Pavol Zlatoš LINEÁRNA ALGEBRA A GEOMETRIA Cesta z troch rozmerov s presahmi do príbuzných odborov Bratislava 2011 Obsah Predhovor 11 Schéma nadväznosti kapitol 17 I Základné pojmy 19 0 Základné pojmy z logiky a teórie množín 21 0.1 Logické spojky a kvantifikátory . . . . . . . . . . . . . . . . . 21 0.2 Množiny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 0.3 Zobrazenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 0.4 Binárne operácie . . . . . . . . . . . . . . . . . . . . . . . . . 29 0.5 Permutácie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 0.6 Ekvivalencie a rozklady . . . . . . . . . . . . . . . . . . . . . . 33 0.7 O matematických dôkazoch . . . . . . . . . . . . . . . . . . . 36 0.8 Matematická indukcia a rekurzia . . . . . . . . . . . . . . . . 38 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 1 Polia a vektorové priestory 47 1.1 Základné číselné obory . . . . . . . . . . . . . . . . . . . . . . 47 1.2 Polia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 1.3 Polia Zp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 1.4 Vektory v rovine a v trojrozmernom priestore . . . . . . . . . 52 1.5 Vektorové priestory . . . . . . . . . . . . . . . . . . . . . . . . 54 1.6 Príklady vektorových priestorov . . . . . . . . . . . . . . . . . 56 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2 Základy maticového počtu 62 2.1 Matice nad danou množinou . . . . . . . . . . . . . . . . . . . 62 2.2 Matice nad daným poľom . . . . . . . . . . . . . . . . . . . . 65 2.3 Matice nad vektorovým priestorom . . . . . . . . . . . . . . . 71 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Obsah 3 3 Sústavy lineárnych rovníc 76 3.1 Maticový zápis sústavy lineárnych rovníc . . . . . . . . . . . . 76 3.2 Redukovaný stupňovitý tvar matice . . . . . . . . . . . . . . . 78 3.3 Gaussova-Jordanova eliminačná metóda . . . . . . . . . . . . 81 3.4 Gaussova eliminačná metóda . . . . . . . . . . . . . . . . . . . 87 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4 Lineárne podpriestory a lineárna nezávislosť 90 4.1 Lineárne podpriestory vektorového priestoru . . . . . . . . . . 90 4.2 Lineárny obal množiny vektorov . . . . . . . . . . . . . . . . . 92 4.3 Prienik a súčet lineárnych podpriestorov . . . . . . . . . . . . 93 4.4 Lineárna nezávislosť . . . . . . . . . . . . . . . . . . . . . . . 94 4.5 Lineárny obal a lineárna nezávislosť v priestoroch Km . . . . . 98 4.6 Lineárne nezávislé postupnosti a množiny . . . . . . . . . . . . 102 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 5 Báza a dimenzia 105 5.1 Steinitzova veta a konečnorozmerné priestory . . . . . . . . . . 105 5.2 Báza a dimenzia konečnorozmerného priestoru . . . . . . . . . 106 5.3 Súradnice vektora vzhľadom na danú bázu . . . . . . . . . . . 107 5.4 Dimenzia prieniku, súčtu a súčinu vektorových priestorov . . . 110 5.5 Usporiadané a neusporiadané bázy . . . . . . . . . . . . . . . 113 5.6 Fyzika v n-rozmernom priestore∗ . . . . . . . . . . . . . . . . 115 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 6 Lineárne zobrazenia 122 6.1 Lineárne zobrazenia . . . . . . . . . . . . . . . . . . . . . . . . 122 6.2 Jadro a obraz lineárneho zobrazenia . . . . . . . . . . . . . . . 125 6.3 Lineárne izomorfizmy . . . . . . . . . . . . . . . . . . . . . . . 127 6.4 Matica lineárneho zobrazenia . . . . . . . . . . . . . . . . . . 129 6.5 Priestory lineárnych zobrazení . . . . . . . . . . . . . . . . . . 134 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 7 Inverzné matice a zmena bázy 140 7.1 Hodnosť matice . . . . . . . . . . . . . . . . . . . . . . . . . . 140 7.2 Inverzné matice a inverzné lineárne zobrazenia . . . . . . . . . 142 7.3 Výpočet inverznej matice . . . . . . . . . . . . . . . . . . . . . 143 7.4 Matica prechodu . . . . . . . . . . . . . . . . . . . . . . . . . 146 7.5 Matice lineárneho zobrazenia vzhľadom na rôzne bázy . . . . . 148 7.6 Pohyblivé bázy . . . . . . . . . . . . . . . . . . . . . . . . . . 150 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 4 Obsah 8 Afinné podpriestory a afinné zobrazenia 156 8.1 Body a vektory . . . . . . . . . . . . . . . . . . . . . . . . . . 156 8.2 Afinné podpriestory . . . . . . . . . . . . . . . . . . . . . . . . 157 8.3 Prienik a spojenie afinných podpriestorov . . . . . . . . . . . . 162 8.4 Vzájomná poloha afinných podpriestorov . . . . . . . . . . . . 165 8.5 Afinné zobrazenia . . . . . . . . . . . . . . . . . . . . . . . . . 167 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 9 Afinné podpriestory a sústavy lineárnych rovníc 174 9.1 Podpriestor riešení homogénnej sústavy a jeho báza . . . . . . 174 9.2 Podpriestor riešení nehomogénnej sústavy . . . . . . . . . . . 176 9.3 Frobeniova veta a riešenie nehomogénnej sústavy . . . . . . . 176 9.4 Parametrické a všeobecné rovnice afinných podpriestorov . . . 178 9.5 Rovnice prieniku a spojenia afinných podpriestorov . . . . . . 182 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 10 Determinanty 191 10.1 Orientovaný objem a multilineárne alternujúce funkcie . . . . 191 10.2 Definícia a základné vlastnosti determinantu . . . . . . . . . . 197 10.3 Charakterizácia determinantu a regulárnych matíc . . . . . . . 199 10.4 Laplaceov rozvoj determinantu . . . . . . . . . . . . . . . . . 201 10.5 Výpočet determinantu . . . . . . . . . . . . . . . . . . . . . . 203 10.6 Inverzná matica a Cramerovo pravidlo . . . . . . . . . . . . . 207 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 II Bilineárne formy a geometria 213 11 Bilineárne a kvadratické formy 215 11.1 Bilineárne zobrazenia a bilineárne formy . . . . . . . . . . . . 215 11.2 Symetrické bilineárne formy a kvadratické formy . . . . . . . . 220 11.3 Diagonalizácia kvadratických foriem . . . . . . . . . . . . . . . 223 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 12 Bilineárne a kvadratické formy nad poľom R 234 12.1 Signatúra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 12.2 Definitnosť . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 12.3 Extrémy funkcií viac premenných . . . . . . . . . . . . . . . . 242 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 Obsah 5 13 Euklidovské priestory 252 13.1 Skalárny súčin . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 13.2 Gramova matica a Cauchyho-Schwartzova nerovnosť . . . . . 255 13.3 Dĺžka vektora a uhol dvoch vektorov . . . . . . . . . . . . . . 256 13.4 Ortogonálne a ortonormálne bázy . . . . . . . . . . . . . . . . 259 13.5 Ortogonálne matice . . . . . . . . . . . . . . . . . . . . . . . . 266 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 14 Ortogonálne projekcie a podpriestory 272 14.1 Ortokomplement a ortogonálna projekcia . . . . . . . . . . . . 272 14.2 Vzdialenosť dvoch afinných podpriestorov . . . . . . . . . . . 278 14.3 Odchýlka dvoch afinných podpriestorov . . . . . . . . . . . . . 280 14.4 Polárne a sférické súradnice . . . . . . . . . . . . . . . . . . . 285 14.5 Riešenie neriešiteľných sústav a lineárna regresia . . . . . . . . 288 14.6 Geometria pravdepodobnosti . . . . . . . . . . . . . . . . . . . 293 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 15 Objem, orientácia a vektorový súčin 300 15.1 Objem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 15.2 Orientácia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 15.3 Orientovaný objem . . . . . . . . . . . . . . . . . . . . . . . . 305 15.4 Vektorový súčin . . . . . . . . . . . . . . . . . . . . . . . . . . 307 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 16 Úvod do špeciálnej teórie relativity 313 16.1 Pseudoeuklidovské priestory . . . . . . . . . . . . . . . . . . . 314 16.2 Minkowského časopriestor . . . . . . . . . . . . . . . . . . . . 318 16.3 Inerciálny pozorovateľ a jeho svetočiara . . . . . . . . . . . . . 321 16.4 Relativita súčasnosti . . . . . . . . . . . . . . . . . . . . . . . 326 16.5 Inerciálne bázy a vzťažné sústavy . . . . . . . . . . . . . . . . 328 16.6 Paradox dvojčiat . . . . . . . . . . . . . . . . . . . . . . . . . 329 16.7 Relatívna rýchlosť dvoch inerciálnych pozorovateľov . . . . . . 331 16.8 Relativistická dilatácia času . . . . . . . . . . . . . . . . . . . 334 16.9 Lorentzova transformácia . . . . . . . . . . . . . . . . . . . . . 336 16.10Relativistická kontrakcia dĺžky . . . . . . . . . . . . . . . . . . 340 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 17 Unitárne priestory 343 17.1 Poldruhalineárne formy . . . . . . . . . . . . . . . . . . . . . . 343 17.2 Hermitovské formy a hermitovské matice . . . . . . . . . . . . 345 17.3 Komplexný skalárny súčin a unitárne priestory . . . . . . . . . 347 6 Obsah 17.4 Unitárne matice . . . . . . . . . . . . . . . . . . . . . . . . . . 351 17.5 Diskrétna Fourierova transformácia . . . . . . . . . . . . . . . 353 17.6 Stavové priestory v klasickej mechanike∗ . . . . . . . . . . . . 358 17.7 Kvantová mechanika . . . . . . . . . . . . . . . . . . . . . . . 361 17.8 Stavovové priestory v kvantovej mechanike∗ . . . . . . . . . . 364 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368 III Lineárne operátory 373 18 Vlastné hodnoty a vlastné vektory 375 18.1 Matica lineárneho operátora a podobnosť matíc . . . . . . . . 375 18.2 Vlastné hodnoty a vlastné vektory . . . . . . . . . . . . . . . . 377 18.3 Charakteristický polynóm . . . . . . . . . . . . . . . . . . . . 380 18.4 Príklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 18.5 Lineárne operátory na nekonečnorozmerných priestoroch . . . 385 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 19 Spektrum lineárneho operátora 389 19.1 Spektrum lineárneho operátora a matice . . . . . . . . . . . . 389 19.2 Schurova veta o triangularizácii . . . . . . . . . . . . . . . . . 393 19.3 Rozšírenia polí, algebraicky uzavreté polia . . . . . . . . . . . 398 19.4 Komplexifikácia . . . . . . . . . . . . . . . . . . . . . . . . . . 400 19.5 Geometrický význam komplexných vlastných čísel . . . . . . . 403 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405 20 Jordanov kanonický tvar 409 20.1 Jordanov kanonický tvar matice . . . . . . . . . . . . . . . . . 409 20.2 Príklady úpravy matíc na Jordanov kanonický tvar . . . . . . 413 20.3 Prípad viacnásobného komplexného vlastného čísla . . . . . . 419 20.4 Rozklad na koreňové podpriestory∗ . . . . . . . . . . . . . . . 422 20.5 Nilpotentné operátory∗ . . . . . . . . . . . . . . . . . . . . . 425 20.6 Ešte raz úprava na JKT . . . . . . . . . . . . . . . . . . . . . 430 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 21 Polynomické invarianty podobnosti matíc 436 21.1 Polynomické maticové funkcie . . . . . . . . . . . . . . . . . . 436 21.2 Minimálny polynóm . . . . . . . . . . . . . . . . . . . . . . . . 440 21.3 Cyklické podpriestory . . . . . . . . . . . . . . . . . . . . . . . 443 21.4 Primárny a racionálny kanonický tvar∗ . . . . . . . . . . . . . 444 21.5 Výpočet invariantných faktorov∗ . . . . . . . . . . . . . . . . . 447 Obsah 7 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 22 Maticové funkcie 456 22.1 Mocninné rady maticovej premennej . . . . . . . . . . . . . . 456 22.2 Exponenciála matice . . . . . . . . . . . . . . . . . . . . . . . 462 22.3 Skalárne funkcie maticového argumentu . . . . . . . . . . . . . 465 22.4 Maticové a vektorové funkcie reálnej premennej . . . . . . . . 468 22.5 Sústavy lineárnych diferenciálnych rovníc . . . . . . . . . . . . 472 22.6 Autonómne sústavy . . . . . . . . . . . . . . . . . . . . . . . . 477 22.7 Komutátor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483 23 Združené lineárne operátory v unitárnych a euklidovských priestoroch 487 23.1 Združené lineárne operátory . . . . . . . . . . . . . . . . . . . 487 23.2 Hermitovské operátory . . . . . . . . . . . . . . . . . . . . . . 489 23.3 Spektrálny rozklad hermitovského operátora . . . . . . . . . . 491 23.4 Unitárne operátory . . . . . . . . . . . . . . . . . . . . . . . . 493 23.5 Štruktúra ortogonálnych operátorov . . . . . . . . . . . . . . . 497 23.6 Eulerove uhly . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 23.7 Normálne operátory . . . . . . . . . . . . . . . . . . . . . . . . 506 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511 24 Kvadriky 514 24.1 Veta o hlavných osiach . . . . . . . . . . . . . . . . . . . . . . 514 24.2 Kvadriky v euklidovských priestoroch . . . . . . . . . . . . . . 515 24.3 Kužeľosečky . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520 24.4 Kvadratické plochy . . . . . . . . . . . . . . . . . . . . . . . . 525 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532 25 Vybrané aplikácie združených operátorov 536 25.1 Singulárny a polárny rozklad . . . . . . . . . . . . . . . . . . . 536 25.2 Pseudoinverzné lineárne zobrazenia a matice . . . . . . . . . . 539 25.3 Odchýlka dvoch lineárnych podpriestorov . . . . . . . . . . . . 543 25.4 Harmonický oscilátor . . . . . . . . . . . . . . . . . . . . . . . 545 25.5 Harmonický oscilátor a Fourierove rady . . . . . . . . . . . . . 547 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550 26 Hermitovské operátory v kvantovej mechanike 553 26.1 Pozorovateľné veličiny a hermitovské operátory . . . . . . . . . 554 26.2 Heisenbergov vzťah neurčitosti . . . . . . . . . . . . . . . . . . 556 8 Obsah 26.3 De Broglieho vlnové funkcie . . . . . . . . . . . . . . . . . . . 558 26.4 Pozorovateľná polohy . . . . . . . . . . . . . . . . . . . . . . . 560 26.5 Vlastné funkcie operátora polohy – Diracova δ-funkcia . . . . 561 26.6 Pozorovateľná hybnosti . . . . . . . . . . . . . . . . . . . . . . 564 26.7 Polohová a hybnostná reprezentácia – Fourierova transformácia568 26.8 Ďalšie pozorovateľné – momenty hybnosti . . . . . . . . . . . . 571 26.9 Hamiltonián a Schrödingerova rovnica . . . . . . . . . . . . . 573 26.10Kvantový harmonický oscilátor . . . . . . . . . . . . . . . . . 577 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584 IV Grupy a algebry 589 27 Úvod do teórie grúp 591 27.1 Abstraktný pojem grupy . . . . . . . . . . . . . . . . . . . . . 591 27.2 Podgrupy, generujúce množiny, cyklické grupy . . . . . . . . . 594 27.3 Homomorfizmy a izomorfizmy . . . . . . . . . . . . . . . . . . 598 27.4 Rozklad grupy podľa podgrupy, normálne podgrupy . . . . . . 601 27.5 Faktorové grupy . . . . . . . . . . . . . . . . . . . . . . . . . . 605 27.6 Priamy súčin grúp . . . . . . . . . . . . . . . . . . . . . . . . 610 27.7 Voľné a konečne prezentované grupy . . . . . . . . . . . . . . . 614 27.8 Grupy homomorfizmov a charaktery abelovských grúp . . . . . 620 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623 28 Grupy transformácií 628 28.1 Cayleyho veta o reprezentácii . . . . . . . . . . . . . . . . . . 628 28.2 Akcie a reprezentácie grúp . . . . . . . . . . . . . . . . . . . . 629 28.3 Grupy automorfizmov a konjugácia . . . . . . . . . . . . . . . 633 28.4 Polopriamy súčin grúp . . . . . . . . . . . . . . . . . . . . . . 637 28.5 Štruktúra grúp jednoduchých rádov . . . . . . . . . . . . . . . 641 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643 29 Lineárne a afinné grupy 647 29.1 Všeobecná a špeciálna lineárna grupa . . . . . . . . . . . . . . 647 29.2 Afinné rozšírenia lineárnych grúp . . . . . . . . . . . . . . . . 650 29.3 Izometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652 29.4 Ortogonálna, špeciálna ortogonálna a euklidovská grupa . . . . 656 29.5 Pseudortogonálna, Lorentzova a Poincarého grupa . . . . . . . 658 29.6 Unitárna a špeciálna unitárna grupa . . . . . . . . . . . . . . 664 29.7 Súvislé komponenty a orientácia . . . . . . . . . . . . . . . . . 666 29.8 Homotopia a jednoduchá súvislosť . . . . . . . . . . . . . . . . 672 Obsah 9 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 676 30 Lineárne algebry 680 30.1 Algebry a štruktúrne konštanty . . . . . . . . . . . . . . . . . 680 30.2 Graduované algebry . . . . . . . . . . . . . . . . . . . . . . . . 683 30.3 Grupové algebry a diskrétna Fourierova transformácia . . . . . 686 30.4 Algebra kvaterniónov . . . . . . . . . . . . . . . . . . . . . . . 691 30.5 Goniometrický tvar kvaterniónu . . . . . . . . . . . . . . . . . 696 30.6 Kvaternióny a rotácie . . . . . . . . . . . . . . . . . . . . . . . 698 30.7 Nakrývajúci homomorfizmus SU(2) → SO(3) . . . . . . . . . 702 30.8 Nakrývajúci homomorfizmus SL(2,C) → Λ↑ + (3) . . . . . . . 705 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708 31 Lieove algebry a maticové grupy 715 31.1 Lieove algebry . . . . . . . . . . . . . . . . . . . . . . . . . . . 715 31.2 Lieova algebra maticovej grupy . . . . . . . . . . . . . . . . . 717 31.3 Exponenciálne zobrazenie . . . . . . . . . . . . . . . . . . . . 719 31.4 Lieove algebry konkrétnych maticových grúp . . . . . . . . . . 722 31.5 Jednoparametrické podgrupy pseudoortogonálnej grupy . . . . 726 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 727 V Multilineárna algebra 731 32 Úvod do tenzorového počtu 733 32.0 Tenzor napätia . . . . . . . . . . . . . . . . . . . . . . . . . . 733 32.1 Dualita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735 32.2 Tenzorový súčin . . . . . . . . . . . . . . . . . . . . . . . . . . 738 32.3 Zdvih poľa skalárov . . . . . . . . . . . . . . . . . . . . . . . . 747 32.4 Priestory (multi)lineárnych zobrazení . . . . . . . . . . . . . . 748 32.5 Tenzory nad vektorovým priestorom . . . . . . . . . . . . . . . 750 32.6 Operácie na tenzoroch . . . . . . . . . . . . . . . . . . . . . . 757 32.7 Tenzory v (pseudo)euklidovských priestoroch . . . . . . . . . . 759 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763 33 Symetrické a alternujúce tenzory 767 33.1 Symetrické tenzory . . . . . . . . . . . . . . . . . . . . . . . . 767 33.2 Symetrické tenzory a ppp-homogénne formy . . . . . . . . . . . . 772 33.3 Totálne derivácie vyšších rádov . . . . . . . . . . . . . . . . . 776 33.4 Alternujúce tenzory . . . . . . . . . . . . . . . . . . . . . . . . 778 33.5 Dualita vo vonkajšej algebre . . . . . . . . . . . . . . . . . . . 785 10 Obsah 33.6 Symetrické a alternujúce tenzory v kvantovej mechanike . . . 787 Cvičenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 790 Literatúra 794 Predhovor Lineárna algebra je jazykom, slúžiacim na vyjadrenie geometrických ideí a vzťahov pôvodne vychádzajúcich z nášho geometrického názoru, ktoré však tento rámec – keďže sa v priebehu vývoja ukázal priúzky – čoraz výraznejšie prekračujú. Kým napr. naša geometrická predstavivosť je ohraničená dvoma rozmermi roviny resp. troma rozmermi priestoru, v lineárnej algebre sa zaoberáme priestormi ľubovoľnej konečnej dimenzie a okrajovo sa zatúlame aj do priestorov nekonečnorozmerných, hoci tie už skôr patria do oblasti pôsobnosti funkcionálnej analýzy. Aparát lineárnej algebry je tak akousi „slepeckou palicou , ktorou si „oťukávame svet neprístupný nášmu pohľadu, zatiaľ čo pôvodný geometrický názor sa stáva zdrojom pojmov, intuitívnych vhľadov a metafor, ktoré do tohto sveta prenášame a s ich pomocou sa v ňom orien- tujeme. V súčasnosti kurz lineárnej algebry tvorí spolu s kurzom matematickej analýzy dva základné piliere univerzitného matematického vzdelania. Lineárna algebra je aspoň v počiatočnej fáze tohto procesu tou pojmovo priezračnejšou a logicky jednoduchšou, no zároveň abstraktnejšou z oboch disciplín. Jej základné pojmy, ako pole, vektorový priestor, báza, lineárne zobrazenie a pod., sú definované ako abstraktné objekty resp. obory objektov, vyhovujúce istým podmienkam (axiómam). Všetky ich ďalšie vlastnosti sú z nich odvodené logickými úvahami, pri ktorých geometrický názor a intuícia hrajú nanajvýš pomocnú úlohu. Lineárnu algebru tak možno do veľkej miery budovať z minima základných pojmov a vopred stanovených predpokladov axiomatickou metódou, čo z jej výuky robí ideálny prostriedok kultivácie logického myslenia a estetického cítenia v matematike. Dôležitú úlohu v matematike hrá voľba vhodného označenia. Kým výpočty s ťažkopádnou symbolikou sa môžu ľahko dostať do slepej uličky, šikovne zvolené označenie nám už samotnou svojou štruktúrou odhaľuje niektoré stránky označovaného predmetu, a tak nás vedie správnym smerom. Zároveň nám ponúka mnemotechnické pomôcky umožujúce predchádzať chybám, či ich aspoň ľahšie odhaliť. Práve algebra (a nielen tá lineárna) asi najviac zo všetkých matematických disciplín cieľavedome rozvíja cit pre primeranú symboliku. 12 Predhovor Základné pojmy a metódy lineárnej algebry zasahujú do takmer všetkých oblastí modernej matematiky a jej aplikácií – nielen vo fyzike, technike, štatistike či informatike (kde to asi málokoho prekvapí), no taktiež v chémii, biológii, ekonómii a sociálnych vedách. S istou dávkou zjednodušenia možno povedať, že väčšina úspechov aplikácií matematiky napr. vo fyzike (no nielen v nej) sa zakladá na jednej pozoruhodnej vlastnosti mnohých prírodných procesov: závislosť ich prírastkov v malých časových úsekoch možno vzhľadom na dĺžku týchto úsekov považovať za lineárnu. Podobne, väčšinu geometrických objektov vyskytujúcich sa v technickej praxi možno v malých oblastiach veľmi dobre aproximovať pomocou lineárnych (t. j. priamočiarych resp. rovných plošných) útvarov. Takto chápaná myšlienka linearizácie je spolu s myšlienkou limitného prechodu (prípadne – v historicky pôvodnej podobe – s myšlienkou nekonečne malých veličín) základom diferenciálneho a integrálneho počtu. Na druhej strane, často sa môžeme stretnúť napr. s grafmi rôznych závislostí, pozostávajúcimi z empirických dát vynesených nad časovú škálu a pospájaných úsečkami do lomenej čiary, zobrazujúcimi napr. vývoj cien, priebeh priemerných denných teplôt, množstva exhalátov v ovzduší a pod. Pokiaľ však nie je k dispozícii hlbšia analýza zaručujúca, že v čiastkových intervaloch nemôže dôjsť k výraznejším výkyvom sledovaného ukazovateľa, treba byť k podobným „bulvárnym uplatneniam myšlienky linearizácie prinajmenšom skeptický. Iným spôsobom vstupuje lineárna algebra (a funkcionálna analýza) napr. do kvantovej mechaniky. Stavom kvantovomechanického systému zodpovedajú vektory vo vhodnom (typicky nekonečnorozmernom) vektorovom priestore nad poľom komplexných čísel. Superpozíciou dvoch stavov je opäť stav systému, ktorému zodpovedá súčet vektorov zodpovedajúcich pôvodným stavom. „Celá fyzika takého systému sa potom do značnej miery redukuje na štúdium spektrálnych vlastností istých lineárnych operátorov na jeho stavovom priestore. ∗ ∗ ∗ ∗ ∗ Zoči-voči množstvu učebníc lineárnej algebry vo svetovej matematickej literatúre sa autor len ťažko vyhne otázke, či má vôbec zmysel písať ďalšiu. Čiastočné oprávnenie by mu vari mohla poskytnúť situácia v slovenskej (a českej) matematickej produkcii. Ale ani tá – hoci má od ideálnej ďaleko (čo je však takmer tautológia) – nie je nijako kritická. Pokúsim sa teda tejto otázke čeliť tak, že odhalím osobné ciele a ambície, ktoré som svojou knihou sledoval. Nakoľko také zámery oprávňujú podobný podnik a do akej miery sa mi ich podarilo naplniť, to nech už posúdia jej čitatelia. Predovšetkým som chcel napísať učebnicu, akú by som si želal mať k dispozícii, keď som ako študent navštevoval prednášky z lineárnej algebry a Predhovor 13 geometrie. Tým nevdojak prezrádzam, že s učebnicami, podľa ktorých sme vtedy postupovali, som príliš spokojný nebol. Neskôr, keď som už sám prednášal lineárnu algebru na Matematicko-fyzikálnej fakulte Univerzity Komenského v Bratislave (kurz som zdedil po kolegovi Jožovi Širáňovi, spolu s brilantnými stručnými poznámkami k prednáškam), som sa sám začal rozhliadať po vhodnom učebnom texte. Najviac ma zaujali Linejnaja algebra i geometrija od Kostrikina a Manina [22] a Pěstujeme lineární algebru od Motla a Zahradníka [29]. Zakrátko som si však uvedomil, že predbežná pripravenosť a všeobecná matematická kultúra, ktorú tieto knihy predpokladajú, sú na podstatne vyššej úrovni, než možno očakávať od študentov prvého ročníka. Ja sám ako prvák by som sa podľa nich učil len ťažko. Rozhodol som sa teda zvoliť elementárnejší spôsob výkladu, ktorý – okrem gymnaziálnej látky a paralelne rozvíjaných poznatkov z matematickej analýzy – aspoň spočiatku nepredpokladá rozsiahlejšie vedomosti z iných matematických disciplín ani veľkú zbehlosť a všeobecný rozhľad. Mojim cieľom bolo napísať učebnicu, ktorá by jednak plne a logicky ucelene pokrývala materiál základného dvojsemestrálneho kurzu lineárnej algebry, jednak ponúkala dostatočne reprezentatívny výber tém tento materiál presahujúcich – či už smerom k iným matematickým disciplínam alebo aplikáciám mimo rámca „čistej matematiky. Ich výber bol popri vkuse autora ovplyvnený jednak spontánnym vývojom, kedy vznikajúca kniha akoby začala žiť svojím vlastným životom a občas sa vymkla spod kontroly autora, jednak faktom, že som túto látku dlhodobo prednášal študentom fyziky. Snažil som sa preto zaradiť doň témy (ako využitie metód lineárnej algebry v špeciálnej teórii relativity a v kvantovej mechanike), ktoré by ich mohli či mali zaujať. Napriek tomu som zvolil abstraktnejší prístup než je pre potreby fyzikov nevyhnutné. Z ich hľadiska by napr. úplne stačilo zaoberať sa vektorovými priestormi nad poľami reálnych a komplexných čísel. S ohľadom na potreby študentov matematiky a informatiky som však, pokiaľ to bolo možné, volil jednotný spôsob výkladu a pripustil ľubovoľné polia skalárov, vrátane tých konečných (hoci na ukážku ich aplikácií v kódovaní a kryptografii už nezostalo miesto). Na druhej strane som práve z pedagogických dôvodov odolal pokušeniu používať jazyk teórie kategórií aj za cenu, že niektoré partie (napr. otázky týkajúce sa duality) nebudú prezentované najelegantnejším možným spôsobom. Napriek značnému rozsahu sa do knihy nedostali ani niektoré ďalšie témy, ktoré s látkou lineárnej algebry úzko súvisia. Napr. o projektívnych priestoroch alebo reprezentáciách grúp je tu len zopár letmých zmienok. Témy ako symplektické priestory, nezáporné a stochastické matice, markovovské reťazce, lineárne programovanie alebo numerické metódy lineárnej algebry, nie sú pokryté ani v náznaku. Čitateľovi (nielen) preto odporúčam, aby siahol po inej literatúre – či už kvôli nim ako aj pre porovnanie nášho prístupu 14 Predhovor k spracovanému materiálu s prístupom iných autorov. Nový pohľad totiž spravidla odkrýva súvislosti, ktoré by inak mohli zostať utajené. Z moderne poňatých kníh, ktoré ma pri výbere a spracovaní materiálu najviac ovplyvnili, vrelo odporúčam do pozornosti tak prednášajúceho ako aj študentov už spomínané Linejnaja algebra i geometrija [22] a Pěstujeme lineární algebru [29]. Na druhej strane som hodne čerpal z klasických (hoci dnes už trochu zastaralých) učebníc Geľfanda [11] a Maľceva [27]. Pokiaľ sa čitateľ nebojí ruštiny, určite stojí za to sa do nich pozrieť. Predbežnú predstavu o náplni knihy možno získať z jej pomerne podrobného obsahu. Už pri zbežnom pohľade naň (no vzhľadom na jej hrúbku aj bez toho) bude asi zrejmé, že látka pokrytá v knihe sa v dvojsemestrálnom kurze nedá nijako rozumne odprednášať. Akési nevyhnutné minimum tvorí časť I (t. j. kapitoly 0–10), ďalej kapitoly 11–14 časti II a kapitoly 18, 19 a prvé dva paragrafy kapitoly 20 z časti III. Pri bližšom pohľade vyjde najavo, že i z tohto minima možno ešte stále všeličo vynechať. Podľa úrovne predbežnej matematickej prípravy poslucháčov možno napr. celú kapitolu 0 prenechať na samostatné čítanie. Z viacerých kapitol časti I možno vypustiť spravidla posledné paragrafy – konkrétne 3.4, 4.6, 5.5–6, 6.5 a 7.6; z kapitol 8 a 9 o afinných priestoroch sa stačí obmedziť na úvodné paragrafy 8.1–2 a 9.1–3. Podobne v časti II možno paragraf 12.3 prenechať na prednášku z analýzy viac premenných a taktiež vynechať paragrafy 14.3-4. Zo spomínaných kapitol časti III možno ešte vypustiť paragraf 19.2. Tento minimálny zoznam ponecháva dostatok priestoru na rozšírenie o niekoľko ďalších ucelených tém. Je už len na prednášajúcom, ktoré si vyberie. Pri plánovaní mu môže pomôcť Schéma nadväznosti kapitol. Ďalšie si študent môže podľa vlastného záujmu osvojiť samostatne. Po niektorých kapitolách môže siahnuť až neskôr, pri štúdiu iných matematických disciplín. Z toho dôvodu som sa usiloval, aby pestrý materiál mohol podľa knihy prednášať aj učiteľ, ktorý nie je špecialistom na danú problematiku, a zároveň sa z nej študent prvého ročníka mohol učiť aj bez sprievodnej prednášky. Celá prvá časť, úvodné kapitoly ďalších častí, ako aj úvodné paragrafy väčšiny kapitol sú preto (občas možno aj za cenu istej rozvláčnosti) napísané pomerne podrobne, vrátane rozboru technických detailov, s rozsiahlym vysvetľujúcim komentárom a dôrazom na motivačné a ilustračné príklady. Smerom ku koncu jednotlivých častí resp. kapitol (s výnimkou prvej časti) sa očakáva, že poslucháč alebo čitateľ sa v problematike začína postupne orientovať, a výklad sa stáva „strmším . Jeden alebo dva záverečné paragrafy kapitoly sú občas venované doplňujúcim informáciám, prípadne matematickým alebo filozofickým „úletom od danej témy. Atypicky neskoré zaradenie kapitol o grupách je komentované v poznámke v paragrafe 27.1. Prednášajúci, ktorý sa nechce vzdať možnosti používať Predhovor 15 pojmy grupy, podgrupy, homomorfizmu a pod. ako výhodné skratky, však môže aspoň úvodné paragrafy 1–3 kapitoly 27 zaradiť do programu kedykoľvek skôr (pri nevyhnutnej modifikácii niektorých dôkazov a príkladov). Napr. samotný pojem grupy možno zaviesť už v paragrafe 0.4. Jednotlivé kapitoly sú sprevádzané pomerne veľkým počtom cvičení rôznej náročnosti. Bolo by naivné očakávať, že čitateľ ich všetky vyrieši. Bolo by však dobre, aby si ich všetky aspoň prečítal a vybral si z nich niekoľko, ktorými sa potom bude zaoberať podrobnejšie. Niektoré slúžia len na overenie porozumenia základným pojmom alebo precvičenie výpočtových postupov. Vo chvíli, keď je čitateľovi jasné, o čo ide alebo ako na to, môže ich kľudne preskočiť. V iných cvičeniach sa od čitateľa žiada, aby doplnil vynechané dôkazy niektorých tvrdení, alebo dokázal ďalšie. Aspoň občas by sa mal o to pokúsiť, u tých ťažších prípadne s využitím návodu, ktorým sú spravidla doplnené. Niektoré cvičenia prehlbujú alebo rozširujú preberanú látku – k tým možno pristupovať podľa individuálnej miery záujmu. Často sú však do cvičení bez predbežného varovania zaradené niektoré pojmy a výsledky, na ktoré sa budeme odvolávať v ďalšom výklade. Čitateľ, ktorý ich preskočil a bude mu chcieť porozumieť, by mal počítať s tým, že sa k nim bude musieť vracať (čo však nijako neprekáža). Často som do cvičení zapracúval otázky (a náznaky odpovedí), ktoré mi kedysi ešte ako študentovi napadali v podobných súvislostiach, no na prednáškach ani vo vtedy u nás dostupnej literatúre som na ne nenašiel odpoveď. Potešilo by ma, keby čitateľovi napadli ďalšie – i také, na ktoré táto kniha neprináša odpoveď, – a vyprovokovali ho k hľadaniu a premýšľaniu. Istú časť cvičení, ako aj mnoho ďalších podobných, no rozsahovo a numericky podstatne náročnejších (teda reálnym aplikáciám bližších) úloh možno efektívne riešiť pomocou interaktívnych softwarových systémov ako MapleR , MathematicaR alebo MATLABR . I keď sa v knihe nevenujeme žiadnemu z nich, určite čitateľovi odporúčam, aby sa aspoň s jedným z nich zoznámil a zvykol si ho používať. Ucelený prehľad týchto systémov ako aj balíkov podprogramov pre lineárnu algebru možno nájsť v Handbook of Linear Algebra [15]. Tento (do jednej ruky priťažký) Handbook (t. j. Príručka) však obsahuje omnoho viac: takmer úplný prehľad (pozor, nie výklad) základných aj pokročilých pojmov, výsledkov a aplikácií lineárnej algebry (vrátane tých najnovších), systematicky zoradený podľa jej jednotlivých oblastí a doplnený podrobnými odkazmi na rozsiahlu literatúru. Čitateľ, ktorý sa bude chcieť dozvedieť z lineárnej algebry čokoľvek, čo v našej knihe nenájde, urobí najlepšie, ak začne hľadať práve tu. Často dostupnejšou, no menej autoritatívnou alternatívou je Wikipedia. ∗ ∗ ∗ ∗ ∗ 16 Predhovor Veľmi potrebnú spätnú väzbu pri písani knihy mi poskytli a viacerými radami a kritickými poznámkami, ktoré, ako verím, viedli k zlepšeniu jej kvality, prispeli kolegovia Vlado Balek, Laco Kvasz, Martin Mojžiš, Martin Mačaj, Martin Niepel, Dano Ševčovič a Jožo Širáň. Obrázky nakreslila a sadzbu v LaTeXu pripravila Mária Benešová. Pri zháňaní finančnej podpory na jej vydanie mi pomohli Andrej Ferko, a hlavne Barbora Kamrlová; v samom závere Peter Mederly. Všetkým im patrí moja vďaka. Za všetky chyby, nepresnosti, preklepy, prehrešky proti spisovnému jazyku či iné nedopatrenia, ktoré v knihe ešte zostali, – snáď je to zbytočné i dodávať – však nesie plnú a výhradnú zodpovednosť jej autor. Napokon by som chcel poďakovať svojej manželke Jane a dcéram Hanke a Janke za morálnu podporu, ktorú mi poskytovali počas tých dlhých rokov práce na tejto knihe, a trpezlivosť, s akou znášali moju častú duševnú neprítomnosť. Bratislava, júl 2011 Pavol Zlatoš Schéma nadväznosti kapitol Čitateľ by si mal byť vedomý, že uvedená schéma je značne neúplná a má len orientačný charakter. Predpokladané znalosti potrebné na štúdium nejakej kapitoly nemusia nutne zahŕňať celý obsah kapitol, ktoré jej v schéme predchádzajú. Naopak, môže sa stať, že niektoré časti danej kapitoly si vyžadujú istú znalosť (spravidla malých) častí kapitol, ktoré nie sú zaradené v schéme ako jej nevyhnutné predpoklady. Spoľahlivejšia schéma by musela miesto kapitol operovať s jednotlivými paragrafmi (a čiastočne aj s cvičeniami). Vzhľadom na ich počet (len paragrafov je takmer dvesto) by však pravdepodobne bola značne neprehľadná a sotva použiteľná. Časť I: 0 → 1 → 2 → 3 → 4 → 5 → 6 → 7 → 10 ↓ 8 → 9 10 8 ↓ ↓ Časť II: 11 → 12 → 13 → 14 → 17 15 16 10 17 ↓ ↓ Časť III: 18 → 19 → 20 → 22 → 23 → 26 ↓ 21 24 25 7 15 16 17 22 ↓ ↓ ↓ Časť IV: 27 → 28 → 29 → 30 → 31 13 30 Časť V: 32 → 33 18 Predhovor Časť I Základné pojmy 0. Základné pojmy z logiky a teórie množín V tejto kapitole zavedieme niektoré základné logické a množinové pojmy a dohodneme sa na štandardnej symbolike, ktorú budeme ďalej používať. Nebudeme však systematicky budovať axiomatickú teóriu množín, práve naopak, s množinami budeme narábať skôr intutívne. Čitateľ, ktorý základné množinové pojmy ovláda, môže túto kapitolu vynechať, prípadne ju len letmo prelistovať, aby sa oboznámil s našou terminológiou a symbolikou. 0.1 Logické spojky a kvantifikátory Kvôli prehľadnosti budeme niektoré matematické tvrdenia zapisovať v symbolickej podobe ako matematické formuly. S príkladmi rôznych formúl sa ešte stretneme. V tejto chvíli sa zameriame len na spôsob, ako možno z daných tvrdení či formúl tvoriť nové pomocou logických spojok a kvantifikátorov. Nech P, Q sú ľubovoľné tvrdenia. (a) Tvrdenie, ktoré je pravdivé práve vtedy, keď tvrdenie P je nepravdivé, nazývame negáciou tvrdenia P, značíme ho ¬P a čítame ho „nie P , prípadne „non P . (b) Tvrdenie, ktoré je pravdivé práve vtedy, keď sú pravdivé obe tvrdenia P, Q, nazývame konjunkciou alebo logickým súčinom tvrdení P, Q, značíme ho P & Q a čítame „P a zároveň Q , krátko len „P a Q , prípadne „P et Q . (c) Tvrdenie, ktoré je pravdivé práve vtedy, keď je pravdivé aspoň jedno z tvrdení P, Q, nazývame alternatívou alebo disjunkciou či logickým súčtom tvrdení P, Q, značíme ho P ∨ Q, a čítame „P alebo Q , prípadne „P vel Q . (d) Tvrdenie ¬P ∨ Q skrátene označujeme P ⇒ Q a nazývame ho implikáciou tvrdení P, Q. Výraz P ⇒ Q čítame „ak P, tak Q alebo „z P vyplýva Q , prípadne „P implikuje Q . Tvrdenie P nazývame predpokladom a tvrdenie Q záverom implikácie P ⇒ Q. Uvedomte si, že implikácia P ⇒ Q je nepravdivá jedine v tom prípade, ak predpoklad P je pravdivý a záver Q je nepravdivý. (e) Tvrdenie (P ⇒ Q) & (Q ⇒ P) skrátene označujeme P ⇔ Q a nazývame ho ekvivalenciou tvrdení P, Q. Výraz P ⇔ Q čítame „P práve vtedy, keď Q , prípadne „P je ekvivalentné s Q . Zrejme ekvivalencia 22 0. Základné pojmy z logiky a teórie množín P ⇔ Q je pravdivá vtedy a len vtedy, keď tvrdenia P, Q sú zároveň obe pravdivé alebo zároveň obe nepravdivé. Znaky ¬, &, ∨, ⇒, ⇔ nazývame logickými spojkami. V literatúre sa možno tiež stretnúť s označením P , −P alebo ∼P pre negáciu, P ∧ Q pre konjunkciu, P → Q alebo P ⊃ Q pre implikáciu a P ↔ Q alebo P ≡ Q pre ekvivalenciu. Okrem tvrdení zapisujeme formulami aj vlastnosti objektov a vzťahy medzi nimi. Na tento účel používame formuly s voľnými premennými. Označujeme ich P(x), Q(x, y), R(x1, . . . , xn) a pod. Dosadením konkrétnych objektov do formúl namiesto voľných premenných dostávame tvrdenia. Napríklad, ak Q(x, y) je formula s voľnými premennými x, y a a, b sú nejaké objekty, tak Q(a, b) je tvrdenie, ktoré je pravdivé práve vtedy, keď sa objekty a, b nachádzajú vo vzťahu označenom formulou Q. Zrejme aj na formuly s voľnými premennými možno aplikovať logické spojky, ktoré si pritom zachovajú svoj doterajší význam. Popri logických spojkách možno z formúl tvoriť nové formuly či tvrdenia aj pomocou kvan- tifikátorov. Nech P(x) je ľubovoľná formula. (a) Tvrdenie „existuje x také, že P(x) skrátene zapisujeme (∃ x)P(x). (b) Tvrdenie „pre každé (pre všetky) x platí P(x) skrátene zapisujeme (∀ x)P(x). Znaky ∃ resp. ∀ sú kvantifikátory; ∃ nazývame existenčný a ∀ univerzálny alebo tiež všeobecný kvantifikátor. Zrejme premenná x už nie je vo formulách (∀ x)P(x) a (∃ x)P(x) voľná ale viazaná; ak x je jediná voľná premenná vo formule P(x), tak (∀ x)P(x) a (∃ x)P(x) sú tvrdenia. Oba uvedené kvantifikátory sú zviazané pravidlami negácie kvantifikovaných formúl: ¬(∃ x)P(x) ⇔ (∀ x)¬P(x), ¬(∀ x)P(x) ⇔ (∃ x)¬P(x). Pomocou existenčného a univerzálneho kvantifikátora už vieme vyjadriť i kvantifikátor jednoznačnej existencie. Ak P(x) je nejaká vlastnosť, tak tvrdenie „existuje práve jedno x také, že P(x) , t. j. tvrdenie (∃ x)(P(x) & (∀ y)(P(y) ⇒ y = x)), skrátene zapisujeme v tvare (∃! x)P(x). Toto tvrdenie je zrejme ekvivalentné s tvrdením (∃ x)(∀ y)(P(y) ⇔ y = x). 0.2. Množiny 23 0.2 Množiny Pod množinou rozumieme ľubovoľné jednoznačne vymedzené zoskupenie nejakých (často i značne rôznorodých) objektov – prvkov množiny – chápané ako jediný objekt. Množiny budeme väčšinou značiť veľkými latinskými písmenami, ich prvky malými písmenami. Tvrdenie „objekt x je prvkom množiny X , zapisujeme x ∈ X; hovoríme tiež, že x patrí do množiny X. Tvrdenie „objekt x nie je prvkom množiny X , t. j. x nepatrí do množiny X, zapisujeme x /∈ X. Množina je jednoznačne zadaná zoskupením svojich prvkov. Preto dve množiny, nezávisle od spôsobu ich zadania, považujeme za totožné, ak majú tie isté prvky. Pre ľubovoľné množiny X, Y teda platí X = Y ⇔ (∀ x)(x ∈ X ⇔ x ∈ Y ). Túto vlastnosť množín nazývame extenzionalitou. Hovoríme, že množina X je podmnožinou množiny Y , označenie X ⊆ Y , ak každý prvok množiny X patrí aj do množiny Y , t. j. X ⊆ Y ⇔ (∀ x)(x ∈ X ⇒ x ∈ Y ). Vzťah ⊆ nazývame vzťahom inklúzie Extenzionalitu množín teraz možno skrátene vyjadriť v tvare konjunkcie dvoch inklúzií X = Y ⇔ X ⊆ Y & Y ⊆ X. Kvantifikácie uvedené v predchádzajúcom paragrafe sa nazývajú neohraničené, lebo oblasť pôsobnosti kvantifikátorov v nich nebola nijako ohraničená. V matematike (i v bežnom živote) sa však častejšie vyskytujú ohraničené kvantifikácie, v ktorých je oblasť pôsobnosti príslušného kvantifikátora ohraničená nejakou množinou X. Ide o kvantifikácie tvaru (∃ x ∈ X), (∀ x ∈ X) a (∃! x ∈ X), ktoré čítame postupne „existuje x z množiny X , „pre každé (pre všetky) x z množiny X , resp. „existuje práve jedno (jediné) x z množiny X . Tieto kvantifikácie možno vyjadriť pomocou neohraničených kvantifikácii nasledujúcim spôsobom: Ak P(x) je ľubovoľná vlastnosť a X je množina, kladieme (∃ x ∈ X)P(x) ⇔ (∃ x)(x ∈ X & P(x)), (∀ x ∈ X)P(x) ⇔ (∀ x)(x ∈ X ⇒ P(x)), (∃! x ∈ X)P(x) ⇔ ∃ x ∈ X P(x) & (∀ y ∈ X)(P(y) ⇒ y = x) . V poslednom prípade môžeme tiež použiť vyjadrenie (∃! x ∈ X)P(x) ⇔ (∃ x ∈ X)(∀ y ∈ X)(P(y) ⇔ y = x). 24 0. Základné pojmy z logiky a teórie množín Množinu nazývame konečnou, ak ju možno zadať vymenovaním všetkých jej prvkov. Ak X je konečná množina a x1, x2, . . . , xn sú všetky jej prvky, píšeme X = {x1, x2, . . . , xn}. Z extenzionality potom vyplýva, že nezáleží na poradí vymenovania prvkov množiny X. Taktiež sa môže stať, že X má menej než n prvkov – v takom prípade sa niektoré z prvkov x1, . . . , xn opakujú a v zápise množiny X môžeme (no nemusíme) opakujúce sa prvky až na jeden z nich vynechať. Napríklad {x, y} = {y, x}, a ak x = y, tak {x, y} = {x} = {y}. Okrem množín, ktoré majú nejaké prvky, zavádzame aj tzv. prázdnu množinu ∅, ktorá neobsahuje nijaký prvok. Z extenzionality vyplýva, že prázdna množina je touto podmienkou jednoznačne určená. Popri konečných množinách však v matematike často pracujeme i s nekonečnými množinami, t. j. takými, ktoré nemožno zadať vymenovaním všetkých ich jednotlivých prvkov. Takéto množiny zvykneme zadávať nejakou charakteristickou vlastnosťou. Ak P(x) je nejaká vlastnosť, píšeme X = {x; P(x)}, čím myslíme, že pre ľubovoľné x platí x ∈ X práve vtedy, keď x spĺňa P(x). Z extenzionality vyplýva, že takto definovaná množina X je určená jednoznačne. Napríklad vlastnosťou „x je párne celé číslo je určená množina všetkých párnych celých čísel. Poznamenajme, že z rovnosti X = {x; P(x)} ešte nijako nevyplýva, že množina X je nekonečná – rovnako dobre môže byť aj konečná, dokonca prázdna. Na tomto mieste je potrebné poznamenať, že uvedený princíp, ktorý nám umožňuje zadávať množiny akýmikoľvek vlastnosťami ich prvkov, vedie k logickým sporom, a je preto v uvedenej intuitívnej a neobmedzenej podobe nepoužiteľný. Keďže sa však nehodláme púšťať do jeho upresňovania, čo by si vyžiadalo vybudovať základy axiomatickej teórie množín, nezostáva nám než čitateľovi vopred zaručiť, že všetky prípady použitia tohto princípu, ktoré sa v tomto texte vyskytnú, budú plne legálne z hľadiska teórie množín, a požiadať ho o dôveru. Zatiaľ stačí, ak prezradíme, že všetky množiny netvoria množinu, t. j. neexistuje množina všetkých množín. To znamená, že vlastnosťou „x je množina nie je vymedzená nijaká množina. Najčastejšie budeme spomínaný princíp používať na vymedzovanie podmnožín nejakej vopred danej množiny pomocou vlastností popísaných matematickými formulami. Ak M je množina a P(x) je nejaká (matematická) vlastnosť, tak existuje množina X všetkých tých prvkov x množiny M, ktoré 0.2. Množiny 25 majú vlastnosť P(x), t. j. množina X = {x ∈ M; P(x)} = {x; x ∈ M & P(x)}. Nech X, Y sú ľubovoľné množiny. Prienikom, zjednotením, a rozdielom množín X, Y nazývame porade nasledujúce množiny: X ∩ Y = {x; x ∈ X & x ∈ Y }, X ∪ Y = {x; x ∈ X ∨ x ∈ Y }, X Y = {x; x ∈ X & x /∈ Y }. Množiny X, Y nazývame disjunktné, ak X∩Y = ∅. Čitateľovi prenechávame, aby si sám premyslel základné vlastnosti uvedených množinových operácií. Pod usporiadanou dvojicou objektov x, y rozumieme objekt označovaný (x, y), taký, že pre všetky x, y, u, v platí: (x, y) = (u, v) ⇔ (x = u & y = v). Uvedomme si, že nepotrebujeme vedieť, čo je „naozaj usporiadaná dvojica (x, y), dôležitá je len uvedená vlastnosť. Analogicky zavádzame pre ľubovoľné celé číslo n ≥ 2 usporiadanú n-ticu (x1, . . . , xn) tak, že pre všetky x1, . . . , xn, y1, . . . , yn platí (x1, . . . , xn) = (y1, . . . , yn) ⇔ (x1 = y1 & . . . & xn = yn). Množiny X × Y = {(x, y); x ∈ X & y ∈ Y }, X1 × . . . × Xn = {(x1, . . . , xn); x1 ∈ X1 & . . . & xn ∈ Xn} nazývame karteziánskym súčinom množín X, Y , resp. množín X1, . . . , Xn. V prípade, že X1 = · · · = Xn = X, píšeme X1 × . . . × Xn = Xn . Pre úplnosť ešte kladieme X1 = X, X0 = {∅}. Xn nazývame n-tou karteziánskou mocninou množiny X. Počet prvkov konečnej množiny X budeme značiť # X. Taktiež prázdna množina je konečná a platí # ∅ = 0. Pre nekonečnú množinu X píšeme # X = ∞. Zrejme pre ľubovoľné konečné množiny X, Y platí # (X ∪ Y ) = # X + # Y − # (X ∩ Y ), # (X × Y ) = # X · # Y. 26 0. Základné pojmy z logiky a teórie množín Z poslednej rovnosti vyplýva, že # Xn = (# X)n pre každé celé číslo n ≥ 0 a konečnú množinu X. 0.3 Zobrazenia Zobrazením alebo tiež funkciou z množiny X do množiny Y rozumieme ľubovoľný predpis, ktorý každému prvku x množiny X priradí jednoznačne určený prvok y množiny Y . Zápis f : X → Y označuje, že f je zobrazenie (funkcia) z X do Y . Ten jednoznačne určený prvok y ∈ Y , ktorý zobrazenie f priradí prvku x ∈ X, budeme značiť f(x), prípadne len fx alebo fx. Vo vzťahu y = f(x) nazývame x nezávisle premennou alebo argumentom a y závisle premennou alebo funkčnou hodnotou funkcie f. Píšeme tiež f : x → y. Dve zobrazenia f, g: X → Y sa rovnajú, ak pre každé x ∈ X platí f(x) = g(x). Množinu všetkých zobrazení z množiny X do množiny Y budeme označovať Y X ; teda Y X = {f; f : X → Y }. Toto označenie je motivované vzorcom pre počet prvkov množiny Y X . Pre konečné množiny X, Y totiž platí # Y X = (# Y )(# X) . (Samostatne si rozmyslite prečo!) Zobrazenie f : X → X sa nazýva transformáciou množiny X alebo tiež unárnou (t. j. jednomiestnou) operáciou na množine X. Zobrazenie f : X → Y sa nazýva prosté alebo tiež injektívne či injekcia, ak rôznym prvkom x1, x2 ∈ X priraďuje rôzne prvky f(x1), f(x2) ∈ Y , t. j. ak platí (∀ x1, x2 ∈ X)(x1 = x2 ⇒ f(x1) = f(x2)). Uvedenú podmienku možno ekvivalentne vyjadriť v tvare (∀ x1, x2 ∈ X)(f(x1) = f(x2) ⇒ x1 = x2). Zobrazenie f : X → Y sa nazýva zobrazenie na množinu Y alebo tiež surjektívne či surjekcia, ak na každý prvok množiny Y sa zobrazí nejaký prvok množiny X, t. j. ak platí (∀ y ∈ Y )(∃ x ∈ X)(y = f(x)). 0.3. Zobrazenia 27 Hovoríme, že f : X → Y je prosté zobrazenie X na Y alebo tiež bijektívne zobrazenie či bijekcia, ak f je zároveň prosté a na, t. j. injektívne i surjektívne. Ešte inak to môžeme vyjadriť podmienkou (∀ y ∈ Y )(∃! x ∈ X)(y = f(x)). Namiesto uvedených pojmov niekedy tiež hovoríme, že f je vzájomne jednoznačné zobrazenie množiny X na množinu Y . Ak f : X → Y je bijekcia, tak existuje jednoznačne určené zobrazenie g: Y → X, ktoré každému y ∈ Y priradí ten jediný prvok x ∈ X, pre ktorý platí y = f(x). Toto zobrazenie nazývame inverzným zobrazením k zobrazeniu f a označujeme ho f−1 . Zrejme f−1 : Y → X je tiež bijekcia a pre všetky x ∈ X, y ∈ Y platí f−1 f(x) = x, f f−1 (y) = y. Nech f : X → Y , g: Y → Z sú zobrazenia. Kompozíciou zobrazení f, g alebo aj zloženým zobrazením z f a g rozumieme zobrazenie označené ako g ◦ f : X → Z, dané pre každé x ∈ X predpisom (g ◦ f)(x) = g(f(x)). Zložené zobrazenie možno znázorniť pomocou tzv. komutatívneho diagramu 1 X f - Y g ◦ f Z ? g (Všimnite si, že zobrazenie g ◦ f zapisujeme „v obrátenom poradí – najprv totiž na prvok x aplikujeme f a až potom g. Núti nás k tomu zaužívaná konvencia, podľa ktorej argument x píšeme napravo od funkcie f. Poznamenajme, že niektorí autori dávajú prednosť „prirodzenému poradiu a kompozíciu zobrazení f : X → Y , g: Y → Z, zapisujú ako f ◦ g. Kvôli tomu však opúšťajú spomínanú konvenciu a namiesto f(x) píšu xf. V tomto duchu fungujú napr. niektoré kalkulačky.) Skladanie zobrazení je asociatívne v nasledujúcom zmysle: ak f : X → Y , g: Y → Z a h: Z → W sú zobrazenia, tak h ◦ (g ◦ f) = (h ◦ g) ◦ f. Ľahko totiž nahliadneme, že obe zobrazenia priradia prvku x ∈ X prvok h(g(f(x))) ∈ W. 28 0. Základné pojmy z logiky a teórie množín Na každej množine X máme definované identické zobrazenie idX : X → X, nazývané tiež identita na X, také, že idX(x) = x pre každé x ∈ X. Zrejme idX je bijekcia pre každé X, a pre ľubovoľné zobrazenie f : X → Y platí f ◦ idX = f = idY ◦f. Pre f : X → X kladieme f2 = f ◦ f, f3 = f ◦ f ◦ f, atď. Kvôli úplnosti definujeme aj f1 = f, f0 = idX. Zobrazenie fn nazývame n-tou iteráciou zobrazenia f. Ak f : X → Y je bijekcia, tak k nej inverzné zobrazenie f−1 : Y → X teraz môžeme charakterizovať rovnosťami f−1 ◦ f = idX, f ◦ f−1 = idY . Čitateľ sám ľahko nahliadne, že pre ľubovoľné zobrazenia f : X → Y , g: Y → Z platí: (a) Ak f, g sú injektívne, tak aj g ◦ f je injektívne. (b) Ak f, g sú surjektívne, tak aj g ◦ f je surjektívne. (c) Ak f, g sú bijektívne, tak aj g ◦ f je bijektívne. (d) Ak g ◦ f je injektívne, tak aj f je injektívne. (e) Ak g ◦ f je surjektívne, tak aj g je surjektívne. (f) Ak g ◦ f je bijektívne, tak f je injektívne a g je surjektívne. Podmienka (c) nás oprávňuje zaviesť pre bijekcie f : X → X aj záporné iterácie f−n = f−1 n = fn −1 . Nech f : X → Y je nejaké zobrazenie a A ⊆ X. Zúžením zobrazenia f na množinu A nazývame zobrazenie f A: A → Y také, že (f A)(x) = f(x) pre každé x ∈ A. Obrazom množiny A v zobrazení f nazývame množinu f(A) = {f(x); x ∈ A} ⊆ Y. Špeciálne, množinu f(X) nazývame obrazom zobrazenia f a značíme ju Im f = f(X) = {f(x); x ∈ X}. Pre f : X → Y a A ⊆ X platí Im(f A) = f(A); zrejme f je surjekcia práve vtedy, keď Im f = Y . 0.4. Binárne operácie 29 Podobne, vzorom množiny B ⊆ Y v zobrazení f : X → Y nazývame množinu f−1 (B) = {x ∈ X; f(x) ∈ B} ⊆ X. Pre ľubovoľné A ⊆ X, B ⊆ Y možno jednoducho overiť inklúzie A ⊆ f−1 f(A) , f f−1 (B) ⊆ B. 0.4 Binárne operácie Ak X, Y , Z sú množiny, tak zobrazenie f : X × Y → Z nazývame binárnou (t. j. dvojmiestnou) operáciou na množinách X, Y s hodnotami v množine Z. Binárne operácie väčšinou označujeme znakmi umiestňovanými medzi hodnoty argumentov, ako napr +, ·, ◦, ∗ a pod. Hodnotu takej operácie na dvojici prvkov x ∈ X, y ∈ Y potom označujeme x + y, x · y (prípadne len xy), x ◦ y, x ∗ y a pod. Podobným spôsobom možno zaviesť aj n-miestne operácie X1×. . .×Xn → Y , prípadne Xn → Y , či Xn → X pre ľubovoľné celé číslo n ≥ 0. Najčastejšie budeme pracovať s binárnymi operáciami tvaru f : X ×X → X, ktoré nazývame jednoducho binárnymi operáciami na množine X. Binárna operácia ∗ na množine X sa nazýva asociatívna, ak pre všetky x, y, z ∈ X platí x ∗ (y ∗ z) = (x ∗ y) ∗ z. Asociativita operácie nám dovoľuje vynechávať zátvorky a písať len x ∗ y ∗ z. Podobne si možno počínať i v prípade viacerých argumentov. Binárna operácia ∗ na množine X sa nazýva komutatívna, ak pre všetky x, y ∈ X platí x ∗ y = y ∗ x. Prvok e ∈ X sa nazýva neutrálny prvok binárnej operácie ∗ na množine X, ak pre všetky x ∈ X platí x ∗ e = e ∗ x = x. Zrejme neutrálny prvok operácie ∗ (ak existuje) je určený jednoznačne. Keby totiž e1, e2 ∈ X boli dva neutrálne prvky, tak nevyhnutne e1 = e1 ∗ e2 = e2. Ak binárna operácia ∗ na množine X má neutrálny prvok e a k danému prvku x ∈ X existuje prvok y ∈ X taký, že x ∗ y = y ∗ x = e, 30 0. Základné pojmy z logiky a teórie množín hovoríme, že y je inverzný prvok k prvku x. Ak ∗ je asociatívna binárna operácia na X, tak aj inverzný prvok k danému prvku x ∈ X (pokiaľ existuje) je určený jednoznačne. Keby totiž y1, y2 boli dva inverzné prvky k x, tak y1 = y1 ∗ e = y1 ∗ (x ∗ y2) = (y1 ∗ x) ∗ y2 = e ∗ y2 = y2. Napríklad pre ľubovoľnú množinu X kompozícia ◦ je asociatívna binárna operácia na množine XX všetkých transformácií množiny X. Zrejme ak # X ≥ 2, tak táto operácia nie je komutatívna. Identické zobrazenie idX ∈ XX je neutrálnym prvkom operácie ◦. K danému zobrazeniu f ∈ XX existuje inverzný prvok práve vtedy, keď f je bijekcia; v tom prípade je ním inverzné zobrazenie f−1 ∈ XX . Binárnu operáciu ∗ na konečnej množine X možno zadať pomocou tzv. multiplikatívnej tabuľky, ktorej stĺpce i riadky sú označené prvkami množiny X. Do poľa tabuľky ležiaceho v priesečníku x-tého riadku a y-tého stĺpca vpíšeme hodnotu x ∗ y. Napr. tabuľkami + 0 1 2 3 4 0 0 1 2 3 4 1 1 2 3 4 0 2 2 3 4 0 1 3 3 4 0 1 2 4 4 0 1 2 3 · 0 1 2 3 4 0 0 0 0 0 0 1 0 1 2 3 4 2 0 2 4 1 3 3 0 3 1 4 2 4 0 4 3 2 1 sú zadané dve asociatívne a komutatívne operácie + a · na množine {0, 1, 2, 3, 4}. Ďalej 0 je neutrálny prvok operácie + a 1 je neutrálny prvok operácie · . Navyše ku každému prvku a tejto množiny existuje inverzný prvok vzhľadom na operáciu + : k prvkom 0, 1, 2, 3, 4 sú to postupne prvky 0, 4, 3, 2, 1. Pokiaľ ide o operáciu · , vidíme, že k prvku 0 neexistuje inverzný prvok; k prvkom 1, 2, 3 však inverzné prvky existujú: sú to postupne 1, 3, 2. Komutativitu binárnej operácie možno ľahko nahliadnuť z jej multiplikatívnej tabuľky – prejaví sa symetriou tabuľky podľa hlavnej diagonály spájajúcej ľavý horný a pravý dolný roh. Taktiež neutrálny prvok možno odhaliť na prvý pohľad, lebo v jeho riadku i stĺpci sa zreproduje riadok resp. stĺpec zo záhlavia tabuľky. Ak už poznáme neutrálny prvok, možno overiť aj existenciu inverzného k danému – treba nájsť neutrálny prvok v riadku i v stĺpci daného prvku. Ak sa nám to podarí pre dvojicu polí tabuľky, ktoré ležia v stĺpci resp. riadku toho istého prvku, tak ide o hľadaný inverzný prvok. Asociatívnosť, žiaľ, tak jednoducho nahliadnuť nemožno. 0.5. Permutácie 31 0.5 Permutácie Kým znalosť predchádzajúcich paragrafov je nevyhnutným predpokladom, aby čitateľ mohol začať so štúdiom kapitoly 1, tento paragraf budeme potrebovať až neskôr, keď začneme preberať determinanty. Nech X je ľubovoľná množina. Permutáciou množiny X rozumieme ľubovoľné bijektívne zobrazenie σ: X → X. Množinu všetkých permutácií množiny X značíme S(X). Ak X je konečná množina, tak počet prvkov množiny S(X) je daný známym vzťahom # S(X) = (# X)! , kde n! = 1 · 2 · . . . · n je faktoriál prirodzeného čísla n (pritom 0! = 1! = 1). Uvedomme si, že transformácia f : X → X konečnej množiny X je injektívna práve vtedy, keď je surjektívna. Jedna i druhá podmienka totiž hovorí, že množina f(X) ⊆ X má rovnaký počet prvkov ako X. Teda už jedna z uvedených podmienok je postačujúca na to, aby f bola permutáciou konečnej množiny X. Keďže zloženie σ ◦τ dvoch permutácií σ, τ ∈ S(X) dáva opäť permutáciu množiny X, kompozícia ◦ je asociatívna binárna operácia na množine S(X). Ľahko sa možno presvedčiť, že – okrem prípadu, keď # X ≤ 2, – táto operácia nie je komutatívna. Zrejme idX ∈ S(X) je neutrálny prvok tejto operácie a inverzným prvkom k permutácii σ ∈ S(X) je inverzná permutácia σ−1 ∈ S(X). Pre X = {1, 2, . . . , n} namiesto S(X) píšeme Sn. Permutáciu σ ∈ Sn zvyčajne zapisujeme v tvare σ = 1 2 . . . n σ(1) σ(2) . . . σ(n) . Prvky množiny S3, t. j. permutácie množiny {1, 2, 3}, si môžeme predstaviť ako symetrie rovnostranného trojuholníka s vrcholmi označenými číslami 1, 2, 3. Ak si identickú permutáciu tejto množiny označíme ako ι, otočenia okolo ťažiska trojuholníka proti smeru resp. v smere hodinových ručičiek o uhol π/3 ako resp. −1 , a osovú súmernosť podľa osi prechádzajúcej i-tým vrcholom a stredom protiľahlej strany ako σi, pre i = 1, 2, 3, tak množina permutácií S3 bude pozostávať z permutácií ι = 1 2 3 1 2 3 = 1 2 3 2 3 1 , −1 = 1 2 3 3 1 2 , σ1 = 1 2 3 3 2 1 , σ2 = 1 2 3 3 2 1 , σ3 = 1 2 3 2 1 3 . 32 0. Základné pojmy z logiky a teórie množín Obr. 0.1. Symetrie rovnostranného trojuholníka Multiplikatívna tabuľka binárnej operácie ◦ na množine S3 vyzerá takto: ◦ ι −1 σ1 σ2 σ3 ι ι −1 σ1 σ2 σ3 −1 ι σ3 σ1 σ2 −1 −1 ι σ2 σ3 σ1 σ1 σ1 σ2 σ3 ι −1 σ2 σ2 σ3 σ1 −1 ι σ3 σ3 σ1 σ2 −1 ι Permutáciu σ ∈ S(X) nazývame transpozíciou, ak existujú x, y ∈ X také, že x = y, σ(x) = y, σ(y) = x a σ(z) = z pre každé z ∈ X {x, y}. Inak povedané, transpozícia je výmena dvoch prvkov množiny X. Zrejme σ1, σ2, σ3 ∈ S3 sú transpozície. Z názoru je zrejmé (dôkaz je v cvičení 0.14), že každú permutáciu σ konečnej množiny X možno získať postupnými výmenami dvojíc prvkov, teda každá taká permutácia je kompozíciou transpozícií. Tento rozklad na transpozície nie je jednoznačný: napr. ι ∈ S3 možno zapísať ako ι, t. j. kompozíciu 0 transpozícií, a taktiež ako ι = σ1 ◦ σ1 = σ2 ◦ σ2 = σ3 ◦ σ3, t. j. aspoň troma ďalšími spôsobmi ako kompozíciu dvoch transpozícií. Dĺžkou permutácie σ konečnej množiny X nazveme najmenší počet transpozícií, na kompozícíu ktorých možno σ rozložiť, a označíme ju |σ|. Samotná dĺžka |σ| nie je dôležitá, význam má len parita tohto čísla, t. j. vlastne výraz sgn σ = (−1)|σ| , ktorý nazývame znakom, prípadne znamienkom permutácie σ. 0.6. Ekvivalencie a rozklady 33 Permutácia σ konečnej množiny X sa nazýva párna resp. nepárna, ak číslo |σ| je párne resp. nepárne, t. j. ak jej znak je 1 resp. −1. Z nasledujúcej vety vyplýva, že pri určovaní znamienka permutácie σ môžeme použiť jej ľubovoľný rozklad na transpozície σ = τ1 ◦ . . . ◦ τk a nemusíme sa starať o to, či tento rozklad je naozaj najkratší – pre ľubovoľný taký rozklad totiž platí (−1)|σ| = (−1)k . 0.5.1. Veta. Nech X je konečná množina. Potom pre ľubovoľné σ, τ ∈ S(X) platí (−1)|σ◦τ| = (−1)|σ| · (−1)|τ| . Dôkaz. Zrejme stačí dokázať uvedenú rovnosť pre prípad, keď τ je transpozícia a X = {1, 2, . . . , n}. Pre každé σ ∈ Sn označme p(σ) súčin všetkých rozdielov tvaru σ(j)−σ(i), kde 1 ≤ i < j ≤ n. Zrejme pre všetky σ ∈ Sn majú výrazy p(σ) rovnakú absolútnu hodnotu a líšia sa nanajvýš znamienkom. Toto znamienko závisí od parity počtu záporných členov v súčine p(σ). Člen σ(j)−σ(i) je záporný práve vtedy, keď i < j a σ(i) > σ(j), – každú takú dvojicu (i, j) nazývame inverziou permutácie σ. Identita idX má 0 inverzií a p(idX) = 1n−1 ·2n−2 ·. . .·(n−1)1 = 1! · 2! · . . . · (n − 1)! > 0. Stačí teda dokázať, že počet inverzií permutácií σ a σ ◦τ sa líší o nepárnu hodnotu. Nech 1 ≤ k < l ≤ n sú tie dva prvky, ktoré vymieňa transpozícia τ. Potom σ = 1 . . . k . . . l . . . n σ(1) . . . σ(k) . . . σ(l) . . . σ(n) , σ ◦ τ = 1 . . . k . . . l . . . n σ(1) . . . σ(l) . . . σ(k) . . . σ(n) . Inverzie (i, j) permutácie σ, v ktorých nevystupuje k ani l, sú tiež inverziami permutácie σ ◦ τ. Inverzie, v ktorých vystupujú prvky i, k, a i, l, kde i = k, l, alebo obe súčasne vzniknú alebo súčasne zaniknú v σ ◦ τ oproti σ. Konečne, pokiaľ (k, l) nebola inverziou v σ, stane sa ňou v σ ◦ τ; pokiaľ ňou bola, táto inverzia v σ ◦ τ zanikne. Teda celkový rozdiel počtu inverzií permutácií σ a σ ◦ τ je nepárny. 0.6 Ekvivalencie a rozklady Podobne ako predošlý, i tento paragraf môže čitateľ zatiaľ preskočiť. Jeho znalosť bude potrebná až neskôr, v súvislosti s niektorými otázkami teórie 34 0. Základné pojmy z logiky a teórie množín grúp. S pojmom ekvivalencie sa síce stretneme už predtým, dovtedy ho však nebudeme systematicky využívať. Nech ∼ je nejaký dvojmiestny vzťah, do ktorého vstupujú prvky nejakého oboru objektov M (tento obor môže, ale nemusí byť množinou). Zápisom x ∼ y značíme, že prvky x, y ∈ M sa nachádzajú vo vzťahu ∼; ak sa x, y ∈ M nenachádzajú v tomto vzťahu, píšeme x ∼ y. Hovoríme, že vzťah ∼ je na obore M (a) reflexívny, ak pre všetky x ∈ M platí x ∼ x; (b) symetrický, ak pre všetky x, y ∈ M platí x ∼ y ⇒ y ∼ x; (c) tranzitívny, ak pre všetky x, y, z ∈ M platí x ∼ y & y ∼ z ⇒ x ∼ z. Vzťah ∼, ktorý je reflexívny, symetrický a tranzitívny na obore M, nazývame vzťahom ekvivalencie alebo len krátko ekvivalenciou na obore M. Ekvivalencie budeme väčšinou značiť znakmi ∼, ≈, ≡ a pod. Každý vzťah ekvivalencie na nejakej množine či obore objektov M predstavuje isté hľadisko, z ktorého považujeme niektoré prvky z M za rovnocenné, t. j. ekvivalentné, a iné nie. Napr. na množine všetkých hracích guličiek v danej jamke možno zaviesť vzťah ekvivalencie, v ktorom sa nachádzajú ľubovoľné dve guličky práve vtedy, keď majú rovnakú farbu. Vzťah, v ktorom sa nachádzajú dve takéto guličky práve vtedy, keď majú rovnakú hmotnosť, je iným príkladom ekvivalencie na tejto množine. Jedným dychom však poznamenajme, že uvedené príklady neslobodno brať príliš vážne, lebo rovnocennosť sa v nich mieša s podobnosťou, – „naozajstné ekvivalencie predstavujú len v značne idealizovanom prípade. S reflexívnosťou a symetriou nie je problém, v reálnom živote však zvykne zlyhať tranzitívnosť. Môžeme sa napríklad zhodnúť, že guličky a, b majú rovnakú farbu, a takisto majú rovnakú farbu guličky b, c. No farba guličiek a, c sa nám už rovnakou zdať nemusí. Podobne môžeme v rámci presnosti našich váh dospieť k záveru, že guličky p, q ako aj guličky q, r majú rovnakú hmotnosť. Avšak hmotnosť guličiek p, r sa nám už vážením môže podariť rozlíšiť. Lepším príkladom ekvivalencie je tak vzťah na množine všetkých bankoviek danej meny, v ktorom sa nachádzajú dve bankovky práve vtedy, keď majú rovnakú nominálnu hodnotu. Na rozdiel od reálneho života sa v matematike nemusíme trápiť podobnými ťažkosťami. Všetky ekvivalencie, s ktorými sa tu stretneme, budú mať v plnej miere všetky tri uvedené vlastnosti. Ešte jeden príklad za všetky: vzťahom x ∼ y ⇔ |x| = |y| je definovaná ekvivalencia „mať rovnakú absolútnu hodnotu na množine C všetkých komplexných čísel. 0.6. Ekvivalencie a rozklady 35 Nech ∼ je ekvivalencia na množine X. Pre x ∈ X označme ˜x = {u ∈ X; u ∼ x} množinu všetkých prvkov u ∈ X ekvivalentných s x, ktorú nazývame triedou alebo blokom ekvivalencie prvku x. Zrejme pre ľubovoľné x ∈ X platí x ∈ ˜x. Ľahko tiež možno dokázať (skúste sami), že x ∼ y ⇔ ˜x = ˜y ⇔ x ∈ ˜y ⇔ y ∈ ˜x ⇔ ˜x ∩ ˜y = ∅ pre všetky x, y ∈ X. Množinu X/∼ = {˜x; x ∈ X} všetkých tried ekvivalencie prvkov množiny X nazývame faktorovou množinou množiny X podľa ekvivalencie ∼. (Podotýkame, že v zhode s paragrafom 0.2 sa každá trieda ˜x nachádza v množine X/∼ iba raz, i keď prvkov y ∈ X, pre ktoré platí ˜x = ˜y, môže byť mnoho.) Priradením x → ˜x je definované surjektívne zobrazenie X → X/∼, ktoré nazývame prirodzenou alebo tiež kanonickou projekciou množiny X na faktorovú množinu X/∼. Na faktorovú množinu X/∼ sa možno dívať dvojakým spôsobom. Jednak ako na výsledok stotožnenia či zlepenia navzájom ekvivalentných prvkov množiny X; v takom prípade sa na bloky ˜x dívame predovšetkým ako na prvky, ktoré vznikli „stiahnutím celej triedy ˜x do jediného bodu, a vedome si nevšímame fakt, že sú to zároveň množiny. Použitím názvu „faktorová množina naznačujeme, že v danej chvíli dávame tomuto pohľadu prednosť. Na druhej strane sa na množinu X/∼ možno dívať ako na rozklad množiny X na navzájom disjunktné neprázdne množiny ˜x. Rozkladom množiny X nazývame ľubovoľný systém (t. j. množinu) jej neprázdnych podmnožín R taký, že každý prvok množiny X padne do práve jednej množiny zo systému R. Inými slovami, systém R neprázdnych podmnožín množiny X je jej rozkladom práve vtedy, keď spĺňa nasledujúce dve podmienky: (1) zjednotením všetkých množín A ∈ R je celá množina X, t. j. (∀ x ∈ X)(∃ A ∈ R)(x ∈ A); (2) množiny z R sú navzájom disjunktné, t. j. (∀ A, B ∈ R)(A = B ⇒ A ∩ B = ∅). Ľahko možno nahliadnuť, že faktorová množina X/∼ množiny X podľa ekvivalencie ∼ je zároveň rozkladom množiny X, ktorý je tvorený triedami navzájom ekvivalentných prvkov. Taktiež naopak, každý rozklad R množiny X určuje predpisom x ∼R y ⇔ (∃ A ∈ R)(x, y ∈ A) 36 0. Základné pojmy z logiky a teórie množín ekvivalenciu na množine X. Inak povedané, prvky x, y ∈ X sú vo vzťahu ekvivalencie určenej rozkladom R práve vtedy, keď sa nachádzajú v tej istej (jednoznačne určenej) množine z tohto rozkladu. Čitateľovi prenechávame, aby si samostane overil, že takto definovaný vzťah ∼R je reflexívny, symetrický a tranzitívny, t. j. má všetky tri požadované vlastnosti ekvivalencie, ako aj rovnosť X/∼R = R, t. j. že rozklad (faktorová množina) určený ekvivalenciou ∼R splýva s pôvodným rozkladom R. 0.6.1. Príklad. Rozklad prislúchajúci k spomínanej ekvivalencii x ∼ y ⇔ |x| = |y| na množine C je vlastne rozkladom komplexnej roviny na navzájom sústredné kružnice so stredom v počiatku 0 a ľubovoľným polomerom r ≥ 0 (kružnicu s nulovým polomerom prirodzene stotožňujeme s jej stredom). 0.7 O matematických dôkazoch Matematika je veda vybudovaná prevažne (hoci nie výlučne) deduktívne. To znamená, že v tej-ktorej matematickej teórii vychádzame z určitých základných pojmov, ktoré považujeme za intuitívne jasné vďaka istým s nimi spojeným názorným predstavám. Ďalšie pojmy potom definujeme pomocou pojmov základných alebo skôr definovaných. Základné pojmy označujú základné objekty, ktoré tvoria predmet nášho štúdia, alebo určité základné vzťahy medzi nimi. Tieto objekty a vzťahy sú charakterizované istými východzími tvrdeniami, ktorým hovoríme axiómy. V najjednoduchších prípadoch je platnosť axióm jasná z názoru, ktorý stojí v pozadí príslušnej teórie. V zložitejších prípadoch však môžu názorné predstavy zlyhať – vtedy sa na axiómy dívame ako na implicitné definície základných pojmov. To znamená, že rezignujeme na otázku, čo „naozaj označujú základné pojmy. Môžu označovať čokoľvek, čo spĺňa dané axiómy – to je všetko, čo o nich predpokladáme. Zisk z takéhoto prístupu spočíva v univerzálnosti matematiky – aj výsledky matematických teórií sa potom vzťahujú na veľmi rôznorodé oblasti reality. Totiž na tie, v ktorých možno interpretovať základné pojmy danej teórie tak, že sú pritom splnené jej axiómy. Pri deduktívnej výstavbe nejakej teórie vyvodzujeme ďalšie poznatky z jej axióm logickými prostriedkami, t. j. dokazujeme ich. Týmto dokázaným poznatkom hovoríme vety, tvrdenia, lemy a dôsledky, čím naznačujeme rôzny stupeň dôležitosti, ktorý im pripisujeme. Názvom veta označujeme tie najdôležitejšie z nich, menej dôležité nazývame tvrdeniami a tvrdenia pomocného charakteru označujeme ako lemy. Dôsledky, ako už samotný názov napovedá, pripájame ako bezprostredné dôsledky niektorých viet, tvrdení či liem, pokiaľ ich význam nedosahuje úroveň viet. Poznamenajme, že toto rozdelenie má značne subjektívny charakter a vývoj ho často zvykne prekonať. Mnohé 0.7. O matematických dôkazoch 37 vety časom upadajú do zabudnutia, kým naopak mnohé lemy postupne nadobúdajú na význame. Základným prostriedkom odvodzovania nových poznatkov v deduktívnej teórii je dôkaz. V tomto paragrafe sa veľmi stručne zoznámime s hlavnými typmi matematických dôkazov: s priamym dôkazom, s nepriamym dôkazom a s dôkazom sporom. Uvidíme, že toto rozdelenie tak trochu súvisí so stratégiou vedenia príslušného dôkazu. V nasledujúcom paragrafe sa ešte zoznámime s dôkazom matematickou indukciou. Väčšina matematických tvrdení má tvar implikácie P ⇒ Q, t. j. tvrdí sa v nich, že z predpokladu P vyplýva záver Q. Pritom predpoklad P je často konjunkciou nejakých dielčích predpokladov, čiže má tvar P1 & . . . & Pn. Na tomto mieste sa obmedzíme na niekoľko poznámok o dôkazoch tvrdení takéhoto tvaru. 0.7.1. Priamy dôkaz. Pri priamom dôkaze implikácie P ⇒ Q dokazujeme (či sa aspoň pokúšame dokázať) záver Q z predpokladu P. Spočiatku sa snažíme dokázať priamo záver Q z daných axióm a už skôr dokázaných tvrdení. Postupujeme pri tom tak ďaleko, ako sa len dá, pričom jedným očkom stále poškuľujeme po predpoklade P, či dielčích predpokladoch P1, . . . , Pn. Vo chvíli, keď už nevieme ako ďalej, siahneme po tom z dielčích predpokladov Pi, ktorý nám umožní pohnúť sa dopredu. Opäť postupujeme ďalej a vo vhodnej chvíli zasa použijeme niektorý dielčí predpoklad Pj (nie nevyhnutne rôzny od Pi). Ak sme úspešní, nakoniec sa nám podarí dospieť k záveru Q, čím dôkaz končí. Ak sme neúspešní, musíme to skúsiť inak, prípadne sa zamyslieť nad otázkou, či spomínaná implikácia vôbec platí. Môže sa stať, že pri našom úspešnom dôkaze sme nepoužili všetky dielčie predpoklady P1, . . . , Pn, ale povedzme prvý a posledný z nich sme nepotrebovali. To znamená, že miesto pôvodného tvrdenia (P1 & P2 & . . . & Pn−1 & Pn) ⇒ Q sme dokázali silnejšie tvrdenie (P2 & . . . & Pn−1) ⇒ Q. 0.7.2. Nepriamy dôkaz. Pri nepriamom dôkaze implikácie P ⇒ Q dokazujeme miesto nej logicky ekvivalentnú tzv. transponovanú implikáciu ¬Q ⇒ ¬P práve opísanou metódou priameho dôkazu. Za tým účelom býva často užitočné (pokiaľ to ide) rozčleniť predpoklad ¬Q na konjunkciu dielčích predpokladov R1 & . . . & Rm. Ak pôvodný predpoklad P bol konjunkciou dielčích predpokladov P1 & . . . & Pn, tak jeho negácia ¬P je ekvivalentná s alternatívou ¬P1 ∨ . . . ∨ ¬Pn. Potom transponovaná implikácia ¬Q ⇒ ¬P je logicky ekvivalentná s ľubovoľnou z implikácií (¬Q & P1 & . . . & Pi−1 & Pi+1 & . . . & Pn) ⇒ ¬Pi, kde 1 ≤ i ≤ n. Nový záver ¬Pi sa, samozrejme, usilujeme vybrať čo najvý- 38 0. Základné pojmy z logiky a teórie množín hodnejšie, na čo neexistuje jednoznačný recept, no časom sa nám azda podarí nadobudnúť cit, ktorým sa budeme môcť riadiť. 0.7.3. Dôkaz sporom. Dôkaz sporom do istej miery pripomína nepriamy dôkaz a často sa s ním zvykne zamieňať. Najmä začiatočník by mal k nemu siahnuť až vtedy, keď sa mu priamy ani nepriamy dôkaz nedarí, prípadne keď v ňom skrsne podozrenie, že dokazované tvrdenie neplatí. Namiesto dokazovanej implikácie P ⇒ Q prijmeme predpoklad P & ¬Q, ktorý je logicky ekvivalentný s jej negáciou ¬(P ⇒ Q). Tento predpoklad sa usilujeme doviesť k sporu, čím sa myslí nejaký logicky absurdný záver, ako napr. x = x, alebo spor s niektorým z pôvodných predpokladov P, ¬Q, prípadne spor s niektorou z axióm alebo s niektorým zo skôr dokázaných tvrdení. Na rozdiel od priameho alebo nepriameho dôkazu, dôkaz sporom nemá vopred stanovený smer určený nejakým známym záverom – ten by sa mal objaviť až v jeho priebehu. Ak sa ani pokus doviesť k sporu predpoklad P & ¬Q neskončí úspešne, je namieste pokúsiť sa ho dokázať, to znamená vyvrátiť pôvodnú hypotézu P ⇒ Q. 0.7.4. Dôkaz ekvivalencie. Niekedy sa nám môže podariť dokázať ekvivalenciu P ⇔ Q postupnosťou logicky ekvivalentných krokov, no to je skôr výnimka než pravidlo. Vo všeobecnosti si jej dôkaz vyžaduje dokázať zvlášť každú z implikácií P ⇒ Q, Q ⇒ P. Pritom na každú z nich možno použiť ľubovoľnú z troch skôr spomínaných metód. Často sa jedna z uvedených implikácií dokazuje priamo a druhá nepriamo, teda dôkaz uvedenej ekvivalencie pozostáva napr. z priamych dôkazov implikácií P ⇒ Q a ¬P ⇒ ¬Q. V našom kurze sa neraz stretneme s vetami, v ktorých sa tvrdí ekvivalencia viacerých podmienok P1, . . . , Pn. V tom je zahrnutých n(n − 1) jednotlivých implikácií Pi ⇒ Pj pre rôzne i, j ≤ n. Dokazovať ich všetky by pre n ≥ 3 bolo značne neefektívne a taktiež zbytočné. Stačí totiž dokázať n implikácií tvoriacich cyklus Pσ(1) ⇒ Pσ(2) ⇒ . . . ⇒ Pσ(n−1) ⇒ Pσ(n) ⇒ Pσ(1), kde σ je ľubovoľná permutácia množiny indexov {1, . . . , n}, ktorú si volíme tak, aby to bolo čo najvýhodnejšie. S príkladmi všetkých uvedených typov dôkazov sa budeme v našom kurze neustále stretávať. 0.8 Matematická indukcia a rekurzia Množinu všetkých nezáporných celých čísel značíme N = {0, 1, 2, . . . , } a nazývame ju tiež množinou všetkých prirodzených čísel. 0.8. Matematická indukcia a rekurzia 39 0.8.1. Dôkaz matematickou indukciou. Platnosť nejakého tvrdenia P(n) pre všetky prirodzené čísla, t. j. tvrdenie (∀ n ∈ N)P(n) sa obvykle dokazuje matematickou indukciou. Dôkaz indukciou spočíva v dôkaze dvoch tvrdení: nato, aby sme dokázali, že každé prirodzené číslo n má vlastnosť P, stačí dokázať, že platí 1◦ P(0), t. j. 0 má vlastnosť P; 2◦ (∀ n ∈ N)(P(n) ⇒ P(n + 1)), t. j. ak n je ľubovoľné prirodzené číslo, ktoré má vlastnosť P, tak aj číslo n + 1 má vlastnosť P. Štruktúru dôkazu matematickou indukciou tak možno zhrnúť do schémy P(0) & (∀ n ∈ N)(P(n) ⇒ P(n + 1)) ⇒ (∀ n ∈ N)P(n). V bode 2◦ sa vlastne tvrdí platnosť všetkých implikácií P(0) ⇒ P(1), P(1) ⇒ P(2), P(2) ⇒ P(3), . . . . Z bodu 1◦ a prvej z nich vyplýva P(1), z toho spolu s druhou implikáciou dostávame P(2), z čoho pomocou tretej implikácie plynie P(3), atď. Princíp matematickej indukcie je logicky ekvivalentný so zdanlivo očividným princípom dobrého usporiadania, ktorý tvrdí, že každá neprázdna množina A ⊆ N má najmenší prvok. Keďže pre väčšinu študentov býva tento princíp ľahšie prijateľný než princíp indukcie, predvedieme ako možno princíp indukcie z neho dokázať. Dôkaz princípu dobrého usporiadania z princípu indukcie prenechávame na rozmyslenie čitateľovi. Predpokladajme teda platnosť princípu dobrého usporiadania. Nech P je vlastnosť taká, že platí P(0) a (∀ n ∈ N)(P(n) ⇒ P(n + 1)). Označme A = {n ∈ N; ¬P(n)}. Ak neplatí (∀ n ∈ N)P(n), tak A = ∅. Nech m je najmenší prvok množiny A. Potom zrejme m = 0 a m − 1 /∈ A, teda platí P(m − 1). No keďže P(m − 1) ⇒ P(m), platí P(m), čiže m /∈ A, čo je spor. Z pedagogických dôvodov sa budeme (najmä spočiatku) pri dôkazoch indukciou odvolávať radšej na princíp dobrého usporiadania než na princíp indukcie, a tomu tiež podriadime redakciu dôkazu. Poznámka. (a) Niekedy je potrebné miesto počiatočného tvrdenia 1◦ osobitne dokázať niekoľko prvých tvrdení P(0), P(1), . . . , P(k) a potom prejsť k dôkazu modifikovaného tvrdenia 2◦ , totiž (∀ n ≥ k)(P(n) ⇒ P(n + 1)). (b) Indukciou možno dokazovať aj tvrdenia tvaru (∀ n ≥ m)P(n), kde m je nejaké pevné prirodzené číslo. Stačí dokázať mierne upravené verzie tvrdení 1◦ a 2◦ : P(m) a (∀ n ≥ m)(P(n) ⇒ P(n + 1)). (c) Pri dôkaze indukciou možno bod 2◦ nahradiť tvrdením (∀ n ∈ N) (P(0) & . . . & P(n)) ⇒ P(n + 1) . 40 0. Základné pojmy z logiky a teórie množín Inak povedané, pri dôkaze záveru P(n+1) v bode 2◦ sa nemusíme opierať len o predpoklad P(n), ale v prípade potreby môžeme ako predpoklady použiť všetky predchádzajúce tvrdenia P(0), . . . , P(n). Takýto dôkaz indukciou sa vlastne riadi schémou (∀ n ∈ N) (∀ k < n)P(k) ⇒ P(n) ⇒ (∀ n ∈ N)P(n). Rozmyslite si, ako je predpoklad 1◦ , t. j. tvrdenie P(0), už zahrnutý v predpoklade novej schémy pre n = 0, t. j. v tvrdení (∀ k < 0)(P(k) ⇒ P(0)). Ďalej si premyslite, ako možno transpozíciou uvedenej implikácie priamo dostať matematickú formuláciu princípu dobrého usporiadania. 0.8.2. Rekurzia. Princíp matematickej indukcie sa používa nielen na dôkazy tvrdení o prirodzených číslach. Možno ho použiť aj na konštrukciu rôznych, či už konečných alebo nekonečných postupností. V takom prípade miesto indukcie budeme radšej hovoriť o postupnosti definovanej či zostrojenej rekurziou. Nech X je množina a F je zobrazenie, ktoré každej konečnej postupnosti, (usporiadanej n-tici) (x1, . . . , xn) prvkov z X (akejkoľvek dĺžky n ∈ N) priradí nejaký prvok F(x1, . . . , xn) ∈ X. Pomocou zobrazenia F možno zostrojiť nekonečnú postupnosť (an)∞ n=0 prvkov z X tak, že položíme a0 = F(∅), an+1 = F(a0, a1, . . . , an) pre každé n ∈ N. V takom prípade, hovoríme, že postupnosť (an) je definovaná rekurziou pomocou zobrazenia F. Druhú rovnosť možno samozrejme zapísať v tvare an = F(a0, a1, . . . , an−1) pre n > 0. Taktiež možno definíciu rekurziou obmedziť len na nejaký počiatočný úsek 0, 1, . . . , n množiny prirodzených čísel a dostať tak rekurziou konečnú postupnosť (a0, a1, . . . , an). Niekedy rekurziu začíname nie od nuly ale od jednotky, prípadne od ľubovoľného prirodzeného čísla k. Prvým členom postupnosti (an) zostrojenej rekurziou pomocou zobrazenia F je prvok a0 = F(∅) ∈ X. Ďalšie členy potom vyzerajú takto: a1 = F(a0), a2 = F(a0, a1), a3 = F(a0, a1, a2), . . . , an = F(a0, . . . , an−1), an+1 = F(a0, . . . , an), atď. Najčastejšie sa stretáme s prípadom, keď sa pri rekurzívnej konštrukcii člena an+1 nepoužíva celá predchádzajúca časť postupnosti (a0, . . . , an) ale len jej posledný člen an. Napríklad v aritmetickej postupnosti reálnych čísel s počiatočným členom a0 a diferenciou d platí an+1 = an + d; podobne rekurentný vzťah pre geometrickú postupnosť reálnych čísel s počiatočným členom a0 a kvocientom q má tvar an+1 = qan. 0.8. Matematická indukcia a rekurzia 41 Iným známym číselným príkladom je tzv. Fibonacciho postupnosť (φn)∞ n=0, ktorej rekurzívna definícia φ0 = φ1 = 1, φn+2 = φn + φn+1 používa dva predchádzajúce členy. Rozmyslite si, ako táto definícia zapadá do našej všeobecnej schémy. 0.8.3. Príklad. Bellove čísla sú definované rekurziou B0 = 1, Bn+1 = n k=0 n k Bk, pri ktorej sa využívajú všetky predchádzajúce členy. Pre istotu pripomíname, že n k = n! k!(n − k)! = n(n − 1) . . . (n − k + 1) k! označuje binomický koeficient alebo kombinačné číslo udávajúce počet všetkých k-prvkových podmnožín n-prvkovej množiny. Vypočítame niekoľko počiatočných hodnôt Bellových čísel: B0 = 1, B1 = 0 0 B0 = 1, B2 = 1 0 B0 + 1 1 B1 = 2, B3 = 2 0 B0 + 2 1 B1 + 2 2 B2 = 5, B4 = 3 0 B0 + 3 1 B1 + 3 2 B2 + 3 3 B3 = 15, B5 = 4 0 B0 + 4 1 B1 + 4 2 B2 + 4 3 B3 + 4 4 B4 = 52, B6 = 5 0 B0 + 5 1 B1 + 5 2 B2 + 5 3 B3 + 5 4 B4 + 5 5 B5 = 203, . . . Matematickou indukciou teraz dokážeme, že počet všetkých rozkladov n-prvkovej množiny (teda aj ekvivalencií na n-prvkovej množine) je rovný číslu Bn. Zrejme na prázdnej možine existuje jediný rozklad R = ∅. Predpokladajme teraz, že pre každé k ≤ n existuje práve Bk rozkladov k-prvkovej množiny. Všetky rozklady (n + 1)-prvkovej množiny {0, 1, . . . , n} možno získať nasledujúcim spôsobom: 42 0. Základné pojmy z logiky a teórie množín (1) zvolíme si ľubovoľné k ≤ n a ľubovoľnú k-prvkovú podmnožinu A množiny {1, . . . , n} – to pre dané k možno urobiť práve n k spôsobmi; (2) vezmeme ľubovoľný rozklad R množiny A – ten podľa indukčného predpokladu možno vybrať práve Bk spôsobmi – a množinu A = {0, 1, . . . , n} A pridáme k pôvodnému rozkladu R. Zrejme sme takto získali nejaký rozklad RA = R ∪ {A } (n + 1)-prvkovej množiny {0, 1, . . . , n}, pričom každý rozklad S množiny {0, 1, . . . , n} má tvar S = RA pre jednoznačne určenú dvojicu (R, A). Všetkých rozkladov (n+1)prvkovej množiny teda je n k=0 n k Bk = Bn+1. Cvičenia 0.1. Pre ľubovoľné množiny X, Y sú nasledujúce štyri podmienky ekvivalentné: (i) X ⊆ Y , (ii) X ∩ Y = X, (iii) X ∪ Y = Y , (iv) X Y = ∅. Dokážte. 0.2. Vzťah inklúzie je reflexívny a tranzitívny, t. j. pre ľubovoľné množiny X, Y , Z platí: (a) X ⊆ X; (b) X ⊆ Y & Y ⊆ Z ⇒ X ⊆ Z Dokážte. Nájdite príklad dosvedčujúci, že nie je symetrický. 0.3. Nech Z = {. . . , −2, −1, 0, 1, 2, . . . } označuje množinu všetkých celých čísel. Pre každé 0 = n ∈ Z označme nZ = {nx; x ∈ Z} množinu všetkých celých čísel deliteľných číslom n. Dokážte, že pre ľubovoľné nenulové celé čísla m, n platí (a) mZ ⊆ nZ ⇔ m je násobkom n; (b) mZ = nZ ⇔ |m| = |n|; (c) mZ ∩ nZ = kZ, kde k je najmenší spoločný násobok čísel m a n; (d) Môže pre niektoré m, n nastať rovnosť mZ∩nZ = ∅, prípadne mZ∩nZ = {0}? Zdôvodnite. 0.4. Pre ľubovoľné množiny X, Y , Z platí X ∩ Y = Y ∩ X, X ∪ Y = Y ∪ X, X ∩ (Y ∩ Z) = (X ∩ Y ) ∩ Z, X ∪ (Y ∪ Z) = (X ∪ Y ) ∪ Z, X ∩ X = X, X ∪ X = X, X ∩ ∅ = ∅, X ∪ ∅ = X, X ∩ (Y ∪ Z) = (X ∩ Y ) ∪ (X ∩ Z), X ∪ (Y ∩ Z) = (X ∪ Y ) ∩ (X ∪ Z), X X = ∅, X ∅ = X, X ∩ (Y X) = ∅, X ∪ (Y X) = X ∪ Y, (X ∩ Y ) Z = (X Z) ∩ (Y Z), (X ∪ Y ) Z = (X Z) ∪ (Y Z), X (Y ∩ Z) = (X Y ) ∪ (X Z), X (Y ∪ Z) = (X Y ) ∩ (X Z), (X Y ) Z = X (Y ∪ Z), X (Y Z) = (X Y ) ∪ (X ∩ Z), (X Y ) ∩ Z = (X ∩ Z) Y, (X Y ) ∪ Z = (X ∪ Z) (Y Z). Dokážte. Pomenujte niektoré z uvedených vlastností binárnych operácií ∩, ∪ a (komutatívnosť, asociatívnosť, . . . ). 0.5. Pre ľubovoľné množiny X, Y , Z platí Cvičenia 43 X × (Y ∩ Z) = (X × Y ) ∩ (X × Z), X × (Y ∪ Z) = (X × Y ) ∪ (X × Z), X × (Y Z) = (X × Y ) (X × Z), X × ∅ = ∅. Dokážte. Napíšte analogické vzťahy distributívnosti karteziánskeho súčinu vzhľadom na operácie prieniku, zjednotenia a množinového rozdielu pri násobení sprava. 0.6. Nech X, Y , Z sú ľubovoľné množiny. Nájdite čo najprirodzenejšiu bijekciu a k nej inverzné zobrazenie medzi každou z nasledujúcich dvojíc množín (množina P(X) všetkých podmnožín množiny X z časti (f) sa nazýva potenčná množina množiny X): (a) X × Y , Y × X; (b) X × (Y × Z), (X × Y ) × Z; (c) (X × Y )Z , XZ × Y Z ; (d) XY ×Z , XY Z ; (e) Xn , X{1,...,n} ; (f) {0, 1}X , P(X) = {A; A ⊆ X}; (g) XY ∪Z , XY × XZ Y ; (h) XY × XZ , X(Y ×{0})∪(Z×{1}) . 0.7. Nech R označuje množinu všetkých reálnych čísel. Funkcie f, g, h: R → R sú dané predpismi f(x) = (x + 1)2 , g(x) = 1 − sin 2x, h(x) = e−x . Napíšte a zjednodušte predpisy pre zložené funkcie f ◦ f, f ◦ g, g ◦ f, f ◦ h, h ◦ f, g ◦ h, h ◦ g, f ◦ g ◦ h, h ◦ g ◦ f, g ◦ f ◦ h a g ◦ h ◦ f. 0.8. Nech f : X → Y , g: Y → Z sú ľubovoľné zobrazenia. Dokážte postupne nasledujúce tvrdenia: (a) Ak f, g sú injektívne, tak aj g ◦ f je injektívne. (b) Ak f, g sú surjektívne, tak aj g ◦ f je surjektívne. (c) Ak f, g sú bijektívne, tak aj g ◦ f je bijektívne. (d) Ak g ◦ f je injektívne, tak aj f je injektívne. (e) Ak g ◦ f je surjektívne, tak aj g je surjektívne. (f) Ak g ◦ f je bijektívne, tak f je injektívne a g je surjektívne. Na príklade ukážte, že v prípade (f) g nemusí byť injektívne ani f surjektívne. Čo z toho vyplýva pre prípady (d) a (e)? 0.9. Pre ľubovoľné zobrazenia f : X → Y , g: Y → Z a množiny A ⊆ X, B ⊆ Z dokážte rovnosti: (a) (g ◦ f)(A) = g(f(A)); (b) (g ◦ f)−1 (B) = f−1 (g−1 (B)). 0.10. Nech f : X → Y je ľubovoľné zobrazenie. Potom pre všetky A, B ⊆ X, C, D ⊆ Y platí (a) A ⊆ B ⇒ f(A) ⊆ f(B); (b) C ⊆ D ⇒ f−1 (C) ⊆ f−1 (D); (c) f(A ∩ B) ⊆ f(A) ∩ f(B); (d) f−1 (C ∩D) = f−1 (C)∩f−1 (D); (e) f(A ∪ B) = f(A) ∪ f(B); (f) f−1 (C ∪ D) = f−1 (C) ∪ f−1 (D); (g) f(A B) ⊇ f(A) f(B); (h) f−1 (C D) = f−1 (C) f−1 (D); (i) f−1 (f(A)) ⊇ A; (j) f f−1 (C) ⊆ C. Dokážte. Na príkladoch sa presvedčte, že inklúzie v prípadoch (c), (g), (i) a (j) nemožno zameniť rovnosťami. Ukážte, že rovnosť pre všetky A, B ⊆ X je v ľubovoľnom z prípadov (c), (g) a (i) ekvivalentná s injektívnoťou zobrazenia f. Podobne je rovnosť pre každé C ⊆ Y v prípade (j) ekvivalentná so surjektívnosťou f. 44 0. Základné pojmy z logiky a teórie množín 0.11. Nech f : X → Y , g: Y → Z sú bijektívne zobrazenia. Potom (g ◦ f)−1 = f−1 ◦ g−1 . Dokážte. Odvoďte z toho, že pre každú permutáciu σ ∈ Sn platí |σ| = σ−1 a sgn σ = sgn σ−1 . 0.12. (a) Sformulujte pojmy ľavého a pravého neutrálneho prvku binárnej operácie ∗ na množine X. (b) Nech x y = y pre všetky x, y ∈ X. Je táto binárna operácia na množine X asociatívna resp. komutatívna? Nájdite všetky ľavé a všetky pravé neutrálne prvky operácie . (c) Predpokladajme, že e je jediným neutrálnym prvkom (či už ľavým, pravým alebo obojstranným) binárnej operácie ∗ na množine X. Sformulujte pojmy ľavého a pravého inverzného prvku k danému prvku x ∈ X. (d) Pomocou multiplikatívnej tabuľky nájdite príklad (neasociatívnej) binárnej operácie ∗ na množine X, ktorá má jediný (obojstranný) neutrálny prvok e, pričom niektorý prvok a ∈ X má jediný ľavý inverzný a dva rôzne pravé inverzné prvky, a iný prvok b ∈ X má jediný ľavý inverzný no žiadny pravý inverzný prvok. Aké situácie môžu ešte nastať? (Pozri cvičenie 0.18.) 0.13. Nech = 1 2 3 4 3 4 1 2 , σ = 1 2 3 4 2 3 1 4 sú permutácie množiny {1, 2, 3, 4}. Vypočítajte permutácie σ−1 , −1 σ ◦ , ◦ σ, σ ◦ −1 , ◦ σ−1 a −1 ◦ σ ◦ . 0.14. Nech 1 ≤ i ≤ n ∈ N. Permutácia α ∈ Sn sa nazýva i-cyklus, ak na nejakej iprvkovej množine {a1, a2, . . . , ai} ⊆ {1, 2, . . . , n} operuje cyklicky podľa schémy α: a1 → a2 → . . . → ai → a1 a na zvyšku množiny {1, . . . , n} identicky, t. j. α(a) = a pre a ∈ {1, . . . , n} {a1, . . . , ai}. Skrátene píšeme α = (a1, . . . , ai). Dva cykly α = (a1, . . . , ai), β = (b1, . . . , bj) sa nazývajú disjunktné, ak {a1, . . . , ai} ∩ {b1, . . . , bj} = ∅. Zrejme identickú permutáciu možno považovať za 1-cyklus a každá transpozícia je 2-cyklus. Dokážte postupne nasledujúce tvrdenia: (a) Nech α, β ∈ Sn sú dva cykly. Potom α ◦ β = β ◦ α práve vtedy, keď cykly α, β sú disjunktné alebo aspoň jeden z nich je 1-cyklus. (b) Každá permutácia σ ∈ Sn, je kompozíciou disjunktných cyklov σ = α1 ◦ . . . ◦ αk. Ak do tejto kompozície zahrnieme aj všetky 1-cykly, tak uvedený rozklad je určený jednoznačne až na poradie jednotlivých cyklov. (Návod: Vytvorte cyklus (1, σ(1), σ2 (1), . . . , σi−1 (1)). Na zvyšku množiny {1, . . . , n}, ak nejaký zostal, postup opakujte.) (c) Každý cyklus je kompozíciou transpozícií (napr. (1, 2, . . . , n) = (1, n) ◦ . . . ◦ (1, 3) ◦ (1, 2)). (d) Každá permutácia σ ∈ Sn je kompozíciou transpozícií. (e) Dĺžka i-cyklu α je |α| = i − 1 a jeho znak je sgn α = (−1)i−1 . (f) Nech σ = α1 ◦ . . . ◦ αk je rozklad permutácie σ na disjunktné cykly, pričom αj je ij-cyklus. Potom dĺžka permutácie σ je |σ| = i1 + . . . + ik − k a jej znak je sgn σ = (−1)i1+...+ik−k . Ak uvedený rozklad zahŕňa aj všetky 1-cykly, tak |σ| = n − k a sgn σ = (−1)n−k . 0.15. (a) Rozložte každú z permutácií zo zadania aj výsledkov v cvičení 0.11 na kompozíciu disjunktných cyklov (vrátane 1-cyklov) a pre každú z nich určte jej dĺžku a znamienko. Cvičenia 45 (b) Spočítajte pre každú z uvedených permutácií počet jej inverzií a porovnajte s jej dĺžkou. Presvedčte sa, že obe čísla sa nemusia rovnať, no vždy majú rovnakú paritu. (c) Rozložte permutáciu τ = (1, 3, 5, 7) ◦ (1, 2) ◦ (2, 4, 6, 8) ◦ (4, 5, 6) ∈ S10 na disjunktné cykly (vrátane 1-cyklov) a určte jej dĺžku a znamienko. 0.16. k:0.16 (a) Nech n ∈ Z (pozri cvičenie 0.3). Dokážte, že vzťahom x ≡n y ⇔ x−y ∈ nZ je definovaná ekvivalencia na množine Z. Túto ekvivalenciu značíme tiež x ≡ y mod n a nazývame ju kongruenciou modulo n. (b) Predpokladajme, že n > 0, a označme Zn = {0, 1, . . . , n − 1} = {x ∈ Z; 0 ≤ x < n}. Potom (∀ x ∈ Z)(∃! z ∈ Zn)(x ≡n z). Dokážte. Toto jednoznačne určené z ∈ Zn nazývame zvyškom po delení čísla x číslom n. (c) Pre ľubovoľné n ∈ Z platí (∀ x, y, u, v ∈ Z)(x ≡n y & u ≡n v ⇒ x + u ≡n y + v & xu ≡n yv). (d) Ako vyzerajú triedy rozkladu množiny Z podľa kongruencie ≡n? 0.17. Matematickou indukciou dokážte nasledujúce vzorce: (a) n i=1 i = 1 + 2 + . . . + n = 1 2 n(n + 1); (b) n j=1 j(j + 1) = 1 · 2 + 2 · 3 + . . . + n(n + 1) = 1 3 n(n + 1)(n + 2); (c) n k=1 k2 = 12 + 22 + . . . + n2 = 1 6 n(n + 1)(2n + 1); (d) n k=0 qk = 1 + q + q2 + . . . + qn = qn+1 −1 q−1 , (q = 1); (e) n p=1 sin px = sin x + sin 2x + . . . + sin nx = sin(nx/2) sin((n+1)x/2) sin(x/2) , (x = 2kπ, k ∈ Z); (f) n p=0 cos px = cos 0 + cos x + . . . + cos nx = cos(nx/2) sin((n+1)x/2) sin(x/2) , (x = 2kπ, k ∈ Z); (g) φn = 1+ √ 5 n+1 − 1− √ 5 n+1 2n+1 √ 5 , (φn sú Fibonacciho čísla). 0.18. (a) Priamym výpočtom overte, že binomické koeficienty n k = n! k!(n−k)! vyhovujú rovnosti n k = n n−k a pravidlám Pascalovho trojuholníka, t. j. n 0 = n n = 1 a n+1 k = n k−1 + n k pre 1 ≤ k ≤ n. (b) Označme C(n, k) počet všetkých k-prvkových podmnožín n-prvkovej množiny. Kombinatorickou úvahou dokážte, že aj tzv. kombinačné čísla C(n, k) vyhovujú pravidlám Pascalovho trojuholníka, t. j. C(n, 0) = C(n, n) = 1 a C(n + 1, k) = C(n, k − 1) + C(n, k) pre 1 ≤ k ≤ n. (c) Na základe (a) a (b) odvoďte známy vzorec C(n, k) = n k . Kde treba pritom použiť matematickú indukciu? (d) Pre k > n dodefinujme n k = C(n, k) = 0. Predpisom n ∗ k = C(n, k) je tak definovaná binárna operácia na množine N. Je táto operácia komutatívna resp. asociatívna? Má nejaký ľavý resp. pravý neutrálny prvok? (Pozri cvičenie 0.12.) Ako je to s prípadnými ľavými či pravými inverznými prvkami? (e) Riešte úlohu (d) aj pre binárnu operáciu n • k = C(n + k, k) = (n+k)! n! k! na množine N. 0.19. Matematickou indukciou dokážte princíp dobrého usporiadania množiny N (t. j. 46 0. Základné pojmy z logiky a teórie množín každá neprázdna podmnožina A množiny N má najmenší prvok). (Návod: Transponujte implikáciu (∀ n ∈ N) (∀ k < n)P(k) ⇒ P(n) ⇒ (∀ n ∈ N)P(n), a nahraďte vlastnosť P(n) vlastnosťou n /∈ A.) 1. Polia a vektorové priestory V tejto kapitole zavedieme dva druhy algebraických štruktúr, ktoré budú hrať v celom ďalšom výklade kľúčovú úlohu, a dokážeme o nich niekoľko jednoduchých základných tvrdení. Ide štruktúry, ktoré zahŕňame pod pojem poľa a pojem vektorového priestoru. Prvky poľa budeme nazývať skaláry, a niekedy len čísla. Fyzikálne ich možno interpretovať ako hodnoty fyzikálnych veličín, ktoré sú určené iba svojou veľkosťou a znamienkom. Prvky vektorového priestoru, t. j. vektory, zasa zodpovedajú fyzikálnym veličinám, ktoré sú okrem veľkosti určené tiež smerom a orientáciou. 1.1 Základné číselné obory Predpokladáme, že čitateľ pozná základné číselné obory, ako sú prirodzené čísla, celé čísla, racionálne čísla, reálne čísla a komplexné čísla. Každý z týchto číselných oborov tvorí množinu. Dohodneme sa, že ich budeme označovať tzv. tučnými tabuľovými písmenami: N – množina všetkých prirodzených čísel, Z – množina všetkých celých čísel, Q – množina všetkých racionálnych čísel, R – množina všetkých reálnych čísel, C – množina všetkých komplexných čísel. Ešte poznamenajme, že i nulu považujeme za prirodzené číslo, t. j. 0 ∈ N. Imaginárnu jednotku (ktorá je prvkom C R) budeme značiť i. Konštatovaním, že uvedené číselné obory tvoria množiny, sme však ich štruktúru zďaleka nevyčerpali. Omnoho dôležitejšie je, že na každej z týchto množín sú definované dve binárne operácie, sčítanie + a násobenie · . Pritom na každej z uvedených množín sú obe tieto operácie asociatívne a komutatívne. Navyše, násobenie je (z oboch strán) distributívne vzhľadom na sčítanie, t. j. pre všetky prvky x, y, z príslušnej množiny platí x(y + z) = xy + xz, (x + y)z = xz + yz. Číselný obor N je v porovnaní s obormi Z, Q, R a C akýsi „chudobnejší – kým rovnice tvaru x + a = b majú v oboroch Z, Q, R, C riešenie x = b − a pre ľubovoľné a, b, v N je takáto rovnica riešiteľná len ak a ≤ b. Obory Q, R a C sú však „bohatšie nielen v porovnaní s N no i so Z – rovnice tvaru 48 1. Polia a vektorové priestory ax = b majú v oboroch Q, R, C riešenie pre ľubovoľné a = 0 a b, kým v N či Z sú riešiteľné len ak a je deliteľom b. Nás budú zaujímať práve vlastnosti číselných oborov Q, R a C s operáciami sčítania a násobenia. Pritom využijeme, že uvedené operácie na týchto oboroch majú rad spoločných vlastností, čo nám umožňuje skúmať ich do veľkej miery jednotným spôsobom a súčasne. To dosiahneme tým, že sformulujeme abstraktný pojem poľa, pod ktorý zahrnieme všetky spomínané prípady, ako i mnohé ďalšie, ktoré sa nám objavia až akosi dodatočne. Ako sme spomínali už v úvode, práve takýto prístup je charakteristický pre algebru, presnejšie, v ňom spočíva jej podstata. 1.2 Polia Poľom nazývame množinu K s dvoma význačnými prvkami – nulou 0 a jednotkou 1 – a dvomi binárnymi operáciami na K – sčítaním + a násobením · – takými, že platí (∀ a, b ∈ K)(a + b = b + a), (∀ a, b ∈ K)(a · b = b · a), (∀ a, b, c ∈ K)(a + (b + c) = (a + b) + c), (∀ a, b, c ∈ K)(a · (b · c) = (a · b) · c), (∀ a ∈ K)(a + 0 = a), (∀ a ∈ K)(1 · a = a), (∀ a ∈ K)(∃ b ∈ K)(a + b = 0), (∀ a ∈ K {0})(∃ b ∈ K)(a · b = 1), (∀ a, b, c ∈ K)(a · (b + c) = (a · b) + (a · c)), 0 = 1. Teda sčítanie a násobenie v poli sú komutatívne a asociatívne operácie a násobenie je distributívne vzhľadom na sčítanie. Ďalej 0 je neutrálny prvok sčítania a 1 je neutrálny prvok násobenia, pričom tieto dva prvky sú rôzne. Jednoducho možno nahliadnuť, že prvok b ∈ K taký, že a + b = 0, t. j. inverzný prvok vzhľadom na operáciu sčítania, je k danému prvku a ∈ K určený jednoznačne (pozri paragraf 0.4). Tento jednoznačne určený prvok k danému a označujeme −a a nazývame opačný prvok k a. Miesto a + (−b) zvykneme písať len a−b. Takisto prvok b ∈ K taký, že a·b = 1, je k danému 0 = a ∈ K určený jednoznačne – označujeme ho a−1 alebo 1 a , prípadne 1/a a nazývame inverzný prvok k a alebo prevrátená hodnota prvku a. Miesto a · b−1 píšeme tiež a b alebo a/b. Znak násobenia budeme väčšinou vynechávať a násobenie bude mať prednosť pred sčítaním, teda napr. miesto (a · b) + c budeme písať len ab + c. Asociatívnosť nám umožňuje vynechávať zátvorky a súčty či súčiny ľubovoľných konečných postupností prvkov poľa jednoznačne zapisovať v tvare a1 + a2 + . . . + an resp. a1 · a2 · . . . · an prípadne len a1a2 . . . an; komutatívnosť nám navyše dovoľuje nestarať sa o poradie sčítancov resp. činiteľov. Kvôli úplnosti sa dohodneme, že pre n = 1 sa oba uvedené výrazy rovnajú a1; pre n = 0 kladieme prázdny súčet rovný 0 a prázdny súčin rovný 1. Ak 1.2. Polia 49 a1 = . . . = an = a, tak miesto a1 + . . . + an píšeme na a miesto a1 . . . an len an . Teraz si ukážeme, ako možno niektoré najzákladnejšie pravidlá počítania, na ktoré sme zvyknutí v číselných oboroch Q, R a C, odvodiť len z axióm poľa. Zhrnieme ich do nasledujúceho tvrdenia. Okrem iného z neho vyplýva, že k 0 nemôže v poli existovať inverzný prvok (podmienka (c)). 1.2.1. Tvrdenie. Nech K je pole. Potom pre ľubovoľné n ∈ N a a, b, c, b1, . . . , bn ∈ K platí (a) a + b = a + c ⇒ b = c, (b) (ab = ac & a = 0) ⇒ b = c, (c) a0 = 0, (d) ab = 0 ⇒ (a = 0 ∨ b = 0), (e) −a = (−1)a, (f) a(b − c) = ab − ac, (g) a(b1 + . . . + bn) = ab1 + . . . + abn. Dôkaz. (a), (b) Keďže obe podmienky možno dokázať v podstate rovnako, urobíme to len pre druhú z nich. Z ab = ac vyplýva a−1 ab = a−1 ac. Ľavá strana sa rovná b a pravá c. (c) a0 + a0 = a(0 + 0) = a0 = a0 + 0. Podľa (a) z toho vyplýva a0 = 0. (d) Nech ab = 0. Potom podľa (c) ab = 0 = a0. Ak a = 0, tak podľa (b) z toho vyplýva b = 0. (e) Vďaka jednoznačnosti opačného prvku k a stačí overiť, že (−1)a+a = 0. Jednoduchý výpočet dáva (−1)a + a = (−1)a + 1a = (−1 + 1)a = 0a = 0 podľa (c). (f) Podľa (e) a(b−c) = a(b+(−1)c) = ab+a(−1)c = ab+(−1)ac = ab−ac. (g) Rovnosť zrejme platí pre n = 0, 1, 2. Keby neplatila pre všetky prirodzené čísla, označme n najmenšie prirodzené číslo, pre ktoré existujú a, b1, . . . , bn ∈ K také, že uvedená rovnosť neplatí. Potom n > 2 a pre n − 1 rovnosť platí. Preto a(b1 + . . . + bn−1 + bn) = a(b1 + . . . + bn−1) + abn = ab1 + . . . + abn−1 + abn. To je však spor. Doplňme, že podmienky (a) a (b) sa nazývajú zákony o krátení pre sčítanie resp. násobenie v poli. Podmienka (e) nám umožňuje zaviesť ľubovoľné celočíselné násobky prvkov z poľa. Pre a ∈ K, n ∈ N kladieme (−n)a = −(na) = n(−a). Podobne možno pre nenulové prvky poľa zaviesť i ľubovoľné celočíselné mocniny. Pre 0 = a ∈ K, n ∈ N kladieme a−n = (an )−1 = (a−1 )n . 50 1. Polia a vektorové priestory Čitateľovi prenechávame, aby si sám odvodil nasledujúce rovnosti známe z bežných číselných oborov: 0a = 0, 1a = a, a ∈ K, n(a + b) = na + nb, a, b ∈ K, n ∈ Z, (m + n)a = ma + na, a ∈ K, m, n ∈ Z, (mn)a = m(na), a ∈ K, m, n ∈ Z, (mn)(ab) = (ma)(nb), a, b ∈ K, m, n ∈ Z, a0 = 1, a1 = a, a ∈ K, (ab)n = an bn , a, b ∈ K, n ∈ Z, n < 0 ⇒ a = 0 = b, am+n = am an , a ∈ K, m, n ∈ Z, (m < 0 ∨ n < 0) ⇒ a = 0, amn = (am )n , a ∈ K, m, n ∈ Z, (m < 0 ∨ n < 0) ⇒ a = 0, Ešte podotýkame, že v rovnostiach v prvom a šiestom riadku označujú 0 a 1 na ľavých stranách prirodzené čísla, t. j. prvky množiny N, kým 0 a 1 na pravých stranách v prvom riadku označujú prvky poľa K. Vzhľadom na to, že pre všetky tri príklady polí, s ktorými sme doteraz stretli, platí N ⊆ K, môže sa nám toto rozlíšenie zdať nepodstatné. Vo všeobecnosti však uvedená inklúzia platiť nemusí. Nech K je pole a L ⊆ K. Hovoríme, že L je podpole poľa K, ak 0, 1 ∈ L a pre všetky a, b ∈ L platí a + b ∈ L, ab ∈ L, −a ∈ L a, ak a = 0, tak aj a−1 ∈ L. Inak povedané, podpole poľa K je taká jeho podmnožina L, ktorá obsahuje nulu a jednotku a je uzavretá vzhľadom na sčítanie, násobenie, opačný a inverzný prvok. Zrejme každé podpole poľa K je s týmito operáciami zúženými z K na L i samo poľom. Hovoríme tiež, že pole K je rozšírením poľa L. Zrejme pole Q je podpoľom poľa R i poľa C; pole C je rozšírením poľa Q aj R. Charakteristikou poľa K, označenie char K, nazývame najmenšie kladné celé číslo n také, že n1 = 0; ak také n neexistuje, t. j. n1 = 0 pre každé celé n > 0, hovoríme že K má charakteristiku ∞ (niektorí autori vtedy kladú char K = 0). Ak pole K je rozšírením poľa L, tak polia K a L majú tú istú jednotku, preto char K = char L. Zrejme char Q = char R = char C = ∞. 1.2.2. Veta. Nech K je pole. Potom char K je ∞ alebo prvočíslo. Dôkaz Keďže 0 = 1, zrejme char K > 1. Predpokladajme, že char K = n je zložené číslo. Potom existujú celé čísla k, l > 1 také, že n = kl. Keďže k, l < n, je k1 = 0 = l1. Na druhej strane (k1)(l1) = (kl)(1 · 1) = n1 = 0. Podľa tvrdenia 1.2.1(d) z toho vyplýva k1 = 0 alebo l1 = 0, čo je spor. 1.3. Polia Zp 51 1.3 Polia Zp V tomto krátkom paragrafe si ukážeme príklady polí, ktorých charakteristika nie je ∞. Z toho dôvodu sa tieto polia výrazne odlišujú od našich dôverne známych číselných polí. Presnejšie, pre každé prvočíslo p zostrojíme isté konečné pole Zp, ktoré má p prvkov a charakteristiku p. Na druhej strane, spomínané číselné polia (ako vôbec všetky polia nekonečnej charakteristiky) sú nekonečné. Poznamenajme, že pre každé prvočíslo p a kladné celé číslo k existuje pk -prvkové pole s charakteristikou p ako aj nekonečné polia charakteristiky p. Ich konštrukcia však presahuje rámec nášho úvodného kurzu. Pre potreby matematickej analýzy, teda aj z hľadiska fyzikálnych aplikácií, sú najdôležitejšími poľami R a C. Konečné polia však v súčasnosti zohrávajú dôležitú úlohu napr. v kódovaní a kryptografii. Pre každé kladné celé číslo n označme Zn = {k ∈ N; k < n} = {0, 1, . . . , n − 1}. Množinu Zn zo zrejmých dôvodov (pozri cvičenie 0.12) nazývame množinou zvyškových tried modulo n. Na tejto množine teraz zavedieme dve binárne operácie – sčítanie ⊕ a násobenie (toto trochu ťažkopádne označenie budeme používať len v tomto paragrafe, neskôr sa vrátime k obvyklým + a · ; v definícii však treba odlíšiť sčítanie a násobenie v Zn od príslušných operácií v Z). Pre a, b ∈ Zn kladieme a ⊕ b = zvyšok po delení (a + b) : n, a b = zvyšok po delení (ab) : n. Čitateľovi prenechávame na overenie (prípadne na uverenie), že ⊕ a sú asociatívne a komutatívne operácie na Zn a násobenie je distributívne vzhľadom na sčítanie. Ďalej 0 je neutrálny prvok sčítania a, pre n > 1, je 1 neutrálny prvok násobenia. Navyše a = n − a je opačný prvok k a ∈ Zn {0}; pre a = 0 je samozrejme 0 = 0. 1.3.1. Veta. Množina Zn s operáciami ⊕ a je pole práve vtedy, keď n je prvočíslo. Dôkaz. Zrejme n je najmenšie kladné celé číslo také, že n1 = 1 ⊕ . . . ⊕ 1 n-krát = 0. Preto, ak Zn je pole, tak char Zn = n, a podľa vety 1.2.2 je n prvočíslo. Dokážeme, že Zp je pole pre každé prvočíslo p. Najprv overíme, že v Zp platí zákon o krátení 52 1. Polia a vektorové priestory (a b = a c & a = 0) ⇒ b = c. Rovnosť a b = a c znamená, že číslo ab − ac = a(b − c) je deliteľné číslom p. Keďže p je prvočíslo, musí byť aspoň jedno z čísel a, b − c deliteľné číslom p. Nakoľko 0 < a < p, môže to byť len b − c. Pre b, c ∈ Zp to však znamená b = c. Zostáva overiť existenciu inverzného prvku ku každému 0 = a ∈ Zp. Uvažujme postupnosť mocnín a1 = a, a2 = a a, a3 = a a a, . . ., atď. Keďže a = 0, z dokázaného krátenia vyplýva, že všetky jej členy sú nenulové. Pretože množina Zp je konečná, nemôžu byť všetky členy uvedenej postupnosti rôzne. Musia preto existovať kladné celé čísla k, l také, že ak = ak+l = ak al . Potom platí ak al = ak 1, z čoho krátením dostávame al = 1. Keďže al = a al−1 , je a−1 = al−1 inverzný prvok k a. Multiplikatívne tabuľky sčítania a násobenia v poli Z5 sme si ako príklady binárnych operácií uviedli v paragrafe 0.4. 1.4 Vektory v rovine a v trojrozmernom priestore Vektory v rovine či v priestore si predstavujeme ako orientované úsečky, t. j. úsečky, ktorých jeden krajný bod považujeme za počiatočný a druhý za koncový – ten je označený šípkou. Pritom dve rovnako dlhé, rovnobežné a súhlasne orientované úsečky predstavujú ten istý vektor – hovoríme, že sú umiestneniami toho istého vektora. Ak si teda zvolíme nejaký pevný bod O, tak všetky vektory v rovine či priestore môžeme jednoznačne reprezentovať ako orientované úsečky −→ OA s počiatkom v O, pričom ich koncom môže byť ľubovoľný bod A roviny či priestoru, bod O nevynímajúc – orientovaná úsečka −→ OO totiž predstavuje tzv. nulový vektor. Vektory v rovine i v priestore možno sčítať pomocou tzv. vektorového rovnobežníka. Súčet vektorov uuu = −→ OA, vvv = −−→ OB je potom znázornený orientovanou uhlopriečkou uuu +vvv = −→ OC rovnobežníka, ktorého dve priľahlé strany tvoria úsečky OA, OB. Vektory možno taktiež násobiť ľubovoľnými skalármi, t. j. reálnymi číslami: ak c ∈ R a vvv je vektor, tak cvvv je vektor, t. j. orientovaná úsečka s počiatkom v O, ktorej dĺžka je |c|-násobkom dĺžky úsečky vvv, leží na tej istej priamke ako vvv a je orientovaná súhlasne s vvv, ak c > 0, resp. nesúhlasne s vvv, ak c < 0, (ak c = 0 alebo vvv je nulový vektor, tak, samozrejme, aj cvvv je nulový vektor, takže nezáleží na jeho smere ani orientácii). Ak si okrem počiatku O zvolíme v rovine či priestore ešte dve resp. tri súradné osi, t. j. navzájom kolmé priamky prechádzajúce počiatkom, a na každej z nich jeden bod v rovnakej jednotkovej vzdialenosti od počiatku 1.4. Vektory v rovine a v trojrozmernom priestore 53 Obr. 1.1. Vektorový rovnobežník (čím zadáme jednotku dĺžky a orientáciu osí), dostaneme pravouhlý súradnicový systém v rovine či v priestore. Každý bod roviny či priestoru je potom jednoznačne určený usporiadanou dvojicou, resp. trojicou svojich súradníc a tiež naopak, každá dvojica resp. trojica súradníc jednoznačne určuje nejaký bod roviny či priestoru. Taktiež každý vektor v rovine či v priestore je potom jednoznačne určený súradnicami svojho koncového bodu a tiež naopak ľubovoľná usporiadaná dvojica resp. trojica súradníc jednoznačne určuje nejaký vektor v rovine či priestore. Pri pevnom súradnicovom systéme tak možno množinu všetkých vektorov v rovine stotožniť s množinou R2 a množinu všetkých vektorov v priestore s množinou R3 . Ak (pri takomto stotožnení) uuu = (u1, u2) ∈ R2 , vvv = (v1, v2) ∈ R2 sú dva vektory v rovine, tak ľahko nahliadneme, že pre ich súčet uuu + vvv, daný vektorovým rovnobežníkom, platí uuu + vvv = (u1, u2) + (v1, v2) = (u1 + v1, u2 + v2). Ak c ∈ R, tak pre skalárny násobok cuuu dostávame cuuu = c(u1, u2) = (cu1, cu2). Podobne možno reprezentovať aj operácie súčtu a skalárneho násobku vektorov v priestore príslušnými operáciami na množine R3 všetkých usporiadaných trojíc reálnych čísel. Ešte si všimnime, že predpoklady kolmosti súradných osí a rovnosti jednotkových dĺžok v jednotlivých smeroch nehrali v našich úvahách nijakú úlohu. Stačí, aby systém súradných osí tvorili dve rôznobežné priamky (v rovine) resp. tri nekomplanárne priamky (v priestore) pretínajúce sa v počiatku O. Za jednotkové dĺžky v smeroch jednotlivých súradných osí možno zvoliť dĺžky ľubovoľných (nie nevyhnutne rovnako dlhých) úsečiek. Operácie súčtu vektorov a násobenia vektora skalárom majú rad vlastností, ktoré nie sú viazané len na ich špecifickú geometrickú reprezentáciu 54 1. Polia a vektorové priestory v rovine či priestore. Napríklad, prostredníctvom súradnicovej reprezentácie vektorov by sme ich mohli priamočiaro zovšeobecniť na usporiadané n-tice skalárov z ľubovoľného poľa K pre akékoľvek n ∈ N. Tým by sme dostali akési „n-rozmerné vektorové priestory nad poľom K . V duchu algebry teraz zadefinujeme abstraktný pojem vektorového priestoru nad daným poľom, pričom budeme abstrahovať od akýchkoľvek súradníc aj „dimenzie . Podstatné budú pre nás len algebraické vlastnosti operácií súčtu vektorov a skalárneho násobku vektora. K spomínaným príkladom sa však budeme sústavne vracať. 1.5 Vektorové priestory Nech K je pole. Vektorovým alebo tiež lineárnym priestorom nad poľom K nazývame množinu V s význačným prvkom 0 a dvomi binárnymi operáciami – sčítaním + : V × V → V a násobením · : K × V → V – takými, že platí (∀xxx,yyy,zzz ∈ V )(xxx + (yyy + zzz) = (xxx + yyy) + zzz)), (∀xxx,yyy ∈ V )(xxx + yyy = yyy + xxx), (∀xxx ∈ V )(xxx + 0 = xxx), (∀xxx ∈ V )(∃yyy ∈ V )(xxx + yyy = 0), (∀ a, b ∈ K)(∀xxx ∈ V )(a · (b · xxx) = (ab) · xxx), (∀xxx ∈ V )(1 · xxx = xxx), (∀ a ∈ K)(∀xxx,yyy ∈ V )(a · (xxx + yyy) = (a · xxx) + (a · yyy)), (∀ a, b ∈ K)(∀xxx ∈ V )((a + b) · xxx = (a · xxx) + (b · xxx)). Ako si čitateľ asi všimol, skaláry značíme „obyčajnými malými latinskými písmenami a vektory tučnými malými latinskými písmenami. Tejto implicitnej dohody sa budeme väčšinou držať, nie však za každú cenu. Kedykoľvek by nás obmedzovala, nebudeme váhať ju porušiť. I keď sčítanie skalárov v poli a sčítanie vektorov značíme rovnakým znakom +, ide o rôzne operácie. Podobne násobenie v poli a násobenie vektora skalárom sú rôzne operácie, hoci obe značíme · . Neskôr tento prístup dovedieme ešte ďalej, keď budeme rovnako značiť príslušné operácie a nuly v rôznych vektorových priestoroch. Rozlišovanie znakov pre nulu 0 ∈ K a 0 ∈ V , hoci tieto prvky plnia rovnakú funkciu v K resp. vo V , je tak trochu proti duchu tohto prístupu. Ide vlastne o zbytočný luxus, ktorý je však v zhode s prijatou dohodou o značení skalárov a vektorov. Z formálneho hľadiska pripomínajú axiómy vektorového priestoru axiómy poľa: sčítanie vektorov je opäť asociatívna a komutatívna binárna operácia na V s neutrálnym prvkom 0 ∈ V , operácia násobenia vektora skalárom tiež spĺňa akúsi podmienku „asociatívnosti , 1 ∈ K je jej „neutrálnym prvkom 1.5. Vektorové priestory 55 a platia dva „distributívne zákony . Je tu však jeden podstatný rozdiel – kým násobenie v poli K je binárnou operáciou na množine K, t. j. zobrazením · : K × K → K, násobenie vo vektorovom priestore V nad poľom K nie je binárnou operáciou na V , ale binárnou operáciou · : K × V → V . To nám však nebráni zaviesť obdobné dohody ako pre operácie v poli: i teraz bude mať násobenie prednosť pre sčítaním a znak násobenia budeme väčšinou vynechávať, t. j. písať napr. axxx + yyy miesto (a · xxx) + yyy. Takisto budeme vynechávať zátvorky, ktorých umiestnenie neovplyvní výslednú hodnotu výrazov ako napr. v abxxx alebo a1xxx1 + . . . + anxxxn. Posledný výraz budeme tiež značiť n i=1 aixxxi a nazývať lineárnou kombináciou vektorov xxx1, . . . ,xxxn s koeficientmi a1, . . . , an. Špeciálne pre n = 1 to znamená 1 i=1 aixxxi = a1xxx1; kvôli úplnosti pre n = 0 ešte kladieme prázdnu lineárnu kombináciu 0 i=1 aixxxi rovnú 0. Podobne ako v prípade polí, možno z axióm vektorových priestorov odvodiť niektoré základne pravidlá pre počítanie so skalármi a vektormi. Predovšetkým prvok yyy ∈ V taký, že xxx + yyy = 0, je k danému xxx ∈ V určený jednoznačne – značíme ho −xxx a nazývame opačný vektor k xxx. Namiesto xxx + (−yyy) opäť píšeme len xxx −yyy. Tieto pravidlá zhrnieme v nasledujúcej analógii tvrdenia 1.2.1 1.5.1. Tvrdenie. Nech V je vektorový priestor nad poľom K. Potom pre ľubovoľné n ∈ N, a, b, a1, . . . , an ∈ K a xxx,yyy,zzz,xxx1, . . . ,xxxn ∈ V platí (a) xxx + yyy = xxx + zzz ⇒ yyy = zzz, (b) (axxx = ayyy & a = 0) ⇒ xxx = yyy, (axxx = bxxx & xxx = 0) ⇒ a = b, (c) a0 = 0 = 0xxx, (d) axxx = 0 ⇒ (a = 0 ∨ xxx = 0), (e) −xxx = (−1)xxx, (f) a(xxx − yyy) = axxx − ayyy, (a − b)xxx = axxx − bxxx, (g) a(xxx1 + . . . +xxxn) = axxx1 + . . . + axxxn, (a1 + . . . + an)xxx = a1xxx + . . . + anxxx. Dôkaz Všetky podmienky, s výnimkou druhej implikácie v (b), možno dokázať celkom analogicky ako príslušné časti tvrdenia 1.2.1 Dokážeme aj túto. Nech axxx = bxxx a xxx = 0. Potom (a − b)xxx = axxx − bxxx = 0. Podľa (d) z toho vyplýva a − b = 0, teda a = b. Práve definované vektorové priestory by sme presnejšie mohli nazvať „ľavými vektorovými priestormi, lebo v operácii skalárneho násobku píšeme skalár vľavo od vektora. Celkom obdobne by sme mohli definovať aj „pravé vektorové priestory, v ktorých by sme operáciu skalárneho násobku chápali ako zobrazenie V × K → V a zapisovali ju v tvare xxx · a alebo len xxxa pre 56 1. Polia a vektorové priestory xxx ∈ V , a ∈ K. Vďaka komutatívnosti násobenia v poli K si však môžeme dovoliť chápať naše „ľavé vektorové priestory zároveň ako „pravé . Pre všetky a ∈ K, xxx ∈ V jednoducho položíme xxxa = axxx. Jediný problém – zabezpečiť pre všetky a, b ∈ K, xxx ∈ V rovnosť (ab)xxx = (ba)xxx, ktorá z takejto definície vyplýva výpočtom (ab)xxx = a(bxxx) = a(xxxb) = (xxxb)a = xxx(ba) = (ba)xxx, – je vyriešený práve v dôsledku komutatívnosti násobenia v K. Teda, ak sa nám v operácii skalárneho násobku vyskytne skalár vpravo od vektora, nemusí nás to vyviesť z miery – kľudne ho môžeme prehodiť vľavo a ani o zátvorky sa nemusíme príliš starať. 1.6 Príklady vektorových priestorov 1.6.1. Rozšírenia polí. Zrejme každé pole K možno považovať za vektorový priestor nad sebou samým. Všeobecnejšie, ak pole L je rozšírením poľa K, tak L možno považovať za vektorový priestor nad poľom K (formálne stačí „zabudnúť násobenie niektorých dvojíc prvkov a, b ∈ L a súčin ab pripustiť len pre a ∈ K, b ∈ L). Podobným spôsobom možno vektorový priestor V nad poľom L zúžením násobenia L × V → V na násobenie K × V → V prerobiť na vektorový priestor nad poľom K. 1.6.2. nnn-rozmerné riadkové a stĺpcové vektory nad daným poľom. Pre ľubovoľné pole K a n ∈ N množina Kn = {(x1, . . . , xn); x1, . . . , xn ∈ K} všetkých usporiadaných n-tíc prvkov z K spolu s operáciami xxx + yyy = (x1, . . . , xn) + (y1, . . . , yn) = (x1 + y1, . . . , xn + yn), cxxx = c(x1, . . . , xn) = (cx1, . . . , cxn), kde xxx = (x1, . . . , xn) ∈ Kn , yyy = (y1, . . . , yn) ∈ Kn a c ∈ K, tvorí vektorový priestor nad poľom K. Zrejme usporiadaná n-tica 0n = (0, . . . , 0) hrá úlohu nuly v Kn . Ak bude potrebné rozlíšiť nulové vektory v priestoroch Kn pre rôzne prirodzené čísla n, budeme pre nulu v Kn používať označenie 0n. Opačný prvok k xxx = (x1, . . . , xn) ∈ Kn je zrejme −xxx = −(x1, . . . , xn) = (−x1, . . . , −xn) Hovoríme, že operácie na Kn sú definované po zložkách. Prvky tohto vektorového priestoru nazývame n-rozmerné riadkové vektory nad poľom K. Kvôli 1.6. Príklady vektorových priestorov 57 úplnosti ešte poznamenajme, že vektorový priestor K0 pozostáva z jediného prvku ∅, predstavujúceho „usporiadanú nulaticu , ktorá tak je nevyhnutne nulou v K0 . Niekedy je (a väčšinou i bude) výhodnejšie pracovať s n-rozmernými stĺpcovými vektormi nad poľom K, t. j. s vektormi tvaru xxx =   x1 ... xn   kde x1, . . . , xn ∈ K. Čitateľ si iste sám doplní definície príslušných operácií (opäť po zložkách) a dalšie podrobnosti. Pokiaľ nebude hroziť nedorozumenie, budeme i tento priestor označovať Kn , prípadne len slovne naznačíme, či tým máme na mysli priestor n-rozmerných riadkových alebo stĺpcových vektorov. V súlade s tým 0n alebo len 0 môže označovať aj nulový vektor-stĺpec. 1.6.3. Polynómy nad daným poľom.Pod polynómom alebo tiež mnohočlenom f(x) stupňa n, kde n ∈ N, v premennej x nad poľom K rozumieme formálny výraz tvaru f(x) = a0 + a1x + . . . + an−1xn−1 + anxn = n i=0 aixi , kde a0, a1, . . . , an−1, an ∈ K sú skaláry, nazývané koeficienty polynómu f, a an = 0; nulu 0 ∈ K považujeme za polynóm stupňa −1 a nenulové skaláry a ∈ K za polynómy stupňa 0. Zrejme každý polynóm f(x) definuje (rovnako značenú) funkciu f : K → K danú predpisom c → f(c), t. j. dosadením konkrétnych hodnôt c ∈ K za premennú x do polynómu f(x). Množinu všetkých polynómov v premennej x nad K stupňa nanajvýš n, kde −1 ≤ n ∈ Z, budeme značiť K(n) [x]; množinu všetkých polynómov v premennej x nad K značíme K[x]. Ľubovoľný polynóm g(x) = m i=0 bixi ∈ K[x] stupňa m < n môžeme tiež písať v tvare g(x) = b0 + b1x + . . . + bmxm + 0xm+1 + . . . + 0xn , t. j. v tvare g(x) = n i=0 bixi , kde bi = 0 pre m < i ≤ n. S použitím tejto konvencie možno definovať súčet f(x) + g(x) polynómov f(x) = n i=0 aixi , g(x) = m i=0 bixi z K[x] predpisom (f + g)(x) = f(x) + g(x) = max(m,n) i=0 (ai + bi)xi . 58 1. Polia a vektorové priestory Ak navyše c ∈ K, kladieme (cf)(x) = cf(x) n i=0 caixi . Ľahko možno nahliadnuť, že s takto po zložkách definovanými operáciami súčtu a skalárneho násobku tvorí každá z množín polynómov K(n) [x], kde −1 ≤ n ∈ Z, ako i množina všetkých polynómov K[x] vektorový priestor nad poľom K. Štruktúrou vektorového priestoru sa však algebra polynómov nevyčerpáva. Popri súčte a skalárnom násobku možno na K[x] definovať aj súčin f(x) g(x) uvedených polynómov f(x), g(x) predpisom (fg)(x) = f(x) g(x) = m+n k=0 ckxk , kde ck = k i=0 aibk−i. 1.6.4. Priame súčiny vektorových priestorov. Nech V1 a V2 sú vektorové priestory nad tým istým poľom K. Priamym súčinom (niekedy tiež vonkajším priamym súčtom) priestorov V1, V2 nazývame množinu V1 × V2, t. j. karteziánsky súčin množín V1, V2, s operáciami súčtu vektorov a skalárneho násobku definovanými po zložkách. Teda pre (uuu1,uuu2), (vvv1,vvv2) ∈ V1 ×V2, c ∈ K kladieme (uuu1,uuu2) + (vvv1,vvv2) = (uuu1 + vvv1,uuu2 + vvv2), c(uuu1,uuu2) = (cuuu1, cuuu2). Zrejme (0, 0) je nulou tohto vektorového priestoru a −(uuu1,uuu2) = (−uuu1, −uuu2) je opačný prvok k (uuu1,uuu2). Čitateľovi prenechávame, aby si overil, že priamy súčin V1 ×V2 s takto definovanými operáciami naozaj tvorí vektorový priestor nad poľom K, a taktiež, aby si premyslel, ako možno uvedenú konštrukciu zovšeobecniť na priamy súčin V1 × . . . × Vn ľubovoľného konečného počtu vektorových priestorov V1, . . . , Vn nad K. Ak V = V1 = . . . = Vn, tak píšeme V1 × . . . × Vn = V n a tento vektorový priestor nazývame n-tou priamou mocninou priestoru V . Pre V = K uvedená konštrukcia dáva nám už známy vektorový priestor Kn z 1.6.2, 1.6.5. Vektorové priestory funkcií. Nech V je vektorový priestor nad poľom K a X je ľubovoľná množina. Pripomeňme, že V X označuje množinu všetkých funkcií f : X → V . Teraz ukážeme, ako možno z tejto množiny urobiť vektorový priestor nad poľom K. Operácie súčtu a skalárneho násobku budeme definovať opäť po zložkách. To znamená, že pre f, g ∈ V X a c ∈ K Cvičenia 59 budeme definovať funkcie f + g ∈ V X a cf ∈ V X tak, že pre každé x ∈ X položíme (f + g)(x) = f(x) + g(x), (cf)(x) = cf(x). Znovu možno ľahko nahliadnuť, že V X s takto definovanými operáciami tvorí vektorový priestor nad poľom K – nazývame ho vektorovým priestorom všetkých funkcií z X do V . Nulou vo V X je funkcia 0: X → V identicky rovná prvku 0 ∈ V ; opačným prvkom k funkcii f ∈ V X je funkcia −f ∈ V X daná predpisom x → −f(x) pre x ∈ X. V špeciálnom prípade pre V = K takto dostaneme vektorový priestor KX všetkých funkcií z množiny X do poľa K. Ak K je pole všetkých reálnych prípadne komplexných čísel a X je napr. nejaký uzavretý interval a, b reálnych čísel, tak dostávame vektorové priestory funkcií R a,b resp. C a,b , ktoré sa hojne vyskytujú v matematickej analýze. Cvičenia Cvičenia 1–4 sú opakovaním základných poznatkov o komplexných číslach. 1.1. Vypočítajte: (a) (5 + 3i) + (7 − i), (b) (11 − 10i) − (8 − 5i), (c) (−2 + 5i) · (3 + 2i), (d) (4 − i) · (2 + 9i), (e) (12 + 5i)−1 , (f) (7 + i)/(3 − 4i). 1.2. (a) Pre komplexné číslo x = a + bi, kde a, b ∈ R, nazývame a = Re x, b = Im x jeho reálnou resp. imaginárnou časťou. Teda Re x aj Im x sú reálne čísla. Dokážte vzorce: Re(x + y) = Re x + Re y, Re(xy) = Re x Re y − Im x Im y, Im(x + y) = Im x + Im y, Im(xy) = Re x Im y + Im x Re y. (b) Ak si v (reálnej) rovine zvolíme pravouhlý súradnicový systém, môžeme každé komplexné číslo x = a + bi reprezentovať bodom či vektorom so súradnicami (a, b). Ak prostredníctvom bijekcie x → (Re x, Im x) stotožníme každé komplexné číslo s jeho obrazom a množinu C s rovinou (množinou R2 ), hovoríme o tzv. Gaussovej rovine. Znázornite čísla zo zadaní aj výsledkov cvičenia 1.1 v Gaussovej rovine. 1.3. Absolútna hodnota komplexného čísla x = a+bi, kde a, b ∈ R, je definovaná ako |x| =√ a2 + b2, t. j. ako vzdialenosť bodu x od počiatku v Gaussovej rovine. Komplexne združené číslo k číslu x je x = a − bi, t. j. číslo súmerne združené s x podľa reálnej osi. (a) Nájdite absolútne hodnoty jednotlivých čísel zo zadaní aj výsledkov v cvičení 1.1. (b) Dokážte nasledujúce vzťahy: Re x = Re x = 1 2 (x + x), Im x = − Im x = 1 2i (x − x), x = x, xy−1 = (xy)/ |y| 2 , (y = 0), x + y = x + y, xy = x y, |x| = |x| , |x| 2 = xx, |xy| = |x| |y| , |x + y| ≤ |x| + |y| . 60 1. Polia a vektorové priestory (c) V poslednom vzťahu nastane rovnosť práve vtedy, keď existuje nezáporné číslo c ∈ R také, že x = cy alebo y = cx. Dokážte. 1.4. Každé komplexné číslo x možno vyjadriť v tzv. goniometrickom tvare x = r(cos α+ i sin α), kde r = |x| a α je uhol, ktorý (pre x = 0) zviera v Gaussovej rovine „vektor −→ 01 s „vektorom −→ 0x (pre x = 0 vyhovuje ľubovoľné α ∈ R). (a) Pre x = 0 vyjadrite cos α a sin α pomocou Re x, Im x a |x|. Dokážte, že α je určené jednoznačne až na sčítanec 2kπ, kde k ∈ Z. (b) Pre x = r(cos α + i sin α), y = s(cos β + i sin β) platí xy = rs(cos(α + β) + i sin(α + β)). Dokážte. (c) Matematickou indukciou dokážte tzv. Moivreovu vetu: (cos α+i sin α)n = cos nα+ i sin nα, pre každé n ∈ N. Rozšírte jej platnosť na všetky n ∈ Z. (d) Vyjadrite všetky čísla zo zadaní aj výsledkov v cvičení 1 v goniometrickom tvare. (e) Pomocou Moivreovej vety vypočítajte ( √ 3 + i)11 , (1 − i)−7 . (f) Na základe Moivreovej vety napíšte vzorec pre všetkých n riešení binomickej rovnice xn = c, kde c ∈ C. (Návod: Riešte najprv prípad |c| = 1.) (g) Nájdite všetky riešenia binomických rovníc x3 = ( √ 3 − i)/2, y4 = 1 + i a z5 = −4 + 3i. 1.5. Podrobne dokážte vzťahy uvedené za dôkazom tvrdenia 1.2.1 Kde treba, použite matematickú indukciu. 1.6. V každom z nasledujúcich prípadov rozhodnite, či množina A je podpoľom poľa K. Svoje rozhodnutie zdôvodnite. (a) K = Q, A = Z; (b) K = R, A = Q √ 2 = {a + b √ 2; a, b ∈ Q}; (c) K = R, A = −1, 1 ; (d) K = C, A = Z[ i ] = {a + bi; a, b ∈ Z}; (e) K = Z11, A = Z5; (f) K = C, A = Q[ω] = {a+bω+cω2 ; a, b, c ∈ Q}, kde ω = (−1 + i √ 3)/2. 1.7. Zostrojte multiplikatívne tabuľky sčítania a násobenia v Zn pre 2 ≤ n ≤ 6. Na ich základe zdôvodnite, prečo Z4 a Z6 nie sú polia. 1.8. Vynechajme z definície poľa podmienku 0 = 1 a podmienku požadujúcu existenciu inverzného prvku vzhľadom na násobenie ku každému nenulovému prvku a ∈ K. Množina K s význačnými prvkami 0, 1 ∈ K, vybavená binárnymi operáciami súčtu a súčinu, spĺňajúcimi zvyšné podmienky sa nazýva komutatívny okruh s jednotkou.1 Komutatívny okruh s jednotkou sa nazýva netriviálny, ak v ňom predsa len platí 0 = 1. Dokážte postupne nasledujúce tvrdenia: (a) Z s obvyklými operáciami súčtu a súčinu je netriviálny komutatívny okruh s jednotkou. (b) Pre každé n ∈ N, n = 0, je Zn so sčítaním a násobením modulo n komutatívny okruh s jednotkou. Tento okruh je netriviálny práve vtedy, keď n ≥ 2. (c) Komutatívny okruh s jednotkou je netriviálny práve vtedy, keď obsahuje aspoň dva rôzne prvky. 1.9. (a) V ľubovoľnom komutatívnom okruhu s jednotkou K zadefinujte výrazy tvaru na pre ľubovoľné n ∈ Z, a ∈ K rovnako ako v poli. Taktiež zadefinujte výrazy tvaru an pre n ∈ N, a ∈ K. Dokážte pre ne analogické tvrdenia, ako platia v poli. Čo je prekážkou definície an pre všetky n ∈ Z? (b) Zadefinujte charakteristiku ľubovoľného komutatívneho okruhu s jednotkou rov- 1 Občas sa v literatúre takáto štruktúra nazýva len komutatívny okruh. Cvičenia 61 nakým spôsobom ako v prípade poľa. (c) Dokážte, že pre komutatívny okruh s jednotkou K platí char K = 1 práve vtedy, keď K je triviálny. (d) Pre každé n ∈ N, n = 0, platí char Zn = n. (e) Pre každé prvočíslo p zostrojte príklad komutatívneho okruhu s jednotkou, ktorý má charakteristiku p, no nie je poľom. (Návod: Pozri cvičenie 1.13.) 1.10. (a) Matematickou indukciou dokážte platnosť binomickej vety v ľubovoľnom komutatívnom okruhu s jednotkou K (teda aj v ľubovoľnom poli). To znamená, že pre všetky n ∈ N, a, b ∈ K platí (a + b)n = an + n 1 an−1 b + . . . + n n − 1 abn−1 + bn = n k=0 n k an−k bk . (b) Predpokladajme, že charakteristikou komutatívneho okruhu s jednotkou K je prvočíslo p. Nech m ∈ Z je násobkom p. Dokážte, že pre každé c ∈ K platí mc = 0. (c) Na základe (a) a (b) dokážte, že v komutatívnom okruhu s jednotkou prvočíselnej charakteristiky p platí pre exponent n = p nasledujúci „populárny variant binomickej vety: (a + b)p = ap + bp . 1.11. Doplňte vynechané časti dôkazu tvrdenia 1.5.1 1.12. V každom z príkladov 1.6.1–5, podrobne overte, že uvedená množina s príslušnými operáciami tvorí vektorový priestor. 1.13. Rovnako ako v príklade 1.6.3, zadefinujte pre ľubovoľný komutatívny okruh s jednotkou K množinu K[x] všetkých polynómov v premennej x s koeficientmi z K a na nej operácie súčtu a súčinu. Dokážte, že K[x] s takto definovanými operáciami je opäť komutatívny okruh s jednotkou a platí char K[x] = char K. 1.14. Na množine R+ všetkých kladných reálnych čísel definujme nové „sčítanie ⊕ ako násobenie, t. j. x ⊕ y = xy. Ďalej definujme novú operáciu „skalárneho násobku : R × R+ → R+ ako umocňovanie, t. j. predpisom a x = xa . Dokážte, že množina R+ s uvedenými operáciami tvorí vektorový priestor nad poľom R. Čo je nulový vektor 0 ∈ R+ ? Ako vyzerá opačný vektor x k vektoru x ∈ R+ ? Vyjadrite pomocou pôvodných operácií násobenia a umocňovania lineárnu kombináciu (a1 x1) ⊕ . . . ⊕ (an xn), kde a1, . . . , an ∈ R, x1, . . . , xn ∈ R+ . 2. Základy maticového počtu V tejto kapitole sa zoznámime s maticami, t. j. obdĺžnikovými tabuľkami, pomocou ktorých budeme kódovať najrôznejšie dôležité údaje o vektorových priestoroch, a naučíme sa s nimi zaobchádzať. Niektoré operácie s maticami budú zatiaľ nemotivované, ich význam vyjde najavo až neskôr. Od čitateľa tak žiadame istú dávku trpezlivosti, podobnú tej, akú musí prejaviť prváčik na základnej škole, ktorý tiež musí najprv zvládnuť jednotlivé písmenká, potom sa naučiť, ako sa z nich skladajú slová, a až potom môže začať čítať zmysluplné texty. Tento vklad sa nám zúročí neskôr, keď nám umožní hladko napredovať a nezdržiavať sa pri nepodstatných otázkach. Pri prvom čítaní možno vynechať odstavce venované blokovým maticiam a maticiam nad vektorovými priestormi. Celkom postačí nalistovať si príslušnú časť až vo chvíli, keď sa s blokovými maticami stretneme v ďalších kapitolách. 2.1 Matice nad danou množinou 2.1.1. Typy matíc. Nech X je ľubovoľná množina a m, n ∈ N. Maticou typu m×n, alebo tiež m×n-rozmernou maticou nad množinou X rozumieme obdĺžnikovú tabuľku AAA =     a11 a12 . . . a1n a21 a22 . . . a2n ... ... ... ... am1 am2 . . . amn     , pozostávajúcu z prvkov množiny X. Skrátene tiež píšeme AAA = (aij)m×n, alebo len AAA = (aij). Prvky aij ∈ X, kde 1 ≤ i ≤ m, 1 ≤ j ≤ n, sa nazývajú prvkami matice AAA. Prvok aij nachádzajúci sa v i-tom riadku a j-tom stĺpci matice AAA nazývame tiež prvok v mieste (i, j), prípadne (i, j)-ty prvok matice AAA. Množinu všetkých m × n-rozmerných matíc nad množinou X značíme Xm×n . Ak m = n, hovoríme o štvorcových maticiach rádu n nad množinou X. Poznamenajme, že v prípade, keď niektoré z čísel m, n je 0, množina Xm×n pozostáva z jedinej a to prázdnej matice ∅. Neskôr sa ukáže rozumné stotožniť túto maticu s tzv. nulovou maticou. Aby sme sa vyhli trivialitám, budeme sa vždy baviť len o maticiach kladných rozmerov m×n, čitateľ by si však mal aspoň občas uvedomiť, že väčšina našich úvah si zachováva platnosť aj v prípade, keď m = 0 alebo n = 0. 2.1. Matice nad danou množinou 63 Dve matice nad množinou X považujeme za navzájom rovné alebo totožné, ak majú rovnaké rozmery a rovnaké prvky na príslušných miestach. To znamená, že pre matice AAA = (aij)m×n, BBB = (bij)p×q nad X kladieme AAA = BBB práve vtedy, keď m = p, n = q a pre všetky i = 1, . . . , m, j = 1, . . . , n platí aij = bij. Množina matíc typu 1 × n nad X splýva s množinou Xn , ak usporiadané n-tice prvkov z X zapisujeme do riadku. Podobne, ak usporiadné m-tice prvkov z X zapisujeme do stĺpca, tak množina matíc typu m × 1 nad X splýva s množinou Xm . Pokiaľ bude z kontextu jasné, či ide o riadky alebo stĺpce, prípadne, ak na tom nebude záležať, budeme písať jednoducho Xn , Xm a pod. Podrobnejšie označenie X1×n , Xm×1 a pod. budeme používať, len ak bude treba rozlíšiť riadky a stĺpce. Podobne by sme mohli zaviesť nielen dvoj- ale aj troj- či viacindexové matice AAA = (aijk)m×n×r, BBB = bi1...ip n1×...×np , a pod. Pri ich prehľadnom zápise by sme však už nevystačili s dvojrozmernými tabuľkami. Napr. trojrozmerné matice by bolo teba zapisovať ako v priestore uložené vrstvy dojrozmerných matíc, čo presahuje obmedzené možnosti dvojrozmernej papierovej stránky prípadne obrazovky, ani nehovoriac o „viacrozmerných maticiach . 2.1.2. Riadky a stĺpce matice. Nech AAA = (aij) ∈ Xm×n . Usporiadanú n-ticu rrri(AAA) = (ai1, ai2, . . . , ain) ∈ X1×n , kde 1 ≤ i ≤ m, nazývame i-tym riadkom matice AAA. Podobne, usporiadnú m-ticu sssj(AAA) =     a1j a2j ... amj     , kde 1 ≤ j ≤ n, nazývame j-tym stĺpcom matice AAA. Maticu AAA tak možno stotožniť so stĺpcom jej riadkov ako aj s riadkom jej stĺpcov, t. j. AAA =     a11 a12 . . . a1n a21 a22 . . . a2n ... ... ... ... am1 am2 . . . amn     =     rrr1(AAA) rrr2(AAA) ... rrrm(AAA)     = (sss1(AAA),sss2(AAA), . . . ,sssn(AAA)). 2.1.3. Transponovaná matica. Maticu, ktorú získame z matice AAA = (aij)m×n zámenou jej riadkov a stĺpcov, nazývame transponovanou maticou k matici 64 2. Základy maticového počtu AAA a značíme ju AAAT . Teda trochu podrobnejšie AAAT =     a11 a21 . . . am1 a12 a22 . . . am2 ... ... ... ... a1n a2n . . . amn     . To znamená, že AAAT ∈ Xn×m a prvok v mieste (i, j) matice AAAT je aji. Zrejme pre ľubovoľnú maticu AAA ∈ Xm×n platí (AAAT )T = AAA. Transpozíciou matíc-riadkov z X1×n dostaneme matice-stĺpce z Xn×1 a transpozíciou matíc-stĺpcov z Xm×1 matice-riadky z X1×m . Na základe tejto poznámky možno nahliadnuť, že pre ľubovoľnú maticu AAA ∈ Xm×n a 1 ≤ i ≤ m, 1 ≤ j ≤ n platí sssi AAAT = rrri(AAA)T , rrrj AAAT = sssj(AAA)T . Štvorcová matica AAA ∈ Xn×n sa nazýva symetrická, ak AAA = AAAT , t. j. ak aij = aji pre všetky i, j = 1, . . . , n. Postupnosť prvkov (a11, a22, . . . , ann) nazývame diagonálou štvorcovej matice AAA. Transponovanú maticu k štvorcovej matici AAA zrejme získame „osovou súmernosťou jej prvkov podľa diagonály. 2.1.4. Blokové matice. Niekedy bude užitočné spojiť dve matice AAA ∈ Xm×n1 , BBB ∈ Xm×n2 s rovnakým počtom riadkov do jednej matice tak, že príslušné tabuľky jednoducho napíšeme vedľa seba. Výsledná matica je typu m × (n1 + n2) a značíme ju (AAA,BBB), prípadne (AAA |BBB). Podobne možno spojiť dve matice AAA ∈ Xm1×n , BBB ∈ Xm2×n s rovnakým počtom stĺpcov do jednej matice tak, že príslušné tabuľky napíšeme pod seba. Výsledná matica je typu (m1 + m2) × n a značíme ju AAA BBB , prípadne AAA BBB . Práve popísané konštrukcie sú príkladmi tzv. blokových matíc. Pôvodné matice, z ktorých takto vytvárame blokovú maticu, potom nazývame jej blokmi. Takisto môžeme vedľa seba resp. pod seba zoradiť väčší počet blokov, nie len dva. Naopak, niekedy sa môže ukázať účelné vyznačiť v danej matici nejaké menšie obdĺžnikove časti ako jej bloky. Vtedy hovoríme o tzv. blokovom tvare danej matice. Príkladom toho bol zápis matice AAA ∈ Xm×n ako riadku jej stĺpcov, prípadne ako stĺpca jej riadkov. Uvedené dve schémy vytvárania blokových matíc „vedľa seba a „pod seba možno tiež kombinovať. Napr. z matíc AAA11 ∈ Xm1×n1 , AAA12 ∈ Xm1×n2 , AAA21 ∈ Xm2×n1 , AAA22 ∈ Xm2×n2 možno vytvoriť blokovú maticu AAA11 AAA12 AAA21 AAA22 2.2. Matice nad daným poľom 65 typu (m1 + m2) × (n1 + n2). Túto konštrukciu možno zrejmým spôsobom zovšeobecniť i na väčšie systémy matíc. Voľne povedané, blokové matice sú vlastne matice, ktorých prvkami sú opäť matice, pričom všetky matice v tom istom riadku blokovej matice majú rovnaký počet riadkov a všetky matice v tom istom stĺpci blokovej matice majú rovnaký počet stĺpcov. Takto chápanú blokovú maticu možno zapísať v tvare AAA = (AAAij)k×l =   AAA11 . . . AAA1l ... ... ... AAAk1 . . . AAAkl   , pričom jednotlivé bloky AAAij sú matice nad X rozmerov mi×nj, kde (m1, . . . , mk), (n1, . . . , nl) sú nejaké konečné postupnosti prirodzených čísel. Maticu nad množinou X z tejto „matice matíc dostaneme tak, že si v AAA odmyslíme vnútorné zátvorky oddeľujúce jej jednotlivé bloky AAAij. 2.2 Matice nad daným poľom Na množine X, nad ktorou sme vytvárali príslušné matice, sme zatiaľ nepredpokladali nijakú ďalšiu štruktúru. Jednako na množinách matíc Xm×n sa nám pomerne bohatá štruktúra prirodzene vynorila. Všetky doposiaľ zavedené maticové operácie a vlastnosti však mali výlučne pozičný charakter – zakladali sa na reprezentácii každej matice ako príslušnej obdĺžnikovej tabuľky. Ďalšie maticové operácie a vlastnosti, ktoré hodláme zaviesť a neskôr využívať, už budú podmienené prítomnosťou istej štruktúry na množine X. Najdôležitejší a, až na pár výnimiek, vlastne jediný druh matíc, ktorými sa budeme v tomto kurze zaoberať, tvoria matice nad nejakým poľom. Teda v celom paragrafe K označuje pevne zvolené, inak však ľubovoľné pole. V súlade s predošlým paragrafom Km×n , kde m, n ∈ N, označuje množinu všetkých matíc typu m × n nad poľom K. 2.2.1. Vektorový priestor matíc. Pre pevné m, n ∈ K budeme na množine matíc Km×n definovať po zložkách operácie súčtu a skalárneho násobku. Teda pre matice AAA = (aij)m×n, BBB = (bij)m×n nad K a c ∈ K položíme AAA + BBB = (aij + bij)m×n, cAAA = (caij)m×n. Podotýkame, že súčet matíc AAA +BBB je definovaný len pre matice AAA, BBB rovnakého typu a samotná matica AAA+BBB je toho istého typu ako AAA a BBB. Neutrálnym prvkom operácie sčítania na Km×n je matica typu m×n, ktorej všetky prvky 66 2. Základy maticového počtu sú nulové; nazývame ju nulová matica typu m × n a označujeme ju 0m,n, prípadne len 0, keď jej rozmer je jasný z kontextu alebo na ňom nezáleží. Opačným prvkom k matici A = (aij)m×n je zrejme matica −AAA = (−aij)m×n. Čitateľ si iste sám ľahko overí, že matice ľubovoľného pevného typu m×n nad poľom K s takto definovanými operáciami súčtu a skalárneho násobku tvoria vektorový priestor nad poľom K. Odteraz teda Km×n už označuje nielen množinu takýchto matíc, ale príslušný vektorový priestor. Nám už známe vektorové priestory K1×n a Km×1 riadkových resp. stĺpcových vektorov sú zrejme špeciálnymi prípadmi vektorových priestorov matíc. 2.2.2. Násobenie matíc. Okrem štruktúry vektorového priestoru na množine matíc pevného typu m × n budeme definovať aj operáciu násobenia matíc, ktorá spája matice rôznych, „vhodne do seba zapadajúcich rozme- rov. Pod vplyvom doterajšieho výkladu čitateľ po takomto nadpise asi očakáva, že i súčin matíc budeme definovať na množine Km×n po zložkách. Hoci by to, samozrejme, bolo možné a na prvý pohľad sa to zdá prirodzené, násobenie matíc budeme definovať diametrálne odlišným spôsobom, ktorý sa nám zatiaľ môže zdať čudný a neprirodzený. Dôvody pre takúto definíciu budú postupne vychádzať najavo a jej prednosti budeme mať mnohokrát možnosť oceniť. Najprv sa naučíme násobiť niektoré dvojice vektorov. Pod súčinom xxx · yyy riadkového vektora xxx = (x1, . . . , xn) ∈ K1×n a stĺpcového vektora yyy = (y1, . . . , yn)T ∈ Kn×1 rozumieme skalár xxx · yyy = (x1, . . . , xn) ·   y1 ... yn   = x1y1 + . . . + xnyn = n i=1 xiyi . Teda, až na „nepochopiteľné miešanie riadkových a stĺpcových vektorov, ide o bežný „skalárny súčin vektorov xxx,yyy ∈ Kn . Pre takto definovaný súčin vektorov sú tiež splnené dobre známe vlastnosti „skalárneho súčinu . Ľahko možno nahliadnuť, prípadne priamym výpočtom overiť, že pre všetky n ∈ N, c ∈ K a xxx,xxx ∈ K1×n , yyy,yyy ∈ Kn×1 platí xxx · (yyy + yyy ) = xxx · yyy + xxx · yyy , (xxx + xxx ) · yyy = xxx · yyy + xxx · yyy, xxx · cyyy = c(xxx · yyy) = cxxx · yyy, xxx · yyy = yyyT · xxxT . Hovoríme, že násobenie riadkových a stĺpcových vektorov je distributívne (z oboch strán) vzhľadom na sčítanie a komutuje, t. j. je zameniteľné s operáciou skalárneho násobku. Poslednú rovnosť možno chápať ako svojho druhu 2.2. Matice nad daným poľom 67 „komutatívnosť tohto súčinu; vďačíme za ňu komutatívnosti násobenia v poli K. Nech m, n, p ∈ N a AAA = (aij)m×n, BBB = (bjk)n×p. Pod súčinom matíc AAA, BBB rozumieme maticu AAA · BBB = (rrri(AAA) · sssk(BBB))m×p. Všimnime si, že súčin matíc AAA, BBB je definovaný, len ak sa počet stĺpcov matice AAA rovná počtu riadkov matice BBB, t. j. práve vtedy, keď riadky matice AAA a stĺpce matice BBB majú rovnaký rozmer. Ďalej, súčin matíc typov m × n a n × p je matica typu m × p, čo si možno ľahko zapamätať v symbolickom tvare [m × n] · [n × p] = [m × p], pripomínajúcom rozmerové vzťahy vo fyzike. Špeciálne, súčin dvoch štvorcových matíc typu n × n je opäť matica typu n × n. Konečne, prvok na mieste (i, k) matice AAA·BBB dostaneme ako súčin i-teho riadku matice AAA a k-teho stĺpca matice BBB, teda ako výraz rrri(AAA) · sssk(BBB) = (ai1, . . . , ain) ·   b1k ... bnk   = ai1b1k + . . . + ainbnk = n j=1 aijbjk . Na základe toho možno ľahko nahliadnuť (prípadne priamym výpočtom overiť) nasledujúce rovnosti rrri(AAA · BBB) = rrri(AAA) · BBB, sssk(AAA · BBB) = AAA · sssk(BBB). Násobenie matíc je (z oboch strán) distributívne vzhľadom na sčítanie. To znamená že pre ľubovoľné m, n ∈ N a matice AAA, AAA ∈ Km×n , BBB, BBB ∈ Kn×p platí AAA · (BBB + BBB ) = AAA · BBB + AAA · BBB , (AAA + AAA ) · BBB = AAA · BBB + AAA · BBB. Vďaka distributívnosti súčinu vektorov voči ich súčtu je totiž jasné, že (i, k)-ty prvok matice AAA · (BBB + BBB ) je rrri(AAA) · sssk(BBB +BBB ) = rrri(AAA) · (sssk(BBB) +sssk(BBB )) = rrri(AAA) · sssk(BBB) +rrri(AAA) · sssk(BBB ), teda sa rovná (i, k)-temu prvku matice AAA · BBB + AAA · BBB . Rovnako pre druhú rovnosť. Podobne, s využitím zameniteľnosti súčinu vektorov a skalárneho násobku možno dokázať, že pre ľubovoľný skalár c ∈ K a všetky matice AAA ∈ Km×n , BBB ∈ Kn×p platí AAA · cBBB = c(AAA · BBB) = cAAA · BBB. 68 2. Základy maticového počtu Hovoríme, že násobenie matíc komutuje, t. j. je zameniteľné s operáciou skalárneho násobku. Násobenie matíc je tiež asociatívne v nasledujúcom zmysle: súčin matíc AAA · (BBB · CCC) je definovaný práve vtedy, keď je definovaný súčin (AAA · BBB) · CCC, a v takom prípade sa obe matice rovnajú. Teda podrobnejšie, pre m, n, p, q ∈ N a AAA ∈ Km×n , BBB ∈ Kn×p , CCC ∈ Kp×q platí AAA · (BBB · CCC) = (AAA · BBB) · CCC. Na dôkaz toho si stačí uvedomiť, že pre ľubovoľné vektory xxx = (x1, . . . , xn) ∈ K1×n , yyy = (y1, . . . , yp)T ∈ Kp×1 platí xxx · (BBB · yyy) = (x1, . . . , xn) ·   p k=1 b1kyk ... p k=1 bnkyk   = n j=1 xj p k=1 bjkyk = p k=1 n j=1 xjbjk yk = n j=1 xjbj1, . . . , n j=1 xjbjp ·   y1 ... yp   = (xxx · BBB) · yyy. Potom pre 1 ≤ i ≤ m, 1 ≤ l ≤ q, prvok na mieste (i, l) matice AAA · (BBB · CCC) je rrri(AAA) · sssl(BBB · CCC) = rrri(AAA) · (BBB · sssl(CCC)) = (rrri(AAA) · BBB) · sssl(CCC) = rrri(AAA · BBB) · sssl(CCC), teda sa rovná (i, l)-tému prvku matice (AAA ·BBB) ·CCC. Štvorcovú maticu rádu n, ktorá má všetky prvky na diagonále rovné 1 a mimo diagonály 0, označujeme IIIn a nazývame jednotkovou maticou rádu n. S použitím tzv. Kroneckerovho symbolu δij = 1, ak i = j, 0, ak i = j, môžeme písať IIIn = (δij)n×n =       1 0 . . . 0 0 0 1 . . . 0 0 ... ... ... ... ... 0 0 . . . 1 0 0 0 . . . 0 1       . Jednotkové matice hrajú úlohu neutrálnych prvkov pre násobenie matíc. Presnejšie, pre ľubovoľnú maticu AAA ∈ Km×n platí IIIm · AAA = AAA = AAA · IIIn. Rozmyslite si prečo. 2.2. Matice nad daným poľom 69 Špeciálne, množina Kn×n všetkých štvorcových matíc rádu n je tak popri štruktúre vektorového priestoru navyše vybavená asociatívnou operáciou násobenia, ktorá je (z oboch strán) distributívna vzhľadom na sčítanie matíc, komutuje s operáciou skalárneho násobku a jednotková matica IIIn je jej neutrálny prvok. To nám, podobne ako pre prvky poľa K, umožňuje zaviesť i mocniny štvorcových matíc. Pre AAA ∈ Kn×n , kladieme AAA0 = IIIn a AAAk = AAA · . . . · AAA k-krát ak 0 < k ∈ N; teda AAA1 = AAA, AAA2 = AAA · AAA, AAA3 = AAA · AAA · AAA, atď. Na druhej strane si treba uvedomiť, že pre n > 1 – napriek komutatívnosti násobenia v poli K – násobenie matíc z pozičných dôvodov nie je komutatívne na Kn×n . Napríklad 1 1 0 1 · 0 1 1 1 = 1 1 + 1 1 1 , 0 1 1 1 · 1 1 0 1 = 0 1 1 1 + 1 . (Uvedomte si, že na to, aby oba súčiny AAA · BBB, BBB · AAA boli definované a mali rovnaké rozmery, teda, aby vôbec malo zmysel uvažovať o komutatívnosti súčinu, AAA, BBB musia byť štvorcové matice rovnakého typu.) Napriek tomu komutatívnosť násobenia v poli K má za dôsledok, že pre všetky m, n, p a matice AAA ∈ Km×n , BBB ∈ Kn×p platí rovnosť (AAA · BBB)T = BBBT · AAAT . Naozaj, (AAA·BBB)T aj BBBT ·AAAT sú matice typu p×m a pre 1 ≤ i ≤ m, 1 ≤ k ≤ p, (k, i)-ty prvok matice (AAA · BBB)T je (i, k)-ty prvok matice AAA · BBB, t. j. rrri(AAA) · sssk(BBB) = sssk(BBB)T · rrri(AAA)T = rrrk(BBBT ) · sssi(AAAT ), čo je (k, i)-ty prvok matice BBBT · AAAT . Pritom sme využili už spomínanú „komutatívnosť xxx · yyy = yyyT · xxxT súčinu vektorov. Na margo poslednej rovnosti ešte podotknime, že pre xxx ∈ K1×n , yyy ∈ Km×1 je taktiež definovaný súčin yyy ·xxx. Nie je to však skalár, ale matica typu m×n: yyy · xxx = (yixj)m×n =   y1x1 . . . y1xn ... ... ... ymx1 . . . ymxn   . Teda, okrem prípadu m = n = 1, rovnosť xxx · yyy = yyy · xxx nemôže nastať už z rozmerových dôvodov. 2.2.3. Operácie s blokovými maticami. Operácie maticového súčtu a skalárneho násobku, vďaka tomu, že boli definované po zložkách, možno na 70 2. Základy maticového počtu blokových maticiach rozložiť na jednotlivé bloky. Ak AAA = (AAAij)k×l, BBB = (BBBij)k×l sú blokové matice nad poľom K, pričom zodpovedajúce si bloky AAAij, BBBij majú rovnaký typ mi × nj, tak ich súčet je opäť bloková matica AAA + BBB = (AAAij + BBBij)k×l s blokmi rovnakých typov. S operáciou skalárneho násobku je to ešte jednoduchšie, lebo sa nemusíme starať o zhodnosť rozmerov jednotlivých blokov. Pre c ∈ K jednoducho dostávame cAAA = (cAAAij)k×l. Bloková štruktúra sa prenáša aj na súčin matíc za podmienky, že stĺpce prvej matice sú v rovnakom poradí rozdelené na rovnaký počet rovnako veľkých skupín, povedzme n1 + n2 + . . . + nν, ako riadky druhej matice. Teda ak AAA = (AAAij)µ×ν, BBB = (BBBjk)ν×ϑ sú blokové matice nad K, pričom blok AAAij je typu mi × nj a blok BBBjk typu nj × pk, tak aj ich súčin je bloková matica tvaru AAA · BBB = (CCCik)µ×ϑ, kde blok CCCik = AAAi1 · BBB1k + AAAi2 · BBB2k + . . . + AAAiν · BBBνk je typu mi ×pk. Inak povedané, blokové matice násobíme tak ako „obyčajné matice, len s tým rozdielom, že súčet resp. súčin v poli K nahradíme súčtom resp. súčinom matíc. Vo výsledku, ak chceme, si nakoniec môžeme odmyslieť zátvorky oddeľujúce jednotlivé bloky a matica, ktorú takto dostaneme, sa rovná matici, ktorú by sme dostali, keby sme „normálne vynásobili „odblokované matice AAA a BBB. Jednotkové matice IIIn sú príkladom tzv. diagonálnych matíc. Štvorcovú maticu AAA = (aij)n×n nazývame diagonálnou, ak aij = 0 pre všetky i = j, t. j. ak všetky jej prvky mimo diagonály sú nuly. Diagonálnu maticu, ktorá má na diagonále postupne prvky d1, d2, . . . , dn ∈ K značíme diag(d1, d2, . . . , dn). Teda napr. IIIn = diag(1, . . . , 1 n-krát ). Podobne možno definovať aj tzv. blokovo diagonálne matice. Ak AAA1, AAA2, . . . ,AAAk sú štvorcové matice rádov n1, n2, . . . , nk, tak blokovo diagonálnou maticou s blokmi AAA1, AAA2, . . . ,AAAk nazývame štvorcovú blokovú maticu diag(AAA1,AAA2, . . . ,AAAk) =     AAA1 0 . . . 0 0 AAA2 . . . 0 ... ... ... ... 0 0 . . . AAAk     , 2.3. Matice nad vektorovým priestorom 71 kde 0 nachádzajúca sa na mieste (i, j) označuje nulovú maticu 0ninj . Pred chvíľou uvedené pravidlo o súčine blokových matíc sa redukuje na obzvlášť jednoduchý tvar pre blokovo diagonálne matíce – ich násobenie totiž funguje diagonálne po zložkách. Ak AAA = diag(AAA1, . . . ,AAAk), BBB = diag(BBB1, . . . ,BBBk) sú blokovo diagonálne matice, pričom zodpovedajúce si bloky AAAi, BBBi sú štvorcové matice rovnakého rádu ni, tak aj ich súčin je blokovo diagonálna matica tvaru AAA · BBB = diag(AAA1 · BBB1, . . . ,AAAk · BBBk) so štvorcovými blokmi rádov n1, . . . , nk. Špeciálne, pre „obyčajné diagonálne matice platí diag(a1, . . . , an) · diag(b1, . . . , bn) = diag(a1b1, . . . , anbn). Formuláciu analogických pravidiel pre súčet a skalárny násobok (blokovo) diagonálnych matíc prenechávame čitateľovi. 2.3 Matice nad vektorovým priestorom Matice typu m × n nad poľom K sú špeciálnym druhom blokových matíc. Maticu AAA = (aij) ∈ Km×n môžeme považovať jednak za blokovú maticu s blokmi aij typu 1 × 1, jednak, ako sme už neraz naznačili, môžeme sa na ňu dívať ako na riadok jej stĺpcov resp. ako na stĺpec jej riadkov. V takom prípade AAA chápeme ako maticu typu m×1 nad vektorovým priestorom K1×n , resp. ako maticu typu 1 × n nad vektorovým priestorom Km×1 . Konkrétna podoba týchto vektorových priestorov je však teraz pre nás nepodstatná – pre ľubovoľné m, n ∈ N a ľubovoľný (abstraktný) vektorový priestor V máme totiž definovanú množinu V m×n všetkých matíc nad množinou V . Na množine V m×n možno zaviesť operácie súčtu a skalárneho násobku po zložkách. V m×n s týmito operáciami opäť tvorí vektorový priestor nad poľom K. Čitateľovi prenechávame, aby si sám doplnil a premyslel potrebné detaily. My sa sústredíme na zovšeobecnenie operácie skalárneho násobku K × V → V na operácie súčinu medzi maticami vhodných typov nad K a nad V . Pre matice AAA = (aij) ∈ Km×n , ααα = (uuujk) ∈ V n×p kladieme AAA · ααα = (vvvik) ∈ V m×p , kde vvvik = n j=1 aijuuujk . Teda súčin AAA · ααα definujeme z formálneho hľadiska rovnako ako súčin matíc nad poľom K, len s tým rozdielom že operácia súčtu v K je nahradená operáciou súčtu vo V a operácia súčinu v K operáciou skalárneho násobku K × V → V . 72 2. Základy maticového počtu Celkom obdobne ako v odstavci 2.2.2 aj pre násobenie matíc nad V maticami nad K možno overiť distributívnosť (z oboch strán) vzhľadom na sčítanie, zameniteľnosť s operáciou skalárneho násobku, asociatívnosť a postavenie jednotkových matíc ako neutrálnych prvkov. To znamená, že pre všetky l, m, n, p ∈ N, c ∈ K, AAA, BBB ∈ Km×n , CCC ∈ Kl×m ααα, βββ ∈ V n×p platí: AAA · (ααα + βββ) = AAA · ααα + AAA · βββ, (AAA + BBB) · ααα = AAA · ααα + BBB · ααα, AAA · (cααα) = c(AAA · ααα) = (cAAA) · ααα, CCC · (AAA · ααα) = (CCC · AAA) · ααα, IIIn · ααα = ααα. Vzhľadom na našu dohodu, podľa ktorej xxxc = cxxx pre c ∈ K, xxx ∈ V , môžeme definovať aj súčin matíc βββ = (vvvij) ∈ V m×n , BBB = (bbbjk) ∈ Kn×p v obrátenom poradí ako maticu βββ · BBB = (wwwik) ∈ V m×p takú, že wwwik = n j=1 vvvijbjk = n j=1 bjkvvvij . S využitím poslednej definície možno pre AAA ∈ Km×n , ααα ∈ V n×p , βββ ∈ V m×n , BBB ∈ Kn×p dokázať tiež rovnosti (AAA · ααα)T = αααT · AAAT , (βββ · BBB)T = BBBT · βββT . Aplikáciou týchto vzťahov na predchádzjúci zoznam rovností (no taktiež priamo) možno aj pre súčin matíc tvaru βββ·BBB, kde βββ ∈ V m×n , BBB ∈ Kn×p , overiť jeho distributívnosť (z oboch strán) vzhľadom na sčítanie, zameniteľnosť s operáciou skalárneho násobku, asociatívnosť a postavenie jednotkových matíc ako neutrálnych prvkov. To znamená, že pre všetky m, n, p, q ∈ N, c ∈ K, ααα, βββ ∈ Km×n , AAA, BBB ∈ V n×p , CCC ∈ Kp×q platí: (ααα + βββ) · AAA = ααα · AAA + βββ · AAA, ααα · (AAA + BBB) = ααα · AAA + ααα · BBB, ααα · (cAAA) = c(ααα · AAA) = (cααα) · AAA, ααα · (AAA · CCC) = (ααα · A) · CCC, ααα · IIIn = ααα. Taktiež vzťahy pre riadky a stĺpce súčinu z odseku 2.2.2 zostávajú zachované pre oba typu súčinov matíc nad K a V , t. j. rrri(AAA · ααα) = rrri(AAA) · ααα, sssk(AAA · ααα) = AAA · sssk(ααα) rrri(βββ · BBB) = rrri(βββ) · BBB, sssk(βββ · BBB) = βββ · sssk(BBB) Cvičenia 73 pre všetky AAA ∈ Km×n , ααα ∈ V n×p βββ ∈ V m×n , BBB ∈ Kn×p . Napokon si ešte uvedomme, že definície súčinov AAA · ααα, βββ · BBB sú v zhode s pôvodným násobením matíc. Ak totiž maticu AAA ∈ Km×n chápame ako riadok, t. j. ako maticu typu 1 × n nad priestorom stĺpcových vektorov Km , tak pre BBB ∈ Kn×p splýva matica (sss1(AAA), . . . ,sssn(AAA)) · BBB vypočítaná podľa „novej definície s blokovým tvarom (AAA · sss1(BBB), . . . ,AAA · sssp(BBB)) matice AAA · BBB. Podobne, ak BBB chápeme ako stĺpec, t. j. ako maticu typu n×1 nad priestorom riadkových vektorov Kp , tak AAA ·   rrr1(BBB) ... rrrn(BBB)   =   rrr1(AAA) · BBB ... rrrm(AAA) · BBB   = AAA · BBB. (Doplňte si vynechané podrobnosti – pozri cvičenie 2.6.) Špeciálne, lineárnu kombináciu a1xxx1 + . . . anxxxn vektorov xxx1, . . . ,xxxn ∈ V s koeficientmi a1, . . . , an ∈ K môžeme s využitím vektorových matíc zapísať v tvare súčinov a1xxx1 + . . . + anxxxn = (a1, . . . , an) ·   xxx1 ... xxxn   = (xxx1, . . . ,xxxn) ·   a1 ... an   . Cvičenia 2.1. Nech AAA = 0 @ 1 −1 1 0 5 2 1 −4 0 1 A, BBB = 0 @ 0 1 2 −2 9 3 10 6 0 1 A, CCC = 0 @ 1 2 3 1 4 9 1 2 4 1 A sú matice nad R. Vypočítajte matice AAA + 2BBB, AAA − BBBT − 3CCC, AAA · BBB, BBB · AAA, AAA · (BBB + CCC), (3AAAT +BBB)·CCC, BBB ·CCC2 , CCC2 ·BBB, CCC ·BBB ·CCC, AAA·CCC −CCC ·AAA, AAA·BBB ·CCC a CCCT ·AAA·CCC. 2.2. Vypočítajte súčin AAA · BBB komplexných matíc AAA = 1+i −2 −i 1−i −i 2+3i , BBB = 3i 2+i −4 1−2i 0 4i . 2.3. Nájdite matice AAA, BBB ∈ Q2×2 také, že AAA · BBB = 0 = BBB · AAA. 2.4. Uvažujte matice AAA = ( 1 3 3 2 ), BBB = ( 0 1 4 1 ), CCC = ( 4 3 4 0 ) nad poľom (a) Z5, (b) Z7, (c) Z11, (d) Q. V každom z uvedených prípadov vypočítajte maticu AAA·(BBB +CCC). Skúste riešiť úlohy (a)–(d) v optimálnom poradí. 2.5. Sú dané reálne blokové matice AAA = AAA11 AAA12 AAA21 AAA22 , BBB = BBB11 BBB12 BBB13 BBB21 BBB22 BBB23 , kde AAA11 = ( 1 1 0 1 ), AAA12 = ( 1 2 0 1 ), AAA21 = ( 2 1 0 1 ), AAA22 = ( 2 2 0 1 ), BBB11 = ( 1 1 1 1 ), BBB12 = BBB13 = 1 2 1 −1 , BBB21 = 2 1 −1 1 , BBB22 = BBB23 = 2 2 −1 −1 . Vynásobte AAA a BBB ako blokové matice aj ako matice, v ktorých ste zabudli na rozdelenie do blokov, a oba výsledky porovnajte. 2.6. Maticu AAA = (aij)m×n nad ľubovoľným poľom K uvažujte ako riadok jej stĺpcov, t. j. ako blokovú maticu AAA = (uuu1, . . . ,uuun), kde uuuj = sssj(AAA) pre j ≤ n. Nech ccc = 74 2. Základy maticového počtu (c1, . . . , cn)T ∈ Kn je stĺpcový vektor. Ukážte, že lineárna kombinácia c1uuu1 + . . . + cnuuun splýva s „obyčajným maticovým súčinom AAA·ccc. Vysvetlite tento fakt pomocou násobenia blokových matíc. 2.7. Nech X je konečná množina. Ľubovoľná množina H ⊆ X2 určuje orientovaný graf (X, H) s množinou vrcholov X a s množinou orientovaných hrán H: vrcholy (t. j. prvky množiny X) si znázorníme krúžkami v rovine a z vrcholu x vedieme orientovanú hranu (t. j. šípku) do vrcholu y práve vtedy, keď (x, y) ∈ H (pozri obr. 2.1). Konečnú postupnosť (z0, z1, . . . , zk) prvkov množiny X takú, že pre každé 1 ≤ i ≤ k platí (zi−1, zi) ∈ H, nazývame cestou dĺžky k v orientovanom grafe (X, H). Predpokladajme, že X = {x1, . . . , xn} má práve n prvkov. Maticu HHH = (hij) ∈ Rn×n takú, že hij = 1, ak (xi, xj) ∈ H, a hij = 0, ak (xi, xj) /∈ H, nazývame incidenčnou maticou orientovaného grafu (X, H). Prvky k-tej mocniny incidenčnej matice HHH označme h (k) ij , t. j. HHHk = h (k) ij . Potom číslo h (k) ij udáva počet ciest dĺžky k z vrcholu xi do vrcholu xj v orientovanom grafe (X, H). Dokážte (napr. matematickou indukciou). Obr. 2.1. Príklady orientovaných grafov 2.8. Očíslujte vrcholy orientovaných grafov z obrázku 2.1). Pre každý graf napíšte jeho incidenčnú maticu a pre každú dvojicu (xi, xj) jeho vrcholov určte počet ciest dĺžky 2, 3, 4 a 5 z xi do xj. 2.9. Nech K je komutatívny okruh s jednotkou (pozri cvičenie 1.8). Presvedčte sa, že pre ľubovoľné m, n ∈ N možno na množine matíc Km×n definovať operácie súčtu AAA + BBB a skalárneho násobku cAAA rovnako ako v odstavci 2.2.1. Taktiež možno pre AAA ∈ Km×n , BBB ∈ Kn×p definovať súčin AAA · BBB ∈ Km×p rovnako ako v odstavci 2.2.2. Ukážte, že všetky vlastnosti maticových operácií uvedené v kapitole 2 zostávajú v platnosti aj v tomto všeobecnejšom prípade. 2.10. Vynechajme z definície poľa, popri nerovnosti 0 = 1 a požiadavke existencie inverzného prvku ku každému nenulovému a ∈ K, aj podmienku komutatívnosti násobenia, namiesto ktorej pridajme ešte jeden distributívny zákon (∀ a, b, c ∈ K)((a + b)c = ac + bc). Množina K s význačnými prvkami 0 a 1, vybavená operáciami sčítania a násobenia, ktoré vyhovujú uvedeným podmienkam, sa nazýva okruh s jednotkou.1 (a) Okruh s jednotkou K sa nazýva netriviálny, ak v ňom platí 0 = 1. Dokážte, že okruh s jednotkou K je netriviálny práve vtedy, keď obsahuje aspoň dva rôzne prvky. (b) Nech K je okruh s jednotkou. Presvedčte sa, že pre matice nad K možno zaviesť operácie súčtu, skalárneho násobku a súčinu rovnako ako pre matice nad poľom. Ukážte, že všetky vlastnosti týchto operácií uvedené v kapitole 2, s výnimkou 1 Občas sa v literatúre takáto štruktúra nazýva len okruh. Cvičenia 75 rovností (xxx ·yyy)T = yyyT ·xxxT , (AAA ·BBB)T = BBBT ·AAAT a možnosti zapisovať „lineárne kombinácie v tvare c1uuu1 +. . . cnuuun = (uuu1, . . . ,uuun)·(c1, . . . , cn)T , zostávajú v platnosti. 2.11. Nech K je okruh s jednotkou a n ∈ N. Dokážte postupne nasledujúce tvrdenia: (a) Množina Kn×n so sčítaním a násobením matíc tvorí okruh s jednotkou. (b) Okruh s jednotkou Kn×n je triviálny práve vtedy, keď K je triviálny alebo n = 0. (c) Okruh s jednotkou Kn×n je komutatívny práve vtedy, keď n = 0, alebo n = 1 a K je komutatívny. 2.12. (a) Rovnako ako v prípade poľa zadefinujte charakteristiku ľubovoľného okruhu s jednotkou. (b) Dokážte, že okruh s jednotkou K je triviálny práve vtedy, keď char K = 1. (c) Nech K je ľubovoľný okruh a 1 ≤ n ∈ N. Potom char Kn×n = char K. Dokážte. (d) Pre každé 2 ≤ m ∈ N ∪ {∞} uveďte príklad nekomutatívneho okruhu s jednotkou charakteristiky m. 2.13. Nech K je okruh s jednotkou. (a) Pre všetky n ∈ N zadefinujte mocniny an prvku a ∈ K rovnako ako v poli a dokážte, že pre m, n ∈ N platí am an = am+n , (am )n = amn . Čo bráni definícii mocnín an pre záporné exponenty n ∈ Z? (b) Prvok a ∈ K sa nazýva invertovateľný, ak k nemu existuje (obostranný, teda nutne jediný) inverzný prvok a−1 vzhľadom na násobenie. Pre invertovateľné prvky a ∈ K rozšírte definíciu mocnín an na všetky n ∈ Z a dokážte rovnosti z (a) pre ľubovoľné m, n ∈ Z. (c) Nech a, b ∈ K. Čo je prekážkou všeobecnej platnosti rovnosti (ab)n = an bn pre n ≥ 2? Dokážte, že ak a, b komutujú, t. j. ab = ba, tak uvedená rovnosť platí pre všetky n ∈ N. (d) Pre K = R2×2 nájdite príklad matíc AAA, BBB ∈ K takých, že (AAA · BBB)2 = AAA2 · BBB2 . (e) Nech a, b ∈ K sú invertovateľné. Dokážte, že potom aj prvok ab je invertovateľný a platí (ab)−1 = b−1 a−1 . Čo je prekážkou všeobecnej platnosti rovnosti (ab)−n = b−n a−n pre n ≥ 2? 2.14. (a) Rovnako ako v príklade 1.6.3 a v cvičení 1.12 zadefinujte množinu K[x] všetkých polynómov v premennej x nad ľubovoľným okruhom s jednotkou K a na nej operácie súčtu a súčinu. Dokážte, že K[x] s takto definovanými operáciami je opäť okruh s jednotkou a platí char K[x] = char K. (b) Dokážte, že K[x] je komutatívny práve vtedy, keď K je komutatívny. (c) Dokážte, že polynóm f(x) je invertovateľný prvok okruhu K[x] práve vtedy, keď f(x) = a je konštantný polynóm, pričom a je invertovateľný prvok okruhu K. 3. Sústavy lineárnych rovníc V tejto kapitole sa predbežne zoznámime so sústavami lineárnych rovníc nad všeobecným poľom K a naučíme sa ich riešiť. Využijeme pri tom zápis sústavy pomocou istej matice. Štruktúrne vlastnosti množiny všetkých riešení danej sústavy a ich dôsledky preštudujeme a využijeme až neskôr, keď sa bližšie oboznámime so štruktúrou vektorových priestorov. 3.1 Maticový zápis sústavy lineárnych rovníc Pod lineárnou rovnicou o n neznámych x1, . . . , xn nad poľom K rozumieme formulu tvaru a1x1 + a2x2 + . . . + anxn = b, kde a1, a2, . . . , an, b ∈ K, v premenných x1, x2, . . . , xn. Sústavou m lineárnych rovníc o n neznámych x1, x2, . . . , xn nad poľom K rozumieme konjunkciu formúl tvaru a11x1 + a21x2 + . . . + a1nxn = b1 a21x1 + a22x2 + . . . + a2nxn = b2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . am1x1 + am2x2 + . . . + amnxn = bm, kde aij, bi, pre 1 ≤ i ≤ m, 1 ≤ j ≤ n, sú skaláry z poľa K. Maticu AAA = (aij) ∈ Km×n nazývame maticou sústavy, stĺpcový vektor bbb = (b1, . . . , bm)T ∈ Km nazývame jej pravou stranou. Konečne rozšírenou maticou sústavy nazývame blokovú maticu (AAA |bbb) ∈ Km×(n+1) . Sústava sa nazýva homogénna, ak bbb = 0; v opačnom prípade sa nazýva nehomogénna. Uvedenú sústavu možno stručne a úsporne zapísať v maticovom tvare AAA · xxx = bbb, prípadne, ak ide o homogénnu sústavu, v tvare AAA · xxx = 0. Riešením sústavy AAA·xxx = bbb nazývame ľubovoľný vektor-stĺpec xxx = (x1, x2, . . . , . . . , xn)T ∈ Kn , ktorého zložky vyhovujú každej z rovníc tejto sústavy, t. j. platí preň AAA · xxx = bbb. Vyriešiť sústavu znamená nájsť všetky jej riešenia, t. j. popísať množinu všetkých jej riešení. 3.1. Maticový zápis sústavy lineárnych rovníc 77 Dve sústavy AAA · xxx = bbb a BBB · xxx = ccc, kde AAA, BBB ∈ Km×n , bbb,ccc ∈ Km×1 , sa nazývajú ekvivalentné, ak majú rovnakú množinu riešení, t. j. ak pre všetky xxx ∈ Kn platí AAA · xxx = bbb práve vtedy, keď BBB · xxx = ccc. Skôr než prikročíme k otázke riešenia sústav lineárnych rovníc, považujeme za potrebné upozorniť čitateľa na dve veci. (a) Podčiarkujeme, že riešením sústavy rozumieme vždy vektor xxx a nie jeho zložky. Tak napríklad sústava 2x + 3y = 12 3x − 2y = 5 nad poľom R má, ako ľahko nahliadneme, jediné riešenie x y = 3 2 a nie dve riešenia x = 3, y = 2. Keď si toto poriadne uvedomíme, môžeme (a samozrejme aj budeme) sa naďalej vyjadrovať obvyklým spôsobom. Budeme teda hovoriť, že sústava má jediné riešenie x = 3, y = 2. (b) Všimnite si, že počet rovníc sústavy a počet neznámych sa nemusia rovnať. V obvyklom prípade, keď rovníc je rovnaký počet ako neznámych, očakávame, že sústava bude mať jediné riešenie. Keď je rovníc menej než neznámych, môžeme očakávať, že sústava bude mať viacero (prípadne i nekonečne mnoho) riešení. Naopak, keď je rovníc viac ako neznámych, môže sa stať, že sústava nebude mať nijaké riešenie. Napriek tomu, že tieto očakávania vyjadrujú niečo ako „prevládajúci trend , ľahko možno nájsť príklady, keď sa nemusia splniť. Zatiaľ len poznamenajme, že homogénna sústava AAA·xxx = 0 má (bez ohľadu na počet neznámych a počet rovníc) vždy aspoň jedno riešenie – je ním nulový vektor xxx = 0. Nie je dôležité, akými znakmi sú označené neznáme v sústave AAA · xxx = bbb. Na jej riešenie nemá nijaký vplyv, či si vektor neznámych označíme xxx = (x1, . . . , xn)T alebo yyy = (y1, . . . , yn)T alebo nejako inak. To znamená, že celá informácia o tejto sústave, potrebná na nájdenie všetkých jej riešení, je obsiahnutá v rozšírenej matici sústavy (AAA |bbb), prípadne, ak ide o homogénnu sústavu, len v matici sústavy AAA. Preto i metóda riešenia sústav lineárnych rovníc, s ktorou sa teraz zoznámime, bude založená len na úprave tejto ma- tice. Stručne povedané, rozšírenú maticu (AAA |bbb) sústavy AAA · xxx = bbb budeme upravovať tak, aby sme dostali vhodnú maticu (BBB |ccc), zodpovedajúcu novej sústave BBB · xxx = ccc, ktorá spĺňa nasledujúce dve podmienky: (a) Je ekvivalentná s pôvodnou sústavou AAA·xxx = bbb, t. j. má rovnakú množinu riešení. (b) Všetky jej riešenia možno priamo vyčítať z jej rozšírenej matice (BBB |ccc). V takom prípade hovoríme, že sústava BBB · xxx = ccc je vyriešená. 78 3. Sústavy lineárnych rovníc 3.2 Redukovaný stupňovitý tvar matice Našou prvou úlohou teda bude vyjasniť si, ako by mala vyzerať matica (BBB |ccc), aby sme príslušnú sústavu BBB · xxx = ccc mohli považovať za vyriešenú. Za tým účelom teraz zavedieme niekoľko pojmov. Hovoríme, že prvok aij matice AAA ∈ Km×n je vedúci prvok i-teho riadku matice AAA, ak aij = 0, a j = 1 alebo ail = 0 pre všetky 1 ≤ l < j. Inak povedané, vedúci prvok nenulového riadku je prvý nenulový prvok tohto riadku. Nulový riadok nemá vedúci prvok. Hovoríme, že matica AAA = (aij) ∈ Km×n je v redukovanom stupňovitom tvare, ak spĺňa nasledujúce štyri podmienky: (a) Ak rrri(AAA) = 0 a rrrk(AAA) = 0, tak i < k; t. j. každý nenulový riadok matice AAA leží nad každým jej nulovým riadkom. (b) Ak aij, akl sú vedúce prvky i-teho resp. k-teho riadku a i < k, tak aj j < l; t. j. vedúci prvok vyššieho riadku leží viac vľavo než vedúci prvok nižšieho riadku. (c) Ak aij je vedúci prvok i-teho riadku, tak aij = 1; t. j. vedúci prvok každého nenulového riadku je 1. (d) Ak aij je vedúci prvok i-teho riadku, tak akj = 0 pre každé k = i; t. j. v stĺpci, v ktorom sa nachádza vedúci prvok nejakého riadku, sú všetky ostatné prvky rovné 0. Pokiaľ matica AAA spĺňa len podmienky (a), (b), hovoríme, že je v stupňovitom tvare. Používa sa tiež názov (redukovaný) schodovitý tvar. Napríklad z uvedených matíc nad poľom R   0 2 1 1 0 0 0 0 0     2 3 0 1 0 0 1 4 0 0 0 0     0 1 0 0 0 0 1 0 0 0 0 1       0 0 0 1 0 0 0 1 0 0 0 1         1 2 3 4 0 1 2 3 0 0 1 2 0 0 0 1         1 0 1 0 0 1 2 0 0 0 0 1 0 0 0 0     ani jedna z matíc vľavo nie je v stupňovitom tvar; obe matice v strednom stĺpci sú v stupňovitom tvare, nie však v redukovanom stupňovitom tvare; konečne, obe matice vpravo sú v redukovanom stupňovitom tvare. (V každom jednotlivom prípade si podrobne premyslite prečo.) Taktiež každá jednotková matica IIIn, ako aj všetky nulové matice 0mn sú v redukovanom stupňovitom tvare. 3.2. Redukovaný stupňovitý tvar matice 79 Uvedomme si teraz, akej sústave lineárnych rovníc zodpovedá rozšírená matica v redukovanom stupňovitom tvare. Napríklad (BBB |ccc) =   1 0 −2 0 0 0 1 6 0 0 0 0 0 1 0 3 0 1   je matica v redukovanom stupňovitom tvare nad R. Táto matica zodpovedá sústave x1 − 2x3 = 3 x2 + 6x3 = 0 x4 = 1 v neznámych x1, x2, x3, x4, x5. Hneď vidíme, že táto sústava má nekonečne mnoho riešení. Každej voľbe parametrov s, t ∈ R totiž zodpovedá jedno rie- šenie x1 = 3 + 2s x2 = − 6s x3 = s x4 = 1 x5 = t. Asi sa zhodneme na tom, že preznačenie neznámych za parametre x3 = s, x5 = t a ich presun na pravú stranu, je úprava natoľko bezprostredná, že sústavu prislúchajúcu k matici (BBB |ccc) už možno považovať za vyriešenú. Na napísanie jej riešenia nemusíme písať príslušnú sústavu, môžeme ho napísať priamo na základe matice (BBB |ccc). Dohodneme sa teda, že sústavu lineárnych rovníc BBB ·xxx = ccc nad poľom K budeme nazývať vyriešenou sústavou, ak jej rozšírená matica (BBB |ccc) je v redukovanom stupňovitom tvare. V prípade homogénnej sústavy sa, samozrejme, stačí obmedziť na maticu BBB. Teraz si predvedieme, ako možno k danej blokovej matici (BBB |ccc) v redukovanom stupňovitom tvare, nájsť všetky riešenia sústavy BBB · xxx = ccc. Najprv si ujasníme, kedy je taká sústava riešiteľná, t. j. má aspoň jedno riešenie. Odpoveď na túto otázku je jednoduchá: Sústava BBB·xxx = ccc má riešenie práve vtedy, keď sa v matici (BBB |ccc) nenachádza riadok tvaru (0, . . . , 0 n-krát | 1). Taký riadok totiž zodpovedá rovnici 0 = 1, ktorá očividne nemá riešenie. To, že neprítomnosť takého riadku je i postačujúcou podmienkou riešiteľnosti sústavy, vyplýva z nasledujúceho postupu, ako toto riešenie nájsť. 80 3. Sústavy lineárnych rovníc Ak sa v j-tom stĺpci matice BBB nenachádza vedúci prvok žiadneho riadku, tak si neznámu xj zvolíme za parameter; ak sa v j-tom stĺpci nachádza vedúci prvok nejakého riadku, tak neznámu xj si vyjadríme pomocou parametrov tak, že stĺpce matice BBB prislúchajúce týmto parametrom „prehodíme s opačným znamienkom na druhú stranu . Presnejšiu formuláciu celého postupu vo všeobecnej podobe si odpustíme. Názornejšie bude osvetliť ho na ešte jednom príklade. (BBB |ccc) =   1 0 0 2/3 −1/2 0 1 0 3/4 0 0 0 1 −4 −2/5 5 2 −2   je reálna matica v redukovanom stupňovitom tvare. Vidíme, že sa v nej nenachádza riadok tvaru (0, 0, 0, 0 | 1), teda sústava BBB · xxx = ccc by mala mať riešenie. Vedúce prvky riadkov matice BBB sa nachádzajú v stĺpcoch 1, 2 a 3. Za parametre si teda zvolíme neznáme x4 a x5. Riešením sústavy je každý vektor (x1, x2, x3, x4, x5)T ∈ R tvaru x1 = 5 − 2 3 s + 1 2 t x2 = 2 − 3 4 s x3 = −2 + 4s + 2 5 t x4 = s x5 = t, kde parametre s, t ∈ R môžu nadobúdať ľubovoľné hodnoty. Pre estétov ešte poznamenajme, že zlomkov pri parametroch sa možno jednoducho zbaviť. Je totiž jedno, či si parametrické premenné zvolíme v tvare x4 = s, x5 = t alebo v tvare x4 = 12s, x5 = 10t, kde s, t ∈ R. Pri takejto voľbe parametrov dostaneme všetky riešenia sústavy v tvare bez zlomkov x1 = 5 − 8s + 5t x2 = 2 − 9s x3 = −2 + 36s + 4t x4 = 12s x5 = 10t. 3.3. Gaussova-Jordanova eliminačná metóda 81 3.3 Gaussova-Jordanova eliminačná metóda Zatiaľ sme si ujasnili, na aký tvar treba upraviť rozšírenú maticu (AAA |bbb) sústavy AAA·xxx = bbb, aby sme získali s ňou ekvivalentnú vyriešenú sústavu BBB·xxx = ccc: rozšírená matica (BBB |ccc) novej sústavy musí byť v redukovanom stupňovitom tvare. Teraz si ukážeme, ako to možno urobiť. Maticu (AAA |bbb) budeme na redukovaný stupňovitý tvar upravovať pomocou tzv. elementárnych riadkových operácií. Elementárnou riadkovou operáciou, skrátene tiež ERO, na matici AAA ∈ Km×n rozumieme I. výmenu dvoch riadkov matice AAA; II. vynásobenie niektorého riadku matice AAA nenulovým skalárom z poľa K; III. pripočítanie skalárneho násobku niektorého riadku matice AAA k jej inému riadku. Matice AAA, BBB ∈ Km×n sa nazývajú riadkovo ekvivalentné, označenie AAA ∼ BBB, ak jednu z nich možno upraviť na druhú konečným počtom elementárnych riadkových operácií. Riešenie sústavy lineárnych rovníc úpravou jej rozšírenej matice pomocou ERO na riadkovo ekvivalentnú maticu v redukovanom stupňovitom tvare sa nazýva Gaussova-Jordanova eliminácia. Prenechávame čitateľovi, aby si sám sformuloval analogické pojmy elementárnych stĺpcových operácií (ESO) a stĺpcovej ekvivalencie matíc, označenie AAA BBB. Ich význam vyjde najavo až v neskorších kapitolách. Výmenou i-teho a k-teho riadku v matici AAA =             rrr1(AAA) ... rrri(AAA) ... rrrk(AAA) ... rrrm(AAA)             dostaneme maticu             rrr1(AAA) ... rrrk(AAA) ... rrri(AAA) ... rrrm(AAA)             . Opätovnou výmenou i-teho a k-teho riadku v tejto matici získame zasa maticu AAA. 82 3. Sústavy lineárnych rovníc Vynásobením i-teho riadku matice AAA skalárom c = 0 dostaneme maticu             rrr1(AAA) ... crrri(AAA) ... rrrk(AAA) ... rrrm(AAA)             . Vynásobením i-teho riadku tejto matice skalárom c−1 = 0 získame opäť maticu AAA. Konečne, pripočítaním c-násobku i-teho riadku matice AAA k jej k-temu riadku z nej dostaneme maticu             rrr1(AAA) ... rrri(AAA) ... rrrk(AAA) + crrri(AAA) ... rrrm(AAA)             . Všimnite si, že i-ty riadok pri tom zostáva nezmenený. Maticu AAA z tejto matice získame pripočítaním (−c)-násobku jej i-teho riadku ku k-temu riadku. Ak AAA · xxx = bbb je sústava s rozšírenou maticou (AAA |bbb) a bloková matica (AAA |bbb ) vznikne z (AAA |bbb) vykonaním jednej (nezáleží ktorej) ERO, tak sústava AAA ·xxx = bbb je ekvivalentná s pôvodnou sústavou AAA·xxx = bbb. Elementárne riadkové operácie na matici (AAA |bbb) totiž zodpovedajú postupne zámene poradia dvoch rovníc sústavy, vynásobením niektorej rovnice nenulovým skalárom a pripočítaním nejakého násobku jednej rovnice k inej rovnici (presnejšie nahradením dojice rovníc rrri(AAA) · xxx = bi, rrrk(AAA) · xxx = bk dvojicou rovníc rrri(AAA) · xxx = bi, (rrrk(AAA) + crrri(AAA)) ·xxx = bk + cbi). Z pred chvíľou vykonaných úvah vyplýva, že ide o ekvivalentné úpravy, ktorými sa množina riešení sústavy nezmení – od novej sústavy AAA ·xxx = bbb sa možno vhodnou ERO vykonanou na jej rozšírenej matici opäť vrátiť k pôvodnej sústave AAA · xxx = bbb. 3.3.1. Tvrdenie. Nech K je pole, AAA, BBB ∈ Km×n , bbb,ccc ∈ Km . Ak sú blokové matice (AAA |bbb), (BBB |ccc) riadkovo ekvivalentné, tak i sústavy lineárnych rovníc AAA · xxx = bbb, BBB · xxx = ccc sú ekvivalentné. 3.3. Gaussova-Jordanova eliminačná metóda 83 Dôkaz. Podľa predpokladu existuje postupnosť blokových matíc (AAA |bbb) = (CCC0 |ddd0), (CCC1 |ddd1), . . . , (CCCp |dddp) = (BBB |ccc) typu m × (n + 1) takých, že pre každé l < p matica (CCCl+1 |dddl+1) vznikne vykonaním jedinej ERO z matice (CCCl |dddl). Potom všetky sústavy CCCl · xxx = dddl majú tú istú množinu riešení, t. j. sú ekvivalentné. 3.3.2. Veta. Každá matica nad poľom K je riadkovo ekvivalentná s jednoznačne určenou maticou v redukovanom stupňovitom tvare. Dôkaz existencie a jednoznačnosti spomínanej matice odložíme do cvičení 3.12 a 3.13 (pozri tiež cvičenie 5.13). Zatiaľ sa radšej len na konkrétnych príkladoch naučíme, ako možno k danej matici AAA nájsť s ňou riadkovo ekvivalentnú maticu v redukovanom stupňovitom tvare. Takýto prístup má navyše tú výhodu, že z radu možných postupov, medzi ktorými si možno pružne voliť podľa okolností, nám nesugeruje jedinú stratégiu, na ktorú by sme sa nevyhnutne museli obmedziť pri všeobecnom dôkaze. Ambicióznejší čitateľ v uvedených príkladoch ľahko i sám zahliadne myšlienku všeobecného dôkazu, ktorú potom bude môcť uplatniť v cvičení 3.12. Napokon, aby sme sa nebavili iba o maticiach, začneme zakaždým s nejakou sústavou lineárnych rovníc. Tým sa zároveň naučíme riešiť ľubovoľnú sústavu lineárnych rovníc nad daným poľom Gaussovou-Jordanovou elimináciou, prípadne rozpoznať, že daná sústava nemá riešenie. 3.3.3. Príklad. Je daná sústava 2x1 + 3x2 − x4 = 1 3x1 + 2x2 + 4x3 − 2x4 = 0 x1 − x2 + 4x3 − x4 = 2 troch rovníc o štyroch neznámych nad poľom R. Jej rozšírená matica je   2 3 0 −1 3 2 4 −2 1 −1 4 −1 1 0 2   . Pri jej úprave na redukovaný stupňovitý tvar (podobne ako i v ďalších príkladoch) budeme vynechávať niektoré medzikroky a zaznamenáme len niektoré výsledky viacerých vykonaných ERO. Posledný riadok matice dáme na prvé miesto, potom jeho (−2)-násobok pripočítame k pôvodnému prvému riadku, ktorý posunieme na druhé miesto, a (−3)-násobok toho istého riadku pripočítame k pôvodnému druhému riadku, ktorý posunieme na tretie miesto. Dostaneme tak maticu   1 −1 4 −1 0 5 −8 1 0 5 −8 1 2 −3 −6   . 84 3. Sústavy lineárnych rovníc Pripočítaním (−1)-násobku druhého riadku k tretiemu dostaneme maticu   1 −1 4 −1 0 5 −8 1 0 0 0 0 2 −3 −3   . Už z tohto tvaru vidíme, že sústava zodpovedajúca poslednej matici nemá riešenie – obsahuje totiž rovnicu 0 = −3. Teda ani pôvodná sústava (hoci neznámych je v nej viac než rovníc) nemá riešenie. Z cvičných dôvodov však dokončíme úpravu na redukovaný stupňovitý tvar, ktorý dostaneme vynásobením tretieho riadku skalárom −1/3, pripočítaním (−2)-násobku resp. 3-násobku tohto nového riadku k prvému resp. druhému riadku a, konečne, vynásobením druhého riadku skalárom 1/5:   1 0 12/5 −4/5 0 1 −8/5 1/5 0 0 0 0 0 0 1   . Čitateľ by si mal všimnúť, že po nastavení vedúceho prvku niektorého riadku na hodnotu 1 okamžite pristupujeme k nulovaniu zvyšných prvkov stĺpca, v ktorom leží tento vedúci prvok. 3.3.4. Príklad. Riešme sústavu x + 2iy = 5 + 4i (3 − i)y + (6 − 2i)z = 10 2x − z = 5 + 3i x + y + z = 5 + 2i štyroch rovníc o troch neznámych nad poľom C. Jej rozšírená matica je     1 2i 0 0 3 − i 6 − 2i 2 0 −1 1 1 1 5 + 4i 10 5 + 3i 5 + 2i     . Prehoďme jej posledný riadok na prvé miesto a zvyšné riadky posuňme o jedno miesto nadol. V takto získanej matici pripočítajme (−1)-násobok prvého riadku k druhému riadku a (−2)-násobok prvého riadku k štvrtému riadku. Konečne vynásobme tretí riadok skalárom (3 + i)/10. Dostaneme maticu     1 1 1 0 −1 + 2i −1 0 1 2 0 −2 −3 5 + 2i 2i 3 + i −5 − i     . 3.3. Gaussova-Jordanova eliminačná metóda 85 (−1)-násobok tretieho riadku pripočítame k prvému riadku, jeho (1 − 2i)násobok k druhému a 2-násobok k štvrtému. Nakoniec výmenou druhého a tretieho riadku dostaneme maticu     1 0 −1 0 1 2 0 0 1 − 4i 0 0 1 2 + i 3 + i 5 − 3i 1 + i     . Pripočítajme posledný riadok k prvému, (−2)-násobok posledného riadku k druhému a jeho (−1 + 4i)-násobok k tretiemu. Zostáva vymeniť tretí a štvrtý riadok – výsledná matica je už v redukovanom stupňovitom tvare     1 0 0 0 1 0 0 0 1 0 0 0 3 + 2i 1 − i 1 + i 0     . Vidíme, že pôvodná sústava (hoci obsahuje viac rovníc než neznámych) má jediné riešenie x = 3 + 2i, y = 1 − i, z = 1 + i, teda presnejšie vektor (3 + 2i, 1 − i, 1 + i)T ∈ C3 . 3.3.5. Príklad. Uvažujme sústavu x1 + x2 + 2x3 + 3x4 = 0 2x1 + 4x3 = 0 x1 + 2x2 + x3 + 3x4 = 0 3x3 + 4x4 = 0 štyroch rovníc o štyroch neznámych nad poľom Z5. Keďže ide o homogénnu sústavu (ktorej ľavá strana je nulový stĺpcový vektor, teda sa nemení pri žiadnej ERO), stačí upravovať jej (nerozšírenú) maticu     1 1 2 3 2 0 4 0 1 2 1 3 0 0 3 4     . (−2)-násobok, t. j. 3-násobok prvého riadku pripočítame k druhému riadku a jeho (−1)-násobok, t. j. 4-násobok pripočítame k tretiemu riadku. Dostaneme tak 86 3. Sústavy lineárnych rovníc maticu     1 1 2 3 0 3 0 4 0 1 4 0 0 0 3 4     . (−1)-násobok, t. j. 4-násobok tretieho riadku pripočítame k prvému riadku a jeho (−3)-násobok, t. j. 2-násobok pripočítame k druhému riadku. Konečne výmenou druhého a tretieho riadku dostaneme maticu     1 0 3 3 0 1 4 0 0 0 3 4 0 0 3 4     . Tretí riadok odpočítame od prvého aj od štvrtého riadku. Ďalej ho vynásobíme skalárom 3−1 = 2. Napokon jeho (−4)-násobok, t. j. priamo tento nový tretí riadok pripočítame k druhému riadku. Výsledná matica je už v redukovanom stupňovitom tvare     1 0 0 4 0 1 0 3 0 0 1 3 0 0 0 0     . Premennú x4 si zvolíme za parameter. Všetky riešenia sústavy majú potom tvar x1 = t, x2 = 2t, x3 = 2t, x4 = t, kde t ∈ Z5. Vidíme teda, že pôvodná sústava (hoci počet jej rovníc je rovnaký ako počet neznámych) má viac než jedno riešenie; nie je ich však nekonečne veľa ale len 5. Práve toľko je totiž možných volieb parametra t, t. j. prvkov poľa Z5. Zaznamenajme ešte jeden očakávaný dôsledok tvrdenia 3.3.1, vety 3.3.2 a spôsobu, ako napísať riešenie sústavy s (rozšírenou) maticou v redukovanom stupňovitom tvare, uvedeného v paragrafe 3.2. 3.3.6. Tvrdenie. Nech AAA ∈ Km×n , bbb ∈ Km a m < n, t. j. sústavy AAA ·xxx = 0, AAA · xxx = bbb obsahujú menej rovníc než neznámych. Potom (a) homogénna sústava AAA·xxx = 0 má popri riešení xxx0 = 0 aspoň jedno riešenie xxx = 0; (b) ak existuje aspoň jedno riešenie sústavy AAA · xxx = bbb, tak táto sústava má viac než jedno riešenie. Dôkaz. (a) Upravme maticu sústavy AAA na redukovaný stupňovitý tvar BBB. Uvedomme si, že matice AAA aj BBB majú m riadkov a n stĺpcov. Riadky matice 3.4. Gaussova eliminačná metóda 87 BBB majú nanajvýš m vedúcich prvkov. Keďže m < n, aspoň v jednom stĺpci matice BBB neleží vedúci prvok žiadneho riadku. Nech je to napr. j-ty stĺpec. Potom voľbe parametra xj = t ∈ K, t = 0 zodpovedá aspoň jedno nenulové riešenie sústavy AAA · xxx = 0. (b) prenechávame ako cvičenie čitateľovi. 3.4 Gaussova eliminačná metóda Hlavne z historických dôvodov ešte stručne spomenieme metódu riešenia sústav lineárnych rovníc tzv. Gaussovou elimináciou. Pri riešení touto metódou upravíme rozšírenú maticu sústavy len na stupňovitý (teda nie nevyhnutne redukovaný stupňovitý) tvar. Už z tohto tvaru možno ľahko spoznať, či sústava má nejaké riešenie (príslušná matica nesmie obsahovať riadok tvaru (0, . . . , 0 | d), kde 0 = d ∈ K). V tom prípade možno všetky riešenia sústavy získať voľbou parametrov (opäť si za ne volíme neznáme xj také, že j-tom stĺpci sa nevyskytuje vedúci prvok žiadneho riadku) a spätným dosadzovaním, t. j. elimináciou neznámych pomocou parametrov. 3.4.1. Príklad. Predpokladajme, že rozšírenú maticu nejakej sústavy nad R sme už pomocou ERO upravili na stupňovitý tvar   0 2 3 0 −1 4 0 0 0 −2 5 4 0 0 0 0 3 1 1 0 4   . Táto matica zodpovedá sústave 2x2 + 3x3 − x5 + 4x6 = 1 − 2x4 + 5x5 + 4x6 = 0 3x5 + x6 = 4. Za parametre si zvolíme premenné x1, x3 a x6. Spätným dosadzovaním postupne dostaneme všetky riešenia v parametrickom tvare x6 = t x5 = 1 3 (4 − x6) = 4 3 − 1 3 t x4 = 1 2 (5x5 + 4x6) = 10 3 − 7 6 t x3 = s x2 = 1 2 (1 − 3x3 + x5 − 4x6) = 7 6 − 3 2 s − 13 6 t x1 = r, 88 3. Sústavy lineárnych rovníc kde r, s, t ∈ R. Prípadne, po trochu „šikovnejšej voľbe parametrov, v tvare x6 = 6t, x5 = 4 3 − 2t, x4 = 10 3 − 7t, x3 = 2s, x2 = 7 6 − 3s + 13t, x1 = r. Pozorný čitateľ si iste všimol, že spätné dosadzovanie možno nahradiť ďalšou úpravou rozšírenej matice sústavy pomocou ERO na redukovaný stupňovitý tvar. Stačí totiž vynásobiť nenulové riadky prevrátenými hodnotami ich vedúcich prvkov a pripočítaním vhodných násobkov týchto riadkov vynulovať zvyšné nenulové prvky v stĺpcoch obsahujúcich vedúce prvky jednotlivých riadkov. I tak však môže byť Gaussova eliminačná metóda v niektorých prípadoch užitočná – najmä keď nám nejde ani tak o explicitný tvar riešení, ako skôr o samotnú otázku riešiteľnosti sústavy, prípadne o počet parametrov, ktoré sa v nich vyskytujú. Všetko to možno totiž spoznať už na základe nejakej matice v stupňovitom tvare, riadkovo ekvivalentnej s pôvodnou rozšírenou maticou sústavy. V takom prípade si teda môžeme odpustiť nielen ďalšiu úpravu na redukovaný stupňovitý tvar, ale aj spätné dosadzovanie. Cvičenia 3.1. Podrobne prepočítajte sústavy lineárnych rovníc z príkladov 3.3.3 – 3.3.5 3.2. Gaussovou-Jordanovou elimináciou riešte sústavu lineárnych rovníc AAA · xxx = bbb nad poľom R pre matice: (a) AAA = 0 B @ 2 1 2 0 −6 1 0 0 2 −5 1 1 2 0 −3 0 1 2 0 1 1 C A, bbb = 4 1 1 2 ; (b) AAA = 3 −6 1 10 1 −2 1 4 2 −4 3 9 1 −2 0 3 , bbb = 6 3 2 2 . 3.3. Gaussovou-Jordanovou elimináciou riešte sústavu lineárnych rovníc AAA · xxx = bbb nad poľom C pre matice: (a) AAA = 1+i 0 i−1 2−i 1 1+i , bbb = 1−2i 0 ; (b) AAA = 1+2i 2−i 1−i 5i 5 3−i , bbb = 1 2+i . 3.4. Gaussovou-Jordanovou elimináciou riešte sústavu AAA · xxx = bbb lineárnych rovníc nad poľom Z11 pre matice: (a) AAA = 1 2 3 4 2 3 1 1 7 3 5 3 , bbb = 1 5 1 ; (b) AAA = 1 1 4 5 3 2 0 1 1 9 1 7 , bbb = 0. Pre každú sústavu určte počet jej riešení. 3.5. Riešte sústavy z cvičenia 3.4 nad poľom Z13 a opäť určte počet riešení každej z nich. 3.6. V paragrafe 3.2 definovaný (redukovaný) stupňovitý tvar matice by sme mohli presnejšie nazvať riadkovým (redukovaným) stupňovitým tvarom. Sformulujte definíciu stĺpcového (redukovaného) stupňovitého tvaru matice. Podrobne definujte elementárne stĺpcové operácie (ESO) typov I, II a III. 3.7. Nech AAA = (aij)m×n, BBB = (bbbik)m×p sú matice nad poľom K. Označme bbbk = sssk(BBB) k-ty stĺpec matice BBB. Uvažujme maticovú rovnicu AAA · XXX = BBB s neznámou maticou XXX = (xjk)n×p. Dokážte postupne nasledujúce tvrdenia: (a) Matica XXX ∈ Kn×p je riešením maticovej rovnice AAA · XXX = BBB práve vtedy, keď pre každé k ≤ p je jej k-ty stĺpec xxxk = sssk(XXX) riešením sústavy AAA · xxx = bbbk. (b) Maticová rovnica AAA · XXX = BBB má riešenie práve vtedy, keď každá zo sústav Cvičenia 89 AAA · xxx = bbbk (k = 1, . . . , p) má riešenie. Na základe (a) a (b) navrhnite metódu, ako možno úpravou vhodnej blokovej matice pomocou ERO riešiť naraz viacero sústav AAA · xxx = bbbk s rovnakou ľavou stranou a rôznymi pravými stranami bbb1, . . . ,bbbp. 3.8. Nech AAA = (aij)m×n, CCC = (ckj)q×n sú matice nad poľom K. S hromadným riešením akých sústav lineárnych rovníc súvisí riešenie maticovej rovnice YYY · AAA = CCC s neznámou maticou YYY = (yki)q×m? Navrhnite metódu založenú na úprave vhodnej blokovej matice pomocou ESO. Ako sa možno vyhnúť ESO a nahradiť ich ERO? 3.9. Riešte maticové rovnice AAA·XXX = BBB a YYY ·AAA = CCC pre matice AAA = ( 3 2 4 2 1 3 ), BBB = 1 3 −1 1 2 4 , CCC = ( 12 7 17 3 3 7 ) nad poľom Q. Určte najprv rozmery matíc XXX a YYY . Aké sústavy lineárnych rovníc ste takto vyriešili? Napíšte riešenie každej z nich (ak existuje). 3.10. Nad poľom R riešte sústavy lineárnych rovníc v neznámych x, y, z a urobte diskusiu počtu riešení vzhľadom na parametre a ∈ R resp. c, d ∈ R: (a) x + y + (2a2 − 1)z = a2 + a + 1, (b) cx + y + (c + 1)dz = c + 2d + 1, x + y + (a2 + a − 1)z = 1, cx + cdz = d + 1, x + a2 z = a2 + a; cy + 2cdz = 2c2 + cd − 1. 3.11. Nech K je pole a m, n ∈ N. Dokážte, že vzťah AAA ∼ BBB riadkovej ekvivalencie na množine Km×n spĺňa podmienky AAA ∼ AAA, AAA ∼ BBB ⇒ BBB ∼ AAA a AAA ∼ BBB & BBB ∼ CCC ⇒ AAA ∼ CCC pre ľubovoľné AAA,BBB,CCC ∈ Km×n . Inak povedané, tento vzťah je reflexívny, symetrický a tranzitívny, teda je naozaj reláciou ekvivalencie na množine KKKm×n (pozri paragraf 0.6). Sformulujte analogický výsledok pre vzťah stĺpcovej ekvivalencie AAA BBB. 3.12. Dokážte vetu 3.3.2 matematickou indukciou podľa počtu riadkov matice. (Návod: Ukážte, že matica s jediným riadkom je riadkovo ekvivalentná s maticou v redukovanom stupňovitom tvare. Predpokladajte, že matica AAA vznikla z matice v redukovanom stupňovitom tvare pridaním jedného riadku. Ukážte, že aj AAA je riadkovo ekvivalentná s maticou v redukovanom stupňovitom tvare.) 3.13. Dokážte jednoznačnosť redukovaného stupňovitého tvaru matice. Presnejšie, dokážte, že pre matice AAA, BBB ∈ Km×n v redukovanom stupňovitom tvare platí AAA ∼ BBB ⇒ AAA = BBB. (Návod: Ak AAA, BBB sú v redukovanom stupňovitom tvare a AAA = BBB, ukážte, že homogénne sústavy lineárnych rovníc nemajú rovnaké riešenia; to je však spor s AAA ∼ BBB.) 3.14. Dokážte zosilnenie tvrdenia 3.3.1 do podoby ekvivalencie, t. j. pre ľubovoľné AAA, BBB ∈ Km×n , bbb,ccc ∈ Km platí: sústavy AAA · xxx = bbb a BBB · xxx = ccc sú ekvivalentné práve vtedy, keď (AAA |bbb) ∼ (BBB |ccc). 3.15. Dokážte tvrdenie 3.3.6(b). 4. Lineárne podpriestory a lineárna nezávislosť V tejto kapitole sa opäť vrátime k štúdiu abstraktných vektorových priestorov nad všeobecným poľom. K bude v celej kapitole označovať nejaké pevné, inak ľubovoľné pole a V bude nejaký pevne zvolený vektorový priestor nad K. Čitateľ sa však nedopustí nijakej chyby, ak si pod všeobecným poľom K bude predstavovať pole R všetkých reálnych čísel. Zakaždým, keď sa budeme odvolávať na geometrický názor, bude to dokonca užitočné. Na druhej strane by však nemal spúšťať zo zreteľa, že naše úvahy majú podstatne širšiu platnosť – okrem vektorových priestorov nad R sa z nám známych príkladov vzťahujú tak na vektorové priestory nad poľom C všetkých komplexných čísel, poľom Q všetkých racionálnych čísel ako i na vektorové priestory nad konečnými poľami Zp. 4.1 Lineárne podpriestory vektorového priestoru Množina S ⊆ V sa nazýva lineárny podpriestor vektorového priestoru V , ak S = ∅ a pre všetky skaláry a ∈ K a vektory xxx,yyy ∈ S platí axxx ∈ S a xxx+yyy ∈ S. Inak povedané, neprázdna podmnožina S ⊆ V je lineárny podpriestor práve vtedy, keď je uzavretá na operácie skalárneho násobku a súčtu vektorov. Nasledujúce tvrdenie je bezprostredným dôsledkom práve vyslovenej de- finície. 4.1.1. Tvrdenie. Nech S je lineárny podpriestor vektorového priestoru V . Potom 0 ∈ S a S s operáciami súčtu vektorov a skalárneho násobku zúženými z V na S tvorí vektorový priestor nad poľom K. V každom vektorovom priestore V sú {0} a V lineárne podpriestory (v prípade, keď V = {0}, dokonca splývajú, inak ide o dva rôzne podpriestory) – {0} nazývame triválny alebo tiež nulový a V nevlastný alebo tiež plný lineárny podpriestor. Teda pre vlastný netriviálny lineárny podpriestor S ⊆ V platí {0} = S = V . Napr. vo vektorovom priestore R3 netriviálne vlastné podpriestory sú práve všetky priamky a roviny prechádzajúce počiatkom 0. Nasledujúce tvrdenie charakterizuje lineárne podpriestory ako množiny uzavreté na lineárne kombinácie. 4.1.2. Tvrdenie. Pre ľubovoľnú podmnožinu S vektorového priestoru V nasledujúce podmienky sú ekvivalentné: 4.1. Lineárne podpriestory vektorového priestoru 91 (i) S je lineárny podpriestor vo V ; (ii) S = ∅ a pre všetky skaláry a, b ∈ K a vektory xxx,yyy ∈ S platí axxx+byyy ∈ S; (iii) pre každé n ∈ N a pre všetky skaláry a1, . . . , an ∈ K a vektory xxx1, . . . ,xxxn ∈ S platí a1xxx1 + . . . + anxxxn ∈ S. Dôkaz. Postupne dokážeme implikácie (i) ⇒ (ii), (ii) ⇒ (iii) a (iii) ⇒ (i). (i) ⇒ (ii): Ak S je lineárny podpriestor, tak S = ∅. Nech a, b ∈ K, xxx,yyy ∈ S. Keďže S je uzavreté na skalárne násobky, platí axxx, byyy ∈ S. Z uzavretosti S na súčet vyplýva axxx + byyy ∈ S. (ii) ⇒ (iii): Nech platí (ii). Keďže S = ∅, existuje sss ∈ S. Potom 0 = 0sss+0sss ∈ S a tiež axxx = axxx+0sss ∈ S pre každé a ∈ K, xxx ∈ S. Teda podmienka z (iii) je splnená pre n = 0 (lebo prázdna lineárna kombinácia je 0) a n = 1; podľa (ii) je splnená tiež pre n = 2. Keby nebola splnená pre všetky n ∈ N, označíme n najmenšie prirodzené číslo s touto vlastnosťou. Potom n > 2 a pre všetky k < n podmienka z (iii) platí. Nech a1, . . . , an ∈ K, xxx1, . . . ,xxxn ∈ S sú také, že a1xxx1 + . . . + anxxxn /∈ S. Avšak a1xxx1 + . . . + anxxxn = (a1xxx1 + . . . + an−1xxxn−1) + anxxxn ∈ S, keďže pre prirodzené čísla n − 1 a 2 podmienka z (iii) platí. To je spor. (iii) ⇒ (i): Z platnosti (iii) pre n = 0 vyplýva, že 0 ∈ S (prázdna lineárna kombinácia je totiž 0). Teda S = ∅. Voľbou n = 1 dostávame uzavretosť S na skalárne násobky. Uzavretosť S na súčet vyplýva z voľby n = 2, a1 = a2 = 1. 4.1.3. Príklad. Keďže s príkladmi lineárnych podpriestorov vektorových priestorov Kn sa ešte stretneme pri mnohých príležitostiach, uvedieme tu niekoľko „exotickejších príkladov. Napospol pôjde o podpriestory priestorov V X všetkých funkcií z ľubovoľnej množiny X do nejakého vektorového priestoru V nad poľom K; špeciálne môže ísť o prípad V = K (pozri príklad 1.6.5). (a) Označme V (X) množinu všetkých funkcií f : X → V takých, že množina {x ∈ X; f(x) = 0} je konečná. Pre ľubovoľnú lineárnu kombináciu funkcií f, g ∈ V X platí {x ∈ X; af(x) + bg(x) = 0} ⊆ {x ∈ X; f(x) = 0} ∪ {x ∈ X; g(x) = 0}. Z toho vyplýva, že V (X) je lineárny podpriestor vektorového priestoru V X . Ak X je konečná, tak V (X) = V X ; ak X je nekonečná, tak V (X) je netriválny vlastný podpriestor v V X . (b) Nech X ⊆ R je ľubovoľná množina reálnych čísel. Potom C(X, R), alebo len stručne C(X) označuje množinu všetkých spojitých funkcií f : X → R. Keďže lineárne kombinácie spojitých funkcií sú zrejme opäť spojité funkcie, 92 4. Lineárne podpriestory a lineárna nezávislosť C(X) je lineárny podpriestor v RX . (c) Ak X je nejaký (ohraničený alebo neohraničený) interval reálnych čísel, tak D(X) označuje množinu všetkých funkcií f : X → R, ktoré majú v každom bode x ∈ X konečnú deriváciu (v prípadných krajných bodoch intervalu X sa žiada existencia konečnej derivácie zľava alebo sprava). Keďže každá diferencovateľná funkcia je spojitá na svojom definičnom obore a lineárna kombinácia diferencovateľných funkcií je opäť diferencovateľná, D(X) je lineárny podpriestor vektorového priestoru C(X). 4.2 Lineárny obal množiny vektorov Množinu všetkých lineárnych kombinácií vektorov z podmnožiny X vektorového priestoru V nazývame lineárnym obalom množiny X a označujeme ju [X]. Teda [X] = {a1xxx1 + . . . + anxxxn; n ∈ N & a1, . . . , an ∈ K & xxx1, . . . ,xxxn ∈ X}. Ak X = {xxx1, . . . ,xxxn} je konečná množina, tak miesto [{xxx1, . . . ,xxxn}] píšeme len [xxx1, . . . ,xxxn]. Zrejme tento zápis má zmysel aj pre ľubovoľnú usporiadanú n-ticu (nie nutne rôznych) vektorov (xxx1, . . . ,xxxn), a platí [xxx1, . . . ,xxxn] = {a1xxx1 + . . . + anxxxn; a1, . . . , an ∈ K}. 4.2.1. Tvrdenie. Nech X je podmnožina vektorového priestoru V . Potom lineárny obal [X] množiny X je najmenší lineárny podpriestor vektorového priestoru V taký, že X ⊆ [X]. Dôkaz. Musíme dokázať dve veci: (a) [X] je lineárny podpriestor vo V ; (b) pre každý lineárny podpriestor S ⊆ V platí X ⊆ S ⇒ [X] ⊆ S. (a) Zrejme [X] obsahuje 0 ako prázdnu lineárnu kombináciu, teda [X] = ∅. Nech c, d ∈ K a uuu = a1xxx1 + . . . + anxxxn, vvv = b1yyy1 + . . . + bmyyym sú prvky z [X], pričom ai, bj ∈ K, xxxi,yyyj ∈ X. Potom cuuu + dvvv = ca1xxx1 + . . . + canxxxn + db1yyy1 + . . . + dbmyyym ∈ [X], keďže je to opäť lineárna kombinácia vektorov z X. Podľa podmienky (ii) tvrdenia 4.1.2 je [X] lineárny podpriestor vo V . (b) Nech S ⊆ V je lineárny podpriestor taký, že X ⊆ S. Potom podľa podmienky (iii) tvrdenia 4.1.2 všetky lineárne kombinácie vektorov z S, a tým skôr vektorov z X, patria do S. Teda [X] ⊆ S. Dokázané tvrdenie nás oprávňuje nazývať lineárny obal [X] množiny X ⊆ V tiež lineárnym podpriestorom generovaným množinou X. Ak [X] = S, 4.3. Prienik a súčet lineárnych podpriestorov 93 hovoríme, že X generuje lineárny podpriestor S, prípadne že X je generujúca množina alebo tiež množina generátorov lineárneho podpriestoru S ⊆ V . Ak S = V , t. j. ak [X] = V , hovoríme krátko o generujúcej množine. Používa sa tiež názov vytvárajúca množina. Kvôli prehľadnosti ešte zhrnieme základné vlastnosti operácie lineárneho obalu X → [X]. 4.2.2. Tvrdenie. Pre ľubovoľné podmnožiny X, Y vektorového priestoru V a vvv ∈ V platí: (a) [∅] = [0] = {0}; (b) X ⊆ [X]; (c) X ⊆ Y ⇒ [X] ⊆ [Y ]; (d) X je lineárny podpriestor vo V práve vtedy, keď X = [X]; (e) [[X]] = [X]; (f) vvv ∈ [X] ⇔ [X ∪ {vvv}] = [X]. Dôkaz. (a), (b) a (c) sú triviálne, (d) priamo vyplýva z tvrdenia 4.2.1 a (e) je bezprostredným dôsledkom (d). (f) Nech vvv ∈ [X]. S použitím (b), (c) a (e) dostávame [X ∪ {vvv}] ⊆ [[X] ∪ {vvv}] = [[X]] = [X]. Teda [X ∪ {vvv}] = [X]. Keďže vvv ∈ [X ∪ {vvv}], obrátená implikácia je triviálna. 4.3 Prienik a súčet lineárnych podpriestorov Nech X, Y sú ľubovoľné podmnožiny vektorového priestoru V . Potom mno- žinu X + Y = {xxx + yyy; xxx ∈ X & yyy ∈ Y } nazývame súčtom množín X, Y . 4.3.1. Tvrdenie. Nech S, T sú lineárne podpriestory vektorového priestoru V . Potom aj S ∩ T a S + T sú lineárne podpriestory vo V . Navyše platí S + T = [S ∪ T], t. j. S + T je najmenší lineárny podpriestor vo V , ktorý obsahuje S aj T. Dôkaz. Zrejme 0 ∈ S ∩ T. Z toho, že S aj T sú uzavreté na lineárne kombinácie, vyplýva, že aj S ∩ T má túto vlastnosť. 94 4. Lineárne podpriestory a lineárna nezávislosť Dokážeme, že aj S+T je uzavreté na lineárne kombinácie. Nech a1, a2 ∈ K a uuu1 = xxx1 +yyy1, uuu2 = xxx2 +yyy2 sú vektory z S +T, pričom xxx1,xxx2 ∈ S, yyy1,yyy2 ∈ T. Potom a1uuu1 + a2uuu2 = a1(xxx1 + yyy1) + a2(xxx2 + yyy2) = (a1xxx1 + a2xxx2) + (a1yyy1 + a2yyy2) ∈ S + T, lebo S, T sú lineárne podpriestory, teda a1xxx1 + a2xxx2 ∈ S a a1yyy1 + a2yyy2 ∈ T. Dokážeme poslednú rovnosť. Inklúzie S ∪ T ⊆ S + T ⊆ [S ∪ T] sú zrejmé. Keďže S + T je lineárny podpriestor vo V a [S ∪ T] je najmenší lineárny podpriestor vo V , ktorý obsahuje množinu S ∪ T, platí tiež [S ∪ T] ⊆ S + T. Na druhej strane čitateľ iste ľahko nájde príklady na to, že zjednotenie dvoch lineárnych podpriestorov S, T vektorového priestoru V nemusí byť lineárnym podpriestorom. Presnejšie, S ∪ T je lineárny podpriestor vo V práve vtedy, keď S ⊆ T alebo T ⊆ S. Porozmýšľajte prečo. Každý prvok zzz ∈ S + T súčtu lineárnych podpriestorov S, T ⊆ V možno vyjadriť v tvare zzz = xxx + yyy pre nejaké xxx ∈ S, yyy ∈ T. Vo všeobecnosti to však možno urobiť viacerými spôsobmi. Súčet lineárnych podpriestorov S, T vektorového priestoru V nazývame priamym alebo tiež direktným súčtom, ak každé zzz ∈ S + T možno jednoznačne vyjadriť v tvare zzz = xxx + yyy, kde xxx ∈ S, yyy ∈ T; takýto súčet zvykneme tiež označovať S ⊕ T. 4.3.2. Tvrdenie. Nech S, T sú lineárne podpriestory vektorového priestoru V . Potom nasledujúce podmienky sú ekvivalentné: (i) S + T = S ⊕ T, t. j. súčet S + T je direktný; (ii) S ∩ T = {0}. Dôkaz. (i) ⇒ (ii): Nech zzz ∈ S ∩ T. Potom zzz možno vyjadriť v tvare zzz = zzz + 0, kde zzz ∈ S, 0 ∈ T, ako aj v tvare zzz = 0 + zzz, kde 0 ∈ S, zzz ∈ T. Z predpokladanej jednoznačnosti vyplýva zzz = 0. Teda S ∩ T = {0}. (ii) ⇒ (i): Nech S ∩T = {0}. Predpokladajme, že vektor zzz ∈ S +T možno vyjadriť v tvaroch zzz = xxx1 + yyy1 = xxx2 + yyy2, kde xxx1,xxx2 ∈ S, yyy1,yyy2 ∈ T. Potom xxx1 −xxx2 = yyy2 −yyy1. Keďže xxx1 −xxx2 ∈ S, yyy2 −yyy1 ∈ T, uvedená spoločná hodnota patrí do S∩T. Preto xxx1 −xxx2 = yyy2 −yyy1 = 0, t. j. xxx1 = xxx2, yyy1 = yyy2. To dokazuje požadovanú jednoznačnosť. Uvedenú definíciu možno zrejmým spôsobom zovšeobecniť na priamy súčet ľubovoľného konečného počtu lineárnych podpriestorov. Zodpovedajúce zovšeobecnenie podmienky (ii) z práve dokázaného tvrdenia však už celkom priamočiare nie je. Podrobnosti nájde čitateľ v cvičení 4.8. 4.4 Lineárna nezávislosť Nech uuu1, . . . ,uuun ∈ V . Hovoríme, že usporiadaná n-tica vektorov (uuu1, . . . ,uuun) je lineárne závislá, ak existujú skaláry c1, . . . , cn ∈ K také, že (c1, . . . , cn) = 0 4.4. Lineárna nezávislosť 95 a c1uuu1 + . . . + cnuuun = 0. V opačnom prípade hovoríme, že usporiadaná n-tica vektorov (uuu1, . . . ,uuun) je lineárne nezávislá. Pre n = 0 kvôli úplnosti dodávame, že usporiadanú 0-ticu (t. j. prázdnu postupnosť) vektorov považujeme za lineárne nezávislú. Miesto „lineárne (ne)závislá usporiadaná n-tica vektorov (uuu1, . . . ,uuun) budeme často hovoriť len o lineárne (ne)závislých vektoroch uuu1, . . . ,uuun. Rozmeňme si teraz „na drobné , čo znamená ono „v opačnom prípade v definícii lineárnej nezávislosti. Podľa tejto definície vektory uuu1, . . . ,uuun sú lineárne nezávislé práve vtedy, keď (∀ c1, . . . , cn ∈ K)(c1uuu1 + . . . + cnuuun = 0 ⇒ c1 = . . . = cn = 0). Vidíme, že logická štruktúra pojmu lineárnej nezávislosti je trochu zložitejšia, než sme boli doteraz zvyknutí. Keďže ide o kľúčový pojem, je potrebné sa pri ňom na chvíľu pristaviť. Uvedomme si, že pre n-ticu skalárov (c1, . . . , cn) = 0 platí c1uuu1 + . . . + cnuuun = 0 pre ľubovoľnú n-ticu vektorov (uuu1, . . . ,uuun), bez ohľadu na to, či je lineárne závislá alebo nezávislá. Avšak pre niektoré n-tice vektorov (uuu1, . . . ,uuun) môžeme ako výsledok lineárnej kombinácie c1uuu1+. . .+cnuuun dostať 0 aj pomocou inej n-tice skalárov (c1, . . . , cn) než len 0 = (0, . . . , 0) – takéto usporiadané n-tice (uuu1, . . . ,uuun) nazývame lineárne závislé. Pre niektoré usporiadané n-tice vektorov (uuu1, . . . ,uuun) je voľba (c1, . . . , cn) = 0 jediná možnosť ako lineárnou kombináciou c1uuu1 + . . . + cnuuun získať výsledok 0 – takéto usporiadané n-tice nazývame lineárne nezávislé. Na precvičenie práve definovaných pojmov čitateľovi odporúčame, aby si dokázal štyri jednoduché no užitočné pozorovania: (a) jediný vektor uuu je lineárne nezávislý práve vtedy, keď uuu = 0; (b) vektory uuu, vvv sú lineárne závislé práve vtedy, keď jeden z nich je násobkom druhého; (c) ak niektorý z vektorov uuu1, . . . ,uuun je 0, tak tieto vektory sú lineárne závislé; (d) ak sa niektoré dva z vektorov uuu1, . . . ,uuun rovnajú alebo niektorý z nich je násobkom iného, tak tieto vektory sú lineárne závislé. Inak povedané, len usporiadaná n-tica nenulových a navzájom rôznych vektorov, z ktorých žiaden nie je násobkom druhého, môže (no stále ešte nemusí) byť lineárne nezávislá. Nasledujúce tvrdenie asi vysvetľuje názov „lineárna závislosť lepšie než samotná definícia. 4.4.1. Tvrdenie. Pre ľubovoľné n ∈ N a uuu1, . . . ,uuun ∈ V nasledujúce podmienky sú ekvivalentné: (i) vektory uuu1, . . . ,uuun sú lineárne závislé; 96 4. Lineárne podpriestory a lineárna nezávislosť (ii) niektorý z vektorov uuuk, k ≤ n, je lineárnou kombináciou predchádzajú- cich; (ii’) niektorý z vektorov uuuk, k ≤ n, je lineárnou kombináciou nasledujúcich; (iii) niektorý z vektorov uuuk, k ≤ n, je lineárnou kombináciou ostatných. Dôkaz. Dokážeme implikácie (i) ⇒ (ii) ⇒ (iii) a (iii) ⇒ (i). Rovnako by bolo možné dokázať aj implikácie (i) ⇒ (ii’) ⇒ (iii). (i) ⇒ (ii): Nech uuu1, . . . ,uuun sú lineárne závislé vektory a c1, . . . , cn sú skaláry, nie všetky rovné 0, také, že c1uuu1 + . . . + cnuuun = 0. Nech k je najväčší z indexov 1, . . . , n taký, že ck = 0. Potom ci = 0 pre k < i ≤ n, teda c1uuu1 + . . . + ckuuuk = n i=1 ciuuui = 0. Z toho dostávame uuuk = c−1 k (c1uuu1 + . . . + ck−1uuuk−1), t. j. uuuk je lineárnou kombináciou predchádzajúcich vektorov. (ii) ⇒ (iii) platí triválne. (iii) ⇒ (i): Ak uuuk = n i=1 i=k ciuuui je lineárnou kombináciou ostatných vektorov, položme ck = −1. Potom pre n-ticu skalárov (c1, . . . , cn) = 0 platí c1uuu1 + . . . + cnuuun = 0, teda vektory uuu1, . . . ,uuun sú lineárne závislé. Poznámka. Všimnite si, že dôkaz implikácie (i) ⇒ (ii) pokrýva aj prípad k = 1. Vtedy c1 = 0 a c1uuu1 = 0, preto tiež uuu1 = 0. Teda uuu1 je naozaj lineárnou kombináciou predchádzajúcich (t. j. prázdnej postupnosti) vektorov. Každý vektor xxx z lineárneho obalu [uuu1, . . . ,uuun] možno vyjadriť v tvare xxx = c1uuu1 + . . . + cnuuun pre nejakú n-ticu skalárov (c1, . . . , cn). Nasledujúce tvrdenie ukazuje, že lineárna nezávislosť vektorov uuu1, . . . ,uuun je ekvivalentná s jednoznačnosťou tohto vyjadrenia. 4.4.2. Veta. Vektory uuu1, . . . ,uuun sú lineárne nezávislé práve vtedy, keď každý vektor xxx ∈ [uuu1, . . . ,uuun] možno vyjadriť v tvare xxx = c1uuu1 +. . .+cnuuun pre jedinú usporiadanú n-ticu (c1, . . . , cn) ∈ Kn . Dôkaz. Nech uuu1, . . . ,uuun sú lineárne nezávislé vektory. Predpokladajme, že vektor xxx ∈ [uuu1, . . . ,uuun] možno vyjadriť v tvaroch xxx = c1uuu1 + . . . + cnuuun = d1uuu1 + . . . + dnuuun, kde (c1, . . . , cn), (d1, . . . , dn) ∈ Kn . Potom (c1 − d1)uuu1 + . . . + (cn − dn)uuun = 0. 4.4. Lineárna nezávislosť 97 Z lineárnej nezávislosti vektorov uuu1, . . . ,uuun vyplýva c1 −d1 = . . . = cn −dn = 0, čiže (c1, . . . , cn) = (d1, . . . , dn). Teda vyjadrenie vektora xxx v tvare lineárnej kombinácie vektorov uuu1, . . . ,uuun je jednoznačné. Predpokladajme teraz, že každý vektor xxx ∈ [uuu1, . . . ,uuun] má jednoznačné vyjadrenie v tvare lineárnej kombinácie vektorov uuu1, . . . ,uuun. Špeciálne to platí aj pre vektor xxx = 0, ktorý má vyjadrenie 0 = 0uuu1+. . .+0uuun. Z jednoznačnosti tohto vyjadrenia vyplýva c1uuu1 + . . . + cnuuun = 0 ⇒ c1 = . . . = cn = 0 pre ľubovoľnú n-ticu skalárov (c1, . . . , cn). Teda vektory uuu1, . . . ,uuun sú lineárne nezávislé. Nasledujúce tvrdenie dáva do súvislosti lineárnu (ne)závislosť s lineárnym obalom. 4.4.3. Tvrdenie. Nech uuu1, . . . ,uuun,vvv ∈ V pričom vektory uuu1, . . . ,uuun sú lineárne nezávislé. Potom nasledujúce podmienky sú ekvivalentné: (i) vvv ∈ [uuu1, . . . ,uuun]; (ii) vektory uuu1, . . . ,uuun,vvv sú lineárne závislé; (iii) [uuu1, . . . ,uuun,vvv] = [uuu1, . . . ,uuun]. Dôkaz. (i) ⇒ (ii): Ak vvv ∈ [uuu1, . . . ,uuun] tak vektory uuu1, . . . ,uuun,vvv sú lineárne závislé podľa tvrdenia 4.4.1 (ii) ⇒ (iii): Nech vektory uuu1, . . . ,uuun,vvv sú lineárne závislé. Potom niektorý z nich je lineárnou kombináciou predchádzajúcich. Keďže vektory uuu1, . . . ,uuun sú lineárne nezávislé, môže to byť len vektor vvv. Teda vvv ∈ [uuu1, . . . ,uuun]. (iii) ⇒ (i) je obsiahnuté v bode (f) tvrdenia 4.2.2 4.4.4. Veta. Nech uuu1, . . . ,uuun,vvv1, . . . ,vvvm ∈ V , pričom vektory uuu1, . . . ,uuun sú lineárne nezávislé. Potom z množiny {1, . . . , m} možno vybrať indexy i1 < . . . < ik tak, že vektory uuu1, . . . ,uuun,vvvi1 , . . . ,vvvik sú lineárne nezávislé a generujú rovnaký podpriestor ako vektory uuu1, . . . ,uuun,vvv1, . . . ,vvvm. Dôkaz. Označme X = {vvv1, . . . ,vvvm}. Vektory vvvi1 , . . . ,vvvik vyberieme z množiny X nasledujúcim spôsobom. Ak X ⊆ [uuu1, . . . ,uuun], položme k = 0, t. j. nevyberieme žiaden z nich. V opačnom prípade nech vvvi1 je prvý z vektorov množiny X, ktorý neleží v podpriestore [uuu1, . . . ,uuun]. Ak X ⊆ [uuu1, . . . ,uuun,vvvi1 ], tak k = 1 a vvvi1 je jediný vybraný vektor. Podľa predchádzajúceho tvrdenia sú vektory uuu1, . . . ,uuun,vvvi1 lineárne nezávislé. Ak X ⊆ [uuu1, . . . ,uuun,vvvi1 ], označíme vvvi2 prvý vektor množiny X, ktorý neleží v [uuu1, . . . ,uuun,vvvi1 ] (zrejme i1 < i2 a vvvi1 = vvvi2 ). Vektory uuu1, . . . ,uuun,vvvi1 ,vvvi2 sú podľa tvrdenia 4.4.3 opäť lineárne nezávislé. Podľa potreby pokračujeme rovnakým spôsobom, až kým pre takto získané lineárne nezávislé vektory uuu1, . . . ,uuun,vvvi1 , . . . ,vvvik neplatí inklúzia X ⊆ [uuu1, . . . ,uuun,vvvi1 , . . . ,vvvik ], kedy sa zastavíme. (V krajnom prípade 98 4. Lineárne podpriestory a lineárna nezávislosť dostaneme k = m, t. j. vyberieme všetky vektory z množiny X.) Z uvedenej inklúzie okamžite vyplýva rovnosť [uuu1, . . . ,uuun,vvv1, . . . ,vvvm] = [uuu1, . . . ,uuun,vvvi1 , . . . ,vvvik ], keďže každý z generátorov podpriestoru na ľavej strane je prvkom podpriestoru na pravej strane. 4.5 Lineárny obal a lineárna nezávislosť v priestoroch Km V tomto paragrafe si ukážeme, ako možno na základe našich doterajších znalostí o sústavách lineárnych rovníc tou istou metódou úpravy matíc pomocou ERO na (redukovaný) stupňovitý tvar riešiť pre vektory z priestoru Km nasledujúce tri otázky: (1) rozhodnúť pre dané vektory xxx1, . . . ,xxxn,yyy ∈ Km či yyy patrí alebo nepatrí do lineárneho obalu [xxx1, . . . ,xxxn]; (2) rozhodnúť pre dané vektory xxx1, . . . ,xxxn ∈ Km či sú lineárne závislé alebo nezávislé; (3) vybrať z vektorov xxx1, . . . ,xxxn ∈ Km lineárne nezávislé vektory xxxj1 , . . . ,xxxjk (j1 < . . . < jk) tak, aby vektory xxxj1 , . . . ,xxxjk generovali vo V ten istý lineárny podpriestor ako vektory xxx1, . . . ,xxxn. Hoci všetky tri otázky možno riešiť naraz jednotným spôsobom, z metodických dôvodov začneme jednoduchšími otázkami (1) a (2), a až potom pristúpime k trochu zložitejšej otázke (3). Navyše pri tom zavedieme označenie, ktorého sa budeme držať v celom paragrafe. Nech xxx1, . . . ,xxxn,yyy ∈ Km sú stĺpcové vektory, pričom xxxj =   x1j ... xmj   , yyy =   y1 ... ym   . Označme XXX = (xij) ∈ Km×n maticu so stĺpcami xxx1, . . . ,xxxn, a (XXX |yyy) ∈ Km×(n+1) blokovú maticu zloženú z matice XXX a vektora yyy. Potom pre ccc = (c1, . . . , cn)T ∈ Kn platí: (1) c1xxx1 + . . . + cnxxxn = yyy ⇔ XXX · ccc = yyy; (2) c1xxx1 + . . . + cnxxxn = 0 ⇔ XXX · ccc = 0. Inak povedané: (1) yyy ∈ [xxx1, . . . ,xxxn] práve vtedy, keď sústava XXX · ccc = yyy s rozšírenou maticou (XXX |yyy) má aspoň jedno riešenie; (2) vektory xxx1, . . . ,xxxn sú lineárne nezávislé práve vtedy, keď homogénna sústava XXX ·ccc = 0 má jediné riešenie ccc = 0; ak táto sústava má aj nejaké nenulové riešenie, tak vektory xxx1, . . . ,xxxn sú lineárne závislé. (Nedajte sa spliesť atypickým označením: xij sú teraz koeficienty sústavy, yi sú zložky pravej strany a cj sú neznáme.) 4.5. Lineárny obal a lineárna nezávislosť v priestoroch Km 99 Otázku (1) už vieme riešiť. Stačí pomocou ERO upraviť maticu (XXX |yyy) na stupňovitý tvar. Ak výsledná matica obsahuje riadok tvaru (0, . . . , 0 | z), kde z = 0, tak sústava XXX ·ccc = yyy nemá riešenie a yyy /∈ [xxx1, . . . ,xxxn]. Ak sa taký riadok vo výslednej matici nenachádza, tak sústava má aspoň jedno riešenie a yyy ∈ [xxx1, . . . ,xxxn]. Podobne je to s otázkou (2). Opäť stačí pomocou ERO upraviť maticu XXX na stupňovitý tvar a pozrieť sa, či v každom stĺpci leží vedúci prvok nejakého riadku. Ak je to tak, niet čo voliť za parametre, ccc = 0 je jediným riešením sústavy XXX · ccc = 0 a vektory xxx1, . . . ,xxxn sú lineárne nezávislé. V opačnom prípade máme možnosť voľby aspoň jedného parametra, sústava má aj nejaké nenulové riešenie a vektory xxx1, . . . ,xxxn sú lineárne závislé. Ešte si všimnime úzku súvislosť oboch otázok. Vedúcim prvkom riadku (0, . . . , 0 | z), kde z = 0, je práve v (n + 1)-om stĺpci ležiaci prvok z. Teda matica v stupňovitom tvare riadkovo ekvivalentná s (XXX |yyy) neobsahuje taký riadok práve vtedy, keď v jej poslednom stĺpci neleží vedúci prvok žiadneho riadku. 4.5.1. Príklad. Uvažujme stĺpcové vektory xxx1 = (1, 1, −1, −1)T , xxx2 = (0, 1, 0, 1)T , xxx3 = (3, 1, −3, −5)T , xxx4 = (0, 0, 1, 2)T , yyy = (3, 5, −2, 1)T , zzz = (1, 1, 1, 1)T v priestore R4 . Máme rozhodnúť, či vektory yyy, zzz patria do lineárneho obalu [xxx1,xxx2,xxx3,xxx4]. Označme si nasledujúce matice (XXX |yyy) =     1 0 3 0 1 1 1 0 −1 0 −3 1 −1 1 −5 2 3 5 −2 1     , (XXX |zzz) =     1 0 3 0 1 1 1 0 −1 0 −3 1 −1 1 −5 2 1 1 1 1     . Matice (XXX |yyy), (XXX |zzz) sú riadkovo ekvivalentné s maticami     1 0 3 0 0 1 −2 0 0 0 0 1 0 0 0 0 3 2 1 0     resp.     1 0 3 0 0 1 −2 0 0 0 0 1 0 0 0 0 1 0 2 −2     . Okamžite vidíme, že platí yyy ∈ [xxx1,xxx2,xxx3,xxx4] a zzz /∈ [xxx1,xxx2,xxx3,xxx4]. 4.5.2. Príklad. Zistíme, či stĺpce reálnej matice XXX =     2 0 1 3 2 1 2 3 0 2 3 2 1 2 4 2     100 4. Lineárne podpriestory a lineárna nezávislosť sú lineárne závislé alebo nezávislé. Táto matica je riadkovo ekvivalentná s maticou     1 2 4 2 0 1 1 0 0 0 1 2 0 0 0 5     . Vidíme, že stĺpce matice XXX sú lineárne nezávislé. Na druhej strane, ako matica nad poľom Z5 je XXX riadkovo ekvivalentná s maticou     1 2 4 2 0 1 3 4 0 0 3 1 0 0 0 0     . Teda stĺpce matice XXX, chápané ako vektory z vektorového priestoru Z4 5, sú lineárne závislé. Kľúčom k odpovedi na otázku (3) je nasledujúce tvrdenie. 4.5.3. Tvrdenie. Nech XXX, YYY ∈ Km×n sú riadkovo ekvivalentné matice, pričom matica YYY je v stupňovitom tvare. Pre 1 ≤ j ≤ n označme xxxj = sssj(XXX) j-ty stĺpec matice XXX. Nech j1 < . . . < jk sú indexy všetkých stĺpcov matice YYY , v ktorých ležia vedúce prvky jej riadkov. Potom platí: (a) vektory xxxj1 , . . . ,xxxjk sú lineárne nezávislé; (b) ak v j-tom stĺpci matice YYY neleží vedúci prvok žiadneho jej riadku (t. j. 1 ≤ j ≤ n a j = j1, . . . , jk), tak vektor xxxj je lineárnou kombináciou vektorov xxxj1 , . . . ,xxxjl , kde l ≤ k je najväčší index, pre ktorý platí jl < j; (c) [xxxj1 , . . . ,xxxjk ] = [xxx1, . . . ,xxxn]. Dôkaz. (a) Označme XXX , YYY matice, ktoré pozostávajú len zo stĺpcov s indexmi j1, . . . , jk matíc XXX resp. YYY (ostatné stĺpce vynecháme). Potom postupnosťou tých istých ERO, ktorými sme XXX upravili na YYY , dostaneme z XXX maticu YYY , teda XXX ∼ YYY . Matica YYY je však v stupňovitom tvare a má v každom stĺpci vedúci prvok nejakého svojho riadku. Preto homogénna sústava XXX · ddd = 0 má jediné riešenie ddd = 0 ∈ Kk , čo znamená, že stĺpce matice XXX , t. j. vektory xxxj1 , . . . ,xxxjk , sú lineárne nezávislé. (b) Bez ujmy na všeobecnosti môžeme predpokladať, že matica YYY je dokonca v redukovanom stupňovitom tvare. Poloha vedúcich prvkov riadkov v jednotlivých stĺpcoch bude stále rovnaká. Nech j = j1, . . . , jk. Pri voľbe parametra cj = 1 a voľbou 0 za hodnotu všetkých ostatných parametrov (ak nejaké zostali) dostaneme jedno riešenie ccc = (c1, . . . , cn)T = 0 sústavy XXX · ccc = 0. Nech l ≤ k je najväčší index taký, že jl < j. Pre naše riešenie ccc navyše platí cp = 0, ak j ≤ p ≤ n. Ak je totiž cp parameter, tak je to 4.5. Lineárny obal a lineárna nezávislosť v priestoroch Km 101 dôsledok našej voľby, a vo vyjadrení neznámych cjh pre l < h ≤ k sa (jediný nenulový) parameter cj nevyskytuje. Označme XXX maticu, ktorá pozostáva len zo stĺpcov matice XXX s indexmi j1, . . . , jl a j. Z uvedených dôvodov je vektor ccc = (cj1 , . . . , cjl , 1)T riešením sústavy XXX · ccc = 0. To znamená, že xxxj = −(cj1xxxj1 + . . . + cjl xxxjl ) ∈ [xxxj1 , . . . ,xxxjl ]. (c) je bezprostredným dôsledkom (b) a tvrdenia 4.4.3 Práve dokázané tvrdenie nám dáva priamy návod na riešenie otázky (3). Stačí pomocou ERO upraviť maticu XXX = (xxx1, . . . ,xxxn) na maticu YYY v stupňovitom tvare a zistiť v nej indexy j1 < . . . < jk všetkých stĺpcov, v ktorých ležia vedúce prvky jej riadkov. Potom xxxj1 , . . . ,xxxjk sú hľadané lineárne nezávislé vektory, ktoré generujú lineárny podpriestor [xxx1, . . . ,xxxn]. 4.5.4. Príklad. Zo stĺpcov reálnej matice XXX =     1 1 3 −1 1 2 0 2 1 3 1 1 3 2 4 2 0 2 0 2     treba vybrať lineárne nezávislé stĺpce, ktoré generujú lineárny obal všetkých stĺpcov matice XXX. Matica XXX je riadkovo ekvivalentná s maticou YYY =     1 1 3 −1 1 0 1 2 2 −3 0 0 0 1 1 0 0 0 0 0     v stupňovitom tvare. Vedúce prvky riadkov matice YYY sa nachádzajú v stĺpcoch 1, 2 a 4. Hľadané vektory sú teda stĺpce 1, 2 a 4 matice XXX. Zapísané vedľa seba tvoria maticu     1 1 −1 2 0 1 1 1 2 2 0 0     . I keď sme celý postup riešenia otázok (1), (2) a (3) vyložili len pre priestory stĺpcových vektorov Km a týchto priestorov sa týkali aj všetky príklady, čitateľovi by už nemalo robiť ťažkosti modifikovať popísanú metódu aj na priestory riadkových vektorov Km – či už transponovaním, príslušných matíc riadkových vektorov alebo nahradením elementárnych riadkových operácií stĺpcovými. 102 4. Lineárne podpriestory a lineárna nezávislosť 4.6 Lineárne nezávislé postupnosti a množiny V tomto paragrafe stručne doplníme pojmy lineárnej závislosti a nezávislosti spôsobom, ktorý umožňuje ich použitie i v prípade nekonečných postupností a ľubovoľných (t. j. konečných aj nekonečných) množín vektorov. Nakoľko však tieto otázky zostávajú na okraji nášho záujmu, popri príslušných definíciách sa obmedzíme len na niekoľko jednoduchých zovšeobecnení výsledkov o lineárnej (ne)závislosti usporiadaných n-tíc. Nekonečnú postupnosť (uuuk)∞ k=0 = (uuu0,uuu1,uuu2, . . . ,uuuk, . . . ) vektorov z priestoru V nazývame lineárne nezávislou, ak každá jej konečná podpostupnosť (uuuk1 , . . . ,uuukn ), kde 0 ≤ k1 < . . . < kn, je lineárne nezávislá. Dôkaz nasledujúceho jednoduchého tvrdenia prenechávame čitateľovi. 4.6.1. Tvrdenie. Nekonečná postupnosť (uuuk)∞ k=0 vektorov z V je lineárne nezávislá práve vtedy, keď pre každé n ∈ N jej počiatočný úsek (uuu0,uuu1, . . . ,uuun) je lineárne nezávislý. Napríklad postupnosť (1, x, x2 , . . . , xk , . . . ) všetkých mocnín x je lineárne nezávislá postupnosť vo vektorovom priestore K[x] všetkých polynómov v premennej x nad poľom K. Polynóm f(x) = a0 + a1x + . . . + anxn je totiž (definitoricky) nulový práve vtedy, keď a0 = a1 = . . . = an = 0. Množina X ⊆ V sa nazýva lineárne nezávislá, ak pre ľubovoľné n ∈ N každá usporiadaná n-tica navzájom rôznych vektorov (uuu1, . . . ,uuun) z množiny X je lineárne nezávislá. Ešte raz podčiarkujeme ono „navzájom rôznych – keby totiž uuu1, . . . ,uuun neboli navzájom rôzne vektory, nemohli by byť lineárne nezávislé. Lineárna závislosť či nezávislosť usporiadanej n-tice vektorov nezávisí od ich poradia – zrejme usporiadaná n-tica (uuu1, . . . ,uuun) je lineárne nezávislá práve vtedy, keď je lineárne nezávislá usporiadaná n-tica (uuuσ(1), . . . ,uuuσ(n)), kde σ je ľubovoľná permutácia množiny {1, . . . , n}. Inak povedané, lineárna (ne)závislosť usporiadanej n-tice (uuu1, . . . ,uuun) navzájom rôznych vektorov je vlastnosťou množiny {uuu1, . . . ,uuun}. Čitateľ už iste ľahko nahliadne platnosť nasledujúceho očividného tvrdenia. 4.6.2. Tvrdenie. Usporiadaná n-tica (uuu1, . . . ,uuun) navzájom rôznych vektorov z V je lineárne nezávislá práve vtedy, keď množina {uuu1, . . . ,uuun} ⊆ V je lineárne nezávislá. Naše záverečné tvrdenie, ktoré dáva do súvisu lineárnu (ne)závislosť množiny s jej lineárnym obalom, je obdobou tvrdenia 4.4.3 Taktiež jeho dôkaz možno získať malou obmenou dôkazu spomínaného tvrdenia. 4.6.3. Tvrdenie. Nech X ⊆ V je lineárne nezávislá množina a vvv ∈ V . Potom nasledujúce podmienky sú ekvivalentné: Cvičenia 103 (i) vvv ∈ [X]; (ii) množina X ∪ {vvv} je lineárne závislá; (iii) [X ∪ {vvv}] = [X]. Cvičenia 4.1. Nech S, T sú lineárne podpriestory vektorového priestoru V . Potom S ∪ T je lineárny podpriestor V práve vtedy, keď S ⊆ T alebo T ⊆ S. Dokážte. 4.2. V každom z nasledujúcich prípadov rozhodnite, či daná podmnožina S vektorového priestoru V nad poľom K je jeho lineárnym podpriestorom. Svoje rozhodnutie zdôvodnite. Ak S nie je lineárny podpriestor, popíšte jeho lineárny obal [S]. (a) K = R, V = R, S = −1, 1 ; (b) K = C, V = C, S = {z ∈ C; |z| = 1}; (c) K = R, V = R2 , S = {(x, y) ∈ R2 ; x − 2y = 0}; (d) K = C, V = C2 , S = {(x, y) ∈ C2 ; x + iy = 1}; (e) K = R, V = C, S = {x ∈ C; Re x = Im x}; (f) K = Q, V = R, S = Q[ √ 3] = {a + b √ 3; a, b ∈ Q}; (g) K = Z2, V = Z3 2, S = {(0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1)}; (h) K = Z3, V = Z2 3, S = {(0, 0), (1, 2), (2, 1)}; (i) K ľubovoľné, V = K[x], S = {f(x) ∈ K[x]; f(1) = 0}; (j) K ľubovoľné, V = K[x], S = {f(x) ∈ K[x]; f(0) = 1}; (k) K ľubovoľné, V = K[x], S = {f(x) ∈ K[x]; f(0) = f(1)}; (l) K ľubovoľné, V = K[x], S = {a + bx + (a + b)x2 ; a, b ∈ K}; (m) K ľubovoľné, V = K[x], S = {a + bx + (a + b + 1)x2 ; a, b ∈ K}. 4.3. V každom z nasledujúcich prípadov rozhodnite, či uvedené vektory z vektorového priestoru V nad poľom K sú lineárne nezávislé. Svoje rozhodnutie odôvodnite. (a) K = Q, V = Q2 , uuu = (0, 0), vvv = (1, 1); (b) K = Q, V = Q3 , www = (1, 2, 3)T ; (c) K = R, V = R4 , xxx = (0, 1, 0, 1)T , yyy = (1, 0, 1, 0)T , zzz = (1, 0, 0, 1)T ; (d) K = C, V = C3 , uuu = (1, i, −i), vvv = (2 + i, 3 − i, 1 + 2i), www = (2 + 2i, 2 − i, 2 + 2i); (e) K = Z5, V = Z4 5, xxx = (1, 3, 2, 4), yyy = (2, 2, 1, 1), zzz = (4, 2, 4, 2); (f) K = Z7, V = Z4 7, xxx = (1, 3, 2, 4), yyy = (2, 2, 1, 1), zzz = (4, 2, 4, 2); (g) K = R, V = R(3) [x], f0(x) = 1, f1(x) = x, f2(x) = x(x−1), f3(x) = x(x−1)(x−2); (h) K = Z3, V = Z13[x], f(x) = 5 + 12x, g(x) = 12 + 8x; (i) K = R, V = R[x], f(x) = 5 + 12x, g(x) = 12 + 8x. 4.4. Nech V je vektorový priestor nad poľom K, uuu1, . . . ,uuun ∈ V sú lineárne nezávislé vektory a AAA ∈ Km×n . Pre i = 1, . . . , m označme vvvi = ai1uuu1 + . . . + ainuuun = rrri(AAA)·(uuu1, . . . ,uuun)T . Potom vektory vvv1, . . . ,vvvm ∈ V sú lineárne nezávislé práve vtedy, keď riadky matice AAA sú lineárne nezávislé vektory v Kn . Dokážte. Čo sa zmení, ak uuu1, . . . ,uuun sú lineárne závislé? 104 4. Lineárne podpriestory a lineárna nezávislosť 4.5. Nech V je vektorový priestor nad poľom K. V každom z nasledujúcich prípadov rozhodnite, či vektor uuu ∈ V patrí do lineárneho obalu vektorov xxx,yyy,zzz ∈ V . (a) K = R, V = R3 , xxx = (1, 1, 2)T , yyy = (−2, 1, −1)T , zzz = (0, 1, 1)T , uuu = (1, 2, −1)T ; (b) K = C, V = C2 , xxx = (i, 1 + i), yyy = (1, 1 − i), zzz = (i, −i), uuu = (1 + i, 1 − i); (c) K = Z3, V = Z3 3, xxx = (0, 1, 2), yyy = (1, 2, 0), zzz = (2, 0, 1), uuu = (1, 0, 1); (d) K = Z5, V = Z3 5, xxx = (0, 1, 2), yyy = (1, 2, 0), zzz = (2, 0, 1), uuu = (1, 0, 1). 4.6. V každej z úloh (a)–(i) cvičenia 4.3 vyberte z daných vektorov lineárne nezávislé vektory, ktoré generujú ten istý lineárny podpriestor ako pôvodné vektory. Riešte rovnaký problém pre vektory xxx, yyy, zzz, uuu v každej z úloh (a)–(d) cvičenia 4.5. Využite pri tom výsledky cvičení 4.3 a 4.5. 4.7. Doplňte chýbajúce dôkazy častí (a)–(e) tvrdenia 4.2.2 4.8. (a) Zovšeobecnite definíciu priameho súčtu na ľubovoľný konečný počet lineárnych podpriestorov daného vektorového priestoru. (b) Nech S1, . . . , Sn (n ≥ 2) sú lineárne podpriestory vektorového priestoru V . Pre i = 1, . . . , n označme Ti = S1 + . . . + Si−1 + Si+1 + . . . + Sn, t. j. T1 = S2 + . . . + Sn, T2 = S1 +S3 +. . .+Sn, . . . , Tn = S1 +. . .+Sn−1. Potom S1 +. . .+Sn = S1 ⊕. . .⊕Sn, t. j. súčet podpriestorov S1, . . . , Sn je priamy, práve vtedy, keď pre každé i ≤ n platí Si ∩ Ti = {0}. Dokážte. 4.9. Nech V je vektorový priestor nad poľom K a X ⊆ V je ľubovoľná podmnožina. Dokážte tzv. podmienku zámeny: (∀uuu,vvv ∈ V )(uuu ∈ [X ∪ {vvv}] [X] ⇒ vvv ∈ [X ∪ {uuu}]). Rozhodnite, či platí dokonca ekvivalencia (∀uuu,vvv ∈ V )(uuu ∈ [X ∪ {vvv}] [X] ⇔ vvv ∈ [X ∪ {uuu}] [X])? 4.10. Dokážte tvrdenia 4.6.1, 4.6.2 a 4.6.3 4.11. Nech K je pole a (pk(x))∞ k=0 je postupnosť polynómov z K[x] taká, že pre k = l majú polynómy pk(x), pl(x) rôzny stupeň. Dokážte, že potom ide o lineárne nezávislú postupnosť. 5. Báza a dimenzia V tejto kapitole sa oboznámime s pojmom bázy vektorového priestoru, čo nám v niektorých vektorových priestoroch umožní zaviesť súradnice. Ďalej budeme definovať dimenziu vektorového priestoru a odvodíme jej základné vlastnosti. V nasledujúcej kapitole si potom okrem iného dokážeme, že dimenzia je základný štruktúrny invariant tzv. konečnorozmerných vektorových priestorov. I v tejto kapitole V označuje nejaký vektorový priestor nad pevným poľom K. 5.1 Steinitzova veta a konečnorozmerné priestory Začneme jedným technickým výsledkom kľúčového významu. 5.1.1. Tvrdenie. (Steinitzova veta) Nech uuu1, . . . ,uuun,vvv1, . . . ,vvvm ∈ V . Ak vektory uuu1, . . . ,uuun sú lineárne nezávislé a všetky patria do lineárneho obalu [vvv1, . . . ,vvvm], tak n ≤ m. Dôkaz. Keďže uuuj ∈ [vvv1, . . . ,vvvm] pre každé j ≤ n, existujú cccj = (c1j, . . . , cmj)T ∈ Km také, že uuuj = c1jvvv1 + . . . + cmjvvvm = (vvv1, . . . ,vvvm) · cccj. Inak povedané (uuu1, . . . ,uuun) = (vvv1, . . . ,vvvm) · CCC, kde CCC = (cij)m×n je matica so stĺpcami ccc1, . . . ,cccn. Predpokladajme, že m < n. Potom podľa tvrdenia 3.3.6 má homogénna sústava CCC · xxx = 0 aspoň jedno riešenie xxx = (x1, . . . , xn)T = 0. Jednoduchým výpočtom dostávame x1uuu1 + . . . + xnuuun = (uuu1, . . . ,uuun) · xxx = (vvv1, . . . ,vvvm) · CCC · xxx = (vvv1, . . . ,vvvm) · 0 = 0, čo je v spore s lineárnou nezávislosťou vektorov uuu1, . . . ,uuun. 5.1.2. Tvrdenie. Pre ľubovoľný vektorový priestor V nasledujúce podmienky sú ekvivalentné: (i) existuje konečná množina X ⊆ V taká, že [X] = V ; 106 5. Báza a dimenzia (ii) každá lineárne nezávislá množina Y ⊆ V je konečná. Dôkaz. (i) ⇒ (ii): Nech X ⊆ V je konečná množina, ktorá generuje V . Podľa Steinitzovej vety pre ľubovoľné lineárne nezávislé vektory uuu1, . . . ,uuun platí n ≤ # X, teda každá lineárne nezávislá množina Y ⊆ V je konečná. (ii) ⇒ (i): Budeme dokazovať logicky ekivalentnú implikáciu ¬ (i) ⇒ ¬ (ii). Predpokladajme, že žiadna konečná podmnožina priestoru V negeneruje V . Potom vo V môžeme zostrojiť postupnosť vektorov (yyyn)∞ n=0 takú, že yyy0 = 0 a pre každé n > 0 platí yyyn /∈ [yyy0, . . . ,yyyn−1]. Podľa tvrdenia 4.4.1 je každý počiatočný úsek (yyy0, . . . ,yyyn) tejto postupnosti lineárne nezávislý, takže celá postupnosť je lineárne nezávislá podľa tvrdenia 4.6.1 Teda vo V existuje nekonečná lineárne nezávislá množina, napr. Y = {yyyn; n ∈ N}. Hovoríme, že vektorový priestor V je konečnorozmerný , ak spĺňa niektorú (teda nevyhnutne obe) z ekvivalentných podmienok (i), (ii) práve dokázaného tvrdenia. V opačnom prípade hovoríme, že V je nekonečnorozmerný vektorový priestor. 5.2 Báza a dimenzia konečnorozmerného priestoru Nech V je konečnorozmerný vektorový priestor. Bázou priestoru V nazývame každú lineárne nezávislú usporiadnú n-ticu (uuu1, . . . ,uuun) vektorov z V , ktorá generuje celý priestor V . Stručne tiež hovoríme, že vektory uuu1, . . . ,uuun tvoria bázu priestoru V . Nasledujúce tvrdenie je priamym dôsledkom vety 4.4.4 5.2.1. Tvrdenie. Nech V je konečnorozmerný vektorový priestor. Potom (a) ľubovoľnú lineárne nezávislú usporiadanú k-ticu (uuu1, . . . ,uuuk) vektorov z V možno doplniť do nejakej bázy (uuu1, . . . ,uuuk, . . . ,uuun) priestoru V ; (b) z ľubovoľnej generujúcej usporiadanej m-tice (vvv1, . . . ,vvvm) vektorov z V možno vybrať nejakú bázu (vvvi1 , . . . ,vvvin ) priestoru V . 5.2.2. Veta. Nech V je konečnorozmerný vektorový priestor. Potom (a) V má aspoň jednu bázu; (b) ľubovoľné dve bázy priestoru V majú rovnaký počet prvkov. Dôkaz. (a) je bezprostredným dôsledkom predchádzajúceho tvrdenia, ktoré nám dokonca dáva dva varianty dôkazu: jeden doplnením prázdnej množiny (ktorá je lineárne nezávislá) na bázu vo V , druhý výberom bázy z nejakej konečnej generujúcej množiny vo V . (b) je bezprostredným dôsledkom Steinitzovej vety. Ak sú totiž (uuu1, . . . ,uuun), (vvv1, . . . ,vvvm) dve bázy vo V , tak, keďže (uuu1, . . . ,uuun) je lineárne nezávislá a 5.3. Súradnice vektora vzhľadom na danú bázu 107 (vvv1, . . . ,vvvm) generuje celý priestor V , musí platiť n ≤ m. Nakoľko však i (vvv1, . . . ,vvvm) je lineárne nezávislá a (uuu1, . . . ,uuun) generuje celé V , platí tiež m ≤ n. Teda m = n. Práve dokázaná veta nám umožňuje korektne definovať dimenziu alebo tiež rozmer konečnorozmerného vektorového priestoru V ako počet prvkov jeho ľubovoľnej bázy. Dimenziu vektorového priestoru V značíme dim V . Ak dim V = n, hovoríme, že V je n-rozmerný vektorový priestor. Ak V je nekonečnorozmerný priestor, kladieme dim V = ∞. V prípade, že bude potrebné zdôrazniť úlohu poľa K, budeme používať podrobnejšie označenie dimK V . Teda V je konečnorozmerný práve vtedy, keď dim V < ∞. Dôkaz nasledujúceho tvrdenia prenechávame ako cvičenie čitateľovi. 5.2.3. Tvrdenie. Nech dim V = n, vvv1, . . . ,vvvm ∈ V . Potom ľubovoľné dve z nasledujúcich podmienok implikujú tretiu: (i) vektory vvv1, . . . ,vvvm sú lineárne nezávislé; (ii) [vvv1, . . . ,vvvm] = V ; (iii) m = n. To okrem iného znamená, že na overenie, či n vektorov vvv1, . . . ,vvvn tvorí bázu n-rozmerného vektorového priestoru V , stačí overiť len jednu (a to ľubovoľnú) z podmienok (i), (ii). 5.3 Súradnice vektora vzhľadom na danú bázu Nasledujúca veta je špeciálnym prípadom vety 4.4.2 5.3.1. Veta. Vektory uuu1, . . . ,uuun tvoria bázu vektorového priestoru V práve vtedy, keď každý vektor xxx ∈ V možno jednoznačne vyjadriť v tvare lineárnej kombinácie xxx = c1uuu1 + . . . + cnuuun. Uvedomme si, že existencia aspoň jedného vyjadrenia xxx = c1uuu1+. . .+cnuuun je ekvivalentná s podmienkou, že vektory uuu1, . . . ,uuun generujú V . Jednoznačnosť tohto vyjadrenia je zasa ekvivalentná s lineárnou nezávislosťou vektorov uuu1, . . . ,uuun. Teda ααα = (uuu1, . . . ,uuun) je bázou V vtedy a len vtedy, keď pre každé xxx ∈ V existuje práve jedno ccc = (c1, . . . , cn)T ∈ Kn také, že xxx = c1uuu1 + . . . + cnuuun = ααα · ccc. 108 5. Báza a dimenzia Tento jednoznačne určený stĺpcový vektor ccc ∈ Kn budeme nazývať súradnice vektora xxx vzhľadom na bázu ααα a označovať ccc = (xxx)ααα. Teda každá báza ααα v n-rozmernom vektorovom priestore V definuje súradnicové zobrazenie xxx → (xxx)ααα z V do stĺpcového vektorového priestoru Kn . Jednoduchý dôkaz nasledujúceho tvrdenia prenechávame ako cvičenie či- tateľovi. 5.3.2. Tvrdenie. Nech ααα = (uuu1, . . . ,uuun) je báza konečnorozmerného vektorového priestoru V . Potom príslušné súradnicové zobrazenie V → Kn je bijektívne a zachováva lineárne kombinácie, t. j. pre ľubovoľné a, b ∈ K, xxx,yyy ∈ V platí (axxx + byyy)ααα = a(xxx)ααα + b(yyy)ααα. K nemu inverzné zobrazenie Kn → V je dané predpisom ccc → ααα · ccc. V označení posledného tvrdenia teda pre ľubovoľné xxx ∈ V , ccc ∈ Kn platí xxx = ααα · (xxx)ααα, (ααα · ccc)ααα = ccc. Prvá rovnosť ukazuje, ako možno vektor xxx zrekonštruovať z danej bázy ααα a jeho súradníc (xxx)ααα v tejto báze; druhá zachytáva zrejmý fakt, že súradnice lineárnej kombinácie n i=1 ciuuui v báze uuu1, . . . ,uuun tvorí vektor (c1, . . . , cn)T . Práve zavedené súradnice by sme mohli podrobnejšie nazvať stĺpcovými súradnicami vzhľadom na danú bázu. Podobným spôsobom možno zaviesť i riadkové súradnice a dokázať pre ne analogické tvrdenia ako pre stĺpcové. V takom prípade je samozrejme vhodnejšie zapisovať príslušnú bázu ako stĺpcový vektor ααα = (uuu1, . . . ,uuun)T a v prípade riadkového priestoru V = Kn ju stotožniť s maticou s riadkami uuu1, . . . ,uuun. Podrobnosti prenechávame na doplnenie čitateľovi. 5.3.3. Príklad. Označme eee (n) i = sssi(IIIn) ∈ Kn stĺpcový vektor pozostávajúci zo samých núl, okrem i-tej zložky, ktorá je 1. Potom εεε(n) = eee (n) 1 , . . . ,eee (n) n je báza stĺpcového vektorového priestoru Kn . Nazývame ju kanonickou bázou tohto priestoru. Túto bázu možno zrejmým spôsobom stotožniť s jednotkovou maticou IIIn. Pokiaľ nebude hroziť nedorozumenie, budeme horný index (n) vynechávať a príslušnú bázu označovať stručne εεε = (eee1, . . . ,eeen). Pre ľubovoľný vektor xxx = (x1, . . . , xn)T ∈ Kn platí xxx = x1eee1 + . . . + xneeen, preto (xxx)εεε = xxx, t. j. každý vektor xxx ∈ Kn splýva so svojimi vlastnými súradnicami v kanonickej báze. 5.3. Súradnice vektora vzhľadom na danú bázu 109 Kanonická báza riadkového vektorového priestoru Kn je tvorená riadkami jednotkovej matice IIIn a značíme ju rovnako ako v predchádzajúcom prípade εεε(n) = eee (n) 1 , . . . ,eee (n) n T alebo stručne εεε = (eee1, . . . ,eeen)T , len s tým rozdielom, že εεε(n) = εεε je teraz stĺpec vektorov a každé eeei je riadok pozostávajúci zo samých núl, okrem i-teho miesta, ktoré je 1. V predošlom príklade je, okrem iného, zahrnutý aj dôkaz nasledujúceho očakávaného výsledku. 5.3.4. Veta. Pre ľubovoľné n ∈ N platí dim Kn = n. 5.3.5. Príklad. Stĺpce matice     1 1 1 1 1 1 1 0 1 1 0 0 1 0 0 0     tvoria bázu ααα (stĺpcového) vektorového priestoru K4 (presvedčte sa o tom s využitím tvrdenia 5.2.3 a vety 5.3.4 Súradnice vektora xxx = (x1, x2, x3, x4)T ∈ Kn v báze ααα sú dané vzťahom (xxx)ααα = (x4, x3 − x4, x2 − x3, x1 − x2)T . Platí totiž     x1 x2 x3 x4     = x4     1 1 1 1     + (x3 − x4)     1 1 1 0     + (x2 − x3)     1 1 0 0     + (x1 − x2)     1 0 0 0     . Overte. 5.3.6. Príklad. Označme ξξξ(n) = (1, x, . . . , xn ) usporiadanú (n + 1)-ticu prvých n + 1 mocnín premennej x. Ľahko nahliadneme, že ξξξ(n) je báza vektorového priestoru K(n) [x] všetkých polynómov stupňa ≤ n v premennej x nad poľom K. Súradnice polynómu f(x) = n i=0 aixi v tejto báze tvorí vektor (f)ξξξ(n) = (a0, a1, . . . , an)T ∈ Kn+1 . Teda dim K(n) [x] = n+1. Na druhej strane vektorový priestor K[x] všetkých polynómov v premennej x nad poľom K zrejme nie je konečnorozmerný, teda dim K[x] = ∞. 110 5. Báza a dimenzia 5.3.7. Príklad. Nech m, n ∈ N. Pre ľubovoľné 1 ≤ k ≤ m, 1 ≤ l ≤ n označme EEE (m,n) kl = EEEkl = (δikδjl)m×n maticu typu m × n nad poľom K, pozostávajúcu zo samých núl, okrem miesta (k, l), na ktorom je 1. Zrejme každú maticu AAA = (akl) ∈ Km×n možno jednoznačne vyjadriť v tvare AAA = m k=1 n l=1 aklEEEkl, z čoho vyplýva, že matice EEE (m,n) kl , 1 ≤ k ≤ m, 1 ≤ l ≤ n, tvoria bázu vektorového priestoru Km×n všetkých matíc typu m × n nad poľom K. Jej špeciálnym prípadom je kanonická báza εεε(n) v priestore Kn . Dostávame tak ďalší očakávaný vzťah: dim Km×n = mn. 5.3.8. Príklad. Pole C všetkých komplexných čísel je rozšírením poľa R všetkých reálnych čísel. Teda C možno považovať za vektorový priestor nad poľom R (príklad 1.6.1). Každé komplexné číslo z možno jednoznačne vyjadriť v tvare z = a + bi = a1 + bi, kde a = Re z, b = Im z sú reálne čísla, nazývané reálna resp. imaginárna časť komplexného čísla z, a i je imaginárna jednotka. To znamená, že komplexné čísla (t. j. vektory) 1, i tvoria bázu vektorového priestoru C nad poľom R. Súradnicové zobrazenie vzhľadom na túto bázu je dané vzťahom (z)(1,i) = Re z Im z = 1 2 (z + ¯z) 1 2i (z − ¯z) , kde ¯z = a−bi je číslo komplexne združené k číslu z = a+bi. Teda dimR C = 2. Na druhej strane každé pole K, uvažované ako vektorový priestor nad sebou samým má dimenziu 1, t. j. dimK K = 1. Špeciálne dimR R = 1 aj dimC C = 1. 5.4 Dimenzia prieniku, súčtu a súčinu vektorových priestorov V tomto paragrafe preskúmame niektoré základné vlastnosti dimenzie, uvažovanej ako zobrazenie definované na všetkých vektorových priestoroch nad pevným poľom K. Na začiatok si uvedomme, že ľubovoľný lineárny podpriestor S vektorového priestoru V je i sám vektorovým priestorom nad tým istým poľom, teda pojmy ako báza podpriestoru S a dimenzia podpriestoru S majú dobre definovaný význam. Zrejme každý podpriestor konečnorozmerného vektorového priestoru je i sám konečnorozmerný. 5.4. Dimenzia prieniku, súčtu a súčinu vektorových priestorov 111 5.4.1. Veta. Nech S, T ⊆ V sú konečnorozmerné lineárne podpriestory vektorového priestoru V . Potom dim(S + T) = dim S + dim T − dim(S ∩ T). Dôkaz. Označme dim S = m, dim T = n, dim(S ∩ T) = k. Nech uuu1, . . . ,uuuk je báza podpriestoru S∩T. Doplňme túto bázu do bázy uuu1, . . . ,uuuk, vvv1, . . . ,vvvm−k podpriestoru S, a taktiež do bázy uuu1, . . . ,uuuk,www1, . . . ,wwwn−k podpriestoru T. Dokážeme, že vektory uuu1, . . . ,uuuk, vvv1, . . . ,vvvm−k, www1, . . . ,wwwn−k tvoria bázu podpriestoru S + T. Tým budeme hotoví, lebo potom naozaj platí dim(S + T) = k + (m − k) + (n − k) = m + n − k = dim S + dim T − dim(S ∩ T). Keďže vektory uuu1, . . . ,uuuk, vvv1, . . . ,vvvm−k, www1, . . . ,wwwn−k zrejme generujú podpriestor S + T (premyslite si detaily), zostáva dokázať, že sú tiež lineárne nezávislé. Nech a1, . . . , ak, b1, . . . , bm−k, c1, . . . , cn−k sú skaláry také, že a1uuu1 + . . . + akuuuk + b1vvv1 + . . . + bm−kvvvm−k + c1www1 + . . . + cn−kwwwm−k = 0. Potom a1uuu1 + . . . + akuuuk + b1vvv1 + . . . + bm−kvvvm−k = −(c1www1 + . . . + cn−kwwwm−k), pričom vektor na ľavej strane patrí do S a vektor na pravej do T. Túto spoločnú hodnotu zzz ∈ S ∩ T možno vyjadriť ako lineárnu kombináciu len vektorov uuu1, . . . ,uuuk. Z jednoznačnosti vyjadrenia zzz v báze uuu1, . . . ,uuuk,vvv1, . . . ,vvvm−k podpriestoru S tak dostávame b1 = . . . = bm−k = 0. Preto a1uuu1 + . . . + akuuuk + c1www1 + . . . + cm−kwwwn−k = 0. Z lineárnej nezávislosti bázy uuu1, . . . ,uuuk, www1, . . . ,wwwn−k podpriestoru T potom vyplýva a1 = . . . = ak = 0, c1 = . . . = cn−k = 0. Teda uuu1, . . . , uuuk,vvv1, . . . ,vvvm−k, www1, . . . ,wwwn−k sú lineárne nezávislé vektory. 5.4.2. Dôsledok. Nech S, T sú lineárne podpriestory vektorového priestoru V . Potom S ∩ T = {0}, t. j. súčet S + T je direktný, práve vtedy, keď dim(S + T) = dim S + dim T. Práve dokázané vzťahy pre dimenzie konečnorozmerných podpriestorov nejakého vektorového priestoru nápadne pripomínajú vzťah # (X ∪ Y ) = # X + # Y − # (X ∩ Y ) 112 5. Báza a dimenzia pre počty prvkov konečných množín z paragrafu 0.2, ktorý sa v prípade disjunktných množín redukuje na rovnosť # (X ∪ Y ) = # X + # Y. To znamená, že konečnorozmerné vektorové priestory (hoci v typickom prípade priestorov nenulovej dimenzie nad nekonečným poľom ide o nekonečné množiny) sa správajú do značnej miery podobne ako konečné množiny. Dimenzia dim V konečnorozmerného priestoru V je tak akousi mierou jeho „veľkosti , podobne ako počet prvkov # X je mierou veľkosti konečnej množiny X. Direktný (priamy) súčet lineárnych podpriestorov je tak analógiou zjednotenia disjunktných množín. Na rozdiel od multiplikatívneho charakteru počtu prvkov karteziánskeho súčinu konečných množín, ktorý je daný formulou # (X × Y ) = # X · # Y, sa však dimenzia priameho súčinu konečnorozmerných vektorových priestorov (pozri príklad 1.6.4) správa aditívne, t. j. do značnej miery podobne ako logaritmus. 5.4.3. Tvrdenie. Nech V , W sú konečnorozmerné vektorové priestory nad poľom K. Potom pre dimenziu ich priameho súčinu platí dim(V × W) = dim V + dim W. Dôkaz. Nech vvv1, . . . ,vvvm je báza priestoru V a www1, . . . ,wwwn je báza priestoru W. Stačí overiť, že vektory (vvv1, 0), . . . , (vvvm, 0), (0,www1), . . . , (0,wwwn) tvoria bázu priameho súčinu V × W. Podrobnosti prenechávame čitateľovi. V dôsledku toho pre konečnorozmerné priestory V1, . . . , Vk nad poľom K platí dim(V1 × . . . × Vk) = dim V1 + . . . + dim Vk, a pre k-tu priamu mocninu V k priestoru V máme dim V k = k dim V. Poznámka. Ak obvyklým spôsobom rozšírime aritmetiku prirodzených čísel aj na symbol ∞, t. j. položíme n + ∞ = ∞ + n = ∞ + ∞ = ∞ pre n ∈ N, 0 · ∞ = ∞ · 0 = 0 a n · ∞ = ∞ · n = ∞ · ∞ = ∞ pre n > 0, ľahko nahliadneme, že vzťahy dokázané v tomto paragrafe zostávajú v platnosti aj pre nekonečnorozmerné priestory. 5.5. Usporiadané a neusporiadané bázy 113 5.5 Usporiadané a neusporiadané bázy Ak (uuu1, . . . ,uuun) je báza vektorového priestoru V , tak (uuuσ(1), . . . ,uuuσ(n)) je tiež báza V pre ľubovoľnú premutáciou σ množiny {1, . . . , n}. Inak povedané, vlastnosť „byť bázou vektorového priestoru nezávisí od poradia vektorov v báze – nie je to ani tak vlastnosť príslušnej usporiadanej n-tice (uuu1, . . . ,uuun) ako skôr množiny {uuu1, . . . ,uuun}. Na druhej strane je rozumné považovať bázy (uuu1, . . . ,uuun) a (uuuσ(1), . . . ,uuuσ(n)), kde σ je neidentická permutácia, za rôzne. Prislúchajú im totiž rôzne súradnicové zobrazenia. Napr. εεε = (eee1,eee2,eee3), ηηη = (eee2,eee3,eee1) sú bázy stĺpcového priestoru K3 , líšiace sa len poradím svojich vektorov. Pre súradnice ľubovoľného vektora xxx = (x1, x2, x3)T ∈ K3 v týchto bázach však platí: (xxx)εεε =   x1 x2 x3   , (xxx)ηηη =   x2 x3 x1   . Teda (xxx)εεε = (xxx)ηηη, okrem prípadu, keď x1 = x2 = x3. Doteraz študované bázy by sme vlastne mali presnejšie nazývať konečnými usporiadanými bázami. To naznačuje možnosti uvažovať jednak o nekonečných, jednak o „neusporiadaných bázach. Keďže v centre nášho záujmu naďalej zostávajú iba konečnorozmerné priestory, oboch týchto otázok sa len letmo dotkneme. Hovoríme, že nekonečná postupnosť (uuuk)∞ k=0 = (uuu0,uuu1,uuu2, . . . ,uuuk, . . . ) je báza, presnejšie usporiadaná báza vektorového priestoru V , ak je lineárne nezávislá a generuje celý priestor V . Treba zdôrazniť, že podmienka generovania priestoru V hovorí, že každý vektor xxx ∈ V možno vyjadriť ako konečnú lineárnu kombináciu xxx = n k=0 ckuuuk, kde n ∈ N a c0, . . . , cn ∈ K, prvkov príslušnej bázy. „Nekonečné lineárne kombinácie tvaru ∞ k=0 ckuuuk sme zatiaľ nedefinovali a len samotná algebraická štruktúra vektorého priestoru nám to vo všeobecnosti ani neumožňuje. Nasledujúce tvrdenie, ktorého dôkaz neuvádzame, je obdobou vety 5.3.1 5.5.1. Tvrdenie. Postupnosť vektorov (uuuk)∞ k=0 je bázou vektorového priestoru V práve vtedy, keď každý vektor xxx ∈ V možno jednoznačne až na nulové členy vyjadriť v tvare lineárnej kombinácie xxx = c0uuu0 + c1uuu1 + . . . + cnuuun, kde n ∈ N a c0, c1, . . . , cn ∈ K. Uvedomme si podstatnosť vsuvky „až na nulové členy . Vzhľadom na premennú hodnotu n dĺžky príslušnej lineárnej kombinácie možno napr. vektor uuu0 − uuu1 ∈ V písať aj v tvare uuu0 − uuu1 + 0uuu2 + 0uuu3 a pod. 114 5. Báza a dimenzia Na druhej strane, pri danej báze ααα = (uuuk)∞ k=0 priestoru V každý vektor xxx ∈ V jednoznačne určuje postupnosť skalárov (ck)∞ k=0 ∈ KN takú, že ck = 0 pre všetky k až na konečný počet, t. j. (ck)∞ k=0 ∈ K(N) (pozri príklad 4.1.3 (a)), a platí xxx = ∞ k=0 ckuuuk. Všimnite si, že takéto lineárne kombinácie obsahujú len konečne mnoho nenulových sčítancov, takže s ich definíciou nie je žiaden problém. Uvedenú postupnosť (ck)∞ k=0 potom nazývame súradnicami vektora xxx vzhľadom na bázu ααα a označujeme ju (xxx)ααα. (Vzhľadom na to, že nemienime ďalej rozvíjať príslušnú teóriu pre nekonečnorozmerné priestory, nemá zmysel bližšie špecifikovať, či tým mienime „riadkovú alebo „stĺpcovú postupnosť (ck)∞ k=0.) 5.5.2. Príklad. Postupnosť ξξξ = (xn )∞ n=0 = (1, x, x2 , . . . , xn , . . . ) všetkých mocnín premennej x je bázou priestoru K[x] všetkých polynómov v premennej x nad poľom K. (Presvedčte sa o tom.) Súradnicami polynómu f(x) = a0 + a1x + . . . + anxn = n i=0 aixi ∈ K[x] v tejto báze je postupnosť (f)ξξξ = (a0, a1, . . . , an, 0, 0, . . . ) ∈ K(N) . Podmnožinu X vektorového priestoru V nazývame bázou, presnejšie neusporiadanou bázou priestoru V , ak X je lineárne nezávislá a [X] = V . Používa sa tiež názov Hamelova báza. Aj v prípade Hamelových báz platí obdoba tvrdení 5.3.1 a 5.5.1, čo umožňuje zaviesť na priestore V s takouto bázou súradnicové zobrazenie V → K(X) (pripomíname, že K(X) označuje vektorový priestor všetkých zobrazení f : X → K takých, že f(xxx) = 0 pre všetky xxx ∈ X až na konečný počet – pozri príklad 4.1.3). Súradnicami vektora vvv ∈ V vzhľadom na bázu X nazývame jednoznačne určené zobrazenie f ∈ K(X) , pre ktoré platí vvv = xxx∈X f(xxx)xxx. (Vzhľadom na konečný počet nenulových sčítancov je uvedená lineárna kombinácia dobre definovaná.) I tieto súradnice označujeme obvyklým spôsobom (vvv)X = f. Zostáva otázka, či aj každý nekonečnorozmerný vektorový priestor má bázu, podobne ako konečnorozmerné priestory resp. nekonečnorozmerné priestory polynómov K[x]. Inak povedané, radi by sme vedieť, či vôbec každý 5.6. Fyzika v n-rozmernom priestore∗ 115 vektorový priestor má bázu. Na základe základných axióm teórie množín nemožno na túto otázku odpovedať. Až prijatie tzv. axiómy výberu, postulujúcej platnosť istého princípu platného pre konečné množiny aj pre nekonečné množiny, nám umožňuje dať na uvedenú otázku kladnú odpoveď. Teda za predpokladu axiómy výberu má každý vektorový priestor nad ľubovoľným poľom Hamelovu bázu. Na druhej strane pre väčšinu nekonečnorozmerných priestorov nám toto tvrdenie zaručuje skutočne len existenciu takejto bázy a nič viac. Nedáva nám nijakú konkrétnu bázu ani návod ako ju zostrojiť. K príkladom vektorových priestorov, v ktorých nevieme nijako rozumne popísať Hamelovu bázu, hoci jej existenciu máme zaručenú, patria priestory KX , kde X je nekonečná množina, priestor C a, b všetkých spojitých funkcií z netriviálneho uzavretého intervalu a, b do množiny R, no taktiež polia R či C uvažované ako vektorové priestory nad poľom Q. Nie je to však až taká chyba, lebo v mnohých nekonečnorozmerných priestoroch študovaných vo funkcionálnej analýze sú užitočnejšie iné typy „báz , umožňujúce vyjadrovať vektory z priestoru napr. v tvare istých „nekonečných lineárnych kombinácií ∞ n=0 cnxxxn prvkov „bázy . 5.6 Fyzika v n-rozmernom priestore∗ Na záver kapitoly si dovolíme jedno odbočenie od hlavnej témy. Keď sa už toľko bavíme o dimenzii, môžeme spolu trochu porozmýšľať, ako sa trojrozmernosť „nášho priestoru prejavuje v matematickej podobe niektorých fyzikálnych zákonov. Na základe toho sa pokúsime o extrapoláciu týchto zákonov za hranice trojrozmerného priestoru. Inak povedané, podnikneme spolu metafyzikálny (nie metafyzický) myšlienkový experiment, v ktorom sa pokúsime trochu pošpekulovať nad otázkou, ako by asi mohla vyzerať „fyzika v n-rozmernom priestore . Samozrejme, nie je jasné, či by pre n = 3 v n-rozmernom priestore mohli existovať vôbec nejakí „fyzici , t. j. či by tú „fyziku mal kto pestovať. Touto otázkou sa však zaoberať nebudeme, hoci naše úvahy nám aj na ňu naznačia istú odpoveď. Ale nebudeme predbiehať. Ak sa len trochu hlbšie zamyslíme nad charakterom priestoru, do ktorého sme nevdojak vrhnutí, uvedomíme si, že je plný záhad. Je konečný (ohraničený) alebo nekonečný (neohraničený)? Je diskrétny (pozostávajúci z akýchsi najmenších, ďalej už nedeliteľných častí) alebo spojitý (súvislý a donekonečna deliteľný)? Keďže skúsenosť nám na tieto otázky nedáva jednoznačnú odpoveď, filozofi sa oddávna pokúšali zodpovedať ich na základe špekulatívnych úvah. Aktuálne nekonečno, či už smerom do diaľky (t. j. smerom k čoraz väčším rozmerom) alebo smerom do hĺbky (t. j. smerom k čoraz menším rozmerom) sa však vymyká našim predstavám. Rovnako problematická je však predstava ohraničeného priestoru ako i predstava akejsi najmenšej, ďalej už 116 5. Báza a dimenzia nedeliteľnej priestorovej oblasti. Priestor si totiž nepredstavujeme ako súcno, t. j. ako „niečo , ale ako prázdnu formu, naplnenú súcnami. Za hranicou, ohraničujúcou „celý priestor , by už nemohlo byť absolútne nič, čo si však nedokážeme predstaviť inak, ako prázdny priestor. Podobne, akákoľvek malá priestorová oblasť, je aspoň myšlienkovo (hoc nie nutne fyzikálne) ďalej deliteľná na menšie časti. Moderná fyzika sa s podobnými otázkami nevysporadúva nijakou definitívnou odpoveďou. Namiesto toho konštruuje rôzne matematické modely a na ich základe získava predpovede, ktoré možno porovnať s výsledkami experimentov. Tým sa tieto modely čiastočne potvrdzujú alebo falzifikujú. Navyše hypotéza zakriveného priestoru oddeľuje otázky (ne)konečnosti a (ne)ohraničenosti. Zakrivený priestor môže byť (sám v sebe) neohraničený a pritom mať konečný objem. Ale tak, ako zakrivená guľová plocha poukazuje na existenciu trojrozmerného (nezakriveného) priestoru, zakrivený konečne veľký trojrozmerný priestor vyvoláva otázku existencie nejakého viacrozmerného, neohraničeného a nezakriveného priestoru. My sa však na tomto mieste nemienime zaoberať otázkou konečnosti či nekonečnosti priestoru, či už smerom k čoraz väčším alebo čoraz menším vzdialenostiam. Svoju pozornosť upriamime na omnoho tvrdšiu hranicu priestoru, ktorú predstavuje jeho trojrozmernosť. Na túto hranicu narazíme, keď sa pokúsime uskutočniť štyri rôzne, navzájom kolmé úsečky, vychádzajúce z jedného bodu. Priestor nám také niečo nedovolí. Pritom existencia takýchto úsečiek nevedie nevyhnutne k sporu, ich uskutočneniu nebránia nijaké logické zákony, ale len a len priestor. Aby sme si uvedomili rozdiel medzi priestorovou nepredstaviteľnosťou a logickou nemožnosťou, pokúsime sa vmyslieť do postavenia akýchsi plochých bytostí, obývajúcich dvojrozmerný priestor, t. j. rovinu. V rovine možno uskutočniť len dve rôzne navzájom kolmé úsečky vychádzajúce z daného bodu. Naši „dvojrozmerní ľudkovia by si zrejme nevedeli predstaviť tri takéto úsečky, čo pre nás nepredstavuje nijaký problém. Podobne nejaké bytosti, obývajúce n-rozmerný priestor, kde n ≥ 3, by si asi vedeli predstaviť n navzájom kolmých úsečiek. Teda ich existencia je logicky možná. Vráťme sa však k pôvodnej otázke: ako sa prejavuje trojrozmernosť nášho priestoru v matematickej podobe niektorých fyzikálnych zákonov a akú „fyziku by asi objavili „fyzici v n-rozmernom priestore. Samozrejme, nebudeme sa zaoberať uvedenými otázkami v celej ich šírke, len sa pokúsime ilustrovať naznačenú problematiku na príklade Newtonovho gravitačného zákona. Úplne analogicky by sme mohli postupovať i v prípade Coulombovho zákona pre elektrostatickú silu. Podľa Newtonovho gravitačného zákona centrálne symetrické teleso o hmotnosti M vytvára okolo seba centrálne symetrické gravitačné pole, ktoré na 5.6. Fyzika v n-rozmernom priestore∗ 117 hmotný bod o hmotnosti m vo vzdialenosti r od stredu telesa pôsobí silou F = κ mM r2 , kde κ ≈ 6, 672 · 10−11 kg−1 m3 s−2 je gravitačná konštanta, ktorej hodnotu možno stanoviť experimentálne. Gravitačná hmotnosť je priamo definovaná ako miera gravitačného účinku telesa, čo vyjadruje priama úmernosť uvedenej sily hmotnostiam oboch telies. Z centrálnej symetrie gravitačného poľa, ktorá je dôsledkom izotropie (homogenity) priestoru, vyplýva, že uvedená sila závisí len od vzájomnej vzdialenosti oboch telies a nie od ďalších parametrov ich vzájomnej polohy, napr. od smeru. Navyše je rozumné predpokladať, že gravitačná sila bude slabnúť so vzdialenosťou r. Na prvý pohľad však nie je jasné, prečo by mala slabnúť akurát nepriamo úmerne jej druhej mocnine. Ukážeme si, že práve to je dôsledkom trojrozmernosti priestoru. Rovnako oprávnene však možno tvrdiť, že trojrozmernosť priestoru je dôsledkom príslušnej podoby v ňom platného gravitačného zákona. Gravitačné pole si znázorňujeme geometricky pomocou kriviek nazývaných siločiary. Tie majú v prípade centrálne symetrického poľa v izotropnom priestore tvar polpriamok vychádzajúcich zo stredu zdroja. Veľkosť príťažlivej sily pôsobiacej na hmotný bod je (okrem jeho hmotnosti) priamo úmerná hustote týchto siločiar v danom mieste. Keďže na povrchu guľovej plochy s polomerom r, opísanej okolo stredu príťažlivosti je hustota siločiar všade rovnaká, táto hustota klesá so vzdialenosťou r nepriamo úmerne plošnému obsahu povrchu danej guľovej plochy. Tento obsah má hodnotu 4πr2 . To znamená, že veľkosť príťažlivej sily F je nepriamo úmerná druhej mocnine vzdialenosti r. Pod (n − 1)-rozmernou sférou rozumieme povrch n-rozmernej gule v nrozmernom priestore. Ak si jej stred zvolíme za počiatok súradnej sústavy, tak (n − 1)-rozmernú sféru s polomerom r možno stotožniť s množinou S(n−1) (r) = {(x1, . . . , xn) ∈ Rn ; x2 1 + . . . + x2 n = r2 }. Veľkosť (n−1)-rozmerného povrchu sféry S(n−1) (r) je priamo úmerná mocnine rn−1 . Rovnakou úvahou ako v predchádzajúcom odstavci tak možno odvodiť nasledujúci tvar Newtonovho gravitačného zákona v n-rozmernom priestore: F = κn mM rn−1 , kde κn je gravitačná konštanta, M je hmotnosť centrálne symetrického telesa vytvárajúceho príslušné gravitačné pole, m je hmotnosť hmotného bodu a r jeho vzdialenosť od stredu príťažlivosti. Špeciálne si uvedomme, že v jednorozmernom priestore, t. j. na priamke, gravitačná sila nezávisí na vzdialenosti (siločiary sa nemajú kam rozptýliť, ich hustota sa so vzdialenosťou nemení). 118 5. Báza a dimenzia Práca, ktorú je potrebné vynaložiť na premiestnenie hmotného bodu s hmotnosťou m zo vzdialenosti r1 > 0 do vzdialenosti r2 > r1 od stredu príťažlivosti, je daná integrálom A = r2 r1 F dr = κnmM r2 r1 r1−n dr. Pre jednotlivé hodnoty n dostávame A = κ1mM(r2 − r1), ak n = 1, A = κ2mM ln r2 r1 , ak n = 2, A = κn mM n − 2 1 rn−2 1 − 1 rn−2 2 , ak n ≥ 3. Ďalšou analýzou uvedených vzťahov (čo už nebudeme robiť) možno zistiť, že pohyb v jedno- a dvojrozmernom priestore, t. j. na priamke a v rovine, by bol nesmierne energeticky náročný. Vymaniť sa z gravitačného poľa daného telesa (r2 → ∞) by si vyžiadalo nekonečne veľkú energiu. Navyše v rovine je v takomto poli možný len pohyb po kruhových uzavretých orbitách, alebo po neuzavretých orbitách (tvaru ružice), pričom oba typy sú stabilné. Uzavretá dráha prechádzajúca v rôznych vzdialenostiach od stredu príťažlivosti nie je možná. (Prípadom n = 1 sa ani nemusíme zaoberať, lebo na priamke jednoducho „nie je dosť miesta na pohyb bodu po uzavretej orbite „okolo iného bodu – zrážka by bola nevyhnutná.) Gravitačné pôsobenie v n-rozmernom priestore je pre n ≥ 4 zasa ďaleko od zdroja také slabé a blízko zdroja také silné, že iné uzavreté orbity ako kruhové nie sú možné, a i tie sú nestabilné. Aj tá najmenšia odchýlka od kruhovej dráhy (zapríčinená napr. pôsobením ďalších planét) by spôsobila zmenu kruhovej dráhy na špirálovú (napr. únik Zeme od Slnka alebo pád naň). Nestabilita pre n = 4 má špeciálny charakter: za veľmi idealizovaných predpokladov si možno predstaviť prechod z jednej kruhovej orbity na inú v dôsledku dvoch po sebe nasledujúcich presne zladených „drgnutí v opačných smeroch (pri ktorých sa zachová energia a moment hybnosti). Každopádne však stabilné kruhové orbity sú možné len v dimenziách 2 a 3 a stabilné eliptické orbity len v dimenzii 3. K podobným efektom by dochádzalo aj pôsobením elektrostatickej sily, pod vplyvom ktorej sa elektróny pohybujú okolo jadra atómu. Dvojrozmerný atóm by bol natoľko stabilný, že by sa mohol len veľmi ťažko ionizovať, teda v dvojrozmernom priestore by asi nemohlo dochádzať ku vzniku chemických zlúčenín. Vo viac než trojrozmernom priestore by zas nemohli existovať stabilné atómy – pri najmenšej odchýlke by elektrón po špirálovej dráhe z atómu unikol alebo spadol na jadro. Jemnejšia analýza kvantovomechanických javov ukazuje, že pre n ≥ 5 – aj bez pôsobenia vyvolávajúceho malú odchýlku – by Cvičenia 119 elektróny v obale atómu samovoľne prechádzali na čoraz vzdialenejšie orbity, teda atóm vo viac než štvorrozmernom priestore by sa spontánne ionizoval. Prípad n = 4 je opäť singulárny: moment hybnosti obiehajúceho elektrónu by mohol nadobúdať len jedinú pevne stanovenú hodnotu. Pokiaľ teda uznáme oprávnenosť vykonanej extrapolácie fyzikálnych zákonov trojrozmerného sveta aj na svety iných rozmerov (čo je zrejme najproblematickejšie miesto našich úvah), dochádzame k záveru, že tak stabilné systémy planét obiehajúcich okolo centrálnych hviezd ako aj stabilné a jednako zlučovania schopné atómy pozostávajúce z jadra a elektrónového obalu sú pravdepodobne možné len v trojrozmernom priestore. Cvičenia 5.1. Dokážte tvrdenie 5.2.3 (Návod: Použite Stenitzovu vetu 5.1.1 a tvrdenie 5.2.1) 5.2. Vyberte z daných vektorov bázu vektorového priestoru V nad poľom K (ak je to možné; ak to nie je možné, zdôvodnite prečo): (a) K = R, V = R3 , xxx = (2, 2, 3)T , yyy = (−1, 0, 2)T , zzz = (0, 2, 7)T , uuu = (1, 2, 7)T , vvv = (3, 2, 1)T ; (b) K = C, V = C4 , xxx = (1, i, 1, i), yyy = (i, 1, i, 1), zzz = (1, 1, 1, 1), uuu = (1, 0, 0, 1), vvv = (0, i, i, 0); (c) K = Z5, V = Z3 5, xxx = (0, 1, 2, 3)T , yyy = (1, 2, 3, 4)T , zzz = (2, 1, 0, 4)T , uuu = (1, 3, 0, 2)T , vvv = (3, 4, 0, 1)T ; (d) K = Q, V = Q(3) [x], f0(x) = 1, f1(x) = 1 + x, f2(x) = (1 + x)2 , f3(x) = (1 + x)3 . 5.3. Doplňte uvedené vektory do bázy vektorového priestoru V nad poľom K (ak je to možné; ak to nie je možné, zdôvodnite prečo): (a) K = R, V = R(2) [x], g(x) = 1 + 2x + 7x2 , h(x) = 1 + x; (b) K = C, V = C4 , uuu = (1 + i, 1 − i, 2, 2i)T , vvv = (1 + 3i, 3 − i, 4 + 2i, −2 + 4i)T ; (c) K = Z7, V = Z (3) 7 [x], f0(x) = 5 + 6x + 5x2 + 6x3 , f1(x) = 6 + 5x + 6x2 + 5x3 ; (d) K = Z11, V = Z (3) 11 [x], f0(x) = 5 + 6x + 5x2 + 6x3 , f1(x) = 6 + 5x + 6x2 + 5x3 . 5.4. V každej z úloh cvičení 5.2 a 5.3 určte dimenziu lineárneho podpriestoru generovaného všetkými danými vektormi. 5.5. Dokážte tvrdenie 5.3.2 5.6. Podrobne dokážte, že εεε(n) = (eee1, . . . ,eeen) je báza vektorového priestoru Kn . 5.7. Doplňte vynechané podrobnosti v príklade 5.3.5 5.8. Dokážte, že uvedená konečná postupnosť vektorov βββ tvorí bázu vektorového priestoru V nad poľom K a nájdite súradnice vektorov xxx, yyy v tejto báze. (a) K = R, V = R3 , βββ = (1, 2, 3)T , (1, −1, 1)T , (2, 1, 0)T , xxx = (1, 1, 1)T , yyy = (0, 1, −2)T ; 120 5. Báza a dimenzia (b) K = C, V = C(2) [z], βββ = (1 + i, 1 + iz, i − z2 ), xxx = f(z) = z, yyy = g(z) = 1 + z2 ; (c) K = Z2, V = Z4 2, βββ = (1, 1, 0, 0)T , (0, 0, 1, 1)T , (1, 0, 0, 1)T , (0, 1, 1, 1)T ), xxx = (1, 0, 0, 0)T , yyy = (1, 1, 1, 0)T ; (d) K = R, V = C, βββ = (1 + i, 1 − i), xxx = 1, yyy = i. 5.9. Dokážte, že vektory uuu1, . . . ,uuuk,vvv1, . . . ,vvvm−k,www1, . . . ,wwwn−k z dôkazu vety 5.4.1 naozaj generujú lineárny podpriestor S + T. 5.10. Zovšeobecnite dôsledok 5.4.2 na súčet ľubovoľného konečného počtu lineárnych podpriestorov a dokážte toto zovšeobecnenie. 5.11. Doplňte vynechané podrobnosti v dôkaze tvrdenia 5.4.3 5.12. Nech AAA ∈ Km×n je matica v stupňovitom tvare. Dokážte, že (a) jej nenulové riadky tvoria bázu lineárneho podpriestoru [rrr1(AAA), . . . ,rrrm(AAA)] ⊆ K1×n ; (b) jej stĺpce, v ktorých ležia vedúce prvky jej riadkov, tvoria bázu lineárneho pod- priestoru [sss1(AAA), . . . ,sssn(AAA)] ⊆ Km×1 . (c) Odvoďte z (a) a (b), že pre matice v stupňovitom tvare platí dim[rrr1(AAA), . . . ,rrrm(AAA)] = dim[sss1(AAA), . . . ,sssn(AAA)]. 5.13. Nech AAA, BBB ∈ Km×n . Dokážte postupne nasledujúce tvrdenia: (a) AAA ∼ BBB ⇒ [rrr1(AAA), . . . ,rrrm(AAA)] = [rrr1(BBB), . . . ,rrrm(BBB)]. (b) Ak AAA ∼ BBB a BBB je navyše v stupňovitom tvare, tak jej nenulové riadky tvoria bázu lineárneho podpriestoru [rrr1(AAA), . . . ,rrrm(AAA)] ⊆ K1×n . (c) Na základe (b) sformulujte postup, ako možno úpravou vhodnej matice pomocou ERO nájsť k daným (riadkovým) vektorom xxx1, . . . ,xxxm ∈ Kn nejakú bázu ich lineárneho obalu [xxx1, . . . ,xxxm]. Táto báza nie je spravidla (až na veľmi špeciálne prípady) vybraná z vektorov xxx1, . . . ,xxxm, na druhej strane však možno úpravou príslušnej matice na redukovaný stupňovitý tvar dosiahnuť veľmi jednoduchý a prehľadný tvar tejto bázy. (d) Riešte analogickú úlohu ako v (c) pre stĺpcové vektory. 5.14. S využitím cvičenia 5.13(b) nanovo dokážte jednoznačnosť redukovaného stupňovitého tvaru danej matice, t. j. pre ľubovoľné matice AAA, BBB ∈ KKKm×n v redukovanom stupňovitom tvare platí AAA ∼ BBB ⇒ AAA = BBB (porovnaj s cvičením 3.13) (Návod: Uvedomte si, že sa stačí obmedziť na matice s nenulovými riadkami, a ďalej postupujte indukciou podľa počtu riadkov m.) 5.15. S použitím cvičenia 5.14 dokážte zosilnenie tvrdenia z cvičenia 5.13 (a) do podoby ekvivalencie, t. j. pre ľubovoľné AAA, BBB ∈ Km×n platí AAA ∼ BBB ⇔ [rrr1(AAA), . . . ,rrrm(AAA)] = [rrr1(BBB), . . . ,rrrm(BBB)]. 5.16. S využitím výsledkov cvičenia 5.13 nájdite pre uvedené vektory z vektorového priestoru V nad poľom K „čo najjednoduchšiu bázu ich lineárneho obalu a doplňte ju (ak treba) do „čo najjednoduchšej bázy celého priestoru V : (a) K = R, V = R4 , xxx = (2, 0, 0, 3), yyy = (4, −1, 4, 0), zzz = (2, −1, 4, 3), uuu = Cvičenia 121 (−2, 2, −8, −9); (b) K = R, V = R4 , xxx = (0, 0, 2, −1)T , yyy = (3, −1, 2, 0)T , zzz = (−3, 1, 2, −2)T , uuu = (2, −1, 1, −2)T ; (c) K = C, V = C3 , xxx = (i, 1, 1 + i), yyy = (1 + i, 1 − i, 2), zzz = (2, −i, 3 − 2i)T ; (d) K = R, V = R(3) [x], f(x) = 2 + x + x2 − x3 , g(x) = 2x2 − x3 , h(x) = 1 − x + 2x2 ; (e) K = Z5, V = Z3 5, xxx = (2, 4, 3), yyy = (0, 1, 2), zzz = (4, 0, 0); (f) K = Z7, V = Z (2) 7 [x], f(x) = 2 + 4x + 3x2 , g(x) = x + 2x2 , h(x) = 4. 5.17. Nech q = ±1 je ľubovoľné reálne číslo. Pre k, n ∈ N, k ≤ n, definujme q-binomický koeficient ako výraz n k q = (qn − 1)(qn−1 − 1) . . . (qn−k+1 − 1) (qk − 1)(qk−1 − 1) . . . (q − 1) . Špeciálne pre k = 0 sa tým myslí n 0 q = 1. Pre k > n navyše kladieme n k q = 0. Potom pre ľubovoľné k ≤ n platí: (a) n k q = n n−k q , (b) n k = lim q→1 n k q , (c) n 0 q = n n q = 1, (d) n+1 k q = n k−1 q + qk n k q = qn−k+1 n k−1 q + n k q , ak 1 ≤ k ≤ n. Dokážte. Rovnosti (c) a (d) sa nazývajú pravidlami q-Pascalovho trojuholníka pre q-binomické koeficienty (porovnaj s cvičením 0.18). 5.18. Nech pole K je konečné a má práve q prvkov. Pre k, n ∈ N označme Cq(n, k) počet všetkých k-rozmerných lineárnych podpriestorov vektorového priestoru Kn . Dokážte postupne nasledujúce tvrdenia: (a) Pre ľubovoľné n platí Cq(n, 0) = Cq(n, n) = 1 a Cq(n, k) = 0 pre k > n. (b) Cq(n, k) sa rovná počtu všetkých matíc AAA ∈ Kk×n v redukovanom stupňovitom tvare, ktoré majú všetky riadky nenulové. (Návod: Uvažujte Kn ako priestor riadkových vektorov a na základe cvičení 5.13 a 5.14 reprezentujte každý jeho k-rozmerný lineárny podpriestor jednoznačne určenou bázou, ktorej vektory, zapísané ako riadky pod sebou, tvoria maticu v redukovanom stupňovitom tvare.) (c) Pre 1 ≤ k ≤ n platí Cq(n + 1, k) = Cq(n, k − 1) + qk Cq(n, k). To spolu s (a) zabezpečuje, že čísla Cq(n, k) vyhovujú rovnakým podmienkam q-Pascalovho trojuholníka ako q-binomické koeficienty n k q . (Návod: Využite (b); matice AAA ∈ Kk×(n+1) v redukovanom stupňovitom tvare s nenulovými riadkami rozdeľte do dvoch skupín podľa toho, či vedúci prvok posledného riadku leží alebo neleží v poslednom stĺpci – ukážte, že prvých je Cq(n, k − 1) a druhých qk Cq(n, k).) (d) Odvoďte z (a) a (c) rovnosť Cq(n, k) = n k q pre všetky k, n ∈ N. (e) Koľko k-rozmerných lineárnych podpriestorov majú vektorové priestory Zn p nad poľom Zp pre p = 2, 3, 5, 7, n = 0, 1, 2, 3, 4, 5, 0 ≤ k ≤ n? Zostrojte počiatočné úseky príslušných p-Pascalových trojuholníkov. 5.19. Nech K je pole a (pk(x))∞ k=0 je postupnosť polynómov z K[x] taká, že stupeň polynómu pk(x) je práve k. Dokážte, že postupnosť (pk(x)) je bázou vektorového priestoru K[x] (využite cvičenie 4.11). 6. Lineárne zobrazenia Zatiaľ sme sa pri štúdiu lineárnej algebry sústredili zakaždým na štruktúru jedného, izolovaného vektorového priestoru. Doteraz sme si nevybudovali pojmy, ktoré by nám umožnili štúdium vzťahov medzi viacerými vektorovými priestormi. V tejto kapitole hodláme zaplniť túto medzeru. Zavedieme a bližšie preskúmame pojem lineárneho zobrazenia, ktorý nám umožní porovnávať štruktúry rôznych vektorových priestorov nad tým istým pevne zvoleným poľom. Voľne povedané, pôjde o zobrazenia medzi vektorovými priestormi, ktoré zachovávajú ich lineárnu štruktúru. 6.1 Lineárne zobrazenia Nech U, V sú vektorové priestory nad tým istým poľom K. Hovoríme, že ϕ: V → U je lineárne zobrazenie, ak ϕ zachováva operácie vektorového súčtu a skalárneho násobku, t. j. ak pre ľubovoľné xxx,yyy ∈ V , c ∈ K platí ϕ(xxx + yyy) = ϕ(xxx) + ϕ(yyy), ϕ(cxxx) = cϕ(xxx). Prvú z uvedených vlastností niekedy nazývame aditivitou a druhú homogenitou. Ako cvičenie si dokážte, že lineárne zobrazenia zachovávajú nulu a opačné vektory, t. j. pre lineárne zobrazenie ϕ: V → U a xxx ∈ V platí ϕ(0) = 0, ϕ(−xxx) = −ϕ(xxx). Zrejme pre každý vektorový priestor V identita idV : V → V je lineárne zobrazenie. Taktiež pre ľubovoľné vektorové priestory U, V nad poľom K zobrazenie 0: V → U, ktoré každému vektoru xxx ∈ V priradí nulový vektor 0 ∈ U, je lineárne. Komutatívnosť operácie súčinu v poli a jeho distributívnosť vzhľadom na sčítanie znamená, že pre ľubovoľný pevný skalár a ∈ K je priradením x → ax definované lineárne zobrazenie K → K. Čoskoro sa zoznámime aj s menej triviálnymi príkladmi lineárnych zobrazení. No zatiaľ si ešte všimnime jednu odlišnosť v použití názvu „lineárne zobrazenie v lineárnej algebre oproti matematickej analýze, kde sa pod lineárnou funkciou R → R rozumie ľubovoľná funkcia tvaru f(x) = ax + b, kde a, b ∈ R. Ľahko sa možno presvedčiť, že takéto f : R → R je lineárne zobrazenie v zmysle našej definície práve vtedy, keď b = 0. Neskôr zavedieme širšiu triedu zobrazení medzi vektorovými priestormi, ktorá zahŕňa aj takéto „v zmysle matematickej analýzy lineárne zobrazenia. 6.1. Lineárne zobrazenia 123 Lineárne zobrazenia možno charakterizovať ako zobrazenia medzi vektorovými priestormi (nad tým istým poľom), ktoré zachovávajú lineárne kombinácie. Jednoduchý dôkaz tohto pozorovania prenechávame čitateľovi. (Návod: Pozrite sa na dôkaz tvrdenia 4.1.2) 6.1.1. Tvrdenie. Nech U, V sú vektorové priestory nad poľom K a ϕ: V → U je ľubovoľné zobrazenie. Nasledujúce podmienky sú ekvivalentné: (i) ϕ je lineárne zobrazenie; (ii) pre všetky xxx,yyy ∈ V , a, b ∈ K platí ϕ(axxx + byyy) = aϕ(xxx) + bϕ(yyy); (iii) pre ľubovoľné n ∈ N a všetky xxx1, . . . ,xxxn ∈ V , c1, . . . , cn ∈ K platí ϕ(c1xxx1 + . . . + cnxxxn) = c1ϕ(xxx1) + . . . + cnϕ(xxxn). Nasledujúce dve tvrdenia zachytávajú významné vlastnosti lineárnych zobrazení: kompozícia lineárnych zobrazení je opäť lineárne zobrazenie a obrazy i vzory lineárnych podpriestorov v lineárnych zobrazeniach sú tiež lineárnymi podpriestormi. 6.1.2. Tvrdenie. Nech U, V , W sú vektorové priestory nad poľom K a ψ: W → V , ϕ: V → U sú lineárne zobrazenia. Potom aj ich kompozícia ϕ ◦ ψ: W → U je lineárne zobrazenie. Dôkaz. Overíme, že i zložené zobrazenie ϕ◦ψ zachováva lineárne kombinácie. Nech xxx,yyy ∈ W, a, b ∈ K. S využitím linearity zobrazení ψ a ϕ postupne dostávame (ϕ ◦ ψ)(axxx + byyy) = ϕ(ψ(axxx + byyy)) = ϕ(aψxxx + bψyyy) = aϕ(ψxxx) + bϕ(ψyyy) = a(ϕ ◦ ψ)(xxx) + b(ϕ ◦ ψ)(yyy). Podľa tvrdenia 6.1.1 to znamená, že zobrazenie ϕ ◦ ψ je lineárne. 6.1.3. Tvrdenie. Nech U, V sú vektorové priestory nad poľom K a ϕ: V → U je lineárne zobrazenie. (a) Ak S je lineárny podpriestor priestoru V , tak ϕ(S) je lineárny podpriestor priestoru U. (b) Ak T je lineárny podpriestor priestoru U, tak ϕ−1 (T) je lineárny podpriestor priestoru V . Dôkaz. (a) Keďže 0 ∈ S, 0 = ϕ(0) ∈ ϕ(S). Overíme, že obraz ϕ(S) je uzavretý vzhľadom na lineárne kombinácie. Nech a, b ∈ K, uuu,vvv ∈ ϕ(S). Potom existujú xxx,yyy ∈ S také, že uuu = ϕ(xxx), vvv = ϕ(yyy). S využitím linearity ϕ dostávame: auuu + bvvv = aϕ(xxx) + bϕ(yyy) = ϕ(axxx + byyy) ∈ ϕ(S), lebo axxx + byyy ∈ S, nakoľko S ⊆ V je lineárny podpriestor. 124 6. Lineárne zobrazenia (b) Keďže ϕ(0) = 0 ∈ T, 0 ∈ ϕ−1 (T). Ukážeme, že aj vzor ϕ−1 (T) je uzavretý vzhľadom na lineárne kombinácie. Zvoľme a, b ∈ K, xxx,yyy ∈ ϕ−1 (T). To znamená, že ϕ(xxx), ϕ(yyy) ∈ T. Z linearity ϕ vyplýva ϕ(axxx + byyy) = aϕ(xxx) + bϕ(yyy) ∈ T, lebo T ⊆ U je lineárny podpriestor. Preto axxx + byyy ∈ ϕ−1 (T). 6.1.4. Príklad. Nech K je pole. Distributívnosť súčinu matíc vzhľadom na ich súčet a jeho zameniteľnosť s operáciou skalárneho násobku (pozri odstavec 2.2.2) vlastne hovorí, že pre pevné m, n, p ∈ N a ľubovoľnú maticu AAA ∈ Km×n je priradením XXX → AAA · XXX definované lineárne zobrazenie medzi vektorovými priestormi matíc Kn×p → Km×p . Podobne je priradením YYY → YYY · AAA definované lineárne zobrazenie Kp×m → Kp×n . Špeciálne pre p = 1 je takto definované lineárne zobrazenie xxx → AAA · xxx medzi stĺpcovými vektorovými priestormi Kn → Km , resp. lineárne zobrazenie yyy → yyy ·AAA medzi riadkovými vektorovými priestormi Km → Kn . Neskôr uvidíme, že každé lineárne zobrazenie medzi konečnorozmernými vektorovými priestormi nad K má „v podstate takúto podobu. 6.1.5. Príklad. Nech K je pole. Pre m, n ∈ N a pevné 1 ≤ i ≤ m, 1 ≤ j ≤ n sú predpismi AAA → rrri(AAA), AAA → sssj(AAA) definované lineárne zobrazenia Km×n → K1×n resp. Km×n → Km×1 . Takisto AAA → AAAT je lineárne zobrazenie Km×n → Kn×m . 6.1.6. Príklad. Nech V je vektorový priestor nad poľom K, X je množina a x ∈ X je pevne zvolený prvok. Pripomeňme, že V X je vektorový priestor všetkých funkcií f : X → V (pozri 1.6.5) Dosadenie prvku x do funkcie f, t. j. priradenie f → f(x), je lineárne zobrazenie V X → V . Podobne, pre ľubovoľnú podmnožinu Y ⊆ X je zúženie f → f Y lineárne zobrazenie V X → V Y . 6.1.7. Príklad. Označme V množinu všetkých konvergentných postupností reálnych čísel. Zrejme V je lineárny podpriestor vektorového priestoru RN všetkých postupností reálnych čísel. Potom zobrazenie V → R, ktoré postupnosti aaa = (an)∞ n=0 ∈ V priradí jej limitu limn→∞ an, je lineárne. 6.1.8. Príklad. (a) Nech X ⊆ R a V označuje množinu všetkých zobrazení X → R, ktoré majú v pevne zvolenom vnútornom bode a množiny X konečnú deriváciu. Zrejme V je lineárny podpriestor vektorového priestoru RX . Potom zobrazenie V → R, ktoré funkcii f ∈ V priradí jej deriváciu f (a) v bode a, je lineárne. (b) Nech X ⊆ R je ľubovoľný netriviálny interval. Pripomeňme, že D(X) označuje lineárny podpriestor vektorového priestoru RX , tvorený všetkými 6.2. Jadro a obraz lineárneho zobrazenia 125 funkciami f : X → R, ktoré majú v každom bode x ∈ X konečnú deriváciu (pozri príklad 4.1.3 (c). Potom derivácia, t. j. priradenie f → f , je lineárne zobrazenie D(X) → RX . 6.1.9. Príklad. Pre reálne čísla a < b označuje C a, b lineárny podpriestor vektorového priestoru R a,b , tvorený všetkými spojitými funkciami f : a, b → R (pozri príklad 4.1.3 (b)). (a) Určitý integrál f → b a f(x) dx je lineárne zobrazenie C a, b → R. (b) Podobne, na určitý integrál ako funkciu hornej medze, ktorý funkcii f ∈ C a, b priradí jej primitívnu funkciu F ∈ C a, b danú predpisom F(x) = x a f(t) dt, (a ≤ x ≤ b), sa možno dívať ako na lineárne zobrazenie C a, b → C a, b . 6.2 Jadro a obraz lineárneho zobrazenia Nech ϕ: V → U je lineárne zobrazenie medzi vektorovými priestormi nad poľom K. Jeho jadrom nazývame množinu Ker ϕ = ϕ−1 (0) = {xxx ∈ V ; ϕ(xxx) = 0}. Obrazom lineárneho zobrazenia ϕ nazývame, v zhode s paragrafom 0.3, mno- žinu Im ϕ = ϕ(V ) = {ϕ(xxx); xxx ∈ V }. (Označenie pochádza z anglických slov kernel a image.) Keďže {0} je lineárny podpriestor priestoru U a V je lineárny podpriestor priestoru V , ako špeciálny prípad tvrdenia 6.1.3 dostávame nasledujúci výsledok. 6.2.1. Tvrdenie. Nech ϕ: V → U je lineárne zobrazenie medzi vektorovými priestormi nad poľom K. Potom Ker ϕ je lineárny podpriestor priestoru V a Im ϕ je lineárny podpriestor priestoru U. Pomocou pojmov jadra a obrazu možno charakterizovať injektívne resp. surjektívne lineárne zobrazenia. 6.2.2. Veta. Nech ϕ: V → U je lineárne zobrazenie. Potom (a) ϕ je injektívne práve vtedy, keď Ker ϕ = {0}; (b) ϕ je surjektívne práve vtedy, keď Im ϕ = U. 126 6. Lineárne zobrazenia Dôkaz. (a) Ak ϕ je injektívne, tak 0 ∈ V je jediný prvok priestoru V , ktorý sa zobrazí na 0 ∈ U. Teda Ker ϕ = {0}. Naopak, ak ϕ nie je injektívne, tak existujú xxx,yyy ∈ V také, že xxx = yyy a ϕ(xxx) = ϕ(yyy). Potom xxx − yyy = 0 a ϕ(xxx−yyy) = ϕ(xxx)−ϕ(yyy) = 0, teda xxx−yyy ∈ Ker ϕ. Inak povedané, Ker ϕ = {0}. (b) je priamo definícia surjektívnosti. Treba poznamenať, že zakiaľ časť (b) uvedeného tvrdenia je triviálna a platí aj bez predpokladu linearity zobrazenia ϕ, o časti (a) to už povedať nemožno. Pre všeobecné zobrazenie ϕ: V → U by sa totiž mohlo stať, že 0 ∈ V je jediný prvok, ktorý sa zobrazí na 0 ∈ U, no ϕ aj tak nie je injektívne. Stále by totiž mohol existovať nejaký vektor 0 = uuu ∈ U a dva rôzne vektory xxx,yyy ∈ V také, že ϕ(xxx) = uuu = ϕ(yyy). Spomínané tvrdenie teda hovorí, že lineárne zobrazenia majú značne homogénnu štruktúru, takže ich injektivitu nemusíme zisťovať „všade – dá sa rozpoznať už podľa množiny vzorov jediného prvku 0 ∈ U. 6.2.3. Veta. Nech ϕ: V → U je lineárne zobrazenie, pričom vektorový priestor V je konečnorozmerný. Potom aj Ker ϕ a Im ϕ sú konečnorozmerné priestory a platí dim V = dim Ker ϕ + dim Im ϕ. Dôkaz. Stačí dokázať uvedenú rovnosť pre dimenzie, konečný rozmer podpriestorov Ker ϕ a Im ϕ je už jej dôsledkom. Označme k = dim Ker ϕ, l = dim V − k. Zrejme l ≥ 0. Nech uuu1, . . . ,uuuk je nejaká báza priestoru Ker ϕ. Doplňme ju do bázy uuu1, . . . ,uuuk,vvv1, . . . ,vvvl priestoru V . Potom ϕ(uuu1) = . . . = ϕ(uuuk) = 0. Dokážeme, že vektory ϕ(vvv1), . . . , ϕ(vvvl) tvoria bázu priestoru Im ϕ, z čoho už vyplýva požadovaná rovnosť. Najprv dokážeme, že vektory ϕ(vvv1), . . . , ϕ(vvvl) generujú podpriestor Im ϕ ⊆ U. Každý vektor www ∈ Im ϕ možno vyjadriť v tvare www = ϕ(xxx) pre nejaké xxx ∈ V , ktoré je vhodnou lineárnou kombináciou xxx = a1uuu1 + . . . + akuuuk + b1vvv1 + . . . + blvvvl vektorov uuu1, . . . ,uuuk,vvv1, . . . ,vvvl bázy priestoru V . Potom www = ϕ(xxx) = ϕ(a1uuu1 + . . . + akuuuk + b1vvv1 + . . . + blvvvl) = a1ϕ(uuu1) + . . . + akϕ(uuuk) + b1ϕ(vvv1) + . . . + blϕ(vvvl) = b1ϕ(vvv1) + . . . + blϕ(vvvl), teda www ∈ [ϕ(vvv1), . . . , ϕ(vvvl)]. Zostáva dokázať lineárnu nezávislosť vektorov ϕ(vvv1), . . . , ϕ(vvvl). Nech c1, . . . , cl sú skaláry také, že c1ϕ(vvv1)+. . .+clϕ(vvvl) = 0. Potom ϕ(c1vvv1 +. . .+clvvvl) = 0, teda c1vvv1 + . . . + clvvvl ∈ Ker ϕ. Preto sa tento vektor musí dať vyjadriť ako lineárna kombinácia c1vvv1+. . .+clvvvl = d1uuu1+. . .+dkuuuk vektorov bázy uuu1, . . . ,uuuk podpriestoru Ker ϕ. Z lineárnej nezávislosti bázy uuu1, . . . ,uuuk,vvv1, . . . ,vvvl priestoru V vyplýva c1 = . . . = cl = 0 = d1 = . . . = dk, teda aj nezávislosť vektorov ϕ(vvv1), . . . , ϕ(vvvl). 6.3. Lineárne izomorfizmy 127 Dimenziu obrazu Im ϕ nazývame hodnosťou lineárneho zobrazenia ϕ a značíme ju h(ϕ) = dim Im ϕ. Lineárne zobrazenie ϕ: V → V vektorového priestoru V do seba nazývame lineárnym operátorom alebo lineárnou transformáciou. Ako sme spomínali v paragrafe 0.5, transformácia f : X → X konečnej množiny X je injektívna práve vtedy, keď je surjektívna. Ako dôsledok práve dokázanej vety dostávame analogický výsledok aj pre lineárne transformácie konečnorozmerných vektorových priestorov. 6.2.4. Dôsledok. Nech ϕ: V → V je lineárna transformácia konečnorozmerného vektorového priestoru V . Potom ϕ je injektívna práve vtedy, keď je surjektívna. Dôkaz. Nech dim V = n. Potom ϕ je injektívne práve vtedy, keď dim Ker ϕ = 0, a surjektívne práve vtedy, keď dim Im ϕ = n. Keďže dim Ker ϕ+dim Im ϕ = n, obe tieto podmienky sú ekvivalenté. 6.3 Lineárne izomorfizmy Bijektívne lineárne zobrazenie ϕ: V → U medzi vektorovými priestormi V , U nad tým istým poľom K nazývame lineárny izomorfizmus. Hovoríme, že vektorové priestory V , U sú lineárne izomorfné alebo len krátko izomorfné, označenie V ∼= U, ak existuje nejaký lineárny izomorfizmus ϕ: V → U. 6.3.1. Tvrdenie. Nech U, V , W sú vektorové priestory nad poľom K. (a) idV : V → V je lineárny izomorfizmus. (b) Ak ϕ: V → U je lineárny izomorfizmus, tak aj ϕ−1 : U → V je lineárny izomorfizmus. (c) Ak ψ: W → V , ϕ: V → U sú lineárne izomorfizmy, tak aj ϕ◦ψ: W → U je lineárny izomorfizmus. Dôkaz. (a) je triviálne, (c) vyplýva z toho, že kompozícia bijekcií je bijekcia a kompozícia lineárnych zobrazení je lineárne zobrazenie. Zostáva dokázať (b). Treba overiť, že inverzné zobrazenie ϕ−1 : U → V k lineárnej bijekcii ϕ: V → U je tiež lineárne (jeho bijektívnosť je totiž zrejmá). Zvoľme uuu,vvv ∈ U, a, b ∈ K. Máme dokázať rovnosť ϕ−1 (auuu + bvvv) = aϕ−1 (uuu) + bϕ−1 (vvv), ktorá je ekvivalentná s podmienkou auuu + bvvv = ϕ aϕ−1 (uuu) + bϕ−1 (vvv) . 128 6. Lineárne zobrazenia Vďaka linearite ϕ a vzťahu ϕ ◦ ϕ−1 = idU naozaj dostávame ϕ aϕ−1 (uuu) + bϕ−1 (vvv) = aϕϕ−1 (uuu) + bϕϕ−1 (vvv) = auuu + bvvv. Z práve dokázaného tvrdenia okamžite vyplýva nasledujúci dôsledok. 6.3.2. Dôsledok. Pre vektorové priestory U, V , W nad tým istým poľom platí: (a) V ∼= V ; (b) V ∼= U ⇒ U ∼= V ; (c) W ∼= V & V ∼= U ⇒ W ∼= U. Hovoríme, že vzťah izomorfnosti ∼= je reflexívny, symetrický a tranzitívny, t. j. je vzťahom ekvivalencie. Z formálneho hľadiska s ním teda môžeme narábať podobne ako so vzťahom rovnosti =. Izomorfné vektorové priestory majú rovnakú štruktúru, líšia sa nanajvýš označením svojich prvkov, nie však vzťahmi medzi nimi. Preto ich možno v prípade potreby stotožniť, či nahradiť jeden vektorový priestor jeho izomorfnou kópiou. Z toho dôvodu je dôležité mať k dispozícii vhodnú triedu vektorových priestorov nad daným poľom, ktorá by pre každý vektorový priestor obsahovala nejaký priestor s ním izomorfný. 6.3.3. Príklad. (a) Nech V je konečnorozmerný vektorový priestor nad poľom K, dim V = n a βββ = (vvv1, . . . ,vvvn) je nejaká jeho báza. Potom tvrdenie 5.3.2 vlastne hovorí, že súradnicové zobrazenie xxx → (xxx)βββ je lineárny izomorfizmus V → Kn . (b) Podobne možno nahliadnuť, že (i v nekonečnorozmernom prípade) určuje Hamelova báza X vektorového priestoru V súradnicové zobrazenie vvv → (vvv)X, ktoré je lineárnym izomorfizmom V → K(X) (pozri záver paragrafu 5.5). Na záver tohto paragrafu ešte ukážeme, že typ izomorfizmu daného konečnorozmerného priestoru je jednoznačne určený jeho dimenziou. 6.3.4. Veta. Nech U, V sú konečnorozmerné vektorové priestory nad poľom K. Potom V ∼= U ⇔ dim V = dim U. Dôkaz. Nech V ∼= U a ϕ: V → U je lineárny izomorfizmus. Potom Ker ϕ = {0} a Im ϕ = U Podľa vety 6.2.3 o dimenzii jadra a obrazu dim V = dim Ker ϕ + dim Im ϕ = 0 + dim U = dim U. Naopak, nech dim V = dim U = n. Podľa príkladu 6.3.3 (a) platí V ∼= Kn ∼= U. 6.4. Matica lineárneho zobrazenia 129 Teda konečnorozmerný vektorový priestor V nad poľom K je izomorfný so stĺpcovým (no rovnako aj s riadkovým) vektorovým priestorom Kn práve vtedy, keď n = dim V . Pritom každá báza βββ priestoru V určuje jeden takýto izomorfizmus V → Kn – je ním súradnicové zobrazenie xxx → (xxx)βββ. 6.4 Matica lineárneho zobrazenia Uvažujme nejaké lineárne zobrazenie ϕ: Kn → Km . V priestore Kn máme kanonickú bázu εεε(n) = (eee1, . . . ,eeen). Keďže obrazy ϕ(eeej) vektorov tejto bázy sú stĺpcové vektory z priestoru Km , môžeme vytvoriť maticu AAA = (ϕ(eee1), . . . , ϕ(eeen)) ∈ Km×n , ktorej stĺpcami sú práve tieto vektory, t. j. platí sssj(AAA) = ϕ(eeej) pre 1 ≤ j ≤ n. Ukážeme, ako možno obraz ϕ(xxx) ľubovoľného vektora xxx = (x1, . . . , xn)T ∈ Kn vypočítať len zo znalosti tejto matice. Uvedomme si, že xxx = x1eee1 +· · ·+xneeen, a počítajme ϕ(xxx) = ϕ(x1eee1 + . . . + xneeen) = x1ϕ(eee1) + . . . + xnϕ(eeen) = (sss1(AAA), . . . ,sssn(AAA)) ·   x1 ... xn   = AAA · xxx Teda každé lineárne zobrazenie ϕ: Kn → Km má tvar ϕ(xxx) = AAA · xxx pre vhodnú maticu AAA ∈ Km×n . Keďže každý konečnorozmerný vektorový priestor nad poľom K je izomorfný s priestorom Kn pre n = dim V , pri voľbe pevných báz v konečnorozmerných priestoroch U, V bude možné ľubovoľné lineárne zobrazenie ϕ: V → U zakódovať pomocou vhodnej matice AAA. Nech U, V sú konečnorozmerné vektorové priestory nad poľom K, dim U = m, dim V = n a ααα = (uuu1, . . . ,uuum), βββ = (vvv1, . . . ,vvvn) sú bázy v U, resp. vo V . Maticou lineárneho zobrazenia ϕ: V → U vzhľadom na bázy βββ, ααα nazývame maticu AAA = (ϕvvv1)ααα, . . . , (ϕvvvn)ααα ∈ Km×n , ktorej stĺpce sú tvorené súradnicami obrazov ϕ(vvvj) vektorov bázy βββ vzhľadom na bázu ααα, t. j. platí sssj(AAA) = (ϕvvvj)ααα pre 1 ≤ j ≤ n. Túto maticu značíme tiež AAA = (ϕ)ααα,βββ. (Všimnite si obrátené poradie znakov báz voči poradiu vektorových priestorov v označení zobrazenia ϕ: V → U.) Maticu AAA zo začiatku tohto paragrafu by sme teda mohli nazvať maticou lineárneho zobrazenia ϕ: Kn → Km vzhľadom na kanonické bázy εεε(n) , 130 6. Lineárne zobrazenia εεε(m) . Pokiaľ nepovieme inak, budeme pod maticou lineárneho zobrazenia ϕ: Kn → Km medzi stĺpcovými vektorovými priestormi vždy rozumieť maticu (ϕ)εεε(m),εεε(n) zobrazenia ϕ vzhľadom na kanonické bázy. Pri štúdiu lineárnych transformácií ϕ: V → V konečnorozmerného vektorového priestoru V budeme spravidla vzory i obrazy vektorov z V vyjadrovať v tej istej báze. Maticou lineárnej transformácie ϕ: V → V vzhľadom na bázu ααα priestoru V teda rozumieme maticu (ϕ)ααα = (ϕ)ααα,ααα. Pri dôkaze nasledujúcej vety bude potrebné si uvedomiť, že (vvvj)βββ = eee (n) j pre ľubovoľný vektor vvvj bázy βββ = (vvv1, . . . ,vvvn) priestoru V . Z toho je zrejmé, že pre každú bázu βββ n-rozmerného vektorového priestoru V platí (idV )βββ,βββ = IIIn. 6.4.1. Veta. Nech ϕ: V → U je lineárne zobrazenie medzi konečnorozmernými vektorovými priestormi nad poľom K, dim V = n, dim U = m a ααα, βββ sú bázy priestorov U resp. V . Potom pre všetky xxx ∈ V platí (ϕxxx)ααα = (ϕ)ααα,βββ · (xxx)βββ a AAA = (ϕ)ααα,βββ je jediná matica s touto vlastnosťou. Dôkaz. Nech βββ = (vvv1, . . . ,vvvn). Zvoľme ľubovoľný vektor xxx ∈ V a označme (xxx)βββ = (x1, . . . , xn)T , teda xxx = x1evvv1 +· · ·+xnvvvn. Podobne ako v špeciálnom prípade zo začiatku tohto paragrafu, i teraz dostávame ϕ(xxx) = ϕ(x1vvv1 + . . . + xnvvvn) = x1ϕ(vvv1) + . . . + xnϕ(vvvn), (ϕxxx)ααα = x1ϕ(vvv1) + . . . + xnϕ(vvvn) ααα = x1(ϕvvv1)ααα + . . . + xn(ϕvvvn)ααα = (ϕvvv1)ααα, . . . , (ϕvvvn)ααα ·   x1 ... xn   = (ϕ)ααα,βββ · (xxx)βββ. Zostáva ukázať, že pre ľubovoľnú maticu AAA ∈ Km×n platí ∀xxx ∈ V (ϕxxx)ααα = AAA · (xxx)βββ ⇒ AAA = (ϕ)ααα,βββ. Za uvedeného predpokladu voľbou xxx = vvvj dostávame (ϕvvvj)ααα = AAA · (vvvj)βββ = AAA · eeej = sssj(AAA) pre každé 1 ≤ j ≤ n. Teda matice AAA a (ϕ)ααα,βββ majú rovnaké stĺpce, preto sa rovnajú. 6.4. Matica lineárneho zobrazenia 131 Matica (ϕ)ααα,βββ lineárneho zobrazenia ϕ: V → U z n-rozmerného vektorového priestoru V do m-rozmerného vektorového priestoru U nad poľom K vzhľadom na bázy βββ, ααα je teda medzi všetkými maticami AAA ∈ Km×n jednoznačne určená podmienkou (ϕxxx)ααα = AAA · (xxx)βββ pre každé xxx ∈ V . Ďalej si ukážeme, že skladanie lineárnych zobrazení zodpovedá násobeniu matíc, čo umožňuje vypočítať maticu kompozície lineárnych zobrazení ϕ ◦ ψ len zo znalosti matíc jednotlivých zobrazení ϕ a ψ. Tento výsledok definitívne „ospravedlňuje spôsob, akým sme súčin matíc definovali v odstavci 2.2.2 6.4.2. Veta. Nech U, V , W sú konečnorozmerné vektorové priestory nad poľom K, ααα je báza U, βββ je báza V a γγγ je báza W. Potom pre ľubovoľné lineárne zobrazenia ψ: W → V , ϕ: V → U platí (ϕ ◦ ψ)ααα,γγγ = (ϕ)ααα,βββ · (ψ)βββ,γγγ. Dôkaz. Označme AAA = (ϕ)ααα,βββ maticu lineárneho zobrazenia ϕ vzhľadom na bázy βββ, ααα a BBB = (ψ)βββ,γγγ maticu lineárneho zobrazenia ψ vzhľadom na bázy γγγ, βββ. Dokážeme rovnosť (ϕ ◦ ψ)ααα,γγγ = AAA · BBB. Na základe definície matíc AAA, BBB pre ľubovoľné xxx ∈ W platí (ϕ ◦ ψ)xxx ααα = ϕ(ψxxx) ααα = AAA · (ψxxx)βββ = AAA · BBB · (xxx)γγγ = (AAA · BBB) · (xxx)γγγ. Keďže matica kompozície ϕ ◦ ψ vzhľadom na bázy γγγ, ααα je podľa vety 6.4.1 touto podmienkou určená jednoznačne, dôkaz je hotový. V nasledujúcich príkladoch sa zoznámime s niekoľkými dôležitými lineárnymi transformáciami roviny R2 a ich maticami vzhľadom na kanonickú bázu εεε = (eee1,eee2). 6.4.3. Príklad. Otočenie roviny okolo počiatku o uhol α ∈ R je lineárne zobrazenie RRRα : R2 → R2 . Homogenita je zrejmá na prvý pohľad. O aditivite sa presvedčíme nasledujúcou úvahou. Ak otočíme rovnobežník vektorov xxx,yyy ∈ R2 o uhol α, dostaneme tak rovnobežník prislúchajúci vektorom RRRα(xxx),RRRα(yyy). Pritom uhlopriečka prvého rovnobežníka prejde na uhlopriečku druhého. Teda RRRα(xxx + yyy) = RRRα(xxx) + RRRα(yyy) (nakreslite si obrázok). Maticu tohto lineárneho zobrazenia vzhľadom na kanonickú bázu εεε budeme značiť rovnako RRRα, teda pre xxx ∈ R2 budeme písať RRRα(xxx) = RRRα ·xxx. Jej stĺpce získame 132 6. Lineárne zobrazenia otočením vektorov eee1 = (1, 0)T , eee2 = (0, 1)T o uhol α. Z definície goniometrických funkcií sínus a kosínus pomocou jednotkovej kružnice priamo dostávame RRRα · eee1 = cos α sin α , RRRα · eee2 = cos π 2 + α sin π 2 + α = − sin α cos α . To znamená, že RRRα = cos α − sin α sin α cos α a obrazom ľubovoľného vektora (x, y)T ∈ R2 v otočení RRRα je vektor RRRα x y = x cos α − y sin α x sin α + y cos α . Na základe znalostí matíc RRRα je už jednoduché napísať matice otočení v R3 okolo súradných osí vzhľadom na kanonickú bázu εεε = (eee1,eee2,eee3). Otočenia okolo osí x = [eee1], y = [eee2] resp z = [eee3] o uhol α majú postupne matice   1 0 0 0 cos α − sin α 0 sin α cos α   ,   cos α 0 sin α 0 1 0 − sin α 0 cos α   ,   cos α − sin α 0 sin α cos α 0 0 0 1   . Na orientáciu otočení používame pravidlo pravej ruky, t. j. prsty pravej ruky ukazujú smer otáčania a palec určuje orientáciu osi: v prvom prípade prsty od vektora eee2 k eee3 a palec v smere vektora eee1, v druhom prsty od eee3 k eee1 a palec v smere eee2, v treťom prsty od eee1 k eee2 a palec v smere eee3. 6.4.4. Príklad. Osová súmernosť roviny podľa ľubovoľnej priamky prechádzajúcej počiatkom definuje zobrazenie SSSα : R2 → R2 , kde α ∈ R je uhol, ktorý zviera os súmernosti s osou x. Obdobnou úvahou ako v prípade otočení možno nahliadnuť, že i SSSα je lineárne zobrazenie. Jeho maticu vzhľadom na kanonickú bázu εεε budeme značiť rovnako SSSα. Zrejme matica súmernosti podľa osi x je SSS0 = 1 0 0 −1 a osovú súmernosť SSSα možno dostať ako kompozíciu otočenia RRR−α, osovej súmernosti SSS0 a otočenia RRRα, t. j. SSSα = RRRα · SSS0 · RRR−α. Po vynásobení príslušných matíc z toho s využitím pár trigonometrických vzorcov dostávame SSSα = cos 2α sin 2α sin 2α − cos 2α . 6.4. Matica lineárneho zobrazenia 133 Teda osová súmernosť SSSα zobrazí vektor (x, y)T ∈ R2 do vektora SSSα x y = x cos 2α + y sin 2α x sin 2α − y cos 2α . 6.4.5. Príklad. Rovnoľahlosť alebo tiež homotetia so stredom v počiatku a s koeficientom podobnosti 0 = c ∈ R je opäť lineárne zobrazenie R2 → R2 s maticou cIII2 = diag(c, c). Tento príklad možno zrejmým spôsobom zovšeobecniť na ľubovoľnú dimenziu n. 6.4.6. Príklad. Skosenie v smere osi x s parametrom a. Pre ľubovoľné a ∈ R je priradením ϕ x y = x + ay y = 1 a 0 1 · x y definovaná lineárna transformácia roviny, ktorá posúva každú jej „vodorovnú vrstvu {(x, y); y = s}, s ∈ R, o vektor aseee1 (nakreslite si obrázok). Analogické lineárne transformácie fungujú aj vo viacrozmerných priestoroch Rn ako aj v konečnorozmerných vektorových priestoroch nad ľubovoľným poľom. 6.4.7. Príklad. Galileova transformácia „roviny , alebo skôr „časopriamky R2 je z formálneho hľadiska totožná so skosením v smere priestorovej osi x s parametrom a = −v: t = t x = −vt + x, t. j. t x = 1 0 −v 1 · t x . Ak k týmto rovniciam ešte doplníme y = y, z = z, dostaneme Galileovu transformáciu „časopriestoru R4 . Vektor (t, x, y, z)T interpretujeme ako súradnice času t a polohy (x, y, z), ktoré nejakej okamžitej bodovej udalosti v trojrozmernom fyzikálnom priestore priradí pozorovateľ P, a vektor (t , x , y , z )T ako súradnice, ktoré jej priradí pozorovateľ P , ktorý sa vzhľadom na P pohybuje rovnomerne priamočiaro rýchlosťou v v smere osi x (pričom počiatky ich súradných sústav sú zhodne stanovené okamihom a miestom ich stretnutia, kedy tiež splývajú ich príslušné súradné osi). Galileova transformácia potom udáva vzťah medzi týmito súradnicami, ku ktorému dospejeme na základe princípov klasickej mechaniky. Je v nej zachytený newtonovský princíp absolútneho času a priestoru, rovnakého pre všetkých pozorovateľov nezávisle od ich pohybu, a galileovský princíp relatívnosti pohybu, ktorý sa prejavuje v rovnocennosti súradných sústav ľubovoľných navzájom rovnomerne priamočiaro sa pohybujúcich pozorovateľov. Je známe, že Galileova transformácia sa veľmi dobre zhoduje so skutočnosťou pre rýchlosti v z „bežného života , ktoré sú malé v porovnaní s rýchlosťou svetla. Pre rýchlosti blízke rýchlosti svetla však stráca svoju platnosť a treba ju nahradiť tzv. Lorentzovou transformáciou, s ktorou sa zoznámime neskôr. 134 6. Lineárne zobrazenia 6.5 Priestory lineárnych zobrazení Nech U, V sú vektorové priestory nad poľom K. Ak zabudneme na štruktúru vektorového priestoru vo V , t. j. V budeme považovať len za množinu, môžeme vytvoriť vektorový priestor UV všetkých zobrazení f : V → U s operáciami súčtu a skalárneho násobku definovanými po zložkách (pozri odstavec 1.6.5). Potom pre množinu L(V, U) všetkých lineárnych zobrazení ϕ: V → U, samozrejme, platí L(V, U) ⊆ UV . 6.5.1. Tvrdenie. Nech U, V sú vektorové priestory nad poľom K. Potom L(V, U) je lineárny podpriestor vektorového priestoru UV . Teda L(V, U) je vektorový priestor nad poľom K. Dôkaz. Treba overiť, že pre ľubovoľné a, b ∈ K lineárna kombinácia ϑ = aϕ + bψ lineárnych zobrazení ϕ, ψ: V → U, definovaná pre xxx ∈ V predpisom ϑ(xxx) = aϕ(xxx) + bψ(xxx), je tiež lineárne zobrazenie ϑ: V → U. Zvoľme xxx,yyy ∈ V , c, d ∈ K. Priamym výpočtom dostávame ϑ(cxxx + dyyy) = aϕ(cxxx + dyyy) + bψ(cxxx + dyyy) = a(cϕ(xxx) + dϕ(yyy)) + b(cψ(xxx) + dψ(yyy)) = c(aϕ(xxx) + bψ(xxx)) + d(aϕ(yyy) + bψ(yyy)) = cϑ(xxx) + dϑ(yyy). Teda ϑ ∈ L(V, U). 6.5.2. Tvrdenie. Nech U, V sú konečnorozmerné vektorové priestory nad poľom K a dim U = m, dim V = n. Potom L(V, U) ∼= Km×n , teda dim L(V, U) = mn. Dôkaz. Zvoľme bázy ααα v priestore U a βββ v priestore V . Z výsledkov predchádzajúceho paragrafu vyplýva, že priradenie ϕ → (ϕ)ααα,βββ je bijekcia L(V, U) → Km×n . Stačí teda dokázať, že je to aj lineárne zobrazenie, to znamená, že pre a, b ∈ K, ϕ, ψ ∈ L(V, U) platí (aϕ + bψ)ααα,βββ = a(ϕ)ααα,βββ + b(ψ)ααα,βββ. To je však zrejmé. Čitateľovi, ktorý má nejaké pochybnosti, odporúčame, aby si jednoduchým výpočtom porovnal stĺpce matíc na ľavej a pravej strane. Na maticu (ϕ)ααα,βββ sa teda možno dívať ako na súradnice vektora ϕ ∈ L(V, U) v priestore Km×n , vzhľadom na dvojicu báz βββ, ααα. 6.5. Priestory lineárnych zobrazení 135 Lineárne zobrazenie ϕ: V → K z vektorového priestoru V do poľa K sa nazýva lineárny funkcionál alebo lineárna forma na V . Vektorový priestor L(V, K) všetkých lineárnych foriem na V sa nazýva duálny priestor alebo len krátko duál vektorového priestoru V . Budeme používať označenie L(V, K) = V ∗ V poli K budeme vždy uvažovať len kanonickú bázu pozostávajúcu z jediného vektora 1 ∈ K. Ľubovoľná báza βββ v konečnorozmernom priestore V dimenzie n tak určuje lineárny izomorfizmus V ∗ → K(1×n) daný predpisom ϕ → (ϕ)1,βββ. Nakoľko aj xxx → (xxx)βββ je lineárny izomorfizmus V → K(n×1) a K(1×n) ∼= K(n×1) , dokázali sme tým nasledujúce tvrdenie. 6.5.3. Tvrdenie. Pre ľubovoľný konečnorozmerný vektorový priestor V nad poľom K platí V ∗ ∼= V . Uvedomme si, že matica (ϕ)1,βββ lineárneho funkcionálu ϕ: V → K je riadkový vektor z priestoru K1×n . To nám odkrýva nový pohľad na vektorový priestor riadkov K1×n . Pri voľbe kanonickej bázy εεε v stĺpcovom priestore Kn×1 možno riadkový priestor K1×n stotožniť s duálom Kn×1 ∗ stĺpcového priestoru Kn×1 . Ešte raz podčiarknime, že izomorfizmus konečnorozmerného priestoru V a jeho duálu V ∗ závisí od výberu bázy vo V . Na druhej strane, pre ľubovoľný vektorový priestor V možno definovať kanonické, t. j. od výberu bázy nezávislé zobrazenie z priestoru V do jeho druhého duálu V ∗∗ dané predpisom xxx → xxx, kde xxx(ϕ) = ϕ(xxx) pre xxx ∈ V , ϕ ∈ V ∗ . 6.5.4. Veta. Nech V je vektorový priestor nad poľom K. Potom (a) xxx → xxx je injektívne lineárne zobrazenie V → V ∗∗ ; (b) ak V je konečnorozmerný, tak xxx → xxx je lineárny izomorfizmus V → V ∗∗ . Dôkaz. Najprv ukážeme, že pre každé xxx ∈ V vôbec platí xxx ∈ V ∗∗ , t. j. xxx je lineárny funkcionál na priestore V ∗ . Pre ϕ, ψ ∈ V ∗ , a, b ∈ K jednoduchý výpočet dáva xxx(aϕ + bψ) = (aϕ + bψ)(xxx) = aϕ(xxx) + bψ(xxx) = axxx(ϕ) + bxxx(ψ). (a) Pre xxx ∈ V označmexxx = η(xxx). Dokážeme, že η: V → V ∗∗ je lineárne zobrazenie. Zvoľme xxx,yyy ∈ V c, d ∈ K. Treba overiť, že zobrazenia η(cxxx+dyyy) a cη(xxx)+dη(yyy) sa rovnajú, t. j. že každému ϕ ∈ V ∗ priradia tú istú hodnotu. Počítajme η(cxxx + dyyy)(ϕ) = ϕ(cxxx + dyyy) = cϕ(xxx) + dϕ(yyy) = cxxx(ϕ) + dyyy(ϕ) = (cη(xxx) + dη(yyy))(ϕ). 136 6. Lineárne zobrazenia Injektívnosť zobrazenia η spoznáme podľa jeho jadra. Stačí si uvedomiť, že pre ľubovoľné 0 = xxx ∈ V existuje ϕ ∈ V ∗ také, že ϕ(xxx) = 0. 1 Potom η(xxx)(ϕ) =xxx(ϕ) = ϕ(xxx) = 0, teda η(xxx) sa nerovná identicky nulovému zobrazeniu 0: V ∗ → K, ktoré je nulou vo V ∗∗ . Preto xxx /∈ Ker η pre xxx = 0, čiže Ker η = {0}. (b) Ak V je konečnorozmerný, tak s vyžitím vety 6.2.3, už dokázanej časti (a) a tvrdenia 6.5.3 dostávame dim Im η = dim V − dim Ker η = dim V = dim V ∗ = dim V ∗∗ . Preto Im η = V ∗∗ , čiže η je i surjektívne. Každý vektor xxx ∈ V tak definuje lineárny funkcionál xxx na duálnom priestore V ∗ . Pritom konečnorozmerný vektorový priestor V možno prostredníctvom priradenia xxx →xxx prirodzene stotožniť s duálom priestoru V ∗ . Napr. stĺpcový priestor Kn×1 možno stotožniť s duálom riadkového priestoru K1×n . Vo všeobecnom prípade možno V stotožniť s lineárnym podpriestorom Im η = {xxx; xxx ∈ V } jeho druhého duálu V ∗∗ . Poznámka. Prostriedkami, ktoré presahujú rámec tohto kurzu, možno dokázať, že V ∼= V ∗ a V ∼= V ∗∗ pre každý nekonečnorozmerný vektorový priestor V . Zjednodušene povedané, duál V ∗ je vždy „podstatne väčší než pôvodný priestor V a druhý duál V ∗∗ je „ešte väčší . Teda ani xxx → xxx nemôže byť surjektívne zobrazenie V → V ∗∗ . Cvičenia 6.1. Nech U, V sú vektorové priestory nad poľom K a ϕ: V → U je lineárne zobrazenie. Potom ϕ(0) = 0 a pre každé xxx ∈ V platí ϕ(−xxx) = −ϕ(xxx). Dokážte. 6.2. Dokážte tvrdenie 6.1.1 6.3. Nech AAA ∈ Km×n . Uvažujme lineárne zobrazenie ϕ: Km → Kn dané predpisom ϕ(xxx) = AAA · xxx. Ako súvisí jadro Ker ϕ s homogénnou sústavou lineárnych rovníc AAA · xxx = 0? 6.4. (a) V príkladoch 6.1.5–9 podrobne overte, že v nich definované zobrazenia sú naozaj lineárne. (b) Pre každé z uvedených lineárnych zobrazení určte jeho jadro a obraz. 6.5. Zdôvodnite, prečo žiadne z nasledujúcich zobrazení R → R nie je lineárne: (a) ϕ(x) = 1 − 3x, (b) ψ(x) = |x|, (c) f(x) = x2 , (d) g(x) = x3 , 1 V konečnorozmernom prípade ide o očividné tvrdenie. V nekonečnorozmernom prípade však jeho dôkaz využíva existenciu Hamelovej bázy vo V , prípadne si vyžaduje nejaký iný vhodný dôsledok axiómy výberu (pozri záverečnú časť paragrafu 5.5 a cvičenie 6.15). Cvičenia 137 (e) h(x) = |x|, (f) k(x) = 3 √ x, (g) l(x) = ln(1 + x2 ) (h) s(x) = sin x, (i) η(x) = ex , (j) σ(x) = sinh x = 1 2 (ex − e−x ). 6.6. (a) Uvažujte C ako vektorový priestor nad poľom R. Ukážte, že komplexná konjugácia z → z je lineárne zobrazenie C → C. (b) Uvažujte C ako vektorový priestor nad poľom C. Ukážte, že komplexná konjugácia z → z nie je lineárne zobrazenie C → C. 6.7. Lineárne zobrazenie ϕ: R3 → R2 je pre xxx = (x1, x2, x3)T ∈ R3 dané predpisom ϕ(xxx) = (x1 + 2x2, 3x1 + 7x2 − x3)T . (a) Napíšte maticu lineárneho zobrazenia ϕ vzhľadom na kanonické bázy εεε(3) v R3 , εεε(2) v R2 . (b) Napíšte maticu ϕ vzhľadom na bázy βββ = (eee1,eee2,vvv) v R3 , ααα = (uuu1,uuu2) v R2 , kde vvv = (−2, 1, 1)T , uuu1 = (1, 3)T , uuu2 = (2, 7)T . (c) Napíšte priamo nejaké bázy lineárnych podpriestorov Ker ϕ ⊆ R3 a Im ϕ ⊆ R2 . 6.8. Báza βββ vektorového priestoru R3 je tvorená stĺpcami matice 0 @ 1 1 2 2 0 2 3 −1 1 1 A a báza ααα vektorového priestoru R4 je tvorená stĺpcami matice 0 B @ 1 2 3 1 1 0 −1 0 1 −1 1 −1 0 1 2 1 1 C A. Lineárne zobrazenie ψ: R3 → R4 má vzhľadom na tieto bázy maticu AAA = (ψ)ααα,βββ = 0 B @ 1 0 0 0 1 0 0 0 0 0 0 0 1 C A. (a) Napíšte priamo nejaké bázy lineárnych podpriestorov Ker ψ ⊆ R3 a Im ψ ⊆ R4 . (b) Napíšte maticu ψ vzhľadom na kanonické bázy εεε(3) v R3 , εεε(4) v R(3) . 6.9. Nech n ∈ N. Uvažujme deriváciu f → f ako lineárnu transformáciu D: R(n) [x] → R(n) [x]. (a) Určte lineárne podpriestory Ker D a Im D v R(n) [x] a nájdite nejaké ich bázy. Zistite dimenzie oboch podpriestorov a overte vzťah dim Ker D + dim Im D = n. (b) Napíšte maticu lineárnej transformácie D vzhľadom na bázu ξξξ(n) = (1, x, x2 , . . . , xn ). (c) Napíšte maticu D vzhľadom na bázu ζζζ(n) = 1, 1 1! x, 1 2! x2 , . . . , 1 n! xn . 6.10. Operátor diferencie ∆: R(n) [x] → R(n) [x] je daný predpisom ∆(f)(x) = f(x + 1) − f(x). (a) Dokážte, že ∆ je lineárny operátor. (b) Určte lineárne podpriestory Ker ∆ a Im ∆ v R(n) [x] a nájdite nejaké ich bázy. Zistite dimenzie oboch podpriestorov. (c) Napíšte maticu lineárnej transformácie ∆ vzhľadom na bázu ξξξ(n) = (1, x, x2 , . . . , xn ). (d) Dokážte, že polynómy 1, x, [x]2, . . . , [x]n, kde [x]k = x(x − 1) . . . (x − k + 1), tvoria bázu vektorového priestoru R(n) [x]. (e) Napíšte maticu ∆ vzhľadom na bázu ηηη(n) = (1, x, [x]2, . . . , [x]n). (f) Nájdite nejakú bázu vektorového priestoru R(n) [x], vzhľadom na ktorú má ∆ maticu tvaru 0n,1 IIIn 0 01,n . 6.11. Pre ľubovoľné α, β ∈ R vynásobením príslušných matíc dokážte uvedené rovnosti a 138 6. Lineárne zobrazenia interpretujte ich v reči lineárnych transformácií roviny R2 : RRRα · RRRβ = RRRα+β, RRRα · SSSβ = SSSβ+α/2, SSSα · SSSβ = RRR2(β−α), SSSβ · RRRα = SSSβ−α/2. 6.12. Predpismi ϕ(x1, x2, x3)T = (x1−2x3, 2x1+x2+3x4, −x1−x4, x3+2x4)T , ψ(x1, x2, x3, x4)T = (2x1 − x3, 3x3 + x4, x2 + x4)T sú dané lineárne zobrazenia ϕ: R3 → R4 , ψ: R4 → R3 . Napíšte matice lineárnych zobrazení ψ ◦ ϕ: R3 → R3 , ϕ ◦ ψ: R4 → R4 vzhľadom na kanonické bázy vektorových priestorov R3 resp. R4 . 6.13. Nech S, T sú lineárne podpriestory vektorového priestoru V . (a) Priradením (xxx,yyy) → xxx+yyy je definované surjektívne lineárne zobrazenie µ: S×T → S + T. Dokážte. (b) Nájdite jadro Ker µ a dokážte, že µ je injektívne práve vtedy, keď S ∩ T = {0}. (c) Odvoďte z toho, že vektorové priestory S × T a S + T sú izomorfné práve vtedy, keď S + T = S ⊕ T. (d) Zovšeobecnite na ľubovoľný konečný počet lineárnych podpriestorov (pozri cvičenie 4.8). 6.14. Galileova transformácia „časopriestoru R4 je daná priradením (t, x, y, z)T → (t , x , y , z )T , kde t = t, x = x−vxt, y = y−vyt, z = z−vzt, pričom vektor vvv = (vx, vy, vz)T ∈ R3 interpretujeme ako rýchlosť (pozri príklad 6.4.7). (a) Napíšte maticu GGGvvv Galileovej transformácie. (b) Uvažujme dvoch pozorovateľov P a P . Vysvetlite, za akých podmienok je uvedenou transformáciou sprostredkovaný vzťah medzi časmi a priestorovými súradnicami udalostí z hľadiska pozorovateľov P a P . (Riešte otázku v rámci klasickej fyziky, bez ohľadu na relativistické efekty.) (c) Vynásobením matíc dokážte vzťah GGGuuu · GGGvvv = GGGuuu+vvv. Vysvetlite, prečo sa tento vzťah nazýva klasickým pravidlom skladania rýchlostí. 6.15. (a) Dokážte nasledujúcu konečnorozmernú verziu Hahnovej-Banachovej vety: Nech V je konečnorozmerný vektorový priestor nad poľom K, S ⊂ V je vlastný lineárny podpriestor a ψ: S → K je lineárny funkcionál. Potom pre každé xxx ∈ V S existuje lineárny funkcionál ϕ ∈ V ∗ taký, že ϕ(xxx) = 0 a ϕ S = ψ. (b) Zovšeobecnite tvrdenie (a) aj na nekonečnorozmerné vektorové priestory. (Návod: Predpokladajte, že V má Hamelovu bázu X takú, že xxx ∈ X a X ∩ S je Hamelova báza podpriestoru S – pozri záverečnú časť paragrafu 5.5). (c) Pre každý vektor 0 = xxx ∈ V existuje lineárny funkcionál ϕ ∈ V ∗ taký, že ϕ(xxx) = 0. Dokážte jednak priamo podľa vzoru (a) resp. (b), jednak z nich odvoďte ako špeciálny prípad. 6.16. Nech K je konečné pole, ktoré má práve q prvkov. Potom q je mocninou nejakého prvočísla. Dokážte. (Návod: Ukážte, že K nesie prirodzenú štruktúru vektorového priestoru nad poľom Zp, kde p = char K.) 6.17. Nech K je konečné pole, q = #K a U, V sú vektorové priestory nad K s konečnými rozmermi dim U = m, dim V = n. Akú dimenziu a koľko prvkov má vektorový priestor L(V, U) všetkých lineárnych zobrazení V → U? Porovnajte s dimenziou a počtom prvkov vektorového priestoru UV všetkých zobrazení V → U. Aká je pravdepodobnosť, že náhodne vybrané zobrazenie f ∈ UV bude lineárne? Cvičenia 139 6.18. Nech (Vi)i∈I je súbor vektorových priestorov nad poľom K indexovaný množinou I. Označme i∈I Vi množinu všetkých funkcií f s definičným oborom I takých, že f(i) ∈ Vi pre každé i ∈ I. Na množine W = i∈I Vi definujme operácie súčtu a skalárneho násobku po zložkách, t. j. (f + g)(i) = f(i) + g(i) a (cf)(i) = cf(i) pre f, g ∈ W, c ∈ K, i ∈ I. (a) Dokážte, že W = i∈I Vi s práve definovanými operáciami tvorí vektorový priestor nad poľom K. Ako vyzerá 0 ∈ W a opačný prvok k prvku f ∈ W? Vektorový priestor i∈I Vi nazývame priamym súčinom systému vektorových priestorov (Vi)i∈I. (b) Predpokladajme, že I = {1, . . . , n} je konečná množina. Dokážte, že oba priame súčiny V1 × . . . , ×Vn a i∈I Vi sú lineárne izomorfné. Snažte sa nájsť čo najprirodzenejší izomorfizmus. (c) Predpokladajme, že Vi = V pre každé i ∈ I. Dokážte (presnejšie, uvedomte si, lebo dokazovať nie je veľmi čo), že priamy súčin i∈I Vi splýva s priestorom funkcií V I (pozri príklad 1.6.5). Z toho dôvodu nazývame priestor V I aj priamou mocninou vektorového priestoru V . (d) Pre každé j ∈ I označme πj : i∈I Vi → Vj zobrazenie dané predpisom πj(f) = f(j) pre f ∈ i∈I Vi. Dokážte, že tzv. kanonická projekcia πj je surjektívne lineárne zobrazenie. Ako vyzerá jadro Ker πj? (e) Pre každé j ∈ I označme σj : Vj → i∈I Vi zobrazenie dané predpisom σj(xxx)(j) = xxx a σj(xxx)(i) = 0, ak i = j, pre xxx ∈ Vj. Dokážte, že tzv. kanonické vnorenie σj je injektívne lineárne zobrazenie, teda je to izomorfizmus priestoru Vj na lineárny podpriestor Im σj ⊆ i∈I Vi. Ako vyzerá obraz Im σj? Dokážte, že pre každé j ∈ I platí W = Im σj ⊕ Ker πj. 6.19. V označení cvičenia 6.18 stotožníme každý vektor xxx ∈ Vj s funkciou σj(xxx) ∈ W a následne aj každý z priestorov Vj s jeho izomorfnou kópiou Im σj ⊆ W. (a) Predpokladajme, že I = {1, . . . , n} je konečná množina. Dokážte, že W = i∈I Vi je priamym súčtom svojich lineárnych podpriestorov V1, . . . , Vn. (b) Predpokladajme, že I je nekonečná množina. Dokážte, že zjednotenie podpriestorov Vi, i ∈ I negeneruje vektorový priestor W = i∈I Vi. (c) Označme S = i∈I Vi lineárny podpriestor priameho súčinu i∈I Vi generovaný zjednotením jeho lineárnych podpriestorov Vi = Im σi, i ∈ I. Dokážte, že S pozostáva zo všetkých funkcií f ∈ W, pre ktoré je množina {i ∈ I; f(i) = 0} konečná. Vektorový priestor S = i∈I Vi nazývame priamym súčtom systému vektorových priestorov (Vi)i∈I. (d) Dokážte, že každý prvok f ∈ S možno jednoznačne až na poradie a nulové sčítance vyjadriť v tvare tzv. formálneho súčtu f = xxx1 + . . . + xxxm konečného počtu sčítancov xxxk ∈ Vik , kde indexy i1, . . . , ik ∈ I sú navzájom rôzne. (e) Sformulujte pravidlá pre rovnosť a sčítanie formálnych súčtov xxx1 + . . . + xxxm, yyy1 +. . .+yyyn tak, aby boli v zhode s rovnosťou vektorov a sčítaním v priestore i∈I Vi. (f) Predpokladajme, že Vi = V pre každé i ∈ I. Dokážte, že priamy súčet i∈I Vi splýva s podpriestorom V (I) priamej mocniny V I z príkladu 4.1.3. 6.20. Nech X je Hamelova báza vektorového priestoru V . Dokážte, že priestor V je izomorfný s priamym súčtom xxx∈X[xxx] svojich jednorozmerných lineárnych podpriestorov [xxx], xxx ∈ X, a tým pádom tiež s vektorovým priestorom K(X) . 7. Inverzné matice a zmena bázy V tejto kapitole zavedieme pojem inverznej matice k danej štvorcovej matici a dáme ho do súvisu s pojmom inverzného lineárneho zobrazenia. Ďalej sa naučíme počítať inverzné matice a matice prechodu z jednej súradnej bázy do druhej. Nakoniec preskúmame vplyv zmeny bázy na maticu lineárneho zobrazenia. Začneme však s pojmom hodnosti matice, ktorý nám umožní rozhodnúť o existencii inverznej matice a – ako uvidíme neskôr – bude nám ešte veľakrát užitočný. V celej kapitole K označuje pevné pole, m, n, p sú kladné celé čísla. 7.1 Hodnosť matice V tomto paragrafe je potrebné rozlišovať medzi vektorovými priestormi riadkových resp. stĺpcových vektorov. Nebudeme teda používať nešpecifikované označenie Kn , ale priestor riadkových vektorov budeme značiť K1×n a priestor stĺpcových vektorov Kn×1 . Pripomeňme, že rrri(AAA) ∈ K1×n označuje i-tý riadok a sssj(AAA) ∈ Km×1 zase j-tý stĺpec matice AAA = (aij)m×n. Túto maticu teda môžeme zapísať v blokových tvaroch AAA =     rrr1(AAA) rrr2(AAA) ... rrrm(AAA)     = (sss1(AAA),sss2(AAA), . . . ,sssn(AAA)). Riadkovou hodnosťou hr(AAA) matice AAA nazývame dimenziu lineárneho podpriestoru vektorového priestoru K1×n generovaného riadkami matice AAA. Podobne, stĺpcovou hodnosťou hs(AAA) matice AAA nazývame dimenziu lineárneho podpriestoru vektorového priestoru Km×1 generovaného stĺpcami matice AAA. Teda hr(AAA) = dim[rrr1(AAA),rrr2(AAA), . . . ,rrrm(AAA)], hs(AAA) = dim[sss1(AAA),sss2(AAA), . . . ,sssn(AAA)] Označme ϕ: Kn×1 → Km×1 lineárne zobrazenie dané predpisom ϕ(xxx) = AAA · xxx pre xxx ∈ Kn×1 . Pripomeňme, že hodnosťou lineárneho zobrazenia ϕ nazývame dimenziu jeho obrazu, t. j. h(ϕ) = dim Im ϕ. V našom prípade zrejme platí h(ϕ) = hs(AAA), keďže lineárny podpriestor Im ϕ ⊆ Km×1 je generovaný stĺpcami matice AAA. 7.1. Hodnosť matice 141 7.1.1. Lema. Nech AAA ∈ Km×n . (a) Nech matica BBB vznikne z matice AAA vykonaním jednej (inak ľubovoľnej) ERO. Potom [rrr1(AAA),rrr2(AAA), . . . ,rrrm(AAA)] = [rrr1(BBB),rrr2(BBB), . . . ,rrrm(BBB)]. (b) Nech matica CCC vznikne z matice AAA vykonaním jednej (inak ľubovoľnej) ESO. Potom [sss1(AAA),sss2(AAA), . . . ,sssn(AAA)] = [sss1(CCC),sss2(CCC), . . . ,sssn(CCC)]. Dôkaz. Zrejme pre ľubovoľné vektory uuu1, . . . ,uuuk v každom vektorovom priestore V a ľubovoľný skalár c ∈ K platí: [uuu1, . . . ,uuui, . . . ,uuuj, . . . ,uuuk] = [uuu1, . . . ,uuuj, . . . ,uuui, . . . ,uuuk], [uuu1, . . . ,uuui, . . . ,uuuk] = [uuu1, . . . , cuuui, . . . ,uuuk] (ak c = 0), [uuu1, . . . ,uuui, . . . ,uuuj, . . . ,uuuk] = [uuu1, . . . ,uuui, . . . , cuuui + uuuj, . . . ,uuuk]. 7.1.2. Tvrdenie. Pre každú maticu AAA ∈ Km×n platí hr(AAA) = hs(AAA). Dôkaz. Upravme AAA pomocou ERO na redukovaný stupňovitý tvar BBB ∈ Km×n a označme k počet nenulových riadkov v matici BBB. Podľa práve dokázanej lemy platí [rrr1(AAA), . . . ,rrrm(AAA)] = [rrr1(BBB), . . . ,rrrm(BBB)]. Preto tiež hr(AAA) = hr(BBB). Keďže nenulové riadky matice BBB sú zrejme lineárne nezávislé (rozmyslite si prečo), hr(BBB) = k, čo je vlastne počet stĺpcov matice BBB, v ktorých sa nachádza vedúci prvok nejakého jej riadku. Označme 1 ≤ j1 < . . . < jk ≤ n indexy týchto stĺpcov. Podľa tvrdenia 4.5.3 vektory sssj1 (AAA), . . . ,sssjk (AAA) sú lineárne nezávislé a platí [sss1(AAA), . . . ,sssn(AAA)] = [sssj1 (AAA), . . . ,sssjk (AAA)]. Preto tiež hs(AAA) = k = hr(AAA). Keďže riadková a stĺpcová hodnosť ľubovoľnej matice AAA splývajú, túto ich spoločnú hodnotu budeme odteraz značiť jednoducho h(AAA) a nazývať hodnosťou matice AAA. Zrejme pre AAA ∈ Km×n je h(AAA) ≤ min(m, n). Práve vykonané úvahy majú dva bezprostredné dôsledky. 7.1.3. Tvrdenie. Nech AAA ∈ Km×n . Potom h(AAA) = h(AAAT ). 7.1.4. Tvrdenie. Nech uuu1, . . . ,uuun ∈ Km×1 sú ľubovoľné vektory a AAA ∈ Km×n je matica taká, že sssj(AAA) = uuuj pre 1 ≤ j ≤ n. Potom (a) uuu1, . . . ,uuun sú lineárne nezávislé práve vtedy, keď h(AAA) = n; (b) [uuu1, . . . ,uuun] = Km×1 práve vtedy, keď h(AAA) = m. Všimnite si, že prípad (a) môže nastať iba vtedy, keď n ≤ m; naopak, (b) môže nastať jedine za predpokladu m ≤ n. Sami si sformulujte a premyslite analogické tvrdenia pre riadkové vektory. Ešte si dokážeme jeden odhad hodnosti súčinu matíc pomocou hodností jednotlivých činiteľov. 142 7. Inverzné matice a zmena bázy 7.1.5. Tvrdenie. Nech AAA ∈ Km×n , BBB ∈ Kn×p . Potom h(AAA · BBB) ≤ min h(AAA), h(BBB) . Dôkaz. Označme ϕ: Kn → Km , ψ: Kp → Kn lineárne zobrazenia dané predpismi ϕ(xxx) = AAA · xxx pre xxx ∈ Kn resp. ψ(yyy) = BBB · yyy pre yyy ∈ Kp . Zrejme Im(ϕ ◦ ψ) ⊆ Im ϕ, preto h(AAA · BBB) = h(ϕ ◦ ψ) ≤ h(ϕ) = h(AAA). S využitím toho druhý potrebný odhad už dostaneme priamym výpočtom h(AAA · BBB) = h (AAA · BBB)T = h BBBT · AAAT ≤ h BBBT = h(BBB). 7.2 Inverzné matice a inverzné lineárne zobrazenia Nech AAA ∈ Kn×n , t. j. AAA je štvorcová matica typu n × n. Inverznou maticou k matici AAA rozumieme maticu BBB ∈ Kn×n takú, že AAA · BBB = IIIn = BBB · AAA. Zrejme k danej štvorcovej matici AAA existuje najviac jedna inverzná matica (rozmyslite si prečo). Túto jednoznačne určenú maticu (ak existuje) budeme značiť AAA−1 . Nasledujúca veta je bezprostredným dôsledkom súvisu medzi lineárnymi zobrazeniami a ich maticami. 7.2.1. Veta. Nech U, V sú vektorové priestory nad poľom K a dim U = dim V = n. Nech ďalej ααα, βββ sú nejaké bázy v U, resp. vo V a AAA = (ϕ)ααα,βββ je matica lineárneho zobrazenia ϕ: V → U vzhľadom na bázy βββ, ααα. Potom k matici AAA existuje inverzná matica AAA−1 práve vtedy, keď k zobrazeniu ϕ existuje inverzné zobrazenie ϕ−1 . V tom prípade AAA−1 je maticou lineárneho zobrazenia ϕ−1 : U → V vzhľadom na bázy ααα, βββ, t. j. AAA−1 = (ϕ)ααα,βββ −1 = ϕ−1 βββ,ααα . Hovoríme, že štvorcová matica AAA ∈ Kn×n je regulárna, ak k nej existuje inverzná matica AAA−1 ; v opačnom prípade hovoríme, že AAA je singulárna. 7.2.2. Veta. Matica AAA ∈ Kn×n je regulárna práve vtedy, keď h(AAA) = n. Dôkaz. Označme ϕ: Kn → Kn lineárnu transformáciu danú predpisom ϕ(xxx) = AAA · xxx pre xxx ∈ Kn . K matici AAA existuje inverzná matica AAA−1 práve vtedy, keď k zobrazeniu ϕ existuje inverzné zobrazenie ϕ−1 , t. j. práve vtedy, keď ϕ je 7.3. Výpočet inverznej matice 143 bijekcia. Podľa dôsledku 6.2.4 to nastane práve vtedy, keď ϕ je surjekcia, čiže Im ϕ = Kn , čo je ekvivalentné s rovnosťou dim Im ϕ = n. Na dokončenie dôkazu si stačí spomenúť, že h(AAA) = h(ϕ) = dim Im ϕ. Z praktických dôvodov bude užitočné si uvedomiť, že na to, aby sme sa presvedčili, že matica BBB ∈ Kn×n je inverzná k matici AAA ∈ Kn×n , stačí overiť len jednu (a to hocktorú) z rovností AAA · BBB = IIIn, BBB · AAA = IIIn. 7.2.3. Tvrdenie. Pre ľubovoľné AAA, BBB ∈ Kn×n platí AAA·BBB = IIIn práve vtedy, keď BBB · AAA = IIIn. Dôkaz. Označme ϕ, ψ: Kn → Kn lineárne transformácie dané pre xxx ∈ Kn predpismi ϕ(xxx) = AAA·xxx, resp. ψ(xxx) = BBB ·xxx. Nech AAA·BBB = IIIn. To nastane práve vtedy, keď ϕ ◦ ψ = idKn . Z toho vyplýva, že ϕ je surjekcia a ψ je injekcia (pozri paragraf 0.3). Keďže ϕ, ψ sú lineárne transformácie konečnorozmerného vektorového priestoru, podľa dôsledku 6.2.4 to znamená, že ϕ aj ψ sú bijekcie, teda lineárne izomorfizmy, a ψ = ϕ−1 . Potom však BBB = AAA−1 , preto tiež BBB · AAA = IIIn. Obrátená implikácia vyplýva zo symetrie tvrdenia. S využitím posledného tvrdenia si ako cvičenie overte nasledujúce vzorce, z ktorých už vyplýva zvyšok tvrdenia. 7.2.4. Tvrdenie. Nech AAA, BBB ∈ Kn×n sú regulárne matice. Potom aj matice AAA−1 , AAA · BBB a AAAT sú regulárne a platí: AAA−1 −1 = AAA, (AAA · BBB)−1 = BBB−1 · AAA−1 , AAAT −1 = AAA−1 T . 7.3 Výpočet inverznej matice Prakticky všetky úlohy lineárnej algebry, s ktorými sme sa doteraz stretli, sme riešili tak, že sme danú situáciu reprezentovali nejakou vhodnou maticou, tú sme ďalej pomocou ERO upravili na redukovaný stupňovitý tvar a tento výsledný tvar sme potom interpretovali v závislosti na charaktere pôvodnej úlohy. Prezraďme už vopred, že zatiaľ sme všetky úlohy, ktoré sa riešia úpravou matíc pomocou ERO prípadne ESO, zďaleka nevyčerpali. Naopak, táto metóda nás bude v lineárnej algebre neustále sprevádzať. Skôr než pristúpime k ďalšiemu využitiu tejto metódy, tentoraz pri výpočte inverznej matice, však bude potrebné si uvedomiť, že ERO aj ESO možno realizovať pomocou násobenia matíc. 7.3.1. Tvrdenie. Nech AAA ∈ Km×n . (a) Nech BBB ∈ Km×n vznikne z AAA vykonaním jednej (inak ľubovoľnej) ERO. Označme EEE maticu, ktorá vznikne z matice IIIm vykonaním tej istej ERO. Potom BBB = EEE · AAA. 144 7. Inverzné matice a zmena bázy (b) Nech CCC ∈ Km×n vznikne z AAA vykonaním jednej (inak ľubovoľnej) ESO. Označme FFF maticu, ktorá vznikne z matice IIIn vykonaním tej istej ESO. Potom CCC = AAA · FFF. Dôkaz. Možno overiť priamym výpočtom pre každý jednotlivý druh ERO resp. ESO. Ako cvičenie si to skúste napr. pre maticu AAA typu 3 × 2, resp. 3 × 3. Štvorcové matice EEE ∈ Kn×n , ktoré vzniknú z jednotkovej matice IIIn vykonaním jedinej ERO alebo ESO, nazývame elementárne matice. Posledná veta teda hovorí, že ľubovoľnú ERO (ESO) na matici AAA možno realizovať vynásobením matice AAA vhodnou elementárnou maticou EEE zľava (sprava). Návod na výpočet inverznej matice k danej štvorcovej matici AAA ∈ Kn×n si možno najľahšie zapamätať v tvare nasledujúcej schémy: (AAA |IIIn) ERO −−−→ (IIIn |AAA−1 ). Tento postup má navyše tú výhodu, že sa nemusíme vopred starať, či inverzná matica k matici AAA existuje alebo nie. Ak AAA−1 existuje, tak ju nakoniec vypočítame, ak neexistuje, tak to odhalíme počas nášho výpočtu a ďalej v ňom nebudeme pokračovať. Celý postup si teraz vysvetlíme trochu podrobnejšie. Bloková matica (AAA |IIIn) vznikne tak, že matice AAA a IIIn jednoducho napíšeme vedľa seba. Túto maticu teraz budeme upravovať pomocou ERO tak, aby sme v ľavej časti z matice AAA dostali jednotkovú maticu IIIn. Akonáhle sa nám to podarí, matica v pravej časti výslednej blokovej matice je už hľadaná matica AAA−1 . Ak sa nám to nepodarí, t. j. matica AAA nie je riadkovo ekvivalentná s jednotkovou maticou (čo nastane práve vtedy, keď h(AAA) < n, a spoznáme to podľa toho, že sa nám v ľavej časti objaví nejaký nulový riadok), tak inverzná matica k matici AAA neexistuje. Korektnosť uvedeného postupu vyplýva z nasledujúceho očividného tvrdenia a skutočnosti, že ERO možno reprezentovať násobením elementárnymi maticami zľava. Taktiež tu hrá úlohu fakt, že pre BBB ∈ Kn×n platí BBB = AAA−1 práve vtedy, keď BBB · AAA = IIIn, uvedený v tvrdení 7.2.3 7.3.2. Tvrdenie. Nech AAA ∈ Kn×n a EEE1,EEE2, . . . ,EEEk ∈ Kn×n sú elementárne matice také, že EEEk · . . . · EEE2 · EEE1 · AAA = IIIn. Potom AAA−1 = EEEk · . . . · EEE2 · EEE1. Poznamenajme, že k rovnakému cieľu vedie tiež postup reprezentovaný schémou: AAA IIIn ESO −−−→ IIIn AAA−1 . Rozmyslite si prečo a sformulujte príslušné tvrdenie. Z práve vykonaných úvah vyplývajú nasledujúce tri dôsledky. Posledný z nich je čiastočným obrátením odhadu hodnosti súčinu matíc za predpokladu regularity aspoň jedného z činiteľov. 7.3. Výpočet inverznej matice 145 7.3.3. Tvrdenie. Matica AAA ∈ Kn×n je regulárna práve vtedy, keď ju možno rozložiť na súčin AAA = EEE1 · . . . · EEEk konečného počtu elementárnych matíc EEE1, . . . ,EEEk ∈ Kn×n . 7.3.4. Tvrdenie. Pre ľubovoľné AAA, BBB ∈ Km×n platí: (a) AAA je riadkovo ekvivalentná s BBB práve vtedy, keď existuje regulárna matica PPP ∈ Km×m taká, že AAA = PPP · BBB; (b) AAA je stĺpcovo ekvivalentná s BBB práve vtedy, keď existuje regulárna matica QQQ ∈ Kn×n taká, že AAA = BBB · QQQ. 7.3.5. Tvrdenie. Nech AAA ∈ Km×n , PPP ∈ Km×m , QQQ ∈ Kn×n , pričom PPP, QQQ sú regulárne matice. Potom h(AAA) = h(PPP · AAA) = h(AAA · QQQ) = h(PPP · AAA · QQQ). Trochu všeobecnejšie možno uvedené úvahy použiť na násobenie ľubovoľnej matice vhodného rozmeru maticou AAA−1 (ak existuje) zľava resp. sprava. Tieto operácie možno uskutočniť pre regulárnu AAA ∈ Kn×n a ľubovoľné BBB ∈ Kn×m , CCC ∈ Km×n podľa nasledujúcich schém: (AAA |BBB) ERO −−−→ (IIIn |AAA−1 · BBB), AAA CCC ESO −−−→ IIIn CCC·AAA−1 . Ešte si všimnime, že v špeciálnom prípade sme niečo podobné vlastne robili už dávno, pri riešení sústav lineárnych rovníc úpravou na redukovaný stupňovitý tvar pomocou ERO. Aj tento postup totiž možno vyjadriť pomocou schémy (AAA |bbb) ERO −−−→ (BBB |ccc), ktorá má pre regulárnu AAA ∈ Kn×n tvar (AAA |bbb) ERO −−−→ (IIIn |AAA−1 · bbb). Ako vedľajší produkt našich úvah tak dostávame nasledujúci výsledok o riešení sústav n lineárnych rovníc o n neznámych. 7.3.6. Veta. Nech AAA ∈ Kn×n , bbb ∈ Kn . Ak AAA je regulárna, tak sústava AAA · xxx = bbb má jediné riešenie xxx = AAA−1 · bbb. 146 7. Inverzné matice a zmena bázy 7.4 Matica prechodu Nech V je vektorový priestor nad poľom K a ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) sú jeho dve bázy. Maticou prechodu z bázy βββ do bázy ααα nazývame maticu identického zobrazenia idV : V → V vzhľadom na bázy βββ, ααα, ktorú značíme PPPααα,βββ. Teda PPPααα,βββ = (idV )ααα,βββ. Podľa definície matice lineárneho zobrazenia vzhľadom na dané bázy (pozri paragraf 6.4), stĺpce matice prechodu PPPααα,βββ sú tvorené súradnicami vektorov bázy βββ vzhľadom na bázu ααα, t. j. sssj(PPPααα,βββ) = (vvvj)ααα pre 1 ≤ j ≤ n. Teda PPPααα,βββ = (vvv1)ααα, (vvv2)ααα, . . . , (vvvn)ααα , a podľa vety 6.4.1 je táto matica jednoznačne určená podmienkou transformácie súradníc (xxx)ααα = PPPααα,βββ · (xxx)βββ pre ľubovoľné xxx ∈ V . Ak do zrejmej rovnosti xxx = ααα · (xxx)ααα (pozri paragraf 5.3) budeme za xxx postupne dosadzovať vektory vvv1, . . . ,vvvn bázy βββ, s využitím vzťahu pre stĺpce súčinu matíc z paragrafu 2.3 dostaneme vvvj = ααα · (vvvj)ααα = ααα · sssj(PPPααα,βββ) = sssj(ααα · PPPααα,βββ) pre každé 1 ≤ j ≤ n. Tým sme dostali ďalší dôležitý vzťah, ktorý jednoznačne charakterizuje maticu prechodu PPPααα,βββ: ααα · PPPααα,βββ = βββ. (Podotýkame, že súčin ααα · PPPααα,βββ treba chápať v zmysle paragrafu 2.3) Priradenie uuui → vvvi pre i ≤ n možno jednoznačne rozšíriť do bijektívnej lineárnej transformácie ϑ: V → V . Skrátene píšeme ϑ(ααα) = βββ. Matica transformácie ϑ vzhľadom na bázu ααα je opäť (ϑ)ααα = (ϑ)ααα,ααα = (ϑuuu1)ααα, . . . , (ϑuuun)ααα = (vvv1)ααα, . . . , (vvvn)ααα = PPPααα,βββ. Zhrnutím vykonaných úvah dostávame štyri ekvivalentné charakterizácie matice prechodu. 7.4.1. Tvrdenie. Nech ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) sú dve bázy nrozmerného vektorového priestoru V nad poľom K. Potom pre ľubovoľnú maticu PPP ∈ Kn×n nasledujúce podmienky sú ekvivalentné: (i) PPP = (idV )ααα,βββ, t. j. PPP je matica prechodu z bázy βββ do bázy ααα; (ii) (xxx)ααα = PPP · (xxx)βββ pre každé xxx ∈ V ; 7.4. Matica prechodu 147 (iii) ααα · PPP = βββ; (iv) PPP = (ϑ)ααα, kde ϑ: V → V je lineárna transformácia taká, že ϑ(ααα) = βββ. Z definície matice prechodu a vety 6.4.2 okamžite vyplývajú nasledujúce rovnosti. 7.4.2. Tvrdenie. Nech ααα, βββ, γγγ sú bázy konečnorozmerného vektorového priestoru V nad poľom K. Potom PPPααα,ααα = IIIn, PPPβββ,ααα = PPPααα,βββ −1 , PPPααα,βββ · PPPβββ,γγγ = PPPααα,γγγ. Z druhej z uvedených podmienok vidno, že matica prechodu PPPααα,βββ je vždy regulárna. Taktiež naopak, každá regulárna matica PPP ∈ Kn×n je maticou prechodu medzi vhodnou dvojicou báz. 7.4.3. Tvrdenie. Nech V je n-rozmerný vektorový priestor nad poľom K, PPP = (pij) ∈ Kn×n je ľubovoľná regulárna matica a ααα = (uuu1, . . . ,uuun) je nejaká báza vo V . Položme βββ = (vvv1, . . . ,vvvn) = ααα · PPP, γγγ = (www1, . . . ,wwwn) = ααα · PPP−1 , t. j. pre 1 ≤ j ≤ n platí vvvj = p1juuu1 + . . . + pnjuuun a wwwj = q1juuu1 + . . . + qnjuuun, kde PPP−1 = (qij)n×n. Potom PPP je maticou prechodu z bázy βββ do bázy ααα a taktiež z bázy ααα do bázy γγγ, čiže PPP = PPPααα,βββ = PPPγγγ,ααα. Špeciálne, PPP je maticou prechodu z bázy (sss1(PPP), . . . ,sssn(PPP)) do bázy εεε = (eee1, . . . ,eeen) v Kn a taktiež z bázy εεε do bázy (sss1(PPP−1 ), . . . ,sssn(PPP−1 )). V prípade, keď V = Kn je priestor stĺpcových vektorov, možno každú jeho bázu ααα stotožniť s príslušnou regulárnou maticou, ktorej stĺpcami sú vektory danej bázy. Pri takomto stotožnení je návod na výpočet matice prechodu obsiahnutý v nasledujúcom tvrdení. 7.4.4. Tvrdenie. Nech ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) sú dve bázy stĺpcového vektorového priestoru Kn . Potom PPPααα,βββ = ααα−1 · βββ. Dôkaz. Z podmienky ααα · PPPααα,βββ = βββ okamžite vyplýva požadovaná rovnosť. To nám dáva návod na výpočet matice prechodu pre bázy ααα, βββ vektorového priestoru Kn podľa už známej schémy (ααα |βββ) ERO −−−→ (IIIn |PPPααα,βββ) = (εεε |ααα−1 · βββ). 148 7. Inverzné matice a zmena bázy 7.5 Matice lineárneho zobrazenia vzhľadom na rôzne bázy V tomto paragrafe sa budeme zaoberať vplyvom zmeny báz na maticu lineárneho zobrazenia, presnejšie, vzťahom medzi maticami daného lineárneho zobrazenia vzhľadom na rôzne dvojice báz. 7.5.1. Veta. Nech V1, V2 sú konečnorozmerné vektorové priestory nad poľom K, ϕ: V1 → V2 je lineárne zobrazenie, ααα1, βββ1 sú dve bázy priestoru V1 a ααα2, βββ2 sú dve bázy priestoru V2. Potom (ϕ)βββ2,βββ1 = PPPβββ2,ααα2 · (ϕ)ααα2,ααα1 · PPPααα1,βββ1 . Dôkaz. Označme AAA = (ϕ)ααα2,ααα1 , BBB = (ϕ)βββ2,βββ1 matice lineárneho zobrazenia ϕ vzhľadom na bázy ααα1, ααα2, resp. bázy βββ1, βββ2. Pre ľubovoľné xxx ∈ V1 platí: BBB · (xxx)βββ1 = (ϕxxx)βββ2 = PPPβββ2,ααα2 · (ϕxxx)ααα2 = PPPβββ2,ααα2 · AAA · (xxx)ααα1 = PPPβββ2,ααα2 · AAA · PPPααα1,βββ1 · (xxx)βββ1 . Na základe vety 6.4.1 z toho okamžite vyplýva dokazovaná rovnosť BBB = PPPβββ2,ααα2 · AAA · PPPααα1,βββ1 . Poslednú transformačnú formulku si možno najľahšie zapamätať pomocou nasledujúceho diagramu: (V1,ααα1) AAA −−−→ (V2,ααα2) PPPααα1,βββ1    PPPβββ2,ααα2 (V1,βββ1) −−−→ BBB (V2,βββ2) Nezabudnite, že zobrazenia skladáme „v obrátenom poradí , a tomu musí zodpovedať aj „obrátené poradie násobenia matíc! 7.5.2. Príklad. Nech ϕ: Kn → Km je lineárne zobrazenie a ααα, βββ sú nejaké bázy priestorov Km resp. Kn . Označme AAA = (ϕ)ααα,βββ, MMM = (ϕ)εεε(m),εεε(n) matice zobrazenia ϕ vzhľadom na bázy βββ, ααα resp. vzhľadom na kanonické bázy εεε(n) , εεε(m) . Podľa poslednej vety platí: AAA = PPPααα,εεε(m) · MMM · PPPεεε(n),βββ, MMM = PPPεεε(m),ααα · AAA · PPPβββ,εεε(n) . Ak stotožníme každú bázu s regulárnou maticou, ktorej stĺpce sú vektory tejto bázy, tak uvedené rovnosti nadobudnú tvar AAA = ααα−1 · IIIm · MMM · III−1 n · βββ = ααα−1 · MMM · βββ, MMM = III−1 m · ααα · AAA · βββ−1 · IIIn = ααα · AAA · βββ−1 , 7.5. Matice lineárneho zobrazenia vzhľadom na rôzne bázy 149 umožňujúci priamy výpočet jednej z matíc AAA, MMM na základe znalosti báz ααα, βββ a druhej z nich. Položme si teraz obrátenú otázku. Za akých podmienok sú matice AAA, BBB ∈ Km×n maticami toho istého lineárneho zobrazenia ϕ: V → U vzhľadom na nejaké dve (možno no nie nutne rôzne) dvojice báz konečnorozmerných vektorových priestorov U, V ? Odpoveď na ňu dáva nasledujúca veta. 7.5.3. Veta. Nech U je m-rozmerný a V je n-rozmerný vektorový priestor nad poľom K. Potom pre ľubovoľné matice AAA, BBB ∈ Km×n nasledujúce podmienky sú ekvivalentné: (i) AAA, BBB sú maticami toho istého lineárneho zobrazenia ϕ: V → U vzhľadom na nejaké dve (možno no nie nutne rôzne) dvojice báz priestorov U, V ; (ii) existujú regulárne matice PPP ∈ Km×m , QQQ ∈ Kn×n také, že BBB = PPP · AAA · QQQ; (iii) h(AAA) = h(BBB). Dôkaz. Ekvivalencia (i) ⇔ (ii) je priamym dôsledkom vety 7.5.1 a tvrdenia 7.4.3 Implikácia (ii) ⇒ (iii) vyplýva z tvrdenia 7.3.5 Zostáva dokázať (iii) ⇒ (ii). Označme h = h(AAA) = h(BBB). Pomocou ERO upravíme AAA aj BBB na redukovaný trojuholníkový tvar AAA = PPP1 ·AAA, resp. BBB = PPP2 · BBB, kde PPP1, PPP2 sú regulárne matice. Zrejme AAA , BBB majú rovnaký počet nenulových riadkov rovný h. AAA aj BBB možno ďalej pomocou ESO upraviť na blokový tvar AAA = AAA · QQQ1 = IIIh 0h,n−h 0m−h,h 0m−h,n−h = BBB · QQQ2 = BBB , kde QQQ1, QQQ2 sú regulárne matice. Stačí pomocou vedúcich prvkov jednotlivých riadkov vynulovať prípadné ďalšie nenulové prvky týchto riadkov a, ak treba, vymeniť poradie niektorých stĺpcov. Potom PPP1 · AAA · QQQ1 = PPP2 · BBB · QQQ2, teda BBB = PPP−1 2 · PPP1 · AAA · QQQ1 · QQQ−1 2 a matice PPP = PPP−1 2 · PPP1, QQQ = QQQ1 · QQQ−1 2 sú zrejme regulárne. Na základe dôkazu tejto vety okamžite dostávame záverečný výsledok. 7.5.4. Veta. Pre každé lineárne zobrazenie ϕ: V → U medzi konečnorozmernými vektorovými priestormi nad poľom K možno zvoliť bázu βββ priestoru V a bázu ααα priestoru U tak, že ϕ má vzhľadom na bázy βββ, ααα maticu v blokovom tvare (ϕ)ααα,βββ = IIIh 0h,n−h 0m−h,h 0m−h,n−h , kde n = dim V , m = dim U a h = h(ϕ). Skúste si túto vetu dokázať priamo a bližšie špecifikovať bázy βββ a ααα. (Návod: Spomeňte si na dôkaz vety 6.2.3 o dimenzii jadra a obrazu.) 150 7. Inverzné matice a zmena bázy 7.6 Pohyblivé bázy Lineárnu transformáciu konečnorozmerného vektorového priestoru V je často výhodné popisovať zadaním obrazov vektorov nejakej bázy. Pritom pre rôzne transformácie môžu byť výhodné rôzne bázy. Napr. pri sledovaní nejakého pohybujúceho sa objektu je prirodzené udávať jeho polohu vzhľadom na bázu spojenú s „nehybným pozorovateľom. Zmenu orientácie takého objektu spôsobenú jeho rotáciou je však výhodnejšie udávať vzhľadom na bázu spojenú s týmto objektom. Uvažujme bázy ααα, βββ vektorového priestoru V . Nech ϑ: V → V je lineárna transformácia taká, že ϑ(ααα) = βββ. Ak prechod od vektora xxx ∈ V k jeho obrazu ϑ(xxx) ∈ V chápeme ako výsledok nejakého pohybu (napr. otočenia) v priestore V , tak bázu βββ možno považovať za novú polohu premiestnenej bázy ααα. Ak γγγ je ďalšia báza vo V a η: V → V je lineárna transformácia taká, že η(βββ) = γγγ, tak bázu γγγ môžeme chápať jednak ako bázu βββ premiestnenú transformáciou η, jednak ako pôvodnú bázu ααα premiestnenú transformáciou η ◦ ϑ. Pre maticu zloženej transformácie η ◦ ϑ vzhľadom na bázu ααα dostávame popri obvyklom vyjadrení pomocou „pevnej bázy ααα (η ◦ ϑ)ααα = (η)ααα · (ϑ)ααα taktiež vyjadrenie pomocou „pohyblivej bázy ααα, t. j. pomocou báz ααα, βββ, (η ◦ ϑ)ααα = (ϑ)ααα · (η)βββ. ktoré je zaujímavé obráteným poradím činiteľov. Stačí si uvedomiť, že zo vzťahov ϑ(ααα) = βββ, η(βββ) = γγγ vyplýva (η ◦ ϑ)(ααα) = γγγ, a ďalej podľa časti (iv) tvrdenia 7.4.1 a tvrdenia 7.4.2 tiež (η ◦ ϑ)ααα = PPPααα,γγγ = PPPααα,βββ · PPPβββ,γγγ = (ϑ)ααα · (η)βββ. Toto pozorovanie možno matematickou indukciou rozšíriť na ľubovoľný konečný počet báz a lineárnych transformácií. 7.6.1. Veta. Nech ααα0,ααα1, . . . ,αααk sú bázy konečnorozmerného vektorového priestoru V a ϑ1, . . . , ϑk : V → V sú lineárne transformácie také, že ϑi(αααi−1) = αααi pre 1 ≤ i ≤ k. Potom maticu zloženej transformácie ϑ = ϑk ◦. . .◦ϑ1 vzhľadom na pôvodnú bázu ααα0 možno vyjadriť ako súčin (ϑ)ααα0 = (ϑ1)ααα0 · . . . · (ϑk)αααk−1 matíc (ϑi)αααi−1 dielčích transformácií ϑi vzhľadom na jednotlivé polohy αααi−1 pohyblivej bázy ααα0. Cvičenia 151 7.6.2. Príklad. Nájdeme maticu lineárnej transformácie Ω : R3 → R3 ktorá vznikne zložením otočenia Ω1 okolo osi z = [eee3] o uhol π/4 s otočením Ω2 okolo osi so smerovým vektorom Ω1(eee1) o uhol π/3. Lineárna transformácia Ω1 má v báze εεε = (eee1,eee2,eee3) maticu (Ω1)εεε =   cos(π/4) − sin(π/4) 0 sin(π/4) cos(π/4) 0 0 0 1   =   √ 2/2 − √ 2/2 0√ 2/2 √ 2/2 0 0 0 1   . Lineárna transformácia Ω2 má v báze βββ = Ω1(εεε) = (Ω1(eee1), Ω1(eee2),eee3) (t. j. v „novej báze εεε) maticu (Ω2)βββ =   1 0 0 0 cos(π/3) − sin(π/3) 0 sin(π/6) cos(π/6)   =   1 0 0 0 1/2 − √ 3/2 0 √ 3/2 1/2   . Preto (Ω)εεε = (Ω2 ◦ Ω1)εεε = (Ω1)εεε · (Ω2)βββ =   √ 2/2 − √ 2/2 0√ 2/2 √ 2/2 0 0 0 1   ·   1 0 0 0 1/2 − √ 3/2 0 √ 3/2 1/2   =   √ 2/2 − √ 2/4 √ 6/4√ 2/2 √ 2/4 − √ 6/4 0 √ 3/2 1/2   . Na základe rovnosti (Ω)εεε = (Ω2)εεε · (Ω1)εεε je už teraz hračkou vypočítať aj samotnú maticu otočenia Ω2 vzhľadom na kanonickú bázu εεε: (Ω2)εεε = (Ω)εεε · (Ω1)−1 εεε =   √ 2/2 − √ 2/4 √ 6/4√ 2/2 √ 2/4 − √ 6/4 0 √ 3/2 1/2   ·   √ 2/2 √ 2/2 0 − √ 2/2 √ 2/2 0 0 0 1   =   3/4 1/4 √ 6/4 1/4 3/4 − √ 6/4 − √ 6/4 √ 6/4 1/2   . Cvičenia 7.1. Nech U, V sú vektorové priestory nad poľom K a ϕ: V → U je lineárne zobrazenie. Potom pre ľubovoľné vektory vvv1, . . . ,vvvn ∈ V platí ϕ[vvv1, . . . ,vvvn] = [ϕ(vvv1), . . . , ϕ(vvvn)]. Dokážte. Odvoďte z toho, že ak vvv1, . . . ,vvvn generujú V , tak ϕ(vvv1), . . . , ϕ(vvvn) generujú 152 7. Inverzné matice a zmena bázy Im ϕ. Špeciálne, stĺpce matice AAA ∈ Km×n generujú lineárny podpriestor Im ϕ ⊆ Km , kde ϕ: Kn → Km je dané predpisom ϕ(xxx) = AAA · xxx. 7.2. Určte hodnosť matice AAA nad poľom K: (a) K = R, AAA = „ 2 2 −1 3 0 1 « ; (b) K = C, AAA = „ 1 + i 1 + 3i 2 3 + i 5 + 5i 4 − 2i « ; (c) K = Z7, AAA = 1 1 2 3 5 4 1 3 0 ; (d) K = Z17, AAA = 1 1 2 3 5 4 1 3 0 . 7.3. (a) Dokážte vzorce z tvrdenia 7.2.4 (b) Dokážte, že pre ľubovoľnú maticu AAA ∈ Kn×n a k, l ∈ N platí AAAk · AAAl = AAAk+l a (AAAk )l = AAAkl . (c) Pre regulárnu maticu AAA ∈ Kn×n rozšírte definíciu jej mocniny AAAk na ľubovovoľný celočíselný exponent k a dokážte rovnosti AAAk · AAAl = AAAk+l , (AAAk )l = AAAkl pre všetky k, l ∈ Z (porovnaj s cvičením 2.13). (d) Za akých okolností platí pre matice AAA, BBB ∈ Kn×n rovnosť (AAA · BBB)k = AAAk · BBBk pre ľubovoľné k ∈ N? (e) Za akých okolností platí pre regulárne matice AAA, BBB ∈ Kn×n rovnosť (AAA · BBB)k = BBBk · AAAk pre ľubovoľné k ∈ Z? (f) Nájdite príklad regulárnych matíc AAA, BBB ∈ R2×2 takých, že všetky štyri matice (AAA · BBB)−2 , (BBB · AAA)−2 , AAA−2 · BBB−2 , BBB−2 · AAA−2 sú rôzne. Dá sa táto úloha riešiť aj bez počítania inverzných matíc? 7.4. Dokážte tvrdenie 7.3.5. 7.5. Zistite, či uvedená matica AAA nad poľom K je regulárna; v tom prípade vypočítajte k nej inverznú maticu AAA−1 : (a) K = Q, AAA = 3 2 1 4 2 1 1 0 1 ; (b) K = R, AAA = 1 √ 2 √ 6 0 1 √ 3 0 0 1 ; (c) K = C, AAA = 1+2i 1−i i−2 1 ; (d) K = C, AAA = 1+2i 1−i i−2 1+i ; (e) K = Z2, AAA = 1 1 0 1 0 1 0 1 1 ; (f) K = Z3, AAA = 1 1 0 1 0 1 0 1 1 . 7.6. Pre matice AAA, BBB nad poľom R vypočítajte maticu CCC = AAA−1 · BBB (ak AAA je regulárna): (a) AAA = „ −2 1 3 −2 « , BBB = „ 2 1 −1 3 2 −5 « ; (b) AAA = 0 @ 2 1 3 1 −2 0 3 0 3 1 A, BBB = 0 @ 2 1 2 2 −2 0 1 A Ako skúšku správnosti vypočítajte maticu AAA · CCC – mali by ste dostať BBB. 7.7. Pre matice AAA, BBB nad poľom R vypočítajte maticu CCC = AAA · BBB−1 (ak BBB je regulárna) (a) AAA 0 @ −2 1 1 −3 0 5 0 2 3 1 A, BBB = 0 @ 0 1 1 0 2 5 1 0 0 1 A; (b) AAA = 2 5 1 0 7 4 , BBB = ( 2 1 2 2 ). Ako skúšku správnosti vypočítajte maticu CCC · BBB – mali by ste dostať AAA. 7.8. Ná základe skúseností nadobudnutých v cvičeniach 7.5, 7.6 a 7.7 dokážte tvrdenie 7.3.1 7.9. Nájdite inverzné matice k maticiam RRRα, SSSα z príkladov 6.4.3, 6.4.4 Vysvetlite geometrický význam získaných výsledkov. Riešte rovnakú úlohu pre matice otočení okolo súradných osí v R3 . Všimnite si, že pre všetky uvažované matice AAA platí AAA−1 = AAAT . 7.10. Bázy ααα, βββ vektorového priestoru R3 sú tvorené stĺpcami matíc 1 1 1 0 1 1 0 0 1 resp. 1 0 0 −1 1 0 0 −1 1 . Cvičenia 153 (a) Nájdite matice prechodu PPPεεε,ααα, PPPβββ,εεε, PPPααα,βββ a PPPβββ,ααα. (b) Vektor xxx ∈ R3 má vzhľadom na bázu βββ súradnice (2, 7, 1)T . Nájdite vektor xxx ako aj jeho súradnice vzhľadom na bázu ααα. 7.11. Báza ααα vektorového priestoru R3 je tvorená stĺpcami matice 1 0 1 2 1 3 0 2 1 . Nájdite bázy βββ, γγγ priestoru R3 , ak poznáte matice prechodu PPPααα,βββ = 1 2 1 2 1 2 1 0 1 a PPPγγγ,ααα = 0 1 0 2 0 1 1 1 1 . Vypočítajte matice prechodu PPPβββ,γγγ a PPPγγγ,βββ. 7.12. Lineárne zobrazenie ϕ: R3 → R4 je dané predpisom ϕ(x, y, z)T = (x + y, x − y, 3x + y + z, z)T . (a) Nájdite maticu zobrazenia ϕ vzhľadom na bázy βββ priestoru R3 a ααα priestoru R4 tvorené stĺpcami matíc 1 1 1 1 2 3 1 4 9 resp. 0 1 0 1 1 −1 1 −1 0 1 2 3 0 0 0 1 (b) Nech xxx = (1, −4, 3)T ∈ R3 . Nájdite súradnice vektora ϕ(xxx) ∈ R4 vzhľadom na bázu ααα. (c) Vektor yyy ∈ R3 má vzhľadom na bázu βββ súradnice (1, 1, 1)T . Nájdite vektor ϕ(yyy) ∈ R4 . (d) Každú z úloh (b), (c) možno riešiť dvoma spôsobmi – vysvetlite ako. (e) Určte hodnosť h zobrazenia ψ a nájdite nejaké bázy priestorov R3 , R4 , vzhľadom na ktoré má matica ϕ blokový tvar IIIh 0 0 0 . Napíšte explicitne túto maticu. 7.13. Lineárne zobrazenie ψ: R4 → R3 má vzhľadom na bázy βββ priestoru R4 a ααα priestoru R3 tvorené stĺpcami matíc 1 1 1 1 1 0 1 0 1 −1 1 1 0 0 1 0 resp. 1 −1 0 0 1 −1 0 0 1 maticu AAA = 0 5 0 7 1 1 2 2 5 2 9 0 . (a) Nájdite maticu zobrazenia ψ vzhľadom na kanonické bázy εεε(4) , εεε(3) . (b) Nech uuu = (2, 1, 0, −1)T ∈ R4 . Nájdite súradnice vektora ψ(uuu) ∈ R3 vzhľadom na bázu ααα. (c) Vektor vvv ∈ R4 má vzhľadom na bázu βββ súradnice (1, −1, 1, −1)T . Nájdite vektor ψ(vvv) ∈ R3 . (d) Každú z úloh (b), (c) možno riešiť dvoma spôsobmi – vysvetlite ako. (e) Určte hodnosť h zobrazenia ψ a nájdite nejaké bázy priestorov R4 , R3 , vzhľadom na ktoré má matica ψ blokový tvar IIIh 0 0 0 . Napíšte explicitne túto maticu. 7.14. Dokážte, že ζζζ = ζζζ(n) = (1, 1 + x, (1 + x)2 , . . . , (1 + x)n ) je bázou vektorového priestoru R(n) [x] a nájdite matice prechodu PPPξξξ,ζζζ, PPPζζζ,ξξξ, kde ξξξ = ξξξ(n) = (1, x, x2 , . . . , xn ) je kanonická báza priestoru R(n) [x]. 7.15. Podľa cvičenia 6.10 je ηηη(n) = ηηη = 1, x, [x]2, . . . , [x]n bázou vektorového priestoru R(n) [x]. Pre 0 ≤ k, m ≤ n označme s(m, k) prvok na mieste (k, m) matice prechodu PPPξξξ,ηηη a S(m, k) prvok na mieste (k, m) matice prechodu PPPηηη,ξξξ. To znamená, že pre 0 ≤ m ≤ n platí [x]m = n k=0 s(m, k)xk a xm = n k=0 S(m, k)[x]k. Koeficienty s(m, k), S(m, k) sa nazývajú Stirlingove čísla prvého resp. druhého druhu. (a) Dokážte, že Stirlingove čísla prvého druhu vyhovujú podmienkam s(0, 0) = 1, s(n, 0) = 0 pre n ≥ 1, s(n, n) = 1 a s(n, k) = 0 pre k > n. (b) Dokážte, že pre 1 ≤ k ≤ n platí s(n + 1, k) = s(n, k − 1) − ns(n, k). (Návod: Vyjadrite polynóm [x]n+1 = [x]n(x−n) dvojakým spôsobom a porovnajte koeficienty pri xk .) 154 7. Inverzné matice a zmena bázy (c) Označme c(n, k) počet všetkých permutácií n-prvkovej množiny, pozostávajúcich z práve k disjunktných cyklov (vrátane 1-cyklov) – pozri cvičenie 0.14. Dokážte, že čísla c(n, k) vyhovujú podmienkam c(0, 0) = 1, c(n, 0) = 0 pre n ≥ 1, c(n, n) = 1 a c(n, k) = 0 pre k > n. (d) Kombinatorickou úvahou dokážte rovnosť c(n + 1, k) = c(n, k − 1) + nc(n, k) pre 1 ≤ k ≤ n. (Návod: Všetky permutácie (n + 1)-prvkovej množiny {0, 1, . . . , n} pozostávajúce z k disjunktných cyklov rozdeľte do dvoch skupín podľa toho, či obsahujú alebo neobsahujú 1-cyklus (0). Ukážte, že prvých je c(n, k − 1) a druhých nc(n, k).) (e) Na základe (a), (b), (c) a (d) dokážte, že pre všetky k, n ∈ N platí c(n, k) = (−1)n−k s(n, k) = |s(n, k)|. Čísla c(n, k) sa nazývajú znamienkovo prosté Stirlingove čísla prvého druhu. (f) Uvedomte si, že (c), (d) sú vlastne akýmisi pravidlami modifikovaného Pascalovho trojuholníka pre čísla c(n, k). Vypočítajte hodnoty týchto čísel pre n ≤ 5, 0 ≤ k ≤ n. (g) Dokážte, že Stirlingove čísla druhého druhu vyhovujú podmienkam S(0, 0) = 1, S(n, 0) = 0 pre n ≥ 1, S(n, n) = 1 a S(n, k) = 0 pre k > n. (h) Dokážte, že pre 1 ≤ k ≤ n platí S(n + 1, k) = S(n, k − 1) + kS(n, k). (Návod: S využitím rovnosti [x]k+1 = [x]k(x − k) vyjadrite polynóm xn+1 = xn x dvojakým spôsobom a porovnajte koeficienty pri [x]k.) (i) Označme S(n, k) počet všetkých rozkladov n-prvkovej množiny, pozostávajúcich z práve k disjunktných množín – pozri paragraf 0.6. Dokážte, že čísla S(n, k) vyhovujú podmienkam S(0, 0) = 1, S(n, 0) = 0 pre n ≥ 1, S(n, n) = 1 a S(n, k) = 0 pre k > n. (j) Kombinatorickou úvahou dokážte rovnosť S(n + 1, k) = S(n, k − 1) + kS(n, k) pre 1 ≤ k ≤ n. (Návod: Všetky rozklady (n + 1)-prvkovej množiny {0, 1, . . . , n} na k disjunktných podmnožín rozdeľte do dvoch skupín podľa toho, či obsahujú alebo neobsahujú jednoprvkovú množinu {0}. Ukážte, že prvých je S(n, k − 1) a druhých kS(n, k).) (k) Na základe (g), (h), (i) a (j) dokážte, že pre všetky k, n ∈ N platí S(n, k) = S(n, k). (l) Uvedomte si, že (g), (h) sú vlastne akýmisi pravidlami modifikovaného Pascalovho trojuholníka pre čísla S(n, k). Vypočítajte hodnoty týchto čísel pre n ≤ 5, 0 ≤ k ≤ n. 7.16. (a) Nech ααα, βββ sú dve bázy konečnorozmerného vektorového priestoru V a ϑ: V → V je lineárna transformácia taká, že ϑ(ααα) = βββ. Potom (ϑ)βββ = PPPααα,βββ. Dokážte. (b) Nech γγγ je tretia báza vo V a η: V → V je lineárna transformácia taká, že η(βββ) = γγγ. Odvoďte nasledujúce vyjadrenie pre maticu zloženej transformácie η ◦ ϑ vo výslednej báze γγγ pomocou jej predchádzajúcich polôh ααα a βββ: (η ◦ ϑ)γγγ = (ϑ)βββ ◦ (η)γγγ. (c) Zovšeobecnite (b) na ľubovoľný počet k lineárnych transformácií a k +1 báz podľa vzoru vety 7.6.1 7.17. (a) Pre ľubovoľnú dvojicu vektorov eeei = eeej kanonickej bázy εεε v R3 nájdite maticu (Ω)εεε transformácie Ω, ktorá vznikne zložením otočenia Ω1 okolo osi [eeei] o uhol ϕ s otočením Ω2 okolo osi [eeej] o uhol ψ. (b) Na základe (a) nájdite maticu otočenia o uhol ψ okolo priamky, ktorá leží v rovine [eeei,eeej] a zviera s osou [eeei] uhol ϕ, vzhľadom na bázu εεε. (Všetky otočenia orientujte podľa pravidla pravej ruky.) (c) Riešte úlohy (a) a (b) pre niekoľko konkrétnych volieb bázických vektorov eeei, eeej a Cvičenia 155 uhlov ϕ, ψ. 7.18. Nech ααα = (uuu1, . . . ,uuun) je nejaká báza vektorového priestoru V nad poľom K a βββ = (vvv1, . . . ,vvvm) je ľubovoľná usporiadaná m-tica vektorov z V . Uvedomte si, že maticu PPPααα,βββ = (vvv1)ααα, . . . , (vvvm)ααα ∈ Kn×m možno definovať aj za takýchto všeobecnejších pomienok a dokážte nasledujúce tvrdenia: (a) Pre hodnosť matice PPPααα,βββ platí h(PPPααα,βββ) = dim[vvv1, . . . ,vvvm]. (b) Ak m = n, tak matica PPPααα,βββ je regulárna práve vtedy, keď aj βββ je báza priestoru V . (c) Ak m = n, tak pre jednoznačne určené (nie nutne bijektívne) lineárne zobrazenie ϑ: V → V také, že ϑ(uuui) = vvvi pre i ≤ n stále platí (ϑ)ααα = PPPααα,βββ. 8. Afinné podpriestory a afinné zobrazenia Keď sme v paragrafe 4.1, odvolávajúc sa na geometrický názor, ilustrovali pojem lineárneho podpriestoru, ako príklad sme uviedli, že netriválne vlastné lineárne podpriestory „nášho trojrozmerného vektorového priestoru R3 sú práve priamky a roviny prechádzajúce počiatkom 0. Kritickejší čitateľ mohol vtedy oprávnene zapochybovať o adekvátnosti a prirodzenosti tohto pojmu, či aspoň pocítiť potrebu zaviesť taký pojem podpriestoru, ktorý by napr. v R3 zahŕňal všetky priamky a roviny, nielen tie prechádzajúce počiatkom. Podobne sme v paragrafe 6.1 hneď po definícii pojmu lineárneho zobrazenia boli nútení učiniť poznámku o jeho odlišnosti od pojmu lineárnej funkcie používaného v matematickej analýze. Vzápätí sme prijali záväzok, že sa s týmto nedostatkom v príhodný čas vyrovnáme. Ten čas práve nastal. Spomínané medzery zaplníme definíciami pojmu afinného podpriestoru alebo tiež lineárnej variety a pojmu afinného zobrazenia. Afinita znamená príbuznosť, spriaznenosť. Čitateľ sám uvidí, že objekty označené prívlastkom „afinný sú úzko spriaznené so zodpovedajúcimi objektmi nesúcimi prívlastok „lineárny . Ťažiskom kapitoly bude klasifikácia vzájomnej polohy afinných podpriestorov vo vektorovom priestore. 8.1 Body a vektory Na vektory, čiže na prvky vektorových priestorov – aspoň pokiaľ ide o konečnorozmerné vektorové priestory nad R, – sa dívame ako na orientované úsečky s počiatkom v bode 0. Už táto veta prezrádza, že pôvodne sa na prvky takéhoto priestoru dívame ako na body a celý priestor chápeme ako homogénny, t. j. všetky body považujeme za rovnocenné a nevyčleňujeme v ňom nijaký privilegovaný bod za počiatok. Až na základe tohto pôvodného porozumenia dokážeme po vyčlenení nejakého počiatku O (ktorým sa môže stať ľubovoľný bod homogénneho priestoru) nahradiť bod A príslušného priestoru orientovanou úsečkou −→ OA a následne abstrahovať od jej polohy, to znamená uvidieť za ňou vektor uuu = −→ OA, daný len jej veľkosťou, smerom a orientáciou, ktorý možno umiestniť do ľubovoľného bodu priestoru – nielen do počiatku. Afinným priestorom nad poľom K rozumieme vektorový priestor V nad týmto poľom, pri pohľade na ktorý sme sa vrátili k onomu pôvodnému porozumeniu jeho štruktúre a prvkom. Tie sa z vektorov stali opäť bodmi a počiatok (t. j. nulový vektor) stratil svoje výsadné postavenie – stal sa z neho bod ako každý iný. 8.2. Afinné podpriestory 157 Formálnu definíciu afinného priestoru nad poľom K tu uvádzať nebudeme. Sme totiž toho názoru, že matematická formalizácia rozdielu medzi oboma spomínanými pohľadmi na prvky vektorového priestoru by v tejto chvíli vniesla do veci viac zmätku než svetla. Celkom postačí, keď úlohu prepínača medzi oboma pohľadmi zveríme dvojiciam slov „bod – „vektor a „afinný ,– „lineárny , prípadne „afinný – „vektorový . Na druhej strane však pred nami vyvstáva potreba formálnej definície podmnožín vektorového priestoru, ktoré sú „vernými kópiami lineárnych podpriestorov – nemusia však prechádzať počiatkom, ale možu byť umiestnené „kdekoľvek . 8.2 Afinné podpriestory V celom tomto a nasledujúcich dvoch paragrafoch V označuje nejaký pevný, no inak ľubovoľný, vektorový priestor nad poľom K a m, n sú prirodzené čísla. Kvôli pohodliu čitateľa budeme písmenami ppp, qqq, rrr (možno s indexmi) značiť výlučne body, uuu, vvv, www označujú zasa výlučne vektory, kým xxx, yyy, zzz môžu podľa potreby označovať body i vektory. Taktiež sa dohodneme, že rozdiel dvoch bodov budeme chápať ako vektor, kým súčet bodu a vektora ako bod. Nech ppp,qqq ∈ V , ppp = qqq. Priamkou prechádzajúcou alebo tiež určenou bodmi ppp,qqq rozumieme množinu (ppp,qqq), ktorú dostaneme tak, že do bodu ppp umiestnime všetky možné skalárne násobky vektora qqq − ppp. Typický bod priamky (ppp,qqq) má teda tvar xxx = ppp + t(qqq − ppp) = (1 − t)ppp + tqqq, kde t ∈ K, čiže (ppp,qqq) = {sppp + tqqq; s, t ∈ K & s + t = 1} ⊆ V. Tento výraz má, samozrejme, zmysel aj pre ppp = qqq, vtedy však nejde o priamku ale o jednobodovú množinu (ppp,ppp) = {ppp}. Z uvedeného tvaru ihneď vidíme, že (ppp,qqq) = (qqq,ppp) pre ľubovoľné ppp,qqq ∈ V . Lineárnu kombináciu, t. j. výraz tvaru t0ppp0 + t1ppp1 + . . . + tnpppn = n i=0 tipppi, kde n ∈ N, ppp0, . . . ,pppn ∈ V , t0, t1, . . . , tn ∈ K, nazývame afinnou alebo tiež barycentrickou1 kombináciou bodov ppp0,ppp1, . . . ,pppn, ak platí t0 + t1 + . . . + 1 Barycentrum znamená ťažisko. 158 8. Afinné podpriestory a afinné zobrazenia tn = 1. Výsledok afinnej kombinácie bodov budeme chápať ako bod; iné lineárne kombinácie bodov ako afinné sa v našich úvahách nevyskytnú. (Ešte si všimnite, že každá afinná kombinácia je neprázdna, t. j. obsahuje aspoň jeden člen.) Neprázdnu podmnožinu M vektorového priestoru V nazývame jeho afinným podpriestorom, prípadne lineárnou varietou vo V , ak pre všetky body ppp,qqq,rrr ∈ M a každý skalár s ∈ K platí sppp + (1 − s)qqq ∈ M a ppp − qqq + rrr ∈ M. Inak povedané, ∅ = M ⊆ V je afinný podpriestor, ak M je uzavretá vzhľadom na afinné kombinácie uvedených dvoch typov. Prvá podmienka znamená, že pre všetky ppp,qqq ∈ M platí (ppp,qqq) ⊆ M, t. j. M s každou dvojicou bodov obsahuje celú priamku nimi určenú. Druhú podmienku dodávame len kvôli poliam charakteristiky 2; ak char K = 2, tak už vyplýva z prvej, takže je vlastne zbytočná. Na druhej strane, napr. vo vektorovom priestore V nad poľom Z2 pre všetky body ppp,qqq ∈ V platí (ppp,qqq) = {ppp,qqq}, teda len prvej podmienke by vyhovovala každá podmnožina M ⊆ V . Podrobnejšie o tom pojednáva nasledujúce tvrdenie, ktoré je očividne analógiou tvrdenia 4.1.2 8.2.1. Tvrdenie. Pre ľubovoľnú neprázdnu množinu M ⊆ V nasledujúce podmienky sú ekvivalentné: (i) M je afinný podpriestor vo V , t. j. pre ľubovoľné ppp,qqq,rrr ∈ M, s ∈ K platí sppp + (1 − s)qqq ∈ M a ppp − qqq + rrr ∈ M; (ii) M je uzavretá vzhľadom na ľubovoľné afinné kombinácie trojíc bodov, t. j. pre všetky ppp,qqq,rrr ∈ M, s, t ∈ K platí sppp + tqqq + (1 − s − t)rrr ∈ M; (iii) M je uzavretá vzhľadom na akékoľvek afinné kombinácie, t. j. pre všetky n ∈ N, body ppp0,ppp1, . . . ,pppn ∈ M a skaláry t0, t1, . . . , tn ∈ K také, že t0 + t1 + . . . + tn = 1, platí t0ppp0 + t1ppp1 + . . . + tnpppn ∈ M; Ak char K = 2, tak uvedené podmienky sú navyše ekvivalentné s podmien- kou (i− ) pre ľubovoľné ppp,qqq ∈ M, s ∈ K platí sppp + (1 − s)qqq ∈ M. Dôkaz. Implikácie (iii) ⇒ (ii) ⇒ (i) sú zrejmé aj bez predpokladu char K = 2. Dokážeme implikáciu (i) ⇒ (iii); pri dôkaze vyjde navyše najavo, že pre char K = 2 stačí na odvodenie záveru (iii) slabšia podmienka (i− ) miesto (i). Predpokladajme (i) (teda tým skôr (i− )) a pripusťme, že podmienka (iii) neplatí. Označme n najmenšie prirodzené číslo, pre ktoré to nastane. Potom n ≥ 2 a pre všetky k < n podmienka (iii) platí, čiže M je uzavretá na afinné kombinácie ≤ n bodov. Nech ppp0, . . . ,pppn ∈ M, t0, . . . , tn ∈ K sú také, že t0 + . . . + tn = 1 a t0ppp0 + . . . + tnpppn /∈ M. Treba zvážiť dve možnosti. (a) Ak ti = 1 pre aspoň jedno i ≤ n, tak bez ujmy na všeobecnosti môžeme 8.2. Afinné podpriestory 159 predpokladať, že t0 = 1. Označme qqq = t1 1 − t0 ppp1 + . . . + tn 1 − t0 pppn. Keďže t1 1 − t0 + . . . + tn 1 − t0 = t1 + . . . + tn 1 − t0 = 1, qqq ∈ M, lebo qqq je afinnou kombináciou n bodov z M. Potom t0ppp0 + t1ppp1 + . . . + tnpppn = t0ppp0 + (1 − t0)qqq ∈ M vyplýva už z podmienky (i− ). To je však spor. (b) Ak ti = 1 pre všetky i ≤ n, tak ide o afinnú kombináciu ppp0 + ppp1 + . . . + pppn−1 + pppn a t1 + . . . + tn−1 = −1. Potom qqq = −ppp1 − . . . − pppn−1 je afinnou kombináciou n − 1 bodov z M, teda qqq ∈ M. Podľa druhej z podmienok v (i) máme ppp0 + ppp1 + . . . + pppn−1 + pppn = ppp0 − qqq + pppn ∈ M, čo je opäť spor. Ak char K = 2, možno sa zaobísť bez tejto podmienky. Keďže 1 2 + 1 2 = 1, už z (i− ) vyplýva 1 2 ppp0 + 1 2 pppn ∈ M. Nakoľko 2 + (−1) = 1, opäť len z (i− ) dostávame ppp0 + ppp1 + . . . + pppn−1 + pppn = 2 1 2 ppp0 + 1 2 pppn − qqq ∈ M. Poznámka. Ak char K = ∞, tak možnosť (b) zrejme nemôže nastať, teda v uvedenom dôkaze stačí uvažovať len možnosť (a). Zároveň vidno, že v druhej časti bodu (b) je podstatný predpoklad char K = 2. Bez neho by sme totiž nevedeli zaručiť existenciu prvku 1/2 = 2−1 ∈ K inverzného k prvku 2 = 1 + 1 ∈ K. Nasledujúca veta ukazuje, že afinné podpriestory skutočne nie sú ničím iným, než lineárnymi podpriestormi posunutými do ľubovoľného bodu príslušného vektorového priestoru. 8.2.2. Veta. Nech M ⊆ V . Potom M je afinný podpriestor vo V práve vtedy, keď existuje bod ppp ∈ V a lineárny podpriestor S ⊆ V taký, že M = ppp + S = {ppp + uuu; uuu ∈ S}. V tom prípade pre všetky qqq,rrr ∈ M, uuu ∈ S platí qqq − rrr ∈ S, qqq + uuu ∈ M, M = qqq + S, S = {xxx − qqq; xxx ∈ M} = {xxx − yyy; xxx,yyy ∈ M}. 160 8. Afinné podpriestory a afinné zobrazenia Dôkaz. Nech M ⊆ V je afinný podpriestor a ppp ∈ M je jeho ľubovoľný bod. Položme S = {xxx − ppp; xxx ∈ M}. Potom zrejme M = ppp+S. Stačí teda dokázať, že S ⊆ V je lineárny podpriestor. Keďže ppp ∈ M, platí 0 = ppp − ppp ∈ S. Ukážeme uzavretosť S na lineárne kombinácie. Nech uuu,vvv ∈ S, a, b ∈ K. Potom uuu = xxx − ppp, vvv = yyy − ppp pre nejaké xxx,yyy ∈ M. Jednoduchý výpočet dáva auuu + bvvv = a(xxx − ppp) + b(yyy − ppp) = axxx + byyy + (1 − a − b)ppp − ppp. Prvé tri sčítance tvoria afinnú kombináciu bodov z M, teda axxx + byyy + (1 − a − b)ppp ∈ M; preto tiež auuu + bvvv ∈ S Nech naopak M = ppp + S pre nejaký bod ppp ∈ V a lineárny podpriestor S ⊆ V . Podľa tvrdenia 8.2.1 stačí ukázať uzavretosť M na afinné kombinácie trojíc. Nech xxx,yyy,zzz ∈ M, s, t ∈ K. Potom xxx = ppp + uuu, yyy = ppp + vvv, zzz = ppp + www pre nejaké uuu,vvv,www ∈ S. Počítajme sxxx + tyyy + (1 − s − t)zzz = s(ppp + uuu) + t(ppp + vvv) + (1 − s − t)(ppp + www) = ppp + suuu + tvvv + (1 − s − t)www. Keďže tuuu + svvv + (1 − s − t)www ∈ S, dostávame sxxx + tyyy + (1 − s − t)zzz ∈ M. Ďalšie tri podmienky možno teraz overiť priamymi výpočtami, ktoré prenechávame čitateľovi; štvrtá z nich okamžite vyplýva. 8.2.3. Dôsledok. Každý lineárny podpriestor S vektorového priestoru V je jeho afinným podpriestorom. Afinný podpriestor M vektorového priestoru V je jeho lineárnym podpriestorom práve vtedy, keď 0 ∈ M. Zameraním alebo tiež smerovým podpriestorom afinného podpriestoru M ⊆ V nazývame lineárny podpriestor Dir M = {xxx − yyy; xxx,yyy ∈ M} ⊆ V. (Označenie pochádza z anglického slova direction). Podľa vety 8.2.2 je Dir M jediný lineárny podpriestor vo V taký, že M = ppp + Dir M pre nejaké (pre každé) ppp ∈ M. Taktiež pre každé ppp ∈ M platí Dir M = {xxx − ppp; xxx ∈ M}. Pre každú usporiadanú (n+1)-ticu bodov (ppp0, . . . ,pppn), vektorového priestoru V , prípadne pre jeho konečnú neprázdnu podmnožinu {ppp0, . . . ,pppn}, označme (ppp0, . . . ,pppn) = {t0ppp0 + . . . + tnpppn; t0, . . . , tn ∈ K & t0 + . . . + tn = 1} 8.2. Afinné podpriestory 161 množinu všetkých afinných kombinácií bodov ppp0, . . . ,pppn. Z práve dokázaného tvrdenia vyplýva, že (ppp0, . . . ,pppn) je najmenší afinný podpriestor vo V , ktorý obsahuje všetky body ppp0, . . . ,pppn; nazývame ho afinný obal bodov ppp0, . . . ,pppn alebo tiež afinný podpriestor generovaný bodmi ppp0, . . . ,pppn. Vo všeobecnosti možno pre ľubovoľnú (i nekonečnú) neprázdnu množinu X ⊆ V definovať jej afinný obal (X), nazývaný tiež afinný podpriestor generovaný množinou X, ako množinu všetkých (konečných) afinných kombinácií bodov z X. Opäť platí, že (X) je najmenší afinný podpriestor vo V , pre ktorý X ⊆ (X). 8.2.4. Tvrdenie. Nech ppp0,ppp1, . . . ,pppn ∈ V . Potom (ppp0,ppp1, . . . ,pppn) = ppp0 + [ppp1 − ppp0, . . . ,pppn − ppp0], Dir (ppp0,ppp1, . . . ,pppn) = [ppp1 − ppp0, . . . ,pppn − ppp0]. Dôkaz. prenechávame ako cvičenie čitateľovi. Dimenziou alebo tiež rozmerom afinného podpriestoru M ⊆ V , označenie dim M, nazývame dimenziu jeho zamerania, teda dim M = dim Dir M. Body ppp0,ppp1, . . . ,pppn vektorového priestoru V nazývame afinne nezávislé, ak vektory ppp1 −ppp0, . . . ,pppn −ppp0 sú lineárne nezávislé. Z nasledujúceho očividného tvrdenia okrem iného vyplýva, že body ppp0,ppp1, . . . ,pppn ∈ V sú afinne nezávislé práve vtedy, keď pre nejaké (pre každé) 0 ≤ k ≤ n vektory pppj − pppk, kde 0 ≤ j ≤ n a j = k, sú lineárne nezávislé. Inak povedané, platí 8.2.5. Tvrdenie. Body ppp0,ppp1, . . . ,pppn ∈ V sú afinne nezávislé práve vtedy, keď dim (ppp0,ppp1, . . . ,pppn) = n Zrejme 0-rozmerné afinné podpriestrory vo V sú práve všetky body ppp ∈ V (presnejšie, všetky jednobodové podmnožiny vo V ). Tieto afinné podpriestory nazývame tiež triviálne. Jednorozmené afinné podpriestory vo V nazývame priamkami. Každá priamka má naozaj tvar (ppp,qqq) pre nejaké afinne nezávislé (t. j. rôzne) body ppp,qqq ∈ V . Dvojrozmerné afinné podpriestory vo V nazývame rovinami. Taktiež samotný priestor V je svojim nevlastným afinným podpriestorom. Ak dim V = n, tak (n−1)-rozmerné afinné podpriestory vo V nazývame nadrovinami. Kým pojmy „bod , „priamka a „rovina sú absolútne v tom zmysle, že závisia len na dimenzii príslušného afinného podpriestoru, pojem nadroviny je relatívny, lebo závisí na vzťahu dimenzií afinného podpriestoru a celého priestoru. Napríklad ak dim V = 1 (t. j. ak samotné V je priamka), tak každý bod vo V je zároveň nadrovinou. Nadrovinami v dvojrozmernom priestore 162 8. Afinné podpriestory a afinné zobrazenia (t. j. v rovine) sú zasa všetky priamky. V trojrozmernom priestore V pojmy roviny a nadroviny splývajú. V štvorrozmernom priestore sú zasa nadrovinami trojrozmerné podpriestory; atď. Ešte poznamenajme, že v 0-rozmernom (t. j. jednobodovom) priestore V niet priamok, rovín ani nadrovín. 8.3 Prienik a spojenie afinných podpriestorov V tomto paragrafe mierne zovšeobecníme niektoré výsledky paragrafov 4.3 a 5.4 o prieniku a súčte lineárnych podpriestorov do podoby použiteľnej pre afinné podpriestory. 8.3.1. Tvrdenie. Nech M, N ⊆ V sú afinné podpriestory. Potom M ∩ N je afinný podpriestor vo V práve vtedy, keď M ∩ N = ∅. V tom prípade Dir(M ∩ N) = Dir M ∩ Dir N. Dôkaz. Ak M ∩ N = ∅, tak to samozrejme nie je afinný podpriestor. Nech M ∩N = ∅. Označme S = Dir M, T = Dir N príslušné smerové podpriestory. Zvoľme ľubovoľný bod ppp ∈ M ∩ N. Stačí dokázať rovnosť M ∩ N = ppp + (S ∩ T). Zvoľme qqq ∈ M ∩N. K nemu existujú uuu ∈ S, vvv ∈ T také, že qqq = ppp+uuu = ppp+vvv. Potom uuu = vvv ∈ S ∩T a qqq ∈ ppp+(S ∩T). Teda M ∩N ⊆ ppp+(S ∩T). Obrátená inklúzia je triviálna. Neprázdnosť prieniku M ∩ N možno zaručiť za predpokladu, že lineárny priestor Dir M + Dir N je „dosť veľký . 8.3.2. Tvrdenie. Nech M, N ⊆ V sú afinné podpriestory. Potom Dir M + Dir N = V ⇒ M ∩ N = ∅. Dôkaz. Označme S = Dir M, T = Dir N. Zvoľme ľubovoľné ppp ∈ M, qqq ∈ N. Keďže S + T = V , existujú vektory uuu ∈ S, vvv ∈ T také, že qqq − ppp = uuu + vvv. Potom qqq = ppp + (qqq − ppp) = ppp + uuu + vvv V dôsledku toho ppp + uuu = qqq − vvv ∈ M ∩ N, lebo ppp + uuu ∈ M a qqq − vvv ∈ N. Spojením afinných podpriestorov M, N ⊆ V , označenie M N, nazývame afinný obal ich zjednotenia. Teda M N = (M ∪ N). Zrejme M N je najmenší afinný podpriestor vo V , ktorý obsahuje M aj N, a pre lineárne podpriestory S, T ⊆ V platí S T = S + T. 8.3. Prienik a spojenie afinných podpriestorov 163 8.3.3. Tvrdenie. Nech M, N ⊆ V sú afinné podpriestory. (a) Ak M ∩ N = ∅, tak Dir(M N) = Dir M + Dir N, M N = M + Dir N = N + Dir M. (b) Ak M ∩ N = ∅, tak pre ľubovoľné ppp ∈ M, qqq ∈ N platí Dir(M N) = [qqq − ppp] + Dir M + Dir N, M N = M + ([qqq − ppp] + Dir N) = N + ([qqq − ppp] + Dir M). Poznámka. Stojí za zmienku, že obe rovnosti z (b) sú splnené aj za predpokladu M ∩ N = ∅. V tom prípade však pre ľubovoľné rrr ∈ M ∩ N platí qqq − ppp = (rrr − ppp) + (qqq − rrr) ∈ Dir M + Dir N, takže vektor qqq − ppp možno v príslušných vzťahoch vynechať. Rovnako tomu bude i v príklade 8.3.5 Dôkaz. Stačí dokázať len (b), lebo (a) z neho vyplýva vo svetle našej poznámky. Označme S = Dir M, T = Dir N a zvoľme ppp ∈ M, qqq ∈ N. Budeme dokazovať iba rovnosť M N = ppp + [qqq − ppp] + S + T; zvyšok je už jej bezprostredným dôsledkom. Každý bod rrr ∈ M N je afinnou kombináciou rrr = m i=0 sipppi + n j=0 tjqqqj kde ppp0, . . . ,pppm ∈ M, qqq0, . . . ,qqqn ∈ N, s0, . . . , sm, t0, . . . , tn ∈ K a i si + j tj = 1. Potom pppi − ppp ∈ S, qqqj − qqq ∈ T pre i ≤ m, j ≤ n. Označme s = s0 + . . . + sm, t = t0 + . . . + tn a počítajme rrr = (sppp + tqqq) + m i=0 si(pppi − ppp) + n j=0 tj(qqqj − qqq) = ppp + t(qqq − ppp) + m i=0 si(pppi − ppp) + n j=0 tj(qqqj − qqq) ∈ ppp + [qqq − ppp] + S + T, keďže s = 1 − t. Teda M N ⊆ ppp + [qqq − ppp] + S + T. Obrátená inklúzia je triviálna. 164 8. Afinné podpriestory a afinné zobrazenia 8.3.4. Dôsledok. Nech M, N ⊆ V sú konečnorozmerné afinné podpriestory. Potom dim(M N) = dim M + dim N − dim(M ∩ N), ak M ∩ N = ∅, dim M + dim N − dim(Dir M ∩ Dir N) + 1, ak M ∩ N = ∅. 8.3.5. Príklad. Vo vektorovom priestore V uvažujme konečnorozmerné afinné podpriestory M = ppp + [uuu1, . . . ,uuum], N = qqq + [vvv1, . . . ,vvvn]. Potom M N = ppp + [uuu1, . . . ,uuum,vvv1, . . . ,vvvn], ak M ∩ N = ∅, ppp + [qqq − ppp,uuu1, . . . ,uuum,vvv1, . . . ,vvvn], ak M ∩ N = ∅, dim(M N) = dim[uuu1, . . . ,uuum,vvv1, . . . ,vvvn], ak M ∩ N = ∅, dim[qqq − ppp,uuu1, . . . ,uuum,vvv1, . . . ,vvvn]), ak M ∩ N = ∅. Ak navyše predpokladáme, že tak vektory uuu1, . . . ,uuum ako aj vektory vvv1, . . . ,vvvn sú lineárne nezávislé, tak dim(M N) = m + n − k, ak M ∩ N = ∅, m + n − k + 1, ak M ∩ N = ∅, kde k = dim([uuu1, . . . ,uuum] ∩ [vvv1, . . . ,vvvn]). 8.3.6. Príklad. V stĺpcovom priestore R4 sú dané vektory xxx = (1, 2, 3, 4)T , yyy = (0, −3, 1, −1)T , zzz = (1, 1, 0, 0)T , uuu = (0, −2, 4, 3)T , vvv = (2, 6, 2, 5)T , www = (0, 0, 1, 1)T a bližšie neurčené body ppp, qqq. Potom S = [xxx,yyy,zzz], T = [uuu,vvv,www] sú lineárne podpriestory a M = ppp + S, N = qqq + N sú afinné podpriestory v R4 . Nájdeme dimenzie lineárnych podpriestorov S + T, S ∩ T a afinných podpriestorov M ∩ N, M N v závislosti na ppp, qqq. Lineárny podpriestor S + T je generovaný stĺpcami blokovej matice     1 0 1 2 −3 1 3 1 0 4 −1 0 0 2 0 −2 6 0 4 2 1 3 5 1     , 8.4. Vzájomná poloha afinných podpriestorov 165 pričom stĺpce ľavého bloku generujú lineárny podpriestor S a stĺpce pravého bloku lineárny podpriestor T. Táto matica je riadkovo ekvivalentná s blokovou maticou     1 0 1 0 1 −3 0 0 3 0 0 0 0 2 0 4 −4 0 −3 3 1 0 0 1     v stupňovitom tvare, ktorej riadky majú vedúce prvky v stĺpcoch 1, 2, 3 a 6. Hneď vidíme, že vektory xxx,yyy,zzz tvoria bázu S a vektory xxx,yyy,zzz,www bázu S +T. Doupravovaním pravého bloku na riadkovo ekvivalentný stupňovitý tvar     4 −4 0 0 2 0 0 0 1 0 0 0     sa možno presvedčiť, že i vektory uuu,vvv,www sú lineárne nezávislé, teda tvoria bázu T. Zhrnutím dostávame dim S = dim T = 3, dim(S + T) = 4. Odtiaľ podľa vety 5.4.1 vyplýva dim(S ∩ T) = 3 + 3 − 4 = 2. Takže S + T = R4 , a bez toho, že by sme čokoľvek ďalej počítali, z tvrdenia 8.3.2 vieme, že nezávisle na bodoch ppp, qqq platí M ∩ N = ∅. Preto dim(M ∩ N) = dim(S ∩ T) = 2 podľa tvrdenia 8.3.1 S použitím tvrdenia 8.3.3 a dôsledku 8.3.4 dostávame dim(M N) = dim(S + T) = 4. 8.4 Vzájomná poloha afinných podpriestorov V tomto paragrafe podáme sľúbenú klasifikáciu vzájomnej polohy dvojíc netriviálnych vlastných afinných podpriestorov vo vektorovom priestore V . (Hoci to nie je z logického hľadiska nevyhnutné, aby sme sa vyhli triedeniu trivialít, body a celý priestor V z našich úvah vylučujeme.) Táto téma prirodzeným spôsobom rozširuje látku stredoškolskej geometrie, zahŕňajúcu klasifikáciu vzájomnej polohy priamok v rovine resp. priamok a rovín v (trojrozmernom) priestore. Polohu netriviálnych vlastných lineárnych variet M, N ⊆ V budeme klasifikovať na základe dvoch kritérií: (A) Ak platí Dir M ⊆ Dir N ∨ Dir N ⊆ Dir M, hovoríme, že M, N sú rovnobežné a píšeme M N. V opačnom prípade, t. j. ak platí Dir M ⊆ Dir N & Dir N ⊆ Dir M, hovoríme, že M, N nie sú rovnobežné, a píšeme M N. (B) Ak platí M ∩ N = ∅, hovoríme, že M, N sa pretínajú. V opačnom prípade, t. j. ak M ∩ N = ∅, hovoríme, že M, N sa nepretínajú, alebo, že sú disjunktné. 166 8. Afinné podpriestory a afinné zobrazenia Celkovo teda dostávame štyri možnosti: (1) M N & M ∩ N = ∅, čiže M, N sú rovnobežné a pretínajú sa. Ľahko možno nahliadnuť, že v takom prípade platí Dir M ⊆ Dir N ⇔ M ⊆ N a Dir N ⊆ Dir M ⇔ N ⊆ M. Teda M ⊆ N alebo N ⊆ M. Hovoríme, že jedna z lineárnych variet M, N je podvarietou druhej, alebo, že M, N sú vo vzťahu inklúzie. (2) M N & M ∩ N = ∅, čiže M, N sú rovnobežné a nepretínajú sa. Tento prípad nazývame vzťahom pravej rovnobežnosti. (3) M N & M ∩ N = ∅, čiže M, N nie sú rovnobežné a pretínajú sa. Hovoríme, že M, N sú rôznobežné. (4) M N & M ∩ N = ∅, čiže M, N nie sú rovnobežné a nepretínajú sa. V tomto prípade ešte rozlišujeme dve ďalšie možnosti: (4a) Ak Dir M ∩ Dir N = {0}, hovoríme, že M, N sú mimobežné. (4b) Ak Dir M ∩ Dir N = {0}, hovoríme, že M, N sú čiastočne rovno- bežné. Prípady (1), (2), (3) sú nám dobre známe zo stredoškolskej planimetrie, s prípadom (4) sa však v rovine stretnúť nemožno – dve priamky v rovine buď splývajú alebo sú to pravé rovnobežky alebo rôznobežky. Zo stredoškolskej stereometrie, okrem prípadov (1), (2), (3), ktoré sa realizujú vo vzájomných polohách dvojíc priamok, dvojíc rovín ako i priamky a roviny v trojrozmernom priestore, poznáme aj prípad (4a) – ide o prípad mimobežných priamok. S prípadom (4b), t. j. s prípadom čiastočnej rovnobežnosti sme sa však dosiaľ nestretli a nedokážeme ho spojiť so žiadnou názornou geometrickou predstavou. Nie je to náhoda. Platí totiž nasledujúce tvrdenie. 8.4.1. Tvrdenie. Nech M, N ⊆ V sú čiastočne rovnobežné lineárne variety. Potom dim M ≥ 2, dim N ≥ 2 a dim V ≥ 4. Dôkaz. Označme S = Dir M, T = Dir N. Potom S ∩ T je netriválny vlastný lineárny podpriestor každého zo zameraní S, T. Teda dim(S ∩ T) ≥ 1, dim M = dim S ≥ 2, dim N = dim T ≥ 2 a taktiež dim(S ∩ T) ≤ min(dim S, dim T) − 1. S použitím vety 5.4.1 z toho vyplýva dim(S + T) = dim S + dim T − dim(S ∩ T) ≥ dim S + dim T − min(dim S, dim T) + 1 = max(dim S, dim T) + 1 ≥ 3. Keďže M ∩ N = ∅, podľa tvrdenia 8.3.2 je S + T vlastný lineárny podpriestor vo V . Preto dim V ≥ dim(S + T) + 1 ≥ 4. 8.5. Afinné zobrazenia 167 Na druhej strane v ľubovoľnom vektorovom priestore V dimenzie ≥ 4 nie je ťažké nájsť príklady čiastočne rovnobežných lineárnych variet. Presvedčte sa, že napr. M = [eee1,eee2], N = eee4 + [eee2,eee3] sú čiastočne rovnobežné roviny v K4 . Skúste nájsť iné príklady. 8.5 Afinné zobrazenia Nech U, V sú vektorové priestory nad tým istým poľom K. Hovoríme, že f : V → U je afinné zobrazenie, ak pre ľubovoľné body ppp,qqq,rrr ∈ V a skalár s ∈ K platí f(sppp + (1 − s)qqq) = sf(ppp) + (1 − s)f(qqq), f(ppp − qqq + rrr) = f(ppp) − f(qqq) + f(rrr). Podobným spôsobom ako tvrdenie 8.2.1 možno dokázať, že afinné sú práve tie zobrazenia f : V → U, ktoré zachovávajú všetky afinné kombinácie trojíc bodov, či, takisto, vôbec všetky afinné kombinácie; v prípade poľa charakteristiky = 2 stačí žiadať zachovávanie afinných kombinácií dvojíc. 8.5.1. Tvrdenie. Nech U, V sú vektorové priestory nad poľom K. Potom pre ľubovoľné zobrazenie f : V → U nasledujúce podmienky sú ekvi- valentné: (i) f je afinné zobrazenie; (ii) pre všetky ppp,qqq,rrr ∈ V , s, t ∈ K platí f(sppp + tqqq + (1 − s − t)rrr) = sf(ppp) + tf(qqq) + (1 − s − t)f(rrr); (iii) pre každé n ∈ N a všetky body ppp0,ppp1 . . . ,pppn ∈ V a skaláry t0, t1, . . . , tn ∈ K také, že t0 + t1 + . . . + tn = 1, platí f(t0ppp0 + t1ppp1 + . . . + tnpppn) = t0f(ppp0) + t1f(ppp1) + . . . + tnf(pppn). Ak char K = 2, tak uvedené podmienky sú navyše ekvivalentné s podmien- kou (ii− ) pre všetky ppp,qqq ∈ V , s ∈ K platí f(sppp + (1 − s)qqq) = sf(ppp) + (1 − s)f(qqq). Posunutím alebo transláciou vektorového priestoru V o vektor uuu ∈ V nazývame zobrazenie V → V dané predpisom xxx → xxx + uuu. 168 8. Afinné podpriestory a afinné zobrazenia Zrejme kompozíciou posunutia o vektor uuu ∈ V a posunutia o vektor vvv ∈ V je posunutie o vektor uuu+vvv. Každé posunutie je bijektívne zobrazenie; inverzné zobrazenie k posunutiu o vektor uuu je posunutie o opačný vektor −uuu. Z nasledujúcej vety okrem iného vyplýva, že každé afinné zobrazenie možno dostať kompozíciou lineárneho zobrazenia a posunutia. 8.5.2. Veta. Nech U, V sú vektorové priestory nad poľom K. Potom zobrazenie f : V → U je afinné práve vtedy, keď existuje vektor uuu ∈ U a lineárne zobrazenie ϕ: V → U také, že pre každé xxx ∈ V platí f(xxx) = ϕ(xxx) + uuu. Dôkaz. Treba dokázať dve veci: (1) Pre ľubovoľný vektor uuu ∈ U a lineárne zobrazenie ϕ: V → U je predpisom f(xxx) = ϕ(xxx) + uuu dané afinné zobrazenie f : V → U. (2) Ak f : V → U je afinné zobrazenie, tak priradenie ϕ(xxx) = f(xxx) − f(0) definuje lineárne zobrazenie ϕ: V → U. V jednom i druhom prípade možno zachovávanie príslušných afinných resp. lineárnych kombinácií overiť priamymi výpočtami, ktoré prenechávame čita- teľovi. Zrejme vektor uuu ∈ U ako aj lineárne zobrazenie ϕ sú podmienkou vety určené jednoznačne. Zobrazenie ϕ = f − f(0) nazývame lineárnou časťou a vektor uuu = f(0) absolútnym členom afinného zobrazenia f. Píšeme tiež f = ϕ + uuu. Afinné zobrazenia sú tak zovšeobecnením funkcií f : K → K tvaru f(x) = ax+b, kde a, b ∈ K, ktoré (najmä v prípade K = R) v matematickej analýze nazývame lineárnymi, na viacrozmerné vektorové priestory. 8.5.3. Dôsledok. Nech U, V sú vektorové priestory nad poľom K. Po- tom (a) ľubovoľná translácia priestoru V je afinné zobrazenie; (b) ľubovoľné lineárne zobrazenie ϕ: V → U je afinné; (c) afinné zobrazenie f : V → U je lineárne práve vtedy, keď f(0) = 0. 8.5.4. Tvrdenie. Nech U, V , W sú vektorové priestory nad poľom K a g: W → V , f : V → U sú afinné zobrazenia. Potom aj ich kompozícia f ◦ g: W → U je afinné zobrazenie. Dôkaz. Hoci priamym výpočtom možno overiť, že f ◦ g zachováva afinné kombinácie, podáme radšej dôkaz založený na vete 8.5.2, ktorý nám poskytne informáciu navyše. 8.5. Afinné zobrazenia 169 Nech f = ϕ + uuu, g = ψ + vvv, kde ϕ: V → U, ψ: W → V sú lineárne zobrazenia a uuu = f(0), vvv = g(0). Potom pre zzz ∈ W s využitím linearity ϕ dostávame (f ◦ g)(zzz) = ϕ(ψ(zzz) + vvv) + uuu = (ϕ ◦ ψ)(zzz) + ϕ(vvv) + uuu. Teda f ◦ g je afinné zobrazenie zložené z lineárneho zobrazenia ϕ ◦ ψ a posunutia o vektor ϕ(vvv) + uuu. Vzorec odvodený v našom dôkaze stojí za zaznamenanie. Pre lineárne zobrazenia ψ: W → V , ϕ: V → U a vektory vvv ∈ V , uuu ∈ U platí (ϕ + uuu) ◦ (ψ + vvv) = (ϕ ◦ ψ) + (ϕvvv + uuu). 8.5.5. Tvrdenie. Nech U, V sú vektorové priestory nad poľom K, f : V → U je afinné zobrazenie a M ⊆ V , N ⊆ U sú afinné podpriestory. Potom f(M) je afinný podpriestor v U a f−1 (N) je afinný podpriestor vo V alebo prázdna množina. Dôkaz. Nech f = ϕ+uuu, kde ϕ je lineárna časť f a uuu = f(0). Nech ďalej M = ppp+S, N = qqq+T, kde ppp ∈ M, qqq ∈ N a S ⊆ V , T ⊆ U sú lineárne podpriestory. Potrebný záver vyplýva z tvrdení 6.1.3, a vety 8.2.2 a nasledujúcich rovností f(M) = f(ppp) + ϕ(S), f−1 (N) = zzz + ϕ−1 (T), kde zzz ∈ V je ľubovoľné také, že ϕ(zzz) = qqq − uuu, ∅, ak neexistuje zzz ∈ V také, že ϕ(zzz) = qqq − uuu, ktorých dôkaz prenechávame čitateľovi. Keďže každé posunutie je bijekcia, afinné zobrazenie f = ϕ + uuu: V → U s lineárnou časťou ϕ je injektívne práve vtedy, keď ϕ je injektívne. Podobne, f je surjektívne práve vtedy, keď ϕ je surjektívne. Z toho už priamo vyplývajú ďalšie tri výsledky. Prvý z nich zovšeobecňuje vetu 6.2.3 o dimenzii jadra a obrazu. 8.5.6. Veta. Nech f : V → U je afinné zobrazenie, pričom V je konečnorozmerný vektorový priestor. Potom pre ľubovoľné yyy ∈ Im f platí dim V = dim f−1 (yyy) + dim Im f. Afinnou transformáciou vektorového priestoru V nazývame ľubovoľné afinné zobrazenie f : V → V . Aj pre afinné transformácie platí obdoba dôsledku 6.2.4 8.5.7. Dôsledok. Nech f : V → V je afinná transformácia konečnorozmerného vektorového priestoru V . Potom f je injektívna práve vtedy, keď je surjektívna. 170 8. Afinné podpriestory a afinné zobrazenia 8.5.8. Tvrdenie. Nech f : V → U je afinné zobrazenie s lineárnou časťou ϕ a absolútnym členom uuu = f(0). Potom f je bijektívne práve vtedy, keď ϕ je bijektívne. V tom prípade aj inverzné zobrazenie f−1 : U → V je afinné a platí f−1 = ϕ−1 − ϕ−1 (uuu). Teda f−1 je kompozíciou lineárneho zobrazenia ϕ−1 a posunutia o vektor −ϕ−1 (uuu). Nech U, V sú konečnorozmerné vektorové priestory a ααα, βββ sú bázy v U resp. vo V . Maticou afinného zobrazenia f : V → U s lineárnou časťou ϕ a absolútnym členom uuu vzhľadom na bázy βββ, ααα nazývame blokovú maticu (f)ααα,βββ = (ϕ)ααα,βββ | (uuu)ααα . Ak teda dim U = m, dim V = n, AAA = (ϕ)ααα,βββ je matica lineárneho zobrazenia ϕ v bázach βββ = (vvv1, . . . ,vvvn), ααα a aaa = (uuu)ααα sú súradnice vektora uuu v báze ααα, tak maticou afinného zobrazenia f v bázach βββ, ααα je bloková matica (f)ααα,βββ = (ϕvvv1)ααα, . . . , (ϕvvvn)ααα | (uuu)ααα = (AAA |aaa) ∈ Km×(n+1) . Súradnice bodu xxx ∈ V v báze βββ a súradnice jeho obrazu f(xxx) ∈ U v báze ααα sú tak spojené rovnosťou (fxxx)ααα = (ϕ)α,βββ · (xxx)βββ + (uuu)ααα = AAA · (xxx)ααα + aaa. Samozrejme, ak f je lineárne zobrazenie, t. j. ak f = ϕ a uuu = 0, nemá význam rozširovať maticu (ϕ)ααα,βββ o nulový stĺpec. Z tvrdenia 8.5.4, presnejšie z formuly odvodenej počas jeho dôkazu, a z tvrdenia 8.5.8 s použitím výsledkov paragrafov 6.4 a 7.2 vyplýva náš záverečný výsledok. 8.5.9. Tvrdenie. Nech U, V , W sú konečnorozmerné vektorové priestory nad poľom K a ααα, βββ, γγγ sú nejaké bázy priestorov U, V , resp. W. (a) Ak g: W → V , f : V → U sú afinné zobrazenia, ktoré majú v príslušných bázach matice (g)βββ,γγγ = (BBB |bbb), (f)ααα,βββ = (AAA |aaa), tak ich kompozícia f ◦ g: W → U má v bázach γγγ, ααα maticu (f ◦ g)ααα,γγγ = (AAA · BBB |AAA · bbb + aaa). (b) Ak f : V → U je afinná bijekcia s maticou (f)ααα,βββ = (AAA |aaa) v bázach βββ, ααα, tak k nej inverzné zobrazenie je afinná bijekcia f−1 : U → V , ktorá má v bázach ααα, βββ maticu f−1 βββ,ααα = AAA−1 | − AAA−1 · aaa . Cvičenia 171 Cvičenia 8.1. Dokážte postupne záverečné štyri podmienky z vety 8.2.2 8.2. Nech V je vektorový priestor nad poľom K. (a) Tri afinne nezávislé body ppp0,ppp1,ppp2 ∈ V sa nazývajú nekolineárne. Dokážte, že ppp0, ppp1, ppp2 sú kolineárne práve vtedy, keď ležia na jednej priamke. (b) Podobne, štyri afinne nezávislé body ppp0,ppp1,ppp2,ppp3 ∈ V sa nazývajú nekomplanárne. Dokážte, že ppp0, ppp1, ppp2 ppp3 sú komplanárne práve vtedy, keď ležia v jednej rovine. 8.3. Nech V je vektorový priestor nad poľom K a ppp0,ppp1, . . . ,pppn,qqq ∈ V . Dokážte postupne nasledujúce tvrdenia: (a) Body ppp0,ppp1, . . . ,pppn sú afinne nezávislé práve vtedy, keď pre nejaké (ľubovoľné) i ≤ n sú lineárne nezávislé vektory pppj − pppi, kde j ∈ {0, 1, . . . , n} {i}. (b) qqq ∈ (ppp0,ppp1, . . . ,pppn) práve vtedy, keď qqq − ppp0 ∈ [ppp1 − ppp0, . . . ,pppn − ppp0]. Odvoďte z toho obe rovnosti z tvrdenia 8.2.4 (c) Ak body ppp0,ppp1, . . . ,pppn sú afinne nezávislé, tak qqq ∈ (ppp0,ppp1, . . . ,pppn) práve vtedy, keď vektory ppp1 − ppp0, . . . ,pppn − ppp0,qqq − ppp0 sú lineárne závislé. 8.4. Vo vektorovom priestore R4 sú dané body ppp0 = (1, 1, 2, 2)T , ppp1 = (0, 1, 0, 1)T , ppp2 = (1, 2, 0, 3)T a qqq = (0, 2, −4, 2)T , rrr = (−1, 2, −4, 1)T . (a) Zistite, či platí qqq ∈ (ppp0,ppp1,ppp2), rrr ∈ (ppp0,ppp1,ppp2). (b) Vypočítajte dimenzie afinných podpriestorov (ppp0,ppp1,ppp2), (ppp0,ppp1,ppp2,qqq), (ppp0,ppp1,ppp2,rrr). (c) Vypočítajte dimenzie afinných podpriestorov (ppp0,ppp1,ppp2) ∩ (qqq,rrr), (ppp0,ppp1,ppp2) (qqq,rrr) a určte vzájomnú polohu afinných podpriestorov (ppp0,ppp1,ppp2), (qqq,rrr). (d) Vypočítajte dimenzie afinných podpriestorov (ppp0,ppp1) ∩ (qqq,rrr), (ppp0,ppp1) (qqq,rrr) a určte vzájomnú polohu afinných podpriestorov (ppp0,ppp1), (qqq,rrr). 8.5. (a) Nájdite príklad troch priamok v R3 tak, aby ľubovoľné dve z nich boli mimobežné. (b) Dokážte, že priamka a rovina v trojrozmernom vektorovom priestore nemôžu byť mimobežné. (c) Vo vektorovom priestore R4 nájdite príklad mimobežnej priamky a roviny. (d) Dokážte, že dve roviny vo štvorrozmernom vektorovom priestore nemôžu byť mi- mobežné. (e) Nájdite príklad dvoch mimobežných rovín v R5 . 8.6. Nech ppp0, ppp1, ppp2, ppp3, ppp4 sú ľubovoľné afinne nezávislé body vo vektorovom priestore V nad poľom K. Potom roviny (ppp0,ppp1,ppp2), ppp4+[ppp2−ppp0,ppp3−ppp0] sú čiastočne rovnobežné. Dokážte. 8.7. Repér vo vektorovom priestore sa zvykne definovať ako usporiadaná (n+1)-tica afinne nezávislých bodov ρρρ = (rrr0,rrr1, . . . ,rrrn) ∈ V n+1 , taká, že (rrr0,rrr1, . . . ,rrrn) = V , prípadne ako usporiadaná (n + 1)-tica (rrr,βββ) = (rrr,vvv1, . . . ,vvvn) ∈ V n+1 , pozostávajúca z ľubovoľného bodu rrr ∈ V a bázy βββ = (vvv1, . . . ,vvvn) vektorového priestoru V . Dokážte nasledujúce dve tvrdenia: (a) Nech ρρρ = (rrr0,rrr1, . . . ,rrrn) je usporiadaná (n + 1)-tica bodov z V . Potom ρρρ je repér vo V v zmysle prvej definície práve vtedy, keď βββ = (rrr1 − rrr0, . . . ,rrrn − rrr0) je báza vektorového priestoru V , t. j. práve vtedy, keď (rrr0,βββ) je repér v zmysle druhej definície. 172 8. Afinné podpriestory a afinné zobrazenia (b) Nech rrr je bod z V a βββ = (vvv1, . . . ,vvvn) je usporiadaná n-tica vektorov z V . Potom (rrr,βββ) je repér v zmysle druhej definície práve vtedy, keď ρρρ = (rrr,rrr + vvv1, . . . ,rrr + vvvn) je repér v zmysle prvej definície. Z toho dôvodu nie je potrebné rozlišovať medzi repérmi v zmysle jednej či druhej definície. 8.8. Nech ρρρ = (rrr,βββ) je repér vo vektorovom priestore V nad poľom K. Afinnými alebo tiež barycentrickými súradnicami bodu xxx ∈ V vzhľadom na repér ρρρ nazývame súradnice vektora xxx−rrr vzhľadom na bázu βββ, čiže (xxx)ρρρ = (xxx−rrr)βββ. Ak je repér ρρρ známy z kontextu, hovoríme len o afinných (barycentrických) súradniciach bodu xxx. Dokážte postupne nasledujúce tvrdenia: (a) (0,εεε), kde εεε = (eee1, . . . ,eeen) je kanonická báza, je repér v Kn a pre každé xxx ∈ Kn platí (xxx)(0,εεε) = xxx. (b) Body repéru ρρρ = (rrr0,rrr1, . . . ,rrrn) majú vzhľadom na tento repér afinné súradnice (rrr0)ρρρ = 0, (rrr1)ρρρ = eee1, . . . , (rrrn)ρρρ = eeen. (c) Ak dim V = n a ρρρ = (rrr,βββ) je repér vo V , tak predpisom xxx → (xxx)ρρρ je definované bijektívne afinné zobrazenie V → Kn a pre každé xxx ∈ V , ccc = (c1, . . . , cn)T ∈ Kn platí xxx = rrr + βββ · (xxx)ρρρ, (rrr + βββ · ccc)ρρρ = ccc. 8.9. V R3 sú dané body rrr0 = (5, 2, 1)T , rrr1 = (0, 2, 1)5 , rrr2 = (5, 0, 2)T , rrr3 = (5, 2, 0)T . (a) Dokážte, že ρρρ = (rrr0,rrr1,rrr2,rrr3) je repér v R3 . (b) Nájdite afinné súradnice bodov xxx = (4, 4, −3)T , yyy = (−5, −2, −1)T , zzz = (0, 0, 0)T vzhľadom na repér ρρρ. (c) Nájdite body ppp, qqq, rrr, ak poznáte ich afinné súradnice (ppp)ρρρ = (0, 2, 1)T , (qqq)ρρρ = (−1, 1, −1)T , (rrr)ρρρ = (0, 0, 0)T . 8.10. Nech πππ = (ppp,ααα), ρρρ = (rrr,βββ) sú dva repéry vo vektorovom priestore V nad poľom K. Potom afinné súradnice ľubovoľného bodu xxx ∈ V vzhľadom na tieto repéry sú zviazané vzťahom (xxx)πππ = PPPααα,βββ · (xxx − ppp)βββ = PPPααα,βββ · (xxx)ρρρ − (ppp)ρρρ , kde PPPα,βββ je matica prechodu z bázy βββ do bázy ααα. Dokážte. 8.11. Dokážte tvrdenie 8.5.1 (Návod: Modifikujte dôkaz tvrdenia 8.2.1) 8.12. Dokážte podmienky (1), (2) z dôkazu vety 8.5.2 8.13. Doplňte vynechané dôkazy oboch rovností z dôkazu tvrdenia 8.5.5 8.14. Na základe tvrdenia 8.5.5 doplňte dôkazy vety 8.5.6, dôsledku 8.5.7 a tvrdenia 8.5.8 8.15. Predpokladajme, že dvaja pozorovatelia P a P popisujú udalosti v čase a v trojrozmernom priestore vzhľadom na po dvoch rovnobežné a rovnako orientované súradné osi x, y, z, resp. x , y , z , pričom počiatok súradnej sústavy pozorovateľa P má z hľadiska pozorovateľa P v čase t = t0, zodpovedajúcom času t = 0 pozorovateľa P , súradnice (x0, y0, z0)T . Nech navyše pozorovateľ P sa vzhľadom na pozorovateľa P pohybuje rovnomerne priamočiaro rýchlosťou vvv = (vx, vy, vz)T (pozri príklad 6.4.7 a cvičenie 6.14). (a) Odvoďte tvar Galileovej transformácie, ktorou sú za týchto okolností v klasickej Cvičenia 173 (t. j. v nerelativistickej) fyzike zviazané časopriestorové súradnice bodových udalostí z hľadiska pozorovateľov P resp. P : t = t − t0, x = x − x0 − vxt, y = y − y0 − vyt, z = z − z0 − vzt. Nahliadnite, že ide o afinnú transformáciu s maticou (GGGvvv | − sss0), kde GGGvvv je matica Galileovej transformácie z cvičenia 6.14 a sss0 = (t0, x0, y0, z0)T . (b) Nech f, g: R4 → R4 sú Galileove transformácie s maticami (GGGvvv |−sss0) resp. (GGGwww |− sss1), kde vvv,www ∈ R3 , sss0,sss1 ∈ R4 . Nájdite rozšírenú maticu kompozície afinných zobrazení f ◦ g a maticu inverzného zobrazenia f−1 . Dokážte, že ide opäť o Galileove transformácie uvedeného typu a vysvetlite fyzikálny význam získaných výsledkov. 8.16. Nech U, V sú vektorové priestory nad poľom K. Označme A(V, U) množinu všetkých afinných zobrazení f : V → U. Dokážte postupne nasledujúce tvrdenia: (a) A(V, U) s operáciami súčtu a skalárneho násobku definovanými po zložkách tvorí lineárny podpriestor vektorového priestoru UV . A(V, U) navyše obsahuje vektorový priestor L(V, U) všetkých lineárnych zobrazení fi: V → U ako svoj lineárny podpriestor. (Pozri príklad 1.6.5 a tvrdenie 6.5.1) (b) Priradením f → (f −f(0), f(0)) je definovaný lineárny izomorfizmus vektorových priestorov A(V, U) → L(V, U) × U (pozri príklad 1.6.4). (c) Nech ααα, βββ sú nejaké bázy priestorov U resp. V . Potom priradením f → (f)ααα,βββ je daný lineárny izomorfizmus vektorových priestorov A(V, U) → Km×(n+1) . (d) Predpokladajme, že U, V sú konečnorozmerné a dim U = m, dim V = n. Odvoďte, či už z (b) alebo z (c), že potom aj A(V, U) je konečnorozmerný a dim A(V, U) = m(n + 1). (e) Ak V je konečnorozmerný, tak jeho duál V ∗ = L(V, K) tvorí nadrovinu v A(V, K) (pozri text tesne pred tvrdením 6.5.3). 9. Afinné podpriestory a sústavy lineárnych rovníc V tejto kapitole sa opäť pozrieme cez prizmu toho, čo sme sa dosiaľ naučili, na sústavy lineárnych rovníc. Uvidíme, že množina riešení každej takej sústavy tvorí afinný (v homogénnom prípade dokonca lineárny) podpriestor niektorého stĺpcového vektorového priestoru Kn . Taktiež naopak, ukážeme, že každý afinný podpriestor v Kn možno popísať ako podpriestor riešení vhodnej sústavy lineárnych rovníc. Na vyjadrenie množiny riešení tejto sústavy pomocou parametrov sa potom možno dívať ako na parametrické rovnice príslušného afinného podpriestoru. Získané znalosti nám umožnia v konkrétnych prípadoch určiť vzájomnú polohu afinných podpriestorov. V celej kapitole K označuje pevné, inak ľubovoľné, pole; m, n sú ľubovoľné, pevne zvolené prirodzené čísla. 9.1 Podpriestor riešení homogénnej sústavy a jeho báza Nech AAA ∈ Km×n , bbb ∈ Km . Uvažujme homogénnu sústavu lineárnych rovníc s maticou AAA AAA · xxx = 0, a nehomogénnu sústavu s maticou AAA a pravou stranou bbb AAA · xxx = bbb. Množiny ich riešení označíme R(AAA) = {xxx ∈ Kn ; AAA · xxx = 0}, resp. R(AAA |bbb) = {xxx ∈ Kn ; AAA · xxx = bbb}. Predpisom ϕ(xxx) = AAA · xxx je definované lineárne zobrazenie ϕ: Kn → Km , pričom R(AAA) = Ker ϕ. Z toho okamžite vyplýva 9.1.1. Tvrdenie. Pre ľubovoľnú maticu AAA ∈ Km×n množina R(AAA) riešení homogénnej sústavy AAA · xxx = 0 tvorí lineárny podpriestor vektorového priestoru Kn . Doteraz sme homogénnu sústavu riešili úpravou jej matice AAA na redukovaný stupňovitý tvar BBB. Z tohto tvaru sme potom vyčítali, ktoré neznáme 9.1. Podpriestor riešení homogénnej sústavy a jeho báza 175 si zvolíme za parametre a ktoré neznáme si vyjadríme pomocou nich. Presnejšie, neznámu xj sme si zvolili za parameter práve vtedy, keď sa v j-tom stĺpci matice BBB nenachádzal vedúci prvok žiadneho riadku matice BBB; ak sa v j-tom stĺpci nachádzal vedúci prvok nejakého riadku, tak neznámu xj sme si vyjadrili pomocou týchto parametrov. Uvedená veta nám umožňuje alternatívny popis množiny riešení R(AAA) – kedže ide o lineárny podpriestor v Kn , môžeme ho najúspornejšie popísať zadaním (niektorej) jeho bázy. Každú bázu priestoru R(AAA) nazývame tiež fundamentálnym systémom riešení sústavy AAA · xxx = 0. Potom každé riešenie príslušnej homogénnej sústavy možno jednoznačne vyjadriť ako lineárnu kombináciu vektorov z fundamentálneho systému riešení, a tiež naopak, každá lineárna kombinácia vektorov fundamentálneho systému je riešením príslušnej sústavy. Fundamentálny systém riešení nájdeme nasledujúcim postupom. Maticu AAA upravíme pomocou ERO na redukovaný stupňovitý tvar BBB ∈ Km×n . Množinu {1, . . . , n} rozdelíme na dve podmnožiny J, J , podľa toho, či sa v j-tom stĺpci matice BBB nachádza alebo nenachádza vedúci prvok nejakého jej riadku. Označme k počet prvkov množiny J a zapíšme ju v tvare J = {j1 < j2 < . . . < jk}. Pre každý index jl ∈ J zostrojíme vektor vvvl = (v1l, . . . , vnl)T ∈ Kn takto: Zvolíme vjll = 1 a vjil = 0 pre i = l. Pre j ∈ J vypočítame hodnoty vjl k uvedeným hodnotám parametrov vj1l, . . . , vjkl tak, aby celý vektor vvvl vyhovoval podmienke BBB · vvvl = 0. Potom vektory vvv1, vvv2, . . . ,vvvk tvoria bázu podpriestoru riešení R(AAA). Pritom zrejme platí k = n − h(AAA). Namiesto dôkazu posledného tvrdenia si celý postup ozrejmíme na prí- klade. 9.1.2. Príklad. Predpokladajme, že sme maticu AAA pomocou ERO už upravili na redukovaný stupňovitý tvar BBB =     1 2 0 0 −1/3 0 0 1 0 1/2 0 0 0 1 −2 0 0 0 0 0     . Vedúce prvky riadkov sa nachádzajú v stĺpcoch 1, 3 a 4. Teda neznáme x2 a x5 si zvolíme za parametre a neznáme x1, x3 a x4 si vyjadríme pomocou nich. Naša prvá voľba je x2 = 1, x5 = 0. Tomu zodpovedá vektor vvv1 = (−2, 1, 0, 0, 0)T . Druhá voľba parametrov je x2 = 0, x5 = 1. Tomu zodpovedá vektor vvv2 = (1/3, 0, −1/2, 2, 1)T . Potom vektory vvv1, vvv2 tvoria bázu podpriestoru (fundamentálny systém) riešení R(AAA) = R(BBB) ⊆ R5 . Ak sa „z estetických dôvodov chceme vyhnúť zlomkom vo výsledku, stačí miesto vektorov obsahujúcich ako súradnice zlomky vziať ich vhodné 176 9. Afinné podpriestory a sústavy lineárnych rovníc nenulové skalárne násobky. V našom prípade stačí nahradiť bázový vektor vvv2 „krajším bázovým vektorom 6vvv2 = (2, 0, −3, 12, 6)T . Pre „veľkosť podpriestoru riešení homogénnej sústavy z našich úvah vy- plýva 9.1.3. Tvrdenie. Pre ľubovoľnú maticu AAA ∈ Km×n platí dim R(AAA) = n − h(AAA). 9.2 Podpriestor riešení nehomogénnej sústavy Prejdime teraz k otázke štruktúry množiny riešení R(AAA |bbb) nehomogénnej sústavy AAA · xxx = bbb. 9.2.1. Tvrdenie. Nech AAA ∈ Km×n , bbb ∈ Km . (a) Ak yyy,zzz ∈ R(AAA |bbb), tak yyy − zzz ∈ R(AAA). (b) Ak zzz ∈ R(AAA |bbb), xxx ∈ R(AAA), tak zzz + xxx ∈ R(AAA |bbb). Dôkaz. Možno overiť priamym výpočtom. Z uvedeného tvrdenia vyplýva, že na popis množiny R(AAA |bbb) všetkých riešení nehomogénnej sústavy stačí poznať podpriestor R(AAA) všetkých riešení príslušnej homogénnej sústavy, t. j. nejaký fundamentálny systém (vvv1, . . . ,vvvk) jej riešení, a ľubovoľné jedno riešenie zzz ∈ R(AAA |bbb) nehomogénnej sústavy. Tvrdenie možno potom schématicky zapísať v niektorom z tvarov R(AAA |bbb) = zzz + R(AAA) = {zzz + xxx; xxx ∈ R(AAA)} = zzz + [vvv1, . . . ,vvvn] = {zzz + c1vvv1 + . . . + ckvvvk; c1, . . . , ck ∈ K}. Každý si môže vybrať ten, ktorý sa mu najväčšmi pozdáva. S využitím pojmov predchádzajúcej kapitoly možno naše úvahy zhrnúť do nasledujúcej podoby. 9.2.2. Tvrdenie. Nech AAA ∈ Km×n , bbb ∈ Km . Ak sústava AAA ·xxx = bbb má aspoň jedno riešenie, tak R(AAA |bbb) je afinný podpriestor v Kn so zameraním R(AAA). To znamená, Dir R(AAA |bbb) = R(AAA) a dim R(AAA |bbb) = dim R(AAA) = n − h(AAA). 9.3 Frobeniova veta a riešenie nehomogénnej sústavy Odpoveď na otázku riešiteľnosti nehomogénnej sústavy možno dať porovnaním hodnosti jej základnej a rozšírenej matice. 9.3. Frobeniova veta a riešenie nehomogénnej sústavy 177 Začneme pozorovaním, že sústava AAA · xxx = bbb má aspoň jedno riešenie zzz ∈ Kn práve vtedy, keď bbb ∈ Im ϕ (kde ϕ(xxx) = AAA · xxx). Ak tento prípad nastane, tak, ako sme už ukázali, R(AAA |bbb) = zzz + R(AAA). 9.3.1. Veta. (Frobenius) Nech AAA ∈ Km×n , bbb ∈ Km . Potom nehomogénna sústava AAA · xxx = bbb má riešenie práve vtedy, keď h(AAA |bbb) = h(AAA). Dôkaz. Z poznámky vyslovenej tesne pred vetou vyplýva, že sústava AAA·xxx = bbb má riešenie práve vtedy, keď bbb ∈ [sss1(AAA), . . . ,sssn(AAA)], t. j. práve vtedy keď [sss1(AAA), . . . ,sssn(AAA),bbb] = [sss1(AAA), . . . ,sssn(AAA)]. Keďže h(AAA |bbb) = dim[sss1(AAA), . . . ,sssn(AAA),bbb], h(AAA) = dim[sss1(AAA), . . . ,sssn(AAA)] a druhý z týchto podpriestorov je podpriestorom prvého, uvedená podmienka je zrejme ekvivalentná s rovnosťou h(AAA |bbb) = h(AAA). Frobeniova veta vlastne hovorí už známu vec: nehomogénna sústava AAA · xxx = bbb nemá riešenie práve vtedy, keď sa pri úprave jej rozšírenej matice (AAA |bbb) na redukovaný stupňovitý tvar objaví nejaký riadok tvaru (0, . . . , 0 | d) ∈ Kn+1 , kde 0 = d ∈ K. Takýto riadok totiž zodpovedá rovnici 0 = d. Ak upravíme pomocou ERO rozšírenú maticu (AAA |bbb) na redukovaný stupňovitý tvar (BBB |ccc), kde BBB ∈ Km×n a ccc ∈ Km , tak BBB je tiež v redukovanom stupňovitom tvare. Potom R(AAA |bbb) = R(BBB |ccc) = ∅ práve vtedy, keď sa žiaden vedúci prvok nejakého riadku matice (BBB |ccc) nenachádza v poslednom, t. j. (n + 1)-om stĺpci. Bázu priestoru riešení R(AAA) = R(BBB) nájdeme postupom popísaným v paragrafe 9.1 Nech J, J a k majú tam uvedený význam. Jedno riešenie zzz = (z1, . . . , zn)T nehomogénnej sústavy dostaneme voľbou parametrov zj1 = . . . = zjk = 0 pre jl ∈ J . Zvyšné hodnoty zj potom vypočítame tak, aby zzz vyhovovalo podmienke BBB · zzz = ccc, t. j. zj = cj pre j ∈ J. 9.3.2. Príklad. Predpokladajme, že sme maticu (AAA |bbb) pomocou ERO už upravili na redukovaný stupňovitý tvar (BBB |ccc) =     1 0 0 3 1/4 0 0 1 0 4 2 −1 0 0 1 1 −5 6 0 0 0 0 0 0 2 −1 −2/7 0     . Vidíme, že h(BBB |ccc) = h(BBB) = 3, teda R(AAA |bbb) = R(BBB |ccc) = ∅. Vedúce prvky riadkov sa nachádzajú v stĺpcoch 1, 2 a 3. Teda neznáme x4, x5 a x6 si zvolíme za parametre a neznáme x1, x2 a x3 si vyjadríme pomocou nich. Prvej voľbe x4 = 1, x5 = x6 = 0 zodpovedá vektor vvv1 = (−3, −4, −1, 1, 0, 0)T . Druhá 178 9. Afinné podpriestory a sústavy lineárnych rovníc voľba x4 = 0, x5 = 1, x6 = 0 nám dá vektor vvv2 = (−1/4, −2, 5, 0, 1, 0)T . Treťou voľbou x4 = x5 = 0, x6 = 1 získame vektor vvv3 = (0, 1, −6, 0, 0, 1)T . Potom vektory vvv1, vvv2, vvv3 tvoria bázu podpriestoru riešení R(AAA) = R(BBB) ⊆ R6 príslušnej homogénnej sústavy. Konečne voľbou parametrov x4 = x5 = x6 = 0 získame jedno riešenie zzz = (2, −1, −2/7, 0, 0, 0)T nehomogénnej sústavy. Výsledok možno prehľadne zapísať do tabuľky (treba si však uvedomiť, že sme ju vypĺňali uvedeným postupom): vvv1 vvv2 vvv3 zzz x1 −3 −1/4 0 2 x2 −4 −2 1 −1 x3 −1 5 −6 −2/7 x4 1 0 0 0 x5 0 1 0 0 x6 0 0 1 0 Porovnajte túto tabuľku s maticou (BBB |ccc) ! 9.4 Parametrické a všeobecné rovnice afinných podpriestorov Hoci sa v tomto i v nasledujúcom paragrafe obmedzíme len na afinné podpriestory stĺpcového vektorového priestoru Kn , naše úvahy majú širšiu platnosť. Zvolením pevnej bázy ich možno pomocou súradnicového zobrazenia zrejmým spôsobom preniesť aj na afinné podpriestory ľubovoľného konečnorozmerného vektorového priestoru V . Každý afinný podpriestor M ⊆ Kn má tvar M = ppp + [uuu1, . . . ,uuuk] = ppp + [ααα] pre nejaký bod ppp = (p1, . . . , pn)T ∈ M a vhodnú usporiadanú k-ticu ααα = (uuu1, . . . ,uuuk) vektorov z Kn , kde uuuj = (u1j, . . . , unj)T . To znamená, že pre ľubovoľné xxx ∈ Kn platí xxx ∈ M práve vtedy, keď existuje ttt = (t1, . . . , tk)T ∈ Kk také, že xxx = ppp + ααα · ttt, kde usporiadanú k-ticu ααα sme ako obyčajne stotožnili s maticou (uij) ∈ Kn×k so stĺpcami uuu1, . . . ,uuuk. Rovnosť xxx = ppp + ααα · ttt je maticovým zápisom parametrických rovníc afinného podpriestoru M ⊆ Kn . Vektor ttt ∈ Kn nazývame vektorom parametrov a jeho zložky t1, . . . , tk ∈ K parametrami. Po rozpísaní do zložiek x1 = p1 + u11t1 + u12t2 + . . . + u1ktk x2 = p2 + u21t1 + u22t2 + . . . + u2ktk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xn = pn + un1t1 + un2tn + . . . + unktk 9.4. Parametrické a všeobecné rovnice afinných podpriestorov 179 dostaneme obvyklejší tvar, s akým sme sa v dimenzii n = 2 resp. n = 3 už stretli v stredoškolskej analytickej geometrii. Ak navyše vektory uuu1, . . . ,uuuk sú lineárne nezávislé, čo možno vždy dosiahnuť vynechaním „nadbytočných vektorov, tak parametrické rovnice podpriestoru M nám priamo ukážu jeho dimenziu: dim M = k. Zápis afinného podpriestoru M ⊆ Kn v tvare M = ppp + [ααα], kde ppp ∈ M a ααα je nejaká usporiadaná k-tica, ktorá generuje jeho zameranie Dir M (môžeme si dovoliť predpokladať, že ααα je dokonca báza v Dir M), budeme nazývať jeho parametrickým vyjadrením. Parametrické vyjadrenie M = ppp + [ααα] afinného podpriestoru možno priamo prepísať do jeho parametrických rovníc xxx = ppp + ααα · ttt, (ttt ∈ Kk ). Taktiež naopak, z jeho parametrických rovníc možno okamžite získať jeho parametrické vyjadrenie. Súvis medzi týmito dvoma druhmi popisu je natoľko bezprostredný, že ich ani nemusíme príliš úzkostlivo rozlišovať. Na druhej strane, v predchádzajúcich paragrafoch sme videli, že každá sústava lineárnych rovníc AAA · xxx = bbb s rozšírenou maticou (AAA |bbb) ∈ Km×(n+1) (pokiaľ má riešenie), popisuje afinný podpriestor R(AAA |bbb) ⊆ Kn . Nájsť parametrické rovnice tohto podpriestoru už vieme, treba si to len uvedomiť. Ak totiž βββ = (vvv1, . . . ,vvvk) je báza podpriestoru R(AAA) riešení príslušenej homogénnej sústavy a zzz ∈ R(AAA |bbb) je ľubovoľné jedno riešenie nehomogénnej sústavy – a jedno i druhé (pokiaľ existuje) naozaj vieme nájsť –, tak xxx = zzz + βββ · ttt, kde ttt ∈ Kk je vektor parametrov, sú parametrické rovnice afinného podpriestoru R(AAA |bbb) ⊆ Kn . Inak povedané, vyriešiť sústavu lineárnych rovníc AAA · xxx = bbb znamená vlastne nájsť nejaké (prípadne nie celkom hocaké ale v istom zmysle „pekné ) parametrické rovnice (alebo parametrické vyjadrenie) afinného podpriestoru R(AAA |bbb) ⊆ Kn . Často je však potrebné riešiť obrátenú úlohu: k parametricky zadanému afinnému podpriestoru M ⊆ Kn nájsť jeho všeobecné rovnice, t. j. sústavu lineárnych rovníc AAA ·xxx = bbb o n neznámych x1, . . . , xn takú, že M = R(AAA |bbb). Nech teda M = ppp + [ααα] je afinný podpriestor v Kn , daný bodom ppp ∈ Kn a usporiadanou k-ticou ααα = (uuu1, . . . ,uuuk) vektorov z Kn , ktorú stotožníme s maticou ααα = (uij) ∈ Kn×k so stĺpcami uuuj. Parametrické rovnice xxx = ppp+ααα·ttt podpriestoru M, kde xxx = (x1, . . . ,xxxn)T ∈ Kn je vektor neznámych a ttt = (t1, . . . , tk)T ∈ Kk je vektor parametrov, možno prepísať do tvaru IIIn · xxx = ααα · ttt + ppp, ktorý možno reprezentovať blokovou maticou (IIIn |ααα |ppp). 180 9. Afinné podpriestory a sústavy lineárnych rovníc Naša metóda bude založená na eliminácii parametrov t1, . . . , tk úpravou tejto matice pomocou ERO. Maticu (IIIn |ααα |ppp) budeme upravovať na riadkovo ekvivalentnú maticu tak, aby stredný blok vo výslednej matici bol v stupňovitom tvare. Môžu nastať dve možnosti (1) h(ααα) = n, čo spoznáme podľa toho, že všetky riadky stredného bloku výslednej matice sú nenulové. V tom prípade M = V a všeobecné rovnice tohto podpriestoru tvorí prázdna sústava (t. j. sústava ktorá neobsahuje žiadnu rovnicu). My sa jednoducho uspokojíme s konštatovaním M = V a nijakými všeobecnými rovnicami sa ďalej nebudeme zaoberať. (2) h(ααα) < n. Vtedy možno stredný blok výslednej matice rozdeliť do dvoch pod sebou umiestnených blokov DDD 0 , kde horný blok DDD je stupňovitá matica typu h(ααα) × k, ktorá má všetky riadky nenulové, teda dolný nulový blok má rozmer (n − h(ααα)) × k. Toto rozdelenie stredného bloku indukuje rozdelenie celej výslednej matice do blokov AAA DDD bbb AAA 0 bbb . Potom AAA·xxx = bbb sú všeobecné rovnice afinného podpriestoru M, t. j. platí M = ppp + [ααα] = R(AAA |bbb). Popísaný algoritmus možno stručne zhrnúť do schémy (IIIn |ααα |ppp) ERO −−−→ AAA DDD bbb AAA 0 bbb , kde DDD je matica v stupňovitom tvare s nenulovými riadkami (ktorých počet teda nutne je h(DDD) = h(ααα)). Ako vedľajší produkt takéhoto výpočtu, možno z k-tice ααα vybrať bázu zamerania Dir M = [ααα]: je tvorená vektormi uuuj1 , . . . ,uuujl , kde 1 ≤ j1 < . . . < jl ≤ k sú indexy tých stĺpcov matice DDD, v ktorých sa nachádzajú vedúce prvky jej riadkov (pozri tvrdenie 4.5.3). Správnosť celého algoritmu vyplýva z nasledujúceho tvrdenia. 9.4.1. Tvrdenie. Nech BBB ∈ Kn×m , CCC ∈ Kn×k a ppp ∈ Kn . Ak bloková matica (BBB |CCC |ppp) je riadkovo ekvivalentná s blokovou maticou AAA DDD bbb AAA 0 bbb , kde DDD je matica v stupňovitom tvare s nenulovými riadkami, tak R(AAA |bbb) = xxx ∈ Km ; (∃ttt ∈ Kk )(BBB · xxx = CCC · ttt + ppp) . 9.4. Parametrické a všeobecné rovnice afinných podpriestorov 181 Dôkaz. Matica (BBB |CCC |ppp) zodpovedá sústave BBB · xxx = CCC · ttt + ppp v neznámych x1, . . . , xm, t1, . . . , tk. Podobne matica AAA DDD bbb AAA 0 bbb zodpovedá sústave AAA · xxx = DDD · ttt + bbb AAA · xxx = bbb v rovnakých neznámych. Vzhľadom na riadkovú ekvivalenciu príslušných matíc sú obe sústavy ekvivalentné. Dokážeme, že pre ľubovoľné xxx ∈ Km nasledujúce podmienky sú ekviva- lentné: (i) AAA · xxx = bbb; (ii) (∃ttt ∈ Kk )(AAA · xxx = DDD · ttt + bbb & AAA · xxx = bbb); (iii) (∃ttt ∈ Kk )(BBB · xxx = CCC · ttt + ppp). Keďže implikácie (ii) ⇒ (iii) ⇒ (i) platia triviálne, vysvetlenie potrebuje iba implikácia (i) ⇒ (ii). Zrejme hodnosť matice DDD sa rovná počtu jej riadkov a ten je ≤ n. Preto tiež h(DDD |AAA ·xxx − bbb ) = h(DDD) nezávisle na xxx. Ale to podľa Frobeniovej vety 9.3.1 znamená, že sústava DDD · ttt = AAA · xxx − bbb (v neznámych t1, . . . , tk) má nejaké riešenie ttt ∈ Kk pre ľubovoľné xxx ∈ Km . Poznámka. Z uvedeného dôkazu vyplýva, že tvrdenie 9.4.1 zostáva v platnosti, aj keď matica DDD nie je v stupňovitom tvare; stačí žiadať len lineárnu nezávislosť jej riadkov. Tú však možno najistejšie nahliadnuť práve úpravou príslušnej matice na stupňovitý tvar. 9.4.2. Príklad. Nájdeme všeobecné rovnice afinného podpriestorru M = ppp+[ααα] stĺpcového vektorového priestoru Z5 11 nad poľom Z11, kde ppp = (1, 2, 3, 4, 5)T a ααα je tvorená stĺpcami matice       2 1 0 1 1 5 2 6 0 2 7 0 1 6 0 9 0 3 5 8       . Budeme upravovať maticu       1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 2 1 0 1 1 5 2 6 0 2 7 0 1 6 0 9 0 3 5 8 1 2 3 4 5       182 9. Afinné podpriestory a sústavy lineárnych rovníc pomocou ERO tak, aby stredný blok nadobudol stupňovitý tvar. Po niekoľkých krokoch dostaneme       1 0 0 0 0 5 1 0 0 0 4 3 0 0 1 10 2 1 0 0 9 3 0 1 1 2 1 0 1 0 10 2 0 0 0 0 8 0 0 0 0 0 0 0 0 1 7 4 6 2       . Predovšetkým vidíme, že tretí vektor štvorice ααα je lineárnou kombináciou predchádzajúcich dvoch, preto ho možno v príslušnom parametrickom vyjadrení podpriestoru M vynechať. Zvyšné tri vektory v ααα sú lineárne nezávislé, čiže dim M = 3. Konečne, všeobecné rovnice podpriestoru M vyzerajú takto 10x1 + 2x2 + x3 = 6 9x1 + 3x2 + x4 + x5 = 2 . Dosadením sa možno presvedčiť, že bod ppp skutočne vyhovuje tejto sústave a vektory štvorice ααα príslušnej homogénnej sústave. 9.5 Rovnice prieniku a spojenia afinných podpriestorov V tomto paragrafe sa pokúsime zostaviť všeobecné recepty, pomocou ktorých budeme vedieť napísať či už všeobecné alebo parametrické rovnice prieniku a spojenia dvoch afinných podpriestorov stĺpcového vektorového priestoru Kn . Pri tom vezmeme do úvahy tri možnosti zadania pôvodných podpries- torov: (1) Oba podpriestory sú zadané všeobecnými rovnicami. (2) Oba podpriestory sú zadané parametricky. (3) Jeden podpriestor je zadaný pomocou všeobecných rovníc a druhý para- metricky. Každú situáciu budeme ilustrovať na jednom až dvoch konkrétnych príkladoch, v ktorých navyše vyšetríme i vzájomnú polohu oboch afinných pod- priestorov. (1) Nech afinné podpriestory M, N ⊆ Kn majú všeobecné rovnice AAA·xxx = bbb resp. BBB · xxx = ccc, kde AAA ∈ Km×n , bbb ∈ Km , BBB ∈ Kl×n , ccc ∈ Kl . Potom všeobecnými rovnicami prieniku M ∩ N je sústava AAA · xxx = bbb BBB · xxx = ccc s rozšírenou maticou AAA BBB bbb ccc . 9.5. Rovnice prieniku a spojenia afinných podpriestorov 183 Parametrické vyjadrenie prieniku M ∩ N možno získať vyriešením tejto sú- stavy. Ak hľadáme parametrické vyjadrenie spojenia M N, najprv vyriešením sústav s rozšírenými maticami (AAA |bbb) resp. (BBB |ccc) získame parametrické vyjadrenia jednotlivých podpriestorov M a N. Z nich na základe tvrdenia 8.3.3 (b) zostavíme parametrické vyjadrenie podpriestoru M N (pozri tiež príklad 8.3.5). Konečne, ak nás zaujímajú všeobecné rovnice podpriestoru M N, môžeme ich odvodiť z jeho parametrických rovníc metódou opísanou v druhej časti predchádzajúceho paragrafu 9.4 (pozri tvrdenie 9.4.1 a príklad 9.4.2). 9.5.1. Príklad. Afinné podpriestory M, N vektorového priestoru Q4 sú dané sústavami x1 + x2 − x3 + x4 = 9 x1 − x2 + x3 − x4 = −3 resp. x1 + 3x2 + 2x3 − x4 = 0 x1 − 3x2 − 2x3 + x4 = 6 . Ak dáme tieto sústavy dohromady, získame všeobecné rovnice prieniku. Ich riešenie však bude výhodné trochu odložiť a najprv upraviť rozšírené matice pôvodných sústav: 1 1 −1 1 1 −1 1 −1 9 −3 ∼ 1 0 0 0 0 1 −1 1 3 6 , 1 3 2 −1 1 −3 −2 1 0 6 ∼ 1 0 0 0 0 1 2/3 −1/3 3 −1 . Z upravených matíc okamžite dostávame parametrické vyjadrenie pôvodných podpriestorov (matica v hranatých zátvorkách označuje lineárny podpriestor generovaný jej stĺpcami) M =     3 6 0 0     +     0 0 1 −1 1 0 0 1     , N =     3 −1 0 0     +     0 0 −2 1 3 0 0 3     . Ak napíšeme obe upravené rozšírené matice všeobecných rovníc podpriestorov M a N do blokov pod seba, dostaneme rozšírenú maticu všeobecných rovníc podpriestoru M ∩N. Jej úpravou na redukovaný stupňovitý tvar vyjde     1 0 0 0 0 1 0 1/5 0 0 1 −4/5 0 0 0 0 3 9/5 −21/5 0     . 184 9. Afinné podpriestory a sústavy lineárnych rovníc Odtiaľ už priamo vyplýva parametrické vyjadrenie M ∩ N =     3 9/5 −21/5 0     +     0 −1 4 5     . Zistili sme, že dvojrozmerné afinné podpriestory M, N majú jednorozmerný prienik, teda sú rôznobežné. Preto tiež dim(M N) = 2 + 2 − 1 = 3. Ak postavíme vedľa seba generátory smerových podpriestorov Dir M a Dir N, úpravou príslušnej matice zistíme, že prvé tri sú lineárne nezávislé a posledný z nich je lineárnou kombináciou predchádzajúcich. Teda stĺpce matice βββ =     0 0 0 1 −1 −2 1 0 3 0 1 0     tvoria bázu zamerania afinného podpriestoru M N. Jeho parametrické vyjadrenie je M N = ppp + [βββ], kde ppp = (3, 9/5, −21/5, 0)T . Úpravou blokovej matice (III4 |βββ |ppp) podľa algoritmu z druhej časti paragrafu 9.4 (pozri poznámku za tvrdením 9.4.1) výmenou prvého a posledného riadku dostaneme všeobecné rovnice podpriestoru M N: x1 = 3 . (2) Nech M = ppp + [ααα], N = qqq + [βββ] sú parametrické vyjadrenia dvoch afinných podpriestorov v Kn . Potom, ako už vieme, M N = ppp + [qqq − ppp,ααα,βββ] a podľa tvrdenia 4.5.3 vynechaním vhodných stĺpcov z blokovej matice (qqq − ppp,ααα,βββ) možno dostať bázu zamerania Dir(M N). Všeobecné rovnice podpriestoru M N dostaneme úpravou blokovej matice (IIIn |qqq −ppp,ααα,βββ |ppp), prípadne matice, v ktorej je prostredný blok nahradený bázou zamerania Dir(M N), podľa algoritmu z paragrafu 9.4 Pokiaľ nás zaujímajú všeobecné rovnice prieniku M ∩N, najjednoduchšie ich získame tak, že parametrické rovnice každého z podpriestorov M, N prevedieme na všeobecné rovnice a tieto spojíme dohromady. Parametrické vyjadrenie prieniku M ∩ N dostaneme vyriešením jeho všeobecných rovníc. Jestvuje aj iná cesta k parametrickým rovniciam prieniku M∩N. Ako vedľajší produkt pri nej možno získať bázy zameraní Dir M, Dir N, Dir(M N), teda aj parametrické rovnice spojenia M N. Pri tejto metóde upravujeme blokovú maticu (ααα |βββ |qqq − ppp) pomocou ERO na stupňovitý tvar AAA BBB ccc 0 BBB ccc , 9.5. Rovnice prieniku a spojenia afinných podpriestorov 185 kde matica AAA má všetky riadky nenulové (teda lineárne nezávislé a ich počet je h(AAA ) = h(ααα) = dim M). Prienik M ∩ N je tvorený všetkými xxx = qqq + βββ · ttt ∈ N, ktoré patria zároveň do M, t. j. existuje vektor parametrov sss taký, že xxx = ppp + ααα · sss. Hľadáme teda všetky vektory parametrov ttt, ku ktorým existuje nejaký vektor parametrov sss taký, že platí ααα · sss = βββ · ttt + (qqq − ppp). Podľa tvrdenia 9.4.1 (stačí v ňom zameniť poradie prvého a druhého zvislého bloku) k danému ttt existuje takéto sss práve vtedy, keď BBB·ttt+ccc = 0. Vyriešením tejto sústavy získame parametrické vyjadrenie ttt = rrr + γγγ · zzz, kde rrr ∈ R(BBB | − ccc) a γγγ je báza lineárneho podpriestoru R(BBB), s vektorom parametrov zzz, ktoré dosadíme do parametrických rovníc podpriestoru N. Dostaneme tak parametrické rovnice xxx = qqq + βββ · (rrr + γγγ · zzz) = (qqq + βββ · rrr) + (βββ · γγγ) · zzz podpriestoru M ∩ N. Metóda zostavenia všeobecných rovníc prieniku M ∩N ako i oboch typov rovníc spojenia M N, popísaná v prvej časti bodu (2), je (aspoň dúfame) dostatočne jasná. V nasledujúcom príklade sa preto sústredíme len na nájdenie parametrických rovníc prieniku M ∩ N metódou z druhej časti a určenie vzájomnej polohy M a N. 9.5.2. Príklad. Nech M =     1 1 1 4 1 1 2 5     , N1 =     0 2 2 3    +     1 2 3 2 2 8 5 0 9 3 4 11     , N2 =     1 1 2 2    +     1 2 3 2 2 8 5 0 9 3 4 11     sú afinné podpriestory v R4 . Zrejme Dir N1 = Dir N2; označme tento lineárny podpriestor D. Obe úlohy o dvojiciach podpriestorov M, N1 aj M, N2 budeme riešiť súčasne. Platí     1 1 1 4 1 1 2 5 1 2 3 2 2 8 5 0 9 3 4 11 0 1 2 1 2 2 3 2     ∼     1 1 0 3 0 0 0 0 1 2 3 1 0 5 4 −2 6 0 0 0 0 1 2 0 2 1 1 0     . Ak si z matice na pravej strane odmyslíme krajný pravý blok, po vynechaní rovnice 0 = 0 z nej dostaneme sústavu 4t1 − 2t2 + 6t3 = 0. 186 9. Afinné podpriestory a sústavy lineárnych rovníc Lineárny podpriestor Dir M ∩ D je tvorený práve všetkými lineárnyni kombináciami βββ · ttt, kde βββ je matica generátorov D (a jeho báza, čo možno zistiť doupravením stredného bloku na stupňovitý tvar) a ttt vyhovuje uvedenej homogénnej rovnici. Teda dim(Dir M ∩D) = dim Dir M = 2. Preto Dir M ⊆ D a platí M N1 aj M N2. Sústava 4t1 − 2t2 + 6t3 = −2 0 = −1, ktorej musí vyhovovať vektor parametrov ttt = (t1, t2, t3)T , aby ním určený bod z N1 patril aj do M, nemá riešenie. Preto M ∩ N1 = ∅ a M, N1 sú pravé rovnobežky. Naopak, analogická sústava pre dvojicu M, N2 vedie na jedinú, očividne riešiteľnú rovnicu 4t1 − 2t2 + 6t3 = −1. V dôsledku toho M ⊆ N2. (3) Nech afinný podpriestor M ⊆ Kn je daný všeobecnými rovnicami AAA · xxx = bbb a afinný podpriestor N = qqq + [βββ] ⊆ Kn je daný parametricky. Ak hľadáme všeobecné rovnice prieniku M ∩ N, stačí nájsť všeobecné rovnice podpriestoru N a pridať ich k sústave AAA·xxx = bbb. Ich vyriešením potom možno dostať aj parametrické vyjadrenie M ∩N. Ak hľadáme popis spojenia M N, najvýhodnejšie je vyriešiť všeobecné rovnice podpriestoru M a z parametrických vyjadrení oboch podpriestorov M, N zostaviť parametrické vyjadrenie M N podľa tvrdenia 8.3.3 a príkladu 8.3.5 Elimináciou parametrov odtiaľ dostaneme všeobecné rovnice podpriestoru M N. Iná metóda, ako nájsť parametrické vyjadrenie prieniku M ∩ N spočíva v dosadení parametrického vyjadrenia podpriestoru N do všeobecných rovníc podpriestoru M. Tým dostaneme sústavu AAA · (qqq + βββ · ttt) = bbb, alebo po úprave s ňou ekvivalentnú sústavu (AAA · βββ) · ttt = bbb − AAA · qqq, ktorej musí vyhovovať vektor parametrov ttt, aby ním určený bod xxx = qqq +βββ·ttt ∈ N patril aj do podpriestoru M, teda do prieniku M ∩ N. Uvedenú sústavu vyriešime úpravou jej rozšírenej matice (AAA · βββ |bbb − AAA · qqq). Podobne ako v prípade (2) riešenie dostaneme v parametrickom tvare ttt = rrr + γγγ · zzz, 9.5. Rovnice prieniku a spojenia afinných podpriestorov 187 kde rrr ∈ R(AAA · βββ |bbb − AAA · qqq) a γγγ je báza lineárneho podpriestoru R(AAA · βββ), s vektorom parametrov zzz, ktoré dosadíme do parametrických rovníc podpriestoru N. Tak získame parametrické rovnice xxx = qqq + βββ · (rrr + γγγ · zzz) = (qqq + βββ · rrr) + (βββ · γγγ) · zzz podpriestoru M ∩ N. I tentokrát sa v nasledujúcom príklade zameriame len na nájdenie parametrických rovníc prieniku M ∩ N druhou z opísaných metód a na určenie vzájomnej polohy M a N. 9.5.3. Príklad. Afinný podpriestor M ⊆ R4 má všeobecné rovnice x1 − x2 + x3 − x4 = 1 x1 + x2 − x3 + x4 = 3. Rozšírenú maticu tejto sústavy označíme (AAA |bbb). Afinný podpriestor N ⊆ R4 je určený ako afinný obal N = (ppp,qqq,rrr,sss) bodov ppp = (3, 0, 1, 1)T , qqq = (4, −1, 2, 2)T , rrr = (4, 1, 2, 0)T a sss = (7, 3, 4, 5)T . Jeho parametrické vyjadrenie potom je N = ppp + [qqq − ppp,rrr − ppp,sss − ppp] =     3 0 1 1     +     1 1 4 −1 1 3 1 1 3 1 −1 4     . Keďže AAA · (qqq − ppp,rrr − ppp,sss − ppp) = 1 −1 1 −1 1 1 −1 1 ·     1 1 4 −1 1 3 1 1 3 1 −1 4     = 2 2 3 0 0 8 , bbb − AAA · ppp = 1 3 − 1 −1 1 −1 1 1 −1 1 ·     3 0 1 1     = −2 0 , bod tvaru ppp + t1(qqq − ppp) + t2(rrr − ppp) + t3(sss − ppp) ∈ N patrí do prieniku M ∩ N práve vtedy, keď príslušný vektor parametrov ttt = (t1, t2, t3)T vyhovuje sústave s rozšírenou maticou 2 2 3 0 0 8 −2 0 ∼ 1 1 0 0 0 1 −1 0 . 188 9. Afinné podpriestory a sústavy lineárnych rovníc Podpriestor riešení tejto sústavy má parametrické vyjadrenie   −1 0 0   +   −1 1 0   . Dosadením do parametrického vyjadrenia N dostaneme M ∩ N =     3 0 1 1     +     1 1 4 −1 1 3 1 1 3 1 −1 4     ·   −1 0 0   +         1 1 4 −1 1 3 1 1 3 1 −1 4     ·   −1 1 0       =     2 1 0 0     +     0 2 0 −2     a dim(M ∩N) = 1. Ľahko nahliadneme, že hodnosť matice sústavy podpriestoru M je 2, preto tiež dim M = 4 − 2 = 2, a dim N = 3. Z toho dôvodu M ∩N je vlastný podpriestor tak v M ako aj v N, čiže M, N sú rôznobežné. Cvičenia 9.1. Nájdite nejaký fundamentálny systém riešení sústavy homogénnych lineárnych rovníc AAA · xxx = 0 pre matice (a) AAA = 0 @ 1 0 −1 −1 0 2 0 −1 1 −1 1 0 1 5 −2 1 A ∈ Q3×5 ; (b) AAA = √ 2 1 √ 3 1 √ 2 1 3 2 1+ √ 6 ∈ R3×3 ; (c) AAA = 1+i 1−i 2+3i 5−i −1−5i 13 ∈ C2×3 ; (d) AAA = 0 4 0 9 0 3 2 5 0 1 1 0 ∈ Z3×4 11 . Vyjadrite všeobecné riešenie každej sústavy ako lineárnu kombináciu fundamentálneho systému riešení. 9.2. Nájdite nejaké riešenie nehomogénnej sústavy AAA · xxx = bbb a fundamentálny systém riešení príslušnej homogénnej sústavy danej rozšírenou maticou (a) (AAA |bbb) = 1 1 1 2 3 7 1 2 2 2 2 5 ∈ Q3×4 ; (b) (AAA |bbb) = 1 π e−1 −1 e−1 π2 ∈ R2×3 ; (c) (AAA |bbb) = 0 @ 1 2 1 0 −1 1 2 1 2 7 5 1 ˛ ˛ ˛ ˛ ˛ ˛ −1 2 −1 1 A ∈ R3×5 ; (d) (AAA |bbb) = 0 @ 1 2 3 1 1 1 3 4 0 ˛ ˛ ˛ ˛ ˛ ˛ 1 4 2 1 A ∈ Z3×4 5 . Vyjadrite všeobecné riešenie každej sústavy v tvare súčtu jedného jej riešenia a lineárnej kombinácie fundamentálneho systému riešení príslušnej homogénnej sústavy. Cvičenia 189 9.3. V každom z nasledujúcich prípadov napíšte parametrické rovnice afinného podpriestoru M vektorového priestoru R3 alebo R4 nad poľom R a nájdite jeho všeobecné rovnice: (a) M = {(0, 2, −1)} ⊆ R3 ; (b) M = (1, −1, 2) + [(1, −5, 4)] ⊆ R3 ; (c) M = [(1, 3, −1), (2, 0, 5)] ⊆ R3 ; (d) M = (eee1 + eee4, 2eee2 − eee3) ⊆ R4 (e) M = (0, 2, −1, 1) + [(3, 1, 10, −8), (3, 5, 8, −6)] ⊆ R4 ; (f) M = ((1, 1, 1, 0), (1, 1, 0, 1), (1, 0, 1, 1), (0, 1, 1, 1)) ⊆ R4 ; (g) M = R4 . 9.4. Pre dané lineárne podpriestory S, T vektorového priestoru R4 nájdite v každom z nasledujúcich prípadov nejaké bázy lineárnych podpriestorov S ∩ T, S + T ⊆ R4 a určte ich dimenzie: (a) S = (1, 1, 1, 1)T , (2, 0, 0, 3)T , T = (3, 2, 1, 0)T , (6, 3, 2, 4)T ; (b) S = [eee1 − eee2 + 2eee3 + eee4], T = [(1, 0, 2, 0)T , (2, −1, 4, 1)T , (4, −1, 8, 1)T ; (c) S = [eee1 + eee2,eee2 + eee3,eee3 + eee4], T = (1, 0, 1, 0)T , (0, 1, 0, 1)T , (1, 0, 0, 1)T . 9.5. Pre dané afinné podpriestory M, N vektorového priestoru R4 nájdite v každom z nasledujúcich prípadov všeobecné aj parametrické rovnice ich prieniku M ∩ N a určte ich vzájomnú polohu ako aj dimenziu spojenia M N: (a) M = (1, 0, 2, 0)T , (0, 2, 0, 1)T , N = (4, 1, 7, 2)T + (1, 2, 3, 4)T , (0, 1, 2, 3)T , (0, 0, 1, 2)T ; (b) M = (0, 0, 1, −1)T + (1, 2, 2, 1)T , (2, 1, 1, 2)T , N = (0, 1, 1, 0)T , (1, 0, 0, 1)T , (1, −1, 0, 0)T ]; (c) M = [eee1,eee2], N = (1, 1, 1, 1)T + [eee3,eee4]. 9.6. Afinné podpriestory M, N vektorového priestoru R5 sú dané všeobecnými rovnicami. V každom z nasledujúcich prípadov zistite ich vzájomnú polohu, napíšte parametrické rovnice ich prieniku aj spojenia a určte dimenzie afinných oboch podpriestorov M ∩N, M N: (a) M : x1 + 2x2 = 0, x2 − 3x3 = 1, 4x3 − x4 + x5 = 2, N : 2x1 + 3x3 − x5 = 5, x2 + x4 = 0, x1 − 2x3 = 7; (b) M : x1 + x2 + x3 + x4 + x5 = 5, x1 − x2 + x3 = 1, x2 + 2x4 − x5 = 2, x3 = 1, N : 3x1 + x2 + 2x3 + 5x4 − x5 = 10, x1 + x3 + 2x4 − x5 = 1; (c) M : x1 = 1, x2 = 2, x3 = 3, N : x1 + x2 + x3 = 6, x1 − x2 + x3 = 2. 9.7. Jeden z afinných podpriestorov M, N vektorového priestoru R4 je daný všeobecnými rovnicami a druhý parametricky. V každom z nasledujúcich prípadov zistite ich vzájomnú polohu, napíšte parametrické rovnice ich prieniku M ∩ N a všeobecné rovnice ich spojenia M N a určte dimenzie afinných podpriestorov M ∩ N, M N: (a) M : x + y + z = 0, x − 2y + z = 4, x − u = 0, N = (1, 0, −1, 0)T ; (b) M : 2x − y + 2z = 3, x + z − 2u = 0, N = (1, 4, 1, 1)T , (1, 0, 1, 0)T ; (c) M : x + y = 0, x + z = 1, x + u = 2, N = (1, 1, 2, 2)T , (2, 2, 3, 2)T . 190 9. Afinné podpriestory a sústavy lineárnych rovníc 9.8. Nech V je vektorový priestor nad poľom K a S je jeho lineárny podpriestor. Označme V/S množinu všetkých afinných podpriestorov M priestoru V takých, že Dir M = S. Dokážte postupne nasledujúce tvrdenia: (a) Pre každý prvok xxx ∈ V existuje práve jeden podpriestor X ∈ V/S taký, že xxx ∈ X. Inými slovami, množina V/S tvorí rozklad množiny V a triedou rozkladu, do ktorej patrí prvok xxx ∈ V , je afinný podpriestor xxx + S ∈ V/S (pozri paragraf 0.6). (b) Prvky xxx,yyy ∈ V patria do tej istej triedy rozkladu V/S práve vtedy, keď xxx−yyy ∈ S. Inak povedané, vzťahom xxx ≡S yyy ⇔ xxx − yyy ∈ S je definovaná ekvivalencia na množine V prislúchajúca k rozkladu V/S, teda V/S = V/≡S. (c) Nech xxx1 ≡S xxx2, yyy1 ≡S yyy2 a c ∈ K. Potom tiež xxx1 + yyy1 ≡S xxx2 + yyy2 a cxxx1 ≡S cxxx2. (d) Nech X = xxx + S, Y = yyy + S patria do V/S. Vďaka (c) sú predpismi X + Y = (xxx +yyy) + S, cX = cxxx + S korektne definované operácie na množine V/S (to znamená, že výsledky týchto operácií nezávisia na reprezentantoch xxx, yyy tried X resp. Y ale výlučne na podpriestoroch X, Y ). (e) Množina V/S s uvedenými operáciami súčtu a skalárneho násobku tvorí vektorový priestor nad poľom K; nazývame ho faktorový priestor vektorového priestoru V podľa podpriestoru S. Čo je nulou v tomto vektorovom priestore? (f) Priradením xxx → ζS(xxx) = xxx + S je definované surjektívne lineárne zobrazenie ζS : V → V/S s jadrom Ker ζS = S. (g) Nech U, V sú vektorové priestory nad poľom K a ϕ: V → U je lineárne zobrazenie. Priradením xxx + Ker ϕ → ϕ(xxx) je korektne definované injektívne lineárne zobrazenie V/ Ker ϕ → U. V dôsledku toho platí V/ Ker ϕ ∼= Im ϕ. (h) Ak V je konečnorozmerný, tak dim V/S = dim V − dim S, čo je ďalšia analógia medzi vlastnosťami dimenzie a logaritmu (porovnaj s tvrdením 5.4.3). 9.9. Nech V je vektorový priestor nad poľom K a S, T sú jeho lineárne podpriestory. Dokážte tzv. kosoštvorcovú vetu o izomorfizme: (S + T)/T ∼= S/(S ∩ T). (Návod: Dokážte, že priradením (xxx + yyy) + T → xxx + (S ∩ T), kde xxx ∈ S, yyy ∈ T, je korektne definovaný lineárny izomorfizmus (S + T)/T → S/(S ∩ T).) 9.10. Nech pole K má konečný počet prvkov q, V je vektorový priestor nad K konečnej dimenzie n a S je jeho lineárny podpriestor dimenzie k (0 ≤ k ≤ n). Dokážte postupne nasledujúce tvrdenia: (a) Faktorový priestor V/S má práve qn−k prvkov. (b) Počet všetkých k-rozmerných afinných podpriestorov priestoru V je práve qn−k n k q , kde n k q je q-binomický koeficient (pozri cvičenia 5.18, 5.17). 10. Determinanty V tejto kapitole zavedieme determinanty štvorcových matíc ľubovoľného rozmeru n × n nad pevným poľom K, preskúmame ich základné vlastnosti a naučíme sa ich počítať. Taktiež si ukážeme niekoľko príkladov ich využitia. Čitateľ sa pravdepodobne už na strednej škole stretol s determinantmi reálnych matíc rozmerov 2 × 2 a 3 × 3. Možno tiež vie previesť výpočet determinantov vyšších rádov na výpočet determinantov nižších rádov pomocou ich rozvoja podľa nejakého riadku alebo stĺpca. So všeobecnou definíciou determinantu sa však asi dosiaľ nestretol. Ako čoskoro uvidíme, nie je to nijako priezračná definícia a na prvý pohľad určite nepôsobí „prirodzeným dojmom. Keďže nechceme, aby táto definícia „spadla z neba , náš výklad začneme pomerne dlhým úvodom, ktorý má poslúžiť ako jej motivácia. 10.1 Orientovaný objem a multilineárne alternujúce funkcie Na začiatok si položme prirodzenú otázku: Ako vyzerajú vzorce pre plošný obsah rovnobežníka v rovine R2 , ktorého dve susedné strany tvoria vektory uuu = (u1, u2)T , vvv = (v1, v2)T , resp. pre objem rovnobežnostena v priestore R3 , ktorého tri susedné hrany tvoria vektory uuu = (u1, u2, u3)T , vvv = (v1, v2, v3)T , www = (w1, w2, w3)T ? Vzorce, ktoré by vyjadrovali príslušný obsah alebo objem len pomocou súradníc vektorov uuu, vvv resp. uuu, vvv, www, asi len tak z rukáva nevysypeme, môžeme sa však pokúsiť ich odvodiť. Najschodnejšia cesta vedie cez ujasnenie si vlastností, ktorým by mali takéto vzorce vyhovovať. Uvidíme, že tieto vlastnosti už jednoznačne (až na voľbu jednotkového obsahu či objemu) určujú hľadané vzorce nielen v rovine či v trojrozmernom priestore, ale možno ich bezprostredne zovšeobecniť na n-rozmerné vektorové priestory Kn nad ľubovoľným poľom K, hoci tu pojem „n-rozmerného objemu stráca svoj názorný geometrický význam. Označme teda P(X) obsah rovinného útvaru X. Zrejme P(X) je vždy nezáporné reálne číslo a pre zhodné útvary X, Y platí P(X) = P(Y ). Obsah je navyše aditívny, t. j. pre útvary X, Y také, že P(X ∩ Y ) = 0, platí P(X ∪ Y ) = P(X) + P(Y ). Konečne, P(X) = 0 pre ľubovoľnú úsečku X. Obsah rovnobežníka {auuu + bvvv; a, b ∈ 0, 1 } určeného vektormi uuu,vvv ∈ R2 budeme značiť P(uuu,vvv). Z práve sformulovaných vlastností obsahu vyplývajú rovnosti 192 10. Determinanty P(uuu,vvv) = P(vvv,uuu), P(cuuu,vvv) = |c|P(uuu,vvv) pre ľubovoľné uuu,vvv ∈ R2 , c ∈ Z. Druhá vlastnosť sa nazýva pozitívna homogenita a pre c = 3 je znázornená na nasledujúcom obrázku. Obr. 10.1. K pozitívnej homogenite obsahu vektorového rovnobežníka Platnosť druhej rovnosti pre všetky c ∈ Q možno už z toho jednoducho dokázať (pozri cvičenie 10.1). S jej platnosťou pre všetky c ∈ R je to už trochu zložitejšie – zakladá sa na istých úvah o „spojitosti obsahu –, a tak jej radšej uveríme bez dôkazu. Pozrime sa teraz na ďalšie dva obrázky. (Podotýkame, že oba znázorňujú situáciu v rovine, teda pri pohľade na ne treba potlačiť priestorové videnie, ktoré sa nám mimovoľne otvára.) Obr. 10.2. K aditivite obsahu vektorového rovnobežníka V prvom prípade určujú vektory xxx + yyy, vvv rovnobežník OABC, vektory yyy, vvv rovnobežník ODEC a rovnobežník vektorov xxx, vvv je zhodný s rovnobežníkom DABE. Zo zhodnosti trojuholníkov OAD, CBE potom na základe uvedených vlastností obsahu vyplýva rovnosť P(xxx + yyy,vvv) = P(xxx,vvv) + P(yyy,vvv). V druhom prípade určujú vektory xxx, vvv rovnobežník OABC, vektory xxx+yyy, vvv rovnobežník ODEC a rovnobežník vektorov yyy, vvv je zhodný s rovnobežníkom DABE. Zo zhodnosti trojuholníkov ODA, CEB vyplýva P(xxx,vvv) = P(xxx + yyy,vvv) + P(yyy,vvv), teda P(xxx + yyy,vvv) = P(xxx,vvv) − P(yyy,vvv). 10.1. Orientovaný objem a multilineárne alternujúce funkcie 193 To je v porovnaní s prvým prípadom nepríjemné prekvapenie, určite by sme dali prednosť rovnakej formule. Všimnime si však , že „kratšie otočenie vektora yyy do vektora vvv je orientované proti „kratším otočeniam vektorov xxx aj xxx +yyy do vektora vvv. V druhom prípade by sa nám preto hodilo, aby obsah rovnobežníka určeného vektormi yyy, vvv mal z toho dôvodu opačné znamienko ako obsahy rovnobežníkov prislúchajúcich vektorom xxx, vvv resp. xxx+yyy, vvv. Tento cieľ možno dosiahnuť, ak namiesto plošného obsahu vektorových rovnobežníkov budeme uvažovať ich orientovaný plošný obsah, ktorý mení znamienko zámenou poradia dvoch vektorov, teda môže nadobúdať aj záporné hodnoty. Pôvodný nezáporný plošný obsah potom dostaneme ako absolútnu hodnotu orientovaného obsahu. Tento prístup nám navyše umožní zbaviť sa absolútnej hodnoty v rovnosti P(cuuu,vvv) = |c|P(uuu,vvv). Podobnými úvahami, ktoré by si však vyžiadali trochu zložitejšie obrázky, tentokrát znázorňujúce naozaj priestorové situácie, by sme mohli dospieť i k potrebe skúmať orientovaný objem rovnobežnostena {auuu+bvvv+cwww; a, b, c ∈ 0, 1 } určeného vektormi uuu, vvv, www v trojrozmernom priestore R3 , prípadne nrozmerný objem rovnobežnostena {a1uuu1 + . . . + anuuun; a1, . . . , an ∈ 0, 1 } určeného vektormi uuu1, . . . ,uuun v n-rozmernom priestore Rn (pre n > 3 však bez možnosti sprostredkovať si geometrický vhľad obrázkami). Pre čitateľa, ktorý sa už stretol s vektorovým súčinom v R3 , poznamenajme, že orientovaný n-rozmerný objem sa správa do značnej miery podobne. Vektorový súčin uuu × vvv dvoch vektorov uuu,vvv ∈ R3 , je vektor kolmý na rovinu [uuu,vvv], ktorého dlžka sa rovná plošnému obsahu rovnobežníka vektorov uuu, vvv a orientácia je daná pravidlom pravej ruky (ak položíme dlaň pravej ruky malíčkom na vektor uuu tak, že zakrivené prsty smerujú k vektoru vvv po oblúku zodpovedajúcom uhlu ≤ 180◦ , vztýčený palec ukazuje smer aj orientáciu vektora uuu × vvv). Z toho dôvodu uuu × vvv = −(vvv × uuu). Ak nahradíme reálne čísla ľubovoľným poľom K, vykonané úvahy nás privádzajú k nasledujúcim definíciám. Nech V je vektorový priestor nad poľom K a 1 ≤ n ∈ N. Hovoríme, že zobrazenie F : V n → K je (a) n-lineárne alebo tiež multilineárne, ak pre každé 1 ≤ j ≤ n a ľubovoľné vektory uuu1, . . . ,uuuj−1,uuuj+1, . . . ,uuun ∈ V priradenie xxx → F(uuu1, . . . ,uuuj−1,xxx,uuuj+1, . . . ,uuun) definuje lineárne zobrazenie V → K, t. j. pre všetky xxx,yyy ∈ V , a, b ∈ K platí F(uuu1, . . . ,uuuj−1, axxx + byyy,uuuj+1, . . . ,uuun) = aF(uuu1, . . . ,uuuj−1,xxx,uuuj+1, . . . ,uuun) + bF(uuu1, . . . ,uuuj−1,yyy,uuuj+1, . . . ,uuun); (b) antisymetrické, ak pre všetky 1 ≤ i < j ≤ n a ľubovoľné vektory uuu1, . . . ,uuun ∈ V platí F(uuu1, . . . ,uuui, . . . ,uuuj, . . . ,uuun) = −F(uuu1, . . . ,uuuj, . . . ,uuui, . . . ,uuun). 194 10. Determinanty Inak povedané, F : V n → K je n-lineárne, ak dosadením ľubovoľných n − 1 pevných vektorov na akékoľvek miesta do F dostaneme lineárne zobrazenie vo zvyšnej voľnej premennej; F je antisymetrické, ak zámenou poradia ľubovoľných dvoch argumentov v F sa hodnota výsledku zmení na opačnú. Cieľom našich úvah teda bolo čitateľa presvedčiť, že n-rozmerný orientovaný objem v Rn je multilineárna antisymetrická funkcia Rn × . . . × Rn n-krát → R. Ukazuje sa však, že antisymetriu možno nahradiť zdanlivo slabšou, geometricky názornou podmienkou, motivovanou očividným vzťahom P(uuu,uuu) = 0 pre obsah degenerovaného vektorového rovnobežníka. Hovoríme, že zobrazenie F : V n → K je (c) alternujúce, ak pre ľubovoľné uuu1, . . . ,uuun ∈ V z podmienky uuui = uuuj pre nejaké 1 ≤ i < j ≤ n vyplýva F(uuu1, . . . ,uuun) = 0. Ukážeme si, že uvedené tri vlastnosti spolu tesne súvisia. Najprv ale pripomeňme, že pole K má charakteristiku 2, ak v ňom platí 1 + 1 = 0, čo je ekvivalentné s podmienkou (∀ a ∈ K)(a = −a). Príkladom je pole Z2 (pozri paragraf 1.2). Ak char K = 2, tak (∀ a ∈ K)(a = −a ⇒ a = 0). 10.1.1. Lema. Nech V je vektorový priestor nad poľom K a F : V n → K je ľubovoľné zobrazenie. (a) Ak char K = 2 a F je antisymetrické, tak F je alternujúce. (b) Ak F je multilineárne a alternujúce, tak F je antisymetrické. Dôkaz. (a) sme už vlastne dokázali v úvahe predchádzajúcej túto lemu. (b) Nech F je multilineárne a alternujúce. Položme xxx = uuui, yyy = uuuj a zafixujme zvyšné z vektorov uuu1, . . . ,uuun. Potom G(xxx,yyy) = F(uuu1, . . . ,xxx, . . . ,yyy, . . . ,uuun) je bilineárne (t. j. 2-lineárne) alternujúce zobrazenie V 2 → K. Stačí dokázať, že G je antisymentrické. Vďaka uvedeným vlastnostiam platí G(xxx,yyy) + G(yyy,xxx) = G(xxx,xxx) + G(xxx,yyy) + G(yyy,xxx) + G(yyy,yyy) = G(xxx + yyy,xxx + yyy) = 0, teda G(xxx,yyy) = −G(yyy,xxx). Pre multilineárne zobrazenie tak alternácia implikuje antisymetriu, kým opačná implikácia platí len za dodatočného predpokladu char K = 2 (no, na druhej strane, aj bez multilinearity). 10.1.2. Lema. Nech F : V n → K, σ: {1, . . . , n} → {1, . . . , n} sú ľubovoľné zobrazenia a uuu1, . . . ,uuun ∈ V . 10.1. Orientovaný objem a multilineárne alternujúce funkcie 195 (a) Ak F je antisymetrické a σ je permutácia, tak F(uuuσ(1), . . . ,uuuσ(n)) = (−1)|σ| F(uuu1, . . . ,uuun). (b) Ak F je alternujúce a σ nie je permutácia, tak F(uuuσ(1), . . . ,uuuσ(n)) = 0. Dôkaz. (a) Stačí si uvedomiť, že |σ| označuje najmenší počet traspozícií (t. j. výmien poradia dvojíc), z ktorých možno zložiť permutáciu σ (pozri paragraf 0.5). (b) Ak σ nie je permutácia, tak σ(i) = σ(j), preto tiež uuuσ(i) = uuuσ(j), pre nejaké 1 ≤ i < j ≤ n. Označme vvvk = uuuσ(k) pre 1 ≤ k ≤ n. Potom vvvi = vvvj, a v dôsledku alternácie F(vvv1, . . . ,vvvi, . . . ,vvvj, . . . ,vvvn) = 0. Zaznamenajme teraz niektoré základné vlastnosti multilineárnych alternujúcich (teda automaticky aj antisymetrických) zobrazení, ktoré budeme sústavne využívať. 10.1.3. Lema. Nech F : V n → K je multilineárne alternujúce zobraznie. Potom pre ľubovoľné vvv1, . . . ,vvvn ∈ V platí: (a) Pripočítaním skalárneho násobku nejakého z vektorov k inému vektoru sa hodnota F(vvv1, . . . ,vvvn) nezmení, t. j. pre ľubovoľné c ∈ K a i, j ≤ n, i = j platí F(vvv1, . . . ,vvvi, . . . ,vvvj + cvvvi, . . . ,vvvn) = F(vvv1, . . . ,vvvi, . . . ,vvvj, . . . ,vvvn). (b) Ak sú vektory vvv1, . . . ,vvvn lineárne závislé, tak F(vvv1, . . . ,vvvn) = 0. Dôkaz. (a) Nech napr. i < j. Priamym výpočtom s použitím multilinearity a alternácie dostávame F(vvv1, . . . ,vvvi, . . . ,vvvj + cvvvi, . . . ,vvvn) = F(vvv1, . . . ,vvvi, . . . ,vvvj, . . . ,vvvn) + cF(vvv1, . . . ,vvvi, . . . ,vvvi, . . . ,vvvn) = F(vvv1, . . . ,vvvi, . . . ,vvvj, . . . ,vvvn) (b) Ak sú vektory vvv1, . . . ,vvvn lineárne závislé, tak niektorý z nich, povedzme vvvk, je lineárnou kombináciou ostatných, teda vvvk = i=k civvvi pre vhodné skaláry ci. Z multilinearity a alternácie F potom vyplýva F(vvv1, . . . ,vvvk, . . . ,vvvn) = i=k ciF(vvv1, . . . ,vvvi, . . . ,vvvn) = 0, lebo v každom z uvedených výrazov F(vvv1, . . . ,vvvi, . . . ,vvvn) sa vektor vvvi vyskytuje ako argument na i-tom aj na k-tom mieste. 196 10. Determinanty Pozrime sa teraz bližšie, ako vyzerajú všetky bilineárne alternujúce zobrazenia F : K2 × K2 → K nad poľom K. Zvoľme ľubovoľné vektory uuu = u1eee1 +u2eee2 a vvv = v1eee1 + v2eee2 z K2 . Ak dvakrát po sebe využijeme bilinearitu a na záver alternáciu a antisymetriu F, postupne dostaneme F(uuu,vvv) = F(u1eee1 + u2eee2, vvv) = u1F(eee1,vvv) + u2F(eee2,vvv) = u1F(eee1, v1eee1 + v2eee2) + u2F(eee2, v1eee1 + v2eee2) = u1v1F(eee1,eee1) + u1v2F(eee1,eee2) + u2v1F(eee2,eee1) + u2v2F(eee2,eee2) = F(eee1,eee2)(u1v2 − u2v1) = F(eee1,eee2) u1 v1 u2 v2 , kde výraz u1 v1 u2 v2 = u1v2 − u2v1 čitateľ už iste pozná ako determinant matice (uuu,vvv) = u1 v1 u2 v2 ∈ K2×2 . Podobným spôsobom možno odvodiť aj tvar ľubovoľnej n-lineárnej alternujúcej funkcie F : Kn×n → K (i teraz, ako obyčajne, prirodzene stotožňujeme n-tú karteziánsku mocninu (Kn )n stĺpcového vektorového priestoru V = Kn s priestorom matíc Kn×n ). Nech AAA = (aij) ∈ Kn×n je matica so stĺpcami sssj(AAA) = a1jeee1 + . . . + anjeeen = n i=1 aijeeei. S využitím n-linearity F pre každý z n stĺpcov matice AAA možno výraz F(AAA) postupne roznásobiť, čím dostaneme súčet nn členov tvaru aσ(1) 1 . . . aσ(n) nF(eeeσ(1), . . . ,eeeσ(n)), z ktorých každý zodpovedá jednému zobrazeniu σ množiny {1, . . . , n} do seba. Podľa lemy 10.1.2 sčítance prislúchajúce zobrazeniam σ /∈ Sn sú všetky rovné 0 a pre σ ∈ Sn platí F(eeeσ(1), . . . ,eeeσ(n)) = (−1)|σ| F(eee1, . . . ,eeen). Záverom tak dostávame F(AAA) = F(eee1, . . . ,eeen) σ∈Sn (−1)|σ| aσ(1) 1 . . . aσ(n) n = F(IIIn) σ∈Sn (−1)|σ| aσ(1) 1 . . . aσ(n) n, kde príslušná suma obsahuje n! sčítancov, jeden pre každú permutáciu σ ∈ Sn. 10.2. Definícia a základné vlastnosti determinantu 197 10.2 Definícia a základné vlastnosti determinantu Determinantom štvorcovej matice AAA = (aij) ∈ Kn×n nazývame výraz detAAA = a11 . . . a1n ... ... ... an1 . . . ann = σ∈Sn (−1)|σ| aσ(1) 1 . . . aσ(n) n. Ak nehrozí zámena s absolútnou hodnotou, používame tiež označenie |AAA|. Determinant štvorcovej matice rádu n budeme nazývať determinant rádu n. Špeciálne pre maticu (aij) ∈ K3×3 dostávame vzorec a11 a12 a13 a21 a22 a23 a31 a32 a33 = a11a22a33 + a21a32a13 + a31a12a23 − a31a22a13 − a21a12a33 − a11a32a23, známy ako Sarrusovo pravidlo. Skôr ako kuriozitu poznamenajme, že uvedená definícia zahŕňa aj prípad n = 0: pre (jedinú) prázdnu maticu III0 = ( ) ∈ K0×0 dáva detIII0 = det( ) = 1. Nasledujúce dve vlastnosti determinantov dokážeme ako dôsledky našej definície. 10.2.1. Tvrdenie. Determinant transponovanej matice sa rovná determinantu pôvodnej matice, t. j. detAAAT = detAAA pre ľubovoľnú AAA ∈ Kn×n . Dôkaz. Podľa definícií transponovanej matice a determinantu detAAAT = σ∈Sn (−1)|σ| a1σ(1) . . . anσ(n). Keďže pre σ ∈ Sn platí i = σ(j) ⇔ j = σ−1 (i), zoradením činiteľov v súčine a1σ(1) . . . anσ(n) podľa druhého indexu tento nadobudne tvar aσ−1(1) 1 . . . aσ−1(n) n. Pritom priradenie σ → σ−1 je bijekcia Sn → Sn. Navyše, ak σ = τ1 ◦ . . . ◦ τk je rozklad permutácie σ na transpozície, tak σ−1 je kompozícia tých istých transpozícií v opačnom poradí, preto |σ| = σ−1 . V dôsledku toho zámenou sumácie cez σ ∈ Sn za sumáciu cez σ−1 = ∈ Sn dostávame detAAAT = ∈Sn (−1)| | a (1) 1 . . . a (n) n = detAAA. 198 10. Determinanty Vďaka práve dokázanému tvrdeniu si všetky výsledky o determinantoch matíc zachovajú svoju platnosť, ak v nich každý výskyt slova „stĺpec nahradíme slovom „riadok a naopak. Tento princíp zámeny riadkov a stĺpcov budeme často využívať. 10.2.2. Tvrdenie. Nech 1 ≤ m < n a AAA ∈ Kn×n je bloková matica tvaru AAA = BBB CCC 0 DDD , kde BBB ∈ Km×m , CCC ∈ Km×(n−m) a DDD ∈ K(n−m)×(n−m) . Potom detAAA = detBBB · detDDD. Dôkaz. Z uvedeného blokového tvaru matice AAA vyplýva aij =    bij, ak 1 ≤ i, j ≤ m, ci j−m, ak 1 ≤ i ≤ m < j ≤ n, 0, ak 1 ≤ j ≤ m < i ≤ n, di−m j−m, ak m < i, j ≤ n. Označme G = {σ ∈ Sn; (∀ j ≤ m)(σ(j) ≤ m)}. Potom pre σ ∈ Sn G platí aσ(1) 1 . . . aσ(n) n = 0, teda do hodnoty determinantu matice AAA prispievajú len sčítance zodpovedajúce permutáciám σ ∈ G. Navyše, (∀ σ ∈ G)(m < j ⇒ m < σ(j)), takže pre σ ∈ G možno definovať permutácie σ ∈ Sm a σ ∈ Sn−m predpismi σ (j) = σ(j), ak 1 ≤ j ≤ m, resp. σ (k) = σ(k + m) − m, ak 1 ≤ k ≤ n − m. Zrejme priradením σ → (σ , σ ) je daná bijekcia G → Sm × Sn−m a platí |σ| = |σ | + |σ |. Takže môžeme písať detAAA = σ∈G (−1)|σ| aσ(1) 1 . . . aσ(m) maσ(m+1) m+1 . . . aσ(n) n = σ∈G (−1)|σ |+|σ | bσ (1) 1 . . . bσ (m) mdσ (1) 1 . . . dσ (n−m) n−m = σ ∈Sm (−1)|σ | bσ (1) 1 . . . bσ (m) m σ ∈Sn−m (−1)|σ | dσ (1) 1 . . . dσ (n−m) n−m = detBBB · detDDD. Na základe tvrdenia 10.2.1 teraz vieme, že detAAA = detBBB ·detDDD, aj keď sa nulový blok 0 nachádza nad a blok CCC ∈ K(n−m)×m pod diagonálou matice AAA. Tvrdenie 10.2.2 možno taktiež zrejmým spôsobom zovšeobecniť na matice pozostávajúce z viacerých diagonálne zoradených štvorcových blokov, pod (nad) ktorými sú samé nuly. Spomeňme explicitne nasledujúce dva prípady: 10.3. Charakterizácia determinantu a regulárnych matíc 199 (1) Ak AAA1, . . . ,AAAk sú štvorcové matice, tak det diag(AAA1, . . . ,AAAk) = detAAA1 ·. . .· detAAAk. (2) Matica AAA ∈ Kn×n sa nazýva horná (dolná) trojuholníková matica, ak aij = 0 pre i < j (resp. pre i > j). Pre horné aj dolné trojuholníkové matice platí detAAA = a11 . . . ann, t. j. determinant takej matice je súčinom jej diagonálnych prvkov. Špeciálne to platí pre diagonálne matice. 10.3 Charakterizácia determinantu a regulárnych matíc Úvahy z paragrafu 10.1 možno zhrnúť do nasledujúcej vety. 10.3.1. Veta. Determinant rádu n je n-lineárna alternujúca funkcia Kn×n → K stĺpcov matice. Navyše, pre každý skalár c ∈ K existuje jediné multilineárne alternujúce zobrazenie F : Kn×n → K stĺpcov matice také, že F(IIIn) = c. Toto F je dané predpisom F(AAA) = c detAAA. Determinant det: Kn×n → K je teda jednoznačne určený ako n-lineárna alternujúca funkcia stĺpcov matice taká, že detIIIn = det(eee1, . . . ,eeen) = 1. Táto rovnosť zodpovedá prirodzenej voľbe jednotky orientovaného n-rozmerného objemu v Kn – je ňou orientovaný objem rovnobežnostena určeného vektormi eee1, . . . ,eeen (v tomto poradí). V paragrafe 10.1 sme vlastne dokázali, že každá n-lineárna alternujúca funkcia F : Kn×n → K musí mať uvedený tvar, t. j. je skalárnym násobkom determinantu. Zostáva však overiť, že determinant, tak, ako sme ho definovali v paragrafe 10.2, je naozaj multilineárne alternujúce zobrazenie. Hoci tieto vlastnosti sú intutívne jasné z našej konštrukcie, pre ambicióznejšieho čitateľa podáme ich dôkaz vychádzajúci len z definície determinantu. Navyše sa tým náš výklad stane formálne nezávislým na motivačných úvahách o orientovanom objeme z prvej časti úvodného paragrafu 10.1. Dôkaz vety 10.3.1 odložíme až do nasledujúceho paragrafu, kde nám poslúži ako vhodný úvod do ďalšieho okruhu otázok. Na tomto mieste však zaznamenáme dva bezprostredné dôsledky tejto charakterizačnej vety. Samozrejme, v jej dôkaze sa na ne nebudeme odvolávať. 200 10. Determinanty 10.3.2. Veta. (Cauchy) Pre ľubovoľné matice AAA, BBB ∈ Kn×n platí det(AAA · BBB) = detAAA · detBBB; t. j. determinant súčinu matíc sa rovná súčinu ich determinantov. Dôkaz. Zvoľme pevne maticu AAA ∈ Kn×n a definujme zobrazenie F : Kn×n → K predpisom F(BBB) = det(AAA ·BBB) pre BBB ∈ Kn×n . Overíme, že F je n-lineárne alternujúce zobrazenie stĺpcov matice BBB; označme ich vvv1, . . . ,vvvn. Najprv overíme, že F je alternujúce. Nech 1 ≤ i < j ≤ n a BBB je matica taká, že vvvi = vvvj pre nejaké i < j. Potom aj AAA · vvvi = AAA · vvvj, a s využitím alternácie determinantu dostávame F(BBB) = det(AAA · (vvv1, . . . ,vvvi, . . . ,vvvj, . . . ,vvvn)) = det(AAA · vvv1, . . . ,AAA · vvvi, . . . ,AAA · vvvj, . . . ,AAA · vvvn) = 0. Teraz dokážeme multilinearitu F. Zafixujme stĺpce vvv1, . . . ,vvvj−1,vvvj+1, . . . ,vvvn a na miesto j-teho stĺpca dosaďme vektor axxx + byyy. S využitím n-linearity determinantu nám vyjde F(vvv1, . . . , axxx + byyy, . . . ,vvvn) = det(AAA · (vvv1, . . . , axxx + byyy, . . . ,vvvn)) = det(AAA · vvv1, . . . ,AAA · (axxx + byyy), . . . ,AAA · vvvn)) = det(AAA · vvv1, . . . , a(AAA · xxx) + b(AAA · yyy), . . . ,AAA · vvvn)) = a det(AAA · vvv1, . . . ,AAA · xxx, . . . ,AAA · vvvn) + b det(AAA · vvv1, . . . ,AAA · yyy, . . . ,AAA · vvvn) = a det(AAA · (vvv1, . . . ,xxx, . . . ,vvvn)) + b det(AAA · (vvv1, . . . ,yyy, . . . ,vvvn)) = aF(vvv1, . . . ,xxx, . . . ,vvvn) + bF(vvv1, . . . ,yyy, . . . ,vvvn). Podľa vety 10.3.1 má F tvar F(BBB) = c detBBB pre jednoznačne určený skalár c = F(IIIn) = det(AAA · IIIn) = detAAA. 10.3.3. Veta. Štvorcová matica AAA ∈ Kn×n je regulárna práve vtedy, keď detAAA = 0. V tom prípade det AAA−1 = (detAAA)−1 . Dôkaz. Ak AAA je singulárna, tak jej stĺpce sú lineárne závislé. Podľa lemy 10.1.3 (b) je F(AAA) = 0 pre ľubovoľnú n-lineárnu alternujúcu funkciu F : Kn×n → K. Teda špeciálne detAAA = 0. Naopak, nech AAA je regulárna. Potom podľa vety 10.3.2, detAAA · det AAA−1 = det AAA · AAA−1 = detIIIn = 1. Preto detAAA = 0 a det AAA−1 = (detAAA)−1 . 10.4. Laplaceov rozvoj determinantu 201 10.4 Laplaceov rozvoj determinantu Náš výklad začneme sľúbeným dôkazom. Keďže pre n = 0, 1 niet čo dokazovať, aby sme sa vyhli rozpitvávaniu trivialít, budeme v celom paragrafe predpokladať, že n ≥ 2. Dôkaz vety 10.3.1 Najprv dokážeme, že determinant je alternujúca funkcia. Nech AAA ∈ Kn×n je taká, že sssi(AAA) = sssj(AAA) pre nejaké i < j. Označme τ ∈ Sn transpozíciu, ktorá vymieňa i a j (a ostatné prvky necháva namieste). Množina všetkých párnych permutácií množiny {1, . . . , n} sa zvykne značiť An. Zrejme priradením σ → σ ◦τ je daná bijekcia An → Sn An. Pre všetky k, l ≤ n platí akl = ak τ(l), a keďže τ−1 = τ, pre každú permutáciu σ ∈ Sn máme a(σ◦τ)(1) 1 . . . a(σ◦τ)(n) n = aσ(1) τ(1) . . . aσ(n) τ(n) = aσ(1) 1 . . . aσ(n) n S využitím toho môžeme počítať detAAA = σ∈Sn (−1)|σ| aσ(1) 1 . . . aσ(n) n = σ∈An aσ(1) 1 . . . aσ(n) n − σ∈Sn An aσ(1) 1 . . . aσ(n) n = σ∈An aσ(1) 1 . . . aσ(n) n − σ∈An a(σ◦τ)(1) 1 . . . a(σ◦τ)(n) n = 0. Teraz dokážeme, že detAAA je lineárnou funkciou j-teho stĺpca (a1j, . . . , anj)T . Pre i ≤ n označme Sn(i, j) = {σ ∈ Sn; i = σ(j)} a položme ˜aij = σ∈Sn(i,j) (−1)|σ| aσ(1) 1 . . . aσ(j−1) j−1aσ(j+1) j+1 . . . aσ(n) n. Potom zrejme detAAA = n i=1 ˜aijaij = (˜a1j, . . . , ˜anj) · (a1j, . . . , anj)T , čo dokazuje spomínanú linearitu. Na základe tvrdenia 10.2.1 platí aj „riadková verzia práve dokázanej vety 10.3.1 Špeciálne, determinant je takisto multilineárna alternujúca funkcia riadkov matice a (keďže σ ∈ Sn(i, j) ⇔ σ−1 ∈ Sn(j, i)) pre i-ty riadok (ai1, . . . , ain) matice AAA jej determinant má rozvoj detAAA = n j=1 aij˜aij = (ai1, . . . , ain) · (˜ai1, . . . , ˜ain)T . 202 10. Determinanty s rovnako definovanými koeficientmi ˜aij. Uvedený prvok ˜aij nazývame algebraickým doplnkom prvku aij v matici AAA. Maticu AAA = (˜aij)n×n nazývame maticou algebraických doplnkov k matici AAA. 10.4.1. Tvrdenie. Nech AAAij označuje maticu rádu n − 1, ktorá vznikne z matice AAA ∈ Kn×n vynechaním i-teho riadku a j-teho stĺpca. Potom ˜aij = (−1)i+j |AAAij|. Dôkaz. Označme BBB maticu, ktorá vznikne nahradením j-teho stĺpca matice AAA stĺpcovým vektorom eeei ∈ Kn . Zrejme ˜aij = |BBB|. Ak budeme v matici BBB postupne vymieňať stĺpce s indexmi j a j + 1, ďalej j + 1 a j + 2, atď., až nakoniec n − 1 a n, a potom riadky s indexmi i a i + 1, ďalej i + 1 a i + 2, atď., až napokon n − 1 a n, dostaneme maticu tvaru CCC = AAAij 0 bbb 1 , kde bbb vznikne z i-teho riadku matice AAA vynechaním j-teho prvku a 0 je nulový stĺpec dĺžky n − 1. Podľa tvrdenia 10.2.2 (a poznámky za jeho dôkazom), determinant tejto matice je |AAAij|. Keďže determinant je alternujúca funkcia tak stĺpcov ako aj riadkov matice a všetkých výmien bolo dohromady (n − j) + (n − i) = 2n − (i + j), platí ˜aij = |BBB| = (−1)2n−(i+j) |CCC| = (−1)i+j |AAAij|. Determinanty matíc, ktoré vzniknú vynechaním niektorých riadkov a rovnakého počtu sĺtpcov z matice AAA ∈ Kn×n , nazývame jej minormi, prípadne subdeterminantmi determinantu |AAA|. Dosadením získaných hodnôt algebraických doplnkov do rozvoja determinantu rádu n podľa niektorého riadku resp. stĺpca tak dostávame jeho vyjadrenie pomocou subdeterminantov rádu n−1. 10.4.2. Veta. Nech AAA ∈ Kn×n , 1 ≤ k, l ≤ n. Potom |AAA| = n j=1 (−1)k+j akj |AAAkj| = n i=1 (−1)i+l ail |AAAil|. Uvedené súčty nazývame Laplaceovými rozvojmi determinantu |AAA| – prvý podľa k-teho riadku, druhý podľa l-teho stĺpca. 10.5. Výpočet determinantu 203 10.5 Výpočet determinantu Skôr než sa pustíme do výpočtov konkrétnych determinantov, skúsme si urobiť inventúru prostriedkov, ktoré máme nato k dispozícii, a posúdiť ich vhod- nosť. Asi sa zhodneme na tom, že výpočet determinantu rádu n podľa jeho definície, ako súčtu n! súčinov po n činiteľoch, by bol značne ťažkopádny. Pokiaľ sme sa stretli len s prípadmi n = 2 alebo n = 3, nemusíme si to jasne uvedomiť. Avšak už 4! = 24, 5! = 120 a funkcia n! veľmi rýchlo rastie. Preto je potrebné pouvažovať o nejakej inej metóde. Keďže determinant je multilineárnou alternujúcou funkciou tak riadkov ako aj stĺpcov matice, ako najprirodzenejšia sa nám ponúka metóda úpravy matice na hornú prípadne dolnú trojuholníkovú maticu pomocou elementárnych riadkových i stĺpcových operácií. Ako sme už spomínali v poznámke (2) za dôkazom tvrdenia 10.2.2: (0) Determinant trojuholníkovej matice sa rovná súčinu jej diagonálnych prvkov. Pripomeňme si aj nasledujúce pravidlá z paragrafu 10.1 o vplyve ERO a ESO na determinant: (1) Výmenou poradia dvoch riadkov alebo stĺpcov matice sa hodnota jej determinantu zmení na opačnú. (2) Vynásobením nejakého riadku alebo stĺpca matice nenulovým skalárom c ∈ K sa jej determinant zmení na c-násobok pôvodnej hodnoty. (3) Pripočítaním skalárneho násobku nejakého riadku matice k jej inému riadku, resp. násobku nejakého jej stĺpca k inému stĺpcu sa hodnota jej determinantu nezmení. Všimnite si, že len tretí typ menovaných úprav necháva determinant bezo zmeny! Poznamenajme, že úpravy typu (3) spolu s pravidlom (0) plne postačujú na výpočet akéhokoľvek determinantu. Bez pravidiel (1) a (2) sa možno kľudne zaobísť, občas nám však môžu pomôcť sprehľadniť situáciu, preto sa im nebudeme vyhýbať. Často býva užitočné výslovne si uvedomiť nasledujúci dôsledok pravidiel (1) – (3): (4) Ak matica obsahuje nulový riadok alebo stĺpec, prípadne dva rovnaké riadky alebo stĺpce, tak jej determinant je 0. Mohlo by sa zdať, že sme akosi pozabudli na Laplaceov rozvoj. Táto metóda umožňuje previesť výpočet determinantu rádu n na výpočet n determinantov rádu n − 1, presnejšie na istú ich lineárnu kombináciu. Ak by sme dôsledne pokračovali ďalej, mohli by sme túto úlohu previesť na výpočet n(n − 1) determinantov rádu n − 2, atď., až by sme napokon dostali n! determinantov rádu 1. Ak si to dobre premyslíme, zistíme, že takýto výpočet by bol rovnako efektívny (či, lepšie povedané, neefektívny) ako výpočet 204 10. Determinanty determinantu priamo na základe jeho definície. Jednako sa Laplaceovho rozvoja celkom nezriekame. Odporúčame ho však používať len vtedy, keď sú všetky prvky príslušného riadku či stĺpca, podľa ktorého determinant rozvíjame, až na jednu výnimku rovné nule. Vtedy vlastne nejde ani tak o rozvoj ako o zníženie rádu daného determinantu o 1 (bez nárastu počtu determinantov). Toto odporúčanie sformulujeme do nášho predposledného pravidla: (5) Nech všetky prvky i-teho riadku prípadne j-teho stĺpca matice AAA s výnimkou prvku aij sú rovné 0. Potom |AAA| = (−1)i+j aij |AAAij|. Všimnite si, že pravidlo (0) možno dostať ako dôsledok (n − 1)-násobného použitia pravidla (5) a zrejmého faktu, že determinant matice (a) typu 1 × 1 je samotná hodnota a. Ak si ešte uvedomíme, že determinanty rádu 2 možno najvýhodnejšie počítať priamo z definície: (6) a11 a12 a21 a22 = a11a22 − a21a12, je to už naozaj všetko, čo potrebujeme vedieť na efektívny výpočet determi- nantu. 10.5.1. Príklad. Vypočítame determinant reálnej matice AAA =       2 2 1 1 1 5 6 3 4 5 7 5 3 5 7 13 10 3 8 13 7 2 1 1 6       . Najprv odpočítame prvý riadok od piateho a druhý od štvrtého. V matici, ktorú takto získame, odpočítame piaty stĺpec od prvého a štvrtý od druhého. Postupne tak dostaneme |AAA| = 2 2 1 1 1 5 6 3 4 5 7 5 3 5 7 8 4 0 4 8 5 0 0 0 5 = 1 1 1 1 1 0 2 3 4 5 0 0 3 5 7 0 0 0 4 8 0 0 0 0 5 = 1 · 2 · 3 · 4 · 5 = 120. Priznávame, že výpočet, ktorý sme práve predviedli je tak trochu podraz voči čitateľovi. Úpravy, ktoré sme pri ňom použili, boli totiž len opačným postupom, ktorým sme pri formulácii úlohy z vopred narafičenej výslednej 10.5. Výpočet determinantu 205 hornej trojuholníkovej matice „uvarili zadanie. Napokon, tak je tomu s väčšinou úloh v učebniciach. No čitateľ, ktorého autor „nevpustil do kuchyne , má len malú nádej toto optimálne riešenie nájsť. Teda aspoň pokiaľ je úloha dobre postavená. Predvedieme preto aj iné, „normálne riešenie, na aké má šancu prísť aj nezasvätený riešiteľ. Najprv odpočítame tretí stĺpec od štvrtého aj piateho a jeho dvojnásobok od prvého aj druhého stĺpca. V ďalšom kroku determinant rozvinieme podľa prvého riadku: |AAA| = 0 0 1 0 0 −1 0 3 1 2 1 −1 3 2 4 7 4 3 5 10 5 0 1 0 5 = −1 0 1 2 1 −1 2 4 7 4 5 10 5 0 0 5 . Teraz odpočítame prvý stĺpec od posledného a získaný determinant rozvinieme podľa posledného riadku: |AAA| = −1 0 1 3 1 −1 2 3 7 4 5 3 5 0 0 0 = −5 0 1 3 −1 2 3 4 5 3 . Po odpočítaní trojnásobku druhého stĺpca od tretieho a rozvinutí podľa prvého riadku sme konečne v cieli: |AAA| = −5 0 1 0 −1 2 −3 4 5 −12 = 5 −1 −3 4 −12 = 5 (12 + 3 · 4) = 5 · 24 = 120. 10.5.2. Príklad. Vypočítame tzv. Vandermondov determinant rádu n VDn(x1, x2, . . . , xn) = 1 x1 x2 1 . . . xn−1 1 1 x2 x2 2 . . . xn−1 2 ... ... ... ... 1 xn x2 n . . . xn−1 n . Odpočítaním prvého riadku od všetkých ostatných riadkov a následným roz- 206 10. Determinanty vojom podľa prvého stĺpca dostaneme VDn(x1, x2, . . . , xn) = 1 x1 x2 1 . . . xn−1 1 0 x2 − x1 x2 2 − x2 1 . . . xn−1 2 − xn−1 1 ... ... ... ... 0 xn − x1 x2 n − x2 1 . . . xn−1 n − xn−1 1 = x2 − x1 x2 2 − x2 1 . . . xn−1 2 − xn−1 1 ... ... ... xn − x1 x2 n − x2 1 . . . xn−1 n − xn−1 1 . Odpočítajme teraz od každého stĺpca počnúc druhým x1-násobok predchádzajúceho stĺpca. V determinante, ktorý získame, je na mieste (i, k), kde 1 ≤ i, k ≤ n − 1, prvok xk i+1 − xk 1 − x1 xk−1 i+1 − xk−1 1 = xk−1 i+1 (xi+1 − x1). Ak teda vyjmeme z i-teho riadku činiteľ xi+1 − x1, postupne nám vyjde VDn(x1, x2, . . . , xn) = x2 − x1 x2(x2 − x1) . . . xn−2 2 (x2 − x1) ... ... ... xn − x1 xn(xn − x1) . . . xn−2 n (xn − x1) = (x2 − x1) . . . (xn − x1) 1 x2 . . . xn−2 2 ... ... ... 1 xn . . . xn−2 n = (x2 − x1) . . . (xn − x1) VDn−1(x2, . . . , xn). Teraz už aj bez počítania determinantov vidíme, že VDn−1(x2, . . . , xn) = (x3 − x2) . . . (xn − x2) VDn−2(x3, . . . , xn), atď. Keďže zrejme VD1(xn) = 1, dostávame výsledok VDn(x1, x2, . . . , xn) = 1≤i 0, nájdite explicitné vzorce 212 10. Determinanty pre koeficienty interpolačného polynómu, ak 0 ≤ n ≤ 3. 10.17. S využitím výsledkov predchádzajúceho cvičenia riešte nasledujúce úlohy: (a) Nájdite kvadratické polynómy f0(x), f1(x), f2(x) ∈ R(2) [x], ktorých grafy prechádzajú bodmi (−1, 0), (1, 0), (3, −2), resp. (−1, 0), (0, −1), (2, 5), resp. (0, −1), (2, 5), (3, −2). (b) Nájdite kubické polynómy g1(x), g2(x) ∈ R(3) [x], ktorých grafy prechádzajú bodmi (0, −1), (1, 0), (2, 5), (3, −2), resp. (−1, 0), (0, −1), (1, 0), (2, 5). (c) Nájdite bikvadratický polynóm h(x) ∈ R(4) [x], ktorého graf prechádza bodmi (−1, 0), (0, −1), (1, 0), (2, 5), (3, −2). (d) Načrtnite grafy funkcií f0, f1, f2, g1, g2 a h na intervale −2, 4 a porovnajte ich. 10.18. Permanentom štvorcovej matice AAA = (aij)n×n nad poľom K nazývame výraz perAAA = σ∈Sn aσ(1) 1 . . . aσ(n) n. Formálne teda permanent dostaneme vynechaním znamienkových koeficientov sgn σ = (−1)|σ| v definícii determinantu. Dokážte postupne nasledujúce tvrdenia: (a) Ak maticu chápeme ako riadok jej stĺpcov, tak permanent je n-lineárne symetrické zobrazenie Kn×n → K (pozri cvičenie 10.3). (b) Pre ľubovoľnú maticu AAA ∈ Kn×n platí perAAAT = perAAA. (c) Ak char K = 2, tak pre každú maticu AAA ∈ Kn×n platí perAAA = detAAA. 10.19. (a) Odvoďte všeobecný vzorec na výpočet permanentu matíc rozmeru 2 × 2. (b) Odvoďte vzorec analogický Sarrusovmu pravidlu na výpočet permanentu matíc rozmeru 3 × 3. 1 (c) Vypočítajte permanenty reálnych matíc AAA = „ 1 3 2 −6 « , BBB = 2 4 0 3 7 −1 1 1 1 ! . (c) Odvoďte z výsledkov úlohy (a), že permanent regulárnej štvorcovej matice sa môže rovnať nule, kým permanent singulárnej štvorcovej matice nemusí byť 0. 10.20. Nech X = {x1, . . . , xn} je n-prvková množina a (X, H) je orientovaný graf s množinou vrcholov X (pozri cvičenie 2.7). Hovoríme, že permutácia σ ∈ Sn žije na grafe (X, H), ak pre každé i ≤ n platí (xi, xσ(i)) ∈ H. (a) Nech HHH ∈ Rn×n je incidenčná matica grafu (X, H). Potom počet všetkých permutácií σ ∈ Sn, ktoré žijú na grafe (X, H), je práve perHHH. Dokážte. (b) Pre každý z grafov z obrázku 2.1 vypočítajte permanent jeho incidenčnej matice a určte počet permutácií, ktoré na ňom žijú (pokúste sa riešiť obe úlohy pre daný graf v optimálnom poradí). 1 Stojí za poznámku, že – na rozdiel od determinantu – nepoznáme nijaký jednoduchý, rýchly algoritmus na výpočet permanentu štvorcových matíc všeobecného rádu n nad poľami charakteristiky = 2. Dokonca máme dobré dôvody domnievať sa, že taký algoritmus neexistuje. Časť II Bilineárne formy a geometria 11. Bilineárne a kvadratické formy V predchádzajúcej kapitole sme sa stretli s multilineárnymi zobrazeniami, ktorých príkladmi boli práve determinanty. V tejto kapitole podrobnejšie preskúmame tzv. bilineárne zobrazenia, ktoré sú najjednoduchším netriviálnym prípadom takýchto zobrazení. Z nich sa sústredíme hlavne na bilineárne formy, t. j. na bilineárne zobrazenia s hodnotami v príslušnom poli. Od bilineárnych foriem je už len krok k tzv. kvadratickým formám. Týmto krokom, prísne vzaté, vystúpime zo sveta objektov lineárnych (t. j. „prvého stupňa ) a dostaneme sa do sveta objektov kvadratických (t. j. „druhého stupňa ). Zatiaľ sa však sústredíme len na algebraickú stránku celej veci. Geometrické aspekty bilineárnych a kvadratických foriem preskúmame až neskôr, keď si na tento účel zadovážime aj ďalšie účinné nástroje. V celej kapitole K označuje nejaké pevné no inak ľubovoľné pole. Ak sa o tom osobitne nezmienime, pod vektorovým priestorom budeme rozumieť vektorový priestor nad poľom K. Väčšina výsledkov tejto kapitoly však platí len za dodatočnej podmienky, že charakteristika nášho poľa K sa nerovná dvom. Na rozdiel od kapitol 8 a 10, kde nám tento predpoklad slúžil len na zjednodušenie formulácií niektorých definícií, tvrdení a dôkazov, v tejto kapitole už hrá podstatnú úlohu. 11.1 Bilineárne zobrazenia a bilineárne formy Nech U, V , W sú vektorové priestory nad poľom K. Hovoríme, že F : U × V → W je bilineárne zobrazenie, ak pre všetky xxx,xxx1,xxx2 ∈ U, yyy,yyy1,yyy2 ∈ V a c1, c2 ∈ K platí F(xxx, c1yyy1 + c2yyy2) = c1F(xxx,yyy1) + c2F(xxx,yyy2), F(c1xxx1 + c2xxx2,yyy) = c1F(xxx1,yyy) + c2F(xxx2,yyy). Inak povedané, zobrazenie F : U × V → W je bilineárne práve vtedy, keď pre ľubovoľné pevné xxx ∈ U je priradením yyy → F(xxx,yyy) definované lineárne zobrazenie V → W a pre ľubovoľné pevné yyy ∈ V je priradením xxx → F(xxx,yyy) definované lineárne zobrazenie U → W. 11.1.1. Príklad. (a) Príklad 6.1.4 vlastne hovorí, že pre pevné m, n, p je predpisom F(AAA,BBB) = AAA · BBB dané bilineárne zobrazenie Km×n × Kn×p → Km×p . Teda násobenie je bilineárne zobrazenie medzi vektorovými priestormi matíc príslušných rozmerov. 216 11. Bilineárne a kvadratické formy (b) Pre ľubovoľné vektorové priestory U, V je predpisom F(ϕ,xxx) = ϕ(xxx) definované bilineárne zobrazenie L(V, U) × V → U. To znamená, že na dosadenie argumentu do funkcie sa možno dívať ako na bilineárne zobrazenie na príslušných vektorových priestoroch (pozri paragraf 6.5). Najdôležitejším prípadom takéhoto bilineárneho zobrazenia je tzv. párovanie alebo dualita (η,xxx) → η(xxx) : V ∗ × V → K medzi priestorom V a jeho duálom V ∗ . (c) Pre ľubovoľné vektorové priestory U, V , W je predpisom F(ϕ, ψ) = ϕ ◦ ψ definované bilineárne zobrazenie L(V, U) × L(W, V ) → L(W, U). Teda kompozíciu možno chápať ako bilineárne zobrazenie na uvedených vektorových priestoroch lineárnych zobrazení. Pod bilineárnou formou na vektorových priestoroch U, V rozumieme ľubovoľné bilineárne zobrazenie F : U × V → K. Nech U, V sú konečnorozmerné vektorové priestory s bázami ααα = (uuu1, . . . ,uuum) resp. βββ = (vvv1, . . . ,vvvn). Potom pre ľubovoľnú maticu AAA = (aij) ∈ Km×n je predpisom F(xxx,yyy) = (xxx)T ααα · AAA · (yyy)βββ = m i=1 n j=1 aijxiyj, kde (xxx)ααα = (x1, . . . , xm)T , (yyy)βββ = (y1, . . . , yn)T sú súradnice vektorov xxx ∈ U, yyy ∈ V v príslušných bázach, definovaná bilineárna forma F : U × V → K (presvedčte sa o tom). Ukážeme, že tiež naopak, každá bilineárna forma na vektorových priestoroch U, V má uvedený tvar pre jednoznačne určenú maticu AAA ∈ Km×n . Maticou bilineárnej formy F : U × V → K vzhľadom na bázy ααα, βββ nazývame maticu [F]ααα,βββ = F(uuui,vvvj) ∈ Km×n , ktorá je tvorená hodnotami formy F na dvojiciach vektorov báz ααα, βββ. 11.1.2. Tvrdenie. Nech U, V sú konečnorozmerné vektorové priestory s bázami ααα, resp. βββ a F : U×V → K je bilineárna forma. Potom pre všetky xxx ∈ U, yyy ∈ V platí F(xxx,yyy) = (xxx)T ααα · [F]ααα,βββ · (yyy)βββ a AAA = [F]ααα,βββ je jediná matica s touto vlastnosťou. Dôkaz. Nech (xxx)ααα = (x1, . . . , xm)T , (yyy)βββ = (y1, . . . , yn)T sú súradnice vektorov xxx ∈ U, yyy ∈ V v príslušných bázach ααα = (uuu1, . . . ,uuum), βββ = (vvv1, . . . ,vvvn). S použitím bilinearity F dostávame F(xxx,yyy) = F(x1uuu1 + . . . + xmuuum, y1vvv1 + . . . + ynvvvn) = m i=1 n j=1 xiyjF(uuui,vvvj) = (xxx)T ααα · [F]ααα,βββ · (yyy)βββ. 11.1. Bilineárne zobrazenia a bilineárne formy 217 Zostáva ukázať, že pre ľubovoľnú maticu AAA = (aij) ∈ Km×n platí ∀xxx ∈ U ∀yyy ∈ V F(xxx,yyy) = (xxx)T ααα · AAA · (yyy)βββ ⇒ AAA = [F]ααα,βββ. Za uvedeného predpokladu voľbou xxx = uuui, yyy = vvvj dostávame F(uuui,vvvj) = (ui)T ααα · AAA · (vvvj)βββ = eeeT i · AAA · eeej = aij. Teda špeciálne každá bilineárna forma F : Km ×Kn → K na (stĺpcových) vektorových priestoroch Km , Kn má tvar F(xxx,yyy) = xxxT · AAA · yyy = m i=1 n j=1 aijxiyj, kde AAA = [F]εεε(m),εεε(n) je matica formy F vzhľadom na kanonické bázy εεε(m) , εεε(n) . Teraz preskúmame ako závisí matica bilineárnej formy F : U × V → K na bázach priestorov U, V , presnejšie, ako sa mení v závislosti od zmien týchto báz. 11.1.3. Tvrdenie. Nech V1, V2 sú konečnorozmerné vektorové priestory nad poľom K, ααα1, βββ1 sú dve bázy priestoru V1, ααα2, βββ2 sú dve bázy priestoru V2 a F : V1 × V2 → K je bilineárna forma. Potom [F]βββ1,βββ2 = (PPPααα1,βββ1 )T · [F]ααα1,ααα2 · PPPααα2,βββ2 . Dôkaz. Označme AAA = [F]ααα1,ααα2 , BBB = [F]βββ1,βββ2 matice formy F v príslušných bázach. Pre ľubovoľné vektory xxx ∈ V1, yyy ∈ V2 platí (xxx)T βββ1 · BBB · (yyy)βββ2 = F(xxx,yyy) = (xxx)T ααα1 · AAA · (yyy)ααα2 = PPPααα1,βββ1 · (xxx)βββ1 T · AAA · PPPααα2,βββ2 · (yyy)βββ2 = (xxx)T βββ1 · (PPPααα1,βββ1 )T · AAA · PPPααα2,βββ2 · (yyy)βββ2 . Požadovaná rovnosť BBB = (PPPααα1,βββ1 )T · AAA · PPPααα2,βββ2 vyplýva z jednoznačnosti matice bilineárnej formy F vzhľadom na bázy βββ1, βββ2 dokázanej v tvrdení 11.1.2. 11.1.4. Príklad. Nech F : Km × Kn → K je bilineárna forma a ααα, βββ sú nejaké bázy priestorov Km , resp. Kn . Označme AAA = [F]ααα,βββ, MMM = [F]εεε(m),εεε(n) 218 11. Bilineárne a kvadratické formy matice formy F vzhľadom na bázy ααα, βββ, resp. vzhľadom na kanonické bázy εεε(m) , εεε(n) . Podľa práve dokázaného tvrdenia platia rovnosti AAA = PPPεεε(m),ααα T · MMM · PPPεεε(n),βββ = αααT · MMM · βββ, MMM = PPPααα,εεε(m) T · AAA · PPPβββ,εεε(n) = ααα−1 T ·AAA · βββ−1 , umožňujúce (po stotožnení každej bázy s maticou tvorenou jej stĺpcami) priamy výpočet jednej z matíc AAA, MMM na základe znalosti príslušných báz a druhej z nich. Tvrdenie 11.1.3 a príklad 11.1.4 nás priamo nabádajú k porovnaniu s vetou 7.5.1 a príkladom 7.5.2. Analógia s lineárnymi zobrazeniami a ich maticami však siaha ešte ďalej a zahŕňa aj vety 7.5.3 a 7.5.4. 11.1.5. Tvrdenie. Nech U je m-rozmerný a V je n-rozmerný vektorový priestor nad poľom K. Potom pre ľubovoľné matice AAA, BBB ∈ Km×n nasledujúce podmienky sú ekvivalentné: (i) AAA, BBB sú maticami tej istej bilineárnej formy F : U × V → K vzhľadom na nejaké dve (možno no nie nutne rôzne) dvojice báz priestorov U, V ; (ii) existujú regulárne matice PPP ∈ Km×m , QQQ ∈ Kn×n také, že BBB = PPP ·AAA·QQQ; (iii) h(AAA) = h(BBB). Dôkaz. Podľa tvrdenia 7.2.4 je štvorcová matica regulárna práve vtedy, keď k nej transponovaná matica je regulárna. Ekvivalencia (i) ⇔ (ii) je tak priamym dôsledkom tvrdena 11.1.3 a vety 7.5.3. Ekvivalencia (ii) ⇔ (iii) je už obsiahnutá vo vete 7.5.3. Na základe uvedeného tvrdenia možno korektne definovať hodnosť h(F) bilineárnej formy F na konečnorozmerných vektorových priestoroch ako hodnosť jej matice vzhľadom na ľubovoľnú dvojicu báz. Je totiž zrejmé, že táto hodnota na voľbe príslušných báz nezávisí. 11.1.6. Dôsledok. Pre každú bilineárnu formu F : U ×V → K na konečnorozmerných vektorových priestoroch nad poľom K možno zvoliť bázu ααα priestoru U a bázu βββ priestoru V tak, že F má vzhľadom na bázy ααα, βββ maticu v blokovom tvare [F]ααα,βββ = IIIh 0h,n−h 0m−h,h 0m−h,n−h , kde m = dim U, n = dim V a h = h(F). Otázkou, ako možno k danej bilineárnej forme F nájsť také bázy ααα, βββ, sa tu nebudeme zaoberať. Pre zvedavého čitateľa podávame stručný návod 11.1. Bilineárne zobrazenia a bilineárne formy 219 v cvičeniach. Za istých okolností sa s ňou však ešte stretneme. No v tejto chvíli obrátime svoju pozornosť trochu iným smerom. Ak F : U × V → K je ľubovoľná bilineárna forma, tak pre každé xxx ∈ U je predpisom ϕxxx(yyy) = F(xxx,yyy) definovaný lineárny funkcionál ϕxxx : V → K, t. j. prvok duálu V ∗ = L(V, K) vektorového priestoru V (pozri paragraf 6.5). Ak položíme F× (xxx) = ϕxxx, je tým definované zobrazenie F× : U → V ∗ . Bude nás zaujímať, pre aké F má každý lineárny funkcionál ϕ ∈ V ∗ tvar ϕ = F× (xxx) pre nejaké, prípadne pre jediné xxx ∈ U. 11.1.7. Veta. (a) Nech U, V sú vektorové priestory a F : U × V → K je bilineárna forma. Potom F× : U → V ∗ je lineárne zobrazenie. (b) Ak U, V sú konečnorozmerné, tak h(F× ) = h(F). V dôsledku toho F× je injektívne práve vtedy, keď h(F) = dim U, a F× je surjektívne práve vtedy, keď h(F) = dim V . Dôkaz. S využitím linearity F v prvej premennej možno podmienku (a) overiť priamym výpočtom, ktorý prenechávame ako cvičenie čitateľovi. (b) Položme dim V = n, zvoľme nejaké bázy ααα, βββ priestorov U resp. V a označme AAA = [F]ααα,βββ maticu formy F vzhľadom na ne. Potom Ker F× = xxx ∈ U; (∀yyy ∈ V )((xxx)T ααα · AAA · (yyy)βββ = 0 = {xxx ∈ U; (xxx)T ααα · AAA = 0}, lebo pre ľubovoľné xxx ∈ U je predpisom yyy → (xxx)T ααα · AAA · (yyy)βββ určené lineárne zobrazenie V → K, ktoré má vzhľadom na bázy βββ vo V a (1) v K maticu (xxx)T ααα· AAA, a matica lineárneho zobrazenia v daných bázach je určená jednoznačne. Keďže (xxx)T ααα ·AAA = AAAT · (xxx)ααα T a xxx → (xxx)ααα je lineárny izomorfizmus U → Kn , z tvrdenia 9.2.2 vyplýva dim Ker F× = dim R AAAT = n − h(AAA) = n − h(F). Podľa vety 6.2.3 o dimenzii jadra a obrazu z toho dostávame h(F× ) = dim Im F× = n − dim Ker F× = h(F). Zvyšok je už triviálnym dôsledkom tejto rovnosti, vety 6.2.2 a tvrdenia 6.5.3 11.1.8. Dôsledok. Nech U, V sú konečnorozmerné vektorové priestory rovnakej dimenzie. Potom pre ľubovoľnú bilineárnu formu F : U × V → K nasledujúce podmienky sú ekvivalentné: (i) F× : U → V ∗ je lineárny izomorfizmus; (ii) h(F) = dim U = dim V ; (iii) pre ľubovoľné (pre nejaké) bázy ααα, βββ priestorov U resp. V je [F]ααα,βββ regulárna matica. Bilineárna forma F : V × V → K sa nazýva regulárna, ak spĺňa niektorú (teda všetky) z podmienok posledného dôsledku; v opačnom prípade sa F nazýva singulárna. 220 11. Bilineárne a kvadratické formy 11.2 Symetrické bilineárne formy a kvadratické formy V tomto paragrafe sa budeme zaoberať výlučne bilineárnymi formami, v ktorých prvá aj druhá premenná prebieha ten istý vektorový priestor V , t. j. bilineárnymi formami tvaru F : V ×V → K. Budeme ich nazývať bilineárnymi formami na vektorovom priestore V . Bilineárna forma F : V 2 → K sa nazýva symetrická, ak pre všetky xxx,yyy ∈ V platí F(xxx,yyy) = F(yyy,xxx). Pre istotu ešte pripomíname, že bilineárna forma F : V 2 → K sa nazýva antisymetrická (pozri paragraf 10.1), ak pre všetky xxx,yyy ∈ V platí F(xxx,yyy) = −F(yyy,xxx). 11.2.1. Tvrdenie. Nech F je bilineárna forma na vektorovom priestore V nad poľom K a char K = 2. Potom F možno rozložiť na súčet F = F0 + F1 pre jednoznačne určené bilineárne formy F0, F1 na V , pričom F0 je symetrická a F1 je antisymetrická. Dôkaz Keďže char K = 2, v K platí 2 = 1 + 1 = 0, teda existuje prvok 1 2 = 2−1 ∈ K. Pre všetky xxx,yyy ∈ V položme F0(xxx,yyy) = 1 2 F(xxx,yyy) + F(yyy,xxx) , F1(xxx,yyy) = 1 2 F(xxx,yyy) − F(yyy,xxx) . Jednoduchými priamymi výpočtami, ktoré prenechávame čitateľovi, možno overiť, že F0 aj F1 sú bilineárne formy na V . Na prvý pohľad vidno, že F0 je symetrická, F1 je antisymetrická a pre všetky xxx,yyy ∈ V platí F(xxx,yyy) = F0(xxx,yyy) + F1(xxx,yyy). Zostáva overiť jednoznačnosť. Uvedený tvar foriem F0, F1 je však bezprostredným dôsledkom poslednej rovnosti a rovnosti F(yyy,xxx) = F0(xxx,yyy) − F1(xxx,yyy), ktorá z nej vyplýva na základe symetrie formy F0 a antisymetrie formy F1. Ak F je bilineárna forma na konečnorozmernom vektorovom priestore V s bázou ααα = (uuu1, . . . ,uuun), tak pod maticou formy F vzhľadom na túto bázu 11.2. Symetrické bilineárne formy a kvadratické formy 221 budeme rozumieť jej maticu vzhľadom na dvojicu báz ααα, ααα; značíme ju [F]ααα. Teda [F]ααα = [F]ααα,ααα = F(uuui,uuuj) n×n . Toto obmedzenie v porovnaní so všeobecnou definíciou z predošlého paragrafu je prirodzené – naopak, značne umelo by pôsobilo vyjadrovať súradnice prvej a druhej premennej v F, hoci ležia v tom istom priestore V , vzhľadom na rôzne bázy. Matice bilineárnych foriem na vektorovom priestore V vzhľadom na dvojice rôznych báz ααα, βββ vo V preto odteraz vylúčime z ďalších úvah. Jedna z výhod takéhoto prístupu spočíva v nasledujúcom zrejmom tvrdení, ktoré by však bez spomínaného obmedzenia neplatilo. Pripomeňme, že štvorcová matica AAA = (aij)n×n sa nazýva symetrická, ak AAA = AAAT , t. j. ak pre všetky i, j ≤ n platí aij = aji; podobne, AAA sa nazýva antisymetrická, ak AAA = −AAAT , t. j. ak pre všetky i, j ≤ n platí aij = −aji. 11.2.2. Tvrdenie. Nech ααα je ľubovoľná báza konečnorozmerného vektorového priestoru V a F : V 2 → K je bilineárna forma na V . Potom (a) F je symetrická práve vtedy, keď jej matica [F]ααα je symetrická; (b) F je antisymetrická práve vtedy, keď jej matica [F]ααα je antisymetrická. Násobenie v poli možno chápať ako bilineárnu formu F : K2 → K, kde F(a, b) = ab pre a, b ∈ K. Stotožnením prvej a druhej premennej dostávame zobrazenie q: K → K, kde q(a) = F(a, a) = a2 , t. j. „a-kvadrát . Zovšeobecnením tohto postupu dospejeme k pojmu kvadratickej formy. Zobrazenie q : V → K vektorového priestoru V do poľa K sa nazýva kvadratická forma na V , ak existuje bilineárna forma F : V 2 → K taká, že pre všetky xxx ∈ V platí q(xxx) = F(xxx,xxx). Hovoríme tiež, že bilineárna forma F indukuje kvadratickú formu q. Vo všeobecnosti existuje k danej kvadratickej forme q : V → K mnoho bilineárnych foriem F : V 2 → K, pre ktoré platí uvedená rovnosť. Ak je totiž F : V 2 → K nejaká bilineárna forma a G : V 2 → K je ľubovoľná antisymetrická bilineárna forma, tak, aspoň pokiaľ char K = 2, F(xxx,xxx) = F(xxx,xxx) + G(xxx,xxx), lebo zrejme G(xxx,xxx) = 0. Špeciálne v označení tvrdenia 11.2.1 platí F(xxx,xxx) = F0(xxx,xxx). To nás privádza na myšlienku pokúsiť sa odstrániť spomínanú nejednoznačnosť dodatočnou požiadavkou symetrie príslušnej bilineárnej formy. Polárnou formou kvadratickej formy q : V → K nazývame symetrickú bilineárnu formu F : V 2 → K, ktorá indukuje formu q. 222 11. Bilineárne a kvadratické formy 11.2.3. Tvrdenie. Nech q je kvadratická forma na vektorovom priestore V nad poľom K, pričom char K = 2. Potom existuje jediná symetrická bilineárna forma F : V 2 → K taká, že q(xxx) = F(xxx,xxx) pre všetky xxx ∈ V . Dôkaz. Ak F je ľubovoľná bilineárna forma na V , ktorá indukuje q, tak z tvrdenia 11.2.1 a pred chvíľou učinenej poznámky vyplýva, že hľadaná polárna forma ku q je daná vzťahom F0(xxx,yyy) = 1 2 (F(xxx,yyy) + F(yyy,xxx)). Požadovaná jednoznačnosť polárnej formy je bezprostredným dôsledkom nasledujúceho tvrdenia, ktoré nám poskytuje ďalšiu cennú informáciu o vzťahu medzi ňou a indukovanou kvadratickou formou. 11.2.4. Tvrdenie. Nech char K = 2, q : V → K je kvadratická forma a F : V 2 → K je jej polárna forma. Potom pre ľubovoľné xxx,yyy ∈ V platí F(xxx,yyy) = 1 2 q(xxx + yyy) − q(xxx) − q(yyy) = 1 2 q(xxx) + q(yyy) − q(xxx − yyy) = 1 4 q(xxx + yyy) − q(xxx − yyy) Dôkaz. Najprv si uvedomme, že char K = 2 má za dôsledok 4 = 2 · 2 = 0. Každú z rovností F(xxx,yyy) = 1 2 F(xxx + yyy,xxx + yyy) − F(xxx,xxx) − F(yyy,yyy) = 1 2 F(xxx,xxx) + F(yyy,yyy) − F(xxx − yyy,xxx − yyy) = 1 4 F(xxx + yyy,xxx + yyy) − F(xxx − yyy,xxx − yyy) možno teraz na základe bilinearity formy F overiť priamym výpočtom, ktorý prenechávame čitateľovi. Uvedené rovnosti nám tak dávajú k dispozícii hneď tri rôzne formuly, z ktorých každá umožňuje zrekonštruovať polárnu formu na základe znalosti jej kvadratickej formy. Ešte si všimnite, že tieto rovnosti sú len jednoduchým zovšeobecnením známych vzorcov ab = 1 2 (a + b)2 − a2 − b2 = 1 2 a2 + b2 − (a − b)2 = 1 4 (a + b)2 − (a − b)2 11.3. Diagonalizácia kvadratických foriem 223 platných pre ľubovoľné a, b ∈ K. Maticou kvadratickej formy q : V → K na konečnorozmernom vektorovom priestore V nad poľom charakteristiky rôznej od dvoch vzhľadom na bázu ααα nazývame maticu jej polárnej formy vzhľadom na túto bázu a značíme ju [q]ααα. Matica [q]ααα je touto požiadavkou jednoznačne určená a je to vždy symetrická matica. Hodnosťou kvadratickej formy potom nazývame hodnosť jej matice vzhľadom na akúkoľvek bázu a značíme ju h(q). Zrejme hodnosť h(q) nezávisí od voľby bázy a rovná sa hodnosti h(F) príslušnej polárnej formy. Kvadratická forma sa nazýva regulárna, resp. singulárna, ak má príslušnú vlastnosť jej polárna forma. Poznámka. Upozorňujeme, že ani jeden z výsledkov uvádzaných v tvrdeniach 11.2.1 a 11.2.3 (t. j. ani existencia ani jednoznačnosť) nie je splnený vo vektorových priestoroch nad poľom charakteristiky 2. Dokonca jednu a tú istú symetrickú bilineárnu, resp. kvadratickú formu možno zadať maticami rôznej hodnosti. Príklady možno nájsť v cvičeniach. V prípade tvrdenia 11.2.4 nedávajú uvedené vzorce nad poľom K charakteristiky 2 vôbec žiadny zmysel. 11.3 Diagonalizácia kvadratických foriem Ak F : V 2 → K je ľubovoľná bilineárna forma na konečnorozmernom vektorovom priestore V a AAA = (aij)n×n je jej matica vzhľadom na nejakú bázu ααα priestoru V , tak pre indukovanú kvadratickú formu q : V → K a všetky xxx ∈ V platí q(xxx) = F(xxx,xxx) = (xxx)T ααα · AAA · (xxx)ααα = n i,j=1 aijxixj = n i=1 aiix2 i + 1≤i 0, bi > 0 pre i ≤ h. Keďže AAA ≡ BBB, existuje regulárna matica PPP ∈ Rn×n taká, že BBB = PPPT · AAA · PPP. Jej stĺpce tvoria bázu βββ = (vvv1, . . . ,vvvn) vektorového priestoru Rn . Potom AAA je maticou kvadratickej formy q(xxx) = xxxT · AAA · xxx na Rn v báze εεε, zatiaľ čo BBB je jej maticou v báze βββ (pozri tvrdenie 11.3.3). Označme S = [eee1, . . . ,eeek], T = [vvvl+1, . . . ,vvvn] lineárne podpriestory v Rn . Pre každý nenulový vektor xxx = x1eee1+. . .+xkeeek ∈ S platí q(xxx) = xxxT · AAA · xxx = a1x2 1 + . . . + akx2 k > 0. Podobne, pre každý vektor yyy = yl+1vvvl+1 + . . . + ynvvvn ∈ T platí q(yyy) = (yyy)T βββ · BBB · (yyy)βββ = −bl+1y2 l+1 − . . . − bhy2 h ≤ 0. Z toho vyplýva, že S ∩ T = {0}, teda dim(S + T) = dim S + dim T = k + (n − l). Keďže S + T ⊆ Rn , zrejme dim(S + T) ≤ n. Z nerovnosti k + n − l ≤ n okamžite vyplýva k ≤ l. Zo symetrie vzťahu kongruencie dostávame tiež l ≤ k. Práve dokázaná veta umožňuje korektne rozšíriť definíciu signatúry z diagonálnych matíc na všetky symetrické matice, a taktiež na symetrické bilineárne a kvadratické formy. Signatúrou symetrickej matice AAA ∈ Rn×n , označenie σ(AAA), rozumieme signatúru ľubovoľnej s ňou kongruentnej diagonálnej matice BBB ∈ Rn×n . Signatúrou symetrickej bilineárnej formy F : V 2 → R na konečnorozmernom 236 12. Bilineárne a kvadratické formy nad poľom R reálnom vektorovom priestore V , označenie σ(F), rozumieme signatúru jej matice vzhľadom na ľubovoľnú bázu vo V . Konečne signatúrou kvadratickej formy q : V → R na konečnorozmernom vektorovom priestore nad R, označenie σ(q), rozumieme signatúru jej polárnej formy. Všimnite si, že pre symetrickú bilneárnu aj pre kvadratickú formu sa príslušná signatúra rovná signatúre nejakej jej diagonálnej matice. Sylvestrov zákon zotrvačnosti spolu s vetou 11.3.4 nám zaručujú, že ľubovoľné dve diagonálne matice zodpovedajúce danej forme vzhľadom na rôzne bázy, v ktorých má táto forma diagonálnu maticu, majú rovnakú signatúru. Každú reálnu symetrickú maticu AAA ∈ Rn×n možno upraviť na s ňou kongruentnú diagonálnu maticu. Tú zasa možno zmenou poradia prvkov na diagonále upraviť na s ňou kongruentnú maticu tvaru diag(d1, . . . , dk, −dk+1, . . . , −dk+l, 0, . . . , 0 m krát ), kde σ(AAA) = (k, l, m) a di > 0 pre i ≤ k + l. Ak teraz pre každé i ≤ k + l vynásobime i-ty stĺpec aj riadok skalárom 1/ √ di, vyjde nám matica v blokovo diagonálnom tvare AAA ≡ diag(IIIk, −IIIl, 0m,m). Spojením tejto úvahy so Sylvestrovým zákonom dostávame 12.1.2. Veta. Nech AAA, BBB ∈ Rn×n sú ľubovoľné symetrické matice. Potom AAA ≡ BBB ⇔ σ(AAA) = σ(BBB). 12.1.3. Dôsledok. Nech V je vektorový priestor nad R konečnej dimenzie n. Potom (a) každá symetrická bilineárna forma F : V 2 → R má vo vhodnej báze ααα priestoru V blokovo diagonálnu maticu tvaru [F]ααα = diag(IIIk, −IIIl, 0m,m), kde σ(F) = (k, l, m); (b) každá kvadratická forma q : V → R má vo vhodnej báze ααα priestoru V diagonálny tvar q(xxx) = x2 1 + . . . + x2 k − x2 k+1 − . . . − x2 k+l, kde σ(q) = (k, l, n − k − l) a (xxx)ααα = (x1, . . . , xn)T . Pre porovnanie ešte uvedieme pár poznámok o symetrických bilineárnych a kvadratických formách na vektorových priestoroch nad poľom C všetkých komplexných čísel a poľom Q všetkých racionálnych čísel. 12.1. Signatúra 237 Keďže char C = char Q = ∞ = 2, každú symetrickú maticu AAA typu n × n nad jedným i druhým poľom možno upraviť na s ňou kongruentnú diagonálnu maticu AAA ≡ diag(d1, . . . , dh, 0, . . . , 0), kde h = h(AAA) a dj = 0 pre j ≤ h. V komplexnom prípade si každý z prvkov dj môžeme vyjadriť v goniometrickom tvare dj = rj(cos αj + i sin αj), kde rj = |dj| > 0 a 0 ≤ αj < 2π. Ak pre každé j ≤ h vynásobíme j-ty stĺpec i riadok skalárom cj = 1 √ rj cos αj 2 − i sin αj 2 , pre ktorý platí c2 j dj = 1, dostaneme AAA ≡ diag(IIIh, 0m,m), kde m = n − h. Z toho vidíme, že nad poľom C sa nič podobné rozdeleniu nenulových prvkov na kladné a záporné nekoná – všetky nenulové prvky na diagonále sú rovnocenné a možno ich nahradiť jednotkou. Jediným invariantom, ktorý jednoznačne určuje kongruenciu symetrických matíc ako aj kanonický tvar matíc symetrických bilineárnych i kvadratických foriem nad C, je ich hodnosť, ktorá tak plne preberá úlohu signatúry v reálnom prípade. Nasledujúce tvrdenie je upresnením a zhrnutím našich úvah. 12.1.4. Tvrdenie. (a) Nech AAA, BBB ∈ Cn×n sú symetrické matice. Potom AAA ≡ BBB práve vtedy, keď h(AAA) = h(BBB). (b) Nech V je konečnorozmerný vektorový priestor nad C, a F : V 2 → C je symetrická bilineárna forma. Potom F má vzhľadom na nejakú bázu ααα priestoru V maticu v blokovo diagonálnom tvare [F]ααα = diag(IIIh, 0m,m), kde h = h(F) a m = dim V − h. Kým situácia nad C je podstatne jednoduchšia než nad R a dokázali sme ju úplne popísať, nad Q si tak ľahko poradiť nevieme. Základný problém tkvie v tom, že nie všetky kladné racionálne čísla majú racionálne druhé odmocniny. Tak už pre matice rozmeru 1×1 máme napr. (2) ≡ (1) v dôsledku iracionality čísla √ 2. Aby to však nebolo také jednoduché, v rozmere 2 × 2 napr. platí 2 0 0 2 ≡ 1 0 0 1 ≡ 2 0 0 1 . (Presvedčte sa o tom!) Systematickému štúdiu kongruencie racionálnych symetrických matíc, ktoré už nie je čiste záležitosťou lineárnej algebry ale aj teórie čísel, sa v tomto kurze viac venovať nebudeme. 238 12. Bilineárne a kvadratické formy nad poľom R 12.2 Definitnosť Nech V je vektorový priestor nad poľom R. Kvadratická forma q : V → R sa nazýva (a) kladne definitná, ak q(xxx) > 0 pre každé 0 = xxx ∈ V ; (b) kladne semidefinitná, ak q(xxx) ≥ 0 pre každé xxx ∈ V ; (c) záporne definitná, ak q(xxx) < 0 pre každé 0 = xxx ∈ V ; (d) záporne semidefinitná, ak q(xxx) ≤ 0 pre každé xxx ∈ V ; (e) indefinitná, ak existujú xxx,yyy ∈ V také, že q(xxx) < 0 < q(yyy). Rovnakú klasifikáciu zavádzame aj pre symetrické bilineárne formy F : V 2 → R – F má príslušnú vlastnosť definitnosti práve vtedy, keď ňou indukovaná kvadratická forma q(xxx) = F(xxx,xxx) má túto vlastnosť. Podobne, symetrická matica AAA ∈ Rn×n má príslušnú vlastnosť definitnosti práve vtedy, keď túto vlastnosť má kvadratická forma q(xxx) = xxxT · AAA · xxx na priestore Rn . Na začiatok zaznamenáme niekoľko jednoduchých pozorovaní: (a) ⇒ (b), (c) ⇒ (d), no každá z podmienok (a), (c), (e) vylučuje zvyšné dve. Dokonca (e) vylučuje každú z podmienok (b), (d). Podmienky (b), (d) sa vzájomne nevylučujú, no jediná kvadratická forma, ktorá je zároveň kladne aj záporne semidefinitná, je forma identicky rovná nule na V . V dimenzii n = 1 je to však jediná (kladne alebo záporne) semidefinitná forma. V dimenzii n = 1 takisto neexistujú nijaké indefinitné formy. Nasledujúce očividné tvrdenie poskytuje úplný popis vlastností definitnosti a regularity kvadratických foriem (a zároveň aj symetrických bilineárnych foriem a symetrických matíc) prostredníctvom ich signatúry. 12.2.1. Tvrdenie. Nech V je n-rozmerý vektorový priestor nad poľom R a q : V → R je kvadratická forma so signatúrou σ(q) = (s+, s−, s0). Potom (a) q je kladne definitná práve vtedy, keď σ(q) = (n, 0, 0); (b) q je kladne semidefinitná práve vtedy, keď σ(q) = (h(q), 0, n − h(q)); (c) q je záporne definitná práve vtedy, keď σ(q) = (0, n, 0); (d) q je záporne semidefinitná práve vtedy, keď σ(q) = (0, h(q), n − h(q)); (e) q je indefinitná práve vtedy, keď s+ ≥ 1 a s− ≥ 1; (f) q je regulárna práve vtedy, keď s0 = 0. Časť (a) predchádzajúceho tvrdenia v spojení s dôsledkom 12.1.3 okamžite dáva 12.2.2. Dôsledok. Symetrická matica AAA ∈ Rn×n je kladne definitná práve vtedy, keď existuje regulárna matica PPP ∈ Rn×n taká, že AAA = PPPT · PPP. 12.2. Definitnosť 239 Tvrdenie 12.2.1 nám spolu s algoritmom z dôkazu vety 11.3.5 (prípadne Lagrangeovou metódou) dáva priamy návod na zistenie charakteru definitnosti nejakej formy či matice. Tak napríklad kvadratická forma z príkladov 11.3.1, 11.3.6 má signatúru (2, 2, 0), teda je indefinitná. Kvadratická forma z príkladu 11.3.2 má signatúru (2, 0, 0), čiže je kladne definitná. Niekedy však môže byť užitočné, ak dokážeme určiť charakter definitnosti nejakej symetrickej matice (a tým pádom aj ňou určenej kvadratickej či bilineárnej formy) priamo, t. j. bez jej predchádzajúcej úpravy na s ňou kongruentný diagonálny tvar. Za tým účelom najprv zavedieme istú modifikáciu úprav typu (1) z dôkazu vety 11.3.5 – nazveme ich úpravami typu (1+ ) Nech i ≤ n je najmenší index taký, že aii = 0. Potom postupne pre každé j ≤ n také, že j > i a aij = aji = 0, pripočítame k j-temu stĺpcu matice − aij aii -násobok i-teho stĺpca a v takto získanej matici pripočítame − aji aii -násobok i-teho riadku k j-temu riadku. Inak povedané, pomocou diagonálneho prvku aii = 0 vynulujeme všetky nenulové prvky i-teho riadku aj stĺpca, ktoré ležia napravo resp. nadol od prvku aii. Uvedomme si, že matica prechodu, ktorá vznikne vykonaním ESO, zodpovedajúcich nejakým úpravám typu (1+ ) na jednotkovej matici, je vždy horná trojuholníková matica s jednotkami na diagonále. Navyše, súčin dvoch matíc takéhoto tvaru má tiež takýto tvar (presvedčte sa o tom). Ak AAA = (aij)n×n je matica nad ľubovoľným poľom K a 1 ≤ k ≤ n, tak pre potreby zvyšku tohto paragrafu AAAk označuje maticu tvorenú ľavým horným rohom rozmeru k × k matice AAA. Teda AAA1 = (a11), AAA2 = a11 a12 a21 a22 , . . . , AAAn = AAA. Determinanty matíc AAAk pre 1 ≤ k ≤ n nazývame hlavnými minormi matice AAA. 12.2.3. Veta. (Jacobi) Nech K je ľubovoľné pole a 0 = AAA ∈ Kn×n je symetrická matica hodnosti h. Potom nasledujúce podmienky sú ekvivalentné: (i) matica AAAh je regulárna a maticu AAA možno upraviť na s ňou kongruentný diagonálny tvar výlučne pomocou úprav typu (1+ ); (ii) |AAAk| = 0 pre každé 1 ≤ k ≤ h, a platí AAA ≡ diag |AAA1|, |AAA2| |AAA1| , . . . , |AAAh| |AAAh−1| , 0, . . . , 0 ; (iii) |AAAk| = 0 pre každé 1 ≤ k ≤ h; (iv) |AAAk| = 0 pre každé 1 ≤ k ≤ h a maticu AAA možno upraviť na s ňou kongruentný diagonálny tvar diag |AAA1|, |AAA2| |AAA1| , . . . , |AAAh| |AAAh−1| , 0, . . . , 0 240 12. Bilineárne a kvadratické formy nad poľom R výlučne pomocou úprav typu (1+ ). Dôkaz. (i) ⇒ (ii): Nech platí (i). Podľa poznámky, predchádzajúcej dokazovanú vetu existuje horná trojuholníková matica PPP ∈ Kn×n s jednotkami na diagonále taká, že matica BBB = PPPT · AAA · PPP je v diagonálnom tvare. Zrejme i každá z matíc PPPk, 1 ≤ k ≤ n, tvorená ľavým horným rohom rozmeru k × k matice PPP, je v takomto tvare. Označme BBB = diag(b1, . . . , bn). Prenechávame čitateľovi, aby sa sám presvedčil, že potom pre každé k ≤ n platí BBBk = diag(b1, . . . , bk) = PPPT k · AAAk · PPPk. Determinant každej z matíc PPPk je súčin jej diagonálnych prvkov, čiže |PPPk| = 1. Preto |BBBk| = b1 . . . bk = |AAAk| pre každé k ≤ n. Keďže matica AAAh je regulárna, platí |AAAh| = |BBBh| = b1 . . . bh = 0, teda bk = 0 pre všetky k ≤ h. Z jednotlivých rovností |AAA1| = b1, |AAA2| = b1b2, . . . , |AAAh| = b1b2 . . . bh už priamo vyplýva nenulovosť všetkých hlavných minorov |AAAk| pre k ≤ h, ako aj rovnosti b1 = |AAA1|, b2 = |AAA2|/|AAA1|, . . . , bh = |AAAh|/|AAAh−1|. Keďže h(BBB) = h(AAA) = h, pre h ≤ k ≤ n platí bk = 0 . (ii) ⇒ (iii) platí triviálne. (iii) ⇒ (iv): Nech platí (iii). Dokážeme, že maticu AAA možno upraviť na diagonálny tvar AAA ≡ diag |AAA1|, |AAA2| |AAA1| , . . . , |AAAh| |AAAh−1| , 0, . . . , 0 len pomocou úprav typu (1+ ). Nakoľko platí a11 = |AAA1| = 0, pomocou a11 možno vynulovať všetky ostatné prvky prvého riadku aj stĺpca matice AAA. Keďže ležia napravo resp. nadol od a11, ide o úpravu typu (1+ ). Dostaneme tak maticu v blokovo diagonálnom tvare AAA ≡ diag a11,CCC(1) , kde CCC(1) = c (1) ij je matica rozmeru (n − 1) × (n − 1) nad K. Vzhľadom na charakter vykonaných stĺpcových a riadkových úprav platí AAA2 = a11 a12 a21 a22 ≡ a11 0 0 c (1) 11 , a taktiež |AAA2| = a11c (1) 11 , čiže c (1) 11 = |AAA2| a11 = |AAA2| |AAA1| = 0. 12.2. Definitnosť 241 Pomocou prvku c (1) 11 = 0 možno teraz vynulovať všetky ostatné prvky prvého riadku aj stĺpca matice CCC(1) . Opäť ide o úpravu typu (1+ ) na matici diag a11,CCC(1) . Dostaneme tak maticu v blokovo diagonálnom tvare AAA ≡ diag a11,CCC(1) ≡ diag |AAA1|, |AAA2| |AAA1| ,CCC(2) , kde CCC(2) = c (2) ij ∈ K(n−2)×(n−2) . Rovnakou úvahou ako v predošlom prípade dospejeme k záveru, že c (2) 11 = |AAA3| |AAA2| = 0. Takto môžeme pokračovať tak dlho, až kým nedospejeme k blokovo diagonálnemu tvaru AAA ≡ diag |AAA1|, |AAA2| |AAA1| , . . . , |AAAh| |AAAh−1| ,CCC(h) , kde CCC(h) ∈ K(n−h)×(n−h) . Vzhľadom nato, že obe matice majú hodnosť h, (pokiaľ h < n) matica CCC(h) je identicky nulová. (iv) ⇒ (i) je opäť triválne. 12.2.4. Veta. (Sylvestrovo kritérium) Nech AAA ∈ Rn×n je symetrická matica. Potom (a) AAA je kladne definitná práve vtedy, keď |AAAk| > 0 pre všetky 1 ≤ k ≤ n; (b) AAA je záporne definitná práve vtedy, keď (−1)k |AAAk| > 0 pre všetky 1 ≤ k ≤ n. Dôkaz. (a) Nech AAA je kladne definitná. Podľa dôsledku 12.2.2 existuje regulárna matica PPP ∈ Rn×n , taká, že AAA = PPPT ·PPP. Keďže |PPP| = 0, odtiaľ už priamo vyplýva |AAA| = |PPPT | · |PPP| = |PPP|2 > 0. Pre každé 1 ≤ k ≤ n označme Sk = [eee1, . . . ,eeek] lineárny podpriestor v Rn generovaný prvými k vektormi kanonickej bázy εεε a qk = q Sk zúženie kvadratickej formy q(xxx) = xxxT ·AAA ·xxx na podpriestor Sk. Zrejme každé qk je kladne definitná kvadratická forma, ktorá má v báze (eee1, . . . ,eeek) podpriestoru Sk maticu AAAk. Takže každá z matíc AAAk, 1 ≤ k ≤ n, je kladne definitná. Podľa prvej časti dôkazu z toho vyplýva |AAAk| > 0. Nech naopak všetky hlavné minory |AAAk|, 1 ≤ k ≤ n, sú kladné. Potom h(AAA) = n a podľa Jacobiho vety platí AAA ≡ diag |AAA1|, |AAA2| |AAA1| , . . . , |AAAn| |AAAn−1| . 242 12. Bilineárne a kvadratické formy nad poľom R Keďže všetky diagonálne prvky v poslednej matici sú kladné, AAA je kladne definitná. (b) vyplýva z (a) na základe faktu, že AAA je záporne definitná práve vtedy, keď −AAA je kladne definitná, a rovnosti |−AAAk| = (−1)k |AAAk| splnenej pre všetky k ≤ n. 12.3 Extrémy funkcií viac premenných V tomto paragrafe si predvedieme, ako nám čerstvo nadobunuté poznatky o kvadratických formách môžu pomôcť pri štúdiu funkcií viac premenných, presnejšie pri hľadaní extrémov a sedlových bodov takýchto funkcií a všeobecnejšie pri klasifikácii ich stacionárnych bodov. Najprv si zopakujme, ako si počíname v prípade funkcie jednej premennej. Pre jednoduchosť sa obmedzíme len na „dostatočne hladké funkcie. Reálnu funkciu jednej premennej f : A → R definovanú na nejakej otvorenej množine 1 A ⊆ R nazveme pre účely tohto paragrafu dostatočne hladkou, ak f má na celej množine A konečnú a spojitú prvú i druhú deriváciu. Z matematickej analýzy si pripomeňme si, že pre takúto funkciu f máme v každom bode a ∈ A k dispozícii Taylorov rozvoj f(x) = f(a) + f (a)(x − a) + 1 2 f (a)(x − a)2 + θ(x)(x − a)2 pre x z istého okolia 2 N ⊆ A bodu a, pričom funkcia θ : N → R je spojitá a vyhovuje podmienke θ(a) = 0, teda absolútna hodnota zvyšku θ(x)(x−a)2 je v dosť malom okolí M ⊆ N bodu a v porovnaní s ostatnými členmi uvedeného rozvoja zanedbateľne malá. Pre x z tohto malého okolia bodu a teda môžeme písať f(x) ≈ f(a) + f (a)(x − a) + 1 2 f (a)(x − a)2 . Ak f (a) = 0, tak lineárny člen f (a)(x − a) mení v bode a znamienko a v dostatočne malom okolí bodu a prevažuje nad kvadratickým členom 1 2 f (a)(x − a)2 . Preto dostatočne hladká funkcia (dokonca už funkcia s konečnou a spojitou prvou deriváciou) môže nadobúdať na otvorenej množine extrémy len bodoch a, pre ktoré platí f (a) = 0; hovoríme im stacionárne alebo tiež kritické body funkcie f. Ak a ∈ A je stacionárny bod, tak uvedený Taylorov rozvoj má v tomto bode tvar f(x) = f(a) + 1 2 f (a)(x − a)2 + θ(x)(x − a)2 ≈ f(a) + 1 2 f (a)(x − a)2 1 Množina A ⊆ R sa nazýva otvorená, ak pre každé a ∈ A existuje ε > 0 také, že celý otvorený interval (a − ε, a + ε) je obsiahnutý v množine A. 2 Množina N ⊆ R sa nazýva okolím bodu a ∈ R, ak existuje ε > 0 také, že (a−ε, a+ε) ⊆ N. 12.3. Extrémy funkcií viac premenných 243 pre x ∈ M. Ak f (a) > 0, tak f(a) < f(x) pre všetky x = a z nejakého okolia L ⊆ M bodu a, teda f má v bode a ostré lokálne minimum. Ak f (a) < 0, tak f(a) > f(x) pre všetky x = a z nejakého okolia L ⊆ M bodu a, teda f má v bode a ostré lokálne maximum. Ak f (a) = 0, tak v bode a sa može diať v podstate „čokoľvek , presnejšie, len na základe prvej a druhej derivácie nevieme určiť, či f má v bode a extrém, ani charakter prípadného extrému. Ak f má aj derivácie vyších rádov, ich znalosť nám môže pomôcť. No tým sa už zaoberať nebudeme. Podobne si budeme počínať aj pri skúmaní funkcií viac premenných. Namiesto „obyčajnej derivácie však musíme uvažovať derivácie podľa rôznych premenných funkcie f – hovoríme im parciálne derivácie. Pre čitateľa, ktorý sa s parciálnymi deriváciami dosiaľ nestretol, poznamenávame, že parciálnu deriváciu ∂f/∂xi funkcie f podľa premennej xi dostaneme tak, že f jednoducho derivujeme podľa xi ako funkciu jednej premennej, pričom všetky ostatné premenné považujeme za konštanty. Druhú parciálnu deriváciu funkcie f, najprv podľa premennej xj a potom podľa premennej xi, značíme ∂2 f/∂xi∂xj. Namiesto ∂2 f/∂xi∂xi píšeme ∂2 f/∂x2 i . Pre jednoduchosť sa opäť obmedzíme len na „dostatočne hladké funkcie. Reálnu funkciu n premenných definovanú na otvorenej množine 3 A ⊆ Rn nazveme pre účely tohto paragrafu dostatočne hladkou, ak f má na celej množine A konečné a spojité všetky parciálne derivácie prvého i druhého rádu. Nech teda f : A → R je dostatočne hladká funkcia definovaná na otvorenej množine A ⊆ Rn a aaa ∈ A. Prvou (totálnou) deriváciou alebo tiež gradientom funkcie f v bode aaa nazývame vektor f (aaa) = gradf(aaa) = f(aaa) = ∂f(aaa) ∂x1 , . . . , ∂f(aaa) ∂xn , ktorého zložky tvoria prvé parciálne derivácie funkcie f v bode aaa (znak čítame ako nabla). Druhou (totálnou) deriváciou alebo tiež Hesseho maticou funkcie f v bode aaa nazývame maticu f (aaa) = ∂2 f(aaa) ∂xi∂xj n×n , tvorenú všetkými druhými parciálnymi deriváciami funkcie f v bode aaa. V diferenciálnom počte funkcií viac premenných sa dokazuje tzv. ClairautovaSchwartzova veta, podľa ktorej zo spojitosti druhých parciálnych derivácií 3 Množina A ⊆ Rn sa nazýva otvorená, ak pre každé aaa ∈ A existuje ε > 0 také, že celá otvorená guľa B(aaa, ε) = xxx ∈ Rn ; (x1 − a1)2 + . . . + (xn − an)2 < ε2 je obsiahnutá v množine A. 244 12. Bilineárne a kvadratické formy nad poľom R na množine A vyplýva ∂2 f(xxx) ∂xi∂xj = ∂2 f(xxx) ∂xj∂xi pre všetky i, j ≤ n a xxx ∈ A. To znamená, že Hesseho matica f (aaa) dostatočne hladkej funkcie f je symetrická, teda je maticou kvadratickej formy q(vvv) = vvv · f(aaa) · vvvT = vvv · ∂2 f(aaa) ∂xi∂xj · vvvT na (riadkovom) vektorovom priestore Rn vzhľadom na kanonickú bázu εεε(n) . Ukážeme si, že práve signatúra druhej derivácie f (aaa) rozhodujúcim (a v prípade jej regularity dokonca jednoznačným) spôsobom určuje chovanie funkcie v jej kritických bodoch. Podobne ako v prípade jednej premennej, aj dostatočne hladkú funkciu viac premenných možno v každom bode aaa = (a1, . . . , an) ∈ A písať v tvare Taylorovho rozvoja f(xxx) = f(aaa)+f (aaa)·(xxx−aaa)T + 1 2 (xxx−aaa)·f (aaa)·(xxx−aaa)T +(xxx−aaa)·ΘΘΘ(xxx)·(xxx−aaa)T pre xxx = (x1, . . . , xn) z istého okolia 4 N ⊆ A bodu aaa, kde ΘΘΘ(xxx) = θij(xxx) n×n je matica, ktorej zložky tvoria hodnoty spojitých funkcií θij : N → R v bode xxx. Tieto funkcie navyše vyhovujú podmienke θij(aaa) = 0, teda absolútna hodnota zvyšku (xxx − aaa) · ΘΘΘ(xxx) · (xxx − aaa)T je v dosť malom okolí M ⊆ N bodu aaa v porovnaní s ostatnými členmi uvedeného rozvoja zanedbateľne malá. Pre xxx z tohto malého okolia bodu aaa teda môžeme písať f(xxx) ≈ f(aaa) + f (aaa) · (xxx − aaa)T + 1 2 (xxx − aaa) · f (aaa) · (xxx − aaa)T . Ak ∂f(aaa) ∂xi = 0, tak zložka ∂f(aaa) ∂xi (xi − ai) lineárneho člena f (aaa) · (xxx − aaa)T mení v bode aaa znamienko a v dostatočne malom okolí bodu aaa takéto zložky prevažujú nad kvadratickým členom 1 2 (xxx − aaa) · f (aaa) · (xxx − aaa)T . Preto dostatočne hladká funkcia (dokonca už funkcia s konečnými a spojitými prvými parciálnymi deriváciami) môže na otvorenej množine nadobúdať extrémy len v bodoch aaa, pre ktoré platí f (aaa) = 0, t. j. všetky parciálne derivácie ∂f/∂xi v bode aaa sa rovnajú nule. Takýmto bodom hovoríme stacionárne alebo tiež kritické body funkcie f. Ak aaa ∈ A je stacionárny bod, tak uvedený Taylorov rozvoj má v tomto bode tvar f(xxx) = f(aaa) + 1 2 (xxx − aaa) · f (aaa) · (xxx − aaa)T + (xxx − aaa) · ΘΘΘ(xxx) · (xxx − aaa)T ≈ f(aaa) + 1 2 (xxx − aaa) · f (aaa) · (xxx − aaa)T 4 Množina N ⊆ Rn sa nazýva okolím bodu aaa ∈ Rn , ak existuje ε > 0 také, že B(aaa, ε) ⊆ N. 12.3. Extrémy funkcií viac premenných 245 pre všetky xxx z okolia M bodu aaa. Ak Hesseho matica f (a) je kladne definitná, tak pre všetky xxx = aaa z nejakého okolia L ⊆ M bodu aaa platí (xxx−aaa)·f (aaa)·(xxx−aaa)T > 0 a f(aaa) < f(xxx), teda f má v bode aaa ostré lokálne minimum. Ak Hesseho matica f (aaa) je záporne definitná, tak pre všetky xxx = aaa z nejakého okolia L ⊆ M bodu aaa platí (xxx − aaa) · f (aaa) · (xxx − aaa)T < 0 a f(aaa) > f(xxx), teda f má v bode aaa ostré lokálne maximum. Ak Hesseho matica f (aaa) je indefinitná, tak existujú vektory uuu, vvv a číslo ε > 0 také, že uuu·f (aaa)·uuuT < 0 < vvv·f(aaa)·vvvT , obe úsečky X = {aaa+tuuu; |t| ≤ ε}, Y = {aaa + tvvv; |t| ≤ ε} sú celé obsiahnuté v okolí M a pre všetky body xxx ∈ X, yyy ∈ Y rôzne od aaa platí f(xxx) < f(aaa) < f(yyy). Hovoríme, že f má v bode aaa sedlový bod alebo krátko sedlo. Tento prípad zrejme nemôže nastať pre funkcie jednej premennej. Samozrejme, v sedlovom bode funkcia nenadobúda extrém. Ak Hesseho matica f (aaa) je nenulová, singulárna a semidefinitná, tak náš čitateľ asi očakáva, že f v bode aaa nadobudne neostré lokálne minimum (pre kladne semidefinitnú maticu) alebo neostré lokálne maximum (pre záporne semidefinitnú maticu). No nie vždy je tomu tak. Podobne ako v prípade nulovej druhej derivácie u funkcií jednej premennej, ak matica f (aaa) je singulárna a (kladne alebo záporne) semidefinitná, tak – bez ohľadu nato, či je nulová alebo nie, – v bode aaa sa môže udiať prakticky „čokoľvek . Funkcia v tomto bode môže, ale nemusí mať extrém alebo sedlo. Niečo však predsa len môžeme povedať: ak uvedená matica je nenulová a kladne semidefinitná, tak f nemá v bode aaa (ostré ani neostré) lokálne maximum; ak je nenulová a Obr. 12.1. Graf funkcie z = f(x, y) = sin πx 2 sin πy 2 246 12. Bilineárne a kvadratické formy nad poľom R záporne semidefinitná, tak f nemá v bode aaa (ostré ani neostré) lokálne minimum. Často však môžeme podobné otázky rozhodnúť preskúmaním Hesseho matice f (xxx) pre body xxx v nejakom blízkom okolí bodu aaa – pozri cvičenie 12.9. Ak platí f (aaa) = 0 a f má aj derivácie vyšších rádov, tak na ich základe môžeme niekedy povedať viac – pozri paragraf 33.2. 12.3.1. Príklad. (Kopčeky a jamky) Preskúmame funkciu f : R2 → R, danú predpisom f(x, y) = sin πx 2 sin πy 2 . Jej prvé parciálne derivácie sú ∂f ∂x = π 2 cos πx 2 sin πy 2 , ∂f ∂y = π 2 sin πx 2 cos πy 2 . Keďže sinus a kosinus nejakého čísla sa súčasne nemôžu rovnať nule, (x, y) je stacionárnym bodom funkcie f práve vtedy, keď cos πx 2 = cos πy 2 = 0 alebo sin πx 2 = sin πy 2 = 0. Teda stacionárnymi bodmi funkcie f sú práve všetky mrežové body roviny tvaru (m, n), kde m, n sú celé čísla rovnakej parity (t. j. m − n je párne číslo). Vypočítame i druhé parciálne derivácie ∂2 f ∂x2 = ∂2 f ∂y2 = − π2 4 sin πx 2 sin πy 2 , ∂2 f ∂x∂y = ∂2 f ∂y∂x = π2 4 cos πx 2 cos πy 2 . Vidíme, že funkcia f je dostatočne hladká na celej rovine R2 . Jej druhá totálna derivácia v stacionárnych bodoch má tvar f (m, n) = π2 4 − sin mπ 2 sin nπ 2 cos mπ 2 cos nπ 2 cos mπ 2 cos nπ 2 − sin mπ 2 sin nπ 2 . Pre m = 2k, n = 2l obe párne máme f (m, n) = π2 4 0 (−1) m+n 2 (−1) m+n 2 0 ≡ 1 0 0 −1 . V každom z týchto bodoch je Hesseho matica indefinitná, teda funkcia f má v bodoch tvaru (2k, 2l), kde k, l ∈ Z, sedlá. Hodnota funkcie vo všetkých sedlových bodoch je 0. Pre m = 2k + 1, n = 2l + 1 obe nepárne máme f (m, n) = π2 4 (−1) m+n 2 0 0 (−1) m+n 2 ≡ (−1)k+l+1 1 0 0 1 . Táto matica je záporne definitná, ak k + l je párne číslo, a kladne definitná pre nepárne k + l. 12.3. Extrémy funkcií viac premenných 247 Funkcia f teda nadobúda ostré lokálne maximá v bodoch (2k +1, 2l +1), kde k, l sú celé čísla a k + l je párne. Hodnota všetkých týchto maxím je 1. V bodoch (2k + 1, 2l + 1), kde k, l ∈ Z a k + l je nepárne číslo, nadobúda f ostré lokálne minimá, ktorých hodnota je vždy −1. Na obrázku je graf funkcie f na časti definičného oboru 0, 4 × 0, 4 . Vidno na ňom maximá v bodoch (1, 1), (3, 3), minimá v bodoch (1, 3), (3, 1) a sedlo v bode (2, 2). Nakoľko všetky typy kritických bodov, ktorých charakter možno určiť na základe druhej derivácie funkcie, sa nám podarilo ilustrovať na jedinom príklade, v ďalších ukážkach sa zameriame na funkcie so singulárnymi semidefinitnými druhými deriváciami v kritických bodoch. Keďže v takom prípade nám toho naša teória mnoho nepovie, zvolíme si funkcie, pri ktorých nám charakter kritických bodov bude jasný z názoru, ako napokon aj v prvom príklade. Najprv jeden príklad, kde všetko dopadne podľa očakávania. 12.3.2. Príklad. (Vlnitý plech) Je daná funkcia g : R2 → R, kde g(x, y) = cos(πx). Jej prvé parciálne derivácie sú ∂g ∂x = −π sin(πx), ∂g ∂y = 0. Stacionárne body funkcie g teda vytvárajú systém ekvidistantných rovnobežných priamok (s rovnicami) x = k, kde k je ľubovoľné celé číslo. Druhé parciálne derivácie funkcie g sú ∂2 g ∂x2 = −π2 cos(πx), ∂2 g ∂y2 = ∂2 g ∂x∂y = ∂2 g ∂y∂x = 0, 1 Obr. 12.2. Graf funkcie z = g(x, y) = cos(πx) 248 12. Bilineárne a kvadratické formy nad poľom R takže funkcia g je dostatočne hladká. Druhá totálna derivácia v stacionárnych bodoch teda vyzerá takto g (k, y) = −π2 cos(kπ) 0 0 0 = −π2 (−1)k 0 0 0 . Pre k párne dostávame g (k, y) ≡ −1 0 0 0 , čo je záporne semidefinitná singulárna matica. Podobne, pre k nepárne máme g (k, y) ≡ 1 0 0 0 , čo je kladne semidefinitná singulárna matica. V takom prípade nám naša teória neposkytuje nijaké závery. Z grafu funkcie na časti −3 2 , 3 2 × 0, 2 definičného oboru a z periodičnosti funkcie cos(πx) však možno usúdiť, že pre párne k ∈ Z nadobúda funkcia g na priamkach x = k neostré lokálne maximum hodnoty 1 a pre nepárne k ∈ Z nadobúda g na priamkach x = k neostré lokálne minimum hodnoty −1. Na záver si predvedieme, čo všetko sa v kritickom bode môže ešte stať. 12.3.3. Príklad. (Kreslo, sieť a sedlo) Uvažujme reálne funkcie dvoch pre- menných h1(x, y) = x2 + y3 , h2(x, y) = x2 + y4 , h3(x, y) = x2 − y4 . Ľahko možno nahliadnuť, že všetky majú jediný a ten istý stacionárny bod (0, 0), v ktorom nadobúdajú tú istú hodnotu 0. Taktiež majú v tomto bode rovnakú druhú totálnu deriváciu h1(0, 0) = h2(0, 0) = h3(0, 0) = 2 0 0 0 , (presvedčte sa o tom sami). Takže Hesseho matica je nenulová, singulárna a kladne semidefinitná. Z obrázkov grafov funkcií v istých okoliach bodu (0, 0) však vidno, že (1) h1 nemá v bode (0, 0) extrém ani sedlo – v tomto bode sa totiž pretína krivka z = x2 , y = 0, pre ktorú je (0, 0) bodom ostrého lokálneho minima, s krivkou x = 0, z = y3 , ktorá má v bode (0, 0) inflexný bod; (2) h2 má v bode (0, 0) ostré lokálne minimum; (3) h3 má v bode (0, 0) sedlo. Cvičenia 249 Obr. 12.3. Graf funkcie z = h1(x, y) = x2 + y3 8 z Obr. 12.4. Graf funkcie z = h2(x, y) = x2 + y4 1 Obr. 12.5. Graf funkcie z = h3(x, y) = x2 − y4 Cvičenia 12.1. Napíšte matice nasledujúcich kvadratických foriem, upravte ich na diagonálny tvar a určte ich signatúry: (a) p(x) = 3(x2 1 + x2 2 + x2 3) − 2(x1x2 + x1x3 + x2x3) pre xxx = (x1, x2, x3)T ∈ R3 ; (b) q(xxx) = x1x2 − 2x1x3 + 3x2x3 pre xxx = (x1, x2, x3)T ∈ R3 ; (c) r(xxx) = x1x2 + x1x3 + x2x3 pre xxx = (x1, x2, x3)T ∈ R3 ; (d) s(xxx) = −2x2 1 + x2 2 − x2 3 + 5x2 4 − 2x1x2 − 4x1x3 − 2x1x4 − 2x2x32x2x44x3x4 pre xxx = (x1, x2, x3, x4)T ∈ R4 ; (e) t(xxx) = −x2 1+x2 2+8x2 3+2x2 4+4x1x3−2x2x4+10x3x4 pre xxx = (x1, x2, x3, x4)T ∈ R4 . 12.2. Vypočítajte hlavné minory matíc kvadratických foriem z cvičenia 12.1. Pokúste sa určiť definitnosť každej z uvedených foriem na základe Sylvestrovho kritéria. Pre ktoré z uvedených foriem možno na základe Jacobiho vety 12.2.3 určiť aj signatúru? 12.3. Riešte rovnakú úlohu ako v cvičení 12.2 pre kvadratické formy z cvičení 11.6 a 11.7. 12.4. (a) Dokážte, že matica 2III2 je kongruentná s maticou III2 nad poľom Q. (b) Dokážte, že matica diag(2, 1) nie je kongrunetná s maticou III2 nad poľom Q. 250 12. Bilineárne a kvadratické formy nad poľom R 12.5. Nájdite stacionárne body nasledujúcich funkcií dvoch premenných a klasifikujte ich pomocou Hesseho matice: (a) f1(x, y) = x3 − 3y2 + 3xy − 3y, (b) f2(x, y) = −2 3 x3 + y2 + 4xy + 3y, (c) g(x, y) = xy, (d) h1(x, y) = x2 y2 (x − y + 1), (e) h2(x, y) = x2 (y + 1) + 2y3 + 5y2 , (f) h3(x, y) = x2 (y + 1) + y2 (x − 1), (g) h4(x, y) = x2 (y + 1) + y2 (y − 1), (h) h5(x, y) = (x2 + y2 )(y + 1). 12.6. Pomocou Sylvestrovho kritéria zdôvodnite nasledujúce pravidlá pre klasifikáciu stacionárnych bodov funkcie dvoch premenných. Nech A ⊆ R je otvorená množina a aaa ∈ A ⊆ R2 je stacionárny bod funkcie f : A → R. Predpokladajme, že f je dostatočne hladká a determinant Hesseho matice funkcie f v bode aaa je nenulový, t. j. det f (aaa) = 0. Potom platí: (a) ak det f (aaa) > 0 a (∂2 f/∂x2 )(aaa) > 0 alebo (∂2 f/∂y2 )(aaa) > 0, tak funkcia f má v bode aaa ostré lokálne minimum; (b) ak det f (aaa) > 0 a (∂2 f/∂x2 )(aaa) < 0 alebo (∂2 f/∂y2 )(aaa) < 0, tak funkcia f má v bode aaa ostré lokálne minimum; (c) ak det f (aaa) < 0, tak tak funkcia f má v bode aaa sedlo. Len tak mimochodom si všimnite, že ak det f (aaa) > 0, tak obe druhé parciálne derivácie (∂2 f/∂x2 )(aaa), (∂2 f/∂y2 )(aaa) sú nevyhnutne nenulové a majú rovnaké znamienko. Vysvetlite prečo. 12.7. S využitím cvičenia 12.6 preskúmajte ešte raz stacionárne body funkcií z cvičenia 12.5. 12.8. Nájdite stacionárne body nasledujúcich funkcií troch premenných a klasifikujte ich pomocou Hesseho matice: (a) f(x, y, z) = 3x2 + x3 + y2 + xy2 + z3 − 3z, (b) g(x, y, z) = (x + y + z) e−(x2 +y2 +z2 ) , (c) h(x, y, z) = x y+z + y x+z + z x+y . 12.9. Nasledujúce kritérium nám umožňuje klasifikovať aj niektoré stacionárne body funkcie, v ktorých je jej druhá totálna derivácia singulárna. Predpokladajme, že f : A → R je dostatočne hladká funkcia definovaná na otvorenej množine A ⊆ Rn a aaa ∈ A je jej stacionárny bod. Zdôvodnite nasledujúce tvrdenia: (a) Ak existuje také okolie N ⊆ A bodu aaa, že pre všetky xxx ∈ N, xxx = aaa je druhá totálna derivácia f”(xxx) funkcie f v bode xxx kladne (záporne) definitná, tak f má v bode aaa ostré lokálne minimum (maximum). (b) Ak existuje také okolie N ⊆ A bodu aaa, že pre všetky xxx ∈ N, xxx = aaa je druhá totálna derivácia f”(xxx) funkcie f v bode xxx kladne (záporne) semidefinitná, tak f má v bode aaa lokálne minimum (maximum). (c) Ak existuje také okolie N ⊆ A bodu aaa, že pre všetky xxx ∈ N, xxx = aaa je druhá totálna derivácia f”(xxx) funkcie f v bode xxx indefinitná, tak f má v bode aaa sedlo. 12.10. S využitím cvičenia 12.9 vysvetlite chovanie funkcií g z príkladu 12.3.2 a h1, h2, h3 z príkladu 12.3.3 v ich kritických bodoch. Taktiež opätovne preskúmajte tie kritické body funkcií z predošlých cvičení, ktoré ste nedokázali klasifikovať podľa Hesseho Cvičenia 251 matice v príslušnom bode. 12.11. Nájdite stacionárne body nasledujúcich funkcií dvoch premenných a klasifikujte ich pomocou Hesseho matice (ak treba) v okolí týchto bodov: (a) f1(x, y) = (x + y − 1)3 + (x − y + 1)2 , (b) f2(x, y) = (x + y − 1)3 + (x − y + 1)3 , (c) g1(x, y) = x2 y2 , (d) g2(x, y) = xy(xy − 1), (e) h1(x, y) = x2 ey , (f) h2(x, y) = x e−y2 . 12.12. Nájdite a klasifikujte stacionárne body funkcií dvoch premenných (a) f(x, y) = x4 (x − 1) + ay(y − 1), (b) g(x, y) = x4 (x − 1) + ay2 (y − 1), (c) h(x, y) = x4 (x − 1) + ay3 (y − 1), (d) k(x, y) = x4 (x − 1) + ay2 (y − 1)2 . Zakaždým urobte diskusiu vzhľadom na parameter a ∈ R. 13. Euklidovské priestory Naše štúdium vektorových priestorov sa doteraz nieslo prevažne v algebraickom duchu a bolo vedené takmer výlučne algebraickými prostriedkami. Geometria bola v tomto poňatí zredukovaná väčšinou len na otázky rovnoči rôznobežnosti a pretínania lineárnych a afinných podpriestorov, t. j. na tzv. štruktúru incidencie. Popri tom však geometrický názor bol pre nás dôležitým zdrojom prvotných motivácií alebo dodatočných ilustrácií mnohých pojmov. To bolo umožnené hlavne tým, že hoci sme sa zaoberali vektorovými priestormi nad ľubovoľným poľom, ako typické príklady sme si pod nimi väčšinou predstavovali vektorové priestory malej dimenzie nad poľom reálnych čísel a vektory v nich ako orientované úsečky (s počiatkom v bode 0), ktoré majú určitú dĺžku, smer a orientáciu. Inak povedané, lineárnu algebru sme často vedome a ešte častejšie podvedome zasadzovali do rámca elementárnej geometrie roviny alebo priestoru. Prísne vzaté nám však len samotná štruktúra vektorového priestoru (ani keby sme sa obmedzili iba na prípad poľa R) neumožňuje vôbec hovoriť o dĺžke – takýto pojem v doterajšom kontexte nemá žiadny zmysel. Pritom práve dĺžka, a spolu s ňou tiež uhol sú základnými kvantitatívnymi veličinami elementárnej euklidovskej geometrie. Naplnenie lineárnej algebry geometrickým obsahom teda v prvom rade vyžaduje dať práve týmto pojmom určitý dobre zakotvený význam, ktorý – hoci by sa neopieral len o náš geometrický názor – bol by s ním v dobrej zhode. V tejto kapitole sa o to pokúsime vo vektorových priestoroch nad poľom R. Ukazuje sa, že celú základnú geometrickú štruktúru, vrátane dĺžok a uhlov, možno odvodiť z jedinej kladne definitnej symetrickej bilineárnej formy na takomto priestore. 13.1 Skalárny súčin Skalárnym alebo tiež vnútorným súčinom na reálnom vektorovom priestore V rozumieme ľubovoľnú kladne definitnú, symetrickú bilineárnu formu na V . Hodnotu tejto formy na vektoroch xxx,yyy ∈ V budeme značiť xxx,yyy . Nezávisle na znalosti uvedených pojmov možno skalárny súčin na V definovať ako binárnu operáciu V × V → R, ktorá každej dvojici (xxx,yyy) vektorov z V priradí reálne číslo xxx,yyy také, že pre všetky xxx,yyy,xxx1,xxx2 ∈ V a ľubovoľné c ∈ R platí: xxx1 + xxx2,yyy = xxx1,yyy + xxx2,yyy (aditivita), cxxx,yyy = c xxx,yyy (homogenita), xxx,yyy = yyy,xxx (symetria), xxx = 0 ⇒ xxx,xxx > 0 (kladná definitnosť). 13.1. Skalárny súčin 253 Spojenie aditivity a homogenity skalárneho súčinu dáva jeho linearitu ako funkcie prvej premennej (pri pevnej druhej premennej). Vďaka symetrii z toho vyplýva aj linearita skalárneho súčinu ako funkcie druhej premennej (pri pevnej prvej premennej), t. j. rovnosti xxx,yyy1 + yyy2 = xxx,yyy2 + xxx,yyy2 , xxx, cyyy = c xxx,yyy , pre všetky xxx,yyy1,yyy2 ∈ V a c ∈ R. Z (bi)linearity takisto vyplýva nasledujúci podrobnejší rozpis podmienky kladnej definitnosti xxx,xxx ≥ 0 & xxx,xxx = 0 ⇔ xxx = 0 pre každé xxx ∈ V . Prvá časť tejto podmienky nám umožňuje definovať normu alebo dĺžku vektora xxx rovnosťou xxx = xxx,xxx . Výraz xxx 2 treba zatiaľ chápať len ako iné označenie pre kvadratickú formu xxx,xxx indukovanú skalárnym súčinom. O oprávnenosti názvu „dĺžka ako aj o ďalších vlastnostiach normy podrobnejšie pojednáme až v paragrafe 13.3. Euklidovským priestorom nazývame ľubovoľný konečnorozmerný reálny vektorový priestor so skalárnym súčinom. Hoci sa v tejto kapitole hodláme sústrediť práve na euklidovské priestory, všetky pojmy a výsledky, v ktorých konečnosť dimenzie nehrá podstatnú úlohu, sa budeme snažiť formulovať tak, aby zahŕňali všetky (teda i nekonečnorozmerné) priestory so skalárnym súčinom. 13.1.1. Príklad. Náš čitateľ sa už na strednej škole v rámci analytickej geometrie, prípadne v rámci fyziky, asi stretol so skalárnym súčinom xxx,yyy = x1y1 + x2y2 v rovine R2 a so skalárnym súčinom xxx,yyy = x1y1 + x2y2 + x3y3 v priestore R3 . Ľahko sa možno presvedčiť, že rovnaká formulka funguje pre každé n, t. j. pre xxx = (x1, . . . , xn)T , yyy = (y1, . . . , yn)T je predpisom xxx,yyy = xxxT · yyy = n i=1 xiyi definovaný skalárny súčin na stĺpcovom vektorovom priestore Rn . V prípade riadkového priestoru Rn máme xxx,yyy = xxx · yyyT = n i=1 xiyi 254 13. Euklidovské priestory pre xxx = (x1, . . . , xn), yyy = (y1, . . . , yn). Takýto skalárny súčin budeme nazývať štandardným skalárnym súčinom na Rn . Štandardný skalárny súčin vektorov xxx,yyy ∈ Rn (či už ide o riadkové alebo stĺpcové vektory) sa obvykle značí xxx ·yyy. Dĺžka vektora xxx vzhľadom na štandardný skalárny súčin je xxx = √ xxx · xxx = n i=1 x2 i 1/2 . V rámci analytickej geometrie sa pre nenulové vektory xxx, yyy dokazuje známy vzťah xxx · yyy = xxx yyy cos α, ktorý zväzuje štandardný skalárny súčin v R2 či v R3 s dĺžkou príslušných vektorov a nimi zvieraným uhlom α. 13.1.2. Príklad. Nech V označuje vektorový priestor C a, b všetkých spojitých reálnych funkcií definovaných na uzavretom intervale a, b , kde a < b sú reálne čísla, prípadne jeho ľubovoľný lineárny podpriestor. Pre f, g ∈ V položme f, g = b a f(x)g(x) dx. Z komutatívnosti násobenia v R a aditivity a homogenity integrálu vyplýva, že f, g je symetrická bilineárna forma na V (podrobne si premyslite ako). Na dôkaz kladnej definitnosti si stačí uvedomiť, že f(x)2 ≥ 0 pre každé x ∈ a, b a pre f = 0 (t. j. f nie identicky rovné nule) zo spojitosti funkcie f (teda aj f2 ) vyplýva existencia nejakého netriviálneho uzavretého podintervalu a1, b1 ⊆ a, b takého, že f(x)2 > 0 pre všetky x ∈ a1, b1 . Keďže f2 na a1, b1 nadobúda minimum m = mina1≤x≤b1 f(x)2 > 0, máme f, f = b a f(x)2 dx ≥ b1 a1 f(x)2 dx ≥ (b1 − a1)m > 0. Teda predpisom (f, g) → f, g je definovaný skalárny súčin na C a, b ako aj na jeho ľubovoľnom lineárnom podpriestore, napr. na priestoroch polynómov R[x], R(n) [x], n ∈ N, uvažovaných ako spojité funkcie na a, b . V prípade priestorov C a, b , či R[x] ide o skalárny súčin na nekonečnorozmerných vektorových priestoroch. Norma spojitej funkcie f : a, b → R potom je f = f, f = b a f(x)2 dx 1/2 . 13.2. Gramova matica a Cauchyho-Schwartzova nerovnosť 255 13.2 Gramova matica a Cauchyho-Schwartzova nerovnosť Nech ααα = (uuu1, . . . ,uuuk) je ľubovoľná usporiadaná k-tica vektorov vo vektorovom priestore V so skalárnym súčinom. Takmer všetky podstatné informácie o týchto vektoroch sú ukryté v tzv. Gramovej matici GGG(ααα) = GGG(uuu1, . . . ,uuuk) = uuui,uuuj k×k vektorov uuu1, . . . ,uuuk. Determinant Gramovej matice detGGG(ααα) = |GGG(uuu1, . . . ,uuuk)| = uuu1,uuu1 . . . uuu1,uuuk ... ... ... uuuk,uuu1 . . . uuuk,uuuk sa nazýva Gramovým determinantom vektorov uuu1, . . . ,uuuk. 13.2.1. Tvrdenie. Nech uuu1, . . . ,uuuk sú ľubovoľné vektory vo vektorovom priestore V so skalárnym súčinom. Potom (a) GGG(uuu1, . . . ,uuuk) je kladne semidefinitná symetrická matica; (b) vektory uuu1, . . . ,uuuk sú lineárne nezávislé práve vtedy, keď matica GGG(uuu1, . . . ,uuuk) je kladne definitná. Dôkaz. Označme GGG = GGG(uuu1, . . . ,uuuk). (a) Symetria matice GGG je priamym dôsledkom symetrie skalárneho súčinu. Zostáva dokázať, že pre ľubovoľný vektor ccc = (c1, . . . , ck) ∈ Rk platí ccc·GGG·cccT ≥ 0. Položme vvv = c1uuu1 + . . . + ckuuuk. Potom z bilinearity a kladnej definitnosti skalárneho súčinu vyplýva ccc · GGG · cccT = k i=1 k j=1 cicj uuui,uuuj = vvv,vvv ≥ 0. (b) Ak uuu1, . . . ,uuuk sú lineárne nezávislé, tak tvoria bázu lineárneho podpriestoru S = [uuu1, . . . ,uuuk] ⊆ V . Zúženie skalárneho súčinu xxx,yyy na podpriestor S je skalárny súčin (t. j. kladne definitná symetrická bilineárna forma) na S. GGG je maticou tejto formy vzhľadom na bázu uuu1, . . . ,uuuk, teda je to kladne definitná matica. Ak uuu1, . . . ,uuuk sú lineárne závislé, tak v Rn existuje vektor ccc = (c1, . . . , ck) = 0 taký, že vvv = c1uuu1 + . . . + ckuuuk = 0. Potom podľa (a) ccc · GGG · cccT = vvv,vvv = 0, 0 = 0, teda GGG nie je kladne definitná. Práve dokázané tvrdenie má spolu s vetou 12.2.4 nasledujúci dôsledok. 256 13. Euklidovské priestory 13.2.2. Dôsledok. Pre ľubovoľné uuu1, . . . ,uuuk ∈ V platí |GGG(uuu1, . . . ,uuuk)| ≥ 0. Pritom |GGG(uuu1, . . . ,uuuk)| = 0 práve vtedy, keď vektory uuu1, . . . ,uuuk sú lineárne závislé. Špeciálne pre ľubovoľné dva vektory uuu,vvv ∈ V platí |GGG(uuu,vvv)| = uuu,uuu uuu,vvv vvv,uuu vvv,vvv = uuu,uuu vvv,vvv − uuu,vvv vvv,uuu = uuu 2 vvv 2 − uuu,vvv 2 ≥ 0, pričom rovnosť nastane práve vtedy, keď vektory uuu, vvv sú lineárne závislé. Tým sme dokázali nasledujúci vzťah, známy ako Cauchyho-Schwartzova nerovnosť. 13.2.3. Veta. Pre ľubovoľné vektory uuu,vvv ∈ V v priestore V so skalárnym súčinom platí | uuu,vvv | ≤ uuu vvv , pričom rovnosť nastane práve vtedy, keď vektory uuu, vvv sú lineárne závislé. 13.3 Dĺžka vektora a uhol dvoch vektorov Normou na reálnom vektorovom priestore V rozumieme ľubovoľné zobrazenie V → R, ktoré vektoru xxx ∈ V priradí reálne číslo xxx , nazývané normou alebo tiež dĺžkou vektora xxx, také, že pre všetky xxx,yyy ∈ V a ľubovoľné c ∈ R platí xxx + yyy ≤ xxx + yyy (trojuholníková nerovnosť), cxxx = |c| xxx (pozitívna homogenita), xxx = 0 ⇒ xxx = 0 (oddeliteľnosť). Z uvedených podmienok vyplýva nezápornosť normy, t. j. xxx ≥ 0 pre každé xxx ∈ V . Keďže vďaka pozitívnej homogenite platí 0 = 0 a −xxx = xxx , s použitím trojuholníkovej nerovnosti naozaj dostávame xxx = 1 2 xxx + −xxx ≥ 1 2 xxx − xxx = 1 2 0 = 0. Navyše, vďaka oddeliteľnosti máme xxx > 0 pre každé 0 = xxx ∈ V ; inak povedané, každý nenulový vektor môžeme pomocou jeho normy „oddeliť od nulového vektora. Reálny vektorový priestor s normou nazývame normovaný priestor. Intuitívne sa na normovaný priestor dívame ako na vektorový priestor, v ktorom možno merať dĺžky vektorov. Tri definujúce podmienky pre normu zaručujú, 13.3. Dĺžka vektora a uhol dvoch vektorov 257 že takéto meranie dĺžok, t. j. priradenie xxx → xxx , má rozumné vlastnosti, aké od dĺžok očakávame. Vzdialenosťou bodov xxx, yyy vo vektorovom priestore V s normou · nazývame dĺžku vektora xxx − yyy, t. j. číslo xxx − yyy . Pomocou vzdialeností bodov možno trojuholníkovú nerovnosť vyjadriť iným, ekvivalentným spôsobom, ktorý vari ešte názornejšie osvetľuje jej názov: xxx − yyy + yyy − zzz ≥ xxx − zzz pre všetky xxx,yyy,zzz ∈ V . Všeobecnou problematikou normovaných priestorov sa v tomto kurze nebudeme zaoberať. Obmedzíme sa len na normy, ktoré pochádzajú zo skalárnych súčinov. 13.3.1. Tvrdenie. Nech V je reálny vektorový priestor so skalárnym súčinom. Potom rovnosťou xxx = xxx,xxx je definovaná norma na V . Dôkaz. Zvoľme xxx,yyy ∈ V . S použitím bilinearity a symetrie skalárneho súčinu a Cauchyho-Schwartzovej nerovnosti (veta 13.2.3) dostávame xxx + yyy 2 = xxx + yyy,xxx + yyy = xxx,xxx + xxx,yyy + yyy,xxx + yyy,yyy = xxx 2 + 2 xxx,yyy + yyy 2 ≤ xxx 2 + 2 xxx yyy + yyy 2 = xxx + yyy 2 . To dokazuje trojuholníkovú nerovnosť. Jednoduchý dôkaz ďalších dvoch podmienok prenechávame čitateľovi. Z Cauchyho-Schwartzovej nerovnosti vyplýva, že pre ľubovoľné nenulové vektory xxx, yyy vo vektorovom priestore so skalárnym súčinom platí −1 ≤ xxx,yyy xxx yyy ≤ 1. Preto existuje jediné reálne číslo α také, že 0 ≤ α ≤ π a cos α = xxx,yyy xxx yyy . Číslo α nazývame uhlom alebo tiež odchýlkou vektorov xxx, yyy a značíme ho α = (xxx,yyy). Zo symetrie skalárneho súčinu vyplýva (xxx,yyy) = (yyy,xxx), to znamená, že ide o neorientovaný uhol. Pri takejto definícii uhla dvoch nenulových vektorov zostáva vzťah xxx,yyy = xxx yyy cos (xxx,yyy), 258 13. Euklidovské priestory platný pre štandardný skalárny súčin v R2 a R3 , zachovaný v ľubovoľnom priestore so skalárnym súčinom. Treba si však uvedomiť, že z logického hľadiska postupujeme obrátene ako v stredoškolskej analytickej geometrii. Tam totiž vopred vieme (či aspoň sa tak tvárime), čo sú to dĺžky a uhly vektorov, a pomocou nich definujeme skalárny súčin uvedeným vzťahom, prípadne rovnosťou xxx · yyy = xiyi, kedy musíme uvedený vzťah dokázať. Pri našom postupe vychádzame z pojmu skalárneho súčinu a pomocou neho definujeme dĺžky a uhly vektorov tak, že platnosť klasických poučiek analytickej geometrie zostáva zachovaná, ba dokonca ju rozširujeme na vektorové priestory ľubovoľnej konečnej i nekonečnej dimenzie vybavené skalárnym súčinom. Hovoríme, že vektory xxx,yyy ∈ V sú (navzájom) kolmé alebo tiež ortogonálne, označenie xxx ⊥ yyy, ak xxx,yyy = 0. Teraz uvedieme niekoľko bezprostredných dôsledkov našich definícií. Ich jednoduché dôkazy prenechávame ako cvičenie čitateľovi. 13.3.2. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné nenulové vektory xxx,yyy ∈ V platí: (a) (xxx,yyy) = 0 ⇔ (∃ c ∈ R)(c > 0 & xxx = cyyy); (b) (xxx,yyy) = π ⇔ (∃ c ∈ R)(c < 0 & xxx = cyyy); (c) (xxx,yyy) = π/2 ⇔ xxx ⊥ yyy; (d) (−xxx, −yyy) = (xxx,yyy), (−xxx,yyy) = (xxx, −yyy) = π − (xxx,yyy). Pokračujeme štyrmi poučkami klasickej analytickej geometrie. 13.3.3. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné nenulové vektory xxx,yyy ∈ V platí: (a) (kosinusová veta) xxx + yyy 2 = xxx 2 + yyy 2 + 2 xxx yyy cos (xxx,yyy), xxx − yyy 2 = xxx 2 + yyy 2 − 2 xxx yyy cos (xxx,yyy); (b) (Pytagorova veta) xxx ⊥ yyy ⇒ xxx + yyy 2 = xxx − yyy 2 = xxx 2 + yyy 2 ; (c) (pravidlo rovnobežníka) xxx + yyy 2 + xxx − yyy 2 = 2 xxx 2 + yyy 2 ; (d) (uhlopriečky kosoštvorca sú na seba kolmé) xxx = yyy ⇒ xxx + yyy ⊥ xxx − yyy. (Samozrejme, tvrdenia (b), (c), (d) platia aj bez predpokladu nenulovosti vektorov xxx, yyy – vidno to i z nášho dôkazu.) Dôkaz. (a) Ako sme ukázali v dôkaze tvrdenia 13.3.1, pre ľubovoľné xxx,yyy ∈ V máme xxx + yyy 2 = xxx 2 + yyy 2 + 2 xxx,yyy . 13.4. Ortogonálne a ortonormálne bázy 259 Z toho už okamžite vyplýva prvá podoba kosinusovej vety; jej druhú podobu dostaneme z prvej na základe 13.3.2 (d). (b) Pytagorova veta je zvláštnym prípadom kosinusovej vety (c) Pravidlo rovnobežníka dostaneme sčítaním oboch verzií kosinusovej vety. (d) priamo vyplýva z identity xxx + yyy,xxx − yyy = xxx 2 − yyy 2 . 13.4 Ortogonálne a ortonormálne bázy Usporiadaná k-tica ααα = (uuu1, . . . ,uuuk) vektorov z vektorového priestoru so skalárnym súčinom V sa nazýva ortogonálna, ak uuui ⊥ uuuj pre všetky 1 ≤ i < j ≤ k. Voľne tiež hovoríme, že vektory uuu1, . . . ,uuuk sú (navzájom) ortogonálne alebo kolmé. Usporiadaná k-tica (uuu1, . . . ,uuuk) sa nazýva ortonormálna, ak je ortogonálna a uuui = 1 pre všetky i ≤ k. Taktiež hovoríme, že vektory uuu1, . . . ,uuuk tvoria ortonormálny systém. Podobne možno definovať pojmy ortogonálnosti a ortonormálnosti aj pre nekonečné postupnosti (uuuk)∞ k=0 vektorov z V , prípadne pre množiny X ⊆ V . Nasledujúce tvrdenie je bezprostredným dôsledkom našich definícií. 13.4.1. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľnú k-ticu ααα = (uuu1, . . . ,uuuk) ∈ V k platí: (a) ααα je ortogonálna práve vtedy, keď jej Gramova matica GGG(ααα) je diago- nálna; (b) ααα je ortonormálna práve vtedy, keď GGG(ααα) = IIIk. Z posledného tvrdenia a dôsledku 13.2.2 priamo vyplýva 13.4.2. Dôsledok. Ak uuu1, . . . ,uuuk ∈ V sú navzájom kolmé nenulové vektory, špeciálne, ak uuu1, . . . ,uuuk tvoria ortonormálny systém, tak sú lineárne nezávislé. V priestore Rn so štandardným skalárnym súčinom kanonická báza εεε = (eee1, . . . ,eeen) je zrejme ortonormálna a v zhode s tvrdením 13.4.1 (b) možno ľahko nahliadnuť rovnosť GGG(εεε) = IIIn. Ortogonálne a ortonormálne bázy však existujú v ľubovoľných euklidovských priestoroch. 13.4.3. Veta. Každý euklidovský priestor má ortonormálnu bázu. Dôkaz Nech V je euklidovský priestor. Keďže skalárny súčin je kladne definitná, symetrická bilineárna forma na konečnorozmernom reálnom priestore V , na základe vety 11.3.5, dôsledku 12.1.3 a tvrdenia 12.2.1 existuje taká báza βββ priestoru V , vzhľadom na ktorú má tento súčin jednotkovú maticu. Inak povedané, GGG(βββ) = IIIn, čiže βββ je ortonormálna báza. 260 13. Euklidovské priestory Nasledujúce tvrdenie zhŕňa niekoľko užitočných vlastností ortonormálnych báz v euklidovskom priestore. Podmienky (b) a (c), ktoré sú ekvivalentné, nesú spoločný názov Parsevalova rovnosť..1 13.4.4. Tvrdenie. Nech ααα = (uuu1, . . . ,uuun) je ortonormálna báza euklidovského priestoru V . Potom pre ľubovoné vektory xxx,yyy ∈ V platí: (a) xxx = n i=1 xxx,uuui uuui, t. j. (xxx)ααα = xxx,uuu1 , . . . , xxx,uuun T ; (b) xxx,yyy = n i=1 xxx,uuui uuui,yyy ; (c) xxx 2 = n i=1 xxx,uuui 2 . Dôkaz. (a) Keďže ααα je báza, xxx možno vyjadriť v tvare xxx = n i=1 ciuuui pre jednoznačne určené koeficienty c1, . . . , cn. Z ortonormálnosti vektorov uuu1, . . . ,uuun vyplýva xxx,uuuj = n i=1 ci uuui,uuuj = cj pre každé 1 ≤ j ≤ n. (b) Ak ααα je ortonormálna báza, tak matica skalárneho súčinu vzhľadom na bázu ααα je GGG(ααα) = IIIn. Preto xxx,yyy = (xxx)T ααα · (yyy)ααα pre všetky xxx,yyy ∈ V . Potrebný záver vyplýva z (a). (c) je špeciálnym prípadom (b). Pre istotu ešte si ešte raz zopakujme, čo vyplýva z tvrdenia 13.4.1, vety 13.4.3 a tvrdenia 13.4.4: V ľubovoľnom n-rozmernom euklidovskom priestore V skalárny súčin vektorov xxx,yyy ∈ V splýva so štandardným skalárnym súčinom v Rn xxx,yyy = n i=1 xiyi = (xxx)T ααα · (yyy)ααα ich súradníc (xxx)ααα = (x1, . . . , xn)T , (yyy)ααα = (y1, . . . , yn)T vzhľadom na ľubovoľnú ortonormálnu bázu ααα = (uuu1, . . . ,uuun) priestoru V . Podmienka (a) posledného tvrdenia nám navyše udáva explicitný tvar týchto súradníc: xi = xxx,uuui , yi = yyy,uuui . Teraz popíšeme algoritmus, ktorý umožňuje zostrojiť ortonormálne bázy, známy ako Gramov-Schmidtov ortogonalizačný proces, skrátene GSO-proces. Nech V je vektorový priestor so skalárnym súčinom a uuu1, . . . ,uuun ∈ V sú lineárne nezávislé vektory. Chceme zostrojiť ortogonálne vektory vvv1, . . . ,vvvn tak, aby pre každé k ≤ n platilo [vvv1, . . . ,vvvk] = [uuu1, . . . ,uuuk]. 1 Týmto názvom sa zvyknú označovať aj isté nekonečnorozmerné varianty uvedených rovností. 13.4. Ortogonálne a ortonormálne bázy 261 Ak položíme vvv1 = uuu1, tak samozrejme [vvv1] = [uuu1]. Vektor vvv2 ∈ [uuu1,uuu2] = [vvv1,uuu2] budeme hľadať v tvare vvv2 = avvv1 + buuu2, kde a, b ∈ R. Ak má však platiť [vvv1,vvv2] = [uuu1,uuu2], musí byť b = 0. To najjednoduchšie dosiahneme voľbou b = 1. Navyše vektor vvv2 = uuu2 + avvv1 má byť kolmý na vektor vvv1, t. j. 0 = vvv2,vvv1 = uuu2,vvv1 + a vvv1,vvv1 . Odtiaľ dostávame a = − uuu2,vvv1 vvv1,vvv1 . Predpokladajme, že 2 ≤ k ≤ n a už sme zostrojili ortogonálne vektory vvv1, . . . ,vvvk−1 také, že pre každé 1 ≤ i ≤ k − 1 platí [vvv1, . . . ,vvvi] = [uuu1, . . . ,uuui]. Poučení prípadom k = 2 budeme vektor vvvk ∈ [uuu1, . . . ,uuuk−1,uuuk] = [vvv1, . . . ,vvvk−1,uuuk] hľadať v tvare vvvk = uuuk + a1vvv1 + · · · + ak−1vvvk−1, kde a1, . . . , ak−1 ∈ R. Navyše vektor vvvk musí byť kolmý na každý z vektorov vvvi pre 1 ≤ i ≤ k − 1, čiže 0 = vvvk,vvvi = uuuk,vvvi + k−1 j=1 aj vvvj,vvvi = uuuk,vvvi + ai vvvi,vvvi , lebo podľa nášho predpokladu vvvj,vvvi = 0 pre j = i. Z toho dôvodu ai = − uuuk,vvvi vvvi,vvvi . Tým sme dokázali nasledujúcu vetu. 13.4.5. Veta. Nech V je vektorový priestor so skalárnym súčinom a uuu1, . . . ,uuun ∈ V sú lineárne nezávislé vektory. Vektory vvv1, . . . ,vvvn ∈ V definujeme rekurziou: vvv1 = uuu1 a vvvk = uuuk − k−1 i=1 uuuk,vvvi vvvi,vvvi vvvi, pre 1 < k ≤ n. Potom vvv1, . . . ,vvvn sú ortogonálne vektory a pre každé 1 ≤ k ≤ n platí [vvv1, . . . ,vvvk] = [uuu1, . . . ,uuuk]. Špeciálne, ak uuu1, . . . ,uuun je báza priestoru V , tak vvv1, . . . ,vvvn je ortogonálna báza priestoru V ; potom vektory vvv1 −1 vvv1, . . . , vvvn −1 vvvn tvoria ortonormálnu bázu priestoru V . Poznámka. Gramov-Schmidtov ortogonalizačný proces funguje aj pre nekonečné postupnosti (uuuk)∞ k=0 lineárne nezávislých vektorov v nekonečnorozmernom vektorovom priestore so skalárnym súčinom V . Rekurziou cez množinu všetkých prirodzených čísel vvv0 = uuu0 a vvvk = uuuk − k−1 i=0 uuuk,vvvi vvvi,vvvi vvvi, 262 13. Euklidovské priestory pre k > 0, je i v tomto prípade definovaná ortogonálna postupnosť (vvvk)∞ k=0 taká, že [vvv0, . . . ,vvvk] = [uuu0, . . . ,uuuk] pre každé k ∈ N. Z toho už vyplýva lineárna nezávislosť postupnosti (vvvk)∞ k=0. Ak (uuuk)∞ k=0 bola bázou V , tak (vvvk)∞ k=0 je ortogonálna a vvvk −1 vvvk ∞ k=0 ortonormálna báza vo V . 13.4.6. Príklad. Na základe Sylvestrovho kritéria (veta 12.2.4) ľahko nahliadneme, že symetrická matica AAA = 2 1 −1 1 2 0 −1 0 3 ∈ R3×3 je kladne definitná. To znamená, že predpisom xxx,yyy = xxxT · AAA · yyy je definovaný skalárny súčin na (stĺpcovom) priestore R3 . Aplikáciou GSO-procesu na kanonickú bázu (eee1,eee2,eee3) zostrojíme ortogonálnu bázu (vvv1,vvv2,vvv3) priestoru R3 s uvedeným skalárnym súčinom: vvv1 = eee1 = (1, 0, 0)T , vvv2 = eee2 − eee2,vvv1 vvv1,vvv1 vvv1 = eee2 − 1 2 vvv1 = (−1/2, 1, 0)T , vvv3 = eee3 − eee3,vvv1 vvv1,vvv1 vvv1 − eee3,vvv2 vvv2,vvv2 vvv2 = eee3 + 1 2 vvv1 − 1 3 vvv2 = (2/3, −1/3, 1)T , keďže eee2,vvv1 = 1, vvv1,vvv1 = 2, eee3,vvv1 = −1, eee3,vvv2 = 1/2 a vvv2,vvv2 = 3/2. Ak ešte dopočítame vvv3,vvv3 = 7/3, dostaneme dĺžky jednotlivých vektorov vvv1 = √ 2, vvv2 = 3/2, vvv3 = 7/3. Príslušná ortonormálna báza je potom tvorená vektormi 1 √ 2 vvv1 = 1 √ 2   1 0 0   , 2 3 vvv2 = 1 √ 6 −1 2 0 , 3 7 vvv3 = 1 √ 21 2 −1 3 . 13.4.7. Príklad. Na vektorovom priestore R[x] všetkých reálnych polynómov v premennej x je daný skalárny súčin f, g = 1 −1 f(x)g(x) dx (pozri príklad 13.1.2). Postupnosť (xn )∞ n=0 všetkých mocnín premennej x tvorí bázu v R[x]. GSO-procesom z nej zostrojíme ortogonálnu bázu Ln(x) ∞ n=0 priestoru R[x] – jej prvky sa niekedy nazývajú Legendreove polynómy. Ak si uvedomíme, že xm , xn = 1 −1 xm xn dx = xm+n+1 m + n + 1 1 −1 = 2 m+n+1 , ak m + n je párne, 0, ak m + n je nepárne, 13.4. Ortogonálne a ortonormálne bázy 263 postupne dostaneme L0(x) = 1, L1(x) = x − x, L0 L0, L0 L0(x) = x, L2(x) = x2 − x2 , L0 L0, L0 L0(x) − x2 , L1 L1, L1 L1(x) = x2 − 1 3 , L3(x) = x3 − x3 , L0 L0, L0 L0(x) − x3 , L1 L1, L1 L1(x) − x3 , L2 L2, L2 L2(x) = x3 − 3 5 x, atď. Vidíme, že Ln(x) = xn − . . . je polynóm n-tého stupňa, ktorý pre párne n obsahuje len párne mocniny premennej x a pre nepárne n len nepárne mocniny x. S trochou námahy možno odvodiť explicitné vyjadrenie Ln(x) = n! (2n)! dn dxn (x2 − 1)n . V literatúre sa Legendreovými polynómami zvyčajne nazývajú násobky Pn(x) = 1 2n 2n n Ln(x) = 1 2nn! dn dxn (x2 − 1)n polynómov Ln(x), normované tak, aby pre každé n platilo Pn(1) = 1. Gramovu-Schmidtovu ortogonalizáciu možno alternatívne vykonať len vhodnými úpravami istých matíc. Ak ααα = (uuu1, . . . ,uuun) je lineárne nezávislá n-tica vektorov v priestore so skalárnym súčinom V , tak podľa tvrdenia 13.2.1 (b) jej Gramova matica GGG(ααα) je kladne definitná a je to matica skalárneho súčinu zúženého na lineárny podpriestor S = [uuu1, . . . ,uuun] ⊆ V v báze ααα. Podľa vety 12.2.3 ju možno výlučne úpravami typu (1+ ) upraviť na diagonálny tvar DDD = diag(d1, . . . , dn) s kladnými prvkami na diagonále. Elementárne stĺpcové operácie zodpovedajúce týmto úpravám postupne vykonané na matici IIIn nás privedú k hornej trojuholníkovej matici PPP = (pij) ∈ Rn×n s jednotkami na diagonále, t. j. pii = 1 a pij = 0 pre každé i ≤ n a j < i. Ak položíme ααα · PPP = βββ = (vvv1, . . . ,vvvn), tak PPP = PPPααα,βββ, t. j. PPP je maticou prechodu z bázy βββ do bázy ααα (pozri paragraf 7.5). Potom DDD je maticou skalárneho súčinu zúženého na podpriestor S v báze βββ, teda GGG(βββ) = DDD, takže βββ je ortogonálna báza S. Navyše, vzhľadom na tvar matice PPP, platí vvv1 = uuu1 a vvvk = uuuk + k−1 i=1 pikuuui, 264 13. Euklidovské priestory pre 1 < k ≤ n, z čoho možno ľahko nahliadnuť rovnosti [vvv1, . . . ,vvvk] = [uuu1, . . . ,uuuk] pre všetky k ≤ n. Taktiež normy vektorov vvvk si možno prečítať priamo z matice DDD. Platí totiž dk = vvvk 2 pre každé k ≤ n. Teda príslušná ortonormálna báza je tvorená vektormi (1/ √ d1)vvv1, . . . , (1/ √ dn)vvvn. Tento posledný krok možno samozrejme realizovať úpravami typu (4) matice GGG(βββ) a príslušnými ESO na matici PPP (pozri paragraf 11.3). Ak V = Rm s akýmkoľvek (t. j. nie nutne štandardným skalárnym súčinom), tak po stotožnení bázy ααα s maticou, ktorej stĺpce sú vektory tejto bázy, možno k báze βββ dospieť priamo (t. j. bez matice PPP), vykonaním príslušných ESO na matici ααα. 13.4.8. Príklad. Prepočítajme si ešte raz príklad 13.4.6 práve opísanou metódou. Uvedená matica AAA je zároveň Gramovou maticou GGG(εεε). Najprv pomocou prvku na mieste (1, 1) vynulujeme ostatné prvky prvého riadku i stĺpca. Potom pomocou prvku na mieste (2, 2) vynulujeme prvky na miestach (2, 3) a (3, 2): GGG(εεε) = 2 1 −1 1 2 0 −1 0 3 ≡   2 0 0 0 3/2 1/2 0 1/2 5/2   ≡   2 0 0 0 3/2 0 0 0 7/3   = GGG(βββ). Zrejme šlo o úpravy typu (1+ ). Vykonaním príslušných ESO na jednotkovej matici dostaneme III3 =   1 0 0 0 1 0 0 0 1     1 −1/2 1/2 0 1 0 0 0 1     1 −1/2 2/3 0 1 −1/3 0 0 1   = βββ. Čitateľ by si mal samostatne premyslieť detaily výpočtu. Vidíme, že výsledné matice sa presne zhodujú s výsledkom príkladu 13.4.6. 13.4.9. Príklad. Vráťme sa ešte k príkladu 13.4.7. Bez podrobnejšieho komentára zortogonalizujeme systém (1, x, x2 , x3 ) prvých štyroch mocnín x v R[x]. Postupnými úpravami typu (1+ ) Gramovej matice GGG(1, x, x2 , x3 ) do- 13.4. Ortogonálne a ortonormálne bázy 265 staneme GGG(1, x, x2 , x3 ) =     2 0 2/3 0 0 2/3 0 2/5 2/3 0 2/5 0 0 2/5 0 2/7     ≡     2 0 0 0 0 2/3 0 2/5 0 0 8/45 0 0 2/5 0 2/7     ≡     2 0 0 0 0 2/3 0 0 0 0 8/45 0 0 0 0 8/175     = GGG(L0, L1, L2, L3). Príslušné ESO vykonané na jednotkovej matici dávajú III4 =     1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1         1 0 −1/3 0 0 1 0 0 0 0 1 0 0 0 0 1         1 0 −1/3 0 0 1 0 −3/5 0 0 1 0 0 0 0 1     = PPP. Potom (L0, L1, L2, L3) = 1, x, x2 , x3 · PPP = 1, x, − 1 3 + x2 , − 3 5 x + x3 , rovnako ako v príklade 13.4.7. Pohľad na maticu GGG(L0, L1, L2, L3) nám navyše prezradí normy polynómov Ln(x) pre n ≤ 3: L0 = √ 2, L1 = 2 3 , L2 = 8 45 = 2 3 2 5 , L3 = 8 175 = 2 5 2 7 . Pre normy Legendreových polynómov Pn(x), n ≤ 3, z toho vyplýva P0 = √ 2, P1 = 2 3 , P2 = 2 5 , P3 = 2 7 . 13.4.10. Príklad. V euklidovskom priestore R4 so štandardným skalárnym súčinom je daný lineárny podpriestor S generovaný stĺpcami matice ααα =   0 1 −1 1 1 2 −1 1 0 1 1 0   . 266 13. Euklidovské priestory Nájdeme nejakú ortonormálnu bázu podpriestoru S. Zrejme stĺpce matice ααα sú lineárne nezávislé, teda ααα je bázou S. Jej Gramovu maticu GGG(ααα) = αααT ·ααα upravíme pomocou úprav typu (1+ ) na s ňou kongruentný diagonálny tvar GGG(ααα) = 3 1 2 1 4 1 2 1 3 ≡   3 0 0 0 11/3 1/3 0 1/3 11/3   ≡   3 0 0 0 11/3 0 0 0 40/11   = GGG(βββ). Príslušnými ESO na matici ααα dostaneme ααα =   0 1 −1 1 1 2 −1 1 0 1 1 0      0 1 −1 1 2/3 4/3 −1 4/3 2/3 1 2/3 −2/3       0 1 −12/11 1 2/3 14/11 −1 4/3 6/11 1 2/3 −8/11    = βββ. Ortonormálna báza podpriestoru S je potom tvorená stĺpcami matice βββ vynásobenými prevrátenými hodnotami druhých odmocnín príslušných diagonálnych prvkov matice GGG(βββ), teda vektormi 1 √ 3    0 1 −1 1    , 3 11     1 2/3 4/3 2/3     = 1 √ 33     3 2 4 2     , 11 40    −12/11 14/11 6/11 −8/11    = 1 √ 110    −6 7 3 −4    . 13.5 Ortogonálne matice Videli sme, že z vyjadrenia súradníc vektorov v euklidovských priestoroch vzhľadom na ortonormálne bázy vyplývajú dodatočné výhody, aké nám bázy, ktoré nespĺňajú túto podmienku, neposkytujú. Bude preto zaujímavé preskúmať, ako vyzerajú matice prechodu medzi takýmito bázami. Odpoveď na naznačenú otázku je prekvapivo jednoduchá. Matica AAA ∈ Rn×n sa nazýva ortogonálna, ak platí AAAT · AAA = IIIn, alebo, čo je to isté, AAA−1 = AAAT . Uvedomme si, že prvá podmienka vlastne hovorí, že stĺpce matice AAA tvoria ortonormálnu bázu euklidovského priestoru Rn so štandardným skalárnym súčinom. Potom tiež platí AAA · AAAT = IIIn, teda takisto riadky matice AAA tvoria ortonormálnu bázu v Rn . Z tých dôvodov by bolo vari priliehavejšie nazývať takéto matice ortonormálnymi. Budeme sa však držať zaužívanej terminológie. 13.5. Ortogonálne matice 267 13.5.1. Veta. Nech V je n-rozmerný euklidovský priestor, ααα je ortonormálna a βββ je ľubovoľná báza priestoru V . Potom báza βββ je ortonormálna práve vtedy, keď matica prechodu PPPααα,βββ z bázy βββ do bázy ααα je ortogonálna. Inak povedané, každá matica prechodu medzi ortonormálnymi bázami je ortogonálna, a tiež naopak, každá ortogonálna matica je maticou prechodu medzi ortonormálnymi bázami. Dôkaz. Označme ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) a PPP = PPPααα,βββ. Podľa definície matice prechodu z paragrafu 7.5 a tvrdenia 13.4.4 (a) pre i ≤ n platí sssi(PPP) = (vvvi)ααα = vvvi,uuu1 , . . . , vvvi,uuun T , teda PPP = vvvi,uuuj n×n . Keďže báza ααα je ortonormálna, podľa tvrdenia 13.4.4 (b) má (i, k)-ty prvok matice PPPT · PPP tvar sssi(PPP)T · sssk(PPP) = n j=1 vvvi,uuuj uuuj,vvvk = vvvi,vvvk . Teda matica PPP je ortogonálna, t. j. PPPT ·PPP = IIIn, práve vtedy, keď vvvi,vvvk = δik pre všetky i, k ≤ n, t. j. práve vtedy, keď βββ je ortonormálna báza. Ortogonálne matice možno tiež charakterizovať ako matice, násobenie ktorými zachovávava štandardný skalárny súčin resp. euklidovskú dĺžku vek- torov. 13.5.2. Veta. Nech Rn je stĺpcový euklidovský priestor so štandardným skalárnym súčinom a AAA ∈ Rn×n . Potom nasledujúce podmienky sú ekvi- valentné: (i) AAA je ortogonálna matica; (ii) pre všetky xxx,yyy ∈ Rn platí AAA · xxx,AAA · yyy = xxx,yyy ; (iii) pre všetky xxx ∈ Rn platí AAA · xxx = xxx . Dôkaz. (i) ⇒ (ii) Nech AAA je ortogonálna a xxx,yyy ∈ Rn . Potom AAA · xxx,AAA · yyy = (AAA · xxx)T · (AAA · yyy) = xxxT · AAAT · AAA · yyy = xxxT · IIIn · yyy = xxx,yyy . (ii) ⇒ (i) Z podmienky (ii) pre vektory xxx = eeei, yyy = eeej, kde i, j ≤ n, vyplýva sssi(AAA)T · sssj(AAA) = sssi(AAA),sssj(AAA) = AAA · eeei,AAA · eeej = eeei,eeej = δij, teda AAAT · AAA = IIIn, čiže AAA je ortogonálna. 268 13. Euklidovské priestory (ii) ⇒ (iii) platí triviálne a (iii) ⇒ (ii) je dôsledkom rovnosti xxx,yyy = 1 2 xxx + yyy 2 − xxx 2 − yyy 2 . Podrobnejší popis štruktúry ortogonálnych matíc nám umožnia až niektoré ďalšie poznatky o spektrálnych vlastnostiach matíc a lineárnych zobrazení, ktoré si začneme zadovažovať počnúc kapitolou 18. Ortogonálne matice rádu n ≤ 2 však možno preskúmať celkom elementárnymi prostriedkami. Čísla ±1 sú zrejme jediné dve ortogonálne matice rozmeru 1 × 1. Prvý netriviálny prípad teda nastáva pre n = 2. 13.5.3. Veta. Nech AAA ∈ R2×2 . Potom AAA je ortogonálna práve vtedy, keď je maticou rotácie okolo počiatku, t. j. AAA = cos α − sin α sin α cos α = RRRα pre nejaké α ∈ R, alebo maticou osovej súmernosti podľa osi prechádzajúcej počiatkom, t. j. AAA = cos 2β sin 2β sin 2β − cos 2β = SSSβ pre nejaké β ∈ R. Dôkaz. Nech AAA = ( a b c d ). Potom AAAT · AAA = a c b d · a b c d = a2 + c2 ab + cd ba + dc b2 + d2 , teda podmienka AAAT · AAA = III2, je ekvivalentná s rovnosťami a2 + c2 = 1, ab + cd = 0, b2 + d2 = 1. Prvá z nich je ekvivalentná s existenciou α ∈ R takého, že a = cos α, c = sin α, a tretia s existenciou β ∈ R takého, že b = sin β, d = cos β. Podľa druhej rovnice musí pre ne platiť cos α sin β + sin α cos β = sin(α + β) = 0, t. j. α+β = kπ, kde k ∈ Z. Pre k párne z toho dostávame b = sin β = − sin α, d = cos β = cos α, teda AAA má tvar AAA = cos α − sin α sin α cos α = RRRα. Cvičenia 269 Pre k nepárne máme b = sin β = sin α, d = cos β = − cos α, čo vedie na maticu tvaru AAA = cos α sin α sin α − cos α = SSSα/2. Substitúciou (teraz už iného) β = α/2 dostávame tvar uvedený v znení vety. Cvičenia 13.1. Nech AAA ∈ Rn×k je ľubovoľná matica, ktorú stotožníme s usporiadanou k-ticou vektorov tvorenou jej stĺpcami. Potom v euklidovskom priestore Rn so štandardným skalárnym súčinom pre Gramovu maticu týchto vektorov platí G(AAA) = AAAT · AAA. Dokážte. 13.2. Nech AAA = 2 −1 −1 −1 2 −1 −1 −1 2 . (a) Dokážte, že formulou xxx,yyy = xxxT · AAA · yyy je definovaný skalárny súčin na vektorovom priestore R3 . (b) Vypočítajte dĺžky vektorov eeei bázy εεε = (eee1,eee2,eee3) a uhly medzi nimi vzhľadom na skalárny súčin daný maticou AAA. Skúste potrebné hodnoty vyčítať priamo z matice AAA. (c) GSO-procesom aplikovaným na bázu εεε nájdite ortogonálnu bázu βββ = (vvv1,vvv2,vvv3) euklidovského priestoru R3 . (d) Vypočítajte normy vektorov bázy βββ a nájdite ortonormálnu bázu k báze βββ. 13.3. Dokážte tzv. Besselovu nerovnosť: Ak uuu1, . . . ,uuuk sú ortonormálne vektory v euklidovskom priestore V , tak xxx,uuu1 2 + . . . + xxx,uuuk 2 ≤ xxx 2 pre každé xxx ∈ V . 13.4. Dokážte Cauchyho-Schwartzovu nerovnosť priamo (t. j. bez použitia Gramovej matice a Sylvestrovho kritéria). (Návod: Uvažujte polynóm f(λ) = λuuu + vvv, λuuu + vvv v premennej λ a diskriminant kvadratickej rovnice f(λ) = 0.) 13.5. Dokážte dôsledok 13.4.2 bez použitia tvrdenia 13.4.1, len na základe definície lineárnej nezávislosti a ortogonálnosti vektorov uuu1, . . . ,uuuk. 13.6. Pre xxx = (x1, . . . , xn) ∈ Rn položme xxx 1 = n i=1 |xi, xxx ∞ = max1≤i≤n |xi|. (a) Dokážte, že obe funkcie · 1, · ∞ sú normy na vektorovom priestore Rn . (b) Nájdite príklady potvrdzujúce, že pre n ≥ 2 ani jedna z noriem · 1, · ∞ nespĺňa pravidlo rovnobežníka xxx + yyy 2 + xxx − yyy 2 = 2 xxx 2 + yyy 2 . (c) Odvoďte z toho, že pre n ≥ 2 ani jedna z noriem · 1, · ∞ nepochádza zo skalárneho súčinu. 13.7. Funkcia f : R → R sa nazýva periodická s periódou T > 0, ak pre každé x ∈ R platí f(x + T) = f(x). Nech a < b sú reálne čísla také, že b − a = T. Dokážte, že formulou f, g = b a f(x)g(x) dx je definovaný skalárny súčin na vektorovom priestore všetkých spojitých periodických funkcií f : R → R s periódou T. 13.8. Uvažujte vektorový priestor všetkých periodických spojitých funkcií f : R → R s periódou T = 2π. Dokážte, že postupnosť funkcií 1, cos x, sin x, cos 2x, sin 2x, . . . 270 13. Euklidovské priestory v ňom tvorí ortogonálny systém vzhľadom na skalárny súčin f, g = 2π 0 f(x)g(x) dx. Vypočítajte normy týchto funkcií. 13.9. Dokážte nasledujúce tvrdenia. (a) Ak AAA ∈ Rn×n je ortogonálna matica, tak detAAA = ±1. (b) Ak AAA,BBB ∈ Rn×n sú ortogonálne matice, tak aj matice AAAT , AAA−1 a AAA · BBB sú ortogonálne. 13.10. Doplňte dôkazy implikácií (ii) ⇒ (iii) a (iii) ⇒ (ii) vo vete 13.5.2. 13.11. Analýzou úvah o reprezentácii GSO-procesu maticovými úpravami (pozri text medzi príkladmi 13.4.7 a 13.4.8) dokážte nasledujúci špeciálny prípad tzv. Iwasawovho rozkladu.2 Každú regulárnu maticu AAA ∈ Rn×n možno rozložiť na súčin AAA = PPP ·DDD·TTT, kde PPP ∈ Rn×n je ortogonálna (t. j. jej stĺpce tvoria ortonormálnu bázu v Rn ), DDD ∈ Rn×n je diagonálna kladne definitná a TTT ∈ Rn×n je horná trojuholníková matica s jednotkami na diagonále. 13.12. Nájdite Iwasawove rozklady nasledujúcich matíc: (a) AAA = 1 −1 −2 3 , (b) BBB = 0 1 1 0 , (c) CCC = 0 1 2 1 1 1 −1 2 −3 , (d) DDD = 1 1 1 1 −1 −1 1 −1 −3 . 13.13. (a) Zmodifikujte Gramov-Schmidtov ortogonalizačný proces tak, aby fungoval aj pre lineárne závislé postupnosti vektorov (uuu1, . . . ,uuun). Ako vyzerá takto získaný k-ty vektor vvvk, ak uuuk ∈ [uuu1, . . . ,uuuk−1]? (b) S využitím (a) dokážte reálnu verziu vety o QR-rozklade: Každú maticu AAA ∈ Rm×n , kde m ≥ n, možno rozložiť na súčin AAA = QQQ · RRR, kde QQQ ∈ Rm×m je ortogonálna matica a RRR ∈ Rm×n je horná trojuholníková matica (t. j. rij = 0 pre i > j) s nulovými poslednými m − n riadkami. (Návod: Ortogonalizujte stĺpce matice AAA a nejako si poraďte s nulovými stĺpcami.) (c) Ak stĺpce matice AAA sú lineárne nezávislé, špeciálne, ak AAA ∈ Rn×n je regulárna matica, tak jej QR-rozklad je určený jednoznačne za dodatočnej podmienky, že všetky diagonálne prvky matice RRR sú kladné. Dokážte. 13.14. Nájdite QR-rozklady nasledujúcich matíc a taktiež matíc z cvičenia 13.12: (a) AAA = 1 −2 1/3 7 , (b) BBB = 4 3 −1 1 , (c) CCC = 2 0 1 −1 3 −2 1 1 0 , (d) DDD = 3 1 −2 0 −1 1 . 13.15. (a) Pre Legendreove polynómy Pn(x) z príkladu 13.4.7 odvoďte rekurentný vzťah P0(x) = 1, P1(x) = x a Pn+1(x) = 2n+1 n+1 xPn(x) − n n+1 Pn−1(x) pre n ≥ 1. (b) Dokážte explicitný vzorec Pn(x) = 1 2nn! dn dxn (x2 − 1)n . (c) Vypočitajte normy Legendreových polynómov Pn(x). 13.16. (a) Dokážte, že rovnosťou f, g = ∞ −∞ f(x)g(x) e−x2 dx je definovaný skalárny súčin na istom vektorovom priestore spojitých funkcií f : R → R obsahujúcom všetky 2 Všeobecný prípad sa týka rozkladu prvkov v istých typoch Lieových grúp. Cvičenia 271 polynómy (a okrem nich mnoho ďalších funkcií – o konvergenciu nevlastného integrálu sa postará faktor e−x2 ). (b) Označme (Hn)∞ n=0 postupnosť funkcií, ktorú získame GSO-procesom z postupnosti polynómov (2x)n ∞ n=0 . Vypočítajte prvé štyri členy H0, H1, H2, H3 tejto po- stupnosti. (c) Odvoďte rekurentný vzťah H0(x) = 1, H1(x) = 2x, Hn+1(x) = 2xHn(x) − 2nHn−1(x) pre n ≥ 1, a vypočítajte ďalšie dva členy H4, H5. (d) Na základe (c) zdôvodnite, že funkcia Hn je polynóm n-tého stupňa, ktorý pre párne n obsahuje iba párne a pre nepárne n iba nepárne mocniny premennej x. Funkcie Hn(x) nazývame Hermitove polynómy. (e) Dokážte explicitný vzťah Hn(x) = (−1)n ex2 dn dxn e−x2 a odvoďte z neho podmienku Hn(x) = 2nHn−1(x). (f) Vychádzajúc z rovnosti pre Laplaceov integrál ∞ −∞ e−x2 dx = √ π (pozri cvičenie 14.20) overte, že pre normy Hermitových polynómov platí Hn(x) 2 = 2n n! √ π. 14. Ortogonálne projekcie a podpriestory V tejto kapitole budeme pokračovať v štúdiu euklidovských priestorov s cieľom podať kvantitatívny popis vzájomnej polohy afinných podpriestorov v takomto priestore pomocou dvoch základných parametrov – ich vzdialenosti a odchýlky (uhla). Našim hlavným nástrojom pri tom budú lineárne operátory kolmého priemetu vektorov do lineárnych podpriestorov, zvané tiež ortogonálne projekcie. V druhej časti kapitoly predvedieme tri aplikácie rozpracovaných pojmov a metód: využijeme ich jednak na zavedenie tzv. sférických súradníc v euklidovských priestoroch, jednak pri konštrukcii „najlepších približných riešení neriešiteľných sústav lineárnych rovníc a lineárnej regresii, a napokon sa oboznámime s formuláciu základných pojmov teórie pravdepodobnosti v jazyku euklidovských priestorov. 14.1 Ortokomplement a ortogonálna projekcia Relácia ortogonality (kolmosti) vo vektorovom priestore so skalárnym súčinom má niekoľko zrejmých vlastností, ktoré tu zaznamenáme bez dôkazu. 14.1.1. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné xxx,yyy,zzz ∈ V , c, d ∈ R platí: (a) xxx ⊥ 0; (b) xxx ⊥ xxx ⇔ xxx = 0; (c) xxx ⊥ yyy ⇔ yyy ⊥ xxx; (d) xxx ⊥ yyy & xxx ⊥ zzz ⇒ xxx ⊥ (cyyy + dzzz). Ortogonálnym doplnkom alebo tiež ortokomplementom ľubovoľnej množiny X ⊆ V vo vektorovom priestore so skalárnym súčinom nazveme množinu X⊥ = {yyy ∈ V ; (∀xxx ∈ X)(xxx ⊥ yyy)} všetkých vektorov yyy ∈ V kolmých na každý vektor xxx ∈ X. 14.1.2. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom. Potom pre ľubovoľné množiny X, Y ⊆ V platí: (a) ∅⊥ = {0}⊥ = V , V ⊥ = {0}; (b) X⊥ = [X]⊥ = [X⊥ ]; (c) X ⊆ Y ⇒ Y ⊥ ⊆ X⊥ ; (d) X ⊆ X⊥⊥ ; 14.1. Ortokomplement a ortogonálna projekcia 273 (e) X⊥⊥⊥ = X⊥ ; (f) X ∩ X⊥ = {0}, ak 0 ∈ X, a X ∩ X⊥ = ∅, ak 0 /∈ X; (g) (X ∪ Y )⊥ = X⊥ ∩ Y ⊥ ; (h) ak X, Y sú navyše lineárne podpriestory, tak (X + Y )⊥ = X⊥ ∩ Y ⊥ . Dôkaz. Jednotlivé podmienky sú priamymi dôsledkami predošlého tvrdenia, ich jednoduché dôkazy preto prenechávame ako cvičenie čitateľovi. Na ukážku predvedieme, ako vyplýva (e) z podmienok (c) a (d). Podľa (d) platí X ⊆ X⊥⊥ , z čoho podľa (c) vyplýva X⊥⊥⊥ ⊆ X⊥ . Obrátená inklúzia X⊥ ⊆ X⊥⊥⊥ je opäť dôsledkom (d). Z podmienky (b) okrem iného vyplýva, že X⊥ je lineárnym podpriestorom vo V pre každú podmnožinu X ⊆ V . Nech S ⊆ V je lineárny podpriestor priestoru so skalárnym súčinom V a xxx ∈ V . Hovoríme, že vektor zzz ∈ S je kolmým priemetom alebo tiež ortogonálnou projekciou vektora xxx do podpriestoru S, ak xxx −zzz ∈ S⊥ . Tento vektor (ak existuje) budeme značiť zzz = prS(xxx) = xxxS. 14.1.3. Veta. Nech V je vektorový priestor so skalárnym súčinom, S ⊆ V je jeho konečnorozmerný lineárny podpriestor a xxx ∈ V . Potom (a) kolmý priemet vektora xxx do podpriestoru S existuje a je jednoznačne určený rovnosťou prS(xxx) = xxxS = k i=1 xxx,uuui uuui, kde (uuu1, . . . ,uuuk) je ľubovoľná ortonormálna báza podpriestoru S; (b) pre ľubovoľný vektor yyy ∈ S platí xxx − xxxS ≤ xxx − yyy , pričom rovnosť nastane práve vtedy, keď yyy = xxxS; (c) ak xxx = 0 a S = {0}, tak pre ľubovoľný vektor 0 = yyy ∈ S platí xxxS xxx ≥ | xxx,yyy | xxx yyy , pričom rovnosť nastane práve vtedy, keď vektory xxxS, yyy sú lineárne závislé. Dôkaz (a) Nech (uuu1, . . . ,uuuk) je ľubovoľná ortonormálna báza podpriestoru S. Ak má kolmý priemet vektora xxx do S existovať, musí mať tvar xxxS = c1uuu1 + . . . + ckuuuk pre nejaké c1, . . . , ck ∈ R. Podmienka xxx −xxxS ∈ S⊥ je podľa 274 14. Ortogonálne projekcie a podpriestory predchádzajúceho tvrdenia ekvivalentná s konjunkciou podmienok xxx − xxxS ⊥ uuui pre každé i ≤ k. Z toho vyplýva 0 = xxx − xxxS,uuui = xxx,uuui − k j=1 ci uuuj,uuui = xxx,uuui − ci, teda lineárna kombinácia c1uuu1 +. . .+ckuuuk je kolmým priemetom xxx do S práve vtedy, keď ci = xxx,uuui , pre každé i. (b) Nech yyy ∈ S. Potom tiež xxxS − yyy ∈ S, teda (xxx − xxxS) ⊥ (xxxS − yyy). Podľa Pytagorovej vety platí xxx − yyy 2 = (xxx − xxxS) + (xxxS − yyy) 2 = xxx − xxxS 2 + xxxS − yyy 2 ≥ xxx − xxxS 2 , pričom rovnosť nastane práve vtedy, keď yyy = xxxS. (c) Pre yyy ∈ S máme (xxx − xxxS) ⊥ yyy, preto xxx,yyy = xxxS,yyy + xxx − xxxS,yyy = xxxS,yyy . Ak yyy = 0, tak s použitím Cauchyho-Schwartzovej nerovnosti z toho dostávame | xxx,yyy | xxx yyy = | xxxS,yyy | xxx yyy ≤ xxxS yyy xxx yyy = xxxS xxx . Rovnosť zrejme nastane práve vtedy, keď vektory xxxS, yyy sú lineárne závislé. Podmienka (a) práve dokázanej vety má nasledujúci dôsledok. 14.1.4. Dôsledok. Nech V je vektorový priestor so skalárnym súčinom a S, T ⊆ V sú jeho konečnorozmerné lineárne podpriestory. Potom (a) V = S ⊕ S⊥ , S = S⊥⊥ , (S ∩ T)⊥ = S⊥ + T⊥ ; (b) prS : V → V je lineárny operátor; (c) (∀xxx ∈ V )(xxx ∈ S ⇔ prS(xxx) = xxx); (d) Im prS = S a Ker prS = S⊥ ; (e) xxx − xxxS je kolmým priemetom vektora xxx do podpriestoru S⊥ . Lineárny operátor prS nazývame ortogonálnou projekciou na podpriestor S. Poznámka. Ak V je euklidovský priestor, tak veta 14.1.3 a dôsledok 14.1.4 samozrejme platia pre ľubovoľný podpriestor S ⊆ V . Za istých okolností, ktorých rozbor však presahuje rámec lineárnej algebry (tzv. úplnosť priestoru V a uzavretosť podpriestoru S), spomínané výsledky platia aj pre nekonečnorozmerné podpriestory. V cvičeniach 14.4, 14.5 a 14.6 zakaždým uvedieme príklad vektorového priestoru so skalárnym súčinom V a jeho nekonečnorozmerného podpriestoru S = V takého, že S⊥ = {0}. Potom pre žiaden vektor xxx ∈ V S nemôže existovať jeho kolmý priemet do S; rovnako S ⊕ S⊥ = S = V . 14.1. Ortokomplement a ortogonálna projekcia 275 (c) (∀ x ∈ V )(x ∈ S ⇔ prS(x) = x); (d) Im prS = S a Ker prS = S⊥ ; (e) x − xS je kolmým priemetom vektora x do podpriestoru S⊥ . Lineárny operátor prS nazývame ortogonálnou projekciou na podpriestor S. Poznámka. Ak V je euklidovský priestor, tak veta 14.1.3 a dôsledok 14.1.4 samozrejme platia pre ľubovoľný podpriestor S ⊆ V . Za istých okolností, ktorých rozbor však presahuje rámec lineárnej algebry (tzv. úplnosť priestoru V a uzavretosť podpriestoru S), spomínané výsledky platia aj pre nekonečnorozmerné podpriestory. V cvičeniach 4, 5 a 6 zakaždým uvedieme príklad vektorového priestoru so skalárnym súčinom V a jeho nekonečnorozmerného podpriestoru S = V takého, že S⊥ = {0}. Potom pre žiaden vektor x ∈ V S nemôže existovať jeho kolmý priemet do S; rovnako S⊕S⊥ = S = V . x xS x − xS α S Obr. 14.1. Kolmý priemet vektora do lineárneho podpriestoru Predpokladajme, že kolmý priemet vektora x do lineárneho podpriestoru S existuje. Vysvetlíme si, ako možno za tohto predpokladu definovať vzdialenosť aj odchýlku vektora x od každého z podpriestorov S, S⊥ . Situácia je znázornená na obrázku 14.1. Obr. 14.1. Kolmý priemet vektora do lineárneho podpriestoru Predpokladajme, že kolmý priemet vektora xxx do lineárneho podpriestoru S existuje. Vysvetlíme si, ako možno za tohto predpokladu definovať vzdialenosť aj odchýlku vektora xxx od každého z podpriestorov S, S⊥ . Situácia je znázornená na obrázku 14.1. Vektor xxx − xxxS je kolmý na každú priamku v podpriestore S, špeciálne trojuholník tvorený vektormi xxx, xxxS, xxx − xxxS je pravouhlý, s pravým uhlom pri „konci vektora xxxS. Podmienka (b) vety 14.1.3 nás oprávňuje nazvať dĺžku (anglicky distance) vektora xxx − xxxS vzdialenosťou vektora (prípadne bodu) xxx od podpriestoru S. Budeme ju značiť dist(xxx, S) = xxx − xxxS = min{ xxx − yyy ; yyy ∈ S}. Vzhľadom na podmienku (e) dôsledku 14.1.4 je vzdialenosť vektora xxx od podpriestoru S⊥ daná vzťahom dist xxx, S⊥ = xxxS . Podobne, keďže kosinus je na intervale 0, π klesajúca funkcia, podmienka (c) vety 14.1.3 nás oprávňuje nazvať výraz (xxx, S) = arccos xxxS xxx = min{ (xxx,yyy); 0 = yyy ∈ S} odchýlkou vektor xxx = 0 od podpriestoru S = {0}, prípadne uhlom vektora xxx a podpriestoru S. Odchýlka (xxx, S) je teda jednoznačne určená ako také reálne číslo α ∈ 0, π/2 , pre ktoré platí cos α = xxxS xxx , alebo ekvivalentne, sin α = xxx − xxxS xxx . Zrejme opäť ide o neorientovaný uhol. Ak xxxS = 0, tak (xxx, S) = (xxx,xxxS); ak xxxS = 0, t. j. ak xxx ∈ S⊥ , tak samozrejme (xxx, S) = π/2. Ešte si všimnite, 276 14. Ortogonálne projekcie a podpriestory že zatiaľ čo uhol dvoch vektorov nadobúda hodnoty z intervalu 0, π , hodnoty, ktoré nadobúda uhol vektora a podpriestoru, sú obmedzené na interval 0, π/2 . Vzhľadom na podmienku 14.1.3 (c), ak S⊥ = {0}, tak odchýlka vektora xxx = 0 od podpriestoru S⊥ je daná vzťahom xxx, S⊥ = arccos xxx − xxxS xxx = arcsin xxxS xxx . Konečne časť (a) vety 14.1.3 nám dáva priamy návod, ako nájsť kolmý priemet vektora xxx do konečnorozmerného podpriestoru S ⊆ V , a tým aj vzdialenosti dist(xxx, S), dist xxx, S⊥ a odchýlky (xxx, S), xxx, S⊥ – potrebujeme však poznať aspoň jednu ortonormálnu bázu v S. Ak máme k dispozícii len nejakú „obyčajnú bázu podpriestoru S, je potrebné ju najprv ortonormalizovať, až potom možno použiť spomínaný vzorec. Diagonalizáciu Gramovej matice si však môžeme odpustiť, rovnaký výsledok sa totiž z nej dá získať aj priamo. 14.1.5. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom, S je jeho konečnorozmerný lineárny podpriestor s bázou ααα = (uuu1, . . . ,uuuk) a xxx ∈ V . Potom pre ccc = (c1, . . . , ck)T ∈ Rk platí xxxS = c1uuu1 + . . . + ckuuuk práve vtedy, keď ccc je riešením sústavy lineárnych rovníc GGG(ααα) · ccc = xxx,ααα T , kde xxx,ααα označuje riadkový vektor xxx,uuu1 , . . . , xxx,uuuk ∈ Rk . Dôkaz. Pre ccc = (c1, . . . , ck)T ∈ Rk platí xxxS = c1uuu1 + . . . + ckuuuk práve vtedy, keď pre každé i ≤ k máme 0 = xxx − c1uuu1 − . . . − ckuuuk, uuui = xxx,uuui − c1 uuu1,uuui − . . . − ck uuuk,uuui . Inými slovami, ccc musí vyhovovať sústave GGG(ααα)T · ccc = xxx,ααα T . Ale GGG(ααα)T = GGG(ααα) vzhľadom na symetriu Gramovej matice. Vďaka regularite matice GGG(ααα) (ααα je báza S) má táto sústava jediné riešenie. Ešte si všimnime, že rozšírená matica GGG(ααα) | xxx,ααα T uvedenej sústavy je vlastne Gramovou maticou GGG(uuu1, . . . ,uuuk,xxx) rádu k+1, z ktorej sme vynechali posledný riadok. Ak ααα je ortonormálna báza, tak GGG(ααα) = IIIk, t. j. príslušná sústava je už vo vyriešenom tvare ccc = xxx,ααα T , presne v zhode s podmienkou (a) vety 14.1.3. Poznámka. Tvrdenie zostáva bezo zmeny v platnosti, aj keď ααα je ľubovoľný konečný (teda nie nutne lineárne nezávislý) systém generátorov v S. Jediné, 14.1. Ortokomplement a ortogonálna projekcia 277 čo sa zmení, je nejednoznačnosť vyjadrenia kolmého priemetu xxxS = c1uuu1 + . . . + ckuuuk ako lineárnej kombinácie vektorov systému ααα. Samotný kolmý priemet xxxS je, samozrejme, určený jednoznačne. Rozmyslite si, prečo je to tak. 14.1.6. Príklad. V R4 so štandardným skalárnym súčinom je daný vektor xxx = (1, 1, 1, 1)T a rovina S = [uuu,vvv], kde uuu = (0, −1, 0, 1)T , vvv = (1, −2, 1, −3)T . Nájdeme kolmý priemet vektora xxx do roviny S a vypočítame vzdialenosť dist(xxx, S) a odchýlku (xxx, S). Kolmý priemet budeme hľadať v tvare xxxS = cuuu + dvvv, kde (c, d)T ∈ R2 vyhovuje sústave s rozšírenou maticou uuu,uuu vvv,uuu uuu,vvv vvv,vvv xxx,uuu xxx,vvv = 2 −1 −1 15 0 −3 . Jej riešením dostaneme c = −3/29, d = −6/29, teda kolmý priemet vektora xxx do roviny [uuu,vvv] je xxxS = (uuu,vvv) · c d =     0 1 −1 −2 0 1 1 −3     · −3/29 −6/29 = 3 29     −2 5 −2 5     . Ako skúšku správnosti si overte rovnosti xxx − xxxS,uuu = xxx − xxxS,vvv = 0. Pre vzdialenosť resp. odchýlku xxx od S potom dostávame dist(xxx, S) = xxx − xxxS = 7 29 (5, 2, 5, 2)T = 7 29 √ 58, sin (xxx, S) = xxx − xxxS xxx = 7 2·29 √ 58 = 7 √ 58 . S požitím kalkulačky možno zistiť (xxx, S) = arcsin 7 √ 58 ≈ 1, 1659 rad ≈ 66◦ 48 5 . 14.1.7. Príklad. Nech AAA ∈ Rm×n , pričom m ≥ n a h(AAA) = n, t. j. stĺpce matice AAA sú lineárne nezávislé vektory v euklidovskom priestore Rm so štandardným skalárnym súčinom. Označme S ⊆ Rm lineárny podpriestor generovaný stĺpcami matice AAA. Potom ortogonálna projekcia na podpriestor S je lineárny operátor prS : Rm → Rm . Nájdeme jeho maticu BBB = prS εεε,εεε ∈ Rm×m vzhľadom na kanonickú ortonormálnu bázu εεε priestoru Rm . Ak stotožníme maticu AAA s usporiadanou n-ticou jej stĺpcov, tak AAA je bázou S. Podľa tvrdenia 14.1.5 obraz yyy = prS(xxx) vektora xxx ∈ Rm dostaneme v tvare yyy = AAA · ccc, 278 14. Ortogonálne projekcie a podpriestory kde ccc ∈ Rn je (jediné) riešenie sústavy GGG(AAA) · ccc = xxx,AAA T . Uvedomme si, že GGG(AAA) = AAAT · AAA je regulárna matica. Ďalej platí xxx,AAA = xxxT · AAA, čiže xxx,AAA T = AAAT · xxx. Z toho dostávame ccc = GGG(AAA)−1 · xxx,AAA T = AAAT · AAA −1 · AAAT · xxx, yyy = AAA · ccc = AAA · AAAT · AAA −1 · AAAT · xxx. Teda hľadaná matica ortogonálnej projekcie prS je BBB = prS εεε,εεε = AAA · AAAT · AAA −1 · AAAT . 14.2 Vzdialenosť dvoch afinných podpriestorov Nech V je vektorový priestor so skalárnym súčinom a X, Y sú jeho dve neprázdne podmnožiny. Vzdialenosťou množín X, Y vo V nazývame číslo dist(X, Y ) = inf{ xxx − yyy ; xxx ∈ X & yyy ∈ Y }. Problematikou vzdialeností množín v plnom rozsahu sa tu zaoberať nebudeme. Obmedzíme sa len na vzdialenosti konečnorozmerných afinných podpriestorov. Úlohu prevedieme na určenie vzdialenosti vektora od lineárneho podpriestoru. 14.2.1. Lema. Nech V je vektorový priestor so skalárnym súčinom a M, N sú jeho afinné podpriestory. Potom pre ľubovoľné body ppp ∈ M, qqq ∈ M platí: dist(M, N) = dist(ppp − qqq, Dir M + Dir N). Dôkaz. Označme S = Dir M, T = Dir N zamerania podpriestrov M, N. Potom M = ppp + S, N = qqq + T. Podľa definície vzdialenosti platí dist(M, N) = inf (ppp + uuu) − (qqq + vvv) ; uuu ∈ S & vvv ∈ T , dist(ppp − qqq, S + T) = inf (ppp − qqq) − (uuu + vvv) ; uuu ∈ S & vvv ∈ T . Stačí teda overiť rovnosť množín na pravých stranách. Túto jednoduchú úlohu prenechávame ako cvičenie čitateľovi. Hovoríme, že body ppp ∈ M, qqq ∈ N tvoria priečku afinných podpriestorov M, N, ak dist(M, N) = ppp − qqq , t. j. ak sa vzdialenosť podpriestorov M, N realizuje ako dĺžka vektora ppp − qqq. 14.2. Vzdialenosť dvoch afinných podpriestorov 279 14.2.2. Tvrdenie. Nech M, N sú konečnorozmerné afinné podpriestory vektorového priestoru so skalárnym súčinom V . Potom (a) body ppp ∈ M, qqq ∈ N tvoria priečku podpriestorov M, N práve vtedy, keď ppp − qqq ∈ (Dir M + Dir N)⊥ ; (b) pre ľubovoľné body ppp ∈ M, qqq ∈ N a vektory uuu ∈ Dir M, vvv ∈ Dir N platí: body ppp + uuu, qqq + vvv tvoria priečku podpriestorov M, N práve vtedy, keď vektor vvv − uuu je kolmým priemetom vektora ppp − qqq do lineárneho podpriestoru Dir M + Dir N; (c) existujú body ppp ∈ M, qqq ∈ N tvoriace priečku podpriestorov M, N. Dôkaz. (a) je bezprostredným dôsledkom vety 14.1.3 (b) a lemy 14.2.1; (b) priamo vyplýva z (a). Konečne (c) dostaneme z (b) a vety 14.1.3 (a). 14.2.3. Dôsledok. Pre konečnorozmerné afinné podpriestory M, N ⊆ V vektorového priestoru so skalárnym súčinom platí dist(M, N) = 0 práve vtedy, keď M ∩ N = ∅. Podmienky 14.1.3 (a) a 14.2.2 (b) nám spolu s tvrdením 14.1.5 poskytujú priamy návod ako nájsť priečku a vzdialenosť ľubovoľných konečnorozmerných afinných podpriestorov. Ak M = ppp+[uuu1, . . . ,uuum], N = qqq+[vvv1, . . . ,vvvn] sú zadané parametricky, stačí nájsť jedno riešenie ccc = (c1, . . . , cm, cm+1, . . . , cm+n)T ∈ Rm+n sústavy GGG(γγγ) · ccc = ppp − qqq,γγγ T , kde γγγ = (uuu1, . . . ,uuum,vvv1, . . . ,vvvn), a položiť uuu = c1uuu1 + . . . cmuuum, vvv = cm+1vvv1 + . . . + cm+nvvvn. Potom vektor www = uuu + vvv = γγγ · ccc je kolmým priemetom vektora ppp − qqq do lineárneho podpriestoru Dir M + Dir N = [uuu1, . . .uuum,vvv1, . . . ,vvvn] a priečka podpriestorov M, N je tvorená bodmi ppp − uuu, qqq + vvv. V dôsledku toho dist(M, N) = (ppp − uuu) − (qqq + vvv) = ppp − qqq − www . Rozmyslite si, prečo – napriek formulácii tvrdenia 14.1.5 – si nemusíme robiť starosti s lineárnou nezávislosťou vektorov uuu1, . . . ,uuum,vvv1, . . . ,vvvn. 14.2.4. Príklad. V euklidovskom priestore R4 so štandardným skalárnym súčinom nájdeme vzdialenosť rovín M = (1, 1, 2, −2)T + [eee1 + eee2,eee1 + eee2 + eee3], N = (0, 0, 5, −1)T + [eee2 + eee4,eee2 + eee3 + eee4]. 280 14. Ortogonálne projekcie a podpriestory Z príslušných skalárnych súčinov zostavíme (takmer Gramovu) rozšírenú maticu sústavy GGG(γγγ) · ccc = ppp − qqq,γγγ T a upravíme ju na redukovaný stupňovitý tvar     2 2 1 1 2 3 1 2 1 1 2 2 1 2 2 3 2 −1 0 −3     ∼     1 0 0 −1 0 1 0 1 0 0 1 1 0 0 0 0 13/3 −3 −2/3 0     . So zreteľom na poslednú otázku si riešenie sústavy napíšeme vo všeobecnom tvare ccct = (13/3 + t, −3 − t, −2/3 − t, t)T s parametrom t ∈ R. Položme uuut = c1(eee1 + eee2) + c2(eee1 + eee2 + eee3) = (4/3, 4/3, −3 − t, 0)T , vvvt = c3(eee2 + eee4) + c3(eee2 + eee3 + eee4) = (0, −2/3, t, −2/3)T Potom pre každé t ∈ R dvojica bodov pppt = (1, 1, 2, −2)T − uuut = (−1/3, −1/3, 5 + t, −2)T t = (0, 0, 5, −1)T + vvvt = (0, −2/3, 5 + t, −5/3)T tvorí priečku podpriestorov M, N. Vektory uuut + vvvt = (4/3, 2/3, −3, −2/3)T , pppt − qqqt = 1 3 (−1, 1, 0, −1)T však od parametra t nezávisia (a nie je to náhoda), rovnako ako vzdialenosť dist(M, N) = pppt − qqqt = 1 √ 3 . Pokiaľ by nás teda zaujímala len vzdialenosť podpriestorov M, N, prípadne by sme chceli nájsť len akúkoľvek ich jednu priečku, skutočne by stačilo použiť iba jedno riešenie ccc uvažovanej sústavy. Ešte si rozmyslite, ako zo získaných výsledkov vyplýva čiastočná rovnobežnosť podpriestorov M, N (pozri paragraf 8.4). 14.3 Odchýlka dvoch afinných podpriestorov Odchýlku alebo uhol dvoch netriviálnych konečnorozmerných afinných podpriestorov vo vektorovom priestrore so skalárnym súčinom V značíme (M, N) a definujeme ju ako odchýlku (Dir M, Dir N) ich zameraní. Stačí teda povedať, čo rozumieme pod odchýlkou alebo uhlom (S, T) dvoch netriválnych 14.3. Odchýlka dvoch afinných podpriestorov 281 konečnorozmerných lineárnych podpriestorov S, T ⊆ V . Pre S ⊆ T alebo T ⊆ S položíme (S, T) = 0. Ak S ∩ T = {0}, kladieme (S, T) = inf{ (xxx,yyy); 0 = xxx ∈ S & 0 = yyy ∈ T}. Ak by sme takýmto spôsobom definovali odchýlku (S, T), aj keď S ∩ T = {0}, ľubovoľný spoločný nenulový vektor xxx ∈ S ∩ T by sa postaral o to, aby platilo (S, T) = (xxx,xxx) = 0, čo nevyzerá príliš rozumne. Preto pokiaľ S ∩ T = {0}, S ⊆ T ani T ⊆ S, položíme S1 = S ∩ (S ∩ T)⊥ , T1 = T ∩ (S ∩ T)⊥ . Zrejme S1, T1 ⊆ V sú netriválne lineárne podpriestory a S1 ∩ T1 = {0} (za predpokladu S ∩ T = {0} dokonca platí S1 = S, T1 = T). Preto môžeme konečne definovať (S, T) = (S1, T1). Takto definovaný uhol podpriestorov S, T je číslo z intervalu 0, π/2 a platí preň (S, T) = (T, S), teda je to neorientovaný uhol. Je užitočné si uvedomiť, že na výpočet odchýlky dvoch podpriestorov stačí minimalizovať odchýlku vhodných vektorov z jedného podpriestoru od druhého z nich. 14.3.1. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom a S, T sú jeho konečnorozmerné lineárne podpriestory, pričom S ⊆ T ani T ⊆ S. Potom (S, T) = inf (xxx, T); 0 = xxx ∈ S ∩ (S ∩ T)⊥ . Dôkaz. Pre ľubovoľné xxx = 0 je xxxT ∈ T a xxx − xxxT ∈ T⊥ . Pre xxx ∈ S ∩ (S ∩ T)⊥ však platí xxxT = xxx − (xxx − xxxT ) ∈ (S ∩ T)⊥ + T⊥ = (S ∩ T)⊥ , lebo z inklúzie S ∩T ⊆ T podľa podmienky 14.1.2 (c) vyplýva T⊥ ⊆ (S ∩T)⊥ . Teda xxxT ∈ T ∩ (S ∩ T)⊥ , preto (S, T) je menšia alebo rovná, ako výraz na pravej strane. Keďže arccos je klesajúca funkcia, opačná nerovnosť je dôsledkom rovnosti (xxx, T) = arccos xxxT xxx −1 a vety 14.1.3 (c). Výpočet odchýlky dvoch všeobecných konečnorozmerných podpriestorov si teda vyžaduje minimalizovať hodnotu istého výrazu. To naznačuje možnosť jej výpočtu s použitím diferenciálneho počtu ako extrému funkcie viac premenných. Nebudeme sa však púšťať touto cestou, lebo neskôr hodláme predviesť elegantnejší spôsob vyjadrenia odchýlky. Prostriedkami, ktoré máme 282 14. Ortogonálne projekcie a podpriestory zatiaľ k dispozícii, dokážeme zrátať len odchýlku ľubovoľného netriviálneho konečnorozmerného podpriestoru od priamky alebo nadroviny, prípadne odchýlky podpriestorov, ktoré možno na tieto prípady previesť. Ako vyplýva z vety 14.1.3 (c), odchýlka priamky [xxx], kde xxx = 0, a konečnorozmerného lineárneho podpriestoru S = {0} je daná vzťahom [xxx], S = (xxx, S) = arccos xxxS xxx = (xxx,xxxS), ak xxxS = 0, t. j. ak xxx /∈ S⊥ , π/2, ak xxxS = 0, t. j. ak xxx ∈ S⊥ . Túto úlohu už vieme riešiť (pozri tvrdenie 14.1.5 a príklad 14.1.6). 14.3.2. Príklad. Vypočítame odchýlku rovín M, N ⊆ R4 z príkladu 14.2.4. Podľa definície (M, N) = (S, T), kde S = [eee1 +eee2,eee1 +eee2 +eee3], T = [eee2 + eee4,eee2+eee3+eee4]. Ľahko nahliadneme, že S∩T = [eee3], teda (S∩T)⊥ = [eee1,eee2,eee4]. V dôsledku toho S1 = S ∩ (S ∩ T)⊥ = [eee1 + eee2], T1 = T ∩ (S ∩ T)⊥ = [eee2 + eee4]. Keďže eee1 + eee2,eee2 + eee4 = 1 ≥ 0 a eee1 + eee2 = eee2 + eee4 = √ 2, (M, N) = (eee1 + eee2, eee2 + eee4) = arccos 1 2 = π 3 = 60◦ . Podľa dôsledku 14.1.4 (a) má každý (n−1)-rozmerný lineárny podpriestor S v n-rozmernom euklidovskom priestore V tvar S = [aaa]⊥ pre vhodný nenulový vektor aaa ∈ V ; potom každá nadrovina N ⊆ V so zameraním S má tvar N = ppp + [aaa]⊥ pre nejaké ppp ∈ N. Vektor aaa sa nazýva normála alebo normálový vektor nadroviny N. Normála nadroviny je zrejme určená jednoznačne až na skalárny násobok. Výpočet odchýlky nadroviny a netriviálneho vlastného afinného podpriestoru možno previesť na výpočet odchýlky normály nadroviny a tohto podpriestoru. Tento prevod sa zakladá na nasledujúcom tvrdení. 14.3.3. Tvrdenie. Nech S je netriviálny, vlastný lineárny podpriestor euklidovského priestoru V a 0 = aaa ∈ V . Potom [aaa]⊥ , S = π 2 − (aaa, S) = aaa, S⊥ . Dôkaz. Keďže druhá rovnosť je zrejmá, stačí dokázať prvú. Podmienky aaaS = 0, aaa ∈ S⊥ a S ⊆ [aaa]⊥ sú ekvivalentné. Podobne, [aaa]⊥ ⊆ S je ekvivalentné s podmienkou S⊥ ⊆ [aaa]. V oboch prípadoch platí [aaa]⊥ , S = 0 = aaa, S⊥ , (aaa, S) = π/2. 14.3. Odchýlka dvoch afinných podpriestorov 283 Nech teda aaaS = 0 a [aaa], S⊥ ani [aaa]⊥ , S nie sú vo vzťahu inklúzie. Označme aaaST kolmý priemet vektora aaaS do podpriestoru T = [aaa]⊥ . Postupne dokážeme rovnosti [aaa]⊥ , S = arccos aaaST aaaS = π 2 − (aaa, S). Prvú z nich dokážme v dvoch krokoch. Najprv si uvedomme, že z dôsledku 14.1.4 (a) vyplýva [aaa]⊥ ∩ S ⊥ = [aaa] + S⊥ , teda aaaS = aaa − (aaa − aaaS) ∈ [aaa] + S⊥ = [aaa]⊥ ∩ S ⊥ . Takže [aaa]⊥ , S ≤ arccos aaaST aaaS −1 na základe tvrdenia 14.3.1. Na dôkaz opačnej nerovnosti stačí podľa toho istého tvrdenia overiť aaaST aaaS ≥ xxxS xxx pre všetky 0 = xxx ∈ [aaa]⊥ ∩ [aaa]⊥ ∩ S ⊥ . Zrejme xxx,aaaS = xxxS,aaaS , lebo xxx−xxxS ∈ S⊥ . Keďže xxx ∈ [aaa]+S⊥ , vektory xxxS, aaaS sú lineárne závislé (rozmyslite si prečo); preto | xxxS,aaaS | = xxxS aaaS . Nakoľko xxx ∈ [aaa]⊥ = T, s použítím vety 14.1.3 (c) z toho vyplýva xxxS xxx = | xxxS,aaaS | xxx aaaS = | xxx,aaaS | xxx aaaS ≤ aaaST aaaS . Druhú rovnosť overíme priamym výpočtom π 2 − (aaa, S) = π 2 − (aaaS,aaa) = π 2 − aaaS, [aaa] = aaaS, [aaa]⊥ = arccos aaaST aaaS . Ako zvláštny prípad pre odchýlku dvoch nadrovín dostávame 14.3.4. Dôsledok. Nech M, N sú dve nadroviny v euklidovskom priestore V s normálami aaa, resp. bbb. Potom (M, N) = (aaa, [bbb]) = min (aaa,bbb), (aaa, −bbb) . V euklidovskom priestore Rn so štandardným skalárnym súčinom vystupuje normálový vektor danej nadroviny priamo v jej (všeobecnej) rovnici. Ak je totiž nadrovina M daná rovnicou a1x1 + . . . + anxn = b, tak aaa = (a1, . . . , an)T = 0 je jej normála a uvedenú rovnicu možno skrátene zapísať v tvare xxx,aaa = b. 284 14. Ortogonálne projekcie a podpriestory 14.3.5. Príklad. V euklidovskom priestore V vypočítame odchýlku roviny S = [uuu,vvv] a nadroviny T = [aaa]⊥ . Podľa tvrdenia 14.3.3 platí (S, T) = π 2 − (aaa, S) = arcsin aaaS aaa . Súradnice c, d kolmého priemetu aaaS = cuuu + dvvv vzhľadom na bázu (uuu,vvv) podpriestoru S získame riešením sústavy GGG(uuu,vvv) · c d = aaa,uuu aaa,vvv podľa Cramerovho pravidla v tvare c = aaa,uuu vvv,uuu aaa,vvv vvv,vvv |GGG(uuu,vvv)| , d = uuu,uuu aaa,uuu uuu,vvv aaa,vvv |GGG(uuu,vvv)| . Spätné dosadenie do vzorca pre odchýlku (S, T) si odpustíme. Tieto vzorce možno zrejmým spôsobom zovšeobecniť aj pre odchýlku k-rozmerného podpriestoru S a priamky, resp. nadroviny. vo V . Pre k ≥ 3 však výpočet pomocou Gramových determinantov už nie je výhodný. 14.3.6. Príklad. Podaktorý čitateľ si možno kladie otázku, prečo sme miesto tvrdenia 14.3.3 nedokázali silnejší výsledok, totiž rovnosť (S, T) + S⊥ , T = π 2 , pre každý netriválny vlastný (teda nie len jednorozmerný) lineárny podpriestor S a každý netriviálny lineárny podpriestor T euklidovského priestoru V . Uvedené tvrdenie, ako aj náš geometrický názor nám totiž napovedajú, že také niečo by malo platiť. O to bizarnejší sa nám preto bude zdať nasledujúci veľmi jednoduchý príklad, ktorý v ľubovoľnej dimenzii n > 3 našu domnienku vyvracia. V euklidovskom priestore Rn so štandardným skalárnym súčinom sú dané lineárne podpriestory S = [eee1,eee2], T = [eee1,eee3]. Zrejme S ∩ T = [eee1], teda S ∩ [eee1]⊥ = [eee2] a T ∩ [eee1]⊥ = [eee3]. V dôsledku toho (S, T) = [eee2], [eee3] = π 2 . Na druhej strane S⊥ = [eee1,eee2]⊥ = [eee3, . . . ,eeen]. Takže S⊥ ∩ T = [eee3], z čoho dostávame S⊥ ∩ [eee3]⊥ = [eee4, . . . ,eeen] a T ∩ [eee3]⊥ = [eee1]. Konečne S⊥ , T = [eee4, . . . ,eeen], [eee1] = π 2 . Teda hodnota súčtu (S, T) + S⊥ , T je tentokrát π, a nie π/2, ako sme očakávali. Voľne povedané, podpriestor T je kolmý tak na podpriestor S, ako aj na jeho ortokomplement S⊥ . Samozrejme, platí tiež S, S⊥ = π/2. 14.4. Polárne a sférické súradnice 285 Obr. 14.2. Polárne súradnice v rovine R2 a sférické súradnice v priestore R3 14.4 Polárne a sférické súradnice Ortonormálne bázy umožňujú zaviesť v euklidovských priestoroch aj iné typy súradníc, ako sme používali doteraz. Polárne súradnice v rovine sú obdobou goniometrického vyjadrenia komplexných čísel. Ak ααα = (uuu1,uuu2) je nejaká ortonormálna báza dvojrozmerného euklidovského priestoru V , tak polárne (prípadne tiež sférické) súradnice vektora xxx ∈ V , so súradnicami (xxx)ααα = (x1, x2)T vzhľadom na bázu ααα, tvorí usporiadaná dvojica (r, θ) reálnych čísel r ≥ 0, −π < θ ≤ π takých, že x1 = r cos θ, x2 = r sin θ. (Rovnako dobre by sme mohli vziať θ z intervalu 0, 2π).) Inak povedané, r = xxx je dĺžka vektora xxx a pre xxx = 0 je θ orientovaný uhol vektorov uuu1, xxx, t. j. uhol, o ktorý treba otočiť vektor uuu1, aby splynul s vektorom r−1 xxx; pri otočení v kladnom zmysle (proti smeru hodinových ručičiek) je θ ≥ 0, v zápornom zmysle θ ≤ 0. Prípad xxx = 0 je singulárny: jeho polárne súradnice tvorí každá usporiadaná dvojica tvaru (0, θ), kde θ ∈ (−π, π . Sférické súradnice v priestore majú názornú geografickú interpretáciu: Nájdeme ich tak, že koncovým bodom daného vektora xxx preložíme „glóbus so stredom v počiatku a polomerom r = xxx , a určíme „zemepisnú dĺžku θ a „zemepisnú šírku ω tohto koncového bodu. Presnejšie, ak ααα = (uuu1,uuu2,uuu3) je nejaká ortonormálna báza trojrozmerného euklidovského priestoru V , tak sférické súradnice vektora xxx ∈ V so súradnicami (xxx)ααα = (x1, x2, x3)T vzhľadom na bázu ααα tvorí usporiadaná trojica (r, θ, ω) reálnych čísel r ≥ 0, −π < θ ≤ π, −1 2 π ≤ ω ≤ 1 2 π takých, 286 14. Ortogonálne projekcie a podpriestory že x1 = r cos θ cos ω, x2 = r sin θ cos ω, x3 = r sin ω. Teda r = xxx je opäť dĺžka vektora xxx. Ak xxx /∈ [uuu3], t. j ak (x1, x2) = (0, 0), tak θ je orientovaný uhol, ktorý zviera vektor uuu1 a kolmý priemet xxxS vektora xxx do roviny S = [uuu1,uuu2], a ω je orientovaný uhol, ktorý zviera tento kolmý priemet a pôvodný vektor xxx.1 Inak povedané, ( xxxS , θ) sú polárne súradnice vektora xxxS ∈ S vzhľadom na ortonormálnu bázu (uuu1,uuu2) roviny S. Priamka [uuu3] je singulárna: ak 0 = xxx ∈ [uuu3], tak θ ∈ (−π, π môže byť ľubovoľné a ω = ±1 2 π, podľa toho, či x3 0; ak xxx = 0, tak aj ω ∈ −π/2, π/2 môže byť ľubovoľné. Ak sa obmedzíme len na sférickú plochu s daným polomerom r a stredom v počiatku, stačí, samozrejme, sférické súradnice bodov na jej povrchu udávať v tvare dvojice „zemepisných súradníc (θ, ω). Pozorný čitateľ v prechode od polárnych k sférickým súradniciam asi zahliadol všeobecnejšiu rekurentnú schému. Ak n ≥ 3 a ααα = (uuu1, . . . ,uuun) je ortonormálna báza n-rozmerného euklidovského priestoru V , tak sférické súradnice vektora xxx ∈ V vzhľadom na bázu ααα tvorí usporiadaná n-tica (r, θ, ω1, . . . , ωn−2) reálnych čísel r ≥ 0, −π < θ ≤ π, −1 2 π ≤ ωi ≤ 1 2 π pre 1 ≤ i ≤ n − 2, takých, že x1 = r cos θ cos ω1 cos ω2 cos ω3 . . . cos ωn−2, x2 = r sin θ cos ω1 cos ω2 cos ω3 . . . cos ωn−2, x3 = r sin ω1 cos ω2 cos ω3 . . . cos ωn−2, x4 = r sin ω2 cos ω3 . . . cos ωn−2, ... xn−1 = r sin ωn−3 cos ωn−2, xn = r sin ωn−2. Inak povedané, r = xxx a pre xxx /∈ [uuun] sú ( xxxS , θ, ω1, . . . , ωn−3) sférické súradníce kolmého priemetu xxxS vektora xxx do nadroviny S = [uuu1, . . . ,uuun−1] vzhľadom na jej ortonormálnu bázu (uuu1, . . . ,uuun−1); ωn−2 je orientovaný uhol vektorov xxxS a xxx. Diskusiu singulárneho prípadu xxx ∈ [uuun] prenechávame ako cvičenie čitateľovi. (Uvedomte si, že singulárny je vlastne celý (n − 2)-rozmerný podpriestor [uuu1,uuu2]⊥ !) Sférické súradnice možno s výhodou použiť pri riešení úloh so sférickou 1 Niekedy sa v sférických súradniciach miesto uhla ω uvažuje uhol π/2 − ω. 14.4. Polárne a sférické súradnice 287 symetriou. Ako príklad môže poslúžiť výpočet n-rozmerných integrálov · · · f(x1, . . . , xn) dx1 . . . dxn cez n-rozmernú guľu B(n) (R) = {xxx ∈ Rn ; xxx ≤ R} s polomerom R v euklidovskom priestore Rn so štandardným skalárnym súčinom.2 Tie totiž možno substitúciou sférických súradníc previesť na integrály tvaru . . . F(r, θ, ω1, . . . , ωn−2) ∂(x1, . . . , xn) ∂(r, θ, ω1, . . . , ωn−2) dr dθ dω1 . . . dωn−2 cez karteziánsky súčin intervalov 0, R × −π, π × −π/2, π/2 n−2 , kde F(r, θ, ω1, . . . , ωn−2) = f(x1, . . . , xn), pričom pôvodné súradnice x1, . . . , xn chápeme ako funkcie sférických súradníc r, θ, ω1, . . . , ωn−2, a výraz ∂(x1,...,xn) ∂(r,θ,ω1,...,ωn−2) označuje tzv. jakobián, t. j. determinant Jacobiho matice sférickej transformácie súradníc      ∂x1 ∂r ∂x1 ∂θ ∂x1 ∂ω1 . . . ∂x1 ∂ωn−2 ∂x2 ∂r ∂x2 ∂θ ∂x2 ∂ω1 . . . ∂x2 ∂ωn−2 ... ... ... ... ... ∂xn ∂r ∂xn ∂θ ∂xn ∂ω1 . . . ∂xn ∂ωn−2      . Priamym výpočtom, ktorý prenechávame ako cvičenie čitateľovi, sa možno presvedčiť, že jakobián sférických súradníc je ∂(x1, . . . , xn) ∂(r, θ, ω1, . . . , ωn−2) = rn−1 cos ω1 cos2 ω2 . . . cosn−2 ωn−2. 14.4.1. Príklad. Vypočítame objem štvorrozmernej gule B(4) (R) v euklidovskom priestore R4 . Tento objem je daný štvorrozmerným integrálom V4(R) = B(4)(R) dx1 dx2 dx3 dx4, Po substitúcii sférických súradníc x1 = r cos θ cos ω1 cos ω2, x2 = r sin θ cos ω1 cos ω2, x3 = r sin ω1 cos ω2, x4 = r sin ω2 2 Sledovanie ďalšieho textu a nasledujúceho príkladu si od čitateľa vyžaduje základné znalosti z integrálneho počtu funkcií viac premenných. 288 14. Ortogonálne projekcie a podpriestory a s využitím Fubiniho vety prejde tento integrál na súčin štyroch jednoduchých integrálov V4(R) = R 0 π −π π/2 −π/2 π/2 −π/2 ∂(x1, x2, x3, x4) ∂(r, θ, ω1, ω2) dr dθ dω1 dω2 = R 0 r3 dr π −π dθ π/2 −π/2 cos ω1 dω1 π/2 −π/2 cos2 ω2 dω2 = r4 4 R 0 θ π −π sin ω1 π/2 −π/2 2ω2 + sin 2ω2 4 π/2 −π/2 = R4 4 · 2π · 2 · π 2 = π2 2 R4 . Poznamenajme, že vychádzajúc zo známych hodnôt V1(R) = 2R, V2(R) = πR2 , možno objemy viacrozmených gúľ B(n) (R) vypočítať aj na základe rekurentného vzťahu Vn+2(R) = 2π R 0 rVn(r) dr = 2π n + 2 R2 Vn(R), využívajúceho zovšeobecnenú integrálnu formulu pre objem rotačných telies. 14.5 Riešenie neriešiteľných sústav a lineárna regresia V celom tomto paragrafe označujú m, n pevné kladné celé čísla. Stĺpcové vektorové priestory Rm a Rn sú vybavené štandardným skalárnym súčinom, takže to sú euklidovské priestory. Nech AAA ∈ Rm×n , bbb ∈ Rm . Uvažujme sústavu lineárnych rovníc AAA · xxx = bbb a označme S = [sss1(AAA), . . . ,sssn(AAA)] lineárny podpriestor v Rm generovaný stĺpcami matice AAA. Podľa Frobeniovej vety naša sústava má nejaké riešenie xxx ∈ Rn práve vtedy, keď bbb ∈ S. Zložky riešenia xxx = (x1, . . . , xn)T ∈ Rn sú potom koeficienty lineárnej kombinácie x1sss1(AAA) + . . . + xnsssn(AAA) = AAA · xxx = bbb. No i v prípade, keď bbb /∈ S, t. j. riešenie sústavy neexistuje, sa môžeme pokúsiť nahradiť jej pravú stranu bbb čo najbližším vektorom podpriestoru S. Takto získaná nová sústava už má riešenie, ktoré môžeme právom považovať za najlepšie možné približné riešenie pôvodnej sústavy. Podľa vety 14.1.3 (b) je najbližší vektor podpriestoru S k vektoru bbb určený jednoznačne, a je to jeho 14.5. Riešenie neriešiteľných sústav a lineárna regresia 289 kolmý priemet bbbS do tohto podpriestoru. Pseudoriešenie neriešiteľnej (hovorí sa tiež preurčenej) sústavy AAA · xxx = bbb teda definujeme ako riešenie (tento raz už istotne riešiteľnej) sústavy AAA · xxx = bbbS. Ak je pôvodná sústava riešiteľná, t. j. ak bbb ∈ S, tak bbbS = bbb a obe sústavy splývajú, takže každé jej pseudoriešenie je priamo riešením pôvodnej sústavy. 14.5.1. Tvrdenie. Nech AAA ∈ Rm×n , bbb ∈ Rm . Potom xxx ∈ Rn je pseudoriešením sústavy AAA · xxx = bbb práve vtedy, keď xxx je riešením sústavy AAAT · AAA · xxx = AAAT · bbb so štvorcovou maticou AAAT · AAA ∈ Rn×n a ľavou stranou AAAT · bbb ∈ Rn . Dôkaz. Najprv si uvedomme, že AAAT · AAA = GGG(sss1(AAA), . . . ,sssn(AAA)) je Gramovou maticou prislúchajúcou stĺpcom matice AAA. Podľa tvrdenia 14.1.5 a za ním nasledujúcej poznámky je lineárna kombinácia x1sss1(AAA)+. . .+xnsssn(AAA) = AAA·xxx kolmým priemetom vektora bbb do podpriestoru S = [sss1(AAA), . . . ,sssn(AAA)], t. j. platí AAA · xxx = bbbS, práve vtedy, keď AAAT · AAA · xxx = AAAT · bbb. Pseudoriešenie preurčenej sústavy AAA · xxx = bbb teda hľadáme ako riešenie zaručene riešiteľnej sústavy AAAT · AAA · xxx = AAAT · bbb. V typickom prípade má pôvodná sústava viac rovníc než neznámych, čiže m > n a AAA je obdĺžniková matica, „vyššia ako širšia . Potom je veľmi pravdepodobné, že štvorcová matica AAAT ·AAA rádu n (ako Gramova matica „malého počtu stĺpcových vektorov v euklidovskom priestore „veľkej dimenzie) je regulárna, teda k nej existuje inverzná matica AAAT · AAA −1 . V takom prípade je pseudoriešenie pôvodnej sústavy určené jednoznačne: xxx = AAAT · AAA −1 · AAAT · bbb. Samozrejme, ak m = n a už samotná matica AAA je regulárna, dostávame AAAT · AAA −1 · AAAT = AAA−1 a xxx = AAA−1 · bbb je priamo jediným riešením pôvodnej sústavy. V úlohách lineárnej regresie máme zadané hodnoty y1, . . . , ym neznámej funkcie f v bodoch x1, . . . , xm jej definičného oboru, získané väčšinou meraním. Funkciu f chceme aproximovať lineárnou kombináciou funkcií f1, . . . , fn, ktoré poznáme, či aspoň sú nám známe ich hodnoty aij = fj(xi) v bodoch x1, . . . , xm. Zvyčajne je m podstatne väčšie ako n. V optimálnom prípade sa nám môže podariť zostrojiť funkciu f = c1f1 +. . .+cnfn priamo ako lineárnu 290 14. Ortogonálne projekcie a podpriestory kombináciu funkcií fj tak, aby f v bodoch xi nadobúdala vopred predpísané hodnoty yi, t. j. yi = f(xi) = n j=1 cjfj(xi) = n j=1 aijcj. Ak označíme AAA = (aij) ∈ Rm×n , yyy = (y1, . . . , ym)T ∈ Rm , ccc = (c1, . . . , cn)T ∈ Rn , vidíme, že vlastne hľadáme riešenie ccc sústavy AAA · ccc = yyy. Táto sústava je v typickom prípade preurčená, teda jej riešenie neexistuje. Úloha lineárnej regresie potom splýva s metódou najmenších štvorcov a spočíva v nájdení takých koeficientov cj, ktoré minimalizujú výraz m i=1 yi − n j=1 aijcj 2 = yyy − AAA · ccc 2 . Toto minimum sa nadobúda pre ccc také, že AAA · ccc = yyyS, kde S je podpriestor v Rm generovaný stĺpcami matice AAA. Inak povedané, hľadanú lineárnu kombináciu dostaneme pre pseudoriešenie ccc sústavy AAA · ccc = yyy. Pre hodnoty pochádzajúce z rozumne postavených praktických úloh je takmer isté, že matica AAAT · AAA je regulárna. V takom prípade ccc = AAAT · AAA −1 · AAAT · yyy, čiže hľadaná lineárna kombinácia f = c1f1 + . . . + cnfn = (f1, . . . , fn) · ccc je určená jednoznačne. Metódu lineárnej regresie, ako aj to, čo približne rozumieme pod „rozumne postavenou úlohou , si ilustrujeme na jednom typickom a dôležitom príklade. 14.5.2. Príklad. V rovine R2 je daných m ≥ 2 bodov (x1, y1), . . . , (xm, ym), získaných meraním hodnôt nejakej neznámej funkcie f vo vybraných bodoch xi jej definičného oboru. Túto funkciu hodláme aproximovať priamkou s rovnicou y = a + bx tak, aby výraz m i=1(yi − a − bxi)2 bol minimálny. Ak si uvedomíme, že funkcia y = a + bx je lineárnou kombináciou konštantnej funkcie y = 1 a identickej funkcie y = x, hneď vidíme, že ide o úlohu lineárnej regresie. Sústava   1 x1 ... ... 1 xxxm   · a b =   y1 ... ym   14.5. Riešenie neriešiteľných sústav a lineárna regresia 291 je okrem triviálneho prípadu, keď všetky body (xi, yi) ležia na jednej priamke, preurčená. Koeficienty a, b teda nájdeme ako pseudoriešenie tejto sústavy. Jej maticu si označíme AAA. Jednoduchý výpočet dáva AAAT · AAA =   m xi xi x2 i   , det AAAT · AAA = m m i=1 x2 i − m i=1 xi 2 = i 0 pre každé x ∈ X (v opačnom prípade môžeme nemožné 3 V takýchto prípadoch zvykneme tiež hovoríme o apriórnom rozdelení pravdepodob- nosti. 294 14. Ortogonálne projekcie a podpriestory elementárne javy z množiny X jednoducho vylúčiť).4 Inak povedané, A = ∅ je jediný nemožný jav A ⊆ X. Náhodnou premennou na pravdepodobnostnom priestore X rozumieme ľubovoľnú funkciu f : X → R. Množina RX všetkých náhodných premenných tvorí vektorový priestor nad poľom R (pozri odstavec 1.6.5). Zrejme dim RX = # X. Vďaka nášmu predpokladu, podľa ktorého p(x) > 0 pre každé x ∈ X, je rovnosťou f, g = x∈X f(x)g(x)p(x), kde f, g sú náhodné premenné, definovaný skalárny súčin na RX . Priestor RX všetkých náhodných premenných je tak euklidovským priestorom. Množina C = f ∈ RX ; (∀ x, y ∈ X)(f(x) = f(y)) všetkých konštantných náhodných premenných tvorí jednorozmerný lineárny podpriestor priestoru RX . Keďže zobrazenie, ktoré reálnemu číslu a priradí konštantnú náhodnú premennú f ∈ RX takú, že f(x) = a pre každé x ∈ X, je lineárny izomorfizmus R ∼= C, môžeme si dovoliť stotožniť toto číslo s príslušnou konštantnou náhodnou premennou. Nakoľko konštantná náhodná premenná 1 tvorí zrejme ortonormálnu bázu podpriestoru C, lineárny operátor prC ortogonálnej projekcie na podpriestor C má tvar E(f) = prC(f) = f, 1 = x∈X f(x)p(x) pre f ∈ RX . Výraz E(f) nazývame strednou alebo aj očakávanou hodnotou náhodnej premennej f (označenie operátora E : RX → RX pochádza z anglického slova expectation). Ortokoplementom podpriestoru C je podľa dôsledku 14.1.4 (d) lineárny podpriestor N = C⊥ = Ker E = {f ∈ RX ; E(f) = 0}, tvorený všetkými náhodnými premennými s nulovou strednou hodnotou. Potom náhodná premenná f −E(f) je kolmým priemetom f ∈ RX do nadroviny N. Disperziou alebo tiež rozptylom náhodnej premennej f ∈ RX nazývame výraz D(f) = f − E(f) 2 . Zrejme platí D(f) = f − E(f) = dist(f, C). 4 Treba poznamenať, že v nekonečnom pravdepodobnostnom priestore X by už takýto predpoklad spôsobil nielen značnú ujmu na všeobecnosti ale i ďalšie vážne ťažkosti. Cvičenia 295 To znamená, že toto číslo, nazývané stredná kvadratická odchýlka prípadne smerodajná odchýlka náhodnej premennej f, udáva akúsi strednú mieru nekonštantnosti f, presnejšie, vzdialenosť f od jej očakávanej hodnoty. Nech f, g ∈ RX sú náhodné premenné s nenulovými disperziami. Ich korelačný koeficient definujeme vzťahom R(f, g) = cos (f − E(f), g − E(g)) = f − E(f), g − E(g) f − E(f) g − E(g) . To znamená, že arccos R(f, g) je uhol, ktorý zvierajú kolmé priemety náhodných premenných f, g do podpriestoru N náhodných premenných s nulovou strednou hodnotou. Špeciálne pre f, g ∈ N je R(f, g) = cos (f, g) = f, g f g . Niekoľko doplňujúcich informácií o „geometrii pravdepodobnosti môže čitateľ nájsť v cvičeniach. Cvičenia 14.1. Doplňte dôkazy tvrdení 14.1.1 a 14.1.2 a dôsledku 14.1.4. 14.2. Nech S, T sú lineárne podpriestory vektorového priestoru V so skalárnym súčinom. Potom podľa podľa 14.1.2 (h) platí (S+T)⊥ = S⊥ ∩T⊥ . Dokážte, že za predpokladu S = S⊥⊥ , T = T⊥⊥ , špeciálne ak S, T sú konečnorozmerné platí aj duálna rovnosť (S ∩ T)⊥ = S⊥ + T⊥ . Je uvedený predpoklad naozaj nevyhnutný? 14.3. Nech V je vektorový priestor so skalárnym súčinom. Dokážte nasledujúce tvrdenia: (a) Kolmý priemet vektora xxx ∈ V do lineárneho podpriestoru S ⊆ V existuje práve vtedy, keď xxx ∈ S + S⊥ . (b) Kolmý priemet do lineárneho podpriestoru S ⊆ V existuje pre každé xxx ∈ V práve vtedy, keď V = S + S⊥ . (c) Pre ľubovoľný lineárny podpriestor S ⊆ V platí S + S⊥ = V ⇔ S = S⊥⊥ . (d) Ak V je euklidovský priestor, tak pre ľubovoľnú podmnožinu X ⊆ V platí [X] = X⊥⊥ . 14.4. (a) Dokážte, že množina 2 všetkých postupností xxx = (xn)∞ n=0 takých, že rad ∞ n=0 x2 n konverguje, tvorí lineárny podpriestor vektorového priestoru RN všetkých postupností N → R. (b) Dokážte, že pre xxx,yyy ∈ 2 rad ∞ n=0 xnyn konverguje. Odvoďte z toho, že formulou xxx,yyy = ∞ n=0 xnyn je definovaný skalárny súčin na vektorovom priestore V = 2. (c) Označme S = [eee0,eee1, ...] lineárny podpriestor priestoru 2, generovaný všetkými vektormi eeen, kde eeen je postupnosť pozostávajúca zo samých núl s výnimkou n-tého člena enn = 1. Nájdite príklad postupnosti aaa ∈ 2 S. Potom S = 2. Dokážte, že 296 14. Ortogonálne projekcie a podpriestory S⊥ = {0}.5 (d) Ako je to s rovnosťami S + S⊥ = V , S = S⊥⊥ a (S ∩ T)⊥ = S⊥ + T⊥ pre T = S⊥⊥ ? 14.5. Riešte rovnaké otázky ako v bodoch (c) a (d) predchádzajúceho cvičenia pre lineárny podpriestor S = R[x] = [1, x, x2 , . . . ] všetkých polynomických funkcií vo vektorovom priestore V = C 0, 1 všetkých spojitých funkcií 0, 1 → R so skalárnym súčinom f, g = 1 0 f(x)g(x) dx. 14.6. Riešte rovnaké otázky ako v bodoch (c) a (d) cvičenia 14.4 pre lineárny podpriestor S = [1, cos x, sin x, cos 2x, sin 2x, . . . ] vektorového priestoru V všetkých periodických spojitých funkcií R → R s periódou 2π. Skalárny súčin na ňom má tvar f, g = 2π 0 f(x)g(x) dx (pozri cvičenie 13.8). 14.7. V každom z nasledujúcich prípadov nájdite kolmý priemet vektora xxx ∈ V do lineárneho podpriestoru S ⊆ V a určte vzdialenosť dist(xxx, S) a odchýlku (xxx, S) (euklidovské priestory Rn sú vybavené štandardným skalárnym súčinom): (a) V = R3 , S = [(2, −1, 0)], xxx = (1, 1, 1); (b) V = R3 , S = [(1, −3, 5)], xxx = (1, 1, 1); (c) V = R3 , S = [(2, −1, 0), (1, −3, 5)], xxx = (1, 1, 1); (d) V = R4 , S = [(1, −2, 0, 3), (1, −3, 5, −2)], xxx = (1, 1, 1, 1); (e) V = R4 , S = {xxx ∈ V ; x1 − x2 − x4 = 0}, xxx = (1, 1, 1, 1). Porovnajte výsledky úloh (a), (b), (c), resp. (d), (e) a vysvetlite rozdiely prípadne zhodu. 14.8. Nech V je ľubovoľný vektorový priestor. Lineárny operátor p : V → V sa nazýva projektor alebo projekcia, ak p ◦ p = p. Za predpokladu, že p : V → V je projekcia, dokážte nasledujúce tvrdenia: (a) lineárny operátor idV −p je tiež projekcia; (b) Im p = {xxx ∈ V ; xxx = p(xxx)} = Ker(idV −p); (c) V = Im p ⊕ Ker p. 14.9. Nech V je vektorový priestor so skalárnym súčinom a p : V → V je projekcia. Hovoríme, že p je ortogonálna projekcia, ak pre všetky xxx,yyy ∈ V platí p(yyy) ⊥ xxx−p(xxx). Dokážte nasledujúce tvrdenia: (a) Ak S ⊆ V je lineárny podpriestor taký, že V = S ⊕ S⊥ , tak lineárny operátor prS : V → V je ortogonálna projekcia. (b) Ak p : V → V je ortogonálna projekcia, tak p = prS pre S = Im p. 14.10. Nech uuu1,uuu2, . . . ,uuun, . . . je ľubovoľná (konečná či nekonečná) postupnosť vektorov vo vektorovom priestore V so skalárnym súčinom. Postupnosť vvv1,vvv2, . . . ,vvvn, . . . definujeme rekurziou vvv1 = uuu1, vvvn+1 = uuun+1 − prSn (uuun+1), kde S = [uuu1, . . . ,uuun] = [vvv1, . . . ,vvvn]. Dokážte, že vektory vvv1,vvv2, . . . ,vvvn, . . . sú ortogonálne, a porovnajte túto konštrukciu s Gramovým-Schmidtovým ortogonalizačným procesom. 14.11. V nasledujúcich úlohách najdite nejakú priečku afinných podpriestorov M, N v euk- 5 V tomto aj v nasledujúcich dvoch cvičeniach, ak rovnosť S⊥ = {0} neviete dokázať (vyžaduje to isté netriviálne poznatky z matematickej analýzy), berte ju ako východiskový postulát pre ďalšie časti. Cvičenia 297 lidovskom priestore V = Rn so štandardným skalárnym súčinom a vypočítajte vzdialenosť dist(M, N) a odchýlku (M, N): (a) V = R3 , M = (1, 1, 1) + [(1, 2, 3)], N = [(1, 0, 1)]; (b) V = R3 , M = (1, 1, 1) + [(1, 2, 3)], N = [(0, 1, 1)]; (c) V = R3 , M = (1, 1, 1) + [(1, 2, 3)], N = [(1, 0, 1), (0, 1, 1)]; (d) V = R4 , M = (1, 1, 1, 1)+[(1, 2, 3, 4), (1, −2, 3, −4)], N = [(0, 1, 0, 1), (1, 0, 3, 0)]; (e) V = R4 , M = (1, 1, 1, 1)+[(1, 2, 3, 4)], N = [(0, 1, 0, 1), (1, 0, 3, 0), (1, −2, 3, −4)]. Porovnajte výsledky úloh (a), (b), (c), resp. (d), (e) a vysvetlite rozdiely prípadne zhodu. 14.12. Nech M je nadrovina v euklidovskom priestore V daná rovnicou xxx,aaa = b, kde aaa ∈ V , b ∈ R, a ppp ∈ V je bod. Odvoďte vzorec pre ich vzdialenosť dist(ppp, M) = ppp,aaa − b / aaa . 14.13. V trojrozmernom euklidovskom priestore je daný pravidelný štvorsten s hranami dĺžky 1. (a) Vypočítajte vzdialenosť jeho vrchola od protiľahlej podstavy. (b) Vyočítajte uhol, ktorý zvierajú (roviny, v ktorých ležia) jeho dve steny. 14.14. V n-rozmernom euklidovskom priestore je daná n-rozmerná (nad)kocka s hranami dĺžky 1. Vypočítajte dĺžku jej (nad)telesovej uhlopriečky a uhol, ktorý zviera so svojou (n − 1)-rozmernou stenou (t. j. s nadrovinou, v ktorej táto stena leží). 14.15. Nech S, T ⊆ V sú vlastné netriviálne lineárne podpriestory v euklidovskom priestore V . Dokážte nasledujúce rovnosti: (a) (S, S⊥ ) = π/2; (b) (S, T⊥ ) = (S⊥ , T); (c) (S⊥ , T⊥ ) = (S, T). 14.16. V euklidovskom priestore R5 (so štandardným skalárnym súčinom) nájdite odchýlku lineárnych podpriestorov S = [eee1,eee2,eee3], T = [4eee3 + 3eee4, 5eee4 + 4eee5, 3eee5 + 5eee3]. 14.17. Nájdite explicitné vyjadrenie pre n-rozmerný objem n-rozmernej gule s polomerom R pre n = 5, 6. 14.18. Podobne ako v prípade objemu preskúmajte (n−1)-rozmerný „plošný obsah (n−1)rozmerného povrchu n-rozmernej gule s polomerom R výpočtom integrálu S(n−1)(R) dx1 . . . dxn cez množinu S(n−1) (R) = {xxx ∈ Rn ; xxx = R} s použitím sférických súradníc. 14.19. Nech α > −1/2 je reálne číslo. S využitím polárnych resp. sférických súradníc vypočítajte určité integrály: (a) B(2)(1) (x2 + y2 )α dx dy, cez jednotkový kruh B(2) (1) = {(x, y) ∈ R2 ; x2 + y2 ≤ 1}, resp. jednotkovú kružnicu A = S(1) (1) = {(x, y) ∈ R2 ; x2 + y2 = 1}; (b) B(3)(1) (x2 + y2 + z2 )α dx dy dz, cez jednotkovú guľu B(3) (1) = {(x, y, z) ∈ R3 ; x2 + y2 + z2 ≤ 1}, resp. jednotkovú sféru A = S(2) (1) = {(x, y, z) ∈ R3 ; x2 + y2 + z2 = 1}. Pokúste o zovšeobecnenie v Rn . V čom je problém pre α ≤ −1/2? 298 14. Ortogonálne projekcie a podpriestory 14.20. Vypočítajte hodnotu Laplaceovho integrálu 6 ∞ −∞ e−x2 dx = √ π. (Návod: Overte rovnosť ∞ −∞ e−x2 dx 2 = R2 e−(x2 +y2 ) dx dy a dvojný integrál vpravo vypočítajte substitúciou pomocou polárnych súradníc.) 14.21. Nájdite pseudoriešenie sústavy m lineárnych rovníc s jednou neznámou x = b1, x = b2, . . . , x = bm. Pekný výsledok, čo vy na to? 14.22. Nájdite minimálne riešenie lineárnej rovnice o n neznámych a1x1 + . . . + anxn = b za predpokladu, že (a1, . . . , an) = 0. 14.23. Za predpokladu, že (a1, a2) = 0, nájdite všetky pseudoriešenia sústavy dvoch rovníc o dvoch neznámych a1x1 + a2x2 = b1, a1x1 + a2x2 = b2 a určte medzi nimi to minimálne. Pokúste sa o zovšeobecnenie na m rovníc o n neznámych. 14.24. Metódou lineárnej regresie postupne aproximujte funkciu f(x), z ktorej poznáte hodnoty f(−3) = 4, f(−2) = 1, f(−1) = 0, f(0) = −2, f(1) = 0, f(2) = −3, f(3) = −5, polynómami f1(x), . . . , f5(x) prvého stupňa až piateho stupňa. Načrtnite ich grafy na intervale −5, 5 a porovnajte ich s grafom interpolačného polynómu f6(x) (pozri cvičenie 10.17). 14.25. Nech AAA ∈ Rm×n . (a) Predpokladajme, že AAAT ·AAA je regulárna matica, a položme AAA¬ = AAAT ·AAA −1 ·AAAT . (b) Predokladajme, že AAA·AAAT je regulárna matica, a položme AAA¬ = AAAT · AAA · AAAT −1 . (c) Dokážte, že v oboch prípadoch (a), (b) sú splnené rovnosti AAA · AAA¬ · AAA = AAA, AAA¬ · AAA · AAA¬ = AAA¬ a obe matice AAA · AAA¬ , AAA¬ · AAA sú symetrické. (d) Dokážte, že pre každú maticu AAA ∈ Rm×n existuje jednoznačne určená matica AAA¬ ∈ Rn×m , ktorá spĺňa podmienky časti (c). Matica AAA¬ sa nazýva MooreovouPenroseovou pseudoinverziou matice AAA (Mooreovou-Penroseovou pseudoinverziou komplexných matíc sa budeme zaoberať v paragrafe 25.2). (e) Sformulujte výsledky o pseudoriešeniach resp. minimálnych riešeniach sústav lineárnych rovníc pomocou Mooreovej-Penroseovej pseudoinverzie matice sústavy. V nasledujúcich cvičeniach X je konečný pravdepodobnostný priestor s pravdepodobnosťou p, pričom p(x) > 0 pre každé x ∈ X. 14.26. Pre náhodné premenné f, g ∈ RX dokážte rovnosti (a) f, g = E(fg), (b) f 2 = E(f2 ), (c) D(f) = E (f − E(f))2 . 14.27. Kovarianciou náhodných premenných f, g ∈ RX nazývame výraz Cov(f, g) = f − E(f), g − E(g) . Dokážte rovnosť Cov(f, g) = E(fg) − E(f)E(g). 14.28. Hovoríme, že náhodné premenné f, g ∈ RX sú nekorelované, ak Cov(f, g) = 0. Dokážte nasledujúce tvrdenia: (a) f, g sú nekorelované práve vtedy, keď f − E(f) ⊥ g − E(g). (b) Ak f, g majú nenulové disperzie, tak f, g sú nekorelované práve vtedy, keď R(f, g) = 0. (c) Cov(f, g)2 ≤ D(f)D(g), pričom rovnosť nastane práve vtedy, keď náhodné premenné f −E(f), g −E(g) sú lineárne závislé. To je ďalej ekvivalentné s podmienkou R(f, g) = ±1. 6 Tento integrál sa zvykne tiež nazývať Gaussovým alebo Poissonovým integrálom. Cvičenia 299 14.29. Uvažujme pravdepodobnostný priestor Zn = {0, 1, . . . , n − 1} s rovnomerným pravdepodobnostným rozdelením p(x) = 1/n pre každé x ∈ Zn. Pre prirodzené číslo a, 1 ≤ a ≤ n, označme fa : Zn → R náhodnú premennú takú, že fa(x) = 1, ak a delí x, a fa(x) = 0 inak. (a) Vypočítajte strednú hodnotu E(fa) a disperziu D(fa). (b) Pre a, b ∈ {1, . . . , n} vypočítajte kovarianciu Cov(fa, fb) a (za predpokladu, že a, b = 1) aj koeficient korelácie R(fa, fb). (c) Dokážte, že náhodné premenné fa, fb sú nekorelované práve vtedy, keď čísla a, b sú nesúdeliteľné a obe delia n alebo aspoň jedno z nich je 1. 15. Objem, orientácia a vektorový súčin Naše zavedenie determinantov v kapitole 10 sme motivovali úvahami o n-rozmernom objeme a orientovanom objeme v priestore Rn , a definíciu determinantu sme potom dostali prenesením formálnych vlastností orientovaného objemu do (stĺpcových) vektorových priestorov Kn nad ľubovoľným poľom K. Prísne vzaté však vo vektorových priestoroch, v ktorých nevieme povedať, ani čo je to dĺžka vektora, nedáva pojem objemu ani orientovaného objemu žiadny zmysel. Na druhej strane, vo vektorovom priestore V so skalárnym súčinom možno pre každé kladné celé číslo k ≤ dim V zmysluplne definovať k-rozmerný objem ako aj orientovaný k-rozmerný objem k-rozmerného rovnobežnostena {a1uuu1 + · · · + akuuuk; a1, . . . , ak ∈ 0, 1 } vytvoreného vektormi uuu1, . . . ,uuuk ∈ V (o skutočne k-rozmerný rovnobežnosten ide samozrejme len vtedy, keď vektory uuu1, . . . ,uuuk sú lineárne nezávislé, inak je to útvar nižšej dimenzie). Práve definícia takýchto objemov a vyjasnenie ich súvisu s determinantmi ako i s tzv. vektorovým súčinom bude náplňou tejto kapitoly. Objemami zložitejších útvarov sa tu zaoberať nebudeme – ich štúdium je predmetom teórie miery a integrálu, ktorá využíva viaceré podstatne hlbšie myšlienky a náročnejšie metódy, než sú tie, s ktorými sme sa doposiaľ zoznámili. 15.1 Objem Pripomeňme si, ako počítame plošný obsah (t. j. dvojrozmerný objem) vol2(uuu,vvv) rovnobežníka vytvoreného vektormi uuu, vvv v R2 alebo v R3 (označenie vol je z anglického volume). Jeden z vektorov, dajme tomu vvv, rozložíme na súčet dvoch zložiek vvv = vvvS + (vvv − vvvS), kde vvvS je kolmý priemet vektora vvv do podpriestoru S = [uuu] a zložka vvv − vvvS je kolmá na uuu. Príslušný obsah potom dostaneme ako súčin dĺžok vol2(uuu,vvv) = uuu vvv − vvvS . Zo zhodnosti trojuholníkov OBB a ACC totiž vyplýva, že rovnobežník OACB a obdĺžnik OAC B majú rovnaký obsah. (Na obrázku vynechávame šípky vektorov.) 15.1. Objem 301 292 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA u vv − vS O A B CCB Obr. 15.1. K definícii plošného obsahu plošného obsahu vol2(u, v) a dĺžky w−wT zložky vektora w kolmej na podpriestor T = [u, v]. Podľa tejto schémy budeme pokračovať aj do vyšších dimenzií. Inak povedané, krozmerný objem rovnobežnostena vytvoreného k vektormi z vektorového priestoru so skalárnym súčinom V budeme definovať ako funkciu volk : V k → R rekurziou cez k. Pre k = 1, u ∈ V kladieme vol1(u) = u , t. j. jednorozmerný objem je jednoducho dĺžka vektora. Ak k > 1 a (k − 1)-rozmerný objem volk−1 už máme definovaný, tak pre u1, . . . , uk−1, uk ∈ V položíme volk(u1, . . . , uk−1, uk) = volk−1(u1, . . . , uk−1) uk − prS(uk) , kde prS(uk) je kolmý priemet vektora uk do podpriestoru S = [u1, . . . , uk−1]. Dôkaz nasledujúceho jednoduchého tvrdenia prenechávame ako cvičenie čitateľovi. 15.1.1. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom a k ≥ 1. Potom pre ľubovoľné vektory u1, . . . , uk ∈ V platí: (a) volk(u1, . . . , uk) ≥ 0, pričom rovnosť nastane práve vtedy, keď u1, . . . , uk sú lineárne závislé; (b) u1, . . . , uk sú ortogonálne práve vtedy, keď volk(u1, . . . , uk) = u1 . . . uk ; (c) ak u1, . . . , uk sú lineárne nezávislé, tak volk(u1, . . . , uk) = volk(v1, . . . , vk) = v1 . . . vk , kde vektory v1, . . . , vk sú získané z vektorov u1, . . . , uk Gramovým-Schmidtovým ortogonalizačným procesom podľa vety 13.4.5. Časť (c) nám dáva priamy návod na výpočet objemu volk(u1, . . . , uk). Stačí utvoriť Gramovu maticu G(u1, . . . , uk) a upraviť ju úpravami typu (1+ ) na diagonálny tvar. Ak sa nám to podarí, tak na diagonále máme druhé mocniny noriem vektorov v1, . . . , vk – stačí teda zobrať druhú odmocninu ich súčinu. Ak sa nám to nepodarí, môže to byť len z toho dôvodu, že vektory u1, . . . , uk nie sú lineárne nezávislé – v takom prípade je objem ich rovnobežnostena 0. Objem volk(u1, . . . , uk) však možno vyjadriť aj bez Gramovho-Schmidtovho ortogonalizačného procesu len pomocou Gramovho determinantu. Obr. 15.1. K definfcii plošného obsahu Podobne, trojrozmerný objem rovnobežnostena vytvoreného vektormi uuu,vvv, www ∈ R3 dostaneme ako súčin vol3(uuu,vvv,www) = vol2(uuu,vvv) www − wwwT plošného obsahu vol2(uuu,vvv) a dĺžky www − wwwT zložky vektora www kolmej na podpriestor T = [uuu,vvv]. Podľa tejto schémy budeme pokračovať aj do vyšších dimenzií. Inak povedané, k-rozmerný objem rovnobežnostena vytvoreného k vektormi z vektorového priestoru so skalárnym súčinom V budeme definovať ako funkciu volk : V k → R rekurziou cez k. Pre k = 1, uuu ∈ V kladieme vol1(uuu) = uuu , t. j. jednorozmerný objem je jednoducho dĺžka vektora. Ak k > 1 a (k − 1)rozmerný objem volk−1 už máme definovaný, tak pre uuu1, . . . ,uuuk−1,uuuk ∈ V položíme volk(uuu1, . . . ,uuuk−1,uuuk) = volk−1(uuu1, . . . ,uuuk−1) uuuk − prS(uuuk) , kde prS(uuuk) je kolmý priemet vektora uuuk do podpriestoru S = [uuu1, . . . ,uuuk−1]. Dôkaz nasledujúceho jednoduchého tvrdenia prenechávame ako cvičenie čitateľovi. 15.1.1. Tvrdenie. Nech V je vektorový priestor so skalárnym súčinom a k ≥ 1. Potom pre ľubovoľné vektory uuu1, . . . ,uuuk ∈ V platí: (a) volk(uuu1, . . . ,uuuk) ≥ 0, pričom rovnosť nastane práve vtedy, keď uuu1, . . . ,uuuk sú lineárne závislé; (b) uuu1, . . . ,uuuk sú ortogonálne práve vtedy, keď volk(uuu1, . . . ,uuuk) = uuu1 . . . uuuk ; (c) ak uuu1, . . . ,uuuk sú lineárne nezávislé, tak volk(uuu1, . . . ,uuuk) = volk(vvv1, . . . ,vvvk) = vvv1 . . . vvvk , kde vektory vvv1, . . . ,vvvk sú získané z vektorov uuu1, . . . ,uuuk Gramovým-Schmidtovým ortogonalizačným procesom podľa vety 13.4.5. 302 15. Objem, orientácia a vektorový súčin Časť (c) nám dáva priamy návod na výpočet objemu volk(uuu1, . . . ,uuuk). Stačí utvoriť Gramovu maticu GGG(uuu1, . . . ,uuuk) a upraviť ju úpravami typu (1+ ) na diagonálny tvar. Ak sa nám to podarí, tak na diagonále máme druhé mocniny noriem vektorov vvv1, . . . ,vvvk – stačí teda zobrať druhú odmocninu ich súčinu. Ak sa nám to nepodarí, môže to byť len z toho dôvodu, že vektory uuu1, . . . ,uuuk nie sú lineárne nezávislé – v takom prípade je objem ich rovnobežnostena 0. Objem volk(uuu1, . . . ,uuuk) však možno vyjadriť aj bez Gramovho-Schmidtovho ortogonalizačného procesu len pomocou Gramovho determinantu. 15.1.2. Veta. Nech V je vektorový priestor so skalárnym súčinom a k ≥ 1. Potom pre ľubovoľné vektory uuu1, . . . ,uuuk ∈ V platí volk(uuu1, . . . ,uuuk) = |GGG(uuu1, . . . ,uuuk)|1/2 . Dôkaz. Ak vektory uuu1, . . . ,uuuk sú lineárne závislé, tak potrebný záver vyplýva z podmienky 15.1.1 (a) a dôsledku 13.2.2. Ak sú lineárne nezávislé, tak podľa predošlej úvahy a vety 12.2.3 spolu s poznámkou, ktorá ju predchádza, existuje horná trojuholníková matica PPP ∈ Rk×k s jednotkami na diagonále, taká, že PPPT · GGG(uuu1, . . . ,uuuk) · PPP = diag vvv1 2 , . . . , vvvk 2 , kde vektory vvv1, . . . ,vvvk sú výsledkom Gramovej-Schmidtovej ortogonalizácie vektorov uuu1, . . . ,uuuk. Keďže |PPP| = |PPPT | = 1, priamym výpočtom s použitím 15.1.1 (c). dostávame volk(uuu1, . . . ,uuuk)2 = vvv1 2 . . . vvvk 2 = diag vvv1 2 , . . . , vvvk 2 = PPPT · GGG(uuu1, . . . ,uuuk) · PPP = |GGG(uuu1, . . . ,uuuk)|. Zámena poradia i-teho a j-teho vektora sa na Gramovej matici GGG(uuu1, . . . ,uuuk) prejaví zámenou i-teho a j-teho stĺpca a zároveň i-teho a j-teho riadku – teda jej determinant, a preto ani objem volk(uuu1, . . . ,uuuk), sa tým nezmení. Doteraz uvažované objemy volk teda možno právom nazvať neorientovanými. 15.2 Orientácia Skôr než sa začneme zaoberať orientovaným objemom v euklidovskom priestore, je potrebné najprv stručne pojednať o orientácii ako takej. Ukazuje sa, že tento pozoruhodný jav nezávisí na skalárnom súčine, ale možno sa s ním stretnúť v ľubovoľnom konečnorozmernom vektorovom priestore nad poľom R. 15.2. Orientácia 303 Nech teda V je reálny vektorový priestor konečnej dimenzie n ≥ 1. Hovoríme, že dve bázy ααα, βββ priestoru V sú súhlasne orientované, ak matica prechodu PPPααα,βββ má kladný determinant. Keďže PPPααα,ααα = IIIn, každá báza je súhlasne orientovaná sama so sebou, t. j. vzťah súhlasnej orientácie je reflexívny. Z rovnosti PPPβββ,ααα = PPP−1 ααα,βββ zasa vyplýva symetria tohto vzťahu. Konečne z rovnosti PPPααα,γγγ = PPPααα,βββ ·PPPβββ,γγγ výplýva, že vzťah súhlasnej orientácie je tranzitívny. Podčiarknuté a zrátané, vzťah súhlasnej orientovanosti je ekvivalenciou na množine všetkých báz priestoru V . Keďže každá matica prechodu je regulárna, jej determinant môže byť len kladný alebo záporný. Tým sa nám množina všetkých báz priestoru V rozpadne na dve disjunktné triedy, z ktorých každá pozostáva so súhlasne orientovaných báz, kým dve bázy patriace do rôznych tried sú orientované nesúhlasne. Orientácia konečnorozmerného reálneho vektorového priestoru V spočíva vo výbere jednej jeho bázy ααα, ktorú prehlásime za kladne orientovanú, rovnako ako všetky bázy orientované súhlasne s ňou – tieto tvoria jednu zo spomínaných tried. Druhá z týchto tried obsahuje bázy orientované nesúhlasne s ααα – nazveme ich záporne orientované bázy. Vektorový priestor, v ktorom sme uskutočnili voľbu nejakej kladne orientovanej bázy nazveme orientovaný. Na konečnorozmernom reálnom vektorovom priestore tak možno zadať dve rôzne, navzájom opačné orientácie. Priestor Rn je prirodzené orientovať tak, aby kanonická báza εεε(n) mala kladnú orientáciu; tejto orientácii Rn hovoríme kanonická. V abstraktnom n-rozmernom priestore, kde nemáme žiadnu privilegovanú bázu, však aj táto pomoc pri voľbe orientácie odpadá – nanajvýš si môžeme hodiť mincou. Orientovateľnosť konečnorozmerného reálneho vektorového priestoru V sa zakladá na tom, že každá nadrovina vo V má „dve strany , t. j. delí V na dva polpriestory, pričom z jedného do druhého sa nemožno dostať spojitým pohybom bez toho, aby sme preťali deliacu nadrovinu. Navyše v euklidovskom priestore V nemožno útvar ležiaci v jednom z polpriestorov previesť na jeho „zrkadlový obraz , t. j. na útvar s ním súmerne združený podľa nadroviny, nijakým zhodným zobrazením, ktoré možno realizovať spojitým pohybom vo V . Intuitívne zodpovedá voľba orientácie priestoru V , t. j. pririeknutie jednej z dvoch možných orientácií nejakej jeho báze ααα = (uuu1, . . . ,uuun), rozdeleniu V nadrovinou [uuu1, . . . ,uuun−1] na dva polpriestory a prehláseniu jedného z nich za kladný a druhého za záporný polpriestor. Podľa toho, do ktorého z nich smeruje vektor uuun, bude i báza ααα kladne alebo záporne orientovaná. Ak napr. prehlásime bázu ααα za kladne orientovanú, bude báza ααα = (uuu1, . . . ,uuun−1, −uuun) orientovaná záporne. Orientácia jednorozmerného priestoru pomocou nejakého vektora (kladne orientovanej bázy) uuu = 0 teda zodpovedá vyznačeniu kladného smeru od 304 15. Objem, orientácia a vektorový súčin počiatku 0, t. j. polpriamky {auuu; 0 < a ∈ R}. Opačná polpriamka {auuu; 0 > a ∈ R} potom vyznačuje záporný smer. V dvojrozmernom priestore sa na zadanie orientácie voľbou kladne orientovanej bázy (uuu1,uuu2) možno dívať aj ako na vyznačenie kladného zmyslu otáčania roviny okolo počiatku 0 od uuu1 k uuu2. Zmysel otáčania od uuu2 k uuu1 je potom záporný, čo sa intuitívne zhoduje s tým, že „opačná báza (uuu2,uuu1) k báze (uuu1,uuu2) zadáva opačnú orientáciu dvojrozmerného priestoru. Vo všeobecnom prípade sú bázy (uuu1, . . . ,uuun) a (uuuσ(1), . . . ,uuuσ(n)), kde σ ∈ SSn, súhlasne orientované práve vtedy, keď σ je párna permutácia (do- kážte). V trojrozmernom priestore zadanie orientácie voľbou nejakej kladne orientovanej bázy zodpovedá napr. výberu pravej alebo ľavej strany. Pri tom môžeme využiť asymetriu našej fyziológie (napr. až na celkom ojedinelé výnimky majú ľudia srdce na ľavej strane, výrazná väčšina populácie sú praváci). Kladnú orientáciu možno fixovať napr. pravidlom pravej ruky: vystretý ukazovák, prostredník zohnutý kolmo k dlani a palec vztýčený kolmo na ich rovinu (v tomto poradí) tvoria kladne orientovanú „bázu . Po stotožnení vektorového priestoru R3 s trojrozmerným fyzikálnym priestorom a smerového vektora eee1 osi x s ukazovákom, smerového vektora eee2 osi y s prostredníkom a smerového vektora eee3 osi z s palcom pravej ruky tak dostávame tzv. pravotočivú súradnú sústavu v R3 . Analogickým spôsobom dostaneme i ľavotočivú súradnú sústavu, ak zadáme kladnú orientáciu v R3 pomocou zrejmého pravidla ľavej ruky. 15. OBJEM, ORIENTÁCIA A VEKTOROVÝ SÚČIN 295 x y z x y z Obr. 15.2. Pravotočivá a ľavotočivá súradná sústava v R3 nú bázu. Výnimkou sú niektoré zákony štatistickej fyziky, menovite zákon rastu entropie, ktorý nepripúšťa obrátenie smeru plynutia času. Otázka, či existujú fyzikálne zákony, ktoré nie sú invariantné voči zrkadlovej reflexii priestoru, bola na všeobecné prekvapenie zodpovedaná kladne v druhej polovici 50. rokov 20. storočia, keď sa experimentálne potvrdilo, že pri tzv. slabých interakciách sa nezachováva parita. Tento výsledok nám samozrejme nehovorí, ktorej z dvoch možných orientácií priestoru by sme mali dať prednosť, ale iba to, že matematický tvar istého fyzikálneho zákona sa môže zmeniť zmenou orientácie priestoru. Voľbou jednej z dvoch možných matematických foriem tohto zákona teda môžeme fixovať orientáciu ” nášho“ trojrozmerného fyzikálneho priestoru aj menej antropomorfným spôsobom než len niektorým z pravidiel pravej alebo ľavej ruky. Neskôr sa zistilo, že pri slabých interakciách dochádza taktiež k (ešte podstatne slabšiemu) narušeniu invariancie voči zrkadlovej reflexii času. Podľa v súčasnosti prevládajúcich kozmologických predstáv práve narušeniu tzv. kombinovanej parity (CP) vďačíme za to, že vo veľmi ranom štádiu vývoja vesmíru vzniklo nepatrne viac baryónov (ťažkých častíc ako napr. protóny a neutróny) než ich Obr. 15.2. Pravotočivá a ľavotočivá súradná sústava v R3 Všetky zákony klasickej fyziky sú invariantné voči zrkadlovej reflexii v priestore aj v čase, to znamená, že ich matematická formulácia sa nezmení, ak v nich vystupujúce veličiny vyjadrené v jednej báze vyjadríme vzhľadom na s ňou nesúhlasne orientovanú bázu. Výnimkou sú niektoré zákony štatistickej fyziky, predovšetkým zákon rastu entropie, ktorý nepripúšťa obrátenie smeru plynutia času. Otázka, či existujú fyzikálne zákony, ktoré nie sú invariantné voči zrkadlovej reflexii priestoru, bola na všeobecné prekvapenie 15.3. Orientovaný objem 305 zodpovedaná kladne v druhej polovici 50. rokov 20. storočia, keď sa experimentálne potvrdilo, že pri tzv. slabých interakciách sa nezachováva parita. Tento výsledok nám samozrejme nehovorí, ktorej z dvoch možných orientácií priestoru by sme mali dať prednosť, ale iba to, že matematický tvar istého fyzikálneho zákona sa môže zmeniť zmenou orientácie priestoru. Voľbou jednej z dvoch možných matematických foriem tohto zákona teda môžeme fixovať orientáciu „nášho trojrozmerného fyzikálneho priestoru aj menej antropomorfným spôsobom než len niektorým z pravidiel pravej alebo ľavej ruky. Neskôr sa zistilo, že pri slabých interakciách dochádza taktiež k (ešte podstatne slabšiemu) narušeniu invariancie voči zrkadlovej reflexii času, ktoré je ekvivalentné narušeniu tzv. kombinovanej parity (CP). Podľa v súčasnosti prevládajúcich kozmologických predstáv práve narušeniu kombinovanej parity vďačíme za to, že vo veľmi ranom štádiu vývoja vesmíru vzniklo nepatrne viac baryónov (ťažkých častíc ako napr. protóny a neutróny) než ich zrkadlových dvojníkov, tzv. antibaryónov, takže postupne nedošlo k úplnej anihilácii všetkej hmoty s antihmotou (presnejšie baryónov s antibaryónmi) na žiarenie, čo teprv umožnilo vznik atómov, hviezd, planét, a napokon i nás samotných. 15.3 Orientovaný objem V našich úvahách o orientovanom objeme sa v tomto paragrafe obmedzíme len na n-rozmerný orientovaný objem v n-rozmernom euklidovskom priestore. Nech teda V je n-rozmerný euklidovský priestor. Vyberme v ňom pevnú ortonormálnu bázu ααα = (uuu1, . . . ,uuun), ktorú prehlásime za kladne orientovanú. Pre ľubovoľnú usporiadanú n-ticu (xxx1, . . . ,xxxn) ∈ V n definujeme n-rozmerný orientovaný objem rovnobežnostena vytvoreného vektormi xxx1, . . . ,xxxn ako de- terminant voln(xxx1, . . . ,xxxn) = xxx1,uuu1 . . . xxxn,uuu1 ... ... ... xxx1,uuun . . . xxxn,uuun matice xxxj,uuui = (xxx1)ααα, . . . , (xxxn)ααα ∈ Rn×n , ktorej stĺpce sú tvorené súradnicami vektorov xxxj v báze ααα (pozri tvrdenie 13.4.4 (a)). Orientovaný objem sme teda definovali ako istý determinant, pričom za jeho jednotku sme zvolili orientovaný objem n-rozmernej kocky vytvorenej vektormi kladne orientovanej ortonormálnej bázy ααα. V euklidovskom priestore Rn so štandardným skalárnym súčinom a kanonickou orientáciou, t. j. pri voľbe ααα = εεε(n) , pre ľubovoľnú maticu AAA ∈ Rn×n platí detAAA = voln(sss1(AAA), . . . ,sssn(AAA)), 306 15. Objem, orientácia a vektorový súčin teda, presne v zhode s kapitolou 10, detAAA je orientovaný n-rozmerný objem rovnobežnostena vytvoreného stĺpcami matice AAA. Taktiež naopak, všetky podstatné vlastnosti orientovaného n-rozmerného objemu možno teraz odvodiť ako bezprostredné dôsledky príslušných vlastností determinantu, takže nemusíme čitateľa unavovať ich vymenúvaním. Zostáva sa presvedčiť, že (1) orientovaný objem nezávisí od výberu konkrétnej kladne orientovanej ortonormálnej bázy ααα (čo prenechávame ako cvičenie čitateľovi); (2) medzi orientovaným a neorientovaným objemom naozaj je očakávaná súvislosť. To sa udeje v nasledujúcej vete (v jej znení i v celom jej dôkaze zvislé zátvorky | | označujú výlučne absolútnu hodnotu, kým determinant dôsledne značíme det). 15.3.1. Veta. Nech V je orientovaný n-rozmerný euklidovský priestor. Potom pre ľubovoľné vektory xxx1, . . . ,xxxn ∈ V platí voln(xxx1, . . . ,xxxn) = voln(xxx1, . . . ,xxxn) ; pričom lineárne nezávislé vektory xxx1, . . . .xxxn tvoria kladne orientovanú bázu vo V práve vtedy, keď voln(xxx1, . . . ,xxxn) > 0. Dôkaz. Nech ααα = (uuu1, . . . ,uuun) je kladne orientovaná ortonormálna báza vo V . Označme XXX =   xxx1,uuu1 . . . xxxn,uuu1 ... ... ... xxx1,uuun . . . xxxn,uuun   . Podľa našej definície je voln(xxx1, . . . ,xxxn) = detXXX. Z tvrdenia 13.4.4 (b) zase vyplýva GGG(xxx1, . . . ,xxxn) = XXXT · XXX. Teda podľa vety 15.1.2 máme voln(xxx1, . . . ,xxxn) = detGGG(xxx1, . . . ,xxxn) = det(XXXT · XXX) = √ detXXXT detXXX = |detXXX| = voln(xxx1, . . . ,xxxn) . Keďže stĺpce matice XXX sú tvorené súradnicami vektorov xxx1, . . . ,xxxn v báze ααα, ak sú tieto lineárne nezávislé, tak XXX je zároveň maticou prechodu z bázy (xxx1, . . . ,xxxn) do bázy ααα (pozri paragraf 7.5). Teda bázy ααα a (xxx1, . . . ,xxxn) sú orientované súhlasne práve vtedy, keď voln(xxx1, . . . ,xxxn) = detXXX > 0. 15.3.2. Dôsledok. Nech V je orientovaný n-rozmerný euklidovský priestor. Potom vektory xxx1, . . . ,xxxn ∈ V sú lineárne nezávislé (t. j. tvoria bázu priestoru V ) práve vtedy, keď voln(xxx1, . . . ,xxxn) = 0. 15.4. Vektorový súčin 307 Orientovaný objem voln(xxx1, . . . ,xxxn) sa zvykne nazývať aj vonkajší súčin vektorov xxx1, . . . ,xxxn a v tejto súvislosti sa značí (((xxx1 . . .xxxn))). V kurze fyziky sa vonkajší súčin (((xxxyyyzzz))) v euklidovskom priestore R3 so štandardným skalárnym súčinom zavádza pomocou skalárneho a vektorového súčinu formulou (((xxxyyyzzz))) = xxx × yyy,zzz = (xxx × yyy) · zzz a zvykne sa tiež nazývať zmiešaný súčin vektorov xxx, yyy, zzz. V nasledujúcom paragrafe si ukážeme, ako je tento súčin „zmiešaný zo skalárneho a vektorového súčinu vo všeobecnom n-rozmernom euklidovskom priestore. Postupovať však budeme opačným smerom – orientovaný objem (t. j. vonkajší súčin) spolu so skalárnym súčinom nám poslúžia ako východisko na definíciu vektorového súčinu. 15.4 Vektorový súčin Predpokladajme i naďalej, že V je orientovaný euklidovský priestor dimenzie n ≥ 2 a ααα = (uuu1, . . . ,uuun) je nejaká jeho kladne orientovaná ortonormálna báza. Nech 0 ≤ k ≤ n a xxx1, . . . ,xxxk ∈ V sú pevne zvolené vektory. Dosadením na prvých k miest orientovaného objemu (vonkajšieho súčinu) tieto vektory definujú vzťahom F(yyy1, . . . ,yyyn−k) = voln(xxx1, . . . ,xxxk,yyy1, . . . ,yyyn−k) = (((xxx1 . . .xxxkyyy1 . . .yyyn−k))) (n − k)-lineárne alternujúce zobrazenie F : V n−k → R. V prípade k = n nám, samozrejme, nezostáva miesto na dosadzovanie ypsilonov, takže F prirodzene stotožňujeme s hodnotou voln(xxx1, . . . ,xxxn) ∈ R; touto otázkou sme sa už zaoberali v predchádzajúcom paragrafe. V tomto paragrafe sa budeme zaoberať prípadom k = n − 1. Pevne zvolené vektory xxx1, . . . ,xxxn−1 definujú vzťahom ψ(yyy) = voln(xxx1, . . . ,xxxn−1,yyy) = (((xxx1 . . .xxxn−1yyy))) lineárny funkcionál ψ : V → R. Uvedomme si, že skalárny súčin je regulárna symetrická bilineárna forma na V . Preto podľa dôsledku 11.1.8 má každý lineárny funkcionál ϕ : V → R tvar ϕ(yyy) = vvv,yyy pre jednoznačne určený vektor vvv ∈ V . Aplikované na náš konkrétny prípad to znamená, že existuje jediný vektor vvv ∈ V taký, že ψ(yyy) = voln(xxx1, . . . ,xxxn−1,yyy) = (((xxx1 . . .xxxn−1yyy))) = vvv,yyy pre všetky yyy ∈ V . Tento jednoznačne určený vektor nazývame vektorovým súčinom, prípadne tiež ortokomplementom vektorov xxx1, . . . ,xxxn−1, a značíme ho vvv = xxx1 × . . . × xxxn−1. 308 15. Objem, orientácia a vektorový súčin Z uvedenej defnície priamo vyplýva, že, rovnako ako orientovaný n-rozmerný objem, ani vektorový súčin nezávisí na výbere konkrétnej kladne orientovanej ortonormálnej bázy vo V . V dimenzii n = 2 ide len o unárnu (jednomiestnu) operáciu V → V – z toho dôvodu nehovoríme o vektorovom súčine ale výlučne o ortokomplemente vektora xxx, ktorý značíme xxx⊥ (keďže znak súčinu × nemáme medzi čo umiestniť). V dimenzii n = 3 ide o binárnu (dvojmiestnu) operáciu V × V → V vektorového súčinu, známeho z kurzov fyziky. No v dimenzii n ≥ 4 je už n − 1 > 2 a vektorový súčin je (n − 1)-miestna operácia na V . Vzťah medzi skalárnym (t. j. vnútorným), vektorovým a vonkajším súčinom zachytáva nasledujúca rovnosť, platná pre ľubovoľné xxx1, . . . ,xxxn−1,xxxn ∈ V , xxx1 × . . . × xxxn−1,xxxn = voln(xxx1, . . . ,xxxn−1,xxxn) = (((xxx1 . . .xxxn−1xxxn))). Čítaná zľava doprava je to už uvedená definícia vektorového súčinu xxx1 ×. . .× xxxn−1 prostredníctvom orientovaného objemu a skalárneho súčinu. Môžeme ju však čítať aj sprava doľava – vtedy sa z nej stáva definícia vonkajšieho súčinu (orientovaného objemu) ako istej kompozície skalárneho a vektorového súčinu. Takto sa bežne postupuje v kurzoch fyziky, kde sa najprv zavedie skalárny a vektorový súčin v dimenzii n = 3 geometrickým spôsobom a zmiešaný (t. j. vonkajší) súčin príde na rad až po nich. Pokúsme sa teraz vyjadriť súradnice vektorového súčinu xxx1 × . . . × xxxn−1 v báze ααα pomocou súradníc jednotlivých vektorov xxxj. Začneme najjednoduchším prípadom n = 2. Ortokomplement xxx⊥ vektora xxx je taký vektor, že xxx⊥ ,yyy = vol2(xxx,yyy) = xxx,uuu1 yyy,uuu1 xxx,uuu2 yyy,uuu2 platí pre každé yyy ∈ V . Ak za yyy postupne dosadíme hodnoty uuu1, uuu2, dostaneme xxx⊥ ,uuu1 = vol2(xxx,uuu1) = xxx,uuu1 1 xxx,uuu2 0 = − xxx,uuu2 , xxx⊥ ,uuu2 = vol2(xxx,uuu2) = xxx,uuu1 0 xxx,uuu2 1 = xxx,uuu1 . Ak označíme (xxx)ααα = (x1, x2)T , kde x1 = xxx,uuu1 , x2 = xxx,uuu2 sú súradnice vektora xxx v báze ααα, tak pre súradnice vektora xxx⊥ dostaneme (xxx⊥ )ααα = −x2 x1 . 15.4. Vektorový súčin 309 Vektor xxx⊥ teda môžeme zapísať v tvare xxx⊥ = −x2uuu1 + x1uuu2 = x1 uuu1 x2 uuu2 = det (xxx)ααα,αααT , kde posledný determinant treba chápať ako úsporný zápis predošlej lineárnej kombinácie, ktorá je tak jeho čiste formálnym Laplaceovým rozvojom podľa druhého stĺpca. Rovnako si budeme počínať pre ľubovoľné n ≥ 3. Najprv položíme xij = xxxj,uuui pre 1 ≤ i ≤ n, 1 ≤ j ≤ n − 1, a označíme XXX = (xij) ∈ Rn×(n−1) maticu, ktorej stĺpce tvoria súradnice vektorov xxxj v báze ααα. Vektorový súčin xxx1 × . . . × xxxn−1 je taký vektor, že xxx1 × . . . × xxxn−1,yyy = voln(xxx1, . . . ,xxxn−1,yyy) = det XXX, (yyy)ααα platí pre každé yyy ∈ V . Ak za yyy postupne dosadíme hodnoty uuui, kde 1 ≤ i ≤ n, pre súradnice vektora xxx1 × . . . × xxxn−1 v báze ααα dostaneme xxx1 × . . . × xxxn−1,uuui = voln(xxx1, . . . ,xxxn−1,uuui) = det(XXX,eeei) = (−1)n+i |XXXi|, kde matica XXXi ∈ R(n−1)×(n−1) vznikne z matice XXX vynechaním i-teho riadku. Vektor xxx1 × . . . × xxxn−1 teda možno zapísať v tvare xxx1 × . . . × xxxn−1 = n i=1 (−1)n+i |XXXi|uuui = x11 . . . x1 n−1 uuu1 ... ... ... ... xn−1 1 . . . xn−1 n−1 uuun−1 xn1 . . . xn n−1 uuun = det XXX,αααT . Pritom posledný determinant treba chápať najmä ako pomôcku na ľahké zapamätanie predošlej lineárnej kombinácie, ktorú z neho možno dostať formálnym Laplaceovým rozvojom podľa n-tého stĺpca. V trojrozmernom euklidovskom priestore R3 so štandardným skalárnym súčinom sa vektory (kladne orientovanej) kanonickej bázy εεε(3) niekedy zvyknú značiť eee1 = iii, eee2 = jjj, eee3 = kkk. Vektorový súčin vektorov xxx = (x1, x2, x3)T , yyy = (y1, y2, y3)T v tomto prípade nadobúda známy tvar xxx × yyy =   x2y3 − x3y2 x3y1 − x1y3 x1y2 − x2y1   = x1 y1 iii x2 y2 jjj x3 y3 kkk , 310 15. Objem, orientácia a vektorový súčin pričom v pravotočivom (ľavotočivom) súradnom systéme v R3 sú jeho smer a orientácia dané pravidlom pravej (ľavej) ruky: ak položíme dlaň príslušnej ruky v smere vektora xxx tak, že zohnuté prsty ukazujú v smere „kratšieho otočenia vektora xxx do vektora yyy okolo počiatku, tak vztýčený palec ukazuje v smere vektora xxx × yyy. Všetky základné vlastnosti operácie vektorového súčinu V n−1 → V možno teraz jednoducho odvodiť na základe jej definície, prípadne jej vzťahu k nrozmernému orientovanému objemu a reprezentácie v tvare uvedeného formálneho determinantu. 15.4.1. Veta. Nech V je orientovaný euklidovský priestor dimenzie n ≥ 2 a xxx1, . . . ,xxxn−1 ∈ V . Potom (a) vektorový súčin je (n − 1)-lineárne alternujúce zobrazenie V n−1 → V ; (b) vektory xxx1, . . . ,xxxn−1 sú lineárne závislé práve vtedy, keď xxx1 × . . . × xxxn−1 = 0; (c) ak vektory xxx1, . . . ,xxxn−1 sú lineárne nezávislé, tak vvv = xxx1 × . . . × xxxn−1 je normálový vektor nadroviny [xxx1, . . . ,xxxn−1] a vektory xxx1, . . . ,xxxn−1,vvv tvoria kladne orientovanú bázu priestoru V ; (d) xxx1 × . . . × xxxn−1 = voln−1(xxx1, . . . ,xxxn−1). Dôkaz. Nech ααα = (uuu1, . . . ,uuun) je nejaká kladne orientovaná ortonormálna báza priestoru V . Označme XXX = (xij)n×(n−1), kde xij = xxxj,uuui . Potom vvv = xxx1 × . . . × xxxn−1 = det(XXX,αααT ). (a) je zrejmé z reprezentácie vektorového súčinu xxx1 × . . . × xxxn−1 v tvare uvedeného formálneho determinantu. (b) Uvedomme si, že podľa dôsledku 11.1.8 je rovnosť vvv = 0 ekvivalentná s podmienkou (∀yyy ∈ V )( vvv,yyy = 0). Podľa definície vektorového súčinu však platí vvv,yyy = voln(xxx1, . . . ,xxxn−1,yyy). Z dôsledku 15.3.2 potom vyplýva, že vvv = 0 práve vtedy, keď pre každé yyy ∈ V sú vektory xxx1, . . . ,xxxn−1,yyy lineárne závislé. Keďže dim V > n−1, tento prípad zrejme nastane práve vtedy, keď už samotné vektory xxx1, . . . ,xxxn−1 sú lineárne závislé. (c) Podľa 15.3.2 pre ľubovoľné 1 ≤ j ≤ n − 1 platí vvv,xxxj = voln(xxx1, . . . ,xxxj, . . . ,xxxn−1,xxxj) = 0, t. j. vvv ⊥ xxxj. Navyše, ak xxx1, . . . ,xxxn−1 sú lineárne nezávislé, tak vvv = 0, teda vvv je normála nadroviny [xxx1, . . . ,xxxn−1]. Dokážeme, že báza βββ = (xxx1, . . . ,xxxn−1,vvv) priestoru V je súhlasne orientovaná s bázou ααα. Uvedomme si, že matica prechodu z bázy βββ do bázy ααα má tvar PPPααα,βββ = XXX, (vvv)ααα . Rozvojom jej determinantu podľa posledného stĺpca a s využitím našej znalosti súradníc (vvv)ααα = (−1)n+1 |XXX1|, . . . , (−1)n+n |XXXn| T , Cvičenia 311 kde XXXi vznikne z matice XXX vynechaním i-teho riadku, dostávame PPPααα,βββ = n i=1 (−1)n+i |XXXi| (−1)n+i |XXXi| = n i=1 |XXXi|2 = vvv 2 > 0, lebo v dôsledku (b) je vvv = 0. To však znamená, že bázy ααα, βββ sú súhlasne orientované. (d) Keďže vvv ∈ [xxx1, . . . ,xxxn−1]⊥ , s využitím definície vektorového súčinu, vety 15.3.1, práve dokázanej druhej časti (c) a rekurzívnej definície k-rozmerného objemu môžeme písať vvv 2 = xxx1 × . . . × xxxn−1,vvv = voln(xxx1, . . . ,xxxn−1,vvv) = voln(xxx1, . . . ,xxxn−1,vvv) = voln−1(xxx1, . . . ,xxxn−1) vvv . Ak vvv = 0, tak podľa (b) sú xxx1, . . . ,xxxn−1 lineárne závislé, preto na základe tvrdenia 15.1.1 (a) tiež voln−1(xxx1, . . . ,xxxn−1) = 0. V opačnom prípade požadovanú rovnosť dostaneme krátením oboch strán členom vvv = 0. Z časti (d) a vety 15.1.2 priamo dostávame nasledujúci dôsledok. 15.4.2. Dôsledok. (a) V dvojrozmernom orientovanom euklidovskom priestore V pre každý vektor xxx ∈ V platí xxx⊥ = xxx . (b) V trojrozmernom orientovanom euklidovskom priestore V pre všetky nenulové vektory xxx,yyy ∈ V platí xxx × yyy = xxx yyy sin (xxx,yyy). (c) Pre n ≥ 2 v n-rozmernom orientovanom euklidovskom priestore V pre všetky xxx1, . . . ,xxxn−1 ∈ V platí xxx1 × . . . × xxxn−1 = |GGG(xxx1, . . . ,xxxn−1)|1/2 . Cvičenia 15.1. V n-rozmernom euklidovskom priestore uvažujme n-rozmerné teleso, ktorého objem závisí od dĺžkového parametra R podľa vzťahu Vn(R) = Vn(1) · Rn . Predstavme si toto teleso napr. ako krabicu so stenami z kartónu papiera alebo ovocie guľovitého tvaru so šupkou hrúbky ∆R. (a) Predpokladajme, že hrúbka „šupky ∆R tvorí 1% parametra R. Dokážte, že pre dostatočne veľké n tvorí „šupka viac než 99% n-rozmerného objemu takého „ovocia . Nájdite približnú hranicu, počnúc ktorým n to nastane. (b) Za predpokladu, že šupka je voči celkovému rozmeru R veľmi tenká, určte približnú závislosť, ako sa mení pomer objemu šupky k celkovému objemu, t. j. výraz ∆Vn(R) Vn(R) = Vn(R)−Vn(R−∆R) Vn(R) , ako funkcia pomeru ∆R R . (c) Približne ako musí s rastúcou dimenziou n klesať pomer ∆R R , aby pomer ∆Vn(R) Vn(R) mal konštantnú hodnotu C? 312 15. Objem, orientácia a vektorový súčin 15.2. Nech ααα, βββ sú dve zhodne orientované ortonormálne bázy v n-rozmernom euklidovskom priestore V . Overte priamym výpočtom, že vyjadrenia orientovaného objemu vol(xxx1, . . . ,xxxn) resp. vektorového súčinu xxx1 × . . . × xxxn−1 ľubovoľných vektorov z V pomocou báz ααα resp. βββ sa rovnajú. 15.3. Ako je to s orientáciou vektorového súčinu xxx × yyy v trojrozmernom euklidovskom priestore, keď vektory xxx, yyy zvierajú uhol 180◦ , teda obe otočenia xxx do yyy sú „rovnako dlhé ? 15.4. (a) Overte priamym výpočtom, že pre ľubovoľné nenulové vektory xxx, yyy v trojrozmernom euklidovskom priestore platí xxx × yyy = xxx yyy sin (xxx,yyy). (b) Odvoďte z toho identitu xxx,yyy 2 + xxx × yyy 2 = xxx 2 yyy 2 . 15.5. Nech V je trojrozmerný vektorový priestor. Dokážte, že pre ľubovoľné xxx,yyy,zzz ∈ V platia rovnosti (a) xxx × yyy,zzz = xxx,yyy × zzz ; (b) xxx × (yyy × zzz) = xxx,zzz yyy − xxx,yyy zzz; (c) xxx × (yyy × zzz) − (xxx × yyy) × zzz = xxx yyy,zzz − xxx,yyy zzz; (d) xxx × (yyy × zzz) + yyy × (zzz × xxx) + zzz × (xxx × yyy) = 0. Rovnosť (d) sa nazýva Jacobiho identita. 15.6. Nech ppp0,ppp1, . . . ,pppn−1 sú afinne nezávislé body v n-rozmernom euklidovskom priestore. Potom rovnica nadroviny (ppp0,ppp1, . . . ,pppn−1) (vzhľadom na ľubovoľnú kladne orientovanú ortonormálnu bázu priestoru V ) má tvar (ppp1 − ppp0) × . . . × (pppn−1 − ppp0),xxx − ppp0 = 0. Dokážte. 15.7. Nech K je ľubovoľné pole. Potom xxx,yyy = xxxT · yyy je regulárna symetrická bilineárna forma na vektorovom priestore Kn a kanonická báza εεε = (eee1, . . . ,eeen) je „ortonormálna vzhľadom na tento „skalárny súčin . Definujme vektorový súčin v Kn ako formálny determinant xxx1 × . . . × xxxn−1 = det xxx1, . . . ,xxxn−1,εεεT . Overte, že rovnica nadroviny (ppp0,ppp1, . . . ,pppn−1) ⊆ Kn má rovnaký tvar ako v predošlom cvičení. 16. Úvod do špeciálnej teórie relativity V predchádzajúcich troch kapitolách sa nám podarilo zrekonštruovať značnú časť euklidovskej geometrie, zovšeobecnenej do ľubovoľnej konečnej dimenzie, z jedinej kladne definitnej symetrickej bilineárnej formy na reálnom vektorovom priestore. V tejto kapitole najprv stručne preskúmame geometriu konečnorozmerných reálnych vektorových priestorov vybavených indefinitnou regulárnou symetrickou bilineárnou formou. Potom si predvedieme, ako možno z jedinej takejto formy signatúry (1, n, 0) odvodiť matematický aparát špeciálnej teórie relativity. Postupovať však budeme v opačnom smere, ako je zvykom vo fyzike. Nebudeme budovať matematický model analýzou fyzikálnej situácie, ale naopak, tento model, tzv. Minkowského časopriestor, nájdeme už hotový. Fyzika sa nám začne vynárať pri jeho matematickom štúdiu takpovediac samovoľne, keď pre niektoré javy a objekty, s ktorými sa v ňom stretneme, začneme používať fyzikálnu terminológiu. Pri tom, samozrejme, budeme dbať na to, aby takéto pomenúvanie bolo v zhode s našou fyzikálnou intuíciou. To nebude zďaleka také ľahké, ako by sa vari dalo čakať – čitateľovi sú iste aspoň zbežne známe niektoré „populárne dôsledky špeciálnej teórie relativity, ktoré našej každodennej fyzikálnej skúsenosti zdanlivo protirečia. Aj nimi sa tu budeme pomerne podrobne zaoberať. Základom špeciálnej teórie relativity je dôsledne uplatnený Galileov princíp relativity, postulujúci ekvivalenciu popisu pohybu a mechanických dejov z pohľadu ktoréhokoľvek z navzájom rovnomerne priamočiaro sa pohybujúcich pozorovateľov. Einstein tento princíp rozšíril do postulátu ekvivalencie popisu prírody z hľadiska ktoréhokoľvek z takýchto pozorovateľov. Presnejšia formulácia Einsteinovho princípu relativity hovorí, že všetky fyzikálne zákony majú rovnakú matematickú podobu nezávisle od inerciálnej sústavy, vzhľadom na ktorú ich formulujeme. Stálosť rýchlosti svetla už možno považovať za dôsledok tohto princípu. Medzi fyzikálne zákony treba totiž zahrnúť aj rýchlosť, akou sa šíri svetelný signál vo vákuu. Tým sa z tejto hodnoty stáva fundamentálna konštanta, rovnaká pre všetky inerciálne sústavy.1 Matematická podoba formúl teórie relativity si navyše vynucuje uznať medzný charakter rýchlosti svetla: relatívna rýchlosť pohybu hmotných objektov je vždy menšia než rýchlosť svetla. Rozpisovať sa o epochálnom význame Einsteinovho objavu špeciálnej a potom všeobecnej teórie relativity by dnes už bolo nosením dreva do lesa. Patrí sa však poznamenať, že základy špeciálnej relativity možno do istej 1 Niektorí fyzici považujú princíp stálosti rýchlosti svetla za nezávislý princíp. 314 16. Úvod do špeciálnej teórie relativity miery nájsť už u Lorentza a jej značnú časť rozvinul prakticky súčasne s Einsteinom a nezávisle na ňom Poincaré. Výlučným Einsteinovým objavom je až všeobecná teória relativity – no pri jej formulácii už nevystačíme s matematickým aparátom lineárnej algebry. Vznik všeobecnej relativity však bol do značnej miery umožnený Minkowského formuláciou špeciálnej relativity, ktorá predstavuje jeden z prvých a rozhodujúcich momentov mimoriadne plodného a dodnes živého programu tzv. geometrizácie fyziky. Práve výklad špeciálnej teórie relativity v Minkowského geometrickom poňatí bude náplňou tejto kapitoly. 16.1 Pseudoeuklidovské priestory Pseudoeuklidovským priestorom nazývame ľubovoľný konečnorozmerný vektorový priestor V nad poľom R, vybavený regulárnou indefinitnou symetrickou bilineárnou formou. Túto formu nazývame pseudoskalárny súčin a jej hodnotu na vektoroch xxx,yyy ∈ V značíme xxx,yyy , t. j. rovnako, ako sme značili skalárny súčin. Signatúrou pseudoeuklidovského priestoru V rozumieme signatúru príslušnej formy. Táto má tvar (p, q, 0), kde p, q ≥ 1 a p + q = dim V , čo nám umožňuje vynechať z nej posledný člen 0 a hovoriť o nej len ako o signatúre (p, q); v takom prípade hovoríme tiež o (p, q)-rozmernom pseudoeuklidovskom priestore. Od tejto chvíle až do konca tohto paragrafu V označuje nejaký pevne zvolený pseudoeuklidovský priestor a n = dim V . Pseudoskalárny súčin vo V takisto spĺňa prvé tri podmienky z definície skalárneho súčinu zo začiatku paragrafu 13.1, ako aj ich o kúsok ďalej uvedené dva dôsledky. Podmienku kladnej definitnosti (z ktorej už vyplýva regularita) však treba nahradiť nasledujúcimi dvoma podmienkami (∃xxx,yyy) xxx,xxx < 0 < yyy,yyy (indefinitnosť), (∀yyy) xxx,yyy = 0 ⇒ xxx = 0 (regularita), pričom ekvivalencia poslednej implikácie a regularity vyplýva z dôsledku 11.1.8. Väčšinu pojmov, s ktorými sme sa zoznámili v euklidovských priestoroch, možno, niekedy s istými nevyhnutnými úpravami, zaviesť aj pre pseudoeuklidovské priestory. Taktiež celý rad výsledkov o euklidovských priestoroch si, opäť s istými modifikáciami, zachováva platnosť aj pre pseudoeuklidovské priestory. Keďže podrobné štúdium týchto priestorov nie je našim cieľom, nevydáme sa cestou systematickej revízie výsledkov troch predchádzajúcich kapitol. Obmedzíme sa len na niekoľko málo príkladov, ktoré nám budú užitočné v ďalších paragrafoch. To si však vyžiada zaviesť aj niekoľko pojmov a dokázať zopár výsledkov, ktoré nemajú priame analógie v euklidovských priestoroch. 16.1. Pseudoeuklidovské priestory 315 Dvojmiestny vzťah ortogonality a ortokomplement množiny zavádzame rovnako ako v euklidovskom priestore xxx ⊥ yyy ⇔ xxx,yyy = 0, X⊥ = {yyy ∈ V ; (∀xxx ∈ X)(xxx ⊥ yyy)}, pre xxx,yyy ∈ V , X ⊆ V .2 Gramovou maticou (usporiadanej k-tice) vektorov ααα = (uuu1, . . . ,uuuk) ∈ V n nazývame maticu GGG(ααα) = GGG(uuu1, . . . ,uuuk) = uuui,uuuj k×k ; jej determinant |GGG(ααα)| nazývame Gramovým determinantom vektorov uuu1, . . . ,uuuk. Hovoríme, že báza ααα = (uuu1, . . . ,uuuk) lineárneho podpriestoru S ⊆ V je ortonormálna, ak pre všetky i, j ≤ k platí uuui,uuuj = 0, ak i = j, a uuui,uuui = ±1, t. j. práve vtedy, keď jej Gramova matica GGG(ααα) je diagonálna, len s prvkami ±1 na diagonále. Štandardný pseudoskalárny súčin signatúry (p, q) na (stĺpcovom) vektorovom priestore Rp+q je daný predpisom xxx,yyy = p i=1 xiyi − p+q i=p+1 xiyi = xxxT · diag(IIIp, −IIIq) · yyy. Ako vyplýva z výsledkov kapitol 11, 12, každý pseudoskalárny súčin tejto signatúry možno voľbou vhodnej ortonormálnej bázy, pri správnom poradí jej členov, upraviť na uvedený tvar. Pseudoeuklidovský priestor Rn so štandardným pseudoskalárnym súčinom signatúry (p, q) budeme značiť R(p,q) . Lineárny podpriestor S ⊆ V sa nazýva kladne definitný, záporne definitný, indefinitný, regulárny, resp. singulárny, ak bilineárna forma , zúžená na S má príslušnú vlastnosť. Zrejme kladne alebo záporne definitný podpriestor je regulárny. Podobne, nenulový vektor uuu ∈ V sa nazýva kladne resp. záporne definitný, ak uuu,uuu > 0, resp. uuu,uuu < 0, t. j. práve vtedy, keď ním generovaný lineárny podpriestor má príslušnú vlastnosť. (Rozmyslite si, prečo nemá zmysel hovoriť o indefinitných vektoroch.) Nenulový vektor uuu ∈ V sa nazýva izotropný, ak uuu,uuu = 0, t. j. ak uuu ⊥ uuu. V opačnom prípade hovoríme, že uuu je anizotropný vektor. Na rozdiel od euklidovských priestorov, v pseudoeuklidovských priestoroch existujú izotropné vektory (presvedčte sa o tom), ako aj netriviálne singulárne podpriestory (napr. každý podpriestor generovaný nenulovým izotropným vektorom je taký). Na druhej strane, každá ortonormálna báza lineárneho podpriestoru vo V nutne pozostáva len z anizotropných vektorov. 2 Správne by sme mali samozrejme hovoriť o pseudoortogonálnych vektoroch, pseudoortokomplemente množiny a pod. Dáme však prednosť stručnosti na úkor presnosti. 316 16. Úvod do špeciálnej teórie relativity 16.1.1. Tvrdenie. (a) Lineárny podpriestor S ⊆ V je regulárny práve vtedy, keď má ortonormálnu bázu. (b) Ľubovoľnú ortonormálnu bázu lineárneho podpriestoru S ⊆ V možno doplniť do ortonormálnej bázy celého priestoru V . Dôkaz. (a) Nech S je regulárny a ααα = (uuu1, . . . ,uuuk) je jeho ľubovoľná báza. Potom aj Gramova matica GGG(ααα), ako matica bilineárnej formy , zúženej na S vzhľadom na bázu ααα, je regulárna. Podľa vety 12.1.2 existuje regulárna matica PPP ∈ Rk×k taká, že PPPT ·GGG(ααα)·PPP je diagonálna matica len s prvkami ±1 na diagonále. Potom ααα · PPP je ortonormálna báza podpriestoru S. Obrátená implikácia je triviálna. (b) Nech (vvv1, . . . ,vvvk) je nejaká ortonormálna báza (regulárneho) podpriestoru S. Doplňme ju (hocakým spôsobom) do bázy βββ = (vvv1, . . . ,vvvk,vvvk+1, . . . ,vvvn) priestoru V . Potom aj Gramova matica GGG(βββ) je regulárna a jej ľavý horný roh rozmeru k × k je diagonálny len s ±1 na diagonále, čiže túto jej časť už upravovať nemusíme. Preto dvojicami ERO a ESO možno celú maticu upraviť na diagonálnu maticu QQQT · GGG(βββ) · QQQ s ±1 na diagonále tak, že ani jeden z prvých k riadkov resp. stĺpcov pôvodnej matice GGG(βββ) nezmení polohu, nebude vynásobený skalárom = 0, ani k nemu nepripočítame násobok iného riadku či stĺpca. To znamená, že regulárna matica QQQ ∈ Rn×n zodpovedajúca príslušným ESO má blokový tvar QQQ = IIIk QQQ1 0 QQQ2 . Preto bázy βββ a βββ ·QQQ majú prvých k vektorov rovnakých, teda βββ ·QQQ je hľadaná ortonormálna báza priestoru V . 16.1.2. Tvrdenie. Nech S ⊆ V je regulárny lineárny podpriestor. Potom aj S⊥ je regulárny lineárny podpriestor a platí V = S ⊕ S⊥ , S⊥⊥ = S. Dôkaz. Podľa tvrdenia 16.1.1 má S nejakú ortonormálnu bázu (uuu1, . . . ,uuuk), ktorú možno doplniť do ortonormálnej bázy (uuu1, . . . ,uuuk,uuuk+1, . . . ,uuun) celého priestoru V . Ľahko nahliadneme, že S⊥ = [uuuk+1, . . . ,uuun]. Z toho už priamo vyplýva regularita podpriestoru S⊥ ako aj rovnosti S∩S⊥ = {0}, S+S⊥ = V a S⊥⊥ = S. 16.1.3. Tvrdenie. Ak S ⊆ V je maximálny kladne definitný podpriestor, tak S⊥ je maximálny záporne definitný podpriestor. Samozrejme tiež naopak, ak S ⊆ V je maximálny záporne definitný podpriestor, tak S⊥ je maximálny kladne definitný podpriestor. Dôkaz. Maximalita kladne definitného podpriestoru S znamená, že lineárny podpriestor S + [xxx] nie je kladne definitný pre žiadny vektor xxx ∈ V S. 16.1. Pseudoeuklidovské priestory 317 Keďže S je regulárny, podľa predchádzajúceho tvrdenia je regulárny aj S⊥ . Nech ααα = (uuu1, . . . ,uuuk), ααα = (uuuk+1, . . . ,uuun) sú ľubovoľné ortonormálne bázy podpriestorov S resp. S⊥ . Potom (uuu1, . . . ,uuun) je zrejme ortonormálna báza celého V . Z kladnej definitnosti S vyplýva, že GGG(ααα) = IIIk; z jeho maximality a Sylvestrovho zákona zotrvačnosti (veta 12.1.1) zas GGG(ααα ) = −IIIn−k. Preto S⊥ je záporne definitný podpriestor, ktorý je v dôsledku vety 12.1.1 zrejme maximálny s touto vlastnosťou. Podľa ostatných dvoch tvrdení je každý pseudoeuklidovský priestor priamym súčtom V = S ⊕ T maximálneho kladne definitného podpriestoru S a maximálneho záporne definitného podpriestoru T; tento rozklad však nie je zďaleka jednoznačný. Pseudoskalárny súčin na podpriestore S je priamo skalárnym súčinom, takže S je vlastne euklidovský priestor. Takisto T možno považovať za euklidovský priestor – stačí formálne zmeniť znamienko pseudoskalárneho súčinu a priradením (xxx,yyy) → − xxx,yyy je už definovaný skalárny súčin na T. Štruktúra pseudoeuklidovského priestoru vzniká takpovediac prepojením dvoch euklidovských štruktúr opačných znamienok. V dôsledku toho sa môže Cauchyho-Schwartzova nerovnosť niekedy zmeniť na opačnú. 16.1.4. Tvrdenie. Nech uuu,vvv ∈ V sú anizotropné vektory. Potom platí (a) uuu,vvv 2 = uuu,uuu vvv,vvv práve vtedy, keď uuu, vvv sú lineárne závislé alebo [uuu,vvv] je dvojrozmerný singulárny podpriestor; (b) uuu,vvv 2 < uuu,uuu vvv,vvv práve vtedy, keď uuu, vvv sú lineárne nezávislé a podpriestor [uuu,vvv] je kladne alebo záporne definitný; (c) uuu,vvv 2 > uuu,uuu vvv,vvv práve vtedy, keď [uuu,vvv] je indefinitný podpriestor. Dodajme, že v prípade, keď niektorý z vektorov uuu, vvv je izotropný, triviálne platí uuu,vvv 2 ≥ 0 = uuu,uuu vvv,vvv , pričom rovnosť nastane práve vtedy, keď uuu,vvv = 0. Dôkaz. Keďže |GGG(uuu,vvv)| = uuu,uuu vvv,vvv − uuu,vvv 2 , uvedená rovnosť z (a), resp. nerovnosti z (b), (c) sú postupne ekvivalentné s podmienkami |GGG(uuu,vvv)| = 0, |GGG(uuu,vvv)| > 0, resp. |GGG(uuu,vvv)| < 0. Ak uuu, vvv sú lineárne závislé, tak rovnosť |GGG(uuu,vvv)| = 0 možno jednoducho overiť priamym výpočtom. Ak sú nezávislé, tak GGG(uuu,vvv) je maticou pseudoskalárneho súčinu na podpriestore [uuu,vvv] v báze (uuu,vvv). Z toho vyplýva: (a) Podpriestor [uuu,vvv] je singulárny práve vtedy, keď matica GGG(uuu,vvv) je singulárna, t. j. práve vtedy, keď |GGG(uuu,vvv)| = 0. (b) Podľa Sylvestrovho kritéria (veta 12.2.4) je podpriestor [uuu,vvv] kladne definitný práve vtedy, keď uuu,uuu > 0 a |GGG(uuu,vvv)| > 0, a záporne definitný 318 16. Úvod do špeciálnej teórie relativity práve vtedy, keď uuu,uuu < 0 a |GGG(uuu,vvv)| > 0. Keďže pre anizotropný vektor uuu iná možnosť nenastane, |GGG(uuu,vvv)| > 0 práve vtedy, keď [uuu,vvv] je kladne alebo záporne definitný. (c) Ako vidno z (b), [uuu,vvv] je indefinitný práve vtedy, keď |GGG(uuu,vvv)| < 0. 16.2 Minkowského časopriestor Vo fyzike, presnejšie v špeciálnej teórii relativity, sa pod Minkowského priestoročasom zvyčajne rozumie pseudoeuklidovský priestor R4 so štandardným pseudoskalárnym súčinom signatúry (3, 1), prípadne (1, 3). Z matematického hľadiska sú obe možnosti ekvivalentné – voľba jednej z nich je preto najmä vecou vkusu. My dáme prednosť druhej možnosti, t. j. pre xxx = (x0, x1, x2, x3)T , yyy = (y0, y1, y2, y3)T položíme xxx,yyy = x0y0 − x1y1 − x2y2 − x3y3 = xxxT · diag(1, −III3) · yyy. Pritom súradnicu x0 interpretujeme ako čas a x1, x2, x3 ako súradnice polohy v euklidovskom priestore. V súlade s tým budeme používať termím časopriestor. Tento pojem však ďalej rozšírime jednak na vyššie, jednak na nižšie dimenzie a na abstraktné pseudoeuklidovské priestory. Minkowského časopriestorom budeme teda nazývať ľubovoľný pseudoeuklidovský priestor V signatúry (1, n), kde n ≥ 1. R(1,n) označuje Minkowského časopriestor Rn+1 so štandardným pseudoskalárnym súčinom signatúry (1, n). V našom výklade budú hrať dôležitú úlohu práve časopriestory „malej signatúry (1, 1) a (1, 2), ktoré ešte pripúšťajú názorné grafické znázornenie. Na Minkowského časopriestor V budeme v prevažnej miere pozerať afinne, t. j. jeho prvky budeme častejšie považovať za body než za vektory – tentokrát ich však budeme nazývať udalosťami alebo tiež svetobodmi. Svetobody predstavujú idealizované okamžité bodové udalosti (ako napr. vyžiarenie fotónu atómom, či zrážku dvoch elementárnych častíc), pri ktorých abstrahujeme od toho, „čo sa stalo , a zaznamenávame len ich čas a polohu. Ak xxx,yyy ∈ V sú dva svetobody, tak pseudoskalárny súčin xxx − yyy,xxx − yyy nazývame štvorcom ich časopriestorovej odľahlosti. Ak xxx = yyy, tak podľa toho, či xxx − yyy,xxx − yyy je väčšie, rovné alebo menšie ako 0 (t. j. vektor xxx − yyy je kladne definitný, izotropný alebo záporne definitný), hovoríme, že udalosti xxx, yyy sú časovo, svetelne, resp. priestorovo odľahlé. Miesto kladne definitný, záporne definitný, resp. izotropný vektor hovoríme tiež časový, priestorový, resp. svetelný vektor.3 Množinu LC(ppp) = {xxx ∈ V ; xxx − ppp,xxx − ppp = 0} 3 Obvykle sa používajú možno výstižnejšie, no určite ťažkopádnejšie názvy časupodobný, priestorupodobný a svetlupodobný vektor. 16.2. Minkowského časopriestor 319 všetkých udalostí, ktoré sú od daného svetobodu ppp ∈ V svetelne odľahlé, nazývame svetelný kužeľ (anglicky light cone) s počiatkom v ppp. Tento názov je motivovaný tvarom svetelného kužeľa v Minkowského časopriestore R(1,2) , ktorý je znázornený na obrázku vpravo; vľavo vidíme svetelný kužeľ v Minkowského časopriestore R(1,1) , tvorený dvoma priamkami x1 = ±x0. V pozadí práve zavedeného názvoslovia stojí fyzikálna interpretácia Minkowského časopriestoru, ktorá bude v priebehu nášho výkladu vychádzať najavo čoraz zreteľnejšie. Zatiaľ si len všimnime, že vyslaniu svetelného signálu v istom okamihu z istého miesta možno priradiť istú udalosť v Minkowského časopriestore R(1,3) , ktorú si bez ujmy na všeobecnosti možno zvoliť za počiatok odpočtu času i súradnej sústavy v priestore. Tento signál sa šíri rovnakou rýchlosťou c všetkými smermi, takže v čase t > 0 bude vytvárať sférickú vlnoplochu s polomerom ct a rovnicou x2 1 + x2 2 + x2 3 = c2 t2 . Obr. 16.1. Svetelný kužeľ v Minkowského časopriestoroch R(1,1) a R(1,2) Po voľbe rýchlosti svetla za jednotku rýchlosti (c = 1) a substitúcii x0 = ct = t vidíme, že všetky svetobody, do ktorých dospeje svetelný signál vyslaný v okamihu 0 z počiatku priestorovej súradnej sústavy, vytvárajú „hornú polovicu svetelného kužeľa, niekedy nazývanú tiež svetelný kužeľ bu- dúcnosti, LC+ (0) = {xxx ∈ R(1,3) ; x0 ≥ 0 & xxx,xxx = 0}. Jeho „dolná polovica , nazývaná aj svetelný kužeľ minulosti, LC− (0) = {xxx ∈ R(1,3) ; x0 ≤ 0 & xxx,xxx = 0}. je tvorená svetobodmi, z ktorých svetelný signál dospel do počiatku priestorovej súradnej sústavy v okamihu 0. Hviezdy, ktoré vidíme na jasnej nočnej oblohe, sú rôzne vzdialené, preto svetlo z nich k nám letí rôzne dlho – 320 16. Úvod do špeciálnej teórie relativity všetky takéto lúče však ležia na svetelnom kuželi minulosti LC− (0). Svetobody, z ktorých bol svetelný signál vyslaný v čase t < 0 opäť vytvárajú sférickú vlnoplochu s polomerom −ct a rovnakou rovnicou ako v predošlom prípade. Príkladom takejto vlnoplochy je belasá nebeská sféra, ktorej časť vidíme za jasného dňa nad hlavou. Pri potlačení jednej priestorovej súradnice x3 možno situáciu názorne ilustrovať v Minkowského časopriestore R(1,2) (predchádzajúci obrázok vpravo). Miesto trojrozmerného priestoru si predstavme dvojrozmernú vodnú hladinu a miesto vyslania svetelného signálu hoďme kameň do vody. Vznikne vlnenie, ktorého čelo sa šíri po hladine v tvare kružnice a za čas t > 0 dospeje do vzdialenosti ct, kde c je rýchlosť jeho šírenia. „Hornú polovicu svetelného kužeľa si predstavme ako kruhové čelo vlny „unášané plynúcim časom – jeho stav v nejakom okamihu t je daný rezom kužeľa rovinou x0 = ct. Tento príklad navodzuje predstavu Minkovského časopriestoru signatúry (1, n) ako n-rozmerného euklidovského priestoru „unášaného časom pozdĺž časovej osi. I keď táto predstava býva často užitočná, uvidíme, že v Minkowského časopriestore neexistuje privilegovaná časová os, ani kanonický, jednoznačný rozklad na časovú a priestorovú zložku, ako by sa nám mohlo zdať pri zbežnom pohľade na Minkowského časopriestor R(1,n) . Skutočnosť, že „časom unášaný fyzikálny priestor je euklidovský, čiže „plochý , poukazuje na to, že špeciálna relativita skúma vlastne prázdny časopriestor, presnejšie, abstrahuje od gravitačného pôsosobenia v ňom rozloženej hmoty. Tieto otázky tematizuje až všeobecná teória relativity, ktorá gravitačné pôsobenie zachytáva opäť geometricky – ako spojite sa meniace zakrivenie časopriestoru. Pre časový vektor uuu ∈ V možno definovať normu alebo dĺžku uuu = uuu,uuu rovnako ako v euklidovskom prípade. Pre priestorový vektor vvv ∈ V však kladieme vvv = − vvv,vvv . V euklidovskom priestore R2 vytvárajú vektory rovnakej dĺžky r > 0 (presnejšie ich konce) kružnicu s rovnicou x2 1 + x2 2 = r2 ; v R3 je to sféra s rovnicou x2 1 + x2 2 + x2 3 = r2 . Na rozdiel od toho v Minkowského časopriestore R(1,1) vytvárajú časové vektory dĺžky r > 0 rovnoosú hyperbolu s rovnicou x2 0 −x2 1 = r2 ; priestorové vektory dĺžky r zasa vytvárajú rovnoosú hyperbolu s rovnicou x2 0 − x2 1 = −r2 (ďalší obrázok vľavo). V Minkowského časopriestore R(1,2) vytvoria takéto časové vektory dvojdielny rotačný hyperboloid s rovnicou x2 0 − x2 1 − x2 2 = r2 , ktorý leží „vovnútri svetelného kužeľa; zodpovedajúce priestorové vektory tvoria jednodielny rotačný hyperboloid s rovnicou x2 0 − x2 1 − x2 2 = −r2 , ktorý obaľuje svetelný kužeľ „zvonka (obrázok vpravo). Do vyšších dimenzíí, vrátane „nášho časopriestoru R(1,3) , bohužiaľ, už naša predstavivosť nesiaha. V istom zmysle si však nadplochy tvorené vektormi rovnakej dĺžky aj vo vyšších dimenziách zachovávajú niektoré podstatné vlastnosti, ktoré sme objavili v časopriestore signatúry (1, 2): časové vektory dĺžky r > 0 stále vytvárajú dvojdielnu rotačnú hyperbolickú 16.3. Inerciálny pozorovateľ a jeho svetočiara 321 Obr. 16.2. Časové resp. priestorové vektory rovnakých dĺžok v R(1,1) a R(1,2) nadplochu umiestnenú „vnútri svetelného kužeľa, kým priestorové vektory dĺžky r > 0 tvoria jednodielnu rotačnú hyperbolickú nadplochu obaľujúcu svetelný kužeľ „zvonka . Varujeme však čitateľa, aby podobným obrázkom a z nich vychádzajúcim názorným geometrickým predstavám neprikladal väčšiu váhu, než im náleží – Minkowského časopriestory R(1,1) a R(1,2) sú na nich totiž zobrazené skreslene prostredníctvom euklidovskej geometrie. To vidno napr. už z toho, že časové vektory rovnakej dĺžky sú zobrazené ako vektory nerovnakej euklidovskej dĺžky. Len na okraj poznamenajme, že napr. na jednom diele hyperboloidu x2 0 − x2 1 − x2 2 = r2 v R(1,2) sa realizuje dvojrozmerná BolyaihoLobačevského geometria, zo zrejmých dôvodov nazývaná tiež hyperbolickou, ktorá je historicky prvým známym príkladom neeuklidovskej geometrie. Štúdium podobných, nesporne zaujímavých otázok však už nie je predmetom tohto kurzu. 16.3 Inerciálny pozorovateľ a jeho svetočiara Inerciálneho pozorovateľa v Minkovského časopriestore V si predstavujeme ako ideálneho dispečera obrovského počtu rovnomerne priamočiaro sa pohybujúcich, no navzájom nehybných, čertovsky malých (presnejšie bodových) trpaslíkov, vyskytujúcich sa v každom svetobode a vybavených synchronizovanými hodinkami a jednotným metrom. Niekedy je však účelná predstava, že aj inerciálny pozorovateľ je len jedným z takýchto trpaslíkov, prípadne, že ktorýkoľvek z trpaslíkov môže prevziať úlohu dispečera. Matematicky však nebudeme zavádzať nijakých inerciálnych dispečerov ani trpaslíkov – úplne vystačíme s dráhami, ktoré opisujú vo V . 322 16. Úvod do špeciálnej teórie relativity Obr. 16.3. Svetočiara inerciálneho pozorovateľa v R(1,2) Na začiatok si uvedomme, akú dráhu opisuje v R(1,n) nehybný bod. Keďže čas neustále plynie, i nehybný bod sa v R(1,n) „pohybuje – a to po „zvislej priamke s parametrickými rovnicami x0 = t, x1 = p1, . . . , xn = pn, kde (p1, . . . , pn)T sú jeho priestorové súradnice v okamihu t = 0. Jej smerový vektor je eee0 = (1, 0, . . . , 0)T . A akú dráhu v R(1,n) opisuje bod pohybujúci sa rovnomerne priamočiaro rýchlosťou vvv so zložkami v1, . . . , vn v smere jednotlivých osí x1, . . . , xn? Zrejme je to priamka s parametrickými rovnicami x0 = t, x1 = p1 + v1t, . . . , xn = pn + vnt, kde (p1, . . . , pn)T sú jeho priestorové súradnice v okamihu t = 0, a smerovým vektorom (1, v1, . . . , vn)T . To si najlepšie znázorníme v R(1,2) , keď si zvolíme os x1 v smere vektora rýchlosti vvv, teda vvv = (v1, 0)T . Situácia pre p1 = p2 = 0 je znázornená na obrázku. Kedže rýchlosť pohybu hmotného bodu je menšia než rýchlosť svetla, t. j. |v1| < 1, naša priamka leží „vovnútri svetelného kužeľa. Vo všeobecnom prípade máme v2 1 + . . . + v2 n < 1, čiže (1, v1, . . . , vn)T je časový vektor. Teraz si uvedomme, že naše otázky boli chybne položené. Hovoriť o nehybnom alebo pohybujúcom sa pozorovateľovi ako takom nedáva rozumný fyzikálny zmysel. Neexistuje absolútny kľud ani absolútny pohyb, ale kľud i pohyb sú relatívne. Nejaký fyzikálny objekt môže byť v kľude alebo v pohybe len vzhľadom na nejaký iný objekt. Aspoň tak nás to učí klasická mechanika od čias Galileových. Aj tak však z našich chybne položených otázok možno vyťažiť netriviálny poznatok: inerciálni pozorovatelia sa v Minkowského časopriestore pohybujú po priamkach s časovými smerovými vektormi. Svetočiarou inerciálneho pozorovateľa, alebo len inerciálnou svetočiarou nazývame ľubovoľnú orientovanú priamku (t. j. jednorozmerný afinný pod- 16.3. Inerciálny pozorovateľ a jeho svetočiara 323 priestor) vo V tvaru WL(ppp,aaa) = ppp + [aaa] = {ppp + taaa; t ∈ R}, (z anglického world line), kde ppp ∈ V je svetobod a aaa ∈ V je časový vektor (čiže aaa,aaa > 0), s orientáciou zadanou vektorom aaa. To znamená, že opačne orientovanú svetočiaru WL(ppp, −aaa) považujeme za rôznu od WL(ppp,aaa), hoci ako množiny bodov predstavujú tú istú priamku. Tu treba upozorniť na ďalšie skreslenie, idúce na vrub zobrazenia v euklidovskej geometrii. Svetočiara WL(0,eee0) v R(1,2) je zobrazená ako os svetelného kužeľa LC(0), kým svetočiara WL(0,aaa) s iným časovým vektorom aaa vedie akoby bližšie popri jeho okraji. Z postulátu stálosti rýchlosti svetla však vyplýva, že svetočiary všetkých inerciálnych pozorovateľov „majú rovnako ďaleko k okraju svetelného kužeľa . Formálne možno svetočiary WL(ppp,aaa) zaviesť rovnako pre ľubovoľné vektory aaa = 0 vo V . Obmedzenie sa na časové smerové vektory je dôsledkom postulátu, podľa ktorého sa všetky hmotné objekty pohybujú rýchlosťou menšou než rýchlosť svetla. Svetočiary tvaru WL(ppp,aaa), kde aaa je svetelný vektor, t. j. aaa,aaa = 0, predstavujú pohyb svetelnou rýchlosťou – takto sa však môžu pohybovať len nehmotné častice (presnejšie, častice s nulovou kľudovou hmotnosťou), teda z dnes známych častíc iba fotóny (o neutrínach sú už dnes – zdá sa – všetci presvedčení, že sú hmotné). Svetočiary tvaru WL(ppp,aaa), kde aaa je priestorový vektor, t. j. aaa,aaa < 0, by zodpovedali pohybu nadsvetelnou rýchlosťou, teda – aspoň v rámci špeciálnej teórie relativity – nemajú fyzikálny význam. Hoci o časticiach pohybujúcich sa nadsvetelnými rýchlosťami, tzv. tachyónoch, sa v teoretickej fyzike stále špekuluje, všetky doterajšie pokusy objaviť ich skončili neúspešne. Pohyb má podľa našich fyzikálnych predstáv vždy relatívny charakter. V abstraktnom Minkowského časopriestore, kde nemáme privilegovanú časovú os, sú všetky inerciálne svetočiary rovnocenné. Pokiaľ teda budeme hovoriť o pohybe inerciálneho pozorovateľa, vždy pôjde o jeho pohyb vzhľadom na iného inerciálneho pozorovateľa. Na druhej strane, niektoré vlastnosti pohybu sú absolútne. V Minkowského časopriestore V je to napr. vlastnosť „pohybovať sa rovnomerne priamočiaro (t. j. opisovať inerciálnu svetočiaru vo V ), a v dôsledku toho tiež vlastnosť „pohybovať sa premennou rýchlosťou . Svetočiara hmotného bodu v Minkowského časopriestore V pohybujúceho sa premennou rýchlosťou totiž nie je inerciálna. Zmena rýchlosti sa prejaví zakrivením príslušnej svetočiary. Nakoľko však okamžitá rýchlosť pohybu hmotného bodu je vždy menšia než rýchlosť svetla, dotykový vektor k takejto svetočiare v každom jej svetobode ppp je časový, t. j. leží „vovnútri svetelného kužeľa LC(ppp). K danej svetočiare WL(ppp,aaa) inerciálneho pozorovateľa v Minkowského časopriestore V existuje jednoznačne určený vektor aaa0 = aaa,aaa −1/2 aaa taký, 324 16. Úvod do špeciálnej teórie relativity Obr. 16.4. Rôzne typy svetočiar v R(1,2) že WL(ppp,aaa) = WL(ppp,aaa0) a aaa0,aaa0 = 1, ktorý nazývame jej časovým šípom alebo šípom času (vo fyzike sa v Minkovského časopriestore R(1,3) používa tiež názov štvorrýchlosť). To znamená, že parameter t vo vyjadrení svetobodov xxx = ppp + taaa0 svetočiary WL(ppp,aaa0) možno skutočne interpretovať ako vlastný čas príslušného inerciálneho pozorovateľa, počítaný od udalosti ppp. Matematicky tak možno inerciálneho pozorovateľa-dispečera stotožniť s časovým šípom aaa ľubovoľnej jeho svetočiary WL(ppp,aaa) a jemu podriadených trpaslíkov s týmito svetočiarami. Ich zladenie, t. j. niečo ako synchronizácia, teda spočíva v totožnosti časových šípov všetkých takýchto svetočiar. Svetočiara WL(ppp,aaa) inerciálneho pozorovateľa tak predstavuje jeho vlastný tok času (a nie jeho pohyb – ten je možný len vzhľadom na iného inerciálneho pozorovateľa). Orientácia svetočiary zodpovedá orientácii času z minulosti do budúcnosti – prostriedkami špeciálnej teórie relativity ju však nemožno odlíšiť od orientácie z budúcnosti do minulosti, presnejšie, rozhodnúť, ktorá z nich je „tá pravá . Možno však rozhodnúť, či sú dve inerciálne svetočiary orientované súhlasne alebo nesúhlasne, t. j. či ich vlastné časy plynú tým istým alebo opačným smerom. Časové vektory aaa, bbb sa nazývajú súhlasne orientované, ak aaa,bbb > 0; ak aaa,bbb < 0, hovoríme, že aaa, bbb sú nesúhlasne orientované. (Samostatne si dokážte, že prípad aaa,bbb = 0 nemôže nastať.) Inerciálne svetočiary WL(ppp,aaa), WL(qqq,bbb) sú potom súhlasne resp. nesúhlasne orientované práve vtedy, keď sú súhlasne resp. nesúhlasne orientované ich časové vektory. Podobne, hovoríme, že svetelný vektor uuu = 0 je súhlasne orientovaný s časovým vektorom aaa, ak aaa,uuu > 0; ak aaa,uuu < 0, hovoríme, že sú nesúhlasne orientované. (Prípad aaa,uuu = 0 je opäť nemožný.) 16.3. Inerciálny pozorovateľ a jeho svetočiara 325 Ukážeme si, že súhlasne orientované časové vektory aaa, bbb určujú rovnakú orientáciu časových aj svetelných vektorov. 16.3.1. Tvrdenie. Nech aaa, bbb sú súhlasne orientované časové vektory v Minkowského časopriestore V . Potom pre ľubovoľný časový alebo svetelný vektor uuu platí aaa,uuu > 0 práve vtedy, keď bbb,uuu > 0, Dôkaz. Bez ujmy na všeobecnosti môžeme predpokladať, že aaa, bbb sú súhlasne orientované časové šípy, t. j. aaa,aaa = bbb,bbb = 1 a aaa,bbb > 0. Vzhľadom na symetriu úlohy stačí dokazovať implikáciu aaa,uuu > 0 ⇒ bbb,uuu > 0. Priamym výpočtom sa možno presvedčiť, že vektory bbb = bbb − aaa,bbb aaa, uuu = uuu − aaa,uuu aaa patria do lineárneho podpriestoru [aaa]⊥ , teda sú to priestorové vektory. Potom 0 > bbb ,bbb = bbb,bbb − 2 aaa,bbb 2 + aaa,bbb 2 aaa,aaa = 1 − aaa,bbb 2 , a podobne, nakoľko uuu,uuu ≥ 0, 0 > uuu ,uuu = uuu,uuu − 2 aaa,uuu 2 + aaa,uuu 2 aaa,aaa = uuu,uuu − aaa,uuu 2 ≥ − aaa,uuu 2 Keďže [bbb ,uuu ] ⊆ [aaa]⊥ , je to záporne definitný podpriestor, a podľa bodov (a), (b) tvrdenia 16.1.4 platí bbb ,uuu 2 ≤ bbb ,bbb uuu ,uuu . Z toho dostávame odhad | bbb ,uuu | ≤ | bbb ,bbb uuu ,uuu | ≤ aaa,uuu aaa,bbb 2 − 1, z ktorého konečne vyplýva bbb,uuu = aaa,bbb aaa,uuu + bbb ,uuu ≥ aaa,bbb aaa,uuu − | bbb ,uuu | ≥ aaa,uuu aaa,bbb − aaa,bbb 2 − 1 > 0. Ak teraz definujeme svetelný kužeľ budúcnosti LCaaa (ppp) = {xxx ∈ V ; aaa,xxx − ppp > 0 & xxx − ppp,xxx − ppp = 0} a svetelný kužeľ minulosti LC−aaa (ppp) = {xxx ∈ V ; aaa,xxx − ppp < 0 & xxx − ppp,xxx − ppp = 0} 326 16. Úvod do špeciálnej teórie relativity udalosti ppp ∈ V vzhľadom na časový vektor aaa, tak z práve dokázaného tvrdenia vyplýva, že platí LCaaa (ppp) = LCbbb (ppp) a LC−aaa (ppp) = LC−bbb (ppp) pre ľubovoľné súhlasne orientované časové vektory aaa, bbb. Keďže aaa,aaa > 0 a vektory xxx, pre ktoré aaa,xxx = 0, tvoria nadrovinu [aaa]⊥ oddeľujúcu obe „polovice svetelného kužeľa LC(0), súhlasná orientácia časových vektorov aaa, bbb znamená, že ležia „vovnútri tej istej polovice svetelného kužeľa LC(0); nesúhlasne orientované časové vektory potom ležia „vovnútri opačných polovíc LC(0). Jedna z dvoch možných orientácií času v Minkowského časopriestore V je tak daná voľbou jediného časového vektora aaa, ktorý prehlásime za kladne orientovaný. Pre V = R(1,n) je týmto vektorom prirodzene časový šíp eee0. 16.4 Relativita súčasnosti Uvažujme inerciálneho pozorovateľa s časovým šípom aaa a pokúsme sa vyjasniť si, ktoré udalosti qqq, rrr v Minkowského časopriestore V by mal tento pozorovateľ považovať za súčasné. Prirodzenou požiadavkou je, aby svetelný signál vyslaný zo svetobodu qqq a preťal svetočiaru WL(rrr,aaa) vo svetobode zodpovedajúcom rovnakému času tejto svetočiary počítanému od udalosti rrr, ako je čas počítaný od udalosti qqq, v ktorom svetelný signál vyslaný zo svetobodu rrr pretne svetočiaru WL(qqq,aaa) – pozri obrázok 16.5. Obr. 16.5. Súčasné udalosti z hľadiska inerciálneho pozorovateľa s časovým šípom aaa Na základe toho udalosti qqq,rrr ∈ V prehlásime za súčasné z hľadiska inerciálneho pozorovateľa s časovým šípom aaa, ak qqq = rrr alebo existujú svetelné vektory uuu, vvv, súhlasne orientované s časovým vektorom aaa, a hodnota časo- 16.4. Relativita súčasnosti 327 vého parametra t ∈ R také, že (qqq + uuu) − rrr = (rrr + vvv) − qqq = taaa, alebo, čo je to isté, uuu − vvv = 2(rrr − qqq) a uuu + vvv = 2taaa. 16.4.1. Tvrdenie. Udalosti qqq a rrr v Minkowského časopriestore sú súčasné z hľadiska inerciálneho pozorovateľa s časovým šípom aaa práve vtedy, keď platí aaa,rrr − qqq = 0. Dôkaz. Keďže pre qqq = rrr niet čo dokazovať, predpokladajme, že qqq = rrr. Nech teda qqq a rrr sú súčasné udalosti vzhľadom na časový vektor aaa a uuu, vvv a t sú svetelné vektory resp. časový parameter zaručené definíciou súčasnosti. Potom 4t aaa,rrr − qqq = 2taaa, 2(rrr − qqq) = uuu + vvv,uuu − vvv = uuu,uuu − vvv,vvv = 0. Preto musí platiť t = 0 alebo aaa,rrr − qqq = 0. Keby nastala prvá možnosť t = 0, tak by platilo uuu − vvv = 0 a uuu + vvv = 0, t. j. uuu, vvv by boli nenulové, navzájom opačné svetelné vektory. Z nich však len jeden je súhlasne orientovaný s časovým vektorom aaa. Preto musí nastať druhá možnosť aaa,rrr − qqq = 0. Nech naopak platí aaa,rrr − qqq = 0. Položme t = − rrr − qqq,rrr − qqq = rrr − qqq , uuu = rrr − qqq + taaa, vvv = qqq − rrr + taaa. Priamym výpočtom možno ľahko overiť, že uuu, vvv a t spĺňajú všetky požadované podmienky. Zrejme definíciu súčasnosti možno ekvivalentne formulovať pre ľubovoľný časový vektor aaa, nielen časový šíp, a práve dokázané tvrdenie pritom zostane v platnosti. Množina všetkých udalostí súčasných s udalosťou qqq z hľadiska inerciálneho pozorovateľa s časovým vektorom aaa tak tvorí afinný podpriestor qqq+[aaa]⊥ v Minkowského časopriestore V , ktorý nazývame okamžitým fyzikálnym priestorom inerciálneho pozorovateľa nachádzajúceho sa v svetobode qqq svojej svetočiary WL(ppp,aaa); každý jednotlivý z takýchto afinných podpriestorov nazývame okamžitým fyzikálnym priestorom svetočiary WL(ppp,aaa). Keďže [aaa] je zrejme maximálny kladne definitný lineárny podpriestor vo V , jeho ortokomplement [aaa]⊥ je podľa tvrdenia 16.1.3 záporne definitný a podľa 328 16. Úvod do špeciálnej teórie relativity tvrdenia 16.1.2 platí V = [aaa]⊕[aaa]⊥ . Na [aaa]⊥ sa budeme dívať ako na euklidovský priestor vybavený skalárnym súčinom − xxx,yyy a normou xxx = − xxx,xxx . Uvedomme si, že okamžité fyzikálne priestory ppp+[aaa]⊥ nášho inerciálneho pozorovateľa sú vlastne tvorené tým istým euklidovským priestorom [aaa]⊥ „unášaným tokom jeho času pozdĺž jeho svetočiary a dohromady vytvárajú celý Minkowského časopriestor V = ppp + [aaa] + [aaa]⊥ . Všetky udalosti v okamžitom fyzikálnom priestore ppp + [aaa]⊥ sa z hľadiska príslušného inerciálneho pozorovateľa odohrávajú súčasne. On sám však nemá ako odlíšiť svoj stav od kľudu, teda preňho je jeho okamžitý fyzikálny priestor stále ten istý a splýva so zameraním [aaa]⊥ jeho okamžitého fyzikálneho priestoru. Preto [aaa]⊥ predstavuje subjektívny fyzikálny priestor inerciálneho pozorovateľa so svetočiarou WL(ppp,aaa). Pre inerciálneho pozorovateľa s iným časovým vektorom bbb /∈ [aaa] však platí [aaa]⊥ = [bbb]⊥ , čiže udalosti súčasné pre jedného z nich sa tak nemusia javiť druhému. Tento jav, označovaný ako relativita súčasnosti, je vari zo všetkých dôsledkov teórie relativity najťažšie uviesť do súladu s našou každodennou skúsenosťou a „zdravým rozumom . Pre časový vektor aaa = 0 v R(1,1) je [aaa]⊥ priamka súmerne združená s priamkou [aaa] podľa osi x0 = x1 (alebo, čo je to isté, podľa osi x0 = −x1). Teda okrem prípadu, keď aaa leží v smere osi x0, priamky [aaa], [aaa]⊥ nie sú na seba euklidovsky kolmé. (Pozri obrázok 16.5.) Ako cvičenie si rozmyslite, ako je rovina [aaa]⊥ „súmerne združená s priamkou [aaa] podľa svetelného kužeľa v R(1,2) . 16.5 Inerciálne bázy a vzťažné sústavy Nech aaa0 je ľubovoľný časový šíp a (aaa1, . . . ,aaan) je nejaká ortonormálna báza podpriestoru [aaa0]⊥ . Potom ααα = (aaa0,aaa1, . . . ,aaan) je zrejme ortonormálna báza pseudoeuklidovského priestoru V s Gramovou maticou GGG(ααα) = diag(1, −IIIn), nazývanou tiež Minkowského symbol alebo Minkowského metrický tenzor. Takúto bázu nazývame inerciálnou bázou inerciálneho pozorovateľa s časovým šípom aaa0 a k nej prislúchajúcu sústavu súradníc nazývame inerciálnou súradnou sústavou prípadne inerciálnou vzťažnou sústavou. Všimnite si, že – na rozdiel od časového šípu aaa0 – priestorové vektory aaa1, . . . ,aaan uvedenej bázy nie sú určené jednoznačne, teda vo všeobecnosti existuje mnoho rôznych inerciálnych báz spojených s daným inerciálnym pozorovateľom. Ak ααα je inerciálna báza vo V , tak pre udalosti xxx,yyy ∈ V so súradnicami (xxx)ααα = (x0, x1, . . . , xn)T , (yyy)ααα = (y0, y1, . . . , yn)T platí xxx,yyy = x0y0 − x1y1 − . . . − xnyn, čiže pseudoskalárny súčin vo V nadobúda tvar štandardného pseudoskalárneho súčinu v R(1,n) . 16.6. Paradox dvojčiat 329 Fyzikálne si pod šípom času aaa0 inerciálnej bázy (aaa0,aaa1, . . . ,aaan) treba predstaviť hodinky a pod priestorovými vektormi aaa1, . . . ,aaan sústavu n očíslovaných navzájom kolmých kovových tyčí jednotkovej dĺžky pevne zvarených v jednom spoločnom koncovom bode, ktoré slúžia na fixovanie jednotlivých súradných osí a meranie vzdialeností v ich smeroch (v „našom časopriestore, samozrejme, n = 3). Zaviesť inerciálnú vzťažnú sústavu v Minkowského časopriestore znamená vybaviť každého jedného trpaslíka podriadeného príslušnému dispečerovi hodinkami a sústavou takýchto tyčí. Navyše všetky hodinky jednotlivých trpaslíkov musia byť navzájom synchronizované a sústavy ich tyčí paralelizované a zhodne orientované. Nasledujúce zrejmé tvrdenie dodáva ďalšie oprávnenie spôsobu, akým sme definovali súčasnosť, okamžité fyzikálne priestory a subjektívny priestor inerciálneho pozorovateľa. 16.5.1. Tvrdenie. Nech ααα = (aaa0,aaa1, . . . ,aaan) je inerciálna báza pozorovateľa s časovým šípom aaa0. Potom udalosti xxx,yyy ∈ V so súradnicami (xxx)ααα = (x0, x1, . . . , xn)T , (yyy)ααα = (y0, y1, . . . , yn)T sú súčasné z hľadiska tohto pozorovateľa práve vtedy, keď x0 = y0, t. j. xxx a yyy sú súčasné udalosti vzhľadom na vzťažnú sústavu ααα. 16.6 Paradox dvojčiat Náš výklad začneme malým doplnkom k obrátenej Cauchyho-Schwartzovej nerovnosti z tvrdenia 16.1.4. 16.6.1. Tvrdenie. Nech V je Minkovského časopriestor a aspoň jeden z vektorov uuu,vvv ∈ V je časový. Potom uuu,vvv 2 ≥ uuu,uuu vvv,vvv , pričom rovnosť nastane práve vtedy, keď vektory uuu, vvv sú lineárne závislé. Dôkaz, Nech napr. uuu = 0 je časový vektor. Potom [uuu] je maximálny kladne definitný lineárny podpriestor vo V , teda [uuu]⊥ je záporne definitný podpriestor podľa tvrdenia 16.1.3 a V = [uuu]⊕[uuu]⊥ podľa tvrdenia 16.1.2. Preto vvv = auuu+zzz pre jednoznačne určený skalár a a vektor zzz ∈ [uuu]⊥ . Z úvah o ortogonalizácii, prípadne priamym výpočtom dostaneme |GGG(uuu,vvv)| = |GGG(uuu,zzz)| = uuu,uuu zzz,zzz . Z toho vyplýva, že podpriestor [uuu,vvv] = [uuu,zzz] je singulárny práve vtedy, keď zzz = 0, t. j. práve vtedy, keď uuu, vvv sú lineárne závislé. Preto ak uuu, vvv sú lineárne nezávislé, tak podpriestor [uuu,vvv] je indefinitný, a požadovaný záver vyplýva z tvrdenia 16.1.4 (c). 330 16. Úvod do špeciálnej teórie relativity Dôsledkom práve dokázaného tvrdenia je nasledujúca „obrátená trojuholníková nerovnosť . 16.6.2. Dôsledok. Nech uuu, vvv sú súhlasne orientované časové vektory v Minkovského časopriestore V . Potom aj uuu + vvv je časový vektor a platí uuu + vvv ≥ uuu + vvv , pričom rovnosť nastane práve vtedy, keď uuu, vvv sú lineárne závislé. Dôkaz. Keďže uuu,vvv > 0, priamym výpočtom dostávame uuu + vvv,uuu + vvv = uuu,uuu + 2 uuu,vvv + vvv,vvv ≥ uuu 2 + 2 uuu vvv + vvv 2 = uuu + vvv 2 , pričom rovnosť zrejme nastane práve vtedy, keď uuu,vvv 2 = uuu,uuu vvv,vvv . Predstavme si teraz v Minkowského časopriestore dvoch trpaslíkov-dvojčatá. Nazvime ich trebárs Kýblik a Spachtoš. Spachtoš je inerciálny a celý čas nášho rozprávania prespí doma. Kýblik sa zatiaľ vyberie na vesmírny výlet raketou. Nejaký čas sa vzďaľuje rovnomerne zrýchleným pohybom, po dosiahnutí istej dosť veľkej rýchlosti sa dlho pohybuje rovnomerne priamočiaro, potom začne brzdiť a po dosiahnutí nulovej rýchlosti obráti svoju vesmírnu loď a začne sa vracať domov na Zem – najprv rovnomerne zrýchleným pohybom naberie istú veľkú rýchlosť, ktorou potom dlho letí rovnomerne priamočiaro, a keď sa priblíži k Zemi, začne brzdiť, až napokon pristane doma na priedomí, kde ho už čaká Spachtoš, ktorý sa práve zobudil a vyšiel von nadýchať sa čerstvého vzduchu. Ukážeme si, že Kýblik je po návrate mladší než Spachtoš, čiže z jeho hľadiska uplynul kratší čas než z hľadiska jeho spiaceho brata. Príslušné úseky svetočiar oboch bratov sú znázornené na obrázku vľavo. Kým Spachtošov úsek je časťou inerciálnej svetočiary, Kýblikov úsek je neinerciálny – parabolicky zakrivené úseky zodpovedajú zrýchľovaniu resp. brzdeniu rakety, priame letu stálou rýchlosťou. Ak zrýchľovanie a brzdenie trvá v porovnaní s rovnomerným priamočiarym letom zanedbateľne krátko, príslušný úsek Kýblikovej svetočiary možno pre naše účely dostatočne presne aproximovať (fyzikálne neuskutočniteľnou) lomenou svetočiarou na obrázku vpravo. Jej úseky zodpovedajú vektorom uuu, vvv. Spachtošov úsek potom zodpovedá vektoru uuu + vvv. Zo Spachtošovho pohľadu uplynie čas uuu + vvv , kým z Kýblikovho uuu + vvv . Keďže, ako (u)vidíme, uuu, vvv sú súhlasne orientované časové vektory, podľa práve dokázaného dôsledku platí uuu +vvv ≥ uuu + vvv . Celú situáciu možno popísať v R(1,1) . Ak si označíme v veľkosť rýchlosti Kýblikovej rakety v rovnomerných priamočiarych úsekoch, a t čas Spachtošovho spánku, máme uuu = (t/2, vt/2), vvv = (t/2, −vt/2), uuu + vvv = (t, 0) a 16.7. Relatívna rýchlosť dvoch inerciálnych pozorovateľov 331 Obr. 16.6. Svetočiaty spiaceho a cestujúceho dvojčaťa uuu,vvv = t2 (1 + v2 )/4 > 0, čiže uuu, vvv sú súhlasne orientované. Jednoduchým výpočtom možno dostať presnejší odhad uuu + vvv = t √ 1 − v2 < t = uuu + vvv . Pomer vlastných časov oboch bratov teda závisí na rýchlosti v. Názvom paradox dvojčiat sa zvykne označovať zdanlivý rozpor, ktorý vzniká, ak sa na uvedenú situáciu pokúšame neuvážene aplikovať relativistický princíp ekvivalencie ľubovoľných inerciálnych sústav. Ak totiž zabudneme, že Kýblikova svetočiara je neinerciálna, a začneme celú situáciu posudzovať z jeho hľadiska, vyjde nám, že by nakoniec mal byť mladší vzhľadom na Kýblika sa pohybovavší Spachtoš. K tejto otázke sa ešte vrátime v paragrafe 16.8, venovanom dilatácii času. 16.7 Relatívna rýchlosť dvoch inerciálnych pozorovateľov Uvažujme dvoch inerciálnych pozorovateľov so svetočiarami WL(ppp,aaa), WL(qqq,bbb) v Minkowského časopriestore V , a kvôli jednoduchosti predpokladajme, že vektory aaa, bbb sú ich šípy času, t. j. aaa,aaa = bbb,bbb = 1. Svetočiara WL(qqq,bbb) druhého inerciálneho pozorovateľa pretína okamžitý fyzikálny priestor ppp + taaa + [aaa]⊥ prvého pozorovateľa vo svetobode qqq + t bbb, kde t nájdeme z podmienky (qqq + t bbb) − (ppp + taaa) ∈ [aaa]⊥ , čiže 0 = aaa,qqq +t bbb−ppp−taaa = aaa,bbb t + aaa,qqq −ppp − aaa,aaa t = aaa,bbb t + aaa,qqq −ppp −t. Z toho vyplýva t = t − aaa,qqq − ppp aaa,bbb . 332 16. Úvod do špeciálnej teórie relativity Z pohľadu prvého inerciálneho pozorovateľa, t. j. v jeho subjektívnom fyzikálnom priestore [aaa]⊥ , tomuto okamihu zodpovedá poloha (qqq + t bbb) − (ppp + taaa) = (qqq − ppp) − aaa,qqq − ppp aaa,bbb bbb + t aaa,bbb bbb − taaa druhého inerciálneho pozorovateľa. Nejakému časovému intervalu ∆t = t2 − t1 prvého inerciálneho pozorovateľa tak zodpovedá časový interval ∆t = t2 − t1 = t2 − t1 aaa,bbb = ∆t aaa,bbb druhého z nich. Za ten čas sa poloha druhého pozorovateľa v subjektívnom fyzikálnom priestore [aaa]⊥ prvého zmení o priestorový vektor ∆t aaa,bbb −1 bbb − aaa ∈ [aaa]⊥ . Priestorový vektor vvv = aaa,bbb −1 bbb − aaa ∈ [aaa]⊥ potom prirodzene predstavuje rýchlosť, akou sa druhý inerciálny pozorovateľ pohybuje v subjektívnom fyzikálnom priestore prvého. Keďže vvv nezávisí od času t, pohyb druhého inerciálneho pozorovateľa sa prvému skutočne javí ako rovnomerný priamočiary. Pre veľkosť tejto rýchlosti platí v = vvv = − vvv,vvv = − aaa,bbb −2 bbb,bbb + 2 − aaa,aaa = 1 − aaa,bbb −2. Teda veľkosť v rýchlosti, ktorou sa z pohľadu prvého inerciálneho pozorovateľa pohybuje druhý z nich, možno vyjadriť pomocou pseudoskalárneho súčinu aaa,bbb ich časových šípov aaa, bbb. Taktiež naopak, pseudoskalárny súčin aaa,bbb možno až na znamienko vyjadriť pomocou veľkosti relatívnej rýchlosti v: | aaa,bbb | = 1 √ 1 − v2 , v čom čitateľ asi spozná známy Lorentzov koeficient, hoci vo fyzike ho častejšie zapisujeme v tvare 1√ 1−(v/c)2 , kde c je rýchlosť svetla. Zrejme postulát medznej hodnoty rýchlosti svetla je ekvivalentný s požiadavkou reálnosti a konečnosti tohto výrazu. Ak navyše prijmeme prirodzený predpoklad, že aaa, bbb sú súhlasne orientované, dostaneme aaa,bbb = 1 √ 1 − v2 . 16.7. Relatívna rýchlosť dvoch inerciálnych pozorovateľov 333 Ešte podotknime, že ak by sme si na začiatku nezjednodušili život podmienkou aaa,aaa = bbb,bbb = 1, čiže za aaa, bbb by sme si vzali ľubovoľné súhlasne orientované časové vektory, poslednú rovnosť by sme dostali v tvare aaa,bbb aaa bbb = 1 √ 1 − v2 , čo na základe analógie s euklidovskými priestormi navodzuje myšlienku, že Lorentzov koeficient predstavuje „kosínus akéhosi „pseudouhla vektorov aaa, bbb. Keďže je však uvedený výraz vždy ≥ 1, o obyčajný kosínus uhla ísť nemôže. Zvyšok paragrafu je venovaný upresneniu týchto úvah. Z Eulerových vzťahov eiα = cos α + i sin α, e−iα = cos α − i sin α, ktoré tu nebudeme odvodzovať, vyplývajú nasledujúce vyjadrenia goniometrických funkcií pomocou exponenciály imaginárneho argumentu cos α = eiα + e−iα 2 , sin α = eiα − e−iα 2i pre ľubovoľné α ∈ R. Funkcie hyperbolický kosínus a hyperbolický sínus sú definované reálnou analógiou uvedených rovností cosh θ = eθ + e−θ 2 , sinh θ = eθ − e−θ 2 pre ľubovoľné θ ∈ R. Všetko, čo potrebujeme v tejto chvíli vedieť, je jednotkový vzťah cosh2 θ − sinh2 θ = 1 (overte si samostatne jednoduchým výpočtom), z ktorého vyplýva, že všetky dvojice (cosh θ, sinh θ) ležia na jednej vetve rovnoosej hyperboly x2 − y2 = 1, (x ≥ 1), a že každý bod (x, y) tejto vetvy má uvedený tvar. Naozaj, stačí položiť θ = ln(x + y). Druhá vetva (x ≤ −1) tejto hyperboly je tvorená dvojicami (− cosh θ, sinh θ), pre θ ∈ R. Pre súhlasne orientované časové vektory aaa, bbb potom existuje jednoznačne určené reálne číslo θ, nazývané tiež hyperbolický uhol vektorov aaa, bbb, také, že cosh θ = aaa,bbb aaa bbb = 1 √ 1 − v2 , sinh θ = −|GGG(aaa,bbb)| aaa bbb = v √ 1 − v2 . Explicitné vyjadrenie pre θ je θ = ln aaa,bbb + −|GGG(aaa,bbb)| aaa bbb = ln 1 + v 1 − v . 334 16. Úvod do špeciálnej teórie relativity 16.8 Relativistická dilatácia času Ako sme odvodili v predošlom paragrafe, pre časový úsek ∆t druhého inerciálneho pozorovateľa, ktorý zodpovedá časovému úseku ∆t s ním súhlasne orientovaného prvého pozorovateľa, platí ∆t = ∆t aaa,bbb = ∆t √ 1 − v2, teda ∆t ≤ ∆t, pričom rovnosť nastane práve vtedy, keď v = 0, čo je ekvivalentné s rovnosťou aaa,bbb = 1, a na základe tvrdenia 16.1.4 s lineárnou závislosťou časových šípov aaa, bbb, čo v tomto prípade znamená aaa = bbb. Z hľadiska prvého pozorovateľa, ktorý sám seba považuje za nehybného, tak medzi dvoma okamihmi t1 a t2 uplynie dlhší čas, než z hľadiska druhého pozorovateľa medzi okamihmi t1, t2, v ktorých sa tento pozorovateľ nachádza v okamžitých fyzikálnych priestoroch ppp + t1aaa + [aaa]⊥ , resp. ppp + t2aaa + [aaa]⊥ prvého. Tento efekt sa nazýva relativistické spomalenie, prípadne relativistická dilatácia času. V uvedenej rovnosti sa však skrýva zdanlivý paradox, niekedy nazývaný paradox času. Z matematických dôvodov symetrie ako aj z fyzikálnych dôvodov rovnocennosti inerciálnych sústav by malo takisto platiť ∆t = ∆t aaa,bbb = ∆t √ 1 − v2, teda ∆t ≤ ∆t . Potom nevyhnutne ∆t = ∆t , v = 0 a aaa,bbb = 1, t. j. aaa = bbb pre ľubovoľné súhlasne orientované časové šípy aaa, bbb, čo je zrejmý nezmysel. Teda niekde v našich úvahách je asi chyba. Odhaliť ju nie je až také ťažké. Časový okamih prvého inerciálneho pozorovateľa, zodpovedajúci časovému okamihu t druhého inerciálneho pozorovateľa z pohľadu druhého pozorovateľa, nie je pôvodný okamih t, ale okamih t = t − bbb,ppp − qqq aaa,bbb = t − aaa,qqq − ppp + aaa,bbb bbb,ppp − qqq aaa,bbb 2 . Teda časovému intervalu ∆t = t2 − t1 druhého inerciálneho pozorovateľa zodpovedá z jeho pohľadu časový interval ∆t = ∆t aaa,bbb = ∆t aaa,bbb 2 , a nie ∆t, prvého pozorovateľa. Situácia pre špeciálny prípad ppp = qqq = 0, t1 = 0, t2 = t = ∆t je znázornená na obrázku v R(1,1) . Na obrázku nám asi udrie do očú, že dĺžka vektora t bbb je väčšia ako dĺžka vektora taaa, aj keď t bbb = t = t √ 1 − v2 < t = taaa . Nezaškodí preto znova 16.8. Relativistická dilatácia času 335 Obr. 16.7. Relativistická dilatácia času pripomenúť, že vzdialenosti, ktoré nám vnucuje obrázok, sú euklidovské, netreba ich preto brať vážne – geometria Minkowského časopriestoru je totiž neeuklidovská. Z hľadiska tejto geometrie sú rovnako dlhé napr. vektory taaa a tbbb (ich „konce ležia na tej istej hyperbole). Experimentálny dôkaz dilatácie času poskytujú µ-mezóny, zvané tiež mióny (niečo ako „ťažké elektróny ) – elementárne častice s veľmi krátkou priemernou dobou života (asi 2, 2 · 10−6 s). Mióny vznikajú vplyvom primárneho kozmického žiarenia v horných vrstvách atmosféry (t. j. vo výškach 10 a viac km) a prilietajú veľkými rýchlosťami (až 0, 998 rýchlosti svetla) na zemský povrch. Za čas 2, 2 · 10−6 s by však ani rýchlosťou svetla c ≈ 300 000 km s−1 nemali preletieť viac než 660 m. Z hľadiska pozemského pozorovateľa však času ∆t v sústave letiaceho miónu zodpovedá čas ∆t = ∆t / √ 1 − v2, kde v je jeho rýchlosť v pomere k rýchlosti svetla. Namerané hodnoty priemernej doby života miónov pri rôznych rýchlostiach (či už v kozmických lúčoch alebo v pozemských urýchľovačoch) sa so značnou presnosťou zhodujú s uvedeným vzťahom. Napríklad vlastnému času 2, 2 · 10−6 s v sústave miónu letiaceho rýchlosťou 0, 998 c, zodpovedá v sústave pozemského pozorovateľa čas asi 34, 8 · 10−6 s, za ktorý mión preletí dráhu približne 10, 4 km. Všimnite si, že vo formule pre dilatáciu času vystupuje rovnaký koefi- cient √ 1 − v2 ako v približnom kvantitatívnom odhade z paradoxu dvojčiat. Navyše dilatácia času je – popri neinerciálnosti Kýblikovej svetočiary – naozaj spoluzodpovedná za jeho „pomalšie starnutie . To sú dôvody, pre ktoré sa oba tieto efekty často pletú. Ešte stále sa možno z času na čas stretnúť s naivnou kritikou špeciálnej teórie relativity, ktorá si berie na mušku práve paradox dvojčiat a používa pri tom už spomínaný argument, akým možno zdanlivo spochybniť dilatáciu času: „Keďže pohyb je relatívny, môžeme rovnako dobre z Kýblikovho hľadiska považovať Spachtoša za pohybujúceho sa a Kýblika za nehybného. Potom by mal viac zostarnúť Kýblik. Podobná symetria tu však nemá miesto. Aby sa mohli Kýblik a Spachtoš, opisujúci 336 16. Úvod do špeciálnej teórie relativity najprv tú istú svetočiaru, rozdeliť a potom opäť stretnúť, musí sa (aspoň) jeden z nich v istých úsekoch svojej svetočiary „zneinerciálniť , t. j. pohybovať sa so zrýchlením. Rozdiel medzi inerciálnou Spachtošovou a neinerciálnou Kýblikovou svetočiarou má tak – v protiklade k našim inerciálnym pozorovateľom z tohto paragrafu – absolútny charakter a rozdiel veku sa pri stretnutí oboch bratov prejaví „hmatateľne . Tento efekt bol potvrdený aj experimentálne – neexperimentovalo sa však s dvojčatami ale s veľmi presnými hodinami, merajúcimi čas pomocou oscilácií v elektrónovom obale atómov cézia. Štvoro céziových hodín obletelo Zem v dvoch prúdových lietadlách – dvojo v smere od západu na východ, dvojo v smere od východu na západ – a po prílete ich porovnali s referenčnými hodinami, ktoré zostali „doma v Námornom observatóriu v USA. Namerané časové rozdiely sa veľmi dobre zhodovali s hodnotami predpovedanými teóriou. Poznamenajme však, že vzhľadom na účinky rotácie a gravitačného poľa Zeme je reálna situácia podstatne zložitejšia než náš umelý príklad s Kýblikom a Spachtošom, a jej matematický popis si vyžaduje i čo-to zo všeobecnej teórie relativity. V skutočnosti v porovnaní s pozemskými hodinami „omladli len hodiny, ktoré leteli smerom na východ – o (59±10)·10−9 s; naopak hodiny, ktoré leteli na západ, v porovnaní s pozemskými hodinami dokonca „zostarli o (273 ± 7) · 10−9 s. Teoretická predpoveď dávala hodnoty (40 ± 23) · 10−9 s, resp. (275 ± 21) · 10−9 s. 16.9 Lorentzova transformácia Vráťme sa ešte raz k našim inerciálnym pozorovateľom v Minkowského časopriestore V so súhlasne orientovanými časovými šípmi aaa, bbb. Označme aaa0 = aaa, bbb0 = bbb a predpokladajme, že ααα = (aaa0,aaa1, . . . ,aaan), βββ = (bbb0,bbb1, . . . ,bbbn) sú ich inerciálne bázy. Lorentzova transformácia z inerciálnej bázy βββ do inerciálnej bázy ααα je transformácia súradníc vzhľadom na tieto bázy, t. j. lineárne zobrazenie ϕ: R(1,n) → R(1,n) také, že (uuu)ααα = ϕ (uuu)βββ pre každé uuu ∈ V , alebo, čo je to isté, ααα · ϕ(xxx) = βββ · xxx pre každé xxx ∈ R(1,n) (stačí položiť xxx = (uuu)βββ). Z uvedených vzťahov okamžite vidno, že Lorentzova transformácia ϕ je danými bázami ααα, βββ jednoznačne určená a jej matica vzhľadom na kanonickú ortonormálnu bázu εεε = (eee0,eee1, . . . ,eeen) v R(1,n) je zároveň maticou prechodu z bázy βββ do bázy ααα, t. j. (ϕ)εεε,εεε = PPPααα,βββ. 16.9. Lorentzova transformácia 337 16.9.1. Tvrdenie. Nech ϕ je Lorentzova transformácia z inerciálnej bázy βββ do inerciálnej bázy ααα v Minkowského časopriestore V . Potom pre ľubovoľné vektory xxx,yyy ∈ R(1,n) platí ϕxxx, ϕyyy = xxx,yyy . Inými slovami, Lorentzova transformácia zachováva štandardný pseudoskalárny súčin. Dôkaz. Nech xxx,yyy ∈ R(1,n) . Vzhľadom na inerciálnosť báz ααα, βββ platí ϕxxx, ϕyyy = ααα · ϕxxx, ααα · ϕyyy = βββ · xxx, βββ · yyy = xxx,yyy , pričom v dvoch krajných výrazoch ide o štandardný pseudoskalárny súčin v R(1,n) , kým v dvoch vnútorných výrazoch o pseudoskalárny súčin vo V . Ak ϕ je Lorentzova transformácia z inerciálnej bázy βββ do inerciálnej bázy ααα, ktoré prislúchajú svetočiaram WL(bbb,qqq) resp. WL(ppp,aaa), pričom naši pozorovatelia si za počiatky odpočtu svojich súradníc zvolili udalosti qqq resp. ppp, tak vzťah medzi súradnicami ľubovoľnej udalosti zzz ∈ V v takto zvolených inerciálnych súradných systémoch udáva afinná transformácia (zzz − ppp)ααα = ϕ(zzz − qqq)βββ, nazývaná tiež Poincarého transformáciou. Preniknúť do štruktúry Lorentzových transformácií možno tak, že popíšeme štruktúru ich matíc. To je vo všeobecnom prípade pomerne náročná úloha. Ukážeme si však, že dané súhlasne orientované časové šípy aaa = aaa0, bbb = bbb0 možno vždy vhodne doplniť do inerciálnych báz ααα = (aaa0,aaa1, . . . ,aaan), βββ = (bbb0,bbb1, . . . ,bbbn) tak, že vzhľadom na ne má matica Lorentzovej transformácie z βββ do ααα obzvlášť jednoduchý a prehľadný tvar PPPααα,βββ = diag(LLLv,IIIn−1), kde LLLv ∈ R2×2 je matica Lorentzovej transformácie Minkowského časopriestoru R(1,1) , ktorej prvky možno vyjadriť výlučne pomocou veľkosti v relatívnej rýchlosti uvažovaných inerciálnych pozorovateľov. V takom prípade hovoríme o tzv. špeciálnej Lorentzovej transformácii. 4 Ak aaa = bbb, nájdeme ľubovoľnú ortonormálnu bázu ααα = βββ časopriestoru V s prvým členom aaa0 = bbb0. Lorentzova transformácia z βββ do ααα je potom identické zobrazenie s maticou PPPααα,βββ = IIIn+1. Ak aaa = bbb, tak ide o nezávislé vektory. V dôkaze tvrdenia 16.1.4 sme ukázali, že [aaa,bbb] je indefinitný podpriestor vo V . Preto existuje aaa1 ∈ [aaa,bbb] také, že (aaa0,aaa1) je ortonormálna báza podpriestoru [aaa,bbb]. Potom nevyhnutne aaa1 ∈ [aaa]⊥ je priestorový vektor. Rovnako existuje bbb1 ∈ [aaa,bbb] ∩ [bbb]⊥ také, že 4 V anglojazyčnej literatúre sa požíva tiež názov boost (pozri paragraf 29.5). 338 16. Úvod do špeciálnej teórie relativity (bbb0,bbb1) je ortonormálna báza podpriestoru [aaa,bbb]. Ak si označíme aaa2 = bbb2, . . . , aaan = bbbn ľubovoľnú ortonormálnu bázu záporne definitného podpriestoru [aaa,bbb]⊥ , tak ααα = (aaa0,aaa1, . . . ,aaan) a βββ = (bbb0,bbb1, . . . ,bbbn) sú inerciálne bázy, ktoré majú posledných n−1 členov rovnakých. Ich matica prechodu má tvar PPPααα,βββ = diag(PPPaaa,bbb,IIIn−1), kde PPPaaa,bbb ∈ R2×2 označuje maticu prechodu z bázy [bbb0,bbb1] do bázy [aaa0,aaa1], ktorú vyjadríme explicitne. Na ten účel stačí poznať vektory aaa1, bbb1. V paragrafe 16.7 sme odvodili tvar vektora vvv rýchlosti, ktorou sa v subjektívnom fyzikálnom priestore inerciálneho pozorovateľa s časovým šípom aaa pohybuje inerciálny pozorovateľ s časovým šípom bbb: vvv = aaa,bbb −1 bbb − aaa. Keďže vvv ∈ [aaa,bbb] ∩ [aaa]⊥ a dim [aaa,bbb] ∩ [aaa]⊥ = 1, stačí položiť aaa1 = v−1 vvv = aaa,bbb −1 bbb − aaa 1 − aaa,bbb −2 = bbb − aaa,bbb aaa aaa,bbb 2 − 1 , kde v = vvv = 1 − aaa,bbb −2. S využitím symetrie úlohy možno písať bbb1 = − aaa,bbb −1 aaa + bbb 1 − aaa,bbb −2 = −aaa + aaa,bbb bbb aaa,bbb 2 − 1 . Z rovnosti pre aaa1 si vyjadríme bbb0 = bbb = aaa,bbb aaa0 + aaa,bbb 2 − 1aaa1, čo po dosadení do rovnosti pre bbb1 a malých úpravách dáva bbb1 = aaa,bbb 2 − 1aaa0 + aaa,bbb aaa1. To znamená, že (bbb0,bbb1) = (aaa0,aaa1) ·   aaa,bbb aaa,bbb 2 − 1 aaa,bbb 2 − 1 aaa,bbb   . Ak si ešte spomenieme na vzťah medzi pseudoskalárnym súčinom aaa,bbb a veľkosťou rýchlosti v, dostaneme dvojaké vyjadrenie matice prechodu PPPaaa,bbb alias Lorentzovej transformácie LLLv: PPPaaa,bbb =   aaa,bbb aaa,bbb 2 − 1 aaa,bbb 2 − 1 aaa,bbb   =    1 √ 1 − v2 v √ 1 − v2 v √ 1 − v2 1 √ 1 − v2    = LLLv. 16.9. Lorentzova transformácia 339 Obr. 16.8. Lorentzenova transformácia z inerciálnej bázy (bbb0,bbb1) Po substitúcii θ = ln (1 + v)/(1 − v) dostávame ešte tretie vyjadrenie v tvare tzv. hyperbolickej rotácie RRRhhhθ = cosh θ sinh θ sinh θ cosh θ = PPPaaa,bbb = LLLv. Všimnite si, že pre aaa = bbb, čiže v = 0, θ = 0, dostávame PPPaaa,aaa = LLL0 = RRRhhh0 = III2, čo je v zhode so skôr prijatým riešením tohto špeciálneho prípadu. Všeobecný prípad je znázornený na obrázku. Z fyzikálneho hľadiska je najdôležitejšia signatúra (1, 3), t. j. n = 3, kedy sa Lorentzova transformácia súradníc vzhľadom na inerciálne bázy ααα, βββ obvykle uvádza v jednom z nasledujúcich tvarov: x0 = ct = x0 + (v/c)x1 1 − (v/c)2 = ct + (v/c)x1 1 − (v/c)2 , x1 = (v/c)x0 + x1 1 − (v/c)2 = vt + x1 1 − (v/c)2 , x2 = x2, x3 = x3, kde c je rýchlosť svetla, v je relatívna rýchlosť pohybu pozorovateľov s inerciálnymi bázami ααα a βββ v smere osi x1 a (x0 =ct, x1, x2, x3)T , (x0 =ct , x1, x2, x3)T sú časopriestorové súradnice ľubovoľnej udalosti vzhľadom na bázy ααα resp. βββ. Ešte raz však pripomíname, že takýto pomerne jednoduchý tvar má Lorentzova transformácia len pri „správnej voľbe priestorových vektorov oboch báz. 340 16. Úvod do špeciálnej teórie relativity 16.10 Relativistická kontrakcia dĺžky Pomocou Lorentzovej transformácie možno jednoducho odvodiť ďalší zo známych relativistických efektov. Nech WL(ppp,aaa), WL(qqq,bbb) sú súhlasne orientované svetočiary inerciálnych pozorovateľov a ααα = (aaa0,aaa1,aaa2, . . . ,aaan), resp. βββ = (bbb0,bbb1,bbb2, . . . ,bbbn) sú s nimi spojené inerciálne bázy zvolené tak, ako v predchádzajúcom paragrafe, t. j. Lorentzova transformácia ϕ z βββ do ααα má maticu tvaru diag(LLLv,IIIn−1). Predpokladajme, že prvý pozorovateľ registruje nehybnú pevnú tyč dĺžky l > 0 v smere vektora aaa1. Matematicky ide o priestorový vektor laaa1 prebiehajúci postupom času okamžité fyzikálne priestory ppp + taaa + [aaa]⊥ ; jeho súradnice v okamihu t vzhľadom na bázu ααα a počiatok ppp sú (t, l, 0, . . . , 0)T . Dĺžka tejto tyče sa druhému pozorovateľovi javí ako dĺžka l = uuu = − uuu,uuu , vektora uuu, ktorý leží v jeho subjektívnom fyzikálnom priestore [bbb]⊥ (čo značí, že pri jeho ľubovoľnom umiestnení sú oba jeho konce súčasné udalosti vzhľadom na bázu βββ) a spĺňa podmienku (taaa0 + laaa1)ααα = (t, l, 0, . . . , 0) = ϕ (uuu)βββ pre nejaký okamih t vlastného času sústavy ααα. Keďže uuu ∈ [bbb]⊥ , jeho súradnice majú tvar (uuu)βββ = (0, x1, x2, . . . , xn)T a z podmienky pre ich Lorentzovu transformáciu okamžite vidíme, že x2 = . . . = xn = 0, ako aj t l = LLLv · 0 x1 = x1 √ 1 − v2 v 1 . Potom zrejme l = x1 a konečne dostávame ohlásený vzťah medzi dĺžkami tyče v oboch inerciálnych sústavách: l = l √ 1 − v2 ≥ l , pričom rovnosť nastane práve vtedy, keď v = 0, teda dĺžka tyče sa javí najväčšia v tej inerciálnej sústave, vzhľadom na ktorú je tyč nehybná. Tento jav sa nazýva relativistické skrátenie alebo tiež relativistická kontrakcia dĺžky v smere pohybu. Nasledujúci obrázok, ktorý znázorňuje situáciu v R(1,1) , je plne analogický obrázku znázorňujúcemu relativistickú dilatáciu času. Opäť sa na ňom stretáme s disproporciou euklidovskej a Minkowského dĺžky vektorov l bbb1 a laaa1. Ešte si všimnime, že onen okamih t vlastného času v sústave ααα je jednoznačne určený: t = l v √ 1 − v2 = lv. Cvičenia 341 Obr. 16.9. Relativistická kontrakcia dĺžky Uvedená formulka je však lepšie čitateľná v obvyklom fyzikálnom tvare ct = v l c . Inak povedané, za čas t preletí svetlo rovnakú vzdialenosť, akú urazíme rýchlosťou v za čas, ktorý potrebuje svetlo na prekonanie vzdialenosti l. Zrejme pre tyč „bežných rozmerov je čas t enormne malý. Cvičenia 16.1. Nech aaa, bbb sú nenulové vektory v Minkowského časopriestore V . Dokážte nasledujúce tvrdenia: (a) Ak aaa, bbb sú časové vektory tak aaa,bbb = 0. (b) Ak aaa, bbb sú lineárne nezávislé svetelné vektory, tak aaa,bbb = 0. (c) Ak aaa je časový a bbb je svetelný vektor, tak aaa,bbb = 0. 16.2. (a) Nenulové svetelné vektory uuu, vvv v Minkowského časopriestore V nazveme súhlasne orientovanými, ak existuje časový vektor aaa taký, že aaa, uuu aj aaa, vvv sú súhlasne orientované. Dokážte, že nenulové svetelné vektory uuu, vvv sú súhlasne orientované práve vtedy, keď uuu,vvv > 0 alebo existuje kladný skalár s ∈ R taký, že uuu = svvv. (b) Dokážte, že Minkowského časopriestor R(1,n) má bázu pozostávajúcu zo samých navzájom súhlasne orientovaných svetelných vektorov. Vypočítajte jej Gramovú maticu a vysvetlite, prečo žiadne dva vektory takejto bázy nemôžu byť ortogo- nálne. (c) Dokážte, že v R(1,n) existuje n-rozmerný singulárny podpriestor. (Návod: Uvažujte zároveň štandardný euklidovský skalárny súčin v Rn+1 a vezmite euklidovský ortokomplement nejakého svetelného vektora.) Aká je signatúra pseudoskalárneho súčinu zúženého na tento podpriestor? 16.3. Doplňte chýbajúce výpočty v dôkazoch tvrdení 16.3.1 a 16.4.1. 342 16. Úvod do špeciálnej teórie relativity 16.4. Nech aaa je časový vektor v R(1,n) a S = [aaa]⊥ je k nemu prislúchajúci subjektívny fyzikálny priestor. Označme aaaS euklidovský kolmý priemet vektora aaa do podpriestoru S a M ľubovoľnú z dvojice priamok, ktoré tvoria prienik [aaa,aaaS]∩LC(0). Dokážte, že priamky [aaa], [aaaS] sú (v euklidovskom zmysle) sssúmerne združené podľa priamky M. 16.5. Načrtnite grafy funkcií β(v) = 1√ 1−v2 a 1/β(v) = √ 1 − v2 pre −1 < v < 1. Pri akej hodnote rýchlosti v dôjde k relativistickému skráteniu pohybujúcej sa tyče na polovicu jej dĺžky? Akému relativistickému skráteniu podlieha nadzvukové lietadlo pri rýchlosti 400 m/s? 16.6. Overte rovnosť Lorentzovej transformácie LLLv a hyperbolickej rotácie RRRhhhθ pre θ = ln 1+v 1−v . Nájdite spätné vyjadrenie v ako vhodnej hyperbolickej funkcie argumentu θ. 16.7. Dokážte, že pre súčin Lorentzových transfomácií LLLu, LLLv platí LLLu · LLLv = LLLw, kde w = u+v 1+uv . Vysvetlite, prečo sa uvedená rovnosť nazýva relativistickým pravidlom skladania rýchlostí. 16.8. (a) Dokážte súčtové vzorce pre hyperbolické funkcie cosh x a sinh x. (b) Odvoďte súčtové pravidlo pre súčin (kompozíciu) hyberbolických rotácií RRRhhhθ · RRRhhhη = RRRhhhθ+η. (c) Porovnajte toto pravidlo s relativistickým pravidlom skladania rýchlostí. 16.9. (a) Uvedomte si, že pri bežnej rotácii v R2 o uhol α rotuje jednotkový vektor po kružnici s rovnicou x2 + y2 = 1, pričom α je nielen dĺžka príslušného oblúka, ale aj polovica plošného obsahu výseku jednotkového kruhu opísaného týmto vektorom (tzv. sprievodičom). (b) Overte, že pri hyberbolickej rotácii v R(1,1) o hyperbolický uhol θ „rotuje jednotkový časový vektor po rovnoosej hyperbole s rovnicou x2 0 − x2 1 = 1 a jednotkový priestorový vektor po rovnoosej hyperbole s rovnicou x2 0 − x2 1 = −1. Pritom pre θ > 0 vektory „rotujú smerom k asymptote s rovnicou x1 = x0 a pre θ < 0 k asymptote s rovnicou x1 = −x0. Svetelné vektory si zachovávajú smer aj orientáciu. Nakreslite si obrázok (vzorom vám môže byť Obr. 16.8, na ktorom sú však vektory aaa0, aaa1 v špeciálnej polohe). (c) Overte, že svetelný vektor xxx sa zobrazí do svojho násobku eθ xxx, ak leží na priamke x1 = x0, resp. e−θ xxx, ak leží na priamke x1 = −x0. (d) Vyznačte v rovine plošný útvar opísaný ľubovoľným jednotkovým časovým alebo priestorovým vektorom pri hyperbolickej rotácii RRRhhhθ a vypočítajte jeho plošný obsah pomocou vhodného určitého integrálu. Malo by vám vyjsť θ/2. Vypočítajte aj dĺžku príslušného hyperbolického oblúka. Vyšla vám očakávaná hodnota θ? Porovnajte s (a). 16.10. Časové šípy aaa, bbb, ccc v Minkowského časopriestore V sú lineárne závislé práve vtedy, keď sú lineárne závislé vektory uuu, vvv rýchlostí, ktorými sa pohybujú inerciálni pozorovatelia s časovými šípmi aaa resp. bbb vzhľadom na inerciálneho pozorovateľa s časovým šípom ccc. Dokážte. 16.11. Vyložte relativistickú dilatáciu času a kontrakciu dĺžky ako odchýlku vhodných vektorov o „hyperbolický uhol . 17. Unitárne priestory V paragrafe 12.1 sme videli, že kanonický diagonálny tvar ľubovoľnej symetrickej bilineárnej formy na konečnorozmernom vektorovom priestore nad poľom C všetkých komplexných čísel je jednoznačne určený jej hodnosťou. Zavádzať pre takéto formy niečo na spôsob signatúry a hovoriť o ich definitnosti vôbec nemá zmysel. Táto jednoduchosť v porovnaní s teóriou symetrických bilineárnych foriem na vektorových priestoroch nad poľom R má za následok, že symetrická regulárna bilineárna forma na komplexnom vektorovom priestore nevytvára geometrickú štruktúru analogickú reálnemu prípadu. Ukazuje sa však, že zdanlivo nepatrnou modifikáciou pojmu bilineárnej formy možno túto prekážku geometrizácie preklenúť. Kapitolu začneme štúdiom tzv. poldruhalineárnych foriem na komplexných vektorových priestoroch. Pre takéto formy spĺňajúce istú mierne pozmenenú podmienku symetrie už možno prirodzene zaviesť pojmy signatúry a definitnosti a rozšíriť na ne platnosť tvrdení z kapitoly 12. Najdôležitejší bude pre nás opäť kladne definitný prípad, kedy hovoríme o (komplexnom) skalárnom súčine. Teória (konečnorozmerných) unitárnych priestorov, t. j. komplexných vektorových priestorov vybavených skalárnym súčinom, je natoľko priamočiarym zovšeobecnením teórie euklidovských priestorov, že väčšinu pojmov a výsledkov možno z jednej do druhej preniesť len s malými redakčnými úpravami. Preto miesto systematickej výstavby teórie unitárnych priestorov iba stručne naznačíme, ako to možno urobiť. Špeciálne zavedieme a stručne preskúmame tzv. unitárne matice, ktoré sú komplexnou analógiou ortogonálnych matíc. Osobitný paragraf venujeme diskrétnej Fourierovej transformácii, ktorej význam prudko vzrástol po objave veľmi rýchlych algoritmov v 60. rokoch 20. storočia. V záverečnej časti stručne načrtneme úlohu unitárnych priestorov v kvantovej mechanike. Tomu bude predchádzať krátke odbočenie do klasickej mechaniky a pojednanie o ťažkostiach, ktoré sa stavajú do cesty pokusom vytvoriť adekvátny fyzikálny obraz javov mikrosveta a matematický popis jeho zákonitostí. 17.1 Poldruhalineárne formy Začneme banálnym pozorovaním: Absolútna hodnota |x| reálneho čísla x, čiže jeho vzdialenosť od počiatku, je so súčinom xy, t. j. s najzákladnejšou bilineárnou formou, zviazaná vzťahom |x|2 = xx. Taktiež absolútna hodnota 344 17. Unitárne priestory |x| komplexného čísla x má geometrický význam jeho vzdialenosti od počiatku – uvedený vzťah však platí v modifikovanej podobe |x|2 = xx. Ak teda chceme budovať geometriu umožňujúcu vyjadriť vzdialenosti pomocou vhodných komplexných analógov reálnych bilineárnych a kvadratických foriem, súčin xy treba nahradiť výrazom xy. Keďže xy = xy pre x, y ∈ R, ide o prirodzené zovšeobecnenie reálneho prípadu. Poldruhalineárnou formou na komplexnom vektorovom priestore V nazývame zobrazenie F : V × V → C také, že pre všetky xxx,yyy,zzz ∈ V , c ∈ C platí F(xxx + yyy,zzz) = F(xxx,zzz) + F(yyy,zzz), F(cxxx,zzz) = cF(xxx,zzz), F(xxx,yyy + zzz) = F(xxx,yyy) + F(xxx,zzz), F(xxx, cyyy) = cF(xxx,yyy). Hovoríme, že F je lineárne v prvej premennej a semilineárne v druhej pre- mennej. Ak V je konečnorozmerný a ααα = (uuu1, . . . ,uuun) je jeho báza, tak maticu AAA = [F]ααα = F(uuuj,uuuk) ∈ Cn×n , rovnako ako v reálnom prípade, nazývame maticou poldruhalineárnej formy F v báze ααα. Potom pre ľubovoľné vektory xxx,yyy ∈ V so súradnicami (xxx)ααα = (x1, . . . , xn)T , (yyy)ααα = (y1, . . . , yn)T platí F(xxx,yyy) = (xxx)T ααα · AAA · (yyy)ααα = n j=1 n k=1 ajkxjyk, kde (yyy)ααα = (y1, . . . , yk)T . Pritom AAA = (ajk)n×n = [F]ααα je jediná matica s touto vlastnosťou. Ak βββ = (vvv1, . . . ,vvvn) je druhá báza priestoru V , tak matice AAA = [F]ααα, BBB = [F]βββ sú zviazané vzťahom BBB = PPPT ααα,βββ · AAA · PPPααα,βββ, kde PPPα,βββ = (pjk) je matica komplexne združená k matici prechodu PPPααα,βββ = (pjk). Z toho vyplýva, že AAA, BBB ∈ Cn×n sú maticami tej istej poldruhalineárnej formy vzhľadom na (možno) rôzne bázy ααα, βββ práve vtedy, keď BBB = PPPT · AAA · PPP pre nejakú regulárnu maticu PPP ∈ Cn×n , t. j. práve vtedy, keď existuje regulárna matica QQQ ∈ Cn×n taká, že BBB = QQQ∗ · AAA · QQQ, kde QQQ∗ = QQQT = QQQ T označuje maticu transponovanú a komplexne združenú k matici QQQ – hovoríme, že QQQ∗ je hermitovsky združená alebo tiež adjungovaná matica k matici QQQ. Naozaj, ak položíme QQQ = PPP, tak QQQ∗ = PPPT . V takom 17.2. Hermitovské formy a hermitovské matice 345 prípade hovoríme, že matice AAA,BBB ∈ Cn×n sú hermitovsky kongruentné a píšeme AAA ∗ ≡ BBB. Keďže pole C všetkých komplexných čísel je rozšírením poľa R všetkých reálnych čísel, každý vektorový priestor V nad poľom C možno zároveň považovať za vektorový priestor nad poľom R (pozri príklad 1.6.1). Tento vektorový priestor budeme značiť VR a nazývať reálnym zúžením alebo tiež zreálnením priestoru V . Každé zobrazenie F : V × V → C určuje predpismi F0(xxx,yyy) = Re F(xxx,yyy), F1(xxx,yyy) = Im F(xxx,yyy), pre xxx,yyy ∈ V , dve zobrazenia F0 = Re F, F1 = Im F : V × V → R; potom, samozrejme, F(xxx,yyy) = F0(xxx,yyy) + iF1(xxx,yyy). Dôkaz nasledujúceho tvrdenia prenechávame ako jednoduché cvičenie či- tateľovi. 17.1.1. Tvrdenie. Nech F : V × V → C je ľubovoľné zobrazenie. Potom F je poldruhalineárna forma práve vtedy, keď F0 = Re F, F1 = Im F sú bilineárne formy na reálnom vektorovom priestore VR a pre všetky xxx,yyy ∈ V platí F0(xxx,yyy) = F1(ixxx,yyy), F1(xxx,yyy) = F0(xxx, iyyy). To okrem iného znamená, že každá zo zložiek F0, F1 poldruhalineárnej formy F jednoznačne určuje druhú. 17.2 Hermitovské formy a hermitovské matice Hovoríme, že poldruhalineárna forma F na komplexnom vektorovom priestore V je hermitovská alebo tiež kososymetrická, ak pre všetky xxx,yyy ∈ V platí F(xxx,yyy) = F(yyy,xxx). Nasledujúce tvrdenie je bezprostredným dôsledkom našej definície. 17.2.1. Tvrdenie. Poldruhalineárna forma F : V × V → C je hermitovská práve vtedy, keď jej zložky F0 = Re F, F1 = Im F spĺňajú podmienky F0(xxx,yyy) = F0(yyy,xxx), F1(xxx,yyy) = −F1(yyy,xxx) pre všetky xxx,yyy ∈ V . Podľa tvrdení 17.1.1 a 17.2.1 možno každú hermitovskú formu F : V × V → C rozložiť na súčet F = F0 + iF1, pričom prvá z bilineárnych foriem F0, F1 : VR × VR → R je symetrická, druhá antisymetrická a platí F1(xxx,yyy) = 346 17. Unitárne priestory F0(xxx, iyyy) alebo, čo vyjde vďaka (anti)symetrii narovnako, F0(xxx,yyy) = F1(ixxx,yyy). Štvorcová matica AAA ∈ Cn×n sa nazýva hermitovská alebo tiež kososymetrická, ak AAA = AAA∗ , t. j. ajk = akj pre všetky j, k ≤ n. Špeciálne, ajj = ajj, čiže všetky diagonálne prvky hermitovskej matice sú reálne. Zrejme AAA je hermitovská práve vtedy, keď poldruhalineárna forma F(xxx,yyy) = xxxT · AAA · yyy na (stĺpcovom) vektorovom priestore Cn je hermitovská. Ak F : V ×V → C je hermitovská forma, tak F(xxx,xxx) = F(xxx,xxx) pre každé xxx ∈ V , čiže všetky hodnoty F(xxx,xxx) sú reálne, teda má zmysel pýtať sa na ich znamienko. To nám v komplexnom prípade umožňuje zaviesť pre hermitovské formy a hermitovské matice všetky pojmy súvisiace s definitnosťou a so signatúrou rovnako, ako v reálnom prípade pre symetrické bilineárne formy a symetrické matice (pozri paragrafy 12.1 a 12.2). Navyše, v dôsledku antisymetrie formy F1 = Im F platí F(xxx,xxx) = F0(xxx,xxx), F1(xxx,xxx) = 0, takže na F(xxx,xxx) sa možno dívať ako na kvadratickú formu na reálnom vektorovom priestore VR. Signatúru hermitovskej matice AAA ∈ Cn×n , a tým aj hermitovskej formy F : V 2 → C na konečnorozmernom vektorovom priestore V nad C, možno zistiť jej úpravou na diagonálny tvar podľa schémy AAA ESO −−−→ ERO BBB IIIn ESO −−−→ PPP Na matici AAA teda vždy vykonáme jednu ERO a jej zodpovedajúcu ESO s komplexne združeným skalárom (teda výmene dvoch riadkov zodpovedá výmena príslušných stĺpcov, avšak vynásobeniu j-teho riadku nenulovým skalárom c ∈ C zodpovedá vynásobenie j-teho stĺpca skalárom c a pripočítaniu cnásobku j-teho riadku ku k-temu riadku zodpovedá pripočítanie c-násobku j-teho stĺpca ku k-temu stĺpcu). Na jednotkovej matici vykonáme príslušnú ESO s pôvodným skalárom. (Porovnaj s podobnou schémou z paragrafu 11.3). Potom AAA ∗ ≡ BBB = PPPT · AAA · PPP a stĺpce matice PPP tvoria bázu βββ priestoru Cn , vzhľadom na ktorú má hermitovská forma xxxT · AAA · yyy diagonálnu (preto tiež nevyhnutne reálnu) maticu BBB. Ak AAA bola maticou hermitovskej formy F na n-rozmernom vektorovom priestore V v báze ααα, tak diagonálna matica BBB je maticou formy F v báze βββ = ααα·PPP, čiže PPP = PPPααα,βββ je maticou prechodu z bázy βββ do bázy ααα. 17.3. Komplexný skalárny súčin a unitárne priestory 347 V podstate rovnako ako v paragrafe 11.3 sa dá dokázať, že uvedený postup vedie vždy k cieľu. Navyše možno dosiahnuť, aby matica BBB mala na diagonále len skaláry ±1 a 0. Napriek istej nejednoznačnosti výsledných matíc BBB a PPP, i v tomto prípade platí Sylvestrov zákon zotrvačnosti, teda signatúra hermitovskej formy či matice je dobre definovaná a sú splnené jednoduché analógie výsledkov pre reálne symetrické bilineárne formy a matice z paragrafu 12.1. Detaily prenechávame na samostatné premyslenie čitateľovi. 17.3 Komplexný skalárny súčin a unitárne priestory Skalárnym alebo tiež vnútorným súčinom na komplexnom vektorovom priestore V nazývame ľubovoľnú kladne definitnú hermitovskú poldruhalineárnu formu na V ; jej hodnotu na vektoroch xxx,yyy ∈ V budeme značiť opäť xxx,yyy . Komplexný vektorový priestor V vybavený skalárnym súčinom nazývame unitárny priestor. Nezávisle na znalosti uvedených pojmov možno skalárny súčin na V definovať ako binárnu operáciu V × V → C, ktorá každej dvojici (xxx,yyy) vektorov z V priradí komplexné číslo xxx,yyy také, že pre všetky xxx,yyy,xxx1,xxx2 ∈ V a ľubovoľné c ∈ C platí: xxx1 + xxx2,yyy = xxx1,yyy + xxx2,yyy (aditivita), cxxx,yyy = c xxx,yyy (homogenita), xxx,yyy = yyy,xxx (kosá symetria), xxx = 0 ⇒ xxx,xxx > 0 (kladná definitnosť). Spojenie aditivity a homogenity skalárneho súčinu dáva jeho linearitu ako funkcie prvej premennej (pri pevnej druhej premennej). Vďaka kosej symetrii z toho vyplýva semilinearita skalárneho súčinu ako funkcie druhej premennej (pri pevnej prvej premennej), t. j. rovnosti xxx,yyy1 + yyy2 = xxx,yyy2 + xxx,yyy2 , xxx, cyyy = c xxx,yyy , pre všetky xxx,yyy1,yyy2 ∈ V a c ∈ C.1 Rovnako z kosej symetrie vyplýva reálnosť výrazu xxx,xxx = xxx,xxx pre každé xxx ∈ V , čo teprv dáva zmysel podmienke kladnej definitnosti; z poldruhalinearity potom vyplýva jej podrobnejší rozpis xxx,xxx ≥ 0 & xxx,xxx = 0 ⇔ xxx = 0 1 Poznamenávame, že vo fyzike sa v definícii komplexného skalárneho súčinu často žiada linearita v druhej a semilinerita v prvej zložke. 348 17. Unitárne priestory pre každé xxx ∈ V . Ako sme naznačili predchádzajúcimi dvoma odstavcami, ktoré verne sledujú formulácie prvých dvoch odstavcov z paragrafu 13.1, teória konečnorozmerných unitárnych priestorov je pomerne priamočiarym zovšeobecnením teórie euklidovských priestorov. Väčšinu pojmov, ktoré sme definovali pre euklidovské priestory, možno zaviesť aj pre (konečnorozmerné) unitárne priestory a väčšinu výsledkov o euklidovských priestoroch možno s malými modifikáciami dokázať aj pre (konečnorozmerné) unitárne priestory. S istou dávkou zjednodušenia možno povedať, že jediný formálny rozdiel spočíva v tom, že v komplexnom prípade si musíme dávať pozor na poradie činiteľov v skalárnom súčine, občas nad niektoré skaláry primaľovať pruh a rozlišovať medzi c2 a |c|2 . Z toho dôvodu nebudeme čitateľa unavovať systematickým budovaním teórie unitárnych priestorov; miesto toho sa obmedzíme len na zopár základných pojmov a výsledkov, a kde to bude možné, odvoláme sa na zodpovedajúce analógie z euklidovských priestorov. Keďže 0 ≤ xxx,xxx ∈ R, dĺžku alebo tiež normu vektora xxx v unitárnom priestore V možno definovať ako nezáporné reálne číslo xxx = xxx,xxx . Zrejme xxx je norma na vektorovom priestore VR pochádzajúca od reálneho skalárneho súčinu xxx,yyy 0 = Re xxx,yyy , teda sú pre ňu splnené všetky tri definujúce podmienky (trojuholníková nerovnosť, pozitívna homogenita, oddeliteľnosť) z paragrafu 13.3. Navyše podmienka pozitívnej homogenity cxxx = |c| xxx platí pre všetky xxx ∈ V , c ∈ C (a nielen pre c ∈ R). Naozaj, cxxx 2 = cxxx, cxxx = cc xxx,xxx = |c|2 xxx 2 . Pozornejší čitateľ možno v tejto chvíli pojal podozrenie, že poldruhalineárne formy, ako modifikácia bilineárnych foriem, boli vymyslené len nato, aby nám v práve vykonanom výpočte prešiel trik so skalárom c. Až na časticu „len mu toto podozrenie nehodláme vyvracať. Z Cauchyho-Schwartzovej nerovnosti (veta 13.2.3) pre reálny skalárny súčin dostávame nerovnosť |Re uuu,vvv | ≤ uuu vvv , z ktorej už vyplýva trojuholníková nerovnosť pre normu. S trochou úsilia však možno dokázať silnejší odhad. 17.3.1. Veta. (Cauchyho-Schwartzova nerovnosť) Nech V je unitárny priestor. Potom pre ľubovoľné vektory uuu,vvv ∈ V platí | uuu,vvv | ≤ uuu vvv , pričom rovnosť nastane práve vtedy, keď uuu, vvv sú lineárne závislé. 17.3. Komplexný skalárny súčin a unitárne priestory 349 Dôkaz. Označme si c = cos α + i sin α, kde uuu,vvv = | uuu,vvv | (cos α + i sin α) je vyjadrenie čísla uuu,vvv ∈ C v goniometrickom tvare. Potom |c| = 1, c−1 = c a | uuu,vvv | = c−1 uuu,vvv = c uuu,vvv = uuu, cvvv = Re uuu, cvvv , lebo ide o reálne číslo. Keďže Re uuu,vvv je kladne definitná bilineárna forma na VR, podľa reálnej verzie Cauchyho-Schwartzovej nerovnosti platí | uuu,vvv | = Re uuu, cvvv ≤ uuu cvvv = |c| uuu vvv = uuu vvv . Rovnosť nastane práve vtedy, keď vektory uuu, cvvv sú lineárne závislé nad R. Z toho zrejme vyplýva lineárna závislosť vektorov uuu, vvv nad C. Naopak, ak uuu, vvv sú lineárne závislé nad C, tak rovnosť | uuu,vvv | = uuu vvv možno jednoducho overiť priamym výpočtom. Pre nenulové vektory uuu,vvv ∈ V predstavuje výraz uuu,vvv / uuu vvv komplexné číslo s absolútnou hodnotou ≤ 1. Analógia s reálnym prípadom nás zvádza pokúsiť sa na jeho základe nejako zadefinovať uhol vektorov uuu, vvv. Núkajú sa nám tri možnosti: (1) Vychádzajúc z toho, že reálna časť Re uuu,vvv skalárneho súčinu uuu,vvv je skalárnym súčinom na reálnom zúžení VR unitárneho priestoru V , ktorý plne určuje jeho normu, môžeme sa sústrediť len na ňu a ignorovať imaginárnu časť. V takom prípade α = arccos Re uuu,vvv uuu vvv predstavuje uhol, ktorý zvierajú vektory uuu, vvv v priestore VR. (2) Uhol vektorov uuu, vvv môžeme definovať ako uhol priamok [uuu], [vvv], t. j. ako reálne číslo α = arccos | uuu,vvv | uuu vvv . V reálnom prípade by také niečo zodpovedalo nahradeniu odchýlky vektorov (uuu,vvv) odchýlkou priamok ([uuu], [vvv]); to znamená, že medzi odchýlkami dvojíc (uuu,vvv) a (uuu, −vvv) by sme nerozlišovali a z pôvodných uhlov (uuu,vvv), (uuu, −vvv) by sme vybrali ten menší. (Nezabúdajme však, že priamky [uuu], [vvv] v komplexnom vektorovom priestore V sú z reálneho hľadiska dvojrozmerné, t. j. sú to vlastne roviny vo VR.) (3) Prostriedkami teórie funkcií komplexnej premennej možno definičný obor reálnej funkcie arccos, t. j. interval −1, 1 , rozšíriť na jednotkový kruh {c ∈ C; |c| ≤ 1} (dokonca na celú komplexnú rovinu C). Potom odchýlka (uuu,vvv) by bola komplexné číslo α = arccos uuu,vvv uuu vvv 350 17. Unitárne priestory také, že cos α = eiα + e−iα 2 = uuu,vvv uuu vvv . Tento spôsob by bol, samozrejme, matematicky najčistejší, hoci z geometrického hľadiska pre nás zatiaľ nie príliš názorný. Navyše by si vyžadoval istú znalosť teórie funkcií komplexnej premennej, ktorú u čitateľa ne- predpokladáme. My sa však nebudeme rozhodovať medzi uvedenými troma alternatívami, teda uhol dvoch nenulových vektorov v unitárnom priestore vôbec nebudeme skúmať ani definovať. Najdôležitejšou interpretácia výrazu uuu,vvv / uuu vvv v unitárnom priestore je totiž jeho interpretácia v kvantovej mechanike. Tou však nie je kosínus uhla, ale – akokoľek čudne to znie – „amplitúda pravdepodobnosti . K tejto otázke sa vrátime až v záverečnom paragrafe 17.8. I keď na uhol dvoch vektorov v unitárnom priestore sme rezignovali, nemienime rezignovať na vzťah ortogonality (kolmosti) xxx ⊥ yyy ⇔ xxx,yyy = 0 pre vektory xxx,yyy ∈ V a operáciu ortokomplementu X⊥ = {yyy ∈ V ; (∀xxx ∈ X)(xxx ⊥ yyy)} množiny X ⊆ V , ktoré majú rovnaké vlastnosti ako v reálnom prípade. Aj pojmy ortogonálnej či ortonormálnej množiny alebo usporiadanej k-tice vektorov, a najmä ortogonálnej a ortonormálnej bázy sú definované rovnako. Gramovým-Schmidtovým ortogonalizačným procesom – či už ho vykonáme podľa vety 13.4.5 alebo diagonalizáciou Gramovej matice GGG(ααα) = uuuj,uuuk nejakej bázy ααα = (uuu1, . . . ,uuun) priestoru V – možno dokázať, že konečnorozmerný unitárny priestor V má ortonormálnu bázu. Vzhľadom na takúto bázu βββ = (vvv1, . . . ,vvvn) nadobúda skalárny súčin na V tvar tzv. štandardného komplexného skalárneho súčinu na Cn , t. j. pre ľubovoľné vektory xxx,yyy ∈ V so súradnicami (xxx)βββ = (x1, . . . , xn)T , (yyy)βββ = (y1, . . . , yn)T platí tzv. Parsevalova rovnosť xxx,yyy = (xxx)T βββ · (yyy)βββ = n j=1 xjyj = n j=1 xxx,vvvj vvvj,yyy , keďže jednotlivé zložky súradníc vektorov xxx, yyy sú xj = xxx,vvvj , yj = yyy,vvvj . Pre xxx = yyy dostávame špeciálny prípad tejto rovnosti xxx 2 = (xxx)T βββ · (xxx)βββ = n j=1 |xj|2 = n j=1 | xxx,vvvj |2 (porovnaj s tvrdením 13.4.4). 17.4. Unitárne matice 351 17.4 Unitárne matice Unitárne matice sú komplexnou analógiou ortogonálnych matíc. Matica AAA ∈ Cn×n sa nazýva unitárna, ak platí AAA∗ · AAA = IIIn, t. j. AAA−1 = AAA∗ . Prvá podmienka je zrejme ekvivalentná s rovnosťou AAAT · AAA = IIIn, ktorá opäť hovorí, že stĺpce matice AAA tvoria ortonormálnu bázu unitárneho priestoru Cn so štandardným skalárnym súčinom. Potom rovnako AAA · AAA∗ = IIIn, teda aj riadky matice AAA tvoria ortonormálnu bázu v Cn . Zrejme reálna štvorcová matica AAA, uvažovaná zároveň ako matica AAA ∈ Cn×n , je unitárna práve vtedy, keď je ortogonálna. Podobne ako ortogonálne matice, aj unitárne matice možno charakterizovať jednak ako matice prechodu medzi ortonormálnymi bázami v konečnorozmerných unitárnych priestoroch, jednak ako matice, násobenie ktorými zachováva štandardný skalárny súčin resp. dĺžku v Cn . Dôkaz nasledujúcej vety možno dostať nepatrnou modifikáciou dôkazu vety 13.5.1. 17.4.1. Veta. Nech V je n-rozmerný unitárny priestor, ααα je ortonormálna a βββ je ľubovoľná báza priestoru V . Potom báza βββ je ortonormálna práve vtedy, keď matica prechodu PPPααα,βββ z bázy βββ do bázy ααα je unitárna. 17.4.2. Veta. Nech Cn je stĺpcový unitárny priestor so štandardným skalárnym súčinom a AAA ∈ Cn . Potom nasledujúce podmienky sú ekvivalentné: (i) AAA je unitárna matica; (ii) pre všetky xxx,yyy ∈ Cn platí AAA · xxx,AAA · yyy = xxx,yyy ; (iii) pre všetky xxx ∈ Cn platí AAA · xxx = xxx . Dôkaz. Implikácie (i) ⇒ (ii) a (ii) ⇒ (i) možno dokázať (takmer) rovnako ako v dôkaze vety 13.5.2 a implikácia (ii) ⇒ (iii) je opäť triviálna. Stačí teda dokázať (iii) ⇒ (ii). Keďže xxx je zároveň norma na zreálnení unitárneho priestoru Cn pochádzajúca od reálneho skalárneho súčinu Re xxx,yyy , pre ľubovoľné xxx,yyy ∈ Cn platí Re xxx,yyy = 1 2 xxx + yyy 2 − xxx 2 − yyy 2 , a podľa tvrdenia 17.2.1 tiež Im xxx,yyy = Re xxx, iyyy . Teda z podmienky (iii) 352 17. Unitárne priestory vyplýva Re AAA · xxx,AAA · yyy = 1 2 AAA · xxx + AAA · yyy 2 − AAA · xxx 2 − AAA · yyy 2 = 1 2 AAA · (xxx + yyy) 2 − AAA · xxx 2 − AAA · yyy 2 = 1 2 xxx + yyy 2 − xxx 2 − yyy 2 = Re xxx,yyy . V dôsledku toho Im AAA · xxx,AAA · yyy = Re AAA · xxx, i(AAA · yyy) = Re AAA · xxx,AAA · (iyyy) = Re xxx, iyyy = Im xxx,yyy , teda AAA · yyy,AAA · yyy = xxx,yyy . Podrobnejší popis štruktúry unitárnych matíc opäť podáme len pre rády n ≤ 2. Unitárne matice rozmeru 1×1 zrejme splývajú s komplexnými číslami s absolútnou hodnotou 1. 17.4.3. Veta. Matica AAA ∈ C2×2 je unitárna práve vtedy, keď má tvar AAA = a b −bu au = eiα cos ϑ eiβ sin ϑ − ei(ω−β) sin ϑ ei(ω−α) cos ϑ , kde čísla a, b, u ∈ C vyhovujú podmienkam |a|2 + |b|2 = |u| = 1, resp. α, β, ϑ, ω ∈ R sú ľubovoľné. Dôkaz. Priamym výpočtom sa možno presvedčiť, že každá matica v ľubovoľnom z uvedených dvoch tvarov vyhovuje podmienke AAA∗ · AAA = III2, teda je unitárna. Nech naopak AAA = ( a b c d ) je unitárna. Potom matica AAA∗ · AAA = III2 má na mieste (1, 1) prvok |a|2 +|b|2 = 1. Označme u = detAAA. Ľahko možno overiť, že |u| = 1, preto aj matice diag(1, u) a BBB = diag(1, u) · AAA = ( a b cu du ) sú unitárne (pozri cvičenie 17.15). Potom detBBB = 1, preto BBB−1 = du −b −cu a a BBB∗ = a cu b du . Keďže BBB−1 = BBB∗ , porovnaním príslušných zložiek oboch matíc dostávame c = −bu, d = au. Ak čísla a, b, u zapíšeme v goniometrickom tvare a = |a| eiα , b = |b| eiβ , u = eiω , kde α, β, ω ∈ R, a uvedomíme si, že z podmienky |a|2 + |b|2 = 1 vyplýva existencia ϑ ∈ 0, π/2 takého, že |a| = cos ϑ, |b| = sin ϑ, vidíme, že maticu AAA možno vyjadriť aj v druhom z uvedených tvarov. 17.5. Diskrétna Fourierova transformácia 353 17.5 Diskrétna Fourierova transformácia Dohodnime sa, že zložky vektorov v priestore Cn (n ≥ 1) budeme číslovať od 0 do n − 1 miesto obvyklého spôsobu od 1 do n. Vektor xxx = (x0, x1, . . . , xn−1)T ∈ Cn si budeme predstavovať ako signál vysielaný v n diskrétnych časových okamihoch t0, t1, . . . , tn−1 s rovnakými rozostupmi ∆t = tk − tk−1 > 0 (1 ≤ k ≤ n − 1). Takisto môže ísť o vzorku vybranú z nejakého signálu X(t) vysielaného v spojitom časovom intervale a, b . Ak je rozostup ∆t dosť malý a n je dosť veľké tak, že interval t0, tn−1 pokrýva relevantný úsek „vysielacieho času a, b (napr. ak sa signál X(t) periodicky opakuje po úsekoch dĺžky n∆t), možno očakávať, že vzorka xxx = (x0, x1, . . . , xn−1)T = X(t0), X(t1), . . . , X(tn−1) T je dostatočne reprezentatívna nato, aby sa z nej pôvodný signál X(t) dal dostatočne verne zrekonštruovať. Na účely takejto rekonštrukcie, no taktiež pri rôznych iných typoch spracovania signálu sa požíva Fourierova transformácia, ktorá v ňom oddelí zložky rôznych frekvencií a určí ich amplitúdy a fázové posuny. V tomto paragrafe sa zoznámime len s diskrétnou Fourierovou transformáciou, ktorá pracuje na konečnorozmernom unitárnom priestore Cn (so štandardným skalárnym súčinom). Vďaka objavu rýchlych algoritmov na jej výpočet v 60. rokoch 20. storočia sa však oblasť jej využitia značne rozšírila. Tzv. rýchla Fourierova transformácia sa dnes využíva napr. pri spracovaní obrazu či iných informácií uložených v počítačoch alebo na rýchle násobenie veľkých čísel. Komplexnú jednotku ω = ωn = e2πi/n = cos 2π n + i sin 2π n nazývame tiež n-tá primitívna odmocnina z jednotky. 2 Potom vektor fffk = 1, ωk , . . . , ωk(n−1) T , kde k ∈ Zn = {0, 1, . . . , n − 1}, predstavuje vybranú vzorku zo spojitého signálu Fk(t) = ωkt = e2πikt/n = cos 2πkt n + i sin 2πkt n v okamihoch t = 0, 1, . . . , n − 1. Samotný signál Fk(t) popisuje kosínusové a sínusové oscilácie s relatívnou frekvenciou k vzhľadom na základný oscilačný mód F1(t) = ωt . 2 Presnejšie sa n-tou primitívnou odmocninou z jednotky nazýva každé z čísel ωk , kde k ∈ Zn je nesúdeliteľné s n. 354 17. Unitárne priestory 17.5.1. Tvrdenie. Vektory fffk tvoria ortogonálnu bázu φφφ = (fff0,fff1, . . . ,fffn−1) unitárneho priestoru Cn a všetky majú rovnakú dĺžku fffk = √ n. Dôkaz. Pre ľubovoľné k, l ∈ Zn platí fffk,fffl = n−1 t=0 ω(k−l)t =    n−1 t=0 1 = n, ak k = l, ω(k−l)n − 1 ωk−l − 1 = 0, ak k = l, lebo ω0 = ωn = 1 a ωk−l = 1 pre k = l. Popri kanonickej ortonormálnej báze εεε = (eee0, . . . ,eeen−1) tak v Cn máme ďalšiu významnú ortogonálnu bázu φφφ a ortonormálnu bázu 1/ √ n φφφ tvorenú vektormi 1/ √ n fffk. Diskrétnou Fourierovou transformáciou (DFT) na priestore Cn nazývame lineárne zobrazenie F : Cn → Cn dané predpisom F(xxx) = xxx = xxx,fff0 , . . . , xxx,fffn−1 T pre xxx = (x0, . . . , xn−1)T ∈ Cn . Rozpísané do zložiek to dáva xk = xxx,fffk = n−1 t=0 xt ω−kt pre k ∈ Zn. Diskrétna Fourierova transformácia tak popisuje súradnice vektora xxx ∈ Cn vzhľadom na bázu φφφ. Presnejšie, keďže báza n−1/2 φφφ je ortonormálna, vďaka Parsevalovej rovnosti platí xxx = n−1 k=0 xxx, n−1/2 fffk n−1/2 fffk = 1 n n−1 k=0 xkfffk = 1 n φφφ · xxx, teda (xxx)φφφ = 1 n xxx. To pre jednotlivé okamihy t ∈ Zn dáva xt = 1 n n−1 k=0 xk ωkt = 1 n n−1 k=0 xk e2πikt/n = 1 n xxx,ffft . 17.5. Diskrétna Fourierova transformácia 355 Ak si každé z komplexných čísel xk vyjadríme v goniometrickom tvare xk = Ak eiαk = Ak(cos αk + i sin αk), dostaneme vyjadrenie xt = 1 n n−1 k=0 Ak exp i 2πkt n + αk , v ktorom už zreteľne vidno amplitúdy Ak i fázové posuny αk jednotlivých frekvenčných módov fffk. DFT sa často používa napr. na odfiltrovanie šumov z analyzovaného signálu alebo na kompresiu dát. Zložky vektora xxx zodpovedajúce vysokým frekvenciám k (považované za šum), prípadne veľmi malým amplitúdam Ak (považované za zanedbateľné) sa vymažú (t. j. nahradia nulami), čím miesto pôvodného vektora xxx = 1 n k∈Zn xkfffk získame „prefiltrovaný resp. „stlačený vektor 1 n k∈I xkfffk, kde I je vhodná podmnožina indexovej množiny Zn. Vzhľadom na cyklický charakter DFT však vysoké frekvencie zodpovedajú hodnotám k ∈ Zn blízkym k n/2. Naopak, keďže −k ≡n n − k, frekvencie blízke k „hornej hranici n − 1 sú malé, rovnako ako frekvencie blízke k „dolnej hranici 0. To je jeden z dôvodov, prečo je často technicky výhodnejšie miesto nezáporných zvyškov Zn = {0, 1, . . . , n − 1} pracovať s tzv. absolútne najmenšími zvyškami modulo n, t. j. s množinou všetkých celých čísel z intervalu (−n/2, n/2 . Zo spätného vyjadrenia xt = 1 n xxx,ffft = 1 n xxx,fffn−t navyše vyplýva, že aj inverzná lineárna transformácia F−1 : Cn → Cn k diskrétnej Fourierovej transformácii má tvar diskrétnej Fourierovej transformácie. Len sa od pôvodnej transformácie F líši multiplikatívnym faktorom 1/n a miesto primítívnej n-tej odmocniny z jednotky ω = e2πi/n používa primitívnu odmocninu ω = ω−1 = e−2πi/n . Pôvodnú DFT xxx → F(xxx) = xxx by sme mohli rovnako dobre definovať predpisom xk = d xxx,fffk = d n−1 t=0 xt ω−kt , kde d je ľubovoľné kladné reálne číslo (napr. veľmi dobre by sa hodilo d = ∆t alebo d = 2π/n). Inverzná DFT xxx → F−1 (xxx) = xxx by mala potom tvar xt = 1 nd xxx,ffft = 1 nd xxx,fffn−t = 1 nd n−1 k=0 xt ωkt . 356 17. Unitárne priestory Popri najbežnejšej voľbe d = 1, 1/nd = 1/n sa často používa aj duálna možnosť d = 1/n, 1/nd = 1, prípadne symetrická možnosť d = 1/nd = 1/ √ n. Jedna z najdôležitejších a často využívaných algebraických vlastností Fourierovej transformácie spočíva v tom, že DFT prevádza cyklickú konvolúciu vektorov v Cn na ich súčin po zložkách (a naopak). Násobenie vektorov xxx,yyy ∈ Cn (no rovnako v Kn nad ľubovoľným poľom K) po zložkách je práve to „prirodzené násobenie xxxyyy = (x0, x1, . . . , xn−1)T (y0, y1, . . . , yn−1)T = (x0y0, . . . , xn−1yn−1)T , ktorému sme sa doteraz priam úzkostlivo vyhýbali. Ľahko však nahliadneme, že je to komutatívna, asociatívna a bilineárna binárna operácia Cn ×Cn → Cn s neutrálnym prvkom (1, 1, . . . , 1)T . Cyklickou konvolúciou vektorov xxx,yyy ∈ Cn nazývame vektor zzz = xxx ∗ yyy = (z0, z1, . . . , zn−1)T , ktorého zložky pre t ∈ Zn sú dané rovnosťou zt = r+s=t xrys = n−1 r=0 xryt−r = n−1 s=0 xt−sys, pričom sčítanie sumačných indexov r, s, t prebieha v Zn, t. j. cyklicky modulo n. 17.5.2. Veta. Nech F : Cn → Cn je diskrétna Fourierova transformácia. Potom pre všetky vektory xxx,yyy ∈ Cn platí F(xxx ∗ yyy) = F(xxx) F(yyy) = xxxyyy, a tiež naopak F(xxxyyy) = 1 n F(xxx) ∗ F(yyy) = 1 n xxx ∗ yyy . Dôkaz. Označme zzz = xxx ∗ yyy. Potom pre každé k ∈ Zn platí zk = zzz,fffk = n−1 t=0 zt ω−kt = n−1 t=0 r+s=t xrys ω−kt = n−1 r=0 xr ω−kr n−1 s=0 ys ω−ks = xxx,fffk yyy,fffk = xkyk. Dôkaz druhej rovnosti prenechávame ako cvičenie čitateľovi. 17.5. Diskrétna Fourierova transformácia 357 Cyklická konvolúcia silne pripomína súčin polynómov (pozri odstavec 1.6.3). Aj pre polynómy f(x) = p i=0 aixi g(x) = q j=0 bjxj sú koeficienty ich súčinu (fg)(x) = p+q k=0 ckxk dané konvolučnou formulou ck = i+j=k aibj = k j=0 ak−jbj, len s tým rozdielom, že súčty sumačných indexov nepočítame cyklicky modulo n ale obvyklým spôsobom. Ak si však zvolíme dosť veľké n (stačí, aby p + q < n) a oba polynómy reprezentujeme vektormi aaa = (a0, a1, . . . , an−1)T , bbb = (b0, b1, . . . , bn−1)T ich koeficientov (doplnenými o nulové členy), bude vektor ccc = (c0, c1, . . . , cn−1)T koeficientov súčinu fg splývať s cyklickou konvolúciou ccc = aaa ∗ bbb. Používané algoritmy pre DFT sú také rýchle, že túto konvolúciu je výhodnejšie počítať nie priamo, ale podľa formuly ccc = aaa ∗ bbb = F−1 F(aaa) F(bbb) = F−1 aaabbb . V pozičnej číselnej sústave pri nejakom základe m ≥ 2 predstavuje ciferný zápis ap . . . a1a0, kde ai ∈ Zm, celé číslo a0 + a1m + . . . + apmp , čiže hodnotu polynómu f(x) pre x = m. Rýchle algoritmy používané na násobenie veľmi veľkých celých čísel sa zakladajú na uvedenom spôsobe násobenia polynómov pomocou Fourierovej transformácie. Na záver treba ešte ošetriť prípadne vzniknuté „dvojciferné cifry , teda to, čo v prípade základu m = 10 nazývame prechodom cez desiatku. Popri jednorozmernej DFT, ktorá operuje na jednoparametrických dátových súboroch, sa často používa aj viacrozmerná DFT. My sa stručne zmienime len o DFT v dvoch rozmeroch. Zvoľme kladné celé čísla m, n. Jednotlivé zložky matice XXX = (xst) ∈ Cm×n môžu predstavovať napr. farbu (vlnovú dĺžku) alebo intenzitu vysvietenia bodu obrazovky s diskrétnymi súradnicami (s, t) ∈ Zm × Zn. Dvojrozmerná diskrétna Fourierova transformácia F : Cm×n → Cm×n priradí matici XXX = (xst) ∈ Cm×n maticu F(XXX) = XXX = (xkl) ∈ Cm×n so zložkami xkl = m−1 s=0 n−1 t=0 xst ω−ks m ω−lt n = m−1 s=0 n−1 t=0 xst exp −2πi ks m + lt n . Inverzná dvojrozmerná DFT je potom daná formulou xst = 1 mn m−1 k=0 n−1 l=0 xkl ωks m ωlt n = 1 mn m−1 k=0 n−1 k=0 xkl exp 2πi ks m + lt n . Dvojrozmerná DFT sa hojne využíva pri digitálnom kódovaní a spracovaní obrazu napr. v počítačovej grafike. Podobne ako jednorozmerná DFT, aj 358 17. Unitárne priestory ona umožňuje efektívne spracovanie a kompresiu dát či odfiltrovanie rôznych šumov napr. z digitálnej fotografie. Ak však chceme pomocou dvojrozmernej DFT dostatočne verne spracovať napr. signál na obrazovke s µ × ν pixlami, treba aby m a n boli vzhľadom na µ resp. ν dosť veľké (aspoň dvojnásobné, ale radšej m ≥ µ2 , n ≥ ν2 ). Počiatok diskrétneho súradného systému pixlov si zvolíme v strede obrazovky, indexové množiny Zm, Zn nahradíme množinami absolútne najmenších zvyškov modulo m resp. n a hodnoty signálu xst „za okrajom obrazovky doplníme nulami. 17.6 Stavové priestory v klasickej mechanike∗ Cieľom tohto paragrafu nie je systematický výklad klasickej mechaniky. Hodláme len zbežne zaviesť a motivovať pojem stavového priestoru a stručne naznačiť prednosti v ňom fungujúceho Hamiltonovho formalizmu. Hlavne nám však ide o vybudovanie aspoň akej-takej názornej predstavy, či aspoň analógie, o ktorú by sme sa mohli oprieť v poslednom paragrafe, kde sa chystáme zaviesť stavové priestory v kvantovej mechanike, čo je oblasť, kde naša intuícia z viacerých dôvodov zlyháva. Uvažujme hmotný bod pohybujúci sa vo fyzikálnom priestore, ktorý prostredníctvom voľby nejakej pravouhlej súradnicovej sústavy zvykneme stotožňovať s euklidovským priestorom R3 . Jeho priestorové súradnice (zložky jeho rádius-vektora) v čase t označme xxx(t) = (x1(t), x2(t), x3(t)). Jeho okamžitá rýchlosť v čase t je potom daná ako derivácia vvv(t) = dxxx dt = dx1 dt , dx2 dt , dx3 dt . Ak navyše poznáme jeho hmotnosť m, tak jeho pohybový stav v čase t je jednoznačne určený dvoma vektormi: polohovým vektorom xxx(t) a vektorom hybnosti ppp(t) = mvvv(t) (t. j. jednotlivé zložky vj rýchlosti a pj hybnosti v smere súradných osí sú zviazané vzťahmi pj = mvj = m(dxj/ dt) pre j = 1, 2, 3). Inak povedané, okamžitý pohybový stav hmotnej častice je jednoznačne určený jediným v čase premenným vektorom (bodom) (xxx,ppp) v stavovom priestore R6 . Tento priestor možno chápať ako priamy súčin R3 × R3 dvoch exemplárov euklidovského priestoru R3 (so štandardným skalárnym súčinom), z ktorých prvý slúži na zaznamenávanie polohy a druhý hybnosti. Kvôli jednoduchosti ďalej predpokladajme, že pohyb nášho hmotného bodu sa odohráva v tzv. konzervatívnom silovom poli, určenom potenciálnou energiou U = U(xxx), ktorá je funkciou len jeho polohy xxx a nezávisí od času. Pomocou nej možno vyjadriť silu pôsobiacu na časticu v danom mieste ako FFF = − gradU = − ∂U ∂x1 , ∂U ∂x2 , ∂U ∂x3 . 17.6. Stavové priestory v klasickej mechanike∗ 359 S využitím Newtonovej pohybovej rovnice FFF = d(mvvv) dt = dppp dt dostávame dppp dt = − gradU, dxxx dt = vvv = 1 m ppp. Celková energia hmotného bodu v danom mieste a čase je súčtom jeho kinetickej a potenciálnej energie H = 1 2 m vvv 2 + U(xxx) = 1 2m ppp 2 + U(xxx). Výraz H = H(xxx,ppp) nazývame Hamiltonovou funkciou alebo hamiltoniánom príslušnej pohybujúcej sa sústavy. Jednoduchý výpočet dáva ∂H ∂xj = ∂U ∂xj = − dpj dt , ∂H ∂pj = 1 2m · ∂ ppp 2 ∂pj = 1 2m · ∂(p2 1 + p2 2 + p2 3) ∂pj = 1 m pj = dxj dt , pre j = 1, 2, 3. Ak si ešte zavedieme skrátené označenie ∂H ∂x1 , ∂H ∂x2 , ∂H ∂x3 = ∂H ∂xxx , ∂H ∂p1 , ∂H ∂p2 , ∂H ∂p3 = ∂H ∂ppp , dostávame parciálne diferenciálne rovnice, popisujúce pohyb hmotného bodu, v tzv. Hamiltonovom tvare dxxx dt = ∂H ∂ppp , dppp dt = − ∂H ∂xxx , ktorý vyniká mimoriadnou eleganciou, symetriou a jednoduchosťou. Podobne, okamžitý stav sústavy pohybujúcich sa n hmotných bodov je jednoznačne určený dvoma usporiadanými n-ticami: (xxx1, . . . ,xxxn) ich polohových vektorov a (ppp1, . . . ,pppn) ich hybností, ktoré možno výhodne reprezentovať ako blokovú maticu (XXX, PPP) =   xxx1 ppp1 ... ... xxxn pppn   =   x11 x12 x13 p11 p12 p13 ... ... ... ... ... ... xn1 xn2 xn3 pn1 pn2 pn3   ∈ Rn×6 , pričom jednotlivé zložky xij = xij(t) matice XXX = XXX(t), resp. pij = pij(t) matice PPP = PPP(t) predstavujú j-tu súradnicu polohy resp. hybnosti i-tej častice a sú zviazané vzťahom pij = mi(dxij/ dt), kde mi je jej hmotnosť. Teda 360 17. Unitárne priestory okamžitý pohybový stav sústavy n hmotných bodov sme zachytili ako jediný od času závislý bod či vektor (XXX, PPP) v 6n-rozmernom stavovom priestore Rn×6 , chápanom ako priamy súčin 2n exemplárov euklidovského priestoru R3 , zodpovedajúcich zložkám matice (xxxi,pppi) ∈ (R3 )n×2 , nazývaným tiež zovšeobecnené súradnice a zovšeobecnené hybnosti sústavy. Celkom analogicky ako v prípade jedinej častice, i pre n hmotných bodov v konzervatívnom silovom poli možno odvodiť, že ich pohyb sa riadi parciálnymi diferenciálnymi rovnicami dXXX dt = ∂H ∂PPP , dPPP dt = − ∂H ∂XXX . ktoré nazývame Hamiltonovými rovnicami. Uvedené výrazy označujú matice dXXX dt = dxij dt n×3 , ∂H ∂XXX = ∂H ∂xij n×3 , dPPP dt = dpij dt n×3 , ∂H ∂PPP = ∂H ∂pij n×3 , a H = H(XXX,PPP) je opäť Hamiltonova funkcia, vyjadrujúca celkovú energiu sústavy. Jej explicitný tvar je H = n i=1 1 2mi pppi 2 + n i=1 Ui(xxxi) + i 0)(∃ m ∈ N)(∀ n ≥ m)( xxxn − xxxm < ε), už konverguje k nejakému vektoru xxx ∈ V , t. j. limn→∞ xxxn − xxx = 0. 4 Treba si však uvedomiť, že priamka alebo lúč [uuu] = Cuuu vo vektorovom priestore nad poľom C je vlastne dvojrozmerný podpriestor čiže rovina, ak ju chápeme ako vektorový priestor nad poľom R. Na druhej strane, niektorí fyzici zastávajú stanovisko, že stotožňovať vektory uuu a eiϑ uuu líšiace sa fázovým činiteľom eiϑ = 1 je scestné, lebo práve v závislosti na ňom môžu interferovať rôznymi spôsobmi. Pre nich sú teda čistými stavmi priamo jednotkové vektory uuu ∈ V . 366 17. Unitárne priestory malizmu, než snahou o „bezprostredné zobrazenie skutočnosti . Predstavme si kvôli jednoduchosti hypotetickú elementárnu časticu, ktorá môže zaujímať n rôznych polôh v priestore, prípadne n energetických hladín, ktoré očíslujeme od 1 po n. Zdanlivo, t. j. z klasického hľadiska, by jej stavový priestor mal byť totožný s množinou {1, 2, . . . , n}. No kvantová mechanika vo všeobecnosti neumožňuje určiť, v ktorom zo stavov 1, . . . , n sa častica nachádza. Môže nám poskytnúť len pravdepodobnosti p1, . . . , pn výskytu v jednotlivých stavoch. Takéto pravdepodobnostné rozdelenie ppp = (p1, . . . , pn), teda nový kandidát na to, čo by sme mohli nazvať stavom systému, leží vo vektorovom priestore Rn . Takže sa zdá, že pri pravdepodobnostnej formulácii kvantovej mechaniky by sme mali vystačiť s reálnymi vektorovými priestormi (a s reálnym skalárnym súčinom). Komplexné unitárne priestory, v našom prípade to bude Cn , sú potrebné na zachytenie vlnového charakteru kvantovomechanických javov. Pri zobrazení v Rn (či v inom reálnom vektorovom priestore), by boli všetky vlnenia nevyhnutne vo fáze, takže typické vlnové javy, ako napr. interferenciu, by nebolo možné zachytiť. Normovaný stavový vektor uuu = (u1, . . . , un) ∈ Cn teda v sebe nesie informáciu nielen o pravdepodobnostnom rozdelení ppp = |u1|2 , . . . , |un|2 ale aj o fázach „pravdepodobnostnej vlny , presnejšie amplitúdy pravdepodobnosti, uuu = |u1| eiϑ1 , . . . , |un| eiϑn . V typickom prípade sa stavový priestor kvantovomechanickej sústavy realizuje ako nekonečnorozmerný Hilbertov priestor istých komplexných funkcií definovaných na klasickom „fyzikálnom priestore sústavy. Napríklad stavový priestor V pre realistickejšiu časticu – elektrón v trojrozmernom priestore R3 – pozostáva z určitých „dostatočne dobre integrovateľných komplexných funkcií R3 → C so skalárnym súčinom5 f, g = R3 f(x, y, z) g(x, y, z) dx dy dz. Istotne netreba zvlášť podotýkať, že ide o nekonečnorozmerný priestor. Pravdepodobnosť, že sa elektrón s normovanou stavovou funciou f nachádza v nejakej (merateľnej) množine A ⊆ R3 , t. j. v istej časti priestoru, je vyjadrená trojným integrálom A |f(x, y, z)|2 dx dy dz. 5 Komplexnú funkciu reálnej premmennej h: M → C, kde M ⊆ R je nejaký (či už ohraničený alebo neohraničený) interval, možno písať v tvare h = h0 + ih1, kde h0(x) = Re h(x) a h1(x) = Im h(x), čiže h0, h1 : M → R. Potom h je integrovateľná (v akomkoľvek bližšie špecifikovanom zmysle) práve vtedy, keď h0 aj h1 sú integrovateľné, pričom M h(x) dx = M h0(x) dx + i M h1(x) dx. Podobne pre funkcie h: M → C, kde M ⊆ Rn . 17.8. Stavovové priestory v kvantovej mechanike∗ 367 Samotná funkcia f taká, že f 2 = f, f = 1, predstavuje svojimi jednotlivými hodnotami f(x, y, z) amplitúdu hustoty pravdepodobnosti, že sa daná častica nachádza v tom-ktorom bode (x, y, z) ∈ R3 . 6 Ak sa kvantovomechanický systém, reprezentovaný stavovým priestorom V , nachádza v istom okamihu v stave [uuu], tak pravdepodobnosť, že ho „vzápätí nájdeme v stave [vvv], sa rovná číslu | uuu,vvv |2 uuu 2 vvv 2 = | uuu,vvv |2 uuu,uuu vvv,vvv . Všimnite si, že uvedený výraz naozaj závisí len na stavoch [uuu], [vvv] a nie na samotných vektoroch uuu, vvv. Keďže ide o nezáporné reálne číslo, ktoré je podľa Cauchyho-Schwartzovej nerovnosti ≤ 1, môžeme ho oprávnene interpretovať ako pravdepodobnosť. Pre normované vektory uuu, vvv je táto pravdepodobnosť rovná priamo | uuu,vvv |2 , čo je vlastne druhá mocnina dĺžky kolmého priemetu pr[vvv](uuu) = uuu,vvv vvv vektora uuu do podpriestoru [vvv]. Samotné komplexné číslo uuu,vvv , nazývané amplitúdou pravdepodobnosti prechodu zo stavu uuu do stavu vvv, nemá ani v tomto prípade bezprostredný fyzikálny význam. Umožňuje však elegantné výpočty. Ak je stavový priestor V konečnorozmerný a γγγ = (www1, . . . ,wwwn) je jeho ortonormálna báza, tak ľubovoľný vektor uuu = a1www1 + . . . + anwwwn ∈ V je normovaný práve vtedy, keď pre jeho súradnice aj = uuu,wwwj platí |a1|2 + . . . + |an|2 = 1. Z postulátov kvantovej mechaniky vyplýva, že číslo |aj|2 predstavuje pravdepodobnosť, že systém v stave uuu prejde do niektorého z bázických stavov wwwj. Uvedená rovnosť tak hovorí, že všetky tieto pravdepodobnosti dávajú v súčte jednotku. 7 Ak je aj vektor vvv = b1www1 + . . . + bnwwwn normovaný, tak pre amplitúdu pravdepodobnosti prechodu zo stavu uuu do stavu vvv dostávame uuu,vvv = n j=1 uuu,wwwj wwwj,vvv = n j=1 ajbj. Inak povedané, amplitúda pravdepodobnosti prechodu uuu → vvv je súčtom súčinov amplitúd pravdepodobnosti prechodov uuu → wwwj → vvv cez jednotlivé bázické stavy. Posledná formula umožňuje ďalekosiahle zovšeobecnenie. 6 Priamo o amplitúde pravdepodobnosti nemôžeme hovoriť, lebo pravdepodobnosť, že sa častica nachádza v bode (x, y, z) nie je |f(x, y, z)|2 ale 0. 7 K takýmto prechodom, pri ktorých si systém „musí vybrať jeden zo stavov istej ortonormálnej bázy, dochádza napr. pri meraní hodnôt fyzikálnych veličín kvantovo-mechanického systému. 368 17. Unitárne priestory Ľubovoľnú konečnú postupnosť (uuu,xxx1,xxx2, . . . ,xxxk,vvv) normovaných vektorov v stavovom priestore V nazývame trajektóriou dĺžky k + 1 z uuu do vvv. Táto postupnosť zrejme predstavuje obdobu klasickej trajektórie. Jej amplitúdou pravdepodobnosti rozumieme súčin uuu,xxx1 xxx1,xxx2 . . . xxxk−1,xxxk xxxk,vvv , chápaný ako „komplexná pravdepodobnosť prechodu systému zo stavu uuu do stavu vvv po naznačenej trajektórii. Matematickou indukciou podľa k možno dokázať, že pre ľubovoľné stavy uuu, vvv a ortonormálne bázy γγγ1 = (www11, . . . ,www1n),. . . , γγγk = (wwwk1, . . . ,wwwkn) platí uuu,vvv = n j1,...,jk=1 uuu,www1j1 www1j1 ,www2j2 . . . wwwk−1jk−1 ,wwwkjk wwwkjk ,vvv . Inak povedané, amplitúdu pravdepodobnosti prechodu uuu → vvv možno vypočítať ako súčet amplitúd pravdepodobnosti cez všetky trajektórie (uuu,www1j1 , . . . ,wwwkjk ,vvv) pevnej dĺžky k + 1. Na značne sofistikovanom nekonečnorozmernom zovšeobecnení poslednej formuly je založené vyjadrenie amplitúd pravdepodobnosti pomocou tzv. Feynmanovho integrálu cez trajektórie v stavovom priestore. Ako zaujímavosť poznamenajme, že hoci fyzici pri svojich výpočtoch Feynmanov integrál hojne a úspešne používajú, matematikom sa dodnes nepodarilo preň vypracovať plne uspokojivú teóriu a zaradiť ho do teoreticko-množinového rámca súčasnej matematiky. Cvičenia 17.1. Nech V je konečnorozmerný vektorový priestor nad poľom C s bázou tvorenou vektormi vvv1, . . . ,vvvn. Potom vektory vvv1, . . . ,vvvn, ivvv1, . . . , ivvvn tvoria bázu jeho reálneho zúženia VR. Dokážte. Odvoďte z toho vzťah dim VR = 2 dim V . 17.2. Pre ľubovoľné vektory xxx, yyy v unitárnom priestore V platí xxx + yyy,xxx − yyy = xxx 2 − yyy 2 − 2i Im xxx,yyy . Dokážte. 17.3. Nech U, V sú vektorové priestory nad poľom C. (a) Definujte jadro a obraz semilineárneho zobrazenia ϕ: V → U rovnako ako pre lineárne zobrazenia a dokážte, že Ker ϕ je lineárny podpriestor vo V a Im ϕ je lineárny podpriestor v U. (b) Za predpokladu, že V je konečnorozmerný, dokážte, že veta o dimenzii jadra a obrazu platí aj pre semilineárne zobrazenia ϕ: V → U. (c) Za predpokladu, že oba priestory U, V sú konečnorozmerné, definujte maticu semilineárneho zobrazenia ϕ: V → U vzhľadom na bázy βββ vo V a ααα v U rovnako ako pre lineárne zobrazenia. Dokážte, že pre ľubovoľný vektor xxx ∈ V platí (ϕxxx)ααα = (ϕ)ααα,βββ · (xxx)βββ. (d) Ako sa mení matica semilineárneho zobrazenia ϕ: V → U pri zmene báz v priestoroch U, V ? Cvičenia 369 17.4. Nech U, V sú konečnorozmerné vektorové priestory nad poľom C a F : U × V → C je poldruhalineárna forma. (a) Definujte maticu formy F vzhľadom na bázy ααα v U a βββ vo V rovnakým spôsobom ako pre bilineárne formy. Dokážte, že pre ľubovoľné vektory xxx ∈ U, yyy ∈ V platí F(xxx,yyy) = (xxx)T · [F]ααα,βββ · (yyy)βββ. (b) Ako sa mení matica formy F pri zmene báz v priestoroch U, V ? (c) Označme V ∗ množinu všetkých semilineárnych zobrazení V → C. Dokážte, že V ∗ je lineárny podpriestor vektorového priestoru CV a platí dim V ∗ = dim V . (d) Dokážte, že predpisom F× (xxx)(yyy) = F(xxx,yyy) pre xxx ∈ U, yyy ∈ V je definované lineárne zobrazenie F× : U → V ∗ . (e) Definujte hodnosť formy F rovnako ako pre bilineárne formy. Ako súvisí hodnosť h(F) s vlastnosťami zobrazenia F× : U → V ∗ ? Porovnajte s vetou 11.1.7. 17.5. (a) Nech F : V × V → C je poldruhalineárma forma a F0 = Re F, F1 = Im F. Dokážte, že F0, F1 : VR × VR → R sú bilineárne formy. (b) Dokážte tvrdenia 17.1.1 a 17.2.1. 17.6. Nech F : Cn ×Cn → C je poldruhalineárna forma na (stĺpcovom) vektorovom priestore Cn a AAA = [F]εεε je jej matica vzhľadom na kanonickú bázu εεε = (eee1, . . . ,eeen). Označme F0 = Re F, F1 = Im F, A0 = Re A, A1 = Im A. Ako vyzerajú matice bilineárnych foriem F0, F1 : Cn R × Cn R → R v báze εεε+ = (eee1, . . . ,eeen, ieee1, . . . , ieeen)? Čo sa dá povedať navyše, ak F je hermitovská? 17.7. Sformulujte pravidlá pre diagonalizáciu hermitovských matíc AAA ∈ Cn×n a dokážte analógy príslušných tvrdení z paragrafov 11.3 a 12.1, 12.2. 17.8. Ak ααα, βββ sú ortonormálne bázy konečnorozmerného unitárneho priestoru V , tak pre ľubovoľné vektory xxx,yyy ∈ V platí xxx,yyy = (xxx)T ααα · PPPααα,βββ · (yyy)βββ. Dokážte. 17.9. Dokážte analóg tvrdenia 13.2.1 pre Gramove matice v unitárnych priestoroch. 17.10. (a) Popíšte lineárne zobrazenie ortogonálnej projekcie do konečnorozmerného lineárneho podpriestoru S v unitárnom priestore V a odvoďte jeho základné vlastnosti. (b) Zovšeobecnite výsledky o vzdialenosti vektora od lineárneho podpriestoru resp. bodu od afinného podpriestoru v konečnorozmernom unitárnom priestore. (c) Napíšte maticu ortogonálnej projekcie do lineárneho podpriestoru S = [s1(AAA), . . . , sk(AAA)] generovaného stĺpcami matice AAA ∈ Cn×k v unitárnom priestore Cn so štandardným skalárnym súčinom vzhľadom na kanonickú ortonormálnu bázu (eee1, . . . ,eeen). 17.11. Upravte Parsevalove rovnosti tak, aby platili aj pre ortogonálne bázy v unitárnych priestoroch. 17.12. Integrál komplexnej funkcie reálnej premennej f(x) = f0(x)+if1(x), kde f0, f1 : a, b → R definujeme rovnosťou b a f(x) dx = b a f0(x) dx + i b a f1(x) dx. (a) Dokážte, že formulou f, g = b a f(x) g(x) dx je definovaný komplexný skalárny súčin na vektorovom priestore všetkých spojitých funkcií f : a, b → C. (b) Dokážte, že funkcie fn : 0, 2π → C, kde fn(x) = einx pre n ∈ Z, x ∈ 0, 2π , sú navzájom ortogonálne. Porovnajte s cvičeniami 13.7 a 13.8. 17.13. (a) Overte, že oba tvary matice AAA ∈ C2×2 z vety 17.4.3 naozaj predstavujú unitárne matice. 370 17. Unitárne priestory (b) Pre akú voľbu parametrov α, β, ϑ, ω v druhom z týchto vyjadrení dostaneme maticu rotácie RRRγ resp. maticu osovej súmernosti SSSγ, kde γ ∈ R? 17.14. Nech AAA ∈ Cn×n je štvorcová komplexná matica. Dokážte nasledujúce tvrdenia: (a) Ak AAA je hermitovská, tak detAAA je reálne číslo. (b) Ak AAA je unitárna, tak detAAA je komplexná jednotka. (c) Ak u1, . . . , un ∈ C, tak matica diag(u1, . . . , un) je hermitovská práve vtedy, keď u1, . . . , un ∈ R. (d) Ak u1, . . . , un ∈ C, tak matica diag(u1, . . . , un) je unitárna práve vtedy, keď |u1| = . . . = |un| = 1. 17.15. Ak AAA,BBB ∈ Cn×n sú unitárne matice, tak aj matice AAA−1 a AAA·BBB sú unitárne. Dokážte. Platí niečo podobné aj pre hermitovské matice? 17.16. Zovšeobecnite tvrdenia o Iwasawovom rozklade a QR-rozklade z cvičení 13.11 resp. 13.13 na komplexné matice a dokážte ich: (a) Každú regulárnu maticu AAA ∈ Cn×n možno jednoznačne rozložiť na súčin AAA = PPP ·DDD ·TTT, kde PPP ∈ Cn×n je unitárna matica, DDD ∈ Rn×n je diagonálna matica s kladnými reálnymi číslami na diagonále a TTT ∈ Cn×n je horná trojuholníková matica s jednotkami na diagonále. (b) Každú maticu AAA ∈ Cm×n kde m ≥ n možno rozložiť na súčin AAA = QQQ · RRR, kde QQQ ∈ Cm×m je unitárna matica a RRR ∈ Cm×n je horná trojuholníková matica s nulovými poslednými m − n riadkami. Ak AAA má (maximálnu) hodnosť n, tak QQQ a RRR sú určené jednoznačne za dodatočnej podmienky, že diagonálne prvky rii, i ≤ n, matice RRR sú kladné reálne čísla. 17.17. Nájdite Iwasawove a QR-rozklady nasledujúcich matíc: (a) 1 + 2i −1 1 + 3i i ! (b) 0 B @ i −1 + i 2 + i 1 3 2i 1 0 −i 1 C A 17.18. (a) S využitím cvičenia 11 napíšte Parsevalove rovnosti vzhľadom na ortogonálnu bázu φφφ = (fff0, . . . ,fffn−1) z tvrdenia 17.5.1. (b) Overte, že pre ľubovoľné vektory xxx,yyy ∈ Cn platí xxx,yyy = 1 n xxx,yyy a xxx 2 = 1 n xxx 2 . (c) Odvoďte z toho, že „znormovaná matica diskrétnej Fourierovej transformácie FFF = 1√ n ω−jk ∈ Cn×n , kde ω = e2πi/n , je unitárna. Ako vyzerá k nej inverzná matica? 17.19. (a) Operácia ∗ cyklickej konvolúcie na priestore Cn je asociatívna, komutatívna a bilineárna. Dokážte priamo aj pomocou vzťahu s násobením po zložkách sprostredkovaného diskrétnou Fourierovou transformáciou. (b) Má operácia ∗ neutrálny prvok? Ak áno, ako vyzerá? 17.20. Dokážte druhú rovnosť z vety 17.5.2 – jednak priamo, jednak ako dôsledok prvej rovnosti a vlastností DFT. 17.21. Nájdite vhodnú ortogonálnu bázu priestoru všetkých komplexných matíc Cm×n so štandardným skalárnym súčinom XXX,YYY = j,k xjkyjk pozostávajúcu z matíc ΩΩΩrs ∈ Cm×n (r ∈ Zm, s ∈ Zn) tak, aby pre každú maticu XXX ∈ Cm×n platilo xrs = XXX,ΩΩΩrs . Zovšeobecnite na viacrozmerné matice. Cvičenia 371 17.22. Vyjadrite formulu „Feynmanovho integrálu uuu,vvv = n j1,...,jk=1 uuu,www1j1 www1j1 ,www2j2 . . . wwwk−1jk−1 ,wwwkjk wwwkjk ,vvv zo záveru paragrafu 17.8 pomocou matíc prechodu medzi bázami γγγj. 372 17. Unitárne priestory Časť III Lineárne operátory 18. Vlastné hodnoty a vlastné vektory Touto kapitolou začíname najdôležitejšiu partiu nášho kurzu lineárnej algebry a geometrie. Jej ústredné pojmy ako vlastná hodnota, vlastný vektor a spektrum lineárneho operátora hrajú kľúčovú úlohu nielen v samotnej lineárnej algebre, ale aj v jej aplikáciách – či už v iných oblastiach matematiky, vo fyzike, i v ďalších disciplínach. Po šiestich kapitolách, ktoré sa odohrávali nad poľom R prípadne C, sa opäť vraciame k vektorovým priestorom nad ľubovoľným poľom K. 18.1 Matica lineárneho operátora a podobnosť matíc Pripomeňme, že lineárnym operátorom na vektorovom priestore V alebo tiež lineárnou transformáciou priestoru V nazývame ľubovoľné lineárne zobrazenie ϕ: V → V . Ak V je konečnorozmerný, tak lineárny operátor ϕ: V → V je injektívny práve vtedy, keď je surjektívny, čo je ekvivalentné s rovnosťou h(ϕ) = dim V (pozri dôsledok 6.2.4). Maticou lineárnej transformácie ϕ: V → V vzhľadom na bázu ααα = (uuu1, . . . ,uuun) nazývame maticu (ϕ)ααα = (ϕ)ααα,ααα = (ϕuuu1)ααα, . . . , (ϕuuun)ααα ∈ Kn×n , tvorenú súradnicami obrazov ϕ(uuuj) vektorov uuuj bázy ααα vzhľadom na tú istú bázu ααα. Jedným z vedúcich zámerov tejto i nasledujúcich dvoch kapitol bude dosiahnuť vhodnou voľbou bázy ααα čo najjednoduchší tvar matice AAA = (ϕ)ααα lineárneho operátora ϕ. Poznamenajme, že pokiaľ by sme netrvali na prirodzenej požiadavke vyjadrovať súradnice vzorov aj obrazov vektorov xxx ∈ V vzhľadom na tú istú bázu priestoru V , šlo by o špeciálny prípad vety 7.5.4: vždy by sme mohli (navyše jednoduchým spôsobom) zvoliť bázy ααα, βββ priestoru V tak, aby matica ϕ vzhľadom na ne mala blokový tvar (ϕ)ααα,βββ = IIIh 0h,n−h 0n−h,h 0n−h,n−h , kde h = h(ϕ). Niečo jednoduchšie si ťažko možno predstaviť – my by sme už tradične boli spokojní s diagonálnou maticou AAA = (ϕ)ααα. Zdanlivo nevinná požiadavka ααα = βββ však značne zužuje možnosti našej voľby, čo – ako uvidíme – dramaticky komplikuje situáciu. 376 18. Vlastné hodnoty a vlastné vektory Analogickú úlohu sme už riešili v kapitole 11 pre symetrické bilineárne formy; vtedy sa nám však podarilo ukázať, že (až na prípad polí charakteristiky 2) možno voľbou vhodnej bázy vždy dosiahnuť diagonálny tvar matice príslušnej formy. Poznamenajme už vopred, že pre lineárne operátory sa nám niečo podobné nepodarí. Jednako preskúmame štruktúru lineárnych operátorov na konečnorozmerných vektorových priestoroch do takej miery, že dokážeme charakterizovať operátory diagonalizovateľné vo vhodnej báze, ako aj identifikovať (ba čiastočne tiež odstrániť – ale to až v nasledujúcej kapitole) prekážky diagonalizovateľnosti u tých ostatných. Na začiatok si uvedomme vzťah medzi maticami lineárneho operátora vzhľadom na rôzne bázy. Ako zvláštny prípad vety 7.6.1 dostávame: 18.1.1. Veta. Nech ϕ: V → V je lineárna transformácia konečnorozmerného vektorového priestoru V a ααα, βββ sú jeho dve bázy. Potom (ϕ)βββ = PPPβββ,ααα · (ϕ)ααα · PPPααα,βββ. Štvorcové matice AAA, BBB ∈ Kn×n sa nazývajú podobné, označenie AAA ≈ BBB, ak existuje regulárna matica PPP ∈ Kn×n taká, že platí BBB = PPP−1 · AAA · PPP. Zrejme podobné matice majú rovnakú hodnosť. Čitateľ si iste sám bez ťažkostí overí, že pre ľubovoľné matice AAA, BBB, CCC ∈ Kn×n platí AAA ≈ AAA, AAA ≈ BBB ⇒ BBB ≈ AAA, AAA ≈ BBB & BBB ≈ CCC ⇒ AAA ≈ CCC. To znamená, že vzťah podobnosti je reflexívny, symetrický a tranzitívny, čiže je to ekvivalencia na množine Kn×n . Ekvivalencia podobnosti nám asi pripomína inú ekvivalenciu na množine Kn×n : totiž kongruenciu matíc AAA ≡ BBB, s ktorou ju však neslobodno zamieňať (pozri paragraf 11.3). Keďže PPPβββ,ααα = PPP−1 ααα,βββ a každá regulárna matica je maticou prechodu medzi vhodnou dvojicou báz, nasledujúca veta je bezprostredným dôsledokom vety 18.1.1. 18.1.2. Veta. Nech V je n-rozmerný vektorový priestor nad poľom K. Potom pre ľubovoľné matice AAA, BBB ∈ Kn×n nasledujúce podmienky sú ekviva- lentné: (i) AAA, BBB sú maticami tej istej lineárnej transformácie ϕ: V → V vzhľadom na nejaké dve (možno no nie nutne rôzne) bázy priestoru V ; 18.2. Vlastné hodnoty a vlastné vektory 377 (ii) AAA ≈ BBB. Stopu matice AAA ∈ Kn×n , označenie trAAA (z anglického trace), definujeme ako súčet jej diagonálnych prvkov, t. j. trAAA = a11 + . . . + ann = n i=1 aii. 18.1.3. Tvrdenie. Nech AAA ∈ KKKm×n , BBB ∈ Kn×m . Potom tr(AAA · BBB) = tr(BBB · AAA). Dôkaz. Označme AAA·BBB = (cij)m×m, BBB·AAA = (djk)n×n. Jednoduchým výpočtom dostávame tr(AAA · BBB) = m i=1 cii = m i=1 n j=1 aijbji = n j=1 m i=1 bjiaij = n j=1 djj = tr(BBB · AAA). Vety 10.3.2 a 10.3.3 o determinante súčinu matíc a determinante inverznej matice, resp. tvrdenie 18.1.3 majú nasledujúci bezprostredný 18.1.4. Dôsledok. Podobné matice majú rovnaký determinant aj stopu. Hovoríme, že determinant a stopa sú invariantmi podobnosti matíc. Ak teda matice AAA, BBB ∈ Kn×n majú rôzne determinanty alebo rôzne stopy (pričom najmä túto druhú podmienku možno veľmi ľahko nahliadnuť), tak nemôžu byť podobné. Na druhej strane však ani rovnosť determinantu a stopy ešte nezaručuje ich podobnosť. 18.2 Vlastné hodnoty a vlastné vektory Lineárny operátor ϕ: V → V na konečnorozmernom vektorovom priestore V sa nazýva diagonalizovateľný, ak existuje nejaká báza priestoru V , vzhľadom na ktorú má ϕ diagonálnu maticu. Nech teda ϕ: V → V je diagonalizovateľný lineárny operátor a βββ = (vvv1, . . . ,vvvn) je taká báza priestoru V , že matica BBB = (ϕ)βββ je diagonálna so skalármi λ1, . . . , λn ∈ K na diagonále. Potom pre bázické vektory vvvi platí ϕ(vvvi) = λivvvi. Ukazuje sa, že tento vzťah medzi lineárnym operátorom ϕ skalárom λi a vektorom vvvi má kľúčový význam. 378 18. Vlastné hodnoty a vlastné vektory Vopred zdôrazňujeme, že nasledujúce dve definície sa vzťahujú rovnako na konečno- i nekonečnorozmerné vektorové priestory. Hovoríme, že skalár λ ∈ K je vlastná alebo tiež charakteristická hodnota lineárneho operátora ϕ: V → V , ak existuje vektor 0 = vvv ∈ V , pre ktorý platí ϕ(vvv) = λvvv. V prípade vektorových priestorov nad číselnými poľami, ako napr. R alebo C, zvykneme hovoriť o vlastnom čísle lineárneho operátora. Hovoríme, že 0 = vvv ∈ V je vlastný alebo tiež charakteristický vektor lineárneho operátora ϕ: V → V , ak existuje skalár λ ∈ K, pre ktorý platí ϕ(vvv) = λvvv. Ak V je vektorový priestor funkcií, zvykneme hovoriť o vlastnej funkcii lineárneho operátora. Obe uvedené definície hovoria vlastne o tom istom. Ak λ ∈ K je vlastná hodnota operátora ϕ, tak každý nenulový vektor vvv ∈ V taký, že ϕ(vvv) = λvvv, je vlastný vektor operátora ϕ. Naopak, ak vvv ∈ V je vlastný vektor, tak skalár λ, pre ktorý platí ϕ(vvv) = λvvv, je vlastná hodnota. Hovoríme, že vvv je vlastný vektor prislúchajúci k vlastnej hodnote λ, resp. že λ je vlastná hodnota prislúchajúca k vlastnému vektoru vvv. Ešte si všimnite, že vlastná hodnota prislúchajúca k danému vlastnému vektoru je určená jednoznačne; na druhej strane, ako uvidíme, k danej vlastnej hodnote môže prislúchať viacero, dokonca lineárne nezávislých vektorov. Vlastnou (charakteristickou) hodnotou (vlastným číslom), resp. vlastným (charakteristickým) vektorom štvorcovej matice AAA ∈ Kn×n nazývame vlastnú hodnotu, resp. vlastný vektor lineárneho operátora Kn → Kn daného predpisom xxx → AAA·xxx. Vlastná hodnota λ ∈ K a k nej prislúchajúci vlastný vektor 0 = vvv ∈ Kn matice AAA sú tak zviazané vzťahom AAA · vvv = λvvv. Z vety 18.1.2 vyplýva, že vlastné hodnoty podobných matíc sú vlastnými hodnotami toho istého lineárneho operátora, preto 18.2.1. Tvrdenie. Podobné matice majú rovnaké vlastné hodnoty. Jednorozmerný podpriestor [vvv] generovaný vlastným vektorom vvv lineárneho operátora je špeciálnym prípadom tzv. invariantného podpriestoru. Hovoríme, že lineárny podpriestor S vektorového priestoru V je invariantným podpriestorom lineárneho operátora ϕ: V → V , ak platí ϕ(S) ⊆ S, t. j. ϕ(xxx) ∈ S pre každé xxx ∈ S. Ak lineárny operátor ϕ je fixovaný kontextom, hovoríme jednoducho o invariantnom podpriestore. Triviálny podpriestor {0} a nevlastný podpriestor V sú vždy invariantné. Zrejme jednorozmerný podpriestor [vvv] je invariantný práve vtedy, keď vvv je vlastný vektor príslušného operátora. Jednorozmerné podpriestory generované vlastnými vektormi lineárneho operátora sú teda príkladmi netriviálnych, a ak dim V > 1, tak i vlastných invariantných podpriestorov. Ak S je invariantný podpriestor lineárnej transformácie ϕ: V → V , tak zúženie ϕ na S je opäť lineárnou transformáciou ϕ S : S → S na vektorovom priestore S. Ak ααα = (uuu1, . . . ,uuuk,uuuk+1, . . . ,uuun) je báza priestoru V taká, že 18.2. Vlastné hodnoty a vlastné vektory 379 jej prvých k vektorov tvorí bázu invariantného podpriestoru S, tak matica ϕ v tejto báze má blokový tvar AAA = (ϕ)ααα = AAA1 MMM 0n−k,k AAA2 , kde AAA1 ∈ Kk×k je matica lineárnej transformácie ϕ S : S → S v báze (uuu1, . . . ,uuuk) a MMM ∈ Kk×(n−k) , AAA2 ∈ K(n−k)×(n−k) . Ak V = S ⊕ T je dokonca priamym súčtom invariantných podpriestorov S, T, tak V má bázu ααα = (uuu1, . . . ,uuuk,uuuk+1, . . . ,uuun), ktorej prvých k vektorov tvorí bázu S a zvyšných n − k vektorov tvorí bázu T. Vzhľadom na takúto bázu má matica ϕ blokovo diagonálny tvar AAA = (ϕ)ααα = AAA1 0k,n−k 0n−k,k AAA2 = diag(AAA1,AAA2), kde AAA1 ∈ Kk×k je matica lineárnej transformácie ϕ S : S → S v báze (uuu1, . . . ,uuuk) a AAA2 ∈ K(n−k)×(n−k) je matica lineárnej transformácie ϕ T : T → T v báze (uuuk+1, . . . ,uuun). Toto pozorovanie možno zrejmým spôsobom zovšeobecniť na priamy súčet ľubovoľného konečného počtu invariantných podpriestorov. (Detaily prenechávame na samostatné premyslenie čitateľovi.) Z vykonaných úvah priamo vyplýva nasledujúca charakterizácia diagonalizovateľných lineárnych operátorov. 18.2.2. Veta. Nech ϕ je lineárny operátor na konečnorozmernom vektorovom priestore V . Potom nasledujúce podmienky sú ekvivalentné: (i) ϕ je diagonalizovateľný; (ii) existuje báza priestoru V pozostávajúca z vlastných vektorov operátora ϕ; (ii) V je priamym súčtom jednorozmerných invariantných podpriestorov lineárneho operátora ϕ. Samozrejme, matica operátora ϕ v báze vlastných vektorov βββ = (vvv1, . . . ,vvvn) má tvar (ϕ)βββ = diag(λ1, . . . , λn), kde λi je vlastné hodnota prislúchajúca k vlastnému vektoru vvvi. Podčiarkujeme, že nasledujúce tvrdenie platí aj bez predpokladu konečnorozmernosti priestoru V . 18.2.3. Tvrdenie. Nech λ1, . . . , λk sú navzájom rôzne vlastné hodnoty lineárneho operátora ϕ: V → V . Potom k nim prislúchajúce vlastné vektory vvv1, . . . ,vvvk sú lineárne nezávislé. Dôkaz. Predpokladajme, že vvv1, . . . ,vvvk sú lineárne závislé. Potom existuje j ≤ k také, že vektor vvvj je lineárnou kombináciou predchádzajúcich; zvoľme 380 18. Vlastné hodnoty a vlastné vektory najmenšie také j. Keďže vvv1 = 0, j ≥ 2 a žiaden z vektorov vvv1, . . . ,vvvj−1 nie je lineárnou kombináciou predchádzajúcich, sú to lineárne nezávislé vektory. Pre nejaké skaláry c1, . . . , cj−1 platí vvvj = c1vvv1 + . . . + cj−1vvvj−1. Nakoľko vvvj = 0, aspoň jeden z týchto skalárov je = 0. Vektor ϕ(vvvj) si vyjadríme dvoma spôsobmi: ϕ(vvvj) = c1ϕ(vvv1) + . . . + cj−1ϕ(vvvj−1) = c1λ1vvv1 + . . . + cj−1λj−1vvvj−1, ϕ(vvvj) = λjvvvj = λj(c1vvv1 + . . . + cj−1vvvj−1) = c1λjvvv1 + · · · + cj−1λjvvvj−1. V dôsledku toho c1(λ1 − λj)vvv1 + . . . + cj−1(λj−1 − λj)vvvj−1 = 0, a keďže λi = λj pre všetky i ≤ j − 1, aspoň jeden z koeficientov ci(λi − λj) je rôzny od nuly. To je však spor s nezávisloťou vektorov vvv1, . . . ,vvvj−1. Práve dokázané tvrdenie spolu s vetou 18.2.2 majú za bezprostredný dôsledok prvú časť nasledujúceho tvrdenia. 18.2.4. Tvrdenie. Nech ϕ je lineárny operátor na n-rozmernom vektorovom priestore V . Ak ϕ má n navzájom rôznych vlastných hodnôt λ1, . . . , λn, tak je ϕ je diagonalizovateľný v báze im prislúchajúcich vlastných vektorov. Navyše každý vlastný vektor vvvi prislúchajúci k vlastnej hodnote λi je určený jednoznačne až na skalárny násobok. Dôkaz. Zostáva overiť záverečnú podmienku jednoznačnosti. Nech teda j ≤ n a www je tiež vlastný vektor prislúchajúci k vlastnej hodnote λj. Keďže vvv1, . . . ,vvvn tvoria bázu V , www = n i=1 civvvi pre nejaké koeficienty ci ∈ K. Dokážeme, že www = cjvvvj. V opačnom prípade by aj www − cjvvvj = 0 bol vlastným vektorom operátora ϕ prislúchajúcim k λj. Podľa predchádzajúceho tvrdenia sú vektory www − cjvvvj, a vvvi, i = j, lineárne nezávislé. To je však spor so skutočnosťou, že www − cjvvvj = i=j civvvi je lineárnou kombináciou ostatných vektorov. 18.3 Charakteristický polynóm V tomto paragrafe si predvedieme, ako možno k danej štvorcovej matici AAA ∈ Kn×n nájsť jej vlastné hodnoty a k nim prislúchajúce vlastné vektory. Reprezentácia lineárneho operátora na konečnorozmernom vektorovom priestore pomocou jeho matice v nejakej (dokonca ľubovoľnej) báze nám potom umožní vyriešiť analogickú úlohu aj preň. 18.3. Charakteristický polynóm 381 Maticu AAA−xIII nazývame charakteristickou maticou matice AAA ∈ Kn×n ; jej charakteristickým polynómom nazývame determinant charakteristickej matice, t. j. polynóm chAAA(x) = det(AAA − xIIIn) = a11 − x a12 . . . a1n a21 a22 − x . . . a2n ... ... ... ... an1 an2 . . . ann − x v premennej x s koeficientmi z poľa K, t. j. chAAA(x) ∈ K[x]. Charakteristický polynóm je zrejme polynóm stupňa n s koeficientom (−1)n pri najvyššej mocnine xn . Charakteristickou rovnicou matice AAA nazývame rovnicu chAAA(x) = 0, t. j. det(AAA − xIIIn) = 0. Niektorí autori definujú charakteristickú maticu ako xIII−AAA a charakteristický polynóm ako det(xIII−AAA), čiže ako (−1)n krát „náš charakteristický polynóm – zrejme ide o nepodstatný rozdiel. Význam práve definovaných pojmov je daný nasledujúcou vetou. 18.3.1. Veta. Nech AAA ∈ Kn×n . Potom skalár λ ∈ K je vlastnou hodotou matice AAA práve vtedy, keď det(AAA − λIIIn) = 0, t. j. práve vtedy, keď λ vyhovuje charakteristickej rovnici matice AAA. Dôkaz. Skalár λ ∈ K je vlastnou hodnotou matice AAA práve vtedy, keď AAA·vvv = λvvv pre nejaký vektor 0 = vvv ∈ Kn , čiže práve vtedy, keď homogénna sústava lineárnych rovníc (AAA − λIII) ·vvv = 0 má aspoň jedno nenulové riešenie vvv ∈ Kn . To nastane práve vtedy, keď matica AAA−λIII je singulárna, t. j. det(AAA−λIII) = 0. Zopakujme si ešte raz, čo sme sa naučili v tomto dôkaze a nie je zahrnuté v znení vety: vlastné vektory štvorcovej matice AAA prislúchajúce k jej vlastnej hodnote λ sú práve všetky nenulové riešenia homogénnej sústavy s maticou AAA − λIII; pritom práve singularita uvedenej matice zaručuje ich existenciu. 18.3.2. Veta. Nech AAA, BBB ∈ Kn×n . Ak AAA ≈ BBB, tak chAAA = chBBB; inými slovami, podobné matice majú rovnaký charakteristický polynóm. Dôkaz. Nech AAA, BBB sú podobné a PPP je regulárna matica taká, že BBB = PPP−1 ·AAA·PPP. Keďže aj xIII = PPP−1 ·xIII ·PPP, s použitím rovností pre determinant súčinu matíc 382 18. Vlastné hodnoty a vlastné vektory a determinant inverznej matice (vety 10.3.2 a 10.3.3) dostávame chBBB(x) = det(BBB − xIII) = det PPP−1 · AAA · PPP − PPP−1 · xIII · PPP = det PPP−1 · (AAA − xIII) · PPP = detPPP−1 det(AAA − xIII) detPPP = det(AAA − xIII) = chAAA(x). To znamená, že i charakteristický polynóm je invariantnom podobnosti matíc. Táto jeho vlastnosť nám umožňuje korektne zadefinovať aj charakteristický polynóm chϕ(x) lineárnej transformácie ϕ konečnorozmerného vektorového priestoru V ako charakteristický polynóm matice tejto transformácie vzhľadom na ľubovoľnú bázu priestoru V . Vlastné hodnoty takejto lineárnej transformácie sú potom totožné s vlastnými hodnotami jej matice. Tvrdenie 18.2.1 teraz priamo vyplýva z vety 18.3.2. Keby sme boli schopní nahliadnuť, že koeficienty pri mocninách x0 resp. xn−1 v charakteristickom polynóme chAAA(x) matice AAA ∈ Kn×n sú detAAA resp. (−1)n−1 trAAA, čiže chAAA(x) = detAAA − . . . + (−1)n−1 (a11 + . . . + ann)xn−1 + (−1)n xn (čo nie je až také ťažké), mohli by sme okamžite dostať aj dôsledok 18.1.4 z práve dokázanej vety. Ani čitateľ, ktorý to nahliadnuť nedokáže, si však nemusí zúfať. Tieto výsledky nám totiž onedlho spadnú do lona samy, ako vedľajšie plody nášho štúdia. 18.4 Príklady Pokúsme sa teraz na niekoľkých veľmi jednoduchých príkladoch (všetky sa týkajú matíc najnižšieho netriviálneho rozmeru 2 × 2) ilustrovať metódu výpočtu vlastných hodnôt λ matice AAA riešením jej charakteristickej rovnice chAAA(x) = 0 a následný výpočet vlastných vektorov riešením homogénnych sústav so singulárnymi maticami AAA − λIII. Zároveň sa pri tom zoznámime s rôznymi možnosťami, ktoré môžu nastať, a pripravíme si tak pôdu pre ďalšie úvahy. 18.4.1. Príklad. Súmernosť roviny podľa osi prechádzajúcej počiatkom a zvierajúcej s osou x uhol α je lineárny operátor SSSα : R2 → R2 , ktorý má vzhľadom na kanonickú bázu εεε = (eee1,eee2) maticu SSSα = cos 2α sin 2α sin 2α − cos 2α (pozri príklad 6.4.4). Charakteristický polynóm det(SSSα − xIII2) = cos 2α − x sin 2α sin 2α − cos 2α − x = x2 − cos2 2α − sin2 2α = x2 − 1 18.4. Príklady 383 má dva korene x1,2 = ±1. K nim prislúchajúce vlastné vektory nájdeme riešením homogénnych sústav s maticami SSSα − III = cos 2α − 1 sin 2α sin 2α − cos 2α − 1 ∼ sin α − cos α 0 0 , resp. SSSα + III = cos 2α + 1 sin 2α sin 2α − cos 2α + 1 ∼ cos α sin α 0 0 . Oba podpriestory riešení sú jednorozmerné, generované vektormi (cos α, sin α)T resp. (− sin α, cos α)T . To znamená, že operátor operátor SSSα má vzhľadom na bázu tvorenú stĺpcami matice cos α − sin α sin α cos α diagonálnu maticu diag(1, −1). Ešte si všimnite, že (cos α, sin α)T je smerový vektor našej osi súmernosti a (− sin α, cos α)T je smerový vektor kolmice na ňu v počiatku. Uvedomte si, že tento výsledok sa presne zhoduje s geometrickým názorom. 18.4.2. Príklad. Otočenie roviny okolo počiatku o uhol α je lineárny operátor RRRα : R2 → R2 , ktorý má v kanonickej báze εεε = (eee1,eee2) maticu RRRα = cos α − sin α sin α cos α (pozri príklad 6.4.3). Charakteristický polynóm det(RRRα − xIII2) = cos α − x − sin α sin α cos α − x = x2 − 2x cos α + cos2 α + sin2 α = x2 − 2x cos α + 1 má diskriminant D = 4 cos2 α−4 = −4 sin2 α. Okrem prípadov, keď sin α = 0, t. j. RRRα = ±III2 (identické zobrazenie resp. stredová súmernosť podľa počiatku, ktorými sa budeme zaoberať v rámci ďalšieho príkladu), je D < 0, teda charakteristický polynóm nemá reálne korene. Preto ani RRRα nemá reálne vlastné hodnoty a nie je podobná so žiadnou diagonálnou maticou nad R. Na druhej strane, keďže R ⊆ C, na RRRα sa môžeme dívať ako na komplexnú maticu z C2×2 ; ako taká určuje vzhľadom na kanonickú bázu εεε = (eee1,eee2) v C2 lineárny operátor C2 → C2 . V poli C jej charakteristický polynóm už má dva korene x1,2 = cos α ± i sin α = e±iα , ktorým zodpovedajúce vlastné vektory dostaneme riešením homogénnych sústav s maticami RRRα − eiα III = −i sin α − sin α sin α −i sin α ∼ 1 −i 0 0 , 384 18. Vlastné hodnoty a vlastné vektory resp. RRRα − e−iα III = i sin α − sin α sin α i sin α ∼ 1 i 0 0 . Oba podpriestory riešení sú jednorozmerné, generované vektormi (1, −i)T resp. (1, i)T . To znamená, že operátor C2 → C2 daný predpisom xxx → RRRα · xxx má vzhľadom na bázu tvorenú stĺpcami matice 1 1 −i i diagonálnu maticu diag(eiα , e−iα ). 18.4.3. Príklad. Rovnoľahlosť v rovine so stredom v počiatku a koeficientom podobnosti c ∈ R je lineárny operátor R2 → R2 , ktorý má v kanonickej báze εεε = (eee1,eee2) diagonálnu maticu cIII2 (pozri príklad 6.4.5). Jej charakteristický polynóm det(cIII2 − xIII2) = (c − x)2 má jeden dvojnásobný reálny koreň x1,2 = c. Podpriestor riešení homogénnej sústavy s maticou cIII2 − cIII2 = 02,2 je samozrejme celé R2 . To znamená, že naša rovnoľahlosť má v ľubovoľnej báze priestoru R2 diagonálnu maticu cIII2. Väčšinou, pokiaľ z nejakých dôvodov nedáme prednosť inej voľbe, si v takom prípade zvykneme vybrať kanonickú bázu εεε = (eee1,eee2). 18.4.4. Príklad. Skosenie roviny v smere osi x s parametrom a ∈ R je lineárny operátor R2 → R2 s maticou 1 a 0 1 vzhľadom na kanonickú bázu εεε = (eee1,eee2) (pozri príklad 6.4.6). Keďže pre a = 0 ide o identické zobrazenie, ktoré má v ľubovoľnej báze maticu III2 (čo je špeciálny prípad predošlého príkladu), budeme ďalej predpokladať, že a = 0. Charakteristický polynóm 1 − x a 0 1 − x = (1 − x)2 má jeden dvojnásobný reálny koreň x1,2 = 1. K nemu prislúchajúce vlastné vektory nájdeme riešením homogénnej sústavy s maticou 0 a 0 0 ∼ 0 1 0 0 . Podpriestor riešení je jednorozmerný, generovaný vektorom eee1 = (1, 0)T , preto skosenie v smere osi x s nenulovým parametrom a nie je diagonalizovateľný lineárny operátor. 18.5. Lineárne operátory na nekonečnorozmerných priestoroch 385 18.4.5. Príklad. Hyperbolická rotácia Minkowského „časopriamky R(1,1) o hyperbolický uhol θ ∈ R je lineárny operátor RRRhhhθ : R2 → R2 , ktorý má v kanonickej báze εεε = (eee0,eee1) maticu RRRhhhθ = cosh θ sinh θ sinh θ cosh θ (pozri paragraf 16.7). Charakteristický polynóm det(RRRhhhθ − xIII2) = cosh θ − x sinh θ sinh θ cosh θ − x = x2 − 2x cosh θ + cosh2 θ − sinh2 θ = x2 − 2x cosh θ + 1 má diskriminant D = 4 cosh2 θ − 4 = 4 sinh2 θ ≥ 0 a dva reálne korene x1,2 = cosh θ ± sinh θ = e±θ . Pre θ = 0 je RRRhhhθ = III2, čo je už známy prípad. Pre θ = 0 dostávame dve rôzne vlastné čísla. Príslušné vlastné vektory nájdeme riešením homogénnych sústav s maticami RRRhhhθ−eθ III2 = cosh θ − eθ sinh θ sinh θ cosh θ − eθ = − sinh θ sinh θ sinh θ − sinh θ ∼ 1 −1 0 0 , resp. RRRhhhθ −e−θ III2 = cosh θ − e−θ sinh θ sinh θ cosh θ − e−θ = sinh θ sinh θ sinh θ sinh θ ∼ 1 1 0 0 . Oba podpriestory riešení sú jednorozmerné, generované vlastnými vektormi (1, 1)T , resp. (1, −1)T . Všimnite si, že ide o svetelné vektory. V nimi tvorenej báze, danej stĺpcami matice 1 1 1 −1 , má hyperbolická rotácia RRRhhhθ diagonálnu maticu diag(eθ , e−θ ). To mimochodom platí aj pre θ = 0. 18.5 Lineárne operátory na nekonečnorozmerných priestoroch V tomto paragrafe (ako napokon ani v celom kurze) nie je našim cieľom systematické štúdium lineárnych operátorov na nekonečnorozmerných priestoroch. Obmedzíme sa len na dva poučné príklady, na ktorých sa výrazne prejavia rozdiely medzi konečno- a nekonečnorozmerným prípadom. 386 18. Vlastné hodnoty a vlastné vektory 18.5.1. Príklad. Symbolom C(∞) (R) sa zvykne označovať množina všetkých funkcií f : R → R, ktoré majú na celom R spojité derivácie všetkých rádov. Zrejme C(∞) (R) je lineárny podpriestor reálneho vektorového priestoru C(R) všetkých spojitých funkcií R → R s operáciami definovanými po zložkách (pozri príklady 4.1.3 a 6.1.8). Potom pre každú funkciu f ∈ C(∞) (R) aj jej derivácia D(f) = f patrí do C(∞) (R), teda D: C(∞) (R) → C(∞) (R) je lineárny operátor. Podmienka D(f) = λf pre jeho vlastnú hodnotu a príslušnú vlastnú funkciu nie je nič iného než diferenciálna rovnica f (x) = λf(x), ktorá má pre každé λ riešenie f(x) = f(0) eλx . To však v reči tejto kapitoly znamená, že každé reálne číslo λ je vlastnou hodnotou operátora D a prislúcha mu jednorozmerný vlastný podpriestor generovaný funkciou eλx . 18.5.2. Príklad. Určitý integrál chápaný ako funkcia hornej medze, ktorý spojitej funkcii f : a, b → R priradí predpisom F(x) = x a f(t) dt jej primitívnu funkciu I(f) = F, definuje lineárny operátor I : C a, b → C a, b na vektorovom priestore C a, b všetkých spojitých reálnych funkcií na intervale a, b (pozri príklad 6.1.9). Podmienka I(f) = λf pre jeho vlastnú hodnotu a príslušnú vlastnú funkciu má tvar integrálnej rovnice x a f(t) dt = λf(x). Ak λ = 0, tak derivovaním oboch strán podľa x zistíme, že jediná spojitá funkcia f, ktorá ju spĺňa, je identicky rovná nule. Teda 0 nie je vlastné číslo operátora I. Nech teda λ = 0. Keďže funkcia na pravej strane je diferencovateľná, musí byť diferencovateľná aj f, a po derivovaní oboch strán podľa x dostávame diferenciálnu rovnicu f(x) = λf (x), čiže f (x) = 1 λ f(x), ktorá, podobne ako v predchádzajúcom príklade, má riešenie f(x) = f(a) e x−a λ . Dosadením x = a do pôvodného vzťahu dostávame λf(a) = a a f(t) dt = 0, Cvičenia 387 teda f(a) = 0, čo má opäť za následok f(x) = 0 pre každé x. Teda ani žiadne reálne λ = 0 nie je vlastným číslom operátora I. Poučení príkladom 18.4.2 by sme sa mohli pokúšať nájsť nejaké komplexné vlastné čísla operátora I. Ale už zbežný pohľad na práve vykonané úvahy nám ukáže, že reálnosť skalára λ v nich nehrala podstatnú úlohu. Teda z rovnakých dôvodov I nemá ani komplexné vlastné čísla. Na druhej strane, lineárny operátor Ia : C a, b → C a, b daný predpisom Ia(f)(x) = f(a) + x a f(t) dt pre f ∈ C a, b , x ∈ a, b má jediné vlastné číslo λ = 1. Všetky riešenia príslušnej integrálnej rovnice Ia(f) = f majú tvar f(x) = f(a) ex−a . To znamená, že tvoria jednorozmerný vlastný podpriestor generovaný vlastnou funkciou ex−a . Presvedčte sa o tom. Cvičenia 18.1. Nájdite vlastné čísla a k nim príslúchajúce vlastné vektory nasledujúcich matíc z R2×2 : (a) AAA = 1 −1 −1 1 , (b) BBB = 1 −1 −1 0 , (c) CCC = 1 −1 1 1 , (d) DDD = 1 −1 1 0 , (e) EEE = 0 1 −1 2 , (f) BBB = 0 1 1 2 , V prípade, že vám nevyjdú reálne vlastné čísla, riešte úlohu nad poľom C. 18.2. Nájdite vlastné čísla a k nim príslúchajúce vlastné vektory nasledujúcich matíc z R3×3 : (a) AAA = 1 −1 0 −1 1 0 0 0 1 , (b) BBB = 1 −1 1 0 2 3 0 0 3 , (c) CCC = 1 1 1 1 1 3 1 3 1 , (d) DDD = 1 −1 1 −1 1 1 1 −1 1 . 18.3. Nech AAA ∈ Kn×n , BBB ∈ Km×m sú štvorcové matice. Dokážte, že nasledujúce dvojice matíc sú podobné a zakaždým nájdite regulárnu maticu, ktorá zaručí ich podobnosť: (a) diag(AAA,BBB) ≈ diag(BBB,AAA); (b) AAA ≈ AAAT . 18.4. Dokážte dôsledok 18.1.4 o invariantnosti determinantu a stopy vzhľadom na ekvivalenciu podobnosti matíc. 18.5. (a) Dokážte, že rovnosťou AAA,BBB = tr AAA · BBBT je definovaný skalárny súčin na reálnom vektorovom priestore Rm×n . 388 18. Vlastné hodnoty a vlastné vektory (b) Dokážte, že rovnosťou AAA,BBB = tr AAA · BBB∗ je definovaný skalárny súčin na komplexnom vektorovom priestore Cm×n . 18.6. (a) Nájdite príklady matíc rozmeru 2 × 2, resp. 3 × 3, ktoré maju rovnaký determinant aj stopu, ale nie sú podobné. (b) Nájdite príklady matíc rozmeru 2 × 2, resp. 3 × 3, ktoré maju rovnaký charakteristický polynóm, ale nie sú podobné. Čím sa líšia obe úlohy? (c) Dokážte že dve matice rozmeru 2×2, ktoré majú rovnaký determinant aj stopu, majú rovnaký charakteristický polynóm. (d) Nájdite príklad dvoch matíc rozmeru 3 × 3, ktoré majú rovnaký determinat aj stopu, ale rôzne charakteristické polynómy. 18.7. Nech AAA = a b c d je reálna matica. Dokážte postupne nasledujúce tvrdenia: (a) AAA má dve rôzne reálne vlastné čísla práve vtedy, keď (a − d)2 > −4bc. (b) AAA má dvojnásobné vlastné číslo práve vtedy, keď (a − d)2 = −4bc. (c) Ak AAA je symetrická, tak obe jej vlastné čísla sú reálne. (d) Ak AAA je symetrická, tak AAA má dvojnásobné vlastné číslo práve vtedy, keď a = d a b = c = 0. 18.8. (a) Ak aspoň jedna z matíc AAA,BBB ∈ Kn×n je regulárna, tak matice AAA · BBB, BBB · AAA sú podobné. Dokážte. (b) Nájdite príklad matíc AAA,BBB ∈ R2×2 takých, že matice AAA·BBB, BBB·AAA nie sú podobné. (c) Ak AAA,BBB ∈ Kn×n , tak matice AAA·BBB, BBB·AAA majú rovnaké vlastné hodnoty. Dokážte. (d) Ak AAA ∈ Rm×n , BBB ∈ Rn×m , tak matice AAA·BBB, BBB·AAA majú rovnaké nenulové vlastné hodnoty. Dokážte. (e) Nájdite príklad matíc AAA ∈ R3×2 , BBB ∈ R2×3 takých, že 0 je vlastnou hodnotou matice AAA·BBB, no nie je vlastnou hodnotou matice BBB·AAA. Mohlo by to byť aj naopak? 18.9. (a) Nájdite vlastné čísla a vlastné vektory lineárnych operátorov D, ∆: R(n) [x] → R(n) [x] z cvičení 6.9 resp. 6.10. (b) Zovšeobecnite úlohu (a) na lineárne operátory D, ∆: K[x] → K[x] dané predpismi D(f)(x) = f (x) resp. ∆(f)(x) = f(x + 1) − f(x) pre polynómy f(x) akéhokoľvek stupňa nad ľubovoľným poľom K. 18.10. (a) Ak vvv ∈ Kn je vlastný vektor matice AAA ∈ Kn×n prislúchajúci k jej vlastnej hodnote λ ∈ K a k ∈ N, tak vvv je aj vlastným vektorom matice AAAk prislúchajúcim k jej vlastnej hodnote λk . Dokážte. (b) Nech AAA ∈ R2×2 . Musí mať každé vlastné číslo matice AAA2 tvar µ = λ2 , kde λ ∈ C je vlastné číslo matice AAA? Zmení sa niečo, ak predpokladáme, že AAA ∈ C2×2 ? (c) Za predpokladu, že AAA je regulárna, sformulujte a dokážte tvrdenie analogické (a) aj pre záporné exponenty k ∈ Z. 19. Spektrum lineárneho operátora V tejto kapitole budeme pokračovať v štúdiu štruktúry lineárnych operátorov na konečnorozmerných vektorových priestoroch. Zavedieme dôležitý, ešte v predchádzajúcej kapitole avizovaný pojem spektra lineárneho operátora, ako i pojmy algebraickej a geometrickej násobnosti vlastnej hodnoty, ktoré nám umožnia klasifikovať prípadné prekážky jeho diagonalizovateľnosti. Ďalej si ujasníme, aký vplyv má riešiteľnosť polynomických rovníc v základnom poli na spektrum lineárneho operátora. Vhodným rozšírením tohto poľa možno dosiahnuť, aby každý lineárny operátor na n-rozmernom priestore mal n vlastných hodnôt, ak každú z nich počítame toľkokrát, aká je jej algebraická násobnosť. 19.1 Spektrum lineárneho operátora a matice Aby sme sa mohli pohnúť ďalej, je potrebné si pripomenúť zopár základných poznatkov o polynómoch. Aspoň v prípade polí Q a R, a možno aj C, by malo ísť o záležitosti známe zo stredoškolskej matematiky; prechod k ľubovoľnému poľu však nepredstavuje žiadnu ťažkosť. Hovoríme, že polynóm f(x) ∈ K[x] delí polynóm g(x) ∈ K[x], ak existuje polynóm p(x) ∈ K[x] taký, že g(x) = f(x) p(x). Zrejme, ak f(x) delí g(x), tak stupeň f(x) je menší alebo rovný stupňu g(x). Nech f(x) ∈ K[x] je polynóm stupňa n ≥ 1. Skalár λ ∈ K je koreňom polynómu f(x) (t. j. f(λ) = 0) práve vtedy, keď polynóm x − λ delí polynóm f(x). Hovoríme, že skalár λ ∈ K je m-násobný koreň polynómu f(x) ∈ K[x], ak (x − λ)m je najvyššia mocnina polynómu x − λ, ktorá ešte delí f(x). Miesto 1-násobný hovoríme jednoduchý koreň. Z úvahy o stupňoch vyplýva, že polynóm f(x) stupňa n ≥ 1 má nanajvýš n koreňov, ak každý z nich počítame aj s jeho násobnosťou. Presnejšie, ak λ1, . . . , λk sú všetky navzájom rôzne korene polynómu f(x) stupňa n a m1, . . . , mk sú ich násobnosti, tak m1 + . . . + mk ≤ n. Ďalej budene striedavo hovoriť raz o maticiach a inokedy o lineárnych operátoroch, podľa toho, čo bude pre nás v danej chvíli výhodnejšie. Na čitateľa nechávame, aby si podľa potreby sám urobil preklad z maticovej reči do operátorovej alebo naopak. Skalár λ ∈ K sa nazýva m-násobná vlastná hodnota matice AAA ∈ Kn×n , ak λ je m-násobným koreňom jej charakteristického polynómu chAAA(x); hovoríme tiež, že algebraická násobnosť vlastnej hodnoty λ matice AAA je m. Miesto 1násobná hovoríme jednoduchá vlastná hodnota. Podobne definujeme aj pojem 390 19. Spektrum lineárneho operátora m-násobnej vlastnej hodnoty a algebraickej násobnosti vlastnej hodnoty pre lineárne operátory na konečnorozmerných priestoroch. Z našich úvah o koreňoch polynómov vyplýva, že ak matica AAA ∈ Kn×n má k navzájom rôznych vlastných hodnôt λ1, . . . , λk ∈ K s algebraickými násobnosťami m1, . . . , mk, tak m1 + . . . + mk ≤ n. Inak povedané, matica rádu n má nanajvýš n vlastných hodnôt, ak každú z nich počítame s jej násobnosťou. Spektrom lineárneho operátora ϕ na konečnorozmernom vektorovom priestore nazývame množinu všetkých jeho vlastných hodnôt a označujeme ju Spec ϕ. Podotýkame, že takto definujeme spektrum len v konečnorozmernom prípade; definícia spektra lineárneho operátora na nekonečnorozmernom vektorovom priestore je podstane zložitejšia záležitosť, ktorá presahuje rámec lineárnej algebry. Rovnako definujeme aj spektrum matice AAA ∈ Kn×n , ktoré značíme SpecAAA. Algebraickou váhou spektra Spec ϕ nazývame súčet algebraických násobností všetkých vlastných hodnôt λ ∈ Spec ϕ. Hovoríme, že lineárny operátor ϕ má jednoduché spektrum, ak sa jeho algebraická váha rovná počtu jeho prvkov, t. j. práve vtedy, keď všetky vlastné hodnoty operátora ϕ sú jedno- duché. Popri algebraickej násobnosti zavedieme aj tzv. geometrickú násobnosť. Spomeňme si, že množina všetkých lineárnych operátorov na vektorovom priestore V sama tvorí vektorový priestor L(V, V ) nad poľom K, ktorého prvkom je aj identický operátor idV : V → V (pozri paragraf 6.5). Preto pre ϕ ∈ L(V, V ) a λ ∈ K aj zobrazenie ϕ − λ idV , dané predpisom xxx → ϕ(xxx)−λxxx, je lineárny operátor na V ; stručne ho budeme značiť ϕ−λ. Zrejme 0 = vvv ∈ V je vlastný vektor operátora ϕ prislúchajúci k jeho vlastnej hodnote λ práve vtedy, keď vvv ∈ Ker(ϕ − λ). Lineárny podpriestor Ker(ϕ − λ) ⊆ V nazývame vlastný podpriestor lineárneho operátora ϕ: V → V prislúchajúci k jeho vlastnej hodnote λ ∈ K. Zrejme pre všetky vvv ∈ Ker(ϕ − λ) platí ϕ(vvv) = λvvv, teda Ker(ϕ − λ) je invariantný podpriestor operátora ϕ. Geometrickou násobnosťou vlastnej hodnoty λ lineárneho operátora ϕ nazývame dimenziu dim Ker(ϕ−λ) jeho vlastného podpriestoru prislúchajúceho k λ. Geometrická násobnosť vlastnej hodnoty λ matice AAA ∈ Kn×n sa zrejme rovná číslu dim R(AAA−λIII). Pripomíname, že R(AAA−λIII) označuje podpriestor riešení homogénnej sústavy s maticou AAA − λIII, takže platí 1 ≤ dim R(AAA − λIII) = n − h(AAA − λIII) ≤ n (pozri paragraf 9.1). Geometrickou váhou spektra lineárneho operátora ϕ na konečnorozmernom vektorovom priestore nazývame súčet geometrických násobností všet- 19.1. Spektrum lineárneho operátora a matice 391 kých jeho vlastných hodnôt. Pojmy ako vlastný podpriestor, algebraická či geometrická násobnosť (ak za ňu pripustíme aj nulu) možno formálne rovnako zaviesť pre lineárny operátor ϕ a ľubovoľný skalár λ ∈ K, nielen pre jeho vlastné hodnoty. No λ ∈ K je vlastná hodnota práve vtedy, keď Ker(ϕ − λ) = {0}, čo je ekvivalentné s nenulovosťou tak geometrickej ako aj algebraickej násobnosti λ vzhľadom na ϕ. Teda 0-násobné, t. j. uvnevlastné hodnoty lineárneho operátora neprispievajú k algebraickej ani ku geometrickej váhe jeho spektra. Pokúsme sa teraz nejako usúvzťažniť množstvo nových pojmov, ktoré sme práve definovali. Začneme jedným pomocným tvrdením. 19.1.1. Lema. Nech ϕ je lineárny operátor na konečnorozmernom vektorovom priestore V a S ⊆ V je jeho invariantný podpriestor. Označme ϕ1 = ϕ S zúženie operátora ϕ na podpriestor S. Potom charakteristický polynóm chϕ1 (x) delí charakteristický polynóm chϕ(x). Ak navyše T ⊆ V je invariantný podpriestor taký, že V = S ⊕ T a ϕ2 = ϕ T, tak chϕ(x) = chϕ1 (x) chϕ2 (x). Dôkaz. Nech (uuu1, . . . ,uuuk,uuuk+1, . . . ,uuun) je báza priestoru V , pričom jej prvých k členov tvorí bázu podpriestoru S. Ako sme si ujasnili v paragrafe 18.2, vzhľadom na takúto bázu má ϕ maticu v blokovom tvare AAA = (ϕ)ααα = AAA1 MMM 0n−k,k AAA2 , kde AAA1 ∈ Kk×k je matica operátora ϕ1 : S → S v báze (uuu1, . . . ,uuuk) a MMM ∈ Kk×(n−k) , AAA2 ∈ K(n−k)×(n−k) . Pomocou tvrdenia 10.2.2 dostávame chϕ(x) = chAAA(x) = |AAA − xIIIn| = AAA1 − xIIIk MMM 0n−k,k AAA2 − xIIIn−k = |AAA1 − xIIIk| |AAA2 − xIIIn−k| = chAAA1 (x) chAAA2 (x) = chϕ1 (x) chAAA2 (x). Druhá časť lemy je už triviálnym dôsledkom našich úvah. 19.1.2. Tvrdenie. Nech λ je vlastná hodnota lineárneho operátora ϕ na konečnorozmernom vektorovom priestore V . Potom jej geometrická násobnosť je menšia alebo rovná jej algebraickej násobnosti. Dôkaz. Nech S = Ker(ϕ − λ) je vlastný podpriestor operátora ϕ prislúchajúci k λ a ϕ1 = ϕ S. Potom k = dim S je geometrická násobnosť λ vzhľadom na ϕ; algebraickú násobnosť λ vzhľadom na ϕ označíme m. Nech βββ = (vvv1, . . . ,vvvk) je ľubovoľná báza S. Keďže každé vvvi je vlastný vektor operátora ϕ prislúchajúci k λ, zrejme (ϕ1)βββ = λIIIk. Preto chϕ1 (x) = (λ − x)k . 392 19. Spektrum lineárneho operátora Podľa predchádzajúcej lemy tento polynóm delí chϕ(x). Nakoľko (x − λ)m je najvyššia mocnina x − λ, ktorá delí chϕ(x), platí k ≤ m. Ak algebraická násobnosť skalára λ vzhľadom na operátor ϕ je ≥ 1, t. j. ak λ je vlastná hodnota, tak aj geometrická násobnosť λ vzhľadom na ϕ je aspoň 1 (teda nie je 0). Ako ukazuje nasledujúci veľmi dôležitý príklad, až na toto minimálne obmedzenie môže byť rozdiel medzi algebraickou a geometrickou násobnosťou vlastnej hodnoty lineárneho operátora ľubovoľne veľký. 19.1.3. Príklad. Označme JJJn ∈ Kn×n štvorcovú maticu rádu n, ktorej prvky na miestach (i, i + 1) sú rovné 1 pre 1 ≤ i ≤ n − 1 a všetky ostatné prvky sú rovné 0. Zrejme h(JJJn) = n − 1. Ďalej položme JJJn(λ) = λIIIn + JJJn =       λ 1 0 . . . 0 0 λ 1 . . . 0 ... ... ... ... ... 0 0 . . . λ 1 0 0 . . . 0 λ       , pre λ ∈ K. Teda JJJn(λ) je tvorená diagonálou z n lámbd, vedľajšou diagonálou vpravo od nej z n − 1 jednotiek a zvyšok sú nuly. Tak napríklad JJJ1(λ) = (λ), JJJ2(λ) = λ 1 0 λ , JJJ3(λ) =   λ 1 0 0 λ 1 0 0 λ   , atď. Každá matica tvaru JJJn(λ) sa nazýva Jordanova bunka, prípadne Jordanov blok rádu n prislúchajúci skaláru λ. Zrejme aj JJJn = JJJn(0) je Jordanova bunka. Charakteristický polynóm Jordanovej bunky JJJn(λ) je det(JJJn(λ) − xIIIn) = detJJJn(λ − x) = (λ − x)n . Táto matica má jedinú vlastnú hodnotu x = λ s algebraickou násobnosťou n. Na druhej strane, podpriestor riešení homogénnej sústavy s maticou JJJn(λ) − λIIIn = JJJn je jednorozmerný, generovaný vlastným vektorom eee1 = (1, 0, . . . , 0)T . Teda geometrická násobnosť vlastnej hodnoty λ matice JJJn(λ) je stále len 1, bez ohľadu na to, aké veľké je n. Preto JJJn(λ) pre n ≥ 2 nie je podobná so žiadnou diagonálnou maticou. Ako sme už spomínali, podobné matice sú maticami toho istého lineárneho operátora. Tvrdenie 18.2.1 tak možno zosilniť do nasledujúcej podoby. 19.1.4. Tvrdenie. Podobné matice majú rovnaké spektrum, vrátane algebraickej i geometrickej násobnosti každej vlastnej hodnoty. 19.2. Schurova veta o triangularizácii 393 Pomocou pojmov spektra a algebraickej a geometrickej násobnosti teraz môžeme podstatne spresniť charakterizáciu diagonalizovateľných operátorov z vety 18.2.2. 19.1.5. Veta. Nech ϕ je lineárny operátor na konečnorozmernom vektorovom priestore V dimenzie n. Potom nasledujúce podmienky sú ekviva- lentné: (i) ϕ je diagonalizovateľný; (ii) geometrická váha spektra Spec ϕ sa rovná n; (iii) algebraická váha spektra Spec ϕ sa rovná n a algebraická násobnosť každej vlastnej hodnoty sa rovná jej geometrickej násobnosti; (iv) algebraická i geometrická váha spektra Spec ϕ sa rovná n. Dôkaz. Z vety 18.2.2 vyplývajú implikácie (iv) ⇒ (i) ⇒ (ii); (ii) ⇒ (iii) ⇒ (iv) sú zasa dôsledkom tvrdenia 19.1.2. Práve vyslovená veta nám umožňuje rozdeliť prekážky, ktoré bránia diagonalizácii nejakého lineárneho operátora ϕ na n-rozmernom vektorovom priestore V , do dvoch kategórií: (1) algebraická váha spektra Spec ϕ je menšia než n = dim V , inak povedané, ϕ má „málo vlastných hodnôt v poli K, i keď každú z nich počítame aj s jej algebraickou násobnosťou; (2) geometrická váha spektra Spec ϕ je menšia než jeho algebraická váha, čiže geometrická násobnosť niektorých vlastných hodnôt nedosahuje ich algebraickú násobnosť. Uvedené dva typy prekážok sa môžu u lineárnych operátorov vyskytovať každá zvlášť i obe súčasne. V druhej polovici tejto kapitoly si ukážeme, ako možno prekážky prvého typu prekonať prechodom do „bohatšieho poľa (niečo také sme už naznačili v príklade 18.4.2). Prekážky druhého typu majú zásadnejší charakter a definitívne vylučujú diagonalizáciu. Ako však uvidíme v nasledujúcej kapitole, i v tomto prípade sa možno do značnej miery priblížiť diagonálnemu tvaru pomocou blokovo diagonálnych matíc zložených zo Jordanových buniek. 19.2 Schurova veta o triangularizácii Zatiaľ aspoň dokážeme, že v maticiach s „dostatočne mnoho vlastnými hodnotami možno vynulovať všetky prvky pod diagonálou. Z toho priamo vyplýva, že každý lineárny operátor s plnou algebraickou váhou spektra má vo vhodnej báze hornú trojuholníkovú maticu (pozri koniec paragraf 10.2), 394 19. Spektrum lineárneho operátora ktorej diagonálu tvorí spektrum operátora, vrátane algebraickej násobnosti každej vlastnej hodnoty. 19.2.1. Veta. (Schurova veta o triangularizácii) Nech matica AAA ∈ Kn×n má spektrum algebraickej váhy n. Potom AAA je podobná s hornou trojuholníkovou maticou CCC = PPP−1 · AAA · PPP, ktorej diagonálu tvoria všetky vlastné hodnoty matice AAA, pričom každá sa tu vyskytuje toľkokrát, aká je jej algebraická násobnosť. Navyše možno zabezpečiť, aby matica prechodu PPP bola v prípade poľa K = R ortogonálna a v prípade poľa K = C unitárna. Dôkaz. Najprv sa sústredíme iba na prvú časť vety. Dokážeme len existenciu hornej trojuholníkovej matice CCC ≈ AAA. Zvyšok vety je už nevyhnutným dôsledkom jej trojuholníkového tvaru. Budeme postupovať indukciou podľa n. Pre n = 1 má už samotná matica AAA = (a) žiadaný tvar. Nech teda n ≥ 2 a predpokladajme, že každá matica z K(n−1)×(n−1) s plnou algebraickou váhou spektra je podobná s nejakou hornou trojuholníkovou maticou. Nech λ je niektorá z vlastných hodnôt matice AAA. Keďže k nej príslušný vlastný vektor generuje AAA-invariantný podpriestor, AAA je podobná s blokovou maticou BBB = λ zzz 0 BBB1 , kde 0 ∈ K(n−1)×1 , zzz ∈ K1×(n−1) , BBB1 ∈ K(n−1)×(n−1) . Preto BBB = RRR−1 · AAA · RRR pre nejakú regulárnu maticu RRR ∈ Kn×n . Keďže AAA aj BBB majú spektrum algebraickej váhy n, algebraická váha spektra BBB1 je n − 1. Podľa indukčného predpokladu BBB1 je podobná s hornou trojuholníkovou maticou CCC1, teda CCC1 = QQQ−1 · BBB1 · QQQ pre vhodnú regulárnu maticu QQQ ∈ K(n−1)×(n−1) . Potom aj diag(1,QQQ) ∈ Kn×n je regulárna. Pomocou pravidla pre násobenie blokových matíc (pozri paragraf 2.2.3) dostávame AAA ≈ (RRR · diag(1,QQQ))−1 · AAA · (RRR · diag(1,QQQ)) = diag(1,QQQ)−1 · RRR−1 · AAA · RRR · diag(1,QQQ) = diag 1,QQQ−1 · λ zzz 0 BBB1 · diag(1,QQQ) = λ zzz · QQQ 0 QQQ−1 · BBB1 · QQQ = λ zzz · QQQ 0 CCC1 , čo je opäť horná trojuholníková matica. Podľa prvej časti vety existuje regulárna matica PPP taká, že matica CCC = PPP−1 · AAA · PPP je horná trojuholníková. V prípade poľa R resp. C označme SSS maticu, ktorá vznikne ortogonalizáciou stĺpcov matice PPP podľa GramovhoSchmidtovho procesu (vzhľadom na štandardný skalárny súčin v Rn resp. 19.2. Schurova veta o triangularizácii 395 v Cn ) a ich následným znormovaním. Potom SSS je ortogonálna resp. unitárna matica, a vzhľadom na to, že k-ty vektor vznikajúci pri GramovomSchmidtovom procese je vždy lineárnou kombináciou prvých k−1 pôvodných vektorov, SSS = PPP · TTT pre jednoznačne určenú regulárnu hornú trojuholníkovú maticu TTT. Potom TTT−1 · CCC · TTT = TTT−1 · PPP−1 · AAA · PPP · TTT = SSS−1 · AAA · SSS je horná trojuholníková matica, podobná s maticou AAA prostredníctvom ortogonálnej resp. unitárnej matice SSS. Preformulovaním práve dokázanej vety do reči lineárnych operátorov okamžite dostávame nasledujúci dôsledok. 19.2.2. Dôsledok. Nech ϕ je lineárny operátor na n-rozmernom vektorovom priestore V nad poľom K so spektrom s algebraickou váhou n. Potom existuje báza βββ priestoru V , vzhľadom na ktorú má ϕ hornú trojuholníkovú maticu s diagonálou tvorenou jeho vlastnými hodnotami. V prípade poľa K = R a euklidovského priestoru V resp. poľa K = C a unitárneho priestoru V možno navyše zabezpečiť, aby báza βββ bola ortonormálna. Charakteristický polynóm hornej trojuholníkovej matice CCC ∈ Kn×n s diagonálou (λ1, . . . , λn) je chCCC(x) = (λ1 − x) . . . (λn − x) = λ1 . . . λn − . . . + (−1)n−1 (λ1 + . . . + λn)xn−1 + (−1)n xn , a jeho koeficienty pri mocninách x0 a xn−1 možno tentokrát (na rozdiel od všeobecnej matice) nahliadnuť naozaj bez ťažkostí. Taktiež platí detCCC = λ1 . . . λn, trCCC = λ1 + . . . + λn. Kedže podobné matice majú rovnaký determinant, stopu aj charakteristický polynóm, z práve dokázanej vety 19.2.1 taktiež vyplýva 19.2.3. Tvrdenie. Nech matica AAA ∈ Kn×n má n (nie nutne rôznych) vlastných hodnôt λ1, . . . , λn. Potom detAAA = λ1 . . . λn, trAAA = λ1 + . . . + λn a v charakteristickom polynóme chAAA(x) sú koeficienty pri mocninách x0 a xn−1 rovné detAAA resp. (−1)n−1 trAAA. 396 19. Spektrum lineárneho operátora 19.2.4. Príklad. Uvažujme reálnu maticu AAA =   12 0 −28 11 1 −29 7 0 −16   . Jej charakteristický polynóm chAAA(x) = 12 − x 0 −28 11 1 − x −29 7 0 −16 − x = 4 − 3x2 − x3 = (1 − x)(2 + x)2 má jednoduchý koreň x1 = 1 a dvojnásobný koreň x2,3 = −2. Homogénna sústava s maticou AAA − III3 =   11 0 −28 11 0 −29 7 0 −17   ∼   1 0 0 0 0 1 0 0 0   má jednorozmerný podpriestor riešení generovaný vektorom (0, 1, 0)T . Homogénna sústava s maticou AAA + 2III3 =   14 0 −28 11 3 −29 7 0 −14   ∼   1 0 −2 0 1 −7/3 0 0 0   má opäť len jednorozmerný podpriestor riešení generovaný vektorom (6, 7, 3)T . Matica AAA teda má jednoduché vlastné číslo 1, ku ktorému prislúcha vlastný vektor (0, 1, 0)T a algebraicky dvojnásobné vlastné číslo −2 s geometrickou násobnosťou 1, ku ktorému prislúcha vlastný vektor (6, 7, 3)T . Preto AAA nie je podobná so žiadnou diagonálnou maticou. Ukážeme, ako k nej možno nájsť podobnú hornú trojuholníkovú maticu. Vlastný vektor (0, 1, 0)T prislúchajúci k vlastnému číslu 1 doplníme do bázy R3 tvorenej stĺpcami matice PPP =   0 1 0 1 0 0 0 0 1   . Potom AAA ≈ PPP−1 · AAA · PPP =   1 11 −29 0 12 −28 0 7 −16   = BBB. 19.2. Schurova veta o triangularizácii 397 O matici BBB1 ∈ R2×2 tvoriacej pravý dolný matice BBB už vieme, že má jediné algebraicky dvojnásobné vlastné číslo −2. K nemu príslušný vlastný vektor nájdeme riešením homogénnej sústavy s maticou BBB1 + 2III2 = 14 −28 7 −14 ∼ 1 −2 0 0 . Podpriestor riešení je generovaný vektorom (2, 1)T . Doplnením tohto vektora do bázy priestoru R2 dostaneme (napr.) maticu QQQ = 2 1 1 0 . Potom 12 −28 7 −16 ≈ QQQ−1 · 12 −28 7 −16 · QQQ = −2 7 0 −2 . Všimnite si, že vlastná hodnota −2 sa nám zákonite objavila aj v pravom dolnom rohu „sama od seba . Stĺpce matice RRR = PPP · diag(1,QQQ) =   0 2 1 1 0 0 0 1 0   tvoria bázu, vzhľadom na ktorú má lineárny operátor xxx → AAA ·xxx na R3 hornú trojuholníkovú maticu. Kedže (11, −29) · QQQ = (−7, 11) (zzz = (11, −29) je prvý riadok matice BBB bez prvého člena), bez ďalšieho násobenia vidíme, že táto matica má tvar RRR−1 · AAA · RRR =   1 −7 11 0 −2 7 0 0 −2   ≈ AAA. Ešte poznamenajme, že pre maticu AAA rádu n > 3 by sme museli procedúru vyčleňovania vlastných čísel a príslušných vlastných podpriestorov opakovať viackrát, pokým by sme sa nedopracovali k hornej trojuholníkovej matici rádu 2 (ak by sme náhodou nemali šťastie a nedospeli už skôr k hornej trojuholníkovej matici väčšieho rádu). Až potom by sme mohli začať z dielčích matíc prechodu spätne skladať výslednú maticu prechodu a pomocou nej získať hornú trojuholníkovú maticu podobnú s AAA. 398 19. Spektrum lineárneho operátora 19.3 Rozšírenia polí, algebraicky uzavreté polia Pri ďalšom štúdiu spektra lineárnych operátorov sa nezaobídeme bez niektorých hlbších vedomostí o štruktúre polí a polynómov nad nimi. Ak by sme trvali na úplnosti a sebestačnosti nášho výkladu, museli by sme v tejto chvíli značne odbočiť od našej hlavnej témy a začať rozvíjať inú časť algebry. Miesto toho iba sformulujeme niekoľko základných výsledkov, o ktoré sa budeme ďalej opierať. Ich dôkazy vynecháme, takže ich vlastne len predložíme čitateľovi na uverenie. Ich formulácia si však vyžaduje zaviesť niekoľko nových pojmov, pri ktorých nám prídu vhod i niektoré poznatky z lineárnej algebry. Pripomíname (pozri paragraf 1.2), že pole K sa nazýva podpoľom poľa L, prípadne pole L sa nazýva rozšírením poľa K, ak K ⊆ L, obe polia majú tú istú nulu 0 a jednotku 1 a pre všetky a, b ∈ K sa ich súčet a + b a súčin ab v K rovná ich súčtu a + b resp. súčinu ab v L. Z toho už vyplýva, že pre 0 = a ∈ K sa inverzný prvok a−1 v K zhoduje s inverzným prvkom a−1 v L. Ak pole L je rozšírením poľa K, tak L možno považovať za vektorový priestor nad poľom K (pozri príklad 1.6.1). Hovoríme, že pole L je konečným rozšírením poľa K, ak L je konečnorozmerný vektorový priestor nad K; jeho dimenziu nazývame stupňom rozšírenia L nad K a značíme ju [L :K] = dimK L. Teda konečné rozšírenie je také, ktoré má konečný stupeň. Prvok c ∈ L sa nazýva algebraický nad K, ak c je koreňom nejakého polynómu f(x) ∈ K[x] stupňa ≥ 1. Rozšírenie L poľa K sa nazýva algebraické, ak každý prvok c ∈ L je algebraický nad K. 19.3.1. Tvrdenie. Každé konečné rozšírenie poľa K je algebraické nad K. Dôkaz uvádzame ako jednoduchú ukážku použitia metód lineárnej algebry v teórii polí. Nech L je konečné rozšírenie poľa K stupňa [L :K] = n. Zvoľme ľubovoľné c ∈ L. Potom (n + 1)-tica (1, c, c2 , . . . , cn ) prvkov z L nemôže byť lineárne nezávislá nad K, preto existujú a0, a1, . . . , an ∈ K, nie všetky rovné 0, také, že a0 + a1c + . . . + ancn = 0. Ale to znamená, že c je koreňom polynómu f(x) = a0 + a1x + . . . + anxn ∈ K[x]. Poznamenajme, že obrátená implikácia neplatí, t. j. algebraické rozšírenie daného poľa môže mať nekonečný stupeň. Z dôkazu navyše vyplýva, že každý prvok konečného rozšírenia L poľa K stupňa [L : K] = n je koreňom polynómu f(x) ∈ K[x] stupňa ≤ n. Pre naše potreby má kľúčový význam nasledujúca skutočnosť. 19.3. Rozšírenia polí, algebraicky uzavreté polia 399 19.3.2. Tvrdenie. Nech f(x) = a0 + a1x + . . . + anxn ∈ K[x], an = 0, je polynóm stupňa n ≥ 1 nad poľom K. Potom existuje konečné (teda nutne algebraické) rozšírenie L poľa K také, že f(x) má v L[x] rozklad na lineárne faktory f(x) = an(x − λ1) . . . (x − λn). Inak povedané, f(x) má práve n koreňov λ1, . . . , λn ∈ L, ak každý z nich počítame aj s jeho násobnosťou. Rozšírenie L možno navyše zvoliť tak, že každý jeho prvok má tvar g(λ1, . . . , λn) pre nejaký polynóm g(x1, . . . , xn) v n premenných s koeficientmi z K – pole L, ktoré je týmito podmienkami určené jednoznačne až na izomorfizmus polí, nazývame rozkladové pole polynómu f(x). Pre stupeň rozkladového poľa platí [L : K] ≤ n!. (Prenechávame čitateľovi, aby si sám sformuloval pojem izomorfizmu polí.) Pole L sa nazýva algebraicky uzavreté, alebo tiež algebraicky úplné, ak každý polynóm f(x) ∈ L[x] stupňa aspoň 1 má v L aspoň jeden koreň. Pomerne jednoducho možno nahliadnuť (prípadne dokázať matematickou indukciou podľa stupňa n), že pole L je algebraicky úplné práve vtedy, keď každý polynóm f(x) ∈ L[x] stupňa aspoň 1 má v L[x] rozklad na lineárne faktory (skúste sami). Algebraické rozšírenie poľa K, ktoré je navyše samo algebraicky uzavreté, sa nazýva algebraický uzáver poľa K. Nie celkom elementárnymi prostriedkami možno dokázať nasledujúcu vetu. 19.3.3. Veta. Ku každému poľu K existuje jeho algebraický uzáver. Podobne ako rozkladové pole polynómu, aj algebraický uzáver daného poľa je určený jednoznačne až na izomorfizmus polí. Na druhej strane, algebraický uzáver daného poľa nemusí byť jeho konečným rozšírením. V jednom dôležitom prípade však tomu tak je. Pole C všetkých komplexných čísel má ako rozšírenie poľa R všetkých reálnych čísel stupeň [C : R] = 2. Aby sme sa teda utvrdili v tom, že je algebraickým uzáverom poľa R, stačí sa odvolať na nasledujúci klasický a hlboký výsledok, známy ako základná veta algebry. 19.3.4. Veta. Pole C všetkých komplexných čísel je algebraicky úplné. Zhrňme si teraz stručne niektoré dôsledky práve vykonaných úvah pre spektrá matíc. Predovšetkým, spektrum matice AAA ∈ Kn×n závisí na príslušnom poli. Presnejšie, takúto maticu možno považovať aj za maticu AAA ∈ Ln×n , kde L je ľubovoľné rozšírenie poľa K. Ak označíme SpecK AAA, SpecL AAA príslušné spektrá (t. j. množiny vlastných hodnôt matice AAA v poli K resp. L), tak zrejme SpecK AAA ⊆ SpecL AAA. Na druhej strane, každé λ ∈ SpecK AAA má 400 19. Spektrum lineárneho operátora zrejme rovnakú algebraickú i geometrickú násobnosť, ktorá nezávisí na príslušnom poli. Z tvrdenia 19.3.2 priamo vyplýva 19.3.5. Tvrdenie. Ku každej matici AAA ∈ Kn×n existuje konečné rozšírenie L poľa K také, že charakteristický polynóm matice AAA možno v L[x] rozložiť na súčin lineárnych faktorov chAAA(x) = (λ1 − x) . . . (λn − x). Inak povedané, AAA má n vlastných hodnôt λ1, . . . , λn ∈ L, vrátane ich algebraickej násobnosti. Potom pre každé rozšírenie M poľa L už platí SpecM AAA = SpecL AAA. Aplikáciou tvrdenia 19.3.5 na Schurovu vetu 19.2.1 okamžite dostávame 19.3.6. Tvrdenie. Ku každej matici AAA ∈ Kn×n existuje konečné rozšírenie L poľa K také, že AAA je nad L podobná s hornou trojuholníkovou maticou BBB ∈ Ln×n , ktorej diagonálu tvoria vlastné hodnoty matice AAA v L, vrátane ich algebraickej násobnosti. Napokon si ešte uvedomme, že tvrdenia 19.3.5 a 19.3.6 sú automaticky (t. j. pre L = K) splnené pre štvorcové matice nad algebraicky uzavretým poľom K. Špeciálne to platí pre štvorcové matice nad poľom C. 19.4 Komplexifikácia Pozrime sa teraz na výsledky sformulovné v závere predchádzajúceho paragrafu z hľadiska vedúceho zámeru tejto kapitoly, ktorým je diagonalizácia matice lineárneho operátora ϕ: V → V na konečnorozmernom vektorovom priestore V . Zdá sa, že sme na tejto ceste naozaj kus pokročili a skutočne ukázali, ako možno prekonať prípadnú prekážku spočívajúcu v nedostatočnej algebraickej váhe spektra. Pokiaľ by sme sa zaujímali len o samotné matice, bolo by tomu tak. Nezabúdajme však, že v prvom rade nám ide o lineárne operátory a matice používame len ako viac-menej pomocné objekty slúžiace na ich popis. Ak L je rozšírenie poľa K, tak každá matica AAA ∈ Kn×n ⊆ Ln×n prirodzene určuje lineárny operátor operátor ϕ: Kn → Kn ako aj lineárny operátor ψ: Ln → Ln . Hoci ϕ aj ψ sú oba definované tým istým predpisom xxx → AAA ·xxx, (okrem triviálneho prípadu, keď L = K) sú to rôzne operátory, lebo operujú na rôznych vektorových priestoroch, navyše nad rôznymi poľami. Napriek tomu akosi podvedome cítime, že tým „správnym analógom vektorového priestoru Kn nad poľom K je práve vektorový priestor Ln nad poľom L. 19.4. Komplexifikácia 401 Potom operátoru ϕ: Kn → Kn , kde ϕ(xxx) = AAA · xxx pre xxx ∈ Kn , „prirodzene zodpovedá operátor ψ: Ln → Ln , kde ψ(xxx) = AAA·xxx pre xxx ∈ Ln . No v situácii, keď ϕ: V → V je lineárny operátor na „abstraktnom vektorovom priestore V nad poľom K, otázka, akým vektorovým priestorom W nad poľom L máme nahradiť V a aký lineárny operátor ψ: W → W by mal zodpovedať operátoru ϕ, už nie je zďaleka taká jasná. Príslušnú konštrukciu možno elegantne popísať v jazyku tenzorových súčinov (pozri paragraf 32.3). Aj elementárnymi prostriedkami, ktoré máme v tejto chvíli k dispozícii však dokážeme zvládnuť pre nás najdôležitejší špeciálny prípad – totiž prechod od R k C. Budeme si počínať v podstate rovnako ako pri dôverne známej konštrukcii poľa C z poľa R. Komplexifikáciou vektorového priestoru V nad poľom R nazveme vektorový priestor V C nad poľom C, ktorého prvkami sú všetky formálne lineárne kombinácie tvaru zzz = xxx + iyyy, kde xxx,yyy ∈ V a i ∈ C je imaginárna jednotka. Pre xxx,yyy,uuu,vvv ∈ V kladieme xxx + iyyy = uuu + ivvv ⇔ xxx = uuu & yyy = vvv. Píšeme tiež xxx = Rezzz, yyy = Imzzz a vektory xxx,yyy ∈ V nazývame reálnou resp. imaginárnou časťou vektora zzz ∈ V C . Sčítanie takýchto vektorov definujeme „po zložkách , čiže (xxx + iyyy) + (uuu + ivvv) = (xxx + uuu) + i(yyy + vvv). Konečne násobenie skalárom a + ib ∈ C, kde a, b ∈ R, definujeme vzťahom (a + ib)(xxx + iyyy) = (axxx − byyy) + i(ayyy + bxxx). Čitateľ si určite aj sám ľahko overí, že komplexifikácia V C reálneho vektorového priestoru V s takto definovanou rovnosťou a operáciami naozaj tvorí vektorový priestor nad poľom C. Ešte dodajme, že – rovnako ako v samotnom poli C – komplexne združeným vektorom k vektoru zzz = xxx + iyyy ∈ V C nazývame vektor zzz = xxx − iyyy. Poznámka Komplexifikácia V C reálneho vektorového priestoru V sa tiež zvykne značiť C⊗R V , prípadne len C⊗V , t. j. ako tenzorový súčin C a V nad poľom R. V tejto chvíli však ide naozaj len o „nevinné označenie a práve popísaná konštrukcia ani jej ďalšie využitie si nijakú znalosť tenzorových súčinov ne- vyžadujú. 19.4.1. Tvrdenie. Nech V je reálny vektorový priestor. Potom dimC V C = dimR V. 402 19. Spektrum lineárneho operátora Dôkaz. Nech dimR V = n a uuu1, . . . ,uuun je nejaká báza priestoru V nad R. Ponechávame na čitateľa, aby si sám overil, že tie isté vektory uuu1, . . . ,uuun tvoria aj bázu V C nad C.1 Taktiež ľahko nahliadneme, že dimR V = ∞ má za následok dimC V C = ∞. Komplexifikácia vektorového priestoru nad R je v istom zmysle opačnou konštrukciou k zreálneniu vektorového priestoru nad C (pozri paragraf 17.1). Vzťahu oboch konštrukcií sa budeme podrobnejšie venovať v cvičeniach. Komplexifikáciou lineárneho zobrazenia ϕ: V → U medzi reálnymi vektorovými priestormi V , U nazývame lineárne zobrazenie ϕC : V C → UC dané predpisom ϕC (xxx + iyyy) = ϕ(xxx) + iϕ(yyy), pre xxx,yyy ∈ V . Špeciálne ϕC (xxx) = ϕ(xxx) pre xxx ∈ V . Opäť sa ľahko overí, že ϕC je naozaj lineárne zobrazenie medzi vektorovými priestormi nad C. Taktiež nasledujúce tvrdenie je zrejmé z práve vyslovenej definície a predchádzajúceho tvrdenia. 19.4.2. Tvrdenie. Nech U, V sú reálne vektorové priestory s bázami ααα resp. βββ a ϕ: V → U je lineárne zobrazenie. Potom (ϕ)ααα,βββ = ϕC ααα,βββ . Inak povedané ϕ a jeho komplexifikácia ϕC : V C → UC majú tú istú maticu vzhľadom na bázy βββ, ααα. Ak ľubovoľný vektor zzz = (x1+iy1, . . . , xn+iyn)T ∈ Cn rozložíme na reálnu a imaginárnu časť zzz = xxx + iyyy = Rezzz + i Imzzz, kde xxx = Rezzz = (x1, . . . , xn)T , yyy = Imzzz = (y1, . . . , yn)T sú reálne vektory tvorené reálnymi resp. imaginárnymi časťami kanonických súradníc vektora zzz, prirodzene tým stotožníme komplexifikáciu (Rn )C priestoru Rn s priestorom Cn . Za takýchto okolností je komplexifikáciou lineárneho zobrazenia ϕ: Rn → Rm s maticou AAA (vzhľadom na kanonické bázy) zobrazenie ϕC : Cn → Cm , ktoré má (v kanonických bázach) rovnakú maticu AAA. Vidíme teda, že naša „abstraktná konštrukcia komplexifikácie sa plne zhoduje s „konkrétnymi komplexifikáciami Cn priestorov Rn a lineárnych zobrazení medzi takýmito priestormi. Z hľadiska vedúceho zámeru tejto kapitoly spočíva hlavný význam komplexifikácie v nasledujúcom tvrdení. 1 Striktne podľa definície by sme mali hovoriť o vektoroch uuu1+i0, . . . ,uuun+i0. Prirodzene však píšeme xxx + i0 = xxx, 0 + iyyy = iyyy, a V stotožňujeme s množinou {xxx + i0; xxx ∈ V } ⊆ V C . 19.5. Geometrický význam komplexných vlastných čísel 403 19.4.3. Veta. Nech V je vektorový priestor konečnej dimenzie n nad poľom R a ϕ: V → V je lineárny operátor. Potom lineárny operátor ϕC : V C → V C má, vrátane algebraickej násobnosti, n vlastných čísel λ1, . . . , λn ∈ C. Samozrejme, reálne spomedzi vlastných čísel λ1, . . . , λn operátora ϕC sú priamo vlastnými číslami pôvodného operátora ϕ. S istou dávkou zjednodušenia však nazývame aj hodnoty λj s nenulovou imaginárnou časťou komplexnými vlastnými číslami (reálneho) operátora ϕ. Inak povedané, prekážku diagonalizácie matice lineárneho operátora na konečnorozmernom vektorovom priestore nad R, spočívajúcu v nedostatočnej algebraickej váhe jeho spektra, vieme prekonať komplexifikáciou príslušného priestoru a operátora. Poznamenajme, že nahradením poľa C rozkladovým poľom príslušného charakteristického polynómu a istým zovšeobecnením metódy komplexifikácie možno rovnaký cieľ dosiahnuť aj pre lineárne operátory na konečnorozmerných vektorových priestoroch nad ľubovoľným poľom. Tieto otázky však už presahujú rámec nášho kurzu. 19.5 Geometrický význam komplexných vlastných čísel Geometrický význam reálnych vlastných čísel lineárnej transformácie ϕ vektorového priestoru V nad poľom R je zrejmý: ak λ ∈ R je vlastné číslo, tak príslušný vlastný vektor vvv ∈ V (i každý vektor vlastnej priamky [vvv]) sa zobrazením ϕ zobrazí na svoj λ-násobok. Pri našej „podvedomej geometrickej interpretácii priestoru V (keď doňho mimovoľne vnášame euklidovskú štruktúru), sa dĺžka vektora vvv zmení na jej |λ|-násobok; ak λ > 0, tak orientácia vektora vvv sa zachová, ak λ < 0, zmení sa na opačnú. Tentokrát sa však nemusíme odvolávať na nijaké „podvedomé geometrické súvislosti. Z podmienky homogenity (pozri paragraf 13.3) totiž vyplýva, že rovnosť ϕ(vvv) = |λ| vvv platí pre ľubovoľnú normu na V . V príklade 18.4.2 sme však videli, že aj lineárna transformácia reálneho vektorového priestoru môže mať komplexné vlastné čísla. Cieľom tohto paragrafu je ukázať, že uvedený príklad je svojim spôsobom typický, presnejšie, za výskytom komplexných vlastných čísel reálnej lineárnej transformácie sa vždy skrýva nejaké otočenie (pri spomínanej mimovoľnej euklidovskej interpretácii). Tým by sa mal z úlohy komplexných vlastných čísel definitívne vytratiť akýkoľvek mystický ráz. 19.5.1. Tvrdenie. Nech λ ∈ C je vlastné číslo matice AAA ∈ Rn×n a www je k nemu prislúchajúci vlastný vektor. Potom aj λ je vlastné číslo matice AAA a prislúcha k nemu vlastný vektor www. Navyše vlastné čísla λ a λ majú rovnakú algebraickú i geometrickú násobnosť. 404 19. Spektrum lineárneho operátora Dôkaz. Najprv dokážeme, že komplexné číslo λ je m-násobným koreňom polynómu f(x) = a0 + a1x + . . . + anxn ∈ R[x] práve vtedy, keď λ je jeho mnásobným koreňom. Stačí ukázať, že z deliteľnosti f(x) mocninou (x − λ)m vyplýva jeho deliteľnosť mocninou (x − λ)m . Nech teda f(x) = (x − λ)m p(x) pre nejaký polynóm p(x) = c0 + c1x + . . . + ckxk ∈ C[x]. Potom zrejme (x − λ)m (c0 + c1x + . . . + ckxk ) = a0 + a1x + . . . + anxn = f(x), lebo pre koeficienty polynómu f(x) ∈ R[x] platí aj = aj. Ak teda λ je algebraicky m-násobné vlastné číslo matice AAA ∈ Rn×n , tak aj λ je jej vlastné číslo s tou istou algebraickou násobnosťou. Nech www ∈ Cn je vlastný vektor prislúchajúci k λ, čiže AAA · www = λwww. Potom tiež AAA · www = λwww. Keďže AAA = AAA je reálna, vyplýva z toho AAA · www = λwww, t. j. www je vlastný vektor matice AAA prislúchajúci k λ. Teda zobrazenie www → www je semilineárny izomorfizmus (pozri cvičenia ku kapitole 17) vlastných podpriestorov R(AAA − λIII) → R(AAA − λIII), preto tieto priestory majú rovnakú dimenziu a vlastné čísla λ, λ majú rovnakú geometrickú násobnosť. Teda komplexné vlastné čísla s nenulovou imaginárnou časťou reálnych matíc resp. lineárnych transformácií reálnych vektorových priestoroch sa vždy vyskytujú v komplexne združených pároch λ, λ, rovnako ako k nim príslušné vlastné vektory. Ukážeme si, že za takýmto výskytom sa vždy skrýva dvojrozmerný invariantný podpriestor, na ktorom príslušná matica operuje ako rotácia o uhol α zložená s rovnoľahlosťou s koeficientom r > 0, kde λ = r(cos α + i sin α) je goniometrický tvar čísla λ. Nech teda ϕ: V → V je lineárny operátor na reálnom vektorovom priestore V , λ = a + ib, λ = a − ib, kde a, b ∈ R, b = 0, sú komplexne združené vlastné čísla jeho komplexifikácie ϕC : V C → V C a www ∈ V C resp. www ∈ V C sú k nim prislúchajúce vlastné vektory. Potom zúženie operátora ϕC na jeho dvojrozmerný invariantný podpriestor [www,www] ⊆ V C má v báze (www,www) maticu diag(λ, λ). Označme uuu = Rewww = Rewww = 1 2 (www + www), vvv = − Imwww = Imwww = 1 2i (www − www) vektory z pôvodného reálneho priestoru V . Potom www = uuu − ivvv, www = uuu + ivvv. Ľahko nahliadneme, že uuu, vvv sú lineárne nezávislé (nad R), teda tvoria bázu dvojrozmerného podpriestoru [uuu,vvv] ⊆ V . Počítajme ϕ(uuu) = ϕC (uuu) = 1 2 ϕC (www) + ϕC (www) = 1 2 (λwww + λwww) = Re(λwww) = auuu + bvvv, ϕ(vvv) = ϕC (vvv) = 1 2i ϕC (www) − ϕC (www) = 1 2i (λwww − λwww) = Im(λwww) = −buuu + avvv. Cvičenia 405 Vidíme, že [uuu,vvv] ⊆ V je dvojrozmerný invariantný podpriestor operátora ϕ a zúženie ϕ na [uuu,vvv] má v báze (uuu,vvv) reálnu maticu, ktorú možno pomocou goniometrického vyjadrenia vlastných čísel λ = r(cos α + i sin α) = r eiα , λ = r(cos α − i sin α) = r e−iα (t. j. a = r cos α, b = r sin α) zapísať v tvare a −b b a = r cos α −r sin α r sin α r cos α = r cos α − sin α sin α cos α = rRRRα. Tým sme vlastne dokázali nasledujúcu vetu. 19.5.2. Veta. Nech ϕ je lineárna transformácia reálneho vektorového priestoru V , λ = a + ib = r(cos α + i sin α) je jej komplexná vlastná hodnota s nenulovou imaginárnou časťou, ku ktorej vo V C prislúcha vlastný vektor uuu−ivvv, kde uuu,vvv ∈ V . Potom (uuu,vvv) je bázou invariantného podpriestoru [uuu,vvv] ⊆ V a zúženie ϕ na [uuu,vvv] má v tejto báze reálnu maticu a −b b a = rRRRα. V úvode ku kapitole 13 sme zdôrazňovali, že hovoriť o kvantitatívnych geometrických veličinách ako dĺžka či uhol v abstraktných vektorových priestoroch, hoc aj nad poľom R, nedáva dobrý zmysel. Až prítomnosť skalárneho súčinu v takomto priestore nám to umožňuje. Teda, prísne vzaté, zatiaľ stále nemáme právo tvrdiť, že ϕ na invariantnom podpriestore [uuu,vvv] pôsobí ako kompozícia otočenia o uhol α a rovnoľahlosti s koeficientom r a stredom v počiatku. Na [uuu,vvv] si však možno (navyše jednoznačne) zvoliť skalárny súčin tak, aby vektory uuu, vvv vzhľadom naň tvorili ortonormálnu bázu. Potom lineárna transformácia ϕ [uuu,vvv] euklidovského priestoru [uuu,vvv] naozaj zodpovedá kompozícii rotácie RRRα a rovnoľahlosti rIII2. (Pozri cvičenia 19.11 a 19.12.) Ak si uvedomíme, že každý polynóm f(x) ∈ R[x] nepárneho stupňa má aspoň jeden reálny koreň, môžeme zaznamenať ešte jeden dôsledok vety 19.5.2. 19.5.3. Dôsledok. Nech ϕ je lineárny operátor na konečnorozmernom vektorovom priestore V nad poľom R. Potom ϕ má aspoň jeden invariantný podpriestor dimenzie 1 alebo 2. Ak dim V je nepárne číslo, tak ϕ má aspoň jedno reálne vlastné číslo a k nemu prislúchajúci vlastný vektor generuje invariantný podpriestor dimenzie 1. Cvičenia 19.1. Nech f(x), g(x) sú polynómy nad poľom K, pričom g(x) má stupeň aspoň 1. Polynóm r(x) sa nazýva zvyškom po delení polynómu f(x) polynómom, ak g(x) delí polynóm f(x)−r(x) a r(x) je nižšieho stupňa ako g(x). Nech ďalej λ ∈ K. Dokážte nasledujúce tvrdenia: (a) Zvyšok po delení polynómu f(x) lineárnym polynómom x − λ je f(λ). 406 19. Spektrum lineárneho operátora (b) λ je koreňom polynómu f(x), t. j. f(λ) = 0, práve vtedy, keď x − λ delí f(x). 19.2. Nech AAA ∈ Km×m , BBB ∈ Kn×n sú štvorcové matice. Označme CCC = diag(AAA,BBB). Dokážte nasledujúce tvrdenia: (a) Ak uuu ∈ Km resp. vvv ∈ Kn je vlastný vektor matice AAA resp. BBB prislúchajúci k jej vlastnej hodnote λ, tak uuu 0n resp. 0m vvv je vlastný vektor matice CCC prislúchajúci k tej istej jej vlastnej hodnote. (b) SpecCCC = SpecAAA ∪ SpecBBB. (c) Algebraická aj geometrická násobnosť skalára λ ako vlastnej hodnoty matice CCC je súčtom príslušných násobností λ ako vlastných hodnôt matíc AAA, BBB. Modfikujte (ak treba) tvrdenia (a) – (c) tak, aby zostali v platnosti aj pre maticu tvaru CCC = AAA MMM 0 BBB , kde MMM ∈ Km×n je nenulová matica. 19.3. Nech AAA = a 1 0 a , BBB = 0 1 −b2 2b , kde a, b ∈ R. (a) Nájdite spektrum a vlastné vektory matice CCC = diag(AAA,BBB). Je matica CCC podobná s nejakou diagonálnou maticou? (b) Určte algebraickú a geometrickú násobnosť všetkých vlastných hodnôt matice CCC. Urobte diskusiu vzhľadom na a, b. (c) (Zároveň nápoveda k (b).) Dokážte, že pre a = b sú matice AAA, BBB podobné a nájdite aspoň jednu maticu PPP ∈ R2×2 , pre ktorú platí PPP−1 · AAA · PPP = BBB. Dokážete nájsť všetky také matice PPP? 19.4. Dopracujte príklad 19.2.4 tak, aby ste našli hornú trojuholníkovú maticu podobnú s maticou AAA prostredníctvom ortogonálnej matice prechodu. 19.5. Nech ϕ je lineárny operátor na konečnorozmernom vektorovom priestore V so spektrom plnej algebraickej váhy n = dim V . Zo Schurovej vety 19.2.1 odvoďte existenciu postupnosti invariantných podpriestorov {0} = V0 ⊆ V1 ⊆ . . . ⊆ Vn−1 ⊆ Vn = V , v ktorej dim Vk = k pre 0 ≤ k ≤ n. 19.6. Ako určíte spektrum (hornej či dolnej) trojuholníkovej matice vrátane algebraickej násobnosti každej jej vlastnej hodnoty bez počítania jej charakteristického polynómu? Dajú sa podobne priamočiaro určiť aj geometrické násobnosti jej vlastných hodnôt? 19.7. (a) Zadefinujte pojem homomorfizmu polí ako zobrazenia, ktoré zachováva sčítanie a násobenie. (b) Nech h: K → L je homomorfizmus polí. Potom h(1) = 1 a h(a−1 ) = h(a)−1 pre každé a ∈ K. Dokážte. (c) Zadefinujte pojem izomorfizmu polí a dokážte, že vzťah izomorfnosti je ekvivalenciou na obore všetkých polí. (d) Dokážte, že každý homomorfizmus polí h: K → L je injektívne zobrazenie, teda je to izomorfizmus poľa K na podpole poľa L. (e) Dokážte, že každé pole charakteristiky ∞ obsahuje podpole izomorfné s poľom Q všetkých racionálnych čísel. (f) Dokážte, že každé pole prvočíselnej charakteristiky p obsahuje podpole izomorfné s poľom Zp. Odvoďte z toho, že počet prvkov každého konečného poľa L je mocninou prvočísla, presnejšie, # L = pk , kde p = char L a k = [L : Zp] Cvičenia 407 19.8. Nech polia L1, L2 sú algebraicky uzavreté algebraické rozšírenia poľa K. Potom L1 ∼= L2. Dokážte. 19.9. Nech p je prvočíslo. Dokážte, že žiadne konečné rozšírenie poľa Zp nie je algebraicky uzavreté. (Návod: Nech L je q-prvkové rozšírenie poľa Zp. Porovnajte počet všetkých normovaných kvadratických polynómov x2 + ax + b nad L s počtom všetkých kvadratických polynómov (x − α)(x − β) rozložiteľných nad L na lineárne faktory.) 19.10. (a) Nech V je vektorový priestor nad poľom R s bázou tvorenou vektormi vvv1, . . . ,vvvn. Potom vektory vvv1, . . . ,vvvn tvoria zároveň bázu jeho komplexifikácie V C . Dokážte. Odvoďte z toho vzťah dimR V = dimC V C . Porovnajte s cvičením 17.1. (b) Zovšeobecnite tvrdenie z cvičenia 17.1 do nasledujúcej podoby: Nech L je konečné rozšírenie poľa K stupňa k = [L : K] a W je konečnorozmerný vektorový priestor nad poľom L s bázou tvorenou vektormi www1, . . . ,wwwn ∈ W. Nech ďalej skaláry u1 = 1, u2 . . . , uk ∈ L tvoria bázu L ako vektorového priestoru nad poľom K. Potom systém vektorov uiwwwj ∈ W, kde i ≤ k, j ≤ n, tvorí bázu W chápaného ako vektorový priestor nad poľom K. Odvoďte z toho vzťah dimK W = kn = [L : K] dimL W. 19.11. Nech V je reálny vektorový priestor so skalárnym súčinom. Pre xxx,yyy,uuu,vvv ∈ V položme xxx + iyyy,uuu + ivvv = ( xxx,uuu + yyy,vvv ) + i( yyy,uuu − xxx,vvv ). Dokážte nasledujúce tvrdenia: (a) Uvedenou formulou je definovaný komplexný skalárny súčin na komplexifikácii V C priestoru V . (b) Uvedená formula predstavuje jedinú možnosť, ako definovať na V C komplexný skalárny súčin, ktorý na V splýva s pôvodným skalárnym súčinom. (c) Pre každý vektor www = uuu + ivvv ∈ V C , kde uuu,vvv ∈ V , platí www 2 = uuu 2 + vvv 2 = www 2 . (d) Vektory www1,www1, . . . ,wwwk,wwwk, kde wwwj = uuuj + ivvvj pre uuuj,vvvj ∈ V , sú ortonormálne v priestore V C práve vtedy, keď vektory √ 2uuu1, √ 2vvv1, . . . , √ 2uuuk, √ 2vvvk sú ortonormálne vo V . 19.12. Nech V je vektorový priestor nad poľom R a ϕ: V → V je lineárna transformácia s komplexnou vlastnou hodnotou λ = a + ib, kde a, b ∈ R, b = 0, ktorej prislúcha vlastný vektor www ∈ V C . Dokážte nasledujúce tvrdenia: (a) Vektory uuu = Rewww, vvv = Imwww sú lineárne nezávislé v pôvodnom priestore V . (b) Nech navyše na priestore V je definovaný skalárny súčin, vzhľadom na ktorý sú vektory uuu,vvv ∈ V ortonormálne. Rozšírme tento skalárny súčin do komplexného skalárneho súčinu na V C ako v cvičení 19.11. Potom vektory www,www ∈ V C sú ortogonálne s rovnakou normou √ 2. (c) Akú maticu má operátor ϕ zúžený na svoj invariantný podpriestor [uuu,vvv] v každej z báz (uuu,vvv), (uuu, −vvv), (−uuu,vvv), (−uuu, −vvv), (vvv,uuu), (−vvv,uuu), (vvv, −uuu), (−vvv, −uuu)? Zapíšte tieto matice s využitím goniometrického tvaru vlastného čísla λ. Sú všetky rôzne? 19.13. Nájdite vlastné čísla a k nim prislúchajúce vlastné vektory nasledujúcich reálnych matíc. V prípade komplexných vlastných čísel nájdite dvojrozmerné invariantné podpriestory zodpovedajúce komplexne združeným dvojiciam vlastných hodnôt a ich bázy zodpovedajúce k nim prislúchajúcim komplexne združeným dvojiciam vlastných vektorov: 408 19. Spektrum lineárneho operátora (a) AAA = −1 2 −2 1 ; (b) BBB = 1 −1 1 1 ; (c) CCC = 1 2 −1 −1 1 2 0 0 −1 ; (d) DDD = 3/5 0 4/5 0 1 0 −4/5 0 3/5 ; (e) EEE =    0 1 0 0 −1 0 0 0 0 0 0 1 0 0 −1 0   ; (f) FFF =    0 1 1 0 −1 0 0 1 0 0 0 1 0 0 −1 0   ; 19.14. Označme CCC = CCC(a0, a1, . . . , an−1) =   a0 a1 ... an−1 an−1 a0 ... an−2 ... ... ... ... a1 a2 ... a0   maticu, ktorá vznikne postupnými cyklickými permutáciami usporiadanej n-tice komplexných čísel aaa = (a0, a1, . . . , an−1) – nazývame ju cirkulantnou maticou prvkov a0, a1, . . . , an−1. Dokážte nasledujúce tvrdenia: (a) Spektrum cirkulantnej matice CCC je tvorené komplexnými číslami g(1), g(ω),. . . , g(ωn−1 ), kde ω = e2πi/n = cos(2π/n) + i sin(2π/n) je primitívna n-tá odmocnina z jednotky a g označuje polynóm g(x) = a0 + a1x + . . . + an−1xn−1 , pričom vlastný vektor prislúchajúci k vlastnej hodnote λk = g(ωk ) má tvar fffk = 1, ωk , . . . , ω(n−1)k T pre 0 ≤ k ≤ n − 1. (b) Potom prvky spektra g(ωk ) = aaa,fffk = aaa,fffn−k = an−k sú vlastne (v cyklicky opačnom slede napísané) Fourierove koeficienty vektora aaa ∈ Cn a CCC = FFF∗ · diag a0, an−1, . . . , a1 · FFF, čiže CCC je podobná s uvedenou diagonálnou maticou Fourierových koeficientov prostredníctvom znormovanej (teda unitárnej) matice FFF = n−1/2 ω−jk diskrétnej Fourierovej transformácie F : Cn → Cn (pozri paragraf 17.5 a cvičenie 17.18). (c) Pre determinant cirkulantnej matice, nazývaný tiež cirkulant prvkov a0, a1, . . . , an−1, platí detCCC = g(1)g(ω) . . . g(ωn−1 ) = a0a1 . . . an−1. 19.15. Vysvetlite nasledujúci postup riešenia sústavy lineárnych rovníc CCC · xxx = bbb, kde CCC(a0, a1, . . . , an−1) je cirkulatná matica a xxx = (x0, x1, . . . , xn−1)T , bbb = (b0, b1, . . . , bn−1)T . (a) Uvedenú sústavu možno pomocou konvolúcie zapísať v tvare aaa ∗ xxx = bbb, kde aaa = (a0, an−1, . . . , a1)T je prvý stĺpec matice CCC. (b) Aplikujúc DFT na obe strany tejto rovnice dostaneme F(aaa )F(xxx) = F(bbb), alebo inak zapísané aaaρxxx = bbb, kde xxxyyy označuje prirodzený súčin po zložkách v Cn . (c) Ak sú teda všetky zložky vektora F(aaa ) = aaa nenulové, môžeme riešenie sústavy vyjadriť pomocou inverznej Fourierovej transformácie xxx = F−1 F(bbb)/F(aaa ) = F−1 bbb/aaaρ , kde xxx/yyy označuje prirodzené delenie po zložkách v Cn . Aj keď uvedená formula tomu možno nenasvedčuje, ak použijeme rýchlu Forurierovu transformáciu, bude takýto výpočet podstatne rýchlejší než Gaussova-Jordanova eliminácia. 20. Jordanov kanonický tvar V tejto kapitole si ukážeme, že i nediagonalizovateľné lineárne operátory či matice možno voľbou vhodnej bázy upraviť na tzv. Jordanov kanonický tvar, ktorý je – aspoň na pohľad – veľmi blízky diagonálnemu. Dôkaz tohto výsledku je však podstatne náročnejší než všetky dôkazy, s ktorými sme sa doteraz v tomto kurze stretli. Preto najprv iba sformulujeme príslušné vety a predvedieme, ako sa úprava na Jordanov kanonický tvar v niektorých jednoduchých prípadoch robí. S takýmito vedomosťami vystačíme vo väčšine učebnicových príkladov. Jednako pre náročnejšieho čitateľa uvádzame úplný dôkaz, ktorý nám zaberie celé dva paragrafy 20.4 a 20.5. Na jeho základe potom popíšeme ďalšiu metódu úpravy matice na Jordanov kanonický tvar. S niektorými aplikáciami výsledkov o Jordanovom kanonickom tvare sa oboznámime až v dvoch nasledujúcich kapitolách. 20.1 Jordanov kanonický tvar matice Hovoríme, že matica AAA ∈ Kn×n je v Jordanovom kanonickom tvare, skrátene JKT, ak má blokovo diagonálny tvar AAA = diag JJJn1 (λ1), . . . ,JJJnk (λk) , kde JJJni (λi) sú Jordanove bunky rozmerov ni × ni prislúchajúce skalárom λi ∈ K (pozri príklad 19.1.3). Zrejme v takom prípade je n1 + . . . + nk = n a AAA má charakteristický polynóm det(AAA − xIII) = (λ1 − x)n1 . . . (λk − x)nk . Vidíme, že skalár λ ∈ K je vlastnou hodnotou matice AAA práve vtedy, keď sa nachádza v zozname λ1, . . . , λk. Keďže skaláry λ1, . . . , λk nemusia byť nevyhnutne rôzne, algebraická násobnosť λ vzhľadom na AAA je súčet veľkostí blokov s hodnotou λ na diagonále, čiže λi=λ ni. Ako vyplýva z príkladu 19.1.3, každému bloku JJJni (λi), bez ohľadu na veľkosť ni, zodpovedá len jednorozmerný vlastný podpriestor – preto geometrická násobnosť λ vzhľadon na AAA je rovná počtu takýchto blokov, t. j. počtu prvkov množiny {i ≤ k; λi = λ}. Jordanovým kanonickým tvarom matice AAA ∈ Kn×n nazývame ľubovoľnú maticu JJJ ∈ Ln×n v JKT, kde pole L je nejaké rozšírenie poľa K, podobnú (nad poľom L) s maticou AAA. Upraviť maticu AAA na Jordanov kanonický tvar znamená nájsť s ňou podobnú maticu JJJ ∈ Ln×n v Jordanovom kanonickom tvare a regulárnu maticu PPP ∈ Ln×n takú, že JJJ = PPP−1 ·AAA ·PPP. Potom lineárny 410 20. Jordanov kanonický tvar operátor xxx → AAA · xxx na (stĺpcovom) vektorovom priestore Ln má v báze tvorenej stĺpcami matice PPP maticu JJJ v JKT. Kľúčové výsledky tejto kapitoly možno zhrnúť do nasledujúcich dvoch viet. 20.1.1. Veta. Nech ϕ: V → V je lineárny operátor na vektorovom priestore V konečnej dimenzie n nad poľom K. Ak ϕ má nad K spektrum algebraickej váhy n, tak existuje taká báza βββ priestoru V , vzhľadom na ktorú má ϕ maticu (ϕ)βββ v Jordanovom kanonickom tvare. Pritom Jordanov kanonický tvar matice zobrazenia ϕ je určený jednoznačne až na poradie Jordanových blokov. 20.1.2. Veta. Nech matica AAA ∈ Kn×n má nad poľom K spektrum algebraickej váhy n. Potom AAA je podobná s maticou JJJ ∈ Kn×n v Jordanovom kanonickom tvare. Pritom matica JJJ je určená jednoznačne až na poradie Jordanových blokov. 20.1.3. Dôsledok. Nech matice AAA, BBB ∈ Kn×n majú v poli K spektrum algebraickej váhy n. Potom AAA ≈ BBB práve vtedy, keď AAA a BBB majú rovnaký Jordanov kanonický tvar. Všimnite si, že predpoklad o plnej algebraickej váhe spektra je splnený práve vtedy, keď K obsahuje rozkladové pole charakteristického polynómu lineárneho operátora ϕ, prípadne matice AAA. Táto podmienka je automaticky splnená nad algebraicky uzavretým poľom K, špeciálne nad poľom komplexných čísel C. Aj v prípade, že tento predpoklad nie je splnený, možno pole K vnoriť do jeho konečného rozšírenia L, nad ktorým už splnený bude. Podrobnosti, ako to možno urobiť, sme si aspoň v prípade rozšírenia R ⊆ C objasnili v paragrafe 19.4 venovanom komplexifikácii. Obe uvedené vety sú zrejme ekvivalentné, preto stačí dokázať len jednu z nich, prípadne dokazovať obe naraz a striedavo používať maticovú či operátorovú formuláciu, podľa toho, ktorá nám práve väčšmi vyhovuje. Dôkazu, ktorý je pomerne náročný, venujeme paragrafy 20.4 a 20.5. Považujeme však za potrebné predoslať mu niekoľko príkladov, na ktorých budeme ilustrovať metódu úpravy matice na JKT. Celá metóda je založená na pozorovaní, čo robí matica JJJn = JJJn(λ) − λIIIn s kanonickou bázou εεε(n) = (eee1, . . . ,eeen) v Kn . Odpoveď na túto otázku možno stručne a prehľadne vyjadriť schémou JJJn : eeen → eeen−1 → . . . → eee2 → eee1 → 0, t. j. JJJn ·eee1 = 0 (inak povedané, eee1 je vlastný vektor matice JJJn(λ)), a JJJn ·eeei = eeei−1 pre 1 < i ≤ n. 20.1. Jordanov kanonický tvar matice 411 Ak má teda lineárny operátor ϕ: V → V mať v nejakej báze βββ maticu v JKT (ϕ)βββ = JJJ = diag JJJn1 (λ1), . . . ,JJJnk (λk) , musí sa táto báza dať rozložiť na k reťazcov βββ1 = (vvv11, . . . ,vvv1n1 ), βββ2 = (vvv21, . . . ,vvv2n2 ), . . . . . . . . . . . . . . . . . . . . . βββk = (vvvk1, . . . ,vvvknk ), zodpovedajúcich jednotlivým Jordanovým bunkám JJJn1 (λ1), JJJn2 (λ2), . . . , JJJnk (λk). Na každom reťazci βββi pôsobí lineárny operátor ϕ − λi idV = ϕ − λi rovnako ako matica JJJni na kanonickej báze εεε(ni) = (eee1, . . . ,eeeni ), t. j. podľa schémy ϕ − λi : vvvini → vvvi ni−1 → . . . → vvvi2 → vvvi1 → 0. Potom prvý vektor vvvi1 každého reťazca βββi (v našej schéme prvý nenulový vektor sprava) je vlastným vektorom operátora ϕ prislúchajúcim k vlastnej hodnote λi. Celý reťazec je zasa tvorený postupnými obrazmi posledného vektora vvvini (v našej schéme prvého vektora zľava) v zobrazení ϕ − λi, t. j. βββi = (ϕ − λi)ni−1 (vvvini ), (ϕ − λi)ni−2 (vvvini ), . . . , (ϕ − λi)(vvvini ),vvvini . Bázu zloženú z takýchto reťazcov nazývame Jordanovou bázou príslušného lineárneho operátora alebo matice. Úprava matice (lineárneho operátora) na JKT teda spočíva hlavne v nájdení Jordanovej bázy, t. j. bázy zloženej z reťazcov vektorov prislúchajúcich jednotlivým vlastným číslam a vlastným vektorom tejto matice. Také niečo však predpokladá znalosť spektra, preto jeho určenie (prípadne doplnenie do plnej algebraickej váhy vo vhodnom rozšírení základného poľa) musí konštrukcii takejto bázy nevyhnutne predchádzať. Vopred však poznamenávame, že priamočiara metóda budovania bázických reťazcov od vlastných vektorov „sprava doľava , dobre funguje len pre matice malých rozmerov (maximálne tak 6 × 6), prípadne pre matice, v ktorých JKT sa vyskytujú len malé Jordanove bloky (maximálne do rozmeru 3 × 3). Pre matice väčších rozmerov, kde sa kombinatorika možných rozmerov blokov stáva pestrejšou, je už neúnosne zložitá. Neskôr, na základe dôkazu viet 20.1.1 a 20.1.2, sa zoznámime aj s metódou postupujúcou pri vytváraní bázických reťazcov „zľava doprava . V nasledujúcej kapitole si ešte stručne priblížime elegantnú metódu založenú na úprave charakteristickej matice AAA − xIII pomocou ERO a ESO, využívajúcu niektoré hlbšie poznatky o maticiach, ktorých prvky sú polynómy nad daným poľom. 412 20. Jordanov kanonický tvar Samostatnú poznámku si vyžaduje otázka určenia spektra analyzovanej matice alebo operátora. Naše príklady budú vopred umelo pripravené tak, aby sme príslušnú charakteristickú rovnicu vedeli ľahko vyriešiť (väčšinou budú dokonca všetky jej korene malé celé čísla). V „reálnom živote to však tak byť nemusí. Vo všeobecnosti neexistujú vzorce, ktoré by vyjadrovali korene polynómu f(x) ∈ C[x] stupňa ≥ 5 ako funkcie jeho koeficientov zostavené pomocou operácií sčítania, odčítania, násobenia, delenia a mocnín s racionálnym exponentom. 1 Ani pre polynómy stupňa 3 a 4, pre ktoré takéto vzorce existujú, však nie sú pre svoju ťažkopádnosť prakticky upotrebiteľné. Takže použiteľné explicitné vzorce máme k dispozícii len na riešenie rovníc stupňa 1 a 2. Tým vzrastá význam približných numerických metód výpočtu vlastných čísel a vektorov a JKT. Tieto otázky však už nie sú predmetom nášho kurzu. Momentálne nie je našim cieľom výpočtovo zvládnuť uvedenú problematiku v celej všeobecnosti, ale porozumieť jej základným súvislostiam. Keďže práve výsledky a metódy lineárnej algebry hrajú v modernej numerickej matematike významnú úlohu, je takéto prvotné porozumenie jedným z nevyhnutných predpokladov zvládnutia pokročilejších numerických metód. Jeden numerický aspekt výpočtu JKT však nemožno v tejto súvislosti nespomenúť. Numerické metódy väčšinou dávajú len približné výsledky s istou vopred zadanou presnosťou. Navyše často pracujú so vstupnými údajmi získanými meraním, teda už od začiatku zaťaženými určitými chybami. Na druhej strane, „takmer všetky štvorcové matice nad C sú podobné s diagonálnymi. 2 Pri hocako malej náhodnej zmene prvkov sa takáto matica s pravdepodobnosťou hraničiacou s istotou stane podobnou diagonálnej. Teda matice s nediagonálnym JKT sú vlastne atypickými výnimkami s nekonečne málo pravdepodobným výskytom. To jednak činí numerický výpočet JKT značne chúlostivou záležitosťou, jednak navodzuje otázku, aký má vôbec význam zaoberať sa nediagonalizovateľnými maticami a lineárnymi operátormi. Dodajme teda, že na druhej strane typická matica AAA ∈ Cn×n s aspoň jednou viacnásobnou vlastnou hodnotou je nediagonalizovateľná (pokúste sa samostatne upresniť význam tohto tvrdenia). Čo je však ešte dôležitejšie, s prirodzenými príkladmi takýchto operátorov sa možno stretnúť napr. v matematickej ana- lýze. 1 Dôkaz neriešiteľnosti rovníc piateho a vyššieho stupňa pomocou radikálov je súčasťou tzv. Galoisovej teórie a patrí k vrcholným výkonom algebry 19. storočia. 2 Presnejšie, topologická dimenzia množiny všetkých matíc AAA ∈ Cn×n , ktoré nie sú podobné s diagonálnymi, je menšia než topologická dimenzia priestoru všetkých matíc Cn×n . Podobne, topologická dimenzia množiny všetkých matíc AAA ∈ Rn×n , ktoré nie sú podobné s diagonálnymi maticami z Cn×n , je menšia než topologická dimenzia priestoru všetkých matíc Rn×n . Pojem topologickej dimenzie je (zďaleka nie priamočiarym) zovšeobecnením dimenzie lineárnych a afinných podpriestorov nad R. 20.2. Príklady úpravy matíc na Jordanov kanonický tvar 413 20.1.4. Príklad. Lineárny operátor derivácie D: R(n) [x] → R(n) [x], kde D(f) = f (x) = df(x) dx pre f(x) ∈ R(n) [x], na priestore všetkých reálnych polynómov stupňa ≤ n má v báze ξξξ(n) = (1, x, x2 . . . , xn ) maticu (D)ξξξ(n) =       0 1 0 . . . 0 0 0 2 . . . 0 ... ... ... ... ... 0 0 . . . 0 n 0 0 . . . 0 0       . Z toho už možno pomerne ľahko nahliadnuť (prípadne dopočítať), že maticou operátora D v báze 1, x, x2 2 , . . . , xn n! je Jordanova bunka JJJn+1 = JJJn+1(0). 20.2 Príklady úpravy matíc na Jordanov kanonický tvar 20.2.1. Príklad. Uvažujme maticu AAA =     1 0 2 −2 1 3 1 −1 1 0 0 −1 3 4 3 −4     ∈ R4×4 . Jej charakteristický polynóm det(AAA − xIII) = x4 − 2x2 + 1 = (x − 1)2 (x + 1)2 má dva korene x1,2 = 1 a x3,4 = −1, oba dvojnásobné. Nájdeme k nim príslušné vlastné vektory. Podpriestor riešení homogénnej sústavy s maticou AAA − III =     0 0 2 −2 1 2 1 −1 1 0 −1 −1 3 4 3 −5     ∼     1 0 0 −2 0 1 0 1 0 0 1 −1 0 0 0 0     je jednorozmerný, generovaný vlastným vektorom vvv1 = (2, −1, 1, 1)T . Teda algebraicky dvojnásobné vlastné číslo 1 má geometrickú násobnosť 1. Ďalší vektor reťazca nájdeme ako nejaké riešenie xxx = vvv2 sústavy (AAA − III) · xxx = vvv1 úpravou jej rozšírenej matice     0 0 2 −2 1 2 1 −1 1 0 −1 −1 3 4 3 −5 2 −1 1 1     ∼     1 0 0 −2 0 1 0 1 0 0 1 −1 0 0 0 0 2 −2 1 0     , 414 20. Jordanov kanonický tvar teda napr. vvv2 = (2, −2, 1, 0)T . Podpriestor riešení homogénnej sústavy s maticou AAA + III =     2 0 2 −2 1 4 1 −1 1 0 1 −1 3 4 3 −3     ∼     1 0 1 −1 0 1 0 0 0 0 0 0 0 0 0 0     má dimenziu 2 (a taká je tiež geometrická násobnosť algebraicky dvojnásobného vlastného čísla −1); jeho bázu tvoria vlastné vektory vvv3 = (1, 0, −1, 0)T , vvv4 = (1, 0, 0, 1)T . Teda AAA je podobná matici v JKT JJJ = diag JJJ2(1), −1, −1 =     1 1 0 0 0 1 0 0 0 0 −1 0 0 0 0 −1     a príslušná Jordanova báza (vvv1,vvv2,vvv3,vvv4) je tvorená stĺpcami matice pre- chodu PPP =     2 2 1 1 −1 −2 0 0 1 1 −1 0 1 0 0 1     . Videli sme, že reťazce vektorov prislúchajúce rôznym vlastným číslam možno bez ťažkostí oddeliť. Preto sa odteraz sústredíme len na hľadanie a oddeľovanie reťazcov prislúchajúcich tomu istému vlastnému číslu a budeme sa zaoberať iba maticami s jednoprvkovým spektrom. 20.2.2. Príklad. Matica AAA =   −2 1 0 −3 1 1 −1 0 1   ∈ R3×3 má charakteristický polynóm det(AAA − xIII) = −x3 a jediné, algebraicky trojnásobné vlastné číslo x1,2,3 = 0. Vlastné vektory nájdeme riešením homogénnej sústavy s maticou AAA − 0III = AAA ∼   1 0 −1 0 1 −2 0 0 0   . 20.2. Príklady úpravy matíc na Jordanov kanonický tvar 415 Podpriestor riešení je jednorozmerný, generovaný vektorom uuu = (1, 2, 1)T , teda geometrická násobnosť vlastného čísla 0 je 1. Hľadaná báza tak bude pozostávať z jediného reťazca prislúchajúceho vlastnému vektoru uuu1 = uuu. Vektor uuu2 nájdeme ako nejaké riešenie xxx = uuu2 sústavy AAA ·xxx = uuu1 úpravou jej rozšírenej matice (AAA |uuu1) =   −2 1 0 −3 1 1 −1 0 1 1 2 1   ∼   1 0 −1 0 1 −2 0 0 0 −1 −1 0   ; takže môžeme položiť napr. uuu2 = (−1, −1, 0)T . Podobne, tretí vektor uuu3 nášho reťazca nájdeme ako nejaké riešenie xxx = uuu3 sústavy AAA · xxx = uuu2 úpravou jej rozšírenej matice (AAA |uuu2) =   −2 1 0 −3 1 1 −1 0 1 −1 −1 0   ∼   1 0 −1 0 1 −2 0 0 0 0 −1 0   , teda napr. uuu3 = (0, −1, 0)T . To znamená, že AAA je podobná priamo s Jordanovou bunkou JJJ3 = JJJ3(0) =   0 1 0 0 0 1 0 0 0   prostredníctvom matice prechodu PPP =   1 −1 0 2 −1 −1 1 0 0   , tvorenej vektormi Jordanovej bázy (uuu1,uuu2,uuu3) ako stĺpcami. 20.2.3. Príklad. Matica AAA =   8 10 −5 −2 −1 2 1 2 2   ∈ R3×3 má charakteristický polynóm det(AAA − xIII) = 27 − 27x + 9x2 − x3 = (3 − x)3 a algebraicky trojnásobné vlastné číslo x1,2,3 = 3. K nemu príslušné vlastné vektory nájdeme riešením homogénnej sústavy s maticou AAA − 3III =   5 10 −5 −2 −4 2 1 2 −1   ∼   1 2 −1 0 0 0 0 0 0   . 416 20. Jordanov kanonický tvar Podpriestor riešení je dvojrozmerný, generovaný (napríklad) vektormi uuu = (2, −1, 0)T , vvv = (1, 0, 1)T . Teda geometrická násobnosť vlastného čísla 3 je 2, takže k nemu budú prislúchať dva reťazce dĺžok 1 a 2. Keďže vopred nevieme, ku ktorému vlastnému vektoru vvv1 ∈ [uuu,vvv] existuje vektor vvv2 taký, že vvv1 = (AAA − 3III) · vvv2, musíme uvažovať ľubovoľnú lineárnu kombináciu vvv1 = auuu + bvvv = (2a + b, −a, b)T , pričom parametre a, b ∈ R budeme voliť tak, aby sústava (AAA − 3III) · xxx = vvv1 mala nejaké riešenie xxx = vvv2. Úpravou jej rozšírenej matice dostaneme   5 10 −5 −2 −4 2 1 2 −1 2a + b −a b   ∼   1 2 −1 0 0 0 0 0 0 b a − 2b 0   . Sústava má riešenie práve vtedy, keď a = 2b; volíme napr. b = 1, a = 2. Tomu zodpovedá vvv1 = (5, −2, 1)T , vvv2 = (1, 0, 0)T . Za vvv3 možno zvoliť akýkoľvek vektor, ktorý spolu s vvv1 tvorí bázu vlastného podpriestoru R(AAA−3III) = [uuu,vvv]; vidíme, že vyhovujú obe voľby vvv3 = uuu, resp. vvv3 = vvv. Vyberme si napr. druhú možnosť vvv3 = (1, 0, 1)T . Teda JKT matice AAA je JJJ = diag JJJ2(3), 3 =   3 1 0 0 3 0 0 0 3   a príslušná matica prechodu tvorená stĺpcami Jordanovej bázy (vvv1,vvv2,vvv3) vyzerá (napr.) takto PPP =   5 1 1 −2 0 0 1 0 1   . 20.2.4. Príklad. Matica AAA =     −4 −6 −19 −1 2 4 3 1 1 1 6 0 5 5 20 2     ∈ R4×4 má charakteristický polynóm det(AAA − xIII) = x4 − 8x3 + 24x2 − 32x + 16 = (x − 2)4 s jediným štvornásobným koreňom x1–4 = 2. Vlastné vektory nájdeme riešením homogénnej sústavy s maticou AAA − 2III =     −6 −6 −19 −1 2 2 3 1 1 1 4 0 5 5 20 0     ∼     1 1 0 4/5 0 0 1 −1/5 0 0 0 0 0 0 0 0     . 20.2. Príklady úpravy matíc na Jordanov kanonický tvar 417 Podpriestor riešení je dvojrozmerný, generovaný vektormi uuu = (1, −1, 0, 0)T , vvv = (4, 0, −1, −5)T ; všeobecné riešenie má tvar auuu+bvvv = (a+4b, −a, −b, −5b)T , kde a, b ∈ R. Vidíme, že hľadaná báza bude pozostávať z dvoch reťazcov, nepoznáme však ich dĺžky – sú totiž dve možnosti zodpovedajúce rozkladom 4 = 1 + 3, resp. 4 = 2 + 2. Ďalšie vektory reťazcov získame riešením sústavy (AAA − 2III) · xxx = auuu + bvvv s rozšírenou maticou     −6 −6 −19 −1 2 2 3 1 1 1 4 0 5 5 20 0 a + 4b −a −b −5b     ∼     1 1 0 4/5 0 0 1 −1/5 0 0 0 0 0 0 0 0 −4a/5 + 3b/5 a/5 − 2b/5 0 0     . Ako vidno, sústava má riešenie pre ľubovoľné a, b; môžeme teda voliť a = 1, b = 0, čomu zodpovedá prvý reťazec uuu1 = uuu = (1, −1, 0, 0)T , uuu2 = (−4/5, 0, 1/5, 0)T , resp. a = 0, b = 1, čomu zodpovedá druhý reťazec vvv1 = vvv = (4, 0, −1, −5)T , vvv2 = (3/5, 0, −2/5, 0)T . JKT matice AAA teda je JJJ = diag JJJ2(2),JJJ2(2) =     2 1 0 0 0 2 0 0 0 0 2 1 0 0 0 2     , a príslušná Jordanova báza (uuu1,uuu2,vvv1,vvv2) je tvorená stĺpcami matice pre- chodu PPP =     1 −4/5 4 3/5 −1 0 0 0 0 1/5 −1 −2/5 0 0 −5 0     . 20.2.5. Príklad. Uvažujme maticu AAA =     0 1 0 0 1 0 1 1 1 1 1 1 −1 −2 −1 −1     ∈ R4×4 . Jej charakteristický polynóm det(AAA − xIII) = x4 má jeden štvornásobný koreň x1–4 = 0. Vlastné vektory dostaneme ako riešenia homogénnej sústavy s maticou AAA − 0III = AAA ∼     1 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0     . 418 20. Jordanov kanonický tvar Podpriestor riešení je dvojrozmerný, generovaný vektormi uuu = (1, 0, −1, 0)T , vvv = (1, 0, 0, −1)T ; všeobecné riešenie má tvar auuu + bvvv = (a + b, 0, −a, −b)T , kde a, b ∈ R. Takže hľadaná báza bude opäť pozostávať z dvoch reťazcov dĺžok 1 + 3 alebo 2 + 2. Ďalšie vektory reťazcov získame riešením sústavy AAA · xxx = auuu + bvvv úpravou jej rozšírenej matice     0 1 0 0 1 0 1 1 1 1 1 1 −1 −2 −1 −1 a + b 0 −a −b     ∼     1 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 −2a − b a + b 2a + b 0     . Sústava má riešenie práve vtedy, keď 2a + b = 0. Z toho je jasné, že dĺžky hľadaných reťazcov budú 1 a 3. Zvolíme napr. a = −1, b = 2. Dostaneme tak prvý vektor trojčlenného reťazca vvv1 = −uuu+2vvv = (1, 0, 1, −2)T . Druhý vektor zatiaľ ponecháme v tvare všeobecného riešenia vvv2 = xxx = (c + d, 1, −c, −d)T sústavy AAA · xxx = vvv1 a parametre c, d ∈ R budeme voliť tak, aby existovalo nejaké riešenie xxx = vvv3 sústavy AAA · xxx = vvv2. Úpravou jej rozšírenej matice dostaneme     0 1 0 0 1 0 1 1 1 1 1 1 −1 −2 −1 −1 c + d 1 −c −d     ∼     1 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 −2c − d c + d 1 + 2c + d 0     . Sústava má riešenie práve vtedy, keď 1 + 2c + d = 0; zvoľme napr. c = 0, d = −1. Tomu zodpovedá vvv2 = (−1, 1, 0, 1)T a (napr.) vvv3 = (1, −1, 0, 0)T . Jediný vektor druhého reťazca zvolíme tak, aby spolu s vektorom vvv1 tvorili bázu vlastného podpriestoru [uuu,vvv]; vyhovuje každý z vektorov uuu, vvv. Zvoľme napr. vvv4 = uuu = (1, 0, −1, 0)T . JKT matice AAA teda je JJJ = diag JJJ3(0), 0 =     0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0     a príslušná matica prechodu, tvorená stĺpcami Jordanovej bázy (vvv1,vvv2,vvv3,vvv4), vyzerá takto: PPP =     1 −1 1 1 0 1 −1 0 1 0 0 −1 −2 1 0 0     . 20.3. Prípad viacnásobného komplexného vlastného čísla 419 20.3 Prípad viacnásobného komplexného vlastného čísla V predchádzajúcom paragrafe sme sa úmyselne vyhli tak komplexným maticiam, ako aj reálnym maticiam s komplexnými vlastnými číslami. Viedla nás k tomu skôr pohodlnosť, než nejaké zásadné dôvody. Jednoducho sme sa snažili sústrediť len na samotnú úpravu matice na JKT a nechceli si zbytočne komplikovať život z tohto hľadiska nepodstatnými detailmi komplexnej aritmetiky. Úprava komplexných matíc (v ktorých sú už zahrnuté i reálne matice s komplexnými vlastnými hodnotami) na JKT sa od reálneho prípadu nijako zásadne nelíši. Len výsledná Jordanova matica môže mať na diagonále komplexné vlastné hodnoty a taktiež v príslušnej Jordanovej báze sa môžu objaviť komplexné vektory. Z hľadiska aplikácií JKT najmä na riešenie diferenciálnych rovníc je však dôležité vedieť nahradiť komplexný JKT nejakej reálnej matice vhodným reálnym kanonickým tvarom, podobným s pôvodnou maticou prostredníctvom reálnej matice prechodu. To možno dosiahnuť rozvinutím už známych metód z paragrafu 19.5. Z toho dôvodu si dovolíme celý postup len stručne opísať a overenie detailov prenechať čitateľovi. Ak λ = a+ib je komplexné vlastné číslo matice AAA ∈ Rn×n , tak aj λ = a−ib je jej vlastné číslo, pričom λ a λ majú rovnakú algebraickú i geometrickú násobnosť. Ak navyše γγγ = (www1, . . . ,wwwm) je časť Jordanovej bázy prislúchajúca k λ, zložená z reťazcov dĺžok m1 + . . . + ml = m, tak γγγ = (www1, . . . ,wwwm) je časť Jordanovej bázy prislúchajúca k λ, zložená v zodpovedajúcom poradí z komplexne združených reťazcov rovnakých dĺžok. Z toho mimochodom vyplýva, že aj keby sme sa neusilovali o elimináciu komplexných čísel z JKT, možno vzťah medzi λ a λ a k nim prislušnými bázami výhodne využiť: stačí nájsť príslušnú časť Jordanovej bázy len pre jednu z vlastných hodnôt λ, λ – zodpovedajúcu časť bázy pre druhú vlastnú hodnotu už možno dostať čiste mechanicky „opruhovaním . Podčiarkujeme však, že také niečo funguje len pre reálne a nie všeobecne pre komplexné matice. 420 20. Jordanov kanonický tvar Vráťme sa však k pôvodnej otázke. Pre m ≥ 1 a a, b ∈ R označme JJJm a −b b a =                  a −b 1 0 0 0 . . . . . . 0 0 b a 0 1 0 0 . . . . . . 0 0 0 0 a −b 1 0 . . . . . . 0 0 0 0 b a 0 1 . . . . . . 0 0 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 0 0 0 0 . . . . . . a −b 1 0 0 0 0 0 . . . . . . b a 0 1 0 0 0 0 . . . . . . 0 0 a −b 0 0 0 0 . . . . . . 0 0 b a                  reálnu maticu rozmeru 2m × 2m, vytvorenú z m diagonálne umiestnených blokov a −b b a a m − 1 blokov III2 = ( 1 0 0 1 ) vedľa nich. Matice tvaru JJJm a −b b a nazývame zovšeobecnenými Jordanovými bunkami. Práve zovšeobecnená Jordanova bunka JJJm a −b b a je tou reálnou maticou, ktorou možno v komplexnom JKT reálnej matice AAA nahradiť dvojicu Jordanových blokov JJJm(λ), JJJm(λ) prislúchajúcich komplexne združeným vlastným číslam λ = a+ib, λ = a−ib s nenulovým b. Presnejšie, ak γγγ = (www1, . . . ,wwwm) je reťazec (komplexných) vektorov zodpovedajúci v príslušnej Jordanovej báze bloku JJJm(λ), tak reálne vektory uuu1 = Rewww1 = 1 2 (www1 + www1), vvv1 = − Imwww1 = 1 2i (www1 − www1), uuu2 = Rewww2 = 1 2 (www2 + www2), vvv2 = − Imwww2 = 1 2i (www2 − www2), ... ... uuum = Rewwwm = 1 2 (wwwm + wwwm), vvvm = − Imwwwm = 1 2i (wwwm − wwwm) tvoria úsek bázy (uuu1,vvv1,uuu2,vvv2, . . . ,uuum,vvvm) zodpovedajúci bloku JJJm a −b b a . Ak teda v komplexnom JKT JJJ štvorcovej reálnej matice AAA necháme reálne Jordanove bloky a im zodpovedajúce reťazce Jordanovej bázy na pokoji, ďalej každú dvojicu Jordanových blokov JJJm(λ), JJJm(λ) prislúchajúcich komplexne združeným imaginárnym vlastným hodnotám λ, λ nahradíme blokom JJJm Re λ − Im λ Im λ Re λ a k nim zodpovedajúce reťazce (www1, . . . ,wwwm), (www1, . . . ,wwwm) Jordanovej bázy nahradíme úsekom (Rewww1, − Imwww1, . . . , Rewwwm, − Imwwwm), získame tak zovšeobecnenú Jordanovu maticu JJJ ∈ Rn×n a reálnu maticu prechodu QQQ (ktorej stĺpce sú vektory novej bázy) takú, že JJJ = QQQ−1 · AAA · QQQ. 20.3. Prípad viacnásobného komplexného vlastného čísla 421 20.3.1. Príklad. Reálna matica        5 −5 5 −4 4 −2 5 −5 7 −7 8 −4 5 −8 12 −12 13 −6 5 −9 12 −12 15 −7 5 −9 12 −15 20 −9 5 −9 12 −16 20 −8        má charakteristický polynóm det(AAA−xIII) = x6 −12x5 +63x4 −184x3 +315x2 −300x+125 = (x2 −4x+5)3 , s dvoma trojnásobnými komplexne združenými koreňmi x1,2,3 = 2 + i a x3,4,5 = x1,2,3 = 2 − i. Vlastný vektor prislúchajúci k vlastnému číslu 2 + i nájdeme ako riešenie homogénnej sústavy s maticou AAA − (2 + i)III. Podpriestor riešení je jednorozmerný, generovaný vektorom www1 = (3 + i, 5, 5, 5, 5, 5)T . Vlastnej hodnote 2 + i tak zodpovedá jediný reťazec dĺžky 3. Ďalší vektor reťazca nájdeme ako riešenie sústavy (AAA − (2 + i)III) · www2 = www1; vyhovuje www2 = (−16/5 − 12i/5, −5, −2 + i, 0, 0, 0)T . Konečne tretí vektor dostaneme ako riešenie sústavy (AAA − (2 + i)III) · www3 = www2; teda napr. www3 = (−8/25 + 44i/25, 0, −16/5 − 12i/5, −5, −2 + i, 0)T . Komplexný JKT matice AAA teda je JJJ = diag(JJJ3(2 + i),JJJ3(2 − i)) =        2 + i 1 0 0 0 0 0 2 + i 1 0 0 0 0 0 2 + i 0 0 0 0 0 0 2 − i 1 0 0 0 0 0 2 − i 1 0 0 0 0 0 2 − i        a stĺpce príslušnej (komplexnej) matice prechodu (ktorú nevypisujeme z typografických dôvodov) tvoria vektory Jordanovej bázy (www1,www2,www3,www1,www2,www3). Zovšeobecnený reálny JKT matice AAA už z toho možno dostať okamžite: JJJ = JJJ3( 2 −1 1 2 ) =        2 −1 1 0 0 0 1 2 0 1 0 0 0 0 2 −1 1 0 0 0 1 2 0 1 0 0 0 0 2 −1 0 0 0 0 1 2        , 422 20. Jordanov kanonický tvar rovnako ako maticu prechodu QQQ =        3 −1 −16/5 12/5 −8/25 −44/25 5 0 −5 0 0 0 5 0 −2 −1 −16/5 12/5 5 0 0 0 −5 0 5 0 0 0 −2 −1 5 0 0 0 0 0        , tvorenú vektormi bázy (Rewww1, − Imwww1, Rewww2, − Imwww2, Rewww3, − Imwww3). V prípade zložitejšej štruktúry reťazcov prislúchajúcich komplexným vlastným hodnotám sa však už situácia stáva dosť neprehľadnou. 20.4 Rozklad na koreňové podpriestory∗ Nech V je vektorový priestor nad poľom K, ϕ: V → V je lineárny operátor a λ ∈ K je jeho vlastná hodnota. Hovoríme, že vektor vvv ∈ V je koreňový vektor lineárneho operátora ϕ prislúchajúci k jeho vlastnej hodnote λ, ak existuje prirodzené číslo k také, že (ϕ − λ)k (vvv) = 0. Najmenšie k s touto vlastnosťou nazývame rádom koreňového vektora vvv vzhľadom na ϕ. Zafixujme na oba paragrafy 20.4 a 20.5 vektorový priestor V konečnej dimenzie n a lineárnu transformáciu ϕ: V → V . Pre k ∈ N, λ ∈ Spec ϕ označme Kerk λ = Ker(ϕ − λ)k = vvv ∈ V ; (ϕ − λ)k (vvv) = 0 lineárne podpriestory priestoru V . Zrejme platí {0} = Ker0 λ ⊆ Ker1 λ ⊆ Ker2 λ ⊆ . . . ⊆ Kerk λ ⊆ Kerk+1 λ ⊆ . . . , a vvv ∈ V je koreňovým vektorom ϕ prislúchajúcim k λ práve vtedy, keď vvv ∈ Kerk λ pre nejaké k. Keďže V je konečnorozmerný, uvedené inklúzie nemôžu byť všetky ostré, lebo inak by dimenzie podpriestorov Kerk λ ⊆ V rástli nad všetky medze. Preto existuje najmenšie také r ∈ N (závislé na λ), pre ktoré platí Kerr λ = Kerr+1 λ ; potom už Kerr λ = Kerk λ pre všetky k ≥ r. Prirodzené číslo r = rλ nazývame rádom vlastnej hodnoty λ lineárnej transformácie ϕ. Lineárny podpriestor Kerr λ ⊆ V značíme Kerλ a nazývame ho koreňovým podpriestorom operátora ϕ prislúchajúcim k vlastnej hodnote λ. Teda vvv ∈ Kerλ práve vtedy, keď vvv je koreňový vektor ϕ vzhľadom na λ. Podobným spôsobom označme Imk λ = Im(ϕ − λ)k = (ϕ − λ)k (uuu); uuu ∈ V 20.4. Rozklad na koreňové podpriestory∗ 423 členy postupnosti lineárnych podpriestorov V = Im0 λ ⊇ Im1 λ ⊇ Im2 λ ⊇ . . . ⊇ Imk λ ⊇ Imk+1 λ ⊇ . . . priestoru V . Podľa vety 6.2.3 o dimenzii jadra a obrazu pre každé k platí dim Kerk λ + dim Imk λ = n. Z toho vyplýva, že dimenzie podpriestorov Kerk λ prestanú rásť v tej istej chvíli, keď dimenzie podpriestorov Imk λ prestanú klesať. Preto r = rλ je taktiež najmenšie prirodzené číslo s vlastnosťou Imr λ = Imr+1 λ . Položme Imλ = Imr λ. 20.4.1. Lema. Nech λ je vlastná hodnota operátora ϕ. Potom pre každé k ∈ N sú Kerk λ aj Imk λ invariantné podpriestory a platí V = Kerλ ⊕ Imλ, t. j. V je priamym súčtom invariantných podpriestorov Kerλ a Imλ. Dôkaz. Pre xxx ∈ V platí ϕ(xxx) = (ϕ − λ)(xxx) + λxxx. Pre xxx ∈ Kerk λ máme (ϕ − λ)k (xxx) = 0, a následne (ϕ − λ)k (ϕxxx) = (ϕ − λ)k+1 (xxx) + λ(ϕ − λ)k (xxx) = 0, teda ϕ(xxx) ∈ Kerk λ. Podobne, ak xxx ∈ Imk λ, tak xxx = (ϕ − λ)k (yyy) pre nejaké yyy ∈ V . Potom ϕ(xxx) = (ϕ − λ)k+1 (yyy) + λ(ϕ − λ)k (yyy) ∈ Imk λ . To dokazuje invariantnosť uvedených podpriestorov, špeciálne invariantnosť podpriestorov Kerλ = Kerr λ a Imλ = Imr λ. Keďže (ϕ − λ)k (Imλ) = Imλ pre všetky k ∈ N, hodnosť lineárneho operátora (ϕ − λ)r Imλ : Imλ → Imλ sa rovná dimenzii podpriestoru Imλ. Preto podľa dôsledku 6.2.4 je to injektívny operátor a Kerλ ∩ Imλ = Ker (ϕ − λ)r Imλ = {0}. Nakoľko súčet dimenzií oboch podpriestorov je n, z toho plynie V = Kerλ ⊕ Imλ. 20.4.2. Lema. Nech λ = µ sú vlastné hodnoty lineárneho operátora ϕ. Potom (a) Kerλ je invariantný podpriestor operátora ϕ − µ; 424 20. Jordanov kanonický tvar (b) lineárny operátor (ϕ − µ) Kerλ : Kerλ → Kerλ je bijektívny; (c) Kerλ ⊆ Imµ. Dôkaz. (a) Nech uuu ∈ Kerλ, t. j. (ϕ − λ)k (uuu) = 0 pre nejaké k. Označme vvv = (ϕ − µ)(uuu). Potom (ϕ − λ)k (vvv) = (ϕ − λ)k (ϕ − λ + λ − µ)(uuu) = (ϕ − λ)k+1 (uuu) + (λ − µ)(ϕ − λ)k (uuu) = 0, teda tiež vvv ∈ Kerλ. (b) Nech uuu ∈ Ker (ϕ−µ) Kerλ = Ker(ϕ−µ)∩Kerλ. Potom (ϕ−µ)(uuu) = 0 a (ϕ − λ)(uuu) = (ϕ − µ)(uuu) + (µ − λ)(uuu) = (µ − λ)(uuu), teda (ϕ − λ)k (uuu) = (µ − λ)k (uuu) pre každé k ∈ N. Pre k = rλ dostávame 0 = (ϕ − λ)k (uuu) = (µ − λ)(uuu). Keďže λ = µ, vyplýva z toho uuu = 0. Teda Ker (ϕ − µ) Kerλ = {0} a podľa dôsledku 6.2.4 je (ϕ − µ) Kerλ bijektívny lineárny operátor. (c) Označme ψ = (ϕ − µ) Kerλ. Z (b) vyplýva, že pre každé k ∈ N je lineárny operátor ψk : Kerλ → Kerλ bijektívny, teda pre k = rµ dostávame Kerλ = ψk (Kerλ) ⊆ ψk (V ) = Imµ . 20.4.3. Tvrdenie. Nech ϕ má nad poľom K spektrum Spec ϕ = {λ1, . . . , λk} plnej algebraickej váhy n, pričom λi = λj pre i = j. Potom V = Kerλ1 ⊕ . . . ⊕ Kerλk , t. j. V je priamym súčtom koreňových podpriestorov Kerλi prislúchajúcich jednotlivým vlastným hodnotám. Navyše, dimenzia každého koreňového podpriestoru Kerλi sa rovná algebraickej násobnosti príslušnej vlastnej hodnoty λi. Dôkaz. Dôkaz prvej časti vykonáme indukciou podľa počtu prvkov spektra k. Pre k = 1 je tvrdenie dôsledkom liem 19.1.1 a 20.4.1. Nech teda k ≥ 2 a predpokladajme, že tvrdenie platí pre lineárne operátory, ktorých spektrum má menej než k prvkov. Podľa lemy 20.4.1 možno V rozložiť na priamy súčet invariantných podpriestorov V = Kerλk ⊕ Imλk . Na základe lemy 19.1.1 ľahko nahliadneme rovnosť Spec(ϕ Imλk ) = {λ1, . . . , λk−1}. Podľa indukčného predpokladu Imλk možno rozložiť na priamy súčet koreňových podpriestorov operátora ϕ Imλk . Tento rozklad má očividne tvar Imλk = (Kerλ1 ∩ Imλk ) ⊕ . . . ⊕ (Kerλk−1 ∩ Imλk ) = Kerλ1 ⊕ . . . ⊕ Kerλk−1 , 20.5. Nilpotentné operátory∗ 425 keďže podľa lemy 20.4.2 (c) pre i < k platí Kerλi ∩ Imλk = Kerλi . Z toho už dostávame požadovaný rozklad V = Imλk ⊕ Kerλk = Kerλ1 ⊕ . . . ⊕ Kerλk−1 ⊕ Kerλk . Rovnosť algebraickej násobnosti vlastnej hodnoty λi a dimenzie koreňového podpriestoru Kerλi je dôsledkom uvedeného rozkladu a lemy 19.1.1. Podľa nich má totiž charakteristický polynóm operátora ϕ tvar chϕ(x) = chϕ1 (x) . . . chϕk (x), kde ϕi = ϕ Kerλi . Na druhej strane, keďže Spec ϕ má plnú algebraickú váhu, chϕ(x) = (λ1 − x)mi . . . (λk − x)mk , kde mi je algebraická násobnosť λi. Nakoľko chϕi je mocninou lineárneho faktora λi − x a hodnoty λi sú navzájom rôzne, je chϕi (x) = (λi − x)mi a mi = dim Kerλi . 20.5 Nilpotentné operátory∗ Zúženie ϕλ = (ϕ−λ) Kerλ lineárneho operátora ϕ−λ na koreňový podpriestor Kerλ lineárneho operátora ϕ vyhovuje podmienke ϕr λ = 0, kde r = rλ je rád príslušnej vlastnej hodnoty λ a 0: Kerλ → Kerλ je identicky nulový lineárny operátor. Hovoríme, že lineárny operátor ϕ: V → V je nilpotentný, ak pre niektoré prirodzené číslo r platí ϕr = 0. Najmenšie takéto r, t. j. vlastne rád vlastnej hodnoty 0 operátora ϕ, nazývame rádom nilpotentného operátora. Celkom analogicky možno definovať aj pojem nilpotentnej matice. Príkladom nilpotentných matíc sú Jordanove bunky JJJn = JJJn(0); platí totiž JJJn n = 0. Keďže JJJn−1 n = 0, n je priamo rádom nilpotentnej matice JJJn. Spektrum nilpotentného operátora ϕ: V → V zrejme pozostáva z jedinej vlastnej hodnoty 0; spektrum posunutého operátora ϕ+λ, daného predpisom xxx → ϕ(xxx)+λxxx, potom pozostáva z jediného skalára λ. Pritom spektrá oboch operátorov majú plnú algebraickú váhu rovnú dim V . V predchádzajúcom paragrafe sme vlastne ukázali, že každý lineárny operátor ϕ na konečnorozmernom vektorovom priestore V s k-prvkovým spektrom {λ1, . . . , λk} plnej algebraickej váhy n = dim V možno rozložiť na priamy súčet vhodne posunutých nilpotentných operátorov. Presnejšie, ak xxx = xxx1 + . . . + xxxk je (jednoznačne určený) rozklad vektora xxx ∈ V na zložky xxxi ∈ Kerλi , tak ϕ(xxx) = ϕ(xxx1) + . . . + ϕ(xxxk) = (ϕλ1 + λ1)(xxx1) + . . . + (ϕλk + λ1)(xxxk) 426 20. Jordanov kanonický tvar je rozklad vektora ϕ(xxx) na zložky ϕ(xxxi) = (ϕλi + λi)(xxxi) ∈ Kerλi , pričom jednotlivé operátory ϕλi : Kerλi → Kerλi sú nilpotentné. Na dovŕšenie dôkazu viet 20.1.1 a 20.1.2 o JKT tak v podstate stačí dokázať prvú z nich pre nilpotentné lineárne operátory. Ak sú totiž βββ1, . . . ,βββk Jordanove bázy nilpotentných operátorov ϕλ1 , . . . , ϕλk , t. j. operátor ϕλi má vzhľadom na bázu βββi koreňového podpriestoru Kerλi maticu v JKT (ϕλi )βββi = diag JJJni1 , . . . ,JJJniqi , tak ϕ má vzhľadom na bázu βββ = (βββ1, . . . ,βββk) priestoru V , ktorá vznikne ich spojením, maticu (ϕ)βββ = diag (ϕλ1 + λ1)βββ1 , . . . , (ϕλk + λk)βββk = diag JJJn11 (λ1), . . . ,JJJn1q1 (λ1), . . . . . . ,JJJnk1 (λk), . . . ,JJJnkqk (λk) , a tá je opäť v JKT. 20.5.1. Tvrdenie. Nech ϕ: V → V je nilpotentný lineárny operátor rádu r. Potom existujú prirodzené čísla l1, . . . , lr také, že r p=1 p lp = n, a vektory uuupj ∈ V rádu p také, že všetkých n vektorov ϕi (uuupj), kde 1 ≤ p ≤ r, 1 ≤ j ≤ lp, 0 ≤ i ≤ p − 1, je lineárne nezávislých, teda dohromady tvoria bázu priestoru V . Najprv niekoľko poznámok k zneniu tvrdenia. Pre pevné 1 ≤ p ≤ r, 1 ≤ j ≤ lp zakaždým dostávame reťazec ϕ: uuupj → ϕ(uuupj) → . . . → ϕp−2 (uuupj) → ϕp−1 (uuupj) → 0. Ak pre 1 ≤ i ≤ p položíme vvvi pj = ϕp−i (uuupj), t. j. očíslujeme vektory sprava doľava, prejde tento reťazec na tvar ϕ: vvvp pj → vvvp−1 pj → . . . → vvv2 pj → vvv1 pj → 0. Spojením jednotlivých reťazcov βββpj = vvv1 pj, . . . ,vvvp pj , dohromady dostaneme Jordanovu bázu βββ = βββr1, . . . ,βββrlr ,βββr−11, . . . ,βββr−1lr−1 , . . . . . . ,βββ21, . . . ,βββ2l2 ,βββ11, . . . ,βββ1l1 operátora ϕ. Matica ϕ vzhľadom na ňu má tvar (ϕ)βββ = diag JJJr, . . . ,JJJr,JJJr−1, . . . ,JJJr−1, . . . . . . ,JJJ2, . . . ,JJJ2,JJJ1, . . . ,JJJ1 = diag JJJr, . . . ,JJJr,JJJr−1, . . . ,JJJr−1, . . . . . . ,JJJ2, . . . ,JJJ2, 0, . . . , 0 , v ktorom sa Jordanov blok JJJp vyskytuje práve lp-krát. Pre p < r pritom nevylučujeme ani možnosť lp = 0; vtedy sa v JKT matice operátora ϕ Jordanov blok JJJp nevyskytuje. 20.5. Nilpotentné operátory∗ 427 Reťazcovú štruktúru Jordanovej bázy βββ možno vo všeobecnosti znázorniť schémou: r r−1 2 1 • → • → . . . → • → • → 0 ... ... ... ... ... lr • → • → . . . → • → • → 0 • → . . . → • → • → 0 ... ... ... ... lr−1 • → . . . → • → • → 0 ... ... ... ... ... ... ... ... ... ... ... ... • → • → 0 ... ... ... l2 • → • → 0 • → 0 ... ... l1 • → 0 kde znak • označuje jednotlivé bázické vektory a každá skupina je tvorená lp reťazcami dĺžky p, pre 1 ≤ p ≤ r. Čísla r, r − 1, . . . , 2, 1 v záhlaví označujú rády vektorov v príslušných stĺpcoch – budeme ich jednoducho nazývať číslami týchto stĺpcov. Napríklad zo schémy ttt5 → ttt4 → ttt3 → ttt2 → ttt1 → 0 uuu5 → uuu4 → uuu3 → uuu2 → uuu1 → 0 vvv3 → vvv2 → vvv1 → 0 www2 → www1 → 0 xxx2 → xxx1 → 0 yyy2 → yyy1 → 0 zzz1 → 0 možno vyčítať, že nilpotentný lineárny operátor ϕ má v Jordanovej báze βββ = (ttt1,ttt2,ttt3,ttt4,ttt5,uuu1,uuu2,uuu3,uuu4,uuu5,vvv1,vvv2,vvv3,www1,www2,xxx1,xxx2,yyy1,yyy2,zzz1) maticu v JKT (ϕ)βββ = diag JJJ5,JJJ5,JJJ3,JJJ2,JJJ2,JJJ2,JJJ1 = diag JJJ5,JJJ5,JJJ3,JJJ2,JJJ2,JJJ2, 0 428 20. Jordanov kanonický tvar rozmeru 20 × 20. (Všimnite si, že l4 = 0, teda Jordanov blok JJJ4 sa v matici (ϕ)βββ nevyskytuje.) Pri dôkaze tvrdenia 20.5.1 budeme potrebovať niekoľko nových pojmov a pomocných výsledkov. Nech S je lineárny podpriestor vektorového priestoru V . Hovoríme, že vektory xxx1, . . . ,xxxm ∈ V sú lineárne nezávislé vzhľadom na podpriestor S, ak pre všetky skaláry c1, . . . , cm ∈ K platí c1xxx1 + . . . + cmxxxm ∈ S ⇒ c1 = . . . = cm = 0. Hovoríme, že vektory xxx1, . . . ,xxxm tvoria bázu priestoru V vzhľadom na podpriestor S, ak sú lineárne nezávislé vzhľadom na S a V = S + [xxx1, . . . ,xxxm]. Zrejme xxx1, . . . ,xxxm ∈ V sú lineárne nezávislé (tvoria bázu V ) práve vtedy, keď sú lineárne nezávislé (tvoria bázu V ) vzhľadom na podpriestor {0}. Jednoduchý dôkaz nasledujúcej lemy prenechávame ako cvičenie čitateľovi (porovnajte s dôkazmi viet 5.4.1 o dimenzii súčtu a prieniku podpriestorov a 6.2.3 o dimenzii jadra a obrazu). 20.5.2. Lema. Nech S ⊆ V je lineárny podpriestor a xxx1, . . . ,xxxm ∈ V . Potom nasledujúce podmienky sú ekvivalentné: (i) vektory xxx1, . . . ,xxxm sú lineárne nezávislé vzhľadom na S; (ii) pre ľubovoľnú bázu vvv1, . . . ,vvvk podpriestoru S vektory vvv1, . . . ,vvvk,xxx1, . . . ,xxxm sú lineárne nezávislé; (iii) existuje báza vvv1, . . . ,vvvk podpriestoru S taká, že vektory vvv1, . . . ,vvvk,xxx1, . . . ,xxxm sú lineárne nezávislé. Na základe lemy 20.5.2 už ľahko odvodíme nasledujúce zovšeobecnenie vety 4.4.4. 20.5.3. Lema. Nech S ⊆ V je lineárny podpriestor a vektory xxx1, . . . ,xxxm ∈ V sú lineárne nezávislé vzhľadom na podpriestor S. Potom existujú yyy1, . . . ,yyyl ∈ V také, že l = dim V −dim S −m a vektory xxx1, . . . ,xxxm,yyy1, . . . ,yyyl tvoria bázu priestoru V vzhľadom na S. Dôkaz. Stačí zvoliť ľubovoľnú bázu vvv1, . . . ,vvvk podpriestoru S a lineárne nezávislý systém vvv1, . . . ,vvvk,xxx1, . . . ,xxxm doplniť vektormi yyy1, . . . ,yyyl na bázu V . 20.5.4. Lema. Nech S ⊆ T ⊆ V sú lineárne podpriestory také, že ϕ−1 (S) ⊆ T. Potom pre ľubovoľné vektory xxx1, . . . ,xxxm ∈ V lineárne nezávislé vzhľadom na T vektory ϕ(xxx1), . . . , ϕ(xxxm) sú lineárne nezávislé nad S. Dôkaz. Nech platí c1ϕ(xxx1) + · · · + cmϕ(xxxm) = ϕ(c1xxx1 + . . . + cmxxxm) ∈ S. Potom c1xxx1 + . . . cmxxxm ∈ ϕ−1 (S) ⊆ T a z nezávislosti vektorov xxx1, . . . ,xxxm 20.5. Nilpotentné operátory∗ 429 nad T vyplýva c1 = . . . = cm = 0, teda ϕ(xxx1), . . . , ϕ(xxxm) sú nezávislé nad S. Dôkaz tvrdenia 20.5.1. Operátor ϕ má jediné vlastné číslo λ = 0 a V je jeho jediný koreňový podpriestor. Využijúc označenie z predchádzajúceho paragrafu položme Sp = Kerp 0 = Ker ϕp pre 0 ≤ p ≤ r. Dostaneme tak ostro klesajúcu postupnosť lineárnych podpriestorov V = Sr ⊃ Sr−1 ⊃ . . . ⊃ S1 ⊃ S0 = {0} usporiadanú inklúziou. Hľadané vektory uuupj, zostrojíme rekurziou v r krokoch, v ktorých postupne, zľava doprava, dopĺňame spodnú časť jednotlivých nenulových stĺpcov uvedenej „veľkej schémy . Vektory uuur1, . . . ,uuurlr ∈ V vyberieme tak, aby tvorili bázu priestoru V = Sr vzhľadom na podpriestor Sr−1. Nech r > p ≥ 1. Predpokladajme, že sme už zostrojili všetky stĺpce schémy s číslami r, r − 1, . . . , p + 1 a vektory každého stĺpca q, kde r ≥ q ≥ p + 1, tvoria bázu priestoru Sq vzhľadom na jeho podpriestor Sq−1. Označme xxx1, . . . ,xxxm vektory stĺpca p + 1. Keďže xxx1, . . . ,xxxm sú nezávislé nad Sp = ϕ−1 (Sp−1), podľa lemy 20.5.4 sú vektory ϕ(xxx1), . . . , ϕ(xxxm) ∈ Sp nezávislé nad Sp−1. Podľa (dôkazu) lemy 20.5.3 ich možno vhodnými vektormi uuup1, . . . ,uuup lp ∈ Sp doplniť do bázy podpriestoru Sp vzhľadom na podpriestor Sp−1. Stĺpec p je potom tvorený vektormi ϕ(xxx1), . . . , ϕ(xxxm),uuup1, . . . ,uuuplp . Na dokončenie dôkazu treba ešte overiť, že systém takto zostrojených vektorov vvvi pj = ϕp−i (uuupj), 1 ≤ p ≤ r, 1 ≤ j ≤ lp, 1 ≤ i ≤ p, naozaj tvorí bázu priestoru V . Z konštrukcie vyplýva, že vektory v stĺpci 1 sú lineárne nezávislé. Nech teda 1 ≤ p ≤ r je najväčšie číslo také, že vektory v stĺpcoch 1, . . . , p sú lineárne nezávislé. Stačí ukázať rovnosť p = r. V opačnom prípade by vektory v stĺpcoch 1, . . . , p, p + 1 boli lineárne závislé. To by však znamenalo, že vektory v stĺpci p + 1 sú lineárne závislé vzhľadom na podpriestor Sp (podrobne si rozmyslite prečo). Ale to odporuje podmienkam našej konštrukcie. Teda všetky vektory „veľkej schémy sú lineárne nezávislé. Konečne ukážeme, že zostrojené vektory generujú celé V . Na to stačí overiť, že ich počet, ktorý je zrejme r p=1 p lp, sa naozaj rovná n = dim V . Pri konštrukcii p-teho stĺpca sme k ϕ-obrazom vektorov predošlého stĺpca vždy pridávali lp = dim Sp − dim Sp−1 − r i=p+1 li 430 20. Jordanov kanonický tvar vektorov. Sčítaním uvedených rovností pre 1 ≤ p ≤ r dostaneme r p=1 lp = r p=1 (dim Sp − dim Sp−1) − r p=1 r i=p+1 li = dim Sr − dim S0 − r i=1 i−1 p=1 li = n − r i=1 (i − 1) li, teda r p=1 p lp = n. Dokončenie dôkazu viet 20.1.1 a 20.1.2 si už vyžaduje len ukázať jednoznačnosť Jordanovho kanonického tvaru. Predovšetkým spektrum {λ1, . . . , λk} lineárneho operátora ϕ (vrátane algebraických i geometrických násobností jednotlivých vlastných hodnôt), ako aj jeho koreňové podpriestory Kerλi (a tým aj ich dimenzie rλi ) sú definované bez akéhokoľvek odkazu na maticu ϕ v nejakej báze. Zúženia ϕλi = (ϕ − λi) Kerλi sú nilpotentné operátory. Takže stačí dokázať jednoznačnosť JKT matice nilpotentného operátora ϕ, t. j. vlastne počtov lp jednotlivých reťazcov dĺžok p, 1 ≤ p ≤ r. Ako sme však videli, tie sú definované rekurzívne pomocou dimenzií podpriestorov Sp = Kerp 0, ktoré opäť závisia len na operátore ϕ. 20.6 Ešte raz úprava na JKT V tvrdeniach 20.4.3 a 20.5.1 je priamo obsiahnutý opis druhej metódy úpravy matice na JKT, pri ktorej budujeme reťazce Jordanovej bázy „zľava doprava . Keďže aj lineárny operátor na konečnorozmernom priestore býva väčšinou zadaný maticou v nejakej báze, možno návod očividným spôsobom aplikovať aj na tento prípad. Za predpokladu znalosti plného spektra matice AAA ∈ Kn×n postupujeme podľa nasledujúcich bodov: (1) Pre každé λ ∈ SpecAAA osobitne vypočítame mocniny matice AAAλ = AAA−λIII a každú z nich upravíme na redukovaný stupňovitý tvar. Dostávame tak postupnosť dvojíc matíc AAAλ ∼ BBB1, AAA2 λ ∼ BBB2, . . . , AAAr λ ∼ BBBr, AAAr+1 λ ∼ BBBr+1, ktorú ukončíme, v prvom kroku r = rλ takom, že BBBr = BBBr+1 (čo môže nastať aj keď AAAr λ = AAAr+1 λ ). Potom podpriestor R(AAAr λ) = R(BBBr) riešení homogénnej sústavy AAAr λ · xxx = 0 je koreňový podpriestor matice AAA prislúchajúci k λ. Špeciálne, v prípade jednobodového spektra je AAAλ nilpotentná a r je prvý krok, pre ktorý AAAr λ = 0. 20.6. Ešte raz úprava na JKT 431 (2) Na základe každej z matíc BBBp, 1 ≤ p ≤ r, nájdeme bázu podpriestoru riešení sústavy AAAp λ · xxx = 0, ktorú zapíšeme ako stĺpce matice CCCp. (3) Vektory uuur1, . . . ,uuurlr ľavého, t. j. r-tého stĺpca „veľkej schémy vyberieme zo stĺpcov matice CCCr podľa vety 4.4.4 tak, aby dopĺňali bázu podpriestoru R AAAr−1 λ , t. j. stĺpce matice CCCr−1, do bázy podpriestoru R(AAAr λ). (4) Keď už máme zostrojené stĺpce r, . . . , p + 1, kde r > p ≥ 1, pričom stĺpec p + 1 je tvorený vektormi xxx1, . . . ,xxxm, tak p-ty stĺpec bude pozostávať z vektorov AAAλ · xxx1, . . . ,AAAλ · xxxm, uuup1, . . . ,uuup lp , pričom vektory uuup1, . . . ,uuup lp získame tak, že bázu CCCp−1 podpriestoru R AAAp−1 λ rozšírenú o vektory AAAλ ·xxx1, . . . ,AAAλ ·xxxm (ktoré, podľa lemy 20.5.4 tvoria spolu lineárne nezávislý systém) doplníme do bázy podpriestoru R(AAAp λ ) vhodnými stĺpcami matice CCCp podľa vety 4.4.4. (5) Vlastnej hodnote λ potom zodpovedá Jordanova báza zložená z takto zostrojených reťazcov a matica v JKT diag JJJr(λ), . . . ,JJJr(λ), . . . . . . ,JJJ1(λ), . . . ,JJJ1(λ) s lp blokmi JJJp(λ). (6) Nakoniec zoradíme vektory Jordanových báz pre jednotlivé vlastné hodnoty pekne za sebou a príslušné JKT blokovo diagonálne. Tým získame výslednú Jordanovu bázu (maticu prechodu) a JKT pôvodnej matice AAA. Poznámka. 1. S trochou skúsenosti a šikovnosti možno obe metódy úpravy na JKT výhodne kombinovať a budovať reťazce Jordanových báz zároveň zľava i sprava. 2. Nad nekonečným poľom K (najmä v typických prípadoch polí R a C) možno nové vektory uuup1, . . . ,uuup lp v bodoch (3), (4) voliť v podstate náhodne. Treba si len vopred zistiť ich počet, t. j. lr = h(BBBr−1) − h(BBBr) a lp = h(BBBp−1) − h(BBBp) − m pre r > p ≥ 1. Za predpokladu lp > 0 je totiž nekonečne málo pravdepodobné, že pri skutočne náhodnej voľbe lp vektorov z podpriestoru R AAAp λ budú vektory AAAλ · xxx1, . . . ,AAAλ · xxxm, uuup1, . . . ,uuup lp lineárne závislé vzhľadom na podpriestor R AAAp−1 λ . Problémom však môže byť zvoliť vektory uuupj „naozaj náhodne . Často práve v snahe o to – spolu s mimovoľnou tendenciou voliť „čo najjednoduchšie či „čo najkrajšie vektory – môžeme nakoniec dostať vektory závislé nad R AAAp−1 λ . Podobne, ako je niekedy ťažké nakresliť „naozaj všeobecný trojuholník. 432 20. Jordanov kanonický tvar 20.6.1. Príklad. Matica AAA =       −5 3 1 −1 6 −3 0 1 −5 3 −4 4 1 4 4 −1 1 0 2 1 −6 3 1 −1 7       ∈ R5×5 má charakteristický polynóm det(AAA − xIII) = 1 − 5x + 10x2 − 10x3 + 5x4 − x5 = (1 − x)5 a jediné vlastné číslo x1−5 = 1 s algebraickou násobnosťou 5. Postupne vypočítame mocniny matice AAA − III, ich redukované stupňovité tvary a bázy podpriestorov riešení sústav (AAA − III)p · xxx = 0: AAA − III =       −6 3 1 −1 6 −3 −1 1 −5 3 −4 4 0 4 4 −1 1 0 1 1 −6 3 1 −1 6       ∼       1 0 0 0 −1 0 1 0 1 0 0 0 1 −4 0 0 0 0 0 0 0 0 0 0 0       , fundamentálny systém riešení tvoria dva lineárne nezávislé vlastné vektory, ktoré zapíšeme ako stĺpce matice CCC1 =       0 1 −1 0 4 0 1 0 0 1       . Druhá mocnina je (AAA − III)2 =       −12 0 3 −12 12 4 0 −1 4 −4 −16 0 4 −16 16 −4 0 1 −4 4 −12 0 3 −12 12       ∼       1 0 −1/4 1 −1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0       s fundamentálnym systémom riešení tvoreným stĺpcami matice CCC2 =       0 1 −1 1 1 0 0 0 0 4 0 0 0 0 1 0 0 0 0 1       . Cvičenia 433 Konečne (AAA − III)3 = 0 (takže BBB3 = 0, CCC3 = III5), a ďalšie mocniny nemusíme počítať. Keďže máme dva lineárne nezávislé vlastné vektory, Jordanova báza bude mať dva reťazce. Dlhší z nich bude mať dĺžku 3, teda ten kratší musí mať nutne dĺžku 5 − 3 = 2. Počiatočný vektor dlhšieho reťazca zvolíme tak, aby dopĺňal stĺpce matice CCC2 na bázu priestoru R5 = R (AAA − III)3 ; vyhovuje napr. uuu3 = (1, 0, 0, 0, 0)T . Druhý a tretí vektor reťazca potom sú uuu2 = (AAA−III)·uuu3 = (−6, −3, −4, −1, −6)T , uuu1 = (AAA − III) · uuu2 = (AAA − III)2 · uuu3 = (−12, 4, −16, −4, −12)T . Počiatočný vektor kratšieho reťazca vyberieme spomedzi stĺpcov matice CCC2 tak, aby dopĺňal stĺpce matice (CCC1,uuu2) na bázu priestoru R (AAA − III)2 . Vyhovuje druhý stĺpec vvv2 = (1, 0, 4, 0, 0)T . Druhý vektor kratšieho reťazca potom je vvv1 = (AAA − III) · vvv2 = (−2, 1, −4, −1, −2)T . Lineárne nezávislé vektory uuu1,vvv1 tvoria bázu vlastného podpriestoru R(AAA− III), takže ďalej už nemusíme nič dopĺňať. Jordanov tvar matice AAA teda je JJJ = diag JJJ3(1),JJJ2(1) =       1 1 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 1       a stĺpce matice prechodu PPP tvoria vektory Jordanovej bázy βββ = (uuu1,uuu2,uuu3,vvv1,vvv2), t. j. PPP =       −12 −6 1 −2 1 4 −3 0 1 0 −16 −4 0 −4 4 −4 −1 0 −1 0 −12 −6 0 −2 0       . Cvičenia 20.1. Reálna matica AAA = a b c d má dvojnásobné vlastné číslo práve vtedy, keď (a−d)2 + 4bc = 0 (pozri cvičenie 18.7). (a) Vysvetlite, v akom zmysle je nekonečne málo pravdepodobné, že náhodne vybraná matica AAA ∈ Rn×n spĺňa túto podmienku. (b) Ak to však nastane, tak AAA je diagonalizovateľná práve vtedy, keď má tvar AAA = λIII2. Opäť vysvetlite, v akom zmysle je to nekonečne málo pravdepodobné aj za uvedeného predpokladu. 434 20. Jordanov kanonický tvar (c) Urobte podobné úvahy aj pre maticu AAA ∈ C2×2 . 20.2. (a) Matice AAA,BBB ∈ Rn×n sú podobné nad poľom R práve vtedy, keď sú podobné nad poľom C. Dokážte. (b) Skúste zovšeobecniť tvrdenie (a) na prípad ľubovoľného poľa K a jeho rozšírenia L. (Ak sa vám to nedarí, budete mať možnosť vrátiť sa k tejto otázke po preštudovaní paragrafu 21.4 v cvičení 21.20.) 20.3. (a) V každom z príkladov 20.2.1–5 doplňte vynechané výpočty. (b) Nájdite v uvedených príkladoch aj nejaké iné Jordanove bázy (matice prechodu), než sme uviedli pri ich riešení. (c) V príklade 20.2.4 nájdite celočíselnú maticu prechodu. (d) Ako sa v uvedených príkladoch zmení výsledný JKT, ak zmeníte poradie niektorých reťazcov v príslušnej Jordanovej báze? 20.4. Metódou z paragrafu 20.2 upravte na Jordanov kanonický tvar nasledujúce reálne matice: (a)    1 1 0 0 0 2 1 0 0 0 2 1 −1 1 −1 3   , (b)    2 1 0 0 −4 −2 1 0 −5 −3 3 0 −3 −2 1 1   , (c)    2 1 0 0 −1 4 0 0 0 2 2 1 2 0 −1 4   , (d)       −6 4 −2 1 1 0 −12 8 −4 1 1 1 −2 1 0 0 1 0 0 0 1 2 0 −1 −3 2 −1 0 0 1 −1 1 0 0 −2 2       , (e)       −1 1 0 0 0 0 −4 3 0 0 0 0 3 −2 −1 1 0 0 −3 1 −2 2 1 0 −7 4 2 −1 2 0 1 −1 −2 1 0 1       . 20.5. Matica AAA ∈ R4×4 má komplexné vlastné číslo i s algebraickou násobnosťou 2 a geometrickou násobnosťou 1. (a) Nájdite jej spektrum a určte algebraickú a geometrickú násobnosť zvyšných vlastných čísel. (b) Nájdite JKT matice AAA ako aj jej reálny zovšeobecnený JKT. (c) Predpokladajte, že uuu,vvv ∈ R4 sú také vektory, že AAA(uuu − ivvv) je vlastný vektor matice AAA prislúchajúci k jej vlastnému číslu i. Možno už z tejto informácie jednoznačne zrekonštruovať maticu AAA? Ako vyzerá matica AAA, ak uuu = (1, 0, 1, 0)T , vvv = (1, −1, 0, −1)T ? 20.6. Dokážte nasledujúce tvrdenia: (a) Matica AAA ∈ Kn×n je nilpotentná práve vtedy, keď chAAA(x) = (−x)n , t. j. práve vtedy, keď SpecAAA = {0}. (b) Rád vlastnej hodnoty λ lineárneho operátora ϕ na konečnorozmernom vektorovom priestore sa rovná rozmeru najväčšej Jordanovej bunky JJJm(λ) v jeho matici v JKT. 20.7. (a) Doplňte vynechané výpočty v príklade 20.6.1. (b) Upravte maticu z príkladu 20.6.1 na JKT „pôvodnou metódou z paragrafu 20.2. (c) Upravte matice z príkladov 20.2.1–5 a z cvičenia 4 na JKT metódou opísanou v paragrafe 20.6. (d) Pre každú z matíc porovnajte obe metódy jej úpravy na JKT a skúste rozhod- Cvičenia 435 núť, ktorá je výhodnejša. (e) Ak má matica AAA ∈ Kn×n viacprvkové spektrum, tak pri jej úprave na JKT podľa návodu z paragrafu 20.6 sa môže stať, že AAAr λ = AAAr+1 λ , aj keď BBBr = BBBr+1. Presvedčte sa o tom pri úprave matíc z príkladu 20.2.1 a cvičenia 20.4 (d). 21. Polynomické invarianty podobnosti matíc V tejto kapitole najprv prirodzene rozšírime oblasť pôsobnosti polynomických funkcií aj na maticové resp. operátorové argumenty. To nám umožní dokázať kľúčovú vlastnosť charakteristického polynómu, známu pod názvom Cayleyho-Hamiltonova veta, a zaviesť ďalší dôležitý polynomický invariant podobnosti matíc – tzv. minimálny polynóm. V druhej polovici sa informatívne oboznámime s dvoma typmi sústav polynómov, z ktorých každá úplným a jednoznačným spôsobom charakterizuje triedu všetkých matíc daného lineárneho operátora resp. triedu všetkých matíc podobných s danou štvorcovou maticou. Na ich základe potom zostrojíme dva nové typy kanonických tvarov matíc lineárnych operátorov, ktorých určenie si – na rozdiel od Jordanovho kanonického tvaru – nevyžaduje znalosť spektra a nevybočuje z pôvodného poľa. Vopred prezraďme aspoň ich názvy: pôjde o tzv. sústavu elementárnych deliteľov a sústavu invariantných faktorov, ku ktorým prislúcha tzv. primárny kanonický tvar resp. racionálny kanonický tvar matice. 21.1 Polynomické maticové funkcie Každý polynóm f(x) = c0 + c1x + . . . + cmxm = m i=0 cixi nad poľom K prirodzene definuje (rovnako značenú) funkciu f : K → K danú dosadením hodnoty a ∈ K za premennú x, t. j. f(a) = c0 +c1a+. . .+cmam = m i=0 ciai . Tak isto však môžeme do polynómu f(x) dosadiť za premennú x ľubovoľnú štvorcovú maticu AAA ∈ Kn×n . Tým dostaneme polynomickú maticovú funkciu f : Kn×n → Kn×n danú predpisom f(AAA) = c0III + c1AAA + . . . + cmAAAm = m i=0 ciAAAi . Podobne definuje polynóm f(x) funkciu f : L(V, V ) → L(V, V ) na vektorovom priestore L(V, V ) všetkých lineárnych operátorov ϕ: V → V . Stačí položiť f(ϕ) = c0 idV +c1ϕ + . . . + cmϕm = m i=0 ciϕi , kde ϕi je i-ta iterácia operátora ϕ, t.j. ϕ0 = idV , ϕ1 = ϕ, ϕ2 = ϕ ◦ ϕ, atď. Keďže v centre našej našej pozornosti zostávajú i naďalej konečnorozmerné vektorové priestory, obmedzíme sa na štúdium maticových funkcií, 21.1. Polynomické maticové funkcie 437 ktoré sú o niečo názornejšie, a uspokojíme sa s poznámkou, že príslušné výsledky možno na operátorové funkcie jednoducho preniesť na základe vzájomne jednoznačnej korešpondencie medzi operátormi ϕ ∈ L(V, V ) a maticami AAA ∈ Kn×n (danej voľbou vhodnej bázy n-rozmerného priestoru V ). Naše štúdium polynomických maticových funkcií začneme niekoľkými jednoduchými pozorovaniami, ktoré navyše plne oprávňujú takýto prístup. 21.1.1. Tvrdenie. Nech f(x) ∈ K[x], AAA,PPP ∈ Kn×n , pričom PPP je regulárna. Potom f PPP · AAA · PPP−1 ) = PPP · f(AAA) · PPP−1 . Dôkaz. Stačí si uvedomiť, že PPP · AAA · PPP−1 2 = PPP · AAA · PPP−1 · PPP · AAA · PPP−1 = PPP · AAA2 · PPP−1 , pričom tento vzťah možno zrejmým spôsobom zovšeobecniť aj na vyššie mocniny. Dokončenie dôkazu už možno prenechať čitateľovi. 21.1.2. Dôsledok. Nech f(x) ∈ K[x], AAA,BBB ∈ Kn×n . Potom AAA ≈ BBB ⇒ f(AAA) ≈ f(BBB). Taktiež jednoduchý dôkaz nasledujúcej lemy prenechávame ako cvičenie čitateľovi. 21.1.3. Lema. Nech f(x) ∈ K[x], AAA1 ∈ Kn1×n1 , . . . , AAAk ∈ Knk×nk . Potom f diag(AAA1, . . . ,AAAk) = diag f(AAA1), . . . , f(AAAk) . Teraz už môžeme uviesť nasledujúci efektný výsledok. 21.1.4. Veta. (Cayley-Hamilton) Pre ľubovoľnú maticu AAA ∈ Kn×n platí chAAA(AAA) = 0, t. j. matica AAA vyhovuje svojej charakteristickej rovnici. V dôkaze využijeme poznatky o Jordanovom kanonickom tvare z predchádzajúcej kapitoly. Nech L je konečné rozšírenie poľa K, v ktorom má AAA spektrum plnej algebraickej váhy n. Označme JJJ = diag JJJn1 (λ1), . . . ,JJJnk (λk) ∈ Ln×n Jordanov kanonický tvar matice AAA a PPP ∈ Ln×n regulárnu maticu, ktorej stĺpce tvoria vektory príslušnej Jordanovej bázy. Potom AAA = PPP·JJJ·PPP−1 , chAAA(x) = chJJJ (x) a podľa tvrdenia 21.1.1 chAAA(AAA) = chJJJ (AAA) = PPP · chJJJ (JJJ) · PPP−1 . 438 21. Polynomické invarianty podobnosti matíc Stačí teda dokázať rovnosť chJJJ (JJJ) = 0 pre matice v JKT. Z lemy 19.1.1 vyplýva chJJJ (x) = chJJJ1 (x) . . . chJJJk (x) = (λ1 − x)n1 . . . (λk − x)nk , kde JJJi = JJJni (λi) pre 1 ≤ i ≤ k. Teda podľa lemy 21.1.3 je chJJJ (JJJ) blokovo diagonálna matica s diagonálnymi blokmi chJJJ (JJJi) = (λ1IIIni − JJJi)n1 . . . (λkIIIni − JJJi)nk pre 1 ≤ i ≤ k. V i-tom bloku sa ako i-ty činiteľ nachádza mocnina (λiIIIni − JJJi)ni = 0 nilpotentnej matice λiIIIni − JJJi = −JJJni (0) rádu ni (pozri začiatok paragrafu 20.5). Preto každý blok i celý výraz chJJJ (JJJ) sú nevyhnutne nulové matice. Caylyeho-Hamiltonovu vetu možno využiť na výpočet mocnín štvorcových matíc. 21.1.5. Príklad. Matica AAA =   1 1 0 0 2 −2 −1 3 0   ∈ R3×3 má charakteristický polynóm chAAA(x) = det(AAA − xIII) = 8 − 7x + 3x2 − x3 . Preto AAA3 = 8III − 7AAA + 3AAA2 , AAA4 = 8AAA − 7AAA2 + 3AAA3 = 8AAA − 7AAA2 + 24III − 21AAA + 9AAA2 = 24III − 13AAA + 2AAA2 , AAA5 = 24AAA − 13AAA2 + 2AAA3 = 24AAA − 13AAA2 + 16III − 14AAA + 6AAA2 = 16III + 10AAA − 7AAA2 , atď. Všetky vyššie mocniny matice AAA teda možno vyjadriť pomocou jej nultej, prvej a druhej mocniny, presnejšie, ako hodnoty vhodných polynómov nanajvýš druhého stupňa pre maticu AAA. V prípade, že poznáme JKT matice AAA ∈ Kn×n a príslušnú maticu prechodu, máme k dispozícii ešte efektívnejší spôsob výpočtu hodnôt f(AAA) pre polynómy f(x) = m i=0 cixi ∈ K[x]. Ak JJJ = diag JJJn1 (λ1), . . . ,JJJnk (λk) je 21.1. Polynomické maticové funkcie 439 JKT matice AAA a PPP je príslušná matica prechodu, t. j. AAA = PPP · JJJ · PPP−1 , tak podľa tvrdenia 21.1.1 a lemy 21.1.3 platí f(AAA) = PPP · f(JJJ) · PPP−1 = PPP · diag f JJJn1 (λ1) , . . . , f JJJnk (λk) · PPP−1 . Preto sa stačí naučiť počítať hodnoty polynómov pre Jordanove bunky JJJn(λ). Samozrejme, začneme polynómami xm . Na výpočet mocniny JJJn(λ)m sa nám zíde nasledujúca maticová verzia binomickej vety, ktorú možno dokázať indukciou rovnako ako binomickú vetu v príslušnom poli. Hovoríme, že matice AAA, BBB ∈ Kn×n komutujú, ak AAA · BBB = BBB · AAA. 21.1.6. Lema. Nech matice AAA, BBB ∈ Kn×n komutujú. Potom pre ľubovoľné m ∈ N platí (AAA + BBB)m = m i=0 m i AAAm−i BBBi . Ak si ešte uvedomíme, že JJJn(λ) = λIIIn + JJJn(0) = λIIIn + JJJn, pričom (λIIIn) · AAA = λAAA = AAA · (λIIIn), teda matica λIIIn komutuje s každou maticou AAA ∈ KKKn×n , okamžite z toho dostávame JJJn(λ)m = m i=0 m i λm−i JJJi n. Mocniny nilpotentej matice JJJn už vypočítame ľahko na základe vzťahov JJJm n · eeei = 0, pre 1 ≤ i ≤ m, eeei+m, pre m ≤ i ≤ n. Takže pre m ≥ n je JJJm n = 0, a pre 0 ≤ m < n je to bloková matica JJJm n = 0n−m m IIIn−m 0m m 0m n−m . Po dosadení do binomickej vety a sčítaní všetkých členov dostávame hľadaný vzorec. 21.1.7. Lema. Pre ľubovoľné m, n ∈ N, n ≥ 1, λ ∈ K platí JJJn(λ)m =      λm m 1 λm−1 . . . m n−1 λm−n+1 0 λm . . . m n−2 λm−n+2 ... ... ... ... 0 0 . . . λm      , pričom pre j > m definitoricky kladieme m j λm−j = 0. 440 21. Polynomické invarianty podobnosti matíc Pre polynóm f(x) = m i=0 cixi ∈ K[x] definujeme jeho formálnu p-tu deriváciu ako polynóm f(p) (x) = m i=p i(i − 1) . . . (i − p + 1)cixi−p = m−p i=0 (i + p)! i! ci+pxi ; pre i = 1 samozrejme píšeme f(1) (x) = f (x). Pre K = R formálna derivácia splýva s obvyklou deriváciou f(p) (x) = dp f(x)/ dxp , definovanou pomocou známej limity. Všimnime si, že prvky matice JJJn(λ)m možno vyjadriť aj pomocou formálnych derivácií polynómu f(x) = xm v bode x = λ: m j λm−j = 1 j! f(j) (λ). Z toho a lineárnosti operátora derivácie už priamo vyplýva nasledujúci všeobecný vzorec. 21.1.8. Veta. Nech f(x) ∈ K[x] je ľubovoľný polynóm, λ ∈ K a 1 ≤ n ∈ N. Potom f JJJn(λ) =      f(λ) 1 1! f (λ) . . . 1 (n−1)! f(n−1) (λ) 0 f(λ) . . . 1 (n−2)! f(n−2) (λ) ... ... ... ... 0 0 . . . f(λ)      . Keby sa niekomu zdal tento vzorec príliš komplikovaný, snáď ho uteší, ak mu pripomenieme, že „typická štvorcová matica nad R či C je podobná s diagonálnou. Pre AAA = PPP · diag(λ1, . . . , λn) · PPP−1 , máme f(AAA) = PPP · diag f(λ1), . . . , f(λn) · PPP−1 , a basta. 21.2 Minimálny polynóm Charakteristický polynóm štvorcovej matice AAA nie je nevyhnutne polynómom najnižšieho možného stupňa, ktorý anuluje maticu AAA. Napríklad charakteristický polynóm matice JJJ = diag JJJm(λ), JJJn(λ) v JKT je zrejme (λ − x)m+n . Avšak už polynóm f(x) = (λ − x)max(m,n) ju anuluje, t. j. platí f(JJJ) = 0. Minimálnym polynómom matice AAA ∈ Kn×n nazývame polynóm nad K najnižšieho možného stupňa, ktorý anuluje maticu AAA a je navyše normovaný (t. j. rôzny od 0 a s koeficientom 1 pri najvyššej mocnine x). Keďže napríklad (−1)n chAAA(x) je normovaný polynóm anulujúci maticu AAA ∈ Kn×n , minimálny polynóm matice AAA určite existuje a má stupeň ≤ 21.2. Minimálny polynóm 441 n. Taktiež ľahko nahliadneme, že je určený jednoznačne. Keby totiž f(x), g(x) boli dva rôzne minimálne polynómy matice AAA, tak by museli mať rovnaký stupeň. Potom by však vhodný skalárny násobok nenulového polynómu f(x) − g(x) bol normovaný polynóm nižšieho stupňa, ktorý tiež anuluje maticu AAA. To nás oprávňuje zaviesť pre minimálny polynóm matice AAA označenie µAAA(x). Celkom obdobne možno definovať aj minimálny polynóm µϕ(x) lineárneho operátora ϕ na konečnorozmernom vektorovom priestore V . Z tvrdenia 21.1.1 okamžite vyplýva očakávaný výsledok. 21.2.1. Tvrdenie. Podobné matice majú rovnaký minimálny polynóm. Minimálny polynóm lineárneho operátora na konečnorozmernom vektorovom priestore sa rovná minimálnemu polynómu jeho matice vzhľadom na ľubovoľnú bázu. Minimálny polynóm je tak popri charakteristickom polynóme ďalším dôležitým invariantom podobnosti matíc. 21.2.2. Tvrdenie. Nech AAA ∈ Kn×n , f(x) ∈ K[x]. Potom f(AAA) = 0 práve vtedy, keď minimálny polynóm µAAA(x) delí polynóm f(x). V dôsledku toho minimálny polynóm matice AAA delí jej charakteristický polynóm. Dôkaz. Zrejme stačí dokázať prvú časť tvrdenia, a v tej je netriválna len jedna implikácia. Nech teda f(AAA) = 0. Označme r(x) ∈ K[x] zvyšok po delení polynómu f(x) minimálnym polynómom µAAA(x). Teda stupeň r(x) je menší ako stupeň µAAA(x) a existuje čiastočný podiel q(x) ∈ K[x] taký, že f(x) = q(x) µAAA(x) + r(x). Potom r(AAA) = f(AAA) − q(AAA) µAAA(AAA) = 0, takže nevyhnutne r(x) = 0, čiže µAAA(x) delí f(x). V opačnom prípade by totiž vhodný skalárny násobok nenulového zvyšku r(x) bol normovaný polynóm nižšieho stupňa ako µAAA(x) anulujúci maticu AAA. Minimálny polynóm matice možno určiť z jej Jordanovho kanonického tvaru. Na to stačí poznať minimálny polynóm matíc v JKT. Jednoduchú odpoveď na túto otázku dáva nasledujúce tvrdenie. Jedna časť jeho dôkazu je v podstate zahrnutá v dôkaze vety 21.1.4, zvyšok vyplýva z tvrdenia 21.2.2 a z faktu, že polynóm (x−λ)m pre m < n neanuluje Jordanovu bunku JJJn(λ). 21.2.3. Tvrdenie. Nech JJJ = diag JJJn1 (λ1), . . . ,JJJnk (λk) je JKT matice AAA ∈ Kn×n . Potom minimálny polynóm µAAA(x) = µJJJ (x) je súčinom mocnín (x − λ)m(λ) lineárnych faktorov x − λ s exponentmi m(λ) = max{ni; λi = λ} pre λ ∈ SpecAAA. Na druhej strane, charakteristický polynóm chAAA(x) = chJJJ (x) je v takom prípade súčinom mocnín (λ−x)n(λ) (až na znamienko) rovnakých lineárnych faktorov s exponentmi n(λ) = λi=λ ni. 442 21. Polynomické invarianty podobnosti matíc 21.2.4. Dôsledok. Pre maticu AAA ∈ Kn×n platí µAAA(x) = (−1)n chAAA(x) práve vtedy, keď sa v JKT matice AAA každá vlastná hodnota λ ∈ SpecAAA vyskytuje v práve jednej Jordanovej bunke JJJni (λi). Napr. charakteristický polynóm matice III4 je (x − 1)4 , kým jej minimálny polynóm je „len x − 1. Na druhej strane, pre diagonálnu maticu AAA = diag(0, 1, 2, 3) platí chAAA(x) = x(x − 1)(x − 2)(x − 3) = µAAA(x). Ukážeme si, že každý normovaný polynóm f(x) = xn − c1xn−1 − . . . − cn−1x − cn ∈ K[x] je minimálnym polynómom vhodnej matice AAA ∈ Kn×n . Označme MMMf =       c1 1 0 . . . 0 c2 0 1 . . . 0 ... ... ... ... ... cn−1 0 0 . . . 1 cn 0 0 . . . 0       ; maticu MMMf nazývame pridruženou maticou polynómu f(x). Napríklad pridruženou maticou polynómu xn je Jordanova bunka JJJn(0). 21.2.5. Tvrdenie. Nech f(x) ∈ K(n) [x] je normovaný polynóm. Potom f(x) je minimálnym polynómom svojej pridruženej matice MMMf ; jej charakteristický polynóm je (−1)n f(x). Dôkaz. Nech f(x) = xn − n i=1 cixn−i . Matica MMMf zobrazuje vektory kanonickej bázy εεε v Kn podľa schémy eeen → eeen−1 → . . . → eee2 → eee1 → (c1, c2 . . . , cn−1, cn)T , z ktorej vyplývajú rovnosti eeei = MMMn−i f · eeen, pre 1 ≤ i ≤ n, a tiež MMMn f · eeen = MMMf · eee1 = n i=1 cieeei = n i=1 ciMMMn−i f · eeen. Keďže matice MMMf a f(MMMf ) zrejme komutujú, platí f(MMMf ) · eeei = f(MMMf ) · MMMn−i f · eeen = MMMn−i f · f(MMMf ) · eeen = MMMn−i f · MMMn f · eeen − n i=1 ciMMMn−i f · eeen = 0 pre každé i ≤ n, v dôsledku čoho f(MMMf ) = 0. 21.3. Cyklické podpriestory 443 Ak g(x) = m i=0 dixi je polynóm stupňa m < n, tak g(MMMf ) · eeen = m i=0 diMMM i f · eeen = d0eeen + d1eeen−1 + . . . + dmeeen−m. Z lineárnej nezávislosti vektorov eeen−m, . . . ,eeen však vyplýva, že uvedená lineárna kombinácia sa môže rovnať 0, len ak sú všetky koeficienty di rovné 0, t. j. keď g(x) = 0. Teda f(x) je naozaj minimálny polynóm matice MMMf . Kedže charakteristický polynóm matice MMMf je stupňa n s koeficientom (−1)n pri najvyššej mocnine premennej x, a je deliteľný jej minimálnym polynómom µMMMf (x) = f(x), ktorý je rovnakého stupňa, nevyhnutne platí chMMMf (x) = (−1)n f(x). 21.3 Cyklické podpriestory V tomto paragrafe dáme pre zmenu prednosť reči lineárnych operátorov. Je na čitateľovi, aby si v prípade potreby sformuloval príslušné pojmy a výsledky v jazyku matíc. Nech S ⊆ V je invariantný podpriestor lineárneho operátora ϕ: V → V . Hovoríme, že S je cyklický podpriestor operátora ϕ, ak existuje vektor vvv ∈ S taký, že nejaká konečná postupnosť vvv, ϕ(vvv), . . . , ϕk−1 (vvv) jeho iterovaných obrazov tvorí bázu podpriestoru S. Vektor vvv nazývame cyklickým generátorom podpriestoru S a bázu vvv, ϕ(vvv), . . . , ϕk−1 (vvv) , prípadne v obrátenom poradí ϕk−1 (vvv), . . . , ϕ(vvv),vvv , nazývame cyklickou bázou podpriestoru S (vzhľadom na ϕ). Každý nenulový vektor vvv ∈ V je cyklickým generátorom práve jedného cyklického podpriestoru operátora ϕ. Keďže V je konečnorozmerný, v postupnosti obrazov vvv, ϕ(vvv), ϕ2 (vvv), . . . sa raz musí vyskytnúť člen, ktorý je lineárnou kombináciou predchádzajúcich. Označme k najmenšie prirodzené číslo, pre ktoré to nastane. Potom vektory vvv, ϕ(vvv), . . . , ϕk−1 (vvv) sú lineárne nezávislé a ϕk (vvv) = c1ϕk−1 (vvv) + . . . + ck−1ϕ(vvv) + ckvvv pre nejaké c1, . . . , ck ∈ K. Zrejme všetky ďalšie obrazy ϕl (vvv), l ≥ k, sú takisto v lineárnom obale S = vvv, ϕ(vvv), . . . , ϕk−1 (vvv) , takže S je cyklický podpriestor operátora ϕ s cyklickým generátorom vvv. Maticou zúženého operátora ϕ S vzhľadom na cyklickú bázu ϕk−1 (vvv), . . . , ϕ(vvv),vvv je pridružená matica MMMf polynómu f(x) = xk − c1xk−1 − . . . − ck−1x − ck. Tento polynóm nazývame cyklickým rádom vektora vvv (vzhľadom na ϕ). Ako uvidíme v nasledujúcej kapitole, v aplikáciách lineárnej algebry na diferenciálne rovnice hrajú významnú úlohu lineárne operátory ϕ: Rn → Rn (teda vlastne matice AAA ∈ Rn×n ), vzhľadom na ktoré je celý priestor 444 21. Polynomické invarianty podobnosti matíc Rn cyklický. Tým nadobúda na dôležitosti otázka charakterizácie takýchto operátorov a matíc, ktorá nás vracia späť k dôsledku 21.2.4. 21.3.1. Tvrdenie. Nech ϕ: V → V je lineárny operátor na n-rozmernom vektorovom priestore V . Potom nasledujúce podmienky sú ekvivalentné: (i) V je cyklickým podpriestorom operátora ϕ; (ii) maticou ϕ vo vhodnej báze priestoru V je pridružená matica MMMf nejakého normovaného polynómu f(x) stupňa n; (iii) minimálny polynóm µϕ(x) má stupeň n; (iv) µϕ(x) = (−1)n chϕ(x); (v) v Jordanovej matici operátora ϕ (nad nejakým konečným rozšírením poľa K) sa každá vlastná hodnota λ ∈ Spec ϕ vyskytuje v práve jednej Jordanovej bunke. Ešte inak môžeme povedať, že vektor vvv ∈ V je cyklickým generátorom priestoru V vzhľadom na lineárny operátor ϕ práve vtedy, keď jeho cyklickým rádom je polynóm (−1)n chϕ(x). 21.4 Primárny a racionálny kanonický tvar∗ Tento paragraf má prevažne informatívny charakter a v našom kurze naň nebudeme nadväzovať. Obsahuje stručný prehľad niektorých základných pojmov a výsledkov o ďalších kanonických tvaroch matíc lineárnych operátorov a invariantoch podobnosti štvorcových matíc, ktoré uvádzame bez dôkazov. Čitateľ s hlbším záujmom o túto problematiku, môže siahnuť po inej dostupnej literatúre. 1 Jordanov kanonický tvar zostáva i naďalej našim „hlavným kanonickým tvarom. Jeho prednosti sa zakladajú na jednoduchých pravidlách výpočtu mocnín a – v dôsledku toho – aj hodnôt iných funkcií pre Jordanove bunky JJJn(λ). Popri tom však Jordanov tvar má i dve nezanedbateľné nevýhody. Predovšetkým, na jeho určenie je potrebná znalosť spektra príslušného lineárneho operátora alebo matice, čo môže byť problém najmä pri vyšších dimenziách. Po druhé, JKT je dosiahnuteľný len pre operátory či matice s plnou algebraickou váhou spektra; v prípade, že tomu tak nie je, musíme napr. JKT matice AAA ∈ Kn×n hľadať až v nejakom rozšírení L pôvodného poľa K. V tomto paragrafe sa zoznámime s dvoma typmi kanonických tvarov matíc, ktorých určenie si nevyžaduje znalosť spektra a – ani v prípade jeho neúplnej algebraickej váhy – nevybočuje z pôvodného poľa. Začneme však 1 Pozri napr. G. Birkhoff, S. Mac Lane, Prehľad modernej algebry, ako aj S. Mac Lane, G. Birkhoff, Algebra. 21.4. Primárny a racionálny kanonický tvar∗ 445 ďalším malým prídavkom k našim mimovoľne sa rozrastajúcim vedomostiam o polynómoch. Hovoríme, že polynómy f(x), g(x) ∈ K[x] stupňa aspoň 1 sú nesúdeliteľné, ak okrem konštantných polynómov 0 = c ∈ K nemajú v K[x] iné spoločné delitele. Hovoríme, že polynóm p(x) ∈ K[x] stupňa aspoň 1 je ireducibilný, ak každý jeho deliteľ je alebo konštantný polynóm alebo skalárny násobok polynómu p(x). Ireducibilné polynómy hrajú v obore K[x] podobnú úlohu ako prvočísla v obore N alebo Z. Obdobou vety o jednoznačnom rozklade celých čísel na prvočinitele je nasledujúce tvrdenie, ktoré možno pomerne jednoducho dokázať indukciou podľa stupňa polynómu f(x). 21.4.1. Tvrdenie. Každý polynóm f(x) ∈ K[x] stupňa aspoň 1 možno rozložiť na súčin tvaru f(x) = a p1(x)α1 . . . pk(x)αk kde 0 = a ∈ K, α1, . . . , αk sú kladné celé čísla a p1(x), . . . , pk(x) sú navzájom rôzne normované ireducibilné polynómy nad K. Tento rozklad je jednoznačný až na poradie mocnín pi(x)αi jednotlivých ireducibilných faktorov pi(x). Teraz už môžeme vysloviť vetu o tzv. primárnom kanonickom tvare. 21.4.2. Veta. Nech ϕ: V → V je lineárny operátor na n-rozmernom vektorovom priestore V , ktorého minimálny polynóm má v K[x] rozklad µϕ(x) = p1(x)α1 . . . pk(x)αk na súčin mocnín rôznych normovaných ireducibilných polynómov p1(x), . . . , pk(x) stupňov n1, . . . , nk. Potom existujú postupnosti prirodzených čísel αi = αi1 ≥ αi2 ≥ . . . ≥ αiri ≥ 1 také, že k i=1 ni ri j=1 αij = n, a báza priestoru V , vzhľadom na ktorú má matica lineárneho operátora ϕ blokovo diagonálny tvar diag MMMp11 , . . . ,MMMp1r1 , . . . . . . ,MMMpk1 , . . . ,MMMpkrk pozostávajúci z pridružených matíc polynómov pij(x) = pi(x)αij , kde 1 ≤ i ≤ k, 1 ≤ j ≤ rj. Sústava polynómov pij(x) = pi(x)αij (1 ≤ i ≤ k, 1 ≤ j ≤ rj) sa nazýva sústava elementárnych deliteľov lineárneho operátora ϕ, a je až na poradie podsústav pi1(x), . . . , piri (x) určená jednoznačne. Uvedený tvar matice operátora ϕ sa nazýva primárny kanonický tvar. I tento tvar je jednoznačne určený až na poradie sústav blokov MMMpi1 , . . . ,MMMpiri , pridružených k mocninám toho istého ireducibilného polynómu pi(x). Charakteristický polynóm operátora ϕ je (až na znamienko) súčinom všetkých elementárnych deliteľov, t. j. chϕ(x) = (−1)n p11(x) . . . p1r1 (x) . . . . . . pk1(x) . . . pkrk (x) = (−1)n p1(x)α11+...+α1r1 . . . . . . pk(x)αk1+...+αkrk 446 21. Polynomické invarianty podobnosti matíc Primárny kanonický tvar matice lineárneho operátora ϕ zodpovedá rozkladu priestoru V najprv na priamy súčet invariantných podpriestorov Si = Ker pαi i (ϕ), o ktorom hovorí tzv. prvá veta o rozklade. Podľa tzv. druhej vety o rozklade sa každý podpriestor Si ďalej rozpadá na priamy súčet cyklických podpriestorov Si1, . . . , Siri , ktorých cyklické rády vzhľadom na ϕ sú polynómy pij(x) = pi(x)αij . S ohľadom na spomínanú jednoznačnosť možno teraz vetu 21.4.2 vysloviť v reči matíc takto: 21.4.3. Veta. Každá matica AAA ∈ Kn×n je podobná s nejakou s maticou BBB ∈ Kn×n v primárnom kanonickom tvare. Matica BBB je určená jednoznačne až na poradie sústav blokov MMMpi1 , . . . ,MMMpiri , pridružených k mocninám jednotlivých ireducibilných polynómov pi(x) ∈ K[x], ktorých najvyššie mocniny tvoria rozklad minimálneho polynómu µAAA(x) = p1(x)α1 . . . pk(x)αk na po dvoch nesúdeliteľné faktory. Ak v uvedenej sústave elementárnych deliteľov položíme r = max{ri; 1 ≤ i ≤ k}, ďalej αij = 0, teda pij(x) = pi(x)αij = 1 pre ri < j ≤ r, tak po prenásobení „po stĺpcoch , obdržíme sústavu polynómov hj(x) = p1j(x) . . . pkj(x) = p1(x)α1j . . . pk(x)αkj , pre 1 ≤ j ≤ r. Prechod od primárneho k tzv. racionálnemu kanonickému tvaru sa zakladá na pozorovaní, že priamy súčet cyklických podpriestorov S1j, . . . , Skj s po dvoch nesúdeliteľnými cyklickými rádmi p1j(x), . . . , pkj(x) je opäť cyklický podpriestor s rádom hj(x) = p1j(x) . . . pkj(x). 21.4.4. Veta. Nech ϕ: V → V je lineárny operátor na n-rozmernom vektorovom priestore V . Potom existuje jednoznačne určená postupnosť nekonštantných normovaných polynómov h1(x) = µϕ(x), h2(x), . . . , hr(x) ∈ K[x], v ktorej každý nasledujúci člen delí predchádzajúci a súčet ich stupňov je n, ako aj báza priestoru V , vzhľadom na ktorú má matica lineárneho operátora ϕ blokovo diagonálny tvar diag MMMh1 ,MMMh2 , . . . ,MMMhr , pozostávajúci z pridružených matíc jednotlivých polynómov hj(x) pre 1 ≤ j ≤ r. Jednotlivé polynómy hj(x) sa nazývajú invariantné faktory lineárneho operátora ϕ a celá postupnosť h1(x) = µϕ(x), h2(x), . . . , hr(x) jeho sústavou invariantných faktorov. Uvedený tvar matice operátora ϕ sa nazýva racionálny kanonický tvar. Sústava invariantných faktorov, rovnako ako racionálny kanonický tvar matice operátora ϕ sú určené jednoznačne, dokonca 21.5. Výpočet invariantných faktorov∗ 447 vrátane poradia jednotlivých polynómov resp. k nim pridružených maticových blokov. Rozkladom každého invariantného faktora na mocniny ireducibilných polynómov možno z ich sústavy spätne získať sústavu elementárnych deliteľov. Charakteristický polynóm operátora ϕ je (až na znamienko) súčinom všetkých jeho invariantných faktorov, t. j. chϕ(x) = (−1)n h1(x)h2(x) . . . hr(x). Vetu 21.4.4 možno v jazyku matíc vysloviť v nasledujúcej podobe. 21.4.5. Veta. Každá matica AAA ∈ Kn×n je podobná s jednoznačne určenou maticou v racionálnom kanonickom tvare diag MMMh1 ,MMMh2 , . . . ,MMMhr , pozostávajúcom z matíc pridružených k jej invariantným faktorom h1(x) = µAAA(x), h2(x), . . . , hr(x). Poznámka. Výslovne zdôrazňujeme, že toľkokrát spomínaná jednoznačnosť sa vzťahuje len na primárny resp. racionálny kanonický tvar matice a nie na príslušnú bázu prípadne maticu prechodu. Napokon, rovnako je tomu aj v prípade JKT. 21.4.6. Príklad. Matica AAA ∈ R6×6 má minimálny polynóm µAAA(x) = (x2 + 3)(x − 1)2 . Potom jej charakteristický polynóm je chAAA(x) = (x2 + 3)2 (x − 1)2 alebo chAAA(x) = (x2 + 3)(x − 1)4 . V prvom prípade sústavu elementárnych deliteľov matice AAA tvoria polynómy x2 + 3, x2 + 3, (x − 1)2 a sústavu invariantných faktorov polynómy (x2 + 3)(x − 1)2 , x2 + 3. V druhom prípade sú dve možnosti: Sústava elementárnych deliteľov má tvar x2 + 3, (x − 1)2 , (x − 1)2 , so sústavou invariantných faktorov (x2 + 3)(x − 1)2 , (x − 1)2 ; alebo sústavu elementárnych deliteľov tvoria polynómy x2 + 3, (x − 1)2 , x − 1, x − 1 a sústavu invariantných faktorov polynómy (x2 + 3)(x − 1)2 , x − 1, x − 1. 21.5 Výpočet invariantných faktorov∗ V tomto paragrafe predvedieme, ako možno k danej matici AAA ∈ Kn×n zostrojiť sústavu invariantných faktorov. Z nej už vieme priamo napísať racionálny kanonický tvar (ako aj sústavu elementárnych deliteľov a primárny kanonický tvar) tejto matice. Taktiež si ukážeme, ako dostaneme príslušné matice prechodu. Pritom sa opäť sústredíme len na informáciu o podstatných súvislostiach a výpočtových postupoch, a príslušné dôkazy iba naznačíme alebo celkom vynecháme. Najprv si uvedomme, že prvkami charakteristickej matice matice AAA ∈ Kn×n sú polynómy s koeficientmi z poľa K, čiže AAA−xIII ∈ K[x]n×n je vlastne 448 21. Polynomické invarianty podobnosti matíc maticou nad množinou K[x] všetkých polynómov v premennej x nad poľom K. Tradične sa v tejto súvislosti miesto premennej x zvykne používať premenná λ a maticiam nad množinou polynómov K[λ] sa zvykne hovoriť λ-matice. Aj my sa prispôsobíme tejto tradícii. Aby sme vyznačili výskyt premennej λ, budeme λ-matice značiť AAA(λ), BBB(λ) a pod. Každú maticu AAA nad poľom K možno zároveň považovať za λ-maticu, ktorej prvky sú konštantné polynómy; hovoríme, že AAA = AAA(λ) je konštantná λ-matica. Zrejme λ-matice (pokiaľ to dovolia ich rozmery) možno sčítať i násobiť celkom analogicky ako matice nad poľom K. Podobne ako v prípade charakteristickej matice, determinant štvorcovej λ-matice AAA(λ) je vždy polynóm detAAA(λ) ∈ K[λ]. Elementárnou riadkovou operáciou, krátko λ-ERO, na λ-matici AAA(λ) roz- umieme I. výmenu dvoch riadkov matice AAA(λ); II. vynásobenie niektorého riadku matice AAA(λ) nenulovým skalárom z poľa K; III. pripočítanie niektorého riadku matice AAA(λ) vynásobeného ľubovoľným polynómom z K[λ] k jej inému riadku. Celkom analogicky definujeme aj elementárne stĺpcové operácie na λmaticiach, krátko λ-ESO. Dve λ-matice AAA(λ), BBB(λ) rovnakých rozmerov sa nazývajú λ-ekvivalentné, označenie AAA(λ) ∼λ BBB(λ), ak jednu z nich možno dostať z druhej konečným počtom λ-ERO a λ-ESO. Zrejme pre každé m, n ∈ N je vzťah ∼λ naozaj ekvivalenciou na množine λ-matíc K[λ]m×n . λ-matica PPP(λ) ∈ K[λ]n×n sa nazýva invertibilná, ak existuje QQQ(λ) ∈ K[λ]n×n taká, že PPP(λ) · QQQ(λ) = IIIn = QQQ(λ) · PPP(λ). Zrejme λ-matica QQQ(λ) = PPP(λ)−1 je k danej invertibilnej PPP(λ) určená jednoznačne už jednou z oboch požadovaných rovností. Čitateľ by si mal sám premyslieť, ako možno λ-ERO a λ-ESO realizovať pomocou násobenia vhodnými invertibilnými λ-maticami. Na základe toho si už ľahko prispôsobí postup z paragrafu 7.4 na výpočet výrazov tvaru PPP(λ)−1 , PPP(λ)−1 · AAA(λ), AAA(λ) · PPP(λ)−1 s invertibilnou λ-maticou PPP(λ). Kľúčom k výpočtu invariantných faktorov je nasledujúca veta. 21.5.1. Veta. Matice AAA, BBB ∈ Kn×n sú podobné práve vtedy, keď ich charakteristické λ-matice AAA−λIII, BBB−λIII sú λ-ekvivalentné; presnejšie, ak PPP(λ),QQQ(λ) ∈ K[λ]n×n sú invertibilné matice také, že BBB − λIII = QQQ(λ) · (AAA − λIII) · PPP(λ), tak PPP(λ) = PPP, QQQ(λ) = QQQ sú konštantné matice, pre ktoré platí QQQ = PPP−1 a BBB = QQQ · AAA · PPP. Náčrt dôkazu. Ak AAA ≈ BBB a PPP ∈ Kn×n je regulárna taká, že BBB = PPP−1 · AAA · PPP, tak zrejme BBB −λIII = PPP−1 ·(AAA−λIII)·PPP, z čoho už vyplýva AAA−λIII ∼λ BBB −λIII. Naopak, pre AAA − λIII ∼λ BBB − λIII existujú invertibilné λ-matice PPP(λ), QQQ(λ) také, že BBB −λIII = QQQ(λ)·(AAA−λIII)·PPP(λ). Netriválnym faktom je, že za týchto okolností už PPP(λ) = PPP, QQQ(λ) = QQQ musia byť konštantné matice, pre ktoré 21.5. Výpočet invariantných faktorov∗ 449 navyše platí QQQ · PPP = III a BBB = QQQ · AAA · PPP, teda AAA ≈ BBB. Hovoríme, že λ-matica HHH(λ) ∈ K[λ]n×n je v kanonickom tvare, ak HHH(λ) = diag(h1(λ), . . . , hn(λ)) je diagonálna matica, ktorej diagonálne prvky sú normované polynómy alebo 0 a každý nasledujúci člen delí predchádzajúci (pritom nulový polynóm delí len nulový polynóm a je deliteľný každým polynómom, teda v kanonickom tvare z hj(λ) = 0 vyplýva hi(λ) = 0 pre každé i ≤ j). Polynóm d(λ) je najväčším spoločným deliteľom polynómov f1(λ), . . . , fk(λ), ak d(λ) delí každý z polynómov fi(λ) a je deliteľný každým polynómom g(x), ktorý delí všetky polynómy fi(λ). Hovoríme, že polynómy f1(λ), . . . , fk(λ) sú nesúdeliteľné, ak ich najväčším spločným deliteľom je konštantný polynóm 1. Pripomeňme, že minorom matice AAA rozumieme determinant ľubovoľnej štvorcovej matice, ktorá vznikne z matice AAA vynechaním niektorých riadkov a stĺpcov. 21.5.2. Veta. Každá štvorcová λ-matica AAA(λ) je λ-ekvivalentná s jednoznačne určenou λ-maticou HHH(λ) = diag(h1(λ), . . . , hn(λ)) v kanonickom tvare. Pre jej diagonálne prvky platí hn(λ) = d1(λ), hn−j(λ) = dj+1(λ) dj(λ) , ak dj(λ) = 0, 0, ak dj(λ) = 0, pre 1 ≤ j ≤ n − 1, kde dk(λ) je najväčší spoločný deliteľ všetkých minorov rádu k matice AAA(λ), a ak dk(λ) = 0, tak je to normovaný polynóm. Poznámka. (a) Polynómy d1(λ), . . . , dn(λ) sa nazývajú determinantové delitele λ-matice AAA(λ). Zrejme dn(λ) sa až na skalárny násobok rovná determinantu detAAA(λ). (b) Pokiaľ je HHH(λ) kanonickým tvarom charakteristickej matice AAA − λIII, tak (z dôvodu zachovania hodnosti pri λ-ERO a λ-ESO) HHH(λ) nemôže obsahovať nulové prvky na diagonále. Preto HHH(λ) = diag h1(λ), . . . , hr(λ), 1, . . . , 1 a jej nekonštantné diagonálne prvky tvoria sústavu invariantných faktorov matice AAA. Miesto dôkazu len opíšeme algoritmus, ako nájsť kanonický tvar štvorcovej λ-matice AAA(λ) = aij(λ) n×n . Jedna možnosť (tá pracnejšia) spočíva vo výpočte všetkých minorov matice AAA(λ) všetkých možných rádov a ich spoločných deliteľov dk(λ). Efektívnejšia je úprava pomocou λ-ERO a λ-ESO. Kľúčovým faktom je pozorovanie, že determinantové delitele dk(λ) sa pri úprave λ-matice AAA(λ) pomocou λ-ERO a λ-ESO nemenia. Ak AAA(λ) je nulová matica, sme hotoví. V opačnom prípade možno výmenou riadkov a stĺpcov zariadiť, aby ann(λ) = 0. Teraz postupne dosiahneme, aby ann(λ) delil všetky prvky v n-tom stĺpci i riadku. Ak napr. ain(λ) = 450 21. Polynomické invarianty podobnosti matíc ann(λ) p(λ)+r(λ), pričom stupeň zvyšku r(λ) = 0 je menší než stupeň ann(λ), odpočítame od i-teho riadku p(λ)-násobok n-tého riadku a vymeníme i-ty a n-tý riadok. Tým zakaždým znížime stupeň ann(λ). Pretože konštantný nenulový polynóm delí každý polynóm, po konečnom počte krokov bude ann(λ) deliť všetky prvky ain(λ), anj(λ); v tej chvíli môžeme pripočítaním vhodných násobkov posledného riadku resp. stĺpca vynulovať všetky prvky v poslednom stĺpci aj riadku okrem ann(λ). Pokiaľ ann(λ) nedelí všetky prvky v matici, možno opäť znížiť jeho stupeň. Ak totiž aij(λ) = ann(λ) q(λ) + s(λ), kde zvyšok s(λ) = 0 má menší stupeň, pripočítame i-ty riadok k n-tému a opäť postupujeme podľa predchádzajúceho odstavca. Po konečnom počte krokov dosiahneme, že ann(λ) delí všetky polynómy v matici a je jediným nenulovým prvkom v n-tom riadku i stĺpci. Navyše, vynásobením vhodným skalárom možno dosiahnuť, aby to bol normovaný polynóm. Teraz aplikujeme rovnaký postup na maticu tvorenú prvými n − 1 riadkami a stĺpcami takto upravenej matice a postupujeme tak dlho, až kým po konečnom počte krokov nedostaneme kanonický tvar. Samozrejme, v konkrétnych prípadoch sa nemusíme otrocky držať uvedeného postupu, ale môžeme výhodne využívať podobu upravovanej matice. 21.5.3. Príklad. Nájdeme sústavu invariantných faktorov matice AAA =     −3 9 −8 3 −1 3 −2 1 0 0 1 0 0 0 0 1     ∈ R4×4 úpravou jej charakteristickej matice AAA − λIII =     −3 − λ 9 −8 3 −1 3 − λ −2 1 0 0 1 − λ 0 0 0 0 1 − λ     na kanonický tvar. V prvom kroku vymeníme druhý a štvrtý riadok, v druhom pomocou jednotky na mieste (4, 4) vynulujeme zvyšné prvky štvrtého riadku i stĺpca. AAA − λIII je tak postupne λ-ekvivalentná s λ-maticami     −3 − λ 9 −8 3 0 0 0 1 − λ 0 0 1 − λ 0 −1 3 − λ −2 1     ∼λ     −λ 3λ −2 0 1 − λ (1 − λ)(λ − 3) 2(1 − λ) 0 0 0 1 − λ 0 0 0 0 1     . 21.5. Výpočet invariantných faktorov∗ 451 Štvrtý riadok a stĺpec sa pri ďalších úpravách už nebudú meniť, preto ich jednoducho „odpílime . Teraz odpočítame od druhého riadku tretí, potom vymeníme (−1/2)-násobok prvého riadku s tretím. V ďalšom kroku pomocou prvku 1 v pozícii (3, 3) vynulujeme zvyšné prvky tretieho stĺpca i riadku a vo výsledku vynásobíme prvý aj druhý riadok dvomi. Tým dostaneme   0 0 1 − λ 1 − λ (1 − λ)(λ − 3) 1 − λ λ/2 −3λ/2 1   ∼λ   λ(λ − 1) 3λ(λ − 1) 0 (1 − λ)(λ − 2) (1 − λ)(5λ − 6) 0 0 0 1   . Zase odpílime tretí riadok i stĺpec. Teraz od druhého stĺpca odpočítame trojnásobok prvého, potom k druhému riadku pripočítame prvý a výsledok vynásobime −1/2. Keďže prvok na mieste (2, 1) delí všetky ostatné prvky, môžeme pomocou neho vynulovať oba diagonálne členy. Nakoniec stačí vymeniť prvý a druhý stĺpec a prenásobením riadkov vhodnými skalármi znormovať oba polynómy na diagonále. Postupne tak dostávame λ(λ − 1) 0 1 − λ λ(λ − 1) ∼λ 0 2λ2 (λ − 1) 1 − λ 0 ∼λ λ2 (λ − 1) 0 0 λ − 1 . Po opätovnom pripojení odpílených riadkov a stĺpcov máme AAA − λIII ∼λ diag λ2 (λ − 1), λ − 1, 1, 1 , pričom posledná λ-matica už je v kanonickom tvare. Nekonštantné polynómy v nej, t. j. λ2 (λ − 1) = λ3 − λ2 , λ − 1, tvoria sústavu invariantných faktorov matice AAA. Jej sústava elementárnych deliteľov preto je λ2 , λ − 1, λ − 1. Na základe toho už môžeme napísať racionálny, primárny i Jordanov kanonický tvar matice AAA: AAA ≈ diag MMMλ2(λ−1),MMMλ−1 =     0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 1     ≈ diag MMMλ2 ,MMMλ−1,MMMλ−1 =     0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 1     = diag JJJ2(0), 1, 1 . Všimnite si, že primárny a Jordanov kanonický tvar matice AAA (náhodou) splývajú. 21.5.4. Príklad. Keby nám v predchádzajúcom príklade napr. vyšlo AAA − λIII ∼λ diag (λ2 − λ + 3)(λ − 2)2 , 1, 1, 1 , 452 21. Polynomické invarianty podobnosti matíc znamenalo by to, že sústava invariantných faktorov pozostáva z jediného polynómu (λ2 −λ+3)(λ−2)2 = λ4 −5λ3 +11λ2 −16λ+12, sústava elementárnych deliteľov z dvoch polynómov λ2 − λ + 3, (λ − 2)2 = λ2 − 4λ + 4 a racionálny resp. primárny kanonický tvar matice AAA je AAA ≈ MMM(λ2−λ+3)(λ−2)2 =     5 1 0 0 −11 0 1 0 16 0 0 1 −12 0 0 0     ≈ diag MMMλ2−λ+3,MMM(λ−2)2 =     1 1 0 0 −3 0 0 0 0 0 4 1 0 0 −4 0     . Keďže polynóm λ2 −λ+3 je ireducibilný nad R (má dva korene (1±i √ 11)/2 ∈ C), JKT matice AAA nad R neexistuje. Jej komplexný resp. zovšeobecnený JKT (pozri paragraf 20.3) by bol AAA ≈ diag (1 + i √ 11)/2, (1 − i √ 11)/2,JJJ2(2) ≈ diag JJJ1 1/2 − √ 11/2 √ 11/2 1/2 ,JJJ2(2) =     1/2 − √ 11/2 0 0√ 11/2 1/2 0 0 0 0 2 1 0 0 0 2     . K úprave na kanonický tvar však navyše patrí nájdenie príslušnej bázy resp. matice prechodu. Nech teda AAA − λIII ∼λ HHH(λ), kde λ-matica HHH(λ) je v kanonickom tvare a CCC ≈ AAA je niektorý z kanonických tvarov (racionálny, primárny či Jordanov) matice AAA, zostrojený na základe HHH(λ). Potom tiež CCC − λIII ∼λ HHH(λ). Preto existujú invertibilné λ-matice PPP1(λ), QQQ1(λ), PPP2(λ), QQQ2(λ) také, že QQQ1(λ) · (AAA − λIII) · PPP1(λ) = HHH(λ) = QQQ2(λ) · (CCC − λIII) · PPP2(λ). V dôsledku toho QQQ2(λ)−1 · QQQ1(λ) · (AAA − λIII) · PPP1(λ) · PPP2(λ)−1 = CCC − λIII, takže podľa vety 21.5.1 sú PPP = PPP1(λ) · PPP2(λ)−1 , QQQ = QQQ2(λ)−1 · QQQ1(λ) konštantné matice a platí QQQ = PPP−1 a CCC = PPP−1 · AAA · PPP. To znamená, že lineárny operátor xxx → AAA · xxx má v báze priestoru Kn tvorenej stĺpcami matice PPP maticu v príslušnom kanonickom tvare CCC. Stačí teda pri úprave AAA − λIII −→ HHH(λ) pomocou λ-ERO a λ-ESO zaznamenať len stĺpcové operácie rovnakými λ-ESO na jednotkovej matici III, čím Cvičenia 453 získame PPP1(λ). Ďalej treba vykonať úpravu CCC − λIII −→ HHH(λ) (čo vzhľadom na špeciálny tvar matice CCC býva podstatne jednoduchšie) a opäť zaznamenať len stĺpcové operácie zodpovedajúcimi λ-ESO na matici III. Tým získame maticu PPP2(λ). Hľadaná matica prechodu potom je PPP = PPP1(λ) · PPP2(λ)−1 . Na ostatok si ešte uvedomme, že (po doplnení vynechaných tvrdení a dôkazov) obsahujú paragrafy 21.4 a 21.5 návod na nový dôkaz vety o Jordanovom kanonickom tvare. Cvičenia 21.1. Dokončite dôkaz tvrdenia 21.1.1, odvoďte z neho dôsledok 21.1.2 a dokážte lemu 21.1.3. 21.2. Bez Cayleyho-Hamiltonovej vety dokážte, že pre danú maticu AAA ∈ Kn×n existuje polynóm f(x) ∈ K[x] stupňa ≤ n2 taký, že f(AAA) = 0. (Návod: Uvažujte postupnosť mocnín III,AAA,AAA2 , . . . ,AAAk , . . . , matice AAA a spomeňte si, aká je dimenzia priestoru Kn×n .) Uvedomte si, ako výrazne oproti tomu znižuje Cayleyho-Hamiltonova veta stupeň polynómu potrebného na anuláciu matice AAA. 21.3. Vysvetlite, prečo nie je v poriadku nasledujúci „dôkaz Cayleyho-Hamiltonovej vety: chAAA(x) = det(AAA − xIII), preto chAAA(AAA) = det(AAA − AAA · III) = det 0 = 0. 21.4. Vypočítajte maticu AAA2 z príkladu 21.1.5. Na základe toho dopočítajte matice AAA3 , AAA4 , AAA5 . 21.5. Nech f(x), g(x) ∈ K[x], AAA,BBB,CCC ∈ Kn×n . Dokážte nasledujúce tvrdenia: (a) Matice f(AAA), g(AAA) komutujú (b) Ak AAA komutuje s BBB, tak f(AAA) komutuje s g(BBB) (c) Ak AAA komutuje s BBB aj s CCC, tak AAA komutuje s BBB · CCC. 21.6. (a) Dokážte lemu 21.1.6. Rozmyslite si, prečo je v nej potrebný predpoklad AAA ·BBB = BBB · AAA. (b) Nájdite príklad matíc AAA,BBB ∈ R2×2 , pre ktoré (AAA + BBB)2 = AAA2 + 2AAA · BBB + BBB2 . (c) Nájdite správne vzorce na výpočet mocnín (AAA + BBB)2 , (AAA + BBB)3 platné pre ľubovoľné (aj nekomutujúce) matice AAA,BBB ∈ Kn×n . Zovšeobecnite na ľubovoľný exponent m ∈ N. Kde sa v nich skrývajú binomické koeficienty m i ? 21.7. Nájdite minimálne polynómy matíc z príkladov 20.2.1–5 a cvičenia 20.4. 21.8. (a) Ako vyzerajú minimálny a charakteristický polynóm zovšeobecnenej Jordanovej bunky JJJn a −b b a ? (b) Nájdite minimálne polynómy matíc z príkladu 20.3.1 a cvičenia 20.5. 21.9. Podrobne dokážte tvrdenie 21.2.3. 21.10. Nech AAA, BBB sú štvorcové matice rádu n nad poľom K, také, že chAAA(x) = chBBB(x) a µAAA(x) = µBBB(x). (a) Dokážte, že pre n ≤ 3 z toho už vyplýva AAA ≈ BBB. (b) Nájdite príklad takých matíc rádu 4, ktoré napriek uvedeným predpokladom nie sú podobné. 454 21. Polynomické invarianty podobnosti matíc 21.11. Priamym výpočtom príslušného determinantu overte, že charakterický polynóm pridruženej matice MMMf normovaného polynómu f(x) ∈ K[x] stupňa n je (−1)n f(x). (Návod: Odvoďte rekurzívny vzorec pomocou vhodného Laplaceovho rozvoja.) 21.12. Nech ϕ je lineárny operátor na vektorovom priestore V nad poľom K a 0 = vvv ∈ V . Dokážte nasledujúce tvrdenia: (a) vvv ∈ Ker ϕ práve vtedy, keď cyklickým rádom vektora vvv je polynóm x. (b) vvv je vlastný vektor operátora ϕ prislúchajúci k jeho vlastnej hodnote λ ∈ K práve vtedy, keď jeho cyklickým rádom je polynóm x − λ. 21.13. Nech S ⊆ V je cyklický podpriestor lineárneho operátora ϕ: V → V , ktorého cyklický generátor vvv má cyklický rád f(x) = xk − k i=1 cixk−i . Napíšte maticu lineárneho operátora ϕ S v cyklickej báze (vvv, ϕ(vvv), . . . ϕk−1 (vvv)) podpriestoru S. Niektorí autori uvádzajú pridruženú maticu normovaného polynómu f(x) práve v takomto tvare, prípadne v tvare transponovanej matice k tejto matici. 21.14. Dokážte tvrdenie 21.3.1. 21.15. Overte priamym výpočtom, že pre ľubovoľný skalár λ matice λ 1 0 λ , 2λ 1 −λ2 0 , sú podobné. Nájdite všetky matice prechodu (porovnajte s cvičením 19.3 (c)). Zvšeobecnite na ľubovoľné n a matice JJJn(λ), MMM(x−λ)n . 21.16. Nech AAA ∈ Kn×n , f(x), g(x) ∈ K[x] sú nesúdeliteľné polynómy a a uuu,vvv ∈ Kn sú vektory s cyklickými rádmi f(x) resp. g(x) vzhľadom na AAA. Dokážte postupne nasledujúce tvrdenia: (a) Cyklický rád vektora uuu + vvv je polynóm f(x) g(x). (b) Existuje vektor www ∈ Kn , ktorého cyklický rád vzhľadom na AAA je práve minimálny polynóm µAAA(x). (Riešte najprv pre prípad, že µAAA(x) = p(x)α , kde p(x) je ireducibilný polynóm.) 21.17. (a) Dokážte, že minimálny polynóm matice CCC = diag(AAA,BBB), kde AAA, BBB sú štvorcové matice nad poľom K, ktorých minimálne polynómy sú nesúdeliteľné, je µCCC(x) = µAAA(x) µBBB(x). (b) Polynóm najnižšieho možného stupňa, ktorý je deliteľný oboma nenulovými polynómami f(x), g(x) ∈ K[x] sa nazýva ich najmenší spoločný násobok. Dokážte, že vo všeobecnosti je minimálny polynóm matice diag(AAA,BBB) najmenším spoločným násobkom minimálnych polynómov µAAA(x), µBBB(x). (c) Nech f(x), g(x) ∈ K[x] sú nesúdeliteľné normované polynómy stupňov n resp. m. Dokážte, že Km+n je cyklickým podpriestorom matice diag(MMMf , MMMg). Nájdite jeho cyklický generátor. 21.18. (a) Sformulujte vetu o prvočíselnom rozklade v obore celých čísel (prípadne si ju vyhľadajte v literatúre) a dokážte ju. (b) Dokážte tvrdenie 21.4.1. 21.19. Podrobne popíšte, ako možno zo sústavy invariantných faktorov matice AAA ∈ Kn×n získať sústavu jej elementárnych deliteľov. 21.20. Nech L je ľubovoľné rozšírenie poľa K. Potom matice AAA, BBB ∈ Kn×n sú podobné nad K práve vtedy, keď sú podobné nad L. Dokážte. (Porovnajte svoje súčasné možnosti s možnosťami, ktoré ste mali k dispozícii v cvičení 20.2.) 21.21. (a) Matica AAA ∈ Kn×n je podobná s diagonálnou maticou nad poľom K práve vtedy, keď jej mininálny polynóm je súčinom lineárnych faktorov z K[x]. Dokážte Cvičenia 455 (b) Za predpokladu, že všetky elementárne delitele matice AAA sú mocninami lineárnych faktorov, vyjasnite vzťah medzi jej primárnym a Jordanovým kanonickým tvarom. 21.22. Ku každej možnosti z príkladu 21.4.6 napíšte primárny, racionálny aj Jordanov kanonický tvar matice AAA. 21.23. ∗ Doplňte medzery v dôkaze vety 21.5.1. 21.24. Pre všetky tri kanonické tvary matice AAA z príkladu 21.5.3 nájdite príslušnú maticu prechodu. 21.25. Determinantové delitele charakteristickej matice tvoria úplný systém invariantov podobnosti danej štvorcovej matice AAA. To znamená, že matice AAA, BBB ∈ Kn×n sú podobné práve vtedy, keď ich charakteristické matice majú rovnaký systém determinantových deliteľov. Dokážte. 21.26. Nájdite sústavy invariantných faktorov a sústavy elementárnych deliteľov ako aj racionálne a primárne kanonické tvary matíc z príkladov 20.2.1–5, 20.3.1, 20.6.1 a cvičení 20.4, 20.5 (c) úpravou ich charakteristických matíc pomocou λ-ERO a λ-ESO. Vysvetlite, ako z nich možno získať JKT pôvodnej matice a príslušnú Jordanovu bázu (maticu prechodu). 22. Maticové funkcie V tejto kapitole najprv preskúmame funkcie, ktoré možno získať dosadením matíc AAA ∈ Cn×n do potenčných radov s komplexnými koeficientmi, t. j. do funkcií v istom zmysle blízkych polynómom. Teda na rozdiel od predchádzajúcej kapitoly sa obmedzíme len na pole C všetkých komplexných čísel, pričom reálne matice i funkcie budeme chápať ako špeciálny prípad komplexných. Najdôležitejšou funkciou, ktorú takto získame, bude exponenciála eAAA ľubovoľnej matice AAA ∈ Cn×n . Potom stručne preskúmame možnosť rozšíriť na maticové argumenty aj iné funkcie komplexnej alebo reálnej premennej. Ďalej sa budeme zaoberať maticovými funkciami reálnej premennej, pre ktoré odvodíme niektoré analógy základných formúl diferenciálneho a integrálneho počtu. Tie sa nám budú hodiť pri riešení sústav lineárnych diferenciálnych rovníc. Podrobnejšie sa budeme venovať sústavám homogénnych rovníc s konštantnými koeficientmi, ktoré predstavujú vďačnú oblasť aplikácií exponenciály a Jordanovho kanonického tvaru matíc nad C. U čitateľa predpokladáme základné znalosti z matematickej analýzy. Časť z nich pripomenieme v poznámkach pod čiarou prípadne zhrnieme do ucelených tvrdení, na ktoré sa budeme (bez dôkazov) odvolávať. Poznamenajme, že k deriváciám funkcií komplexnej premennej budeme pristupovať skôr algebraicky než analyticky – v podstate vystačíme s formálnymi deriváciami polynómov a potenčných radov. To nám umožní vedome prehliadnuť istý zásadný rozdiel medzi deriváciami funkcií reálnej a komplexnej premennej. 22.1 Mocninné rady maticovej premennej Po polynómoch najjednoduchšie reálne či komplexné funkcie sú definované mocninnými alebo tiež potenčnými radmi, t. j. formálnymi výrazmi tvaru f(x) = ∞ k=0 ckxk = ckxk , kde (ck)∞ k=0 je ľubovoľná postupnosť reálnych alebo komplexných čísel. 1 Množinu všetkých potenčných radov v premennej x s koeficientmi z poľa K budeme značiť K[[x]]. Zrejme K[[x]] je nekonečnorozmerný vektorový priestor nad poľom K. 1 V analýze sa uvažujú potenčné rady ∞ k=0 ck(x − w)k so stredom v ľubovoľnom bode w ∈ C. Pre naše účely však celkom postačí, ak sa obmedzíme na potenčné rady so stredom w = 0. 22.1. Mocninné rady maticovej premennej 457 Pod formálnou p-tou deriváciou potenčného radu f(x) = ∞ k=0 ∈ K[[x]] rozumieme potenčný rad f(p) (x) = ∞ k=p k(k − 1) . . . (k − p + 1)ckxk−p = ∞ k=0 (k + p)! k! ck+pxk ∈ K[[x]]; pre p = 0 je f(0) (x) = f(x) a pre p = 1 píšeme f(1) (x) = f (x). Každý potenčný rad f(x) = ckxk nad R alebo C definuje predpisom f(a) = ∞ k=0 ckak (rovnako značenú) funkciu na množine všetkých tých reálnych alebo komplexných čísel a, pre ktoré uvedený rad konverguje. 2 Táto množina, ktorú nazývame definičný obor alebo obor konvergencie potenčného radu f(x) a značíme Dom(f) (z anglického domain), je (až na hraničné body) charakterizovaná svojim polomerom konvergencie. Označme s = lim sup k→∞ |ck|1/k a r = s−1 , ak 0 < s < ∞, resp. r = ∞, ak s = 0, resp. r = 0, ak s = ∞. 3 Potom r nazývame polomerom konvergencie mocninného radu ckxk . Pre nás podstatné poznatky matematickej analýzy o mocninných radoch sú zhrnuté v nasledujúcej vete. 22.1.1. Veta. Nech mocninný rad f(x) = ∞ k=0 ckxk ∈ C[[x]] má polomer konvergencie r. Potom pre každé a ∈ C platí (a) ak |a| < r, tak rad ckak absolútne konverguje; (b) ak |a| > r, tak rad ckak diverguje. Ak navyše r > 0, tak funkcia f je spojitá na celom otvorenom kruhu {a ∈ C; |a| < r} a má tam spojité derivácie všetkých rádov dané potenčnými radmi f(p) (x), z ktorých každý má rovnaký polomer konvergencie ako pôvodný rad a konverguje rovnomerne na každom uzavretom kruhu {a ∈ C; |a| ≤ q} pre 2 Pre pohodlie čitateľa pripomíname, že súčet radu ∞ k=0 ak komplexných čísel je definovaný ako limita jeho čiastočných súčtov, t. j. (ak prijmeme dohodu, že súčet radu značíme rovnako ako príslušný rad) ∞ k=0 ak = lim m→∞ m k=0 ak. Ak táto limita existuje (a je to komplexné číslo), hovoríme, že príslušný rad konverguje, v opačnom prípade hovoríme, že rad diverguje. Rad ak konverguje absolútne, ak konverguje rad |ak|. 3 Limes superior lim sup ak postupnosti reálnych čísel (ak) je definované ako supremum množiny všetkých hromadných bodov tejto postupnosti. Pritom b ∈ R ∪ {−∞, ∞} je hromadný bod postupnosti (ak), ak existuje z nej vybraná podpostupnosť akn , kde (kn) je rastúca postupnosť prirodzených čísel, taká, že limn→∞ akn = b. 458 22. Maticové funkcie 0 < q < r.4 Naopak, pre koeficienty pôvodného potenčného radu platí ck = 1 k! f(k) (0). Špeciálne, ak r = ∞, tak funkcia f je definovaná v celej komplexnej rovine C a má tam všetky „príjemné vlastnosti uvedené v druhej časti vety. Ak r = 0, tak f je definovaná v jedinom bode x = 0. Ak 0 < r < ∞, tak funkcia f môže no nemusí byť definovaná aj v niektorých bodoch hraničnej kružnice {a ∈ C; |a| = r} svojho oboru konvergencie. Platí teda {a ∈ C; |a| < r} ⊆ Dom(f) ⊆ {a ∈ C; |a| ≤ r}. Podrobnejší rozbor hraničných situácií však presahuje rámec nášho kurzu. (Pozri tiež cvičenie 22.3.) Práve rovnomerná konvergencia vo vnútri definičného oboru potenčného radu zabezpečuje nielen spojitosť jeho súčtu a derivácií, ale tiež umožňuje tento súčet derivovať alebo integrovať formálnym derivovaním resp. integrovaním pôvodného radu člen za členom. Vo vnútri kruhu konvergencie tak nemusíme rozlišovať medzi radom a funkciou definovanou jeho súčtom, a rovnako ani medzi p-tou formálnou deriváciou radu a p-tou deriváciou tejto funkcie. Formálne možno do mocninného radu f(x) = ∞ k=0 ckxk dosadiť za premennú x nielen reálne či komplexné číslo, ale aj ľubovoľnú štvorcovú maticu AAA = (aij)n×n nad R alebo C. Aby sme však mohli bližšie preskúmať maticové funkcie, ktoré takto dostaneme, musíme si najprv ujasniť niektoré základné otázky týkajúce sa konvergencie postupností a radov komplexných matíc. Konvergenciu postupnosti matíc definujeme po zložkách. Teda postupnosť matíc (AAAk)∞ k=0, kde AAAk = (akij) ∈ Cm×n , konverguje k matici AAA = (aij) ∈ Cm×n , ak pre všetky i ≤ m, j ≤ n postupnosť (akij)∞ k=0 konverguje k prvku aij, čiže lim k→∞ akij = aij. V takom prípade píšeme lim k→∞ AAAk = AAA. V dôsledku spojitosti sčítania a násobenia v poli C možno pre súčty a súčiny konvergentných maticových postupností (AAAk), (BBBk) vhodných rozmerov dokázať obdobné vzťahy ako pre číselné postupnosti: lim k→∞ (AAAk + BBBk) = lim k→∞ AAAk + lim k→∞ BBBk, lim k→∞ (AAAk · BBBk) = lim k→∞ AAAk · lim k→∞ BBBk. 4 Funkcionálny rad ∞ k=0 gk(x) konverguje rovnomerne na množine X ⊆ C k funkcii g(x), ak (∀ ε > 0)(∃ m0)(∀ m ≥ m0)(∀ x ∈ X) m k=0 gk(x) − g(x) < ε . Vo všeobecnosti súčet konvergentného funkcionálneho radu funkcií spojitých na množine X nemusí byť spojitá funkcia na X. Ak však rad konverguje k svojmu súčtu na tejto množine rovnomerne, tak aj jeho súčet je spojitá funkcia na X. 22.1. Mocninné rady maticovej premennej 459 Tieto pravidlá nám umožňujú počítať s limitami maticových postupností do značnej miery podobne ako s limitami číselných postupností. Súčet maticového radu ∞ k=0 AAAk, kde (AAAk)∞ k=0 je nejaká postupnosť komplexných matíc rovnakého rozmeru m × n, potom definujeme ako limitu postupnosti jeho čiastočných súčtov, t. j. ∞ k=0 AAAk = lim p→∞ p k=0 AAAk, samozrejme, ak uvedená limita (t. j. matica AAA ∈ Cm×n príslušných vlastností) existuje. V takom prípade hovoríme, že maticový rad AAAk konverguje, v opačnom prípade hovoríme, že diverguje. Dosadením konkrétnej matice AAA ∈ Cn×n do mocninného radu f(x) = ∞ k=0 ckxk tak dostaneme maticový rad ∞ k=0 ckAAAk , ktorého súčet je definovaný ako limita f(AAA) = ∞ k=0 ckAAAk = lim m→∞ m k=0 ckAAAk postupnosti hodnôt fm(AAA) polynómov fm(x) = m k=0 ckxk pre maticu AAA. Definičným oborom takejto funkcie f je množina tých matíc AAA ∈ Cn×n , pre ktoré uvedený rad, t. j. postupnosť fm(AAA) , konverguje. Túto množinu (pri pevnom n) budeme značiť Domn(f). Limitným prechodom pre m → ∞ dostávame z výsledkov 21.1.1–3 obdobné tvrdenia aj pre maticové potenčné rady. 22.1.2. Tvrdenie. Nech f(x) ∈ C[[x]], AAA, PPP ∈ Cn×n , pričom PPP je regulárna. Potom AAA ∈ Domn(f) práve vtedy, keď PPP ·AAA·PPP−1 ∈ Domn(f), a v tom prípade platí f PPP · AAA · PPP−1 = PPP · f(AAA) · PPP−1 . 22.1.3. Dôsledok. Nech f(x) ∈ C[[x]], AAA, BBB ∈ Cn×n , pričom AAA ≈ BBB. Potom AAA ∈ Domn(f) práve vtedy, keď BBB ∈ Domn(f), a v tom prípade f(AAA) ≈ f(BBB). 22.1.4. Lema. Nech f(x) ∈ C[[x]], AAA1 ∈ Cn1×n1 , . . . , AAAp ∈ Cnp×np . Potom diag(AAA1, . . . ,AAAp) ∈ Domn(f) práve vtedy, keď AAAj ∈ Domnj (f) pre každé j ≤ p, a v tom prípade platí f diag(AAA1, . . . ,AAAp) = diag f(AAA1), . . . , f(AAAp) . Ľubovoľný polynóm, ktorý anuluje maticu AAA ∈ Cn×n , nám umožňuje zjednodušiť výpočet súčtu potenčného radu f(AAA) = ckAAAk , a to tým väčšmi, čím nižší je jeho stupeň m. Pomocou neho možno totiž všetky mocniny AAAk , 460 22. Maticové funkcie k ≥ m, vyjadriť ako hodnoty polynómov stupňa < m pre maticu AAA (porovnajte s príkladom 21.1.5). Najvýhodnejší na ten účel preto je minimálny polynóm matice AAA. Ak totiž µAAA(x) = xm − m j=1 djxm−j , tak AAAm = m j=1 djAAAm−j . Potom AAAm+k = m j=1 d (k) j AAAm−j , kde koeficienty d (k) j možno vypočítať z rekurentného vzťahu d (0) j = dj, d (k+1) j = djd (k) 1 + d (k) j+1, pričom pre j > m definitoricky kladieme d (k) j = 0. Ak teda označíme ν (k) AAA (x) = d (k) 1 xm−1 + . . . + d (k) m−1x + d(k) m = m j=1 d (k) j xm−j , tak všetky tieto polynómy majú stupeň < m a pre AAA ∈ Domn(f) platí f(AAA) = ∞ k=0 ckAAAk = c0III + . . . + cm−1AAAm−1 + ∞ k=0 cm+kν (k) AAA (AAA). Iný spôsob výpočtu potenčného radu f(AAA) = ckAAAk , pri ktorom zároveň možno rozhodnúť otázku, či AAA ∈ Domn(f), sa zakladá na znalosti Jordanovho kanonického tvaru matice AAA ∈ Cn×n . Keďže pole C je algebraicky uzavreté, existuje matica JJJ = diag JJJn1 (λ1), . . . ,JJJnp (λp) ∈ Cn×n v JKT a regulárna matica PPP ∈ Cn×n také, že AAA = PPP ·JJJ ·PPP−1 . Vďaka tvrdeniu 22.1.2 a leme 22.1.4 potom AAA ∈ Domn(f) ⇔ JJJ ∈ Domn(f) ⇔ (∀ i ≤ p) JJJni (λi) ∈ Domni (f) , a – podobne ako pre polynómy – v tom prípade platí f(AAA) = PPP · f(JJJ) · PPP−1 = PPP · diag f JJJn1 (λ1) , . . . , f JJJnp (λp) · PPP−1 . Tým sme otázku konvergencie potenčných radov pre všeobecné matice AAA ∈ Cn×n zredukovali na otázku konvergencie takýchto radov pre Jordanove bunky JJJn(λ), kde λ ∈ C. Použitím viet 22.1.1, 21.1.8 a limitným prechodom m → ∞ na postupnosť čiastočných súčtov fm(x) = m k=0 ckxk , umožneným rovnomernou konvergenciou, dostávame 22.1.5. Veta. Nech f(x) = ∞ k=0 ckxk ∈ C[[x]] je potenčný rad s polomerom konvergencie r a JJJn(λ) je komplexná Jordanova bunka. Potom platí 22.1. Mocninné rady maticovej premennej 461 (a) ak |λ| < r, tak JJJn(λ) ∈ Domn(f); (b) ak |λ| > r, tak JJJn(λ) /∈ Domn(f). V prípade (a) navyše platí f JJJn(λ) =      f(λ) 1 1! f (λ) . . . 1 (n−1)! f(n−1) (λ) 0 f(λ) . . . 1 (n−2)! f(n−2) (λ) ... ... ... ... 0 0 . . . f(λ)      . K hraničnému prípadu |λ| = r poznamenajme len toľko, že rad f JJJn(λ) konverguje práve vtedy, keď konverguje rad f(n−1) (λ). Potom konvergujú i všetky ostatné rady f(j) (λ), 0 ≤ j ≤ n − 1, a vyššie uvedený vzorec zostáva v platnosti. Vzorec pre f JJJn(λ) je cenný najmä vtedy, keď máme k dispozícii kompaktnú formulu pre funkciu f, z ktorej vieme priamo vypočítať aj jej derivácie. Ako uvidíme v paragrafe 22.3, taktiež ho možno použiť na definíciu hodnôt f JJJn(λ) aj pre iné funkcie, než len dané potenčnými radmi. Stačí, aby funkcia f mala v bode λ všetky derivácie až do rádu n − 1. V ďalšom kroku možno definíciu f(AAA) rozšíriť na všetky matice AAA ∈ Cn×n za predpokladu, že ich spektrum spĺňa istú podmienku, ktorú presnejšie sformulujeme v 22.3. Spektrálnym polomerom komplexnej (a tým i reálnej) štvorcovej matice AAA nazývame maximum absolútnych hodnôt jej vlastných čísel, t. j. číslo ρ(AAA) = max{|λ|; λ ∈ SpecAAA}. Zrejme ρ(AAA) ≥ 0 je reálne číslo. Otázku konvergencie potenčných radov pre všeobecné matice možno vyjasniť na základe vzťahu medzi polomerom konvergencie radu a spektrálnym polomerom matice. Keďže každá komplexná štvorcová matica je podobná s maticou v JKT, z tvrdení 22.1.2, 22.1.4 a 22.1.5 vyplýva 22.1.6. Veta. Nech f(x) = ckxk ∈ C[[x]] je potenčný rad s polomerom konvergencie r. Potom pre ľubovoľnú maticu AAA ∈ Cn×n platí (a) ak ρ(AAA) < r, tak AAA ∈ Domn(f); (b) ak ρ(AAA) > r, tak AAA /∈ Domn(f). 22.1.7. Príklad. Funkcie (1 − x)−1 , (1 + x)−1 možno pre |x| < 1 vyjadriť Mac Laurinovými radmi 1 1 − x = ∞ k=0 xk , 1 1 + x = ∞ k=0 (−1)k xk , 462 22. Maticové funkcie s rovnakým polomerom konvergencie r = 1. Preto i maticové rady AAAk , (−1)k AAAk konvergujú pre každé AAA ∈ Cn×n , ρ(AAA) < 1, a platí ∞ k=0 AAAk = (III − AAA)−1 , ∞ k=0 (−1)k AAAk = (III + AAA)−1 ; pozri cvičenie 22.4. Rad AAAk = (III − AAA)−1 sa zvykne tiež nazývať von Neumannovým radom matice AAA. 22.1.8. Príklad. Funkcie ln(1−x), ln(1+x) možno pre |x| < 1 rozvinúť do Mac Laurinových radov ln(1 − x) = − ∞ k=1 1 k xk , ln(1 + x) = ∞ k=1 (−1)k−1 k xk , opäť s polomerom konvergencie r = 1, ktoré sme získali z radov pre (1±x)−1 formálnou integráciou člen po člene a využitím rovnosti ln 1 = 0. Uvedené rady teda môžeme použiť na definíciu funkcií ln(III − AAA) = − ∞ k=1 1 k AAAk , ln(III + AAA) = ∞ k=1 (−1)k−1 k AAAk , pre AAA ∈ Cn×n , ρ(AAA) < 1. Oprávnenosťou takýchto definícií sa budeme zaoberať v cvičení 22.5. Uvedomme si, že Spec(AAA − III) = {λ − 1; λ ∈ SpecAAA}, a dosaďme do druhého radu maticu AAA−III miesto matice AAA (prípadne do prvého radu maticu III − A). Maticový rad lnAAA = ∞ k=1 (−1)k−1 k (AAA − III)k = − ∞ k=1 1 k (III − AAA)k , ktorý takto dostaneme, konverguje pre všetky AAA ∈ Cn×n také, že |λ − 1| < 1 pre každé λ ∈ SpecAAA; pre takéto matice ho teda možno použiť na definíciu funkcie lnAAA. 22.2 Exponenciála matice Vari najdôležitejšou funkciou v matematickej analýze je exponenciála ex , ktorú možno pre každé x ∈ C definovať potenčným radom ex = exp x = ∞ k=0 xk k! . 22.2. Exponenciála matice 463 Z uvedeného rozvoja už možno odvodiť všetky dôležité vlastnosti exponenciálnej funkcie, vrátane kľúčového vzťahu ex = ex . S exponenciálnou funkciou úzko súvisia ďalšie dve funkcie, kosínus a sínus, ktoré je pre naše účely najvýhodnejšie definovať pre každé x ∈ C mocninnými radmi cos x = ∞ k=0 (−1)k (2k)! x2k , sin x = ∞ k=0 (−1)k (2k + 1)! x2k+1 . Presvedčte sa samostatne, že polomer konvergencie všetkých troch uvedených radov je r = ∞. To nám umožňuje definovať exponenciálu, kosínus a sínus pre ľubovoľnú maticu AAA ∈ Cn×n : eAAA = expAAA = ∞ k=0 1 k! AAAk , cosAAA = ∞ k=0 (−1)k (2k)! AAA2k , sinAAA = ∞ k=0 (−1)k (2k + 1)! AAA2k+1 . Jednoduchým výpočtom možno overiť maticové zovšeobecnenie slávneho Eulerovho vzťahu eix = cos x + i sin x. 22.2.1. Tvrdenie. Pre ľubovoľnú maticu AAA ∈ Cn×n platí eiAAA = cosAAA + i sinAAA. Dôkaz. Sčítaním zvlášť cez párne a nepárne členy radu dostaneme eiAAA = ∞ k=0 1 k! (iAAA)k = ∞ k=0 i2k (2k)! AAA2k + ∞ k=0 i2k+1 (2k + 1)! AAA2k+1 = ∞ k=0 (−1)k (2k)! AAA2k + i ∞ k=0 (−1)k (2k + 1)! AAA2k+1 = cosAAA + i sinAAA. Známy vzťah ex+y = ex ey má tiež maticové zovšeobecnenie. 22.2.2. Tvrdenie. Ak matice AAA,BBB ∈ Cn×n komutujú, tak eAAA+BBB = eAAA · eBBB . 464 22. Maticové funkcie Dôkaz. S použitím rovnosti k j = k! j!(k−j)! a binomickej vety (lema 21.1.6) postupnými úpravami vypočítame eAAA · eBBB = ∞ i=0 1 i! AAAi · ∞ j=0 1 j! BBBj = ∞ k=0 i+j=k 1 i! j! AAAi BBBj = ∞ k=0 1 k! k j=0 k j AAAk−j BBBj = ∞ k=0 1 k! (AAA + BBB)k = eAAA+BBB . Ak matice AAA,BBB ∈ Cn×n komutujú, tak komutujú aj matice AAA, iBBB. Z tvrdení 22.2.1, 22.2.2 tak dostávame 22.2.3. Dôsledok. Ak matice AAA,BBB ∈ Rn×n komutujú, tak eAAA+iBBB = eAAA (cosBBB + i sinBBB), pričom eAAA , cosBBB, sinBBB ∈ Rn×n . Uvedomte si, že pre nulovú maticu 0n,n = diag(0, . . . , 0) podľa lemy 21.1.3 platí exp 0n,n = diag(e0 , . . . , e0 ) = IIIn. Keďže každá štvorcová matica AAA komutuje s maticou −AAA, z tvrdenia 22.2.2 okamžite vyplýva ďalší dôsledok. 22.2.4. Dôsledok. Exponenciála eAAA ľubovoľnej matice AAA ∈ Cn×n je regulárna a platí eAAA )−1 = e−AAA . Kľúčom k výpočtu exponenciály matice je opäť znalosť exponenciály Jordanových buniek. Vďaka rovnosti (ex ) = ex podľa vety 22.1.5 dostávame 22.2.5. Tvrdenie. Pre n ≥ 1, λ ∈ C platí expJJJn(λ) =      eλ eλ 1! . . . eλ (n−1)! 0 eλ . . . eλ (n−2)! ... ... ... ... 0 0 . . . eλ      =      1 1 1! . . . 1 (n−1)! 0 1 . . . 1 (n−2)! ... ... ... ... 0 0 . . . 1      eλ . Na záver ešte zaznamenáme jeden užitočný a zaujímavý vzťah, umožňujúci jednoduchý vypočet determinantu exponenciály matice len na základe jej stopy. 22.2.6. Veta. (Liouvilleova formula) Pre ľubovoľnú maticu AAA ∈ Cn×n platí det eAAA = etrAAA . 22.3. Skalárne funkcie maticového argumentu 465 Dôkaz. Pre JJJ = diag JJJn1 (λ1) . . . ,JJJnp (λp) podľa lemy 22.1.4 máme eJJJ = diag expJJJn1 (λ1), . . . , expJJJnp (λp) . Takže v dôsledku tvrdenia 22.2.5 platí det eJJJ = eλ1 n1 . . . eλp np = exp(n1λ1 + . . . + npλp) = etrJJJ . Nech teraz JJJ ≈ AAA je JKT matice AAA. Podľa dôsledku 22.1.3 platí eAAA ≈ eJJJ . Keďže podobné matice majú rovnaký determinant aj stopu (pozri dôsledok 18.1.4), z prvej časti dôkazu vyplýva det eAAA = det eJJJ = etrJJJ = etrAAA . Keďže det eAAA = etrAAA = 0, dostávame tak iný dôkaz regularity matice eAAA . 22.3 Skalárne funkcie maticového argumentu Tvrdenie 21.1.1, lema 21.1.3 a veta 21.1.8, spolu s vetou 20.1.2 o Jordanovom kanonickom tvare, nám umožňujú vypočítať hodnotu f(AAA) pre ľubovoľný polynóm f(x) a štvorcovú maticu AAA nad poľom komplexných čísel. Vďaka tvrdeniu 22.1.2, leme 22.1.4 a vete 22.1.5 môžeme tú istú schému uplatniť aj pre potenčný rad f(x) ∈ C[[x]] a maticu AAA ∈ Cn×n , ktorej spektrálny polomer je menší ako polomer konvergencie radu f(x). To navodzuje myšlienku použiť rovnakú schému na definíciu rozšírenia komplexných funkcií komplexnej premennej (prípadne reálnych funkcií reálnej premennej) na maticové argumenty. Takto získaným funkciám budeme hovoriť skalárne funkcie maticového argumentu. Pripomeňme, že rádom vlastnej hodnoty λ matice AAA ∈ Kn×n nad ľubovoľným poľom K nazývame rád r najväčšej Jordanovej bunky JJJr(λ) v JKT matice AAA (pozri paragraf 20.4 a cvičenie 20.6). Nech f je komplexná funkcia komplexnej premennej a AAA ∈ Cn×n . Hodnota funkcie f je definovaná pre maticu AAA, píšeme tiež AAA ∈ Domn f, ak pre každé vlastné číslo λ ∈ SpecAAA s rádom r sú funkcia f a všetky derivácie f , . . . , f(r−1) definované v bode λ. (Ak r > 1, tak to predpokladá, že funkcia f je definovaná v nejakom okolí bodu λ.) Samotnú definíciu hodnoty f(AAA), za uvedených podmienok, rozložíme do troch krokov: (1) Ak AAA = JJJn(λ) je Jordanova bunka, tak f(AAA) = f JJJn(λ) =      f(λ) 1 1! f (λ) . . . 1 (n−1)! f(n−1) (λ) 0 f(λ) . . . 1 (n−2)! f(n−2) (λ) ... ... ... ... 0 0 . . . f(λ)      . 466 22. Maticové funkcie (2) Ak AAA = JJJ = diag(JJJ1, . . . ,JJJk) je v JKT, kde JJJi = JJJni (λi) pre i ≤ k sú Jordanove bunky, tak f(AAA) = f(JJJ) = diag f(JJJ1), . . . , f(JJJk) . (3) Konečne, ak AAA = PPP · JJJ · PPP−1 , kde JJJ je JKT matice AAA a PPP je regulárna matica, tak f(AAA) = PPP · f(JJJ) · PPP−1 . Pred chvíľou spomínané výsledky nám zaručujú, že pre funkcie dané polynómami či potenčnými radmi dáva táto definícia rovnaké výsledky ako pôvodné definície. V prípade všeobecných funkcií je však potrebné dokázať jej korektnosť. Táto úloha sa redukuje na dôkaz nezávislosti hodnoty f(AAA) na matici prechodu PPP medzi maticou AAA a jej JKT JJJ, ako aj na poradí Jordanových buniek v matici JJJ. Začneme jedným zovšeobecnením Lagrangeovho interpolačného polynómu (porovnaj s cvičením 10.16). 22.3.1. Lema. Nech K je niektoré z polí R alebo C, hodnoty λ1, . . . , λm ∈ K sú navzájom rôzne a YYY = (yik) ∈ Km×r je matica (so stĺpcami číslovanými od 0 do r − 1). Potom existuje jednoznačne určený polynóm F(x) ∈ K[x] stupňa ≤ mr − 1 taký, že F(k) (λi) = yik pre všetky 1 ≤ i ≤ m, 0 ≤ k < r. Dôkaz. Polynóm F(x) budeme hľadať v tvare F(x) = p1(x)q1(x) + . . . + pm(x)qm(x), kde pi(x) = r−1 k=0 cik k! (x − λi)k má tvar Taylorovho polynómu a qi(x) = j=i (x − λj)r . Takže zostáva určiť iba koeficienty cik. Zvoľme ľubovoľné 1 ≤ i ≤ m, 0 ≤ k < r. Z tvaru polynómov qi(x) je zrejmé, že q (k) i (λj) = 0 pre j = i. V dôsledku toho s použitím Newtonovej binomickej formuly pre k-tu deriváciu súčinu dvoch funkcií dostávame F(k) (λi) = dk dxk pi(x)qi(x) x=λi = k j=0 k j p (j) i (λi)q (k−j) i (λi) = k j=0 k j cijq (k−j) i (λi); 22.3. Skalárne funkcie maticového argumentu 467 pozri cvičnie 22.9. Pre pevné i vypočítame vektor koeficientov ci0, . . . , ci r−1 ako riešenie sústavy r lineárnych rovníc k j=0 k j q (k−j) i (λi) cij = yik pre 0 ≤ k < r. Táto sústava má dolnú trojuholníkovú maticu, pričom všetky jej diagonálne prvky sú qi(λi). Keďže hodnoty λ1, . . . , λm sú navzájom rôzne, qi(λi) = 0, preto matica sústavy je regulárna a sústava má jediné riešenie. Postupnou elimináciou dostávame ci0 = yi0 qi(λi) , ci1 = yi1 qi(λi) − qi(λi) yi0 qi(λi)2 , ci2 = yi2 qi(λi) − 2qi(λi) yi1 qi(λi)2 + 2qi(λi)2 − qi(λi)qi (λi) yi0 qi(λi)3 , atď. Konkrétny tvar riešenia nás v tejto chvíli príliš nezaujíma – dôležitá je len jeho existencia. 22.3.2. Veta. Nech AAA ∈ Cn×n a λ1, . . . , λm sú všetky navzájom rôzne vlastné hodnoty matice AAA, pričom ri označuje rád vlastnej hodnoty λi. Nech f je skalárna funkcia maticového argumentu taká, že AAA ∈ Domn f. Potom existuje polynóm F(x) ∈ C[x], ktorý závisí len na vlastných hodnotách λi matice AAA, ich rádoch ri a hodnotách funkcie f a jej derivácií až do rádu ri −1 v bodoch spektra λi, taký, že f(AAA) = F(AAA). Dôkaz. Označme r = max{r1, . . . , rm}. Pre 1 ≤ i ≤ m, 0 ≤ k < r položme yik = f(k) (λi), ak k < ri, 0, ak k ≥ ri. Podľa práve dokázanej lemy existuje polynóm F(x) taký, že F(k) (λi) = yik pre všetky i, k. Nech JJJ ≈ AAA je JKT matice AAA a PPP je regulárna matica taká, že AAA = PPP · JJJ · PPP−1 . Potom maximálny rozmer Jordanových buniek v JJJ je r × r. Keďže hodnota f(JJJ) závisí len od hodnôt f(k) (λi) pre 1 ≤ i ≤ m, 0 ≤ k < ri, zrejme platí f(JJJ) = F(JJJ). Podľa definície výrazu f(AAA) a tvrdenia 22.1.2 z toho vyplýva f(AAA) = PPP · f(JJJ) · PPP−1 = PPP · F(JJJ) · PPP−1 = F PPP · JJJ · PPP−1 = F(AAA). 468 22. Maticové funkcie Z práve dokázanej vety okamžite vyplýva korektnosť našej definície výrazu f(AAA): hodnota f(AAA) = F(AAA) totiž nezávisí na konkrétnej reprezentácii AAA = PPP · JJJ · PPP−1 matice AAA pomocou matíc JJJ a PPP. V najjednoduchšom prípade, keď matica AAA je diagonalizovateľná, t. j. AAA = PPP · diag(λ1, . . . , λn) · PPP−1 pre nejakú regulárnu maticu PPP a λ1, . . . , λn ∈ C, hodnota f(AAA) je definovaná práve vtedy, keď funkcia f je definovaná vo všetkých bodoch λi spektra matice AAA, pričom f(AAA) = PPP · diag f(λ1), . . . , f(λn) · PPP−1 . Napokon si ešte ujasnime, ako je to s možnosťou rozšírenia reálnych funkcií reálnej premennej na maticové argumenty. Z vykonaných úvah vyplýva, že otázka, či AAA je reálna alebo komplexná matica, pri tom nehrá podstatnú úlohu. Dôležité je, aby AAA mala reálne spektrum. Teda hodnotu f(AAA) možno definovať podľa rovnakej schémy pre ľubovoľnú maticu AAA ∈ Cn×n , pre ktorú platí SpecAAA ⊆ R a pre každé λ ∈ SpecAAA sú funkcia f a všetky jej derivácie až do rádu menšieho než rád λ definované (a konečné) v bode λ. Potom výsledná matica f(AAA) ∈ Cn×n má opäť reálne spektrum Spec f(AAA) = {f(λ); λ ∈ SpecAAA}. Ak AAA je navyše reálna matica s reálnym spektrom, tak aj výsledná matica f(AAA) je reálna. (Rozmyslite si prečo – pozri cvičenie 22.11.) 22.4 Maticové a vektorové funkcie reálnej premennej Funkciu xxx: S → Cn , resp. xxx: S → Rn , kde S ⊆ R, budeme nazývať komplexnou resp. reálnou vektorovou funkciou reálnej premennej. Takáto funkcia sa prirodzene rozpadá na n zložiek, t. j. skalárnych funkcií xi : S → C resp. xi : S → R takých, že xxx(t) = (x1(t), . . . , xn(t))T pre každé t ∈ S. Podobne funkciu XXX : S → Cm×n resp. XXX : S → Rm×n nazývame komplexnou resp. reálnou maticovou funkciou reálnej premennej na množine S ⊆ R. I takúto funkciu možno rozložiť na mn skalárnych zložiek xij : S → C, resp. xij : S → R takých, že pre každé t ∈ S platí XXX(t) = xij(t) m×n . Zrejme vektorové funkcie možno chápať ako špeciálny prípad maticových a reálne ako špeciálny prípad komplexných. 5 Maticová funkcia XXX = (xij) je spojitá v bode t0 svojho definičného oboru S, prípadne na množine N ⊆ S, ak každá z jej zložiek xij má uvedenú vlastnosť. 5 Pripomeňme, že komplexnú funkciu g: S → C reálnej premennej t ∈ S ⊆ R možno jednoznačne rozložiť na tvar g(t) = g1(t) + ig2(t), kde g1, = Re g, g2 = Im g sú funkcie S → R. Potom g je spojitá v bode t0 ∈ S práve vtedy, keď g1 aj g2 sú spojité v t0. Podobne aj derivácia a integrál sú definované po zložkách: g (t0) existuje práve vtedy, keď existujú g1(t0) a g2(t0), pričom g (t0) = g1(t0)+ig2(t0); pre spojitú g: a, b → C kladieme b a g(t) dt = b a g1(t) dt + i b a g2(t) dt. 22.4. Maticové a vektorové funkcie reálnej premennej 469 Predpokladajme, že maticová funkcia XXX je definovaná v nejakom okolí N bodu t0, t. j. všetky jej zložky xij sú definované na N. Hovoríme, že XXX má deriváciu v bode t0, ak všetky zložky xij majú v bode t0 (konečnú) deriváciu. Deriváciu funkcie XXX v bode t0 značíme dXXX(t0) dt = dxij(t0) dt m×n , prípadne XXX (t0) = xij(t0) m×n . Niekedy, najmä pri typickej interpretácii premennej t ako času, sa tiež používa od Newtona pochádzajúce označenie ˙XXX(t0) = ˙xij(t0) m×n . Vyššie derivácie (ak existujú) značíme dk XXX/ dtk , prípadne XXX(k) . Nasledujúce maticové zovšeobecnenia pravidiel pre deriváciu lineárnej kombinácie a súčinu maticových funkcií, resp. pre kompozíciu skalárnej a maticovej funkcie možno overiť priamym výpočtom. 22.4.1. Tvrdenie. Nech maticové funkcie XXX,YYY : S → Cm×n , ZZZ : S → Cn×p majú derivácie v bode t0 ∈ S a a, b ∈ C. Potom aj funkcie aXXX + bYYY = (axij + byij)m×n, XXX · ZZZ = j xijzjk m×p majú derivácie v bode t0 a platí (aXXX + bYYY ) (t0) = aXXX (t0) + bYYY (t0) (XXX · ZZZ) (t0) = XXX (t0) · ZZZ(t0) + XXX(t0) · ZZZ (t0). Nech navyše reálna skalárna funkcia g je definovaná v okolí bodu s0 a má v ňom (konečnú) deriváciu, pričom g(s0) = t0. Potom aj funkcia XXX ◦ g = (xij ◦ g)m×n má v bode s0 deriváciu (XXX ◦ g) (s0) = XXX (t0)g (s0). 22.4.2. Dôsledok. Nech maticová funkcia XXX : S → Rn×n je definovaná v okolí bodu t0 a má tam deriváciu. Potom pre každé k ∈ N aj maticová funkcia XXXk má v bode t0 deriváciu dXXXk (t0) dt = k j=1 XXXj−1 (t0) · XXX (t0) · XXXk−j (t0). Ak navyše matice XXX(t0) a XXX (t0) komutujú, tak dXXXk (t0) dt = kXXXk−1 (t0) · XXX (t0) = kXXX (t0) · XXXk−1 (t0). Dôkaz indukciou cez k. 470 22. Maticové funkcie 22.4.3. Tvrdenie. Nech potenčný rad f(x) = ∞ k=0 ckxk ∈ C[[x]] má polomer konvergencie r > 0. Nech ďalej maticová funkcia XXX : S → Cn×n je definovaná v okolí bodu t0 ∈ S a má v ňom deriváciu, pričom matice XXX(t0) a XXX (t0) komutujú. Ak ρ(XXX(t0)) < r, tak funkcia f(XXX) = f ◦ XXX je definovaná v nejakom okolí bodu t0 a má v ňom deriváciu f(XXX) (t0) = (f ◦ XXX) (t0) = f XXX(t0) · XXX (t0) = XXX (t0) · f XXX(t0) . V dôkaze použijeme niekoľko argumentov z matematickej analýzy. Čitateľovi, ktorému veľa nehovoria, odporúčame prejsť priamo k výpočtu. Z existencie derivácie XXX (t0) vyplýva spojitosť funkcie XXX v nejakom okolí N ⊆ S bodu t0. Zo spojitej závislosti koeficientov charakteristického polynómu na prvkoch matice ako aj koreňov polynómu na koeficientoch zasa vyplýva existencia okolia M ⊆ N bodu t0 a čísla q > 0 takých, že ρ(XXX(t)) ≤ q < r pre t ∈ M. Označme fm(x) = m k=0 ckxk . Vďaka rovnomernej konvergencii radu f(XXX(t)) = ckXXX(t)k na množine M a s použitím pravidiel z 22.4.1, 22.4.2 dostávame f(XXX) (t0) = lim m→∞ fm(XXX) (t0) = lim m→∞ m k=0 ck dXXXk (t0) dt = lim m→∞ m k=1 kckXXXk−1 (t0) · XXX (t0) = f XXX(t0) · XXX (t0). Keďže za uvedeného predpokladu komutujú aj XXX (t0) a f XXX(t0) , platí i druhá rovnosť. Z faktu, že matica AAAt vždy komutuje s maticou (AAAt) = AAA, ako aj s maticami eAAAt , cosAAAt, sinAAAt, na základe práve dokázanej vety okamžite vyplýva 22.4.4. Dôsledok. Nech AAA ∈ Rn×n je pevne zvolená matica. Potom maticové funkcie eAAAt , cosAAAt, sinAAAt sú definované pre každé t ∈ R a pre ich derivácie platí eAAAt = AAA · eAAAt , cosAAAt = −AAA · sinAAAt, sinAAAt = AAA · cosAAAt. Určitý integrál spojitej maticovej funkcie XXX : S → Cm×n na intervale 6 S ⊆ R definujeme pre s, t ∈ S opäť po zložkách: t s XXX(τ) dτ = t s xij(τ) dτ m×n 6 Dohodneme sa, že pod intervalom budeme odteraz vždy rozumieť netriviálny interval – či už ohraničený alebo neohraničený, – t. j. ľubovoľnú podmnožinu S ⊆ R, ktorá obsahuje aspoň dva body a spĺňa podmienku (∀ a, b ∈ S)(∀ x ∈ R)(a ≤ x ≤ b ⇒ x ∈ S). 22.4. Maticové a vektorové funkcie reálnej premennej 471 Prenecháme čitateľovi, aby si samostatne premyslel, že takto definovaný určitý integrál splýva s limitou maticových integrálnych súčtov t s XXX(τ) dτ = lim k→∞ k j=1 XXX(s + jdk)dk, kde dk = (t − s)/k. Nasledujúce tvrdenie o „maticovej linearite sprava i zľava a množinovej aditívnosti určitého integrálu je priamym zovšeobecnením analogických pravidiel pre integrál skalárnych funkcií. 22.4.5. Tvrdenie. Nech XXX,YYY : S → Cm×n sú spojité maticové funkcie na intervale S ⊆ R, s, t, u ∈ S a AAA,BBB ∈ Ck×m , CCC,DDD ∈ Cn×p . Potom t s AAA · XXX(τ) · CCC + BBB · YYY (τ) · DDD dτ = AAA · t s XXX(τ) dτ · CCC + BBB · t s YYY (τ) dτ · DDD, t s XXX(τ) dτ + u t XXX(τ) dτ = u s XXX(τ) dτ. Špeciálne pre skaláry a, b ∈ C a s, t ∈ S platí t s aXXX(τ) + bYYY (τ) dτ = a t s XXX(τ) dτ + b t s YYY (τ) dτ, t t XXX(τ) dτ = 0, t s XXX(τ) dτ = − s t XXX(τ) dτ. Derivácia a určitý integrál ako funkcia hornej medze sú opäť zviazané maticovým zovšeobecnením Newtonovej-Leibnizovej formuly, ako aj vyjadrením určitého integrálu rozdielom primitívnej funkcie hornej a dolnej medze. Inak povedané, ide o navzájom inverzné operácie v rovnakom zmysle ako v jednorozmernom prípade. 22.4.6. Tvrdenie. Nech XXX : S → Cm×n je spojitá maticová funkcia na intervale S ⊆ R a s, t ∈ S. Potom d dt t s XXX(τ) dτ = XXX(t). Ak XXX navyše má na S spojitú deriváciu XXX , tak t s XXX (τ) dτ = XXX(t) − XXX(s). 472 22. Maticové funkcie 22.5 Sústavy lineárnych diferenciálnych rovníc Paragraf 22.2 sme začali vyzdvihnutím exponenciály ex ako „vari najdôležitejšej funkcie v matematickej analýze . Jeden z dôvodov takéhoto hodnotenia sme už naznačili v príklade 18.5.1 – každé riešenie diferenciálnej rovnice dx dt = ax, kde a ∈ C, má tvar funkcie x(t) = q eat reálnej premennej t, kde q ∈ C je ľubovoľná konštanta. Túto možno určiť, ak máme navyše predpísanú i počiatočnú podmienku, t. j. hodnotu x(t0) = c ∈ C v nejakom bode t0 ∈ R, – vtedy riešenie nadobúda tvar x(t) = c ea(t−t0) = q eat , kde q = c e−at0 . Riešenia zložitejších diferenciálnych rovníc sa preto často zostavujú vhodnými kombináciami funkcií eat , prípadne funkcií cos at, sin at, pre rôzne a, ktoré však s exponenciálnymi funkciami tesne súvisia prostredníctvom Eulerovho vzťahu. Uvedený tvar riešenia možno priamo zovšeobecniť aj na prípad, keď a: S → C je ľubovoľná spojitá funkcia, definovaná na nejakom intervale S ⊆ R, a nielen konštanta. Vtedy x(t) = x(t0) exp t t0 a(τ) dτ , pre t0, t ∈ S. V tomto paragrafe preskúmame viacrozmerný analóg podobnej situácie. Sústavou lineárnych diferenciálnych rovníc, prípadne vektorovou lineárnou diferenciálnou rovicou nazývame formulu tvaru xxx = AAA · xxx + bbb, kde AAA: S → Cn×n resp. bbb: S → Cn je spojitá maticová resp. vektorová funkcia na nejakom intervale S ⊆ R. Riešením takejto sústavy rozumieme ľubovoľnú funkciu xxx: S → Cn , ktorá má na S spojitú deriváciu a pre každé t ∈ S platí xxx (t) = AAA(t) · xxx(t) + bbb(t). (V prípadných krajných bodoch intervalu sa pod deriváciou myslí derivácia sprava resp. zľava.) Takáto sústava býva často doplnená o počiatočnú podmienku xxx(t0) = ccc, 22.5. Sústavy lineárnych diferenciálnych rovníc 473 ktorá predpisuje hodnotu ccc ∈ Cn funkcie xxx v niektorom pevnom bode t0 ∈ S. V takom prípade hovoríme o počiatočnej úlohe. V kurze obyčajných diferenciálnych rovníc sa zvykne dokazovať nasledujúca veta o existencii a jednoznačnosti jej riešenia. 22.5.1. Veta. Nech S ⊆ R je interval, AAA: S → Cn×n resp. bbb: S → Cn je spojitá maticová resp. vektorová funkcia na S, t0 ∈ S a ccc ∈ Cn . Potom existuje práve jedno riešenie počiatočnej úlohy xxx = AAA · xxx + bbb, xxx(t0) = ccc. Poznámka. (a) Keďže Cn×n je vektorový priestor nad C a násobenie pevnou maticou AAA ∈ Cn×n (či už zľava alebo sprava) je lineárne zobrazenie Cn×n → Cn×n , do rámca vektorových lineárnych diferenciálnych rovníc zapadajú aj maticové lineárne diferenciálne rovnice tvaru XXX = AAA1 ·XXX ·AAA2 + BBB či XXX = AAA1 ·XXX + XXX ·AAA2 + BBB a pod., kde AAA1,AAA2,BBB : S → Cn×n sú spojité maticové funkcie na nejakom intervale S ⊆ R, prípadne doplnené počiatočnou podmienkou XXX(t0) = CCC, pre t0 ∈ S, CCC ∈ Cn×n . Čitateľ si iste ľahko sformuluje pojem riešenia takýchto počiatočných úloh. Taktiež veta 22.5.1 zostáva s minimálnymi typografickými úpravami v platnosti aj pre takéto rovnice. (b) Lineárnu (jednorozmernú) diferenciálnu rovnicu n-tého rádu x(n) − a1x(n−1) − . . . − an−1x − anx = b, kde a1, . . . , an, b: S → C sú spojité funkcie, možno substitúciou x = xn previesť na sústavu n lineárnych diferenciálnych rovníc x1 = a1x1 +. . . anxn + b, x2 = x1, . . . , xn = xn−1, t. j. xxx = AAA · xxx + bbb, kde AAA(t) =     a1(t) . . . an−1(t) an(t) 1 . . . 0 0 ... ... ... ... 0 . . . 1 0     , bbb(t) = b(t)eee1 =     b(t) 0 ... 0     . Pri uvedenej substitúcii totiž pre 1 ≤ i ≤ n platí xi = x(n−i) . Všimnite si, že pri pevnom t je AAA(t) = MMMT gt transponovaná matica k pridruženej matici normovaného polynómu gt(x) = xn −a1(t)xn−1 −. . .−an−1(t)x−an(t) (pozri paragraf 21.2). Vetu 22.5.1 možno tiež interpretovať nasledujúcim spôsobom. Podobne ako u sústav lineárnych (algebraických) rovníc, aj tento raz ľahko nahliadneme, že všetky riešenia homogénnej sústavy lineárnych diferenciálnych rov- níc xxx = AAA · xxx 474 22. Maticové funkcie tvoria lineárny podpriestor vektorového priestoru C(1) (S, Cn ) všetkých spojito diferencovateľných funkcií S → Cn . Riešenia pôvodnej nehomogénnej sústavy potom tvoria afinný podpriestor v C(1) (S, Cn ), ktorého zameraním je podpriestor riešení homogénnej sústavy. Veta 22.5.1 okrem iného hovorí, že dimenzia oboch priestorov riešení je n. V prípade homogénnej sústavy je totiž pre pevné t0 ∈ S priradením xxx → xxx(t0) definovaný lineárny izomorfizmus medzi priestorom jej riešení a Cn . Na popis priestoru všetkých riešení homogénnej sústavy teda stačí nájsť nejakú jeho bázu – v tomto prípade sa jej hovorí fundamentálny systém riešení. Takúto bázu tvorí ľubovoľných n lineárne nezávislých riešení xxx1, . . . ,xxxn, t. j. takých, že vektory xxx1(t0), . . . ,xxxn(t0) ∈ Cn sú lineárne nezávislé pre nejaké t0 ∈ S; potom už vektory xxx1(t), . . . ,xxxn(t) sú lineárne nezávislé pre každé t ∈ S (pozri cvičenie 22.17 (c)). Priestor všetkých riešení nehomogénnej sústavy je tak plne určený (ľubovoľným) jej jediným riešením a fundamentálnym systémom riešení homogénnej sústavy. Maticová funkcia FFF : S → Cn×n , ktorej stĺpce tvoria fundamentálny systém riešení sústavy xxx = AAA · xxx, sa nazýva fundamentálna matica tejto sústavy. Z pred chvíľou vykonaných úvah vyplýva, že spojitá maticová funkcia FFF : S → Cn×n je fundamentálnou maticou sústavy xxx = AAA · xxx práve vtedy, keď matica FFF(t) je regulárna pre každé t ∈ S (na čo stačí overiť jej regularitu v jedinom ľubovoľnom bode t0 ∈ S) a vyhovuje maticovej diferenciálnej rovnici XXX = AAA · XXX, t. j. pre každé t ∈ S platí FFF (t) = AAA(t) · FFF(t); z toho už vyplýva aj spojitosť maticovej funkcie FFF : S → Cn×n . Za predpokladu, že poznáme nejakú fundamentálnu maticu sústavy, už nie je ťažké napísať explicitný tvar riešenia príslušnej počiatočnej úlohy. 22.5.2. Veta. Nech FFF je fundamentálna matica sústavy xxx = AAA·xxx. Potom (a) riešenie homogénnej počiatočnej úlohy xxx = AAA · xxx, xxx(t0) = ccc má tvar xxx(t) = FFF(t) · FFF(t0)−1 · ccc ; (b) Riešenie nehomogénnej počiatočnej úlohy xxx (t) = AAA·xxx + bbb, xxx(t0) = ccc má tvar xxx(t) = FFF(t) · FFF(t0)−1 · ccc + t t0 FFF(t) · FFF(s)−1 · bbb(s) ds = FFF(t) · FFF(t0)−1 · ccc + t t0 FFF(s)−1 · bbb(s) ds . Dôkaz. Zrejme obe postulované riešenia sú spojité a vyhovujú počiatočnej podmienke. 22.5. Sústavy lineárnych diferenciálnych rovníc 475 (a) V homogénnom prípade platí xxx (t) = FFF (t) · FFF(t0)−1 · ccc = AAA(t) · FFF(t) · FFF(t0)−1 · ccc = AAA(t) · xxx(t), z čoho vyplýva aj spojitosť derivácie xxx (t). (b) V nehomogénnom prípade stačí overiť, že druhý sčítanec yyy(t) = FFF(t) · t t0 FFF(s)−1 · bbb(s) ds výrazu pre xxx(t) je riešením sústavy. Ako už vieme, prvý sčítanec je totiž riešením homogénnej sústavy. S použitím pravidla pre deriváciu súčinu a Newtonovej-Leibnizovej formuly z tvrdení 22.4.1 resp. 22.4.6 vypočítame yyy (t) = d dt FFF(t) · t t0 FFF(s)−1 · bbb(s) ds = FFF (t) · t t0 FFF(s)−1 · bbb(s) ds + FFF(t) · FFF(t)−1 · bbb(t) = AAA(t) · FFF(t) · t t0 FFF(s)−1 · bbb(s) ds + bbb(t) = AAA(t) · yyy(t) + bbb(t). Vidíme, že i funkcia yyy je spojitá a yyy vyhovuje príslušnej rovnici. Poznámka. Vzorec pre riešenie nehomogénnej sústavy sa odvodzuje tzv. Lagrangeovou metódou variácie konštánt tak, že vo vzorci pre riešenie homogénnej sústavy nahradíme konštatný vektor ccc vektorovou funkciou qqq: S → Cn . Dosadením riešenia xxx(t) = FFF(t) · qqq(t) do nehomogénnej počiatočnej úlohy nakoniec dospejeme k tvaru qqq(t) = FFF(t0)−1 · ccc + t t0 FFF(s)−1 · bbb(s) ds. Vo všeobecnosti nevieme vyjadriť fundamentálnu maticu sústavy xxx = AAA · xxx rozumným spôsobom pomocou maticovej funkcie AAA: S → Cn×n . Za istých dodatočných predpokladov si však dokážeme poradiť. Pre s, t ∈ S označme EEEAAA(t, s) = exp t s AAA(τ) dτ . Ľahko nahliadneme, že EEEAAA(t, t) = III pre každé t ∈ S. Hovoríme, že maticová funkcia AAA: S → Cn×n je komutujúca, ak matice AAA(s), AAA(t) komutujú pre všetky s, t ∈ S. 22.5.3. Veta. Nech AAA: S → Cn×n je spojitá komutujúca maticová funkcia na intervale S ⊆ R. Potom pre ľubovoľné pevné t0 ∈ S je FFF(t) = EEEAAA(t, t0), uvažovaná ako funkcia premennej t ∈ S, fundamentálna matica sústavy xxx = AAA · xxx. 476 22. Maticové funkcie Dôkaz. Určitý integrál t s AAA(τ) dτ splýva s limitou integrálnych súčtov lim k→∞ k j=1 AAA(s + jdk)dk, kde dk = (t−s)/k. Keďže všetky uvažované sčítance komutujú s každou maticou AAA(u), u ∈ S, limitným prechodom dostaneme, že ľubovoľné dve z matíc AAA(t), t s AAA(τ) dτ, u t AAA(τ) dτ tiež komutujú. Preto podľa tvrdenia 22.2.2 platí EEEAAA(u, t) · EEEAAA(t, s) = exp u t AAA(τ) dτ + t s AAA(τ) dτ = EEEAAA(u, s). Z toho už vyplýva, že matica EEEAAA(t, s) je vždy regulárna s inverznou maticou EEEAAA(t, s)−1 = EEEAAA(s, t). Pomocou tvrdení 22.4.3 a 22.4.6 môžeme počítať FFF (t) = d dt exp t t0 AAA(τ) dτ = d dt t t0 AAA(τ) dτ · exp t t0 AAA(τ) dτ = AAA(t) · EEEAAA(t, t0) = AAA(t) · FFF(t). 22.5.4. Dôsledok. Pre spojitú komutujúcu maticovú funkciu AAA: S → Cn×n platí: (a) riešenie homogénnej počiatočnej úlohy xxx = AAA · xxx, xxx(t0) = ccc má tvar xxx(t) = EEEAAA(t, t0) · ccc ; (b) riešenie nehomogénnej počiatočnej úlohy xxx (t) = AAA ·xxx + bbb, xxx(t0) = ccc má tvar xxx(t) = EEEAAA(t, t0) · ccc + t t0 EEEAAA(t, s) · bbb(s) ds. I v takom špeciálnom prípade sme v riešení sústav lineárnych diferenciálnych rovníc stále iba na pol ceste. Niečo iné je totiž napísať pekné všeobecné vzorce pre ich riešenie (dôsledne vzaté, zaviesť preň len isté vhodné označenie) a niečo iné nájsť riešenia konkrétnych sústav. To si vyžaduje vypočítat maticové funkcie EEEAAA(t, t0) a t t0 EEEAAA(t, s)·bbb(s) ds pre rôzne typy komutujúcich maticových funkcií AAA(t) a vektorových funkcií bbb(t). Také niečo však vieme len v určitých prípadoch. Tým najjednoduchším, no veľmi dôležitým, keď AAA je konštantná funkcia, sa budeme podrobnejšie zaoberať v nasledujúcom paragrafe, čím náš výlet do sveta diferenciálnych rovníc zakončíme. 22.6. Autonómne sústavy 477 22.6 Autonómne sústavy Hovoríme, že sústava lineárnych diferenciálnych rovníc xxx = AAA · xxx + bbb je autonómna, prípadne sústava s konštantnými koeficientmi, ak AAA ∈ Cn×n , t. j. AAA je konštantná funkcia, a bbb: S → Cn je spojitá vektorová funkcia na intervale S ⊆ R. Keďže konštantná maticová funkcia AAA je automaticky spojitá a komutujúca, fundamentálna matica homogénnej autonómnej sústavy xxx = AAA · xxx je podľa vety 22.5.3 daná formulou FFF(t) = EEEAAA(t, t0) = exp t t0 AAA dτ = eAAA(t−t0) , pre ľubovoľné pevné t0 ∈ R a premenné t ∈ R. Špeciálne je fundamentálnou maticou takejto sústavy funkcia FFF(t) = eAAAt . K tomuto záveru možno dôjsť aj priamo na základe dôsledku 22.4.4. Z dôsledku 22.5.4 vyplýva 22.6.1. Veta. Nech AAA ∈ Cn×n , bbb: S → Cn je spojitá vektorová funkcia na intervale S ⊆ R, t0 ∈ S a ccc ∈ Cn . Potom (a) riešenie homogénnej počiatočnej úlohy xxx = AAA · xxx, xxx(t0) = ccc má tvar xxx(t) = eAAA(t−t0) ·ccc ; (b) riešenie nehomogénnej počiatočnej úlohy xxx (t) = AAA ·xxx + bbb, xxx(t0) = ccc má tvar xxx(t) = eAAA(t−t0) ·ccc + t t0 eAAA(t−s) ·bbb(s) ds ; (c) ak aj bbb je konštantná funkcia, tak riešením nehomogénnej počiatočnej úlohy je xxx(t) = eAAA(t−t0) ·ccc + t t0 eAAA(t−s) ds · bbb . Na dovŕšenie riešenia autonómnej homogénnej úlohy ako aj popisu jej fundamentálnej matice stačí vedieť vypočítať maticu eAAAt pre ľubovoľné t ∈ R. Ak JJJ = diag JJJn1 (λ1), . . . ,JJJnk (λk) je JKT matice AAA a PPP ∈ Cn×n je regulárna matica, pre ktorú AAA = PPP · JJJ · PPP−1 , tak eAAAt = PPP · diag exp JJJn1 (λ1)t , . . . , exp JJJnk (λk)t · PPP−1 . 478 22. Maticové funkcie Úloha sa teda redukuje na výpočet matíc exp JJJn(λ)t . Pri pevnom t ∈ R uvažujme mocninný rad ft(x) = ∞ k=0 tk k! xk = ext v premennej x. Potom f (p) t (x) = tp ext pre každé p ∈ N. Dosadením do vzorca z vety 22.1.5 tak dostávame nasledujúce zovšeobecnenie tvrdenia 22.2.5: 22.6.2. Veta. Nech n ≥ 1, λ ∈ C. Potom pre ľubovoľné t ∈ R (dokonca t ∈ C) platí exp JJJn(λ)t =      eλt t eλt 1! . . . tn−1 eλt (n−1)! 0 eλt . . . tn−2 eλt (n−2)! ... ... ... ... 0 0 . . . eλt      =      1 t 1! . . . tn−1 (n−1)! 0 1 . . . tn−2 (n−2)! ... ... ... ... 0 0 . . . 1      eλt . V prípade komplexných vlastných čísel reálnej matice možno dvojicu Jordanových buniek JJJn(λ), JJJn(λ) nahradiť zovšeobecnenou Jordanovou bunkou JJJn a −b b a , kde a = Re λ, b = Im λ (pozri paragraf 20.3). Nasledujúca veta, ktorú uvádzame bez dôkazu, umožňuje nahradiť vo fundamentálnej matici komplexné funkcie eλt reálnymi funkciami eat cos bt, eat sin bt. 22.6.3. Veta. Nech n ≥ 1, a, b ∈ R. Potom pre ľubovoľné t ∈ R platí exp a −b b a t = eat cos bt − eat sin bt eat sin bt eat cos bt = eat RRRbt, expJJJn a −b b a t =      eat RRRbt t 1! eat RRRbt . . . tn−1 (n−1)! eat RRRbt 0 eat RRRbt . . . tn−2 (n−2)! eat RRRbt ... ... ... ... 0 0 . . . eat RRRbt      =             eat cos bt − eat sin bt t eat cos bt 1! −t eat sin bt 1! . . . tn−1 eat cos bt (n−1)! −tn−1 eat sin bt (n−1)! eat sin bt eat cos bt t eat sin bt 1! t eat cos bt 1! . . . tn−1 eat sin bt (n−1)! tn−1 eat cos bt (n−1)! 0 0 eat cos bt − eat sin bt . . . tn−2 eat cos bt (n−2)! −tn−2 eat sin bt (n−2)! 0 0 eat sin bt eat cos bt . . . tn−2 eat sin bt (n−2)! tn−2 eat cos bt (n−2)! ... ... ... ... ... ... ... 0 0 0 0 . . . eat cos bt − eat sin bt 0 0 0 0 . . . eat sin bt eat cos bt             22.6. Autonómne sústavy 479 Na riešenie nehomogénnej autonómnej úlohy s konštantným členom bbb treba ešte vedieť vypočítať integrál t t0 eAAA(t−s) ds = t−t0 0 eAAAs ds. Stačí sa teda obmedziť na integrály tvaru t 0 eAAAs ds. A znovu stará známa pesnička: ak AAA = PPP · JJJ · PPP−1 , kde PPP je regulárna matica a JJJ = diag JJJn1 (λ1), . . . ,JJJnk (λ) je JKT matice AAA, tak t 0 eAAAs ds = PPP · diag t 0 exp JJJn1 (λ1)s ds, . . . , t 0 exp JJJnk (λk)s ds · PPP−1 , takže opäť stačí poznať príslušné integrály pre Jordanove bunky. 22.6.4. Veta. Nech n ≥ 1, 0 = λ ∈ C. Potom pre ľubovoľné t ∈ R platí t 0 exp JJJn(λ)s ds =       eλt λ t eλt λ 1! − eλt λ2 . . . n−1 j=0 (−1)jtn−1−j eλt λj+1(n−1−j)! 0 eλt λ . . . n−2 j=0 (−1)jtn−2−j eλt λj+1(n−2−j)! ... ... ... ... 0 0 . . . eλt λ       −      1 λ − 1 λ2 . . . (−1)n−1 λn 0 1 λ . . . (−1)n−2 λn−1 ... ... ... ... 0 0 . . . 1 λ      ; pre λ = 0 máme t 0 exp JJJn(0)s ds =      t t2 2! . . . tn n! 0 t . . . tn−1 (n−1)! ... ... ... ... 0 0 . . . t      . Náčrt dôkazu. Oba vzorce dostaneme priamo z vety 22.6.2 integrovaním jednotlivých členov matice exp JJJn(λ)s . Pre λ = 0, 0 ≤ p ≤ n − 1, pri výpočte integrálu t 0 sp eλs p! ds = p j=0 (−1)j tp−j eλt λj+1(p − j)! − (−1)p λp+1 použijeme p-krát za sebou metódu per partes. Ak AAA je regulárna, môžeme sa uvedeným vzorcom vyhnúť. Ľahko totiž nahliadneme, že d ds eAAAs ·AAA−1 = eAAAs , teda podľa tvrdenia 22.4.6 t 0 eAAAs ds = eAAAt −III · AAA−1 . To znamená, že výpočet hľadaného integrálu možno priamo previesť na výpočet exponenciály eAAAt podľa vety 22.6.2 a úvahy, ktorá ju predchádza. Z časti (c) vety 22.6.1 teraz vyplýva 480 22. Maticové funkcie 22.6.5. Dôsledok. Nech AAA ∈ Cn×n je regulárna matica, bbb,ccc ∈ Cn . Potom riešenie nehomogénnej autonómnej počiatočnej úlohy xxx = AAA·xxx + bbb, xxx(t0) = ccc má tvar xxx(t) = eAAA(t−t0) ·ccc + eAAA(t−t0) −III · AAA−1 · bbb. V poznámke (b) za vetou 22.5.1 sme sa stručne zmienili o možnosti previesť (jednorozmernú) lineárnu diferenciálnu rovnicu n-tého rádu na vektorovú diferenciálnu rovnicu. V špeciálnom prípade homogénnej rovnice s konštantnými koeficientmi ai dostaneme homogénnu autonómnu sústavu xxx = MMMT g · xxx, kde g(x) = xn −a1xn−1 −. . .−an−1x−an. Niekedy môže byť naopak užitočné „znížiť počet rovníc a neznámych funkcií , presnejšie, pre AAA ∈ Cn×n upraviť sústavu xxx = AAA · xxx na jednorozmernú lineárnu diferenciálnu rovnicu n-tého rádu. Rôzne ekvivalentné podoby podmienky, za ktorej je také niečo možné, sú sformulované v tvrdení 21.3.1. My si vyberieme len jednu z nich. 22.6.6. Tvrdenie. Nech AAA ∈ Cn×n . Ak f(x) = xn − n j=1 cjxn−j ∈ C[x] je normovaný polynóm taký, že AAAT ≈ MMMf , tak autonómnu homogénnu sústavu xxx = AAA·xxx možno vhodnou substitúciou upraviť na homogénnu lineárnu diferenciálnu rovnicu n-tého rádu y(n) − c1y(n−1) − . . . − cn−1y − cny = 0. Dôkaz. Za uvedených predpokladov platí AAA ≈ MMMT f , preto existuje regulárna matica PPP ∈ Cn×n taká, že AAA = PPP · MMMT f · PPP−1 . Položme yyy = PPP−1 · xxx. Potom xxx vyhovuje sústave xxx = AAA ·xxx práve vtedy, keď yyy vyhovuje sústave yyy = MMMT f ·yyy, t. j. y1 = c1y1 + . . . + cnyn, y2 = y1, . . . , yn = yn−1. Teda pre y = yn, 1 ≤ j ≤ n, platí yj = y(n−j) a y(n) − n j=1 cjy(n−j) = 0. 22.6.7. Dôsledok. Nech AAA ∈ Cn×n . Ak f1(x), . . . , fk(x) ∈ C[x] sú normované polynómy také, že fi(x) = xni − ni j=1 cijxni−j a AAAT ≈ diag MMMf1 , . . . ,MMMfk , tak autonómnu homogénnu sústavu xxx = AAA · xxx n lineárnych diferenciálnych rovníc pre n neznámych funkcií x1, . . . , xn možno vhodnou substitúciou upraviť na sústavu k homogénnych lineárnych diferenciálnych rovníc y (n1) 1 − c11y (n1−1) 1 − · · · − c1n1−1y1 − c1n1 y1 = 0, ... y (nk) k − ck1y (nk−1) k − · · · − ck nk−1yk − ck nk yk = 0, rádov n1, . . . , nk pre k neznámych funkcií y1, . . . , yk. 22.7. Komutátor 481 Doplnenie konkrétneho tvaru takejto substitúcie už prenechávame na rozmyslenie čitateľovi. Ešte poznamenajme, že pokiaľ chceme dosiahnuť čo najvýraznejšie zníženie počtu rovníc a neznámych funkcií, najvhodnejším kandidátom na polynómy f1(x), . . . , fk(x) je sústava invariantných faktorov matice AAAT (pozri paragraf 21.4, úsek medzi vetami 21.4.4, 21.4.5). Potom matica diag MMMf1 , . . . ,MMMfk je racionálny kanonický tvar matice AAAT . 22.7 Komutátor V predchádzajúcej i celej tejto kapitole sme mohli vidieť, akú významnú úlohu hrá pri štúdiu maticových funkcií vzťah komutovania. V tomto záverečnom paragrafe zavedieme pojem komutátora matíc. Pomocou neho, po sérii aplikácii lineárnej algebry v teórii diferenciálnych rovníc, pre zmenu predvedieme jednu aplikáciu vety 22.5.1 o jednoznačnosti riešenia sústavy lineárnych diferenciálnych rovníc v lineárnej algebre. Komutátorom matíc AAA,BBB ∈ Kn×n (nad ľubovoľným poľom K) nazývame maticu [AAA,BBB] = AAA · BBB − BBB · AAA. Zrejme AAA, BBB komutujú práve vtedy, keď [AAA,BBB] = 0. Priamym výpočtom možno overiť, že komutátor je antisymetrické bilineárne zobrazenie Kn×n ×Kn×n → Kn×n a lineárny operátor adAAA = [AAA, · ]: Kn×n → Kn×n , ktorý dostaneme zafixovaním prvej zložky, sa správa voči súčinu matíc podobne ako derivácia. Analogicky chová aj lineárny operátor − adBBB = [ ·,BBB]: Kn×n → Kn×n . 22.7.1. Tvrdenie. Nech K je pole a n ∈ N. Potom pre ľubovoľné AAA,BBB,CCC ∈ Kn×n , c, d ∈ K platí [AAA,BBB] = −[BBB,AAA], [AAA, cBBB + dCCC] = c[AAA,BBB] + d[AAA,CCC], [AAA,BBB · CCC] = [AAA,BBB] · CCC + BBB · [AAA,CCC]. 22.7.2. Dôsledok. Nech AAA,BBB ∈ Kn×n , f(x) ∈ K[x]. Ak matice AAA, [AAA,BBB] komutujú, tak [f(AAA),BBB] = [AAA,BBB] · f (AAA) = f (AAA) · [AAA,BBB]. V prípade K = C platí uvedený vzťah nielen pre polynómy ale aj pre potenčné rady f(x) ∈ C[[x]] a matice AAA ∈ Domn f, BBB ∈ Cn×n . 482 22. Maticové funkcie Dôkaz. S použitím antisymetrie komutátora a poslednej rovnosti z tvrdenia 22.7.1 možno za uvedeného predpokladu indukciou cez k ∈ N jednoducho dokázať [AAAk ,BBB] = kAAAk−1 · [AAA,BBB]. Potrebný záver pre polynómy vyplýva z linearity zobrazenia adBBB : AAA → [AAA,BBB]; na rady sa prenesie limitným prechodom. Podľa tvrdenia 22.2.2 pre komutujúce matice AAA,BBB ∈ Cn×n platí eAAA+BBB = eAAA · eBBB . Pre nekomutujúce matice to však nie je pravda. I v prípade, že AAA, BBB nekomutujú, za predpokladu, že komutujú aspoň so svojím komutátorom, možno vzorec pre exponenciálu súčtu modifikovať do nasledujúcej podoby. 22.7.3. Veta. Nech matice AAA,BBB ∈ Cn×n komutujú so svojim komutátorom, t. j. [AAA, [AAA,BBB]] = [[AAA,BBB],BBB] = 0. Potom eAAA · eBBB = exp(AAA + BBB) · exp 1 2 [AAA,BBB]. Dôkaz. Uvažujme ešte raz mocninný rad ft(x) = tk k! xk = ext ∈ C[[x]] pri pevnom t ∈ R. Potom ft(x) = t ext . Ak AAA a [AAA,BBB] komutujú, tak podľa dôsledku 22.7.2 platí eAAAt ,BBB = [ft(AAA),BBB] = ft(AAA) · [AAA,BBB] = t eAAAt ·[AAA,BBB], t. j. eAAAt ·BBB = BBB + [AAA,BBB]t · eAAAt . Uvažujme teraz spojité maticové funkcie YYY (t) = eAAAt · eBBBt , ZZZ(t) = exp(AAA + BBB)t · exp 1 2 [AAA,BBB]t2 , pre t ∈ R. Zrejme YYY (0) = ZZZ(0) = IIIn. Pozrime sa bližšie na ich derivácie. S využitím tvrdení 22.4.1, 22.4.3 a komutačného vzťahu pre eAAAt a BBB dostávame YYY (t) = eAAAt · eBBBt + eAAAt · eBBBt = AAA · eAAAt · eBBBt + eAAAt ·BBB · eBBBt = AAA · eAAAt · eBBBt + BBB + [AAA,BBB]t · eAAAt · eBBBt = AAA + BBB + [AAA,BBB]t · YYY (t). Ak si uvedomíme, že za daných predpokladov komutujú AAA+BBB a [AAA,BBB], teda aj (AAA+BBB)t a 1 2 [AAA,BBB]t2 , resp. (AAA+BBB)t+ 1 2 [AAA,BBB]t2 a d dt (AAA+BBB)t+ 1 2 [AAA,BBB]t2 = AAA + BBB + [AAA,BBB]t, s použitím tvrdení 22.2.2, 22.4.3 nám postupne vyjde ZZZ(t) = exp (AAA + BBB)t + 1 2 [AAA,BBB]t2 , ZZZ (t) = AAA + BBB + [AAA,BBB]t · ZZZ(t). Cvičenia 483 Vidíme, že YYY , ZZZ vyhovujú rovnakej počiatočnej úlohe XXX = AAA+BBB+[AAA,BBB]t · XXX, XXX(0) = III. Z jednoznačnosti riešenia takejto úlohy (pozri poznámku (a) za vetou 22.5.1) vyplýva, že YYY (t) = ZZZ(t) pre každé t ∈ R. Voľbou t = 1 dostávame požadovanú rovnosť. Nekonečnorozmerný analóg práve dokázaného vzťahu hrá významnú úlohu v kvantovej mechanike. Ako uvidíme v kapitole 26, pre lineárne operátory X a P, reprezentujúce fyzikálne veličiny polohy a hybnosti, je totiž [X, P] = i · id, teda rýdzo imaginárny násobok identického operátora. Keďže skalárne násobky identity komutujú s každým operátorom, (po vhodnom zakamuflovaní fyzikálnych jednotiek) máme eX · eP = exp(X + P) · exp i 2 id = ei /2 exp(X + P). To znamená, že lineárne operátory eX · eP a exp(X +P) sa líšia len násobkom komplexnej jednotky ei /2 = cos( /2) + i sin( /2), t. j. fázovým posunom o „uhol /2, kde = h/2π ≈ 1, 055 · 10−34 J s je tzv. redukovaná Planckova konštanta. 7 Cvičenia 22.1. Dokážte, že všetky formálne potenčné rady tvoria vektorový priestor K[[x]] nad poľom K, všetky polynómy nad K tvoria lineárny podpriestor K[x] v K[[x]], pričom platí dim K[x] = dim K[[x]] = ∞, ale K[x] = K[[x]]. 22.2. Odvoďte konvolučnú formulu ck = k i=0 aibk−i pre koeficienty súčinu f(x) g(x) = ckxk potenčných radov f(x) = akxk , g(x) = bkxk . Dokážte, že pre polomer r konvergencie radu f(x) g(x) platí r ≥ min{p, q}, kde p, q sú polomery konvergencie radov f(x) resp. g(x). 22.3. Dokážte postupne nasledujúce tvrdenia: (a) Rad ∞ k=0 xk , kde x ∈ C, konverguje práve vtedy, keď |x| < 1, teda diverguje na celej hraničnej kružnici svojho oboru konvergencie. (b) Rad ∞ k=1 xk k konverguje pre každé |x| ≤ 1 okrem x = 1, teda na celej hraničnej kružnici svojho oboru konvergencie s výnimkou jedného bodu (využite fakt, že tzv. harmonický rad ∞ k=1 1 k diverguje). (c) Rad k=1 xk k2 má polomer konvergencie 1 a konverguje pre každé |x| ≤ 1, teda na celej hraničnej kružnici svojho oboru konvergencie. 22.4. Nech AAA ∈ Cn×n . Dokážte nasledujúce tvrdenia: (a) Rad ∞ k=0 AAAk konverguje práve vtedy, keď ρ(AAA) < 1. (b) Z podmienky ρ(AAA) < 1 vyplýva regularita matice III − AAA; za tohto predpokladu 7 Redukovaná Planckova konštanta sa často nazýva len stručne Planckova konštanta, občas tiež Diracova konštanta. 484 22. Maticové funkcie platí (III − AAA) · ∞ k=0 AAAk = III, čiže ∞ k=0 AAAk = (III − AAA)−1 . Riešte obdobnú úlohu pre druhý rad z príkladu 22.1.7. 22.5. Nech AAA ∈ Cn×n . Dokážte nasledujúce tvrdenia: (a) Ak ρ(AAA) < 1, tak rad ∞ k=1 1 kAAAk konverguje a platí exp − 1 kAAAk = III − AAA. (b) Ak Re λ < 0 pre každé λ ∈ SpecAAA, tak ρ III − eAAA < 1 a − 1 k III − eAAA k = AAA. Riešte obdobnú úlohu pre druhý rad z príkladu 22.1.8. 22.6. Dokážte, že pre AAA,BBB ∈ Cn×n platí eAAA+BBB = eAAA · eBBB ⇔ AAA · BBB = BBB · AAA. 22.7. Dokážte tvrdenie 22.2.5 na základe rovnosti JJJn(λ) = JJJn + λIIIn a tvrdenia 22.2.2. 22.8. Vypočítajte hodnoty eAAA , cosAAA, sinAAA, coshAAA = 1 2 eAAA + e−AAA , sinhAAA = 1 2 eAAA − e−AAA , pre matice z príkladov 20.2.1–5, 20.3.1, 20.6.1, 21.5.3 a cvičení 20.4, 20.5 (c). 22.9. Overte tzv. Newtonovu binomickú formulu pre k-tu deriváciu súčinu funkcií p(x)q(x)](k) = k j=0 k j p(j) (x)q(k−j) (x). 22.10. Dokážte, že lema 22.3.1 platí nad ľubovoľným poľom charakteristiky ∞. V čom je problém v prípade polí konečnej charakteristiky? V nasledujúcich dvoch cvičeniach vychádzame z definície rozšírenia skalárnych funkcií na maticové argumenty z paragrafu 22.3. 22.11. (a) Nech f je komplexná funkcia komplexnej premennej a AAA ∈ Domn(f). Ako vyzerá spektrum matice f(AAA)? (b) Ak f je reálna funkcia reálnej premennej a AAA ∈ Rn×n ∩ Domn f má reálne spektrum, tak aj f(AAA) je reálna matica. Dokážte. (c) Nech f je komplexná funkcia komplexnej premennej taká, že f(z) = f(z) pre každé z ∈ Dom f. Dokážte, že pre každú reálnu maticu AAA ∈ Domn f aj f(AAA) je reálna matica. 22.12. (a) Uvažujme reálne funkcie reálnej premennej f(x) = √ x, g(x) = ln x, h(x) = x−1 . Pre každú z funkcií f, g, h určte podmienky, za ktorých je definovaná jej hodnota pre Jordanovu bunku JJJn(λ), kde λ ∈ R. (b) Dokážte, že za príslušných podmienok pre Jordanovu bunku JJJ = JJJn(λ) ľubovoľného rozmeru n platí f(JJJ)2 = JJJ, exp g(JJJ) = JJJ a JJJ · h(JJJ) = III, t. j. h(JJJ) = JJJ−1 je „obyčajná inverzná matica k matici JJJ. (c) Dokážte, že pre ľubovoľnú Jordanovu bunku JJJ = JJJn(λ) platí: ak n = 1 alebo λ = 0, tak JJJ2 ∈ Domn f a f(JJJ2 ) = JJJ; eJJJ ∈ Dom g a g(eJJJ ) = JJJ. (d) Za príslušných podmienok vypočítajte hodnoty f(JJJ), g(JJJ), h(JJJ) pre Jordanove bunky JJJ = JJJn(λ), kde 2 ≤ n ≤ 4. (e) Vypočítajte √ AAA, lnAAA, AAA−1 (ak sú definované) pre každú z matíc z príkladov 20.2.1–5, 20.3.1, 20.6.1, 21.5.3 a cvičení 20.4, 20.5 (c). 22.13. Deriváciu maticovej (vektorovej) funkcie FFF : M → Kn×n (kde K je R alebo C a M ⊆ R je otvorený interval) v bode t0 ∈ M definujeme ako limitu FFF (t0) = limt→t0 FFF (t)−FFF (t0) t−t0 . Odvoďte z toho: ak FFF(t) je z lineárneho podpriestoru S ⊆ Kn×n pre každé t z nejakého okolia bodu t0 a FFF (t0) existuje, tak aj FFF (t0) ∈ S. 22.14. Nech XXX : M → Cn×n je maticová funkcia reálneho argumentu, M ⊆ R je otvorený interval a t0 ∈ M. Ak XXX(t) je regulárna pre t z nejakého okolia bodu t0 a XXX má deriváciu v bode t0, tak dXXX−1 (t0)/ dt = −XXX−1 (t0) · XXX (t0) · XXX−1 (t0). Dokážte. Cvičenia 485 22.15. Sformulujte a dokážte pravidlá o substitúcií a metóde per partes pre integrály maticových funkcií reálnej premennej. 22.16. (a) Pre ľubovoľnú bilineárnu funkciu F : Cm ×Cn → Ck a vektorové funkcie xxx: S → Cm , yyy: S → Cn reálneho argumentu platí d dt F(xxx(t),yyy(t)) = F(xxx (t),yyy(t))+F(xxx(t),yyy (t)). Sformulujte vynechané predpoklady a dokážte. Zovšeobecnite na prípad multilineárnej funkcie F. (b) Nech xxx1, . . . ,xxxn : S → Cn sú diferencovateľné vektorové funkcie. Dokážte, že potom d dt det(xxx1, . . . ,xxxn) = n j=1 det(xxx1, . . . ,xxxj, . . . ,xxxn). 22.17. (a) Nech S ⊆ R je otvorený interval a AAA: S → Cn×n je spojitá maticová funkcia. Uvažujme sústavu lineárnych diferenciálnych rovníc XXX (t) = AAA(t) · XXX(t) pre maticovú funkciu XXX : S → Cn×n . S použitím Liouvilleovej formuly (veta 22.2.6) dokážte, že funkcia f(t) = detXXX(t) vyhovuje lineárnej diferenciálnej rovnici f (t) = f(t) trAAA(t). (b) Na základe (a) dokážte, že z podmienky detXXX(t0) = 0 pre nejaké t0 ∈ S vyplýva detXXX(t) = 0 pre každé t ∈ S. (c) Nech xxx1, . . . ,xxxn : S → Cn sú riešenia homogénnej sústavy lineárnych diferenciálnych rovníc xxx = AAA · xxx také, že vektory xxx1(t0), . . . ,xxxn(t0) sú lineárne nezávislé pre nejaké t0 ∈ S. Dokážte, že potom vektory xxx1(t), . . . ,xxxk(t) sú lineárne nezávislé pre ľubovoľné t ∈ S. (Návod: Položte f(t) = det(xxx1(t), . . . ,xxxn(t)) a využite (b).) 22.18. Nech F : S → Cn je fundamentálna matica sústavy xxx = AAA · xxx. Dokážte, funkcia FFF(t)−1 je spojitá na S. Zdôvodnite tým integrovateľnosť funkcie FFF(s)−1 · bbb(s) z vety 22.5.2 (b). 22.19. Za predpokladu, že všetky matice AAA(t) navzájom komutujú, overte vzorce pre riešenie počiatočných úloh z dôsledku 22.5.4. 22.20. Dokážte postupne nasledujúce tvrdenia: (a) Nech ε > 0 a f : (−ε, ε) → R je ľubovoľná diferencovateľná funkcia taká, že f(0) = 1 a f (0) = a. Označme fk(x) = f(x/k)k pre x ∈ (−kε, kε) a h(x) = lim|x|/ε 0 a FFF : (−ε, ε) → Cn×n je ľubovoľná diferencovateľná maticová funkcia taká, že FFF(0) = III a FFF (0) = AAA. Označme FFFk(x) = FFF(x/k)k pre x ∈ (−kε, kε) a HHH(x) = lim|x|/ε 0 sa presvedčíme, že báza (uuu0,vvv0,www0) je kladne orientovaná (ak by sme dostali det(uuu0,vvv0,www0) < 0, nahradili by sme vektor www0 vektorom −www0). Znormovaním všetkých bázických vektorov na jednotkovú dlžku dostaneme kladne orientovanú ortonormálnu bázu βββ = (uuu,vvv,www) priestoru R3 tvorenú stĺpcami matice PPP =   1/2 −1/ √ 2 1/2 1/2 1/ √ 2 1/2 −1/ √ 2 0 1/ √ 2   . Potom AAA = RRRwww π/2 a PPP−1 · AAA · PPP = diag(RRRπ/2, 1). Inak povedané, lineárna transformácia xxx → AAA · xxx má v báze βββ maticu diag(RRRπ/2, 1) =   0 −1 0 1 0 0 0 0 1   . 23.5.8. Príklad. V euklidovskom priestore R3 nájdeme maticu otočenia RRRuuu α o uhol α = π/6 (v kladnom zmysle) okolo osi [uuu] danej vektorom uuu = (1, 1, 1)T . Zrejme vektor vvv = (1, −1, 0) je kolmý na uuu. Položme www = uuu × vvv = (1, 1, −2)T . Potom uuu = √ 3, vvv = √ 2, www = √ 6, teda stĺpce matice PPP = 1 √ 3 uuu, 1 √ 2 vvv, 1 √ 6 www = 1 √ 6   √ 2 √ 3 1√ 2 − √ 3 1√ 2 0 −2   tvoria ortonormálnu kladne orientovanú bázu v R3 , vzhľadom na ktorú má naše otočenie maticu RRReee1 α = diag(1,RRRπ/6) =   1 0 0 0 √ 3/2 −1/2 0 1/2 √ 3/2   . 23.6. Eulerove uhly 503 Matica tohto otočenia v kanonickej báze εεε je preto daná súčinom RRRuuu α = PPP · RRReee1 α · PPPT = 1 3   1 + √ 3 1 − √ 3 1 1 1 + √ 3 1 − √ 3 1 − √ 3 1 1 + √ 3   . 23.6 Eulerove uhly Videli sme, že každé otočenie RRRwww α v R3 možno rozložiť na kompozíciu piatich otočení okolo troch, prípadne iba dvoch súradných osí. Trochu náročnejšou geometrickou úvahou možno dokázať, že každé takéto otočenie možno rozložiť na kompozíciu dokonca len troch otočení okolo troch, prípadne iba dvoch súradných osí o tzv. Eulerove uhly. U objektov, ktoré majú svoje prirodzené súradné osi (napr. u lietadla je to pozdĺžna os, os krídel a os prechádzajúca ich priesečníkom kolmo na ich rovinu) zasa možno pomocou nich zadávať ich priestorovú orientáciu, t. j. natočenie osí objektu voči vopred zvoleným „nehybným súradným osiam. Tieto parametre sa (v rôznych modifikáciách) vyskytujú v mnohých aplikáciách, napr. v klasickej mechanike pri popise pohybu tuhých telies i v kvantovej mechanike pri popise uhlových momentov. Hojne sa využívajú napr. v aeronautike (kde sa im hovorí tiež TaitoveBryanove uhly) pri riadení smeru letu a priestorovej orientácie lietadiel, kozmických lodí a satelitov. Nevýhodou popisu rotácií v R3 pomocou Eulerových uhlov je to, že pri ňom priamo nevidíme os a nepoznáme uhol výsledného otočenia. Táto nevýhoda, ako aj trochu vyššie nároky na priestorovú predstavivosť sú však bohato vyvážené jednoduchosťou reprezentácie pomocou malého počtu rotácií okolo súradných osí. Predvedieme, ako možno ľubovoľnú ortonormálnu bázu v trojrozmernom euklidovskom priestore pomocou troch vhodne zvolených otočení o Eulerove uhly ϕ, χ, ψ previesť na ľubovoľnú s ňou súhlasne orientovanú ortonormálnu bázu. Vzápätí metódou pohyblivej bázy (pozri paragraf 7.6) ukážeme, ako možno tieto otočenia nahradiť otočeniami o rovnaké uhly len v zmenenom poradí okolo súradných osí daných vektormi pôvodnej bázy. Pri tom sa môžeme bez ujmy na všeobecnosti obmedziť na euklidovský priestor R3 (so štandardným skalárnym súčinom) a za východziu bázu si zvoliť kanonickú bázu εεε = (eee1,eee2,eee3). Tým zároveň dokážeme, že každé otočenie v R3 okolo nejakej osi prechádzajúcej počiatkom možno vyjadriť ako kompozíciu troch otočení okolo (niektorých dvoch zo) súradných osí x, y, z. Situácia je znázornená na štyroch obrázkoch: kým prvé tri znázorňujú jednotlivé dielčie otočenia, na štvrtom sú zhrnuté všetky tri fázy do jediného celku. Nech βββ = (vvv1,vvv2,vvv3) je ľubovoľná kladne orientovaná ortonormálna báza v R3 . Predpokladajme najprv, že roviny [eee1,eee2] a [vvv1,vvv2] sú rôznobežné, 504 23. Združené lineárne operátory v unitárnych a euklidovských priestoroch Obr. 23.1. Eulerove uhly (zxz-konvencia) teda sa pretínajú v priamke, ktorú si označíme L. Nech (uuu1,uuu2) je kladne orientovaná ortonormálna báza roviny [eee1,eee2] taká, že uuu1 je smerový vektor priamky L. Potom (uuu1,uuu2,eee3) je kladne orientovaná ortonormálna báza priestoru R3 a tiež uuu1 ⊥ vvv3. Označme Ω1 otočenie okolo osi z = [eee3] dané priradením eee1 → uuu1, eee2 → uuu2 a ϕ ∈ −π, π uhol tohto otočenia (obrázok vľavo hore). Nech ďalej Ω2 je otočenie okolo osi L = [uuu1], t. j. novej osi x, ktorým vektor eee3 prejde do vektora vvv3 a vektor uuu2 do vektora uuu2; označme χ ∈ −π/2, π/2 uhol tohto otočenia (obrázok vpravo hore). Konečne Ω3 je otočenie okolo osi [vvv3], t. j. novej osi z, ktorým uuu1 prejde do vvv1 a uuu2 do vvv2, a ψ ∈ −π, π je uhol tohto otočenia (obrázok vľavo dole). Schématicky teda môžeme písať εεε = (eee1,eee2,eee3) Ω1 −→ ααα = (uuu1,uuu2,eee3) Ω2 −→ ααα = (uuu1,uuu2,vvv3) Ω3 −→ βββ = (vvv1,vvv2,vvv3). 23.6. Eulerove uhly 505 Potom Ω1 = RRReee1 ϕ , Ω2 = RRRuuu1 χ a Ω3 = RRRvvv3 ψ , teda Ω = Ω3 ◦ Ω2 ◦ Ω1 = RRRvvv3 ψ ◦ RRRuuu1 χ ◦ RRReee3 ϕ . Pritom uvedené vyjadrenie je jednoznačné, až na krajné hodnoty ϕ = ±π, χ = ±π/2 a ψ = ±π (samozrejme, miesto intervalov −π, π resp. −π/2, π/2 možno uvažovať intervaly 0, 2π resp. 0, π a pod.). V prípade, že roviny [eee1,eee2] a [vvv1,vvv2] (teda aj vektory eee3 a vvv3) splývajú, je Ω otočením okolo osi z o nejaký uhol γ. Uvedená rovnosť tak zostáva v platnosti s hodnotou χ = 0; k spomínaným nejednoznačnostiam sa však pridružuje nová, podstatnejšia: ϕ a ψ sú teraz ľubovoľné hodnoty, pre ktoré platí ϕ + ψ = γ. Vo všeobecnosti nevystupujú v uvedenom vyjadrení otočenia okolo pôvodných súradných osí x, y, z. Ortonormálne bázy ααα, ααα a βββ, ktoré dostaneme postupnými rotáciami pôvodnej bázy εεε prostredníctvom otočení Ω1, Ω2 a Ω3, však možno chápať ako jedinú kanonickú bázu spojenú s pohybujúcim sa objektom (napr. satelitom alebo lietadlom). Vyjadrenie pomocou otočení okolo pôvodných súradných osí možno dostať na základe zrejmých rovností (Ω1)εεε = RRReee3 ϕ , (Ω2)ααα = RRReee1 χ , (Ω3)ααα = RRReee3 ψ , z vety 7.6.1 (pri obvyklom stotožnení lineárnej transformácie na R3 s jej maticou v kanonickej báze εεε): Ω = (Ω)εεε = (Ω3 ◦ Ω2 ◦ Ω1)εεε = (Ω1)εεε · (Ω2)ααα · (Ω3)ααα = RRReee3 ϕ · RRReee1 χ · RRReee3 ψ = RRReee3 ϕ ◦ RRReee1 χ ◦ RRReee3 ψ . Vynásobením príslušných matíc dostávame pre maticu výsledného otočenia explicitné vyjadrenie pomocou Eulerových uhlov (Ω)εεε =   cos ϕ − sin ϕ 0 sin ϕ cos ϕ 0 0 0 1   ·   1 0 0 0 cos χ − sin χ 0 sin χ cos χ   ·   cos ψ − sin ψ 0 sin ψ cos ψ 0 0 0 1   =   cos ϕ cos ψ − sin ϕ cos χ sin ψ − cos ϕ sin ψ − sin ϕ cos χ cos ψ sin ϕ sin χ sin ϕ cos ψ + cos ϕ cos χ sin ψ − sin ϕ sin ψ + cos ϕ cos χ cos ψ − cos ϕ sin χ sin χ sin ψ sin χ cos ψ cos χ   . Vyjadrenie pomocou otočení okolo osi z, potom x a zase z, t. j. tzv. zxzkonvencia, nie je jediné možné. Popri nej sa vyskytujú aj ďalšie konvencie využívajúce dve súradné osi, napr. zyz, xyx, xzx a pod. (dohromady je 6 možností). Taktiež sa používajú konvencie využívajúce všetky tri súradné osi, napr. xyz, xzy, zyx a pod. (spolu ďalších 6 možností). Preto je pri reprezentácií transformácie pomocou Eulerových uhlov vždy potrebné špecifikovať príslušnú konvenciu, ako aj fakt, či sa osi dielčích otočení vzťahujú na nehybný alebo pohyblivý súradnicový systém. 506 23. Združené lineárne operátory v unitárnych a euklidovských priestoroch 23.7 Normálne operátory Čitateľovi asi neuniklo, že viaceré výsledky o hermitovských resp. unitárnych operátoroch, ktoré sme uviedli v paragrafoch 23.2–4, boli do značnej miery analogické, ba aj ich dôkazy využívali podobné myšlienky a postupy. Natíska sa preto otázka, či sa za touto podobnosťou neskrýva nejaký všeobecnejší pojem, ktorý by zahŕňal oba typy operátorov a umožnil jednotným spôsobom dokázať spomínané výsledky. Takýmto jednotiacim pojmom je pojem normálneho operátora. Hovoríme, že lineárny operátor ϕ na unitárnom priestore V je normálny, ak komutuje so svojím združeným operátorom, t. j. ak platí ϕ ◦ ϕ∗ = ϕ∗ ◦ ϕ. Zrejme ϕ je normálny práve vtedy, keď je normálny jeho združený operátor ϕ∗ . Hermitovské aj unitárne operátory sú z triválnych dôvodov normálne. Ďalším príkladom normálnych operátorov sú antihermitovské lineárne operátory, definované podmienkou ϕ∗ = −ϕ, ako aj ľubovoľné skalárne násobky unitárnych operátorov. 23.7.1. Tvrdenie. Nech ϕ: V → V je normálny lineárny operátor. Potom združené operátory ϕ, ϕ∗ majú spoločný vlastný vektor. Presnejšie, ak vvv je vlastný vektor operátora ϕ prislúchajúci k jeho vlastnej hodnote λ, tak vvv je zároveň vlastný vektor operátora ϕ∗ prislúchajúci k jeho vlastnej hodnote λ. Dôkaz. Keďže pole C je algebraicky uzavreté, ϕ má aspoň jednu vlastnú hodnotu a k nej prislúchajúci vlastný vektor. Stačí preto dokázať druhú časť tvrdenia. Nech λ je vlastná hodnota operátora ϕ a vvv je k nej prislúchajúci vlastný vektor, t. j. (ϕ − λ)(vvv) = 0. Podľa tvrdenia 23.1.2 platí (ϕ − λ)∗ = ϕ∗ − λ, v dôsledku čoho aj združené operátory ϕ − λ, (ϕ − λ)∗ komutujú. Preto tiež (ϕ − λ)∗ (vvv), (ϕ − λ)∗ (vvv) = (ϕ − λ) ◦ (ϕ − λ)∗ (vvv),vvv = (ϕ − λ)∗ ◦ (ϕ − λ) (vvv),vvv = (ϕ − λ)(vvv), (ϕ − λ)(vvv) = 0, teda ϕ∗ (vvv) − λvvv = (ϕ − λ)∗ (vvv) = 0. To znamená, že vvv je zároveň vlastným vektorom operátora ϕ∗ prislúchajúcim k jeho vlastnej hodnote λ. 23.7. Normálne operátory 507 Vzájomne združené normálne operátory možno súčasne diagonalizovať vzhľadom na tú istú ortonormálnu bázu. 23.7.2. Veta. Nech ϕ je normálny operátor na n-rozmernom unitárnom priestore V . Potom existuje ortonormálna báza βββ priestoru V vzhľadom na ktorú majú združené operátory ϕ a ϕ∗ diagonálne matice tvaru (ϕ)βββ = diag(λ1, . . . , λn) resp. (ϕ∗ )βββ = diag(λ1, . . . , λn). Dôkaz. Budeme postupovať indukciou podľa n. Prípad n = 0 je triviálny, pre n = 1 vyplýva potrebný záver z predchádzajúceho tvrdenia. Nech teda n > 1 a predpokladajme, že tvrdenie platí v unitárnych priestoroch dimenzie < n. Podľa tvrdenia 23.7.1 majú normálne operátory ϕ, ϕ∗ spoločný vlastný vektor vvv, ktorému zodpovedajú vlastné hodnoty λ, λ operátorov ϕ, resp. ϕ∗ . Kedže [vvv] je invariantný podpriestor operátora ϕ, jeho ortokomplement S = [vvv]⊥ je podľa tvrdenia 23.1.5 invariantný podpriestor operátora ϕ∗ . Podobne z ϕ∗ invariantnosti [vvv] vyplýva ϕ-invariantnosť S. Potom zúženia ϕ S, ϕ∗ S sú navzájom združené normálne operátory na (n − 1)-rozmernom unitárnom priestore S. Podľa indukčného predpokladu v S možno nájsť ortonormálnu bázu βββ0 = (vvv1, . . . ,vvvn−1), vzhľadom na ktorú majú tieto operátory diagonálne matice (ϕ S)βββ0 = (λ1, . . . , λn−1) resp. (ϕ∗ S)βββ0 = (λ1, . . . , λn−1). Potom βββ = (vvv1, . . . ,vvvn−1,vvv) je ortonormálna báza priestoru V taká, že (ϕ)βββ = diag(λ1, . . . , λn−1, λ) resp. (ϕ∗ )βββ = diag(λ1, . . . , λn−1, λ). 23.7.3. Dôsledok. Nech ϕ je normálny operátor na n-rozmernom unitárnom priestore V . Potom existujú polynómy f(x), g(x) ∈ C[x] stupňa nanajvýš n také, že ϕ∗ = f(ϕ) a ϕ = g(ϕ∗ ). Dôkaz. V označení predchádzajúcej vety za f(x) resp. g(x) stačí vziať Lagrangeov interpolačný polynóm taký, že f(λ1) = λ1, . . . , f(λn) = λn, resp. g(λ1) = λ1, . . . , g(λn) = λn – pozri cvičenie 10.16, prípadne lemu 22.3.1. Taktiež naopak, diagonalizovateľnosť vzhľadom na ortonormálnu bázu už má za následok normálnosť lineárneho operátora. Normálne operátory tak možno charakterizovať viacerými ekvivalentnými spôsobmi. Predošlime, že implikácia (i) ⇒ (v) je vlastne vetou o spektrálnom rozklade normálneho ope- rátora. 23.7.4. Veta. Pre ľubovoľný lineárny operátor ϕ: V → V nasledujúce podmienky sú ekvivalentné: (i) ϕ je normálny, t. j. ϕ ◦ ϕ∗ = ϕ∗ ◦ ϕ; (ii) pre hermitovské operátory ϕ0 = Re ϕ = 1 2 (ϕ + ϕ∗ ), ϕ1 = Im ϕ = 1 2i (ϕ − ϕ∗ ) platí ϕ0 ◦ ϕ1 = ϕ1 ◦ ϕ0; (iii) pre každý invariantný podpriestor S ⊆ V operátora ϕ aj jeho ortokomplement S⊥ je invariantný; 508 23. Združené lineárne operátory v unitárnych a euklidovských priestoroch (iv) existuje ortonormálna báza priestoru V , vzhľadom na ktorú má ϕ diagonálnu maticu s diagonálou tvorenou vlastnými číslami operátora ϕ; (v) ϕ možno vyjadriť v tvare lineárnej kombinácie ϕ = λ1 prS1 + . . . + λk prSk ortogonálnych projekcií prS1 , . . . , prSk na navzájom ortogonálne vlastné podpriestory prislúchajúce k jeho po dvoch rôznym vlastným číslam λ1, . . . , λk ∈ C, pričom V = S1 ⊕ . . . ⊕ Sk. Dôkaz. (i) ⇔ (ii): Operátory ϕ0, ϕ1 sú hermitovské podľa tvrdenia 23.2.6. Na základe rovností ϕ = ϕ0+iϕ1, ϕ∗ = ϕ0−iϕ1 a ϕ0 = 1 2 (ϕ+ϕ∗ ), ϕ1 = 1 2i (ϕ−ϕ∗ ) možno ľahko nahliadnuť (prípadne sa presvedčiť priamym výpočtom), že ϕ, ϕ∗ komutujú práve vtedy, keď komutujú ϕ0, ϕ1. (i) ⇒ (iii): Nech ϕ je normálny a S ⊆ V je ϕ-invariantný lineárny podpriestor. Potom podľa tvrdenia 23.1.5 jeho ortokomplement S⊥ je ϕ∗ -invariantný podpriestor. Nech g(x) ∈ C[x] je polynóm taký, že ϕ = g(ϕ∗ ), zaručený dôsledkom 23.7.3. Potom S⊥ je zrejme invariatný podpriestor operátora g(ϕ∗ ) = ϕ. (iii) ⇒ (iv) možno dokázať rovnako ako vetu 23.7.2, lebo podstatným momentom jej dôkazu bolo práve ustanovenie podmienky (iii), a (iv) ⇔ (v) je zrejmé, keďže podmienka (v) je len inou formuláciou podmienky (iv). (iv) ⇒ (i): V ortonormálnej báze zaručenej podmienkou (iv), v ktorej má ϕ maticu diag(λ1, . . . , λn), má združený operátor ϕ∗ maticu diag(λ1, . . . , λn). Keďže tieto matice komutujú, aj ϕ, ϕ∗ komutujú. Zaznamenáme dva dôsledky práve dokázanej vety. Prvým z nich je istá extremálna vlastnosť vlastných čísel normálneho operátora. 23.7.5. Dôsledok. Nech ϕ: V → V je normálny operátor. Označme µ = min{|λ|; λ ∈ Spec ϕ}, M = max{|λ|; λ ∈ Spec ϕ}. Potom pre každé xxx ∈ V platí µ xxx ≤ ϕxxx ≤ M ϕxxx . Poznamenajme, že M je spektrálny polomer lineárneho operátora ϕ (porovnaj so spektrálnym polomerom štvorcových matíc nad C v paragrafe 22.1). Dôkaz. Nech βββ = (vvv1, . . . ,vvvn) je ortonormálna báza priestoru V , vzhľadom na ktorú má ϕ diagonálnu maticu diag(λ1, . . . , λn), t. j. ϕ(vvvj) = λjvvvj pre j ≤ n. Zvoľme xxx = a1vvv1 + . . . + anvvvn ∈ V . Potom ϕ(xxx) = a1λ1vvv1 + . . . + anλnvvvn, xxx 2 = a2 1 + . . . + a2 n a ϕxxx 2 = a2 1λ2 1 + . . . + a2 nλ2 n. Keďže µ ≤ |λj| ≤ M pre každé j, µ xxx ≤ ϕxxx ≤ M xxx . 23.7. Normálne operátory 509 Zrejme dolný (horný) odhad sa dosahuje práve vtedy, keď xxx je prvkom vlastného podpriestoru Ker(ϕ − λ) pre nejaké vlastné číslo λ operátora ϕ také, že |λ| = µ (|λ| = M). Podľa vety 23.7.4 možno hermitovské resp. unitárne operátory vyčleniť z normálnych operátorov dodatočnou podmienkou pre prvky ich spektier. 23.7.6. Dôsledok. Nech ϕ je normálny operátor. Potom (a) ϕ je hermitovský práve vtedy, keď má reálne spektrum; (b) ϕ je unitárny práve vtedy, keď |λ| = 1 pre všetky λ ∈ Spec ϕ. Pojem normálnej matice možno definovať analogicky: AAA ∈ Cn×n je normálna matica, ak AAA · AAA∗ = AAA∗ · AAA. Teda AAA ∈ Rn×n je normálna práve vtedy, keď AAA·AAAT = AAAT ·AAA. Taktiež by malo byť zrejmé, že lineárny operátor na konečnorozmernom unitárnom priestore je normálny práve vtedy, keď jeho matica vzhľadom na nejakú (každú) ortonormálnu bázu je normálna. Čitateľ si istotne aj sám bez ťažkostí preloží výsledky tohto paragrafu z jazyka operátorov do jazyka matíc. Len ako ukážku zaznamenáme nasledujúcu analógiu viet 23.3.2 a 23.4.6 a pridáme jednu ekvivalentnú podmienku navyše, ktorá znie prirodzenejšie v maticovej formulácii. 23.7.7. Veta. Pre ľubovoľnú maticu AAA ∈ Cn×n nasledujúce podmienky sú ekvivalentné: (i) A je normálna; (ii) existuje unitárna matica PPP taká, že matica PPP−1 · AAA · PPP = PPP∗ · AAA · PPP je diagonálna, s diagonálou tvorenou vlastnými číslami matice AAA; (iii) ak λ1, . . . , λn sú všetky vlastné čísla matice AAA vrátane násobnosti, tak n i,j=1 |aij|2 = n i=1 |λi|2 . Dôkaz. Ekvivalencia (i) ⇔ (ii) je len prekladom ekvivalencie (i) ⇔ (iv) z vety 23.7.4. (ii) ⇒ (iii): Zrejme i,j |aij|2 je stopa matice AAA · AAA∗ a i |λi|2 je stopa matice diag |λ1|2 , . . . , |λn|2 . Ak AAA = PPP · diag(λ1, . . . , λn) · PPP∗ pre nejakú unitárnu maticu PPP, tak AAA · AAA∗ = PPP · diag(λ1, . . . , λn) · PPP∗ · PPP · diag(λ1, . . . , λn) · PPP∗ = PPP · diag |λ1|2 , . . . , |λn|2 · PPP−1 . Podľa dôsledku 18.1.4 podobné matice AAA · AAA∗ a diag |λ1|2 , . . . , |λn|2 majú rovnaké stopy. 510 23. Združené lineárne operátory v unitárnych a euklidovských priestoroch (iii) ⇒ (ii): Podľa Schurovej vety o triangularizácii (veta 19.2.1, druhá časť), existuje unitárna matica PPP taká, že matica CCC = PPP−1 · AAA · PPP je horná trojuholníková. Keďže podobné matice AAA, CCC majú rovnaké spektrum, diagonála matice CCC je nevyhnutne tvorená prvkami λ1, . . . , λn (možno v inom poradí) spektra matice AAA. Potom aj matice AAA ·AAA∗ a CCC ·CCC∗ = PPP−1 ·AAA ·AAA∗ ·PPP sú podobné, preto majú rovnaké stopy. Zrejme tr(CCC · CCC∗ ) = i |λi|2 + i 1 a uvedená implikácia platí pre všetky k < n. Sú dve možnosti: 1. Každý operátor ϕ ∈ F má jednoprvkové spektrum. Podľa vety 23.7.2, resp. vety 23.7.4 z toho vyplýva, že ϕ má diagonálnu maticu λIIIn, kde λ je jeho jediné vlastné číslo, vzhľadom na nejakú ortonormálnu bázu priestoru V . Potom nevyhnutne ϕ = λ idV a ϕ má maticu λIIIn vzhľadom na akúkoľvek bázu priestoru V . 2. Existuje nejaký operátor ϕ ∈ F s aspoň dvojprvkovým spektrom. Nech λ je jedno z jeho vlastných čísel. Potom pre vlastný podpriestor S = Ker(ϕ − λ) platí {0} = S = V , a takisto {0} = S⊥ = V , teda dim S < n aj dim S⊥ < n. Ukážeme, že S je invariantný podpriestor každého operátora ψ ∈ F. Zvoľme xxx ∈ S, t. j. ϕ(xxx) = λxxx. Potom tiež ϕ(ψxxx) = ψ(ϕxxx) = ψ(λxxx) = λψ(xxx), teda ψ(xxx) ∈ S. Podľa vety 23.7.4 z toho vyplýva, že aj S⊥ je invariantný podpriestor každého operátora ψ ∈ F. Prechodom k zúženiam tak dostávame dva systémy komutujúcich normálnych operátorov F0 = {ψ S; ψ ∈ F} a F1 = {ψ S⊥ ; ψ ∈ F} na podpriestoroch S resp. S⊥ . Podľa indukčného predpokladu existujú ortonormálne bázy βββ0 podpriestoru S a βββ1 podpriestoru S⊥ také, že matice (ψ S)βββ0 , (ψ S⊥ )βββ1 sú diagonálne pre všetky ψ ∈ F. Spojením oboch báz dostávame hľadanú ortonormálnu bázu βββ priestoru V . Cvičenia 23.1. Dokážte nasledujúce tvrdenia: (a) Každý lineárny operátor na n-rozmernom vektorovom priestore nad poľom C má (n − 1)-rozmerný invariantný podpriestor. (b) Každý lineárny operátor na n-rozmernom vektorovom priestore nad poľom R má (n − 1)- alebo (n − 2)-rozmerný invariantný podpriestor; ak n je nepárne, tak má (n − 1)-rozmerný invariantný podpriestor (Návod: Uvedomte si, že na takom vektorovom priestore možno zaviesť skalárny súčin a využite dôsledok 19.5.3 a tvrdenia 23.1.4 a 23.1.5.) 512 23. Združené lineárne operátory v unitárnych a euklidovských priestoroch 23.2. Nech ϕ, ψ sú lineárne operátory na reálnom vektorovom priestore V so skalárnym súčinom. Potom ϕ, ψ sú združené operátory práve vtedy, keď ich komplexifikácie ϕC , ψC sú združené operátory na unitárnom priestore V C so skalárnym súčinom definovaným ako v cvičení 19.11. Dokážte. Odvoďte z toho, že ϕC je hermitovský (unitárny, normálny) práve vtedy, keď ϕ je symetrický (ortogonálny, normálny). 23.3. Nech ϕ, ψ sú hermitovské operátory na unitárnom priestore V . (a) Na príklade ukážte, že už v prípade dvojrozmerného priestoru V operátor ϕ ◦ ψ nemusí byť hermitovský. (b) Dokážte ϕ ◦ ψ + ψ ◦ ϕ je hermitovský operátor. (c) Na príklade ukážte, že už v prípade dvojrozmerného priestoru V komutátor [ϕ, ψ] = ϕ ◦ ψ − ψ ◦ ϕ nemusí byť hermitovský. (d) Dokážte, že operátor i [ϕ, ψ] je hermitovský. 23.4. Pripomeňme, že lineárny operátor na vektorovom priestore V sa nazýva projekcia, ak p ◦ p = p (pozri cvičenia 14.8, 14.9). Dokážte nasledujúce tvrdenia: (a) Ak p: V → V je projekcia, tak Spec p ⊆ {0, 1}. (b) Nech V je unitárny priestor a p: V → V je projekcia. Potom p je samoadjungovaný operátor práve vtedy, keď p je ortogonálna projekcia, (t. j. p(yyy) ⊥ xxx − p(xxx) pre všetky xxx,yyy ∈ V ). 23.5. Uvažujme euklidovský priestor R3 so štandardným skalárnym súčinom. Dokážte, že pre ľubovoľný vektor uuu = (a, b, c)T ∈ R3 taký, že (a, b) = 0, vektory uuu, vvv = (−b, a, 0)T , www = uuu × vvv tvoria kladne orientovanú ortogonálnu bázu v R3 . Nájdite explicitný tvar vektora www. Ako možno čo najjednoduchšie doplniť do kladne orientovanej ortogonálnej bázy nenulový vektor uuu = (0, 0, c)T ? 23.6. Na základe cvičenia 23.5 napíšte maticu RRRuuu α otočenia okolo osi so smerovým vektorom uuu o uhol α (v kladnom zmysle z hľadiska vektora uuu). 23.7. (a) Nájdite matice otočení RRRuuu α pre niekoľko vybraných dvojíc vektorov uuu a uhlov α, kde uuu ∈ 1 1 0 , 1 2 0 , 1√ 2 0 , 1√ 3 0 , 3 4 0 , 1 1 1 , 1 1 2 , 1 2 2 , 1√ 2√ 2 , 1√ 2√ 3 , 3 4 5 , α ∈ {±π/6, ±π/4, ±π/3, ±π/2, ±2π/3, π}. (b) Nájdite matice uvedených otočení (priberte k nim aj otočenie o nulový uhol) zložených so zrkadlovou symetriou podľa roviny prechádzajúcej počiatkom a kolmej na os otočenia. (c) Pre zopár dvojíc otočení z (a) okolo rôznych osí nájdite os a uhol otočenia, ktoré vznikne ich kompozíciou. 23.8. Zistite, aké transformácie trojrozmerného euklidovského priestoru R3 (otočenia resp. otočenia zložené so zrkadlovými súmernosťami) sú dané násobením nasledujúcimi ortogonálnymi maticami; zistite uhly a osi týchto otočení (vrátane orientácie): (a) 1 4 −2 √ 3 √ 2 − √ 2 − √ 2 2+ √ 3 2− √ 3√ 2 2− √ 3 2+ √ 3 , (b) 1 4 3 1 − √ 6 1 3 − √ 6√ 6 − √ 6 2 , (c) 1 6 2 √ 3 2 √ 3 −2 √ 3√ 6 √ 6 2 √ 6 3 √ 2 −3 √ 2 0 , (d) 1 4 2+ √ 2 2− √ 2 −2 2− √ 2 2+ √ 2 2 −2 2 −2 √ 2 , (e) 1 2 −1 − √ 2 1 −1 √ 2 1√ 2 0 √ 2 , (f) 1 5 √ 2 3 4 5 −4 √ 2 3 √ 2 0 3 4 −5 . 23.9. S použitím vety 23.4.9, tvrdenia 23.2.4 a Liouvilleovej formuly 22.2.6 dokážte, že pre Cvičenia 513 unitárnu maticu UUU je | detUUU| = 1. 23.10. (Doplnok k vete 23.4.3.) (a) Nech V je unitárny priestor f : V → V je ľubovoľné (teda nie nutne lineárne) zobrazenie. Ak pre všetky xxx,yyy ∈ V platí f(xxx) − f(yyy) = xxx −yyy , t. j. f zachováva vzdialenosť, tak f je nevyhnutne injektívne. Dokážte. (b) Označme 2(C) vektorový priestor všetkých postupností xxx = (xk)k∈N komplexných čísel takých, že rad ∞ k=0 |xk|2 konverguje. Dokážte, že 2(C) so skalárnym súčinom xxx,yyy = ∞ k=0 xkyk tvorí unitárny priestor (ide o komplexifikáciu vektorového priestoru 2 = 2(R) z cvičenia 14.4). (c) Nájdite príklad lineárneho operátora ϕ: 2(C) → 2(C), ktorý spĺňa podmienku ϕxxx, ϕyyy = xxx,yyy pre všetky xxx,yyy ∈ 2, no nie je surjektívny (teda ani unitárny). 23.11. Lineárny operátor na konečnorozmernom unitárnom priestore je anthihermitovský práve vtedy, keď má v nejakej ortonormálnej báze priestoru V diagonálnu maticu a všetky nenulové prvky diagonály sú rýdzo imaginárne čísla. Dokážte. 23.12. (a) Nájdite príklad normálnej matice AAA ∈ R2×2 , ktorá nie je symetrická ani antisymetrická ani ortogonálna. (b) Dokážte, že matica AAA ∈ R2×2 je normálna práve vtedy, keď je symetrická alebo skalárny násobok ortogonálnej. Ako je to v komplexnom prípade? (c) Nájdite príklad normálnej matice AAA ∈ R3×3 , ktorá nie je symetrická ani antisymetrická ani skalárny násobok ortogonálnej. (d) Nájdite príklad normálnej matice AAA ∈ C2×2 , ktorá nie je (komplexným) skalárnym násobkom hermitovskej ani unitárnej matice. 23.13. Sformulujte a dokážte maticovú analógiu vety 23.7.10. 23.14. Odvoďte výsledky o hermitovských a unitárnych operátoroch ako špeciálne prípady príslušných výsledkov o normálnych operátoroch. 24. Kvadriky Kvadriky sú viacrozmernými zovšeobecneniami kužeľosečiek (t. j. kvadratických kriviek) a kvadratických plôch v euklidovských priestoroch ľubovoľnej dimenzie. Táto kapitola by teda tematicky skôr patrila do Časti II tejto knihy venovanej bilineárnym a kvadratickým formám a ich súvisu s geometriou. Ich zaradenie do tejto časti nám však umožní ich geometrickú klasifikáciu s využitím spektrálnej teórie symetrických lineárnych operátorov resp. symetrických matíc. Hlavným nástrojom tejto analýzy bude reformulácia viet 23.3.1 a 23.3.2 do reči hermitovských poldruhalineárných resp. symetrických bilineárnych foriem, známa ako veta o hlavných osiach. Všeobecné výsledky potom spätne aplikujeme na situáciu prístupnú nášmu geometrickému názoru, čiže na kužeľosečky v rovine a kvadratické plochy v trojrozmernom priestore. 24.1 Veta o hlavných osiach Podľa vety 23.3.2 je každá hermitovská matica AAA ∈ Cn×n podobná s diagonálnou maticou DDD = diag(λ1, . . . , λn) prostredníctvom nejakej unitárnej matice PPP ∈ Cn×n . Samozrejme λ1, . . . , λn ∈ R sú potom všetky vlastné čísla matice AAA, vrátane násobnosti, a stĺpce matice PPP sú k nim prislúchajúce navzájom ortogonálne vlastné vektory jednotkovej dĺžky. Z rovností PPP−1 · AAA · PPP = DDD a PPP−1 = PPP∗ však vyplýva PPP∗ · AAA · PPP = DDD, teda AAA je zároveň hermitovsky kongruentná s DDD prostredníctvom unitárnej matice PPP. Každá symetrická matica AAA ∈ Rn×n je zasa podobná aj kongruentná s diagonálnou maticou prostredníctvom ortogonálnej matice PPP ∈ Rn×n . Tento výsledok možno sformulovať v jazyku kososymetrických poldruhalineárnych resp. symetrických bilineárnych foriem ako vetu o hlavných osiach. 24.1.1. Veta. (a) Každá kososymetrická poldruhalineárna forma F : V × V → C na konečnorozmernom unitárnom priestore V má vo vhodnej ortonormálnej báze tohto priestoru reálnu diagonálnu maticu. (b) Každá symetrická bilineárna forma F : V × V → R na euklidovskom priestore V má vo vhodnej ortonormálnej báze tohto priestoru diagonálnu maticu. Pre reálny prípad uvádzame aj formuláciu v jazyku kvadratických foriem. 24.1.2. Dôsledok. Každá kvadratická forma q: V → R na euklidovskom priestore V má vo vhodnej ortonormálnej báze tohto priestoru diagonálnu maticu. 24.2. Kvadriky v euklidovských priestoroch 515 Upozorňujeme, že v oboch častiach vety aj v jej dôsledku je dôraz na slove ortonormálna – existenciu vôbec nejakej bázy, vzhľadom na ktorú je matica príslušnej formy diagonálna, sme totiž odôvodnili už v paragrafoch 17.2 resp. 11.3. Hlavnými osami príslušnej formy rozumieme navzájom kolmé priamky, t. j. jednorozmerné lineárne podpriestory, generované vektormi spomínanej ortonormálnej bázy. 24.2 Kvadriky v euklidovských priestoroch V tomto paragrafe preskúmame geometrický význam dôsledku 24.1.2 v kontexte euklidovských priestorov. Kvadrikou v euklidovskom priestore V rozumieme množinu bodov tvaru Q = {xxx ∈ V ; q(xxx) + ϕ(xxx) + c = 0}, kde q: V → R je nenulová kvadratická forma, ϕ: V → R je ľubovoľný lineárny funkcionál (lineárna forma) a c ∈ R je ľubovoľný skalár. Formulu q(xxx) + ϕ(xxx) + c = 0 nazývame rovnicou kvadriky Q. Kvadriky v dvojrozmernom euklidovskom priestore, t. j. v rovine, sa nazývajú kužeľosečky. Názov sa odvodzuje z pozorovania, že (s výnimkou prázdnej množiny a dvojice rovnobežných priamok) ich možno získať ako rezy rotačnej kužeľovej plochy vhodnými rovinami. Kvadriky v trojrozmernom euklidovskom priestore sa nazývajú tiež kvadratické plochy. Ide napospol o krivky a plochy dobre známe z elementárnej geometrie a hojne využívané v technickej praxi. Vo všeobecnosti sú kvadriky v n-rozmernom euklidovskom priestore (s výnimkou niektorých singulárnych prípadov) (n − 1)-rozmernými nadplo- chami. Veta o hlavných osiach umožňuje tzv. metrickú klasifikáciu kvadrík. Z jej hľadiska považujeme dve kvadriky za rovnaké, ak možno jednu na druhú zobraziť zhodným zobrazením (izometrickou transformáciou) euklidovského priestoru. Pri takejto klasifikácii určujeme nielen typ kvadriky (elipsa, hyperbola, parabola a pod.), ale tiež jej metrické invarianty, napr. dĺžky jej polosí, a kanonický tvar jej rovnice. Sú možné aj iné klasifikácie, založené na porovnávaní kvadrík pomocou iných typov zobrazení. Napr. pri afinnej klasifikácii by sme považovali dve kvadriky za rovnaké, ak by sme vedeli zobraziť jednu na druhú bijektívnou afinnou transformáciou príslušného priestoru. Pri takejto klasifikácii by sme napr. v euklidovskej rovine rozlišovali elipsy, hyperboly a paraboly, ale už by sme nedokázali rozlíšiť elipsu od kružnice ani dve elipsy či dve hyperboly s polosami rôznych dĺžok. 516 24. Kvadriky Hodnosťou resp. signatúrou kvadriky Q budeme rozumieť hodnosť resp. signatúru jej kvadratickej formy q; t. j. h(Q) = h(q) a σ(Q) = σ(q). 1 Podľa dôsledku 24.1.2 existuje ortonormálna báza βββ = (vvv1, . . . ,vvvn) priestoru V , vzhľadom na ktorú má kvadratická forma q diagonálnu maticu DDD = diag(λ1, . . . , λn). Diagonálne prvky λi matice DDD nájdeme ako vlastné čísla (symetrickej) matice formy q vzhľadom na akúkoľvek ortonormálnu bázu priestoru V (v typickom prípade euklidovského priestoru V = Rn so štandardným skalárnym súčínom to býva kanonická ortonormálna báza εεε = (eee1, . . . ,eeen)). Báza βββ je potom tvorená navzájom ortogonálnymi vlastnými vektormi vvvi, prislúchajúcimi k vlastným číslam λi, znormovanými na jednotkovú dĺžku. Ak si označíme (xxx)βββ = (x1, . . . , xn)T súradnice vektora xxx v báze βββ a položíme bi = ϕ(vvvi), môžeme rovnicu kvadriky Q vyjadriť v tvare n i=1 λix2 i + n i=1 bixi + c = 0. Ak si ďalej označíme h = h(Q) hodnosť a σ(Q) = (k, h − k, n − h) signatúru kvadriky Q, možno navyše bez ujmy na všeobecnosti predpokladať, že λi > 0 pre i ≤ k, λi < 0 pre k < i ≤ h a λi = 0 pre i > h. Lineárnych členov bixi pre i ≤ h sa možno zbaviť doplnením na úplný štvorec a rovnicu kvadriky následne zapísať v tvare h i=1 λi x + bi 2λi 2 + n i=h+1 bixi = d, kde d = 1 4 h i=1 b2 i λi − c. V tejto chvíli rozlíšime dve možnosti: (1) h = n alebo bi = 0 pre všetky h < i ≤ n, inak povedané, nezostali nám nijaké lineárne členy. Kvadriky, ktorých rovnicu možno upraviť na tvar bez lineárnych členov, nazývame stredové. (2) h < n a bi = 0 pre aspoň jedno h < i ≤ n. Kvadriky, z ktorých rovnice nemožno eliminovať lineárne členy, nazývame nestredové. (1) Pre stredovú kvadriku zavedieme nové súradnice substitúciou yi = xi + bi 2λi , ak 1 ≤ i ≤ h, xi, ak h < i ≤ n, 1 V tomto prípade, ako i miestami ďalej ide o nie celkom štandardnú terminológiu, ktorá sa však dobre hodí na účely nášho zámerne tak trochu kuchynského výkladu. 24.2. Kvadriky v euklidovských priestoroch 517 čo zodpovedá posunutiu počiatku súradníc o vektor, ktorého súradnice v báze βββ sú (b1/2λ1, . . . , bh/2λh, 0, . . . , 0)T . Touto izometrickou transformáciou rovnica kvadriky nadobudne tvar h i=1 λiy2 i = d. Vidíme, že stredová kvadrika je skutočne symetrická podľa stredu, ktorý sme práve zvolili za nový počiatok súradnej sústavy (jej rovnica je invariantná voči substitúcii yi → −yi). U stredových kvadrík je účelné ďalej rozlíšiť dva prípady: (1a) d = 0, kedy ide o tzv. homogénne stredové kvadriky. Ich rovnicu možno upraviť na tvar k i=1 y2 i a2 i = h i=k+1 y2 i a2 i , kde ai = 1/ |λi|. (1b) d = 0, čo sú tzv. nehomogénne stredové kvadriky. Ich rovnica prejde po prenásobení faktorom 1/d a substitúcii ai = |d/λi| na tvar k i=1 y2 i a2 i − h i=k+1 y2 i a2 i = 1, ak d > 0, prípadne na tvar − k i=1 y2 i a2 i + h i=k+1 y2 i a2 i = 1, ak d < 0. Zrejme stačí uvažovať prvú možnosť, lebo druhú možno na ňu previesť nahradením pôvodnej rovnice kvadriky Q ekvivalentnou rovnicou −q(xxx) − ϕ(xxx) − c = 0. Stredové kvadriky typu (1a), t. j. homogénne, a typu (1b), t. j. nehomogénne, pre ktoré navyše platí h < n, sa nazývajú singulárne. Regulárne stredové kvadriky sú potom nehomogénne, spĺňajúce podmienku h = n. (2) V prípade nestredovej kvadriky sa na vektor bbb = (bh+1, . . . , bn) pozrieme ako na prvok riadkového euklidovského priestoru Rn−h so štandardným skalárnym súčinom a položíme p = 1 2 bbb = 1 2 b2 h+1 + . . . + b2 n 518 24. Kvadriky (dôvody pre faktor 1/2 sú viac-menej „tradično-kozmetické a majú pôvod v syntetickej geometrii – pozri cvičenie 24.5). Teraz si stačí uvedomiť, že jednotkový vektor −(1/2p)bbb možno doplniť do nejakej ortonormálnej bázy priestoru Rn−h , ktorú možno zapísať ako ortogonálnu maticu BBB = (bij), s riadkami tvorenými vektormi príslušnej bázy. (Ako hneď uvidíme, na konkrétnom tvare ďalších riadkov matice BBB nezáleží, teda ich vôbec nemusíme hľadať.) Nové súradnice zavedieme substitúciou yi =    xi + bi 2λi , ak i ≤ h, 1 2p d − n j=h+1 bjxj , ak i = h + 1, n j=h+1 bijxj, ak h + 1 < i ≤ n. Vektor (y1, . . . , yh, yh+1, . . . , yn)T dostaneme z vektora (x1, . . . , xh, xh+1, . . . , xn)T vynásobením ortogonálnou maticou diag(IIIh,BBB) zľava a následným pričítaním vektora b1 2λ1 , . . . , bh 2λh , d 2p , 0, . . . , 0 T . Teda substitúcia xi → yi predstavuje izometrickú afinnú transformáciu priestoru Rn (násobenie ortogonálnou maticou zložené s posunutím). Rovnica kvadriky v nových súradniciach prejde na tvar h i=1 λiy2 i = 2pyh+1, v ktorom nevystupujú premenné yi pre i > h + 1, teda nie sú v nich skryte prítomné ani prvky riadkov matice BBB okrem prvého. Konečne, ak položíme ai = 1/ |λi|, môžeme zapísať rovnicu kvadriky v tvare k i=1 y2 i a2 i − h i=k+1 y2 i a2 i = 2pyh+1. Nestredová kvadrika sa nazýva regulárna, ak h = n − 1; v opačnom prípade, t. j. ak h < n − 1, sa nazýva singulárna. Skôr než zhrnieme naše úvahy do záverečnej podoby, pripomeňme, že repérom vo vektorovom priestore V nazývame usporiadanú dvojicu ρρρ = (rrr,βββ), kde rrr ∈ V je ľubovoľný bod (vektor) a βββ je ľubovoľná báza vo V . Afinné alebo tiež barycentrické súradnice bodu xxx ∈ V vzhľadom na repér ρρρ sú definované ako súradnice vektora xxx − rrr vzhľadom na bázu βββ, čiže (xxx)ρρρ = (xxx − rrr)βββ (pozri cvičenia 8.7–10). Repér ρρρ = (rrr,βββ) euklidovského priestoru V sa nazýva ortogonálny resp. ortonormálny, ak báza βββ má príslušnú vlastnosť. 24.2. Kvadriky v euklidovských priestoroch 519 24.2.1. Veta. Nech Q je ľubovoľná kvadrika s hodnosťou h(Q) = h > 0 a signatúrou σ(Q) = (k, h−k, n−h) v n-rozmernom euklidovskom priestore V . Potom vo V existuje ortonormálny repér ρρρ a kladné čísla a1, . . . , ah, prípadne tiež p, také, že Q má v afinných súradniciach (xxx)ρρρ = (x1, . . . , xn)T vzhľadom na ρρρ rovnicu v jednom z nasledujúcich kanonických tvarov k i=1 x2 i a2 i = h i=k+1 x2 i a2 i , ak Q je stredová homogénna, k i=1 x2 i a2 i − h i=k+1 x2 i a2 i = 1, ak Q je stredová nehomogéna, resp. k i=1 x2 i a2 i − h i=k+1 x2 i a2 i = 2pxh+1, ak Q je nestredová. V prípade stredových homogénnych ako aj nestredových kvadrík možno navyše bez ujmy na všeobecnosti predpokladať, že k ≥ h−k, t. j. 2k ≥ h. Ešte poznamenajme, že hlavnými osami kvadriky Q nazývame navzájom kolmé priamky rrr + [vvvi], t. j. jednorozmerné afinné podpriestory prechádzajúce novým počiatkom súradnej sústavy rrr so zameraniami generovanými ortonormálnymi bázovými vektormi vvvi. Bod rrr nazývame v prípade stredových kvadrík stredom kvadriky; ľahko nahliadneme, že každá stredová kvadrika je naozaj symetrická podľa svojho stredu. V prípade nestredových kvadrík nazývame bod rrr vrcholom kvadriky; zrejme platí rrr ∈ Q. Čísla ai nazývame dĺžkami polosí kvadriky Q; číslo p nazývame parametrom nestredovej kvadriky Q. Tieto veličiny sú však určené jednoznačne iba pre nehomogénne stredové kvadriky. V prípade homogénnej stredovej kvadriky, ako aj v prípade nestredovej kvadriky sú určené len s presnosťou na ľubovoľnú kladnú multiplikatívnu konštantu. Zmysel tohto faktu, ako i niektoré ďalšie súvislosti by sa vyjasnili až v kontexte projektívnej geometrie, čo je však téma, ktorej sa v tomto kurze nebudeme venovať. Uvedenú nejednoznačnosť možno odstrániť napr. dodatočnou požiadavkou a1 = 1, alebo ah = 1, prípadne pre nestredové kvadriky p = 1 2 . Tieto možnosti občas využijeme pri nasledujúcej podrobnej klasifikácií kvadrík v rovine a v (trojrozmernom) priestore. Do euklidovských priestorov vyšších dimenzií už nezablúdime, lebo v dôsledku absencie priamej skúsenosti nám v nich zlyháva geometrická predstavivosť a chýbajú názvy pre rôzne typy kvadrík, s ktorými sa tam možno stretnúť. 520 24. Kvadriky 24.3 Kužeľosečky Pripomeňme, že kužeľosečkami nazývame kvadriky v dvojrozmernom euklidovskom priestore čiže v rovine. Na základe vety 24.2.1 ich možno klasifikovať podľa kanonického tvaru ich rovníc. (1a) Stredové homogénne (t. j. singulárne) kužeľosečky: signatúra rovnica kužeľosečka (1, 0, 1) x2 = 0 priamka x = 0, (2, 0, 0) x2 a2 + y2 b2 = 0 bod x = y = 0, (1, 1, 0) x2 a2 = y2 b2 dve rôznobežné priamky y = ±(b/a)x. (1b) Stredové nehomogénne kužeľosečky: signatúra rovnica kužeľosečka (1, 0, 1) x2 a2 = 1 dve rovnobežné priamky x = ±a, (0, 1, 1) − x2 a2 = 1 prázdna možina, (2, 0, 0) x2 a2 + y2 b2 = 1 elipsa, (1, 1, 0) x2 a2 − y2 b2 = 1 hyperbola, (0, 2, 0) − x2 a2 − y2 b2 = 1 prázdna množina. Poznamenajme, že z uvedených kužeľosečiek považujeme za singulárny len prvý a druhý prípad. Teda za regulárne kužeľosečky považujeme popri elipse a hyperbole aj prázdnu množinu riešení poslednej rovnice. Toto rozlišovanie medzi dvoma prázdnymi množinami zodpovedajúcimi signatúram (0, 1, 1) a (0, 2, 0) najskôr čitateľovi pripadá umelé. Rozdiel medzi oboma typmi kužeľosečiek by sa prejavil, až keby sme vzali do úvahy imaginárne riešenia oboch rovníc. Z dĺžok a, b polosí elipsy za hlavnú považujeme väčšiu a vedľajšiu menšiu; ak a = b, ide samozrejme o kružnicu s polomerom a a rovnicou x2 + y2 = a2 . Pri hyperbole s rovnicou v uvedenom tvare je a vždy dĺžkou hlavnej a b vedľajšej polosi; ak a = b, hovoríme o rovnoosej hyperbole. Priamky y = ±(b/a)x sú asymptoty hyperboly. 24.3. Kužeľosečky 521 (2) Nestredové kužeľosečky: signatúra rovnica kužeľosečka (1, 0, 1) x2 = 2py parabola. Na rozdiel od stredových kužeľosečiek, ktoré sú súmerné podľa oboch hlavných osí aj podľa stredu, parabola má len jednu os súmernosti – v uvedenom prípade je to os y. Na obrázkoch sú znázornené len elipsa, hyperbola a parabola. Čitateľ by si však mal pri každom z uvedených typov samostatne rozmyslieť, ako treba viesť rez rotačnej kužeľovej plochy s rovnicou x2 + y2 = z2 v trojrozmernom priestore rovinou tak, aby sme dostali tú ktorú kužeľosečku. Obr. 24.1: Elipsa s ohniskami F1, F2, hlavnou polosou a, vedľajšou polosou b a excentricitou e (pozri cvičenie 24.3) 24.3.1. Príklad. Napíšeme rovnicu elipsy so stredom sss = (−1, 2)T , hlavnou polosou a = √ 5 v smere vektora (3, −1)T a vedľajšou polosou b = 1/2 v smere vektora (1, 3)T . Znormovaním uvedených vektorov dostaneme ortonormálnu bázu (tvorenú stĺpcami matice) γγγ = 1 √ 10 3 1 −1 3 V súradniciach (u, v)T vzhľadom na repér (sss,γγγ) má elipsa rovnicu v kanonickom tvare u2 5 + 4v2 = 1. Vzťah medzi súradnicami (u, v)T a súradnicami (x, y)T vzhľadom na kanonický repér (0,εεε) je daný rovnosťou u v = PPPγγγ,εεε · x y − sss = γγγT · x + 1 y − 2 = 1 √ 10 3x − y + 5 x + 3y − 5 522 24. Kvadriky Obr. 24.2: Hyperbola s ohniskami F1, F2, hlavnou polosou a, vedľajšou polosou b a excentricitou e (pozri cvičenie 24.4) (pozri cvičenie 8.10). Dosadením za u a v do pôvodnej rovnice dostávame (3x − y + 5)2 50 + 2(x + 3y − 5)2 5 = 1, čo po prenásobení faktorom 50 a ďalších úpravách dáva výslednú rovnicu 29x2 + 181y2 + 114xy − 170x − 610y + 475 = 0, z ktorej by sme na prvý pohľad asi sotva uhádli, akú kužeľosečku popisuje. 24.3.2. Príklad. V euklidovskom priestore R2 je pre ľubovoľnú hodnotu parametra t ∈ R daná kužeľosečka Qt s rovnicou tx2 + ty2 + 2xy + √ 2 x − √ 2 y = 0. Zistíme o akú kužeľosečku ide v závislosti na t. Matica príslušnej kvadratickej formy AAA = t 1 1 t má vlastné hodnoty t+1 a t−1, ktorým zodpovedajú vlastné vektory (1, 1)T resp. (−1, 1)T . Príslušná orotonormálna báza je (tvorená stĺpcami matice) βββ = 1 √ 2 1 −1 1 1 . 24.3. Kužeľosečky 523 Obr. 24.3: Parabola s ohniskom F, riadiacou priamkou L a parametrom p pozri cvičenie 24.5) V súradniciach (u, v)T = βββT · (x, y)T vzhľadom na túto bázu má rovnica kužeľosečky tvar (t + 1)u2 + (t − 1)v2 + √ 2, − √ 2 · βββ · (u, v)T = 0, t. j. (t + 1)u2 + (t − 1)v2 − 2v = 0. Odteraz budeme všetky údaje popisovať v súradniciach (u, v)T vzhľadom na bázu βββ. Ak teda budeme hovoriť napr. o bode (3, −1)T , budeme mať na mysli bod, ktorého súradnice vzhľadom na pôvodnú bázu εεε sú βββ · (3, −1)T = 2 √ 2, √ 2 T . Rozlíšime tri základné prípady: (a) t = −1. Rovnica −2v2 −2v = 0 po úprave dáva v(v+1) = 0, takže Q−1 je zjednotením dvojice rovnobežných priamok s rovnicami v = 0 a v = −1. (b) t = 1. Rovnica 2u2 − 2v = 0 po úprave dáva u2 = v, čo je rovnica paraboly s vrcholom v počiatku 0 a osou súmernosti v. (c) t = ±1. Rovnicu kužeľosečky Qt možno doplnením na štvorec upraviť na tvar (t + 1)u2 + (t − 1) v − 1 t − 1 2 − 1 t − 1 = 0, čiže t2 − 1 u2 + (t − 1)2 v − 1 t − 1 2 = 1. (∗) Z toho je zrejmé, že Qt je stredová kužeľosečka so stredom v bode 0, 1 t−1 T a jedným z vrcholov v počiatku. Jej hlavné osi ležia na priamkach s rovnicami v = 1 t−1 (čo je rovnobežka s osou u) resp. u = 0 (čo je priamo os v). Pri ďalšej analýze opäť rozlíšime dva prípady: 524 24. Kvadriky Obr. 24.4. Príklad parametrického systému kužeľosečiek. 24.4. Kvadratické plochy 525 (c1) |t| < 1. (∗) je potom rovnicou hyperboly s hlavnou polosou dĺžky 1 1−t na priamke u = 0 a vedľajšou polosou dĺžky 1√ 1−t2 na priamke v = 1 t−1 . (c2) |t| > 1. (∗) je potom rovnicou elipsy s polosami dĺžok 1√ t2−1 , 1 |t−1| , ktoré ležia na priamkach v = 1 t−1 resp. u = 0. Ak t < −1, tak prvá z nich je hlavná a druhá vedľajšia; pre t > 1 je tomu naopak. Ak parameter t interpretujeme ako čas, tak vývoj krivky Qt pripúšťa s trochou nadsádzky fabuláciu bezmála kozmologickú: Pred úsvitom času (t. j. pre t = −∞) je „všetko sústredené v jedinom bode v počiatku súradného systému 0uv. Ten bod sa náhle začne rozpínať do elipsy, ktorej stred sa pohybuje po osi v nadol smerom k bodu −1 2 , jej vedľajšia polos sa rozťahuje po osi v až k medznej dĺžke 1 2 , zatiaľ čo dĺžka jej hlavnej polosi rastie v smere rovnobežnom s osou u nad všetky medze. V okamihu t = −1 sa elipsa roztrhne na dve rovnobežné priamky v = 0 a v = −1. Tie sa vzápätí začnú prehýbať ako dve vetvy hyperboly – horná má vrchol v počiatku, kým vrchol dolnej sa po osi v vzdaľuje stále ďalej nadol, obe vetvy sa stále väčšmi prehýbajú a v čase t = 0 tvoria rovnoosú hyperbolu s rovnicou (v + 1)2 − u2 = 1. Ohýbanie a vzďaľovanie dolnej vetvy stále pokračuje, až sa v okamihu t = 1 dolná vetva úplne stratí za obzorom a horná sa zmení na parabolu s rovnicou u2 = v. Parabola sa vzápätí uzavrie do elipsy s jedným vrcholom v počiatku – jej hlavná polos v smere osi v ako aj vedľajšia polos v smere rovnobežnom s osou u sa postupne skracujú, až kým na súmraku času (t. j. pre t = +∞) celá krivka neskolabuje do jediného bodu v počiatku, z ktorého kedysi povstala. 24.4 Kvadratické plochy Opäť pripomíname, že kvadriky v trojrozmernom euklidovskom priestore nazývame aj kvadratickými plochami. Klasifikácia podľa kanonického tvaru ich rovníc na základe vety 24.2.1 je už pomerne rozsiahla. (1a) Stredové homogénne (t. j. singulárne) kvadratické plochy: signatúra rovnica kvadrika (1, 0, 2) x2 = 0 rovina x = 0, (2, 0, 1) x2 a2 + y2 b2 = 0 priamka x = y = 0, (1, 1, 1) x2 a2 = y2 b2 dve rôznobežné roviny y = ±(b/a)x, (3, 0, 0) x2 a2 + y2 b2 + z2 c2 = 0 bod x = y = z = 0, (2, 1, 0) x2 a2 + y2 b2 = z2 eliptická kužeľová plocha. 526 24. Kvadriky V poslednom prípade sú rezy eliptickej kužeľovej plochy vodorovnými rovinami z = c elipsy s polosami dĺžok a|c|, b|c| (pre c = 0 ide pochopiteľne o bod x = y = 0). Ak a = b, hovoríme o rotačnej kužeľovej ploche. (1b) Stredové nehomogénne kvadratické plochy: signatúra rovnica kvadrika (1, 0, 2) x2 a2 = 1 dve rovnobežné roviny x = ±a, (0, 1, 2) − x2 a2 = 1 prázdna množina, (2, 0, 1) x2 a2 + y2 b2 = 1 eliptická valcová plocha, (1, 1, 1) x2 a2 − y2 b2 = 1 hyperbolická valcová plocha, (0, 2, 1) − x2 a2 − y2 b2 = 1 prázdna množina, (3, 0, 0) x2 a2 + y2 b2 + z2 c2 = 1 trojosý elipsoid, (2, 1, 0) x2 a2 + y2 b2 − z2 c2 = 1 jednodielny eliptický hyperboloid, (1, 2, 0) x2 a2 − y2 b2 − z2 c2 = 1 dvojdielny eliptický hyperboloid, (0, 3, 0) − x2 a2 − y2 b2 − z2 c2 = 1 prázdna množina. Prvých päť z uvedených kvadratických plôch je singulárnych, ďalšie štyri sú regulárne. Opäť sa tak stretáme s javom tento raz dokonca „trojakej prázdnej množiny , s možnosťou rozlíšenia až v komplexnom rozšírení. Všetky rezy uvedenej eliptickej valcovej plochy vodorovnými rovinami z = c sú elipsy s polosami dĺžok a, b. Ak a = b, ide o rotačnú valcovú plochu. Podobne, rezy hyperbolickej valcovej plochy takýmito rovinami sú hyperboly s hlavnou polosou dĺžky a a vedľajšou polosou dĺžky b. Ak a = b, sú to rovnoosé hyperboly. Trojosý elipsoid je niečo ako „guľová plocha s rôznymi polomermi v smeroch osí x, y, z. Tieto „rôzne polomery sú samozrejme dĺžky polosí a, b, c nášho elipsoidu. O naozajstnú guľovú (sférickú) plochu ide, len ak a = b = c. Ak sa dve z dĺžok polosí rovnajú a dĺžka zvyšnej polosi je väčšia, hovoríme o vajcovitom alebo pretiahnutom rotačnom elipsoide; ak je dĺžka zvyšnej polosi menšia, ide o sploštený rotačný elipsoid. Podobná situácia je pri hyperboloidoch. V uvedenom prípade sú rezy jednodielneho eliptického hyperboloidu vodorovnými rovinami z = d elipsy 24.4. Kvadratické plochy 527 Obr. 24.5. Trojosý elipsoid Obr. 24.6. Jednodielny eliptický hyperboloid s polosami dĺžok a 1 + (d/c)2, b 1 + (d/c)2; ak a = b, sú tieto rezy kružnice a hovoríme o rotačnom jednodielnom hyperboloide. Rezy jednodielneho hyperboloidu zvislými rovinami y = 0, resp. x = 0 sú hyperboly s hlavnou polosou dĺžky a resp. b a vedľajšou polosou dĺžky c. „Vnútornou asymptotickou plochou jednodielneho eliptického hyperboloidu je v danom prípade eliptická kužeľová plocha s rovnicou x2 /a2 +y2 /b2 = z2 /c2 (pozri tiež posledný obrázok k paragrafu 16.2). Rezy uvedeného dvojdielneho eliptického hyperboloidu zvislými rovinami 528 24. Kvadriky x = d, kde |d| > a, sú elipsy s polosami dĺžok b d2/a2 − 1, c d2/a2 − 1 (ak |d| = a, je tento rez jediný bod, ak |d| < a, je rezom prázdna množina – preto sa plocha rozpadá na dve časti). Ak b = c, ide o rotačný dvojdielny hyperboloid. Rezy vodorovnou rovinou z = 0, resp. zvislou rovinou y = 0 sú hyperboly s hlavnou polosou dĺžky a a vedľajšou polosou dĺžky b resp. c. „Vonkajšou asymptotickou plochou dvojdielneho eliptického hyperboloidu je tentokrát eliptická kužeľová plocha s rovnicou x2 /a2 = y2 /b2 + z2 /c2 (pozri tiež posledný obrázok k paragrafu 16.2). Obr. 24.7. Dvojdielny eliptický hyperboloid (2) Nestredové kvadratické plochy: signatúra rovnica kvadrika (1, 0, 2) x2 = 2py parabolická valcová plocha, (2, 0, 1) x2 a2 + y2 b2 = z eliptický paraboloid, (1, 1, 1) x2 a2 − y2 b2 = z hyperbolický paraboloid. Prvá z uvedných plôch je singulárna, ďalšie dve sú regulárne. Rezy parabolickej valcovej plochy vodorovnými rovinami z = c sú paraboly zhodné s parabolou x2 = 2py v rovine z = 0. Rezy eliptického paraboloidu vodorovnými rovinami z = c, kde c > 0, sú elipsy s polosami dĺžok a √ c, b √ c (pre c = 0 je to bod, pre c < 0 prázdna množina). Ak a = b, ide o rotačný paraboloid. Rezy zvislými rovinami x = 0, resp. y = 0 sú paraboly s rovnicami y2 = b2 z, resp. x2 = a2 z. 24.4. Kvadratické plochy 529 Obr. 24.8. Eliptický paraboloid Obr. 24.9. Hyperbolický paraboloid Rezy hyperbolického paraboloidu vodorovnými rovinami z = c sú pre c > 0 hyperboly s hlavnou polosou dĺžky a √ c v smere osi x a vedľajšou polosou dĺžky b √ c v smere osi y; pre c < 0 sú to hyperboly s hlavnou polosou dĺžky b √ −c v smere osi y a vedľajšou polosou dĺžky a √ −c v smere osi x. Ak a = b, tak všetky tieto rezy sú rovnoosé hyperboly. Pre c = 0 je rezom dvojica priamok y = ±(b/a)x. Rezy zvislými rovinami x = 0, resp. y = 0 sú paraboly s rovnicami y2 = −b2 z, resp. x2 = a2 z. Hyperbolický paraboloid, ako graf funkcie z = x2 /a2 − y2 /b2 , má sedlo v bode (0, 0). 24.4.1. Príklad. V euklidovskom priestore R3 so štandardným skalárnym 530 24. Kvadriky súčinom je rovnicou x2 + 2z2 + 8 √ 6 xy − 2 √ 2 xz + 8 √ 3 yz = 12 daná kvadrika Q. Treba zistiť, o akú kvadriku ide, a určiť jej polohu, smery hlavných osí a metrické invarianty. Príslušná kvadratická forma má maticu AAA =   1 4 √ 6 − √ 2 4 √ 6 0 4 √ 3 − √ 2 4 √ 3 2   s vlastnými číslami 3, 12 a −12, ktorým zodpovedajú vlastné vektory 1, 0, − √ 2 T , √ 2, √ 3, 1 T a ( √ 2, − √ 3, 1 T . Hlavnými osami kvadriky Q sú tak priamky generované týmito vektormi. Po ich znormovaní dostávame ortonormálnu bázu βββ =    1√ 3 1√ 3 1√ 3 0 1√ 2 − 1√ 2 − 2 3 1√ 6 1√ 6    priestoru R3 , tvorenú vlastnými vektormi matice AAA (ktorú, ako obvykle, stotožníme s uvedenou maticou). Potom v súradniciach (u, v, w)T = βββT · (x, y, z)T vzhľadom na bázu βββ má rovnica kvadriky Q tvar 3u2 +12v2 −12w2 = 12. Z toho po úprave dostávame u2 4 + v2 − w2 = 1, čo je rovnica jednodielného eliptického hyperboloidu so stredom v počiatku 0. Rezom tejto kvadriky rovinou w = 0 je elipsa s hlavnou polosou a = 2 v smere osi u a vedľajšou polosou b = 1 v smere osi v. Jej rezom rovinou v = 0 je hyperbola s hlavnou polosou a = 2 v smere osi u a vedľajšou polosou c = 1 v smere osi w. Konečne jej rezom rovinou u = 0 je rovnoosá hyperbola s polosami b = c = 1 v smeroch osí v, w. 24.4.2. Príklad. V euklidovskom priestore R3 so štandardným skalárnym súčinom je rovnicou 41x2 + 41y2 + 8z2 − 80xy − 4xz − 4yz − 48x − 48y − 51z + 180 = 0 daná kvadrika Q. Treba zistiť, o akú kvadriku ide, a určiť jej polohu, smery hlavných osí a metrické invarianty. 24.4. Kvadratické plochy 531 Príslušná kvadratická forma má maticu AAA =   41 −40 −2 −40 41 −2 −2 −2 8   s vlastnými číslami 81, 9 a 0 a im zodpovedajúcimi vlastnými vektormi (1, −1, 0)T , (1, 1, −4)T a (2, 2, 1)T . Hlavnými osami kvadriky Q sú priamky generované týmito vektormi. Ich znormovaním dostávame ortonormálnu bázu βββ =    1√ 2 1 3 √ 2 2 3 − 1√ 2 1 3 √ 2 2 3 0 −2 √ 2 3 1 3    priestoru R3 , tvorenú vlastnými vektormi matice AAA. V súradniciach (ξ, η, ζ)T = βββT · (x, y, z)T vzhľadom na bázu βββ má rovnica kvadriky Q tvar 81ξ2 + 9η2 + (−48, −48, −51) · βββ · (ξ, η, ζ)T + 180 = 0, t. j. 81ξ2 + 9η2 + 18 √ 2 η − 81ζ + 180 = 0. Z toho po niekoľkých úpravach a predelení oboch strán rovnice faktorom 81 dostaneme ξ2 + 1 9 (η + √ 2)2 − (ζ − 2) = 0. Záverečnou substitúciou u = ξ, v = η + √ 2, w = ζ − 2 prejde rovnica na kanonický tvar u2 + v2 9 = w, čo je rovnica eliptického paraboloidu s osou súmernosti w. Jeho rez rovinou w = 1 je elipsa s hlavnou polosou b = 3 v smere osi v a vedľajšou polosou a = 1 v smere osi u. Podrobnejšia analýza oboch substitúcií dáva   u v w   =   ξ η + √ 2 ζ − 2   = βββT ·   x y z   −   0 − √ 2 2   = βββT ·   x − 1 y − 1 z − 2   . Vidíme tak, že (u, v, w)T predstavujú súradnice vzhľadom na repér (rrr,βββ), kde rrr = (1, 1, 2)T = βββ · 0, − √ 2, 2 T je vrchol kvadriky Q. 24.4.3. Príklad. Hyperbolický paraboloid Q ⊆ R3 má v súradniciach (u, v, w)T vzhľadom na ortonormálny repér (sss,ααα), kde sss = (−2, 0, 1)T a ααα =   3 5 4 5 0 −4 5 3 5 0 0 0 1   , 532 24. Kvadriky rovnicu v kanonickom tvare u2 − v2 2 = w. Napíšeme jeho rovnicu v súradniciach (x, y, z)T vzhľadom na kanonický repér (0,εεε). Stačí si uvedomiť, že prechod od jedných súradníc k druhým je daný rovnicou   u v w   = PPPααα,εεε ·     x y z   − sss   = αααT ·   x + 2 y z − 1   =   (3x − 4y + 6)/5 (4x + 3y + 8)/5 z − 1   . Po dosadení posledného výrazu za (u, v, w)T do kanonickej rovnice kvadriky Q dostávame (3x − 4y + 6)2 25 − (4x + 3y + 8)2 50 = z − 1, čo po prenásobení faktorom 50 a ďalších úpravách dáva 2x2 + 23y2 − 72xy + 68x + 26y − 50z + 53 = 0. Cvičenia 24.1. Dokážte vetu o súčasnej diagonalizácii dvoch kvadratických foriem: Nech V je konečnorozmerný vektorový priestor nad poľom R a p, q: V → R sú dve kvadratické formy na V , pričom p je kladne definitná. Potom existuje taká báza βββ priestoru V , že v súradniciach (xxx)βββ = (x1, . . . , xn)T vzhľadom na túto bázu majú obe formy diagonálny tvar p(xxx) = x2 1 + . . . + x2 n, q(x) = λ1x2 1 + . . . + λnx2 n. 24.2. Klasifikujte kvadriky na euklidovskej priamke podľa signatúry a načrtnite ich obrázky. Presvedčte sa, že neprázdne singulárne kužeľosečky, s výnimkou bodu a dvojice rôznobežných priamok, vzniknú vždy z vhodnej kvadriky na priamke tak, že každým jej bodom vedieme na túto priamku kolmicu. Načrtnite obrázok každej z nich. Nasledujúce tri cvičenia sú venované vzťahu medzi tzv. syntetickým a analytickým popisom regulárnych kužeľosečiek. 24.3. Elipsa je syntetickým spôsobom definovaná ako množina bodov v euklidovskej rovine, ktoré majú rovnaký predpísaný súčet vzdialeností od daných dvoch bodov F1, F2 tejto roviny, tzv. ohnísk elipsy. (a) Zvoľte si v rovine súradný systém tak, aby obe ohniská ležali na osi x súmerne voči počiatku, teda F1 = (−e, 0), F2 = (e, 0), kde e ≥ 0 je tzv. excentricita elipsy. Predpísaný súčet vzdialeností bodov na elipse od oboch ohnísk označte 2a a položte Cvičenia 533 b = √ a2 − e2. Dokážte, že bod roviny so súradnicami (x, y) leží na takto synteticky určenej elipse práve vtedy, keď x2 a2 + y2 b2 = 1. (Pozri obr. 24.3.) (b) Akú podmienku musia spĺňať parametre a a e, aby šlo naozaj o elipsu? Aké množiny bodov v rovine môžeme dostať, ak táto podmienka nie je splnená? (c) Ako sa nazýva elipsa s nulovou excentricitou? 24.4. Hyperbola je syntetickým spôsobom definovaná ako množina bodov v euklidovskej rovine, ktoré majú v absolútnej hodnote rovnaký predpísaný rozdiel vzdialeností od daných dvoch bodov F1, F2 tejto roviny, tzv. ohnísk hyperboly. (a) Zvoľte si v rovine súradný systém tak, aby obe ohniská ležali na osi x súmerne voči počiatku, teda F1 = (−e, 0), F2 = (e, 0), kde e ≥ 0 je tzv. excentricita hyperboly. Prepdpísanú absolútnu hodnotu rozdielu vzdialeností bodov na elipse od oboch ohnísk označte 2a a položte b = √ e2 − a2. Dokážte, že bod roviny so súradnicami (x, y) leží na takto synteticky určenej hyperbole práve vtedy, keď x2 a2 − y2 b2 = 1. (Pozri obr. 24.2.) (b) Aké podmienky musia spĺňať parametre a a e, aby šlo naozaj o hyperbolu? Aké množiny bodov v rovine môžeme dostať, ak tieto podmienky nie sú splnené? (c) Je rovnoosá hyperbola to isté ako hyperbola s nulovou excentricitou? Akým vzťahom medzi parametrami a, e zodpovedá prvý prípad? Akú množinu bodov dostaneme v druhom prípade? 24.5. Parabola je syntetickým spôsobom definovaná ako množina bodov v euklidovskej rovine, ktoré majú rovnakú vzdialenosť od danej riadiacej priamky L a daného bodu F /∈ L, tzv. ohniska paraboly, ležiacich v tejto rovine. (a) Zvoľte si v rovine súradný systém tak, aby os y prechádzala ohniskom F kolmo na riadiacu priamku a ich priesečník bol súmerne združený s ohniskom podľa počiatku. Teda F = (0, p/2) a riadiaca priamka má rovnicu y = −p/2, kde p > 0 je tzv. parameter paraboly. Dokážte, že bod roviny so súradnicami (x, y) leží na takto synteticky určenej parabole práve vtedy, keď x2 = 2py. (Pozri obr. 24.3.) (b) Ako by vyzerala „parabola v prípade, že F ∈ L, t. j. p = 0? 24.6. Presvedčte sa, že neprázdne singulárne kvadratické plochy, s výnimkou bodu a eliptickej kužeľovej plochy, vzniknú vždy z vhodnej kužeľosečky tak, že každým jej bodom vedieme priamku kolmú na rovinu, v ktorej leží. Načrtnite obrázok každej z nich. 24.7. Pre každú z kvadratických plôch určte všetky jej osi a roviny súmernosti. 24.8. Pripomíname, že bod sss euklidovského priestoru V sa nazýva stred kvadriky Q ⊆ V , ak kvadrika Q je symetrická podľa tohto stredu. Dokážte postupne tvrdenia (a) – (d): (a) Bod sss ∈ V je stredom kvadriky Q ⊆ V práve vtedy, keď pre každý bod xxx ∈ V platí xxx ∈ Q ⇒ 2sss − xxx ∈ Q. (b) Nech (xxx)T ααα·AAA(xxx)ααα+bbb·(xxx)ααα+c = 0 je rovnica kvadriky Q v súradniciach vzhľadom na ľubovoľnú bázu ααα euklidovského priestoru V , kde AAA ∈ Rn×n je symetrická matica, bbb ∈ Rn je riadkový vektor a c ∈ R. Potom bod sss ∈ V je stredom kvadriky Q práve vtedy, keď 2AAA · (sss)ααα + bbbT = 0. (c) Množina všetkých stredov stredovej kvadriky tvorí afinný podpriestor vo V . 534 24. Kvadriky (d) Regulárna stredová kvadrika má práve jeden stred. (e) Nájdite príklady singulárnych stredových kvadrík, ktoré majú práve jeden stred, ako aj singulárnych stredových kvadrík, ktorých stredy tvoria priamku resp. rovinu. 24.9. Určte druh, polohu a metrické invarianty kužeľosečiek v R2 daných rovnicami: (a) 2x2 + 2y2 − 4y + 1 = 0; (b) x2 + y2 − 6x + 8y = 0; (c) 7x2 + 2xy √ 3 + 5y2 = 8; (d) 3x2 + 2xy + 3y2 − 8x − 8y + 4 = 0; (e) x2 − 4y2 + 2x + 16y = 19; (f) 11x2 + 24xy + 4y2 − 26x + 8y = 1; (g) x2 + 2x − 2y + 5 = 0; (h) x2 − 2xy + y2 − 2x √ 2 − 2y √ 2 = 0; (i) 9x2 − 24xy + 16y2 − 34x − 38y + 71 = 0. Zakaždým načrtnite obrázok. 24.10. V závislosti na parametri t určte druh, polohu a metrické invarianty kužeľosečiek v R2 daných rovnicami: (a) tx2 + ty2 − 4xy = 8; (b) x2 − y2 + 2txy = 1; (c) (t + 4)x2 + (t − 4)y2 − 6xy = t − 5; (d) (t + 3)x2 + (t − 3)y2 + 8xy = (t − 5)2 ; (e) (t + 1)x2 + (t − 2)y2 − 4xy = 1; (f) (t+2)x2 +(t−1)y2 +4xy = (t+3)(t−2). Podobne ako na obr. 24.4, načrtnite tieto kužeľosečky pre viacero hodnôt parametra t a pozorujte, ako sa transformujú s meniacim sa t. 24.11. Napíšte rovnice nasledujúcich kužeľosečiek v R2 : (a) kružnica so stredom (−4, 3) a polomerom 5; (b) elipsa so stredom v počiatku, hlavnou polosou a = (1 + √ 5)/2 v smere vektora (1, √ 3) a vedľajšou polosou b = 1; (c) rovnoosá hyperbola s ohniskami F1 = (−1, −1), F2 = (1, 1); (d) parabola s ohniskom F = (1, −5) a vrcholom V = (0, −4). 24.12. Určte typ, polohu a metrické invarianty kvadrík v R3 daných rovnicami (a) x2 + 3y2 + z2 + √ 2 xy + 4xz + √ 2 yz = 0; (b) 3x2 + 6y2 + 3z2 + 2 √ 2 xy + 6xz + 2 √ 2 yz = 4; (c) 2x2 +3y2 +2z2 + √ 2 xy+2xz+ √ 2 yz− 6+ √ 2 x−2 3+ √ 2 y− 6+ √ 2 z+7+ √ 2=0; (d) x2 + y2 − 3z2 − 6xy − 2xz − 2yz + 14x − 10y + 2z + 21 = 0; (e) 13x2 + 13y2 + 7z2 − 22xy + 10xz + 10yz + 70x − 74y − 10z + 121 = 0; (f) x2 + y2 + 7z2 + 2xy + 10xz + 10yz + 12 = 0; (g) 13x2 + 37y2 + 30z2 + 30xy + 2 √ 6 xz + 2 √ 6 yz − 32 √ 6 x + 32 √ 6 y − 64z = 0; (h) 7x2 − 17y2 − 6z2 − 6xy − 10 √ 6 xz − 14 √ 6 yz − 4 √ 6 x + 4 √ 6 y − 8z = 0; (i) 2x2 + 2y2 + 2z2 + 4xy − 4xz − 4yz − 9 √ 2 + 4 x + 9 √ 2 − 4 y + 4z + 2 = 0. 24.13. Napíšte rovnice nasledujúcich kvadrík R3 : (a) rotačný elipsoid so stredom v počiatku, ktorý vznikne rotáciou elipsy s hlavnou polosou a = 1 a vedľajšou polosou b = 1/ √ 2 okolo jej hlavnej osi so smerovým vektorom (1, 1, 1); Cvičenia 535 (b) rotačný elipsoid so stredom v počiatku, ktorý vznikne rotáciou elipsy s hlavnou polosou a = 1 a vedľajšou polosu b = 1/ √ 2 okolo jej vedľajšej osi so smerovým vektorom (1, −2, 1); (c) jednoplochý eliptický hyperboloid, ktorý vznikne otočením RRReee3 α základného eliptického hyperboloidu s rovnicou x2 + 2y2 − z2 = 1 okolo osi z o uhol α = π/4 a následným posunutím o vektor (1, 2, 0); (d) dvojplochý rotačný hyperboloid so stredom v počiatku, ktorý vznikne rotáciou rovnoosej hyperboly s excentricitou e = √ 2 okolo jej hlavnej osi so smerovým vektorom (1, 1, 1); (e) eliptická kužeľová plocha, ktorá vznikne otočením RRReee1 β základnej eliptickej kužeľovej plochy s rovnicou x2 + 3y2 − 3z2 = 0 okolo osi x o uhol β = π/6; (f) eliptický paraboloid s vrcholom v bode (0, 0, 1), ktorého os súmernosti je rovnobežná s osou z a rez rovinou z = −1 je elipsa s hlavnou polosou a = 1 v smere vektora (1, √ 3, 0) a vedľajšou polosou b = 1/ √ 3; (g) hyperbolický paraboloid, ktorý vznikne otočením RRRuuu γ základného hyperbolického paraboloidu s rovnicou x2 − y2 = z okolo priamky prechádzajúcej počiatkom so smerovým vektorom uuu = (1, 1, 0) o uhol γ = π/2 a následným posunutím o vektor (2, −1, −3). 25. Vybrané aplikácie združených operátorov V tejto pomerne rôznorodej kapitole sa – po kuželosečkách a kvadrikách – oboznámime s niekoľkými ďalšími aplikáciami združených (najmä hermitovských) operátorov. Výsledky prvého a druhého paragrafu, venovaného singulárnemu a polárnemu rozkladu resp. pseudoinverzným maticiam, sa vo veľkej miere využívajú v numerickej matematike, v ktorej sa však hojne vyskytujú aj iné typy rozkladov. K nim patrí napr. QR-rozklad, s ktorým sme sa už stretli v cvičeniach 13.13 a 13.14 resp. 17.16 a 17.17, ďalej tzv. LU-rozklad, LDU-rozklad atď., no tým, ani ich aplikáciám sa už v tomto kurze venovať nebudeme. S aplikáciou iného druhu – tentoraz v geometrii – sa stretneme v treťom paragrafe: pomocou singulárnych čísel dokážeme elegantne vyjadriť odchýlku ľubovoľných lineárnych či afinných podpriestorov v euklidovskom priestore. Dva záverečné paragrafy tvoria ucelenú časť. Riešením diferenciálnej rovnice harmonického oscilátora sa pokúsime motivovať stručnú analýzu vzťahu samoadjungovaných operátorov i d dt a − d2 dt2 (na vhodnom priestore funkcií) a (trigonometrických) Fourierových radov. 25.1 Singulárny a polárny rozklad V tomto paragrafe budeme ďalej rozvíjať paralelu medzi reálnymi číslami a hermitovskými operátormi resp. maticami. Hermitovský lineárny operátor ϕ na unitárnom priestore V sa nazýva (a) kladný prípadne pozitívny, ak pre každý vektor 0 = xxx ∈ V platí ϕxxx,xxx > 0; (b) nezáporný, ak pre každý vektor xxx ∈ V platí ϕxxx,xxx ≥ 0. Vďaka samoadjungovanosti operátora ϕ je F(xxx,yyy) = ϕxxx,yyy = xxx, ϕyyy kososymetrická bilineárna forma na V . Preto ϕ je kladný práve vtedy, keď F je kladne definitná, a ϕ je nezáporný práve vtedy, keď F je kladne semidefi- nitná. Formuláciu pojmov kladnej resp. nezápornej hermitovskej matice ako aj dôkaz nasledujúceho jednoduchého tvrdenia prenechávame ako cvičenie čita- teľovi. 25.1.1. Tvrdenie. Nech ϕ je hermitovský lineárny operátor na konečnorozmernom unitárnom priestore V . (a) ϕ je kladný práve vtedy, keď pre každé λ ∈ Spec ϕ platí λ > 0; 25.1. Singulárny a polárny rozklad 537 (b) ϕ je nezáporný práve vtedy, keď pre každé λ ∈ Spec ϕ platí λ ≥ 0. Ľahko nahliadneme, že pre ľubovoľný lineárny operátor ϕ: V → V sú oba operátory ϕ∗ ◦ ϕ, ϕ ◦ ϕ∗ hermitovské. Navyše sú však aj nezáporné. Naozaj, pre každé xxx ∈ V platí ϕ∗ (ϕxxx),xxx = ϕxxx, ϕxxx ≥ 0, a podobne pre operátor ϕ ◦ ϕ∗ . Analogicky pre každú, dokonca nie nutne štvorcovú maticu AAA ∈ Cm×n sú obe matice AAA∗ · AAA, AAA · AAA∗ nezáporné hermitovské. Ich druhé odmocniny, t. j. matice √ AAA∗ · AAA, √ AAA · AAA∗ sa nazývajú pravý resp. ľavý modul matice AAA. Ako vyplýva z cvičenia 18.8, obe tieto matice majú rovnaké nenulové vlastné čísla. Nazývame ich singulárne čísla matice AAA. Sú to vlastne (kladné) druhé odmocniny kladných vlastných čísel ktorejkoľvek z matíc AAA∗ · AAA, AAA · AAA∗ . 25.1.2. Veta. Nech AAA ∈ Cm×n . Potom existujú unitárne matice UUU ∈ Cm×m a VVV ∈ Cn×n také, že AAA = UUU · DDD0 0 0 0 · VVV ∗ , kde h = h(AAA∗ · AAA) a d1, . . . , dh sú singulárne čísla matice AAA, pričom každé z nich sa v tomto zozname vyskytuje toľkokrát, aká je jeho násobnosť, DDD0 = diag(d1, . . . , dh) a 0-y sú nulové matice potrebných rozmerov. Ak AAA je reálna, tak matice UUU, VVV možno zvoliť ortogonálne. Dôkaz. Označme BBB uvedenú blokovú maticu. Pre určitosť predpokladajme, že m ≤ n; druhý prípad možno zvládnuť analogicky. Matica AAA∗ · AAA ∈ Cn×n je nezáporná hermitovská, preto existuje unitárna matica PPP ∈ Cn×n taká, že AAA∗ · AAA = PPP · DDD2 · PPP∗ . kde DDD = diag(d1, . . . , dn) je reálna diagonálna matica, pričom d1, . . . , dh > 0 sú singulárne čísla matice AAA a dj = 0 pre h < j ≤ n. Keďže pre každé k ≤ n je k-ty stĺpec matice PPP vlastný vektor matice AAA∗ ·AAA prislúchajúci k jej vlastnému číslu d2 k, a PPP je unitárna, pre stĺpce matice AAA · PPP platí sssj(AAA · PPP),sssk(AAA · PPP) = AAA · sssj(PPP),AAA · sssk(PPP) = sssj(PPP),AAA∗ · AAA · sssk(PPP) = sssj(PPP), d2 ksssk(PPP) = d2 k sssj(PPP),sssk(PPP) = d2 kδjk Teda sssj(AAA · PPP) = 0 pre j > h, a všetky vektory tvaru uuuk = d−1 k sssk(AAA · PPP), kde k ≤ h, tvoria ortonormálny systém v Cm . Možno ich teda doplniť do ortonormálnej bázy uuu1, . . . ,uuum tohto priestoru. Potom UUU = (uuu1, . . . ,uuum) je unitárna matica, pre ktorej všetky stĺpce uuuk platí dkuuuk = sssk(AAA · PPP), t. j. AAA · PPP = (d1uuu1, . . . , dmuuum, 0, . . . , 0) = UUU · BBB. 538 25. Vybrané aplikácie združených operátorov Z toho vyplýva AAA = UUU · BBB · PPP−1 = UUU · BBB · PPP∗ . Stačí teda položiť VVV = PPP. Pre reálnu maticu AAA možno hneď na začiatku zvoliť ortogonálnu maticu PPP = VVV a ortogonálnu maticu UUU získať doplnením reálnych vektorov uuuk = d−1 k sssk(AAA · PPP), k ≤ h, do ortonormálnej bázy v Rm . Práve dokázaný výsledok, nazývaný tiež veta o singulárnom rozklade, má názornú geometrickú interpretáciu. Lineárne zobrazenie xxx → AAA · xxx zobrazuje jednotkovú sféru S = {xxx ∈ Cn ; xxx = 1} v unitárnom priestore Cn na (možno degenerovaný) elipsoid v Cm . Singulárne čísla matice AAA sú dĺžkami jeho (nedegenerovaných) polosí. Dôkaz vety o singulárnom rozklade je vlastne návod, ako zostrojiť ortonormálnu bázu βββ = (vvv1, . . . ,vvvn) = VVV priestoru Cn a ortonormálnu bázu ααα = (uuu1, . . . ,uuum) = UUU priestoru Cm tak, aby vektory AAA · vvv1 = d1uuu1, . . . , AAA · vvvh = dhuuuh tvorili priamo nedegenerované polosi tohto elipsoidu a AAA · vvvj = 0 pre j > h. Nasledujúca veta, nazývaná tiež vetou o polárnom rozklade, je maticovou analógiou goniometrického vyjadrenia komplexného čísla v goniometrickom tvare z = ru = r eiα , kde 0 ≤ r ∈ R, u ∈ C, |u| = 1, a α ∈ R. 25.1.3. Veta. Nech AAA ∈ Cn×n je ľubovoľná matica. Potom existujú nezáporné hermitovské matice RRR,RRR ∈ Cn×n a unitárne matice UUU,UUU ∈ Cn×n také, že AAA = RRR · UUU = UUU · RRR . Pritom matice RRR, RRR sú určené jednoznačne, a ak AAA je regulárna, tak i matice UUU, UUU sú určené jednoznačne. Navyše, ak AAA je reálna, tak aj matice RRR, UUU resp. RRR , UUU možno zvoliť reálne, t. j. RRR, RRR symetrické, kladne semidefinitné a UUU, UUU ortogonálne. Dôkaz. Nech AAA = WWW ·DDD·VVV ∗ je singulárny rozklad matice AAA. Keďže DDD ∈ Cn×n je nezáporná diagonálna (teda hermitovská) a VVV ,WWW ∈ Cn×n sú unitárne, tak aj RRR = WWW · DDD · WWW∗ je nezáporná hermitovská a UUU = WWW · VVV ∗ je unitárna. Potom AAA = WWW · DDD · WWW∗ · WWW · VVV ∗ = RRR · UUU. Ak AAA = RRR·UUU s nezápornou hermitovskou RRR a unitárnou UUU, tak AAA∗ = UUU∗ ·RRR a AAA · AAA∗ = RRR · UUU · UUU∗ · RRR = RRR2 , teda RRR je určená jednoznačne ako druhá odmocnina nezápornej hermitovskej matice AAA·AAA∗ . Navyše, ak AAA je regulárna, tak aj AAA∗ , AAA · AAA∗ a RRR = √ AAA · AAA∗ sú regulárne. Preto podmienkou AAA = RRR · UUU je matica UUU = RRR−1 · AAA určená jednoznačne. 25.2. Pseudoinverzné lineárne zobrazenia a matice 539 Druhý polárny rozklad AAA = UUU · RRR možno získať z prvého polárneho rozkladu AAA∗ = QQQ·VVV matice AAA∗ , s nezápornou hermitovskou QQQ a unitárnou VVV . Potom AAA = VVV ∗ · QQQ; stačí teda položiť RRR = QQQ, UUU = VVV ∗ . Podmienka reálnosti matíc RRR, UUU resp. RRR , UUU pre AAA ∈ Rn×n vyplýva z analogickej podmienky pre singulárny rozklad. Spojením práve dokázanej vety a vety 23.4.9 dostávame 25.1.4. Dôsledok. Pre ľubovoľnú maticu AAA ∈ Cn×n existujú hermitovské matice HHH,HHH ∈ Cn×n a jednoznačne určené nezáporné hermitovské matice RRR,RRR ∈ Cn×n také, že AAA = RRR · exp(iHHH) = exp(iHHH ) · RRR . 25.2 Pseudoinverzné lineárne zobrazenia a matice Týmto paragrafom nadväzujeme na tému, ktorú sme začali rozvíjať v paragrafe 14.5, venovanom „riešeniu neriešiteľných sústav. Nech X, Y sú ľubovoľné množiny. Hovoríme, že g: Y → X je pseudoinverzné zobrazenie k zobrazeniu f : X → Y , ak platí f ◦ g ◦ f = f, g ◦ f ◦ g = g. Zrejme g je pseudoinverzné zobrazenie k f práve vtedy, keď f je pseudoinverzné zobrazenie ku g. Takisto ľahko nahliadneme, že ak f : X → Y je bijekcia, t. j. ak k nemu existuje inverzné zobrazenie f−1 : Y → X, tak f−1 je zároveň jediným pseudoinverzným zobrazením k f. Ak však f nie je bijektívne a # X ≥ 2, tak k nemu existuje viacero pseudoinverzných zobrazení g. (Presvedčte sa o tom.) Nás budú v tejto chvíli zaujímať najmä pseudoinverzné lineárne zobrazenia k lineárnym zobrazeniam medzi konečnorozmernými unitárnymi prípadne euklidovskými priestormi. Začneme však trochu všeobecnejším prípadom lineárnych zobrazení medzi konečnorozmernými vektorovými priestormi nad ľubovoľným poľom K. Z výpočtových dôvodov zavádzame aj pojem pseudoinverznej matice. BBB ∈ Kn×m sa nazýva pseudoinverzná matica k matici AAA ∈ Km×n , ak platí AAA · BBB · AAA = AAA, BBB · AAA · BBB = BBB. Zrejme k regulárnej matici AAA ∈ Kn×n existuje jediná pseudoinverzná matica, a to AAA−1 . Ako čoskoro uvidíme, k obdĺžnikovým maticiam, ako i k singulárnym štvorcovým maticiam môže existovať viacero rôznych pseudoinverzných matíc. 540 25. Vybrané aplikácie združených operátorov Nech ϕ: V → U je lineárne zobrazenie medzi konečnorozmernými vektorovými priestormi nad poľom K. Označme m = dim U, n = dim V a h = h(ϕ). Podľa vety 7.5.4 existuje báza βββ = (vvv1, . . . ,vvvn) priestoru V a báza ααα = (uuu1, . . . ,uuum) priestoru U, vzhľadom na ktoré má ϕ maticu v blokovom tvare AAA = (ϕ)ααα,βββ = IIIh 0h,n−h 0m−h,h 0m−h,n−h . Z tohto tvaru je zrejmé, že vektory vvvh+1, . . . ,vvvn tvoria bázu lineárneho podpriestoru Ker ϕ ⊆ V a vektory uuu1 = ϕ(vvv1), . . . ,uuuh = ϕ(vvvh) bázu lineárneho podpriestoru Im ϕ ⊆ U. Navyše platí V = [vvv1, . . . ,vvvh] ⊕ Ker ϕ, U = Im ϕ ⊕ [uuuh+1, . . . ,uuum] a ϕ zúžené na podpriestor [vvv1, . . . ,vvvh] je lineárny izomorfizmus tohto podpriestoru na podpriestor Im ϕ. Nech teraz ψ: U → V je lineárne zobrazenie, ktoré má vzhľadom na bázy ααα, βββ maticu AAAT = (ψ)βββ,ααα = IIIh 0h,m−h 0n−h,h 0n−h,m−h . Potom Ker ψ = [uuuh+1, . . . ,uuum] a ψ Im ϕ: Im ϕ → [vvv1, . . . ,vvvh] je lineárny izomorfizmus, inverzný k zúženiu ϕ na [vvv1, . . . ,vvvh]. Prenechávame čitateľovi, aby sa sám presvedčil, že lineárne zobrazenie ψ je pseudoinverzné k ϕ. Taktiež naopak, ak ψ: U → V je pseudoinverzné k ϕ: V → U, tak existujú bázy βββ = (vvv1, . . . ,vvvh,vvvh+1, . . . ,vvvn) priestoru V a ααα = (uuu1, . . . ,uuuh,uuuh+1, . . . ,uuum) priestoru U také, že matice (ϕ)ααα,βββ, (ψ)βββ,ααα majú uvedený tvar. Vo všeobecnosti pre dané lineárne zobrazenie ϕ: V → U medzi konečnorozmernými vektorovými priestormi ľubovoľná dvojica lineárnych podpriestorov S ⊆ V , T ⊆ U takých, že S ⊕ Ker ϕ = V, Im ϕ ⊕ T = U, jednoznačne určuje lineárne zobrazenie ψ: U → V pseudoinverzné k ϕ, pre ktoré Ker ψ = T a Im ψ = S. Stačí si uvedomiť, že ϕ S : S → Im ϕ je lineárny izomorfizmus, takže k nemu existuje inverzné lineárne zobrazenie (ϕ S)−1 : Im ϕ → S. Potom jediná možnosť ako definovať ψ je ψ(yyy) = (ϕ S)−1 (yyy1), kde yyy = yyy1 + yyy2 je jednoznačný rozklad vektora yyy ∈ U na zložky yyy1 ∈ Im ϕ, yyy2 ∈ T. Opäť možno jednoducho overiť, že lineárne zobrazenie ψ je pseudoinverzné k ϕ. Z našej konštrukcie je taktiež zrejmé, že pokiaľ ϕ nie je bijektívne, tak aspoň jeden z podpriestorov S, T je netriviálny a možno ho voliť viacerými 25.2. Pseudoinverzné lineárne zobrazenia a matice 541 spôsobmi. Rôzne voľby S a T potom určujú rôzne pseudoinverzné lineárne zobrazenia k ϕ. V prípade konečnorozmerných vektorových priestorov nad všeobecným poľom nemáme k dispozícii prirodzený prostriedok, ako túto nejednoznačnosť odstrániť. K danému netriválnemu vlastnému lineárnemu podpriestoru P ⊆ V totiž existuje mnoho lineárnych podpriestorov P ⊆ V takých, že V = P ⊕ P , a všetky možné voľby P sú navzájom rovnocenné. Iná je však situácia v konečnorozmerných unitárnych resp. euklidovských priestoroch – tam je prirodzené položiť P = P⊥ . 25.2.1. Tvrdenie. Nech U, V sú konečnorozmerné unitárne, prípadne euklidovské priestory a ϕ: V → U, ψ: U → V sú navzájom pseudoinverzné lineárne zobrazenia. Potom nasledujúce podmienky sú ekvivalentné: (i) lineárne podpriestory Ker ϕ, Im ψ ⊆ V ako aj Ker ψ, Im ϕ ⊆ U sú navzájom ortogonálne; (ii) lineárne operátory ψ ◦ϕ: V → V a ϕ◦ψ: U → U sú samoadjungované. Dôkaz. Označme S = Im ψ. Keďže ϕ, ψ sú navzájom pseudoinverzné, V = S ⊕ Ker ϕ a ψϕ(uuu) = uuu pre uuu ∈ S. (i) ⇒ (ii) Zvoľme xxx,yyy ∈ V . Potom xxxS,yyyS ∈ S, teda xxx − xxxS,yyy − yyyS ∈ Ker ϕ = S⊥ , a platí ϕ(xxx) = ϕ(xxxS), xxxS,yyy − yyyS = 0. V dôsledku toho ψϕ(xxx),yyy = ψϕ(xxxS),yyy = xxxS,yyy = xxxS,yyyS . Z rovnakých dôvodov je xxx, ψϕ(yyy) = xxxS,yyyS , teda ψϕ(xxx),yyy = xxx, ψϕ(yyy) , čiže operátor ψ ◦ ϕ je samoadjungovaný. Podobne možno dokázať samodjungovanosť operátora ϕ ◦ ψ. (ii) ⇒ (i) Ukážeme, že xxx ⊥ yyy pre ľubovoľné xxx ∈ Im ψ, yyy ∈ Ker ϕ. Potom xxx = ψ(uuu) pre nejaké uuu ∈ U a ϕ(yyy) = 0. Keďže ψ ◦ ϕ ◦ ψ = ψ a ψ ◦ ϕ je samoadjungovaný, xxx,yyy = ψ(uuu),yyy = ψϕψ(uuu),yyy = ψ(uuu), ψϕ(yyy) = 0. Podobne sa dokáže ortogonálnosť podpriestorov Im ϕ a Ker ψ. Nech ϕ: V → U je lineárne zobrazenie medzi konečnorozmernými unitárnymi prípadne euklidovskými priestormi. Pseudoinverzné lineárne zobrazenie ψ: U → V k zobrazeniu ϕ nazývame jeho Mooreovou-Penroseovou pseudoinverziou, ak je splnená jedna (teda nevyhnutne obe) z ekvivalentných podmienok (i), (ii) tvrdenia 25.2.1. Z našich predchádzajúcich úvah vyplýva, že Mooreova-Penroseova pseudoinverzia (na rozdiel od inverzného zobrazenia) existuje vždy a uvedenou dodatočnou podmienkou je určená jednoznačne – značíme ju ψ = ϕ¬ . Podobne, maticu BBB ∈ Cn×m nazývame Mooreovou-Penroseovou pseudoinverziou matice AAA ∈ Cm×n , ak BBB je pseudoinverzná k AAA a obe matice AAA ·BBB, 542 25. Vybrané aplikácie združených operátorov BBB · AAA sú hermitovské (v reálnom prípade symetrické). Takisto každá matica AAA ∈ Cm×n má jednoznačne určenú Mooreovu-Penroseovu pseudoinverziu, ktorú opäť značíme AAA¬ . Mooreovu-Penroseovu pseudoinverziu matice AAA možno tiež opísať s využitím singulárneho rozkladu. 25.2.2. Tvrdenie. Nech AAA ∈ Cm×n . Potom jej Mooreova-Penroseova pseudoinverzia má tvar AAA¬ = VVV · diag d−1 1 , . . . , d−1 h , 0, . . . , 0 · UUU∗ , kde AAA = UUU · diag(d1, . . . , dh, 0, . . . , 0) · VVV ∗ je singulárny rozklad matice AAA. Ak navyše AAA je reálna, tak aj AAA¬ je reálna. Dôkaz. Zrejme pre maticu DDD = diag(d1, . . . , dh, 0, . . . , 0) platí DDD¬ = diag d−1 1 , . . . , d−1 h , 0, . . . , 0 . Označme BBB = VVV · DDD¬ · UUU∗ . Keďže UUU, VVV sú unitárne, AAA · BBB · AAA = UUU · DDD · VVV ∗ · VVV · DDD¬ · UUU∗ · UUU · DDD · VVV ∗ = UUU · DDD · VVV ∗ = AAA. Podobne možno tiež dokázať BBB · AAA · BBB = BBB. Rovnosti (AAA · BBB)∗ = AAA · BBB, (BBB·AAA)∗ = BBB·AAA sú triviálne. Z jednoznačnosti Mooreovej-Penroseovej inverzie vyplýva AAA¬ = BBB. Z vety 25.1.2 navyše vyplýva, že AAA¬ je reálna pre reálnu AAA. Najdôležitejšie vlastnosti Mooreovej-Penroseovej pseudoinverzie sú zhrnuté v nasledujúcich dvoch tvrdeniach. Dôkaz prvého z nich sa redukuje na niekoľko priamych výpočtov, ktorých vzory možno nájsť v paragrafe 14.5. 25.2.3. Tvrdenie. Nech AAA ∈ Cm×n . Potom (a) ak AAA · AAA∗ je regulárna, tak AAA¬ = AAA∗ · (AAA · AAA∗ )−1 ; (b) ak AAA∗ · AAA je regulárna, tak AAA¬ = (AAA∗ · AAA)−1 · AAA∗ . Pre reálnu maticu AAA platí AAA∗ = AAAT , teda z regularity matice AAA ·AAAT resp. AAAT ·AAA vyplýva AAA¬ = AAAT · (AAA ·AAAT )−1 resp. AAA¬ = (AAA∗ ·AAA)−1 ·AAA∗ , čo sa zhoduje s výsledkami paragrafu 14.5. Skôr než čitateľ prejde k druhému tvrdeniu, mal by si najprv samostatne premyslieť, že pojmy pseudoriešenia a minimálneho (pseudo)riešenia sústavy lineárnych rovníc z paragrafu 14.5 možno celkom mechanicky preniesť z euklidovského priestoru Rn do unitárneho priestoru Cn . Taktiež výsledky o nich zostávajú v platnosti s jedinou zmenou: transponovanú maticu AAAT treba všade nahradiť hermitovsky združenou maticou AAA∗ . 25.3. Odchýlka dvoch lineárnych podpriestorov 543 25.2.4. Tvrdenie. Nech AAA ∈ Cm×n , bbb ∈ Cm a xxx0 = AAA¬ · bbb ∈ Cn . Potom xxx0 je minimálne pseudoriešenie sústavy AAA · xxx = bbb. Dôkaz. Podľa tvrdení 14.5.1 a 14.5.3, modifikovaných spomínaným očividným spôsobom, je xxx ∈ Cn minimálnym pseudoriešním sústavy AAA · xxx = bbb práve vtedy, keď xxx = AAA∗ · AAA · zzz pre nejaké zzz ∈ Cn také, že (AAA∗ · AAA)2 · zzz = AAA∗ · bbb. Pre xxx0 = AAA¬ · bbb stačí položiť zzz = AAA¬ · AAA¬∗ · AAA¬ · bbb. Skôr než pristúpime k overeniu požadovaných rovností, uvedomme si, že AAA∗ · AAA · AAA¬ = AAA∗ · (AAA · AAA¬ )∗ = (AAA · AAA¬ · AAA)∗ = AAA∗ , a z rovnakého dôvodu AAA∗ · AAA¬∗ · AAA¬ = AAA¬ . Preto AAA∗ · AAA · zzz = AAA∗ · AAA · AAA¬ · AAA¬∗ · AAA¬ · bbb = AAA∗ · AAA¬∗ · AAA¬ · bbb = AAA¬ · bbb = xxx0, z čoho ďalej vyplýva (AAA∗ · AAA)2 · zzz = AAA∗ · AAA · AAA¬ · bbb = AAA∗ · bbb. Či už sústava AAA · xxx = bbb má alebo nemá riešenie, xxx0 = AAA¬ · bbb je jej pseudoriešením, t. j. riešením sústavy AAA · xxx = bbbS, kde bbbS je kolmý priemet vektora bbb do lineárneho podpriestoru S ⊆ Cm generovaného stĺpcami matice AAA. To znamená, že pre všetky yyy ∈ Cn platí AAA · xxx0 − bbb ≤ AAA · yyy − bbb . Navyše toto pseudoriešenie je minimálne, t. j. pre každé iné pseudoriešenie xxx ∈ Cn platí xxx0 ≤ xxx . Na druhej strane, ak sústava AAA · xxx = bbb má viac riešení, tak xxx0 = AAA¬ · bbb je jej riešením s minimálnou normou. Mooreova-Penroseova pseudoinverzia matice AAA tak jednotným spôsobom rieši obe otázky diskutované v paragrafe 14.5 a zároveň ich zovšeobecňuje z reálnych matíc na komplexné. 25.3 Odchýlka dvoch lineárnych podpriestorov Singulárne čísla matíc možno okrem iného využiť na určenie odchýlky afinných či lineárnych podpriestorov v euklidovskom priestore. Pripomeňme, že odchýlku dvoch netriviálnych afinných podpriestorov v euklidovskom priestore V sme v paragrafe 14.3 definovali ako odchýlku ich zameraní. Odchýlku 544 25. Vybrané aplikácie združených operátorov netriviálnych lineárnych podpriestorov S, T ⊆ V sme definovali ako odchýlku ich podpriestorov S1 = S ∩ (S ∩ T)⊥ , T1 = T ∩ (S ∩ T)⊥ , pre ktoré platí S1 ∩ T1 = {0}. Avšak odchýlku netriviálnych lineárnych podpriestorov S, T spĺňajúcich S ∩ T = {0} sme vedeli určiť, len ak aspoň jeden z nich bol priamka alebo nadrovina. Túto medzeru zapĺňa nasledujúca veta. 25.3.1. Veta. Nech S, T sú netriviálne lineárne podpriestory v euklidovskom priestore V , S ∩ T = {0} a ααα = (uuu1, . . . ,uuuk), resp. βββ = (vvv1, . . . ,vvvl) sú ich ortonormálne bázy. Potom cos (S, T) = D = √ M, kde D je najväčšie singulárne číslo matice AAA =     uuu1,vvv1 uuu2,vvv1 . . . uuuk,vvv1 uuu1,vvv2 uuu2,vvv2 . . . uuuk,vvv2 ... ... ... ... uuu1,vvvl uuu2,vvvl . . . uuuk,vvvl     , resp. M je najväčšie vlastné číslo matice AAAT · AAA. Dôkaz. Označme ϕ: S → T zúženie ortogonálnej projekcie prT na podpriestor S a ψ: T → S zúženie ortogonálnej projekcie prS na podpriestor T. Potom lineárne zobrazenia ϕ, ψ majú vzhľadom na bázy ααα, βββ matice (ϕ)βββ,ααα = AAA, (ψ)ααα,βββ = AAAT . Lineárny operátor ψ ◦ ϕ: S → S má v báze ααα maticu AAAT · AAA, teda je nezáporný hermitovský a všetky jeho vlastné čísla (t. j. vlastné čísla matice AAAT · AAA) sú reálne nezáporné. Obr. 25.1. K odchýlke dvoch lineárnych podpriestorov Podľa tvrdenia 14.3.1 a vlastností kolmého priemetu je cos (S, T) = sup{cos (xxx, T); 0 = xxx ∈ S} = sup xxxT xxx ; 0 = xxx ∈ S . 25.4. Harmonický oscilátor 545 Nech www ∈ S je vlastný vektor operátora ψ ◦ ϕ prislúchajúci k jeho vlastnému číslu λ, t. j. wwwTS = ψϕ(www) = λwww. Označme γ = (www, T). Potom cos γ = wwwT www = ϕwww www Z obrázku 25.1 je zrejmé, že taktiež wwwTS = ψϕ(www) = wwwT cos γ = www cos2 γ. V dôsledku toho λ www = www cos2 γ, čiže cos γ = √ λ. Zostáva dokázať, že ak λ = M je najväčšie vlastné číslo matice AAAT · AAA, tak pre ľubovoľný nenulový vektor xxx ∈ S platí xxxT xxx ≤ √ M = D. Keďže ϕ(xxx) = xxxT ⊥ xxx−xxxT , ϕxxx, ϕxxx = ϕxxx,xxx . Ďalej z podmienky xxx ∈ S vyplýva ψ(xxx) = xxx. S využitím týchto faktov, Cauchyho-Schwartzovej nerovnosti a dôsledku 23.7.5 dostávame xxxT 2 = ϕxxx, ϕxxx = ϕxxx,xxx = ϕψxxx,xxx ≤ ϕψxxx xxx ≤ M xxx 2 = D2 xxx 2 , teda xxxT ≤ D xxx . 25.4 Harmonický oscilátor Harmonickým alebo aj lineárnym harmonickým oscilátorom budeme nazývať systém charakterizovaný jedinou číselnou veličinou x = x(t), ktorej vývoj v čase t sa riadi diferenciálnou rovnicou d2 x dt2 = −ω2 x, kde ω ∈ R je konštanta, nazývaná kruhová frekvencia. Pomocou rovnice harmonického oscilátora možno – či už presne alebo približne – popísať mnoho rozmanitých jednoduchých fyzikálnych systémov, najmä v blízkosti rovnovážneho stavu. Tie zložitejšie možno zasa často „vyskladať z viacerých rôzne spriahnutých harmonických oscilátorov (a tie matematickou transformáciou analogickou diagonalizácii kvadratickej formy nahradiť súborom nespriahnutých oscilátorov). 1 1 V realistickejších matematických modeloch však treba brať do úvahy aj tlmenie kmitov napr. v dôsledku trenia, prípadne kmitanie vynútené premennou silou. 546 25. Vybrané aplikácie združených operátorov Okamžite vidíme, že ide o lineárnu diferenciálnu rovnicu druhého rádu s konštantnými koeficientmi (pozri paragrafy 22.5–6). Ak položíme xxx = (x1, x2)T , kde x1 = dx/ dt, x2 = x, môžeme ju zapísať v tvare homogénnej autonómnej sústavy dxxx dt = 0 −ω2 1 0 · xxx. Vlastnými hodnotami jej matice sú rýdzo imaginárne čísla λ1,2 = ±iω. Podmienky −x1± iωx2 = 0 pre zložky vlastných vektorov sú vlastne diferenciálne rovnice dx dt = ±iωx. Fundamentálny systém riešení pôvodnej rovnice tak tvoria funkcie e±iωt . Ak nám ide len o reálne riešenia, môžeme ho nahradiť fundamentálnym systémom (cos ωt, sin ωt). Všeobecné reálne riešenie má preto tvar x(t) = C1 cos ωt + C2 sin ωt, pričom koeficienty C1, C2 ∈ R možno určiť z prípadných počiatočných podmienok C1 = x(0), C2 = dx dt (0). Alternatívne možno všeobecné riešenie zapísať v ľubovoľnom z tvarov x(t) = A cos(ωt + ϕ) = A sin(ωt + ψ). A potom predstavuje amplitúdu a ϕ, ψ = ϕ + π/2 fázové posuny kmitov harmonického oscilátora. Ako príklad harmonického oscilátora môžu slúžiť kmity závažia zaveseného na pružine, uvedeného do pohybu vychýlením z rovnovážnej polohy. Pokiaľ je počiatočná výchylka malá a tlmenie v dôsledku trenia a odporu prostredia zanedbateľné, výchylka x z rovnovážnej polohy sa mení v čase podľa diferenciálnej rovnice m d2 x dt2 = −kx, kde m je hmotnosť závažia a konštanta k, tuhosť pružiny, charakterizuje jej odpor proti pozdĺžnej deformácii. Rovnicu možno odvodiť z druhého Newtonovho pohybového zákona porovnaním dvoch výrazov pre zrýchlenie a = d2 x/ dt2 = F/m, kde sila F = −kx, ktorou sa pružina „bráni proti deformácii, je priamo úmerná veľkosti výchylky x. Ak položíme ω = k/m, dostaneme rovnicu v pôvodnom tvare. Podobne možno rovnicou harmonického oscilátora pomerne verne opísať kmity ideálneho matematického kyvadla pri malých výchylkách z rovnovážnej polohy. Rovnomerný pohyb po kružnici s polomerom R a uhlovou rýchlosťou 25.5. Harmonický oscilátor a Fourierove rady 547 ω možno zasa vyjadriť ako superpozíciu kmitov dvoch harmonických oscilá- torov x(t) = R cos ωt, y(t) = R sin ωt v dvoch navzájom kolmých smeroch. V tomto prípade je však výhodnejšie položiť z(t) = x(t)+iy(t) a obe rovnice spojiť do jedinej rovnice v komplexnom tvare z(t) = R eiωt . Príkladom tlmeného lineárneho oscilátora je elektrický obvod s kapacitou C, indukciou L a odporom (rezistenciou) R: prúd I (no taktiež náboj a napätie) v takomto obvode sa mení v čase podľa rovnice d2 I dt2 + R L dI dt + I LC = 0 Harmonický oscilátor dostaneme v ideálnom prípade obvodu s nulovou rezistenciou R = 0. Kruhová frekvencia vtedy je ω = 1/ √ LC. Vráťme sa však k harmonickému oscilátoru reprezentovanému kmitmi závažia na pružine. Jeho hamiltonián dostaneme ako súčet kinetickej a potenciálnej energie kmitavého pohybu H(x, p) = 1 2 mv2 + x 0 kξ dξ = p2 2m + 1 2 kx2 = 1 2 p2 m + mω2 x2 , kde v = dx/ dt je okamžitá rýchlosť a p = mv hybnosť sústavy (pozri paragraf 17.6). Diferenciálnu rovnicu pre harmonický oscilátor možno teraz odvodiť z Hamiltonových pohybových rovníc dx dt = ∂H ∂p , dp dt = − ∂H ∂x , Kým prvá z nich je len vyjadrením známeho faktu dx/ dt = v = p/m = ∂H/∂p, druhá dáva m d2 x dt2 = d(mv) dt = dp dt = − ∂H ∂x = −mω2 x, z čoho po vykrátení člena m v krajných výrazoch dostaneme pôvodnú rovnicu harmonického oscilátora. 25.5 Harmonický oscilátor a Fourierove rady Rovnica pre harmonický oscilátor je ekvivalentná s úlohou nájsť všetky vlastné funkcie (t. j. vlastné vektory) lineárneho operátora − d2 dt2 na vhodnom priestore funkcií, prislúchajúce k danej vlastnej hodnote ω2 (čím sa v prípade 548 25. Vybrané aplikácie združených operátorov úspechu spätne overí, že ω2 je naozaj jeho vlastná hodnota). K štúdiu podobných otázok je účelné pristupovať zo zorného uhla unitárnych priestorov a samoadjungovaných operátorov. Všimnime si, že všetky riešenia x(t) rovnice harmonického oscilátora sú periodické funkcie s periódou T = 2π/ω, čiže x(t + T) = x(t) pre každé t ∈ R. Obráťme tak trochu úlohu: zvoľme pevné kladné číslo T a uvažujme množiny V = C (∞) T (R, R), W = C (∞) T (R, C) všetkých funkcií R → R resp. R → C, ktoré majú v každom bode t ∈ R (konečné a spojité) derivácie všetkých rádov a sú periodické s periódou T. Zrejme V je vektorový priestor nad R a W je vektorový priestor nad C. Rovnosťou f, g = T 0 f(t) g(t) dt je na nich definovaný skalárny súčin (vo V možno vynechať pruh nad g). Ak si uvedomíme, že každá funkcia f ∈ W má tvar f = f0 + if1 pre funkcie f0 = Re f, f1 = Im f z V , vidíme, že nekonečnorozmerný unitárny priestor W = V C je komplexifikáciou nekonečnorozmerného reálneho priestoru so skalárnym súčinom V (pozri príklady 13.1.2, 18.5.1, cvičenia 13.7, 13.8, 17.12 a paragraf 19.4). Uvažujme lineárny operátor i d dt : W → W. S použitím integrácie per partes a periodicity funkcií f, g, vďaka ktorej sa anulujú „hranaté zátvorky , dostávame i df dt , g = i T 0 f (t) g(t) dt = i f(t) g(t) T 0 − i T 0 f(t) g (t) dt = f, i dg dt pre ľubovoľné funkcie f, g ∈ W. To znamená, že i d dt je samoadjungovaný lineárny operátor na priestore W. Keby sme uvažovali o i d dt ako o lineárnom operátore na priestore C(∞) (R, C) všetkých (a nielen periodických) nekonečne diferencovateľných funkcií R → C, bolo by každé λ ∈ C jeho vlastným číslom a zodpovedala by mu vlastná funkcia e−iλt = eIm λt cos(Re λt) − i sin(Re λt) . Takáto funkcia je však periodická s periódou T (teda patrí do nášho priestoru W), len ak λ ∈ R a λT/2π je celé číslo. Vlastnými číslami operátora i d dt na priestore W sú teda všetky celočíselné násobky čísla ω = 2π/T, pričom vlastnému číslu λn = nω zodpovedá vlastná funkcia e−inωt = cos(nωt) − i sin(nωt), 25.5. Harmonický oscilátor a Fourierove rady 549 to znamená, že všetky vlastné čísla λn operátora i d dt sú jednoduché. V dôsledku samoadjungovanosti operátora i d dt je aj − d2 dt2 = i d dt ◦ i d dt = i d dt 2 samoadjungovaný lineárny operátor na W, a keďže V ⊆ W je jeho invariantný podpriestor, tak aj na V . Jeho vlastnými hodnotami sú všetky čísla tvaru λ2 n = n2 ω2 , kde n ∈ Z. Vlastné číslo λ2 0 = 0 je jednoduché – zodpovedá mu vlastná funkcia identicky rovná 1 (ďalší kandidát, funkcia x(t) = t, síce vyhovuje podmienke − d2 x/ dt2 = 0, no nie je periodická). Vlastné čísla λ2 n = λ2 −n = n2 ω2 pre n > 0 sú dvojnásobné, s príslušnými vlastnými funkciami e±inωt = cos(nωt) ± i sin(nωt). Pri obmedzení sa na priestor V ich možno nahradiť vlastnými funkciami cos(nωt), sin(nωt) (veta 22.6.3). Ortogonálny systém funkcií {cos(nωt); n ∈ N} ∪ {sin(nωt); 1 ≤ n ∈ N} funguje ako svojho druhu „nekonečná ortogonálna báza priestoru V (porovnaj s cvičením 13.8). Presnejšie, každú funkciu f ∈ V možno vyjadriť v tvare trigonometrického Fourierovho radu2 f(t) = 1 2 a0 + ∞ n=1 an cos(nωt) + bn sin(nωt) s Fourierovými koeficientmi an = 2 T f, cos(nωt) = 2 T T 0 f(t) cos(nωt) dt, bn = 2 T f, sin(nωt) = 2 T T 0 f(t) sin(nωt) dt. Uvedený rad rovnomerne konverguje k funkcii f dokonca za omnoho všeobecnejších podmienok: stačí napr., aby f : R → R bola spojitá periodická funkcia s periódou T = 2π/ω a s po častiach spojitou prvou deriváciou. Pre komplexné funkcie f : R → C analogických vlastností máme k dispozícii vyjadrenie v tvare exponenciálneho alebo komplexného Fourierovho radu f(t) = n∈Z cn einωt s komplexnými Fourierovými koeficientmi cn = 1 T f, einωt = 1 T T 0 f(t) e−inωt dt. 2 Názov je na počesť francúzskeho prírodovedca a matematika Josepha Fouriera, ktorý vo svojej práci z r. 1822 použil trigonometrické rady na analýzu a riešenie parciálnej diferenciálnej rovnice pre vedenie tepla. 550 25. Vybrané aplikácie združených operátorov Na druhej strane, Fourierov rad spojitej periodickej funkcie k nej vo všeobecnosti nemusí konvergovať ani bodovo. Pre (reálnu či komplexnú) periodickú funkciu f s periódou T, lebesgueovsky integrovateľnú na intervale 0, T spolu so svojim štvorcom f2 máme ešte stále zaručenú konvergenciu jej Fourierovho radu k funkcii f podľa stredu. To znamená, že postupnosť f − sn 2 = T 0 |f(t) − sn(t)|2 dt, kde sn(t) = 1 2 a0 + n k=0 ak cos(kωt) + bk sin(kωt) , resp. sn(t) = n k=−n ck eikωt označuje n-tý čiastočný súčet príslušného Fourierovho radu, konverguje k nule. V takom prípade však treba vo vzorci pre skalárny súčin funkcií uvažovať namiesto Riemannovho integrálu Lebesgueov. Otázky, pre aké funkcie a ako ich Fourierov rad konverguje, prípadne kedy a ako konverguje k pôvodnej funkcii, sú vo všeobecnosti veľmi zložité a podnes nie sú úplne zodpovedané. Podobné otázky priviedli v druhej polovici 19. storočia Georga Cantora k rozpracovaniu základov teórie množín (presnejšie, v jeho prípade to bola otázka jednoznačnosti rozvoja funkcie do Fourierovho radu) a na dlhé obdobie sa stali zdrojom významných podnetov jej ďalšieho rozvoja, ako aj rozvoja nových na nej založených matematických disciplín: všeobecnej topológie, teórie miery a funkcionálnej analýzy. Hlavný význam Fourierových radov však spočíva v ich aplikáciách – používajú sa v elektrotechnike, akustike, optike, pri prenose signálov, spracovaní obrazu, kompresii dát či v spektrálnej analýze v chémii aj astronómii. Navyše ich mnohostranné zovšeobecnenia, ako napr. spojitá či diskrétna Fourierova transformácia, hrajú kľúčovú úlohu v mnohých oblastiach modernej matematiky, fyziky a informatiky. Cvičenia 25.1. Dokážte tvrdenie 25.1.1. 25.2. Nájdite singulárne (a s výnimkou prípadov (e), (f) a (h)) aj polárne rozklady nasledujúcich matíc: (a) AAA = 0 1 1 0 , (b) BBB = 1 −2 1/3 7 , Cvičenia 551 (a) CCC = 4 3 −1 1 , (d) DDD = 1 + 2i −1 1 + 3i i , (e) EEE = 1 1 0 0 −1 −3 , (f) FFF = 3 i i −2i 0 1 + i , (g) GGG = 2 0 1 −1 3 −2 1 1 0 , (h) HHH = 3 1 −2 0 −1 1 . 25.3. Nájdite Mooreovu-Penroseovu pseudoinverziu riadkového vektora aaa = (a1, . . . , an) ∈ Cn a stĺpcového vektora bbb = (b1, . . . , bn)T ∈ Cn . 25.4. Nájdite Mooreove-Penroseove pseudoinverzie matíc EEE, FFF, GGG a HHH z cvičenia 25.2. Ako je to s pseudoniverziami zvyšných matíc z tohto cvičenia? 25.5. Nech AAA = QQQ · RRR je QR-rozklad matice AAA ∈ Cm×n , kde m ≥ n (pozri cvičenia 13.13 a 17.16) a stĺpce matice AAA sú lineárne nezávislé (t. j. h(AAA) = n). Potom AAA∗ · AAA = RRR∗ ·RRR a AAA¬ = RRR¬ ·QQQ∗ . Dokážte. Vysvetlite, ako možno veľmi jednoducho vypočítať pseudoinverznú maticu RRR¬ k hornej trojuholníkovej matici RRR = RRR 0 , kde RRR ∈ Cn×n je regulárna. 25.6. Nájdite singulárny aj polárny rozklad všeobecnej Jordanovej bunky JJJn(λ) a MooreovuPenroseovu pseudoinverziu Jordanovej bunky JJJn(0). 25.7. Na príklade dvoch matíc rozmeru 2 × 2 ukážte, že pre matice AAA,BBB ∈ Cn×n nemusí platiť (AAA · BBB)¬ = BBB¬ · AAA¬ . 25.8. (a) Nájdite pseudoriešenie neriešiteľnej sústavy (1 + i)x − 2y = 1, 3x − iy = 0, ix + (1 − i)y = 2 + i a dokážte, že je jediné. (b) Nájdite minimálne riešenie sústavy ix + 2y − iz = 0, 2x + (2 − i)z = 1. (c) Nájdite minimálne pseudoriešenie sústavy x + iy − iz = 1 2x + 2iy − 2iz = 0. 25.9. (a) S využitím cvičenia 19.14 odvoďte, že singulárny rozklad cirkulantnej matice CCC = CCC(a0, a1, . . . , an−1) má tvar CCC = FFF∗ · DDD · FFF, kde FFF = n−1/2 ω−jk je znormovaná (teda unitárna) matica diskrétnej Fourierovej transformácie F : Cn → Cn , ω = e2πi/n = cos(2π/n) + i sin(2π/n) je primitívna n-tá odmocnina z jednotky, g(x) = a0 + a1x + . . . + an−1xn−1 a DDD = diag |g(1)|, |g(ω)|, . . . , |g(ωn−1 )| . (b) Na základe (a) dokážte, že Mooreova-Penroseova pseudoinverzia cirkulantnej matice má tvar CCC¬ = FFF∗ · DDD¬ · FFF. 25.10. S využitím predchádzajúceho cvičenia modifikujte postup riešenia sústavy CCC · xxx z cvičenia 19.15 tak, aby ho bolo možné použiť, aj keď Fourierov obraz F(aaa ) vektora aaa = (a0, an−1, . . . , a1)T má niektoré zložky nulové. Aký druh riešenia predstavuje vektor xxx = CCC¬ · bbb? 25.11. Nech S, T sú lineárne podpriestory euklidovského priestoru V . Označme ϕ = prT S : S → T, ψ = prS T : T → S, rovnako ako v dôkaze vety 25.3.1. Dokážte, že všetky vlastné čísla lineárneho operátora ψ ◦ ϕ: S → S ležia v intervale 0, 1 . 25.12. (a) Určte odchýlku rovín [eee1,eee2] a [eee1 + eee3,eee2 + e4] v euklidovskom priestore R4 . (b) Určte odchýlku roviny [eee1,eee2] a trojrozmerného lineárneho podpriestoru [eee1 + eee2 + eee3,eee2 + eee3 + eee4,eee3 + eee4 + eee5] v euklidovskom priestore R5 . 25.13. Overte vzťahy c0 = 1 2 a0, cn = 1 2 (an − ibn), c−n = 1 2 (an + ibn) pre n ≥ 1 medzi koeficientmi exponenciálneho a trigonometrického Fourierovho radu periodickej funkcie f. Nájdite spätné vyjadrenie koeficientov an, bn pomocou cn a c−n. 25.14. Označme C† T (R, R) resp. C† T (R, C) vektorové priestory všetkých po častiach spojitých periodických funkcií R → R resp. R → C s periódou T > 0 a ω = 2π/T. 552 25. Vybrané aplikácie združených operátorov (a) Dokážte že rovnosťou f, g = 1 T T 0 f(t) g(t) dt je definovaný skalárny súčin na C† T (R, C) (a bez pruhu nad g aj na C† T (R, R)). Ďalej overte, že f, g = 1 T a+T a f(t) g(t) dt pre ľubovoľné a ∈ R. (b) Konvolúciou funkcií f, g ∈ C† T (R, C) nazývame funkciu f ∗ g danú predpisom (f ∗ g)(x) = 1 T T 0 f(x − t)g(t) dt. Dokážte, že pre f, g ∈ C† T (R, C) platí f ∗ g ∈ C† T (R, C) a odvoďte z toho, že konvolúcia je komutatívna a asociatívna bilineárna operácia na vektorovom priestore C† T (R, C). (Návod: Najprv dokážte, že f ∗ g ∈ C† T (R, R) pre f, g ∈ C† T (R, R).) (c) Označme 1(C) vektorový priestor všetkých postupností komplexných čísel aaa = (an)n∈Z (indexovaných „na obe strany ) takých, že rad aaa 1 = n∈Z |an| konverguje. Dokážte, že 1(C) je lineárny podpriestor vektorového priestoru CZ všetkých postupností aaa: Z → C a · 1 je norma na 1(C). (d) Dokážte, že pre súčin aaabbb = (anbn)n∈Z postupností aaa,bbb ∈ 1 platí aaabbb ∈ 1. Odvoďte z toho, že rovnosťou aaa,bbb = n∈Z anbn je definovaný komplexný skalárny súčin na vektorovom priestore 1(C) (porovnajte s cvičením 23.10 (b)). (e) Konvolúciou postupností aaa,bbb ∈ 1 nazývame postupnosť aaa ∗ bbb = (cn)n∈Z, kde cn = k∈Z an−kbk. Dokážte, že pre aaa,bbb ∈ 1 platí aaa ∗ bbb 1 ≤ aaa 1 bbb 1. Odvoďte z toho, že aaa ∗ bbb ∈ 1(C) a následne, že konvolúcia je komutatívna a asociatívna bilineárna operácia na vektorovom priestore 1(C). (f) Nech an = f, einωt , bn = g, einωt sú Fourierove koeficienty funkcií f, g ∈ C† T (R, C). Dokážte Parsevalovu rovnosť f, g = aaa,bbb . (g) Pri rovnakom označení ako v (f) dokážte, že pre Fourierove koeficienty cn = f ∗ g, einωx konvolúcie f ∗ g platí cn = anbn. (h) Predpokladajme navyše, že aaa,bbb ∈ 1(C). Dokážte, že postupnosť ddd Fourierových koeficientov dn = f g, einωt súčinu funkcií f, g je konvolúciou postupností Fourierových koeficienov funkcií f, g, t. j. ddd = aaa ∗ bbb. 25.15. Predpokladajme, že f ∈ C† T (R, C) má po častiach spojitú deriváciu, čiže f ∈ C† T (R, C). (a) Potom pre Fourierove koeficienty cn = f , einωt funkcie f platí cn = −inωcn, kde cn = f, einωt sú Fourierove koeficienty pôvodnej funkcie f. Dokážte. (b) Za predpokladu, že f : R → R, vyjadrite koeficienty an, bn trigonometrického Fourierovho radu funkcie f pomocou koeficientov an, bn trigonometrického Fourierovho radu funkcie f. Využite (a) a cvičenie 25.13 a výsledok overte deriváciou trigonometrického Fourierovho radu funkcie f člen za členom. 25.16. (a) Sformulujte Parsevalovu rovnosť pre trigonometrické Fourierove rady. (b) Dokážte, že ∞ n=1 1 n2 = π2 6 . (Návod: Vypočítajte trigonometrické Fourierove koeficienty funkcie f(x) = x na intervale −π, π a použite Parsevalovu rovnosť.) (c) Vypočítate súčet radu ∞ n=1 1 (2n−1)2 . 26. Hermitovské operátory v kvantovej mechanike V tejto kapitole sa oboznámime s matematickým modelovaním merateľných fyzikálnych veličín (hovoríme im tiež pozorovateľné) v kvantovej mechanike pomocou hermitovských operátorov. To si však vynúti doposiaľ najrozsiahlejší výlet mimo územia lineárnej algebry do iných oblastí matematiky – najmä funkcionálnej analýzy. V súlade s označením zaužívaným v kvantovej mechanike budeme stavové vektory značiť gréckymi písmenami ϕ, χ, ψ a pod., zatiaľ čo lineárne operátory na stavovom priestore budeme značiť najrôznejšími písmenami – typicky A, B, X, Y , Z, P, H –, len nie ϕ, ψ ako doteraz. V prístupe ku klasickej mechanike, s ktorým sme sa zoznámili v paragrafe 17.6, je okamžitý stav nejakého systému matematicky zachytený ako vektor (bod) vo vhodnom stavovom priestore. V prípade sústavy n pohybujúcich sa hmotných bodov to je 6n-rozmerný euklidovský priestor Rn×6 . Jednotlivé zložky xij, pij daného vektora (XXX,PPP), kde XXX,PPP ∈ Rn×3 , predstavujú súradnice polohy resp. hybnosti i-teho hmotného bodu v smeroch troch súradných osí. Hodnota akejkoľvek fyzikálnej veličiny, ktorú možno priradiť takejto sústave, je jednoznačne určená jej stavom. Matematicky ju teda možno zachytiť ako funkciu zo stavového priestoru do reálnych čísel. No v dôsledku toho, že množinové univerzum obsahuje tiež obrovské množstvo „patologických funkcií, nie každá takáto funkcia predstavuje merateľnú fyzikálnu veličinu. Preto za matematické modely fyzikálnych veličín zvykneme považovať len v nejakom zmysle „slušné funkcie, napr. dostatočne hladké alebo dostatočne dobre integrovateľné. Príkladmi takých funkcií sú samotné jednotlivé zložky polôh a hybností, t. j. priradenia (XXX,PPP) → xij, resp. (XXX,PPP) → pij, alebo Hamiltonova funkcia H(XXX,PPP) = n i=1 1 2mi pppi 2 + n i=1 Ui(xxxi) + i 0 existuje yyy ∈ S také, že xxx − yyy < ε. 566 26. Hermitovské operátory v kvantovej mechanike v dôsledku kvadratickej integrovateľnosti funkcií f, g (ich limity pre x → ±∞ sú totiž rovné 0). Avizovaný Heisenbergov vzťah neurčitosti pre pozorovateľné polohy a hybnosti možno dokázať veľmi jednoducho. 26.6.1. Veta. Komutátor pozorovateľných polohy X a hybnosti P pre kvantovomechanický systém s jedným stupňom voľnosti je [X, P] = i . V dôsledku toho pre ich stredné kvadratické odchýlky v ľubovoľnom stave ϕ platí ∆ϕX · ∆ϕP ≥ 2 . Dôkaz. Overíme len uvedenú rovnosť pre komutátor. Heisenbergova nerovnosť pre ich kvadratické odchýlky je potom dôsledkom vety 26.2.1. Zvoľme dostatočne slušnú (stačí diferencovateľnú) funkciu ϕ ∈ L2(R). Potom pre každé x ∈ R platí [X, P]ϕ (x) = (XPϕ)(x) − (PXϕ)(x) = x i ϕ (x) − i (xϕ) (x) = i xϕ (x) − ϕ(x) − xϕ (x) = i ϕ(x). Pri pokuse znormovať vlastné funkcie ψp,0 narazíme na ďalší problém: integrál ψp,0 2 = R |ψp,0(x)|2 dx = ∞ −∞ 1 dx = +∞ diverguje. Vidíme, že hoci sú vlnové funkcie ψp,0 – na rozdiel od distribúcií δa – „normálne funkcie R → C, jedno majú s nimi spoločné: ani jedny ani druhé nepatria do priestoru L2(R). Rozšírenie priestoru funkcií o nové objekty, s cieľom zabezpečiť vlastné funkcie pre niektoré hermitovské operátory, vzdialene pripomína rozšírenie poľa reálnych čísel pomocou komplexných, ktorým sme dosiahli, aby všetky lineárne operátory na konečnorozmerných vektorových priestoroch nad R mali spektrum plnej algebraickej váhy. Z nekonečnej veľkosti výrazu ψp,0 2 navyše vyplýva, že žiadnou voľbou amplitúdy 0 < C ∈ R nemožno dosiahnuť, aby pre funkciu ψp = Cψp,0 platilo ψp = 1. Normovaciu konštantu C preto zvolíme tak, aby sme dosiahli splnenie podmienky ψp, ψq = δ(p − q) pre p, q ∈ R. Rovnako ako rovnosť δa, δb = δ(a − b) pre Diracove funkcie, je to zrejme najvhodnejšia obdoba podmienky vvvj,vvvk = δjk, charakterizujúcej 26.6. Pozorovateľná hybnosti 567 ortonormálne bázy v konečnorozmerných unitárnych priestoroch. S využitím symbolickej rovnosti R eipx dx = 2πδ(p) dostávame ψp, ψq = R C eipx/ · C e−iqx/ dx = C2 R ei(p−q)x/ dx = 2π C2 δ(p − q). Z toho dôvodu volíme C = 1/ √ 2π , takže normované de Broglieho vlnové funkcie majú tvar ψp(x, t) = 1 √ 2π exp i (px − Et) pre časovo závislú rovinnú vlnu, resp. ψp(x) = 1 √ 2π eipx/ pre bezčasovú rovinnú vlnu. Pre časticu s troma stupňami voľnosti pohybujúcu sa v trojrozmernom priestore sú pozorovateľné hybnosti Px, Py, Pz v smeroch súradných osí x, y resp. z reprezentované imaginárnymi násobkami operátorov parciálnych derivácií podľa príslušnej premennej na priestore L2 R3 (presnejšie na jeho vhodnom hustom podpriestore) Px = i ∂ ∂x , Py = i ∂ ∂y , Pz = i ∂ ∂z . K nim prislúchajúce normované vlastné funkcie, zopovedajúce vlastným hodnotám px, py resp. pz majú tvar ψ(1) px (x, y, z) = ψpx (x) = 1 √ 2π eixpx/ , ψ(2) py (x, y, z) = ψpy (y) = 1 √ 2π eiypy/ , ψ(3) pz (x, y, z) = ψpz (z) = 1 √ 2π eizpz/ . Priamym výpočtom možno overiť Heisenbergove komutačné vzťahy [X, Y ] = [X, Z] = [Y, Z] = [Px, Py] = [Px, Pz] = [Py, Pz] = 0, [X, Py] = [X, Pz] = [Y, Px] = [Y, Pz] = [Z, Px] = [Z, Py] = 0, 568 26. Hermitovské operátory v kvantovej mechanike [X, Px] = [Y, Py] = [Z, Pz] = i . Inak povedané, rovnako ako operátory súradníc X, Y , Z, aj operátory hybnosti Px, Py, Pz v smeroch jednotlivých osí navzájom komutujú. Takisto komutujú operátory súradníc a hybností v smeroch rôznych osí. Avšak operátory polohy a hybnosti v smere tej istej osi majú nenulový komutátor i , teda presnosť ich súčasnej merateľnosti je obmedzená Heisenbergovým vzťahom neurčitosti. Vektorová pozorovateľná (všetkých troch zložiek) hybnosti je reprezentovaná vektorovým operátorom PPP = (Px, Py, Pz) = iiiPx + jjjPy + kkkPz : L2 R3 ) → L2 R3 × L2 R3 × L2 R3 , ktorý má tvar imaginárneho násobku operátora gradientu PPP = i ∂ ∂x , ∂ ∂y , ∂ ∂z = i iii ∂ ∂x + jjj ∂ ∂y + kkk ∂ ∂z = i grad. Vektoru hybnosti ppp = (px, py, pz) = px iii+py jjj+pz kkk ∈ R3 , zloženému z trojice vlastných hodnôt px, py, pz operátorov Px, Py resp. Pz, zodpovedá vlastná funkcia ψppp(x, y, z) = ψpx (x) ψpy (y) ψpz (z) = 1 √ 2π eixpx/ 1 √ 2π eiypy/ 1 √ 2π eizpz/ = 1 (2π )3/2 eirrrppp/ , kde rrr = (x, y, z) je polohový vektor a rrrppp = xpx + ypy + zpz je štandardný skalárny súčin vektorov rrr a ppp. 26.7 Polohová a hybnostná reprezentácia – Fourierova transformácia Napriek diametrálne odlišnému tvaru operátorov polohy a hybnosti vládne v ich vzťahu zvláštna, hoci na prvý pohľad nie celkom viditeľná symetria. Aj na systém de Broglieho vlnových funkcií (ψp)p∈R sa možno dívať ako na „spojitú ortonormálnu bázu priestoru L2(R), podobne ako na systém Diracových δ-funkcií (δa)a∈R. Pre funkciu f ∈ L2(R) označme f(p) = f, ψp = 1 √ 2π R f(x) e−ipx/ dx koeficient pri funkcii ψp vo vyjadrení pôvodnej funkcie f v tvare „spojitej lineárnej kombinácie f = R f(p) ψp dp. 26.7. Polohová a hybnostná reprezentácia – Fourierova transformácia 569 Ak si totiž uvedomíme symetriu premenných x a p v de Broglieho vlnovej funkcii ψp(x) = 1 √ 2π eipx/ = ψx(p), a podmienku ortonormality ψx, ψy = δ(x − y), ľahko overíme, že pre každé x ∈ R skutočne platí R f(p) ψp(x) dp = R f, ψp ψp(x) dp = R R f(y) ψp(y) dy ψp(x) dp = R f(y) R ψx(p) ψy(p) dp dy = R f(y) ψx, ψy dy = R f(y) δ(x − y) dy = f(x). Funkciu f : R → C tak možno chápať ako „súradnice funkcie f vzhľadom na „bázu (ψp)p∈R. Poznamenajme, že formula f(p) = f, ψp ako aj uvedený výpočet nefungujú pre všetky funkcie f ∈ L2(R), ale opäť iba pre funkcie z istého hustého podpriestoru. Nad „prízemné otázky typu, ktoré funkcie to sú a čo s tými ostatnými, sa však veľkoryso povznesieme. Priradením f → f je definované zobrazenie L2(R) → L2(R), nazývané spojitá Fourierova transformácia na R alebo len krátko Fourierova transformácia. Samozrejme, z matematického hľadiska je výskyt Planckovej konštanty vo Fourieovej transformácii nepodstatný – inak povedané, Fourierovu transformáciu možno definovať pre ľubovoľnú hodnotu parametra . 5 To je jeden z dôvodov, prečo nielen v matematike no i vo fyzike často kladieme = 1, čo zodpovedá voľbe takej sústavy jednotiek, v ktorej je Planckova konštanta jednotkou účinku. My však budeme práve z fyzikálnych dôvodov konštantu predsa len explicitne uvádzať. 26.7.1. Veta. Fourierova transformácia f → f je unitárny lineárny operátor na Hilbertovom priestore L2(R), ktorý prevádza vektory „ortonormálnej bázy (ψp)p∈R na vektory „ortonormálnej bázy (δp)p∈R. Navyše, pre ϕ ∈ L2(R) platí (Pϕ)(p) = p ϕ(p) a (Xϕ)(p) = i d dp ϕ(p). 5 K tomu treba poznamenať, že aplikáciami v kvanotvej mechanike sa význam Fourierovej transformácie zďaleka nevyčerpáva. Napr. fakt, že Fourierova transformácia prevádza operátor derivácie d/ dx na operátor násobenia funkcie násobkom argumentu (i/ )p (pozri nasledujúcu vetu 26.7.1), z nej robí učinný prostriedok používaný pri riešení diferenciálnych rovníc. 570 26. Hermitovské operátory v kvantovej mechanike Dôkaz. Keďže linearita Fourierovej transformácie je zrejmá, stačí overiť, že zachováva skalárny súčin. Zvoľme „slušné funkcie ϕ, χ ∈ L2(R) a (len pre účely tohto výpočtu) položme = 1. Potom ϕ, χ = R ϕ(p) χ(p) dp = R ϕ, ψp ψp, χ dp = R 1 √ 2π R ϕ(x) e−ipx dx · 1 √ 2π R eipy χ(y) dy dp = 1 2π R ϕ(x) R χ(y) R eip(y−x) dp dy dx = 1 2π R ϕ(x) R χ(y) · 2π δ(y − x) dy dx = R ϕ(x) χ(x) dx = ϕ, χ . Ďalej pre p, q ∈ R platí ψp(q) = ψp, ψq = δ(p − q) = δp(q), teda ψp = δp. Posledné dve rovnosti overíme jednoduchými výpočtami (Pϕ)(p) = Pϕ, ψp = ϕ, Pψp = ϕ, p ψp = p ϕ, ψp = p ϕ(p), (Xϕ)(p) = Xϕ, ψp = ϕ, Xψp = ϕ, i d dp ψp = − i d dp ϕ, ψp = i d dp ϕ(p). Klasický stavový priestor R môžeme rovnako dobre chápať aj ako priestor hybností častice s jedným stupňom voľnosti – a nie jej polôh. Následne sa môžeme na kvantovomechanický stavový priestor L2(R) pozerať ako na priestor kvadraticky integrovateľných funkcií ϕ: R → C premennej hybnosti p. Náš pôvodný spôsob opisu kvantovomechanických stavov sa nazýva súradnicová prípadne polohová reprezentácia – v druhom prípade hovoríme o hybnostnej reprezentácii. Prepojenie medzi oboma reprezentáciami je analogické zámene jednej ortonormálnej bázy druhou v konečnorozmernom unitárnom priestore. Inak povedané, funkcie z L2(R) môžeme vyjadrovať jednak vzhľadom na „ortonormálnu bázu tvorenú vlastnými vektormi δx operátora polohy X (t. j. obvyklým spôsobom), jednak vzhľadom na „ortonormálnu bázu tvorenú vlastnými vektormi ψp operátora hybnosti P. Vzhľadom na túto „bázu má pozorovateľná hybnosti P (v polohovej reprezentácii daná operátorom i d dx ) prirodzene tvar operátora násobenia argumentom p so zovšeobecnenými vlastnými funkciami δp. Pozorovateľná polohy X (v polohovej 26.8. Ďalšie pozorovateľné – momenty hybnosti 571 reprezentácii daná násobením súradnicou x) má zasa v hybnostnej reprezentácii tvar imaginárneho násobku operátora derivácie i d dp . Pritom vlastnej hodnote x zodpovedá ako vlastná funkcia normovaná de Broglieho bezčasová vlna ψx(p) = ψx(−p) = 1 √ 2π e−ipx/ , v ktorej sme antisymetrickým spôsobom zamenili úlohy premenných x a p. Pre úplnosť už len poznamenajme, že v trojrozmernom prípade má Fourierova transformácia „slušnej funkcie f ∈ L2 R3 tvar f(ppp) = f, ψppp = R3 f(rrr) ψppp(rrr) d3 rrr = 1 (2π )3/2 R3 f(x, y, z) e−irrrppp/ d3 rrr, kde rrr = (x, y, z), ppp = (px, py, pz) a d3 rrr = dx dy dz. Vektorovým pozorovateľným hybnosti PPP resp. polohy RRR zodpovedajú v hybnostnej reprezentácii operátory dané predpismi (PPPϕ)(ppp) = ppp ϕ(ppp) = (px, py, pz) ϕ(ppp), (RRRϕ)(ppp) = i gradϕ(ppp) = i ∂ϕ(ppp) ∂px , ∂ϕ(ppp) ∂px , ∂ϕ(ppp) ∂px . 26.8 Ďalšie pozorovateľné – momenty hybnosti V klasickej mechanike sú fyzikálne veličiny matematicky modelované ako („slušné ) funkcie na stavovom priestore, t. j. ako funkcie F(x1, . . . , xn, p1, . . . , pn) = F(xxx,ppp) premenných polôh xi a hybností pj, kde n je počet stupňov voľnosti sústavy. V kvantovej mechanike zodpovedá takejto situácii stavový priestor L2(Rn ) a pozorovateľným polohy resp. hybnosti hermitovské operátory Xi, Pj, ktorých konkrétny matematický tvar závisí na zvolenej reprezentácii. Potom zrejme najprirodzenejší spôsob, ako zachytiť kvantovomechanický analóg klasickej fyzikálnej veličiny danej funkciou F : R2n → R, spočíva v jej reprezentácii operátorom A = F(X1, . . . , Xn, P1, . . . , Pn). Takýto prístup hladko funguje pre fyzikálne veličiny, ktoré závisia len na jedinej z premenných xi, pj. Ak je to napr. premenná xi, t. j. F(xxx,ppp) = f(xi), kde f : R → R, tak operátor A = f(Xi) funguje v polohovej reprezentácii ako násobenie funkčnou hodnotou argumentu xi: (Aϕ)(xxx) = f(xi) ϕ(xxx) 572 26. Hermitovské operátory v kvantovej mechanike pre ϕ ∈ L2 Rn , xxx ∈ Rn . Ak ide o funkciu závislú na jedinej premennej pj, t. j. F(xxx,ppp) = g(pj), kde g: R → R, tak operátor B = g(Pj) je výhodnejšie opisovať v hybnostnej reprezentácii: (Bχ)(ppp) = g(pj) χ(ppp) pre χ ∈ L2 Rn , ppp ∈ Rn . Možnosť voľby výhodnejšej z oboch reprezentácií sa však stráca, ak funkcia F závisí zároveň na niektorej zo súradníc polohy Xi aj hybnosti Pj. V takom prípade si vieme jednoducho poradiť, ak funkcia F je polynóm v premenných x1, . . . , xn, p1, . . . , pn, ktorý neobsahuje žiaden súčin xm j pk j mocnín premenných zodpovedajúcich nekomutujúcim pozorovateľným Xj, Pj. Mocninám pk j premennej hybnosti pj (v polohovej reprezentácii) zodpovedajú mocniny operátora Pj: Pk j = i ∂ ∂xj k = i k ∂k ∂xk j . Ak F je polynóm pozostávajúci zo sčítancov tvaru axm1 1 . . . xmn n pk1 1 . . . pkn n , pričom mjkj = 0 pre všetky j ≤ n, tak operátor F(X1, . . . , Xn, P1, . . . , Pn) pozostáva z tomu zodpovedajúceho súčtu operátorov aXm1 1 . . . Xmn n Pk1 1 . . . Pkn n . To znamená, že aplikáciou takého operátora na (dostatočne mnohokrát diferencovateľnú) funkciu ϕ ∈ L2(Rn ) dostaneme funkciu, ktorá je súčtom funkcií tvaru a i k xm1 1 . . . xmn n ∂k ϕ ∂xk1 1 . . . ∂xkn n , kde k = k1 + . . . + kn. Pre zložitejšie funkcie F, a taktiež ak F obsahuje súčiny mocnín niektorých dvojíc premenných xj, pj, výraz F(X1, . . . , Xn, P1, . . . , Pn) zostavený podľa uvedeného receptu nemusí dávať hermitovský operátor. Vo všeobecnosti neexistuje nijaký jednoduchý univerzálny návod, ako priradiť funkcii F príslušnú pozorovateľnú. Problém sa zvykne riešiť pre jednotlivé prípady ad hoc. Napr. funkcii F(x, p) = xp obyčajne priraďujeme pozorovateľnú 1 2 (XP + PX). Príkladom, kde naznačný prístup funguje, sú pozorovateľné momentov hybnosti vzhľadom na jednotlivé súradné osi. Klasický moment hybnosti je vektorová veličina definovaná ako vektorový súčin lll = rrr × ppp = x y z px py pz iii jjj kkk 26.9. Hamiltonián a Schrödingerova rovnica 573 vektorov polohy rrr = (x, y, z) a hybnosti ppp = (px, py, pz). Jeho jednotlivé zložky, t. j. momenty hybnosti vzhľadom na osi x, y resp. z, sú lx = ypz − zpy, ly = zpx − xpz, lz = xpy − ypx. Pozorovateľným momentov hybnosti vzhľadom na jednotlivé osi preto zodpovedajú hermitovské operátory Lx = Y Pz − ZPy = i y ∂ ∂z − z ∂ ∂y , Ly = ZPx − XPz = i z ∂ ∂x − x ∂ ∂z , Lz = XPy − Y Px = i x ∂ ∂y − y ∂ ∂x . Vektorová pozorovateľná momentu hybnosti má potom tvar LLL = RRR × PPP = X Y Z Px Py Pz iii jjj kkk = i x y z ∂ ∂x ∂ ∂y ∂ ∂z iii jjj kkk . Ešte poznamenjame, že nie všetky pozorovateľné majú klasickú analógiu, t. j. vznikajú z vhodných funkcií F : R2n → R. Napr. komutátor [X, P] = XP − PX nie je hermitovský ale antihermitovský operátor – hermitovský je až operátor (1/i)[X, P]. Táto pozorovateľná však nemá analógiu v klasickej teórii. Podstatne dôležitejším príkladom pozorovateľnej bez klasickej analógie je spin, čiže vnútorný moment hybnosti. Rovnako nazývame spinom aj najväčšiu hodnotu priemetu vnútorného momentu hybnosti v jednotkách . Táto veličina nadobúda polocelé hodnoty 1/2, 3/2, 5/2, . . . pre fermióny (elektróny, protóny, neutróny,. . . ) a celé hodnoty 0, 1, 2, . . . pre bozóny (fotóny, W- a Z-bozóny, pióny, . . . ). Ak chceme brať do úvahy aj spin častíc, treba stavový priestor vhodne modifikovať. Napr. pre jednu časticu so spinom 1/2 musíme pôvodný unitárny priestor V nahradiť tenzorovým súčinom V ⊗ C2 . Pre n identických častíc so spinom 1/2 poslúži tenzorový súčin n exemplárov priestoru V ⊗ C – v ňom sa však musíme obmedziť na podpriestor antisymetrických tenzorov (pozri paragraf 33.6). 26.9 Hamiltonián a Schrödingerova rovnica 26.9.1. Hamiltonián. Vari najdôležitejšou pozorovateľnou popisujúcou vlastnosti kvantovomechanickej sústavy je – podobne ako v klasickej mechanike 574 26. Hermitovské operátory v kvantovej mechanike – pozorovateľná energie alebo hamiltonián. Kvôli jednoduchosti sa pre začiatok obmedzíme len na jedinú časticu o hmotnosti m a s troma stupňami voľnosti, pohybujúcu sa v R3 v konzervatívnom poli danom potenciálnou energiou, ktorá sa nemení v čase. Klasický výraz pre Hamiltonovu funkciu je v takom prípade súčtom dvoch častí: kinetickej energie 1 2m ppp 2 = 1 2m p2 x + p2 y + p2 z a potenciálnej energie V (rrr), ktorá je výlučne funkciou (vektora) polohy rrr = (x, y, z), a plne určuje charakter poľa. V dôsledku toho je Hamiltonov operátor alebo hamiltonián (v polohovej reprezentácii) súčtom H = 1 2m P2 x + P2 y + P2 z + V (rrr) = − 2 2m ∂2 ∂x2 + ∂2 ∂y2 + ∂2 ∂z2 + V (rrr) = − 2 2m ∆ + V (rrr), kde ∆ = ∂2 ∂x2 + ∂2 ∂y2 + ∂2 ∂z2 je Laplaceov operátor. Prvý člen − 2 2m ∆ predstavuje pozorovateľnú kinetickej a druhý V (rrr) pozorovateľnú potenciálnej energie. Pre istotu ešte pripomíname, že H je lineárny operátor, ktorý (dvakrát diferencovateľnej) funkcii ψ ∈ L2(R) priradí funkciu Hψ = − 2 2m ∆ψ + V (rrr)ψ = − 2 2m ∂2 ψ ∂x2 + ∂2 ψ ∂y2 + ∂2 ψ ∂z2 + V (rrr)ψ. Hamiltonián zodpovedajúci systému n častíc v R3 je hermitovský operátor na priestore L2 R3n kvadraticky integrovateľných funkcií tvaru ψ(rrr1, . . . ,rrrn), kde rrrj = (xj, yj, zj) je polohový vektor j-tej častice. Dostaneme ho sčítaním príspevkov kinetických a potenciálnych energií jednotlivých častíc, ku ktorým navyše pristupuje súčet potenciálnych energií vzájomných interakcií H = − 2 2 n j=1 1 mj ∂2 ∂x2 j + ∂2 ∂y2 j + ∂2 ∂z2 j + n j=1 Vj(rrrj) + j 0, a túto energiu už oscilátor nemôže vyžiariť. Stavy ψn, kde n ≥ 1, zodpovedajúce vyšším energetickým hladinám nazývame vzbudené alebo excitované. Obrázky vľavo znázorňujú základný stav ψ0 a vzbudené stavy ψn pre 1 ≤ n ≤ 5. Vpravo sú im zodpovedajúce hustoty pravdepodobnosti |ψn|2 . Všimnite si, že pravdepodobnosť základného stavu je sústredená v blízkosti rovnovážnej polohy x = 0, čo je prirodzené pre stav s malou energiou. Vo všeobecnosti miesta lokálnych maxím pravdepodobnosti výskytu častice splývajú s miestami lokálnych extrémov (maxím aj miním) funkcie ψn, kde je derivácia ψn(x) teda aj hybnosť (Pψ)(x) = i ψn(x) nulová. Časticu v danom stave tak pravdepodobnejšie nájdeme tam, kde je jej hybnosť (t. j. aj rýchlosť) najmenšia. S rastúcou energiou sa počet lokálnych maxím pravdepodobnosti výskytu zvyšuje vždy o jednotku a jej globálne maximá sa posúvajú do blízkosti miest zodpovedajúcich klasickým bodom obratu (tie ležia na priesečníkoch paraboly E = 1 2 x2 a vodorovných priamok vyznačujúcich príslušné energetické hladiny a zároveň osi x pre jednotlivé stavy ψn), kde celá energia stavu oscilátora má podobu potenciálnej energie (a kinetická energia je nulová). Podľa klasickej teórie sa častica môže nachádzať len „vovnútri paraboly , t. j. na úsečke ohraničenej klasickými bodmi obratu. V kvantovej mechanike existuje nenulová pravdepodobnosť objaviť ju aj mimo tejto úsečky, teda tam, kde sa z klasického hľadiska nemôže vyskytovať. Táto pravdepodobnosť však s rastúcou hodnotou |x| rýchle klesá k nule. 584 26. Hermitovské operátory v kvantovej mechanike Obr. 26.1. Kvantový harmonický oscilátor: vľavo vlastné stavy, vpravo im zodpovedajúce hustoty pravdepodobnosti. V kvantovej teórii poľa sa elektromagnetické pole matematicky popisuje ako sústava nekonečne mnohých (až kontinua) harmonických oscilátorov s rôznymi kruhovými frekvenciami ω. Presnejšie, každý stav (oscilačný mód) elektromagnetického poľa (ako aj iných bozónových polí) s daným vektorom hybnosti a polarizáciou je reprezentovaný kvantovým harmonickým oscilátorom. Kvantové číslo n (vlastné číslo príslušného modifikovaného hamiltoniánu M = A∗ A) udáva počet fotónov v danom stave. Základný stav, tzv. vákuum, t. j. „nula fotónov , je superpozíciou základných stavov všetkých jednotlivých oscilátorov. Matematický model tak predpisuje energii poľa v tomto stave nekonečnú hodnotu, hoci z klasického hľadiska by jeho energia mala byť nulová. S podobnými matematickými ťažkosťami sa súčasné fyzikálne teórie vyrovnávajú zďaleka nie uspokojivým spôsobom. Cvičenia 26.1. Nech V je unitárny priestor a dim V ≥ 2. Cvičenia 585 (a) Nájdite príklady hermitovských operátorov A, B : V → V takých, že ich komutátor [A, B] nie je hermitovský operátor. (b) Dokážte, že komutátor [A, B] hermitovských operátorov A, B : V → V je antihermitovský operátor, teda i[A, B] je hermitovský operátor. 26.2. Nech L2(R) označuje vektorový priestor všetkých funkcií f : R → C, pre ktoré má nevlastný integrál R |f(x)|2 dx konečnú hodnotu, so skalárnym súčinom f, g = R f(x)g(x) dx. (a) Dokážte, že pre f, g ∈ L2(R) má nevlastný integrál R f(x)g(x) dx konečnú hod- notu. (b) Uvedomte si, že · , · je síce kososymetrická poldruhalineárna forma na L2(R), nie je však kladne definitná ale iba kladne semidefinitná. Nájdite príklady funkcií f ∈ L2(R), ktoré nie sú identicky rovné 0, jednako f, f = 0. (c) Dokážte, že N = {f ∈ L2(R); f = 0} je lineárny podpriestor v L2(R). Vysvetlite, ako možno na faktorový priestor L2(R)/N (pozri cvičenie 9.8) preniesť skalárny súčin z L2(R), a dokážte, že L2(R)/N je unitárny priestor. (L2(R)/N je dokonca Hilbertov priestor; v matematickej literatúre sa pod Hilbertovým priestorom L2(R) väčšinou rozumie faktorový priestor L2(R)/N.) 26.3. Dokážte, že nasledujúce predpisy definujú samoadjungované lineárne operátory na vhodných „dosť veľkých lineárnych podpriestoroch priestoru L2(R): (a) X(f)(x) = xf(x), t. j. operátor polohy; (b) P(f)(x) = idf(x) dx , t. j. (až na multiplikatívnu konštantu) operátor hybnosti; (c) H(f)(x) = −d2 f(x) dx2 + x2 f(x), t. j. (až na multiplikatívnu konštantu) operátor energie čiže hamiltonián. 26.4. Overte komutačné vzťahy pre operátory polohy a hybnosti v smeroch osí x, y, z: (a) [X, Y ] = [X, Z] = [Y, Z] = 0; (b) [Px, Py] = [Px, Pz] = [Py, Pz] = 0; (c) [X, Py] = [X, Pz] = [Y, Px] = [Y, Pz] = [Z, Px] = [Z, Py] = 0; (d) [X, Px] = [Y, Py] = [Z, Pz] = i . 26.5. (a) Symbolickým integrovaním (prevedením trojného integrálu na trojnásobný) overte rovnosť R3 f(x, y, z) δrrr(x, y, z) dx dy dz = f(a, b, c) pre rrr = (a, b, c) a ľubovoľnú „slušnú funkciu f : R3 → C. (b) Odvoďte z toho zovšeobecnenú podmienku pre vektor vlastných hodnôt a vlastnú funkciu vektorového lineárneho operátora polohy RRR δrrr = rrrδrrr = (aδrrr, bδrrr, cδrrr). 26.6. Overte formulu pre inverznú Fourierovu transformáciu: Ak funkcia F(t) = f(t) = f, ψt = 1√ 2π R f(x) e−itx dx je Fourierovou transformáciou funkcie f vzhľadom na systém funkcií ψt(x) = 1√ 2π eitx , tak pôvodná funkcia f(x) = F(−x) = F, ψ−x = 1√ 2π R F(t) eitx dt je Fourierovou transformáciou funkcie F vzhľadom na systém funkcií ψ−x(t) = 1√ 2π e−itx . (Predpokladajte, že obe funkcie f a F sú „slušné natoľko, že umožňujú všetky obvyklé manipulácie s príslušnými nevlastnými integ- rálmi.) 26.7. Normálne alebo tiež Gaussovo pravdepodobnostné rozdelenie so strednou hodnotou 0 586 26. Hermitovské operátory v kvantovej mechanike a strednou kvadratickou odchýlkou σ > 0 je dané funkciou φ(x) = 1 σ √ 2π e−x2 /2σ2 , nazývanou hustota normálneho rozdelenia. (a) Odvoďte formulu pre Fourierovu transformáciu hustoty takého normálneho φ(t) = 1√ 2π R φ(x) e−itx dx = 1 2πσ R exp − x2 2σ2 − itx dx = σ√ 2π e−σ2 t2 /2 . (Návod: Úlohu preveďte vhodnou substitúciou na výpočet Laplaceovho integrálu R e−y2 dy = √ π – pozri cvičenie 14.20.) Funkciu φ(t) nazývame tiež charakteristickou funkciou normálneho rozdelenia. (b) Odvoďte z (a), že charakteristická funkcia normálneho rozdelenia so strednou hodnotou 0 a strednou kvadratickou odchýlkou σ je sama hustotou normálneho pravdepodobnostného rozdelenia s rovnakou strednou hodnotou 0 a strednou kvadratickou odchýlkou σ = 1/σ. Pre stredné kvadratické odchýlky normálnych rozdelení φ(x) a φ(t) teda platí σσ = 1 (čo možno tiež interpretovať ako istý prípad Heisenbergovho vzťahu neurčitosti). 26.8. (a) Overte komutačné vzťahy pre operátory momentov hybnosti vzhľadom na osi x, y, z: [Lx, Ly] = i Lz, [Ly, Lz] = i Lx, [Lz, Lx] = i Ly. (b) Označme L2 = L2 x + L2 y + L2 z operátor štvorca celkovej hybnosti. Overte komutačné vzťahy Lx, L2 = Ly, L2 = Lz, L2 = 0. 26.9. Zaveďme v R3 sférické súradnice x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ (všimnite si tradovanú malú redakčnú úpravu oproti sférickým súradniciam z paragrafu 14.4). Uhly θ, φ sa nazývajú polárny uhol resp. azimut. (a) Overte vyjadrenia operátorov momentov hybnosti vzhľadom na sférické súradnice: Lx = i sin φ ∂ ∂θ + ctg θ cos φ ∂ ∂φ , Ly = −i cos φ ∂ ∂θ − ctg θ sin φ ∂ ∂φ , Lz = −i ∂ ∂φ . (b) Overte vyjadrenie operátora štvorca celkového momentu hybnosti vo sférických súradniciach: L2 = − 2 sin θ 1 sin θ ∂2 ∂φ2 + ∂ ∂θ sin θ ∂ ∂θ . (c) Pokúste sa názorne geometricky zdôvodniť, prečo uvedené operátory závisia len na uhlových súradniciach θ, φ a nezávisia na dĺžkovej súradnici r. 26.10. Zúženie kreačného operátora A∗ na vlastný podpriestor Ker(M −n) modifikovaného hamiltoniánu M je lineárny izomorfizmus tohto podpriestoru na vlastný podpriestor Ker(M − (n + 1)) operátora M. Dokážte. Akú medzeru v úvahách paragrafu 26.10 o kvantovom harmonickom oscilátore zapĺňa toto pozorovanie? 26.11. (a) Overte, že funkcie ϕ0(x) = e−x2 /2 a ϕ+ 0 (x) = e−x2 /2 x 0 eu2 du sú lineárne nezávislé a vyhovujú diferenciálnej rovnici d2 ϕ dx2 = (x2 − 1)ϕ, teda tvoria jej fundamentálny systém riešení. (b) Riešte uvedenú diferenciálnu rovnicu rozvojom funkcie ϕ do mocninného radu ϕ(x) = ∞ n=0 an n! xn . (Na základe diferenciálnej rovnice odvoďte najprv rekurentný a potom explicitný vzťah pre koeficienty an.) (c) Pre aké hodnoty počiatočných koeficientov a0, a1 dostávame riešenia ϕ0 resp. ϕ+ 0 ? 26.12. (a) Ukážte, že lokálne extrémy vlastnej stavovej funkcie ψn kvantového harmonického oscilátora sú v takých bodoch x ∈ R, kde Pψn(x) = 0. (b) Vysvetlite, prečo hustota pravdepodobnosti výskytu častice v danom stave ψn Cvičenia 587 nadobúda lokálne maximá v tých istých bodoch x ∈ R ako v (a). (c) V akých bodoch x ∈ R nadobúda hustota pravdepodobnosti výskytu častice v danom stave ψn svoje lokálne minimá? 26.13. (a) Zmodifikujte definície cyklického podpriestoru a cyklického generátora lineárneho operátora z paragrafu 21.3 tak, aby dávali zmysel pre každý lineárny operátor T : V → V na (nie nutne konečnorozmernom) vektorovom priestore V , aj keď je celá nekonečná postupnosť xxx, T(xxx), T2 (xxx), . . . , Tn (xxx), . . . iterovaných obrazov vektora xxx ∈ V lineárne nezávislá. (b) Presvedčte sa, že vlastná funkcia ψ(x) = exp −mω 2 x2 oboch hamiltoniánov M a H je cyklickým generátorom cyklického podpriestoru kreačného operátora A∗ . (Pokročilejšími metódami možno ukázať, že tento podpriestor je hustý v L2(R).) 588 26. Hermitovské operátory v kvantovej mechanike Časť IV Grupy a algebry 27. Úvod do teórie grúp Pojem grupy hrá natoľko kľúčovú úlohu nielen v algebre, ale v celej modernej matematike a jej početných aplikáciách, že ani v našom kurze by už nebolo ďalej únosné sa mu vyhýbať. Systematické štúdium teórie grúp však nie je predmetom lineárnej algebry, teda ani tohto kurzu. Preto sa sústredíme hlavne na jej základné pojmy a výsledky v miere, ktorá nám umožní ich využitie pri hlbšom objasnení algebraickej a geometrickej štruktúry vektorových priestorov, bilineárnych a kvadratických foriem a lineárnych transformácií. Potom sa trochu podrobnejšie pozrieme na niektoré maticové grupy. V záujme ucelenosti výkladu a na ilustráciu niektorých pojmov, výsledkov a metód však neraz neodoláme pokušeniu povedať toho o grupách trochu viac, než je z hľadiska uvedených zámerov naozaj nevyhnutné. Pri analýze akéhokoľvek (nielen matematického) štruktúrovaného oboru objektov hrá dôležitú úlohu otázka jeho symetrie. Znalosť transformácií, ktoré zachovávajú príslušnú štruktúru (t. j. jej symetrií), nám totiž neraz umožňuje výrazne sprehľadniť a zjednodušiť jej popis. Čím je takýchto transformácií viac, tým symetrickejšiu štruktúru nesie spomínaný obor, malé množstvo takýchto transformácií naopak svedčí o nízkom stupni symetrie. Ukazuje sa, že (bijektívne) transformácie zachovávajúce danú štruktúru tvoria vždy grupu, t. j. množinu transformácií uzavretú vzhľadom na kompozíciu, obsahujúcu identickú transformáciu a spolu s každou transformáciou aj transformáciu k nej inverznú. Typickými príkladmi takýchto grúp sú kryštalografické grupy, alebo grupy transformácií euklidovských priestorov zachovávajúcich rôzne invarianty, ako napr. dĺžku, objem či uhol. Grupa transformácií daného štruktúrovaného oboru však v sebe nesie podstatne viac informácií o jeho symetrii, než len to, či je ich „veľa alebo „málo . I „rovnako veľké grupy sa totiž môžu výrazne líšiť svojou vlastnou vnútornou štruktúrou, a tým spätne mnoho vypovedať o symetrii a štruktúre pôvodných oborov. V tejto kapitole sa stručne oboznámime len s celkom základnými pojmami a výsledkami teórie grúp. V duchu modernej algebry ich však budeme študovať v abstraktnom poňatí, t. j. bez toho, aby sme predpokladali, že ide nutne o grupy transformácií. Tým sa budeme podrobnejšie venovať až v nasledujúcej kapitole. 27.1 Abstraktný pojem grupy Grupou nazývame množinu G vybavenú binárnou operáciou · : G × G → G, 592 27. Úvod do teórie grúp ktorá spĺňa nasledujúce podmienky, nazývané tiež axiómami teórie grúp: (a) (∀ a, b, c ∈ G) a(bc) = (ab)c , t. j. operácia · je asociatívna; (b) (∃ e ∈ G)(∀ a ∈ G) ae = ea = a & (∃ b ∈ G)(ab = ba = e) , t. j. existuje neutrálny prvok e ∈ G operácie · a ku každému a ∈ G existuje inverzný prvok b ∈ G vzhľadom na operáciu · . Ako už vieme z paragrafu 0.4, neutrálny prvok e ∈ G je prvou časťou podmienky (b) určený jednoznačne; podobne je jej druhou časťou jednoznačne určený inverzný prvok b ∈ G k danému a ∈ G. Hovoríme, že grupa G je komutatívna, alebo tiež abelovská, ak operácia · je komutatívna, t. j. platí ab = ba pre všetky a, b ∈ G. Uvedený spôsob zápisu, pri ktorom grupovú operáciu značíme · (a jej znak väčšinou vynechávame), prípadne ◦, nazývame multiplikatívny zápis. Grupovú operáciu vtedy nazývame súčinom alebo násobením, prípadne skladaním alebo kompozíciou. Neutrálny prvok nazývame tiež jednotkovým prvkom alebo jednotkou, prípadne identitou a značíme ho väčšinou e, ε alebo 1, prípadne III, id, ι a pod. Inverzný prvok k prvku a ∈ G značíme a−1 , občas tiež a alebo ¯a. Zrejmým spôsobom (porovnaj s paragrafom 1.2) zavádzame výrazy an pre a ∈ G, n ∈ Z. Grupovú operáciu, neutrálny prvok resp. inverzný prvok k danému môžeme, samozrejme, označiť hocako. Popri multiplikatívnom zápise sa však bežne používa už len tzv. aditívny zápis, pri ktorom grupovú operáciu značíme + a nazývame sčítaním, neutrálny prvok značíme 0 a nazývame nulou alebo nulovým prvkom a inverzný prvok značíme −a a nazývame opačným prvkom k prvku a ∈ G. Čitateľ by si mal samostane premyslieť, ako sa zmení formulácia grupových axióm (a), (b) pri prechode k aditívnemu zápisu. Výrazy a − b, na, pre a, b ∈ G, n ∈ Z, zavádzame obdobne ako v paragrafe 1.2. Aditívny zápis je rezervovaný takmer výlučne pre abelovské grupy. To neznamená, že by sme sa s komutatívnou grupou nemohli stretnúť v multiplikatívnom zápise. No uvedením nejakej grupy v aditívnom zápise už vlastne dávame najavo (pokiaľ výslovne nezdôrazníme opak), že ide o abelovskú grupu. Ako sme už naznačili, grupu väčšinou označujeme rovnakým znakom ako jej základnú množinu. Niekedy je však účelné zahrnúť do označenia grupy i príslušnú binárnu operáciu, prípadne aj jej neutrálny prvok, či tiež unárnu operáciu inverzného prvku; vtedy hovoríme napr. o grupe (G, ·), grupe (A, +, 0), grupe H, ·, e, −1 , a pod. Hovoríme, že grupa G je konečná resp. nekonečná, ak jej základná množina má príslušnú vlastnosť. Rádom konečnej grupy nazývame počet jej prv- kov. S niektorými jednoduchými príkladmi grúp sme sa už v našom kurze stretli. 27.1. Abstraktný pojem grupy 593 27.1.1. Príklad. Množina Z všetkých celých čísel tvorí grupu vzhľadom na operáciu sčítania. Podobne, pre n ≥ 1, tvorí grupu množina Zn = {0, 1, . . . , n− 1} všetkých zvyškových tried s operáciou sčítania modulo n (pozri paragraf 1.3). Zrejme (Z, +) aj všetky (Zn, +) sú napospol abelovské grupy. 27.1.2. Príklad. Každé pole K určuje hneď dve komutatívne grupy. Je to jednak aditívna grupa (K, +, 0), jednak multiplikatívna grupa (K {0}, ·, 1) jeho nenulových prvkov, ktorú zvykneme tiež značiť (K , ·, 1) alebo len krátko K . V prípade polí Q a R sa k nim pridružujú ešte multiplikatívne grupy (Q+ , ·, 1) resp. (R+ , ·, 1) kladných prvkov daného poľa. Podobne určuje každý vektorový priestor V nad ľubovoľným poľom K abelovskú grupu (V, +, 0). 27.1.3. Príklad. Z úvah vykonaných v paragrafe 0.5 vyplýva, že množina S(X) všetkých permutácií ľubovoľnej množiny X tvorí grupu vzhľadom na operáciu ◦ skladania zobrazení, s jednotkou idX. Táto grupa je pre # X ≥ 3 nekomutatívna. Pre konečnú množinu X = {1, . . . , n} nazývame grupu S(X) = Sn symetrickou grupou stupňa n; jej rád je zrejme n! . 27.1.4. Príklad. Množinu všetkých regulárnych matíc rozmeru n × n nad poľom K budeme odteraz značiť GL(n, K). Z výsledkov paragrafu 7.2 vyplýva, že GL(n, K) tvorí grupu vzhľadom na operáciu násobenia matíc, s jednotkou IIIn; nazývame ju všeobecná lineárna grupa (stupňa n nad poľom K) (GL je skratka anglického general linear). Pre n ≥ 2 je GL(n, K) nekomutatívna grupa. Poznámka. Pri pohľade na pred chvíľou uvedenú definíciu a za ňou nasledujúce dôverne známe príklady hĺbavejšieho čitateľa asi nevdojak napadne otázka, prečo sme s definíciou grupy tak dlho otáľali. Pritom je to definícia – najmä v porovnaní s definíciami poľa a vektorového priestoru (pozri paragrafy 1.2 a 1.5) – veľmi jednoduchá. Vlastne už v paragrafe 0.4 sme mali pohromade všetky pojmy potrebné nato, aby sme ju mohli vysloviť. Navyše, keby sme vtedy boli tak učinili, mohli sme trochu neskôr definície poľa a vektorového priestoru sformulovať podstatne kratšie a jednoduchšie. Napr. v definícii poľa (pozri paragraf 1.2) možno prvé štyri formuly ľavého stĺpca zhrnúť do podmienky, že množina K tvorí vzhľadom na sčítanie + komutatívnu grupu s nulovým prvkom 0, a celý ľavý stĺpec zasa do podmienky, že množina K = K {0} tvorí komutatívnu grupu vzhľadom na násobenie s jednotkovým prvkom 1 (potom nutne 1 ∈ K , teda 0 = 1). Zostáva už len jediná formula – distributívny zákon –, ktorá dáva do súvisu obe operácie. S istou dávkou zjednodušenia možno povedať, že pole pozostáva z dvoch komutatívnych grúp spojených distributívnym zákonom. 594 27. Úvod do teórie grúp Podobne možno prvé štyri formuly v definícii vektorového priestoru (pozri paragraf 1.5) nahradiť požiadavkou, že (V, +, 0) je abelovská grupa. No takýto prístup by popri spomínanom zisku mohol zároveň u čitateľa vyvolať mylný dojem, že pojem grupy je len verbálnou skratkou, slúžiacou na zjednodušenie niektorých zložitejších definícií iných algebraických pojmov. Navyše, pokiaľ by sme nechceli neorganicky odbočovať od témy, prípadne na prítomnosť grúp v našom výklade umelo upozorňovať, boli by sme obmedzení v podstate na grupy uvedené v príkladoch 27.1.1–4, v ktorých prevládajú abelovské grupy. Takéto obmedzenie by však zastieralo viaceré podstatné znaky sveta grúp, v ktorom naopak prevládajú grupy neabelovské. Práve stručnosť a jednoduchosť definície grupy má totiž za následok, že jej vyhovuje obrovské množstvo nesmierne rozmanitých matematických objektov, a tým aj prekvapivú zložitosť možnej štruktúry grúp. Abelovské grupy, a obzvlášť vektorové priestory patria práve k tým štruktúrne najjednoduchším predstaviteľom grúp. V nasledujúcom tvrdení, ktorého dôkaz prenechávame ako jednoduché cvičenie čitateľovi, je zhrnutých niekoľko najelementárnejších pravidiel pre počítanie v grupách. 27.1.5. Tvrdenie. Nech (G, ·, e) je grupa. Potom pre ľubovoľné prvky a, b, c ∈ G a m, n ∈ Z platí e−1 = e, a−1 −1 = a, (ab)−1 = b−1 a−1 , a0 = e, am+n = am an , amn = (am )n , v G sú splnené pravidlá o krátení zľava aj sprava, t. j. ab = ac ⇒ b = c, ac = bc ⇒ a = b, a každá z rovníc ax = b, resp. ya = b má v G jediné riešenie x = a−1 b, resp. y = ba−1 . 27.2 Podgrupy, generujúce množiny, cyklické grupy Nech (G, ·, e) je grupa. Hovoríme, že podmnožina S ⊆ G je podgrupa grupy G, ak e ∈ S a pre ľubovoľné a, b ∈ S platí ab ∈ S aj a−1 ∈ S. Inak povedané, podgrupa grupy G je jej podmnožina, ktorá obsahuje neutrálny prvok a je uzavretá vzhľadom na operácie súčinu a inverzného prvku v G. Zrejme každá podgrupa grupy G je zároveň sama grupou vzhľadom na grupovú operáciu zdedenú z G. Pri overovaní, či daná pomnožina grupy je jej podgrupou, býva niekedy užitočné nasledujúce tvrdenie. 27.2. Podgrupy, generujúce množiny, cyklické grupy 595 27.2.1. Tvrdenie. Nech (G, ·, e) je grupa a S ⊆ G. Potom S je podgrupa grupy G práve vtedy, keď S = ∅ a pre každé a, b ∈ S platí ab−1 ∈ S. Dôkaz. Zrejme každá podgrupa grupy G je neprázdna a uzavretá vzhľadom na operáciu (a, b) → ab−1 . Naopak, nech ∅ = S ⊆ G je uzavretá na uvedenú operáciu a s ∈ S je ľubovoľný prvok. Potom e = ss−1 ∈ S. Ďalej pre a, b ∈ S platí b−1 = eb−1 ∈ S a taktiež ab = a(b−1 )−1 ∈ S. Teda S je podgrupa grupy G. Pojem podgrupy danej grupy má niektoré spoločné črty s pojmom lineárneho podpriestoru daného vektorového priestoru: v oboch prípadoch ide o neprázdnu podmnožinu uzavretú vzhľadom na príslušné operácie. Navyše, lineárny podpriestor S vektorového priestoru V je zároveň podgrupou grupy (V, +, 0). Naopak, podgrupa S (aditívnej grupy) vektorového priestoru V je jeho lineárnym podpriestorom práve vtedy, keď je uzavretá aj na skalárne násobky. Každá grupa G obsahuje tzv. triviálnu podgrupu {e} a nevlastnú podgrupu G. Pritom, okrem prípadu G = {e}, ide zrejme o dve rôzne podgrupy. V nasledujúcich príkladoch si ukážeme niekoľko dôležitých typov netriviálnych vlastných podgrúp, čím zároveň trochu rozšírime našu zatiaľ skromnú zbierku grúp. 27.2.2. Príklad. Nech n ≥ 3 je prirodzené číslo. Označme ι identickú permutáciu množiny {1, . . . , n} a cyklickú permutáciu 1 → 2 → . . . → n−1 → n → 1. Potom permutácie ι = 0 , = 1 , . . . , k , . . . , n−1 predstavujú otočenia (proti smeru hodinových ručičiek) pravidelného n-uholníka s vrcholmi 1, . . . , n o uhly 2kπ/n pre 0 ≤ k ≤ n − 1. Ak n = 2m je párne, tak pre 1 ≤ k ≤ m označme σ2k−1 permutáciu zodpovedajúcu súmernosti n-uholníka podľa osi spájajúcej vrcholy k, m+k a σ2k permutáciu zodpovedajúcu súmernosti podľa osi strany spájajúcej vrcholy k, k +1 (a protiľahlej strany). Ak n je nepárne, tak σk pre 1 ≤ k ≤ n označuje permutáciu zodpovedajúcu osovej súmernosti podľa spojnice vrchola k so stredom protiľahlej strany n-uholníka. Prípad nepárneho n = 3 je znázornený na obrázku v paragrafe 0.5 (kde zrejme −1 = 2 ). Obrázok na dalšej strane ukazuje situáciu pre párne n = 4 (tentokrát −1 = 3 ). Pre každé n ≥ 3 tvorí množina {ι, , . . . , n−1 , σ1, . . . , σn} podgrupu symetrickej grupy Sn. Označujeme ju ∆n a nazývame grupou symetrií pravidelného n-uholníka alebo tiež dihedrálnou grupou stupňa n.1 Dihedrálna grupa ∆n má rád 2n a – okrem prípadu n = 3, kedy ∆3 = S3, – je to netriválna vlastná podgrupa symetrickej grupy Sn. 1 Používa sa tiež označenie Dn prípadne D2n. 596 27. Úvod do teórie grúp Obr. 27.1. Symetrie štvorca 27.2.3. Príklad. Z vety 0.5.1 vyplýva, že množina všetkých párnych permutácií množiny {1, . . . , n} tvorí podgrupu symetrickej grupy Sn. Hovoríme jej alternujúca grupa stupňa n a značíme ju An. Zrejme A0 = S0, A1 = S1, no pre n ≥ 2 má An rád n!/2 (rozmyslite si prečo), teda je to vlastná (a pre n ≥ 3 tiež netriviálna) podgrupa symetrickej grupy Sn. 27.2.4. Príklad. Ako sme už spomínali, množina C = C {0} tvorí grupu vzhľadom na násobenie. Z vlastností komplexných čísel možno ľahko nahliadnuť, že množina {z ∈ C; |z| = 1} je jej podgrupou. Hovoríme jej grupa komplexných jednotiek (nepliesť si s jednotkou ako neutrálnym prvkom grupy) a z dôvodov, ktoré vysvitnú neskôr, ju značíme U(1). Zrejme U(1) je nekonečná vlastná podgrupa grupy (C , ·). Podobne ako vo vektorovom priestore V generuje ľubovoľná množina X ⊆ V lineárny podpriestor [X], každá podmnožina X grupy G generuje istú podgrupu grupy G, ktorú teraz opíšeme. Pre X ⊆ G označme X = xk1 1 . . . xkn n ; n ∈ N & k1, . . . , kn ∈ Z & x1, . . . , xn ∈ X . Ak X = {x1, . . . , xm} je konečná množina, tak miesto {x1, . . . , xm} píšeme len x1, . . . , xm . Množinu X nazývame podgrupa generovaná množinou X. Tento názov je oprávnený nasledujúcim tvrdením. 27.2.5. Tvrdenie. Nech X je podmnožina grupy G. Potom množina X je najmenšia podgrupa grupy G taká, že X ⊆ X . Náčrt dôkazu. Podobne ako v tvrdení 4.2.1 pre vektorové priestory, i teraz možno ľahko dokázať, že 27.2. Podgrupy, generujúce množiny, cyklické grupy 597 (a) X je podgrupa grupy G; (b) pre každú podgrupu S ⊆ G platí X ⊆ S ⇒ X ⊆ S. Ak X = G, hovoríme, že množina X generuje grupu G, alebo, že X je množinou generátorov grupy G. Prvky množiny X potom nazývame generátory grupy G. Grupa G sa nazýva konečne generovaná, ak G má nejakú konečnú množinu generátorov. Štruktúrne najjednoduchšími grupami sú tzv. cyklické grupy, t. j. grupy generované jediným generátorom. Príkladom cyklickej grupy je grupa (Z, +) všetkých celých čísel, a taktiež grupy (Zn, +) pre každé kladné celé číslo n. Každá z týchto grúp (okrem prípadu n = 1, kedy však Z1 = {0} = 0 ) je totiž generovaná svojim prvkom 1. Každý prvok x grupy G v nej generuje cyklickú podgrupu x . Ak je konečná, tak jej rád # x nazývame rádom prvku x v G; ak je nekonečná, hovoríme, že prvok x ∈ G má nekonečný rád. Nasledujúce tvrdenie by sme mohli dostať ako jednoduchý dôsledok našich neskorších úvah. Zámerne ho však dokážeme celkom elementárnymi, no o to názornejšími prostriedkami. 27.2.6. Tvrdenie. Prvok x grupy G má konečný rád práve vtedy, keď existuje kladné celé číslo r také, že xr = e. Potom rádom prvku x je najmenšie kladné celé číslo r s touto vlastnosťou a x = e, x, . . . , xr−1 . Ak x má nekonečný rád, tak x = {xn ; n ∈ Z}, pričom xm = xn pre všetky celé čísla m = n. Dôkaz. Vezmime x ∈ G a uvažujme postupnosť mocnín x1 = x, x2 = xx, x3 = xxx, atď. Všetky jej členy patria do podgrupy x . Pokiaľ x má konečný rád, t. j. x je konečná, musia sa v tejto postupnosti vyskytnúť aspoň dva rovnaké členy, napr. xk a xk+r , kde k a r sú kladné celé čísla. Potom však xk e = xk = xk+r = xk xr , z čoho krátením zľava dostávame e = xr . Ak r je najmenšie kladné celé číslo s touto vlastnosťou, tak všetky prvky x0 = e, x1 = x, . . . , xr−1 sú navzájom rôzne (rozmyslite si, prečo), a ďalšie mocniny sa už cyklicky opakujú: xr = e, xr+1 = x, . . . , x2r−1 = xr−1 , atď. Ak si ešte uvedomíme, že pre 1 ≤ k ≤ r − 1 potom platí xk −1 = xr−k , je jasné, že x = {xk ; 0 ≤ k ≤ r − 1}. Z prvej časti dôkazu je zrejmé, že ak x ∈ G má nekonečný rád, tak všetky prvky uvažovanej nekonečnej postupnosti x, x2 , . . . , xn , . . . sú navzájom rôzne. Potom sa v nej nemôže vyskytnúť neutrálny prvok e. Navyše, žiadne dva z nich nemôžu byť navzájom inverzné. Teda xm = xn pre navzájom rôzne m, n ∈ Z a x = {xn ; n ∈ Z}. 598 27. Úvod do teórie grúp 27.3 Homomorfizmy a izomorfizmy Nech (G, ·), (H, ·) sú grupy. Zobrazenie ϕ: G → H sa nazýva homomorfizmus grúp, ak pre všetky a, b ∈ G platí ϕ(ab) = ϕ(a) · ϕ(b). Inak povedané, homomorfizmus je zobrazenie, ktoré zachováva operáciu súčinu v grupách. Nasledujúce tvrdenie ukazuje, že grupový homomorfizmus už nevyhnutne zachováva aj jednotku a operáciu inverzného prvku. 27.3.1. Tvrdenie. Nech ϕ: G → H je homomorfizmus grúp. Potom ϕ(eG) = eH a pre každé a ∈ G platí ϕ a−1 = ϕ(a)−1 . Dôkaz. Čitateľ asi sám prišiel na to, že kvôli rozlíšeniu jednotiek v grupách G a H sme ich pre potreby tohto tvrdenia a jeho dôkazu označili eG resp. eH. S využitím vlastnosti homomorfizmu dostávame ϕ(eG) · eH = ϕ(eG) = ϕ(eG · eG) = ϕ(eG) · ϕ(eG), z čoho po krátení zľava vyplýva eH = ϕ(eG). Na dôkaz rovnosti ϕ a−1 = ϕ(a)−1 stačí overiť, že ϕ a−1 sa správa ako inverzný prvok k prvku ϕ(a), t. j. platí ϕ(a) · ϕ a−1 = eH. Vďaka vlastnosti homomorfizmu a už dokázanej prvej rovnosti nám vyjde ϕ(a) · ϕ a−1 = ϕ aa−1 = ϕ(eG) = eH. Pre ľubovoľné dve grupy G, H je konštantné zobrazenie x → eH, ktoré každému prvku x ∈ G priradí jednotkový prvok grupy H, homomorfizmus grúp; nazývame ho triválny homomorfizmus. Čoskoro sa budeme mať možnosť zoznámiť aj s netriválnymi homomorfizmami. Opäť sa stretáme so zrejmou analógiou spájajúcou pojmy lineárneho zobrazenia medzi vektorovými priestormi a homomorfizmu grúp: sú to zobrazenia medzi ich základnými množinami, ktoré zachovávajú príslušné operácie. Navyše, lineárne zobrazenie ϕ: V → U je zároveň homomorfizmus grúp ϕ: (V, +) → (U, +). Naopak, homomorfizmus ϕ: (V, +) → (U, +) aditívnych grúp vektorových priestorov V a U je lineárnym zobrazením práve vtedy, keď ϕ zachováva aj skalárne násobky. Z toho dôvodu nie je potrebné uvádzať dôkazy zostávajúcich tvrdení tohto paragrafu. Čitateľ by si však mal samostatne premyslieť, ako ich dostane malými obmenami dôkazov príslušných tvrdení o lineárnych zobrazeniach, ktorých čísla mu na uľahčenie zakaždým uvedieme. 27.3. Homomorfizmy a izomorfizmy 599 27.3.2. Tvrdenie. Nech ψ: F → G, ϕ: G → H sú homomorfizmy grúp. Potom aj ich kompozícia ϕ ◦ ψ: F → H je homomorfizmus grúp. Dôkaz. Pozri tvrdenie 6.1.2. 27.3.3. Tvrdenie. Nech ϕ: G → H je homomorfizmus grúp, S ⊆ G je podgrupa grupy G a T ⊆ H je podgrupa grupy H. Potom aj ϕ(S) ⊆ H je podgrupa grupy H a ϕ−1 (T) ⊆ G je podgrupa grupy G. Dôkaz. Pozri tvrdenie 6.1.3. Nech ϕ: G → H je homomorfizmus grúp. Jeho jadrom resp. obrazom nazývame množinu Ker ϕ = ϕ−1 {eH} = {x ∈ G; ϕ(x) = eH}, resp. Im ϕ = ϕ(G) = {ϕ(x); x ∈ G}. Ako bezprostredný dôsledok tvrdenia 27.3.3 (pozri tiež tvrdenie 6.2.1) do- stávame 27.3.4. Tvrdenie. Nech ϕ: G → H je homomorfizmus grúp. Potom Ker ϕ je podgrupa grupy G a Im ϕ je podgrupa grupy H. Podobne ako vo vete 6.2.2 pre lineárne zobrazenia, možno pomocou jadra a obrazu charakterizovať aj injektívnosť resp. surjektívnosť grupových ho- momorfizmov. 27.3.5. Tvrdenie. Nech ϕ: G → H je homomorfizmus grúp. Potom (a) ϕ je injektívny práve vtedy, keď Ker ϕ = {eG}; (b) ϕ je surjektívny práve vtedy, keď Im ϕ = H. Bijektívny homomorfizmus grúp ϕ: G → H nazývame izomorfizmus grúp. Hovoríme, že grupy G, H sú izomorfné, označenie G ∼= H, ak existuje nejaký izomorfizmus ϕ: G → H. Zrejme injektívny homomorfizmus ϕ: G → H je zároveň izomorfizmom grupy G na podgrupu Im ϕ grupy H. Aj pre grupové izomorfizmy platí obdoba tvrdenia 6.3.1 pre lineárne izo- morfizmy. 27.3.6. Tvrdenie. Nech F, G, H sú grupy. (a) idG : G → G je izomorfizmus grúp. (b) Ak ϕ: G → H je izomorfizmus grúp, tak aj inverzné zobrazenie ϕ−1 : H → G je izomorfizmus grúp. 600 27. Úvod do teórie grúp (c) Ak ψ: F → G, ϕ: G → H sú izomorfizmy grúp, tak aj ϕ ◦ ψ: F → H je izomorfizmus grúp. V dôsledku toho pre ľubovoľné grupy F, G, H platí G ∼= G, G ∼= H ⇒ H ∼= G, F ∼= G & G ∼= H ⇒ F ∼= H. Inak povedané, vzťah ∼= izomorfnosti grúp je reflexívny, symetrický a tranzitívny, teda je to vzťah ekvivalencie. Izomorfné grupy môžeme z hľadiska ich štruktúry považovať za totožné. 27.3.7. Príklad. Nech (G, ·) je ľubovoľná grupa, a ∈ G. Keďže pre všetky m, n ∈ Z platí am+n = am an , znamená to, že predpisom ϕ(n) = an je definovaný homomorfizmus ϕ: (Z, +) → (G, ·). Zrejme Im ϕ = a je cyklická podgrupa grupy G generovaná prvkom a. Ak a má konečný rád r, tak Ker ϕ = rZ = {rn; n ∈ Z}; ak x má nekonečný rád, tak Ker ϕ = {0}. Teda ϕ je surjektívne práve vtedy, keď G = a , t. j. keď a generuje grupu G, a ϕ je injektívne práve vtedy, keď a má nekonečný rád. 27.3.8. Príklad. Nech 0 < a ∈ R. Keďže ax > 0 a ax+y = ax ay pre všetky x, y ∈ R, je predpisom ϕ(x) = ax definovaný homomorfizmus grúp ϕ: (R, +) → (R+ , ·). Ak a = 1, ide o triviálny homomorfizmus ϕ(x) = 1 pre každé x ∈ R, teda Ker ϕ = R a Im ϕ = {1}. Pre a = 1 je to však bijektívny homomorfizmus, teda izomorfizmus. Inverzný izomorfizmus ϕ−1 : (R+ , ·) → (R, +) je daný predpisom ϕ−1 (u) = loga u pre u ∈ R+ . Známa formula loga uv = loga u + loga v pre u, v ∈ R+ nie je vlastne nič iné než vlastnosť homomorfizmu zobrazenia u → loga u. Okrem iného sme práve dokázali, že aditívna grupa (R, +) a multiplikatívna grupa (R+ , ·) sú izomorfné. 27.3.9. Príklad. Pripomeňme, že RRRα = ( cos α − sin α sin α cos α ) ∈ GL(2, R) je matica otočenia euklidovskej roviny R2 okolo počiatku o uhol α (pozri príklad 6.4.3). Keďže pre α, β ∈ R platí známy vzťah RRRα ·RRRβ = RRRα+β, znamená to, že priradením α → RRRα je definovaný homomorfizmus grúp RRR: (R, +) → (GL(2, R), ·). Zrejme jadro KerRRR = 2πZ = {2kπ; k ∈ Z} ⊆ R tvorí podgrupa všetkých celočíselných násobkov čísla 2π a obraz ImRRR = {RRRα; α ∈ R} ⊆ GL(2, R) je práve podgrupa všetkých matíc otočení RRRα. 27.3.10. Príklad. Exponenciála rýdzo imaginárneho čísla ix, kde x ∈ R, je definovaná Eulerovým vzťahom eix = cos x + i sin x. Opäť platí ei(x+y) = 27.4. Rozklad grupy podľa podgrupy, normálne podgrupy 601 eix eiy pre všetky x, y ∈ R. To znamená, že priradením x → eix je definovaný homomorfizmus grúp ϕ: (R, +) → (C , ·). Ľahko možno nahliadnuť, že Ker ϕ = 2πZ a Im ϕ = U(1). 27.3.11. Príklad. Predošlé tri príklady majú veľmi dôležité spoločné zovšeobecnenie. Ak FFF je spojitý homomorfizmus aditívnej grupy R do všeobecnej lineárnej grupy GL(n, R) resp. GL(n, C), tak jeho obraz ImFFF sa nazýva jednoparametrická maticová grupa (pritom spojitosť maticovej funkcie FFF = (fij)n×n chápeme v zmysle paragrafu 22.4, čiže ako spojitosť všetkých jej zložiek fij). Často striktne nerozlišujeme medzi homomorfizmom FFF a maticovou grupou ImFFF a používame názov jednoparametrická (maticová) grupa aj pre homomorfizmus FFF. Podobne možno definovať aj jednoparametrické grupy lineárnych operátorov. Jednoparametrické podgrupy sú akousi spojitou obdobou cyklických podgrúp grupy GL(n, R) resp. GL(n, C). Každá taká cyklická podgrupa má totiž tvar ImΦΦΦ = {AAAk ; k ∈ Z}, kde AAA je jej generátor a ΦΦΦ(k) = AAAk je homomorfizmus aditívnej grupy celých čísel Z do príslušnej všeobecnej lineárnej grupy (porovnaj s cvičením 27.5(c)). Jednoparametrické grupy úzko súvisia s autonómnymi sústavami lineárnych diferenciálnych rovníc (pozri paragraf 22.6). Presnejšie, pre AAA z Rn×n , prípadne Cn×n , je fundamentálna matica FFF(t) = eAAAt autonómnej homogénnej sústavy xxx = AAA · xxx zároveň jednoparametrickou grupou matíc. Ak položíme UUU = eAAA , môžeme písať FFF(t) = eAAAt = UUUt ; príslušnú jednoparametrickú grupu potom obvykle zapisujeme v exponenciálnom tvare UUUt t∈R . 27.4 Rozklad grupy podľa podgrupy, normálne podgrupy Skôr než čitateľ pristúpi k štúdiu tohto a nasledujúceho paragrafu, mal by si zopakovať základné fakty o ekvivalenciách a rozkladoch z paragrafu 0.6. Pre ľubovoľné podmnožiny X, Y grupy (G, ·) označíme XY = {xy; x ∈ X & y ∈ Y }. Miesto X{y} píšeme len krátko Xy a miesto {x}Y iba xY . V aditívnom zápise používame označenie X + Y = {x + y; x ∈ X & y ∈ Y }, X + y a x + Y . Nech S je podgrupa grupy (G, ·, e). Potom zrejme x = ex ∈ Sx, lebo e ∈ S. Navyše pre ľubovoľné x, y ∈ G platí Sx ∩ Sy = ∅ ⇒ Sx = Sy; inak povedané množiny, Sx, Sy sú disjunktné alebo sa rovnajú. Ak totiž z ∈ Sx∩Sy, tak existujú s1, s2 ∈ S také, že z = s1x = s2y. Potom x = s−1 1 s2y, a každý prvok množiny Sx má pre vhodné s ∈ S tvar sx = ss−1 1 s2y ∈ Sy, 602 27. Úvod do teórie grúp lebo – keďže S ⊆ G je podgrupa – platí ss−1 1 s2 ∈ S. Teda Sx ⊆ Sy a obrátenú inklúziu možno dostať rovnako, zámenou úloh x a y. Tým sme dokázali prvú časť nasledujúceho tvrdenia. 27.4.1. Tvrdenie. Nech S je podgrupa grupy G. Potom systém množín {Sx; x ∈ G} tvorí rozklad množiny G. Prvky x, y ∈ G patria do tej istej triedy tohto rozkladu práve vtedy, keď xy−1 ∈ S. Dôkaz. Zostáva dokázať už len druhú časť. Keďže uvedený systém množín je rozklad a y ∈ Sy, tak x a y patria do tej istej triedy rozkladu práve vtedy, keď x ∈ Sy, t. j. x = sy pre nejaké s ∈ S. To je zrejme ekvivalentné s podmienkou xy−1 = s ∈ S. Množiny Sx, x ∈ G, sa nazývajú ľavé triedy rozkladu grupy G podľa podgrupy S. Reláciu ekvivalencie zodpovedajúcu tomuto rozkladu značíme ≡S a môžeme ju vyjadriť nasledujúcimi piatimi ekvivalentnými spôsobmi: x ≡S y ⇔ xy−1 ∈ S ⇔ Sx = Sy ⇔ x ∈ Sy ⇔ y ∈ Sx ⇔ Sx ∩ Sy = ∅. Príslušnú faktorovú množinu (t. j. vlastne rozklad) značíme G/S = G/≡S = {Sx; x ∈ G}. Počet prvkov #(G/S) faktorovej množiny G/S (ak je konečná) nazývame indexom podgrupy S v grupe G a značíme ho tiež [G : S]; ak G/S je nekonečná, kladieme [G : S] = ∞ a hovoríme, že S má v G nekonečný index. Rád # G samotnej grupy G zrejme splýva s indexom [G : e] jej triviálnej podgrupy {e}. Analogicky možno zaviesť aj pravé triedy rozkladu grupy G podľa podgrupy S, t. j. množiny xS, x ∈ G, a dokázať pre ne obdobu tvrdenia 27.4.1.2 Príslušnú reláciu ekvivalencie možno vyjadriť zodpovedajúcimi piatimi ekvivalentnými formulami: x S≡ y ⇔ x−1 y ∈ S ⇔ xS = yS ⇔ x ∈ yS ⇔ y ∈ xS ⇔ xS ∩ yS = ∅. Taktiež rozklad grupy G na pravé triedy rozkladu podľa podgrupy S značíme rovnako G/S = G/S≡ = {xS; x ∈ G}; 2 Používaná terminológia nie je v tomto smere jednotná. Niektorí autori nazývajú pravými triedami rozkladu grupy podľa podgrupy to, čo my nazývame ľavými triedami, a naopak. 27.4. Rozklad grupy podľa podgrupy, normálne podgrupy 603 ak je potrebné blžšie špecifikovať, či ide o rozklad na ľavé alebo pravé triedy, vyjadríme to väčšinou slovne. Nech S je podgrupa grupy G a Sx, Sy sú ľubovoľné (nie nevyhnutne rôzne) ľavé triedy rozkladu G podľa S. Takpovediac na prstoch možno overiť, že predpisom u → ux−1 y je definované bijektívne zobrazenie Sx → Sy, ktoré prvok u = sx ∈ Sx (s ∈ S) zobrazí na prvok sy ∈ Sy; k nemu inverzné zobrazenie Sy → Sx je dané predpisom v → vy−1 x, t. j. prvok v = sy ∈ Sy ním prejde na prvok sx ∈ Sx. V prípade, že podgrupa S je konečná, to však znamená, že všetky ľavé (no rovnako aj pravé) triedy rozkladu G podľa S majú ten istý počet prvkov rovný rádu # S = [S : e] grupy S = Se = eS. Keďže G je zjednotením navzájom disjunktných, rovnako početných tried rozkladu Sx ∈ G/S (prípadne xS), dokázali sme tým nasledujúcu vetu: 27.4.2. Veta. (Lagrange) Nech S je podgrupa konečnej grupy G. Potom [G : e] = [G : S] · [S : e], teda rád aj index podgrupy S sú deliteľmi rádu grupy G. Neskôr uvidíme, že pre daný deliteľ d rádu konečnej abelovskej grupy G existuje podgrupa grupy G rádu d (veta 28.3.8). Vo všeobecnosti však G nemusí obsahovať podgrupu rádu d pre každý deliteľ d svojho rádu [G : e] (pozri cvičenie 28.20). 27.4.3. Dôsledok. (Malá veta Fermatova) Nech p je prvočíslo. Potom pre každé celé číslo x, ktoré nie je násobkom čísla p, platí xp−1 ≡ 1 mod p, t. j. číslo xp−1 dáva po delení číslom p zvyšok 1. Dôkaz. Označme z zvyšok, ktorý dáva x po delení p. Keďže x nie je násobkom p, z ∈ Zp, čo je multiplikatívna grupa (nenulových prvkov) poľa Zp s rádom p − 1. Potom rád r jej cyklickej podgrupy z je deliteľom čísla p − 1, teda p − 1 = rk pre nejaké kladné celé číslo k. Podľa tvrdenia 27.2.6 v grupe (Zp, ·, 1) platí zr = 1, z čoho vyplýva zp−1 = zrk = (zr )k = 1k = 1. Teda zp−1 (teraz už ako prvok Z) dáva po delení číslom p zvyšok 1. Avšak čísla zp−1 a xp−1 dávajú po delení číslom p rovnaký zvyšok (pozri cvičenie 0.16). Pre ľavú a pravú triedu rozkladu prvku x grupy G podľa jej podgrupy S môže vo všeobecnosti platiť Sx = xS. Napríklad rozklad dihedrálnej grupy 604 27. Úvod do teórie grúp ∆3 = S3 podľa cyklickej podgrupy S = σ1 = {ι, σ1} na ľavé triedy tvoria množiny Sι = Sσ1 = {ι, σ1}, S = Sσ2 = { , σ2}, S −1 = Sσ3 = −1 , σ3 , a rozklad na pravé triedy zasa množiny ιS = σ1S = {ι, σ1}, S = σ3S = { , σ3}, −1 S = σ2S = −1 , σ2 . (Overte pomocou multiplikatívnej tabuľky tejto grupy v paragrafe 0.5.) Za istých dodatočných podmienok kladených na podgrupu S však ľavé a pravé triedy rozkladu G podľa S splývajú. 27.4.4. Tvrdenie. Nech S je podgrupa grupy G. Potom nasledujúce podmienky sú ekvivalentné: (i) (∀ x ∈ G)(∀ s ∈ S) x−1 sx ∈ S ; (ii) (∀ x ∈ G) x−1 Sx = S); (iii) (∀ x ∈ G)(Sx = xS); (iv) (∀ x, y ∈ G)(x ≡S y ⇔ x S≡ y). Dôkaz. (i) ⇒ (ii) Z predpokladu (i) vyplýva inklúzia x−1 Sx ⊆ S. Jej prenásobením prvkom x zľava a prvkom x−1 sprava dostaneme inklúziu S ⊆ xSx−1 ; keďže x ∈ G je ľubovoľný prvok, substitúciou x−1 miesto x získame S ⊆ x−1 Sx. Teda x−1 Sx = S. (ii) ⇒ (iii) Stačí prenásobiť rovnosť x−1 Sx = S prvkom x zľava. (iii) ⇒ (iv) Ak Sx = xS, tak x ≡S y ⇔ y ∈ Sx ⇔ y ∈ xS ⇔ x S≡ y. (iv) ⇒ (i) Podľa predpokladu pre všetky x, y ∈ G platí xy−1 ∈ S ⇔ x−1 y ∈ S. Keďže pre ľubovoľné s ∈ S je x(sx)−1 = s−1 ∈ S, stačí položiť y = sx a hneď máme x−1 sx ∈ S. Hovoríme, že podgrupa S grupy G je normálna alebo tiež invariantná, označenie S G, ak spĺňa niektorú (teda všetky) z navzájom ekvivalentných podmienok tvrdenia 27.4.4. V prípade normálnych podgrúp teda nemusíme rozlišovať medzi ľavými a pravými triedami rozladu ani medzi ekvivalenciami ≡S a S≡. V každej grupe G platí {e} G a G G. Zrejme v abelovskej grupe G je každá podgrupa normálna. Ako sme však videli pred chvíľou, netriválna vlastná podgrupa neabelovskej grupy už normálna byť nemusí. Najdôležitejšími, a svojim spôsobom typickými príkladmi normálnych podgrúp sú jadrá grupových homomorfizmov. 27.5. Faktorové grupy 605 27.4.5. Tvrdenie. Nech ϕ: G → H je homomorfizmus grúp. Potom Ker ϕ G. Dôkaz. Podľa tvrdenia 27.3.4 je Ker ϕ podgrupa grupy G. Overíme podmienku (i) tvrdenia 27.4.4, čím dokážeme jej normálnosť. Nech a ∈ Ker ϕ, t. j. ϕ(a) = e, a x ∈ G je ľubovoľný prvok. Potom ϕ x−1 ax = ϕ x−1 · ϕ(a) · ϕ(x) = ϕ(x)−1 · e · ϕ(x) = e, teda x−1 ax ∈ Ker ϕ. Každá podmnožina X grupy G generuje nielen najmenšiu podgrupu X ⊆ G takú, že X ⊆ X , ale aj najmenšiu normálnu podgrupu |X| ⊆ G, ktorá obsahuje X. Množinu |X| možno jednoducho popísať. Položme X−1 = {x−1 ; x ∈ X}, X = {gug−1 ; u ∈ X ∪ X−1 & g ∈ G} a konečne |X| = X , čiže |X| je podgrupa generovaná množinou X. Jednoduchý dôkaz nasledujúceho tvrdenie prenechávame ako cvičenie čitateľovi. 27.4.6. Tvrdenie. Nech G je grupa a X ⊆ G. Potom |X| je najmenšia normálna podgrupa grupy G taká, že X ⊆ X| . Množinu |X| teda môžeme oprávnene nazývať normálna podgrupa grupy G generovaná množinou X. Zrejme platí X ⊆ |X| , a v abelovskej grupe G dokonca X = |X| . 27.5 Faktorové grupy V tomto paragrafe sa zoznámime s konštrukciou faktorovej grupy. Ide o dôležitý príklad všeobecnejšej konštrukcie faktorovej štruktúry, s ktorou sa možno stretnúť v najrôznejších oblastiach matematiky. S prvou základnou myšlienkou tejto konštrukcie sme sa už zbežne zoznámili v paragrafe 0.6 – spočíva v nazeraní prvkov faktorovej množiny X/∼ množiny X podľa ekvivalencie ∼ nie ako množín (t. j. tried príslušného rozkladu) ale ako jednotlivých prvkov. Druhou kľúčovou myšlienkou spomínanej konštrukcie je prenos štruktúry z pôvodnej množiny X na faktorovú množinu X/∼ pomocou kanonickej projekcie X → X/∼ danej priradením x → ˜x. Túto všeobecnú myšlienku možno asi najjednoduchšie ilustrovať práve na konštrukcii faktorovej grupy. Nech (G, ·) je grupa a ∼ je ekvivalencia na množine G. Na faktorovej množine G/∼ hodláme zaviesť binárnu operáciu · tak, aby (G/∼, ·) bola 606 27. Úvod do teórie grúp grupa a kanonická projekcia G → G/∼ homomorfizmus grúp. To znamená, že pre všetky x, y ∈ G musí platiť ˜x · ˜y = xy, Inak povedané, podmienka homomorfnosti kanonickej projekcie x → ˜x už jednoznačne určuje príslušnú binárnu operáciu na G/∼. Aby však takto bola korektne definovaná binárna operácia na množine G/∼, jej výsledok nesmie závisieť na konkrétnych reprezentantoch x, y tried ˜x, ˜y ∈ G/∼. Pre prvky x1, x2, y1, y2 ∈ G také, že ˜x1 = ˜x2 a ˜y1 = ˜y2, t. j. x1 ∼ x2 a y1 ∼ y2, musí totiž platiť ˜x1 · ˜y1 = ˜x2 · ˜y2. Teda podľa našej definície x1y1 = ˜x1 · ˜y1 = ˜x2 · ˜y2 = x2y2, v dôsledku čoho x1y1 ∼ x2y2. Hovoríme, že ekvivalencia ∼ na grupe G je kongruencia, ak pre ľubovoľné prvky x1, x2, y1, y2 ∈ G platí x1 ∼ x2 & y1 ∼ y2 ⇒ x1y1 ∼ x2y2. Krátko povedané, aby rovnosťou ˜x· ˜y = xy bola korektne definovaná binárna operácia na faktorovej množine G/∼, ekvivalencia ∼ musí byť kongruenciou na grupe G. Táto nevyhnutná podmienka je aj postačujúca na dosiahnutie nášho vopred stanoveného cieľa. 27.5.1. Veta. Nech ∼ je kongruencia na grupe (G, ·). Potom faktorová množina G/∼ s binárnou operáciou ˜x · ˜y = xy tvorí grupu, ktorej jednotkovým prvkom je ˜e a inverzným prvkom k prvku ˜x ∈ G/∼ je prvok ˜x−1 = x−1. Navyše, prirodzená projekcia G → G/∼ je surjektívny homomorfizmus grúp. Dôkaz. Na dôkaz prvej časti tvrdenia stačí overiť, že pre ľubovoľné prvky x, y, z ∈ G platí ˜x · (˜y · ˜z) = (˜x · ˜y) · ˜z, ˜e · ˜x = ˜x · ˜e = ˜x, ˜x · x−1 = x−1 · ˜x = ˜e. Príslušné jednoduché výpočty prenechávame ako cvičenie čitateľovi. Zrejme prirodzená projekcia G → G/∼ je surjekcia. Už len stačí pripomenúť, že násobenie na množine G/∼ bolo definované práve tak, aby zobrazenie x → ˜x bolo homomorfizmom. Ukazuje sa, že kongruencie na grupách úzko súvisia s normálnymi podg- rupami. 27.5.2. Tvrdenie. Nech (G, ·, e) je grupa. 27.5. Faktorové grupy 607 (a) Ak N je normálna podgrupa grupy G, tak ekvivalencia ≡N je kongruenciou na grupe G. (b) Ak ∼ je kongruencia na grupe G, tak N = ˜e je normálna podgrupa grupy G a pre všetky x, y ∈ G platí x ∼ y ⇔ xy−1 ∈ N, t. j. ∼ splýva s ekvivalenciou ≡N rozkladu grupy G podľa N a pre x ∈ G platí ˜x = Nx = xN. Inými slovami, kongruencie na grupách sú práve ekvivalenciami rozkladu podľa ich normálnych podgrúp. Dôkaz. (a) Nech N G. Už vieme, že ≡N je ekvivalencia na G. Zvoľme v G prvky x1 ≡N x2, y1 ≡N y2; ukážeme, že platí x1y1 ≡N x2y2. Podľa predpokladu x1x−1 2 ∈ N a y1y−1 2 ∈ N. Keďže N je normálna, platí x2 y1y−1 2 x−1 2 ∈ N. Preto tiež (x1y1)(x2y2)−1 = x1 y1y−1 2 x−1 2 = x1x−1 2 x2 y1y−1 2 x−1 2 ∈ N, teda x1y1 ≡N x2y2, takže ≡N je kongruencia na G. (b) Nech ∼ je kongruencia na G. Podľa vety 27.5.1 je x → ˜x homomorfizmus grúp G → G/∼. Jeho jadrom je zrejme N = ˜e. Podľa tvrdenia 27.4.5 potom N G. Keďže (G/∼, ·) je grupa, pre x, y ∈ G máme x ∼ y ⇔ ˜x = ˜y ⇔ ˜x · ˜y−1 = ˜e. Nakoľko x → ˜x je homomorfizmus, platí ˜x · ˜y−1 = (xy−1 ) ∼ , preto tretia podmienka je zrejme ekvivalentná so vzťahom xy−1 ∈ N. Zvyšok je dôsledkom tvrdenia 27.4.4. Grupu G/≡N nazývame faktorovou grupou grupy G podľa jej normálnej podgrupy N a značíme ju G/N. Násobenie v G/N je definované rovnosťou Nx · Ny = Nxy, jednotkovým prvkom v G/N je N = Ne a inverzným prvkom k Nx ∈ G/N je (Nx)−1 = Nx−1 . Prirodzená projekcia ζN : G → G/N, daná predpisom ζN (x) = Nx pre x ∈ G, je surjektívny homomorfizmus s jadrom Ker ζN = N. To dokazuje platnosť aj obrátenej implikácie k tvrdeniu 27.4.5. 27.5.3. Veta. Podgrupa N grupy G je normálna práve vtedy, keď existuje homomorfizmus grúp ϕ: G → H taký, že N = Ker ϕ. 608 27. Úvod do teórie grúp 27.5.4. Veta. (O homomorfizme) Nech ϕ: G → H je homomorfizmus grúp; označme N = Ker ϕ. Potom predpisom ϕ∗(Nx) = ϕ(x) je definovaný injektívny homomorfizmus grúp ϕ∗ : G/N → H. V dôsledku toho Im ϕ ∼= G/ Ker ϕ; ak ϕ je navyše surjektívny homomorfizmus, tak H ∼= G/ Ker ϕ. Dôkaz. Pre x, y ∈ G platí Nx = Ny ⇔ ϕ(x) = ϕ(y). Implikácia ⇒ zaručuje, že priradením Nx → ϕ(x) je korektne definované zobrazenie ϕ∗ : G/N → H. Obrátená implikácia ⇐ vyjadruje injektívnosť tohto zobrazenia. Priamočiary výpočet ϕ∗(Nx · Ny) = ϕ∗(Nxy) = ϕ(xy) = ϕ(x) · ϕ(y) = ϕ∗(Nx) · ϕ∗(Ny) ukazuje, že ide o homomorfizmus. Druhá časť vety je bezprostredným dôsledkom prvej. Uvedený homomorfizmus ϕ∗ spĺňa podmienku ϕ = ϕ∗ ◦ ζN , t. j. zabezpečuje komutatívnosť diagramu 27.5.3. Veta. Podgrupa N grupy G je normálna práve vtedy, keď existuje homomorfizmus grúp ϕ: G → H taký, že N = Ker ϕ. 27.5.4. Veta. (O homomorfizme) Nech ϕ: G → H je homomorfizmus grúp; označme N = Ker ϕ. Potom predpisom ϕ∗(Nx) = ϕ(x) je definovaný injektívny homomorfizmus grúp ϕ∗ : G/N → H. V dôsledku toho Im ϕ ∼= G/ Ker ϕ; ak ϕ je navyše surjektívny homomorfizmus, tak H ∼= G/ Ker ϕ. Dôkaz. Pre x, y ∈ G platí Nx = Ny ⇔ ϕ(x) = ϕ(y). Implikácia ⇒ zaručuje, že priradením Nx → ϕ(x) je korektne definované zobrazenie ϕ∗ : G/N → H. Obrátená implikácia ⇐ vyjadruje injektívnosť tohto zobrazenia. Priamočiary výpočet ϕ∗(Nx · Ny) = ϕ∗(Nxy) = ϕ(xy) = ϕ(x) · ϕ(y) = ϕ∗(Nx) · ϕ∗(Ny) ukazuje, že ide o homomorfizmus. Druhá časť vety je bezprostredným dôsledkom prvej. Uvedený homomorfizmus ϕ∗ spĺňa podmienku ϕ = ϕ∗ ◦ ζN , t. j. zabezpečuje komutatívnosť diagramu G H G/N ϕ ϕ∗ζN Naopak, pokiaľ má zobrazenie ϕ∗ : G/N → H vyhovovať tejto podmienke, musí byť nevyhnutne definované rovnosťou ϕ∗(Nx) = ϕ(x). Grupa H sa nazýva homomorfným obrazom grupy G, ak existuje surjektívny homomorfizmus ϕ: G → H. Zrejme každá faktorová grupa grupy G je jej homomorfným obrazom. Ako vyplýva z vety o homomorfizme, tiež naopak, každý homomorfný obraz grupy G je izomorfný s faktorovou grupou G/N grupy G podľa niektorej jej normálnej podgrupy N. To znamená, že všetky homomorfné obrazy grupy G sú (až na izomorfizmus) skryte prítomné už v samotnej grupe G. 27.5.5. Príklad. Nech n je kladné celé číslo. Označme ζn(x) zvyšok po delení celého čísla x číslom n. Potom ζn : Z → Zn je homomorfizmus grúp (s operáciou +). Keďže ζn je surjektívny a Ker ζn = nZ, podľa vety o homomorfizme platí Z/nZ ∼= Zn. Po stotožnení faktorovej grupy Z/nZ s homomorfným obrazom Zn = ζn(Z) grupy Z, danom uvedeným izomorfizmom, je každý prvok x + nZ = {x + nk; k ∈ Z} faktorovej grupy Z/nZ, t. j. vlastne nekonečná trieda rozkladu podľa podgrupy nZ ⊆ Z, reprezentovaný ako jediný prvok ζn(x) ∈ Zn = {0, 1, . . . , n − 1}. Príslušná kongruencia ≡nZ zrejme splýva s kongruenciou ≡n modulo n z cvičenia 16 z kapitoly 0. Naopak, pokiaľ má zobrazenie ϕ∗ : G/N → H vyhovovať tejto podmienke, musí byť nevyhnutne definované rovnosťou ϕ∗(Nx) = ϕ(x). Grupa H sa nazýva homomorfným obrazom grupy G, ak existuje surjektívny homomorfizmus ϕ: G → H. Zrejme každá faktorová grupa grupy G je jej homomorfným obrazom. Ako vyplýva z vety o homomorfizme, tiež naopak, každý homomorfný obraz grupy G je izomorfný s faktorovou grupou G/N grupy G podľa niektorej jej normálnej podgrupy N. To znamená, že všetky homomorfné obrazy grupy G sú (až na izomorfizmus) skryte prítomné už v samotnej grupe G. 27.5.5. Príklad. Nech n je kladné celé číslo. Označme ζn(x) zvyšok po delení celého čísla x číslom n. Potom ζn : Z → Zn je homomorfizmus grúp (s operáciou +). Keďže ζn je surjektívny a Ker ζn = nZ, podľa vety o homomorfizme platí Z/nZ ∼= Zn. Po stotožnení faktorovej grupy Z/nZ s homomorfným obrazom Zn = ζn(Z) grupy Z, daným uvedeným izomorfizmom, je každý prvok x + nZ = {x + nk; k ∈ Z} faktorovej grupy Z/nZ, t. j. vlastne nekonečná trieda rozkladu podľa podgrupy nZ ⊆ Z, reprezentovaný ako jediný prvok ζn(x) ∈ Zn = {0, 1, . . . , n − 1}. Príslušná kongruencia ≡nZ zrejme splýva s kongruenciou ≡n modulo n z cvičenia 0.16. 27.5. Faktorové grupy 609 27.5.6. Príklad. Z príkladu 27.3.9 vieme, že zobrazenie RRR: (R, +) → (GL(2, R), ·) je homomorfizmus grúp s jadrom KerRRR = 2πZ a obrazom ImRRR = {RRRα; α ∈ R}. Z príkladu 27.3.10 zasa vieme, že priradením x → eix je definovaný homomorfizmus grúp (R, +) → (C , ·) s rovnakým jadrom 2πZ a s obrazom U(1) = {eix ; x ∈ R} = {z ∈ C; |z| = 1}. Z vety 27.5.4 tak okamžite vyplýva ImRRR ∼= R/2πZ ∼= U(1). Práve izomorfizmus aditívnej faktorovej grupy R/2πZ grupy R a jej homomorfného obrazu, multiplikatívnej grupy U(1), je pre pochopenie všeobecnej konštrukcie faktorovej grupy veľmi poučný. Faktorová množina R/2πZ je ním reprezentovaná ako jednotková kružnica – názorne si môžeme predstaviť, že vznikla priložením bodu 0 reálnej osi R na bod 1 jednotkovej kružnice U(1) ⊆ C a následným namotaním kladnej polosi proti a zápornej v smere hodinových ručičiek. Body x, y ∈ R sa pritom ocitnú v tom istom bode kružnice U(1) práve vtedy keď x−y ∈ 2πZ, t. j. práve vtedy, keď (x−y)/2π je celé číslo. Celá nekonečná trieda rozkladu x + 2πZ ∈ R/2πZ prvku x ∈ R podľa podgrupy 2πZ ⊆ R je tak reprezentovaná jediným bodom eix = cos x + i sin x kružnice U(1). Konštrukcia faktorovej grupy pripúšťa tiež abstraktnejší popis pomocou tzv. krátkych exaktných postupností. Hovoríme že postupnosť G0 ϕ1 −−−→ G1 ϕ2 −−−→ · · · ϕn−1 −−−→ Gn−1 ϕn −−−→ Gn grupových homomorfizmov je exaktná, ak pre každé 1 ≤ i < n platí Im ϕi = Ker ϕi+1. Podobne možno definovať pojem exaktnosti aj pre (na jednu či na obe strany) nekonečné postupnosti na seba nadväzujúcich grupových homomorfizmov. Krátkou exaktnou postupnosťou nazývame exaktnú postupnosť tvaru {e} η −→ F ϕ −→ G ψ −→ H τ −→ {e}, kde η: {e} → F a τ : H → {e} sú triviálne homomorfizmy. Exaktnosť v člene F znamená, že Ker ϕ = Im η = {eF }, čiže injektívnosť ϕ. Podobne, exaktnosť v člene H znamená, že Im ψ = Ker τ = H, čiže surjektívnosť ψ. Konečne exaktnosť v strednom člene G znamená, že platí Im ϕ = Ker ψ G, z čoho vzhľadom na vetu o homomorfizme a surjektívnosť ψ vyplýva G/ Im ϕ ∼= H. Triviálna grupa {e} na okrajoch, ako aj triviálne homomorfizmy η, τ sa zvyknú pri zápise krátkej exaktnej postupnosti vynechávať. Ak teda hovoríme o krátkej exaktnej postupnosti F ϕ G ψ H, 610 27. Úvod do teórie grúp znamená to, že ϕ je injektívny a ψ je surjektívny homomorfizmus grúp, pričom platí Im ϕ = Ker ψ. Injektívnosť ϕ resp. surjektívnosť ψ sa vyznačuje modifikovanými šípkami resp. . Ak existuje krátka exaktná postupnosť F ϕ G ψ H, hovoríme, že stredná grupa G je rozšírením grupy H pomocou grupy F.3 Paragraf uzatvárame zhrnutím úvah o krátkych exaktných postupnostiach a vety o homomorfizme do jedného celku. 27.5.7. Veta. (a) Nech G je grupa a N G je jej normálna podgrupa. Označme ι: N → G vnorenie, t. j. identické zobrazenie N do G a ζ : G → G/N kanonickú projekciu G na faktorovú grupu G/N. Potom N ι G ζ G/N je krátka exaktná postupnosť homomorfizmov grúp. (b) Nech naopak F ϕ G ψ H je krátka exaktná postupnosť homomorfizmov grúp. Označme N = Im ϕ = Ker ψ. Potom F ∼= N G a H ∼= G/N. 27.6 Priamy súčin grúp Konštrukcia priameho súčinu nám, spolu s konštrukciami podgrúp a faktorových grúp, umožňuje vytvárať z daných grúp nové. Taktiež naopak, niekedy nám umožňuje reprezentovať danú grupu v tvare priameho súčinu jednoduchších grúp, a tým sprehľadniť jej štruktúru. Opäť ide o špeciálny prípad veľmi dôležitej všeobecnej konštrukcie, ktorej pôsobnosť sa neobmedzuje len na teóriu grúp. Priamym súčinom grúp (G1, ·, e1), (G2, ·, e2) nazývame karteziánsky súčin G1 × G2 = {(x1, x2); x1 ∈ G1 & x2 ∈ G2}, množín G1, G2, s binárnou operáciou definovanou po zložkách, t. j. (x1, x2) · (y1, y2) = (x1y1, x2y2) pre x1, y1 ∈ G1, x2, y2 ∈ G2. Roznásobením zvlášť v každej zložke sa možno ľahko presvedčiť, že táto operácia na množine G1 × G2 je asociatívna, má (e1, e2) za neutrálny prvok a inverzným prvkom k prvku (x1, x2) ∈ G1 × G2 je (x1, x2)−1 = x−1 1 , x−1 2 . Tým sme vlastne dokázali nasledujúcu vetu. 27.6.1. Veta. Priamy súčin G1 × G2 grúp G1, G2 je grupa. Zovšeobecnenie konštrukcie priameho súčinu, ako aj vety 27.6.1 na ľubovoľný konečný počet grúp prenechávame čitateľovi. 3 Niektorí autori v takejto situácii hovoria, že grupa G je rozšírením grupy F pomocou grupy H. 27.6. Priamy súčin grúp 611 Reprezentácia danej grupy G v tvare priameho súčinu G ∼= G1 × G2 prináša niečo nové, len ak sú obe grupy G1, G2 netriviálne. To nastoľuje zaujímavý problém: rozložiť danú grupu G na priamy súčin dvoch netriviálnych grúp, t. j. nájsť netriválne grupy G1 a G2 tak, že platí G ∼= G1 × G2, prípadne ukázať, že také grupy neexistujú – v tom prípade hovoríme, že grupa G je priamo nerozložiteľná. Rozumnú charakterizáciu priamo nerozložiteľných grúp nemáme naporúdzi. Jednako uvedieme niekoľko jednoduchých podmienok, ktoré nám umožnia rozložiť niektoré známe grupy na priamy súčin v istom zmysle jednoduchších faktorov. Najprv si všimnime, že projekcie π1 : G1 × G2 → G1, π2 : G1 × G2 → G2, dané predpismi π1(x1, x2) = x1, π2(x1, x2) = x2, sú surjektívne grupové homomorfizmy a pre ich jadrá platí Ker π1 = {e1} × G2 ∼= G2, Ker π2 = G1 × {e2} ∼= G1; príslušné izomorfizmy sú dané priradeniami (e1, x2) → x2 resp. (x1, e2) → x1. To znamená, že grupa G1 × G2 obsahuje dve normálne podgrupy N1 ∼= G1 a N2 ∼= G2. Navyše N1 ∩ N2 = {(e1, e2)} a pre ľubovoľný prvok (x1, x2) ∈ G1 × G2 platí (x1, x2) = (x1, e2) · (e1, x2) = (e1, x2) · (x1, e2), z čoho vyplývajú rovnosti G = N1N2 = N2N1. 27.6.2. Tvrdenie. Nech (G, ·) je grupa a S, T ⊆ G sú jej podgrupy. Označme ϕ: S × T → G zobrazenie dané predpisom ϕ(x, y) = xy pre x ∈ S, y ∈ T. Potom (a) ϕ je homomorfizmus grúp práve vtedy, keď pre všetky x ∈ S, y ∈ T platí xy = yx; (b) ϕ je injektívne práve vtedy, keď S ∩ T = {e}; (c) ϕ je surjektívne práve vtedy, keď G = ST. Dôkaz. (a) Predpokladajme, že ϕ je homomorfizmus. Potom pre ľubovoľné x ∈ S, y ∈ T platí xy = ϕ(x, y) = ϕ (e, y) · (x, e) = ϕ(e, y) · ϕ(x, e) = (ey)(xe) = yx. Nech naopak pre všetky x ∈ S, y ∈ T platí xy = yx. Zvoľme x1, x2 ∈ S, y1, y2 ∈ T. Potom ϕ (x1, y1) · (x2, y2) = ϕ(x1x2, y1y2) = (x1x2)(y1y2) = (x1y1)(x2y2) = ϕ(x1, y1) · ϕ(x2, y2), čo znamená, že ϕ je homomorfizmus. 612 27. Úvod do teórie grúp (b) Predpokladajme, že platí S∩T = {e}. Nech (x1, y1), (x2, y2) ∈ S×T sú také, že ϕ(x1, y1) = ϕ(x2, y2). Potom x1y1 = x2y2, a keďže S, T sú podgrupy a x1, x2 ∈ S, y1, y2 ∈ T, platí x−1 2 x1 = y2y−1 1 ∈ S∩T. Z toho vyplýva x−1 2 x1 = y2y−1 1 = e, teda (x1, y1) = (x2, y2), čo dokazuje injektívnosť zobrazenia ϕ. Nech naopak ϕ je injektívne. Pre x ∈ S ∩ T platí tiež x−1 ∈ S ∩ T, lebo S ∩ T je podgrupa grupy G. Preto x, x−1 ∈ S × T a ϕ x, x−1 = xx−1 = e = ϕ(e, e). Vďaka injektívnosti ϕ z toho vyplýva x = e = x−1 . Teda S ∩ T = {e}. (c) platí triviálne. 27.6.3. Dôsledok. Nech G je grupa a S, T G sú jej dve normálne podgrupy také, že S ∩ T = {e} a G = ST. Potom G ∼= S × T. Dôkaz. Stačí overiť, že za uvedených predpokladov je splnená aj podmienka (a) predchádzajúceho tvrdenia, čiže pre všetky x ∈ S, y ∈ T platí xy = yx. Potom totiž priradenie (x, y) → xy bude izomorfizmus grúp S × T ∼= G. Keďže S, T G, platí yx−1 y−1 ∈ S, xyx−1 ∈ T a x · yx−1 y−1 = xyx−1 · y−1 ∈ S ∩ T, teda xyx−1 y−1 = e, z čoho už vyplýva požadovaná rovnosť. Nasleduje niekoľko aplikácií čerstvo dokázaných výsledkov. 27.6.4. Tvrdenie. Nech m, n sú kladné celé čísla. Potom cyklická aditívna grupa Zmn je izomorfná s priamym súčinom Zm × Zn cyklických aditívych grúp Zm a Zn práve vtedy, keď m a n sú nesúdeliteľné. Dôkaz. Nech m, n sú nesúdeliteľné. Označme S, T podmnožiny množiny Zmn pozostávajúce z čísel deliteľných číslom n resp. m. Zrejme S aj T sú podgrupy grupy Zmn a platí Zm ∼= S = {0, n, 2n, . . . , (m − 1)n}, Zn ∼= T = {0, m, 2m . . . , (n − 1)m}. Keďže grupa Zmn je komutatívna, rovnosť x + y = y+x platí pre všetky x, y ∈ Zmn, a nielen pre x ∈ S, y ∈ T. Z nesúdeliteľnosti m a n vyplýva S ∩ T = {0}. Podľa častí (a), (b) tvrdenia 27.6.2 je predpisom (x, y) → x + y definovaný injektívny homomorfizmus grúp S × T → Zmn. Keďže množina S má m prvkov a množina T má n prvkov, je to injekcia mnprvkovej množiny S × T do množiny Zmn s rovnakým počtom prvkov, teda zároveň surjekcia. Môžeme uzavrieť, že uvedené zobrazenie je izomorfizmus grúp, preto platí Zmn ∼= S × T ∼= Zm × Zn. 27.6. Priamy súčin grúp 613 Nech naopak m, n sú súdeliteľné s najväčším spoločným deliteľom d > 1. Potom m/d, n/d aj k = mn/d < mn sú celé čísla. Pre každý prvok (x, y) grupy Zm × Zn platí k(x, y) = (kx, ky) = n d mx, m d ny = (0, 0), lebo mx = 0 v Zm a ny = 0 v Zn (výrazy ako kz označujú súčet k exemplárov prvku z v príslušnej grupe). To znamená, že rád každého prvku tejto grupy je nanajvýš k, teda ostro menší než mn. Z toho dôvodu podľa tvrdenia 27.2.6 grupa Zm × Zn nemôže byť izomorfná s cyklickou grupou rádu mn. Poznámka. Metódami do istej miery podobnými niektorým metódam z kapitoly 21 možno dokázať, že každá konečne generovaná abelovská grupa je izomorfná s priamym súčinom konečného počtu cyklických grúp. V dôsledku toho je každá konečná abelovská grupa izomorfná s priamym súčinom Zn1 ×. . .×Znk pre vhodné kladné celé čísla n1, . . . , nk. Čísla n1, . . . , nk možno navyše vybrať tak, že každé z nich je mocninou nejakého prvočísla (primárny kanonický tvar), prípadne tak, že každé z nich je násobkom nasledujúceho (racionálny kanonický tvar). Tieto výsledky však už výrazne presahujú rámec nášho kurzu. Nasledujúce jednoduché dôsledky tvrdenia 27.6.4 nám poslúžia pri dôkaze záverečného tvrdenia. 27.6.5. Dôsledok. V ľubovoľnej grupe (G, ·) platí: (a) Ak prvky x, y ∈ G komutujú, t. j. xy = yx, a majú konečné po dvoch nesúdeliteľné rády m resp. n, tak prvok xy má rád mn. (b) Ak prvok x ∈ G má konečný rád mn, kde m, n sú navzájom nesúdeliteľné kladné celé čísla, tak existujú prvky u, v ∈ x rádov m resp. n také, že x = uv. (c) Ak prvky x, y ∈ G komutujú a majú konečné rády m resp. n, tak existuje prvok z ∈ x, y , ktorého rád je najmenším spoločným násobkom čísel m a n. Dôkaz. (a) Rád prvku xy ∈ x, y ∼= x × y je zrejme rovnaký ako rád prvku (1, 1) ∈ Zm × Zn. (b) Cyklická podgrupa x grupy G je izomorfná s priamym súčinom Zm × Zn; nech ϕ: Zm × Zn → x je nejaký izomorfizmus a (a, b) = ϕ−1 (x). Potom rád prvku a ∈ Zm je m a rád prvku b ∈ Zn je n (rozmyslite si prečo). Stačí položiť u = ϕ(a, 0), v = ϕ(0, b). (c) Nech m = pα1 1 . . . pαk k , n = pβ1 1 . . . pβk k , kde p1, . . . , pk sú navzájom rôzne prvočísla a αi, βi ∈ N. Keďže pre i = j sú čísla pαi i , p αj j navzájom nesúdeliteľné, podľa (b) (ktoré možno indukciou zovšeobecniť na ľubovoľný konečný 614 27. Úvod do teórie grúp počet činiteľov) existujú prvky u1, . . . , uk ∈ x také, že x = u1 . . . uk a ui má rád pαi i . Z rovnakého dôvodu existujú prvky v1, . . . , vk ∈ y také, že y = v1 . . . vk a vi má rád pβi i . Zrejme ľubovoľné dva z prvkov u1, . . . , uk, v1, . . . , vk komutujú. Položme wi = ui, ak αi ≥ βi a wi = vi, ak αi < βi. Podľa (a) (ktoré možno takisto zovšeobecniť indukciou na ľubovoľný konečný počet činiteľov) rád prvku z = w1 . . . wk je pγ1 1 . . . pγk k , kde γi = max(αi, βi), čiže najmenší spoločný násobok čísel m a n. Taktiež časť (c) uvedeného dôsledku možno indukciou zovšeobecniť na ľubovoľný konečný počet po dvoch komutujúcich prvkov grupy. Jeden špeciálny prípad tohto zovšeobecnenia si zaslúži našu pozornosť. 27.6.6. Dôsledok. Nech G je konečná abelovská grupa. Potom existuje prvok z ∈ G, ktorého rád je násobkom rádu každého prvku grupy G. Nasledujúca veta odhaľuje zaujímavú súvislosť medzi štruktúrou polí a konečných cyklických grúp. 27.6.7. Veta. Nech K je ľubovoľné pole. Potom každá konečná podgrupa multiplikatívnej grupy K jeho nenulových prvkov je cyklická. Dôkaz. Nech G je konečná podgrupa grupy K . Podľa dôsledku 27.6.6 existuje prvok z ∈ G, ktorého rád n = # z je násobkom rádu každého prvku grupy G. Potom n delí rád G, teda n ≤ # G, a pre každé a ∈ G platí an = 1. Inak povedané, každý prvok grupy G je koreňom polynómu xn − 1 ∈ K[x]. Ale, ako sme sa už zmienili v úvode paragrafu 19.1, polynóm n-tého stupňa má v poli K najviac n koreňov (dokonca vrátane násobnosti). Preto musí platiť # G ≤ n, teda # G = n a G = z je cyklická. 27.6.8. Dôsledok. Nech K je konečné pole. Potom multiplikatívna grupa K jeho nenulových prvkov je cyklická. Ešte poznamenajme, že generátor cyklickej multiplikatívnej grupy K konečného q-prvkového poľa K sa nazýva (q − 1)-á primitívna odmocnina z jednotky. Takýto prvok má totiž rád q − 1, t. j. vyhovuje rovnici xq−1 = 1, ale žiadnej z rovníc xk = 1 pre 1 ≤ k < q − 1. 27.7 Voľné a konečne prezentované grupy Nech X je ľubovoľná množina. Zamyslime sa nad otázkou, ako vyzerá „najvšeobecnejšia grupa generovaná množinou X. Predovšetkým treba upresniť, čo vlastne znamená ono „najvšeobecnejšia . Označme F túto zatiaľ bližšie neurčenú grupu. Vieme, že X ⊆ F = X . Podľa našich predstáv by v grupe 27.7. Voľné a konečne prezentované grupy 615 F nemali platiť „žiadne vzťahy navyše okrem tých, ktoré sú nevyhnutnými logickými dôsledkami axióm (a), (b) teórie grúp, uvedených na začiatku paragrafu 27.1. Grupa F by teda okrem prvkov množiny X mala obsahovať aj nejaký (jediný) neutrálny prvok e, a keďže nás nič nenúti, aby pre nejaké x ∈ X platilo x = e, tento prvok by mal byť rôzny od každého prvku x ∈ X. S každým prvkom x ∈ X by F mala obsahovať aj k nemu inverzný prvok x−1 , ktorý by mal byť z rovnakého dôvodu rôzny od každého prvku y ∈ X aj od prvku e. Na druhej strane, axiómy teórie grúp nás nútia položiť e−1 = e a (x−1 )−1 = x. Pôvodná množina X sa nám tak rozrástla do zjednotenia po dvoch disjunktných množín X, {e} a X−1 = {x−1 ; x ∈ X}. Grupa F však musí byť uzavretá aj vzhľadom na súčiny, teda musí popri prvku e obsahovať aj všetky výrazu tvaru s1s2 . . . sn, kde 1 ≤ n ∈ N a s1, . . . , sn ∈ X ∪ X−1 . Zátvorky si môžeme dovoliť vynechať, lebo v dôsledku asociatívnosti grupy F ich umiestnenie nemá vplyv na výsledok. Keď sa však v takomto „slove vyskytnú vedľa seba „písmená x a x−1 , je nevyhnutné ich navzájom vykrátiť a takto pokračovať, pokiaľ sa to len dá. Napr. zo slova u−1 uxxyz−1 zy−1 zu−1 , kde x, y, z, u ∈ X, tak najprv dostaneme xxyy−1 zu−1 a potom xxzu−1 . Ukážeme, že do množiny F netreba ďalej nič pridávať. Ak sa navyše dohodneme, že prvok e stotožníme s prázdnou postupnosťou prvkov množiny X ∪ X−1 , máme F = s1 . . . sn; n ∈ N & s1, . . . , sn ∈ X ∪ X−1 & (∀ i < n)(s−1 i = si+1) . Prvky množiny F nazývame redukované grupové slová nad abecedou X. Ak k po sebe nasledujúcich rovnakých znakov x resp. x−1 napíšeme ako mocninu xk resp. x−k , možno každé redukované slovo jednoznačne vyjadriť v tvare xk1 1 . . . xkm m , kde m ∈ N, x1, . . . , xm ∈ X, k1, . . . , km ∈ Z {0} a xi = xi+1 pre 1 ≤ i < m. Súčin redukovaných slov r1 . . . rm, s1 . . . sn definujeme v dvoch krokoch: Najprv ich jednoducho napíšeme za sebou, t. j. utvoríme slovo r1 . . . rms1 . . . sn, a potom ho zredukujeme podľa skôr spomínaného receptu. Ľahko nahliadneme, že takto definovaná operácia násobenia je asociatívna. Prázdne slovo e je naozaj redukované a je jej neutrálnym prvkom. Inverzným prvkom k redukovanému slovu s1 . . . sn je redukované slovo s−1 n . . . s−1 1 , lebo redukciou zloženého slova s1 . . . sns−1 n . . . s−1 1 zrejme dostaneme prázdne slovo e. Krátko povedané, množina F s práve definovanou operáciou tvorí grupu. Nazývame ju voľná grupa nad množinou generátorov X a prvkom množiny X hovoríme voľné generátory. Aby sme zvýraznili ich úlohu, používame označenie F = FG(X) (z anglického free group). Voľné grupy však možno charakterizovať aj iným, abstraktným spôsobom. 616 27. Úvod do teórie grúp 27.7.1. Veta. Nech X je množina a G je ľubovoľná grupa. Potom ku každému zobrazeniu f : X → G existuje práve jeden homomorfizmus ϕ: FG(X) → G taký, že ϕ X = f, t. j. ϕ(x) = f(x) pre každé x ∈ X. Naopak, ak nejaká grupa F má tiež uvedenú vlastnosť, t. j. X ⊆ F a ku každému zobrazeniu g: X → G existuje jediný homomorfizmus grúp ψ: F → G taký, že ψ X = g, tak F ∼= FG(X). Dôkaz. Nech f : X → G je nejaké zobrazenie z množiny X do grupy G. Ak má byť ϕ: FG(X) → G homomorfizmus rozširujúci f, tak pre každé (redukované) slovo xk1 1 . . . xkn n ∈ FG(X), kde xi ∈ X a ki ∈ Z, musí platiť ϕ xk1 1 . . . xkn n = ϕ(x1)k1 . . . ϕ(xn)kn = f(x1)k1 . . . f(xn)kn , teda ϕ možno definovať len jediným spôsobom. Naopak, ľahko nahliadneme, že uvedeným predpisom je naozaj definovaný homomorfizmus grúp rozširujúci f. Predpokladajme, že F ⊇ X je grupa a ku každému zobrazeniu g: X → G do ľubovoľnej grupy G existuje jediný homomorfizmus ψ: F → G rozširujúci g. Uvažujme identitu idX ako zobrazenie X → F aj ako zobrazenie X → FG(X). Existuje jediný homomorfizmus ϕ: FG(X) → F rozširujúci idX, a tiež jediný taký homomorfizmus χ: F → FG(X). Potom aj ϕ ◦ χ: F → F je homomorfizmus rozširujúci idX, rovnako ako χ ◦ ϕ: FG(X) → FG(X). Preto nevyhnutne ϕ ◦ χ = idF a χ ◦ ϕ = idFG(X), teda ϕ, χ sú navzájom inverzné izomorfizmy. Uvedená vlastnosť voľných grúp pripomína vektorové priestory. Aj tie sú „voľné nad svojimi bázami . Ak totiž X je (neusporiadaná) báza vektorového priestoru V nad poľom K, tak každé zobrazenie f : X → U do nejakého vektorového priestoru U možno jediným spôsobom rozšíriť do lineárneho zobrazenia ϕ: V → U. Zrejme ϕ zobrazí lineárnu kombináciu c1x1 +. . .+cnxn, kde x1, . . . , xn ∈ X, c1, . . . , cn ∈ K do lineárnej kombinácie ϕ(c1x1 + . . . + cnxn) = c1f(x1) + . . . + cnf(xn). No na rozdiel od vektorových priestorov, zďaleka nie všetky grupy, dokonca ani tie konečne generované, sú voľné. Jednako – ako ukazuje nasledujúca veta – voľné grupy sú v istom zmysle predobrazmi všetkých grúp. 27.7.2. Veta. Každá grupa je homomorfným obrazom nejakej voľnej grupy. Dôkaz. Nech G je ľubovovoľná grupa a X ⊆ G je nejaká množina jej generátorov (vždy môžeme položiť napr. X = G). Nech F = FG(X) je voľná grupa nad množinou X. Uvažujme identitu idX ako zobrazenie idX : X → G. Podľa predchádzajúcej vety existuje (dokonca jediný) homomorfizmus grúp 27.7. Voľné a konečne prezentované grupy 617 ϕ: F → G taký, že ϕ(x) = x pre všetky x ∈ X. Keďže X generuje G, zrejme ϕ je surjekcia. Napríklad voľná grupa s jedným generátorom x je zrejme nekonečná cyklická grupa, teda (FG(x), ·) ∼= (Z, +). Podľa tvrdenia 27.3.1 je každý homomorfizmus Z → G jednoznačne určený obrazom jej generátora 1 ∈ Z, ktorým môže byť každý prvok grupy G. Homomorfné obrazy grupy Z – grupy Zn, kde 2 ≤ n ∈ N, – však voľné nie sú. Voľné grupy s viac než jedným generátorom už nie sú komutatívne a majú podstatne zložitejšiu štruktúru. Nech X ⊆ G je nejaká množina, ktorá generuje grupu G. Uvažujme (jednoznačne určený) surjektívny homomorfizmus ϕ: FG(X) → G rozširujúci identické zobrazenie idX : X → G. Potom jeho jadro N = Ker ϕ je normálna podgrupa voľnej grupy FG(X). Ľubovoľný prvok s1 . . . sn ∈ N predpisuje rovnosť s1 . . . sn = e, ktorá musí platiť v grupe G. Ak napr. xyx−1 y−1 ∈ N, znamená to, že v G platí xyx−1 y−1 = e, t. j. generátory x, y ∈ X komutujú. Podobne, ak xxx ∈ N, tak v G platí x3 = e, t. j. generátor x má rád 3, prípadne 1. Keby sme vypísali všetky slová, ktoré sú prvkami grupy N, dostali by sme tak zoznam všetkých redukovaných grupových slov nad abecedou X, ktoré sa v grupe G rovnajú neutrálnemu prvku e. Keďže každú rovnosť medzi slovami r1 . . . rm = s1 . . . sn možno prepísať na ekvivalentný tvar r1 . . . rms−1 n . . . s−1 1 = e, grupa N tak v sebe skrýva všetky možné rovnosti medzi (redukovanými) grupovými slovami nad abecedou X, ktoré platia v G. Aby sme však mohli popísať grupu G ∼= FG(X)/N, nepotrebujeme explicitne poznať všetky rovnosti s1 . . . sn = e spomínaného tvaru, ktoré platia v G. Stačí mať k dispozícii nejaký menší zoznam takých rovností, z ktorých všetky ostatné rovnosti v G logicky vyplývajú. Inak povedané, nepotrebujeme zoznam všetkých prvkov grupy N FG(X), stačí nejaká jej podmnožina E ⊆ N, taká, že |E| = N. Potom rovnosť r1 . . . rm = s1 . . . sn platí v G práve vtedy, keď vyplýva z množiny rovností E, t. j. práve vtedy, keď r1 . . . rms−1 n . . . s−1 1 ∈ |E| . Faktorovú grupu FG(X)/ |E| značíme X | E a nazývame ju grupa prezentovaná množinou generátorov X a množinou slov E. X | E tak predstavuje „najvšeobecnejšiu grupu generovanú množinou X, v ktorej platia rovnosti s1 . . . sn = e, kde s1 . . . sn ∈ E. Akákoľvek iná rovnosť medzi slovami zostavenými z generátorov (t. j. z prvkov množiny X) v nej platí, len ak je logickým dôsledkom rovností z E a axióm teórie grúp – inak nie. Špeciálne FG(X) = X | ∅ . Niekedy slová w ∈ E zapisujeme ako rovnosti w = e, prípadne slová tvaru uv−1 ∈ E ako rovnosti u = v. Napr. x | xn = x | xn = e , 618 27. Úvod do teórie grúp predstavuje cyklickú grupu rádu n, teda izomorfnú s aditívnou grupou Zn. Podobne x, y | xyx−1 y−1 = x, y | xy = yx predstavuje „voľnú abelovskú grupu s dvoma generátormi. Možno ukázať, že je izomorfná s priamym súčinom Z × Z. Grupy tvaru X | E , kde X aj E ⊆ FG(X) sú konečné množiny, nazývame konečne prezentované grupy. Ak X = {x1, . . . , xn}, E = {w1, . . . , wk}, píšeme X | E = x1, . . . , xn | w1, . . . , wk . Zrejme každá konečná grupa je konečne prezentovaná (rozmyslite si prečo). Ako sme však videli pred chvíľou, konečne prezentovaná grupa môže byť nekonečná. Prezentácie grúp hrajú dôležitú úlohu pri popise na nich definovaných homomorfizmov. 27.7.3. Veta. Nech X | E je prezentácia grupy G a H je ľubovoľná grupa. Potom zobrazenie f : X → H možno rozšíriť do homomorfizmu ϕ: G → H práve vtedy, keď pre každé xk1 1 . . . xkn n ∈ E, kde x1, . . . , xn ∈ X, k1, . . . , kn ∈ Z, platí f(x1)k1 . . . f(xn)kn = eH. V tom prípade je homomorfizmus ϕ rozširujúci f určený jednoznačne. Dôkaz. Ak ϕ má byť homomorfizmus, tak jediný možný spôsob ako ho definovať zrejme je ϕ xk1 1 . . . xkn n = ϕ(x1)k1 . . . ϕ(xn)kn = f(x1)k1 . . . f(xn)kn pre každý prvok xk1 1 . . . xkn n grupy G. Ľahko možno overiť, že takto definované zobrazenie je homomorfizmus grúp práve vtedy, keď f(x1)k 1 . . . f(xn)k n = eH pre každé xk1 1 . . . xkn n ∈ E. Ak si napríklad uvedomíme, že Zn ∼= x | xn , pričom úlohu generátora x hrá prvok 1 ∈ Zn, hneď vidíme, že priradenie 1 → a ∈ H možno rozšíriť do homomorfizmu grúp ϕ: Zn → H práve vtedy, keď v H platí an = e, čiže rád prvku a je deliteľom čísla n. Taktiež naopak, každý homomorfizmus ϕ: Zn → H je jednoznačne určený obrazom a = ϕ(1) jediného prvku 1 ∈ Zn. Úlohu prvku 1 môže samozrejme zohrať ľubovoľný generátor cyklickej grupy Zn, t. j. ľubovoľný prvok k ∈ Zn nesúdeliteľný s n. 27.7.4. Príklad. Metacyklickou grupou nazývame každú konečne prezentovanú grupu tvaru Fk mn = x, y | xm = yn = e, xyx−1 = yk , 27.7. Voľné a konečne prezentované grupy 619 kde m, n sú prirodzené čísla a k ∈ Zn je nesúdeliteľné s n také, že km ≡n 1. Pripúšťame aj prípady m = 0 alebo n = 0; vtedy kladieme Z0 = Z, navyše podmienka nesúdeliteľnosti k ∈ Z s n = 0 znamená k = ±1. Grupy Fk mn patria do širšej triedy grúp nazývaných Frobeniovými grupami. Ukážeme, že každý prvok grupy Fk mn má tvar yb xa pre jednoznačne určené a ∈ Zm, b ∈ Zn. Uvedená prezentácia totiž umožňuje vypočítať všetky súčiny yb xa · yd xc a previesť ich na súčin vhodných mocnín generátorov y a x. Ak si totiž uvedomíme, že pre prvky ľubovoľnej grupy platí gug−1 ·gvg−1 = guvg−1 a (gh)u(gh)−1 = g(huh−1 )g−1 , môžeme počítať yb xa ·yd xc = yb ·xa yd x−a ·xa+c = yb (xa yx−a )d xa+c = yb ykad xa+c = yb+kad xa+c , lebo xyx−1 = yk a x2 yx−2 = xyk x−1 = (xyx−1 )k = (yk )k = yk2 , . . . , xa yx−a = yka . Pre m = 2, k = n − 1 dostávame dihedrálnu grupu ∆n z príkladu 27.2.2. Keďže pre generátor y rádu n je yn−1 = y−1 , môžeme jej prezentáciu prepísať do obvyklej podoby ∆n ∼= x, y | x2 = yn = e, xyx−1 = y−1 . Zrejme v uvedenej prezentácii zodpovedá generátor x osovej súmernosti podľa niektorej z osí pravidelného n-uholníka a y otočeniu okolo jeho stredu o uhol 2π/n. 27.7.5. Príklad. Nech p, q sú ľubovoľné prvočísla. Keďže podľa dôsledku 27.6.8 multiplikatívna grupa Zq poľa Zq je cyklická rádu q −1, prvok k ∈ Zq rádu p (t. j. k ∈ Zq, kp ≡q 1 a k = 1) existuje práve vtedy, keď p delí q − 1. V takom prípade p < q a Fk pq = x, y | xp = yq = e, xyx−1 = yk je nekomutatívna grupa rádu pq. Ukážeme, že metacyklická grupa Fk pq nezávisí na k; presnejšie, ak l ∈ Zq je iný prvok rádu p, tak Fk pq ∼= Fl pq. Množina A = {a ∈ Zq; ap = 1} tvorí cyklickú podgrupu grupy Zq rádu p, preto l ∈ A = k . Teda existuje 1 ≤ r ≤ p − 1 také, že v Zq platí l = kr , čiže l ≡q kr . Potom pre z = xr ∈ Fk pq máme z = x , zp = e a zyz−1 = xr yx−r = ykr = yl . To však podľa vety 27.7.3 znamená, že priradenie x → xr , y → y možno rozšíriť do homomorfizmu grupy Fl pq = x, y | xp = yq = e, xyx−1 = yl do grupy Fk pq. Čitateľ by si mal samostatne premyslieť, že ide naozaj o izo- morfizmus. 620 27. Úvod do teórie grúp 27.8 Grupy homomorfizmov a charaktery abelovských grúp V paragrafe 6.5 sme videli, že všetky lineárne zobrazenia z vektorového priestoru V do vektorového priestoru U nad daným poľom K opäť tvoria vektorový priestor L(V, U). Niečo podobné platí aj pre abelovské grupy. Množinu všetkých homomorfizmov grupy G do grupy H označujeme Hom(G, H). Ak ϕ, ψ ∈ Hom(G, H), tak ich súčin po zložkách, t. j. zobrazenie ϕψ: G → H dané predpisom (ϕψ)(x) = ϕ(x) ψ(x) pre x ∈ G, nemusí byť homomorfizmom. Situácia sa však zmení, ak grupa H je komutatívna. Jednoduchý dôkaz nasledujúceho tvrdenia prenechávame čitateľovi ako cvičenie. 27.8.1. Tvrdenie. Nech G je ľubovoľná grupa a H je abelovská grupa. Potom množina Hom(G, H) s operáciou súčinu po zložkách je abelovská grupa. Ďalej sa budeme zaoberať výlučne grupami homomorfizmov medzi abelovskými grupami. 27.8.2. Tvrdenie. Nech A, B1, B2, resp. A1, A2, B sú abelovské grupy. Potom (a) Hom(A, B1 × B2) ∼= Hom(A, B1) × Hom(A, B2); (b) Hom(A1 × A2, B) ∼= Hom(A1, B) × Hom(A2, B); Dôkaz. len naznačíme. Budeme používať aditívny zápis grupových operácií. (a) Označme π1 : B1 × B2 → B1, π2 : B1 × B2 → B2 projekcie priameho súčinu na prvý resp. druhý faktor, t. j. π1(b1, b2) = b1, π2(b1, b2) = b2 pre (b1, b2) ∈ B1 × B2. Zrejme sú to surjektívne homomorfizmy. Niekoľkými priamočiarymi výpočtami sa možno presvedčiť, že priradením ϕ → (π1 ◦ϕ, π2 ◦ϕ) je určený izomofizmus grúp Hom(A, B1 × B2) → Hom(A, B1) × Hom(A, B2). (b) Označme ι1 : A1 → A1 × A2, ι2 : A2 → A1 × A2 kanonické vnorenia prvého resp. druhého činiteľa do ich priameho súčinu, t. j. ι1(a1) = (a1, 0), ι2(a2) = (0, a2) pre a1 ∈ A1, a2 ∈ A2. Zrejme sú to injektívne homomorfizmy. Opäť sa sa možno ľahko presvedčiť, že zobrazenie ϕ → (ϕ ◦ ι1, ϕ ◦ ι2) je izomorfizmus grúp Hom(A1 × A2, B) → Hom(A1, B) × Hom(A2, B). Zvláštnu pozornosť si zaslúžia grupy homomorfizmov do (abelovskej) grupy komplexných jednotiek U(1). Jedným z dôvodov je ich súvis s diskrétnou Fourierovou transformáciou, ktorý si bližšie všimneme v paragrafe 30.2. Charakterom abelovskej grupy G nazývame ľubovoľný homomorfizmus α: G → U(1) a grupe Gd = Hom(G, U(1)) 27.8. Grupy homomorfizmov a charaktery abelovských grúp 621 hovoríme grupa charakterov alebo tiež duálna grupa abelovskej grupy G. Jednotkou v grupe Gd je triviálny charakter ε: G → U(1), t. j. ε(x) = 1 pre každé x ∈ G, a inverzný prvok k charakteru α ∈ Gd je k nemu komplexne združený charakter α−1 = α. Tvrdenie 27.8.2 (b) má nasledujúci dôsledok. 27.8.3. Dôsledok. Pre ľubovoľné abelovské grupy G1, G2 platí (G1 × G2)d ∼= Gd 1 × Gd 2. 27.8.4. Tvrdenie. Pre ľubovoľné n ≥ 1 je Zd n ∼= Zn. Dôkaz. Keďže grupa Zn je cyklická s generátorom 1, ľubovoľný charakter α: Zn → U(1) je podľa vety 27.7.3 jednoznačne určený svojou hodnotou α(1) ∈ U(1). Naopak, číslo c ∈ U(1) môže byť hodnotou c = α(1) charakteru α: Zn → U(1) práve vtedy, keď vyhovuje binomickej rovnici cn = 1. Možné hodnoty α(1) tak tvoria podgrupu Cn = {c ∈ U(1); cn = 1} = e2πia/n ; a ∈ Zn grupy U(1) izomorfnú so Zd n. Zrejme a → e2πia/n je izomorfizmus Zn → Cn, takže Zd n ∼= Cn ∼= Zn. Na základe faktu, že každá konečná abelovská grupa G je izomorfná s nejakým priamym súčinom cyklických grúp Zn1 × . . . × Znk , ktorý sme nútení prijať bez dôkazu, tak z dôsledku 27.8.3 a z tvrdenia 27.8.4 vyplýva nasledujúci výsledok. 27.8.5. Veta. Pre ľubovoľnú konečnú abelovskú grupu G platí Gd ∼= G. Charaktery grupy G = Zn1 ×. . .×Znk už vieme explicitne popísať: každý z nich má tvar α(x) = cx1 1 . . . cxk k = e2πia1x1/n1 . . . e2πiakxk/nk = exp 2πi k j=1 ajxj nj , kde x = (x1, . . . , xk) ∈ G a c1, . . . , ck ∈ U(1) sú pevné čísla také, že c nj j = 1, t. j. cj = e2πiaj/nj pre nejaké aj ∈ Znj . Potom priradenie α → (c1, . . . , ck) určuje izomorfizmus grúp (Zn1 × . . . × Znk )d ∼= Cn1 × . . . × Cnk a priradenie α → (a1, . . . , ak) izomorfizmus grúp (Zn1 × . . . × Znk )d ∼= Zn1 × . . . × Znk . Podotknime, že vetu 27.8.5 nemožno rozšíriť na nekonečné abelovské grupy. Napr. pre grupu celých čísel Z zrejme platí Zd ∼= U(1) ∼= Z. 622 27. Úvod do teórie grúp Ďalej poznamenajme, že izomorfizmus Zn ∼= Zd n z tvrdenia 27.8.4 nie je kanonický. Závisí totiž od voľby generátora cyklickej grupy Zn. Tým môže byť popri prvku 1 ľubovoľný prvok a ∈ Zn nesúdeliteľný s n. Z podobných dôvodov nie je kanonický izomorfizmus G ∼= Gd z vety 27.8.5. Konečná abelovská grupa G je však kanonicky izomorfná so svojim druhým duálom Gdd (a tento výsledok už možno – ale až s využitím vhodných topologických pojmov – zovšeobecniť aj na niektoré nekonečné, tzv. lokálne kompaktné abelovské grupy). Ľahko nahliadneme, že pre každý prvok x abelovskej grupy G je predpi- som x∆ (α) = α(x), kde α ∈ Gd , definovaný homomorfizmus x∆ : Gd → U(1). To znamená, že x∆ ∈ Gdd a x → x∆ je zobrazenie G → Gdd . 27.8.6. Veta. Nech G je konečná abelovská grupa. Potom x → x∆ je izomorfizmus grúp G ∼= Gdd . Dôkaz. Označme ∆(x) = x∆ . Priamym výpočtom, ktorý prenechávame čitateľovi, možno overiť, že ∆: G → Gdd je homomorfizmus. Keďže G ∼= Gd ∼= Gdd , všetky tieto grupy majú rovnaký počet prvkov. Stačí preto dokázať, že ∆ je injektívne, čiže Ker ∆ = {0}. Zvoľme x ∈ G, x = 0. Keďže G je konečná, stačí sa zaoberať prípadom, keď G = Zn1 × . . . × Znk je priamym súčinom cyklických grúp. Potom x = (x1, . . . , xk), kde xj ∈ Znj . Nakoľko x = (0, . . . , 0), xj = 0 pre nejaké j ≤ k. Definujme α ∈ Gd predpisom α(y) = e2πiyj/nj pre y = (y1, . . . , yk) ∈ G. Zrejme α(x) = 1, preto ∆(x)(α) = x∆ (α) = α(x) = 1, t. j. x∆ = ∆(x) nie je jednotkový prvok grupy Gdd (triviálny charakter Gd → U(1)) a x /∈ Ker ∆. Teda Ker ∆ = {0}. Na základe uvedeného kanonického izomorfizmu stotožníme konečnú abelovskú grupu G s grupou Gdd charakterov jej duálnej grupy Gd . Každý prvok x = x∆ grupy G tak zároveň považujeme za charakter grupy Gd a pre α ∈ Gd máme x(α) = α(x). Na budúce použitie ešte zaznamenáme jeden technický výsledok. 27.8.7. Lema. Nech G je konečná abelovská grupa a α ∈ Gd . Potom x∈G α(x) = 0, ak α = ε, # G, ak α = ε. Cvičenia 623 Dôkaz. Opäť stačí uvažovať prípad G = Zn1 × . . . × Znk . Ľubovoľné α ∈ Gd má tvar α(x) = cx1 1 . . . cxk k , kde x = (x1, . . . , xk) ∈ G a c1, . . . , ck ∈ U(1) sú pevné čísla také, že c nj j = 1. Zrejme α = ε práve vtedy, keď c1 = . . . = ck = 1. Počítajme x∈G α(x) = n1−1 x1=0 . . . nk−1 xk=0 cx1 1 . . . cxk k = n1−1 x1=0 cx1 1 . . . nk−1 xk=0 cxk k . V poslednom výraze je každý jednotlivý činiteľ súčtom prvých nj členov geometrickej postupnosti s kvocientom cj, t. j. nj−1 xj=0 c xj j =    c nj j − 1 cj − 1 = 0, ak cj = 1, nj−1 xj=0 1 = nj, ak cj = 1. V dôsledku toho x∈G α(x) = 0, ak α = ε, n1 . . . nk = # G, ak α = ε. Cvičenia 27.1. Pojem grupy možno definovať viacerými alternatívnymi spôsobmi. (a) Nech G je neprázdna množina s asociatívnou binárnou operáciou ·. Dokážte, že nasledujúce podmienky sú ekvivalentné: (i) (G, ·) je grupa; (ii) v (G, ·) platia pravidlá o krátení zľava (∀ x, y, z ∈ G)(xy = xz ⇒ y = z) a sprava (∀ x, y, z ∈ G)(xy = zy ⇒ x = z) a pre každé a, b ∈ G majú rovnice ax = b, ya = b aspoň jedno riešenie, t. j. (∀ a, b ∈ G)(∃ x, y ∈ G)(ax = b & ya = b); (iii) pre ľubovoľné a, b ∈ G majú rovnice ax = b, ya = b jediné riešenie v G, t. j. (∀ a, b ∈ G)(∃! x, y ∈ G)(ax = b & ya = b); (iv) (G, ·) má ľavú jednotku a každý prvok v G má ľavý inverzný, t. j. (∃ e ∈ G)(∀ x ∈ G) ex = x & (∃ x ∈ G)(x x = e) ; (v) (G, ·) má pravú jednotku a každý prvok v G má pravý inverzný, t. j. (∃ e ∈ G)(∀ x ∈ G) xe = x & (∃ x ∈ G)(xx = e) . (Návod: V dôkaze implikácie (iv) ⇒ (v), dokážte najprv, že ľavá jednotka v G je zároveň pravou jednotkou, a potom, že ľavý inverzný prvok k x ∈ G je zároveň pravý inverzný prvok k x.) (b) Na základe (iv) resp. (v) ukážte, že aj z podmienok (ii) resp. (iii) možno niečo 624 27. Úvod do teórie grúp vynechať, a (G, ·) spĺňajúca takéto oslabené podmienky bude stále ešte grupou. Skúste nájsť viac možností. (c) Nech G je neprázdna množina s asociatívnou binárnou operáciou ·, ktorá spĺňa pravidlo o krátení zľava, má ľavú jednotkou a ku každému prvku existuje pravý inverzný, t. j. (∃ e ∈ G)(∀ x ∈ G) ex = x & (∃ x ∈ G)(xx = e) . Zostrojte príklad, z ktorého vyplýva, že (G, ·) aj tak nemusí byť nevyhnutne grupa. (Návod: Operáciu · zadefinujte tak, aby každý prvok množiny G bol ľavou jednot- kou.) 27.2. (a) Dokážte tvrdenie 27.1.5. (b) Doplňte vynechané podrobnosti v dôkazoch tvrdení 27.2.5, 27.2.6. (c) Dokážte tvrdenia 27.3.2 – 27.3.6. 27.3. (a) V abelovskej grupe pre ľubovoľné prvky a, b a celé číslo n platí (ab)n = an bn . Dokážte, že uvedené tvrdenie platí v ľubovoľnej grupe za predpokladu, že prvky a, b komutujú. (b) Nájdite príklad neabelovskej grupy a v nej prvkov a, b takých, že (ab)2 = a2 b2 . 27.4. Neprázdna podmnožina konečnej grupy (G, ·) je jej podgrupou práve vtedy, keď je uzavretá na grupový súčin. Dokážte. 27.5. Dokážte nasledujúce tvrdenia o cyklických grupách: (a) Každá podgrupa cyklickej grupy je cyklická. (b) Každý homomorfný obraz cyklickej grupy je cyklická grupa. (c) Grupa G je cyklická práve vtedy, keď je homomorfným obrazom grupy (Z, +). (d) Ak celé číslo k ≥ 1 delí rád konečnej cyklickej grupy G, tak G má práve jednu podgrupu rádu k. 27.6. Dokážte nasledujúce zovšeobecnenie Lagrangeovej vety: Ak S, T sú podgrupy konečnej grupy G a S ⊆ T, tak [G : S] = [G : T] [T : S]. 27.7. Nájdite všetky podgrupy grúp Z4 a a Z2 × Z2. Odvoďte z toho, že uvedené grupy nie sú izomorfné. 27.8. (a) Zostrojte multiplikatívne tabuľky grúp ∆4 a ∆5. (b) Nájdite všetky podgrupy týchto grúp. Ktoré z nich sú normálne? 27.9. Nech G je grupa a S, T sú jej podgrupy. Označme S ∨ T = S ∪ T podgrupu grupy G generovanú množinou S ∪ T, t. j. najmenšiu podgrupu grupy G, ktorá obsahuje S aj T. Dokážte dve nasledujúce tvrdenia: (a) Ak pre podgrupy S, T platí ST = TS, tak S ∨ T = ST = TS. (b) Ak aspoň jedna z podgrúp S, T je normálna, tak ST = TS, teda tiež S ∨ T = ST = TS. (c) Na príklade podgrúp vhodnej dihedrálnej grupy ∆n ukážte, že množina ST nemusí byť podgrupou grupy G. 27.10. (a) Všetky otočenia roviny R2 okolo počiatku tvoria podgrupu grupy S(R), ◦ všetkých bijekcií R → R s operáciou kompozície zobrazení, izomorfnú s multiplikatívnou grupou všetkých komplexných jednotiek U(1). Dokážte. (b) Dokážte, že všetky otočenia roviny R2 okolo počiatku o celočíselný počet stup- Cvičenia 625 ňov tvoria podgrupu grupy všetkých otočení roviny okolo počiatku. Pre ktoré n je táto grupa izomorfná s cyklickou grupou Zn? 27.11. Dokážte postupne nasledujúce tvrdenia: (a) Každá konečná podgrupa multiplikatívnej grupy (C , ·) je nevyhnutne podgrupou grupy komplexných jednotiek U(1) ⊆ C . (b) Každá konečná podgrupa S grupy U(1) je cyklická, teda izomorfná s grupou Zn pre n = # S. (c) Množina e2πiQ = e2πiq ; q ∈ Q je podgrupou grupy U(1). (d) Každá konečná podgrupa grupy U(1), teda aj C , je podgrupou grupy e2πiQ . (e) Ak a ∈ R je iracionálne číslo, tak cyklická podgrupa e2πia grupy U(1) je nekonečná, teda izomorfná s grupou (Z, +). (f) Podgrupa S = e2πia , kde a ∈ R Q, je navyše hustá v U(1), t. j. pre ľubovoľné x ∈ U(1) a ε > 0 existuje s ∈ S také, že |x − s| < ε. (g) Podgrupa e2πiQ je takisto hustá v U(1). 27.12. Nech N G je normálna podgrupa grupy G a M N je normálna podgrupa grupy N. Vyplýva z toho, že M je normálna podgrupa grupy G? 27.13. Nech G je konečná grupa a H je jej podgrupa indexu 2. Dokážte, že H je normálna. Odvoďte z toho, že pre každé n ≥ 2 je alternujúca grupa An normálnou podgrupou symetrickej grupy Sn. Viete tento výsledok dokázať aj iným spôsobom? 27.14. Sformulujeme a dokážeme Eulerovu vetu, ktorá je zovšeobecnením malej Fermatovej vety (dôsledok 27.4.3). (a) Ak n ≥ 2 je celé číslo, tak prvky množiny Zn nesúdeliteľné s n tvoria grupu vzhľadom na násobenie v Zn. Dokážte. Túto grupu značíme (Zn, ·) a jej rád φ(n). Funkciu φ: N {0} → N {0} (doplnenú o hodnotu φ(1) = 1) nazývame Eulerovou funkciou. (b) Dokážte, že φ(p) = p − 1 pre každé prvočíslo p. (c) Nech n = pm1 1 . . . pmk k je rozklad čísla n na prvočinitele (pi sú rôzne prvočísla a mi ≥ 1). Odvoďe explicitné vyjadrenie φ(n) = pm1−1 1 (p1 − 1) . . . pmk−1 k (pk − 1). (d) Dokážte Eulerovu vetu: Ak n ≥ 2 je celé číslo, x je celé číslo nesúdeliteľné s n, tak xφ(n) ≡n 1. (e) Počet prvkov cyklickej grupy rádu n, ktorých rád je rovný danému deliteľovi d čísla n je rovný číslu φ(d). Dokážte. 27.15. Nech ϕ: G → H je homomorfizmus grúp a X ⊆ G je ľubovoľná množina. (a) Dokážte rovnosť ϕ X = ϕX . (b) Dokážte inklúziu ϕ |X| ⊆ |ϕX| a na príklade ukážte, že rovnosť nemusí nastať. (c) Dokážte, že ak homomorfizmus ϕ je surjektívny, tak ϕ |X| = |ϕ(X)| . (d) Odvoďte z (b), že homomorfný obraz ϕ(N) normálnej podgrupy N G nemusí byť normálnou podgrupou v H. (e) Odvoďte z (c), že homomorfný obraz ϕ(N) normálnej podgrupy N G v surjektívnom homomorfizme ϕ je normálna podgrupa v H. (f) Predpokladajme, že ϕ je surjektívny homomorfizmus. Dokážte, že zobraze- 626 27. Úvod do teórie grúp nie N → ϕ(N) je bijekcia z množiny Nϕ = {N G; Ker ϕ ⊆ N} na množinu všetkých normálnych podgrúp grupy H a pre ľubovoľné M, N ∈ Nϕ platí M ⊆ N ⇔ ϕ(M) ⊆ ϕ(N). 27.16. Nech N G je normálna podgrupa grupy G. Overte Nx · Ny = N(xy), (Nx)−1 = Nx−1 ako rovnosti množín. 27.17. Zmodifikujte definíciu homomorfizmu x → eix z príkladu 27.5.6 tak, aby ste získali izomorfizmus R/Z ∼= U(1). 27.18. Dokážte nasledujúce vety o izomorfizmoch grúp tak, že zakaždým nájdete konkrétne kanonické izomorfizmy. (a) Prvá (kosoštvorcová) veta o izomorfizme: Nech N, S sú podgrupy grupy G, pričom N G. Potom N ∩ S S, NS je podgrupa v G a S/(N ∩ S) ∼= NS/N. (b) Druhá veta o (dvojnom) izomorfizme: Nech M, N sú normálne podgrupy grupy G, pričom M ⊆ N. Potom M N, N/M = ζM (N) je normálna podgrupa faktorovej grupy G/N a platí (G/M)/(N/M) ∼= G/N. (c) Tretia veta o izomorfizme: Nech N1 je normálna podgrupa grupy G1 a N2 je normálna podgrupa grupy G2. Potom N1 ×N2 je normálna podgrupa grupy G1 ×G2 a platí G1/N1 × G2/N2 ∼= (G1 × G2)/(N1 × N2). 27.19. Dokážte, že nasledujúce grupy sú izomorfné: (a) (R , ·) ∼= (R+ , ·) × ({−1, 1}, ·) ∼= (R, +) × (Z2, +); (b) (C , ·) ∼= (R+ , ·) × (U(1), ·) ∼= (R, +) × (U(1), ·). 27.20. Pripomeňme, že RRRhhhθ = ch θ sh θ sh θ ch θ je označuje maticu hyperbolickej rotácie (pozri paragraf 16.9). Dokážte, že priradením θ → RRRhhhθ je definovaný injektívny grupový homomorfizmus RRRhhh: (R, +) → GL(2, R), · . 27.21. (a) Podajte priamy dôkaz izomorfizmu grúp Zn × Zn ∼= Zmn pre nesúdeliteľné celé čísla m, n ≥ 1. (Návod: Určte rád prvku (1, 1)). (b) Pre nesúdeliteľné celé čísla m, n ≥ 1 existujú celé čísla a, b také, že am+bn = 1. Dokážte jednak priamo, jednak ako dôsledok tvrdenia 27.6.4. (c) Odvoďte z (b), že pre ľubovoľné celé čísla m, n ≥ 1 existujú a, b ∈ Z také, že am + bn je najväčší spoločný deliteľ čísel m, n. 27.22. Uvažujme komutatívny diagram grupových homomorfizmov: {e} −−−−→ F1 ϕ1 −−−−→ G1 ψ1 −−−−→ H1 −−−−→ {e}  α  β  γ {e} −−−−→ F2 −−−−→ ϕ2 G2 −−−−→ ψ2 H2 −−−−→ {e} ktorého riadky tvoria krátke exaktné postupnosti. Dokážte, tzv. lemu o piatich ho- momorfizmoch:4 (a) Ak sú oba krajné zvislé homomorfizmy α, γ injektívne, tak aj stredný homomorfizmus β je injektívny. 4 Názov je mierne povedané čudný, lebo v hre je minimálne sedem homomorfizmov. Zrejme ide o pokračovanie literárnej tradície v duchu Alexandra Dumasa: aj jeho Traja mušketieri boli v skutočnosti štyria. Cvičenia 627 (b) Ak sú oba krajné zvislé homomorfizmy α, γ surjektívne, tak aj stredný homomorfizmus β je surjektívny. (c) Ak sú oba krajné zvislé homomorfizmy α, γ izomorfizmy, tak aj stredný homomorfizmus β je izomorfizmus. 27.23. Komutátorom prvkov x, y v grupe G nazývame výraz [x, y] = xyx−1 y−1 . Podgupu [G, G] = [x, y]; x, y ∈ G grupy G generovanú všetkými komutátormi nazývame komutantom alebo tiež deriváciou grupy G. Dokážte nasledujúce tvrdenia: (a) Prvky x, y komutujú práve vtedy, keď [x, y] = 1. (b) Grupa G je komutatívna práve vtedy, keď jej komutant je triválna podgrupa, t. j. [G, G] = {e}. (c) Komutant grupy je vždy jej normálna podgrupa, t. j. [G, G] G. (d) Nech N G je normálna podgrupa grupy G. Potom faktorová grupa G/N je komutatívna práve vtedy, keď [G, G] ⊆ N. 27.24. Dokážte nasledujúci dodatok k vete 27.7.3. Nech X je podmnožina grupy G a E je nejaká množina redukovaných grupových slov nad abecedou X. Ak ϕ: G → X | E je prostý homomorfizmus grúp taký, že ϕ(x) = x pre každé x ∈ X, tak ϕ je izomorfizmus G na X | E . 27.25. (a) Podrobne zdôvodnite výpočet súčinu yb xa · yd xc v príklade 27.7.4 o metacyklických grupách Fk mn. (b) Na základe cvičenia 27.23 (c) doplňte ďalšie vynechané detaily v tomto príklade. (c) Popíšte komutant metacyklickej grupy Fk mn a dokážte, že Fk mn, Fk mn ∼= Zn. (d) Pomocou cvičenia 27.23 (c) odvoďte z (c), že grupa Fk mn je rozšírením cyklickej grupy Zm pomocou cyklickej grupy Zn. Popíšte príslušnú krátku exaktnú postup- nosť. 27.26. Dokážte, že homomorfizmus Fl pq → Fk pq z príkladu 27.7.5 je naozaj izomorfizmus. 27.27. Dokážte tvrdenie 27.8.1. 27.28. (a) Nech H je abelovská grupa. Dokážte izomorfizmus grúp Hom(Z, H) ∼= H. (b) Odvoďte z (a), že duálna grupa ku grupe celých čísel Z je izomorfná s grupou komplexných jednotiek U(1), čiže Zd ∼= U(1). 27.29. Dokážte tvrdenie 27.8.1 a doplňte vynechané detaily z dôkazov tvrdenia 27.8.2 a vety 27.8.6. 27.30. (a) Nech m, n ≥ 1 sú celé čísla. Dokážte izomorfizmus grúp Hom(Zm, Zn) ∼= Zd, kde d je najväčší spoločný deliteľ čísel m, n. (b) Vychádzajúc z faktu, že každá konečná abelovská grupa je priamym súčinom cyklických grúp, a z tvrdenia 27.8.2 odvoďte z (a), že pre ľubovoľné konečné abelovské grupy G, H platí Hom(G, H) ∼= Hom(H, G). 28. Grupy transformácií V tejto kapitole si trochu bližšie všimneme niektoré typy grúp transformácií. Nebudeme sa však systematicky venovať ich štúdiu. Začneme dôkazom tzv. Cayleyho vety o reprezentácii, podľa ktorej je každá grupa izomorfná s nejakou grupou transformácií, a sústredíme sa najmä na využitie tohto faktu pri štúdiu abstraktných grúp. Uvidíme, že práve reprezentácie abstraktných grúp ako grúp transformácií konkrétnych množín, často vybavených dodatočnou štruktúrou, sú veľmi účinným nástrojom, ktorý nám umožňuje hlbšie preniknúť do štruktúry pôvodných grúp a jasnejšie osvetliť ich stavbu. Ani v tomto smere však nebudeme postupovať príliš ďaleko. Uspokojíme sa s vybudovaním niekoľkých základných pojmov a techník, ktoré využijeme v nasledujúcej kapitole venovanej maticovým grupám, a týmito elementárnymi prostriedkami sa pokúsime zodpovedať niektoré prirodzené otázky, ktoré by pri štúdiu tejto a predchádzajúcej kapitoly mohli či – lepšie povedané – mali napadnúť zvedavého čitateľa. 28.1 Cayleyho veta o reprezentácii Nech X je ľubovoľná množina. Každú podgrupu G ⊆ S(X) grupy všetkých permutácií množiny X nazývame grupou transformácií množiny X. Hovoríme, že G je grupa transformácií, ak G je grupou transformácií nejakej množiny. Zrejme všetky prvky ľubovoľnej grupy transformácií sú bijektívne transformácie príslušnej množiny. Podľa uvedenej definície je množina G ⊆ S(X) grupou transformácií množiny X práve vtedy, keď idX ∈ G a pre všetky f, g ∈ G platí f ◦ g ∈ G a f−1 ∈ G, t. j. G obsahuje identické zobrazenie na X, je uzavretá vzhľadom na kompozíciu zobrazení a s každým zobrazením obsahuje aj k nemu inverzné zobrazenie. Ukazuje sa, že grupy transformácií, až na izomorfizmus, zahŕňajú vôbec všetky grupy. Inak povedané, každú abstraktnú grupu (G, ·) možno reprezentovať konkrétnym spôsobom ako grupu transformácií nejakej množiny X a jej grupovú operáciu skladaním zobrazení. 28.1.1. Veta. (Cayley) Každá grupa je izomorfná s nejakou grupou trans- formácií. Dôkaz. Vlastne stačí k danej grupe G nájsť nejakú vhodnú množinu X a 28.2. Akcie a reprezentácie grúp 629 injektívny homomorfizmus grúp Φ: G → S(X). Podľa vety 27.5.4 o homomorfizme G je potom izomorfná s grupou transformácií Im Φ ⊆ S(X). Zvoľme X = G a pre g ∈ G, x ∈ X položme Φg(x) = gx. Inak povedané, pre g ∈ G je Φg : X → X zobrazenie dané priradením x → gx. Každé zobrazenie Φg je zrejme bijektívne, s inverzným zobrazením Φ−1 g = Φg−1 : x → g−1 x, takže Φ: G → S(X). Dokážeme, že Φ je homomorfizmus grúp, t. j. Φgh = Φg ◦ Φh pre všetky g, h ∈ G. Nato stačí overiť, že obe zobrazenia dávajú rovnaké výsledky pre každé x ∈ X: Φgh(x) = (gh)x = g(hx) = Φg(Φh(x)) = (Φg ◦ Φh)(x). Na dôkaz injektívnosti homomorfizmu Φ sa stačí presvedčiť, že má triválne jadro. Ak g ∈ Ker Φ, tak Φg = idX, preto gx = Φg(x) = idX(x) = x pre všetky x ∈ X. Voľbou x = e dostávame g = ge = e, teda Ker Φ = {e}. 28.1.2. Príklad. Nech (V, +) je aditívna grupa nejakého vektorového priestoru (nad ľubovoľným poľom K). Pre každé uuu ∈ V označme Φuuu : V → V zobrazenie dané priradením xxx → xxx + uuu pre xxx ∈ V , t. j. posunutie (transláciu) o vektor uuu. Zrejme každé posunutie Φuuu je bijektívne zobrazenie (k nemu inverzné zobrazenie je posunutie o vektor −uuu) a pre uuu,vvv ∈ V platí Φuuu+vvv = Φuuu ◦ Φvvv. Inak povedané, zložením posunutí o vektory uuu a vvv dostaneme posunutie o vektor uuu + vvv. Samozrejme, identickým zobrazením idV : V → V je jedine posunutie Φ0 o nulový vektor 0. Φ: (V, +) → (S(V ), ◦) je tak injektívny grupový homomorfizmus a (V, +) je izomorfná s grupou Im Φ ⊆ S(V ) všetkých posunutí priestoru V . Výslovne upozorňujeme, že – napriek dojmu, ktorý by snáď mohol navodiť dôkaz vety 28.1.1 a príklad 28.1.2, – zďaleka nie pre každý injektívny homomorfizmus grúp Φ: G → S(X) musí množina X splývať so základnou množinou grupy G. 28.2 Akcie a reprezentácie grúp Niektoré metódy, ktoré sa vyskytli v dôkaze Cayleyho vety, stoja za podrobnejšie preskúmanie vo všeobecnej polohe. Nech (G, ·, e) je grupa a X je ľubovoľná množina. (a) Akciou grupy G na množine X nazývame binárnu operáciu ·: G×X → X, ktorá spĺňa podmienky ex = x a g(hx) = (gh)x pre ľubovoľné g, h ∈ G, x ∈ X. Uvedený typ akcie presnejšie nazývame ľavou akciou grupy G na množine X. Analogicky možno definovať aj pravú akciu 630 28. Grupy transformácií ·: X × G → X grupy G na množine X; formuláciu príslušných podmienok prenechávame čitateľovi. (b) Reprezentáciou grupy G v množine X nazývame ľubovoľný grupový homomorfizmus Φ: G → S(X). Keďže pre g ∈ G je samotné Φ(g): X → X zobrazenie, budeme miesto Φ(g) dávať prednosť zápisu Φg; podmienka homomorfnosti Φ má potom tvar rovnosti Φgh = Φg ◦Φh pre všetky g, h ∈ G. Rozdiel medzi pojmami akcie a reprezentácie je čiste formálny, sú to len dva mierne odlišné spôsoby ako hovoriť o tom istom. Ak je daná akcia ·: G× X → X, tak každé g ∈ G určuje predpisom Φg(x) = gx bijekciu Φg ∈ S(X); k nej inverzná bijekcia je daná prepisom Φg−1 (x) = g−1 x. Zobrazenie Φ: G → S(X) je potom reprezentáciou grupy G v množine X. Z vlastností akcie totiž vyplýva podmienka homomorfnosti Φ: Φgh(x) = (gh)x = g(hx) = Φg(Φh(x)) = (Φg ◦ Φh)(x), pre všetky g, h ∈ G, x ∈ X. Naopak, každá reprezentácia Φ: G → S(X) určuje predpisom gx = Φg(x) akciu ·: G × X → X. Dôvody sú podobné: na dôkaz podmienky g(hx) = (gh)x stačí prepísať uvedené rovnosti v mierne pozmenenom poradí; podmienka ex = x vyplýva z vlastnosti reprezentácie Φe = idX. Nech grupa G má akciu na množine X. Orbitou prvku x ∈ X (vzhľadom na túto akciu) naývame množinu Gx = {gx; g ∈ G}. Podobne ako v paragrafe 27.4, i teraz možno ľahko nahliadnuť, že pre ľubovoľné x, y ∈ X platí x = ex ∈ Gx a Gx ∩ Gy = ∅ ⇔ Gx = Gy. Z toho vyplýva, že systém orbít všetkých prvkov grupy G tvorí rozklad množiny X; hovoríme mu orbitálny rozklad množiny X a značíme ho X/G. K nemu prislúchajúcu ekvivalenciu možno vyjadriť nasledujúcimi štyrmi ekvivalentnými spôsobmi: x ≡G y ⇔ Gx = Gy ⇔ x ∈ Gy ⇔ y ∈ Gx ⇔ Gx ∩ Gy = ∅. Hovoríme, že množina T ⊆ X je transverzálna, ak # (Gx ∩ T) = 1 pre každé x ∈ X, t. j. T obsahuje práve jedného reprezentanta každej orbity Gx ∈ X/G. Stabilizátorom prvku x ∈ X nazývame množinu Stb(x) = {g ∈ G; gx = x}. Ľahko sa možno presvedčiť, že stabilizátor Stb(x) je dokonca podgrupou grupy G. Podobne nazývame Fix(g) = {x ∈ G; gx = x} 28.2. Akcie a reprezentácie grúp 631 množinou pevných bodov, prípadne množinou fixpunktov prvku g ∈ G. Zrejme pre g = e máme Fix(e) = X. Nasledujúce dva výsledky dávajú do súvisu práve zavedené pojmy. 28.2.1. Veta. Nech grupa G má akciu na množine X. Potom pre každé x ∈ X je predpisom g Stb(x) → gx korektne definované bijektívne zobrazenie G/ Stb(x) → Gx medzi množinou pravých tried rozkladu grupy G podľa stabilizátora Stb(x) a orbitou Gx. Ak G alebo X je konečná, tak z toho vyplýva # Gx = [G : Stb(x)]. Ak X je konečná, tak navyše pre každú transverzálnu množinu T ⊆ X platí #X = x∈T [G : Stb(x)]. Dôkaz. Označme S = Stb(x). Predpisom g → gx je zrejme definované surjektívne zobrazenie G → Gx. Pre všetky g, h ∈ G pritom platí gx = hx ⇔ x = g−1 hx ⇔ g−1 h ∈ S ⇔ gS = hS, To znamená, že predpisom gS → gx je naozaj korektne definované bijektívne zobrazenie G/S → Gx. To dokazuje prvú rovnosť. Keďže množina X je zjednotením po dvoch disjunktných orbít Gx, x ∈ T, druhá rovnosť je dôsledkom prvej. Poznamenajme, že druhá z rovností vety 28.2.1 sa niekedy zvykne nazývať rovnosť tried. Podľa prvej rovnosti sa počet prvkov orbity Gx ľubovoľného prvku x ∈ X rovná indexu jeho stabilizátora Stb(x) v grupe G. Ak G je konečná, tak z toho podľa Lagrangeovej vety 27.4.2 vyplýva rovnosť # Stb(x) = (# G)/(# Gx), v dôsledku čoho majú všetky stabilizátory prvkov tej istej orbity rovnaký rád. No nielen to – tieto stabilizátory sú dokonca izomorfné. 28.2.2. Tvrdenie. Nech grupa G má akciu na množine X. Potom stabilizátory ľubovoľných dvoch prvkov tej istej orbity sú izomorfné. Presnejšie, ak x, y ∈ X a y = hx, kde h ∈ G, tak predpisom g → hgh−1 je definovaný izomorfizmus grúp Stb(x) ∼= Stb(y). Dôkaz prenechávame ako cvičenie čitateľovi. Ďalšia veta, známa pod názvom Burnsideova lema, vyjadruje počet orbít akcie ako aritmetický priemer počtov fixpunktov jednotlivých prvkov grupy. Ako vzápätí uvidíme Burnsideova lema je zovšeobecnením Lagrangeovej vety 27.4.2. 632 28. Grupy transformácií 28.2.3. Veta. Nech G je konečná grupa, ktorá má akciu na konečnej množine X. Potom # (X/G) = 1 # G g∈G # Fix(g). Dôkaz. Počet prvkov množiny R = {(g, x) ∈ G × X; gx = x} spočítame dvoma spôsobmi. Zrejme platí #R = g∈G # Fix(g) = x∈X # Stb(x). S využitím predchádzajúceho tvrdenia a faktu, že X je zjednotením po dvoch disjunktných orbít ω ∈ X/G, z toho dostaneme g∈G # Fix(g) = x∈X # Stb(x) = x∈X # G # Gx = ω∈X/G x∈ω # G # ω = # (X/G)·# G. S príkladom reprezentácie sme sa už stretli v predchádzajúcom paragrafe, v dôkaze vety 28.1.1. Tam zostrojené zobrazenie Φ: G → S(X) bolo injektívnou reprezentáciou grupy G v množine X = G. To je tiež dôvod, prečo uvedený výsledok nazývame Cayleyho veta o reprezentácii. Trochu všeobecnejšiu situáciu si teraz preberieme v reči akcií. 28.2.4. Príklad. Nech G je grupa a H je jej podgrupa. Potom grupa H má na množine G ľavú akciu transláciou H × G → G danú priradením (h, x) → hx pre h ∈ H, x ∈ G, ako aj pravú akciu transláciou G × H → G danú priradením (x, h) → xh. Orbitou prvku x ∈ G v ľavej akcii transláciou je práve ľavá trieda rozkladu Hx prvku x podľa podgrupy H; jeho orbitou v pravej akcii transláciou je zasa pravá trieda rozkladu xH podľa podgrupy H. Označenie G/H množiny všetkých orbít (ľavej resp. pravej) akcie podgrupy H transláciou si tak zachováva svoj predošlý význam z paragrafu 27.4 množiny (ľavých resp. pravých) rozkladových tried grupy G podľa podgrupy H. Ďalej sa sústreďme len na ľavú akciu podgrupy H na grupe G. Zrejme každé x ∈ G má triviálny stabilizátor Stb(x) = {e}, a taktiež množina pevných bodov každého h ∈ H {e} je prázdna, čiže Fix(h) = ∅; pre h = e samozrejme Fix(e) = G. Prvá časť vety 28.2.1 v tomto kontexte hovorí, že podgrupu H ∼= H/{e} možno prirodzeným spôsobom vzájomne jednoznačne zobraziť na každú orbitu (ľavú triedu rozkladu) Hx. Podobne, Burnsideova lema splýva v tomto prípade s Lagrangeovou vetou, podľa ktorej #(G/H) = (# G)/(# H). 28.3. Grupy automorfizmov a konjugácia 633 28.2.5. Príklad. Tento príklad nadväzuje na príklad 27.3.11, v ktorom sme zaviedli jednoparametrické grupy matíc. Pre ľubovoľnú maticu AAA z Rn×n resp. Cn×n je priradením (t,ccc) → eAAAt ·ccc daná akcia grupy (R, +) na vektorovom priestore Rn resp. Cn . Orbitu bodu ccc, t. j. množinu eAAAt ·ccc; t ∈ R nazývame dráhou alebo trajektóriou bodu ccc. Riešenie xxx(t) = eAAAt ·ccc autonómnej počiatočnej úlohy xxx = AAA · xxx, xxx(0) = ccc možno chápať ako parametrizáciu tejto trajektórie. Poznámka o značení. V literatúre sa možno stretnúť so značne rôznorodým označením akcií, orbít, stabilizátorov a pod. Napr. výsledok akcie prvku g ∈ G na prvok x ∈ X sa často značí ako „mocnina xg a orbita prvku x ako xG = {xg ; g ∈ G}. Tento zápis je vhodný najmä pre pravú akciu grupy (G, ·, 1) na množine X, kedy definujúce podmienky akcie nadobúdajú tvar x1 = x a (xg )h = xgh . Bežné označenie stabilizátora prvku x ∈ X v akcii grupy G je Gx. Orbita prvku x sa občas značí Orb(x). 28.3 Grupy automorfizmov a konjugácia Niektoré reprezentácie Φ grupy G v množine X môžu mať isté vlastnosti navyše – jednotlivé zobrazenia Φg nemusia byť len bijekcie X → X, ale môžu to byť zobrazenia zachovávajúce nejakú štruktúru na množine X. Potom reprezentáciu Φ možno chápať ako homomorfizmus Φ: G → A, kde A je nejaká podgrupa grupy S(X). Jedným takým prípadom sa budeme zaoberať v tomto paragrafe: množina X bude opäť splývať s grupou G a spomínaná podgrupa A ⊆ S(G) bude pozostávať z izomorfizmov G → G. Homomorfizmus ϕ: G → G grupy G do seba sa nazýva endormorfizmus grupy G. Množinu všetkých endomorfizmov grupy G značíme End G. Zrejme idG ∈ End G a pre ϕ, ψ ∈ End G platí ϕ ◦ ψ ∈ End G, čiže množina End G obsahuje identické zobrazenie a je uzavretá vzhľadom na skladanie zobrazení. Taktiež obsahuje ďalší význačný prvok – je ním triviálny (konštantný) endomorfizmus x → e. Automorfizmom grupy G nazývame každý jej bijektívny endomorfizmus. Množinu všetkých automorfizmov grupy G značíme Aut G. 28.3.1. Veta. Nech (G, ·) je grupa. Potom množina jej automorfizmov Aut G je podgrupou grupy S(G), teda je to grupa transformácií množiny G. Dôkaz. Zrejme Aut G ⊆ S(G), idG ∈ Aut G a pre ľubovoľné ϕ, ψ ∈ Aut G platí ϕ ◦ ψ ∈ Aut G a ϕ−1 ∈ Aut G. Grupu Aut G nazývame grupou automorfizmov grupy G. 634 28. Grupy transformácií Dôležitým príkladom automorfizmov sú tzv. konjugácie. Ak g je prvok grupy G, tak zobrazenie Γg : G → G dané predpisom Γg(x) = gxg−1 pre x ∈ G nazývame konjugáciou prvkom g ∈ G. 28.3.2. Tvrdenie. Nech G je grupa. Potom (a) pre každé g ∈ G platí Γg ∈ Aut G, t. j. zobrazenie Γg je automorfizmus grupy G; (b) samotné zobrazenie Γ : G → Aut G je reprezentácia grupy G v množine G. Dôkaz. (a) Zrejme každé zobrazenie Γg je bijektívne – k nemu inverzným zobrazením je Γ−1 g = Γg−1 . Ukážeme, že je to tiež homomorfizmus. Pre ľubovoľné x, y ∈ G platí Γg(xy) = g(xy)g−1 = gxg−1 gyg−1 = Γg(x)Γg(y). (b) Treba overiť rovnosť Γgh = Γg ◦Γh pre všetky g, h ∈ G. Zvoľme x ∈ G a počítajme Γgh(x) = (gh)x(gh)−1 = g hxh−1 g−1 = Γg(Γh(x)) = (Γg ◦ Γh)(x). Automorfizmy grupy G, ktoré majú tvar Γg pre nejaké g ∈ G, nazývame jej vnútornými automorfizmami. Podgrupu Im Γ ⊆ Aut G značíme In G a nazývame grupou vnútorných (interných) automorfizmov grupy G. Akciu grupy G na množine G konjugáciou budeme značiť (g, x) → gxg−1 ; v predchádzajúcom paragrafe zavedené označenie (g, x) → gx by v tomto prípade zrejme viedlo k nedorozumeniam. Orbitou prvku x ∈ G v tejto akcii je množina {gxg−1 ; g ∈ G}; prvky x, y ∈ G sa nazývajú konjugované, označenie x ∼G y, ak existuje g ∈ G také, že y = gxg−1 , t. j. ak ležia v tej istej orbite. Zrejme relácia konjugovanosti ∼G je ekvivalencia na množine G. Orbitálny rozklad tvorí faktorová množina G/∼G, príslušné orbity sa nazývajú triedy konjugácie. Výslovne upozorňujeme, že (s výnimkou komutatívnych grúp) ekvivalencia konjugovanosti ∼G nie je kongruencia na grupe G. Stabilizátorom prvku x ∈ G v akcii konjugáciou je podgrupa CG(x) = C(x) = {g ∈ G; gxg−1 = x} = {g ∈ G; gx = xg} grupy G, nazývaná centralizátor prvku x; zrejme pre g ∈ G platí g ∈ C(x) práve vtedy, keď gx = xg, t. j. g komutuje s x. Podobne, množinou pevných bodov prvku g ∈ G je opäť centralizátor CG(g) = C(g) = {x ∈ G; gxg−1 = x} = {x ∈ G; gx = xg}. 28.3. Grupy automorfizmov a konjugácia 635 Jadrom reprezentácie Γ : G → Aut G je množina C(G) = {g ∈ G; Γg = idG} = {g ∈ G; (∀ x ∈ G)(gx = xg)} nazývaná centrum grupy G, pozostávajúca zo všetkých prvkov grupy G, ktoré komutujú s každým jej prvkom. Zrejme C(G) je abelovská grupa a G je abelovská práve vtedy, keď C(G) = G. Z vety 27.5.3 a vety 27.5.4 o homomorfizme okamžite vyplýva 28.3.3. Veta. Centrum C(G) grupy G je jej normálna podgrupa a faktorová grupa G/C(G) je izomorfná s grupou In G vnútorných automorfimov grupy G; symbolicky C(G) G a G/C(G) ∼= In G. Centrum hodne vypovedá o štruktúre pôvodnej grupy. Ako jednoduchú ukážku uvádzame nasledujúci zďaleka nie očividný výsledok. 28.3.4. Veta. Nech G je ľubovoľná grupa. Ak faktorová grupa G/C(G) je cyklická, tak G je komutatívna. Dôkaz. Označme C = C(G) a predpokladajme, že G/C je cyklická rádu r s generátorom Ca, kde 0 < r ∈ N ∪ {∞}, a ∈ G. Potom množina C ∪ {a} generuje celú grupu G. Pre ľubovoľný prvok x ∈ G totiž existuje 0 ≤ k < r také, že Cx = (Ca)k = Cak . Preto x ∈ Cak , teda x = cak ∈ C ∪ {a} pre nejaké c ∈ C. Ukážeme, že i samotná grupa G je komutatívna. Ľubovoľné x, y ∈ G možno napísať v tvare x = cak , y = dal pre vhodné c, d ∈ C, 0 ≤ k, l < r. V dôsledku toho platí xy = cak · dal = dal · cak = yx. Prvok x ∈ C(G) je konjugovaný len sám so sebou, t. j. jeho orbitou je jednoprvková množina {x}, preto pre každú transverzálnu množinu T platí C(G) ⊆ T. Ak x /∈ C(G), tak jeho orbita obsahuje aspoň dva prvky. Centralizátor prvku x ∈ C(G) je celá grupa, t. j. C(x) = G; pre x /∈ C(G) je C(x) vlastná podgrupa grupy G. Špecifikáciou viet 28.2.1 a 28.2.3 na akciu konjugáciou dostávame nasledujúce dve vety – rovnosť v prvej z nich sa opäť nazýva rovnosť tried, druhá je zvláštnym prípadom Burnsideovej lemy. 28.3.5. Veta. Nech G je konečná grupa. Potom počet prvkov grupy G konjugovaných s prvkom x ∈ G sa rovná indexu [G : C(x)] jeho centralizátora. Ak T ⊆ G je transverzálna množina vzhľadom na akciu konjugáciou, tak C(G) ⊆ T a platí # G = x∈T [G : C(x)] = # C(G) + x∈T C(G) [G : C(x)]. 636 28. Grupy transformácií 28.3.6. Veta. Nech G je konečná grupa. Potom počet tried konjugácie v grupe G je # (G/∼G) = 1 # G g∈G # C(g) = # C(G) + 1 # G g∈G C(G) # C(g) a počet netriviálnych (t. j. aspoň dvojprvkových) tried konjugácie v G je # (G/∼G) − # C(G) = 1 # G g∈G C(G) # C(g). Rovnosť tried ma celý rad zaujímavých dôsledkov. Jedným z nich je Cauchyho veta, ktorá je obrátením Lagrangeovej vety pre prvočíselné delitele rádu konečnej grupy. 28.3.7. Veta. Nech G je konečná grupa a p je prvočíslo, ktoré delí jej rád. Potom G má podgrupu rádu p. Dôkaz. Najprv budeme predpokladať, že G = {x1, . . . , xn} je komutatívna rádu n, pričom prvok xi má rád ri. Vďaka komutatívnosti G ľahko nahliadneme, že priradením (k1, . . . , kn) → xk1 1 . . . xkn n je definovaný surjektívny homomorfizmus grúp ϕ: Zr1 × . . . × Zrn → G. Podľa vety o homomorfizme je G ∼= (Zr1 ×. . .×Zrn )/ Ker ϕ a z Lagrangeovej vety vyplýva, že rád n grupy G delí rád r1 . . . rn grupy Zr1 ×. . .×Zrn . Potom aj prvočíslo p delí r1 . . . rn, preto musí deliť niektorý z činiteľov ri. Označme k = ri/p. Prvok y = xk i ∈ xi ⊆ G má zrejme rád p, teda y ⊆ G je cyklická podgrupa rádu p. Predpokladajme teraz, že G je konečná grupa s najmenším možným rádom, ktorý je deliteľný číslom p, ale G nemá podgrupu rádu p. Potom G nie je komutatívna, takže centrum C = C(G) je jej vlastná komutatívna podgrupa a z prvej časti dôkazu vyplýva, že p nemôže deliť ani rád centra C. Podľa rovnosti tried z vety 28.3.5 platí # G = # C + x∈T C [G : C(x)], kde T ⊆ G je nejaká transverzálna množina vzhľadom na akciu konjugáciou grupy G na sebe samej. Keby p nedelilo rád žiadneho z centralizátorov C(x), x ∈ T C, delilo by všetky ich indexy [G : C(x)]; potom by však muselo deliť aj rád # C, čo je spor. Preto p delí rád C(x) pre nejaké x /∈ C, čo je vlastná podgrupa grupy G. Z minimality rádu G vyplýva, že C(x), a tým aj G, obsahuje pogrupu rádu p, čo je opäť spor. Pre konečné abelovské grupy je možné úplné obrátenie Lagrangeovej vety. 28.4. Polopriamy súčin grúp 637 28.3.8. Veta. Nech G je konečná abelovská grupa a d je prirodzené číslo, ktoré delí jej rád. Potom G má podgrupu rádu d. Dôkaz. Ak d je prvočíslo, tak potrebný záver vyplýva z predchádzajúcej vety. Predpokladajme, že d je najmenšie prirodzené číslo, pre ktoré existuje konečná abelovská grupa s rádom deliteľným číslom d, no bez podgrupy rádu d. Potom d = pm pre nejaké prvočíslo p a prirodzené číslo m > 1. Nech G je spomínaná grupa. Keďže m < d tiež delí rád grupy G, táto má podgrupu S rádu m. Faktorová grupa G/S má rád deliteľný číslom p, teda aj podgrupu H rádu p. Potom však ζ−1 S (H) je podgrupa grupy G rádu pm = d, čo je spor. (Pripomíname, že ζS : G → G/S označuje prirodzenú projekciu.) Aj nasledujúci výsledok je jednoduchým dôsledkom rovnosti tried. Ide o slabšiu verziu výsledku dokázaného Burnsidom. 28.3.9. Veta. Nech rád grupy G je kladnou mocninou prvočísla p. Potom G má netriviálne centrum. Dôkaz. Nech T ⊆ G je transverzálna množina vzhľadom na akciu konjugáciou. Pre každé x ∈ T C(G) je centralizátor C(x) vlastnou podgrupou grupy G, teda jeho index [G : C(x)] je deliteľný číslom p. Potom však aj rád centra # C(G) = # G − x∈T C(G) [G : C(x)] je deliteľný číslom p. 28.3.10. Dôsledok. Nech G je grupa rádu p2 , kde p prvočíslo. Potom G je komutatívna. Dôkaz. Podľa predošlej vety G má netriviálne centrum; toto môže mať len p alebo p2 prvkov. Prvý prípad však nemôže nastať, lebo potom by faktorová grupa G/C(G) bola rádu p, teda cyklická. Podľa vety 28.3.4 by G bola komutatívna, čiže C(G) = G. 28.4 Polopriamy súčin grúp Reprezentácie jednej grupy automorfizmami inej grupy umožňujú zaujímavé zovšeobecnenie konštrukcie priameho súčinu grúp. Zatiaľ čo priamy súčin abelovských grúp je abelovská grupa, pomocou tzv. polopriameho súčinu možno i z abelovských grúp vytvoriť grupy neabelovské. Naopak, rozkladom nejakej grupy na polopriamy súčin v istom zmysle jednoduchších grúp možno získať hlbší vhľad do jej štruktúry. 638 28. Grupy transformácií Nech G a X sú grupy a Φ: G → Aut X je homomorfizmus grúp, teda vlastne reprezentácia grupy G v množine X automorfizmami grupy X. Polopriamym súčinom grúp G a X vzhľadom na reprezentáciu Φ nazývame množinu G × X s binárnou operáciou definovanou predpisom (g, x) · (h, y) = (gh, xΦg(y)) pre g, h ∈ G, x, y ∈ X. Polopriamy súčin grúp G, X budeme značiť G Φ X, prípadne len G X, ak reprezentácia Φ bude zrejmá z kontextu. 28.4.1. Veta. Nech (G, ·, e), (X, ·, ε) sú grupy a Φ : G → Aut X je reprezentácia grupy G. Potom polopriamy súčin G Φ X grúp G a X je grupa. Dôkaz. Na základe definície operácie na polopriamom súčine G Φ X a vlastností homomorfizmov pre ľubovoľné (g, x), (h, y), (f, z) ∈ G × X platí (g, x) · (h, y) · (f, z) = (g, x) · (hf, y Φh(z)) = g(hf), x Φg(y Φh(z)) = (gh)f, x Φg(y) Φgh(z) = (gh, x Φg(y)) · (f, z) = (g, x) · (h, y) · (f, z), (e, ε) · (g, x) = (eg, ε Φe(x)) = (g, x) = (ge, x Φg(ε)) = (g, x) · (e, ε), (g, x) · g−1 , Φg−1 x−1 = gg−1 , x Φgg−1 x−1 = e, xx−1 = (e, ε) = g−1 g, Φg−1 (x)−1 Φg−1 (x) = g−1 , Φg−1 (x)−1 · (g, x). To znamená, že príslušná binárna operácia je asociatívna, jej neutrálnym prvkom je (e, ε) a inverzným prvok k prvku (g, x) je (g, x)−1 = g−1 , Φg−1 x−1 = g−1 , Φg−1 (x)−1 , teda G Φ X je grupa. Ak Φ: G → Aut X je triviálny homomorfizmus, čiže Φg = idX pre všetky g ∈ G, tak uvedená definícia operácie na množine G × X nadobúda tvar (g, x) · (h, y) = (gh, xy), teda polopriamy súčin G Φ X splýva s priamym súčinom G × X grúp G a X. Iný dôležitý špeciálny prípad polopriameho súčinu dostaneme tak, že za grupu G vezmeme priamo grupu Aut X všetkých automorfizmov grupy X a za homomorfizmus Φ identické zobrazenie idG : G = Aut X → Aut X. Príslušný polopriamy súčin značíme Aut X X = Hol(X) a nazývame holomorf grupy X. Bližší pohľad na holomorf nájde čitateľ v cvičeniach 28.10 a 28.11. Trochu všeobecnejšie možno za G vziať akúkoľvek podgrupu grupy automorfizmov Aut X. Násobenie v takomto polopriamom súčine G X je dané formulou (g, x) · (h, y) = (g ◦ h, xg(y)). 28.4. Polopriamy súčin grúp 639 Konečne tretí špeciálny prípad možno dostať ako polopriamy súčin grupy G samej so sebou vzhľadom na reprezentáciu konjugáciou Γ : G → Aut G (porovnaj s cvičením 28.11). I táto konštrukcia funguje za trochu všeobecnejších podmienok. Ak H a N sú podgrupy grupy G, pričom N G (dokonca stačí, aby platilo hxh−1 ∈ N pre všetky h ∈ H, x ∈ N), tak H má reprezentáciu Γ : H → Aut N konjugáciou na grupe N. Násobenie na polopriamom súčine H N = H Γ N je dané predpisom (g, x) · (h, y) = gh, xgyg−1 , pre g, h ∈ H, x, y ∈ N. Pre tento polopriamy súčin nezavádzame osobitný názov práve preto, že – ako hneď uvidíme – ide svojim spôsobom o prípad typický. Podobne ako v prípade priameho súčinu, aj v súvislosti s polopriamym súčinom prirodzene vzniká otázka rozložiteľnosti danej grupy na polopriamy súčin netriválnych, v istom zmysle jednoduchších faktorov. Tieto, ak existujú, možno opäť nájsť medzi jej vhodnými podgrupami. Ľahko možno overiť, že s každým polopriamym súčinom G Φ X grúp (G, ·, e), (X, ·, ε) sú zviazané tri grupové homomorfizmy 548 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA akúkoľvek podgrupu grupy automorfizmov Aut X. Násobenie v takomto polopriamom súčine G X je dané formulou (g, x) · (h, y) = (g ◦ h, xg(y)). Konečne tretí špeciálny prípad možno dostať ako polopriamy súčin grupy G samej so sebou vzhľadom na reprezentáciu konjugáciou Γ : G → Aut G (porovnaj s cvičením 28.11). I táto konštrukcia funguje za trochu všeobecnejších podmienok. Ak H a N sú podgrupy grupy G, pričom N G (dokonca stačí, aby platilo hxh−1 ∈ N pre všetky h ∈ H, x ∈ N), tak H má reprezentáciu Γ : H → Aut N konjugáciou na grupe N. Násobenie na polopriamom súčine H N = H Γ N je dané predpisom (g, x) · (h, y) = gh, xgyg−1 , pre g, h ∈ H, x, y ∈ N. Pre tento polopriamy súčin nezavádzame osobitný názov práve preto, že – ako hneď uvidíme – ide svojim spôsobom o prípad typický. Podobne ako v prípade priameho súčinu, aj v súvislosti s polopriamym súčinom prirodzene vzniká otázka rozložiteľnosti danej grupy na polopriamy súčin netriválnych, v istom zmysle jednoduchších faktorov. Tieto, ak existujú, možno opäť nájsť medzi jej vhodnými podgrupami. Ľahko možno overiť, že s každým polopriamym súčinom G Φ X grúp (G, ·, e), (X, ·, ε) sú zviazané tri grupové homomorfizmy X G Φ X G, ξ π γ dané predpismi ξ(x) = (e, x), π(g, x) = g, γ(g) = (g, ε), pre g ∈ G, x ∈ X. Pritom ξ je injektívny, π je surjektívny a platí Im ξ = Ker π, teda X ξ G Φ X π G je krátka exaktná postupnosť. Taktiež γ : G → G Φ X je injektívny a spĺňa podmienku π ◦ γ = idG. Podotýkame, že ani jedno z ponúkajúcich sa zobrazení (g, x) → x resp. (g, x) → Φg(x) vo všeobecnosti nie je homomorfizmom G Φ X → X. V polopriamom súčine G Φ X sme tak identifikovali dve podgrupy H = Im γ = {(g, ε); g ∈ G} ∼= G, N = Im ξ = Ker π = {(e, x); x ∈ X} ∼= X také, že N G Φ X a H ∩N = {(e, ε)}. Navyše každý prvok (g, x) ∈ G Φ X možno písať v tvare (g, x) = (e, x) · (g, ε) ∈ NH, ako aj (g, x) = (g, ε) · (e, Φg−1 (x)) ∈ HN, teda G = NH = HN. Ukazuje sa, že prítomnosť takýchto podgrúp v danej grupe už zabezpečuje jej rozklad na ich polopriamy súčin. dané predpismi ξ(x) = (e, x), π(g, x) = g, γ(g) = (g, ε), pre g ∈ G, x ∈ X. Pritom ξ je injektívny, π je surjektívny a platí Im ξ = Ker π, teda X ξ G ΦX π G je krátka exaktná postupnosť. Taktiež γ : G → G ΦX je injektívny a spĺňa podmienku π◦γ = idG. Podotýkame, že ani jedno z ponúkajúcich sa zobrazení (g, x) → x resp. (g, x) → Φg(x) vo všeobecnosti nie je homomorfizmom G Φ X → X. V polopriamom súčine G Φ X sme tak identifikovali dve podgrupy H = Im γ = {(g, ε); g ∈ G} ∼= G, N = Im ξ = Ker π = {(e, x); x ∈ X} ∼= X také, že N G Φ X a H ∩ N = {(e, ε)}. Navyše každý prvok (g, x) ∈ G Φ X možno písať v tvare (g, x) = (e, x) · (g, ε) ∈ NH, ako aj (g, x) = (g, ε) · (e, Φg−1 (x)) ∈ HN, teda G = NH = HN. Ukazuje sa, že prítomnosť takýchto podgrúp v danej grupe už zabezpečuje jej rozklad na ich polopriamy súčin. 640 28. Grupy transformácií 28.4.2. Veta. Nech (G, ·, e) je grupa a H, N sú jej podgrupy také, že N G, H ∩ N = {e} a G = NH. Potom G je izomorfná s polopriamym súčinom H Γ N grúp H, N vzhľadom na reprezentáciu konjugáciou Γ : H → Aut N. Dôkaz. Ukážeme, že zobrazenie ϕ(g, x) = xg je homomorfizmus grúp ϕ: H N → G. Pre g, h ∈ H, x, y ∈ N jednoduchým výpočtom dostávame ϕ (g, x)·(h, y) = ϕ(gh, xgyg−1 ) = (xgyg−1 )(gh) = (xg)(yh) = ϕ(g, x)ϕ(h, y). Keďže H ∩ N = {e}, z tvrdenia 27.6.2 (b) vyplýva, že ϕ je injekcia. Surjektívnosť ϕ je dôsledkom rovností Im ϕ = NH = G. Teda G ∼= H N. Hovoríme, že krátka exaktná postupnosť grúp F ϕ G ψ H je rozštiepená, ak existuje homomorfizmus η: H → G taký, že ψ ◦ η = idH. Videli sme, že každý polopriamy súčin grúp určuje istú rozštiepenú krátku exaktnú postupnosť. Toto tvrdenie však možno aj obrátiť. 28.4.3. Dôsledok. Nech F ϕ G ψ H je krátka exaktná postupnosť grúp rozštiepená homomorfizmom η: H → G. Potom grupa G je izomorfná s polopriamym súčinom H F grúp H a F. Dôkaz. Stačí overiť, že podgrupy N = Im ϕ a H = Im η grupy G spĺňajú podmienky N G, N ∩ H = {e} a G = NH predošlej vety. Detaily prenechávame čitateľovi. 28.4.4. Príklad. Nech m, n sú prirodzené čísla. Keďže Zn ∼= x | xn , každý endomorfizmus ϕ: Zn → Zn je jednoznačne určený jediným prvkom k ∈ Zn, totiž obrazom k = ϕ(1) generátora 1 ∈ Zn. Pre b ∈ Zn potom platí ϕ(b) = kb. Samostatne si rozmyslite, že ϕ ∈ Aut Zn práve vtedy, keď k = ϕ(1) je nesúdeliteľné s n. Podobne, z dôvodu Zm ∼= x | xm je každý homomorfizmus Φ: Zm → Aut Zn jednoznačne určený jediným automorfizmom ϕ grupy Zn, totiž obrazom ϕ = Φ1 generátora 1 ∈ Zm, ktorý však musí vyhovovať podmienke ϕm = idZn (pozri vetu 27.7.3). V konečnom dôsledku je tak každý homomorfizmus Φ: Zm → Aut Zn jednoznačne určený jediným prvkom k = Φ1(1) ∈ Zn, ktorý je nesúdeliteľný s n a vyhovuje podmienke km ≡n 1. Potom pre a ∈ Zm, b ∈ Zn platí Φa(b) = ka b. Nech teda Φ: Zm → Aut Zn je reprezentácia grupy Zm automorfizmami grupy Zn a k = Φ1(1). Polopriamy súčin Zm Φ Zn budeme značiť Zm k Zn. Operácia v grupe Zm k Zn je daná formulou (a, b) ∗ (c, d) = (a + c, b + ka d), 28.5. Štruktúra grúp jednoduchých rádov 641 pre a, c ∈ Zm, b, d ∈ Zn. Pri porovnaní s príkladom 27.7.4 vidíme, že priradením (a, b) → yb xa je definovaný homomorfizmus grúp Zm k Zn → Fk mn. Čitateľ by si mal samostatne premyslieť, že ide dokonca o izomorfizmus. Teda Zm k Zn ∼= Fk mn = x, y | xm = yn = e, xyx−1 = yk , čím sme metacyklické grupy predstavili v tvare polopriamych súčinov cyklických grúp. 28.5 Štruktúra grúp jednoduchých rádov Ako naznačuje naše doterajšie krátke zoznámenie so svetom grúp, štruktúra konečnej grupy do značnej miery závisí od jej rádu, presnejšie od štruktúry deliteľov tohto čísla. Jednako rád grupy (okrem istých singulárnych prípadov) ani zďaleka neurčuje jej štruktúru jednoznačne. Štruktúrou deliteľov rádu grupy je však daný akýsi predbežný rozvrh možností, ktoré u grúp daného rádu vôbec prichádzajú do úvahy. Naopak, ak je štruktúra deliteľov niektorého prirodzeného čísla dostatočne jednoduchá, umožňuje to popísať štruktúru všetkých grúp daného rádu. Pomocou doteraz dokázaných výsledkov sme schopní jednoznačne až na izomorfizmus popísať všetky grupy rádov p, p2 a pq, kde p, q sú rôzne prvočísla. Skúsme si najprv zosumarizovať to málo, čo už vieme: 1. Každá grupa G rádu p je cyklická, teda izomorfná s aditívnou grupou Zp. 2. Každá grupa G rádu p2 je podľa dôsledku 28.3.10 komutatívna. Ak obsahuje prvok rádu p2 , tak je cyklická, teda izomorfná s grupou Zp2 . V opačnom prípade musí obsahovať aspoň dva prvky a, b rádu p také, že b /∈ a . Ľahko možno overiť, že potom a ∩ b = {e} a a b = G (skúste sami). Z tvrdenia 27.6.2 tak vyplýva izomorfizmus grúp G ∼= a × b ∼= Zp ×Zp. Štruktúru všetkých grúp rádu pq popisuje nasledujúca veta. 28.5.1. Veta. Nech p < q sú dve prvočísla. Potom (a) každá komutatívna grupa rádu pq je cyklická, teda izomorfná s grupou Zpq; (b) nekomutatívna grupa rádu pq existuje práve vtedy, keď p delí q − 1, a v tom prípade je izomorfná s metacyklickou grupou Fk pq, kde k ∈ Zq je prvok rádu p. Dôkaz. Nech G je grupa rádu pq. Podľa Cauchyho vety G obsahuje podgrupu A rádu p aj podgrupu B rádu q. Obe sú zrejme cyklické, teda A = a , B = b pre nejaké prvky a, b ∈ G rádov p resp. q. Keďže rád podgrupy A ∩ B musí deliť rád každej z grúp A, B, nevyhnutne A ∩ B = {e}. Podľa tvrdenia 27.6.2 (b) je predpisom (x, y) → yx definované injektívne zobrazenie 642 28. Grupy transformácií A × B → G. Keďže obe množiny A × B aj G majú zhodne pq prvkov, je to dokonca bijekcia, teda G = BA. Podobným spôsobom ukážeme, že B je normálna podgrupa v G. Keby pre niektoré g ∈ G platilo gBg−1 = B, podgrupa B ∩ gBg−1 by bola triviálna, teda predpisom (x, y) → xy by bolo definované prosté zobrazenie B × gBg−1 → G. Ale množina B × gBg−1 má q2 kým množina G len pq prvkov, čo je spor, teda B G. Podľa vety 28.4.2 grupa G je izomorfná s polopriamym súčinom A B vzhľadom na reprezentáciu konjugáciou Γ : A → Aut B grupy A automorfizmami grupy B. Nech Γa(b) = aba−1 = bk , kde k ∈ Zq. Z úvah vykonaných v príkladoch 27.7.4–5 a 28.4.4 je jasné, že G je izomorfná s metacyklickou grupou Fk pq. Ak k = 1, tak generátory a, b komutujú, teda i G je komutatívna a podľa tvrdenia 27.6.2 izomorfná s priamym súčinom svojich cyklických podgrúp A ∼= Zp, B ∼= Zq. Z tvrdenia 27.6.4 potom vyplýva, že G ∼= Zpq je cyklická grupa. Ak k = 1, tak k je prvok rádu p multiplikatívnej grupy Zq poľa Zq. Keďže Zq má rád q −1, takéto k existuje vtedy a len vtedy, keď p delí q −1. Navyše, ako sme dokázali v príklade 27.7.5, metacyklická grupa Fk pq ∼= G je nezávisle na k = 1 určená jednoznačne až na izomorfizmus. Len pre informáciu a bez dôkazu uveďme, že pre každé prvočíslo p existujú až na izomorfizmus práve tri komutatívne grupy rádu p3 : Zp3 , Zp2 × Zp a Zp × Zp × Zp; a práve dve nekomutatívne grupy rádu p3 . Pre nepárne p sú to x, y, z | xp = yp = zp = e, xz = zx, yz = zy, xyx−1 y−1 = z , x, y | xp = yp2 = e, xyx−1 = yp+1 . Pre p = 2 máme tiež dve grupy ∆4 ∼= x, y | x2 = y4 = e, xyx−1 = y−1 , Q8 ∼= x, y | x4 = e, x2 = y2 , xyx−1 = y−1 . Ešte poznamenajme, že Q8 sa zvykne nazývať kvaterniónová grupa. Obsahuje osem prvkov, typicky označovaných ako ±1, ±i, ±j, ±k, nazývaných tiež kvaterniónové jednotky. Násobenie v Q8 je jednoznačne dané požiadavkami, že 1 je neutrálny prvok, (−1)q = −q pre každé q ∈ Q8, a rovnosťami i2 = j2 = k2 = −1, ij = −ji = k, jk = −kj = i, ki = −ik = j. Kvaterniónmi sa budeme podrobnejšie zaoberať v paragrafoch 30.4–6. Cvičenia 643 Cvičenia 28.1. (a) Nech σ = (i1, . . . , ik) ∈ Sn je permutácia n-prvkovej množiny pozostávajúca z jediného cyklu (pozri cvičenie 0.14). Dokážte, že jej rád je práve k. (b) Dokážte, že cykly párneho rádu sú nepárne permutácie a cykly párneho rádu sú nepárne permutácie. (c) Nech σ = 1 ◦. . .◦ m je rozklad permutácie σ ∈ Sn na disjunktné cykly. Potom jej rád je najmenším spoločným násobkom rádov jednotlivých cyklov 1, . . . , m; dokážte. 28.2. (a) Nech grupa G má akciu na množine X. Podrobne dokážte, že stabilizátor Stb(x) ľubovoľného prvku x ∈ X je podgrupa grupy G. (b) Dokážte tvrdenie 28.2.2. 28.3. Nech G×X → X je akcia grupy G na množine X. Dokážte, že každé z nasledujúcich priradení určuje akciu grupy G na príslušnej množine: (a) pre každé n ≥ 1 je g, (x1, . . . , xn) → (gx1, . . . , gxn) akcia grupy G na množine Xn ; (b) pre každé n ≥ 1 je g, {x1, . . . , xn} → {gx1, . . . , gxn} akcia grupy G na množine Pn(X) všetkých n-prvkových podmnožín množiny X; (c) (g, S) → gM = {gx; x ∈ M} je akcia grupy G na množine P(X) všetkých podmnožín množiny X. 28.4. Nech G×P(X) → P(X) je akcia grupy G na množine všetkých podmnožín množiny X pochádzajúca z akcie G × X → X. Stabilizátorom množiny M ⊆ X nazývame jej stabilizátor ako prvku M ∈ P(X), t. j. Stb(M) = {g ∈ G; gM = M}. Jej bodový stabilizátor definujeme ako prienik stabilizátorov všetkých jej prvkov, čiže Stb• (M) = x∈M Stb(x) = g ∈ G; (∀ x ∈ M)(gx = x) . Dokážte, že stabilizátor Stb(M) množiny M ⊆ X je podgrupa grupy G a jej bodový stabilizátor Stb• (M) je normálna podgrupa je stabilizátora Stb(S), teda Stb• (M) Stb(M). 28.5. Nech Φ: G → Aut X je reprezentácia grupy G automorfizmami grupy X. Potom predpisom gS = {Φg(x); x ∈ S} je definovaná akcia grupy G na množine Sub(X) všetkých podgrúp grupy X. Dokážte. 28.6. V zmysle predchádzajúceho cvičenia označme (g, S) → gSg−1 akciu grupy G na svojich podgrupách pochádzajúcu od reprezentácie konjugáciou Γ : G → Aut G. (a) Podgrupa N grupy G je normálna práve vtedy, keď je pevným bodom uvedenej akcie; dokážte. (b) Stabilizátor podgrupy S ⊆ G nazývame normalizátorom podgrupy S v grupe G a značíme ho NG(S) = N(S) = {g ∈ G; gSg−1 = S}. Dokážte, že normalizátor NG(S) je najväčšia podgrupa grupy G, pre ktorú platí S NG(S). (c) Dokážte, že počet rôznych podgrúp grupy G konjugovaných s pogrupou S ⊆ G sa rovná indexu jej normalizátora [G : N(S)]. (d) Bodový stabilizátor podgrupy S ⊆ G nazývame centralizátorom podgrupy S v grupe G a značíme ho CG(S) = C(S) = {g ∈ G; (∀ x ∈ S)(gxg−1 = x)}. Dokážte, že centralizátor CG(S) je normálnou podgrupou normalizátora NG(S). 28.7. Nech X, Y sú ľubovoľné množiny; označme F = Y X množinu všetkých funkcií f : X → Y . 644 28. Grupy transformácií (a) Predpokladajme, že H ×Y → Y je ľavá akcia grupy H na množine Y . Dokážte, že predpisom (η, f) → ηf, kde (ηf)(x) = ηf(x) pre η ∈ H, f ∈ F, x ∈ X, je definovaná ľavá akcia grupy H na množine F. (b) Funkcia f ∈ F je pevným bodom prvku η ∈ H práve vtedy, keď pre každé y ∈ f(X) platí ηy = y, t. j. η f(X) = idf(X). Dokážte. (c) Predpokladajme, že X×G → X je pravá akcia grupy G na množine X. Dokážte, že predpisom (f, γ) → fγ, kde (fγ)(x) = f(γx) pre γ ∈ G, f ∈ F, x ∈ X, je definovaná pravá akcia grupy G na množine F. (d) Funkcia f ∈ F je pevným bodom prvku γ ∈ G práve vtedy, keď pre každé x ∈ X platí f(γx) = x, t. j. f je konštantná na každej orbite podgrupy γ ⊆ G v akcii X × γ → X. Dokážte. 28.8. Kruh v rovine je rozdelený svojimi n polomermi na n rovnakých kruhových výsečí. Každú z týchto výsečí vyfarbíme niektorou z k rôznych farieb (pripúšťame, že niektoré susedné výseče možu mať rovnakú farbu). Pomocou Burnsideovej lemy určíme počet rôznych terčov, ktoré možno získať takýmto farbením (dva terče považujeme za rovnaké, ak jeden možno získať z druhého otočením o celočíselný násobok uhla 2π/n). (a) Vysvetlite ako zodpovedajú farbenia výsečí kruhu funkciám f : {1, . . . , n} → {1, . . . , k}. Označíme F = F(n, k) množinu všetkých takých funkcií (farbení) a Cn = ρ podgrupu symetrickej grupy Sn generovanú cyklickou permutáciou ρ = (1, . . . , n). Zrejme (Cn, ◦) ∼= (Zn, +). (b) Podľa cvičenia 28.7 (c) je priradením (f, γ) → f ◦ γ daná pravá akcia grupy Cn na množine F. Dokážte, že dve farbenia f, g ∈ F určujú rovnaký terč práve vtedy, keď ležia v tej istej orbite tejto akcie F × Cn → F, teda počet terčov splýva s počtom orbít #(F/Cn) (c) Pre j ∈ Zn označme dj najväčšieho spoločného deliteľa čísel j a n (pre j = 0 kladieme d0 = n). Dokážte, že množina Fix(ρj ) = {f ∈ F; fρj = f} všetkých pevných bodov permutácie ρj ∈ Cn má práve kdj prvkov. (d) Odvoďte z (c), že počet všetkých terčov, ktoré možno získať zafarbením kruhu rozdeleného na n výsečí k farbami je práve 1 n n−1 j=0 kdj . (e) Nech 1 ≤ d ≤ n je ľubovoľný deliteľ čísla n. Dokážte, že počet všetkých prvkov j ∈ Zn, pre ktoré je najväčší spoločný deliteľ j a n rovný práve d, je φ(n/d), kde φ je Eulerova funkcia – pozri cvičenie 27.14. (f) Odvoďte z (e), že hľadaný počet terčov je práve 1 n d kd φ(n/d), kde súčet beží cez všetky delitele d čísla n. (g) Vypočítajte niekoľko konkrétnych hodnôt počtov terčov #(F(n, k)/Cn) pre 3 ≤ n ≤ 12, 2 ≤ k ≤ 6. 28.9. Nech G je ľubovoľná aspoň dvojprvková grupa. (a) Dokážte, že priradením (x, y) → (y, x) je definovaný autorfizmus grupy G2 = G × G, ktorý nie je vnútorný. (b) Nech n ≥ 2. Pre každú permutáciu σ ∈ Sn označme Φσ : Gn → Gn zobrazenie dané predpisom Φσ(x1, . . . , xn) = (xσ−1(1), . . . , xσ−1(n)). Dokážte, že Φ: Sn → Aut Gn je injektívna reprezentácia symetrickej grupy Sn automorfizmami grupy Gn a platí Im Φ ∩ In Gn = {idGn }. Cvičenia 645 (c) Vysvetlite, prečo sme v (b) nepoužili jednoduchšiu definíciu Φσ(x1, . . . , xn) = (xσ(1), . . . , xσ(n)). 28.10. Pripomeňte si definíciu okruhu s jednotkou z cvičení 1.8 a 2.10. (a) Dokážte že všetky endomorfizmy ľubovoľnej abelovskej grupy (A, +) tvoria okruh s jednotkou (End A, +, ◦, 0, idA) so sčítaním po zložkách, násobením daným kompozíciou zobrazení a identickým zobrazením idA ako jednotkou. (b) Zadefinujte pojem izomorfizmu pre okruhy s jednotkou a dokážte nasledujúce izomorfizmy okruhov s jednotkou: End Zn ∼= Zn pre ľubovoľné n ≥ 1 a End Z ∼= Z. 28.11. (a) Nech p je prvočíslo. Dokážte, že grupa Aut Zp všetkých automorfizmov cyklickej grupy (Zp, +) je izomorfná s multiplikatívnou grupou (Zp, ·) nenulových prvkov poľa Zp ako aj s cyklickou aditívnou grupou (Zp−1, +). (b) Nech n ≥ 2. Dokážte, že grupa Aut Zn všetkých automorfizmov cyklickej grupy (Zn, +) je izomorfná s multiplikatívnou grupou (Zn, ·) všetkých zvyškov modulo n nesúdeliteľných s n. (c) Grupa Aut Z všetkých automorfizmov nekonečnej cyklickej grupy (Z, +) je izomorfná s multiplikatívnou grupou ({1, −1}, ·), teda tiež s cyklickou aditívnou grupou (Z2, +). Dokážte. 28.12. Holomorfizmom grupy X nazývame ľubovoľnú bijekciu h: X → X takú, že pre ľubovoľné x, y, z ∈ G platí h xy−1 z = h(x)h(y)−1 h(z). Dokážte nasledujúce tvrdenia: (a) Každý automorfizmus grupy X je jej holomorfizmom. (b) Každá ľavá translácia, t. j. vynásobenie µa : x → ax konštantným prvkom a ∈ X, je holomorfizmus grupy X. (c) Všetky holomorfizmy grupy X tvoria grupu Hol(X) vzhľadom na skladanie zo- brazení. (d) Grupa Aut G všetkých automorfizmov grupy G je podgrupou grupy Hol(G). (e) Všetky translácie µa : G → G, a ∈ X, tvoria normálnu podgrupu grupy Hol X izomorfnú s grupou X. (f) Hol(X) ∼= Aut X X. 28.13. (a) Podobným spôsobom ako v predchádzajúcom cvičení opíšte vnútorný holomorf IHol(X) grupy X ako polopriamy súčin In X X grupy X s grupou jej vnútorných automorfizmov In X. (b) Dokážte, že vnútorný holomorf IHol(X) je izomorfný s homomorfným obrazom polopriameho súčinu X X grupy X so sebou samou vzhľadom na reprezentáciu konjugáciou Γ : X → Aut X. Popíšte explicitne prirodzený surjektívny homomorfizmus X X → In X X = IHol(X) aj jeho jadro. 28.14. Podrobne overte, že zobrazenia ξ, π a γ z rozštiepenej krátkej exaktnej postupnosti polopriameho súčinu v paragrafe 28.4 sú naozaj homomorfizmy. Na jednoduchých príkladoch predveďte, že zobrazenia (g, x) → x, (g, x) → Φg(x) nemusia byť homo- morfizmy. 28.15. Doplňte vynechané detaily dôkazu dôsledku 28.4.3 a popíšte explicitne homomorfizmus Φ: H → Aut F pomocou homomorfizmov ϕ, ψ a η. 28.16. Doplňte vynechané podrobnosti v úvahe z bodu 2 na začiatku paragrafu 28.5. 28.17. Dokážte nasledujúce tvrdenia: 646 28. Grupy transformácií (a) Každá grupa rádu 15, 33, 35, resp. 77 je cyklická. (b) Existuje jediná nekomutatívna grupa rádu 21, 55, resp. 155. (c) Ak p je nepárne prvočíslo, tak ∆p je jediná nekomutatívna grupa rádu 2p. (d) Ak q je prvočíslo tvaru 3k+1, tak existuje jediná nekomutatívna grupa rádu 3q. (e) Ak q je prvočíslo tvaru 3k − 1, tak každá grupa rádu 3q je cyklická. 28.18. (a) Dokážte, že grupy ∆4 a Q8 nie sú izomorfné. (b) Dokážte, že každá nekomutatívna grupa rádu 8 je izomorfná s niektorou z grúp ∆4 alebo Q8. 28.19. (a) Dokážte, že jediná dvojprvková podgrupa kvaterniónovej grupy Q8 je jej centrum C(Q8) = {1, −1}. (b) Odvoďte z (a), že hoci Q8 nie je komutatívna, každá jej podgrupa je normálna. 28.20. (a) Znázornite si všetkých 12 prvkov alternujúcej grupy A4 ako permutácie štvorprvkovej množiny {1, 2, 3, 4} umiestnenej do vrcholov pravidelného štvorstena. Uvedomte si, že všetky tieto permutácie možno reprezentovať rotáciami v euklidovskom priestore R3 okolo vhodných osí prechádzajúcich cez stred štvorstena o uhol π resp. 2π/3. (b) Nájdite všetky dvoj-, troj- a štvorprvkové podgrupy grupy A4. (c) Dokážte, že A4 nemá podgrupu rádu 6. (d) Dokážte, že žiadne dve z nasledujúcich nekomutatívnych dvanásťprvkových grúp nie sú izomorfné: alternujúca grupa A4, dihedrálna grupa ∆6, priamy súčin ∆3 ×Z2. 29. Lineárne a afinné grupy Lineárne grupy, t. j. rôzne grupy regulárnych matíc resp. grupy automorfizmov vektorových priestorov, patria k vôbec najdôležitejším príkladom grúp. V tejto kapitole sa zoznámime so základnými typmi lineárnych grúp a ich afinnými rozšíreniami, ako aj s rôznymi vzťahmi medzi nimi. Využitie aparátu teórie grúp nám zároveň umožní uvidieť v novom, jednotiacom svetle niektoré otázky týkajúce sa zachovávania niektorých geometrických invariantov, napr. objemu, vzdialenosti či časopriestorovej odľahlosti. Lineárne grupy (najmä nad poľom C) hrajú navyše kľúčovú úlohu pri objasnení štruktúry vôbec všetkých konečných grúp pomocou ich lineárnych reprezentácií, t. j. homomorfizmov danej grupy do rôznych lineárnych grúp. Teóriou takýchto reprezentácií sa však už v tomto kurze zaoberať nebudeme. V dvoch záverečných paragrafoch podnikneme malý výlet do topológie lineárnych grúp. Zavedieme pojmy súvislosti a jednoduchej súvislosti a okrem iného ukážeme, ako súvisia súvislé komponenty niektorých maticových grúp s orientáciou (časo)priestoru. Obmedzený rozsah nám však nedovoľuje zaviesť všetky potrebné topologické pojmy a techniky, ktoré by nám umožnili pojednať o tejto téme uceleným a elegantnejším spôsobom. Preto budeme nútení urobiť zopár dôkazov takpovediac na kolene a trochu „zašmodrchať niektoré detaily. 29.1 Všeobecná a špeciálna lineárna grupa Ako sme už uviedli v príklade 27.1.4, všetky regulárne matice daného rozmeru n×n nad poľom K tvoria vzhľadom na násobenie matíc grupu, ktorú značíme GL(n, K) a nazývame všeobecná lineárna grupa stupňa n nad poľom K. Podobne, pre ľubovoľný vektorový priestor V nad poľom K tvorí množina všetkých lineárnych izomorfizmov ϕ: V → V grupu vzhľadom na skladanie zobrazení. Značíme ju GL(V ) a nazývame všeobecná lineárna grupa, prípadne tiež grupa automorfizmov vektorového priestoru V . Zrejme GL(V ) je podgrupou grupy S(V ) všetkých bijekcií V → V a taktiež grupy Aut(V, +) všetkých automorfizmov aditívnej grupy (V, +) vektorového priestoru V . Ak dim V = n a ααα = (uuu1, . . . ,uuun) je pevne zvolená báza vektorového priestoru V , tak priradenie ϕ → (ϕ)ααα určuje izomorfizmus grúp GL(V ) ∼= GL(n, K). Pre inú bázu βββ dostávame iný izomorfizmus ϕ → (ϕ)βββ. Pre (stŤpcový) vektorový priestor V = Kn sa grupy GL(Kn ) a GL(n, K) zvyknú často stotožňovať prostredníctvom izomorfizmu ϕ → (ϕ)εεε sprostredkovaného kanonickou bázou εεε v Kn . 648 29. Lineárne a afinné grupy Lineárnou grupou stupňa n nad poľom K budeme nazývať ľubovoľnú podgrupu G všeobecnej lineárnej grupy GL(n, K). Podobne, lineárnou grupou vektorového priestoru V budeme nazývať ľubovoľnú podgrupu G všeobecnej lineárnej grupy GL(V ).1 Lineárne grupy transformácií G ⊆ GL(V ) a lineárne grupy matíc G ⊆ GL(n, K), nazývané tiež maticovými grupami, budeme študovať paralelne. Pritom budeme prednostne používať tú formuláciu, ktorá sa nám v danej situácii vidí názornejšia, prípadne technicky výhodnejšia. Spomínané izomorfizmy nám kedykoľvek umožnia prenášať získané výsledky oboma smermi. Všeobecná lineárna grupa GL(n, K) má dve význačné pravé akcie na množine Kn×n všetkých matíc rozmeru n × n nad poľom K: sú dané prira- deniami (XXX,AAA) → AAA−1 · XXX · AAA, resp. (XXX,AAA) → AAAT · XXX · AAA, pre XXX ∈ Kn×n , AAA ∈ GL(n, K). V prípade poľa komplexných čísel K = C k druhú z nich často nahrádza niektorá z akcií (XXX,AAA) → AAAT · XXX · AAA, resp. (XXX,AAA) → AAA∗ · XXX · AAA. To nám umožňuje zasadiť známe vzťahy podobnosti a kongruencie štvorcových matíc do kontextu orbitálnych rozkladov akcií grúp. Priamočiary dôkaz nasledujúceho tvrdenia tak možno prenechať čiateľovi. 29.1.1. Tvrdenie. (a) Všetky štyri uvedené zobrazenia sú pravými akciami grupy GL(n, K) na vektorovom priestore Kn×n , pričom pre pevné AAA ∈ GL(n, K) je každé z priradení XXX → AAA−1 · XXX · AAA, XXX → AAAT · XXX · AAA, XXX → AAAT · XXX · AAA, XXX → AAA∗ · XXX · AAA lineárnym izomorfizmom Kn×n → Kn×n . (b) Matice XXX,YYY ∈ Kn×n sú podobné, t. j. XXX ≈ YYY , práve vtedy, keď patria do tej istej orbity grupy GL(n, K) vzhľadom na akciu (XXX,AAA) → AAA−1 · XXX · AAA. (c) Matice XXX,YYY ∈ Kn×n sú kongruentné, t. j. XXX ≡ YYY , práve vtedy, keď patria do tej istej orbity grupy GL(n, K) vzhľadom na akciu (XXX,AAA) → AAAT · XXX · AAA. (d) Matice XXX,YYY ∈ Cn×n sú hermitovsky kongruentné, t. j. XXX ∗ ≡ YYY , práve vtedy, keď patria do tej istej orbity grupy GL(n, C) vzhľadom na akciu (XXX,AAA) → AAAT · XXX · AAA, prípadne vzhľadom na akciu (XXX,AAA) → AAA∗ · XXX · AAA, keďže obe majú rovnaký orbitálny rozklad. 1 Kvôli vylúčeniu niektorých patologických príkladov sa od lineárnych (maticových) grúp (aspoň nad poľami R resp. C) tradične žiada, aby boli navyše uzavretými podmnožinami príslušnej všeobecnej lineárnej grupy (chápanej – ak treba po vhodnom stožnení – ako podmnožina n2 -rozmerného priestoru Rn×n resp. 2n2 -rozmerného priestoru Cn×n ). Keďže všetky konkrétne príklady lineárnych grúp, s ktorými sa v tejto kapitole stretneme, budú túto popmienku spĺňať, nepovažujeme za potrebné zahrnúť ju do našej definície. 29.1. Všeobecná a špeciálna lineárna grupa 649 Uvedené relácie, ako aj tvrdenie 29.1.1 však možno zovšeobecniť na ľubovoľnú lineárnu grupu G ⊆ GL(n, K). Matice XXX,YYY ∈ Kn×n sa nazývajú G-podobné, označenie XXX ≈G YYY , ak existuje matica AAA ∈ G taká, že YYY = AAA−1 · XXX · AAA. Hovoríme, že XXX, YYY sú G-kongrunetné, označenie XXX ≡G YYY , ak existuje AAA ∈ G taká, že YYY = AAAT · XXX · AAA. V prípade poľa K = C možno zaviesť aj vzťah hermitovskej G-kongruencie: XXX ∗ ≡G YYY , ak existuje AAA ∈ G taká, že YYY = AAA∗ ·XXX ·AAA. Obzvlášť zaujímavá je situácia, keď pre všetky AAA ∈ G platí AAA−1 = AAAT (resp. v komplexnom prípade AAA−1 = AAA∗ ), kedy vzťahy Gpodobnosti a (hermitovskej) G-kongruencie splývajú. Ešte si všimnime, že akciu z bodu (c) možno uvažovať aj ako akciu len na lineárnom podpriestore všetkých symetrických matíc z Kn×n a akcie z bodu (d) ako akcie len na podpriestore všetkých hermitovských matíc z Cn×n . Podľa Cauchyho vety 10.3.2 a jej dôsledku, vety 10.3.3, je determinant homomorfizmom všeobecnej lineárnej grupy GL(n, K) na multiplikatívnu grupu K poľa K. Jeho jadro SL(n, K) = {AAA ∈ GL(n, K); detAAA = 1} je tak normálnou podgrupou grupy GL(n, K) – nazývame ju špeciálna lineárna grupa stupňa n nad poľom K. Taktiež dôkaz nasledujúceho jednoduchého tvrdenia prenechávame čita- teľovi. 29.1.2. Tvrdenie. Pre AAA ∈ GL(n, K) platí AAA ∈ SL(n, K) práve vtedy, keď det(AAA · XXX) = detXXX pre každú maticu XXX ∈ Kn×n . Teda v prípade poľa K = R a euklidovského priestoru Rn vybaveného štandardným skalárnym súčinom špeciálna lineárna grupa SL(n, R) pozostáva práve zo všetkých matíc AAA ∈ Rn×n takých, že lineárne zobrazenie Rn → Rn , dané predpisom xxx → AAA · xxx, zachováva orientované objemy nrozmerných rovnobežnostenov vytvorených usporiadanými n-ticami vektorov (uuu1, . . . ,uuun) z Rn . Hovoríme, že orientovaný objem je invariantom grupy SL(n, R); všeobecnejšie, determinant je invariantom grupy SL(n, K). Všeobecnú lineárnu grupu GL(n, K) možno tiež opísať ako polopriamy súčin multiplikatívnej grupy K nenulových prvkov poľa K a špeciálnej lineárnej grupy SL(n, K). 29.1.3. Tvrdenie. GL(n, K) ∼= K SL(n, K). Dôkaz. Ľahko možno nahliadnuť, že grupové homomorfizmy SL(n, K) ι GL(n, K) δ K , 650 29. Lineárne a afinné grupy kde ι je identické zobrazenie a δ priradí matici AAA ∈ GL(n, K) jej determinant, tvoria krátku exaktnú postupnosť, rozštiepenú napr. homomorfizmom η: K → GL(n, K), a → diag(IIIn−1, a). Potrebný záver tak vyplýva z dôsledku 28.4.3. 29.2 Afinné rozšírenia lineárnych grúp Podľa vety 8.5.2 a bezprostredne za ňou nasledujúcej poznámky možno každé afinné zobrazenie f : V → V vektorového priestoru V do seba jednoznačne vyjadriť v tvare kompozície f = ϕ + uuu = τuuu ◦ ϕ lineárneho zobrazenia ϕ = f − f(0): V → V a posunutia τuuu : V → V o pevný vektor uuu = f(0) ∈ V . Navyše podľa tvrdenia 8.5.8 je f bijektívne práve vtedy, keď je bijektívne ϕ. Afinným rozšírením lineárnej grupy G ⊆ GL(V ) nad vektorovým priestorom V nazývame množinu Gaf všetkých afinných zobrazení f : V → V , ktorých lineárna časť ϕ = f − f(0) patrí do grupy G – pozri paragraf 8.5. Keďže kompozícia f ◦g afinných bijekcií f, g: V → V s lineárnymi časťami ϕ resp. ψ je opäť afinná bijekcia s lineárnou časťou ϕ◦ψ, a inverzné zobrazenie k f je tiež afinná bijekcia s lineárnou časťou ϕ−1 , vidíme, že afinné rozšírenie Gaf lineárnej grupy G je podgrupou grupy transformácií S(V ). Štruktúru afinného rozšírenia Gaf teraz popíšeme pomocou polopriameho súčinu grupy G a aditívnej grupy (V, +) vektorového priestoru V . Každá lineárna grupa G ⊆ GL(V ) nad vektorovým priestorom V je zároveň podgrupou grupy Aut(V, +) všetkých automorfizmov jeho aditívnej grupy (V, +). Množina G × V tak prirodzene nesie štruktúru polopriameho súčinu týchto grúp s neutrálnym prvkom (idV , 0) a s operáciami definovanými pomocou rovností (ϕ,uuu) ◦ (ψ,vvv) = (ϕ ◦ ψ,uuu + ϕ(vvv)), (ϕ,uuu)−1 = ϕ−1 , −ϕ−1 (uuu) , pre ϕ, ψ ∈ G, uuu,vvv ∈ V – pozri paragraf 28.4. Ak tieto rovnosti porovnáme s rovnosťou tesne za dôkazom tvrdenia 8.5.4 a s rovnosťou z tvrdenia 8.5.8, uvidíme, že sme vlastne dokázali nasledujúcu vetu: 29.2.1. Veta. Nech V je vektorový priestor nad poľom K a G ⊆ GL(V ) je ľubovoľná lineárna grupa nad V . Potom jej afinné rozšírenie Gaf je izomorfné s polopriamym súčinom G V ; príslušný izomorfizmus G V → Gaf je daný predpisom (ϕ,uuu) → ϕ + uuu. Z popisu polopriameho súčinu v paragrafe 28.4 tak dostávame tri grupové homomorfizmy 554 PAVOL ZLATOŠ: LINEÁRNA ALGEBRA A GEOMETRIA Štruktúru afinného rozšírenia Gaf teraz popíšeme pomocou polopriameho súčinu grupy G a aditívnej grupy (V, +) vektorového priestoru V . Každá lineárna grupa G ⊆ GL(V ) nad vektorovým priestorom V je zároveň podgrupou grupy Aut(V, +) všetkých automorfizmov jeho aditívnej grupy (V, +). Množina G×V tak prirodzene nesie štruktúru polopriameho súčinu týchto grúp s neutrálnym prvkom (idV , 0) a s operáciami definovanými pomocou rovností (ϕ, u) ◦ (ψ, v) = (ϕ ◦ ψ, u + ϕ(v)), (ϕ, u)−1 = ϕ−1 , −ϕ−1 (u) , pre ϕ, ψ ∈ G, u, v ∈ V – pozri paragraf 28.4. Ak tieto rovnosti porovnáme s rovnosťou tesne za dôkazom tvrdenia 8.5.4 a s rovnosťou z tvrdenia 8.5.8, uvidíme, že sme vlastne dokázali nasledujúcu vetu: 29.2.1. Veta. Nech V je vektorový priestor nad poľom K a G ⊆ GL(V ) je ľubovoľná lineárna grupa nad V . Potom jej afinné rozšírenie Gaf je izomorfné s polopriamym súčinom G V ; príslušný izomorfizmus G V → Gaf je daný predpisom (ϕ, u) → ϕ + u. Z popisu polopriameho súčinu v paragrafe 28.4 tak dostávame tri grupové homo- morfizmy V Gaf G, τ λ ι kde τu je posunutie o vektor u ∈ V , ι je identické vnorenie grupy G do grupy Gaf a λ(f) = f − f(0) je lineárna časť afinného zobrazenia f ∈ G. Zrejme V τ Gaf λ G je krátka exaktná postupnosť a λ ◦ ι = idG. Vzhľadom na vetu 29.2.1 a očividný izomorfizmus GL(Kn ) ∼= GL(n, K) daný kanonickou bázou ε v Kn , afinné rozšírenie lineárnej grupy G ⊆ GL(n, K) priamo definujeme ako polopriamy súčin Gaf = G Kn , t. j. jej prvky budeme reprezentovať ako usporiadané dvojice (blokové matice) (A, u) = (A | u) ∈ GL(n, K) × Kn , s násobením 29.2. Afinné rozšírenia lineárnych grúp 651 kde τuuu je posunutie o vektor uuu ∈ V , ι je identické vnorenie grupy G do grupy Gaf a λ(f) = f − f(0) je lineárna časť afinného zobrazenia f ∈ G. Zrejme V τ Gaf λ G je krátka exaktná postupnosť a λ ◦ ι = idG. Vzhľadom na vetu 29.2.1 a očividný izomorfizmus GL(Kn ) ∼= GL(n, K) daný kanonickou bázou εεε v Kn , afinné rozšírenie lineárnej grupy G ⊆ GL(n, K) priamo definujeme ako polopriamy súčin Gaf = G Kn , t. j. jej prvky budeme reprezentovať ako usporiadané dvojice (blokové matice) (AAA,uuu) = (AAA |uuu) ∈ GL(n, K) × Kn , s násobením (AAA,uuu) · (BBB,vvv) = (AAA · BBB,uuu + AAA · vvv) – porovnaj s tvrdením 8.5.9. Afinné rozšírenie všeobecnej lineárnej grupy GL(n, K) značíme GA(n, K) a nazývame všeobecnou afinnou grupou stupňa n nad poľom K. Podobne, afinné rozšírenie špeciálnej lineárnej grupy SL(n, K) značíme SA(n, K) a nazývame špeciálnou afinnou grupou stupňa n nad poľom K. Záverom tohto paragrafu si ukážeme, že všeobecnú afinnú grupu GA(n, K) možno prirodzene vnoriť do všeobecnej lineárnej grupy GL(n + 1, K). V dôsledku toho je i každé afinné rozšírenie ľubovoľnej lineárnej grupy izomorfné s nejakou lineárnou grupou. 29.2.2. Veta. Zobrazenie dané predpisom (AAA,uuu) → AAA uuu 0n 1 , kde (AAA,uuu) ∈ GA(n, K) a 0n ∈ Kn je nulový riadkový vektor, je injektívny homomorfizmus grúp GA(n, K) → GL(n + 1, K). Dôkaz. Nakoľko pre (AAA,uuu) ∈ GA(n, K) platí det AAA uuu 0n 1 = detAAA = 0, je to naozaj zobrazenie do grupy GL(n + 1, K). Podmienku homomorfnosti overíme priamym výpočtom. Pre (AAA,uuu), (BBB,vvv) ∈ GA(n, K) dostávame AAA uuu 0n 1 · BBB vvv 0n 1 = AAA · BBB AAA · vvv + uuu 0n 1 , čo je matica zodpovedajúca prvku (AAA,uuu) · (BBB,vvv) = (AAA · BBB,uuu + AAA · vvv) ∈ GA(n, K). Tento homomorfizmus je injektívny, lebo jeho jadro obsahuje jedine neutrálny prvok (IIIn, 0) ∈ GA(n, K). 652 29. Lineárne a afinné grupy Trik spočívajúci v nahradení dvojice (AAA,uuu) maticou (AAA uuu 0 1 ) je výpočtovo nesmierne výhodný. Umožňuje totiž počítať s afinnými transformáciami pomocou obvyklého násobenia matíc. Preto je hojne využívaný napr. pri programovaní úloh počítačovej grafiky. Navyše funguje aj bez predpokladu regularity matice AAA (pozri cvičenie 28.5). 29.3 Izometrie Pojem izometrie kvadratickej formy je zovšeobecnením pojmu zhodného zobrazenia známeho zo stredoškolskej geometrie. Nech V je vektorový priestor nad ľubovoľným poľom K a q: V → K je kvadratická forma. Hovoríme, že zobrazenie f : V → V je izometriou kvadratickej formy q (prípadne len izometriou, ak q je jasná z kontextu), ak pre všetky xxx,yyy ∈ V platí q(fxxx − fyyy) = q(xxx − yyy). 29.3.1. Príklad. Ak V je vektorový priestor s reálnym prípadne komplexným skalárnym súčinom xxx,yyy a q(xxx) = xxx,xxx = xxx 2 je ním indukovaná kvadratická forma, tak izometrie formy q sú práve tie zobrazenia f : V → V , ktoré zachovávajú vzdialenosť vo V , t. j. pre všetky xxx,yyy ∈ V platí fxxx − fyyy = xxx − yyy . Hovoríme im tiež zhodné zobrazenia alebo izometrie priestoru V . Väčšina čitateľov sa už asi stretla s príkladmi zhodných zobrazení v rovine a v trojrozmernom priestore. Pojem izometrie však má ten istý geometrický význam v ľubovoľnom vektorovom priestore so skalárnym súčinom (či už reálnym alebo komplexným). 29.3.2. Príklad. V Minkowského časopriestore V s pseudoskalárnym súčinom xxx,yyy sú izometriami kvadratickej formy q(xxx) = xxx,xxx práve tie zobrazenia f : V → V , ktoré zachovávajú štvorec časopriestorovej odľahlosti, t. j. platí pre ne fxxx − fyyy, fxxx − fyyy = xxx − yyy,xxx − yyy pre všetky xxx,yyy ∈ V . K obom uvedeným príkladom sa ešte niekoľkokrát vrátime. Všeobecné štúdium izometrií začneme jednoduchým pozorovaním, ktorého dôkaz prenechávame čitateľovi. Pripomíname, že posunutie τuuu vektorového priestoru V o pevný vektor uuu ∈ V je zobrazenie V → V dané predpisom τuuu(xxx) = xxx + uuu. 29.3. Izometrie 653 29.3.3. Tvrdenie. Nech q: V → K je kvadratická forma na vektorovom priestore V nad poľom K. (a) Ak uuu ∈ V je pevný vektor, tak posunutie τuuu : V → V je izometria formy q. (b) Ak f : V → V je izometria formy q, tak aj zobrazenie ϕ: V → V dané predpisom ϕ(xxx) = f(xxx) − f(0) je izometria formy q, ktorá navyše fixuje počiatok, t. j. spĺňa podmienku ϕ(0) = 0. Pri štúdiu štruktúry všetkých izometrií danej kvadratickej formy q: V → K sa teda stačí obmedziť na izometrie, ktoré navyše fixujú počiatok. Každú izometriu totiž možno získať ako kompozíciu f = τuuu ◦ ϕ = ϕ + uuu izometrie ϕ = f − f(0) fixujúcej počiatok a posunutia τuuu o vektor uuu = f(0). Táto súvislosť silne pripomína vzťah medzi afinnými a lineárnymi zobrazeniami. Ukážeme si, že to nie je náhoda. Ďalej budeme predpokladať, že V je konečnorozmerný vektorový priestor nad ľubovoľným poľom K charakteristiky = 2 a F : V ×V → K je symetrická bilineárna, prípadne, pre K = C, kososymetrická poldruhalineárna forma na V . Pripomeňme, že F je regulárna, práve vtedy, keď pre každé xxx ∈ V platí (∀yyy ∈ V )(F(xxx,yyy) = 0) ⇒ xxx = 0; potom takisto (∀xxx ∈ V )(F(xxx,yyy) = 0) ⇒ yyy = 0, pre ľubovoľné yyy ∈ V (pozri záver paragrafu 11.1). 29.3.4. Veta. Nech V je konečnorozmerný vektorový priestor nad poľom K charakteristiky = 2, F : V × V → K je regulárna symetrická bilineárna, prípadne kososymetrická poldruhalineárna forma a q je ňou indukovaná kvadratická forma. Potom pre ľubovoľné zobrazenie ϕ: V → V nasledujúce podmienky sú ekvivalentné: (i) ϕ zachováva formu F, t. j. pre všetky xxx,yyy ∈ V platí F(ϕxxx, ϕyyy) = F(xxx,yyy); (ii) ϕ je lineárne zobrazenie zachovávajúce formu q, t. j. pre každé xxx ∈ V platí q(ϕxxx) = q(xxx); (iii) ϕ je izometria formy q zachovávajúca počiatok, t. j. pre všetky xxx,yyy ∈ V platí q(ϕxxx − ϕyyy) = q(xxx − yyy) a ϕ(0) = 0. Navyše každá lineárna transformácia ϕ: V → V spĺňajúca niektorú z uvedených podmienok je už nevyhnutne bijektívna, teda je to lineárny izomorfiz- mus. Dôkaz. (i) ⇒ (ii): Nech ϕ zachováva F. Najprv dokážeme linearitu ϕ. Zvoľme ľubovoľnú bázu ααα = (uuu1, . . . ,uuun) priestoru V . Potom [F]ααα = F(uuui,uuuj) ∈ Kn×n je regulárna matica. Pre i ≤ n označme vvvi = ϕ(uuui) a položme βββ = 654 29. Lineárne a afinné grupy (vvv1, . . . ,vvvn). Podľa predpokladu F(uuui,uuuj) = F(vvvi,vvvj) pre všetky i, j. Z regularity matice F(vvvi,vvvj) n×n vyplýva, že i βββ je báza priestoru V . Existuje jediné lineárne zobrazenie ϑ: V → V také, že ϑ(uuui) = vvvi pre i ≤ n a, keďže βββ je báza, ϑ je nevyhnutne bijektívne. Z linearity ϑ a podmienok F(ϑuuui, ϑuuuj) = F(uuui,uuuj) navyše vyplýva, že aj ϑ zachováva formu F. Dokážeme, že ϕ = ϑ. Na to stačí overiť, že pre každé xxx ∈ V a pre každý vektor vvvi bázy βββ platí F(ϕxxx−ϑxxx,vvvi) = 0. Potom totiž F(ϕxxx−ϑxxx,yyy) pre každé yyy ∈ V , a z regularity formy F vyplýva ϕ(xxx) = ϑ(xxx). Počítajme F(ϕxxx − ϑxxx,vvvi) = F(ϕxxx, ϕuuui) − F(ϑxxx, ϑuuui) = F(xxx,uuui) − F(xxx,uuui) = 0. Druhá časť tvrdenia (ii) je triviálnym dôsledkom predpokladu (i) a rovnosti q(xxx) = F(xxx,xxx). (ii) ⇒ (iii): Nech ϕ je lineárne a zachováva q. Potom ϕ(0) = 0 a pre všetky xxx,yyy ∈ V máme q(ϕxxx − ϕyyy) = q(ϕ(xxx − yyy)) = q(xxx − yyy). (iii) ⇒ (i): Nech ϕ je izometria, ktorá zachováva počiatok. Ak si uvedomíme, že pre všetky xxx,yyy ∈ V platí F(xxx,yyy) = 1 2 q(xxx) + q(yyy) − q(xxx − yyy) , vyplýva potrebný záver z nasledujúceho jednoduchého výpočtu: F(ϕxxx, ϕyyy) = 1 2 q(ϕxxx − ϕ0) + q(ϕyyy − ϕ0) − q(ϕxxx − ϕyyy) = 1 2 q(xxx − 0) + q(yyy − 0) − q(xxx − yyy) = F(xxx,yyy). Dôkaz záverečneho dovetku je už zahrnutý v dôkaze implikácie (i) ⇒ (ii). Zdôraznime, že linearita ani bijektívnosť zobrazenia ϕ nie sú zahrnuté vo východzích predpokladoch práve dokázaného tvrdenia. Pozoruhodné je, že v konečnorozmerných priestoroch sú už obe tieto vlastnosti dôsledkom zachovávania regulárnej bilineárnej (prípadne poldruhalineárnej) formy (všimnite si, že v príslušných častiach dôkazu sme nevyužívali ani žiadnu vlastnosť symetrie formy F). Vari ešte prekvapivejšia je skutočnosť, že linearita i bijektívnosť sú dôsledkom izometrie a fixovania počiatku. To však znamená, že každá izometria f : V → V je bijektívnym afinným zobrazením. Práve dokázaná veta tak má nasledujúci dôsledok. 29.3. Izometrie 655 29.3.5. Dôsledok. Všetky zobrazenia zachovávajúce regulárnu symetrickú bilineárnu formu na konečnorozmernom vektorovom priestore V nad poľom charakteristiky = 2 (v prípade poľa C tiež kososymetrickú poldruhalineárnu na V ) tvoria podgrupu všeobecnej lineárnej grupy GL(V ). Všetky izometrie príslušnej kvadratickej formy tvoria podgrupu všeobecnej afinnej grupy GA(V ), ktorá je jej afinným rozšírením. Zachovávanie (nie nutne symetrických) bilineárnych foriem (nie nutne bijektívnymi) lineárnymi transformáciami na konečnorozmernom vektorovom priestore možno jednoducho vyjadriť v reči ich matíc. To nám ďalej umožní stotožniť obe grupy izometrií z dôsledku 29.3.5 s istými podgrupami všeobecných lineárnych grúp matíc. Nech ααα = (uuu1, . . . ,uuun) je nejaká báza vektorového priestoru V , F : V × V → K je akákoľvek bilineárna forma a ϕ: V → V je lineárna transformácia. Označme ZZZ = [F]ααα maticu F a AAA = (ϕ)ααα maticu ϕ v báze ααα. Potom pre všetky xxx,yyy ∈ V platí F(xxx,yyy) = (xxx)T ααα · ZZZ · (yyy)ααα, F(ϕxxx, ϕyyy) = (AAA · (xxx)ααα)T · ZZZ · (AAA · (yyy)ααα) = (xxx)T · (AAAT · ZZZ · AAA) · (yyy)ααα. To znamená, že ϕ zachováva F práve vtedy, keď AAAT · ZZZ · AAA = ZZZ. V prípade poldruhalineárnej formy F : V × V → C možno rovnako odvodiť, že ϕ zachováva F práve vtedy, keď AAAT · ZZZ · AAA = ZZZ. V oboch prípadoch teda AAA musí patriť do stabilizátora matice ZZZ v príslušnej akcii grupy GL(n, K) na priestore matíc Kn×n . Ak ZZZ je regulárna, t. j. detZZZ = 0, tak z toho vyplýva (detAAA)2 = 1, t. j. detAAA = ±1, prípadne pre poldruhalineárne formy |detAAA|2 = 1, t. j. |detAAA| = 1. To má o. i. za dôsledok regularitu matice AAA a iným spôsobom dokazuje, že lineárna transformácia ϕ konečnorozmerného priestoru V zachovávajúca regulárnu bilineárnu formu F na V je nevyhnutne bijektívna. Tým sme vlastne dokázali nasledujúcu vetu. 29.3.6. Veta. Nech V je vektorový priestor konečnej dimenzie n nad poľom K charakteristiky = 2, F : V × V → K je regulárna symetrická bilineárna, prípadne, pre K = C, hermitovská poldruhalineárna forma, q je ňou indukovaná kvadratická forma, ααα je ľubovoľná báza priestoru V a ZZZ = [F]ααα je matica formy F v báze ααα. Potom priradením ϕ → (ϕ)ααα je daný izomorfizmus lineárnej grupy tvorenej všetkými zobrazeniami ϕ: V → V zachovávajúcimi F so stabilizátorom Stb(ZZZ) = AAA ∈ GL(n, K); AAAT · ZZZ · AAA = ZZZ 656 29. Lineárne a afinné grupy matice ZZZ v akcii (XXX,AAA) → AAAT · XXX · AAA všeobecnej lineárnej grupy GL(n, K) na priestore všetkých symetrických matíc XXX ∈ KKKn×n , prípadne s jej stabili- zátorom Stb(ZZZ) = AAA ∈ GL(n, C); AAAT · ZZZ · AAA = ZZZ v akcii (XXX,AAA) → AAAT ·XXX ·AAA všeobecnej lineárnej grupy GL(n, C) na priestore všetkých hermitovských matíc XXX ∈ Cn×n . Grupa všetkých izometrií kvadratickej formy q je potom izomorfná s afinným rozšírením Stb(ZZZ) Kn stabilizátora Stb(ZZZ), teda tiež s podgrupou všeobecnej lineárnej grupy GL(n+1, K) tvorenou všetkými maticami tvaru (AAA uuu 0 1 ), kde AAA ∈ Stb(ZZZ) a uuu ∈ Kn . Pri ďalšom štúdiu grúp izometrií sa preto zameriame len na stabilizátory (koso)symetrických regulárnych matíc ZZZ ∈ Kn×n . Navyše, keďže podľa tvrdenia 28.2.2 sú stabilizátory kongruentných matíc navzájom izomorfné, stačí sa pritom obmedziť na diagonálne matice ZZZ; v prípade kvadratických foriem nad poľom R resp. hermitovských kvadratických foriem nad poľom C dokonca na matice tvaru diag(IIIk, −IIIl). 29.4 Ortogonálna, špeciálna ortogonálna a euklidovská grupa Nech K je ľubovoľné pole. Potom stabilizátor jednotkovej matice IIIn vzhľadom na akciu (XXX,AAA) → AAAT ·XXX·AAA všeobecnej lineárnej grupy GL(n, K) na priestore Kn×n tvorí podgrupu O(n, K) = Stb(IIIn) = AAA ∈ GL(n, K); AAAT · AAA = IIIn grupy GL(n, K) nazývanú ortogonálna grupa stupňa n nad poľom K. Zrejme pre AAA ∈ GL(n, K) platí AAA ∈ O(n, K) ⇔ AAA−1 = AAAT . Lineárnu grupu SO(n, K) = O(n, K) ∩ SL(n, K) = {AAA ∈ O(n, K); detAAA = 1} nazývame špeciálna ortogonálna grupa stupňa n nad poľom K. Zrejme SO(n, K), ako jadro homomorfizmu det: O(n, K) → {1, −1}, je normálna podgrupa grupy O(n, K) s indexom 2 (okrem prípadu char K = 2, kedy SO(n, K) = O(n, K)). Uvedené grupy majú najväčší význam nad poľom reálnych čísel. Preto sa pre ne zaužívalo skrátené označenie O(n) = O(n, R), resp. SO(n) = SO(n, R), a názvy ortogonálna, resp. špeciálna ortogonálna grupa stupňa n (bez explicitnej zmienky o poli R). Prvky grupy O(n) sa nazývajú ortogonálne matice a jednotlivo sme ich už dosť podrobne preštudovali v paragrafoch 13.5 a 23.5. 29.4. Ortogonálna, špeciálna ortogonálna a euklidovská grupa 657 Ak uvažujeme Rn ako euklidovský priestor so štandardným skalárnym súčinom xxx,yyy = xxxT · yyy a kanonickou ortonormálnou bázou εεε = (eee1, . . . ,eeen), tak každú maticu AAA ∈ GL(n, R) možno stotožniť s lineárnou transformáciou xxx → AAA·xxx, teda považovať za prvok grupy GL(Rn ). Prvky grupy O(n) tak zodpovedajú izometriám euklidovského priestoru Rn , ktoré fixujú počiatok. Jej podgrupa SO(n) je tvorená práve tými maticami z O(n), ktoré zachovávajú orientáciu danú kanonickou bázou εεε (pozri paragraf 15.2). Všetky izometrie euklidovského priestoru Rn tvoria grupu izomorfnú s afinným rozšírením O(n) Rn ortogonálnej grupy O(n) pomocou grupy posunutí Rn – hovoríme jej euklidovská grupa stupňa n. Jej prvky nazývame tiež zhodné zobrazenia alebo len zhodnosti v Rn . Prvky jej podgrupy SO(n) Rn , t. j. afinného rozšírenia špeciálnej ortogonálnej grupy SO(n), nazývame priamymi zhodnosťami, ostatné prvky euklidovskej grupy nazývame nepriamymi zhodnosťami. K vete 23.5.3, ktorá vyčerpávajúcim spôsobom popisuje štruktúru ortogonálnych matíc, ešte dodajme, že priame zhodnosti fixujúce počiatok, t. j. prvky grupy SO(n), sú práve tie, ktoré majú v nejakej ortonormálnej báze priestoru Rn maticu tvaru diag(RRRα1 , . . . ,RRRαm , 1), ak n = 2m + 1 ≥ 1 je nepárne, resp. diag(RRRα1 , . . . ,RRRαm ), ak n = 2m ≥ 2 je párne. Zvyšné matice diag(RRRα1 , . . . ,RRRαm , −1) resp. diag(RRRα1 , . . . ,RRRαm−1 , 1, −1) zodpovedajú nepriamym zhodnostiam. Vzťah grúp SO(n, K) a O(n, K) nad ľubovoľným poľom K charakteristiky = 2 možno objasniť pomocou konštrukcie polopriameho súčinu (ešte raz pripomíname, že v prípade char K = 2 platí SO(n, K) = O(n, K), takže niet čo objasňovať). Označme QQQn = diag(IIIn−1, −1) ∈ O(n, K) SO(n, K) a ∆ = {IIIn,QQQn}. Potom ∆ je zrejme podgrupa grupy O(n, K) izomorfná s aditívnou grupou Z2 ako aj s multiplikatívnou grupou {1, −1}. Ďalej platí ∆ ∩ SO(n, K) = {IIIn}, a kedže index podgrupy SO(n, K) v O(n, K) je 2, tak nevyhnutne SO(n, K)·∆ = O(n, K). To podľa vety 28.4.2 dokazuje nasledujúci výsledok. 658 29. Lineárne a afinné grupy 29.4.1. Veta. Nech K je pole chrakteristiky = 2. Potom ortogonálna grupa O(n, K) je izomorfná s polopriamym súčinom ∆ SO(n, K) svojich podgrúp ∆ ∼= Z2 a SO(n, K). Ešte podotknime, že úlohu generátora QQQn grupy ∆ by mohol zohrať ľubovoľný prvok QQQ ∈ O(n, K) SO(n, K) taký, že QQQ2 = IIIn, napr. ľubovoľná matica tvaru QQQ = diag(±1, . . . , ±1) s nepárnym počtom prvkov −1. 29.5 Pseudortogonálna, Lorentzova a Poincarého grupa Nech K je ľubovoľné pole a n = k + l, kde k, l sú kladné celé čísla. Potom stabilizátor matice diag(IIIk, −IIIl) vzhľadom na akciu (XXX,AAA) → AAAT · XXX · AAA všeobecnej lineárnej grupy GL(n, K) na priestore Kn×n tvorí podgrupu O(k, l, K) = Stb diag(IIIk, −IIIl) = AAA ∈ GL(n, K); AAAT · diag(IIIk, −IIIl) · AAA = diag(IIIk, −IIIl) grupy GL(n, K), nazývanú pseudoortogonálna grupa typu (k, l) nad poľom K. Jej normálnu podgrupu SO(k, l, K) = O(k, l, K) ∩ SL(n, K) = {AAA ∈ O(k, l, K); detAAA = 1} nazývame špeciálna pseudoortogonálna grupa typu (k, l) nad poľom K. I tentokrát majú uvedené grupy majú najväčší význam nad poľom reálnych čísel. Z toho dôvodu ich označujeme len O(k, l) = O(k, l, R), resp. SO(k, l) = SO(k, l, R), a nazývame stručne pesudoortogonálna, resp. špeciálna pseudoortogonálna grupa typu (k, l) (bez explicitnej zmienky o poli R). Keďže kongruentné matice majú izomorfné stabilizátory vzhľadom na uvedenú akciu a zrejme platí Stb(−IIIn) = Stb(IIIn) = O(n), stabilizátor každej regulárnej symetrickej matice ZZZ ∈ Rn×n je už izomorfný s niektorou z grúp O(n) či O(k, l). Poznamenajme, že štúdium grúp O(k, l, C) by bolo nadbytočné. Každá z matíc diag(IIIk, −IIIl) je totiž nad poľom komplexných čísel kongruentná s maticou IIIn. Preto platí O(k, l, C) ∼= O(n, C) a SO(k, l, C) ∼= SO(n, C). Ale ani samotné grupy O(n, C) a SO(n, C) nie sú až také dôležité. Významnejšie sú ich hermitovské varianty, unitárna grupa U(n) a špeciálna unitárna grupa SU(n), s ktorými sa letmo zoznámime v nasledujúcom paragrafe. Na druhej strane nad inými poľami ako R a C, napríklad nad poľom Q všetkých racionálnych čísel, nemusí byť každá symetrická matica kongruentná s niektorou z diagonálnych matíc IIIn, −IIIn či diag(IIIk,IIIl). Preto stabilizátor nie každej regulárnej symetrickej matice ZZZ ∈ Qn×n je nevyhnutne izomorfný s niektorou z grúp O(n, Q) či O(k, l, Q). 29.5. Pseudortogonálna, Lorentzova a Poincarého grupa 659 Ani všetkými „dôležitými reálnymi pseudortogonálnymi grupami sa však v tomto kurze nebudeme osobitne zaoberať. Obmedzíme sa len na grupy O(1, n), ktoré úzko súvisia so špeciálnou teóriou relativity a štruktúrou Minkowského časopriestoru R(1,n) so štandardným pseudoskalárnym súčinom xxx,yyy = x0y0 − x1y1 − . . . − xnyn. Grupu Λ(n) = O(1, n) budeme nazývať Lorentzovou grupou stupňa n. Poincarého grupou nazývame jej afinné rozšírenie Λ(n) Rn+1 .2 V súlade s tým budeme Lorentzovými transformáciami Minkowského časopriestoru R(1,n) nazývať lineárne zobrazenia ϕ: Rn+1 → Rn+1 , ktorých matice vzhľadom na kanonickú inerciálnu bázu εεε = (eee0,eee1, . . . ,eeen) (s ktorými ich budeme stotožňovať) patria do Lorentzovej grupy Λ(n). Ako o chvíľu uvidíme, Lorentzove transformácie, tak ako sme ich zaviedli v paragrafe 16.9, tvoria istú významnú podgrupu grupy Λ(n). Na začiatok vyčleníme niekoľko dôležitých podgrúp Lorentzovej grupy Λ(n): popri nám už známej grupe SO(1, n) všetkých Lorentzových transformácií s determinantom 1, je to grupa Λ↑ (n) = {AAA ∈ Λ(n); eee0,AAA · eee0 > 0} všetkých ortochrónnych Lorentzových transformácií, t. j. takých, ktoré zachovávajú orientáciu časového šípu eee0. Pri číslovaní riadkov a stĺpcov matíc AAA ∈ R(n+1)×(n+1) od 0 do n je eee0,AAA · eee0 = a00, teda Lorentzova transformácia AAA ∈ Λ(n) je ortochrónna práve vtedy, keď a00 > 0 (podľa cvičenia 16.1 je toto číslo, ako pseudoskalárny súčin dvoch časových šípov, vždy = 0). Práve týmto typom Lorentzových transformácií sme sa zaoberali v paragrafe 16.9. Ďalej je to grupa Λ+(n) = {AAA ∈ Λ(n); eee0,AAA · eee0 detAAA > 0} všetkých vlastných Lorentzových transformácií, t. j. takých ktoré zachovávajú orientáciu euklidovského podpriestoru [eee0]⊥ ⊆ R(1,n) ,3 a prienik uvedených grúp Λ↑ +(n) = Λ+(n) ∩ Λ↑ (n) = Λ+(n) ∩ SO(1, n) = Λ↑ (n) ∩ SO(1, n), 2 Vo väčšine učebníc sa pod Lorentzovou či Poincarého grupou rozumejú len fyzikálne relevantné grupy Λ(3) resp. Λ(3) R4 . Našou všeobecnejšou definíciou sa chceme zavďačiť najmä „malým Lorentzovým grupám Λ(1) a Λ(2), náramne užitočným pri ich štúdiu. Lorentzova grupa Λ(4) sa vyskytuje ako grupa izometrií istého kozmologického modelu, tzv. de Sitterovho univerza. S vyššími Lorentzovými grupami Λ(n) sa zasa možno stretnúť v niektorých strunových teóriách. 3 Najmä vo fyzike sa pod pojmom „vlastná Lorentzova grupa často rozumie špeciálna pseudoortogonálna grupa SO(1, n), jej prvkom sa potom prirodzene hovorí vlastné Lorentzove transformácie. 660 29. Lineárne a afinné grupy čiže grupa všetkých vlastných ortochrónnych Lorentzových transformácií. Konečne je to tzv. štvorgrupa Γ tvorená maticami IIIn+1, PPPn+1 = diag(1,IIIn−1, −1), TTTn+1 = diag(−1,IIIn−1, 1) a PPPn+1TTTn+1 = diag(−1,IIIn−1, −1), izomorfná s aditívnou grupou Z2 × Z2. Ak vynecháme indexy v označení týchto matíc, môžeme písať Γ = {III,PPP,TTT,PPPTTT}. 29.5.1. Veta. Lorentzova grupa Λ(n) je izomorfná s polopriamym súčinom Γ Λ↑ +(n) svojich podgrúp Γ ∼= Z2 × Z2 a Λ↑ +(n). Dôkaz. Označme H = {1, −1} × {1, −1} priamy súčin dvoch exemplárov multiplikatívnej grupy {1, −1} ⊆ R . Zrejme H je generovaná svojimi prvkami (1, −1), (−1, 1) a (nezávisle na n) je H ∼= Z2 × Z2 ∼= Γ. Nech ďalej ι: Λ↑ +(n) → Λ(n) je identické zobrazenie a π: Λ(n) → H je dané predpisom π(AAA) = eee0,AAA · eee0 | eee0,AAA · eee0 | , detAAA = a00 |a00| , detAAA , pre AAA ∈ Λ(n). Niekoľkými priamymi výpočtami možno jednoducho overiť, že Λ↑ +(n) ι Λ(n) π H je krátka exaktná postupnosť grúp rozštiepená homomorfizmom η: H → Λ(n), ktorý je jednoznačne určený obrazmi generátorov η(1, −1) = PPP, η(−1, 1) = PPPTTT. Preto podľa dôsledku 28.4.3 je Λ(n) ∼= H Λ↑ +(n) ∼= Γ Λ↑ +(n). Detaily prenechávame ako cvičenie čitateľovi. Teda Lorentzova grupa je zjednotením Λ(n) = Λ↑ +(n) ∪ Λ↑ −(n) ∪ Λ↓ +(n) ∪ Λ↓ −(n) štyroch disjunktných tried rozkladu Λ↑ +(n) = Λ↑ +(n) · III, Λ↑ −(n) = Λ↑ +(n) · PPP, Λ↓ +(n) = Λ↑ +(n) · TTT, Λ↓ −(n) = Λ↑ +(n) · PPPTTT podľa svojej normálnej podgrupy Λ↑ +(n). Násobenie maticou PPP sprava reprezentuje zmenu orientácie v priestore a maticou TTT zasa obrátenie smeru plynutia času. Kým výber matice TTT je viac-menej kanonický, úlohu matice PPP by mohla zohrať ľubovoľná matica 29.5. Pseudortogonálna, Lorentzova a Poincarého grupa 661 tvaru diag(1, ±1, . . . , ±1) s nepárnym počtom členov −1 (t. j. s determinantom −1). V euklidovskom priestore Rn má špeciálna ortogonálna grupa SO(n) v ortogonálnej grupe O(n) index 2, na základe čoho možno hovoriť o jeho dvoch možných orientáciách. Naproti tomu v Minkowského časopriestore R(1,n) má vlastná ortochrónna Lorentzova grupa Λ↑ +(n) v Lorentzovej grupe Λ(n) index 4, v dôsledku čoho Minkowského časopriestoru pripisujeme štyri orientácie, dané kombináciami dvoch možných orientácií priestoru a dvoch možných orientácií času. Na objasnenie štruktúry grupy Λ(n) tak stačí poznať štruktúru jej podgrupy Λ↑ +(n) vlastných ortochrónnych Lorentzových transformácií. Najprv podrobnejšie preskúmame „malú Lorentzovu grupu Λ(1) a jej podgrupu Λ↑ +(1). 29.5.2. Veta. Nech AAA ∈ R2×2 . Potom AAA ∈ Λ↑ +(1) práve vtedy, keď AAA = 1√ 1−v2 v√ 1−v2 v√ 1−v2 1√ 1−v2 = LLLv pre nejaké v ∈ R také, že |v| < 1. Ďalej AAA ∈ Λ(1) práve vtedy, keď AAA je tvaru LLLv, LLLv · PPP, LLLv · TTT alebo LLLv · PPPTTT. Dôkaz. Nech AAA = ( a b c d ). Potom AAAT · diag(1, −1) · AAA = a c b d · 1 0 0 −1 · a b c d = a2 − c2 ab − cd ba − dc b2 − d2 , teda podmienka AAA ∈ Λ(1), t. j. AAAT · diag(1, −1) · AAA = diag(1, −1), je ekvivalentná s rovnosťami a2 − c2 = 1, ab − cd = 0, b2 − d2 = −1. Z prvej rovnosti vyplýva a2 = 1 + c2 > c2 ≥ 0, teda a = 0 a |a| > |c|. Podobne, z tretej vyplýva d2 = 1+b2 > b2 ≥ 0, teda d = 0 a |d| > |b|. Druhú rovnosť preto možno upraviť na tvar b d = c a . Označme túto spoločnú hodnotu v = b/d = c/a. Zrejme |v| < 1 a b = dv, c = av. Dosadením do prvej a tretej rovnosti dostávame a2 (1 − v2 ) = d2 (1 − v2 ) = 1. 662 29. Lineárne a afinné grupy Teda a = ± 1 √ 1 − v2 , d = ± 1 √ 1 − v2 . Matica AAA tak nadobúda niektorý z tvarov LLLv = 1√ 1−v2 v√ 1−v2 v√ 1−v2 1√ 1−v2 , LLLv · PPP = 1√ 1−v2 − v√ 1−v2 v√ 1−v2 − 1√ 1−v2 , LLLv · TTT = − 1√ 1−v2 v√ 1−v2 − v√ 1−v2 1√ 1−v2 , LLLv · PPPTTT = − 1√ 1−v2 − v√ 1−v2 − v√ 1−v2 − 1√ 1−v2 . Naopak, priamym výpočtom sa možno presvedčiť, že každá z uvedených matíc je prvkom grupy Λ(1). Zrejme AAA ∈ Λ↑ +(1) práve vtedy, keď AAA = LLLv; zvyšné tri tvary zodpovedajú ostatným triedam rozkladu grupy Λ(1) podľa podgrupy Λ↑ +(1). Pripomeňme si, že Lorentzovu transformáciu LLLv možno substitúciou θ = 1 2 ln 1+v 1−v previesť do tvaru hyperbolickej rotácie RRRhhhθ = cosh θ sinh θ sinh θ cosh θ (pozri paragraf 16.9). Zrejme tiež naopak, RRRhhhθ ∈ Λ↑ +(1) pre každé θ ∈ R. Konečne z cvičenia 27.20 vieme, že zobrazenie RRRhhh: (R, +) → (GL(2, R), ·) je prostý homomorfizmus grúp. Práve dokázaná veta, tak má nasledujúci 29.5.3. Dôsledok. Λ↑ +(1) = {LLLv; v ∈ R & |v| < 1} = {RRRhhhθ; θ ∈ R} ∼= R. Nech teda n ≥ 2. Uvažujme všeobecnú vlastnú ortochrónnu Lorentozovu transformáciu AAA ∈ Λ↑ +(n). Inak povedané, stŤpce aaa0,aaa1, . . . ,aaan ∈ Rn+1 matice AAA tvoria inerciálnu bázu ααα Minkowského časopriestoru R(1,n) , pričom platí a00 > 0 a detAAA = 1 > 0. Potom AAA = PPPεεε,ααα je maticou prechodu z bázy ααα do kanonickej bázy εεε. Keďže časové šípy eee0 a aaa0 = AAA · eee0 sú zhodne orientované, z našich úvah vykonaných v paragrafe 16.9 vyplýva, že ich možno doplniť do inerciálnych báz βββ = (eee0,bbb1,bbb2, ·,bbbn) a γγγ = (aaa0,ccc1,ccc2, . . . ,cccn) takých, že bbb2 = ccc2, . . . , bbbn = cccn a matica prechodu medzi nimi má tvar PPPβββ,γγγ = PPPeee0,aaa0 = diag(LLLv,IIIn−1), kde v = 1 − eee0,aaa0 −2 = 1 − eee0,AAA · eee0 −2 = 1 − a−2 00 . Keďže navyše detAAA > 0, vynásobením priestorového vektora vektora bbb2 = ccc2 skalárom −1 (ak treba) možno docieliť, že ortonormálne bázy (eee1, . . . ,eeen), 29.5. Pseudortogonálna, Lorentzova a Poincarého grupa 663 (bbb1, . . .bbbn) euklidovského priestoru [eee0]⊥ budú súhlasne orientované, rovnako ako ortonormálne bázy (ccc1, . . . ,cccn), (aaa1, . . .aaan) euklidovského priestoru [aaa0]⊥ . Príslušné matice prechodu majú preto tvar PPPεεε,βββ = diag(1,BBB), PPPγγγ,ααα = diag(1,CCC), kde BBB,CCC ∈ SO(n). Maticu AAA tak možno rozložiť na súčin AAA = PPPεεε,ααα = PPPεεε,βββ · PPPβββ,γγγ · PPPγγγ,ααα = diag(1,BBB) · diag(LLLv,IIIn−1) · diag(1,CCC) špeciálnej Lorentzovej transformácie diag(LLLv,IIIn−1) a dvoch Lorentzových transformácií diag(1,BBB), diag(1,CCC), ktoré sú zároveň prvkami špeciálnej ortogonálnej (euklidovskej) grupy SO(n + 1). Tým sme vlastne dokázali nasledujúcu vetu. 29.5.4. Veta. Pre n ≥ 2 možno každú vlastnú ortochrónnu Lorentzovu transformáciu AAA ∈ Λ↑ +(n) vyjadriť v tvare kompozície AAA = diag(1,BBB) · diag(LLLv,IIIn−1) · diag(1,CCC) špeciálnej Lorentzovej transformácie diag(LLLv,IIIn−1), kde v = 1 − a−2 00 , a dvoch Lorentzových transformácií diag(1,BBB), diag(1,CCC) ∈ SO(n + 1), kde matice BBB,CCC ∈ SO(n) zodpovedajú priamym zhodnostiam n-rozmerných euklidovských podpriestorov [eee0]⊥ resp. [AAA · eee0]⊥ v R(1,n) . Špeciálne pre n = 2, resp. pre fyzikálne relevantný prípad n = 3 dostávame nasledujúci 29.5.5. Dôsledok. (a) V Minkowského časopriestore R(1,2) možno každú vlastnú ortochrónnu Lorentzovu transformáciu AAA ∈ Λ↑ +(2) vyjadriť v tvare kompozície AAA = diag(1,RRRα) · diag(LLLv, 1) · diag(1,RRRβ) špeciálnej Lorentzovej transformácie diag(LLLv, 1), kde v = 1 − a−2 00 , a dvoch Lorentzových transformácií diag(1,RRRα), diag(1,RRRβ) ∈ SO(3), kde matice RRRα,RRRβ ∈ SO(2) zodpovedajú otočeniam euklidovských rovín [eee1,eee2] resp. [AAA ·eee1,AAA ·eee2] v R(1,2) . (b) V Minkowského časopriestore R(1,3) možno každú vlastnú ortochrónnu Lorentzovu transformáciu AAA ∈ Λ↑ +(3) vyjadriť v tvare kompozície AAA = diag(1,RRRuuu α) · diag(LLLv, 1, 1) · diag(1,RRRwww β ) špeciálnej Lorentzovej transformácie diag(LLLv, 1, 1), kde v = 1 − a−2 00 , a dvoch Lorentzových transformácií diag(1,RRRuuu α), diag(1,RRRwww β ) ∈ SO(4), kde matice RRRuuu α,RRRwww β ∈ SO(3) zodpovedajú otočeniam trojozmerných euklidovských podpriestorov [eee1,eee2,eee3] resp. [AAA · eee1,AAA · eee2,AAA · eee3] v R(1,3) . 664 29. Lineárne a afinné grupy Transformáciám Minkovského časopriestoru R(1,3) , ktoré majú v nejakej inerciálnej báze ααα maticu tvaru diag(LLLv, 1, 1), sa najmä v anglojazyčnej fyzikálnej literatúre zvykne hovoriť boosty. Taký boost má vzhľadom na kanonickú bázu εεε maticu tvaru PPPεεε,ααα ·diag(LLLv, 1, 1)·PPPααα,εεε. Podľa dôsledku 29.5.5 (b) tak možno každú Lorentzovu transformáciu AAA ∈ Λ↑ +(3) vyjadriť ako kompozíciu boostu (výrazy vo veľkých zátvorkách) a euklidovskej rotácie AAA = diag(1,BBB) · diag(LLLv, 1, 1) · diag(1,CCC) = diag(1,BBB) · diag(LLLv, 1, 1) · diag 1,BBB−1 · diag(1,BBBCCC) = diag(1,BBBCCC) · diag 1,CCC−1 · diag(LLLv, 1, 1) · diag(1,CCC) , kde BBB,CCC ∈ SO(3). Keďže však kompozícia dvoch boostov nie je vo všeobecnosti boostom, z hľadiska teórie grúp nie je tento pojem až taký dôležitý. Poznámka. Pri odvodzovaní matematickej podoby špeciálnej Lorentzovej transformácie môže v dôsledku nie príliš jasnej argumentácie niekedy vzniknúť dojem, že jej tvar je dôsledkom výlučne postulátu stálosti rýchlosti svetla vo všetkých inerciálnych sústavách (a šikovnej voľby inerciálnych báz prislúchajúcich uvažovaným pozorovateľom). Niekedy sa otvorene prijme aj predpoklad linearity hľadanej transformácie. Z nich sa potom nejako „vyargumentuje nevyhnutnosť zachovávania časopriestorovej odľahlosti. Ako sme videli, od tohto bodu už ide všetko hladko. Z postulátu stálosti rýchlosti svetla však bezprostredne vyplýva len požiadavka, aby hľadaná transformácia ϕ Minkowského časopriestoru V zachovávala svetelný kužeľ, t. j. spĺňala podmienku xxx,xxx = 0 ⇔ ϕxxx, ϕxxx = 0 pre každé xxx ∈ V . V cvičení 29.12 si ukážeme, že už na Minkowského časopriamke R(1,1) existujú bijektívne (lineárne aj nelineárne) transformácie, ktoré zachovávajú svetelný kužeľ, no nezachovávajú časopriestorovú odľahlosť ani pseudoskalárny súčin, teda nepatria do Lorentzovej grupy Λ(1). Inak povedané, či už je matematický predpoklad zachovávania časopriestorovej odľahlosti fyzikálne dobre zdôvodniteľný alebo nie, bez neho to nejde, a predpoklad linearity je už po jeho prijatí nadbytočný. 29.6 Unitárna a špeciálna unitárna grupa Nech n = k+l > 0, kde k, l sú kladné celé čísla. Potom stabilzátory matíc IIIn a diag(IIIk, −IIIl) vzhľadom na akciu (XXX,AAA) → AAAT · XXX · AAA všeobecnej lineárnej 29.6. Unitárna a špeciálna unitárna grupa 665 grupy GL(n, C) na priestore všetkých matic Cn×n tvoria podgrupy U(n) = Stb(IIIn) = AAA ∈ GL(n, C); AAAT · AAA = IIIn , U(k, l) = Stb diag(IIIk, −IIIl) = AAA ∈ GL(n, C); AAAT · diag(IIIk, −IIIl) · AAA = diag(IIIk, −IIIl) grupy GL(n, C), nazývané unitárna grupa stupňa n, resp. pseudounitárna grupa typu (k, l). Ich podgrupy SU(n) = U(n) ∩ SL(n, C) = {AAA ∈ U(n); detAAA = 1}, SU(k, l) = U(k, l) ∩ SL(n, C) = {AAA ∈ U(k, l); detAAA = 1} nazývame špeciálna unitárna grupa stupňa n resp. špeciálna pseudounitárna grupa typu (k, l). Zrejme pre AAA ∈ GL(n, C) platí AAA ∈ U(n) ⇔ AAA−1 = AAA∗ , AAA ∈ U(k, l) ⇔ AAA∗ · diag(IIIk, −IIIl) · AAA = diag(IIIk, −IIIl), a stabilizátor každej regulárnej kososymetrickej matice ZZZ ∈ Cn×n vzhľadom na uvedenú akciu je už izomorfný s niektorou z grúp U(n), U(k, l). Lineárne grupy U(n), U(k, l), SU(n) a SU(k, l) sú tak komplexnou analógiou reálnych lineárnych grúp O(n), O(k, l), SO(n) a SO(k, l). Ani tentokrát sa im však nebudeme venovať všetkým. Obmedzíme sa len na jeden všeobecný výsledok o vzťahu unitárnej grupy U(n) a špeciálnej unitárnej grupy SU(n), ktorým doplníme paragrafy 17.4 a 23.4. Potom si podrobnejšie všimneme špeciálnu unitárnu grupu SU(2). Začneme triviálnym pozorovaním, ktorým si pripomenieme, čo už vlastne vieme z príkladov 27.2.4 a 27.5.6: keďže pre c ∈ C platí c∗ = c a cc = |c|2 , unitárna grupa U(1) = {c ∈ C; |c| = 1} splýva s jednotkovou kružnicou v Gaussovej komplexnej rovine. Priradením eiα → RRRα je daný izomorfizmus grúp U(1) ∼= SO(2) Ak uvažujeme Cn ako unitárny priestor vybavený štandardným skalárnym súčinom xxx,yyy = xxxT · yyy, tak matica AAA ∈ Cn×n je zrejme unitárna práve vtedy, keď jej stĺpce tvoria ortonormálnu bázu v Cn . Podľa tvrdenia 23.4.4 sú všetky vlastné hodnoty unitárnej matice AAA ∈ Cn×n komplexné jednotky (t. j. prvky U(1)) a podľa vety 23.4.7 je AAA podobná s diagonálnou maticou prostredníctvom unitárnej matice prechodu. Ukazuje sa, že grupu U(n) možno popísať ako polopriamy súčin grupy SU(n) a jednotkovej kružnice U(1). Úplne rovnako ako v dôkaze tvrdenia 29.1.3 možno totiž nahliadnuť, že grupové homomorfizmy SU(n) ι U(n) δ U(1), 666 29. Lineárne a afinné grupy kde ι je identické zobrazenie a δ priradí matici AAA ∈ U(n) jej determinant, tvoria krátku exaktnú postupnosť, rozštiepenú napríklad homomorfizmom η: U(1) → U(n), u → diag(IIIn−1, u). 29.6.1. Veta. Pre každé n ≥ 1 je unitárna grupa U(n) izomorfná s polopriamym súčinom U(1) SU(n) jednotkovej kružnice U(1) a špeciálnej unitárnej grupy SU(n). Prejdime teraz k avizovanej grupe SU(2). Podľa vety 17.4.3 je matica AAA ∈ C2×2 unitárna práve vtedy, keď má tvar AAA = a b −bu au , pre nejaké a, b, u ∈ C také, že |a|2 + |b|2 = |u| = 1. Potom u = detAAA. Ako špeciálny prípad pre u = 1 tak dostávame 29.6.2. Veta. Nech AAA ∈ C2×2 . Potom AAA ∈ SU(2) práve vtedy, keď existujú komplexné čísla a, b také, že |a|2 + |b|2 = 1 a AAA = a b −b a . Po rozklade komplexných čísel a = a0 + a1i, b = b0 + b1i na reálnu a imaginárnu časť možno špeciálnu unitárnu grupu SU(2) priamo stotožniť s jednotkovou trojrozmernou sférou S(3) = (a0, a1, b0, b1) ∈ R4 ; a2 0 + a2 1 + b2 0 + b2 1 = 1 v štvorrozmernom euklidovskom priestore R4 . Len ako zaujímavosť poznamenajme, že zo všetkých jednotkových sfér S(n) = (x0, x1, . . . , xn) ∈ Rn+1 ; x2 0 + x2 1 + . . . + x2 n = 1 rôznych rozmerov n ≥ 0 jedine sféry S(0) = {1, −1}, S(1) ∼= U(1) a S(3) ∼= SU(2) nesú „prirodzenú grupovú štruktúru. Posledný vzťah konkretizujeme do podoby grupového izomorfizmu v nasledujúcej kapitole v časti venovanej kvaterniónom. 29.7 Súvislé komponenty a orientácia Pri našom sľúbenom výlete do topológie lineárnych grúp sa obmedzíme len na maticové grupy. Začneme však v mierne všeobecnejšom kontexte podmnožín priestoru Rn . 29.7. Súvislé komponenty a orientácia 667 Nech X ⊆ Rn pre nejaké n ≥ 1. Pod cestou alebo oblúkom v množine X rozumieme ľubovoľné spojité zobrazenie f : a, b → X, kde a, b ⊆ R je netriviálny uzavretý interval. Ak f(a) = x, f(b) = y, hovoríme, že f je cesta z x do y v množine X. Množina X sa nazýva súvislá, ak každé dva body x, y ∈ X možno spojiť cestou v X.4 Pri tom sa zrejme stačí obmedziť na cesty f : 0, 1 → X. Pre x, y ∈ X položme x ∼X y práve vtedy, keď x a y možno spojiť cestou v X. Zrejme ∼X je relácia ekvivalencie na množine X. Triedu ekvivalencie bodu x ∈ X, t. j. množinu {y ∈ X; x ∼X y} ∈ X/∼X, nazývame komponentou súvislosti alebo súvislou komponentou bodu x v množine X. 29.7.1. Príklad. (a) Každý interval v R (otvorený či uzavretý, ohraničený či neohraničený, možno dokonca prázdny alebo jednobodový) je zrejme súvislá množina. Naopak, ak množina X ⊆ R nie je interval, t. j. existujú body x < y < z také, že x, z ∈ X a y /∈ X, tak X nie je súvislá. Každá cesta v R z x do z totiž musí prejsť cez y, teda nemôže celá ležať v X. (b) Ak X ⊆ Rn je konečná množina, ktorá má aspoň dva prvky, tak X je nesúvislá. Všeobecnejšie, všetky komponenty súvislosti konečnej neprázdnej množiny sú jednoprvkové. (c) Každý afinný podpriestor M ⊆ Rn je súvislá množina. Pre ľubovoľné ppp,qqq ∈ M je totiž funkcia f(t) = (1 − t)ppp + tqqq, kde t ∈ 0, 1 , t. j. prirodzená parametrizácia úsečky spájajúcej body ppp a qqq, zároveň cestou z ppp do qqq v M. 29.7.2. Tvrdenie. Nech X ⊆ Rm , Y ⊆ Rn a F : X → Y je surjektívne spojité zobrazenie. Ak množina X je súvislá, tak aj množina Y je súvislá; naopak, ak Y je nesúvislá, tak aj X je nesúvislá. Dôkaz. Stačí si uvedomiť, že ak je f : 0, 1 → X cesta z x do y, tak F ◦ f : 0, 1 → Y je cesta z F(x) do F(y). 29.7.3. Tvrdenie. Nech X ⊆ Rm , Y ⊆ Rn . Potom (a) množina X × Y ⊆ Rm+n je súvislá práve vtedy, keď obe množiny X, Y sú súvislé; (b) súvislá komponenta bodu (x, y) ∈ X × Y je karteziánskym súčinom súvislej komponenty bodu x v X a súvislej komponenty bodu y v X. Dôkaz. (a) Keďže obe projekcie (x, y) → x: X×Y → X, (x, y) → y: X×Y → Y sú spojité, súvislosť množiny X × Y implikuje súvislosť X aj Y podľa predchádzajúceho tvrdenia. 4 Tento druh súvislosti sa v topológii zvykne nazývať oblúkovou súvislosťou, zatiaľ čo pod súvislosťou sa rozumie o niečo všeobecnejší (no menej názorný) pojem, definovaný ako nemožnosť rozkladu na dve otvorené podmnožiny. Keďže sa však mienime zaoberať výlučne oblúkovou súvislosťou, nebudeme si zbytočne komplikovať názvoslovie. 668 29. Lineárne a afinné grupy Nech naopak X aj Y sú súvislé. Zvoľme ľubovoľné (x0, y0), (x1, y1) ∈ X × Y . Existujú cesty f : 0, 1 → X z x0 do x1 a g: 0, 1 → Y z y0 do y1. Potom h(t) = (f(t), g(t)), t ∈ 0, 1 , je cesta z (x0, y0) do (x1, y1) v X × Y . (b) priamo vyplýva z (a). Ďalej nám pôjde hlavne o súvislosť v maticových grupách nad poľami R alebo C. Uvedomme si preto, že každá maticová grupa G ⊆ GL(n, R) je zároveň podmnožinou n2 -rozmerného priestoru Rn×n . Podobne, po stotožnení komplexných čísel s usporiadanými dvojicami reálnych čísel, možno každú grupu G ⊆ GL(n, C) považovať za podmnožinu 2n2 -rozmerného priestoru Cn×n ∼= R2n2 . Ďalej je užitočné si uvedomiť, že pre obe z uvedených polí, t. j. pre K = R aj K = C, sú grupové operácie násobenia · : GL(n, K) × GL(n, K) → GL(n, K) a inverzného prvku −1 : GL(n, K) → GL(n, K), ako i determinant det: GL(n, K) → K spojité zobrazenia. Taktiež exponenciála AAA → eAAA je spojité zobrazenie Kn×n → GL(n, K). Nasledujúce tvrdenie je bezprostredným dôsledkom tvrdení 29.7.2 a 29.7.3 (a) a spojitosti násobenia v GL(n, K). 29.7.4. Tvrdenie. Nech G ⊆ GL(n, K) je maticová grupa nad poľom K ∈ {R, C} a A, B ⊆ G sú súvislé množiny. Potom aj množina A · B = {AAA · BBB; AAA ∈ A & BBB ∈ B} je súvislá. 29.7.5. Veta. Nech G ⊆ GL(n, K) je maticová grupa nad poľom K ∈ {R, C}. Potom súvislá komponenta Υ(G) = {AAA ∈ G; AAA ∼G IIIn} jednotkovej matice IIIn je normálna podgrupa grupy G. Súvislá komponenta matice AAA ∈ G je trieda rozkladu Υ(G)AAA ∈ G/Υ(G) a index [G : Υ(G)] udáva počet komponent súvislosti grupy G. Dôkaz. Zrejme IIIn ∈ Υ(G). Nech AAA,BBB ∈ Υ(G) a f, g: 0, 1 → G sú cesty také, že f(0) = g(0) = IIIn, f(1) = AAA, g(1) = B. Položme h(t) = f(t) g(t)−1 pre t ∈ 0, 1 . Potom h je cesta z IIIn do AAABBB−1 v G. Ak XXX ∈ G je ľubovoľná matica, tak j(t) = XXX f(t)XXX−1 definuje cestu j z IIIn do XXXAAAXXX−1 v G. Teda AAABBB−1 aj XXXAAAXXX−1 patria do Υ(G), čo dokazuje, že Υ(G) G. Druhé tvrdenie je bezprostredným dôsledkom prvého. Preskúmajme teraz, ako je to so súvislosťou niektorých vybraných maticových grúp nad R resp. C. 29.7.6. Veta. Pre každé n ≥ 1 nasledujúce maticové grupy sú súvislé: 29.7. Súvislé komponenty a orientácia 669 (a) špeciálna ortogonálna grupa SO(n); (b) unitárna grupa U(n) a špeciálna unitárna grupa SU(n); (c) všeobecná lineárna grupa GL(n, C) a obe špeciálne lineárne grupy SL(n, C) a SL(n, R); (d) vlastná ortochrónna Lorentzova grupa Λ↑ +(n). Dôkaz. V každom z uvedených prípadov stačí dokázať, že ľubovoľnú maticu AAA z danej grupy možno v nej spojiť cestou s jednotkovou maticou III = IIIn. (a) Nech napr. n = 2m + 1 je nepárne. Zvoľme AAA ∈ SO(n). Podľa vety 23.5.3 (pozri tiež paragraf 29.4) existuje ortogonálna matica PPP a reálne čísla α1, . . . , αm také, že AAA = PPP · diag(RRRα1 , . . . ,RRRαm , 1) · PPP−1 . Položme f(t) = PPP · diag(RRRα1t, . . . ,RRRαmt, 1) · PPP−1 pre 0 ≤ t ≤ 1. Potom f je cesta v SO(n), f(0) = III a f(1) = AAA. Podobne možno postupovať aj pre párne n. (b) Nech AAA ∈ U(n). Podľa vety 23.4.9 existuje hermitovská matica HHH taká, že AAA = eiHHH . Potom f(t) = eitHHH je hľadaná cesta z III do AAA v U(n). Ak AAA ∈ SU(n), tak HHH možno podľa vety 23.4.9 zvoliť tak, aby navyše platilo trHHH = 0. Potom však tr tHHH = 0 a det f(t) = 1 pre každé t ∈ 0, 1 , teda f je cesta v SU(n). (c) Nech AAA ∈ GL(n, C). Podľa vety 25.1.3 o polárnom rozklade AAA = RRR ·UUU pre nejakú kladne definitnú hermitovskú maticu RRR a unitárnu maticu UUU. Z (b) už vieme, že množina U(n) ⊆ GL(n, C) je súvislá. Vzhľadom na tvrdenie 29.7.4 stačí dokázať, že aj množina H+ všetkých kladne definitných hermitovských matíc RRR ∈ Cn×n je súvislá. Podľa vety 23.3.2 (a) má každá taká matica tvar RRR = PPP · DDD · PPP−1 , kde PPP ∈ U(n) a DDD ∈ Rn×n je diagonálna matica s diagonálou tvorenou kladnými číslami. Potom predpis f(t) = PPP · (1 − t)III + tDDD · PPP−1 , pre t ∈ 0, 1 , určuje cestu z III do RRR v H+ . Ak AAA ∈ SL(n, C), tak z podmienok detRRR > 0 a detRRR detUUU = detAAA = 1 vyplýva detUUU = 1, čiže UUU ∈ SU(n), a následne aj detRRR = 1. Vzhľadom na súvislosť grupy SU(n) opäť stačí dokázať, že existuje cesta z III do RRR v množine H+ 1 všetkých kladne definitných hermitovských matíc RRR ∈ Cn×n s determinantom 1. Diagonálnu maticu DDD možno zapísať v tvare DDD = diag ea1 , . . . , ean , kde a1, . . . , an ∈ R a j aj = 0. Potom g(t) = PPP · diag ea1t , . . . , eant · PPP−1 , 670 29. Lineárne a afinné grupy kde 0 ≤ t ≤ 1, je cesta v H+ 1 z III do RRR. Ak AAA ∈ SL(n, R), tak matice RRR, UUU možno zvoliť reálne. Presnejšie, RRR je symetrická, kladne definitná a UUU je ortogonálna. Potom aj PPP je reálna (teda ortogonálna) matica. Preto g(t) je symetrická kladne definitná matica a det g(t) = 1 pre každé t. (d) Podľa vety 29.5.4 možno každú maticu AAA ∈ Λ↑ +(n) zapísať v tvare AAA = diag(1,BBB) · diag(LLLv,IIIn−1) · diag(1,CCC), kde v ∈ −1, 1 a BBB,CCC ∈ SO(n). Nech f, g: 0, 1 → SO(n) sú cesty také, že f(0) = g(0) = IIIn a f(1) = BBB, g(1) = CCC. Položme h(t) = diag(1, f(t)) · diag(LLLvt,IIIn−1) · diag(1, g(t)). Potom h je cesta z III do AAA v Λ↑ +(n). Na druhej strane pre každé n ≥ 1 sú maticové grupy GL(n, R), O(n) a Λ(n) = O(1, n) nesúvislé. Presnejšie platí nasledujúca veta. 29.7.7. Veta. Nech n ≥ 1. Potom (a) súvislú komponentu jednotkovej matice vo všeobecnej lineárnej grupe GL(n, R) tvorí jej podgrupa GL+ (n, R) = {AAA ∈ GL(n, R); detAAA > 0}; (b) súvislou komponentou jednotkovej matice v ortogonálnej grupe O(n) je špeciálna ortogonálna grupa SO(n); (c) súvislou komponentou jednotkovej matice v Lorentzovej grupe Λ(n) je vlastná ortochrónna Lorentzova grupa Λ↑ +(n). Dôkaz. (a) Podľa tvrdenia 29.1.3 platí GL(n, R) ∼= R × SL(n, R) a z dôkazu vyplýva, že oba navzájom inverzné izomorfizmy sú zároveň spojité zobrazenia. Keďže grupa SL(n, R) je podľa vety 29.7.6 (c) súvislá a súvislá komponenta jednotky v grupe R je zrejme R+ , súvislou komponentou jednotky v tomto priamom súčine je podľa tvrdenia 29.7.3 (b) podgrupa R+ ×SL(n, R). Tej zodpovedá v príslušnom izomorfizme podgrupa GL+ (n, R). (b) Obrazom grupy O(n) v spojitom zobrazení AAA → detAAA je nesúvislá množina {−1, 1}. To podľa tvrdenia 29.7.2 znamená, že O(n) je nesúvislá. Rovnako je nesúvislá každá jej podmnožina, ktorá obsahuje aspoň jednu maticu s deteminantom 1 a aspoň jednu maticu s determinantom −1. Preto súvislá komponenta jednotkovej matice v O(n) je podmnožinou podgrupy SO(n). Na zavŕšenie dôkazu si stačí uvedomiť, že táto podgrupa je súvislá podľa vety 29.7.6 (a). (c) možno dokázať podobne ako (b), len namiesto determinantu treba použiť surjektívne spojité zobrazenie AAA → (a00/|a00|, detAAA): Λ(n) → {1, −1}× {1, −1} z dôkazu vety 29.5.1. 29.7. Súvislé komponenty a orientácia 671 Z viet 29.7.6 a 29.7.7 zároveň vyplýva, že postavenie normálnej podgrupy SU(n) v grupe U(n) sa diametrálne líši od postavenia normálnej podgrupy SO(n) v grupe O(n): kým špeciálna unitárna grupa aj unitárna grupa sú obe súvislé, ortogonálna grupa je nesúvislá a špeciálna ortogonálna je jej komponentou súvislosti. Afinné rozšírenia lineárnych grúp G ⊆ GL(n, K) sme v paragrafe 29.2 opísali ako polopriame súčiny Gaf = G Kn grupy G a aditívnej grupy (Kn , +) vektorového priestoru Kn . Kedže základná množina polopriameho súčinu splýva s karteziánskym súčinom základných množín oboch činiteľov (pozri paragraf 28.4), z tvrdenia 29.7.3 a súvislosti priestorov Rn , Cn vyplýva 29.7.8. Veta. Nech K je jedno z polí R, C a G ⊆ GL(n, K) je maticová grupa nad K. Potom (a) G je súvislá práve vtedy, keď jej afinné rozšírenie Gaf = G Kn je súvislé; (b) súvislá komponenta jednotky (III, 0) v afinnom rozšírení grupy G splýva s afinným rozšírením súvislej komponenty jednotkovej matice III v grupe G, čiže Υ Gaf = Υ(G)af = Υ(G) Kn . Teraz už konečne môžeme podporiť ďalšími argumentmi naše úvahy o dvoch orientáciách priestoru z paragrafov 15.2 a 29.5, resp. o štyroch orientáciách časopriestoru z paragrafu 29.5. Číslo 2 sme dostali ako index špeciálnej ortogonálnej grupy SO(n) v ortogonálnej grupe O(n) a číslo 4 ako index vlastnej ortochrónnej Lorentzovej grupy Λ↑ +(n) v Lorentzovej grupe Λ(n) = O(1, n). Vyhli sme sa však otázke, prečo by o orientácii mali rozhodovať práve tieto podgrupy. Na túto otázku teraz môžeme poskytnúť jednotnú odpoveď. Príslušné číslo sa totiž objavuje ako index [G : Υ(G)] súvislej komponenty Υ(G) v grupe G „prirodzených transformácií (časo)priestoru. Na „náš trojrozmerný priestor, no taktiež na priestory iných rozmerov n sa môžeme dívať rôznymi spôsobmi: (a) Ako na (iba) vektorový, prípadne afinný priestor Rn . „Prirodzenými transformáciami takého priestoru sú transformácie zachovávajúce jeho lineárnu resp. afinnú štrutúru. Tie tvoria (po stotožnení transformácie s jej maticou vzhľadom na kanonickú bázu εεε resp. kanonický repér (0,εεε)) všeobecnú lineárnu grupu GL(n, R), so súvislou komponentou jednotky GL+ (n, R), prípadne všeobecnú afinnú grupu GA(n, R) = GL(n, R) Rn , so súvislou komponentou jednotky GA+ (n, R) = GL+ (n, R) Rn . (b) Ako na (vektorový alebo afinný) euklidovský priestor Rn . V tom prípade úlohu „prirodzených transformácií preberajú transformácie zachovávajúce dĺžku (skalárny súčin) vektorov, prípadne euklidovskú vzdialenosť bodov (čiže izometrie). Tie tvoria ortogonálnu grupa O(n), so súvislou komponentou jednotky SO(n), prípadne euklidovskú grupu O(n) Rn , so súvislou komponentou jednotky SO(n) Rn . 672 29. Lineárne a afinné grupy V každom z uvedených prípadov je index súvislej komponenty Υ(G) v celej grupe G rovný 2, presnejšie G/Υ(G) ∼= ({1, −1}, · ) ∼= (Z2, +). Pritom od jednej transformácie sa dá spojitým prechodom dostať k druhej transformácii práve vtedy, keď ležia v tej istej komponente. Celá grupa sa tak rozpadá na dva od seba oddelené súvislé bloky, zodpovedné za dve orientácie priestoru. Komplexné analógy uvedených grúp sú napospol súvislé. Baviť sa o orientácii príslušných komplexných priestorov preto nedáva príliš zmysel – tieto priestory sú neorientovateľné, alebo, ak silou-mocou chceme, majú len jednu orientáciu. V prípade „nášho Minkowského časopriestoru R(1,3) , no aj iných Minkowského časopriestorov R(1,n) sa ako „prirodzené grupy transformácií ukazujú Lorentzova grupa Λ(n), so súvislou komponentou jednotky Λ↑ +(n), prípadne Poincarého grupa Λ(n) Rn+1 , so súvislou komponentou jednotky Λ↑ +(n) Rn+1 . V oboch prípadoch je index súvislej komponenty Υ(G) v celej grupe G rovný 4, presnejšie G/Υ(G) ∼= {1, −1}2 , · ∼= Z2 2, + . Celá grupa sa tak rozpadá na štyri súvislé, no spojitými prechodmi navzájom neprepojiteľné časti, zodpovedné za štyri orientácie časopriestoru. Len na doplnenie a bez dôkazu poznamenajme, že aj vo všeobecnom prípade je pseudoortogonálna grupa O(k, l) izomorfná s polopriamym súčinom štvorgrupy Γ = {III,PPP,TTT,PPPTTT} ∼= Z4 a svojej súvislej komponenty SO+ (k, l) jednotkovej matice. Pritom vlastná špeciálna pseudoortogonálna grupa SO+ (k, l) je tvorená maticami, ktoré zachovávajú orientáciu (vhodne zvoleného) maximálneho kladne definitného podpriestoru S ⊆ R(k,l) aj jeho ortokomplementu S⊥ , alebo, ekvivalentne, maticami s determinantom 1, ktoré zachovávajú orientáciu jedného z nich. Špeciálne teda Λ↑ +(n) = SO+ (1, n). V tomto zmysle môžeme aj v prípade pseudoeuklidovského priestoru R(k,l) hovoriť o štyroch orientáciách. 29.8 Homotopia a jednoduchá súvislosť Aj medzi súvislými grupami existujú viaceré rozdiely: niektoré sú súvislejšie než iné. Akási „súvislosť vyššieho rádu spočíva v možnosti spojitého prechodu medzi istými uzavretými cestami v danej grupe. Homotopiou medzi cestami f, g: 0, 1 → X v množine X ⊆ Rn nazývame ľubovoľné spojité zobrazenie H : 0, 1 × 0, 1 → X také, že pre všetky t ∈ 0, 1 platí H(0, t) = f(t), H(1, t) = g(t). Intuitívne určuje homotopia H 29.8. Homotopia a jednoduchá súvislosť 673 systém ciest Hs = H(s, −): 0, 1 → X, kde s ∈ 0, 1 , na ktorý sa možno dívať ako na jedinú cestu spájajúcu body f = H0, g = H1 v množine ciest C( 0, 1 , X). Ak F ⊆ C( 0, 1 , X) je nejaká množina ciest a Hs ∈ F pre každé s ∈ 0, 1 , hovoríme, že H je homotopia v množine F. Hovoríme, že cesta f : 0, 1 → X je uzavretá, ak f(0) = f(1). Uzavreté cesty nazývame tiež slučkami. Množinu všetkých slučiek f v X takých, že f(0) = f(1) = x0 ∈ X, značíme Ω(X, x0). Množina X ⊆ Rn sa nazýva jednoducho súvislá, ak je súvislá a taktiež jej množina slučiek Ω(X, x0) je súvislá. To druhé znamená, že pre každú slučku f ∈ Ω(X, x0) existuje homotopia H v Ω(X, x0) taká, že H0 je konštantná slučka x0 (t. j. H(0, t) = x0 pre každé t) a H1 = f. Názorne hovoríme, že každú slučku v X možno stiahnuť do bodu x0. Dá sa dokázať, že uvedená definícia jednoduchej súvislosti nezávisí na voľbe bodu x0 (pozri cvičenie 29.18). 29.8.1. Príklad. (a) Grupa U(1), t. j. kružnica, je zrejme súvislá, no nie je jednoducho súvislá. Slučku, ktorá obieha celú kružnicu práve raz (takou je napr. funkcia f(t) = exp(2πit)) totiž nemožno vnútri kružnice stiahnuť do bodu 1 bez toho, aby sme ju niekde pretrhli. Také niečo by sme mohli urobiť vovnútri kruhu {c ∈ C; |c| ≤ 1} – ten však nemáme k dispozícii. Podobne nie je jednoducho súvislá napr. (konečná či nekonečná) valcová plocha (x, y, z) ∈ R3 ; x2 + y2 = 1 & z ∈ J , kde ∅ = J ⊆ R je ľubovoľný (ohraničený či neohraničený) interval. Gumičku na ňu natiahnutú totiž opäť nemožno bez pretrhnutia stiahnuť do bodu. Treba si však uvedomiť, že i v množinách, ktoré nie sú jednoducho súvislé, možno niektoré slučky stiahnuť do bodu. Takou je napríklad slučka f v kružnici U(1), ktorá beží z bodu 1 v kladnom zmysle dokola do ľubovoľného pevného bodu c ∈ U(1), tam sa obráti a beží v opačnom smere nazad. Napíšte si sami vzorec pre nejakú takú funkciu f a nájdite homotopiu, ktorá z nej spraví konštantnú slučku g(x) = 1. (b) Na druhej strane každý interval J ⊆ R, rovina R2 (resp. C), ako aj dvojrozmerná sféra S(2) sú jednoducho súvislé. Z názoru je totiž zrejmé, že každú slučku v takejto množine možno vnútri nej stiahnuť do bodu. Z podobných príčin je jednoducho súvislá aj plocha, ktorá vznikne pridaním aspoň jednej z podstáv k ohraničenej valcovej ploche (x, y, z) ∈ R3 ; x2 + y2 = 1 & 0 ≤ z ≤ 1 . (c) Keď však (po jej potrebnom natiahnutí) zlepíme voľné okraje valcovej plochy (x, y, z) ∈ R3 ; x2 + y2 = 1 & 0 ≤ z ≤ 1 , dostaneme niečo ako pneumatiku, čiže plochu učene nazývanú torus. Táto opäť nie je jednoducho súvislá. Dokonca vieme uviesť dva základné príklady slučiek na tore, nestiahnuteľných do bodu. Jedna vznikne napr. z úsečky spájajúcej body (1, 0, 0) a (1, 0, 1) zlepením práve týchto koncových bodov – môžeme si ju predstaviť ako gumičku znútra obopínajúcu vnútorný obvod toru (na obrázku ju pred- 674 29. Lineárne a afinné grupy stavuje krivka f). Druhou je napr. slučka, ktorá práve raz obehne množinu (x, y, 1/2) ∈ R3 ; x2 + y2 = 1 , čiže „gumička vopred natiahnutá na plášť valca ešte pred zlepením jeho okrajov (na obrázku krivka g). Obr. 29.1. Valcová plocha a torus so slučkami f, g Prechod od kružnice k valcovej ploche v bode (a) predchádzajúceho príkladu pripúšťa nasledujúce zovšeobecnenie. 29.8.2. Tvrdenie. Nech X ⊆ Rn je súvislá množina a J ⊆ R je neprázdny interval. Potom množina X × J ⊆ Rn+1 je jednoducho súvislá práve vtedy, keď množina X je jednoducho súvislá. Dôkaz. Keďže interval J je súvislý, aj X×J je súvislá. Ďalej si zrejme môžeme dovoliť bez ujmy na všeobecnosti predpokladať, že 0 ∈ J. Zvoľme ľubovoľné x0 ∈ X. Predpokladajme, že X je jednoducho súvislá. Dokážeme, že aj X × J má rovnakú vlastnosť. Nech f : 0, 1 → X × J je slučka taká, že f(0) = f(1) = (x0, 0). Potom f(t) = g(t), h(t) pre vhodné slučky g: 0, 1 → X a h: 0, 1 → J. Keďže X je jednoducho súvislá, existuje homotopia H : 0, 1 2 → X v Ω(X, x0) taká, že H(0, t) = g(t) a H(1, t) = x0 pre každé t ∈ 0, 1 . Potom predpisom H(s, t) = H(s, t), (1 − s)h(t) je určená homotopia H : 0, 1 2 → X ×J v Ω X ×J, (x0, 0) spájajúca slučku f s konštantnou slučkou (x0, 0). Nech naopak X ×J je jednoducho súvislá. Treba dokázať, že aj ľubovoľnú slučku f : 0, 1 → X, f(0) = f(1) = x0 možno v X stiahnuť do bodu x0. Potom f(t) = (f(t), 0) je slučka v X × J. Z jednoduchej súvislosti množiny X × J vyplýva existencia homotopie H : 0, 1 2 → X × J, ktorá stiahne 29.8. Homotopia a jednoduchá súvislosť 675 f do bodu (x0, 0). H má tvar H(s, t) = H(s, t), H (s, t) pre vhodné homotopie H v Ω(X, x0), H v Ω(J, 0). Potom H je hľadaná homotopia, ktorá stiahne f do x0. Ak G ⊆ GL(n, K), kde K ∈ {R, C}, je maticová grupa, tak miesto Ω(G,III) píšeme len Ω(G). Ľahko možno nahliadnuť, že Ω(G) obsahuje konštantnú slučku III(t) = III a je uzavretá na operácie súčinu a inverzného prvku definované po zložkách. Presnejšie, ak f, g ∈ Ω(G), tak aj funkcie f · g a f−1 definované predpismi (f · g)(t) = f(t) · g(t), resp. f−1 (t) = f(t)−1 patria do Ω(G). To je vlastne obsahom prvej časti nasledujúcej vety. Jej druhú časť možno dokázať podobne ako vetu 29.7.5. 29.8.3. Veta. Pre ľubovoľnú maticovú grupu G nad poľom R alebo C množina slučiek Ω(G) tvorí tiež grupu. Množina ΥΩ(G) všetkých slučiek v Ω(G) stiahnuteľných do bodu III, t. j. vlastne súvislá komponenta konštantnej slučky III v grupe Ω(G), je normálna podgrupa grupy Ω(G). Teda maticová grupa G je jednoducho súvislá práve vtedy, keď Υ(G) = G a ΥΩ(G) = Ω(G). Pre nás sú dôležité dve skupiny jednoducho súvislých grúp. 29.8.4. Veta. Pre každé n ≥ 1 sú grupy SU(n) a SL(n, C) jednoducho sú- vislé. Náznak dôkazu. Podľa vety 29.7.6 sú obe uvedené grupy súvislé pre každé n. Nech f je slučka v SU(n) so začiatkom i koncom v III. Podľa vety 23.4.9 možeme pre každé t ∈ 0, 1 nájsť hermitovskú maticu h(t) ∈ Cn×n s nulovou stopou, takú že f(t) = exp ih(t) . Navyše možno zaručiť, že h je spojité zobrazenie intervalu 0, 1 do množiny takých matíc (čo nie je celkom samozrejmé, no nechávame na uverenie). Položme H(s, t) = exp ish(t) . Potom H je homotopia, H0 je konštantná slučka III, každé Hs je slučka v SU(n) a H1 = f. Ak f je slučka v SL(n, C), f(0) = f(1) = III, tak podobným spôsobom ako v dôkaze bodu (c) vety 29.7.6 a v predošlom odstavci možno zaručiť, že existujú spojité funkcie p: 0, 1 → U(n), g1, . . . , gn : 0, 1 → R a h z 0, 1 do množiny všetkých hermitovských matíc rádu n s nulovou stopou také, že j gj(t) = 0 a f(t) = p(t) · diag eg1(t) , . . . , egn(t) · p(t)−1 · eih(t) 676 29. Lineárne a afinné grupy pre každé t. Potom H(s, t) = p(t) · diag esg1(t) , . . . , esgn(t) · p(t)−1 · eish(t) je hľadaná homotopia. Na druhej strane grupy SO(3) a Λ↑ +(3), tak náramne dôležité z geometrického resp. z fyzikálneho hľadiska, jednoducho súvislé nie sú. Dôvody tejto skutočnosti len veľmi približne naznačíme v nasledujúcej kapitole. To dodáva zvláštny význam surjektívnym dvojnásobne nakrývajúcim homomorfizmom SU(2) → SO(3) a SL(2, C) → Λ↑ +(3), ktoré ich dávajú do súvislosti s jednoducho súvislými grupami SU(2) resp. SL(2, C). Cvičenia 29.1. (a) Sformulujte zovšeobecnenia častí (a) – (d) tvrdenia 29.1.1 pre ľubovoľnú lineárnu grupu G ⊆ GL(n, K) a dokážte ich. (b) Vysvetlite, prečo používame pravé a nie ľavé akcie. Zmeňte uvedené zobrazenia tak, aby ste dostali ľavé akcie. 29.2. (a) Dokážte tvrdenie 29.1.2. (b) Popíšte grupu všetkých matíc PPP ∈ GL(n, R) takých, že lineárne zobrazenie xxx → PPP ·xxx, Rn → Rn zachováva (neorientované) objemy n-rozmerných rovnobežnostenov vytvorených usporiadanými n-ticami vektorov (uuu1, . . . ,uuun) z Rn . 29.3. Nech V je n-rozmerný vektorový priestor nad poľom K. Dokážte, že všeobecné afinné grupy GA(V ) a GA(n, K) sú izomorfné. Využite pritom akýkoľvek repér vo V (pozri cvičenia 8.7, 8.8). 29.4. Nech G ⊆ GL(n, K) je lineárna grupa a S ⊆ G je jej podgrupa. Potom afinné rozšírenie Saf je podgrupou afinného rozšírenia Gaf . Dokážte pre grupy matíc aj lineárnych zobrazení. 29.5. Nasledujúce označenie umožňuje rozlíšiť body a vektory v priestore Kn a afinné zobrazenia Kn → Km reprezentovať pomocou lineárnych zobrazení Kn+1 → Km+1 , t. j. maticami z K(m+1)×(n+1) . Každý vektor uuu ∈ Kn nahradíme vektorom uuu 0 ∈ Kn+1 a každý bod ppp ∈ Kn nahradíme bodom ppp 1 ∈ Kn+1 . Dvojicu (AAA,uuu) pozostávajúcu z matice AAA ∈ Km×n a vektora uuu ∈ Km nahradíme maticou AAA uuu 0n 1 ∈ K(m+1)×(n+1) . (a) Dokážte, že v takejto reprezentácii skutočne platí, že súčet bodu a vektora je bod, rozdiel dvoch bodov je vektor a afinná kombinácia bodov je bod. (b) Pre ľubovoľný bod xxx 1 ∈ Kn+1 a maticu AAA uuu 0n 1 ∈ K(m+1)×(n+1) platí AAA·xxx+uuu 1 = AAA uuu 0n 1 · xxx 1 . Dokážte. (c) Dokážte, že kompozícia f ◦ g afinných zobrazení g: Kp → Kn , f : Kn → Km , tvaru g(xxx) = BBB · xxx + vvv, f(yyy) = AAA · yyy + uuu zodpovedá súčinu matíc AAA uuu 0n 1 · BBB vvv 0p 1 . 29.6. (a) Nech K je ľubovoľné pole. Uvažujme akciu (XXX,AAA) → AAAT · XXX · AAA všeobecnej lineárnej grupy GL(n, K) na priestore matíc Kn×n . Ak ZZZ ∈ Kn×n je regulárna, Cvičenia 677 tak pre každú maticu AAA ∈ Stb(ZZZ) platí detAAA = ±1. Dokážte. (b) Odvoďte z (a), že ak char K = 2, tak normálna podgrupa SO(n, K) má v grupe O(n, K) index 2. Ako je to v prípade char K = 2? (c) Uvažujme akciu (XXX,AAA) → AAAT · XXX · AAA všeobecnej lineárnej grupy GL(n, C) na priestore matíc Cn×n . Nech ZZZ ∈ Cn×n je ľubovoľná regulárna matica. Potom pre každé AAA ∈ Stb(ZZZ) platí |detAAA| = 1. Dokážte. (d) Odvoďte z (c), že U(n)/ SU(n) ∼= U(1). 29.7. Nech V je vektorový priestor nad poľom K, F je regulárna bilineárna (prípadne pre K = C tiež poldruhalineárna) forma na V a ϕ: V → K je ľubovoľné zobrazenie. (a) Pre kladne resp. záporne definitnú formu F nad poľom R resp. C dokážte injektívnosť zobrazenia ϕ zachovávajúceho F aj bez predpokladu konečnorozmernosti priestoru V . (b) Pre každé n ≥ 2 nájdite príklad (neregulárnej) symetrickej bilineárnej formy na Rn a nebijektívneho lineárneho zobrazenia ϕ: Rn → Rn , ako aj bijektívneho nelineárneho zobrazenia ψ: Rn → Rn fixujúceho počiatok, takých, že ϕ aj ψ zachovávavajú F (teda sú zároveň izometriami kvadratickej formy q(xxx) = F(xxx,xxx)). (c) Odvoďte z (b), že všetky bijektívne izometrie kvadratickej formy q na vektorovom priestore V tvoria podgrupu grupy S(V ), nie však nutne afinnej grupy GA(V ). 29.8. Zameňte vo vete 29.3.4 vete predpoklad konečnorozmernosti priestoru V predpokladom surjektívnosti lineárnej transformácie ϕ a dokážte jej takto pozmenenú verziu. 29.9. Dokážte, že prienik ľubovoľných dvoch z grúp SO(1, n), Λ+(n), Λ↑ (n) je podgrupou tretej z nich. Odvoďte z toho rovnosti Λ+(n)∩Λ↑ (n) = Λ+(n)∩SO(1, n) = Λ↑ (n)∩ SO(1, n). 29.10. Pre reálne čísla u, v z otvoreného intervalu J = (−1, 1) (chápané ako veľkosti rýchlostí) definujme ich „relativistický súčet u ⊕ v = u+v 1+uv . Dokážte, že interval J s takto definovanou operáciou ⊕ tvorí grupu a nájdite grupové izomorfizmy Λ↑ +(1), · ∼= (J, ⊕) ∼= (R, +). 29.11. Nájdite explicitný tvar prvkov „malej Lorentzovej grupy Λ↑ +(2). 29.12. Ukážeme, že zo zachovávania svetelného kužeľa v Minkowského časopriestore R(1,1) nejakou bijektívnou transformáciou R(1,1) → R(1,1) ešte nevyplýva, že táto transformácia zachováva časopriestorovú odľahlosť resp. pseudoskalárny súčin, a dokonca ani jej linearita. (a) Nech F označuje množinu všetkých rýdzo monotónnych (t. j. rastúcich alebo klesajúcich) surjektívnych funkcií R → R takých, že f(0) = 0 (také funkcie sú už nevyhnutne spojité a bijektívne). Dokážte, že F je podgrupa grupy S(R) všetkých bijekcií R → R s operáciou skladania zobrazení. (b) Prvky priameho súčinu grúp F × F budeme značiť fff = (f0, f1). Pre fff = (f0, f1) ∈ F × F označme fff∗ : R(1,1) → R(1,1) zobrazenie dané predpisom fff∗ (xxx) = 1 2 f0(x0 + x1) + f1(x0 − x1) f0(x0 + x1) − f1(x0 − x1) , pre xxx = (x0, x1)T ∈ R(1,1) . Dokážte, že fff → fff∗ je prostý grupový homomorfizmus 678 29. Lineárne a afinné grupy F × F → S R2 . (c) Overte, že pre každé fff ∈ F × F a xxx ∈ R(1,1) platí fff∗ (0) = 0 a xxx,xxx = 0 ⇔ fff∗ (xxx),fff∗ (xxx) = 0, t. j. transformácia fff∗ zachováva svetelný kužeľ LC(0) v R(1,1) . (d) Označme G = (F × F)∗ obraz grupy F × F v homomorfizme fff → fff∗ . Dokážte, že Λ(1) ⊆ G (pri stotožnení lineárnych transformácií R2 → R2 s ich maticami vzhľadom na bázu (eee0,eee1)). (e) Dokážte, že grupa G ∩ GL(2, R) (pri rovnakom stotožnení ako v (d)) pozostáva práve zo všetkých nenulových skalárnych násobkov aϕ Lorentzových transformácií ϕ ∈ Λ(1). Nájdite príklady lineárnych transformácií fff∗ ∈ G, ktoré nezachovávajú časopriestorovú odľahlosť a pseudoskalárny súčin, teda nepatria do Lorentzovej grupy Λ(1). (f) Nájdite príklady nelineárnych transformácií fff∗ ∈ G. Nelineárne transformácie fff∗ ∈ G nemôžu podľa vety 29.3.4 zachovávať pseudoskalárny súčin ani časopriestorovú odľahlosť v R(1,1) . 29.13. (a) Dokážte vetu 29.6.2 priamo, bez použitia vety 17.4.3. (b) Odvoďte vetu 17.4.3 z viet 29.6.1 a 29.6.2. 29.14. Dokážte, že pseudounitárna grupa U(k, l) je izomorfná s polopriamym súčinom U(1) SU(k, l) kružnice U(1) a špeciálnej pseudounitárnej grupy SU(k, l). 29.15. Projektívnou priamkou nad poľom K nazývame množinu K ∪ {∞}, t. j. jednorozmerný vektorový priestor K rozšírený o nevlastný bod ∞. Dokážte nasledujúce tvrdenia: (a) Pre ľubovoľnú maticu A = a b c d ∈ GL(2, K) je predpisom FAAA = ax+b cx+d definovaná bijektívna transformácia FAAA : K ∪ {∞} → K ∪ {∞} (kladieme FAAA(x) = ∞, ak cx + d = 0, a FAAA(∞) = ∞ pre c = 0 resp. FAAA(∞) = a/c pre c = 0). Zobrazenia tvaru FAAA nazývame racionálne lineárne transformácie. (b) Priradením AAA → fAAA je daná reprezentácia grupy GL(2, K) v množine K ∪{∞}. Obraz Im F ⊆ S(K ∪ {∞}) nazývame (najmä v prípade poľa C) Möbiovou grupou alebo grupou grupou racionálnych lineárnych transformácií. 29.16. (a) Dokážte, že centrum všeobecnej lineárnej grupy GL(n, K) pozostáva práve zo všetkých nenulových skalárnych násobkov aIII jednotkovej matice III = IIIn, teda je izomorfné s multiplikatívnou grupou K , s ktorou ho možno stotožniť. (b) Všeobecná projektívna grupa rádu n nad poľom K je definovaná ako faktorová grupa PGL(n, K) ∼= GL(n, K)/K všeobecnej lineárnej grupy podľa jej centra. Dokážte, že projektívna grupa PGL(2, K) je izomorfná s Möbiovou grupou všetkých racionálnych lineárnych transormácií FAAA : K ∪ {∞} → K ∪ {∞}. 29.17. Doplňte vynechané podrobnosti v dôkaze vety 29.7.7 (c). 29.18. Nech X ⊆ Rn je súvislá množina. Ukážte nezávislosť definície jednoduchej súvislosti množiny X na vybranom bode x0 ∈ X. 29.19. Nech V je vektorový priestor nad poľom R (prípadne zreálnenie vektorového priestoru nad poľom C). Množina X ⊆ V sa nazýva konvexná, ak pre všetky xxx,yyy ∈ X celá úsečka spájajúca body xxx, yyy leží v X, t. j. (1 − t)xxx + tyyy ∈ X pre každé reálne číslo 0 ≤ t ≤ 1. Dokážte nasledujúce tvrdenia: (a) Každá konvexná množina X ⊆ V je jednoducho súvislá. Cvičenia 679 (b) Každý interval J ⊆ R je konvexná, teda jednoducho súvislá množina. 29.20. Nech K je jedno z polí R, C a G ⊆ GL(n, K) je súvislá lineárna grupa. Potom jej afinné rozšírenie G Kn je jednoducho súvislé práve vtedy, keď G je jednoducho súvislá. Dokážte. (Návod: Použite tvrdenie 29.8.2 a matematickú indukciu.) 29.21. S využitím sférických súradníc (pozri paragraf 14.4) dokážte jednoduchú súvislosť viacrozmerných sfér S(n) = (x0, x1, . . . , xn) ∈ Rn+1 ; x2 0 + x2 1 + . . . + x2 n = 1 pre n ≥ 2. 30. Lineárne algebry Lineárne algebry sú vektorové priestory vybavené dodatočnou bilineárnou operáciou. Spomedzi rôznych typov lineárnych algebier sa v tejto kapitole budeme zaoberať najmä asociatívnymi algebrami. Nepôjde nám však o ich systematické štúdium, a tak sa popri nevyhnutnom minime všeobecných poznatkov a krátkej zmienke o graduovaných algebrách obmedzíme len na dve ukážky: grupové algebry konečných abelovských grúp a ich súvis s diskrétnou Fourierovou transformáciou, a na kvaternióny (teda akúsi štvorrozmernú analógiu komplexných čísel), ktoré využijeme na reprezentáciu rotácií v trojrozmernom euklidovskom priestore R3 . Na dôvažok predvedieme, ako možno túto reprezentáciu rozšíriť do reprezentácie Lorentzových transformácií v Minkowského časopriestore R(1,3) maticami zo špeciálnej lineárnej grupy SL(2, C). Ďalšie aspekty reprezentácií grúp, ktoré tvoria hlavnú náplň teórie asociatívnych algebier, si už všímať nebudeme. 30.1 Algebry a štruktúrne konštanty Lineárnou algebrou alebo len algebrou nad poľom K, prípadne K-algebrou, nazývame vektorový priestor A nad týmto poľom vybavený bilineárnou binárnou operáciou ·: A ×A → A. Bilinearita rozmenená na drobné znamená, že pre všetky xxx,yyy,zzz ∈ A, c ∈ K platí (xxx + yyy)zzz = xxxzzz + yyyzzz, xxx(yyy + zzz) = xxxyyy + xxxzzz, (cxxx)yyy = c(xxxyyy) = xxx(cyyy). Operáciu · často nazývame násobením alebo súčinom v algebre A. Niekedy jej prítomnosť zvýraznime označením algebry v tvare (A, ·). Hovoríme, že (lineárna) algebra A je asociatívna resp. komutatívna, ak binárna operácia · má príslušnú vlastnosť. Ak súčin · má neutrálny prvok, t. j. existuje eee ∈ A také, že eeexxx = xxx = xxxeee pre každé xxx ∈ A, hovoríme, že A je algebra s jednotkou a (jednoznačne určený) prvok eee nazývame jednotkou algebry A. Hovoríme, že lineárna algebra je konečnorozmerná, ak je konečnorozmerný jej podkladový vektorový priestor. Podobne, bázou lineárnej algebry nazývame ľubovoľnú bázu jej vektorového priestoru a jej dimenziou dimenziu tohto priestoru. 30.1. Algebry a štruktúrne konštanty 681 30.1.1. Príklad. Nech K je pole a n je ľubovoľné prirodzené číslo. (Len aby sme sa vyhli trivialitám budeme predpokladať, že n ≥ 1.) (a) Vektorový priestor Kn všetkých (pre určitosť riadkových, no rovnako aj stĺpcových) usporiadaných n-tíc s násobením definovaným po zložkách, t. j. xxxyyy = (x1y1, . . . , xnyn) pre xxx = (x1, . . . , xn), yyy = (y1, . . . , yn) ∈ Kn , tvorí komutatívnu a asociatívnu K-algebru. Jej jednotkou je usporiadaná n-tica 111 = (1, . . . , 1) ∈ Kn . (b) Vektorový priestor K[x] všetkých polynómov v premennej x, s obvyklým násobením polynómov (pozri príklad 1.6.3), tvorí komutatívnu a asociatívnu K-algebru s jednotkou 1 ∈ K ⊆ K[x]. (c) Vektorový priestor Kn×n všetkých štvorcových matíc rozmeru n × n s operáciou násobenia matíc tvorí asociatívnu K-algebru s jednotkou IIIn. Táto algebra je komutatívna práve vtedy, keď n = 1. Neskôr sa stretneme aj s príkladmi neasociatívnych algebier. Podalgebrou (lineárnej) K-algebry A nazývame jej lineárny podpriestor S, ktorý je zároveň uzavretý na súčin v A, t. j. pre ľubovoľné xxx,yyy ∈ S platí xxxyyy ∈ S. Lineárne zobrazenie ϕ: A → B K-algebry A do K-algebry B nazývame homomorfizmom (lineárnych) algebier, ak ϕ zachováva aj operáciu súčinu, t. j. pre ľubovoľné xxx,yyy ∈ A navyše platí ϕ(xxxyyy) = ϕ(xxx) ϕ(yyy). Bijektívny homomorfizmus algebier nazývame izomorfizmom. Hovoríme, že algebry A, B sú izomorfné, označenie A ∼= B, ak existuje nejaký izomorfimus algebier ϕ: A → B. Ukazuje sa, že celá štruktúra konečnorozmernej algebry je pri pevne zvolenej báze jednoznačne zakódovaná v istej „trojrozmernej , presnejšie trojindexovej matici. Systémom štruktúrnych konštánt algebry A vzhľadom na jej bázu βββ = (vvv1, . . . ,vvvn) nazývame trojindexovú maticu CCC = ck ij ∈ Kn×n×n takú, že pre všetky i, j ≤ n platí vvvivvvj = n k=1 ck ijvvvk. (∗) Inak povedané, pre ľubovoľnú dvojicu vektorov vvvi, vvvj tvorí vektor c1 ij, . . . , cn ij T ∈ Kn súradnice ich súčinu vvvivvvj v báze βββ, t. j. (vvvivvvj)βββ = c1 ij, . . . , cn ij T . Píšeme tiež CCC = {A}βββ. Taktiež naopak, pri danej báze βββ = (vvv1, . . . ,vvvn) vektorového priestoru V nad poľom K, ľubovoľná trojindexová matica CCC = ck ij ∈ Kn×n×n jednoznačne určuje bilineárnu operáciu na V vyhovujúcu rovnostiam (∗) pre 682 30. Lineárne algebry i, j ≤ n, a tým robí z V algebru nad K. Podmienka bilinearity si totiž vynucuje, že súčin vektorov xxx,yyy ∈ V so súradnicami (xxx)βββ = (x1, . . . , xn)T , (yyy)βββ = (y1, . . . , yn)T musí mať tvar xxxyyy = n i=1 xivvvi · n j=1 yjvvvj = i,j≤n xiyj vvvivvvj = i,j,k≤n ck ijxiyj vvvk. Inak povedané, jednotlivé zložky súradníc (xxxyyy)βββ = (z1, . . . , zn)T súčinu xxxyyy vzhľadom na bázu βββ sú zk = i,j≤n ck ijxiyj. Nasledujúca veta vyjadruje jednoznačnú určenosť algebry systémom jej štruktúrnych konštánt abstraktnejším spôsobom. Dôkaz prenechávame čitateľovi ako cvičenie. 30.1.2. Veta. Nech A, B sú konečnorozmerné lineárne algebry nad poľom K. Potom A ∼= B práve vtedy, keď dim A = dim B a existujú bázy ααα v A a βββ v B také, že algebra A má vzhľadom na bázu ααα rovnaký systém štruktúrnych konštánt ako algebra B vzhľadom na bázu βββ, čiže {A}ααα = {B}βββ. 30.1.3. Príklad. V každom z príkladov 30.1.1 (a) – (c) určíme štruktúrne konštanty príslušnej algebry vzhľadom na (v istom zmysle) kanonickú bázu. Vo všetkých prípadoch v nich podstatným spôsobom vystupuje Kroneckerov delta-symbol. (a) Nech εεε = (eee1, . . . ,eeen) je kanonická báza v Kn . Zrejme platí eeeieeej = δijeeei = δijeeej, teda štruktúrne konštanty algebry Kn s po zložkách definovaným súčinom sú ck ij = δk i δk j = 1, ak i = j = k, 0, ak i = k alebo j = k. (b) Kanonickou bázou v K[x] je postupnosť 1, x, x2 , . . . , xn , . . . mocnín premennej x. Ide síce o nekonečnorozmernú algebru, ale (ako vzápätí uvidíme) hodnoty jej štruktúrnych konštánt ck mn sú i tak dobre definované. Zo zrejmej rovnosti xm xn = xm+n vyplýva ck mn = δk m+n = 1, ak k = m + n, 0, ak k = m + n. (c) Kanonickú bázu v algebre matíc Kn×n s bežným maticovým súčinom tvorí systém matíc EEEkl = δi kδj l , kde k, l ≤ n. S trochou námahy možno nahliadnuť, že pre ľubovoľné k, l, p, q ≤ n platí EEEkl · EEEpq = δlpEEEkq, teda cij kl,pq = δlpδi kδj q = 1, ak p = l, i = k a j = q, 0, ak l = p alebo k = i alebo q = j. 30.2. Graduované algebry 683 (Treba si uvedomiť, že „jednotlivý index štruktúrnej konštanty tvorí v tomto prípade dvojica čísel z množiny {1, . . . , n}.) 30.2 Graduované algebry Niektoré algebry sa prirodzene štiepia do akýchsi „vrstiev , ktorých štruktúra tesne súvisí so súčinom v algebre. Pripomeňme si z cvičenia 6.19, že vektorový priestor V je (izomorfný s) priamym súčtom systému (Vi)i∈I svojich lineárnych podpriestorov, ak každý prvok xxx ∈ V možno jednoznačne až na poradie sčítancov a nulové členy vyjadriť v tvare konečného súčtu xxx = xxx1 + . . . + xxxn, kde xxxk ∈ Vik a i1, . . . , in ∈ I sú navzájom rôzne indexy. V takom prípade píšeme V = i∈I Vi. Hovoríme, že systém (Ak)k∈N lineárnych podpriestorov lineárnej algebry A je jej rozvrstvením alebo graduáciou, ak A = k∈N Ak, t. j. A je priamym súčtom svojich lineárnych podpriestorov Ak, a pre všetky xxx ∈ Ak, yyy ∈ Al platí xxxyyy ∈ Ak+l. Samotnú algebru A (spolu so systémom vyznačených podpriestorov Ak) nazývame graduovanou (lineárnou) algebrou. Operácia súčinu v graduovanej algebre sa tak rozpadá na čiastkové bilineárne operácie ·: Ak × Al → Ak+l. Výsledná operácia ·: A × A → A je jednoznačne určená týmito čiastkovými operáciami a požiadavkou bilineárnosti. Ak je napr. algebra A nekonečnorozmerná, tak jej rozvrstvenie do konečnorozmerných podpriestorov často umožňuje lepší vhľad do jej štruktúry. Naopak, niekedy môže byť užitočné zahrnúť systém vektorových priestorov (Vk)k∈N vybavený bilineárnymi operáciami Vk ×Vl → Vk+l do jedinej graduovanej lineárnej algebry s podkladovým priestorom k∈N Vk. Každá podalgebra B graduovanej algebry A je sama graduovaná systémom svojich lineárnych podpriestorov Bk = B ∩ Ak. Hovoríme, že zobrazenie ϕ: A → B K-algebry A s graduáciou (Ak) do K-algebry B s graduáciou (Bk) je homomorfizmus graduovaných algebier, ak ϕ je homomorfizmus K-algebier, ktorý zachováva graduáciu, t. j. pre xxx ∈ Ak 684 30. Lineárne algebry platí ϕ(xxx) ∈ Bk. Bijektívny homomorfizmus graduovaných algebier nazývame izomorfizmom graduovaných algebier. Z podmienky rozkladu graduovanej algebry na priamy súčet svojich vrstiev možno odvodiť, že každé zúženie ϕ Ak : Ak → Bk izomorfizmu graduovaných algebier ϕ: A → B je lineárnym izomorfizmom vrstvy Ak na vrstvu Bk. 30.2.1. Príklad. Tento príklad v sebe zahŕňa viacero tvrdení, ktoré by si čitateľ mal dokázať samostatne. (a) Všetky polynómy v n komutujúcich premenných x1, . . . , xn nad poľom K tvoria komutatívnu a asociatívnu algebru, ktorú značíme K[x1, . . . , xn]. Každý taký polynóm možno jednoznačne až na poradie sčítancov a nulové členy vyjadriť v tvare súčtu f(x1, . . . , xn) = k1,...,kn ak1...kn xk1 1 . . . xkn n , kde k1, . . . , kn sú nezáporné celé, čísla a len konečne mnoho koeficientov ak1...kn ∈ K je nenulových. Dva polynómy f(x1, . . . , xn) = ak1...kn xk1 1 . . . xkn n , g(x1, . . . , xn) = bk1...kn xk1 1 . . . xkn n sa rovnajú práve vtedy, keď pre každú n-ticu (k1, . . . , kn) platí ak1...kn = bk1...kn . Operácie súčtu a skalárneho násobku takýchto polynómov sú definované zrejmým spôsobom po zložkách. Ich súčin je jednoznačne určený požiadavkou bilineárnosti a pravidlom pre súčin jednočlenov xk1 1 . . . xkn n · xl1 1 . . . xln n = xk1+l1 1 . . . xkn+ln n . Stupňom jednočlena xk1 1 . . . xkn n nazývame súčet jeho exponentov k1 + . . .+kn a stupňom polynómu f(x1, . . . , xn) je maximum stupňov jednočlenov xk1 1 . . . xkn n , ktoré sa v ňom vyskytujú s nenulovým koeficientom ak1...kn . Hovoríme, že f je homogénny polynóm stupňa p, ak všetky jednočleny, ktoré sa v ňom vyskytujú s nenulovým koeficientom, majú ten istý stupeň p. Všetky homogénne polynómy stupňa p (spolu s nulovým polynómom) tvoria lineárny podpriestor K[x1, . . . , xn]p algebry K[x1, . . . , xn] a algebra K[x1, . . . , xn] je priamym súčtom systému svojich podpriestorov K[x1, . . . , xn]p p∈N . Pre f ∈ K[x1, . . . , xn]p, g ∈ K[x1, . . . , xn]q navyše platí f · g ∈ K[x1, . . . , xn]p+q. Inak povedané, K[x1, . . . , xn] je graduovaná algebra, rozvrstvená do podpriestorov homogénnych polynómov jednotlivých stupňov K[x1, . . . , xn]p. (b) Nech V je konečnorozmerný vektorový priestor nad poľom K s bázou βββ = (vvv1, . . . ,vvvn). Označme si : V → K lineárny funkcionál, ktorý vektoru 30.2. Graduované algebry 685 xxx ∈ V priradí jeho i-tú súradnicu v báze βββ, t. j. (xxx)βββ = s1(xxx), . . . , sn(xxx) T . Označme K[V ] množinu všetkých funkcií Φ: V → K, ktoré možno vyjadriť v tvare Φ = f(s1, . . . , sn), t. j. Φ(xxx) = f s1(xxx), . . . , sn(xxx) , pre nejaký polynóm f ∈ K[x1, . . . , xn]. Ľahko sa možno presvedčiť, že odpoveď na otázku či nejaká funkcia Φ : V → K patrí alebo nepatrí do K[V ], nezávisí od bázy βββ. Zrejme K[V ] s operáciami definovanými po zložkách tvorí komutatívnu a asociatívnu K-algebru – nazývame ju algebrou polynomických funkcií na vektorovom priestore V alebo aj súradnicovým okruhom priestoru V . Hovoríme, že polynomická funkcia Φ: V → K je homogénna stupňa p, ak pre všetky xxx ∈ V , c ∈ K platí Φ(cxxx) = cp Φ(xxx). Homogénne polynomické funkcie stupňov 0, 1 a 2 sú postupne konštantné funkcie, lineárne funkcionály resp. kvadratické formy. Homogénne funkcie stupňa p, nazývané tiež p-homogénnymi formami, tvoria lineárny podpriestor K[V ]p algebry K[V ]. Pre Φ ∈ K[V ]p, Ψ ∈ K[V ]q zrejme platí Φ · Ψ ∈ K[V ]p+q. Zobrazenie K[x1, . . . , xn] → K[V ], ktoré polynómu f ∈ K[x1, . . . , xn] priradí polynomickú funkciu f(s1, . . . , sn) ∈ K[V ], je surjektívny homomorfizmus K-algebier, ktorý zobrazí každý z podpriestorov K[x1, . . . , xn]p phomogénnych polynómov na príslušný podpriestor K[V ]p p-homogénnych foriem. Ak pole K má viac než p prvkov, tak toto zúženie je bijekcia K[x1, . . . , xn]p → K[V ]p (pozri cvičenie 30.9). Preto ak pole K je nekonečné, tak systém podpriestorov K[V ]p je rozvrstvením graduovanej algebry K[V ] a zobrazenie K[x1, . . . , xn] → K[V ] (závislé na báze βββ) je izomorfizmus graduovaných algebier. Na druhej strane, ak pole K pole má q prvkov, tak rôzne nenulové polynómy x ∈ K[x]1, xq ∈ K[x]q určujú tú istú polynomickú funkciu K → K (pozri dôsledok 27.6.8). Takže pre konečné pole K systém podpriestorov K[V ]p nie je graduáciou algebry K[V ]. Ak zafixujeme bázu βββ a – ako je to bežné – funkciu i-tej súradnice vzhľadom na bázu βββ budeme značiť xi, môžeme polynóm aj príslušnú polynomickú funkciu značiť tým istým výrazom f = f(x1, . . . , xn). V konečnom poli K sa nám môže akurát tak stať, že dva rôzne polynómy f a g budú označovať tú istú funkciu. Také niečo interpretujeme ako platnosť netriviálnej identity f(x1, . . . , xn) = g(x1, . . . , xn) v K. Graduácia algebry nemusí byť nutne indexovaná len prirodzenými číslami. V kapitole o tenzoroch sa napr. stretneme s graduáciou indexovanou dvojicami prirodzených čísel. V takom prípade je algebra A priamym súčtom systému Ak l k,l∈N svojich lineárnych podpriestorov a pre xxx ∈ Ak l , yyy ∈ Am n platí xxxyyy ∈ Ak+m l+n . 686 30. Lineárne algebry Ešte s inak indexovanou graduáciou sa stretneme v nasledujúcom paragrafe. 30.3 Grupové algebry a diskrétna Fourierova transformácia Vektorový priestor KG všetkých funkcií f : G → K z konečnej grupy G do poľa K s operáciou súčinu definovanou po zložkách, t. j. (fg)(x) = f(x) g(x) pre f, g ∈ KG , x ∈ G, tvorí asociatívnu K-algebru KG , ·). Táto algebra je zrejme izomorfná s algebrou (Kn , ·) z príkladu 30.1.1 (a) pre n = # G. Popri nej však KG nesie ešte jednu štruktúru algebry, tesne zviazanú so štruktúrou grupy G. Grupovou algebrou konečnej grupy (G, ·, 1) nad poľom K nazývame vektorový priestor KG všetkých funkcií f : G → K (s operáciami definovanými po zložkách), vybavený operáciou násobenia, definovanou ako konvolúcia (f ∗ g)(x) = st=x f(s) g(t) = s∈G f(s) g s−1 x = t∈G f xt−1 g(t), pre f, g: G → K, x ∈ G.1 Ak prvok x ∈ G stotožníme s δ-funkciou δx ∈ KG , kde δx(y) = 1, ak x = y, 0, ak x = y, pre y ∈ G, tak ľubovoľnú funkciu f ∈ KG možno chápať ako lineárnu kom- bináciu f = x∈G f(x) δx = x∈G f(x) x . Množina G ⊆ KG potom tvorí (neusporiadnú) bázu vektorového priestoru KG a samotná funkcia f ∈ KG splýva so svojimi súradnicami f = (f)G vzhľadom na bázu G (pozri paragraf 5.5). Ľahko sa presvedčíme, že pre x, y ∈ G platí (δx ∗ δy)(z) = δ(xy)(z), v dôsledku čoho x ∗ y = δx ∗ δy = δ(xy) = xy. Inými slovami, konvolúcia prvkov bázy G splýva s ich súčinom v grupe G. Grupovú algebru KG , ∗ tak možno alternatívne popísať ako množinu všetkých (konečných) formálnych lineárnych kombinácií x∈G axx s koeficientmi ax ∈ K. Skalárne násobky a súčty sú definované zrejmým spôsobom 1 Grupovú algebru možno definovať aj pre nekonečné grupy, treba sa však obmedziť na priestor K(G) funkcií f : G → K s konečným suportom supp f = {x ∈ G; f(x) = 0}. 30.3. Grupové algebry a diskrétna Fourierova transformácia 687 po zložkách, zatiaľ čo tvar súčinu výrazov s∈G ass, t∈G btt je jednoznačne vynútený požiadavkou bilinearity a zachovávania násobenia v G s∈G ass · t∈G btt = s,t∈G asbtst = x∈G cxx, kde koeficienty výsledného výrazu sú opäť dané konvolúciou cx = st=x asbt. Grupová algebra KG , ∗ , najmä pri reprezentácii jej prvkov v uvedenom tvare, sa obvykle značí KG. 2 Ako zaujímavosť si všimnime, že grupová algebra KG je priamym súčtom svojich jednorozmerných podpriestorov Kx = {ax; a ∈ K}, kde x ∈ G, a pre ax ∈ Kx, by ∈ Ky platí ax · by = abxy ∈ Kxy. Inak povedané, KG je graduovaná algebra rozvrstvená do jednorozmerných lineárnych podpriestorov Kx, x ∈ G. Ide teda o graduáciu indexovanú prvkami grupy G.3 30.3.1. Tvrdenie. Nech G je konečná grupa. Potom jej grupová algebra (KG, ·) ∼= KG , ∗ je asociatívna lineárna algebra nad poľom K; jej jednotkou je funkcia δ1, ktorú stotožňujeme s jednotkovým prvkom 1 grupy G. Ak G je navyše komutatívna, tak aj jej grupová algebra je komutatívna. Náčrt dôkazu. Naznačíme len dôkaz asociatívnosti konvolúcie a zvyšok prenecháme čitateľovi ako cvičenie. Jednoduchým výpočtom sa možno presvedčiť, že pre ľubovoľné f, g, h ∈ KG , x ∈ G platí f ∗ (g ∗ h) (x) = uvw=x f(u) g(v) h(w) = (f ∗ g) ∗ h (x). Grupové algebry sú jedným zo základných objektov teórie reprezentácií konečných grúp. V špeciálnom a najdôležitejšom prípade poľ K = C je takáto algebra zároveň unitárnym priestorom so skalárnym súčinom f, g = x∈G f(x) g(x), vzhľadom na ktorý je kanonická báza G = {δx; x ∈ G} zrejme ortonormálna. My sa však vo zvyšku tohto paragrafu budeme venovať výhradne grupovým 2 V prípade nekonečnej grupy G splýva KG s algebrou K(G) , ∗ . 3 Táto úvaha zostáva v platnosti, aj keď grupa G je nekonečná. V takom prípade G je Hamelovou bázou algebry KG (pozri paragraf 5.5 a cvičenie 6.20). 688 30. Lineárne algebry algebrám konečných abelovských grúp nad poľom C. Tie majú popri kanonickej báze G ⊆ CG ešte jednu významnú ortogonálnu bázu tvorenú charaktermi grupy G. Práve ony nám umožnia pozrieť sa na diskrétnu Fourierovu transformáciu z istého nadhľadu a zovšeobecniť tak výsledky paragrafu 17.5 z grúp (Zn, +) (skryte v nich prítomných) na ľubovoľné konečné abelovské grupy. Pripomeňme, že charakterom abelovskej grupy G nazývame ľubovoľný grupový homomorfizmus α: G → U(1); množina Gd = Hom(G, U(1)) všetkých charakterov grupy G s násobením definovaným po zložkách tvorí abelovskú grupu. Pre konečnú G okrem toho platí G ∼= Gd a taktiež Gd ⊆ CG (pozri paragraf 27.8). 30.3.2. Tvrdenie. Pre ľubovoľné charaktery α, β konečnej abelovskej grupy G platí α, β = (# G) δα,β = # G, ak α = β, 0, ak α = β. Inak povedané, všetky charaktery grupy G majú rovnakú normu √ # G a tvoria ortogonálnu bázu unitárneho priestoru CG . Dôkaz. Ak si uvedomíme, že αβ−1 = αβ je tiež charakter grupy G a αβ−1 = ε (triviálny charakter) práve vtedy, keď α = β, tak s použitím lemy 27.8.7 dostávame α, β = x∈G α(x) β(x) = x∈G αβ−1 (x) = # G, ak α = β, 0, ak α = β. Ako sme už spomínali, súradnice funkcie f ∈ CG vzhľadom na ortonormálnu bázu G ⊆ CG tvoria priamo funkčné hodnoty f(x) = f, δx . Podobne, jej súradnice vzhľadom na ortogonálnu bázu Gd ⊆ CG možno vyjadriť pomocou skalárneho súčinu v tvare f, α α, α = 1 # G f, α . Samotné priradenie α → f, α určuje funkciu f : Gd → C čiže vektor z unitárneho priestoru CGd . Pri takomto označení možno súradnice funkcie f ∈ CG vzľadom na bázu charakterov Gd vyjadriť ako (f)Gd = 1 # G f. Diskrétnou Fourierovou transformáciou (DFT) na konečnej abelovskej grupe G nazývame zobrazenie F : f → f unitárneho priestoru CG do unitárneho priestoru CGd dané predpisom F(f)(α) = f(α) = f, α = x∈G f(x) α(x), 30.3. Grupové algebry a diskrétna Fourierova transformácia 689 pre f ∈ CG , α ∈ Gd . Každú funkciu f ∈ CG možno teda vyjadriť ako lineárnu kombináciu charakterov s koeficientmi určenými hodnotami Fourierovej transformácie f: f = 1 # G α∈Gd f(α) α, čo v jednotlivých zložkách x ∈ G dáva f(x) = 1 # G α∈Gd f(α) α(x). 30.3.3. Veta. Nech G je konečná abelovská grupa. Potom pre všetky f, g ∈ CG platí F(f), F(g) = f, g = (# G) f, g , F(f ∗ g) = (f ∗ g) = F(f) F(g) = f g. V dôsledku toho DFT na G je izomorfizmus algebier F : CG , ∗ → CGd , · . Dôkaz. Nech f, g ∈ CG . Označme n = # G. Ak si uvedomíme, že násobky charakterov n−1/2 α tvoria ortonormálnu bázu v CG , tak z Parsevalovej rovnosti dostávame f, g = α∈Gd f(α) g(α) = α∈Gd f, α α, g = n α∈Gd f, n−1/2 α n−1/2 α, g = n f, g . To dokazuje prvú rovnosť. Keďže F je očividne lineárne zobrazenie, vyplýva z toho tiež, že F je lineárny izomorfizmus. Zvoľme ľubovoľný charakter β ∈ Gd . Keďže β je grupový homomorfizmus, platí F(f ∗ g)(β) = f ∗ g, β = x∈G (f ∗ g)(x) β(x) = x∈G st=x f(s) g(t) β(st) = s∈G f(s) β(s) · t∈G g(t) β(t) = f, β g, β = f(β) g(β) = f g (β). Teda (f ∗ g) = f g. To znamená, že F : CG , ∗ → CGd , · je izomorfizmus algebier. Nakoľko algebra CGd , · si z grupy Gd „pamätá len počet jej prvkov, presnejšie CGd , · ∼= (Cn , ·) pre n = # Gd = # G, vyplýva z práve dokázanej vety obdobný, dosť nečakaný výsledok aj pre grupové algebry konečných abelovských grúp. 690 30. Lineárne algebry 30.3.4. Dôsledok. Nech G, H sú konečné abelovské grupy. Potom grupové algebry CG , ∗ , CH , ∗ sú izomorfné práve vtedy, keď G a H majú rovnaký počet prvkov. Ešte poznamenajme, že vďaka stotožneniu konečnej abelovskej grupy G s jej druhým duálom Gdd prostredníctvom kanonického izomorfizmu x → x∆ (pozri vetu 27.8.6 a text okolo), má aj inverzné zobrazenie F−1 : CGd → CG k DFT F tvar diskrétnej Fourierovej transformácie (až na násobok konštantou (# G)−1 a zámenu α ↔ α), konkrétne F−1 (h)(x) = 1 # G h, x−1 = 1 # G α∈Gd h(α) α(x), pre h ∈ CGd , x ∈ G. Keďže každá konečná abelovská grupa je izomorfná s priamym súčinom cyklických grúp, stačí sa obmedziť na DFT na takýchto grupách. Z paragrafu 27.8 vieme, že každý charakter α grupy G = Zn1 × . . . Znk má tvar α(x) = exp 2πi k j=1 ajxj nj , kde x = (x1, . . . , xk) ∈ G, pre jednoznačne určený prvok a = (a1, . . . , ak) ∈ G a priradenie α → a určuje izomorfizmus grúp Gd ∼= G. Označme n = n1 . . . nk = # G. Po takomto stotožnení grúp Gd a G sa z DFT na G stáva tzv. k-rozmerná diskrétna Fourierova transformácia F : CG → CG definovaná predpisom F(f)(a) = f(a) = f, α = x∈G f(x) exp −2πi k j=1 ajxj nj pre f ∈ CG , a ∈ G, čo dáva vyjadrenie f v ortogonálnej báze charakterov f(x) = 1 n a∈G f(a) exp 2πi k j=1 ajxj nj . Inverzná k-rozmerná DFT má potom tvar F−1 (h)(x) = 1 n h(−x) = 1 n a∈G h(a) exp 2πi k j=1 ajxj nj pre h ∈ CG , x ∈ G. 30.4. Algebra kvaterniónov 691 30.4 Algebra kvaterniónov Začiatkom 19. stor. sa vyjasnilo, že komplexné čísla možno algebraicky reprezentovať ako usporiadané dvojice reálnych čísel a geometricky znázorniť ako body v rovine, pričom násobenie komplexnou jednotkou cos α + i sin α zodpovedá otočeniu roviny okolo počiatku o uhol α. Prirodzene sa tak vynorila otázka, či niečo podobné nie je možné aj v priestore. Na R3 máme síce k dispozícii vektorový súčin – ten však nie je komutatívny ani asociatívny, nemá jednotkový prvok a neumožňuje delenie. Snahe objaviť násobenie trojíc reálnych čísel alias bodov priestoru, ktoré by (povedané moderným jazykom) spolu s obvyklým vektorovým sčítaním urobilo z R3 pole a zároveň algebru nad poľom R rozširujúcu C, venoval Sir William Rowan Hamilton dlhých trinásť rokov. Postupne v ňom začali hlodať pochybnosti, či jeho cieľ je vôbec dosiahnuteľný. Podľa jeho vlastného vyjadrenia ho riešenie napadlo 16. októbra 1843, keď s manželkou prechádzali popri Royal Canal v Dubline. Zrazu si uvedomil, že násobenie, ktoré hľadá, nie je komutatívne a vyžaduje si nie tri ale štyri rozmery. V náhlom „záblesku génia zahliadol základnú formulu pre súčiny troch imaginárnych jednotiek i, j, k. Bol taký nadšený svojim objavom, že ho vyryl nožíkom do kameňa blízkeho mosta Broombridge. Dnes je na tom mieste pamätná tabuľa s nápisom: Here as he walked by on the 16th of October 1843 Sir William Rowan Hamilton in a flash of genius discovered the fundamental formula for quaternion multiplication i2 = j2 = k2 = ijk = −1 & cut it on a stone of this bridge Kvaternióny definujeme ako lineárnu algebru H nad poľom R s bázou tvorenou jednotkou 1 ∈ R a troma imaginárnymi jednotkami i, j, k, pričom súčiny bázických prvkov sú dané tabuľkou · 1 i j k 1 1 i j k i i −1 k −j j j −k −1 i k k j −i −1 ktorú si však netreba pamätať, lebo všetky jej výsledky vyplývajú z uvedenej 692 30. Lineárne algebry Hamiltonovej formuly vďaka bilinearite a asociatívnosti (ktorú zatiaľ mlčky predpokladáme a dokážeme neskôr). Napr. ij = (ij)(−k2 ) = −(ijk)k = k, ji = (ji)(−ijk) = −ji2 jk = j2 k = −k, kj = (ij)j = ij2 = −i, atď. Ešte lepšou mnemotechnickou pomôckou pre súčiny dvojíc rôznych imaginárnych jednotiek je nasledujúca cyklická schéma Súčin dvojice rôznych imaginárnych jednotiek v smere šípky je tretia jednotka, súčin proti smeru šípky je tá ista jednotka so znamienkom mínus. Kvaternióny teda možno zaviesť aj ako výrazy tvaru q = q0 + q1i + q2j + q3k, kde q0, q1, q2, q3 ∈ R, pričom rovnosť kvaterniónov p = p0 + p1i + p2j + p3k, q = q0 + q1i + q2j + q3k je definovaná podmienkou p = q ⇔ p0 = q0 & p1 = q1 & p2 = q2 & p3 = q3 a ich súčet a súčin sú dané formulami p + q = (p0 + q0) + (p1 + q1)i + (p2 + q2)j + (p3 + q3)k, p q = (p0q0 − p1q1 − p2q2 − p3q3) + (p0q1 + p1q0 + p2q3 − p3q2)i + (p0q2 + p2q0 + p3q1 − p1q3)j + (p0q3 + p3q0 + p1q2 − p2q1)k. Toto je v skutočnosti obvyklá definícia algebry kvaterniónov H. Keďže reálne čísla komutujú so všetkými kvaterniónmi, môžeme tiež písať q = q0 + iq1 + jq2 + kq3 ako aj 1 a q = q 1 a = q a = q0 a + q1 a i + q2 a j + q3 a k pre 0 = a ∈ R. Skalár q0 ∈ R nazývame skalárnou prípadne reálnou časťou kvaterniónu q a vektor q = q1i + q2j + q3k ∈ R3 nazývame jeho vektorovou prípadne 30.4. Algebra kvaterniónov 693 imaginárnou časťou. Každý kvaternión teda môžeme rozložiť na súčet jeho skalárnej a vektorovej časti q = q0 + q1i + q2j + q3k = q0 + q. Množinu všetkých skalárnych kvaterniónov, t. j. takých, pre ktoré platí q = q0, stotožňujeme s poľom R ⊆ H a množinu všetkých vektorových kvaterniónov, t. j. takých, pre ktoré platí q = q, stotožňujeme s vektorovým priestorom R3 ⊆ H. Čitateľ už v tejto chvíli určite uhádol, odkiaľ pochádza označenie iii, jjj, kkk pre kanonickú ortonormálnu bázu v euklidovskom priestore R3 . Združeným kvaterniónom ku kvaterniónu q nazývame kvaternión q∗ = q0 − q1i − q2j − q3k = q0 − q. Zrejme platí (p + q)∗ = p∗ + q∗ ; overenie nasledujúcej identity prenechávame ako cvičenie čitateľovi: (p q)∗ = q∗ p∗ . Na kvaterniónoch možno definovať obvyklý euklidovský skalárny súčin p, q E = p0q0 + p1q1 + p2q2 + p3q3, ako aj Minkowského pseudoskalárny súčin p, q M = p, q∗ E = p0q0 − p1q1 − p2q2 − p3q3. Ak si ešte spomenieme, že vektorový súčin vektorov p, q ∈ R3 je daný formu- lou p × q = p1 p2 p3 q1 q2 q3 i j k , zistíme, že súčin kvaterniónov možno vyjadriť v jednom z podstatne kompaktnejších tvarov p q = − p, q E + p0q + q0p + (p × q) = p0q0 − p, q E + p0q + q0p + (p × q) = p, q M + p0q + q0p + (p × q), ktoré odhaľujú jeho tesnú spätosť so skalárnym resp. pseudoskalárnym a vektorovým súčinom. Špeciálne pre vektorové kvaternióny p = p1i + p2j + p3k, q = q1i + q2j + q3k dostávame p q = − p, q E + (p × q). 694 30. Lineárne algebry Absolútnou hodnotou kvaterniónu q nazývame jeho euklidovskú normu |q| = q, q 1/2 E = q2 0 + q2 1 + q2 2 + q2 3. Prvú z nasledujúcich dvoch formúl možno ľahko nahliadnuť a s jej pomocou overiť i druhú: |q|2 = q, q E = q, q∗ M = q q∗ = q∗ q = |q∗ |2 , |p q| = |p| |q| . Z toho okrem iného vyplýva, že pre nenulový kvaternión q platí q q∗ |q|2 = q∗ |q|2 q = |q|2 |q|2 = 1. Ale to znamená, že q−1 = q∗ /|q|2 je inverzný prvok ku kvaterniónu q = 0 vzhľadom na operáciu násobenia. Kvaternióny jednotkovej dĺžky nazývame jednotkovými kvaterniónmi alebo kvaterniónovými jednotkami. Množinu všetkých jednotkových kvaterniónov S(3) = {q ∈ H; |q| = 1} = (x0, x1, x2, x3) ∈ R4 ; x2 0 + x2 1 + x2 2 + x2 3 = 1} z očividných dôvodov stotožňujeme s trojrozmernou jednotkovou sférou v R4 . Pre p, q ∈ S(3) zrejme platí p q ∈ S(3) , ako aj q−1 = q∗ ∈ S(3) . Kvaternióny možno taktiež reprezentovať komplexnými maticami tvaru a b −b a , kde a, b sú ľubovoľné komplexné čísla. Množinu všetkých takýchto matíc označíme U. Pre matice z U platí a b −b a + c d −d c = a + c b + d −(b + d) a + c , a b −b a · c d −d c = ac − bd ad + bc −(ad + bc) a c − bd , teda ich súčet i súčin sú opäť matice uvedeného typu. Zrejme i nulová matica 0 ∈ C2×2 a jednotková matica III ∈ C2×2 patria do U a pre AAA ∈ U, c ∈ R platí cAAA ∈ U. Tým sme dokázali nasledujúce tvrdenie. 30.4.1. Tvrdenie. Množina U všetkých komplexných matíc tvaru a b −b a , kde a, b ∈ C, tvorí asociatívnu algebru nad poľom R s jednotkou III. 30.4. Algebra kvaterniónov 695 Pre ľubovoľný kvaternión q = q0 + q1i + q2j + q3k položme UUU(q) = q0 + q1i q2 + q3i −q2 + q3i q0 − q1i . Potom UUU : H → U je zrejme bijektívne R-lineárne zobrazenie. 30.4.2. Tvrdenie. Zobrazenie UUU : H → U je izomorfizmus R-algebier H a U. Dôkaz. Zostáva dokázať, že UUU zachováva súčin. Na to stačí podľa vety 30.1.2 overiť, že pre ľubovoľnú dvojicu x, y ∈ {1, i, j, k} plati UUU(xy) = UUU(x) · UUU(y) (pozri tiež cvičenie 30.30). Napr. UUU i2 = UUU(−1) = −1 0 0 −1 = i 0 0 −i 2 = UUU(i)2 , UUU(ij) = UUU(k) = 0 i i 0 = i 0 0 −i · 0 1 −1 0 = UUU(i) · UUU(j). Zvyšné priamočiare výpočty prenechávame čitateľovi (nakoľko UUU(1) = III, stačí sa obmedziť na x, y = 1). Keďže U je asociatívna a H ∼= U, je i H asociatívna. Ak chce čitateľ doceniť spôsob, akým sme práve dokázali asociatívnosť násobenia kvaterniónov, nech skúsi overiť identitu p (qr) = (p q)r priamym výpočtom. 30.4.3. Dôsledok. Množina H = H {0} všetkých nenulových kvaterniónov s operáciou súčinu tvorí grupu. Množina S(3) všetkých jednotkových kvaterniónov je jej normálna podgrupa. Za povšimnutie stojí i to, že pre matice z U platí a b −b a ∗ = a −b b a , a b −b a = |a|2 + |b|2 , z čoho pre ľubovoľné q ∈ H vyplýva UUU(q)∗ = UUU(q∗ ) UUU(q) · UUU(q)∗ = UUU(qq∗ ) = |q|2 III, 696 30. Lineárne algebry a konečne detUUU(q) = |q0 + q1i|2 + |q2 + q3i|2 = |q|2 = 1 2 tr UUU(q) · UUU(q)∗ . Ďalej si všimnime, že špeciálna unitárna grupa SU(2) splýva podľa vety 29.6.2 s podmnožinou algebry U tvorenou maticami s determinantom 1. Zúženie zobrazenia UUU na množinu jednotkových kvaterniónov je tak izomorfizmom grupy S(3) na grupu SU(2). Tým sme dokázali ďalší výsledok. 30.4.4. Veta. Špeciálna unitárna grupa SU(2) je izomorfná s multiplikatívnou grupou jednotkových kvaterniónov alias jednotkovou trojrozmernou sférou S(3) . Ak z definície poľa z paragrafu 1.2 vypustíme podmienku komutatívnosti násobenia, získame definíciu štruktúry, ktorej hovoríme teleso, prípadne kosé pole alebo okruh s delením. Pole teda je komutatívne teleso (t. j. teleso s komutatívnym násobením). Kvaternióny sú tak príkladom telesa, ktoré nie je poľom. Algebra s jednotkou A nad poľom K sa nazýva algebra s delením, ak ku každému prvku 0 = aaa ∈ A existuje (obojstranný) inverzný prvok aaa−1 ∈ A. S využitím práve zavedenej terminológie teda môžeme povedať, že kvaternióny H tvoria nekomutatívnu asociatívnu R-algebru s delením. Ako dokázal Georg Frobenius v r. 1878, okrem nej existujú (až na izomorfizmus) len dve asociatívne R-algebry s delením: samotné R a C, ktoré sú obe komutatívne. Ak oželieme aj podmienku asociatívnosti, môžeme dostať ešte jednu R-algebru s delením: tzv. Cayleyho čísla alebo oktonióny O, objavené vzápätí po Hamiltonovom objave jeho priateľom Johnom Gravesom a krátko nato a nezávisle na ňom Arthurom Cayleym. Ako naznačuje ich názov, ide o osemrozmernú algebru nad R. Teda R-algebry s delením existujú iba v dimenziách 1, 2, 4 a 8. 30.5 Goniometrický tvar kvaterniónu Pre každý vektorový kvaternión u = u1i+u2j+u3k jednotkovej dĺžky |u| = 1 platí u2 = − u, u E + (u × u) = −|u|2 = −1, rovnako ako pre imaginárne jednotky i, j, k. Z toho dôvodu budeme všetky takéto kvaternióny nazývať imaginárnymi jednotkami. Množinu všetkých imaginárnych jednotiek stotožníme s jednotkovou dvojrozmernou sférou S(2) = (x1, x2, x3) ∈ R3 ; x2 1 + x2 2 + x2 3 = 1 . 30.5. Goniometrický tvar kvaterniónu 697 Obdobou vyjadrenia komplexného čísla z = x+yi v goniometrickom tvare z = |z| (cos α + i sin α) je vyjadrenie kvaterniónu q = q0 + q1i + q2j + q3k v tvare q = |q| (cos α + u sin α), (∗) kde α ∈ R a u a je imaginárna jednotka. Pre q = 0 môžu byť α aj u ľubovoľné, pre 0 = q = q0 ∈ R je q = q0 = |q| cos 0, ak q0 > 0, |q| cos π, ak q0 < 0, a u môže byť stále ľubovoľné. No pre q ∈ H R máme |q| = 0 = |q |, v dôsledku čoho q = q0 + q = |q| q0 |q| + q |q | |q | |q| , pričom q/|q | je zrejme imaginárna jednotka. Preto musí platiť cos α = q0 |q| a zároveň u = q |q | , sin α = |q | |q| ,    alebo    u = − q |q | , sin α = − |q | |q| . Teda stále zostáva istá dvojznačnosť, nakoľko imaginárna jednotka u a uhol α určujú ten istý kvaternión ako dvojica −u, −α. Keď na tom záleží, môžeme zafixovať napr. prvú možnosť dodatočnou podmienkou 0 ≤ α ≤ π. Každú imaginárnu jednotku u = u1i + u2j + u3k ∈ S(2) možno vyjadriť pomocou jej sférických súradníc u = i cos θ cos ω + j sin θ cos ω + k sin ω – pozri paragraf 14.4. Dosadením do (∗) dostávame konečné vyjadrenie kvaterniónu v goniometrickom tvare q = |q| cos α + sin α (i cos θ cos ω + j sin θ cos ω + k sin ω) . No z praktických dôvodov dávame prednosť stručnejšiemu vyjadreniu (∗). To v prípade kvaterniónovej jednotky q ∈ S(3) budeme zapisovať pomocou zovšeobecneného Eulerovho vzťahu q = cos α + u sin α = euα . 698 30. Lineárne algebry Pre n ∈ Z (dokonca pre n ∈ R) zostáva v platnosti aj obdoba Moivreovej vety euα n = (cos α + u sin α)n = cos nα + u sin nα = eunα . Všimnime si však, že imaginárne jednotky u, v spĺňajú identitu euα evβ = e(uα+vβ) pre všetky α, β ∈ R vtedy a len vtedy, keď uv = vu (pozri cvičenie 30.18). 30.6 Kvaternióny a rotácie V komplexnej rovine predstavuje násobenie z → az komplexnou jednotkou a = eiα otočenie okolo počiatku o uhol α. Súvis kvaterniónov s rotáciami v R3 a priamymi zhodnosťami v R4 nie je až taký priamočiary. Nech q = q0 +q1i+q2j+q3k ∈ H je pevne zvolený kvaternión. Zobrazenia Lq, Rq : H → H, dané predpismi Lq(x) = qx resp. Rq(x) = xq pre x ∈ H, budeme nazývať ľavou resp. pravou transláciou kvaterniónom q. Očividne lineárne zobrazenia Lq, Rq budeme stotožňovať s ich maticami vzhľadom na kanonickú bázu (1, i, j, k), čiže Lq =     q0 −q1 −q2 −q3 q1 q0 −q3 q2 q2 q3 q0 −q1 q3 −q2 q1 q0     , Rq =     q0 −q1 −q2 −q3 q1 q0 q3 −q2 q2 −q3 q0 q1 q3 q2 −q1 q0     . Keďže vďaka asociatívnosti pre všetky p, q, x ∈ H platí Lp(Rq(x)) = pxq = Rq(Lp(x)), zobrazenia (matice) Lp, Rq komutujú, t. j. LpRq = RqLp. Ďalej zrejme |Lq(x)| = |Rq(x)| = |q| |x| pre každé x ∈ H, a jednoduchý výpočet dáva det Lq = det Rq = q2 0 + q2 1 + q2 2 + q2 3 2 = |q|4 ≥ 0. Špeciálne pre kvaterniónovú jednotku q a ľubovoľné x ∈ H platí |Lq(x)| = |Rq(x)| = |x| a det Lq = det Rq = 1, čiže ľavá aj pravá translácia kvaterniónom q ∈ S(3) sú priame zhodnosti euklidovského priestoru H ∼= R4 , a ako matice, Lq, Rq ∈ SO(4). Poznamenajme, že každú maticu AAA ∈ SO(4) možno zapísať v tvare AAA = LpRq = RqLp 30.6. Kvaternióny a rotácie 699 pre vhodné kvaterniónové jednotky p, q ∈ S(3) . Inak povedané, každá priama zhodnosť v euklidovskom priestore R4 ∼= H fixujúca počiatok má tvar x → pxq pre nejaké p, q ∈ S(3) (pozri cvičenie 30.31). Nás však väčšmi zaujímajú rotácie v euklidovskom priestore R3 , ktorý stotožňujeme s lineárnym podpriestorom [i, j, k] ⊆ H. Konjugáciou kvaterniónom q = 0 nazývame lineárne zobrazenie ΓΓΓq : H → H dané predpisom ΓΓΓq(x) = qxq−1 pre x ∈ H. Zrejme ΓΓΓq = Lq ◦ Rq−1 = Rq−1 ◦ Lq a pre reálne a = 0 platí ΓΓΓaq = ΓΓΓq. Ale to znamená, že pri konjugácii kvaterniónmi sa stačí obmedziť na kvaterniónové jednotky, lebo každá takáto konjugácia má tvar ΓΓΓq = ΓΓΓs kde s ∈ S(3) je kvaterniónová jednotka taká, že q = ± |q| s. 30.6.1. Tvrdenie. Konjugácia kvaterniónom q ∈ H je priama zhodnosť ΓΓΓq : H → H fixujúca počiatok s invariantnými podpriestormi R, R3 ⊆ H. Dôkaz. Z našich predchádzajúcich úvah vyplýva, že ΓΓΓq je izometria a jej matica v kanonickej báze (1, i, j, k) má determinant detΓΓΓq = det Lq det Rq−1 = |q|4 q−1 4 = qq−1 4 = 1. Stačí teda overiť, že R3 = [i, j, k] je ΓΓΓq-invariantný podpriestor. Pre a ∈ R platí ΓΓΓq(a) = qaq−1 = aqq−1 = a, teda podpriestor R všetkých skalárnych kvaterniónov je invariantný. Preto aj jeho ortokomplement R3 = R⊥ je invariantný – pozri tvrdenie 23.4.5. Uvedený záver vyplýva aj z tvaru matice zobrazenia ΓΓΓq vzhľadom na kanonickú bázu (1, i, j, k). Po obvyklom stotožnení zobrazení a matíc môžeme písať ΓΓΓq = LqRq−1 = LqRq∗/|q|2 = |q|−2 LqRq∗ = |q|−2     q0 −q1 −q2 −q3 q1 q0 −q3 q2 q2 q3 q0 −q1 q3 −q2 q1 q0     ·     q0 q1 q2 q3 −q1 q0 −q3 q2 −q2 q3 q0 −q1 −q3 −q2 q1 q0     = |q|−2     |q|2 0 0 0 0 q2 0 + q2 1 − q2 2 − q2 3 2(q1q2 − q0q3) 2(q1q3 + q0q2) 0 2(q1q2 + q0q3) q2 0 − q2 1 + q2 2 − q2 3 2(q2q3 − q0q1) 0 2(q1q3 − q0q2) 2(q2q3 + q0q1) q2 0 − q2 1 − q2 2 + q2 3     . 700 30. Lineárne algebry Vynechaním prvého riadku a stĺpca dostaneme maticu zúženia ΦΦΦq = ΓΓΓq R3 konjugácie ΓΓΓq na invariantný podpriestor R3 vzhľadom na kanonickú bázu (i, j, k). Ak sa navyše obmedzíme len na kvaterniónové jednotky q ∈ S(3) a zobrazenie ΦΦΦq opäť stotožníme s jeho maticou, dostaneme ΦΦΦq =   q2 0 + q2 1 − q2 2 − q2 3 2(q1q2 − q0q3) 2(q1q3 + q0q2) 2(q1q2 + q0q3) q2 0 − q2 1 + q2 2 − q2 3 2(q2q3 − q0q1) 2(q1q3 − q0q2) 2(q2q3 + q0q1) q2 0 − q2 1 − q2 2 + q2 3   . Determinant tejto matice zrejme je detΦΦΦq = |q|6 = 1. Z toho dôvodu ΦΦΦq ∈ SO(3), inak povedané ΦΦΦq predstavuje otočenie v R3 okolo nejakej osi prechádzajúcej počiatkom o určitý uhol. Štvorici reálnych čísel q0, q1, q2, q3, t. j. zložkám kvaterniónu q, hovoríme Eulerove parametre príslušného otočenia. Zostáva vyjasniť súvis medzi osou a uhlom daného otočenia a jeho Eulerovými parametrami. Začneme jednoduchým príkladom. 30.6.2. Príklad. Nájdeme matice ΦΦΦq, ak q je niektorá z kvaterniónových jednotiek eiα = cos α + i sin α, ejα = cos α + j sin α, ekα = cos α + k sin α, kde α ∈ R. Priamym dosadením a jednoduchými úpravami dostaneme ΦΦΦeiα =   1 0 0 0 cos 2α − sin 2α 0 sin 2α cos 2α   = RRRi 2α, ΦΦΦejα =   cos 2α 0 sin 2α 0 1 0 − sin 2α 0 cos 2α   = RRRj 2α, ΦΦΦekα =   cos 2α − sin 2α 0 sin 2α cos 2α 0 0 0 1   = RRRk 2α. Porovnanie s príkladom 23.5.6 ukazuje, že uvedené matice predstavujú postupne otočenia v R3 okolo osí [i], [j], [k] o uhol 2α v kladnom zmysle vzhľadom na vektory i = eee1, j = eee2, resp. k = eee3. Nahraďme teraz základné imaginárne jednotky i, j, k všeobecnou imaginárnou jednotkou u = u1i + u2j + u3k ∈ S(2) a preskúmajme otočenie ΦΦΦq pre jednotkový kvaternión q = euα = cos α + u sin α. Predovšetkým si všimnime, že qu = uq, teda ΦΦΦq(u) = quq−1 = u, čiže u je vlastný vektor lineárneho operátora ΦΦΦq prislúchajúci k jeho vlastnému číslu 1. ΦΦΦq teda bude otočenie okolo osi [u] o zatiaľ neznámy uhol. 30.6. Kvaternióny a rotácie 701 Ten zistíme z pôsobenia ΦΦΦq na vektory z ortokomplementu [u]⊥ (vzhľadom na R3 ). Pritom stačí uvažovať vektorové kvaternióny x ⊥ u také, že |x| = 1, t. j. opäť imaginárne jednotky. Pre také x platí u, x E = 0, teda ux = − u, x E + (u × x) = u × x a |ux| = |u| |x| = 1, a tiež qx = euα x = x cos α + ux sin α. Podľa vety 15.4.1 (c) tvoria vektory u, x a ux = u × x kladne orientovanú ortonormálnu bázu priestoru R3 . Vektory x a ux tvoria kladne orientovanú ortonormálnu bázu roviny [u]⊥ , rovnako ako vektory 1 a i v komplexnej rovine C ∼= R2 . Posledná rovnosť preto znamená, že vektor qx vznikne otočením vektora x o uhol α okolo osi [u] v kladnom zmysle vzhľadom na vektor u. Ak si ďalej uvedomíme, že x ⊥ u má tiež za dôsledok xu = x × u = −(u × x) = −ux, dostaneme xq∗ = x e−uα = x cos α − xu sin α = x cos α + ux sin α = qx a konečne ΦΦΦq(x) = qxq∗ = q2 x = x cos 2α + ux sin 2α. Rovnako ako v predchádzajúcom odstavci dospejeme k záveru, že vektor ΦΦΦq(x) = qxq∗ vznikne otočením vektora x o uhol 2α okolo tej istej osi [u] v kladnom zmysle. S použitím označenia z paragrafu 23.5 môžeme písať ΦΦΦq = ΦΦΦeuα = RRRu 2α a výsledky našich úvah zhrnúť do vety. 30.6.3. Veta. Nech α ∈ R, u ∈ S(2) je imaginárna jednotka a q = |q| (cos α+ u sin α) je nenulový kvaternión. Potom zobrazenie x → qxq−1 : R3 → R3 predstavuje otočenie RRRu 2α euklidovského priestoru R3 = [i, j, k]. Naopak, každé otočenie RRRv β, kde β ∈ R, v ∈ S(2) , euklidovského priestoru R3 má tvar RRRv β(x) = pxp−1 = pxp∗ pre jednotkový kvaternión p = evβ/2 = cos(β/2) + v sin(β/2). Maticu RRRu α otočenia v R3 o uhol α okolo osi so smerovým jednotkovým vektorom u = u1i + u2j + u3k v kladnom zmysle vzhľadom na vektor u teda získame dosadením jednotlivých zložiek jednotkového kvaterniónu q = euα/2 = cos(α/2) + u sin(α/2) = cos(α/2) + (u1i + u2j + u3k) sin(α/2) 702 30. Lineárne algebry ako Eulerových parametrov do matice ΦΦΦq. S využitím goniometrických vzorcov a vzťahu u2 1 + u2 2 + u2 3 = 1 po jednoduchých úpravách dostaneme RRRu α = ΦΦΦeuα/2 =   u2 1 + (u2 2 + u2 3) cos α u1u2(1−cos α) − u3 sin α u1u3(1−cos α) + u2 sin α u1u2(1−cos α) + u3 sin α u2 2 + (u2 1 + u2 3) cos α u2u3(1−cos α) − u1 sin α u1u3(1−cos α) − u2 sin α u2u3(1−cos α) + u1 sin α u2 3 + (u2 1 + u2 2) cos α  . 30.7 Nakrývajúci homomorfizmus SU(2) → SO(3) Pozrime sa teraz na grupovo-teoretický aspekt reprezentácie rotácií v R3 pomocou kvaterniónov. Priradenie q → ΦΦΦq je samo zobrazením ΦΦΦ : H → SO(3). Na základe znalostí o konjugácii z paragrafu 28.3 ľahko nahliadneme (prípadne aj bez nich overíme priamym výpočtom), že ΦΦΦp · ΦΦΦq = ΦΦΦpq pre všetky p, q ∈ H . Inými slovami, ΦΦΦ je homomorfizmus grúp. Podľa vety 30.6.3 je dokonca zúženie ΨΨΨ = ΦΦΦ S(3) homomorfizmu ΦΦΦ na podgrupu S(3) ⊆ H jednotkových kvaterniónov surjektívne. Zrejme KerΦΦΦ = R a KerΨΨΨ = {−1, 1}. Z vety 27.5.4 tak vyplývajú izomorfizmy grúp H /R ∼= SO(3) a S(3) /{±1} ∼= SO(3), a na základe izomorfizmu SU(2) ∼= S(3) z vety 30.4.4 tiež izomorfizmus SU(2)/{±III} ∼= SO(3). Tým sme dokázali nasledujúcu vetu. 30.7.1. Veta. SO(3) ∼= S(3) /{1, −1} ∼= SU(2)/{III2, −III2}. Každá matica AAA ∈ SO(3) má v homomorfizme ΨΨΨ : S(3) → SO(3) dva vzory, rovnako ako jednotková matica III3. Tieto dva vzory majú navyše v S(3) také disjunktné okolia P resp. Q, že zúženie homomorfizmu ΨΨΨ na každé z nich je spojité bijektívne zobrazenie na to isté okolie M matice AAA v SO(3), a tiež obe inverzné zobrazenia (ΨΨΨ P)−1 : M → P, (ΨΨΨ Q)−1 : M → Q sú spojité (v topologickej terminológii sa hovorí, že ΨΨΨ P, ΨΨΨ Q sú homeomorfizmy). To je dôvod, prečo sa homomorfizmus ΨΨΨ nazýva dvojnásobným nakrytím špeciálnej ortogonálnej grupy SO(3) grupou kvaterniónových jednotiek S(3) , prípadne len nakrývajúcim homomorfizmom. Rovnako dobre možno hovoriť o dvojnásobnom nakrytí grupy SO(3) špeciálnou unitárnou grupou SU(2). Prečo týmto homomorfizmom a samotnej možnosti nakrytia grupy SO(3) grupou S(3) resp. SU(2) prikladáme taký význam? Podľa vety 29.8.4 sú všetky grupy SU(n) jednoducho súvislé. Na základe názoru a analógie s dvojrozmernou sférou S(2) sme zasa náchylní uveriť, že aj všetky sféry S(n) pre n ≥ 2 sú jednoducho súvislé (v cvičení 29.21 je návod na presný dôkaz). Hoci zvodný izomorfizmus SU(n) ∼= S(n+1) ani nič podobné sa pre n = 3 nekoná – sféry 30.7. Nakrývajúci homomorfizmus SU(2) → SO(3) 703 S(2) a S(n) pre n > 3 dokonca vôbec nie sú grupami. Každopádne však jednoduchá súvislosť grúp S(3) resp. SU(2) naznačuje, že majú v istom zmysle prehľadnú a jednoduchú štruktúru. Na druhej strane, grupa SO(3) – hoci je súvislá – nie je jednoducho súvislá. Pokúsme sa aspoň približne naznačiť prečo. To si však vyžiada krátke odbočenie, v ktorom sa letmo zoznámime s pojmom projektívneho priestoru. Izomorfizmus SO(3) ∼= S(3) /{±1} o. i. hovorí, že grupa SO(3) vznikne zlepením dvojíc navzájom protiľahlých bodov q a −q sféry S(3) . Takúto konštrukciu možno urobiť aj pre sféry S(n) ľubovoľného iného rozmeru n. Výsledný tvar sa nazýva n-rozmerný projektívny priestor nad poľom R a značí RPn . Všeobecnejšie možno projektívny priestor KPn nad poľom K popísať ako množinu všetkých priamok prechádzajúcich počiatkom (t. j. jednorozmerných lineárnych podpriestorov) vo vektorovom priestore Kn+1 . V Rn+1 pretína každá taká priamka jednotkovú sféru S(n) v dvoch protiľahlých bodoch, ktoré tak predstavujú jediný bod v priestore RPn . V paragrafe 17.8 sme sa dohodli, že stavy kvantovomechanického systému zodpovedajúceho klasickej sústave s n stavmi budeme reprezentovať lúčmi, t. j. jednorozmernými podpriestormi [u] = Cu v unitárnom priestore Cn . S použitím práve zavedenej terminológie tak môžeme povedať, že stavový priestor takého kvantovomechanického systému je projektívny priestor CPn−1 . Historicky vznikla projektívna rovina RP2 pridaním jedného nekonečne vzdialeného nevlastného bodu ku každej priamke prechádzajúcej počiatkom v rovine R2 (tým sa „oba konce každej nekonečnej priamky a všetkých s ňou rovnobežných priamok akosi spojili do tohto nevlastného bodu). Všetky nevlastné body v projektívnej rovine tvoria tzv. nevlastnú priamku, ktorá ohraničuje či uzatvára („kompaktifikuje ) pôvodnú euklidovskú rovinu R2 . Podobne možno dostať projektívny priestor RP3 pridaním nevlastného bodu ku každej priamke prechádzajúcej počiatkom v R3 ; všetky nevlastné body potom tvoria nevlastnú rovinu. Uvedené zovšeobecnenie pre ľubovoľné pole a ľubovoľnú dimenziu je až neskoršou záležitosťou. Zamyslime sa, ako vyzerajú slučky v RPn . Tie vzniknú (po vhodnom preparametrizovaní) zo systémov ciest f1, . . . , fk : 0, 1 → S(n) , ktoré sa prepoja a uzavrú zlepením protiľahlých bodov sféry, t. j. spĺňajú podmienky fi(1) = −fi+1(0) pre i < k a fk(1) = ±f1(0). Také systémy ciest zahŕňajú okrem pôvodných slučiek v S(n) , aj cesty f : 0, 1 → S(n) také, že f(0) = −f(1), dvojice ciest f1, f2 také, že f1(1) = −f2(0) a f2(1) = ±f1(0), atď. Pôvodné slučky sa dajú stiahnuť do bodu vďaka jednoduchej súvislosti S(n) pre n ≥ 2 (tak isto je tomu so slučkami, ktoré vznikli párnym počtom lepení). Ale slučky, ktoré vznikli zlepením koncov neuzavretej cesty v S(n) (všeobecne slučky, ktoré potrebovali nepárny počet lepení), sa do bodu stiahnuť nedajú. V prípade sféry S(2) je takou napr. cesta po poludníku od jedného pólu k druhému. Teda projektívne priestory RPn pre n ≥ 2, vrátane RP3 , ktorý nesie 704 30. Lineárne algebry štruktúru grupy SO(3), nie sú jednoducho súvislé. Podobne je tomu napr. so slučkami na plášti valca, ktorý vznikol zlepením dvoch protiľahlých strán obdĺžnika. Slučku na plášti pochádzajúcu zo slučky v pôvodnom obdĺžniku možno stiahnuť do bodu; slučka, ktorá vznikla z cesty spájajúcej dva body protiľahlých strán, čo sa majú zlepiť, sa však do bodu stiahnuť nedá – pozri obrázok 29.1. Konkrétnym príkladom slučky v SO(3) vychádzajúcej z a končiacej v III, ktorá sa nedá stiahnuť do bodu (konštantnej slučky) III, je napr. funkcia g(t) = RRRuuu 2πt, t ∈ 0, 1 , kde uuu ∈ S(2) je ľubovoľný pevný vektor. Túto jej nestiahnuteľnosť si dokonca môžeme navodiť telesným pocitom. Ak sa postavíme a pripažíme pravú ruku k telu s dlaňou otočenou dozadu, môžeme ňou opísať kruh, dvíhajúc ju dopredu do vzpaženej polohy a potom ju spustiac zadom nadol. Pri prirodzenom pohybe skončíme s rukou opäť pripaženou no s dlaňou obrátenou dopredu (niečo ako „obrátenie spinu ). Ak si to skúsime ešte raz overiť a budeme sa snažiť skončiť s dlaňou obrátenou dozadu, zistíme, že v porovnaní s prvým otočením musíme ruku vo vrchnej fáze omnoho výraznejšie vychýliť zo zvislej roviny doprava (teda vlastne dosť švindlovať). Prvky špeciálnej ortogonálnej grupy SO(3) možno chápať aj ako všetky možné pohyby sféry S(2) (zemského glóbu), pri ktorých jej stred zostáva nehybný (také niečo možno docieliť upevnením glóbusu pomocou gyroskopu). Zložitosť tvaru SO(3) ∼= RP3 sa prejavuje okrem iného v tom, že dvojrozmernú sféru nemožno „spojito učesať . V dôsledku toho neexistujú spojité zobrazenia f, g: S(2) → S(2) také, že pre každé xxx ∈ S(2) tvorí trojica vektorov (xxx, f(xxx), g(xxx)) kladne orientovanú ortonormálnu bázu v R3 . Napr. pokus umiestniť do každého bodu zemského glóbu trojicu (myslených) jednotkových šípiek ukazujúcich nahor, na sever a na západ stroskotá na oboch póloch. Túto skutočnosť treba brať do úvahy pri leteckej navigácii. Ku každej zo špeciálnych ortogonálnych grúp SO(n) pre n ≥ 3 existuje jednoducho súvislá maticová grupa Spin(n), nazývaná spinorová grupa, a dvojnásobne nakrývajúci homomorfizmus Spin(n) → SO(n). Z nich sme sa zatiaľ zoznámili iba s grupou Spin(3) a nakrývajúcim homomorfizmom Spin(3) → SO(3). Ako napovedá ich názov, spinorové grupy súvisia so spinom častíc, kvôli ktorému je často účelné rozlišovať medzi rotáciami okolo tej istej osi o uhly líšiace sa o nepárny násobok plného uhla 2π. Rotácia o 2π totiž síce zachováva geometrickú polohu, ale obracia spin. Okrem štyroch výnimiek Spin(3) ∼= SU(2) ∼= S(3) , Spin(4) ∼= SU(2) × SU(2) ∼= S(3) × S(3) , Spin(5) ∼= Sp(2), Spin(6) ∼= SU(4) 30.8. Nakrývajúci homomorfizmus SL(2,C) → Λ↑ + (3) 705 sa však spinorové grupy nenachádzajú medzi grupami, s ktorými sa v tejto knihe stihneme čo len letmo zoznámiť. Aj k uvedenému zoznamu treba dodať, že tzv. symplektická grupa Sp(n) je kvaterniónová obdoba unitárnej grupy U(n), t. j. grupa všetkých kvaterniónových matíc AAA ∈ Hn×n takých, že AAA · AAA∗ = IIIn, kde AAA∗ označuje maticu, ktorú dostaneme nahradením každého prvku matice AAA k nemu združeným kvaterniónom a následnou transpozíciou. Z nich sme sa doteraz, aj to len inkognito, stretli iba s prvou v poradí – symplektickou grupou Sp(1) = S(3) ∼= SU(2). Ešte poznamenajme, že druhý z uvedených izomorfizmov, teda vlastne Spin(4) ∼= Sp(1) × Sp(1), súvisí s už spomínanou reprezentáciou matíc zo špeciálnej ortogonálnej grupy SO(4) v tvare AAA = Lp · Rq pre p, q ∈ Sp(1). (pozri cvičenie 30.31). Na druhej strane hrá nakrývajúci homomorfizmus Sp(1)×Sp(1) → SO(4) významnú úlohu pri prepojení štvorrozmerných variet, Yangových-Millsových konexií a časticovej fyziky. 30.8 Nakrývajúci homomorfizmus SL(2,C) → Λ↑ +(3) Rovnako ako špeciálna ortogonálna grupa SO(3), ani vlastná ortochrónna Lorentzova grupa Λ↑ +(3) nie je jednoducho súvislá. Z topologického hľadiska má totiž Λ↑ +(3) rovnakú štruktúru ako množina SO(3) × R3 (hoci ako grupy nie sú izomorfné). To možno nahliadnuť na základe reprezentácie každej matice AAA ∈ Λ↑ +(3) v tvare súčinu boostu daného vhodným časovým vektorom vvv = (1, v1, v2, v3) a euklidovskej rotácie v trojrozmernom priestore [vvv]⊥ (pozri komentár za dôsledkom 29.5.5 a cvičenie 29.10). Trojnásobným použitím tvrdenia 29.8.2 na interval J = R tak dostávame, že SO(3)×R3 nie je jednoducho súvislá. Nakrývajúci homomorfizmus SU(2) → SO(3) však možno rozšíriť do nakrývajúceho homomorfizmu SL(2, C) → Λ↑ +(3), pri ktorom je vlastná ortochrónna Lorentzova grupa Λ↑ +(3) dvojnásobne nakrytá špeciálnou lineárnou grupou SL(2, C). O tej už vieme, že – podobne ako grupa SU(2) – jednoducho súvislá je (pozri vetu 29.8.4). Navyše zúženie avizovaného homomorfizmu SL(2, C) → Λ↑ +(3) na podgrupu SU(2) ⊆ SL(2, C) dáva (len v mierne pozmenenej podobe) nám už známy homomorfizmus SU(2) → SO(3). Pripomeňme si, že pri reprezentácii kvaterniónu q = q0 + q1i + q2j + q3k maticou UUU(q) = q0 + q1i q2 + q3i −q2 + q3i q0 − q1i z paragrafu 30.4 pre jeho euklidovskú normu platí q 2 = qq∗ = q2 0 + q2 1 + q2 2 + q2 3 = detUUU(q), 706 30. Lineárne algebry v dôsledku čoho je podmienka q = 1, t. j. q ∈ S(3) , ekvivalentná s UUU(q) ∈ SU(2). Pokúsme sa teraz ten istý kvaternión reprezentovať mierne pozmenenou maticou VVV (q) tak, aby výraz detVVV (q) reprezentoval indefinitnú kvadratickú formu signatúry (1, 3) v Minkovského časopriestore, t. j. aby platilo detVVV (q) = q, q M = q2 0 − q2 1 − q2 2 − q2 3. Také niečo možno dosiahnuť napr. definíciou VVV (q) = q0 + q3 q1 − q2i q1 + q2i q0 − q3 . Potom každé VVV (q) ∈ C2×2 je zrejme hermitovská matica. Množina H všetkých hermitovských matíc rozmeru 2 × 2 tvorí vektorový priestor nad poľom R a samotné VVV : H → H je lineárny izomorfizmus (na rozdiel od UUU : H → U však VVV nezachováva súčin, ani H nie je podalgebra R-algebry C2×2 , · ). Jednu z báz vektorového priestoru H tvoria tzv. Pauliho matice σ0 = 1 0 0 1 , σ1 = 0 1 1 0 , σ2 = 0 −i i 0 , σ3 = 1 0 0 −1 , ktoré zaviedol Wolfgang Pauli, jeden z tvorcov kvantovej mechaniky, pri popise spinu elektrónu. Pri takomto označení VVV (q) = q0σ0 + q1σ1 + q2σ2 + q3σ3. Ako cvičenie prenechávame čitateľovi, aby overil, že polárna forma ku kvadratickej forme XXX,XXX M = detXXX na H je daná výrazom XXX,YYY = XXX,YYY M = 1 2 trXXX trYYY − tr(XXXYYY ) pre XXX,YYY ∈ H. Vzhľadom na tento pseudoskalárny súčin platí σ0, σ0 = − σ1, σ1 = − σ2, σ2 = − σ3, σ3 = 1, σi, σj = 0 pre i = j, inak povedané, Pauliho matice tvoria inerciálnu bázu Minkowského časopriestoru H ∼= R(1,3) . Obrazy reálnych kvaterniónov q = q0 ∈ R tvoria kladne definitný podpriestor [σ0], obrazy vektorových kvaterniónov q = q1i+q2j+q3k ∈ R3 tvoria jeho ortokomplement, teda maximálny záporne definitný podpriestor [σ0]⊥ = [σ1, σ2, σ3] = {XXX ∈ H; trXXX = 0}, 30.8. Nakrývajúci homomorfizmus SL(2,C) → Λ↑ + (3) 707 ktorý splýva s podpriestorom hermitovských matíc s nulovou stopou. Keďže pre AAA ∈ GL(2, C), XXX ∈ H je i matica AAA · XXX · AAA∗ hermitovská, je predpisom ΘΘΘAAA(XXX) = AAA · XXX · AAA∗ definované lineárne zobrazenie ΘΘΘAAA : H → H. Za predpokladu AAA ∈ SL(2, C), t. j. detAAA = 1, navyše platí det AAA · XXX · AAA∗ = detXXX, čiže ΘΘΘA zachováva kvadratickú formu XXX,XXX = detXXX a tým podľa vety 29.3.4 aj pseudoskalárny súčin XXX,YYY . Preto po stotožnení lineárneho zobrazenia ΘΘΘAAA s jeho maticou v kanonickej báze σσσ = (σ0, σ1, σ2, σ3), môžeme tvrdiť, že ΘΘΘAAA ∈ Λ(3) = O(1, 3). Priradenie AAA → ΘΘΘAAA je očividne homomorfizmus grúp ΘΘΘ: SL(2, C) → Λ(3). Okrem toho pre AAA ∈ SU(2) platí ΘΘΘAAA(XXX) = AAA ·XXX ·AAA−1 , teda ak AAA = VVV (q) pre q ∈ S(3) , tak ΘΘΘAAA funguje na H rovnako ako ΓΓΓq z paragrafu 30.6 na H. Platí však ešte o čosi viac. 30.8.1. Veta. Zobrazenie ΘΘΘ: SL(2, C) → O(1, 3), kde ΘΘΘAAA(XXX) = AAA · XXX · AAA∗ pre AAA ∈ SL(2, C), XXX ∈ H, je spojitý homomorfizmus grúp s jadrom KerΘΘΘ = {±III} a obrazom ImΘΘΘ = Λ↑ +(3). Navyše, pre AAA ∈ SU(2) je zúženie ΘΘΘA [σ1, σ2, σ3] ∈ SO(3). Inak povedané, ΘΘΘ je dvojnásobne nakrývajúci homomorfizmus vlastnej ortochrónnej Lorentzovej grupy Λ↑ +(3) špeciálnou lineárnou grupou SL(2, C), v dôsledku čoho Λ↑ +(3) ∼= SL(2, C)/{±III}. Zúženie izomorfizmu ΘΘΘ na špeciálnu unitárnu grupu SU(2) dáva nám už známy nakrývajúci homomorfizmus SU(2) → SO(3). Dôkaz. Zostáva overiť, že pre jadro resp. obraz homomorfizmu ΘΘΘ skutočne platí KerΘΘΘ = {±III} resp. ImΘΘΘ = Λ↑ +(3) a invariantnosť podpriestoru [σ1, σ2, σ3] matíc XXX ∈ H s nulovou stopou vzhľadom na zobrazenia ΘΘΘAAA pre AAA ∈ SU(2). Začnime posledným bodom. Pre AAA ∈ SU(2) a XXX ∈ H s použitím tvrdenia 18.1.3 a rovností AAA∗ · AAA = III, trXXX = 0 vyplýva tr(AAA · XXX · AAA∗ ) = tr(AAA∗ · AAA · XXX) = trXXX = 0. Nech AAA ∈ KerΘΘΘ. Potom AAA · σi · AAA∗ = σi pre i = 0, 1, 2, 3. Pre i = 0 to znamená, že AAA · AAA∗ = III, teda AAA ∈ SU(2). Ďalšie tri podmienky znamenajú, že zúženie ΘΘΘAAA na euklidovský podpriestor [σ1, σ2, σ3] je identické zobrazenie, z čoho na základe úvah predchádzajúcich vetu 30.7.1. vyplýva, že AAA = ±III. Keďže grupa SL(2, C) je podľa vety 29.7.6 (c) súvislá a ΘΘΘ je spojité zobrazenie, je aj obraz ImΘΘΘ súvislá množina. Preto ImΘΘΘ je podmnožinou súvislej komponenty jednotky Λ↑ +(3) v Λ(3). Naopak, každú maticu MMM ∈ Λ↑ +(3) možno podľa vety 29.5.4 napísať v tvare súčinu MMM = diag(1,BBB) · diag(LLLv, 1, 1) · diag(1,CCC), 708 30. Lineárne algebry kde BBB,CCC ∈ SO(3) a |v| < 1. Stačí teda ukázať, že matice uvedených typov ležia v ImΘΘΘ. Ak BBB ∈ SO(3), tak podľa výsledkov predchádzajúceho paragrafu existuje matica AAA ∈ SU(2) taká, že matica zúženia ΘΘΘAAA [σ1, σ2, σ3] v báze (σ1, σ2, σ3) je BBB. Keďže ΘΘΘAAA(σ0) = σ0, platí ΘΘΘAAA = diag(1,BBB) (presnejšie, matica zobrazenia ΘΘΘAAA v báze σσσ je diag(1,BBB)). Ak |v| < 1, tak – ako sme sa presvedčili v paragrafe 16.9 (pozri tiež dôsledok 29.5.3) – existuje reálne číslo γ také, že LLLv = RRRhhhγ. Hľadáme teda maticu AAA ∈ SL(2, C), pre ktorú platí AAA · σ0 · AAA∗ = (cosh γ) σ0 + (sinh γ) σ1, AAA · σ2 · AAA∗ = σ2, AAA · σ1 · AAA∗ = (sinh γ) σ0 + (cosh γ) σ1, AAA · σ3 · AAA∗ = σ3. Prvá podmienka je vlastne rovnosť AAA·AAA∗ = RRRhhhγ, ktorej vďaka tomu, že zobrazenie RRRhhh: R → Λ↑ +(1) je homomorfizmus grúp, vyhovuje reálna symetrická matica AAA = RRRhhhγ/2 ∈ SL(2, C). Priamymi výpočtami, ktoré prenechávame čitateľovi, možno overiť, že AAA spĺňa aj zvyšné tri podmienky. Cvičenia 30.1. Pripomeňte si definíciu okruhu s jednotkou (cvičenia 1.8 a 2.10) a dokážte nasledujúce tvrdenia: (a) Každá asociatívna algebra s jednotkou je zároveň okruh s jednotkou. (b) Táto algebra je komutatívna práve vtedy, keď príslušný okruh je komutatívny. 30.2. Kompozícia homomorfizmov algebier je homomorfizmus algebier a inverzné zobrazenie k izomorfizmu algebier je tiež izomorfizmus algebier. Dokážte. 30.3. Nech A, B sú K-algebry, ααα = (uuu1, . . . ,uuun) je báza v A. (a) Dokážte, že lineárne zobrazenie ϕ: A → B je homomorfizmus algebier práve vtedy, keď pre ľub. dvojicu uuui, uuuj prvkov bázy ααα platí ϕ(uuuiuuuj) = ϕ(uuui) ϕ(uuuj); homomorfizmus ϕ je izomorfizmus práve vtedy, keď navyše ϕ(ααα) = (ϕuuu1, . . . , ϕuuun) je báza v B. (b) Na základe (a) dokážte vetu 30.1.2. 30.4. Vyjadrite podmienky komutatívnosti resp. asociatívnosti lineárnej algebry algebry v reči štruktúrnych konštánt. 30.5. (a) V zhode s definíciou kongruencie na grupe (pozri paragraf 27.5) zadefinujte pojem kongruencie na lineárnej algebre A ako ekvivalancie na množine A, ktorá sa zachováva pri operáciach súčtu, skalárneho násobku a súčinu v A. (b) Nech ∼ je kongruencia na K-algebre A. Na faktorovej množine A/∼ zadefinujte operácie súčtu, skalárneho násobku a súčinu tak, aby kanonické zobrazenie xxx → xxx: A → A/∼ bolo homomorfizmom K-algebier. Uvedomte si, že to možno urobiť jediným spôsobom, a overte korektnosť svojej definície, aj to, že A/∼ je naozaj K-algebra. Cvičenia 709 (c) Dokážte, že ak pôvodná algebra A je asociatívna, komutatívna, resp. algebra s jednotkou, tak aj faktorová algebra A/∼ má príslušnú vlastnosť. 30.6. Lineárny podpriestor J ⊆ A nazývame ideálom K-algebry A, ak pre všetky aaa ∈ A, xxx ∈ J platí aaaxxx,xxxaaa ∈ J. Dokážte nasledujúce tvrdenia: (a) Nech ∼ je kongruencia na algebre A. Potom množina J∼ = 0 = {xxx ∈ A; xxx ∼ 0} je ideál algebry A. (b) Nech J je ideál algebry A. Potom relácia xxx ∼J yyy ⇔ xxx−yyy ∈ J je kongruencia na algebre A a triedou ekvivalencie prvku xxx ∈ A v kongruencii ∼J je afinný podriestor xxx + J ⊆ A so zameraním J (porovnaj s cvičením 9.8). (c) Priradenia popísané v (a), (b) tvoria dvojicu navzájom inverzných bijekcií medzi množinou všetkých kongruencií na algebre A a množinou všetkých ideálov algebry A. (d) Prienik ľubovoľného (konečného či nekonečného) systému ideálov algebry A je opäť ideál v A. (e) Pre každú množinu X ⊆ A existuje najmenší ideál I(X) algebry A taký, že X ⊆ I(X), nazývaný ideál generovaný množinou X. (f) Ak A je asociatívna algebra, tak I(X) splýva s lineárnym obalom množiny {aaaxxxbbb; xxx ∈ X & aaa,bbb, ∈ A} vo vektorovom priestore A. (g) Upravte popis ideálu I(X) z bodu (f) tak, aby fungoval aj v neasociatívnych algebrách. Ideály v algebrách sú obdobou normálnych podgrúp v grupách. Faktorovú algebru A/∼J budeme odteraz značiť A/J a nazývať faktorovou algebrou algebry A podľa ideálu J. 30.7. Nech ϕ: A → B je homomorfizmus K-algebier. (a) Dokážte, že jeho jadro Ker ϕ = ϕ−1 (0) je ideál algebry A a jeho obraz Im ϕ = ϕ(A) je podalgebrou algebry B. (b) Nájdite kanonický izomorfizmu K-algebier A/ Ker ϕ ∼= Im ϕ. (c) Odvoďte z (b), že A ∼= Im ϕ, ak ϕ je injektívny, a A/ Ker ϕ ∼= B, ak ϕ je surjektívny. 30.8. Nech ααα, βββ sú bázy n-rozmerného vektorového priestoru V nad poľom K a ri, si : V → K sú lineárne funkcionály také, že pre ľubovoľné xxx ∈ V platí (xxx)ααα = r1(xxx), . . . , rn(xxx) T , (xxx)βββ = s1(xxx), . . . , sn(xxx) T . (a) Pre daný jednočlen µ(x1, . . . , xn) = xm1 1 . . . xmn n nájdite polynóm g(x1, . . . , xn) = k1,...,kn ck1...kn xk1 1 . . . xkn n ∈ K[x1, . . . , xn] tak, aby pre každý vektor xxx ∈ V platilo g s1(xxx), . . . , sn(xxx) = µ r1(xxx), . . . , rn(xxx) = r1(xxx)m1 . . . rn(xxx)mn . (b) Na základe (a) dokážte, že ak platí µ ∈ K[x1, . . . , xn]p (t. j. m1 +. . .+mn = p), tak aj g ∈ K[x1, . . . , xn]p. Odvodťe z toho, že definícia algebry polynomických funkcií K[V ] ani jednotlivých p-homogénnych vrstiev K[V ]p nezávisí na báze priestoru V . 30.9. V označení predchádzajúceho cvičenia zafixujme bázu βββ vektorového priestoru V a uvažujme zobrazenie K[x1, . . . , xn] → K[V ] dané priradením f(x1, . . . , xn) → fβββ = f(s1, . . . , sn). 710 30. Lineárne algebry (a) Dokážte, že uvedené zobrazenie je surjektívny homomorfizmus K-algebier a pre f ∈ K[x1, . . . , xn]p platí fβββ ∈ K[V ]p. (b) Za predpokladu, že pole K má viac ako p prvkov, dokážte, že priradenie f → fβββ určuje bijekciu vrstvy K[x1, . . . , xn]p na vrstvu K[V ]p. (Návod: Najprv overte prípady n = 0 a n = 1 a ďalej postupujte indukciou.) (c) Odvoďte z (b), že nad nekonečným poľom K určuje priradenie f → fβββ izomorfizmus graduovaných algebier K[x1, . . . , xn] ∼= K[V ]. 30.10. Dokážte, že dim K[x1, . . . , xn]p = n+p−1 p . 30.11. Uvažujme algebru polynomických funkcií K[V ] pre (stĺpcový) vektorový priestor V = Kn . Každý polynóm f(x1, . . . , xn) ∈ K[x1, . . . , xn] určuje rovnako značenú funkciu f ∈ K[V ] takú, že f(xxx) = f(x1, . . . , xn) pre xxx = (x1, . . . , xn)T ∈ Kn . Pre f ∈ K[V ] a ľubovoľnú maticu AAA ∈ Kn×n označme fAAA : V → K funkciu danú predpisom fAAA (xxx) = f(AAA · xxx). Dokážte nasledujúce tvrdenia: (a) Pre každé AAA ∈ Kn×n je f → fAAA homomorfizmus K-algebier K[V ] → K[V ], ktorý zachovávava rozvrstvenie, t. j. pre f ∈ K[V ]p platí fAAA ∈ K[V ]p. (b) Priradením (f,AAA) → fAAA je definovaná (pravá) akcia všeobecnej lineárnej grupy GL(n, K) (aj každej jej podgrupy) na algebre polynomických funkcií K[V ]. (c) Nech G ⊆ GL(n, K) je ľubovoľná maticová grupa. Polynomická funkcia f ∈ K[V ] sa nazýva invariantom grupy G, ak fAAA = f pre každú maticu AAA ∈ G, t. j. ak f je pevným bodom (fixpunktom) každej matice AAA ∈ G. Inak povedané, f je invariantom grupy G práve vtedy, keď stabilizátorm funkcie f v príslušnej akcii K[V ] × G → K[V ] je celá grupa G (pozri paragraf 28.2). Dokážte, že všetky invarianty grupy G tvoria podalgebru K[V ]G algebry K[V ] – nazývame ju algebrou alebo okruhom invariantov grupy G. (d) Pre podgrupy G1 ⊆ G2 ⊆ GL(n, K) platí K[V ]G2 ⊆ K[V ]G1 , t. j. algebra invariantov K[V ]G2 je podalgebrou algebry invariantov K[V ]G1 . (e) Polynomická funkcia xxx 2 = x2 1 + . . . + x2 n je invariantom ortogonálnej grupy O(n). (f) Polynomická funkcia s2 (xxx) = x2 1 + . . . + x2 p − x2 p+1 − . . . − x2 p+q je invariantom pseudoortogonálnej grupy O(p, q). 30.12. Nech G je konečná grupa, # G = n, a K je pole. (a) Overte, že pre x, y, z ∈ G v KG = KG platí (δx ∗ δy)(z) = δ(xy)(z) a nájdite štruktúrne konštanty konvolúcie v grupovej algebre KG vzhľadom na bázu G ⊆ KG. (b) Za predpokladu, že G je navyše komutatívna a K = C, overte, že pre charaktery α, β, γ ∈ Gd ⊆ CG = KG platí α ∗ β, γ = n2 δα,γδβ,γ. Na základe toho nájdite štruktúrne konštanty konvolúcie v grupovej algebre CG vzhľadom na bázu Gd ⊆ CG . 30.13. Dokážte podrobne tvrdenie 30.3.1. 30.14. Nech G je konečná grupa. Pre g ∈ CG označme g funkciu danú predpisom g(x) = g x−1 ). Dokážte nasledujúce tvrdenia: (a) Pre každý homomorfizmus ϕ grupy G do multiplikatívnej grupy C platí ϕ(G) ⊆ U(1) (pozri cvičenie 27.11), v dôsledku čoho ϕ = ϕ. Cvičenia 711 (b) Pre f, g ∈ CG platí g = g a f, g = (f ∗ g)(1). 30.15. Nech G je konečná abelovská grupa a FG : CG → CGd , FGd : CGd → CG označujú diskrétne Fourierove transformácie FG(f)(α) = f, α = x∈G f(x) α(x) pre f ∈ CG , α ∈ Gd resp. FGd (h)(x) = h, x = α∈Gd h(α) α(x) pre h ∈ CGd , x ∈ G. (a) V označení cvičenia 30.14 overte, že pre každé f ∈ CG , α ∈ Gd platí FG f (α) = FG ¯f α−1 , FG(f)∼ (α) = FG ¯f (α), (FGd ◦ FG)(f) = (# G)f, (FGd ◦ FG ◦ FGd ◦ FG)(f) = (# G)2 f. (b) Overte tvar inverznej DFT F−1 G : CGd → CG , konkrétne F−1 G (h) = 1 # G FGd h pre h ∈ CGd , x ∈ G. 30.16. Pozrite sa na látku paragrafu 17.5 zo zorného uhla paragrafu 30.3. (a) Vysvetlite, v akom zmysle možno vektory fffk považovať za charaktery grupy (Zn, +). (b) Vysvetlite, v akom zmysle splývajú dva na oko rôzne popisy diskrétnej Fourierovej transformácie na grupe Zn z paragrafov 17.5 a 30.3. 30.17. Nech p, q sú ľubovoľné kvaternióny. Overte nasledujúce podmienky: (a) (q∗ )∗ = q a q ∈ R ⇔ q = q∗ ; (b) |q∗ | = |q| a q−1 = |q|−1 pre q = 0; (c) (pq)∗ = q∗ p∗ a nájdite príklad, keď (pq)∗ = p∗ q∗ . 30.18. (a) Dokážte, že pre kvaternióny p, q platí p q = qp práve vtedy, keď ich vektorové časti p, q sú lineárne závislé. Odvoďte z toho, že jediné kvaternióny, ktoré komutujú zo všetkými kvaterniónmi, sú reálne čísla. (b) Dokážte, že imaginárne jednotky u, v spĺňajú identitu euα evβ = e(uα+vβ) pre všetky α, β ∈ R práve vtedy, keď uv = vu. Charakterizujte bližšie takéto dvojice u, v. 30.19. (a) Zdôvodnite aspoň dvoma spôsobmi, prečo platí S(3) H ? (b) Dokážte, že faktorová grupa H /S(3) je izomorfná s multiplikatívnou grupou kladných reálnych čísel R+ . (c) Dokáže, že grupa H je izomorfná s priamym súčinom grúp S(3) × R+ . 30.20. Dokážte, že na R3 nemožno definovať bilineárnu operáciu xxxyyy tak, aby všetky súčiny dvojíc vektorov kanonickej bázy (iii,jjj,kkk) boli celé čísla a pre všetky xxx,yyy ∈ R3 platilo xxxyyy = xxx yyy , kde · označuje euklidovskú normu. (Návod: Ukážte, že číslo (12 +12 +12 )(02 +12 +22 ) = 15 nie je súčtom žiadnych troch druhých mocnín celých čísel; prípadne, ak vás ruší 0, urobte to isté pre číslo (12 +12 +12 )(12 +22 +42 ) = 63.) 30.21. Dokážte, že množina všetkých celých čísel, ktoré sa dajú napísať ako súčet štvorcov štyroch celých čísel, je uzavretá na súčet aj súčin. (Skúste najprv priamo, ak to nepôjde, použite kvaternióny.) Odvoďte z toho, že každé prirodzené číslo možno rozložiť na súčet štyroch štvorcov prirodzených čísel. 30.22. Dokážte priamym výpočtom, že každá imaginárna jednotka u ∈ H vyhovuje rovnici x2 + 1 = 0. Teda polynóm konečného stupňa n ≥ 2 môže mať v telese – na rozdiel od poľa – nekonečne mnoho koreňov! 712 30. Lineárne algebry 30.23. (a) Porovnajte goniometrický tvar vektorového kvaterniónu so sférickými súradnicami v R3 (pozri paragraf 14.4). (b) Opakujte úlohu (a) pre goniometrický tvar všeobecného kvaterniónu a sférické súradnice v R4 . Vysvetlite názorne v geometrických pojmoch, v čom a prečo sa líšia. Zmodifikujte definíciu sférických súradníc v R4 tak, aby sa zhodovali. 30.24. Pripomeňme, že zobrazenia Lp, Rp : H → H označujú ľavú resp. pravú transláciu kvaterniónom p. Dokážte, že pre všetky p, q ∈ H platí Lpq = Lp ◦Lq , Rpq = Rq ◦Rp a Lp ◦ Rq = Rq ◦ Lp. 30.25. Pripomeňme, že ΦΦΦq : H → H označuje zúženie konjugácie ΓΓΓq = Lq ◦ Rq−1 kvaterniónom q = 0 na invariantný podpriestor R3 a zároveň jeho maticu v kanonickej báze (i, j, k). Dokážte bez priameho výpočtu, že detΦΦΦq = 1 pre každé q ∈ H . 30.26. Nech q = q0 + q1i + q2j + q3k je jednotkový kvaternión. Nájdite explicitné vzťahy medzi Eulerovými parametrami q0, q1, q2, q3 otočenia ΦΦΦq na jednej strane, a jeho uhlom α a sférickými súradnicami θ, ω jednotkového smerového vektora u jeho osi na strane druhej. 30.27. Nájdite Eulerove parametre vybraných otočení z cvičení 23.7 a 23.8. 30.28. (a) Dokážte, že spojitý homomorfizmus z → z2 je dvojnásobným nakrytím grupy U(1) grupou U(1) s jadrom {±1}. Odvoďte z toho, že projektívna priamka RP1 rovnako ako grupa SO(2) ∼= U(1) majú obe tvar kružnice, teda o. i. nie sú jednoducho súvislé. (b) Pre spojité homomorfizmy maticových grúp zadefinujte pojem n-násobného nakrytia. Pre každé n ≥ 1 nájdite n-násobne nakrývajúci homomorfizmus U(1) → U(1) a určte jeho jadro. (c) Vysvetlite, čo rozumiete tvrdením, že homomorfizmus α → RRRα : (R, +) → (SO(2), ·) je nekonečnonásobným nakrytím grupy (SO(2), ·) (ktorá má tvar kružnice) grupou (R, +) (ktorá má tvar priamky, teda o. i. je jednoducho súvislá, i keď nie kompaktná). 30.29. (a) Vyrobte si Möbiovu pásku z pretočeného pruhu látky zošitím jeho dvoch protiľahlých okrajov (obrázok 30.1). Uvedomte si, že výsledný útvar má len jednu stranu a jeho okraj pozostáva len z jednej uzavretej krivky – na rozdiel od plášťa valca (zošitý nepretočený pruh), ktorý má dve strany a jeho okraj tvoria dve kružnice. (b) Pokúste sa vyrobiť „Möbiov torus zošitím protiľahlých bodov na okraji Möbiovej pásky. Prečo sa vám nedarí zošívanie dokončiť? V štvorrozmernom priestore by to nebol problém – dostali by ste uzavretú plochu známu pod názvom Kleinova fľaša. (c) Z valcovej plochy možno vyrobiť valec „prišitím dvoch kruhových podstáv k jej hraničným kružniciam. Pokúste sa prišiť k Möbiovej páske (ktorá má len jednu uzavretú hraničnú krivku) kus látky v tvare kruhu, ktorého obvod je dvojnásobkom dĺžky pôvodného pruhu. Prečo sa vám ani tentokrát nedarí prišívanie dokončiť? V štvorrozmernom priestore by ste opäť uspeli – uzavretá plocha, ktorú by ste dostali, má tvar projektívnej roviny RP2 . Teda na rozdiel od projektívnej priamky RP1 , ktorá má tvar kružnice S(1) , projektívna rovina RP2 nemá tvar dvojrozmernej sféry S(2) – je to plocha nerealizovateľná v trojrozmernom priestore. 30.30. Dokážte podrobne vetu 30.4.4, t. j. overte izomorfizmus grúp S(3) = Sp(1) ∼= SU(2) na základe izomorfizmu algebier UUU : H ∼= U z tvrdení 30.4.1, 30.4.2. Cvičenia 713 Obr. 30.1. Möbiova páska 30.31. Euklidovský priestor R4 stotožníme s priestorom kvaterniónov H a ukážeme si, ako možno priame zhodnosti (t. j. matice) AAA ∈ SO(4) reprezentovať dvojicami kvater- niónov. (a) Dokážte, že priradenie (p, q) → Lp ◦Rq∗ je homomorfizmus grúp S(3) ×S(3) → SO(4) s jadrom {(1, 1), (−1, −1)}. (b) Dokážte, že uvedený homomorfizmus je surjektívny, teda je to dvojnásobné nakrytie grupy SO(4) grupou Spin(4) ∼= Sp(1) × Sp(1) ∼= SU(2) × SU(2). (Návod: Nech AAA ∈ SO(4). Stĺpce matice AAA označte a, b, c, d a považujte ich za kvaternióny – potom (a, b, c, d) je kladne orientovaná ortonormálna báza v euklidovskom priestore H ∼= R4 . Nech q ∈ S(3) je jednotkový kvaternión taký, že zhodnosť ΦΦΦq = Lq ◦ Rq∗ : R3 → R3 pretransformuje kladne orientovanú ortonormálnu bázu (i, j, k) do kladne orientovanej ortonormálnej bázy (a∗ b, a∗ c, a∗ d). Dokážte, že AAA = Laq ◦ Rq∗ .) (c) Odvoďte z (a) a (b), že každá priama zhodnosť v euklidovskom priestore H ∼= R4 má tvar x → pxq pre vhodnú dvojicou jednotkových kvaterniónov p, q ∈ S(3) . 30.32. (a) Dokážte, že determinant detXXX je kvadratická forma na reálnom vektorovom priestore H ⊆ C2×2 všetkých hermitovských matíc rozmeru 2 × 2 a určte jej signa- túru. (b) Overte, že polárna forma ku kvadratickej forme detXXX má tvar XXX,YYY = 714 30. Lineárne algebry 1 2 trXXX trYYY − tr(XXXYYY ) pre XXX,YYY ∈ H. 30.33. (a) Overte aj zvyšné tri podmienky pre maticu AAA = RRRhhhγ/2 a Pauliho matice zo záverečnej časti dôkazu vety 30.8.1. (b) Nech v ∈ R, |v| < 1, je také, že LLLv = RRRhhhγ. Nájdite u ∈ R, |u| < 1, také, že LLLu = RRRhhhγ/2, t. j. LLLu · LLLu = LLLv, a vyjadrite ho ako funkciu v (u je „relativistická polovica rýchlosti v). (c) Uvedomte si, že pre rýchlosti, ktoré sú malé v porovnaní s rýchlosťou svetla, naozaj platí u ≈ v/2. Na druhej strane, pre v = c je u = c. 31. Lieove algebry a maticové grupy Lieove algebry patria k najdôležitejším typom lineárnych algebier. Teória Lieových grúp a Lieových algebier je však značne rozsiahla a pokročilá časť modernej matematiky, pre ktorú je rámec samotnej lineárnej algebry priúzky. Ak sa chceme vyhnúť teórii vektorových polí na hladkých varietách a všeobecným Lieovým grupám, čo by nás predsa len zaviedlo priďaleko od témy nášho kurzu a zväčšilo by rozsah tejto už aj bez toho značne hrubej učebnice nad únosné medze, nezostáva nám nič iné než sa popri niekoľkých základných pojmoch a výsledkoch tejto teórie obmedziť na viac-menej informatívny prehľad Lieových algebier nám už známych maticových grúp a niekoľko málo jednoduchých ukážok ich použitia. 31.1 Lieove algebry Lieove algebry tesne súvisia s asociatívnymi lineárnymi algebrami. Bilineárnu binárnu operáciu v Lieových algebrách však nenazývame násobením ale Lieovými zátvorkami alebo komutátorom a obvykle ju značíme hranatými zátvorkami [ , ]. Lieova algebra L nad poľom K teda je lineárna K-algebra s operáciou [ , ], ktorá je popri bilinearite navyše alternujúca, t. j. [aaa,aaa] = 0 pre všetky aaa ∈ L, a spĺňa tzv. Jacobiho identitu [aaa, [bbb,ccc]] + [bbb, [ccc,aaa]] + [ccc, [aaa,bbb]] = 0 pre všetky aaa,bbb,ccc ∈ L. Z podmienok bilinearity a alternovania vyplýva anti- symetria [aaa,bbb] = −[bbb,aaa] – pozri lemu 10.1.1, najmä dôkaz časti (b). Pomocou nej možno Jacobiho identitu prepísať do podoby [aaa, [bbb,ccc]] = [[aaa,bbb],ccc] + [bbb, [aaa,ccc]], ktorá vlastne hovorí, že pre pevné aaa ∈ L sa lineárne zobrazenie adaaa = [aaa, ]: L → L správa voči Lieovým zátvorkám podobne ako derivácia voči súčinu. Táto podobnosť lepšie vynikne pri menej symetrickom zápise adaaa[bbb,ccc] = [adaaa(bbb),ccc] + [bbb, adaaa(ccc)]. 716 31. Lieove algebry a maticové grupy S komutátorom matíc sme sa už stretli v paragrafe 22.7. Skutočne, vektorový priestor Kn×n štvorcových matíc nad ľubovoľným poľom K s operáciou komutátora [AAA,BBB] = AAABBB − BBBAAA tvorí Lieovu algebru. Tento príklad pripúšťa isté zovšeobecnenie. Komutátorom prvkov aaa, bbb asociatívnej algebry (A, ·) nazývame výraz [aaa,bbb] = aaabbb − bbbaaa. Potom algebru AL = A, [ , ] nazývame Lieovou algebrou asociatívnej algebry A. Tento názov je oprávnený nasledujúcim tvrdením. 31.1.1. Tvrdenie. Nech (A, ·) je asociatívna lineárna algebra nad poľom K. Potom AL je Lieova algebra nad poľom K. Dôkaz. Bilinearita a alternovanie komutátora [ , ] sú splnené triviálne. Vďaka asociatívnosti násobenia v A možno ľahko overiť, že pre pevné aaa ∈ A sa lineárne zobrazenie adaaa = [aaa, ]: A → A správa voči súčinu ako derivácia, t. j. pre ľubovoľné bbb,ccc ∈ A platí [aaa,bbbccc] = [aaa,bbb]ccc + bbb[aaa,ccc]. Z toho sa už jednoducho odvodí rovnosť [aaa, [bbb,ccc]] = [[aaa,bbb],ccc] + [bbb, [aaa,ccc]] a následne Jacobiho identita. Nasledujúci príklad ukazuje, že nie každá Lieova algebra L je izomorfná s Lieovou algebrou AL nejakej asociatívnej algebry A. Na druhej strane každá Lieova algebra je izomorfná s podalgebrou Lieovej algebry AL vhodnej asociatívnej algebry A. Dôkaz tohto faktu však prekračuje rámec nášho kurzu. To je tiež dôvod, prečo sa Lieova algebra L nazýva komutatívna, ak v nej platí [aaa,bbb] = 0 pre všetky aaa,bbb ∈ L. Pre Lieovu algebru AL je totiž táto podmienka ekvivalentná s komutatívnosťou pôvodnej asociatívnej algebry A. Komutátor [aaa,bbb] tak v istom zmysle zachytáva „mieru nekomutatívnosti súčinu aaabbb v A. Čitateľ už pozná aj ďalší jednoduchý no dôležitý príklad Lieovej algebry. 31.1.2. Príklad. Trojrozmerný vektorový priestor R3 nad poľom R s operáciou vektorového súčinu × tvorí Lieovu algebru. Overenie Jacobiho identity (uuu × (vvv × www)) + (vvv × (www × uuu)) + (www × (uuu × vvv)) = 0 pre uuu,vvv,www ∈ R3 prenechávame čitateľovi ako súčasť cvičenia 31.8. V cvičení 3.1.8 nájde čitateľ návod ako dokázať, že na R3 neexistuje asociatívna bilineárna operácia (uuu,vvv) → uuuvvv taká, že uuu×vvv = uuuvvv−vvvuuu pre všetky uuu,vvv ∈ R3 . Inak povedané, Lieova algebra R3 , × nie je izomorfná so žiadnou algebrou tvaru AL , kde (A, ·) je asociatívna R-algebra. 31.2. Lieova algebra maticovej grupy 717 31.2 Lieova algebra maticovej grupy Z predošlých dvoch kapitol by čitateľ mal nadobudnúť dojem, že maticové grupy sú vo všeobecnosti dosť zložité objekty, ktoré sa jedna od druhej môžu výrazne líšiť svojou algebraickou, geometrickou a topologickou štruktúrou. Na druhej strane, štruktúra konečnorozmerných vektorových priestorov je pomerne jednoduchá a nám už dobre známa. Je jednoznačne určená jediným celočíselným invariantom – dimenziou (pozri vetu 6.3.4). Prekvapivo veľa informácií o štruktúre maticovej grupy však možno získať z istej Lieovej algebry (čo je vlastne „iba konečnorozmerný vektorový priestor doplnený binárnou operáciou komutátora) priradenej tejto grupe. Pôjde o dotykový priestor „priložený bodom 0 k maticovej grupe G v jednotkovom prvku III ∈ G. Kvôli upresneniu tejto definície je však potrebné malé odbočenie do diferenciálnej geometrie. Nech M ⊆ Rn je ľubovoľná množina. Hladkou krivkou v M budeme nazývať akékoľvek spojité zobrazenie f : J → M netriviálneho intervalu J ⊆ R do M, ktoré má na celom intervale J spojitú prvú deriváciu f .1 Hovoríme, že vektor uuu ∈ Rn je dotykový vektor množiny M v bode aaa ∈ M, ak existuje hladká krivka f : J → M a vnútorný bod t0 intervalu J taký, že aaa = f(t0) a uuu = f (t0). Zrejme uuu ∈ Rn je dotykový vektor množiny M ⊆ Rn v bode aaa ∈ M práve vtedy, keď existuje ε > 0 a hladká krivka f : (−ε, ε) → M taká, že aaa = f(0) a uuu = f (0). Každá grupa reálnych matíc je podmnožinou n2 -rozmerného vektorového priestoru Rn×n pre nejaké n ∈ N; každú grupu komplexných matíc možno zasa po stotožnení C ∼= R2 chápať ako podmnožinu vhodného 2n2 -rozmerného vektorového priestoru (Cn×n )R ∼= R2 n×n . Množinu všetkých dotykových vektorov maticovej grupy G ⊆ Kn×n (kde K je niektoré z polí R, C) v bode III ∈ G budeme značiť L(G). 31.2.1. Veta. Nech K je niektoré z polí R, C a G ⊆ GL(n, K) je maticová grupa. Potom pre ľubovoľné AAA,BBB ∈ L(G), c ∈ R, XXX ∈ G platí (a) AAA + BBB, cAAA ∈ L(G); (b) XXX · AAA · XXX−1 ∈ L(G); (c) [AAA,BBB] ∈ L(G). Dôkaz. Nech f, g: (−ε, ε) → G sú hladké krivky také, že f(0) = g(0) = III a f (0) = AAA, g (0) = BBB. V (a) budeme navyše predpokladať, že c = 0 (prípad c = 0 je totiž triviálny). (a) Potom predpismi t → f(t) · g(t) resp. t → f(ct) sú určené hladké krivky f ·g: (−ε, ε) → G resp. fc : (−ε/|c|, ε/|c|) → G, pre ktoré zrejme platí 1 Bežne sa v matematike v definícii hladkej krivky vyžaduje existencia a spojitosť derivácií všetkých rádov. Na naše účely by to však bol zbytočný luxus. 718 31. Lieove algebry a maticové grupy (f ·g)(0) = III, fc(0) = III. Jednoduchými výpočtami s využitím tvrdenia 22.4.1 dostávame (f · g) (0) = f (0) · g(0) + f(0) · g (0) = AAA + BBB, (fc) (0) = cf (0) = cAAA, teda AAA + BBB, cAAA ∈ L(G). (b) Keďže G je grupa, predpisom t → XXX · f(t) ·XXX−1 je definovaná hladká krivka XXX · f · XXX−1 : (−ε, ε) → G, pričom XXX · f · XXX−1 (0) = III. Podľa tvrdenia 22.4.1 XXX · f · XXX−1 (0) = XXX · f (0) · XXX−1 = XXX · AAA · XXX−1 , takže aj XXX · AAA · XXX−1 ∈ L(G). (c) Podľa (b) je predpisom t → f(t) · BBB · f(t)−1 definovaná funkcia f · BBB · f−1 : (−ε, ε) → L(G); zrejme je to hladká krivka v množine L(G) ⊆ Kn×n . Podľa (a) je L(G) lineárny podpriestor konečnorozmerného vektorového priestoru Rn×n , prípadne (Cn×n )R. Z definície derivácie h (t0) funkcie h v bode t0 ako limity výrazov tvaru h(t)−h(t0) /(t−t0) pre t → t0 a z uzavretosti lineárnych podpriestorov ako podmnožín v Rn vyplýva, že i derivácia funkcie f · BBB · f−1 v každom bode intervalu (−ε, ε) patrí do podpriestoru L(G) (pozri cvičenie 22.13). Špeciálne tam patrí matica f · BBB · f−1 (0) = f (0) · BBB · f(0)−1 − f(0) · BBB · f(0)−1 · f (0) · f(0)−1 = AAA · BBB − BBB · AAA = [AAA,BBB]. Pri výpočte sme použili vzorec f−1 (t0) = f(t0)−1 · f (t0) · f(t0)−1 z cvičenia 22.14. 31.2.2. Dôsledok. Nech K je niektoré z polí R, C a G ⊆ GL(n, K) je maticová grupa. Potom dotykový priestor L(G) s operáciou komutátora je Lieova algebra nad poľom R. Podľa (b) vety 31.2.1 je L(G) navyše uzavretá vzhľadom na konjugáciu prvkami grupy G. Lieovu algebru L(G) nazývame Lieovou algebrou maticovej grupy G. Pre istotu ešte raz zdôraznime, že bez ohľadu na to, či G je reálna alebo komplexná maticová grupa, jej Lieova algebra L(G) je vo všeobecnosti len reálna Lieova algebra. Podľa okolností je to Lieova podalgebra Lieovej algebry Rn×n resp. (Cn×n )R s operáciou komutátora [AAA,BBB] = AAA ·BBB −BBB ·AAA. To samozrejme neznamená, že by Lieova algebra L(G) nejakej maticovej grupy G ⊆ GL(n, C) nemohla byť uzavretá aj na komplexné skalárne násobky a tvoriť tak Lieovu algebru nad C – to je však niečo ako „bonus navyše . 31.3. Exponenciálne zobrazenie 719 Len na okraj poznamenajme, že Lieovu algebru možno uvedeným spôsobom priradiť každej Lieovej grupe, čo je, veľmi približne povedané, grupa vybavená hladkou topologickou štruktúrou lokálne zhodnou s topológiou nejakého euklidovského priestoru Rn , vzhľadom na ktorú sú grupové operácie súčinu a inverzného prvku spojito diferencovateľné. Lieova algebra maticovej (či, všeobecnejšie, Lieovej) grupy sa zvykne značiť príslušným malým gotickým písmenom, napr. L(G) = g, L(H) = h a pod. Z definície Lieovej algebry g maticovej grupy G vyplýva, že g zaznamenáva chovanie prvkov grupy G len v blízkosti jej jednotky III; naopak o prvkoch, do ktorých sa z III nemožno dostať po hladkej krivke, takpovediac „nevie nič . Presnejšie možno tento jav popísať pomocou pojmu lokálneho izomorfizmu, ktorý však už presahuje rámec nášho kurzu. Jeden zrejmý dôsledok našej definície však môžeme zaznamenať. 31.2.3. Tvrdenie. Nech G je reálna alebo komplexná maticová grupa. Po- tom L(G) = L Υ(G) . Inak povedané, Lieova algebra g grupy G je totožná s Lieovou algebrou súvislej komponenty Υ(G) jednotkovej matice III ∈ G. Napr. ak G je diskrétna maticová grupa, t. j. existuje ε > 0 také, že jediný prvok AAA ∈ G, pre ktorý platí maxij |aij − δij| < ε, je jednotková matica III, tak g = {0} je triválna Lieova algebra, rovnako ako v prípade jednoprvkovej grupy G = {III}. 31.3 Exponenciálne zobrazenie Prvky Lieovej algebry g = L(G) maticovej grupy G možno alternatívne charakterizovať s využitím exponenciály matice. V zhode s príkladom 27.3.11 nazývame jednoparametrickou podgrupou maticovej grupy G ľubovoľný spojitý grupový homomorfizmus Φ: (R, +) → (G, ·), prípadne jeho obraz Im Φ = {Φ(t); t ∈ R}. Možno dokázať, že každá jednoparametrická podgrupa Φ: R → G je zároveň hladká krivka, ktorá vyhovuje homogénnej autonómnej diferenciálnej rovnici Φ (t) = AAA · Φ(t) s počiatočnou podmienkou Φ(0) = III, kde AAA = Φ (0). Φ má preto tvar Φ(t) = eAAAt . Maticu AAA potom nazývame infinitezimálnym generátorom jednoparametrickej grupy Φ. Ide o zjavnú analógiu s cyklickými grupami, ktoré možno vyjadriť v tvare {ak ; k ∈ Z}, kde a je generátor grupy. 31.3.1. Veta. Nech K je niektoré z polí R, C a G ⊆ GL(n, K) je maticová grupa. Potom L(G) = AAA ∈ Kn×n ; (∀ t ∈ R) eAAAt ∈ G . 720 31. Lieove algebry a maticové grupy To znamená, že Lieova algebra g = L(G) pozostáva z infinitezimálnych generátorov jednoparametrických podgrúp grupy G. Dôkaz. Zrejme f(t) = eAAAt je hladká krivka, f(0) = III, f (0) = AAA. Preto ak eAAAt ∈ G pre všetky t z nejakého netriviálneho intervalu (−ε, ε), tak AAA ∈ g. Pri dôkaze obrátenej inklúzie využijeme doteraz úspešne obchádzaný predpoklad uzavretosti maticovej grupy G ako podmnožiny priestoru Kn×n . Nech teda AAA ∈ Kn×n a f : (−ε, ε) → G je hladká krivka, pre ktorú platí f(0) = III, f (0) = AAA. Pre každé celé číslo k ≥ 1 položme fk(t) = f(t/k)k . Potom fk : (−kε, kε) → G je hladká krivka, fk(0) = III a – keďže matica fk(0) = III komutuje s každou maticou – podľa dôsledku 22.4.2 je fk(0) = kf(t/k)k−1 · (1/k)f (t/k) t=0 = AAA. Dokážeme, že pre každé t ∈ R platí lim k→∞ |t| 0) aj prosté. Potom však zúženie expG M je nevyhnutne bijektívne zobrazenie okolia M na nejaké okolie N jednotkovej matice III ∈ G spojité zároveň so svojim inverzným tzv. logaritmickým zobrazením (expG M)−1 = lnG N. Čo je však ešte zaujímavejšie, súčin matíc z N je plne určený štruktúrou Lieovej algebry g. Presnejšie, pre ľubovoľné AAA,BBB ∈ M existuje jednoznačne určená matica CCC ∈ g taká, že eAAA · eBBB = eCCC , ktorú možno vyjadriť ako súčet tzv. Campbellovho-Bakerovho-Hausdorffovho radu, pozostávajúceho z rôznym spôsobom do seba vložených komutátorov matíc AAA a BBB. Na tomto mieste bez dôkazu uvádzame len jeho prvé členy CCC = AAA + BBB + 1 2 [AAA,BBB] + 1 12 [AAA, [AAA,BBB]] + [[AAA,BBB],BBB]] + . . . . Vyššie členy treba chápať ako postupné „opravy k súčtu prvých dvoch členov AAA + BBB. Pre komutujúce AAA, BBB dostávame známu formulu eAAA · eBBB = eAAA+BBB z tvrdenia 22.2.2; ak AAA, BBB komutujú so svojim komutátorom, dostávame rov- nosť eAAA · eBBB = exp AAA + BBB + 1 2 [AAA,BBB] = exp(AAA + BBB) · exp 1 2 [AAA,BBB] z vety 22.7.3. Nakoľko každé okolie N ⊆ Υ(G) jednotkovej matice III ∈ G už generuje súvislú komponentu Υ(G), vyplýva z toho, že štruktúra podgrupy Υ(G) ⊆ G je plne určená štruktúrou Lieovej algebry g. Špeciálne štruktúru súvislej maticovej grupy G možno plne zrekonštruovať na základe znalosti jej Lieovej algebry g. Ešte raz však upozorňujeme, že g nenesie nijakú informáciu o diskrétnej faktorovej grupe G/Υ(G), teda o tom, ako je G zostavená z jednotlivých tried rozkladu Υ(G) · AAA ∈ G/Υ(G). 722 31. Lieove algebry a maticové grupy Na druhej strane, napr. z komutatívnosti Lieovej algebry g očividne vyplýva komutatívnosť súvislej komponenty Υ(G) jej maticovej grupy G. Spomínaná rekonštrukcia je najjednoduchšia v prípade surjektívnosti exponenciálneho zobrazenia expG : g → G, t. j. ak každá matica XXX ∈ G má tvar XXX = eAAA pre nejakú maticu AAA ∈ g, – vtedy hovoríme, že G je exponenciálna maticová grupa. Zrejme každá exponenciálna grupa je súvislá. Na druhej strane, nie každá súvislá maticová grupa je exponenciálna (pozri cvičenie 31.19). Ako uvidíme v nasledujúcom paragrafe, niektoré nám už známe súvislé maticové grupy sú exponenciálne. 31.4 Lieove algebry konkrétnych maticových grúp Lieova algebra nejakej konkrétnej maticovej grupy, typicky označenej skratkou z veľkých písmen, sa značí rovnakou skratkou z malých písmen, napr. L GL(n, K) = gl(n, K), L SO(n) = so(n), L U(n) = u(n) a pod. Preskúmajme teraz Lieove algebry niektorých najdôležitejších maticových grúp. Z definujúcej podmienky detAAA = 0 regularity matice vyplýva, že všeobecné lineárne grupy GL(n, R), GL(n, C) sú otvorené podmnožiny v Rn×n resp. Cn×n . Preto dotykový priestor v každom ich bode splýva s priestorom všetkých matíc nad príslušným poľom. Ak ešte uvážime, že súvislá komponenta jednotky v GL(n, R) je GL+ (n, R) (pozri vetu 29.7.7), podľa tvrdenia 31.2.3 z toho vyplýva: 31.4.1. Veta. gl(n, R) = gl+ (n, R) = Rn×n , gl(n, C) = Cn×n . 31.4.2. Veta. Nech K je niektoré z polí R, C. Potom sl(n, K) = AAA ∈ Kn×n ; trAAA = 0 . Dôkaz. Nech AAA ∈ Kn×n je ľubovoľná matica Podľa Liouvilleovej formuly (veta 22.2.6) pre každé t ∈ R platí det eAAAt = etrAAAt . Na základe vety 31.3.1 z toho vyplýva, že AAA ∈ sl(n, K) práve vtedy, keď etrAAAt = 1 pre každé t ∈ R. Táto podmienka je zrejme ekvivalentná s rovnosťou trAAA = 0. Z viet 31.4.1–2 vyplýva, že gl(n, C) aj sl(n, C) možno v prípade potreby považovať aj za Lieove algebry nad poľom C. K popisu Lieových algebier ďalších maticových grúp pristúpime jednotným spôsobom. 31.4. Lieove algebry konkrétnych maticových grúp 723 31.4.3. Veta. (a) Nech G = StbZZZ je stabilizátor matice ZZZ ∈ Rn×n vzhľadom na akciu XXX → AAAT · XXX · AAA grupy GL(n, R) na priestore matíc Rn×n . Potom g = L(G) = AAA ∈ Rn×n ; AAAT · ZZZ = −ZZZ · AAA . (b) Nech G = StbZZZ je stabilizátor matice ZZZ ∈ Cn×n vzhľadom na akciu XXX → AAA∗ · XXX · AAA grupy GL(n, C) na priestore matíc Cn×n . Potom g = L(G) = AAA ∈ Cn×n ; AAA∗ · ZZZ = −ZZZ · AAA . Dôkaz. Dokážeme len reálny prípad (a); komplexný prípad (b) je analogický. Nech AAA ∈ g a f je hladká krivka v G taká, že f(0) = III, f (0) = AAA. To znamená, že pre každé t z jej definičného oboru platí f(t)T · ZZZ · f(t) = ZZZ. Derivovaním tejto rovnosti v bode t = 0 s použitím tvrdenia 22.4.1 dostaneme f (0)T · ZZZ · f(0) + f(0) · ZZZ · f (0) = AAAT · ZZZ + ZZZ · AAA = 0, teda, AAAT · ZZZ = −ZZZ · AAA. Naopak, nech AAA ∈ Rn×n spĺňa uvedenú rovnosť. Dokážeme, že potom pre každé t ∈ R platí eAAAt ∈ G, t. j. eAAAt T · ZZZ · eAAAt = ZZZ. V priestore Rn×n uvažujme hladkú krivku h(t) = eAAAt T · ZZZ · eAAAt a konštantnú krivku z(t) = ZZZ. Priamym výpočtom možno overiť, že obe vyhovujú počiatočnej úlohe x (t) = AAAT · x(t) + x(t) · AAA, x(0) = ZZZ. Potrebný záver h(t) = z(t) = ZZZ pre každé t potom vyplýva z jednoznačnosti riešenia tejto úlohy (pozri vetu 22.5.1 a nasledujúcu poznámku (a)). Lieove algebry jednotlivých (pseudo)ortogonálnych či (pseudo)unitárnych grúp dostaneme vhodnou voľbou matice ZZZ. Vzhľadom na tvrdenie 31.2.3 a vetu 29.7.7 by nás už nemalo prekvapiť, že Lieova algebra nerozlišuje celú grupu a jej súvislú komponentu jednotky (ani podgrupy H, pre ktoré platí Υ(G) ⊆ H ⊆ G). 31.4.4. Veta. Nech k, l, n sú kladné celé čísla, n = k+l a DDDkl = diag(IIIk, −IIIl). Potom o(n) = so(n) = AAA ∈ Rn×n ; AAAT = −AAA , o(k, l) = so(k, l) = so+ (k, l) = AAA ∈ Rn×n ; AAAT · DDDkl = −DDDkl · AAA}, u(n) = AAA ∈ Cn×n ; AAA∗ = −AAA , su(n) = u(n) ∩ sl(n, C) = AAA ∈ Cn×n ; AAA∗ = −AAA & trAAA = 0 , u(k, l) = AAA ∈ Cn×n ; AAA∗ · DDDkl = −DDDkl · AAA}, su(k, l) = u(k, l) ∩ sl(n, C) = AAA ∈ Cn×n ; AAA∗ · DDDkl = −DDDkl · AAA & trAAA = 0 . 724 31. Lieove algebry a maticové grupy Všimnite si, že Lieova algebra o(n) = so(n) je tvorená všetkými antisymetrickými maticami AAA ∈ Rn×n . Takéto matice už automaticky majú nulovú celú diagonálu, teda aj stopu. Podobne, Lieova algebra u(n) pozostáva zo všetkých antihermitovských matíc AAA ∈ Cn×n – tie však môžu mať nenulovú stopu. Konečne si treba uvedomiť, že Lieove algebry u(n), su(n), u(k, l), su(k, l) nie sú uzavreté vzhľadom na komplexné skalárne násobky. Jedna z charakteristík maticovej (všeobecnejšie Lieovej) grupy G, ktorú vieme určiť zo znalosti jej Lieovej algebry, je dimenzia. Samotná definícia dimenzie topologického priestoru nie je nijako jednoduchou záležitosťou, pre vektorové priestory nad poľom R však topologická dimenzia splýva s ich dimenziou ako počtom prvkov bázy. Intuitívne by malo byť jasné, že vzhľadom na translačnú symetriu je topológia maticovej grupy „všade rovnaká , a taktiež, že okolie jednotky v grupe sa od okolia nuly v k nemu priloženom dotykovom priestore, ktoré mu zodpovedá v exponenciálnom zobrazení, líši len prípadným zakrivením, teda ich dimenzie sú rovnaké. To nám umožňuje významne si zjednodušť život tým, že dimenziu maticovej grupy priamo definujeme ako dimenziu jej Lieovej algebry. Teda presnejšie, ak G je maticová grupa nad niektorým z polí R, C, tak dim G = dim g = dimR L(G). Vety 31.4.1–4 majú spolu s uvedenou definíciou nasledujúci dôsledok. Samozrejme, najprv treba určiť dimenzie príslušných Lieových algebier – to prenechávame čitateľovi ako cvičenie. 31.4.5. Veta. Nech k, l, n sú kladné celé čísla a n = k + l. Potom dim GL(n, R) = dim GL+ (n, R) = n2 , dim GL(n, C) = 2n2 , dim SL(n, R) = n2 − 1, dim SL(n, C) = 2(n2 − 1), dim O(n) = dim SO(n) = 1 2 n(n − 1), dim U(n) = n2 , dim SU(n) = n2 − 1, dim O(k, l) = dim SO(k, l) = 1 2 n(n − 1), dim U(k, l) = n2 , dim SU(k, l) = n2 − 1. 31.4.6. Príklad. Prvky kanonickej bázy (eee1,eee2,eee3) v R3 spĺňajú komutačné vzťahy eee1 × eee2 = eee3, eee2 × eee3 = eee1, eee3 × eee1 = eee2. 31.4. Lieove algebry konkrétnych maticových grúp 725 Podobne, jednu z báz Lieovej algebry so(3) očividne tvoria antisymetrické matice EEE1 =   0 0 0 0 0 −1 0 1 0   , EEE2 =   0 0 1 0 0 0 −1 0 0   , EEE3 =   0 −1 0 1 0 0 0 0 0   , ktoré vyhovujú analogickým komutačným vzťahom [EEE1,EEE2] = EEE3, [EEE2,EEE3] = EEE1, [EEE3,EEE1] = EEE2. Z toho dôvodu je priradením eeei → EEEi pre i = 1, 2, 3 definovaný izomorfizmus Lieových algebier R3 , × ∼= so(3), [ , ] . Jednotkové kvaternióny i, j, k tvoria bázu Lieovej algebry R3 = [i, j, k] ⊆ H vektorových kvaterniónov s obvyklým komutátorom [p, q] = pq − qp a spĺňajú komutačné vzťahy [i, j] = 2k, [j, k] = 2i, [k, i] = 2j. Keďže zobrazenie UUU : H → C2×2 , definované tesne pred tvrdením 30.4.2, je injektívny homomorfizmus asociatívnych algebier, je zrejmé, že aj antihermitovské matice s nulovou stopou UUU(i) = iσ3 = i 0 0 −i , UUU(j) = iσ2 = 0 1 −1 0 , UUU(k) = iσ1 = 0 i i 0 , tvoriace bázu Lieovej algebry su(2) (kde σ1, σ2, σ3 sú Pauliho matice z paragrafu 30.8), vyhovujú obdobným komutačným vzťahom [UUU(i),UUU(j)] = 2UUU(k), [UUU(j),UUU(k)] = 2UUU(i), [UUU(k),UUU(i)] = 2UUU(j). Zúženie zobrazenia UUU na podpriestor vektorových kvaterniónov R3 ⊆ H je tak izomorfizmom Lieových algebier R3 , [ , ] ∼= su(2), [ , ] . Nakrývajúci homomorfizmus SU(2) → SO(3) zas dáva tušiť, že aj Lieove algebry so(3) a su(2) sú izomorfné. Priradenie EEE1 → UUU(i), EEE2 → UUU(j), EEE3 → UUU(k), ktoré nás asi napadne ako prvé, však nezachováva komutačné vzťahy. Dokážete ho upraviť tak, aby dávalo izomorfizmus so(3) ∼= su(2)? Splňme ešte sľub, ktorý sme dali na konci predchádzajúceho paragrafu. 31.4.7. Veta. Pre každé n ≥ 1 maticové grupy U(n), SU(n), SO(n), ako aj vlastná ortochrónna Lorentzova grupa Λ↑ +(1) sú exponenciálne. Dôkaz. Exponenciálnosť grúp U(n) a SU(n) je vlastne len iným vyjadrením druhej časti vety 23.4.9 v spojení s vetou 31.4.4. Dôkaz exponenciálnosti grúp SO(n) a Λ↑ +(1) prenechávame ako cvičenie čitateľovi. 726 31. Lieove algebry a maticové grupy 31.5 Jednoparametrické podgrupy pseudoortogonálnej grupy Stojí za trochu námahy domyslieť do podrobností, ako vyzerajú matice z Lieových algebier pseudoortogonálnych a pseudounitárnych grúp. Algebra o(k, l) = so(k, l) = so+ (k, l) je tvorená maticami blokového tvaru AAA0 BBB BBBT AAA1 , kde AAA0 ∈ Rk×k , AAA1 ∈ Rl×l sú antisymetrické matice a BBB ∈ Rk×l . Podobne, algebra u(k, l) je tvorená maticami v blokovom tvare AAA0 BBB BBB∗ AAA1 , kde AAA0 ∈ Ck×k , AAA1 ∈ Cl×l sú antihermitovské matice a BBB ∈ Ck×l . Teda v oboch prípadoch príslušné matice obsahujú diagonálne umiestnenú antisymetrickú resp. antihermitovskú časť diag(AAA1,AAA2), priečne doplnenú symetrickou časťou zloženou z blokov BBB, BBBT resp. hermitovskou časťou zloženou z blokov BBB, BBB∗ . Matice z algebry o(k, l) = so(k, l) majú nulovú diagonálu, a tým skôr stopu, rovnako ako matice z algebry o(k + l) = so(k + l). Matica AAA ∈ u(k, l) patrí do algebry su(k, l) práve vtedy, keď má nulovú stopu, t. j. práve vtedy, keď trAAA0 = − trAAA1, čo je opäť analogické vzťahu medzi algebrami u(k + l) a su(k + l). Znalosť Lieových algebier o(k, l), u(k, l) a su(k, l) umožňuje nájsť ich viacmenej kanonické bázy a popísať jednoparametrické podgrupy k nim prislúchajúcich maticových grúp, ktorých infinitezimálne generátory tvoria prvky týchto báz. To nám dáva možnosť aspoň trochu nahliadnuť do štruktúry týchto grúp. Bližšie si to predvedieme na príklade pseudoortogonálnej grupy O(k, l). 31.5.1. Príklad. Lieova algebra o(k, l) má bázu pozostávajúcu z generátorov dvoch typov: Jednak je to k 2 + l 2 antisymetrických matíc EEEsr − EEErs, kde 1 ≤ r < s ≤ k alebo k +1 ≤ r < s ≤ k +l, jednak kl symetrických matíc EEErs + EEEsr, kde 1 ≤ k ≤ r, k + 1 ≤ s ≤ k + l. Matica EEEsr − EEErs má na mieste (r, s) prvok −1, na mieste (s, r) prvok 1 a všade inde nuly. Kľúčom k ňou generovanej jednoparametrickej grupe je jednoparametrická grupa e−itσ2 = exp 0 −t t 0 = cos t − sin t sin t cos t = RRRt. Jednoparametrická grupa exp (EEEsr − EEErs)t má preto na miestach (r, r) a (s, s) hodnotu cos t, na miestach (r, s) resp. (s, r) hodnoty − sin t resp. sin t, Cvičenia 727 na zvyšných miestach diagonály 1 a všade inde 0. Je to teda rotácia o uhol t v dvojrozmernom kladne alebo záporne definitnom invariantnom podpriestore [eeer,eees] ⊆ R(k,l) . Matica EEErs +EEEsr má na miestach (r, s) a (s, r) prvok 1 a všade inde nuly. V najjednoduchšom prípade, keď k = l = 1, generuje jednoparametrickú grupu etσ1 = exp 0 t t 0 = cosh t sinh t sinh t cosh t = RRRhhht. Jednoparametrická grupa exp (EEErs + EEEsr)t má preto na miestach (r, r) a (s, s) hodnotu cosh t, na miestach (r, s) a (s, r) hodnotu sinh t, na zvyšných miestach diagonály 1 a všade inde 0. Ide teda o hyperbolickú rotáciu, čiže boost, o hyperbolický uhol t v dvojrozmernom indefinitnom invariantnom podpriestore [eeer,eees] ⊆ R(k,l) . Všetky matice z vlastnej špeciálnej pseudoortogonálnej grupy SO+ (k, l) možno teda vyjadriť v tvare súčinu konečného počtu matíc uvedených dvoch typov. Cvičenia 31.1. (a) Vyjadrite podmienku alternovania resp. antisymetrie komutátora v Lieovej algebre v reči štruktúrnych konštánt. (b) Vyjadrite pomocou štruktúrnych konštánt Jacobiho identitu. 31.2. (a) Dokážte, že Lieova algebra nad poľom charakteristiky = 2 je komutatívna práve vtedy, keď je komutatívna v pôvodnom zmysle tohto slova, t. j. platí v nej [aaa,bbb] = [bbb,aaa]. (b) Ako je to s Lieovými algebrami nad poľom charakteristiky 2? Je ich veľa, vzniknú napr. z každej asociatívnej algebry definíciou komutátora [x, y] = xy−yx = xy + yx a sú nevyhnutne komutatívne v obyčajnom zmysle, ale nie ako Lieove algebry. Uveďte konkrétne príklady. 31.3. Nájdite (až na izomorfizmus) všetky Lieove algebry nad poľom R so základným vektorovým priestorom R resp. R2 . (V oboch prípadoch je len jedna a to komutatívna, t. j. [aaa,bbb] = 0 pre všetky aaa,bbb.) 31.4. Heisenbergova algebra je Lieova algebra so základným priestorom R3 , pre bázické vektory platí [eee1,eee2] = eee3, [eee1,eee3] = [eee2,eee3] = 0. Dá sa realizovať striktne hornými trojuholníkovými maticami AAA ∈ R3×3 (t. j. aij = 0 pre i ≥ j) – nájdite príslušný izomorfizmus. 31.5. (a) Pre každý z vektorov eee1,eee2,eee3 ∈ R3 , napíšte maticu EEEi ∈ R3×3 lineárneho operátora xxx → eeei ×xxx na priestore R3 vzhľadom na štandardnú bázu εεε = (eee1,eee2,eee3). (b) Predpis eeei → EEEi určuje izomorfizmus R-algebier R3 , × ∼= so(3), [ , ] . Dokážte a porovnajte s príkladom 31.4.6. Odvoďte z toho Jacobiho identitu pre vektorový súčin. (c) Nájdite obraz všeobecného vektora (a, b, c)T ∈ R3 v uvedenom izomorfizme. 728 31. Lieove algebry a maticové grupy 31.6. Skúste riešiť rovnakú úlohu ako v cvičení 31.3 pre vektorový priestor R3 . (Malo by ich byť 9; hovorí sa tomu Bianchiho klasifikácia.) 31.7. (a) Nájdite explicitný tvar pre komutátor [p, q] = pq − qp kvaterniónov p, q ∈ H. (b) Dokážte, že predpisom eee1 → i/2, eee2 → j/2 eee3 → k/2 je definovaný injektívny homomorfizmus Lieových algebier R3 , × → H, [ , ] . (c) Nájdite explicitný tvar čo najprirodzenejšieho izomorfizmu Lieových algebier so(3) ∼= su(2). 31.8. Dokážeme, že Lieova algebra (R3 , ×) nie je izomorfná so žiadnou Lieovou algebrou, ktorá vznikne ako AL z nejakej asociatívnej algebry A. Predpokladajme, že (uuu,vvv) → uuuvvv je asociatívna bilineárna operácia na R3 taká, že R3 , × = R3 , · L , t. j. uuu × vvv = uuuvvv − vvvuuu pre všetky uuu,vvv ∈ R3 . (a) Dokážte, že pre každé uuu ∈ R3 platí uuu2 × uuu = 0. Odvoďte z toho, že vektory uuu a uuu2 = uuuuuu sú lineárne závislé. (b) Pre i = 1, 2, 3 označte ai reálne čísla také, že eee2 i = aieeei. Dokážte, že pre i = j platí aieeej = eeeieeej + eeejeeei = ajeeei. Odvoďte z toho, že pre ľubovoľné uuu,vvv ∈ R3 potom nutne platí vvvuuu = −uuuvvv, t. j. bilineárna operácia uuuvvv je antisymetrická. (c) Dokážte, že potom uuu × vvv = 2uuuvvv, v dôsledku čoho by aj vektorový súčin musel byť asociatívny. Nájdite príklad dosvedčujúci, že nie je. (d) Nájdite asociatívnu algebru A = R4 , · , pre ktorú existuje injektívny homomorfizmus Lieových algebier (R3 , ×) → AL . 31.9. Nech G je maticová grupa. Nájdite chybu v nasledujúcom „dôkaze uzavretosti Lieovej algebry L(G) vzhľadom na súčet matíc: Nech AAA,BBB ∈ L(G). Potom podľa vety 31.3.1 platí eAAAt , eBBBt ∈ G pre všetky t ∈ R. Preto tiež e(AAA+BBB)t = eAAAt · eBBBt ∈ G pre všetky t ∈ R, a z tej istej vety vyplýva AAA + BBB ∈ L(G). 31.10. (a) Na základe kanonického izomorfizmu z vety 29.2.2 stotožníme afinné rozšírenie Gaf maticovej grupy G ⊆ GL(n, K) nad poľom K = R resp. K = C s grupou matíc tvaru (AAA uuu 0 1 ), kde AAA ∈ G, uuu ∈ Kn . Dokážte, že základný priestor Lieovej algebry L Gaf ⊆ K(n+1)×(n+1) pozostáva zo všetkých matíc tvaru (AAA uuu 0 0 ), kde AAA ∈ L(G), uuu ∈ Kn . (b) Nech K je ľubovoľné pole. Nájdite explicitný tvar komutátora matíc (AAA uuu 0 0 ), (BBB vvv 0 0 ), kde AAA,BBB ∈ Kn×n , uuu,vvv ∈ Kn . Dokážte, že všetky matice tvaru (AAA uuu 0 0 ), kde AAA ∈ Kn×n , uuu ∈ Kn , tvoria podalgebru Lieovej algebry K(n+1)×(n+1) . (c) Nech A ⊆ Kn×n je Lieova algebra nad nejakým podpoľom F poľa K (s komutátorom [AAA,BBB] = AAABBB − BBBAAA). Afinným rozšírením Lieovej algebry A nazývame algebru Aaf = A × Kn so štruktúrou vektorového priestoru nad F definovanou po zložkách a s komutátorom (AAA,uuu), (BBB,vvv) = [AAA,BBB],uuu + AAAvvv − vvv − BBBuuu . Dokážte, že Aaf je Lieova algebra nad poľom F izomorfná s podalgebrou Lieovej algebry K(n+1)×(n+1) tvorenou všetkými maticami tvaru (AAA uuu 0 0 ), kde AAA ∈ A, uuu ∈ Kn . (d) Za podmienok ako v časti (a) popíšte prirodzený izomorfizmus Lieových algebier L Gaf ∼= L(G)af . Taktiež overte, že pri reprezentácii afinného rošírenia Gaf polopriamym súčinom G Kn platí priamo rovnosť L Gaf = L(G)af . (e) Vypočítajte dimenzie afinných rozšírení Lieových algebier z viet 31.4.1, 31.4.2 a 31.4.4 a maticových grúp z vety 31.4.5. 31.11. Vypočítajte deriváciu funkcie h z dôkazu vety 31.4.3 a dokážte, že h vyhovuje po- Cvičenia 729 čiatočnej úlohe h = AAAT · h + h · AAA, h(0) = ZZZ. 31.12. Nech G, H ⊆ GL(n, K), kde K je niektoré z polí R, C, sú maticové grupy. Dokážte rovnosť L(G ∩ H) = L(G) ∩ L(H). Zdôvodnite tým tvar Lieových algebier su(n) a su(k, l) z vety 31.4.4. 31.13. Vysvetlite prečo dimenzie Lieových algebier o(k, l) = so(k, l), resp. u(k, l), su(k, l) nezávisia priamo na k, l ale iba na ich súčte n = k + l. (Návod: AAA → AAA · DDDkl je izomorfizmus vektorových priestorov (nie nutne Lieových algebier) nad R so(n) → so(k, l) resp. u(n) → u(k, l) resp. su(n) → su(k, l).) 31.14. Dokážte vetu 31.4.5 výpočtom dimenzií Lieových algebier príslušných maticových grúp. (S použitím predchádzajúceho cvičenia minimalizujte počet nevyhnutných výpočtov.) 31.15. Dokážte, že z komutatívnosti Lieovej algebry g vyplýva komutatívnosť súvislej komponenty Υ(G) jej maticovej grupy G. 31.16. (a) Dokážte, že pre maticu EEE = 0 −1 1 0 , ktorá tvorí bázu Lieovej algebry so(2), naozaj platí eEEEt = RRRt pre ľubovoľné t ∈ R. Odvoďte z toho, že grupa SO(2) je exponenciálna. (b) Pomocou (a) dokážte, že pre matice EEE1, EEE2, EEE3 z príkladu 31.4.6, tvoriace bázu Lieovej algebry so(3), platí eEEEit = RRReeei t pre i = 1, 2, 3 a ľubovoľné t ∈ R. S využitím tvrdenia 22.1.2, dôsledku 23.5.4 a vety 31.2.1 (b) z toho odvoďte, že aj SO(3) je exponenciálna grupa. (c) Podobne ako v (b) dokážte, že aj grupy SO(n) pre n > 3 sú exponenciálne. 31.17. (a) Odvoďte explicitný tvar jednoparametrických podgrúp eUUU(i)t = eit 0 0 e−it , eUUU(j)t = cos t sin t − sin t cos t , eUUU(k)t = ( cos t i sin t i sin t cos t ) grupy SU(2), zodpovedajúcich infinitezimálnym generátorom UUU(i) = iσ3, UUU(j) = iσ2, UUU(k) = iσ1, ktoré tvoria bázu jej Lieovej algebry su(2). (b) S použitím vety 17.4.3 dokážte, že ľubovoľnú maticu AAA = a b −b a ∈ SU(2) možno vyjadriť v tvare AAA = exp ϕ 2 iσ3 · exp χ 2 iσ1 · exp ψ 2 iσ3 = cos χ 2 exp i(ϕ+ψ) 2 i sin χ 2 exp i(ϕ−ψ) 2 i sin χ 2 exp i(ψ−ϕ) 2 cos χ 2 exp −i(ϕ+ψ) 2 , kde 0 ≤ ϕ < 2π, 0 ≤ χ < π, −2π < ψ ≤ 2π sú parametre, ktoré opäť nazývame Eulerove uhly, – porovnajte s paragrafom 23.6. (c) Dokážte, že obrazom matice exp α 2 iσp , kde p = 1, 2, 3, v nakrývajúcom homomorfizme SU(2) → SO(3) je matica otočenia RRR eeep α . 31.18. Pre dané ϑ ∈ R nájdite maticu AAA ∈ so(1, 1) takú, že eAAA = RRRhhhϑ. Odvoďte z toho, že Λ↑ +(1) je exponenciálna grupa izomorfná s (R, +). 31.19. Dokážeme, že hoci grupa SL(2, R) je súvislá (veta 29.7.6 (c)), exponenciálne zobrazenie sl(2, R) → SL(2, R) nie je surjektívne. Uvažujme ľubovoľnú maticu AAA = a b c −a ∈ sl(2, R) a označme δ = − detAAA = a2 + bc, ρ = |δ|. Overte nasledujúce rovnosti: (a) AAA2 = δIII2; 730 31. Lieove algebry a maticové grupy (b) eAAAt = cosh(ρt)+(a/ρ) sinh(ρt) (b/ρ) sinh(ρt) (c/ρ) sinh(ρt) cosh(ρt)−(a/ρ) sinh(ρt) , ak δ > 0; (c) eAAAt = 1+at bt ct 1−at , ak δ = 0; (d) eAAAt = cos(ρt)+(a/ρ) sin(ρt) (b/ρ) sin(ρt) (c/ρ) sin(ρt) cos(ρt)−(a/ρ) sin(ρt) , ak δ < 0. (e) V každom z uvedených troch prípadov vypočítajte stopu matice eAAAt a ohraničte hodnoty, aké može nadobúdať. Presvedčte sa, že pre ľubovoľnú maticu AAA ∈ sl(2, R) platí tr eAAAt ≥ −2. (f) Nájdite aspoň jednu maticu XXX ∈ SL(2, R) takú, že trXXX < −2. Táto matica nemôže mať tvar XXX = eAAAt pre žiadnu maticu AAA ∈ sl(2, R). Ukážte, že existuje nekonečne mnoho takých matíc XXX. Časť V Multilineárna algebra 32. Úvod do tenzorového počtu Tenzory sú z matematického hľadiska jednoducho multilineárne formy. Vo fyzike sa tenzory vyskytujú najmä ako hodnoty veličín popisujúcich vlastnosti anizotropných prostredí a dejov, ktoré v nich prebiehajú. Významnejšie príklady využitia tenzorov presahujú rámec lineárnej algebry, a tým aj nášho kurzu. Z matematických disciplín, v ktorých hrajú tenzory významnú úlohu, treba spomenúť aspoň diferenciálnu geometriu, prostredníctvom ktorej ďalej vstupujú napr. do teoretickej mechaniky či všeobecnej teórie relativity, a reperezentácie grúp, s rozsiahlymi aplikáciámi napr. v kryštalografii či časticovej fyzike. Bez tenzorov sa nezaobídeme ani pri štúdiu elektromagnetizmu či zložitejších systémov v kvantovej mechanike. Vo väčšine týchto aplikácií však nejde o „konštantné ale o „premenné tenzory, čiže o tenzorové polia. Zoči-voči spomínaným faktom sú ciele záverečných dvoch kapitol tejto knihy pomerne skromné. Mali by čitateľovi sprostredkovať istú „tenzorovú gramotnosť , ktorá by mu umožnila ďalej študovať oné dôležitejšie, no zložitejšie aplikácie. Naše príklady využitia tenzorov budú preto pomerne jednoduché. K nim patrí aj nasledujúci úvodný motivačný príklad. 32.0 Tenzor napätia Ako sme spomínali ešte v úvode ku kapitole 1, skaláry (presnejšie prvky poľa R) sú hodnoty fyzikálnych veličín určených jedine svojou veľkosťou (prípadne aj znamienkom). Vektory zodpovedajú veličinám, ktoré sú okrem veľkosti určené navyše smerom a orientáciou. Ukazuje sa však, že popri nich je užitočné zaviesť a študovať aj veličiny, ktoré zachytávajú vzťahy medzi dvoma či dokonca viacerými vektorovými veličinami. Takýmto veličinám hovoríme tenzory. Príkladom tenzorovej fyzikálnej veličiny je tenzor napätia, ktorý popisuje silové pôsobenie v rôznych smeroch v danom prostredí. Napätie sa po latinsky povie tensio, čo prešlo do slovenčiny v podobe odborného termínu tenzia. Tenzor napätia, teda doslova tenzor tenzie, je tak prototypom všetkých tenzorových veličín. Predstavme si nejaké spojité prostredie (napr. pevné alebo kvapalné teleso) v trojrozmernom euklidovskom priestore R3 vystavené silovému pôsobeniu, ktoré sa v ňom šíri. Také pôsobenie môže spočívať v tlaku resp. ťahu v rôznych smeroch, ako aj v torzii. Do nejakého bodu tohto prostredia umiestnime myslenú plôšku ∆SSS = nnn∆S, orientovanú v smere jednotkového vektora normály nnn, dosť malú na to, aby sme veľkosť sily ∆FFF, ktorá na ňu pôsobí 734 32. Úvod do tenzorového počtu zo strany protiľahlej vektoru nnn, mohli považovať za priamoúmernú veľkosti ∆S tejto plôšky. Keby aj sila ∆FFF mala smer normály nnn, mohli by sme písať ∆FFF = p ∆SSS pre nejaký koeficient úmernosti p = p(nnn) ∈ R, závislý od normálového vektora nnn. V prostredí spĺňajúcom Pascalov zákon, ako je tomu v ideálnych kvapalinách, by koeficient úmernosti p bol navyše konštantný, čiže mal rovnakú hodnotu pre všetky smery normál nnn, zodpovedajúcu tlaku v danom bode. Smery vektorov ∆SSS a ∆FFF sa však môžu líšiť, napr. v dôsledku torzie. Zovšeobecnením podmienky priamej úmernosti je podmienka lineárnej závislosti sily ∆FFF od orientovanej plôšky ∆SSS, čiže ∆FFF = T(∆SSS) = T(nnn)∆S pre nejaký lineárny operátor T : R3 → R3 , ktorému hovoríme tenzor napätia v danom bode. V limite pre ∆S → 0 dostávame vyjadrenie vektora T(nnn) v tvare derivácie T(nnn) = dFFF dS . Tenzor napätia môžeme stotožniť s jeho maticou T = T(eee1), T(eee2), T(eee3) = Ti j ∈ R3×3 v kanonickej báze (eee1,eee2,eee3) priestoru R3 . Stĺpec T(eeej) matice T predstavuje silu v prepočte na jednotku plošného obsahu pôsobiacu na infinitezimálnu orientovanú plôšku s normálou nnn = eeej a Ti jeeei je kolmý priemet vektora T(eeej) do osi xi = [eeei]. Inak povedané, T(eeej) = T1 j eee1 + T2 j eee2 + T3 j eee3 je rozklad vektora T(eeej) do zložiek v smeroch jednotlivých súradných osí. V prípade platnosti Pascalovho zákona má tenzor napätia diagonálnu maticu T = pIII3. Dospievame teda k záveru, že niektorým fyzikálnym veličinám môžu zodpovedať aj zložitejšie matematické objekty než len skaláry alebo vektory. V našom zatiaľ jedinom príklade to bolo lineárne zobrazenie, no vo všeobecnosti to môžu byť multilineárne zobrazenia. Takýmto objektom budeme hovoriť tenzory. Skôr než pristúpime k samotnému matematickému výkladu tenzorov, treba ešte upozorniť na istú nejednoznačnosť v terminológii, ktorá by občas mohla viesť k nedorozumeniam. V našom príklade sme každému bodu nejakej množiny M ⊆ R3 predstavujúcej skúmané teleso priradili tenzor napätia v tomto bode. Napätie v danom prostredí je tak popísané (typicky spojitou či dokonca spojito diferencovateľnou) funkciou T : M → R3×3 , ktorá každému 32.1. Dualita 735 bodu xxx ∈ M priradí tenzor (maticu) T(xxx) = Ti j (xxx) zodpovedajúci napätiu v bode xxx. Ak chceme zachytiť aj vývoj napätia v čase, musíme uvažovať funkciu T : M × I → R3×3 , kde I ⊆ R predstavuje nejaký časový interval. Často – či už v diferenciálnej geometrii, fyzike alebo v technických aplikáciách – sa pod tenzorom rozumie práve takáto funkcia. Metodicky správnejšie je však nazývať ju tenzorovým poľom (v prvom prípade statickým, v druhom časovo premenným) a názov tenzor používať len pre jej hodnoty T(xxx) resp. T(xxx, t). V našom výklade sa zameriame iba na jednotlivé tenzory, a nie na tenzorové polia. Vo viacerých príkladoch však bude aspoň v pozadí prítomná možnosť priradiť tenzor príslušného typu všetkým bodom nejakej množiny M ⊆ Rn , teda chápať „naše tenzory ako hodnoty istého tenzorového poľa. 32.1 Dualita V tejto i v nasledujúcej kapitole označuje K ľubovoľné pevne zvolené pole a pod vektorovým priestorom rozumieme vždy vektorový priestor nad poľom K. Pripomeňme z paragrafu 6.5, že všetky lineárne zobrazenia z vektorového priestoru V do vektorového priestoru W tvoria vektorový priestor, ktorý značíme L(V, W). Vektorový priestor L(V, K) značíme V ∗ a nazývame duálnym priestorom alebo len krátko duálom vektorového priestoru V . Jeho prvky nazývame lineárne funkcionály alebo tiež lineárne formy na V . Konečnorozmerný vektorový priestor V je izomorfný so svojim duálom V ∗ a taktiež so svojim druhým duálom V ∗∗ . Konkrétny izomorfizmus V ∼= V ∗ závisí na voľbe bázy v priestore V . Na druhej strane existuje kanonický izomorfizmus V ∼= V ∗∗ , ktorý nám umožňuje stotožniť každý vektor xxx ∈ V s lineárnym funkcionálom xxx: V ∗ → K, kde xxx(η) = η(xxx) pre η ∈ V ∗ . V dôsledku toho nebudeme ďalej rozlišovať vektor xxx ∈ V a funkcionál xxx ∈ V ∗∗ ani priestor V a jeho druhý duál V ∗∗ , čiže pod duálom priestoru V ∗ budeme rozumieť pôvodný priestor V . Zároveň zavádzame symetrické označenie η,xxx = η(xxx) = xxx(η) = xxx, η . Takto zavedené lomené zátvorky sú tiež bilineárnou formou · , · : V ∗ ×V → K; hovoríme jej párovanie alebo dualita medzi V ∗ a V . Pozrime sa teraz bližšie na nekanonické izomorfizmy V ∼= V ∗ . Každá báza βββ = (vvv1, . . . ,vvvn) priestoru V určuje lineárny izorfizmus xxx → (xxx)βββ : V → Rn , kde n = dim V . Ak položíme (xxx)βββ = (x1 , . . . , xn )T (dôvody náhleho presunu indexov zdola nahor začneme odhaľovať v závere paragrafu), tak každé z priradení vvvi (xxx) = xi určuje lineárny funkcionál vvvi : V → K. Pri takomto 736 32. Úvod do tenzorového počtu označení teda môžeme písať (xxx)βββ = vvv1 (xxx), . . . ,vvvn (xxx) T , xxx = x1 vvv1 + . . . + xn vvvn = vvv1 (xxx)vvv1 + . . . + vvvn (xxx)vvvn. Každý z lineárnych funkcionálov vvvi : V → K je jednoznačne určený svojimi hodnotami vvvi ,vvvj = δi j na vektoroch vvvj bázy βββ. Treba si však uvedomiť, že – napriek označeniu – lineárny funkcionál vvvi závisí od celej bázy βββ = (vvv1, . . . ,vvvn), a nielen od vektora vvvi. Lineárne formy vvv1 , . . . ,vvvn tvoria bázu duálneho priestoru V ∗ ; označujeme ju βββ∗ = (vvv1 , . . . ,vvvn ) a nazývame duálna báza k báze βββ = (vvv1, . . . ,vvvn). Priradenie vvvj → vvvj možno jednoznačne rozšíriť do lineárneho izomorfizmu V → V ∗ , pri ktorom sa vektor xxx = j xj vvvj zobrazí na funkcionál j xj vvvj . Pre lineárny funkcionál η ∈ V ∗ a vektor xxx = i xi vvvi ∈ V zrejme platí η(xxx) = i xi η(vvvi) = i η(vvvi)vvvi (xxx), čiže η = i η(vvvi)vvvi . To znamená, že súradnice funkcionálu η v báze βββ∗ tvorí stĺpec (η)βββ∗ = η(vvv1), . . . , η(vvvn) T = (η)T 1,βββ, t. j. transponovaná matica k matici (η)1,βββ lineárneho zobrazenia η: V → K vzhľadom na bázy βββ vo V a 1 v K. Uvažujme dve bázy ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) priestoru V . Označme Pi j prvok na mieste (i, j) matice prechodu PPPααα,βββ z bázy βββ do bázy ααα. S použitím práve zavedeného označenia môžeme písať Pi j = uuui ,vvvj . Súradnice (xxx)ααα = uuu1 (xxx), . . . ,uuun (xxx) T , (xxx)βββ = vvv1 (xxx), . . . ,vvvn (xxx) T vektora xxx ∈ V v bázach ααα resp. βββ sa transformujú podľa vzťahu (xxx)ααα = PPPααα,βββ · (xxx)βββ (pozri paragraf 7.5), čo rozmenené na drobné znamená uuui (xxx) = j Pi jvvvj (xxx), čiže uuui = j Pi jvvvj pre i ≤ n, a v súhrne ααα∗ = βββ∗ ·PPPT ααα,βββ. Pre maticu prechodu medzi duálnymi bázami ααα∗ , βββ∗ z toho vyplýva PPPβββ∗,ααα∗ = PPPT ααα,βββ = PPP−1 βββ,ααα T . 32.1. Dualita 737 Súradnice lineárnej formy η ∈ V ∗ vzhľadom na duálne bázy ααα∗ = (uuu1 , . . . ,uuun ), βββ∗ = (vvv1 , . . . ,vvvn) sa preto budú transformovať inverzne voči transformácií súradníc (xxx)ααα, (xxx)βββ: (η)βββ∗ = PPPβββ∗,ααα∗ · (η)ααα∗ = PPPT ααα,βββ · (η)ααα∗ , teda po rozpise do jednotlivých zložiek vvvi(η) = j Pj i uuuj(η), t. j. vvvi = j Pj i uuuj, čo je v zhode s transformačným vzťahom βββ = ααα·PPPααα,βββ ešte z paragrafu 7.5. Znovu si však uvedomme, že zatiaľ čo matica PPPααα,βββ = Pi j sprostredkúva prechod od súradníc (xxx)βββ k súradniciam (xxx)ααα, k nej transponovaná matica PPPT ααα,βββ = Pj i = PPPβββ∗,ααα∗ zabezpečuje prechod v opačnom smere, totiž od súradníc (η)ααα∗ k súradniciam (η)βββ∗ . Ak označíme maticu prechodu PPPααα,βββ = PPP, máme βββ = ααα·PPP, βββ∗ = (ααα · PPP)∗ , a rozdielny charakter transformačných rovníc pre súradnice vektorov xxx ∈ V resp. funkcionálov η ∈ V ∗ sa prejaví výrazne: (xxx)ααα·PPP = PPP−1 · (xxx)ααα resp. (η)(ααα·PPP)∗ = PPPT · (η)ααα∗ . Hovoríme, že súradnice vektorov xxx ∈ V sa transformujú kontravariatne (t. j. inverzne voči transformácii báz), zatiaľ čo súradnice lineárnych foriem η ∈ V ∗ sa transformujú kovariantne (t. j. súhlasne s transformáciou báz). Prvky pôvodného priestoru V preto nazývame kontravariantné vektory alebo len krátko vektory, kým prvky jeho duálu V ∗ nazývame kovariantné vektory, stručne len kovektory. Je to však terminológia „zaujatého pozorovateľa , ktorý celú vec posudzuje z hľadiska báz v pôvodnom priestore V . V tejto súvislosti prijmeme nasledujúcu dohodu, ktorú sme vlastne už začali uplatňovať: súradnice vektorov budeme číslovať hornými a súradnice kovektorov dolnými indexmi; naopak, usporiadané n-tice vektorov budeme číslovať dolnými a usporiadané n-tice kovektorov hornými indexmi. Význam tejto dohody vyjde najavo až trochu neskôr v súvislosti s tzv. Einsteinovou sumačnou konvenciou. Dualita umožňuje zaviesť aj akýsi vzťah ortogonálnosti medzi vektormi a kovektormi, ktorý do veľkej miery pripomína ortogonálnosť v (pseudo)euklidovských resp. konečnorozmerných unitárnych priestoroch. Hovoríme, že vektor xxx ∈ V a kovektor η ∈ V ∗ sú ortogonálne, označenie xxx ⊥ η, prípadne η ⊥ xxx, ak xxx, η = 0. Pre množiny X ⊆ V , Ω ⊆ V ∗ definujeme ich ortokomplementy X⊥ = η ∈ V ∗ ; (∀xxx ∈ X)(xxx ⊥ η) 738 32. Úvod do tenzorového počtu resp. Ω⊥ = xxx ∈ V ; (∀ η ∈ Ω)(xxx ⊥ η) . Pre naše účely postačí, ak zaznamenáme nasledujúce jednoduché tvrdenie, ktorého dôkaz prenechávame čitateľovi. 32.1.1. Tvrdenie. Nech V je konečnorozmerný vektorový priestor a Ω ⊆ V ∗ je ľubovoľná množina. Potom Ω⊥ ⊆ V je lineárny podpriestor a pre jeho dimenziu platí dim Ω⊥ = dim V − dim[Ω]. Špeciálne Ω generuje V ∗ práve vtedy, keď Ω⊥ = {0}. 32.2 Tenzorový súčin Jestvuje viacero ekvivalentných spôsobov ako definovať tenzorový súčin vektorových priestorov. Z nich asi najmenej abstraktný a pedagogicky najstráviteľnejší začína veľmi jednoduchou a konkrétnou definíciou tenzorového súčinu funkcií, ktorá je základom konštrukcie tenzorového súčinu vektorových priestorov funkcií. Ako špeciálny prípad dostaneme tenzorový súčin duálnych priestorov k daným vektorovým priestorom. Trik s dualitou, pri ktorom pôvodný konečnorozmerný priestor V stotožníme s jeho druhým duálom V ∗∗ , prípadne nekonečnorozmerný priestor V iba vnoríme do V ∗∗ , nám napokon umožní zaviesť tenzorový súčin pre akékoľvek vektorové priestory nad daným poľom. My sa vydáme práve touto cestou, hoci zďaleka nie je najkratšia možná. Nech X, Y sú množiny a K je pole. Tenzorovým súčinom funkcií f : X → K, g: Y → K nazývame funkciu f ⊗ g: X × Y → K danú predpisom (f ⊗ g)(x, y) = f(x)g(y) pre x ∈ X, y ∈ Y . Funkcie h: X × Y → K tvaru h = f ⊗ g, kde f : X → K, g: Y → K, nazývame rozložiteľné. Uvedomme si, že zďaleka nie každá funkcia h ∈ KX×Y je rozložiteľná, t. j. pripúšťa separáciu premenných h(x, y) = f(x)g(y) pre nejaké funkcie f ∈ KX , g ∈ KY . Tenzorovým súčinom lineárnych podpriestorov U ⊆ KX , V ⊆ KY nazývame lineárny podpriestor U ⊗ V vektorového priestoru KX×Y generovaný všetkými funkciami f ⊗ g, kde f ∈ U, g ∈ V . Teda tenzorový súčin U ⊗ V je tvorený všetkými súčtami tvaru (f1 ⊗g1)+. . .+(fn ⊗gn), kde f1, . . . , fn ∈ U, g1, . . . , gn ∈ V . Tento fakt sa zakladá na pozorovaní, že pre a ∈ K a f ∈ KX , g ∈ KY platí a(f ⊗ g) = (af) ⊗ g = f ⊗ (ag). 32.2. Tenzorový súčin 739 Navyše pre f, f1, f2 ∈ KX , g, g1, g2 ∈ KY máme f ⊗ (g1 + g2) = (f ⊗ g1) + (f ⊗ g2), (f1 + f2) ⊗ g = (f1 ⊗ g) + (f2 ⊗ g). Takže môžeme zhrnúť: 32.2.1. Tvrdenie. Operácia tenzorového súčinu funkcií (f, g) → f ⊗ g je bilineárne zobrazenie KX × KY → KX×Y . Pre funkcie f : X → K, g: Y → K, h: Z → K a prvky x ∈ X, y ∈ Y , z ∈ Z zrejme platí (f ⊗ g)(x, y) = f(x)g(y) = (g ⊗ f)(y, x), (f ⊗ (g ⊗ h)(x, (y, z)) = f(x)g(y)h(z) = ((f ⊗ g) ⊗ h)((x, y), z). Pre ľubovoľné lineárne podpriestory U ⊆ KX , V ⊆ KY , W ⊆ KZ tak dostávame prirodzené izomorfizmy U ⊗ V ∼= V ⊗ U, U ⊗ (V ⊗ W) ∼= (U ⊗ V ) ⊗ W, ktoré interpretujeme ako komutatívnosť a asociatívnosť tenzorového súčinu priestorov. K nim sa druží ešte distributívnosť: pre lineárne podpriestory U1, U2 ⊆ KX , V ⊆ KY bilineárnosť tenzorového súčinu funkcií má za následok priamo rovnosť lineárnych podpriestorov (U1 + U2) ⊗ V = (U1 ⊗ V ) + (U2 ⊗ V ), pričom súčet vpravo je priamy práve vtedy, keď U1 + U2 je priamy súčet. Keďže priamy súčin U1×U2 je izomorfný s priamym súčtom svojich lineárnych podpriestorov U1×{0} ∼= U1 a {0}×U2 ∼= U2, vyplýva z toho aj distributivita tenzorového súčinu voči priamemu súčinu: (U1 × U2) ⊗ V ∼= (U1 ⊗ V ) × (U2 ⊗ V ). Najdôležitejšia z uvedených vlastností je asociatívnosť, ktorá nám umožňuje vynechávať zátvorky vo viacnásobných tenzorových súčinoch a stotožniť tenzorový súčin V1 ⊗ . . . ⊗ Vn (s ľubovoľným rozmiestnením zátvoriek) lineárnych podpriestorov Vi ⊆ KXi s lineárnym podpriestorom v KX1×...×Xn generovaným všetkými funkciami tvaru f1 ⊗ . . . ⊗ fn, kde fi ∈ Vi. 32.2.2. Tvrdenie. Ak U ⊆ KX a V ⊆ KY sú konečnorozmerné lineárne podpriestory s bázami ααα = (uuu1, . . . ,uuum) resp. βββ = (vvv1, . . . ,vvvn), tak systém mn vektorov ααα ⊗ βββ =     uuu1 ⊗ vvv1, uuu1 ⊗ vvv2, . . . uuu1 ⊗ vvvn, uuu2 ⊗ vvv1, uuu2 ⊗ vvv2, . . . uuu2 ⊗ vvvn, ... ... ... ... uuum ⊗ vvv1, uuum ⊗ vvv2, . . . uuum ⊗ vvvn     740 32. Úvod do tenzorového počtu tvorí bázu tenzorového súčinu U ⊗ V . Preto dim(U ⊗ V ) = dim U · dim V = mn. Dôkaz. To, že uvedené vektory generujú tenzorový súčin U ⊗ V , je triviálne. Dokážeme, že sú lineárne nezávislé. Nech cij ∈ K sú skaláry také, že i,j cij (uuui ⊗ vvvj) = 0. Uvedomme si, že uuui : X → K, vvvj : Y → K sú funkcie, takže uvedená rovnosť znamená, že pre všetky x ∈ X, y ∈ Y platí i,j cij uuui(x)vvvj(y) = i uuui(x) j cij vvvj(y) = 0. Zvoľne pevne nejaké y ∈ Y . Z platnosti poslednej rovnosti pre každé x ∈ X vyplýva i j cij vvvj(y) uuui = 0, a na základe lineárnej nezávislosti vektorov uuu1, . . . ,uuum j cij vvvj(y) = 0 pre každé i. Nakoľko y ∈ Y sme zvolili ľubovoľne, vyplýva z toho j cij vvvj = 0. Keďže aj vektory vvv1, . . . ,vvvn sú lineárne nezávislé, konečne dostávame cij = 0 pre všetky i, j. Uvažujme teraz ľubovoľné vektorové priestory U a V nad poľom K. Ich duály U∗ , V ∗ tvoria lineárne podpriestory priestorov funkcií KU resp. KV . Teda tenzorový súčin U∗ ⊗ V ∗ je dobre definovaný. 32.2.3. Tvrdenie. Pre ľubovoľné lineárne funkcionály η ∈ U∗ , ϑ ∈ V ∗ je ich tenzorový súčin η ⊗ ϑ: U × V → K bilineárna forma na vektorových priestoroch U, V . Ak U a V sú konečnorozmerné, tak ich tenzorový súčin U∗ ⊗ V ∗ splýva s vektorovým priestorom L2(U, V, K) všetkých bilineárnych foriem U × V → K. 32.2. Tenzorový súčin 741 Dôkaz. Prvé tvrdenie možno overiť priamym výpočtom, ktorý vynecháme. Zostáva dokázať, že každú bilineárnu formu F : U × V → K na konečnorozmerných priestoroch U, V možno vyjadriť v tvare súčtu F = (η1 ⊗ ϑ1 ) + . . . + (ηk ⊗ ϑk ), pre vhodné lineárne formy ηi ∈ U∗ , ϑi ∈ V ∗ . Nech ααα = (uuu1, . . . ,uuum), βββ = (vvv1, . . . ,vvvn) sú bázy priestorov U resp. V a ααα∗ = (uuu1 , . . . ,uuum ), βββ∗ = (vvv1 , . . . ,vvvn ) sú k nim duálne bázy. Položme Aij = F(uuui,vvvj); potom AAA = (Aij)m×n je matica formy F vzhľadom na bázy ααα, βββ a pre všetky xxx ∈ U, yyy ∈ V platí F(xxx,yyy) = i,j Aijuuui (xxx)vvvj (yyy) = i,j Aij(uuui ⊗ vvvj )(xxx,yyy) (pozri paragraf 11.1). To znamená, že F = i,j Aij(uuui ⊗ vvvj ). Tým sme dokázali ešte jeden výsledok. 32.2.4. Tvrdenie. Nech U, V sú konečnorozmerné vektorové priestory s bázami ααα = (uuu1, . . . ,uuum) resp. βββ = (vvv1, . . . ,vvvn) a F : U × V → K je bilineárna forma. Potom súradnice formy F ∈ U∗ × V ∗ vzhľadom na tenzorový súčin duálnych báz ααα∗ ⊗ βββ∗ tvoria prvky Aij = F(uuui,vvvj) matice [F]ααα,βββ formy F vzhľadom na bázy ααα, βββ. Zatiaľ máme definovaný tenzorový súčin pre vektorové priestory funkcií, pod ktoré spadajú aj duály ľubovoľných vektorových priestorov. Chýba nám však definícia tenzorového súčinu pre abstraktné vektorové priestory. Našťastie môžeme každý konečnorozmerný vektorový priestor V stotožniť s jeho druhým duálom V ∗∗ , prípadne nekonečnorozmerný priestor V vnoriť do V ∗∗ . V oboch prípadoch sa teda na V môžeme dívať ako na lineárny podpriestor priestoru funkcií KV ∗ . Nech U a V sú vektorové priestory nad poľom K. Podľa predchádzajúcej definície tenzorový súčin vektorov uuu ∈ U, vvv ∈ V je bilineárna forma uuu ⊗ vvv: U∗ × V ∗ → K daná predpisom (uuu ⊗ vvv)(η, ϑ) = uuu(η)vvv(ϑ) = η(uuu)ϑ(vvv) = (η ⊗ ϑ)(uuu,vvv) pre η ∈ V ∗ , ϑ ∈ U∗ . Tenzorový súčin U ⊗ V vektorových priestorov U a V je lineárny podpriestor priestoru KU∗×V ∗ generovaný všetkými bilineárnymi formami uuu ⊗ vvv, kde uuu ∈ U, vvv ∈ V . 742 32. Úvod do tenzorového počtu Pre vektorové priestory funkcií U ⊆ KX , V ⊆ KY však teraz máme dve definície tenzorového súčinu: pôvodnú definíciu a novú definíciu, v ktorej vystupujú ako vektorové priestory funkcií U ⊆ KU∗ , V ⊆ KV ∗ . Patrilo by sa ukázať, že „oba tenzorové súčiny U ⊗ V sú izomorfné. Na chvíľu teda budeme pre ten neskôr definovaný používať znak . Kľúčovým momentom celého dôkazu bude pozorovanie, že dosadenie ľubovoľného prvku x ∈ X do funkcie f ∈ U, t. j. priradenie f → f(x), definuje lineárnu formu σx : U → K, pomocou ktorej možno množinu X stotožniť s množinou {σx ; x ∈ X} ⊆ U∗ . Podobne možno Y stotožniť s množinou {σy ; y ∈ Y } ⊆ V ∗ . Najprv si však treba vyjasniť, kedy sa dva prvky (f1 ⊗g1)+. . .+(fn ⊗gn), (f1 ⊗ g1) + . . . + (fm ⊗ gm) pôvodného tenzorového súčinu KX ⊗KY rovnajú. To platí vtedy a len vtedy, keď ich rovnosť možno (v konečnom počte krokov) odvodiť z vlastností bilinearity operácie tenzorového súčinu. Presnejšie to vystihuje nasledujúce tvrdenie, podľa ktorého o rovnosti takých výrazov rozhodujú lineárne resp. bilineárne formy. Zrejme stačí vedieť, kedy platí (f1 ⊗g1)+. . .+(fn ⊗gn) = 0. Vyslovíme celý rad podmienok ekvivalentných s touto rovnosťou. 32.2.5. Tvrdenie. Nech U ⊆ KX , V ⊆ KY sú lineárne podpriestory, f1, . . . , fn ∈ U, g1, . . . , gn ∈ V sú ľubovoľné funkcie a U0 = [f1, . . . , fn] ⊆ U, V0 = [g1, . . . , gn] ⊆ V sú ich lineárne obaly. Potom nasledujúce podmienky sú ekvivalentné: (i) (f1 ⊗ g1) + . . . + (fn ⊗ gn) = 0; (ii) η(f1)ϑ(g1) + . . . + η(fn)ϑ(gn) = 0 pre všetky lineárne formy η ∈ U∗ 0 , ϑ ∈ V ∗ 0 ; (iii) η(f1)ϑ(g1) + . . . + η(fn)ϑ(gn) = 0 pre všetky lineárne formy η ∈ U∗ , ϑ ∈ V ∗ ; (iv) F(f1, g1) + . . . + F(fn, gn) = 0 pre všetky bilineárne formy F : U0 × V0 → K; (v) F(f1, g1) + . . . + F(fn, gn) = 0 pre všetky bilineárne formy F : U × V → K; (vi) H(f1, g1) + . . . + H(fn, gn) = 0 pre ľubovoľný vektorový priestor W a bilineárne zobrazenie H : U0×V0 → W; (vii) H(f1, g1) + . . . + H(fn, gn) = 0 pre ľubovoľný vektorový priestor W a bilineárne zobrazenie H : U ×V → W. Dôkaz vykonáme podľa schémy (i) ⇒ (ii) ⇒ (iv) ⇒ (vi) ⇒ (vii) ⇒ (v) ⇒ (iii) ⇒ (i). (i) ⇒ (ii) Pre každé x ∈ X je predpisom f → f(x) definovaný lineárny funkcionál σx : U0 → K. Potom pre množinu Ω = {σx ; x ∈ X} ⊆ U∗ 0 zrejme 32.2. Tenzorový súčin 743 platí Ω⊥ = {0}. Nakoľko U0 konečnorozmerný, podľa záverečnej časti tvrdenia 32.1.1 to znamená, že Ω generuje jeho duál U∗ 0 . Keďže i ten je konečnorozmerný, existuje konečná množina X0 ⊆ X taká, že už podmnožina {σx ; x ∈ X0} ⊆ Ω generuje U∗ 0 . Podobne možno nájsť konečnú množinu Y0 ⊆ Y takú, že lineárne formy σy : V0 → K, y ∈ Y0, generujú duál V ∗ 0 . Podľa (i), f1(x)g1(y) + . . . + fn(x)gn(y) = 0 pre všetky x ∈ X, y ∈ Y . Zvoľme ľubovoľné η ∈ U∗ 0 , ϑ ∈ V ∗ 0 . Z vykonaných úvah vyplýva existencia skalárov ax, by ∈ K, pre x ∈ X0, y ∈ Y0, takých že η = x∈X0 axσx a ϑ = y∈Y0 byσy . Potom η(f1)ϑ(g1) + . . . + η(fn)ϑ(gn) = n i=1 x∈X0 axσx (fi) y∈Y0 byσy (gi) = n i=1 x∈X0 axfi(x) y∈Y0 bygi(y) = x∈X0 y∈Y0 axby n i=1 fi(x)gi(y) = 0. (ii) ⇒ (iv) vyplýva z tvrdenia 32.2.3, podľa ktorého každá bilineárna forma na konečnorozmerných priestoroch U0, V0 je súčtom foriem tvaru η ⊗ ϑ, kde η ∈ U∗ 0 , ϑ ∈ V ∗ 0 . (iv) ⇒ (vi) Nech platí (iv) a predpokladajme, že pre nejaké bilineárne zobrazenie H : U0 × V0 → W je www = H(f1, g1) + . . . + H(fn, gn) = 0. Potom existuje lineárny funkcionál ϕ: W → K taký, že ϕ(www) = 0 (pozri cvičenie 6.15). To je však v spore s (iv), lebo predpisom F(f, g) = ϕH(f, g) je definovaná bilineárna forma ϕ ◦ H : U0 × V0 → K. (vi) ⇒ (vii) je triviálne, lebo pre bilineárne zobrazenie H : U × V → W jeho zúženie H (U0 × V0): U0 × V0 → W je opäť bilineárne zobrazenie. Implikácie (vii) ⇒ (v) a (v) ⇒ (iii) sú tak isto triviálne. (iii) ⇒ (i) vyplýva z pozorovania, že pre x ∈ X, y ∈ Y sú priradeniami f → f(x), g → g(y) definované lineárne formy σx : U → K resp. σy : V → K. Potom (f1 ⊗ g1)(x, y) + . . . + (fn ⊗ gn)(x, y) = σx (f1)σy (g1) + . . . + σx (fn)σy (gn) = 0 pre všetky x ∈ X, y ∈ Y . Ešte poznamenajme, že ekvivalenciu podmienok (i)–(v), prípadne aj (vi) a (vii) pre konečnorozmerný vektorový priestor W, možno dokázať aj bez predpokladu existencie Hamelových báz z cvičenia 6.15. 744 32. Úvod do tenzorového počtu 32.2.6. Dôsledok. Nech U ⊆ KX , V ⊆ KY sú vektorové priestory funkcií nad poľom K. Potom priradenie f ⊗ g → f g určuje prirodzený lineárny izomorfizmus ich tenzorových súčinov U ⊗ V → U V . Dôkaz. Vďaka ekvivalencii podmienok (i) a (iii) predchádzajúceho tvrdenia je priradením f ⊗ g → f g dobre definované injektívne lineárne zobrazenie U ⊗ V → U V . Kedže U ⊗ V je generovaný prvkami tvaru f ⊗ g a U V je generovaný prvkami tvaru f g, je to zároveň surjektívne zobrazenie. Odteraz teda nebudeme rozlišovať medzi „konkrétnym tenzorovým súčinom lineárnych podpriestorov funkcií U ⊆ KX , V ⊆ KY a ich „abstraktným tenzorovým súčinom, pri ktorom ich chápeme ako lineárne podpriestory U ⊆ KU∗ , V ⊆ KV ∗ . Oba značíme rovnako U ⊗ V a používame tú reprezentáciu, ktorá sa v danej chvíli lepšie hodí. Ak bude treba zdôrazniť úlohu poľa K, budeme používať označenie U ⊗K V . Najdôležitejšie vlastnosti tenzorového súčinu „abstraktných vektorových priestorov sú zhrnuté v nasledujúcej vete. 32.2.7. Veta. Nech U, V W sú vektorové priestory nad poľom K. Potom (a) operácia tenzorového súčinu (uuu,vvv) → uuu ⊗ vvv je bilineárne zobrazenie U × V → U ⊗ V ; (b) ku každému bilineárnemu zobrazeniu H : U × V → W existuje práve jedno lineárne zobrazenie H : U ⊗ V → W také, že H (uuu ⊗ vvv) = H(uuu,vvv) pre všetky uuu ∈ U, vvv ∈ V ; (c) priradenie H → H je lineárny izomorfizmus L2(U, V, W) → L(U ⊗ V, W); (d) ak U, V sú konečnorozmerné, tak tenzorový súčin U ⊗V splýva s vektorovým priestorom L2(U∗ , V ∗ , K) všetkých bilineárnych foriem F : U∗ × V ∗ → K a pre jeho dimenziu platí dim(U ⊗ V ) = dim U · dim V. Dôkaz. (a) je obsahom tvrdenia 32.2.1. (b) Nech H : U × V → W je bilineárne zobrazenie. Keďže U ⊗ V je generovaný prvkami tvaru uuu ⊗ vvv, každé lineárne zobrazenie U ⊗ V → W je jednoznačne určené svojimi hodnotami na nich. Teda k danému H existuje najviac jedno H , ktoré spĺňa uvedenú podmienku. Presvedčíme sa, že také H naozaj existuje. Problém by mohli robiť jedine prvky uuu1, . . . ,uuun ∈ U, vvv1, . . . ,vvvn ∈ V také, že i(uuui ⊗ vvvi) = 0, ale i H(uuui,vvvi) = 0. To však odporuje implikácii (i) ⇒ (vii) z tvrdenia 32.2.5. 32.2. Tenzorový súčin 745 (c) Injektívnosť aj surjektívnosť zobrazenia H → H je zrejmá. Linearitu možno jednoducho overiť priamym výpočtom. (d) je dôsledkom tvrdení 32.2.2 a 32.2.3. Tvrdenia (a) a (b) hovoria, že priradenie (uuu,vvv) → uuu ⊗ vvv je univerzálne bilineárne zobrazenie na priamom súčine vektorových priestorov U × V : akékoľvek zobrazenie H : U × V → W do tretieho vektorového priestoru W je totiž bilineárne práve vtedy, keď ho možno rozložiť na kompozíciu H(uuu,vvv) = H (uuu ⊗ vvv) tenzorového súčinu ⊗: U × V → U ⊗ V a lineárneho zobrazenia H : U ⊗ V → W. Vďaka (d) (porovnaj tiež s tvrdením 32.2.3) môžeme tenzorový súčin U ⊗V akýchkoľvek vektorových priestorov U, V nad poľom K stručne definovať ako vektorový priestor všetkých bilineárnych foriem U∗ × V ∗ → K na duálnych priestoroch U∗ , V ∗ . Toto je naozaj jedna z obvyklých definícií bežne používaných v matematickej literatúre. Význam tvrdenia (c) sa naplno prejaví až v paragrafe 32.4. Jeden jeho dôsledok však môžeme zaznamenať už teraz. 32.2.8. Dôsledok. Nech U a V sú konečnorozmerné vektorové priestory. Potom duál (U ⊗ V )∗ tenzorového súčinu U ⊗ V je kanonicky izomorfný s tenzorovým súčinom U∗ ⊗ V ∗ duálnych priestorov U∗ a V ∗ . Dôkaz. Podľa 32.2.7 (c) možno každú bilineárnu formu F : U × V → K stotožniť s lineárnym funkcionálom F : U ⊗ V → K. Vďaka tvrdeniu 32.2.3 tak máme U∗ ⊗ V ∗ = L2(U, V, K) ∼= L(U ⊗ V, K) = (U ⊗ V )∗ . V prípade, že K je niektoré z polí R, C, nekonečnorozmerné vektorové priestory U, V sú často vybavené vhodnou topológiou (napr. pochádzajúcou od nejakej normy). Ich duály U∗ , V ∗ , ktoré sa obvykle definujú ako priestory všetkých spojitých lineárnych funkcionálov na príslušnom priestore, sú opäť vybavené prirodzenou topológiou. Tenzorovým súčinom U ⊗ V sa v takom prípade väčšinou rozumie priestor všetkých spojitých bilineárnych foriem U∗ × V ∗ → K. 1 Zvyčajne neplatí, že by množina {uuu ⊗ vvv; uuu ∈ U, vvv ∈ V }, (v algebraickom zmysle) generovala takto definovaný tenzorový súčin U ⊗V , no možno aspoň dokázať, že jej lineárny obal je hustý v U ⊗ V v nejakej „prirodzenej topológii na priestore U ⊗ V , čiže každú bilineárnu formu F ∈ U ⊗ V možno ľubovoľne presne aproximovať formami tvaru konečných 1 Aj konečnorozmerné vektorové priestory nad R alebo C majú svoju prirodzenú topológiu totožnú s obvyklou topológiou v Rn resp. Cn , kde n je dimenzia príslušného priestoru. Nakoľko však všetky lineárne aj bilineárne formy na nich sú automaticky spojité, je požiadavka spojitosti bilineárnych foriem pri definícii tenzorového súčinu konečnorozmerných vektorových priestorov nadbytočná. 746 32. Úvod do tenzorového počtu súčtov m i=1(uuui ⊗ vvvi). My sa však budeme naďalej držať jednotnej čisto algebraickej definície tenzorového súčinu pre akékoľvek vektorové priestory. 32.2.9. Príklad. Tenzorový súčin K[x]⊗K[y] priestorov polynómov jednej premennej x resp. y v dôsledku rovnosti xm ⊗yn = xm yn splýva s priestorom K[x, y] polynómov dvoch (komutujúcich) premenných x a y. 32.2.10. Príklad. Na druhej strane tenzorový súčin C(R) ⊗ C(R) dvoch exemplárov vektorového priestoru všetkých spojitých funkcií R → R s priestorom C(R×R) všetkých spojitých funkcií R×R → R nesplýva, no je v ňom hustý v tom zmysle, že pre každú spojitú funkciu h ∈ C(R × R), ε > 0 a ľubovoľné intervaly a, b , c, d existujú funkcie f1, g1, . . . , fk, gk ∈ C(R) také, že pre všetky x ∈ a, b , y ∈ c, d platí 2 |f1(x)g1(y) + . . . + fk(x)gk(y) − h(x, y)| < ε. To sa využíva pri riešení diferenciálnych rovníc. V tom najjednoduchšom prípade možno pri dostatočne presnej aproximácii funkcie h(x, t) ≈ f1(x)g1(t) + . . . + fk(x)gk(t) na dostatočne veľkom dvojrozmernom intervale a, b × c, d aproximovať riešenie diferenciálnej rovnice x (t) = h(x(t), t) s ľubovoľnou presnosťou a na ľubovoľne veľkom intervale súčtom x(t) ≈ x1(t) + . . . + xk(t) riešení dielčích rovníc xi(t) = fi(xi(t))gi(t). Tie sa riešia ľahko zapamätateľnou metódou separácie premenných: dx dt = f(x)g(t), dx f(x) = g(t) dt, dx f(x) = g(t) dt, Φ(x) = G(t) + C, x(t) = Φ−1 (G(t) + C), kde G je primitívna funkcia k funkcii g, Φ je primitívna funkcia k funkcii 1/f, Φ−1 je k nej inverzná funkcia a C je integračná konštanta, ktorú možno stanoviť na základe prípadnej počiatočnej podmienky x(t0) = x0. Detaily však v konkrétnych prípadoch môžu byť trochu zložitejšie, než prezrádza náš zbežný náčrt. 2 Ide o hustotu vzhľadom na tzv. topológiu rovnomernej konvergencie na kompaktoch, nazývanú tiež kompaktno-otvorená topológia. 32.3. Zdvih poľa skalárov 747 32.3 Zdvih poľa skalárov Pomocou tenzorových súčinov možno jednoducho popísať konštrukciu nazývanú zdvihom poľa skalárov, ktorou z vektorového priestoru nad poľom K dostaneme vektorový priestor nad jeho rozšírením L. Špeciálnym prípadom tejto konštrukcie je komplexifikácia reálneho vektorového priestoru z paragrafu 19.4. Nech pole L je rozšírením poľa K a V je vektorový priestor nad K. Potom aj L môžeme považovať za vektorový priestor nad poľom K a vytvoriť tenzorový súčin L ⊗K V . Ten je, samozrejme, vektorovým priestorom nad K, no jednoducho z neho možno vyrobiť vektorový priestor nad L. Stačí zadefinovať násobenie rozložiteľných prvkov c ⊗ xxx ∈ L ⊗ V skalármi b ∈ L rovnosťou b(c ⊗ xxx) = bc ⊗ xxx. Výsledný vektorový priestor nad L značíme tiež V L = L ⊗K V a nazývame zdvihom poľa skalárov vektorového priestoru V z K na L. na pole L. Pre dimenzie priestoru L ⊗K V platí dimK(L ⊗K V ) = [L : K] dimK V, dimL(L ⊗K V ) = dimK V. Prípad nekonečného rozšírenia je triválny. Ak [L : K] = m a ααα = (u1 = 1, u2, . . . , um) je báza L ako vektorového priestoru nad K, tak L ⊗K V je tvorený všetkými súčtami tvaru (u1 ⊗ xxx1) + (u2 ⊗ xxx2) + . . . + (um ⊗ xxxm), kde xxx1,xxx2, . . . ,xxxm ∈ V , čo možno zjednodušene zapísať ako lineárnu kombi- náciu xxx1 + u2xxx2 + . . . + umxxxm, pričom pre dva takéto výrazy platí xxx1 + u2xxx2 + . . . + umxxxm = yyy1 + u2yyy2 + . . . + umyyym ⇔ xxx1 = yyy1 & . . . & xxxm = yyym a ich súčet je definovaný zrejmým spôsobom po zložkách. Pre K = R, L = C s bázou (1, i) v tom čitateľ určite spozná reprezentáciu vektorov komplexifikácie V C = C ⊗R V v tvare xxx + iyyy, kde xxx,yyy ∈ V . Ak βββ = (vvv1, . . . ,vvvn) je báza V , tak βββ je zároveň bázou V L ako vektorového priestoru nad poľom L; jeho bázu ako vektorového priestoru nad K podľa tvrdenia 32.2.2 tvoria všetky vektory ui ⊗ vvvj = uivvvj systému ααα ⊗ βββ. Pole L možno zároveň chápať ako asociatívnu lineárnu algebru nad poľom K (pozri paragraf 30.1). Označme γk ij ∈ K štruktúrne konštanty algebry 748 32. Úvod do tenzorového počtu L vzhľadom na bázu ααα. To znamená, že pre všetky i, j ≤ m platí uiuj = m k=1 γk ijuk. Vyjadrenie násobku všeobecného skalára a1 +a2u2 +. . .+amum ∈ L, ai ∈ K, a všeobecného vektora xxx1 + u2xxx2 + . . . + umxxxm ∈ V L , xxxj ∈ V , pomocou štruktúrnych konštánt možno na prvý pohľad vyzerá trochu zložito: (a1 + a2u2 + . . . + amum)(xxx1 + u2xxx2 + . . . + umxxxm) = i,j aiuiujxxxj = i,j k γk ijuk aixxxj = k uk i,j γk ijaixxxj. Čitateľ by si mal preto samostatne overiť, že pre komplexifikáciu reálneho vektorového priestoru dáva táto formula presne to, čo sa od nej očakáva. 32.4 Priestory (multi)lineárnych zobrazení Pomocou konštrukcií duálu a tenzorového súčinu možno jednotným spôsobom popísať vektorové priestory lineárnych a multilineárnych zobrazení. Najprv si pripomeňme označenie Ln(V1, . . . , Vn, W) vektorového priestoru všetkých n-lineárnych zobrazení V1 × . . . × Vn → W, ktoré sme zaviedli v cvičení 10.2. Teda špeciálne L1(V, W) = L(V, W) a L2(U, V, W) je priestor všetkých bilineárnych zobrazení U × V → W. Pre úplnosť ešte kladieme L0(W) = W. Multilineárne zobrazenia V1 × . . . × Vn → K nazývame tiež multilineárnymi formami. Uvedomme si, že na funkciu dvoch premenných F : X ×Y → Z sa možno dívať aj ako na funkciu F : X → ZY , ktorá predpisom Fx(y) = F(x, y) priradí prvku x ∈ X funkciu Fx : Y → Z. Naopak, každú funkciu G: X → ZY možno chápať aj ako funkciu dvoch premenných G: X × Y → Z takú, že G(x, y) = G(x)(y) pre x ∈ X, y ∈ Y . Tým sú popísané dve prirodzené navzájom inverzné bijekcie medzi množinami funkcií ZX×Y a ZY X , prostredníctvom ktorých ich možno priamo stotožniť. Niečo podobné funguje aj pre lineárne a multilineárne zobrazenia medzi vektorovými priestormi. Každé bilineárne zobrazenie H : U × V → W určuje priradením uuu → Huuu = H(uuu, ·) lineárne zobrazenie H : U → L(V, W), ktoré umožňuje prirodzene stotožniť priestory L2(U, V, W) a L(U, L(V, W)). Konečnorozmerné vektorové priestory V a W možno navyše prirodzene stotožniť s ich druhými duálmi V ∗∗ resp. W∗∗ , čím dostávame ďalšie kanonické izomorfizmy L(V, W) ∼= L(V, W∗∗ ) = L(V, L(W∗ , K)) ∼= L2(V, W∗ , K) ∼= L2(V ∗∗ , W∗ , K) ∼= V ∗ ⊗ W. 32.4. Priestory (multi)lineárnych zobrazení 749 Tento výsledok stojí za zaznamenanie. 32.4.1. Tvrdenie. Nech V , W sú konečnorozmerné vektorové priestory. Potom vektorový priestor L(V, W) všetkých lineárnych zobrazení V → W je kanonicky izomorfný s tenzorovým súčinom V ∗ ⊗ W. Kanonický izomorfizmus L(V, W) → V ∗ ⊗ W možno popísať aj priamo. Lineárne zobrazenie ϕ: V → W sa v ňom zobrazí na (rovnako značenú) bilineárnu formu ϕ: V ×W∗ → K (t. j. prvok priestoru V ∗ ⊗W) danú predpisom ϕ(xxx, ϑ) = ϑ(ϕxxx) = (ϑ ◦ ϕ)(xxx) pre xxx ∈ V , ϑ ∈ W∗ . Nech βββ = (vvv1, . . . ,vvvn), γγγ = (www1, . . . ,wwwk) sú bázy priestorov V resp. W a βββ∗ = (vvv1 , . . . ,vvvn ), γγγ∗ = (www1 , . . . ,wwwk ) sú k nim duálne bázy. Potom súradnice bilineárnej formy ϕ vzhľadom na bázu βββ∗ ⊗ γγγ = (vvvj ⊗ wwwi) priestoru V ∗ ⊗ W tvoria podľa tvrdenia 32.2.4 skaláry Ai j = ϕ(vvvj,wwwi ) = wwwi (ϕvvvj), čiže prvky matice AAA = (Ai j) = (ϕ)γγγ,βββ lineárneho zobrazenia ϕ: V → W. Samotné ϕ teda možno vyjadriť ako lineárnu kombináciu ϕ = i,j Ai j(vvvj ⊗ wwwi). Podľa (b) a (c) vety 32.2.7 stotožňujeme bilineárne zobrazenie H : U × V → W s lineárnym zobrazením H : U ⊗ V → W a následne aj vektorové priestory L2(U, V, W) a L(U ⊗ V, W). V konečnorozmernom prípade je ten druhý podľa tvrdenia 32.4.1 kanonicky izomorfný s tenzorovým súčinom (U ⊗ V )∗ ⊗ W, a podľa dôsledku 32.2.8 tiež s tenzorovým súčinom U∗ ⊗ V ∗ ⊗ W. Situáciu možno indukciou zovšeobecniť na ľubovoľný konečný počet činiteľov. 32.4.2. Veta. Nech V1, . . . , Vm a W sú konečnorozmerné vektorové priestory. Potom priestor Lm(V1, . . . , Vm, W) všetkých m-lineárnych zobrazení V1 × . . . × Vm → W je kanonicky izomorfný s tenzorovým súčinom V ∗ 1 ⊗ . . . ⊗ V ∗ m ⊗ W. Explicitne stotožňujeme m-lineárne zobrazenie H : V1 × . . . × Vm → W s lineárnym funkcionálom H : V1 ⊗ . . . ⊗ Vm ⊗ W∗ → K (t. j. prvkom duálu (V1 ⊗ . . . ⊗ Vm ⊗ W∗ )∗ , ako aj s (m + 1)-lineárnou formou H : V1 × . . . × Vm × W∗ → K (t. j. prvkom tenzorového súčinu V ∗ 1 ⊗ . . . ⊗ V ∗ m ⊗ W) takými, že H(xxx1 ⊗ . . . ⊗ xxxm ⊗ ϑ) = H(xxx1, . . . ,xxxm, ϑ) = ϑH(xxx1, . . . ,xxxm) = (ϑ ◦ H)(xxx1, . . . ,xxxm) 750 32. Úvod do tenzorového počtu pre xxx1 ∈ V1, . . . , xxxm ∈ Vm, ϑ ∈ W∗ . Vo všeobecnosti môžeme uvažovať tenzorové súčiny tvaru V1 ⊗ . . . ⊗ Vp ⊗ V ∗ p+1 ⊗ . . . ⊗ V ∗ p+q vektorových priestorov Vi resp. ich duálov V ∗ i . My sa však ďalej obmedzíme na prípad, keď všetky priestory Vi sú inštanciami jedného a toho istého konečnorozmerného vektorového priestoru V . 32.5 Tenzory nad vektorovým priestorom Nad každým konečnorozmerným vektorovým priestorom V možno pomocou konštrukcií duálu a tenzorového súčinu vybudovať rozvetvenú štruktúru ďalších vektorových priestorov. Ľubovoľnú (p + q)-lineárnu formu T : V ∗ × . . . × V ∗ p × V × . . . × V q → K, nazývame tenzorom typu p q nad vektorovým priestorom V . Skaláry, t. j. prvky poľa K, považujeme za tenzory typu 0 0 . Číslo p+q nazývame stupňom tenzora T. 3 Tenzor typu p q je tak prvkom tenzorového súčinu T p q (V ) = V ⊗ . . . ⊗ V p ⊗ V ∗ ⊗ . . . ⊗ V ∗ q p exemplárov vektorového priestoru V a q exemplárov jeho duálu V ∗ . T p q (V ) nazývame priestorom tenzorov typu p q nad vektorovým priestorom V . Špeciálne pre p = q = 0 kladieme T 0 0 (V ) = K. Hovoríme, že T ∈ T p q (V ) je rozložiteľný tenzor, ak má tvar T = xxx1 ⊗ . . . ⊗ xxxp ⊗ η1 ⊗ . . . ⊗ ηq pre nejaké vektory xxx1, . . . ,xxxp ∈ V a kovektory η1, . . . , ηq ∈ V ∗ ; ostatné tenzory sa nazývajú nerozložiteľné. Priestor tenzorov T p q (V ) teda pozostáva z lineárnych kombinácií rozložiteľných tenzorov. Poznamenajme, že v prípade vektorových priestorov nad poľom komplexných čísel je namieste zaviesť a študovať aj tenzory typu p,r q,s , čiže formy T : V ∗ × . . . × V ∗ p × V × . . . × V q × V ∗ × . . . × V ∗ r × V × . . . × V s → C 3 Značenie ani terminológia nie sú v tejto záležitosti jednotné. To, čo sme práve nazvali tenzorom typu p q , sa niekde nazýva tenzorom typu (p, q) a inde zasa tenzorom typu (q, p). Tenzor stupňa m sa zvykne tiež nazývať m-valentný tenzor, prípadne tenzor rádu alebo rangu m. 32.5. Tenzory nad vektorovým priestorom 751 lineárne v prvých p + q argumentoch a semilineárne v ďalších r + s argumentoch. Vektorový priestor takýchto foriem možno opísať ako tenzorový súčin T p,r q,s (V ) = T p q (V ) ⊗ T r s (V ) = V ⊗ . . . ⊗ V p ⊗ V ∗ ⊗ . . . ⊗ V ∗ q ⊗ V ⊗ . . . ⊗ V r ⊗ V ∗ ⊗ . . . ⊗ V ∗ s , kde V označuje vektorový priestor V , v ktorom bola pôvodná operácia skalárneho násobku nahradená operáciou násobku konjugovaným skalárom (c,xxx) → cxxx. Napríklad každá poldruhalineárna forma F : V × V → C je ako tenzor prvkom tenzorového súčinu T 0,0 1,1 (V ) = V ∗ ⊗ V ∗ . Priestormi tenzorov tohto druhu sa však podrobnejšie zaoberať nebudeme. Podľa vety 32.4.2 je priestor T p q (V ) kanonicky izomorfný s ďalšími priestormi (multi)lineárnych zobrazení T p q (V ) = T p 0 (V ) ⊗ T q 0 (V ∗ ) = T p 0 (V ) ⊗ T 0 q (V ) = Lp+q(V ∗ , . . . , V ∗ p , V, . . . , V q , K) ∼= L(V ∗ ⊗ . . . ⊗ V ∗ p ⊗ V ⊗ . . . ⊗ V q , K) = T q p (V ∗ ) = T q p (V )∗ ∼= L(V ⊗ . . . ⊗ V q , V ⊗ . . . ⊗ V )p = L T q 0 (V ), T p 0 (V ) . Tenzor T ∈ T p q (V ) preto môžeme podľa potreby považovať tak za lineárny funkcionál T : V ∗ ⊗ . . . ⊗ V ∗ p ⊗ V ⊗ . . . ⊗ V q → K, čiže T : T q p (V ) → K, ako aj za lineárne zobrazenie T : V ⊗ . . . ⊗ V q → V ⊗ . . . ⊗ V p , t. j. T : T q 0 (V ) → T p 0 (V ). 32.5.1. Veta. Nech dim V = n. Potom dim T p q (V ) = np+q . Dôkaz vety je vedľajším produktom nasledujúcej úvahy. Ak ααα = (uuu1, . . . ,uuun) je nejaká báza priestoru V a ααα∗ = (uuu1 , . . . ,uuun ) je k nej duálna báza, tak bázu priestoru T p q (V ) tvoria v dôsledku tvrdenia 32.2.2 tenzory uuui1 ⊗ . . .uuuip ⊗ uuuj1 ⊗ . . .uuujq , 752 32. Úvod do tenzorového počtu kde indexy i1, . . . , ip, j1, . . . , jq nadobúdajú hodnoty od 1 do n. Každý tenzor T ∈ T p q (V ) tak možno vyjadriť ako lineárnu kombináciu T = i1,...,ip j1,...,jq A i1...ip j1...jq uuui1 ⊗ . . . ⊗ uuuip ⊗ uuuj1 ⊗ . . . ⊗ uuujq pre jednoznačne určené koeficienty A i1...ip j1...jq = T uuui1 , . . . ,uuuip ,uuuj1 , . . . ,uuujq ∈ K. Horné, tzv. kontravariantné indexy i1, . . . , ip zodpovedajú v tejto lineárnej kombinácii vektorom uuui1 , . . . ,uuuip ∈ V a dolné, tzv. kovariantné indexy j1, . . . , jq zasa kovektorom uuuj1 , . . . ,uuujq ∈ V ∗ . Pre kovektory η1 , . . . , ηp ∈ V ∗ a vektory xxx1, . . . ,xxxq ∈ V so súradnicami ηk i = ηk ,uuui resp. xj l = xxxl,uuuj (k ≤ p, l ≤ q, i, j ≤ n) vzhľadom na bázu ααα potom platí T η1 , . . . , ηp ,xxx1, . . . ,xxxq = i1,...,ip j1,...,jq A i1...ip j1...jq η1 i1 . . . ηp ip xj1 1 . . . xjq q . Systém koeficientov AAA = A i1...ip j1,...jq , kde každý z indexov ik, jl nadobúda hodnoty od 1 do n, hrá podobnú úlohu ako matica lineárnej transformácie V → V alebo bilineárnej formy V × V → K; nazývame ho súradnicami tenzora T vzhľadom na bázu ααα a značíme AAA = A i1...ip j1...jq = (T)ααα. AAA je naozaj niečo ako „(p+q)-rozmerná matica s p hornými a q dolnými indexmi. Znázorniť si takúto „maticu prehľadne ako tabuľku však pre tenzory stupňa > 2 už nie je ďalej možné – také niečo by si vyžadovalo schopnosť čítať z „(p+q)-rozmerného papiera, čo je úloha, ktorú by mohli zvládnuť leda ak obyvatelia (p + q + 1)-rozmerného priestoru, kde by list takého „papiera predstavoval časť nadroviny. Z toho dôvodu nebudeme ďalej viazať reprezentáciu súradníc tenzorov na „geometriu listu papiera , inak povedané, nebudeme si ich predstavovať ako tabuľky. Potrebnú informáciu budeme fixovať polohou indexov a ich poradím. Napr. obdobou operácie transponovania matice bude zámena poradia dvoch indexov rovnakého typu. Miesto rozlišovania vektorov-stĺpcov a vektorov-riadkov budeme rozlišovať vektory, ktorých súradnice budú mať indexy hore, a kovektory, ktorých súradnice budú mať indexy dole. Naopak, systémy vektorov budeme číslovať dolnými a systémy kovektorov hornými 32.5. Tenzory nad vektorovým priestorom 753 indexmi. Túto dohodu sme už medzičasom začali požívať. Kvôli sprehľadneniu zápisov však prijmeme aj tzv. Einsteinovu konvenciu, ktorá nám umožní vynechávať znaky sumácie . 32.5.2. Einsteinova konvencia o implicitnej sumácii. Vo svete tenzorov sa výrazy „správne sčitujú len cez tzv. sumačné indexy, t. j. indexy, ktoré sa v nich vyskytujú raz v hornej a raz v dolnej polohe. Sumácia cez takéto indexy sa nemusí explicitne vyznačovať znakom . Výsledok sumácie potom závisí iba od zvyšných (t. j. „nesumačných ) tzv. voľných indexov. Zrozumiteľnosť Einsteinovej sumačnej konvencie závisí na kontexte. Bez toho nemusí byť zrejmé či napr. výraz Ai i označuje jeden všeobecný diagonálny prvok matice AAA = Ai j alebo jej stopu trAAA = i Ai i. Celá vec sa stane jasnejšou po niekoľkých známych príkladoch, ktoré si teraz prepíšeme pomocou tejto konvencie. Keďže našim cieľom nie je túto konvenciu systematicky využívať, ale naučiť sa jej rozumieť a používať ju, budeme väčšinou uvádzať oba zápisy – s explicitnou aj s implicitnou sumáciou. 32.5.3. Príklad. (a) Vektory sú tenzory typu 1 0 . Vektor xxx ∈ V so súradnicami (xxx)ααα = (xj ) vzhľadom na bázu ααα = (uuu1, . . . ,uuun) má tvar xxx = j xj uuuj = xj uuuj. (b) Kovektory sú tenzory typu 0 1 . Kovektor η ∈ V so súradnicami (η)ααα = (ηi) možno zapísať aj ako lineárnu kombináciu η = i ηiuuui = ηiuuui . (c) Samotné párovanie · , · je tenzor typu 1 1 , ktorý zodpovedá identickému lineárnemu zobrazeniu idV : V → V so súradnicami (maticou) (idV )ααα = (δi j). Potom idV = i,j δi j uuui ⊗ uuuj = i uuui ⊗ uuui = δi j uuui ⊗ uuuj = uuui ⊗ uuui a η,xxx = i,j δi jηixj = i ηixi = δi jηixj = ηixi . (d) Lineárna transformácia ϕ: V → V je rovnako tenzor typu 1 1 . Jej súradnice (t. j. matica) v báze ααα sú AAA = (ϕ)ααα = (Ai j), kde Ai j = uuui , ϕuuuj . Potom ϕ = i,j Ai j(uuui ⊗ uuuj ) = Ai j(uuui ⊗ uuuj ) 754 32. Úvod do tenzorového počtu a ϕ(η,xxx) = η(ϕxxx) = η, ϕxxx = i,j Ai jηixj = Ai jηixj . Špeciálne pre η = uuui máme ϕ(uuui ,xxx) = uuui (ϕxxx) = uuui , ϕxxx = j Ai jxj = Ai jxj . (e) Bilineárna forma F : V × V → K je tenzor typu 0 2 . Jej súradnice (matica) v báze ααα je AAA = (F)ααα = (Aij), kde Aij = F(uuui,uuuj). Potom F = i,j Aij(uuui ⊗ uuuj ) = Aij(uuui ⊗ uuuj ) a F(xxx,yyy) = i,j Aijxi yj = Aijxi yj pre vektory xxx = xi uuui, yyy = yj uuuj. (f) Konečne všeobecný tenzor T ∈ T p q (V ) so súradnicami AAA = (T)ααα = A i1...ip j1...jq , kde A i1...ip j1...jq = T uuui1 , . . . ,uuuip ,uuuj1 , . . . ,uuujq , má tvar T = i1,...,ip j1,...,jq A i1...ip j1...jq uuui1 ⊗ . . . ⊗ uuuip ⊗ uuuj1 ⊗ . . . ⊗ uuujq = A i1...ip j1...jq uuui1 ⊗ . . . ⊗ uuuip ⊗ uuuj1 ⊗ . . . ⊗ uuujq . Potom pre η1 , . . . , ηp ∈ V ∗ , xxx1, . . . ,xxxq ∈ V máme T η1 , . . . , ηp ,xxx1, . . . ,xxxq = i1,...,ip j1,...,jq A i1...ip j1...jq η1 i1 . . . ηp ip xj1 1 . . . xjq q = A i1...ip j1...jq η1 i1 . . . ηp ip xj1 1 . . . xjq q . Pozrime sa teraz bližšie, ako sa transformujú súradnice tenzora pri zmene bázy. Najprv preskúmame jednoduchšie špeciálne príklady vektorov, kovektorov, bilineárnych foriem a lineárnych zobrazení. 32.5.4. Príklad. Nech ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) sú dve bázy priestoru V a ααα∗ = (uuu1 , . . . ,uuun ) resp. βββ∗ = (vvv1 , . . . ,vvvn ) sú k nim duálne bázy. Označme PPP = PPPααα,βββ = Pi j a QQQ = PPPβββ,ααα = Qi j matice prechodu medzi nimi. Potom QQQ = PPP−1 . 32.5. Tenzory nad vektorovým priestorom 755 (a) Náš doterajší zápis (xxx)ααα = PPPααα,βββ ·(xxx)βββ transformačnej rovnice súradníc vektora xxx ∈ V nadobúda s využitím Einsteinovej sumačnej konvencie podobu uuui (xxx) = j Pi jvvvj (xxx) = Pi jvvvj (xxx). V opačnom smere prebieha zámena súradníc podľa rovnice vvvi (xxx) = j Qi juuuj (xxx) = Qi juuuj (xxx). (b) Pre kovektor η ∈ V ∗ sa pôvodná transformačná rovnica (η)βββ∗ = PPPT ααα,βββ · (η)ααα∗ zapíše takto: vvvi(η) = i Pj i uuuj(η) = Pj i uuuj(η). (c) Transformačný vzťah BBB = PPPT ααα,βββ ·AAA ·PPPααα,βββ medzi maticami AAA = [F]ααα = (Aij), BBB = [F]βββ = (Bkl) bilineárnej formy F : V × V → K vzhľadom na bázy ααα resp. βββ prejde do podoby Bkl = i,j Pi kAijPj l = AijPi kPj l . (d) Konečne transformačný vzťah BBB = PPPβββ,ααα · AAA · PPPααα,βββ medzi maticami AAA = (ϕ)ααα = Ai j , BBB = (ϕ)βββ = Bk l lineárnej transformácie ϕ: V → V vzhľadom na bázy ααα resp. βββ má tvar Bk l = i,j Qk i Ai jPj l = Ai jQk i Pj l . Obzvlášť v poslednom príklade (d) pekne vidno ako sa pri prechode od súradníc v báze ααα k súradniciam v báze βββ dvojica i, k kontravariantných (horných) indexov transformuje prostredníctvom prvku Qk i matice QQQ = PPPβββ,ααα = PPP−1 , teda kontravariantne, kým dvojica j, l kovariantných (dolných) indexov sa transformuje prostredníctvom prvku Pj l matice PPP = PPPααα,βββ, teda kovariantne. Vo všetkých príkladoch nám párovanie horných a dolných sumačných indexov a požiadavka zhody voľných indexov na oboch stranách rovností poskytujú účinný kontrolný prostriedok. S trochou cviku možno transformačné rovnice písať tak povediac mechanicky. Niečo podobné platí aj pre transformáciu súradníc všeobecného tenzora. 32.5.5. Veta. Nech T ∈ T p q (V ) je tenzor typu p q nad n-rozmerným vektorovým priestorom V , AAA = (T)ααα = A i1...ip j1...jq , BBB = (T)βββ = B k1...kp l1...lq sú jeho 756 32. Úvod do tenzorového počtu súradnice v bázach ααα resp. βββ a PPP = PPPααα,βββ = Pi j a QQQ = PPPβββ,ααα = Qi j sú matice prechodu medzi nimi. Potom B k1...kp l1...lq = i1,...,ip j1,...,jq Qk1 i1 . . . Q kp ip A i1...ip j1...jq Pj1 l1 . . . P jq lq = A i1...ip j1...jq Qk1 i1 . . . Q kp ip Pj1 l1 . . . P jq lq . Dôkaz prenechávame ako cvičenie čitateľovi. Tradične sa tenzory vo fyzikálnej, technickej, no i v (najmä staršej) matematickej literatúre chápu ako systémy skalárov T = T i1...ip j1...jq s rôznym počtom horných a dolných indexov. Tenzor je tak stotožňovaný s jeho súradnicami v nejakej, podľa možnosti kanonickej, báze daného vektorového priestoru. Vzápätí je však potrebné dodať, že jeden taký systém skalárov ešte netvorí tenzor – tenzor je totiž až celý systém Tααα takýchto indexovaných systémov skalárov, jeden pre každú bázu ααα priestoru V , ktoré sa (pri označeni Tααα = (T)ααα = AAA, Tβββ = (T)βββ = BBB) transformujú podľa rovnice z vety 32.5.5. Za všetkými jednotlivými súradnicovými reprezentáciami tenzora sa však skrýva jednoznačne určený matematický objekt, ktorý ich drží pohromade. Tým je práve multilineárna forma T : (V ∗ )p × V q → K. Z toho dôvodu dávame v našom kurze prednosť invariantnej, t. j. na jednotlivých bázach nezávislej reprezentácii tenzorov. 32.5.6. Príklad. Násobenie M(xxx,yyy) = xxxyyy v lineárnej algebre A nad poľom K je bilineárne zobrazenie M : A × A → A. To znamená, že M ∈ T 1 2 (A) je tenzor typu 1 2 nad vektorovým priestorom A. Systém štruktúrnych konštánt algebry A vzhľadom na bázu ααα potom nie je nič iné ako súradnice tenzora M v tejto báze, čiže {A}ααα = ak ij = (M)ααα. Ak {A}βββ = bk ij = (M)βββ je systém štruktúrnych konštánt algebry A vzhľadom na druhú bázu βββ, tak bk ij = r,s,t Qk r ar stPs i Pt j = Qk r ar stPs i Pt j kde PPPααα,βββ = Pi j , PPPβββ,ααα = Qi j sú príslušné matice prechodu. Naopak, každý tenzor M ∈ T 1 2 (V ) určuje na vektorovom priestore V štruktúru lineárnej algebry. To znamená, že priestor tenzorov T 1 2 (V ) možno chápať ako vektorový priestor všetkých lineárnych algebier s podkladovým vektorovým priestorom V . 32.6. Operácie na tenzoroch 757 32.6 Operácie na tenzoroch Na priestoroch tenzorov T p q (V ) nad konečnorozmerným vektorovým priestorom V možno zaviesť niekoľko ďalších algebraických operácií. O ich súradnicovej podobe sa niekedy zvykne mierne ironicky hovoriť ako o indexovej gymnastike. 32.6.1. Súčin tenzorov. Súčin S ⊗ T tenzorov S ∈ T p q (V ), T ∈ T r s (V )je tenzor S ⊗ T ∈ T p+r q+s (V ), t. j. multilineárna forma daná predpisom (S ⊗ T)(η1 , . . . , ηp , ϑ1 , . . . , ϑr ,xxx1, . . . ,xxxq,yyy1, . . . ,yyys) = S(η1 , . . . , ηp ,xxx1, . . . ,xxxq) T(ϑ1 , . . . , ϑr ,yyy1, . . . ,yyys) pre η1 , . . . , ηp , ϑ1 , . . . , ϑr ∈ V ∗ , xxx1, . . . ,xxxq,yyy1, . . . ,yyys ∈ V . Pre každú štvoricu prirodzených čísel p, q, r, s je tak určená bilineárna binárna operácia ⊗: T p q (V ) × T r s (V ) → T p+r q+s (V ), indukujúca lineárny izomorfizmus vektorových priestorov T p q (V ) ⊗ T r s (V ) ∼= T p+r q+s (V ). Ak βββ = (vvv1, . . . ,vvvn) je nejaká báza priestoru V , a AAA = A i1...ip j1...jq = (S)βββ, BBB = Bk1...kr l1...ls = (T)βββ sú súradnice tenzorov S resp. T vzhľadom na ňu, tak pre súradnice CCC = C i1...ipk1...kr j1...jql1...ls = (S ⊗ T)βββ tenzora S ⊗ T v báze βββ platí C i1...ip k1...kr j1...jq l1...ls = A i1...ip j1...jq Bk1...kr l1...ls . Píšeme tiež CCC = AAA ⊗ BBB a (p + q + r + s)-rozmernú maticu CCC nazývame tenzorovým súčinom matíc AAA a BBB. Z priestorov tenzorov T p q (V ) jednotlivých typov vytvoríme ich priamy súčet T (V ) = p,q∈N T p q (V ) (pozri cvičenie 6.19). Dielčie tenzorové súčiny ⊗: T p q (V )×T r s (V ) → T p+r q+s (V ) možno potom jednoznačne rozšíriť do bilineárnej binárnej operácie ⊗: T (V ) × T (V ) → T (V ). Výsledný tenzorový súčin ⊗ určuje na nekonečnorozmernom priestore T (V ) štruktúru asociatívnej lineárnej algebry s jednotkou 1 ∈ K = T 0 0 (V ), nazývanej algebrou tenzorov nad vektorovým priestorom V . Algebra T (V ), ⊗ je prirodzene graduovaná do podpriestorov T p q (V ) (pozri paragraf 30.2). Podpriestor kontravariantných tenzorov T0(V ) = p∈N T p 0 (V ) a podpriestor kovariantných tenzorov T 0 (V ) = q∈N T 0 q (V ) tvoria podalgebry tenzorovej 758 32. Úvod do tenzorového počtu algebry T (V ), ktoré sú samy tiež prirodzene graduované. Kým však graduácie podalgebier kontra- resp. kovariantných tenzorov sú indexované prirodzenými číslami, graduácia celej tenzorovej algebry je indexovaná dvojicami čísel p, q ∈ N. 32.6.2. Kontrakcie alebo zovšeobecnené stopy tenzora. Sumácia cez vybraný horný a dolný index určuje lineárne zobrazenie T p q (V ) → T p−1 q−1 (V ) nazývané kontrakciou alebo zúžením alebo tiež zovšeobecnenou stopou. Názornejšie je opísať toto zobrazenie najprv v jeho súradnicovej podobe. Nech n = dim V a p, q ≥ 1, k ≤ p, l ≤ q. Ak AAA = A i1...ip j1...jq je matica nad poľom K s p hornými a q dolnými indexmi nadobúdajúcimi hodnoty od 1 do n, tak maticu BBB s p − 1 hornými a q − 1 dolnými indexmi s jednotlivými zložkami B i1...ip−1 j1...jq−1 = n i=1 A i1...ik−1 i ik...ip−1 j1...jl−1 i jl...jq−1 = A i1...ik−1 i ik...ip−1 j1...jl−1 i jl...jq−1 nazývame kontrakciou, prípadne zúžením alebo zovšeobecnenou stopou matice AAA podľa k-teho horného a l-tého dolného indexu; píšeme BBB = trk l AAA. (Uvedená formula si vyžaduje miernu modifikáciu, ak sa niektorý z indexov ik, jl nachádza v krajnej polohe – to však prenechávame čitateľovi.) Zrejme pre dvojrozmernú maticu AAA = (Ai j) kontrakcia tr1 1 AAA = i Ai i = Ai i splýva s jej „obyčajnou stopou trAAA. Obvyklý súčin dvojrozmerných matíc AAA = Ai j , BBB = Bj k možno vyjadriť ako kontrakciu ich tenzorového súčinu AAA · BBB = tr2 1(AAA ⊗ BBB). Podobne možno pomocou kontrakcií a tenzorového súčinu vyjadriť hodnotu bilineárnej formy F(xxx,yyy) = Aijxi yj na Kn : F(xxx,yyy) = tr12 12(AAA ⊗ xxx ⊗ yyy) = tr1 1 ◦ tr2 2 AAA ⊗ (xxx ⊗ yyy) . Presvedčte sa o jednom i druhom rozpisom do jednotlivých zložiek. Ak AAA = (T)βββ je matica súradníc tenzora T ∈ T p q (V ) v báze βββ = (vvv1, . . . ,vvvn) priestoru V , tak jej kontrakcia trk l AAA tvorí súradnice tenzora trk l T ∈ T p−1 q−1 (V ) v tej istej báze. Tento tenzor ako multilineárna forma funguje podľa predpisu trk l T η1 , . . . , ηp−1 ,xxx1, . . . ,xxxq−1 = n i=1 T η1 , . . . , ηk−1 ,vvvi , ηk , . . . , ηp−1 ,xxx1, . . . ,xxxl−1,vvvi,xxxl, . . . ,xxxq−1 pre η1 , . . . , ηp−1 ∈ V ∗ , xxx1, . . . ,xxxq−1 ∈ V . Presvedčte sa o tom samostatne a dokážte, že multilineárna forma trk l T ∈ T p−1 q−1 (V ) nezávisí na báze βββ. 32.7. Tenzory v (pseudo)euklidovských priestoroch 759 32.6.3. Permutácie indexov. Ľubovoľná dvojica permutácií množiny {1, . . . , p} a σ množiny {1, . . . , q} indukuje lineárny izomorfizmus T → Tσ : T p q (V ) → T p q (V ), daný predpisom Tσ η1 , . . . , ηp ,xxx1, . . . ,xxxq = T η (1) , . . . , η (p) ,xxxσ(1), . . . ,xxxσ(q) pre T ∈ T p q (V ) a η1 , . . . , ηp ∈ V ∗ , xxx1, . . . ,xxxq ∈ V . Inak povedané, poradie kovektorových argumentov ηk poprehadzujeme permutáciou a poradie vektorových argumentov xxxl permutáciou σ. Znak identickej permutácie ι (či už na množine {1, . . . , p} alebo {1, . . . , q}) nepíšeme, teda Tσ = Tι σ a T = Tι . Ak matica AAA = A i1...ip j1...jq tvorí súradnice tenzora T ∈ T p q (V ) v báze βββ priestoru V , tak zložky matice AAAρ σ = BBB = B i1...ip j1...jq súradníc tenzora Tσ v tejto báze sú dané rovnosťou B i1...ip j1...jq = A i (1)...i (p) jσ(1)...jσ(q) . To znamená, že poradie horných indexov je poprehadzované permutáciou a poradie dolných indexov permutáciou σ. 32.7 Tenzory v (pseudo)euklidovských priestoroch Predpokladajme, že V je konečnorozmerný vektorový priestor nad poľom R s bázou βββ = (vvv1, . . . ,vvvn) a G: V × V → R je symetrická regulárna bilineárna forma na V s Gramovou maticou [G]βββ = ggg = (gij), kde gij = G(vvvi,vvvj). Teda V je euklidovský alebo pseudoeuklidovský priestor a G je skalárny resp. pseudoskalárny súčin na V (navyše bez ujmy na všeobecnosti môžeme predpokladať, že G nie je záporne definitná). Formu G obvykle nazývame metrický prípadne pseudometrický tenzor. Hoci prípad poľa R je najdôležitejší, väčšina úvah z tohto paragrafu si zachováva platnosť v konečnorozmerných vektorových priestoroch nad ľubovoľným poľom K vybavených symetrickou regulárnou bilineárnou formou G: V × V → K. V prostredí takýchto priestorov možno indexovú gymnastiku obohatiť o ďalší súbor cvikov. Každý vektor xxx ∈ V totiž určuje lineárnu formu (kovektor) ↓xxx ∈ V ∗ predpisom (↓xxx)(yyy) = G(xxx,yyy) pre yyy ∈ V . Naopak, každý kovektor η ∈ V ∗ má tvar η = ↓ xxx pre j ednoznačne určený vektor xxx = ↑ η. Priestor V tak možno stotožniť s jeho duálom V ∗ prostredníctvom dvojice navzájom inverzných lineárnych izomorfizmov xxx → ↓xxx, η → ↑η. V súradniciach funguje izomorfizmus xxx → ↓xxx ako spustenie indexu (čo je aj dôvod pre jeho označenie šípkou ↓): Ak (xxx)βββ = (xi ), tak (↓xxx)βββ = (xj), kde xj = i gijxi = gijxi . 760 32. Úvod do tenzorového počtu V opačnom smere ide o zdvih indexu xi = j gij xj = gij xj, kde gijgjk = δk i , čiže gjk = ggg−1 je inverzná matica k matici ggg. Systémy skalárov (xi ), (xj) sa niekedy nazývajú kontravariantné resp. kovariantné súradnice (toho istého kontravariantného) vektora xxx. Rovnako možno popísať aj súradnicovú podobu izomorfizmu η → ↑ η, ktorá sa opäť prejaví zdvihom indexu: Ak (η)βββ = (ηj), tak (↑η)βββ = (ηi ), kde ηi = j gij ηj = gij ηj. V opačnom smere ide o spustenie indexu ηj = i gijηi = gijηi . Systémy skalárov (ηj), (ηi ) sa zvyknú nazývať kovariantné resp. kontravariantné súradnice kovektora η. Tým sa otvára možnosť voľného prechodu oboma smermi medzi vektormi a kovektormi. Ak (V, G) je euklidovský priestor a báza βββ je navyše ortonormálna, t. j. gij = δij, tak aj gjk = δjk a xj = xj , ηi = ηi. Potreba rozlišovať medzi vektormi a kovektormi ako aj medzi hornými a dolnými indexmi sa potom celkom vytráca. V pseudoeuklidovskom priestore však (v dôsledku indefinitnosti formy G) pre žiadnu bázu βββ neplatí [G]βββ = IIIn, preto (gij) = (δij) a súradnice (xi ), (xi) či (ηj), (ηj ) sa pre niektoré (ko)vektory nevyhnutne líšia. Operácie spustenia a zdvihu indexov možno z vektorov resp. kovektorov rozšíriť aj na všeobecné tenzory. V (pseudo)euklidovskom priestore (V, G) máme za predpokladu p ≥ 1 pre každú dvojicu k ≤ p, l ≤ q + 1 lineárny izomorfizmus tenzorových priestorov ↓k l : T p q (V ) → T p−1 q+1 (V ), nazývaný spustenie k-teho horného indexu na l-té miesto. Podobne, za predpokladu q ≥ 1 máme pre každú dvojicu l ≤ q, k ≤ p+1 lineárny izomorfizmus tenzorových priestorov ↑k l : T p q (V ) → T p+1 q−1 (V ), nazývaný zdvih l-teho dolného indexu na k-té miesto. V invariantnom zápise fungujú tieto zobrazenia podľa predpisov ↓k l T η1 , . . . , ηp−1 ,xxx1, . . . ,xxxq+1 = T η1 , . . . , ηk−1 , ↓xxxl, ηk , . . . , ηp−1 ,xxx1, . . . ,xxxl−1,xxxl+1, . . . ,xxxq+1 32.7. Tenzory v (pseudo)euklidovských priestoroch 761 pre η1 , . . . , ηp−1 ∈ V ∗ , xxx1, . . . ,xxxq+1 ∈ V , resp. ↑k l T η1 , . . . , ηp+1 ,xxx1, . . . ,xxxq−1 = T η1 , . . . , ηk−1 , ηk+1 , . . . , ηp+1 ,xxx1, . . . ,xxxl−1, ↑ηk ,xxxl, . . . ,xxxq−1 pre η1 , . . . , ηp+1 ∈ V ∗ , xxx1, . . . ,xxxq−1 ∈ V . 4 (Uvedené formuly si opäť vyžadujú miernu modifikáciu pre krajnú polohu niektorého z indexov ik, jl.) V súradniciach tenzora vidno spúšťanie a dvíhanie indexov jasnejšie: Ak (T)βββ = A i1...ip j1...jq , tak ↓k l T βββ = B i1...ip−1 j1...jq+1 a ↑k l T βββ = C i1...ip+1 j1...jq−1 , kde B i1...ip−1 j1...jq+1 = i gijl A i1...ik−1iik...ip−1 j1...jl−1 jl+1...jq+1 = gijl A i1...ik−1iik...ip−1 j1...jl−1 jl+1...jq+1 , C i1...ip+1 j1...jq−1 = j gikj A i1...ik−1 ik+1...ip+1 j1...jl−1jjl...jq−1 = gikj A i1...ik−1 ik+1...ip+1 j1...jl−1jjl...jq−1 . Samozrejme, spúšťať alebo dvíhať môžeme aj viacero indexov, v krajnom prípade všetky. Označenia ako ↓kr l s , ↑ k1...kq 1 ... q a pod. hovoria samy za seba. Napríklad spustením oboch horných indexov v tenzore T typu 2 0 so súradnicami (T)βββ = Aij dostaneme tenzor ↓12 12 T typu 0 2 so súradnicami ↓12 12 T βββ = Akl , kde Akl = ij gikgjlAij = gikgjlAij . Ďalšie podrobnosti ponechávame na samostatné premyslenie čitateľovi. Aj samotná forma G je tenzor typu 0 2 . Zdvihom oboch jej indexov dostaneme tenzor ↑12 12 G typu 2 0 . Vďaka symetrii matice ggg a rovnosti ggg−1 = ggg−1 · ggg · ggg−1 vidíme, že gij = kl gik gklglj = gik gjl gkl, teda súradnice ↑12 12 G βββ naozaj tvorí inverzná matica ggg−1 = gij k matici ggg. V dôsledku komutatívnosti tenzorového súčinu nehrá miesto, kam sa nejaký index spúšťa alebo dvíha, až takú dôležitú úlohu. V konkrétnych prípadoch sa preto ani nezvykne explicitne vyznačovať; implicitne sa predpokladá, 4 Značenie ↓k l T, ↑k l T spustenia a zdvihu indexov nie je celkom obvyklé, no na rozdiel od bežne používaného značenia (či skôr neznačenia lebo poloznačenia) je názorné a jednoznačné, a preto vhodné na potreby výuky. Pri konkrétnych výpočtoch by bolo zrejme zbytočne pedantské a ťažkopádne. Ak je z kontextu jasné, ktorý index spúšťame resp. dvíhame a na ktoré miesto, môžeme použiť obvyklejšie „hudobné značenie ↓ T = T , resp. ↑T = T . 762 32. Úvod do tenzorového počtu že index spúšťame alebo dvíhame „na to isté miesto pod resp. nad ním. Kvôli tomu sa indexy tenzorov často zvyknú písať tak, aby žiaden pár pozostávajúci z jedného horného a jedného dolného indexu neležal v jednej zvislej línii. Príslušný index sa potom spustí/zdvihne na voľné miesto pod/nad ním. V diferenciálnej geometrii napr. Riemannov tenzor krivosti (presnejšie jeho súradnice) zapisujeme v tvare Ri klm. Spustením horného indexu získame tenzor Rjklm = gijRi klm. Keby sme hodlali spustiť horný index napr. na druhé miesto, pôvodný tenzor by sme zapísali v tvare R i k lm a po spustení by sme dostali tenzor Rkjlm = gijR i k lm. Ak ααα je iná báza priestoru V , tak spúšťanie a dvíhanie indexov v súradnicich tenzorov vzhľadom na bázu ααα funguje rovnako ako v súradnicich vzhľadom na bázu βββ, len s tým rozdielom, že úlohu matíc ggg = (gij) = [G]βββ, ggg−1 = (gij ) prevezmú matice fff = (fij) = [G]ααα, fff−1 = (fij ). Býva zvykom obmedziť sa len na ortonormálne bázy ααα, βββ pre ktoré platí [G]ααα = [G]βββ = diag(IIIr, −IIIs), kde (r, s) je signatúra formy G. Vo všetkých takých bázach spúšťanie aj dvíhanie indexov funguje s rovnakými koeficientmi gij = gij . Čitateľ si hádam ešte spomenie, že v Minkowského časopriestore (kapitola 16) sme takýmto bázam hovorili inerciálne. 32.7.1. Príklad. Nech M ⊆ Rn je otvorená množina, f : M → R je (spojito) diferencovateľná reálna funkcia n premenných a aaa ∈ M je ľubovoľný bod. V diferenciálnom počte funkcií viac premenných chápeme gradient funkcie f v bode aaa primárne ako vektor gradf(aaa) = f(aaa) = ∂f(aaa) ∂x1 , . . . , ∂f(aaa) ∂xn = n i=1 ∂f(aaa) ∂xi eeei = ∂f(aaa) ∂xi eeei vychádzajúci z bodu aaa a ukazujúci v smere, v ktorom sa hodnota funkcie f mení najrýchlejšie, s dĺžkou priamo úmernou rýchlosti tejto zmeny. Derivácia funkcie f v bode aaa v smere vektora vvv ∈ Rn je definovaná ako limita vvvf(aaa) = lim t→0 f(aaa + tvvv) − f(aaa) t . Špeciálne pre vektory eeei kanonickej ortonormálnej bázy smerové derivácie splývajú s parciálnymi deriváciami: eeei f(aaa) = ∂f(aaa) ∂xi . Pre všeobecný vektor vvv ∈ Rn platí vvvf(aaa) = f(aaa) · vvv = n i=1 ∂f(aaa) ∂xi vi = ∂f(aaa) ∂xi vi , Cvičenia 763 kde · označuje štandardný skalárny súčin v Rn . Na gradient funkcie f v bode aaa sa tak môžeme dívať aj ako na kovektor, t. j. lineárnu formu f(aaa): Rn → R, ktorá vektoru vvv ∈ Rn priradí skalár f(aaa)(vvv) = vvvf(aaa) = n i=1 ∂f(aaa) ∂xi vi = ∂f(aaa) ∂xi vi . Výraz pre totálny diferenciál funkcie f v bode aaa df(aaa,xxx) = n i=1 ∂f(aaa) ∂xi (xi − ai ) = ∂f(aaa) ∂xi (xi − ai ) = f(aaa) · (xxx − aaa) je tak aplikáciou gradientu f(aaa) ako lineárneho funkcionálu na vektor xxx−aaa. V „plochých priestoroch, ako sú napr. otvorené množiny M v euklidovskom priestore Rn , je rozdiel medzi gradientom ako vektorom a gradientom ako kovektorom viac-menej formálny a nie príliš zreteľný. V zakrivenom priestore však prechod medzi oboma rolami gradientu sprostredkúva Riemannov metrický tenzor gij(aaa) spojite závislý na bodoch aaa ∈ M, ktorý určuje jeho geometriu (a vo všeobecnosti nesplýva s Kroneckerovým symbolom δij). Gradient je tu primárne lineárna forma na dotykovom priestore v danom bode; zdvihom indexu z neho dostaneme vektor n j=1 n i=1 gij (aaa) ∂f(aaa) ∂xi eeej = gij (aaa) ∂f(aaa) ∂xi eeej. Ak prestaneme fixovať bod aaa ∈ M a gradient budeme chápať ako funkciu M → Rn , stane sa z neho (ko)vektorové pole, ako je to obvyklé v diferenciálnej geometrii. Na záver ešte poznamenajme, že spúšťať a dvíhať indexy možno aj bez predpokladu symetrie formy G – dôležitá je len jej regularita. Tak je tomu napr. v tzv. symplektickej geometrii, ktorá je zadaná pomocou antisymetrickej bilineárnej formy G a má o. i. značné využitie v hamiltonovskej mechanike. Pri absencii symetrie by však bolo treba viaceré formuly tohto paragrafu mierne upraviť. Cvičenia 32.1. Dokážte tvrdenie 32.1.1. 32.2. Nech X, Y sú konečné množiny a K je pole. (a) Dokážte rovnosť vektorových priestorov funkcií KX ⊗ KY = KX×Y jednak porovnaním ich dimenzií, jednak explicitným vyjadrením každej funkcie h: X ×Y v tvare h = (f1 ⊗ g1) + . . . + (fk ⊗ gk) pre fi ∈ KX , gi ∈ KY . Odhadnite počet 764 32. Úvod do tenzorového počtu potrebných sčítancov k v závislosti na počtoch m = # X, n = # Y . (b) Ak aj pole K je konečné, pričom # K = q, porovnajte počet prvkov tenzorového súčinu KX ⊗ KY a priameho súčinu KX × KY . (c) Aká je pravdepodobnosť, že náhodne vybraná funkcia h ∈ KX×Y je rozloži- teľná? 32.3. (a) Nech ϕ: V → U je lineárne zobrazenie. Dokážte, že predpisom ϕ∗ (η) = η ◦ ϕ je definované lineárne zobrazenie ϕ∗ : U∗ → V ∗ . (b) Dokážte, že pre identické zobrazenie idV : V → V je id∗ V = idV ∗ : V ∗ → V ∗ taktiež identické zobrazenie. (c) Pre lineárne zobrazenia ψ: W → V , ϕ: V → U platí (ϕ ◦ ψ)∗ = ψ∗ ◦ ϕ∗ . Nakreslite si komutatívny diagram a dokážte. (V jazyku teórie kategórií hovoríme, že priradenia V → V ∗ , ϕ → ϕ∗ určujú kontravariantný funktor na kategórií vektorových priestorov nad poľom K a lineárnych zobrazení.) 32.4. (a) Nech η: U → W, ϑ: V → W sú lineárne zobrazenia. Overte, že ich tenzorový súčin η ⊗ ϑ: U × V → W je naozaj bilineárne zobrazenie. (b) Nech U je vektorový podpriestor priestoru funkcií KX . Overte, že dosadením prvku x ∈ X do funkcie f ∈ U, t. j. predpisom σx (f) = f(x), je definovaná lineárna forma σx : U → K. (c) Dokážte, že priradením x → σx je definované prosté zobrazenie σ: X → U∗ . 32.5. Nech V je vektorový priestor nad poľom K. Nájdite prirodzené izomorfizmy vektorových priestorov (a) K ⊗ V ∼= V ; (b) Kn ⊗ V ∼= V n pre n ≥ 0; (c) Km ⊗ Kn ∼= Km×n ; (d) Km×n ⊗ Kr×s ∼= Kmr×ns . 32.6. Kroneckerovým súčinom vektorov xxx ∈ Km , yyy ∈ Kn nazývame maticu xxx ⊗ yyy = (xiyj) ∈ Km×n . Kroneckerov súčin xxx ⊗ yyy niekedy nazývame priamo tenzorovým súčinom vektorov xxx, yyy. (a) Dokážte, že pre hodnosť matice xxx ⊗ yyy platí h(xxx ⊗ yyy) ≤ 1, pričom h(xxx ⊗ yyy) = 1 ⇔ xxx = 0 & yyy = 0. (b) Matica AAA ∈ Km×n sa nazýva rozložiteľná, ak AAA = xxx ⊗ yyy pre nejaké vektory xxx ∈ Km , yyy ∈ Kn . Dokážte, že matica AAA ∈ Km×n je rozložiteľná práve vtedy, keď je rozložiteľná ako tenzor AAA ∈ Km ⊗ Kn , a to je ekvivalentné s podmienkou h(AAA) ≤ 1. (c) Dokážte, že hodnosť matice AAA ∈ Km×n splýva s najmenším prirodzeným číslom k, pre ktoré sa AAA dá vyjadriť ako súčet AAA = (xxx1 ⊗ yyy1) + . . . + (xxxk ⊗ yyyk) k nerozložiteľných matíc xxxi ⊗ yyyi. 32.7. Kroneckerovým súčinom matíc AAA ∈ Km×n , BBB ∈ Kr×s nazývame maticu AAA ⊗ BBB =      a11BBB a12BBB . . . a1nBBB a21BBB a22BBB . . . a2nBBB ... ... ... ... am1BBB am2BBB . . . amnBBB      ∈ Kmr×ns . Kroneckerov súčin AAA ⊗ BBB niekedy nazývame priamo tenzorovým súčinom matíc Cvičenia 765 AAA, BBB. Dokážte nasledujúce rovnosti: (a) IIIm ⊗ IIIn = IIImn; (b) (AAA1 ⊗ BBB1) · (AAA2 ⊗ BBB2) = AAA1AAA2 ⊗ BBB1BBB2 pre AAA1,AAA2 ∈ Km×n , BBB1,BBB2 ∈ Kr×s ; (c) (AAA ⊗ BBB)−1 = AAA−1 ⊗ BBB−1 , ak AAA ∈ Kn×n , BBB ∈ Ks×s sú regulárne; (d) pre hodnosť matice AAA ⊗ BBB platí h(AAA ⊗ BBB) = h(AAA) h(BBB); (e) tr(AAA ⊗ BBB) = trAAA trBBB a det(AAA ⊗ BBB) = (detAAA)n (detBBB)s pre AAA ∈ Kn×n , BBB ∈ Ks×s . 32.8. Dokážte, že komplexifikácia V C reálneho vektorového priestoru V tak, ako bola definovaná v paragrafe 19.4, je izomorfná s tenzorovým súčinom C ⊗R V . 32.9. Predpokladajme, že pole L je rozšírením poľa K a V je vektorový priestor nad K. (a) Za prepokladu, že L je konečné rozšírenie stupňa [L : K] = k, podrobne dokážte, že prvky vektorového priestoru V L = L ⊗K V možno jednoznačne až na poradie sčítancov reprezentovať v tvare (b1 ⊗xxx1) + (b2 ⊗xxx2) + . . . + (bk ⊗xxxk), kde b1, . . . , bk je báza L ako vektorového priestoru nad poľom K a xxx1, . . . ,xxxk ∈ V . (b) Dokážte, že xxx → 1 ⊗ xxx je injektívne K-lineárne zobrazenie V → V L . (c) Dokážte, že rovnosť dimK(L ⊗K V ) = [L : K] dimK V platí, aj keď L je nekonečné rozšírenie poľa K. (d) Dokážte rovnosť dimL V L = dimK V . (e) Nech U, V sú vektorové priestory nad poľom K, s bázami ααα resp. βββ a ϕ: V → U je K-lineárne zobrazenie s maticou AAA = (ϕ)ααα,βββ. Dokážte, že predpisom ϕL (a ⊗ xxx) = a ⊗ ϕ(xxx) je jednoznačne určené L-lineárne zobrazenie ϕL : V L → UL s tou istou maticou ϕL ααα,βββ = AAA vzhľadom na dané bázy. 32.10. Nech V1, . . . , Vp, W1, . . . , Wq sú konečnorozmerné vektorové priestory nad poľom K. (a) Podrobne popíšte prirodzené izomorfizmy medzi každou dvojicou z nasledujúcich vektorových priestorov: V ∗ 1 ⊗ . . . ⊗ V ∗ p ⊗ W1 ⊗ . . . ⊗ Wq, Lp+q(V1, . . . , Vp, W∗ 1 , . . . , W∗ q , K), L(V1 ⊗ . . . ⊗ Vp, W1 ⊗ . . . ⊗ Wq). (b) Aká je dimenzia uvedených priestorov, ak dim Vi = ni, dim Wj = mj? 32.11. Preverte výpočty v jednotlivých častiach príkladu 32.5.4 a na ich základe dokážte vetu 32.5.5. 32.12. Nech AAA = Ai j , BBB = Bj k sú matice rozmeru n × n nad poľom K a xxx = (x1 , . . . , xn ), yyy = (y1 , . . . , yn ) sú vektory z Kn . Dokážte nasledujúce rovnosti: (a) AAA · BBB = tr2 1(AAA ⊗ BBB); (b) Aijxi yj = (tr1 1 ◦ tr2 2) AAA ⊗ (xxx ⊗ yyy) . 32.13. Dokážte formulu pre kontrakciu trk l T tenzora T z konca odseku 32.6.2 a overte, že trk l T ako multilineárna forma nezávisí na báze βββ. 32.14. Nech V je konečnorozmerný vektorový priestor nad poľom K. Dokážte nasledujúce dve tvrdenia: (a) Predpisom (T, , σ) → Tσ je definovaná pravá akcia grupy Sp×Sq na priestore tenzorov T p q (V ). (b) Pre pevné ∈ Sp, σ ∈ Sq je T → Tσ lineárny izomorfizmus T p q (V ) → T p q (V ). (c) Ako vyzerajú pevné body uvedenej akcie? Osobitne sa zamerajte na prípady 766 32. Úvod do tenzorového počtu p = 0 resp. q = 0. 32.15. Nech βββ = (vvv1, . . . ,vvvn) je báza vektorového priestoru V a βββ∗ = (vvv1 , . . . ,vvvn ) je k nej duálna báza. V častiach (d), (e) navyše predokladáme, že G: V × V → K je symetrická regulárna bilineárna forma s Gramovou maticou [G]βββ = (gij). Overte, že operácie tenzorového súčinu, kontrakcie, permutácie indexov a spúšťania a dvíhania indexov na bázických prvkoch fungujú podľa nasledujúcich formúl: (a) vvvi1 ⊗ . . . ⊗ vvvip ⊗ vvvj1 ⊗ . . . ⊗ vvvjq ⊗ vvvk1 ⊗ . . . ⊗ vvvkr ⊗ vvvl1 ⊗ . . . ⊗ vvvls = vvvi1 ⊗ . . . ⊗ vvvip ⊗ vvvk1 ⊗ . . . ⊗ vvvkr ⊗ vvvj1 ⊗ . . . ⊗ vvvjq ⊗ vvvl1 ⊗ . . . ⊗ vvvls ; (b) trk l vvvi1 ⊗ . . . ⊗ vvvip ⊗ vvvj1 ⊗ . . . ⊗ vvvjq = vvvik ,vvvjl vvvi1 ⊗ . . . ⊗ vvvik−1 ⊗ vvvik+1 ⊗ . . . ⊗ vvvip ⊗vvvj1 ⊗ . . . ⊗ vvvjl−1 ⊗ vvvjl+1 ⊗ . . . ⊗ vvvjq ; (c) vvvi1 ⊗. . .⊗vvvip ⊗vvvj1 ⊗. . .⊗vvvjq σ = vvvi −1(1) ⊗. . .⊗vvvi −1(p) ⊗vvvjσ−1(1) ⊗. . .⊗vvvjσ−1(q) pre ∈ Sp, σ ∈ Sq; (d) ↓k l vvvi1 ⊗ . . . ⊗ vvvip ⊗ vvvj1 ⊗ . . . ⊗ vvvjq = j gikj vvvi1 ⊗ . . . ⊗ vvvik−1 ⊗ vvvik+1 ⊗ . . . ⊗ vvvip ⊗vvvj1 ⊗ . . . ⊗ vvvjl−1 ⊗ vvvj ⊗ vvvjl ⊗ . . . ⊗ vvvjq ; (e) ↑k l vvvi1 ⊗ . . . ⊗ vvvip ⊗ vvvj1 ⊗ . . . ⊗ vvvjq = i gijl vvvi1 ⊗ . . . ⊗ vvvik−1 ⊗ vvvi ⊗ vvvik ⊗ . . . ⊗ vvvip ⊗vvvj1 ⊗ . . . ⊗ vvvjl−1 ⊗ vvvjl+1 ⊗ . . . ⊗ vvvjq . V časti (c) si všimnite zámenu permutácií , σ inverznými permutáciami −1 , σ−1 a ich presun v indexoch zhora nadol resp. zdola nahor. V častiach (d), (e) zasa stojí za povšimnutie, že na bázických vektoroch sa spúšťanie indexu prejavi jeho zdvihom a zdvih indexu jeho spustením. 32.16. (a) Overte, že lineárny izomorfizmus xxx → ↓ xxx na (pseudo)eklidovskom priestore (V, G) môžeme vyjadriť pomocou operácií tenzorového súčinu a kontrakcie ↓xxx = tr1 1(G ⊗ xxx). (b) Vyjadrite aj všeobecné formuly spúšťania a dvíhania indexov pomocou tenzorového súčinu a zúženia. 32.17. Nech βββ = (vvv1, . . . ,vvvn) je báza vektorového priestoru V nad poľom R a βββ∗ = (vvv1 , . . . ,vvvn ) je k nej duálna báza. Nech ďalej G je (pseudo)skalárny súčin na V . Za akých podmienok platí ↓vvvi = vvvi resp. ↑vvvj = vvvj pre všetky i, j ≤ n? 32.18. Popíšte ako „do kríža funguje v priestoroch tenzorov nad konečnorozmerným vektorovým priestorom V nad poľom C s regulárnou kososymetrickou poldruhalineárnou formou G spúšťanie indexov T p,r q,s (V ) → T p−1,r q,s+1 (V ) resp. T p,r q,s (V ) → T p,r−1 q+1,s (V ) a dvíhanie indexov T p,r q,s (V ) → T p,r+1 q−1,s (V ) resp. T p,r q,s (V ) → T p+1,r q,s−1 (V ). Ktoré z týchto zobrazení sú lineárne a ktoré semilineárne izomorfizmy? 33. Symetrické a alternujúce tenzory Mnoho tenzorov (dalo by sa povedať, že ich väčšina), s ktorými sa stretávame v geometrii či vo fyzike, vykazuje istú symetriu voči zámene poradia argumentov resp. indexov. Napr. kvadratické formy reprezentujeme pomocou symetrických bilineárnych foriem (t. j. symetrických kovariantných tenzorov stupňa 2). Riemannov tenzor krivosti Ri jkl je zasa antisymetrický v poslednej dvojici indexov a po spustení indexu i aj v prvej dvojici, čiže Ri jkl = −Ri jlk a Rijkl = −Rjikl. 1 Symetrický je aj tenzor napätia (po zdvihu alebo spustení niektorého indexu) a tenzor momentu zotrvačnosti, zatiaľ čo tenzor elektromagnetického poľa je antisymetrický. Antisymetrické multilineárne formy hrajú dôležitú úlohu v diferenciálnej geometrii a algebraickej topológii. Algebry symetrických resp. antisymetrických tenzorov sa objavujú v kvantovej mechanike ako stavové priestory systémov identických bozónov resp. fermiónov (t. j. častíc s celočíselným resp. poloceločíselným spinom). Symetria prípadne antisymetria tenzora T ∈ T p 0 (V ) umožňuje značnú redukciu počtu parametrov potrebných na jeho popis. Formálne sa to prejavuje tým, že dimenzie podpriestorov takýchto tenzorov sú podstatne menšie než dimenzia priestoru T p 0 (V ) (porovnaj vety 33.1.3 a 33.4.3 s vetou 32.5.1). Podrobné a ucelené spracovanie problematiky symetrických a alternujúcich (antisymetrických) tenzorov, zahŕňajúce aj ich najdôležitejšie aplikácie, by podstatne presiahlo rozumný rozsah jednej na to vyhradenej kapitoly. A tak sa voľky-nevoľky obmedzíme len na výklad základných pojmov a súvislostí, doplnený niekoľkými ukážkami aplikácií mimo rámca lineárnej algebry. 33.1 Symetrické tenzory Prototypom symetrických tenzorov nad vektorovým priestorom V sú symetrické bilineárne formy F : V × V → K, ktoré tvoria lineárny podpriestor priestoru tenzorov T 0 2 (V ) ∼= T 2 0 (V ∗ ). Hovoríme, že p-lineárne zobrazenie H : V p → W je symetrické, ak zámenou poradia ľubovoľných dvoch argumentov xxxi,xxxj ∈ V sa hodnota výrazu H(xxx1, . . . ,xxxp) ∈ W nezmení. Pre W = K dostávame pojem symetrického kovariantného tenzora nad priestorom V . Zrejme kovariantný tenzor T ∈ T 0 p (V ) stupňa p (t. j. typu 0 p ) je symetrický práve vtedy, keď pre ľubovoľnú permutáciu σ ∈ Sp platí Tσ = T. V reči súradníc (vzhľadom na ľubovoľnú 1 Riemannov tenzor Rijkl je navyše symetrický voči zámene poradia dvojíc indexov (i, j) a (k, l), t. j. Rijkl = Rklij. 768 33. Symetrické a alternujúce tenzory bázu βββ priestoru V ) to znamená, že platí Tj1...jp = Tjσ(1)...jσ(p) pre všetky j1, . . . , jp ≤ n. Podobne možno definovať a charakterizovať aj pojem symetrického kontravariantného tenzora T ∈ T p 0 (V ) stupňa p (t. j. typu p 0 ). Symetrické tenzory tvoria v oboch prípadoch lineárne podpriestory priestorov tenzorov T 0 p (V ) resp. T p 0 (V ); značíme ich Symp(V ) resp. Symp (V ). 2 Vzhľadom na kanonické izomorfizmy T 0 p (V ) ∼= T p 0 (V ∗ ) a Symp(V ) ∼= Symp (V ∗ ) pre začiatok stačí zaoberať sa priestormi kontravariantných symetrických tenzorov Symp (V ) ⊆ T p 0 (V ). Všetky skaláry a ∈ K a vektory xxx ∈ V budeme považovať za symetrické tenzory (rozmyslite si, že je to aj formálne v zhode s definíciou symetrického tenzora). Inak povedané, Sym0 (V ) = K a Sym1 (V ) = V . Naším cieľom je vybaviť priestor všetkých symetrických tenzorov Sym(V ) = p∈N Symp (V ) prirodzenou štruktúrou asociatívnej graduovanej lineárnej algebry. Bežný tenzorový súčin symetrických tenzorov však vo všeobecnosti nie je symetrický tenzor. Napr. vektory xxx,yyy ∈ V sú symetrické tenzory, ale ich súčin xxx ⊗ yyy nemusí byť symetrický. Pre η, ϑ ∈ V ∗ totiž platí (xxx ⊗ yyy)(η, ϑ) = xxx(η)yyy(ϑ) = yyy(ϑ)xxx(η) = (yyy ⊗ xxx)(ϑ, η). Teda symetria tenzora xxx ⊗ yyy, t. j. rovnosť (xxx ⊗ yyy)(η, ϑ) = (xxx ⊗ yyy)(ϑ, η) pre všetky η, ϑ ∈ V ∗ , je ekvivalentná s podmienkou xxx ⊗ yyy = yyy ⊗ xxx. Ak sú ale xxx, yyy lineárne nezávislé vektory, tak xxx ⊗ yyy a yyy ⊗ xxx sú rôzne bilineárne formy na priestore V ∗ . Ako však vyplýva z našej úvahy, bilineárna operácia súčinu, ktorá zo symetrických tenzorov vyrába opäť symetrické tenzory, musí byť aspoň na vektoroch xxx,yyy ∈ V komutatívna. Ku konštrukcii algebry symetrických tenzorov preto pristúpime z inej strany. Ak si zvolíme v priestore V nejakú bázu βββ = (vvv1, . . . ,vvvn), tak komutatívny a asociatívny súčin ľubovoľných p vektorov vvvi1 , . . . ,vvvip tejto bázy je jednoznačne určený len počtom výskytov k1, . . . , kn každého z vektorov vvv1, . . . ,vvvn v uvedenom zozname. Tento súčin preto zapíšeme v tvare vvvi1 . . .vvvip = vvvk1 1 . . .vvvkn n . Všetky formálne lineárne kombinácie ak1...knvvvk1 1 . . .vvvkn n 2 Používa sa tiež označenie Sp(V ) resp. Sp (V ), ktoré by však v našom prípade kolidovalo s označením grupy permutácií Sp. 33.1. Symetrické tenzory 769 len s konečným počtom nenulových koeficientov ak1...kn ∈ K tvoria nekonečnorozmerný vektorový priestor K[vvv1, . . . ,vvvn] a pravidlo pre súčin výrazov vvvk1 1 . . .vvvkn n · vvvl1 1 . . .vvvln n = vvvk1+l1 1 . . .vvvkn+ln n spolu s podmienkou bilinearity jednoznačne určuje na K[vvv1, . . . ,vvvn] komutatívnu a asociatívnu binárnu operáciu, ktorú nazývame symetrickým tenzorovým súčinom. Takto získanú algebru možno prirodzene stotožniť s graduovanou algebrou polynómov K[x1, . . . , xn] z príkladu 30.2.1, resp. chápať ju priamo ako algebru polynómov v premenných vvv1, . . . ,vvvn nad poľom K. Presnejšie, priradenie xi → vvvi pre i ≤ n určuje izomorfizmus algebier f(x1, . . . , xn) → f(vvv1, . . . ,vvvn): K[x1, . . . , xn] → K[vvv1, . . . ,vvvn] a zároveň indukuje prirodzenú graduáciu algebry K[vvv1, . . . ,vvvn], v ktorej prvky podpriestoru K[vvv1, . . . ,vvvn]p zodpovedajú homogénnym polynómom p-teho stupňa. Graduovanú algebru K[vvv1, . . . ,vvvn] nazývame symetrickou algebrou vektorového priestoru V a značíme ju Σ(V ). Špeciálne každý vektor xxx = xi vvvi ∈ V = T 1 0 (V ) môžeme chápať ako prvok vrstvy Σ1 (V ) = V . Priradenie vvvi1 ⊗ . . . ⊗ vvvip → vvvk1 1 . . .vvvkn n , kde ki = # {r ≤ p; i = ir} je počet výskytov indexu i v zozname i1, . . . , ip, určuje surjektívny homomorfizmus graduovaných algebier T0(V ) → Σ(V ), nazývaný symetrická kanonická projekcia. Čitateľ by si mal rozmyslieť, že samotná algebra Σ(V ) ani jej graduácia na vrstvy Σp (V ) = K[vvv1, . . . ,vvvn]p, na rozdiel od homomorfizmu T0(V ) → Σ(V ), nezávisia od výberu bázy βββ (pozri cvičenie 33.2 (a)). Vďaka spomínanému surjektívnemu homomorfizmu sa na symetrickú algebru Σ(V ) možno dívať ako na faktorovú algebru graduovanej tenzorovej algebry T0(V ), ktorá vznikne stotožnením všetkých tenzorových súčinov xxx1 ⊗ . . . ⊗ xxxp ∈ T p 0 (V ) líšiacich sa len poradím činiteľov. Tento popis symetrickej algebry Σ(V ) je už invariantný, teda samotná algebra Σ(V ) ani jej graduácia Σp (V ) = K[vvv1, . . . ,vvvn]p, na rozdiel od izomorfizmu Σ(V ) ∼= K[x1, . . . , xn], nezávisia od výberu bázy βββ (pozri cvičenie 33.2 (b)). Navzájom rôznych jednočlenov xk1 1 . . . xkn n stupňa p je práve toľko, koľkými spôsobmi možno číslo p rozložiť na súčet n celých nezáporných sčítancov, t. j. toľko, koľko je p-prvkových kombinácií s opakovaním z n prvkov (pozri cvičenie 30.10). Keďže tieto polynómy tvoria bázu priestoru K[x1, . . . , xn]p ∼= Σp (V ), môžeme tak určiť dimenziu priestoru p-homogénnych polynómov Σp (V ). 33.1.1. Tvrdenie. Symetrická algebra Σ(V ) n-rozmerného vektorového priestoru V je komutatívna a asociatívna nekonečnorozmerná graduovaná Kalgebra s jednotkou 1 ∈ K. Pre dimenzie jej jednotlivých vrstiev platí dim Σp (V ) = n + p − 1 p = n(n + 1) . . . (n + p − 1) p! . 770 33. Symetrické a alternujúce tenzory Symetrický tenzorový súčin xxxyyy vektorov xxx,yyy ∈ V sa niekedy tiež značí xxx ⊗ sym yyy alebo xxx∨yyy. Priestor Σp (V ) potom značíme aj ako symetrický tenzorový súčin p exemplárov priestoru V , t. j. Σp (V ) = V ⊗ sym . . . ⊗ sym V p = V ∨ . . . ∨ V p , a nazývame p-tou symetrickou mocninou priestoru V . Symetrický tenzorový súčin sa spomedzi symetrických bilineárnych zobrazení vydeľuje podobnou univerzálnou vlastnosťou ako bežný tenzorový súčin spomedzi všetkých bilineárnych zobrazení (porovnaj s vetou 32.2.7). 33.1.2. Veta. Nech V , W sú vektorové priestory nad poľom K, pričom V je konečnorozmerný a p ∈ N. Potom (a) operácia symetrického tenzorového súčinu (xxx1, . . . ,xxxp) → xxx1 . . .xxxp je symetrické p-lineárne zobrazenie V p → Σp (V ); (b) ku každému symetrickému p-lineárnemu zobrazeniu H : V p → W existuje práve jedno lineárne zobrazenie H : Σp (V ) → W také, že H(xxx1 . . .xxxp) = H(xxx1, . . . ,xxxp) pre všetky xxx1, . . . ,xxxp ∈ V ; (c) priradenie H → H je lineárny izomorfizmus priestoru všetkých symetrických p-lineárnych zobrazení V p → W na priestor L Σp (V ), W . Dôkaz prenechávame ako cvičenie čitateľovi. Symetrická mocnina Σp (V ) je podmienkami (a), (b) určená jednoznačne až na lineárny izomorfizmus. Zostáva nám vyjasniť, ako súvisia jednotlivé priestory symetrických tenzorov Symp (V ) ⊆ T p 0 (V ) s priestormi Σp (V ) homogénnych polynómov stupňa p a celý nekonečnorozmerný priestor Sym(V ) ⊆ T0(V ) s graduovanou symetrickou algebrou Σ(V ). Kľúčom k odpovedi na túto otázku sú body (b) a (c) vety 33.1.2. Každý symetrický tenzor T ∈ Symp (V ) ⊆ T p 0 (V ) je symetrická p-lineárna forma T : (V ∗ )p → K. Táto podľa (b) určuje lineárny funkcionál T : Σp (V ∗ ) → K taký, že pre ľubovoľné k1 + . . . + kn = p platí T (vvv1 )k1 . . . (vvvn )kn = T(vvv1 , . . . ,vvv1 k1 , . . . ,vvvn , . . . ,vvvn kn , kde βββ∗ = (vvv1 , . . . ,vvvn ) je duálna báza k báze βββ (vo výrazoch (vvvi )ki treba rozlišovať horný index i a exponent ki). V dôsledku symetrie tenzora T 33.1. Symetrické tenzory 771 výraz na pravej strane rovnosti závisí len od počtu výskytov jednotlivých kovektorov vvvj a nie od ich poradia. Podľa (c) je priradenie T → T lineárny izomorfizmus vektorového priestoru Symp (V ) na vektorový priestor L(Σp (V ∗ ), K) = Σp (V ∗ )∗ . Lineárny funkcionál T ∈ Σp (V ∗ )∗ môžeme prirodzene stotožniť s polynómom T = k1+...+kn=p T (vvv1 )k1 . . . (vvvn )kn vvvk1 1 . . .vvvkn n ∈ Σp (V ) a priradenie T → T chápať ako lineárny izomorfizmus Symp (V ) ∼= Σp (V ).3 Vzor polynómu f ∈ Σp (V ) v tomto zobrazení, teda vlastne inverzné zobrazenie k zobrazeniu T → T, budeme značiť f+ . Symetrický tenzor, ktorý sa v tomto izomorfizme zobrazí na jednočlen vvvk1 1 . . .vvvkn n stupňa p, má tvar súčtu vvvk1 1 . . .vvvkn n + = i1,...,ip vvvi1 ⊗ . . . ⊗ vvvip cez všetky usporiadané p-tice (i1, . . . , ip) indexov z množiny {1, . . . , n}, ktoré obsahujú každý z indexov i ≤ n práve ki-krát. Počet týchto sčítancov udáva tzv. polynomický koeficient p k1, . . . , kn = p! k1! . . . kn! . Násobenie v priestore symetrických tenzorov Sym(V ) = p∈N Symp (V ) zavedieme tak, aby priradenie T → T bolo homomorfizmom, a teda izomorfizmom graduovaných algebier Sym(V ) ∼= Σ(V ). Pre S ∈ Symp (V ), T ∈ Symq (V ) preto položíme S · T = S · T + . Potom zrejme ST = S · T. Takže môžeme zhrnúť: 33.1.3. Veta. Symetrické (kontravariantné) tenzory nad n-rozmerným vektorovým priestorom V tvoria nekonečnorozmernú komutatívnu a asociatívnu graduovanú algebru Sym(V ), · s jednotkou 1 ∈ K, izomorfnú so symetrickou algebrou Σ(V ), · priestoru V . Pre dimenzie jej jednotlivých vrstiev platí dim Symp (V ) = n + p − 1 p . 3 Tým sme len tak medzi rečou dokázali očakávaný izomorfizmus Σp (V )∗ ∼= Σp (V ∗ ), ktorý je dokonca kanonický. Chyba krásy uvedeného popisu, ktorý závisí od bázy βββ, sa totiž dá odstrániť (pozri cvičenie 33.2 (c)). 772 33. Symetrické a alternujúce tenzory Ešte raz výslovne upozorňujeme, že – napriek inklúzii Sym(V ) ⊆ T0(V ) – symetrické tenzory netvoria podalgebru graduovanej algebry všetkých kontravariantných tenzorov nad V . Nad poľami nekonečnej charakteristiky však existuje možnosť ako rozšíriť symetrický tenzorový súčin na celý priestor T0(V ) a urobiť z neho komutatívnu a asociatívnu graduovanú algebru, v ktorej symetrické tenzory tvoria graduovanú podalgebru Sym(V ) ⊆ T0(V ) izomorfnú so symetrickou graduovanou algebrou Σ(V ). Na ten účel stačí definovať súčiny bázických tenzorov vvvi1 ⊗. . .⊗vvvip ∈ T p 0 (V ), vvvj1 ⊗. . .⊗vvvjq ∈ T q 0 (V ). Ak označíme ki = #{r ≤ p; ir = i}, lj = #{s ≤ q; js = j}, môžeme písať vvvk1 1 . . .vvvkn n + · vvvl1 1 . . .vvvln n + = vvvk1+l1 1 . . .vvvkn+ln n + = m1,...,mp+q vvvm1 ⊗ . . . ⊗ vvvmp+q , kde posledný súčet beží cez všetky (p + q)-tice (m1, . . . , mp+q), v ktorých sa každý z indexov m ≤ n vyskytuje práve (km +lm)-krát. Túto hodnotu rovnomerne rozdelíme medzi p k1,...,kn q l1,...,ln sčítancov tvoriacich výraz vľavo, t. j. položíme (vvvi1 ⊗. . .⊗vvvip )·(vvvj1 ⊗. . .⊗vvvjq ) = k1! . . . kn! p! l1! . . . ln! q! m1,...,mp+q vvvm1 ⊗. . .⊗vvvmp+q . V nasledujúcom paragrafe uvidíme, že nad poľami nekonečnej charakteristiky jestvuje ešte jedna prirodzená možnosť ako urobiť z priestoru T0(V ) komutatívnu a asociatívnu graduovanú algebru s graduovanou podalgebrou Sym(V ) ⊆ T0(V ), izomorfnou so symetrickou graduovanou algebrou Σ(V ). Tento nový symetrický súčin sa však od práve definovaného symetrického súčinu bude líšiť len istými faktormi kombinatorického charakteru pred výrazmi m1,...,mp+q vvvm1 ⊗ . . . ⊗ vvvmp+q (pozri cvičenie 33.5). 33.2 Symetrické tenzory a ppp-homogénne formy Súvis medzi (symetrickými) bilineárnymi formami a kvadratickými formami, ktorý sme študovali v kapitole 11, má svoju analógiu vo vzťahu (symetrických) multilineárnych foriem, t. j. kovariantných tenzorov stupňa p a phomogénnych foriem. Pripomeňme si z príkladu 30.2.1, časť (b), že K[V ]p označuje lineárny podpriestor algebry K[V ] všetkých polynomických funkcií V → K, tvorený práve p-homogénnymi funkciami. Ak si zafixujeme nejakú bázu βββ = (vvv1, . . . ,vvvn) priestoru V a k nej duálnu bázu βββ∗ = (vvv1 , . . . ,vvvn ), tak priradenie xi → vvvi možno jednoznačne rozšíriť do surjektívneho homomorfizmu K-algebier K[x1, . . . , xn] → K[V ], pri ktorom sa podpriestor phomogénnych polynómov K[x1, . . . , xn]p zobrazí na podpriestor p-homogénnych polynomických funkcií (foriem) K[V ]p. 33.2. Symetrické tenzory a ppp-homogénne formy 773 Každý kovariantný tenzor T ∈ T 0 p (V ), t. j. p-lineárna forma T : V p → K určuje predpisom T∆ (xxx) = T(xxx, . . . ,xxx) p-homogénnu formu T∆ : V → K. Naopak, každá p-homogénna forma f ∈ K[V ]p má zrejme tvar f(xxx) = T∆ (xxx) = T(xxx, . . . ,xxx) pre viacero rôznych tenzorov T ∈ T 0 p (V ). Predpisom T → T∆ je tak definované surjektívne (a okrem prípadu n = 1 neinjektívne) lineárne zobrazenie T 0 p (V ) → K[V ]p. Navyše, pre S ∈ T 0 p (V ), T ∈ T 0 q (V ) zrejme platí (S ⊗ T)∆ = S∆ · T∆ ∈ K[V ]p+q. Vieme, že v špeciálnom prípade p = 2 a za predpokladu char K = 2 má každá kvadratická forma f : V → K tvar f(xxx) = T∆ (xxx) = T(xxx,xxx) pre jednoznačne určený symetrický tenzor T ∈ T 0 2 (V ) (pozri paragraf 11.2). Jeden z tenzorov T ∈ T 0 p (V ), ktorý po stotožnení svojich argumentov dáva p-homogénnu formu f(xxx) = k1+...+kn=p ak1...kn xk1 1 . . . xkn n , kde xi = vvvi (xxx) sú súradnice vektora xxx ∈ V v báze βββ,4 je daný predpisom T(vvvi1 , . . . ,vvvip ) =    ak1...kn , ak (i1, . . . , ip) = ( 1, . . . , 1 k1 , . . . , n, . . . , n kn ), 0 inak. To napr. pre p = 2 zodpovedá reprezentácii kvadratickej formy q(xxx) = i≤j aijxixj bilineárnou formou F(xxx,yyy) = i≤j aijxiyj s hornou trojuholníkovou maticou (aij). Teda tento tenzor má vo všeobecnosti do symetrie ďaleko. Na druhej strane symetrický tenzor T = f+ , ktorý zodpovedá polynómu f(x1, . . . , xn) v lineárnom izomorfizme T → T : Symp(V ) → Σp(V ) ∼= K[x1, . . . , xn]p, dáva po stotožnení svojich argumentov polynomickú funkciu T∆ (xxx) = f+ (xxx, . . . ,xxx) = k1,...,kn p k1, . . . , kn ak1...kn xk1 1 . . . xkn n , ktorá okrem prípadu, že f je priamo lineárnou kombináciou p-tych mocnín xp i , nesplýva s f(xxx). 4 Všimnite si, že sme práve porušili dohodu o značení súradníc vektorov hornými indexmi. Pri označení (xj )kj by sa nám však plietli horné indexy a exponenty. 774 33. Symetrické a alternujúce tenzory Symetrickú p-lineárnu formu T : V p → K, ktorá po stotožnení svojich argumentov dáva p-homogénnu polynomickú funkciu f, čiže platí pre ňu T∆ = f, nazývame polárnou formou funkcie f a značíme ju pol f. Jej existencia a jednoznačnosť je však viazaná na možnosť deliť v poli K kladnými celými číslami ≤ p (a ich súčinmi). Predpokladajme, že char K > p. Keďže char K je ∞ alebo prvočíslo – v tom druhom prípade je počet prvkov poľa K mocninou jeho charakteristiky, tým skôr platí # K > p. Podľa príkladu 30.2.1 z toho vyplýva, že priradenie xi → vvvi určuje lineárny izomorfizmus K[x1, . . . , xn]p → K[V ]p, prostredníctvom ktorého môžeme stotožniť p-homogénne formy f : V → K s p-homogénnymi polynómami f(x1, . . . , xn). Navyše, žiaden z polynomických koeficientov p k1,...,kn nie je násobkom čísla char K. V takom prípade vieme polárnu formu funkcie f ∈ K[V ]p určiť len zo znalosti jej koeficientov. Vďaka linearite stačí poznať polárne formy jednočlenov p-teho stupňa xk1 1 . . . xkn n – tie majú zrejme tvar pol xk1 1 . . . xkn n = p k1, . . . , kn −1 xk1 1 . . . xkn n + = k1! . . . kn! p! i1,...,ip vvvi1 ⊗ . . . ⊗ vvvip , pričom sčítame cez všetky usporiadané p-tice (i1, . . . , ip) indexov z množiny {1, . . . , n}, ktoré obsahujú každý z indexov i ≤ n práve ki-krát. Posledný výraz preskúmame v trochu všeobecnejšom kontexte. Symetrizáciou tenzora T ∈ T 0 p (V ) nazývame tenzor sym T = 1 p! σ∈Sp Tσ. Predpisom T → sym T je definované lineárne zobrazenie sym: T 0 p (V ) → T 0 p (V ), ktoré nazývame symetrizáciou. Tenzor T ∈ T 0 p (V ) je zrejme symetrický práve vtedy, keď T = sym T. Navyše pre ľubovoľný tenzor T ∈ T 0 p (V ) a xxx ∈ V očividne platí (sym T)(xxx, . . . ,xxx) = T(xxx, . . . ,xxx), teda symetrizácia tenzora T a samotný tenzor indukujú tú istú p-homogénnu formu T∆ = (sym T)∆ ∈ K[V ]p. Pre každý z tenzorov vvvj1 ⊗ . . . ⊗ vvvjp , v ktorom sa každý z činiteľov vvvj vyskytuje práve kj-krát, zrejme platí sym vvvj1 ⊗ . . . ⊗ vvvjp = k1! . . . kn! p! i1,...,ip vvvi1 ⊗ . . . ⊗ vvvip , 33.2. Symetrické tenzory a ppp-homogénne formy 775 kde súčet beží cez všetky usporiadané p-tice indexov (i1, . . . , ip), ktoré majú túto vlastnosť. Inak povedané výraz p k1, . . . , kn sym vvvj1 ⊗ . . . ⊗ vvvjp ∼ = (vvv1 )k1 . . . (vvvn )kn je symetrická kanonická projekcia bázického tenzora vvvj1 ⊗. . .⊗vvvjp . Spojením oboch rovností dostávame pol xk1 1 . . . xkn n = sym vvvj1 ⊗ . . . ⊗ vvvjp , kde (j1, . . . , jp) je ľubovoľná usporiadaná p-tica indexov, ktorá obsahuje každý index j ≤ n práve kj-krát. Ak p + q < char K, tak môžeme definovať ešte jeden súčin symetrických kovariantných tenzorov S ∈ Symp(V ), T ∈ Symq(V ) formulou S T = sym(S ⊗ T) = 1 (p + q)! σ∈Sp+q (S ⊗ T)σ, ktorá však dáva zmysel pre akékoľvek tenzory S ∈ T 0 p (V ), T ∈ T 0 q (V ) a stále platí S T ∈ Symp+q(V ). Navyše oba tenzory S T = sym(S ⊗ T) a S ⊗ T určujú tú istú (p + q)-homogénnu formu (S T)∆ = (S ⊗ T)∆ = S∆ · T∆ , takže lineárne zobrazenie T → T∆ je homomorfizmom operácie symetrického tenzorového súčinu a zároveň aj operácie bežného tenzorového súčinu ⊗ na súčin polynómov v K[V ]. Ak si uvedomíme, že po stotožnení kanonicky izomorfných algebier priradenie T → T∆ nie je vlastne nič iné ako symetrická kanonická projekcia T0(V ∗ ) → K[x1, . . . , xn] ∼= Σ(V ∗ ), nemalo by nás to prekvapiť. Z jednoznačnosti polárnej formy a zo symetrie tenzorov S T, sym(S ⊗ T) ďalej vyplýva S T = sym(S ⊗ T) = pol S∆ · T∆ = sym S sym T. Za predpokladu, že pole K má nekonečnú charakteristiku, definuje súčin na podkladovom priestore symetrických kovariantných tenzorov Sym(V ∗ ) = p∈N Symp (V ∗ ) = p∈N Symp(V ) štruktúru graduovanej komutatívnej a asociatívnej lineárnej algebry. I keď rovnosť S · T = S T pre symetrické tenzory vo všeobecnosti neplatí, vytvárajú oba symetrické tenzorové súčiny izomorfné graduované algebry. Pre každú jednotlivú vrstvu máme totiž lineárne izomorfizmy Symp(V ) ∼= K[x1, . . . , xn]p ∼= K[V ]p, 776 33. Symetrické a alternujúce tenzory ktoré dohromady dávajú izomorfizmy príslušných graduovaných algebier Sym(V ∗ ), · ∼= K[x1, . . . , xn], · ∼= K[V ], · ∼= Sym(V ∗ ), . Symetrizácia T → sym T je navyše homomorfizmom každej z graduovaných algebier T 0 (V ), ⊗ , T 0 (V ), na graduovanú algebru Sym(V ∗ ), · . Zatiaľ čo súčin · je univerzálny v tom zmysle, že aspoň na symetrických tenzoroch nezávisí na charakteristike poľa K, súčin funguje čo len na podpriestore symetrických tenzorov iba nad poľami nekonečnej charakteristiky, priamo sa však zhoduje s násobením v súradnicovom okruhu polynomických funkcií K[V ]. To je hlavný dôvod, prečo sa nad poľom charakteristiky ∞ niekedy dáva prednosť symetrickému tenzorovému súčinu S T pred „univerzálnym symetrickým tenzorovým súčinom S·T. Označenie S·T, prípadne S ⊗ sym T sa potom zvykne používať pre „uprednostňovaný symetrický tenzorový súčin. Ešte poznamenajme, že symetrický tenzorový súčin S T = sym(S ⊗ T) možno samozrejme definovať aj pre kontravariantné tenzory S ∈ T p 0 (V ), T ∈ T q 0 (V ). Úvahy vykonané v paragrafe 33.2 nás teraz oprávňujú vysloviť nasledujúci záver. 33.2.1. Veta. Nech V je konečnorozmerný vektorový priestor nad poľom K charakteristiky ∞. Potom súčin vytvára na priestore kontravariantných tenzorov T0(V ) štruktúru komutatívnej a asociatívnej graduovanej algebry T0(V ), s jednotkou 1 ∈ K, v ktorej symetrické tenzory tvoria graduovanú podalgebru Sym(V ) a symetrická kanonická projekcia T → T∆ je homomorfizmus každej z graduovaných algebier T0(V ), ⊗ , T0(V ), na symetrickú graduovanú algebru Σ(V ), · . Jej zúženie na podalgebru symetrických tenzorov je izomorfizmus graduovaných algebier Sym(V ), ∼= Σ(V ), · . 33.3 Totálne derivácie vyšších rádov V prípade, že V je vektorový priestor nad poľom R, možno pre p-homogénne formy f : V → R očividným spôsobom definovať vlastnosti kladnej resp. zápornej definitnosti či semidefinitnosti, ako aj vlastnosť indefinitnosti, rovnako ako pre kvadratické formy v paragrafe 12.2. Zrejme každá homogénna funkcia nepárneho stupňa p, ktorá nie je identicky rovná nule, je automaticky indefinitná. Hovoriť o kladnej resp. zápornej (semi)definitnosti má preto praktický zmysel len pre homogénne formy párneho stupňa p. Ukážeme si, ako možno pomocou týchto pojmov aplikovaných na parciálne derivácie vyšších rádov rozhodnúť o existencii a charaktere extrémov funkcie n-premenných aj v niektorých prípadoch, keď nám to len znalosť prvých a druhých parciálnych derivácií nedovoľuje. 33.3. Totálne derivácie vyšších rádov 777 Nech M ⊆ Rn je otvorená množina a f : M → R je funkcia. Totálnou p-tou deriváciou prípadne totálnou deriváciou p-teho rádu funkcie f v bode v bode aaa ∈ M nazývame p-rozmernú maticu f(p) (aaa) = ∂p f(aaa) ∂xi1 . . . ∂xip , tvorenú parciálnymi deriváciami ∂p f(aaa)/∂xi1 . . . ∂xip , za predpokladu, že všetky jej zložky existujú a sú konečné. Pre p = 1 dostávame gradient a pre p = 2 Hesseho maticu funkcie f (pozri paragraf 12.3 a príklad 32.7.1). Na totálnu p-tu deriváciu sa možno dívať ako na kovariantný tenzor f(p) (aaa) ∈ T 0 p (Rn ). Ak navyše všetky parciálne derivácie funkcie f až do stupňa p sú spojité v nejakom okolí bodu aaa, tak podľa Clairautovej-Schwartzovej vety f(p) (aaa) je symetrický tenzor. Ním indukovaná p-homogénna forma priradí vektoru uuu = xxx − aaa ∈ Rn , kde xxx ∈ M, výraz dp f(aaa,xxx) = f(p) (aaa) ∆ (uuu) = ∂p f(aaa) ∂xi1 . . . ∂xip xi1 − ai1 . . . xip − aip (používame Einsteinovu sumačnú konvenciu), ktorý nazývame p-ty totálny diferenciál alebo totálny diferenciál p-teho rádu funkcie f v bode aaa. Hodnotu funkcie f, ktorá má v bode aaa spojité parciálne derivácie až do rádu p vrátane, možno v okolí tohto bodu vyjadriť pomocou Taylorovho rozvoja f(xxx) = f(aaa) + df(aaa,xxx) + 1 2! d2 (aaa,xxx) + . . . + 1 p! dp (aaa,xxx) + Θ(xxx)(xxx − aaa), kde Θ je spojité zobrazenie, ktoré každému bodu xxx z onoho okolia bodu aaa priradí p-homogénnu formu Θ(xxx): Rn → R a Θ(aaa) je forma identicky rovná nule. Z uvedeného vyjadrenia možno podobnou úvahou ako v paragrafe 12.3 odvodiť nasledujúce závery: 33.3.1. Veta. Nech M ⊆ Rn je otvorená množina, aaa ∈ M a f : M → R je funkcia, ktorá má v bode aaa spojité všetky parciálne derivácie až do rádu p vrátane. Predpokladajme, že v bode aaa sú všetky parciálne derivácie rádov 1 až p − 1 nulové, t. j. f(r) (aaa) = 0 pre 1 ≤ r < p, a f(p) (aaa) = 0. Potom (a) ak forma f(p) (aaa) je kladne definitná (čo môže nastať len pre párne p), tak funkcia f má v bode aaa ostré lokálne minimum; (b) ak forma f(p) (aaa) je záporne definitná (čo opäť môže nastať len pre párne p), tak funkcia f má v bode aaa ostré lokálne maximum; (c) ak forma f(p) (aaa) je indefinitná (čo nastane vždy, keď p je nepárne), tak funkcia f nemá v bode aaa extrém; ak p je párne, tak f má v bode aaa sedlo. 778 33. Symetrické a alternujúce tenzory Pre istotu pripomíname, že funkcia f : M → R má v bode aaa ∈ M sedlo, ak existujú dva lineárne nezávislé vektory uuu,vvv a kladné číslo ε také, že aaa+suuu+ tvvv; s2 + t2 ≤ ε2 ⊆ M, a funkcie fuuu aaa , fvvv aaa : (−ε, ε) → R, kde fuuu aaa (t) = f(aaa + tuuu), fvvv aaa (t) = f(aaa + tvvv) majú v bode t = 0 ostré lokálne maximum resp. minimum. Zrejme v prípade (c) sa sedlo v bode aaa ∈ M môže (no nemusí) vyskytnúť aj pre nepárne p. Ak nenastane žiaden z prípadov (a), (b), (c), t. j. ak p je párne a forma f(p) (aaa) je kladne alebo záporne semidefinitná, ale nie definitná, tak o prítomnosti ani charaktere prípadných extrémov funkcie f v bode aaa nemožno rozhodnúť len na základe znalosti p-tej totálnej derivácie f(p) (aaa). Niekedy nám v takom prípade môže pomôcť „výlet do okolia bodu aaa (pozri cvičenie 33.6). Bohužiaľ, na rozdiel od kvadratických foriem, pre p-homogénne formy párneho stupňa ≥ 4 nemáme k dispozícii jednoduchú a efektívnu metódu na určenie ich definitnosti. A tak má veta 33.3.1 väčšmi teoretický než praktický význam. 33.4 Alternujúce tenzory Nech V , W sú vektorové priestory nad poľom K a H : V p → W je p-lineárne zobrazenie. Hovoríme, že H je alternujúce zobrazenie, ak H(xxx1, . . . ,xxxp) = 0 pre všetky xxx1, . . . ,xxxp ∈ V , len čo pre nejaké i < j ≤ n platí xxxi = xxxj. Zobrazenie H sa nazýva antisymetrické, ak zámenou poradia ľubovoľných argumentov xxxi,xxxj ∈ V , kde i = j, sa výraz H(xxx1, . . . ,xxxp) ∈ W zmení na opačný. Úplne rovnako ako v dôkaze lemy 10.1.1 sa možno presvedčiť, že každé alternujúce multilineárne zobrazenie je antisymetrické. Ak charakteristika poľa K nie je 2, tak aj naopak každé antisymetrické multilineárne zobrazenie je očividne alternujúce. Ak však char K = 2, tak podmienky antisymetrie a symetrie sú zrejme ekvivalentné. Ako špeciálny prípad pre W = K dostávame pojmy alternujúceho resp. antisymetrického kovariantného tenzora nad priestorom V . Zrejme tenzor T ∈ T 0 p (V ) je antisymetrický práve vtedy, keď pre ľubovoľnú permutáciu σ ∈ Sp platí Tσ = (sgn σ) T, kde sgn σ = (−1)|σ| je znamienko permutácie σ (pozri paragraf 0.5). Podobne (zámenou vektorového priestoru V jeho duálom V ∗ ) možno definovať aj pojmy alternujúceho resp. antisymetrického kontravariantného tenzora T ∈ T p 0 (V ). Nad poľami charakteristiky = 2, špeciálne nad poľami nekonečnej charakteristiky sa pojmy alternujúci a antisymetrický tenzor môžu používať ako synonymá. Nakoľko však nehodláme zo svojich úvah zbytočne vylučovať ani polia charakteristiky 2, radšej budeme dôsledne hovoriť o alternujúcich 33.4. Alternujúce tenzory 779 tenzoroch. Kontravariantné alternujúce tenzory T ∈ T p 0 (V ) tvoria lineárny podpriestor priestoru tenzorov T p 0 (V ), ktorý značíme Altp (V ). Podobne tvoria lineárny podpriestor Altp(V ) ⊆ T 0 p (V ) kovariantné alternujúce tenzory. Vzhľadom na kanonický izomorfizmus Altp(V ) ∼= Altp (V ∗ ) sa stačí zaoberať kontravariantnými alternujúcimi tenzormi. Kvôli úplnosti (no v plnom súlade s definíciou) kladieme Alt0 (V ) = K, Alt1 (V ) = V , čiže skaláry a ∈ K a vektory xxx ∈ V považujeme za alternujúce tenzory. Jeden typ alternujúceho tenzora na vektorovom priestore V = Kn všetkých usporiadaných n-tíc, zapisovaných ako stĺpce, už dôverne poznáme. Je to determinant chápaný ako zobrazenie D = det: Kn×n → K, t. j. ako alternujúci kovariantný tenzor D ∈ Altn(Kn ). Čoskoro uvidíme, že všetky alternujúce tenzory sú v podstate „iba determinanty. Ďalej si všimnime, že pre p > n = dim V neexistujú nenulové alternujúce tenzory T ∈ T p 0 (V ), teda Altp (V ) = {0}. Z toho dôvodu je priestor alternujúcich tenzorov nad vektorovým priestorom V , čiže priamy súčet Alt(V ) = p∈N Altp (V ) = n p=0 Altp (V ), konečnorozmerný. Našim cieľom je vybaviť ho štruktúrou asociatívnej graduovanej K-algebry. Obyčajný tenzorový súčin xxx ⊗ yyy vektorov xxx,yyy ∈ V (čo sú alternujúce tenzory) však vo všeobecnosti alternujúci nie je. Pre ľubovoľné η ∈ V ∗ totiž platí (xxx ⊗ yyy)(η, η) = xxx(η)yyy(η) = η(xxx) η(yyy) = (η ⊗ η)(xxx,yyy). Z toho vidno, že ak zároveň chceme, aby naša konštrukcia mala všeobecný charakter, t. j. dala sa rovnakým spôsobom aplikovať na ľubovoľný (konečnorozmerný) vektorový priestor, o. i. aj na duál V ∗ pôvodného priestoru V , je potrebné, aby aj samotný súčin v algebre Alt(V ) bol na vektoroch xxx,yyy ∈ V alternujúcim bilineárnym zobrazením. Ku konštrukcii tejto algebry preto pristúpime z druhej strany, podobne ako sme si počínali v prípade symetrických tenzorov v paragrafe 33.1. V priestore V si zvolíme ľubovoľnú bázu βββ = (vvv1, . . . ,vvvn). Vopred sa dohodneme, že hľadaný súčin budeme značiť znakom ∧ a nazývať klinovým alebo častejšie vonkajším súčinom. Alternujúci a asociatívny súčin vvvi1 ∧· · ·∧vvvip ľubovoľných p vektorov vvvi1 , . . . ,vvvip tejto bázy je nenulový, len ak sú všetky indexy i1, . . . , ip navzájom rôzne. Pre dva takéto súčiny vvvi1 ∧. . .∧vvvip , vvviσ(1) ∧. . .∧vvviσ(p) , líšiace sa len poradím činiteľov, t. j. permutáciou σ ∈ Sp, v dôsledku antisymetrie nevyhnutne platí vvviσ(1) ∧ . . . ∧ vvviσ(p) = (sgn σ)(vvvi1 ∧ . . . ∧ vvvip ). 780 33. Symetrické a alternujúce tenzory Každý taký súčin možno preto jednoznačne zapísať v tvare ±vvvj1 ∧ . . . ∧ vvvjp , kde 1 ≤ j1 < . . . < jp ≤ n. Všetky formálne lineárne kombinácie j1<... n. Pravidlo pre súčin p-vektora vvvi1 ∧ . . . ∧vvvip ∈ Λp (V ) a q-vektora vvvj1 ∧ · · · ∧ vvvjq ∈ Λq (V ) (vvvi1 ∧. . .∧vvvip )∧(vvvj1 ∧· · ·∧vvvjq ) =    0, ak {i1, . . . , ip} ∩ {j1, . . . , jq} = ∅, vvvi1 ∧ . . . ∧ vvvip ∧ vvvj1 ∧ · · · ∧ vvvjq , ak {i1, . . . , ip} ∩ {j1, . . . , jq} = ∅, je vynútené požiadavkami alternovania a asociatívnosti, a spolu s podmienkou bilinearity jednoznačne určuje na priamom súčte Λ(V ) = p∈N Λp (V ) = n p=0 Λp (V ) štruktúru graduovanej algebry s vrstvami Λp (V ). Graduovanú algebru (Λ(V ), ∧) nazývame vonkajšou alebo tiež Grassmannovou algebrou vektorového priestoru V . Priradením vvvi1 ⊗ . . . ⊗ vvvip → vvvi1 ∧ · · · ∧ vvvip je určený surjektívny homomorfizmus graduovaných algebier T0(V ) → Λ(V ), nazývaný alternujúca kanonická projekcia. Čitateľ by si mal rozmyslieť, že samotná algebra Λ(V ) ani jej graduácia na vrstvy Λp (V ), na rozdiel od homomorfizmu T0(V ) → Λ(V ), nezávisia od výberu bázy βββ (pozri cvičenie 33.8 (a)). Na vonkajšiu algebru Λ(V ) sa vďaka tomuto surjektívnemu homomorfizmu možno pozerať ako na faktorovú algebru graduovanej tenzorovej algebry T0(V ), ktorá vznikne stotožnením všetkých tenzorových súčinov xxx1 ⊗ . . . ⊗xxxp ∈ T p 0 (V ), v ktorých sú vektory xxx1, . . . ,xxxp ∈ V lineárne závislé, s nulovým tenzorom 0 ∈ T p 0 (V ). Tento popis algebry Λ(V ) je už invariantný, t. j. nezávisí na báze (vvv1, . . . ,vvvn) (pozri cvičenie 33.8 (b), (c)). Násobenie vo vonkajšej algebre Λ(V ) je navyše kosokomutatívne alebo graduovane antikomutatívne, t. j. pre A ∈ Λp (V ), B ∈ Λq (V ) platí B ∧ A = (−1)pq (A ∧ B). 33.4. Alternujúce tenzory 781 Platnosť tejto podmienky pre p-vektor A = vvvi1 ∧ . . . ∧ vvvip a q-vektor B = vvvj1 ∧ . . . ∧ vvvjq možno nahliadnuť okamžite: stačí si uvedomiť, že na to, aby sme v súčine A ∧ B dostali všetkých q činiteľov vvvjl dopredu, musíme postupne každý z nich vymeniť s každým z p činiteľov vvvik , čo má za následok pq zmien znamienka. Všeobecný prípad vyplýva zo špeciálneho na základe multilinearity klinového súčinu. Všetkých súčinov vvvi1 ∧ · · · ∧ vvvip stupňa p, kde 1 ≤ i1 < . . . < ip ≤ n, je práve toľko, koľko je p-prvkových podmnožín množiny {1, . . . , n}. Keďže tieto súčiny tvoria bázu priestoru Λp (V ), môžeme tak určiť dimenziu jednotlivých vrstiev Λp (V ) ako aj celej vonkajšej algebry Λ(V ). 33.4.1. Tvrdenie. Vonkajšia algebra Λ(V ), ∧ n-rozmerného vektorového priestoru V je kosokomutatívna a asociatívna graduovaná K-algebra s jednotkou 1 ∈ K. Pre dimenzie jej jednotlivých vrstiev resp. celej algebry platí dim Λp (V ) = n p = n(n − 1) . . . (n − p + 1) p! , dim Λ(V ) = n p=0 n p = 2n . Vonkajšiu p-tu mocninu vektorového priestoru V niekedy značíme aj ako klinový súčin Λp (V ) = V ∧ . . . ∧ V p p exemplárov vektorového priestoru V . Vonkajší súčin sa spomedzi alternujúcich multilineárnych zobrazení vydeľuje analogickou univerzálnou vlastnosťou ako bežný tenzorový súčin spomedzi všetkých bilineárnych zobrazení resp. symetrický tenzorový súčin spomedzi všetkých symetrických multilineárnych zobrazení (porovnaj s vetami 32.2.7 a 33.1.2). 33.4.2. Veta. Nech V , W sú vektorové priestory nad poľom K, pričom V je konečnorozmerný a p ∈ N. Potom (a) operácia vonkajšieho súčinu (xxx1, . . . ,xxxp) → xxx1 ∧ . . . ∧ xxxp je alternujúce p-lineárne zobrazenie V p → Λp (V ); (b) ku každému alternujúcemu p-lineárnemu zobrazeniu H : V p → W existuje práve jedno lineárne zobrazenie H : Λp (V ) → W také, že H(xxx1 ∧ . . . ∧ xxxp) = H(xxx1, . . . ,xxxp) pre všetky xxx1, . . . ,xxxp ∈ V ; (c) priradenie H → H je lineárny izomorfizmus priestoru všetkých alternujúcich p-lineárnych zobrazení V p → W na priestor L Λp (V ), W . 782 33. Symetrické a alternujúce tenzory Dôkaz opäť prenechávame ako cvičenie čitateľovi. Ľahko možno nahliadnuť, že podmienky (a), (b) určujú priestor Λp (V ) jednoznačne až na izomorfizmus. Podmienky (b), (c) sú kľúčom k objasneniu súvisu jednotlivých priestorov alternujúcich tenzorov Altp (V ) ⊆ T p 0 (V ) s vonkajšími mocninami Λp (V ) ako aj celého priestoru alternujúcich tenzorov Alt(V ) ⊆ T0(V ) s graduovanou vonkajšou algebrou Λ(V ). Každý alternujúci tenzor T ∈ Altp (V ) ⊆ T p 0 (V ) je alternujúca p-lineárna forma T : (V ∗ )p → K. Preto podľa (b) určuje lineárny funkcionál T : Λp (V ∗ ) → K taký, že pre ľubovoľné 1 ≤ i1 < . . . < ip ≤ n platí T vvvi1 ∧ · · · ∧ vvvip = T(vvvi1 , . . . ,vvvip , kde βββ∗ = (vvv1 , . . . ,vvvn ) je duálna báza k báze βββ. Podľa (c) je priradenie T → T lineárny izomorfizmus vektorového priestoru Altp (V ) na vektorový priestor L(Λp (V ∗ ), K) = Λp (V ∗ )∗ . Lineárny funkcionál T ∈ Λp (V ∗ )∗ možno prirodzene stotožniť s výrazom T = i1<... p. Alternáciou, prípadne tiež antisymetrizáciou tenzora T ∈ T p 0 (V ) nazývame výraz alt T = 1 p! σ∈Sp (sgn σ) Tσ . Predpisom T → alt T je zrejme definované lineárne zobrazenie alt: T p 0 (V ) → T p 0 (V ), pričom tenzor T ∈ T p 0 (V ) je alternujúci práve vtedy, keď T = alt T. Navyše výraz p! (alt T) ∈ Λp (V ) je zrejme alternujúca kanonická projekcia tenzora T ∈ T p 0 (V ). Ak p + q < char K, tak súčin alternujúcich tenzorov S ∈ Altp (V ), T ∈ Altq (V ) možno definovať formulou S ¯∧ T = alt(S ⊗ T) = 1 (p + q)! σ∈Sp+q (sgn σ)(S ⊗ T)σ . Túto formulu však možno aplikovať na ľubovoľné tenzory S ∈ T p 0 (V ), T ∈ T q 0 (V ), pričom stále platí S ¯∧ T ∈ Altp+q (V ) a taktiež S ¯∧ T = alt(S ⊗ T) = alt S ¯∧ alt T. Inak povedané, alternácia T → alt T je homomorfizmom každej z graduovaných algebier T0(V ), ⊗ , T0(V ), ¯∧ na graduovanú algebru Alt(V ), ¯∧ . Tento „nový klinový súčin ¯∧ súvisí s „pôvodným klinovým súčinom ∧ jednoduchým vzťahom: pre ľubovoľný p-vektor S ∈ Altp (V ) a q-vektor T ∈ Altq (V ) platí S ¯∧ T = p! q! (p + q)! (S ∧ T) (overte si samostatne ako cvičenie). Z tejto rovnosti vyplýva izomorfizmus všetkých troch graduovaných algebier Alt(V ), ¯∧ , Alt(V ), ∧ , Λ(V ), ∧ . Takže, podobne ako vo vete 33.2.1, môžeme zhrnúť: 33.5. Dualita vo vonkajšej algebre 785 33.4.6. Veta. Nech V je konečnorozmerný vektorový priestor nad poľom charakteristiky ∞. Potom súčin ¯∧ vytvára na priestore kontravariantných tenzorov T0(V ) štruktúru kosokomutatívnej asociatívnej graduovanej algebry T0(V ), ¯∧ s jednotkou 1 ∈ K, v ktorej alternujúce tenzory tvoria graduovanú podalgebru Alt(V ) a kanonická alternujúca projekcia T → p! (alt T) pre T ∈ T p 0 (V ) je homomorfizmus každej z graduovaných algebier T0(V ), ⊗ , T0(V ), ¯∧ na graduovanú algebru Λ(V ), ∧ . Jej zúženie na podalgebru alternujúcich tenzorov je izomorfizmom graduovaných algebier Alt(V ), ¯∧ ∼= Λ(V ), ∧ . Z uvedených dôvodov sa aj súčin S ¯∧ T štandardne značí S∧T. Vzhľadom na reprezentáciu alternujúcich tenzorov prvkami vonkajšej algebry Λ(V ) však voľba konkrétneho alternujúceho súčinu v T0(V ) resp. v Alt(V ) nehrá až takú významnú úlohu. 33.5 Dualita vo vonkajšej algebre V celom paragrafe predpokladáme, že V je n-rozmerný vektorový priestor nad poľom K, βββ = (vvv1, . . . ,vvvn) je nejaká jeho báza a βββ∗ = (vvv1 , . . . ,vvvn ) je k nej duálna báza. 33.5.1. Dualita a vektorový súčin. Vektorové priestory alternujúcich tenzorov Λp (V ), Λn−p (V ), Λp(V ), Λn−p(V ) majú rovnakú dimenziu n p = n n−p , sú preto lineárne izomorfné. Pri bližšom pohľade sa ukazuje, že tieto izomorfizmy majú charakter duality. Predpis η1 , . . . , ηp ,xxx1, . . . ,xxxp → det ηi ,xxxj určuje multilineárne zobrazenie (V ∗ )p × V p → K, alternujúce v prvých a rovnako aj v druhých p argumentoch. Preto podľa vety 33.4.2 (b) (ktorú treba použiť dvakrát) indukuje bilineárnu formu F : Λp (V ∗ ) × Λp (V ) → K takú, že F η1 ∧ . . . ∧ ηp ,xxx1 ∧ . . . ∧ xxxp = det ηi ,xxxj pre xxx1, . . . ,xxxp ∈ V , η1 , . . . , ηp ∈ V ∗ . Ľahko možno nahliadnuť, že forma F je regulárna, preto predpisom Φ(η1 , . . . , ηp )(xxx1, . . . ,xxxp) = det ηi ,xxxj je podľa vety 11.1.7 definovaný kanonický lineárny izomorfizmus Φ: Λp(V ) = Λp (V ∗ ) ∼= Λp (V )∗ . Rovnako možno dospieť ku kanonickému izomorfizmu Λp (V ) = Λp(V ∗ ) ∼= Λp(V )∗ . Taktiež klinový súčin medzi vrstvami Λp (V ) a Λn−p (V ) vo vonkajšej algebre Λ(V ) je bilineárne zobrazenie ∧: Λp (V ) × Λn−p (V ) → Λn (V ). Uvedomme si, že priestor Λn (V ) je jednorozmerný s bázou (napr.) vvv1 ∧ . . . ∧ vvvn. Pre T ∈ Λn (V ) označme B(T) ten jediný skalár b ∈ K, pre ktorý platí 786 33. Symetrické a alternujúce tenzory T = b(vvv1 ∧ . . . ∧ vvvn). Potom B môžeme považovať aj za regulárnu bilineárnu formu B : Λp (V ) × Λn−p (V ) → K takú, že B(T1, T2) = B(T1 ∧ T2) pre T1 ∈ Λp (V ), T2 ∈ Λn−p (V ). Z nej dostávame lineárny izomorfizmus Λp (V ) ∼= Λn−p (V )∗ . Uvedené priradenie je však popísané pomocou bázy βββ. Vyjasníme, v akom zmysle ho možno považovať za kanonické. S inou bázou ααα = (uuu1, . . . ,vvvn) by sme pre každé T ∈ Λn (V ) mali T = b(vvv1 ∧ . . . ∧ vvvn) = a(uuu1 ∧ . . . ∧ uuun), kde a = b detPPPααα,βββ. A tak sú forma B aj ňou indukovaný izomorfizmus určené jednoznačne až na multiplikatívnu konštantu. Obraz p-vektora xxx1 ∧ . . . ∧ xxxp v izomorfizme Λp (V ) ∼= Λn−p (V )∗ je teda lineárny funkcionál Λn−p (V ) → K, ktorý značíme xxx1 × . . . × xxxp, prípadne xxx1 ∨ . . . ∨xxxp a nazývame vektorový alebo tiež duálny vonkajší súčin vektorov xxx1, . . . ,xxxp ∈ V . Jeho pôsobenie na (n − p)-vektor yyy1 ∧ . . . ∧ yyyn−p ∈ Λn−p (V ) možno pomocou súradníc v báze βββ opísať názorne ako determinant (xxx1 × . . . × xxxp)(yyy1 ∧ . . . ∧ yyyn−p) = det (xxx1)βββ, . . . , (xxxp)βββ, (yyy1)βββ, . . . , (yyyn−p)βββ . Inak povedané, xxx1 ∧ . . . ∧xxxp ∧yyy1 ∧ . . . ∧yyyn−p = (xxx1 × . . . ×xxxp)(yyy1 ∧ . . . ∧yyyn−p)(vvv1 ∧ . . . ∧vvvn). Ak vezmeme do úvahy aj skôr spomínaný kanonický izomorfizmus Λn−p (V )∗ ∼= Λn−p(V ) = Λn−p (V ∗ ) dostávame ďalší „takmer kanonický izomorfizmus Λp (V ) ∼= Λn−p (V ∗ ), takže vektorový súčin xxx1 × . . . × xxxp môžeme chápať aj ako prvok vonkajšej mocniny Λn−p (V ∗ ). V euklidovskom priestore V by sme si za βββ samozrejme zvolili nejakú ortonormálnu bázu, ktorou by sme zadali orientáciu priestoru V (pozri paragraf 15.2). Potom pre každú ortonormálnu bázu ααα zhodne orientovanú s bázou βββ by sme dostali tú istú bilineárnu formu B a ten istý lineárny izomorfizmus Λp (V ) ∼= Λn−p (V )∗ ako pre bázu βββ. Navyše po stotožnení priestoru V s jeho duálom V ∗ prostredníctvom skalárneho súčinu dostávame izomorfizmy Λp (V ) ∼= Λn−p (V ∗ ) ∼= Λn−p (V ), kanonické z hľadiska všetkých kladne orientovaných ortonormálnych báz. V tomto prípade teda môžeme vektorový súčin xxx1 × . . . × xxxp konečne považovať za (n − p)-vektor z vonkajšej mocniny Λn−p (V ). Zrejme pre p = n − 1 splýva xxx1 × . . . × xxxn−1 s vektorovým súčinom z paragrafu 15.4. 33.6. Symetrické a alternujúce tenzory v kvantovej mechanike 787 33.5.2. Vnútorný súčin a Hodgeov operátor. Dosadením pevných vektorov xxx1, . . . ,xxxp ∈ V na prvých p-miest alternujúcej (p + q)-formy F ∈ Altp+q(V ) získame q-formu iiixxx1...xxxp (F) ∈ Altq(V ) takú, že iiixxx1...xxxp (F)(yyy1, . . . ,yyyq) = F(xxx1 . . .xxxp,yyy1, . . . ,yyyq) pre yyy1, . . . ,yyyq ∈ V . Priradením xxx1, . . . ,xxxp, F → iiixxx1...xxxp (F) je dané multilineárne zobrazenie V p × Altp+q(V ) → Altq(V ) alternujúce v prvých pzložkách. To podľa viet 32.2.7 (b) a 33.4.2 (b) indukuje lineárne zobrazenie Λp (V )⊗Altp+q(V ) → Altq(V ) nazývané vnútorný súčin. Teda pre T ∈ Λp(V ), F ∈ Altp+q(V ), yyy1, . . . ,yyyq ∈ V platí iiiT (F)(yyy1, . . . ,yyyq) = F(T ∧ yyy1 ∧ . . . ∧ yyyq). Rovnako funguje aj vnútorný súčin Λp(V ) × Altp+q (V ) → Altq (V ). Pre q = 0 nám bilineárne forma (T, F) → iiiT (F): Λp (V ) × Altp(V ) → Alt0(V ) = K dáva iný pohľad na dualitu Altp(V ) = Altp (V ∗ ) ∼= Λp (V )∗ . Pre q = n − p je zasa Altn(V ) ∼= K, takže Λp (V ) ⊗ Altn(V ) ∼= Λp (V ) a predpisom ∗T = iiiT (vvv1 ∧ . . . ∧ vvvn ) je definovaný izomorfizmus ∗ : Λp (V ) ∼= Altn−p(V ) nazývaný Hodgeov operátor alebo Hodgeova dualita. Obvyklú podobu Hodgeovho operátora ∗ : Λp (V ) ∼= Λn−p(V ) dostávame po stotožnení Altn−p(V ) ∼= Λn−p(V ). V euklidovskom priestore V môžeme ďalej stotožniť V ∼= V ∗ a Λn−p(V ) = Λn−p (V ∗ ) ∼= Λn−p (V ), takže po voľbe nejakej ortonormálnej bázy βββ funguje Hodgeova dualita ∗ : Λp (V ) ∼= Λn−p (V ) kanonicky vzhľadom na všetky s ňou súhlasne orientované ortonormálne bázy. Nie je ťažké nahliadnuť, že Hodgeova dualita splýva s dualitami Λp (V ) ∼= Λn−p(V ), resp. Λp (V ) ∼= Λn−p (V ) z odstavca 33.5.1. Presnejšie, pre xxx1, . . . ,xxxp ∈ V platí xxx1 × . . . × xxxp = ∗(xxx1 ∧ . . . ∧ xxxp). 33.6 Symetrické a alternujúce tenzory v kvantovej mechanike Jeden zo základných princípov kvantovej mechaniky postuluje, že stavový priestor W kvantovo-mechanického systému S, ktorý je spojením kvantovomechanických systémov S1, . . . , Sp so stavovými priestormi V1, . . . , Vp, je „vhodný lineárny podpriestor tenzorového súčinu V1⊗. . .⊗Vp = V1⊗C. . .⊗C 788 33. Symetrické a alternujúce tenzory Vp.6 Intuitívne, rozložiteľný vektor ψ1 ⊗. . .⊗ψp reprezentuje stav systému S, zodpovedajúci situácii, keď každý z jeho podsystémov Sj je v stave ψj ∈ Vj. Nerozložiteľné stavové vektory však takúto intuitívnu reprezentáciu nemajú, v dôsledku čoho úvahy o tom, aké stavy podsystémov Sj reprezentuje všeobecný stavový vektor k ak(ψ1k ⊗. . .⊗ψpk) ∈ W, ako aj samotná predstava o rozdelení systému S na pôvodné podsystémy, strácajú jasný zmysel. Dôležité špeciálne typy kvantovomechanických systémov vznikajú spojením podsystémov pozostávajúcich z identických častíc. Stavy každého z takýchto podsystémov (to znamená stavy každej jednotlivej častice) možno reprezentovať vektormi z toho istého priestoru Vj = V . Na celý systém sa potom vzťahuje princíp nerozlíšiteľnosti rovnakých častíc. Podľa neho v takomto systéme nemožno rozlíšiť jednotlivé častice, ani určiť stavy, v ktorých sa každá z nich nachádza. Napr. v systéme pozostávajúcom z dvoch rovnakých častíc nemožno rozlíšiť celkový stav, keď je prvá častica v stave ϕ ∈ V a druhá v stave ψ ∈ V , od celkového stavu, keď je prvá v stave ψ a druhá v stave ϕ (presnejšie, takáto formulácia problému vôbec nemá zmysel). Pri matematickom modelovaní sa to prejaví tak, že stavový priestor systému je buď podpriestor symetrických tenzorov Symp (V ) ⊆ T p 0 (V ) alebo podpriestor alternujúcich (antisymetrických) tenzorov Altp (V ) ⊆ T p 0 (V ), kde p je počet identických častíc. Ktorý z oboch prípadov nastane, závisí na spine príslušného druhu častíc. Systému p rovnakých častíc s celočíselným spinom (vrátane častíc bez spinu, čiže so spinom 0) zodpovedá priestor symetrických tenzorov Symp (V ) ∼= Σp (V ). Ich chovanie podlieha tzv. Boseho-Einsteinovej štatistike a hovoríme im bozóny. Medzi bozóny patria napr. fotóny, mezóny a α-častice (jadrá hé- lia). Systému p rovnakých častíc s poloceločíselným spinom zodpovedá priestor alternujúcich tenzorov Altp (V ) ∼= Λp (V ). Ich chovanie sa riadi tzv. FermihoDiracovou štatistikou a hovoríme im fermióny. Medzi fermióny patria napr. elektróny a protóny (a ich antičastice – pozitróny a antiprotóny), ako aj neutróny. Ak (ψ1, . . . , ψn) je nejaká ortonormálna báza stavového priestoru V , tak stav systému p identických bozónov „k1 častíc v stave ψ1, k2 častíc v stave ψ2, . . . , kn častíc v stave ψn fyzici zvyčajne zapisujú ako symetrický tenzor |k1, . . . , kn = p k1, . . . , kn −1/2 ψk1 1 . . . ψkn n ∈ Σp (V ), kde k1, . . . , kn sú nezáporné celé čísla také, že k1 +. . .+kn = p. Podobne, stav systému p identických fermiónov „po jednej častici v stavoch ψj1 , . . . , ψjp , 6 V typickom prípade, keď aspoň dva z Hilbertových priestorov V1, . . . , Vp sú nekonečnorozmerné, je potrebné nahradiť tenzorový súčin V1 ⊗ . . . ⊗ Vp jeho zúplnením. Túto technickú komplikáciu však nebudeme brať do úvahy. 33.6. Symetrické a alternujúce tenzory v kvantovej mechanike 789 kde 1 ≤ j1 < . . . < jp ≤ n, sa zvykne zapisovať ako alternujúci tenzor |k1, . . . , kn = (p!)−1/2 (ψj1 ∧ . . . ∧ ψjp ) ∈ Λp (V ), kde pre j ≤ n platí kj = 1, ak j ∈ {j1, . . . , jp}, a kj = 0 v opačnom prípade. Čísla k1, . . . , kn zakaždým udávajú stupne zaplnenia jednotlivých bázických stavov ψ1, . . . , ψn. Normujúce koeficienty p k1,...,kn −1/2 resp. (p!)−1/2 sa môžu líšiť podľa voľby konkrétnej reprezentácie symetrického súčinu v Symp (V ) resp. vonkajšieho súčinu v Altp (V ). Symetria stavového tenzora |k1, . . . , kn ∈ Σp (V ) znamená, že dva „mysliteľné stavy ψi1 ⊗ . . . ⊗ ψip , ψj1 ⊗ . . . ⊗ ψjp systému p identických bozónov, líšiace sa len poradím činiteľov ψj sú nerozlíšiteľné, teda nemôžu vystupovať oddelene, ale iba ako súčasť toho istého symetrického tenzora ψi1 . . . ψip = ψj1 . . . ψjp = ψk1 1 . . . ψkn n . Z toho, že stavový tenzor |k1, . . . , kn ∈ Λp (V ) systému p identických fermiónov je alternujúci, vyplýva obmedzujúca podmienka kj ∈ {0, 1} na stupne zaplnenia jednotlivých bázických stavov. Ide o matematický prejav tzv. Pauliho vylučovacieho princípu, podľa ktorého v systéme identických fermiónov sa žiadne dve častice nemôžu nachádzať v rovnakom stave. Antisymetria takýchto tenzorov je už čisto matematickým dôsledkom ich alternovania a multilinearity. Keďže v priebehu vývoja kvantovomechanického systému môžu častice vznikať i zanikať, je potrebné matematicky zachytiť aj systémy s premenným počtom identických bozónov resp. fermiónov. Prvému prípadu zodpovedá symetrická algebra Σ(V ) = p∈N Σp (V ), druhému vonkajšia algebra Λ(V ) = p∈N Λp (V ). Stojí za povšimnutie, že v typickom prípade nekonečnorozmerného Hilbertovho priestoru V sú netriválne všetky priame sčítance Λp (V ), p ∈ N. Naopak, ak V má konečný rozmer n, tak z Pauliho vylučovacieho princípu vyplýva, že takýto systém môže obsahovať nanajvýš n častíc. Taktiež si treba uvedomiť, že v oboch prípadoch tenzor |0, . . . , 0, . . . pozostávajúci zo samých núl (či už ich je konečne alebo nekonečne mnoho) nepredstavuje nulový tenzor 0 (ktorému napokon nezodpovedá žiaden stav systému), ale nenulový skalár z priestoru Σ0 (V ) = Λ0 (V ) = C. Dohodou stanovujeme |0, . . . , 0, . . . = 1. Uvedený tvar stavových tenzorov umožňuje veľmi názorný zápis napr. anihilačných a k nim združených kreačných operátorov. Jednotlivé operátory anihilácie resp. kreácie Aj, A∗ j : Σ(V ) → Σ(V ) bozónu v stave ψj vyzerajú takto: Aj|k1, . . . , kj, . . . , kp = kj |k1, . . . , kj ˙− 1, . . . , kp , A∗ j |k1, . . . , kj, . . . , kp = kj + 1 |k1, . . . , kj + 1, . . . , kp , 790 33. Symetrické a alternujúce tenzory kde k ˙− 1 = max{0, k − 1}. Jednoduché overenie komutačných vzťahov [Ai, Aj] = [A∗ i , A∗ j ] = 0, [Ai, A∗ j ] = δij id prenechávame čitateľovi. Pre operátory anihilácie resp. kreácie Aj, A∗ j : Λ(V ) → Λ(V ) fermiónu v stave ψj máme vyjadrenia Aj|k1, . . . , kj, . . . , kp = (−1)k1+...+kj−1 kj |k1, . . . , kj ˙− 1, . . . , kp , A∗ j |k1, . . . , kj, . . . , kp = (−1)k1+...+kj−1 kj ⊕ 1 |k1, . . . , kj ⊕ 1, . . . , kp , kde ⊕ označuje sčítanie modulo 2. Znamienkový faktor (−1)k1+...+kj−1 má konvenčný charakter a mohol by sa voliť aj inak. Ľahko možno overiť, že ľubovoľné dva kreačné resp. anihilačné operátory antikomutujú, t. j. AiAj = −AjAi a A∗ i A∗ j = −A∗ j A∗ i . Pre kompozície anihilačného a kreačného operátora však platí AiA∗ j + A∗ j Ai = δij id. Ak si teda označíme {A, B} = AB + BA antikomutátor operátorov A, B, dostávame tzv. antikomutačné vzťahy {Ai, Aj} = {A∗ i , A∗ j } = 0, {Ai, A∗ j } = δij id . Špeciálne A∗ j A∗ j = 0, teda v zhode s Pauliho vylučovacím princípom nie je možné kreovať dva identické fermióny v tom istom stave ψj. Význam kreačných a anihilačných operátorov spočíva hlavne v tom, že – podobne ako sme to videli v paragrafe 26.10 pri kvantovom harmonickom oscilátore – s ich pomocou možno vyjadriť hamiltonián systému aj viacero ďalších hermitovských operátorov zodpovedajúcich pozorovateľným fyzikálnym veličinám, popisujúcim jeho vlastnosti. Napr. hermitovský operátor A∗ j Aj popisuje v oboch prípadoch počet častíc v stave ψj a operátor n j=1 A∗ j Aj udáva počet všetkých častíc v systéme. Cvičenia 33.1. (a) Dokážte vetu 33.1.2. (b) Sformulujte, čo presne znamená, že priestor Σp (V ) je podmienkami (a), (b) tejto vety určený jednoznačne až na izomorfizmus, a dokážte to. 33.2. (a) Nech ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) sú dve bázy vektorového priestoru V . Dokážte, že priradenie uuui → vvvi možno jednoznačne rozšíriť do izomorfizmu graduovaných algebier K[uuu1, . . . ,uuun] ∼= K[vvv1, . . . ,vvvn]. Odvoďte z toho, že symetrická algebra Σ(V ) nezávisí na báze priestoru V . (b) Označme Jsym najmenší ideál graduovanej algebry T0(V ), ktorý obsahuje Cvičenia 791 všetky prvky tvaru T − Tσ , kde T ∈ T p 0 (V ) a σ ∈ Sp pre p ∈ N (pozri cvičenie 30.6). Dokážte, že graduovaná symetrická algebra Σ(V ) je izomorfná s faktorovou algebrou T0(V )/Jsym, čo je invariantný (t. j. na báze priestoru V nezávislý) popis symetrickej algebry Σ(V ). (c) Nájdite kanonický (t. j. na báze priestoru V nezávislý) lineárny izomorfizmus Σp (V )∗ ∼= Σp (V ∗ ). 33.3. (a) Dokážte že počet všetkých usporiadaných p-tic (i1, . . . , ip) prvkov z množiny {1, . . . , n}, ktoré obsahujú každý z indexov i ≤ n práve ki-krát udáva polynomický koeficient p k1,...,kn = p! k1!...kn! . (b) Dokážte, že tento počet je rovnaký ako počet rozkladov množiny {1, . . . , p} na na n disjunktných nie nevyhnutne neprázdnych podmnožín, ktoré majú postupne k1, . . . , kn prvkov. (c) Dokážte tzv. polynomickú vetu (pre p = 2 ide samozrejme o binomickú vetu): Pre prvky a1, . . . , an ∈ K platí (a1 + . . . + an)p = p k1, . . . , kn ak1 1 . . . akn n , kde súčet prebieha cez všetky usporiadané n-tice nezáporných celých čísel k1, . . . , kn takých, že k1 + . . . + kn = p. (d) Odvoďte z toho identitu p k1,...,kn = np (pri rovnakej sumácii ako v (c)). 33.4. Nech char K > p a f : Kn → K je p-homogénna forma daná predpisom f(xxx) = k1+...+kn=p ak1...kn xk1 1 . . . xkn n . Označme pol f = T = i1...ip Ti1...ip eeei1 ⊗. . .⊗eeeip . Nájdite explicitné vyjadrenie zložiek Ti1...ip symetrického tenzora T pomocou koeficientov ak1...kn . 33.5. Odvoďte explicitný vzťah (vvvi1 ⊗. . .⊗vvvip ) (vvvj1 ⊗. . .⊗vvvjq ) = p k1,...,kn q l1,...,ln p+q k1+l1,...,kn+ln (vvvi1 ⊗. . .⊗vvvip )·(vvvj1 ⊗. . .⊗vvvjq ) medzi oboma symetrickými súčinmi bázických vektorov vvvi1 ⊗ . . . ⊗ vvvip ∈ T p 0 (V ), vvvj1 ⊗ . . . ⊗ vvvjq ∈ T q 0 (V ), kde ki = # {r ≤ p; ir = i}, lj = # {s ≤ q; js = j}. 33.6. Zdôvodnite platnosť nasledujúceho dodatku k vete 33.3.1 (porovnajte s cvičením 12.9). Nech M ⊆ Rn je otvorená množina, aaa ∈ M a f : M → R je funkcia, ktorá má v bode aaa spojité všetky parciálne derivácie až do rádu p vrátane. Predpokladajme, že v bode aaa sú všetky parciálne derivácie rádov 1 až p − 1 nulové, t. j. f(r) (aaa) = 0 pre 1 ≤ r < p, pričom p je párne číslo. (a) Ak forma f(p) (xxx) je kladne (záporne) definitná pre všetky xxx = aaa z nejakého okolia N ⊆ M bodu aaa, tak f má v bode aaa ostré lokálne minimum (maximum); (b) Ak forma f(p) (xxx) je kladne (záporne) semidefinitná pre všetky xxx = aaa z nejakého okolia N ⊆ M bodu aaa, tak f má v bode aaa lokálne minimum (maximum). (c) Ak forma f(p) (xxx) je indefinitná pre všetky xxx = aaa z nejakého okolia N ⊆ M bodu aaa, tak f má v bode aaa sedlo. 792 33. Symetrické a alternujúce tenzory 33.7. (a) Dokážte vetu 33.4.2. (b) Sformulujte, čo presne znamená, že priestor Λp (V ) je podmienkami (a), (b) tejto vety určený jednoznačne až na izomorfizmus, a dokážte to. 33.8. Kvôli zdôrazneniu úlohy bázy βββ = (vvv1, . . . ,vvvn) pri konštrukcii vonkajšej algebry vektorového priestoru V budeme miesto Λ(V ) na chvíľu písať Λ(vvv1, . . . ,vvvn). (a) Nech ααα = (uuu1, . . . ,uuun), βββ = (vvv1, . . . ,vvvn) sú dve bázy vektorového priestoru V . Dokážte, že priradenie uuui → vvvi možno jednoznačne rozšíriť do izomorfizmu graduovaných algebier Λ(uuu1, . . . , . . .uuun) ∼= Λ(vvv1, . . . , . . .vvvn). Odvoďte z toho, že symetrická algebra Λ(V ) nezávisí na báze priestoru V . (b) Označme Jalt najmenší ideál graduovanej algebry T0(V ), ktorý obsahuje všetky prvky tvaru T −(sgn σ)Tσ , kde T ∈ T p 0 (V ) a σ ∈ Sp pre p ∈ N (pozri cvičenie 30.6). Dokážte, že graduovaná vonkajšia algebra Λ(V ) je izomorfná s faktorovou algebrou T0(V )/Jalt. Odvoďte z toho, že symetrická algebra Λ(V ) nezávisí na báze priestoru V . (c) Dokážte, že vektory xxx1, . . . ,xxxp ∈ V sú lineárne závislé práve vtedy, keď xxx1 ⊗ . . . ⊗ xxxp ∈ Jalt, t. j. práve vtedy, keď xxx1 ∧ . . . ∧ xxxp = 0. (d) Nájdite kanonický (t. j. na báze priestoru V nezávislý) lineárny izomorfizmus Λp (V )∗ ∼= Λp (V ∗ ). 33.9. Odvoďte explicitnú formulu S ∧ T = (S ∧ T)± = σ∈Ssh p,q (sgn σ)(S ⊗ T)σ , pre vonkajší súčin alternujúcich tenzorov S ∈ Altp (V ), T ∈ Altq (V ), kde množina Ssh p,q = {σ ∈ Sp+q; σ(1) < . . . < σ(p) & σ(p + 1) < . . . < σ(p + q)} je tvorená všetkými tzv. (p, q)-premiešanými (t. j. shuffle) permutáciami množiny {1, . . . , p+ q}. 33.10. Za predpokladu char K > p + q dokážte vzťah medzi oboma vonkajšími súčinmi S ¯∧ T = p! q! (p + q)! (S ∧ T) alternujúcich tenzorov S ∈ Altp (V ), T ∈ Altq (V ). Rozšírte jeho platnosť (ak treba, po prípadnej úprave) na ľubovoľné kontravariantné tenzory S ∈ T p 0 (V ), T ∈ T q 0 (V ). 33.11. Nech V je vektorový priestor nad poľom K, dim V = n. Anulátorom p-vektora T ∈ Λp (V ) nazývame množinu An T = {xxx ∈ V ; T ∧ xxx = 0}. Dokážte postupne nasledujúce tvrdenia: (a) Anulátor An T ľubovoľného p-vektora T ∈ Λp (V ) je lineárny podpriestor vo V . (b) Ak aaa1, . . . ,aaap ∈ V sú lineárne nezávislé 1-vektory, tak An(aaa1 ∧ . . . ∧ aaap) = [aaa1, . . . ,aaap]. (c) Pre T ∈ Λp (V ), U ∈ Λq (V ) platí An T ⊆ An U práve vtedy, keď T delí U, t. j. q ≥ p a U = T ∧ S pre nejaké S ∈ Λq−p (V ). (d) Pre nenulový p-vektor T ∈ Λp (V ) platí dim An T = p práve vtedy, keď T je Cvičenia 793 rozložiteľný p-vektor, t. j. T = xxx1 ∧ . . . ∧ xxxp pre nejaké xxx1, . . . ,xxxp ∈ V . (e) Nenulový 2-vektor T ∈ Λ2 (V ) je rozložiteľný práve vtedy, keď T ∧ T = 0. (f) Každý (n − 1)-vektor T ∈ Λn−1 (V ) je rozložiteľný. 33.12. Nech V je euklidovský priestor so skalárnym súčinom ·, · . (a) Dokážte, že formulou xxx1 ∧ . . . ∧ xxxp,yyy1 ∧ . . . ∧ yyyp = det xxxi,yyyj je daný skalárny súčin na vonkajšej mocnine Λp (V ). (b) Pre ľubovoľné 1-vektory xxx1, . . . ,xxxp ∈ V platí xxx1 ∧ . . . ∧ xxxp = detGGG(xxx1, . . . ,xxxp) 1/2 = volp(xxx1, . . . ,xxxp), kde GGG(xxx1, . . . ,xxxp) je Gramova matica a volp(xxx1, . . . ,xxxp) je p-rozmerný objem rovnobežnostena vytvoreného vektormi xxx1, . . . ,xxxp ∈ V . Dokážte a porovnajte s paragrafom 15.3. 33.13. Pre konečnorozmerné priestory a p ≤ dim V + dim W popište kanonické lineárne izomorfizmy Σp (V ⊕ W) ∼= p k=0 Σk (V ) ⊗ Σp−k (W), Λp (V ⊕ W) ∼= p k=0 Λk (V ) ⊗ Λp−k (W) pre p-tu symetrickú resp. vonkajšiu mocninu priameho súčtu V ⊕ W. 33.14. (a) Dokážte, že vnútorný súčin V × Alt(V ∗ ) → Alt(V ∗ ) sa voči vonkajšiemu súčinu správa ako graduovaná derivácia, t. j. pre xxx ∈ V , F ∈ Altp (V ∗ ) = Altp(V ), G ∈ Altq (V ∗ ) = Altq(V ) platí iiixxx(F ∧ G) = iiixxx(F) ∧ G + (−1)p F ∧ iiixxx(G) . (b) Dokážte, že pre ľubovoľné xxx,yyy ∈ V platí iiixxx ◦ iiixxx = 0, iiixxx ◦ iiiyyy = −(iiiyyy ◦ iiixxx). (c) Vyjadrite obe rovnosti v (b) jednotným spôsobom ako antikomutačný vzťah pre operátory iiixxx, iiiyyy. 33.15. Zaveďte vnútorný súčin aj pre symetrické tenzory; sformulujte a overte jeho základné vlastnosti. 33.16. Predpokladajme, že V je euklidovský priestor a každá z vonkajších mocnín Λp (V ) je vybavená skalárnym súčinom tak, ako v cvičení 33.12. (a) Dokážte, že Hodgeov operátor ∗: Λp (V ) → Λn−p (V ) je izometria. (b) Overte, že kompozícia ∗ ◦ ∗ Hodgeových operátorov ∗: Λp (V ) → Λn−p (V ) a ∗: Λn−p (V ) → Λp (V ) je (−1)p(n−p) násobok identického operátora. 33.17. (a) Overte komutačné resp. antikomutačné vzťahy pre anihilačné a kreačné operátory Ai, A∗ j bozónov resp. fermiónov. (b) Nájdite vlastné hodnoty a k nim príslušné vlastné podpriestory hermitovských operátorov počtu častíc A∗ j Aj a n j=1 A∗ j Aj pre bozóny, t. j. ako operátorov Σ(V ) → Σ(V ), aj pre fermióny, t. j. ako operátorov Λ(V ) → Λ(V ). Literatúra [1] A. V. Archangeľskij, Konečnomernyje linejnyje prostranstva, Izdateľstvo Moskovskogo universiteta, Moskva, 1982. [2] L. Bican, Lineární algebra, Matematický seminář, SPN, Praha, 1979. [3] G. Birkhoff, S. Mac Lane, Prehľad modernej algebry, Alfa, Bratislava, 1979. [4] L. Boček, Tensorový počet, Matematický seminář, SPN, Praha, 1978. [5] M. L. Curtis, Matrix Groups, Springer Verlag, New York, 1984. [6] B. A. Dubrovin, A. T. Fomenko, S. P. Novikov, Sovremennaja geometrija, Metody i priloženija, časť I, Nauka, Moskva, 1979, (anglický preklad Modern Geometry, Methods and Applicatons, Springer Verlag, New York, 1984). [7] A. K. Faddejev, J. S. Sominskij, Zbierka úloh z vyššej algebry Alfa, Bratislava, 1968. [8] L. D. Faddejev, O. A. Jakubovskij, Lekcii po kvantovoj mechanike dľa studentov-matematikov, Izdateľstvo Leningradskogo universiteta, Leningrad, 1980. [9] M. Fecko, Diferenciálna geometria a Lieove grupy pre fyzikov Iris, Bratislava, 2004. [10] F. R. Gantmacher, Teorija matric, Nauka, Moskva, 1966. [11] I. M. Geľfand, Lekciji po linejnoj algebre, Nauka, Moskva, 1966. [12] L. I. Golovina, Linejnaja algebra i nekotoryje jejo priloženija Nauka, Moskva, 1985. [13] W. H. Greub, Multilinear Algebra, Springer-Verlag, Berlin, 1967. [14] P. R. Halmos, Finite-Dimensional Vector Spaces, Springer Verlag, New York, 1974. [15] L. Hogben (ed.), Handbook of Linear Algebra, Chapman & Hall/CRC, Boca Raton, FL 2007. [16] V. Chvál, M. Mikola, Lineárna algebra, Katolícka univerzita, Ružomberok, 2000. [17] D. Ilkovič, Fyzika I, II, (4. vyd.), Alfa, Bratislava, SNTL, Praha, 1968. [18] V. A. Iľjin, E. G. Pozňak, Linejnaja algebra Nauka, Moskva, 1978. Literatúra 795 [19] P. Kaprálik, J. Tvarožek, Zbierka riešených príkladov z lineárnej algebry a analytickej geometrie, Alfa, Bratislava, 1987. [20] T. Katriňák, M. Gavalec, E. Gedeonová, J. Smítal, Algebra a teoretická aritmetika I, (3. vydanie), Univerzita Komenského, Bratislava, 1999. [21] J. Korbaš, Lineárna algebra a geometria I, Univerzita Komenského, Bratislava, 2003. [22] A. I. Kostrikin, Ju. I. Manin, Linejnaja algebra i geometrija, Nauka, Moskva, 1986, (anglický preklad Linear algebra and geometry, Gordon & Breach, New York, 1989). [23] J. Kvasnica, Matematický aparát fyziky, Academia, Praha, 1989. [24] D. C. Lay, Linear Algebra and Its Applications, Addison-Wesley, Boston, 2003. [25] O. Litzman, M. Sekanina, Užití grup ve fyzice, Academia, Praha, 1982. [26] S. Mac Lane, G. Birkhoff, Algebra, (2. vydanie), Alfa, Bratislava, 1974. [27] A. I. Maľcev, Osnovy linejnoj algebry, Nauka, Moskva, 1975. [28] R. Merris, Multilinear Algebra, Gordon Breach, Amsterdam, 1997. [29] L. Motl, M. Zahradník, Pěstujeme lineární algebru, Univerzita Karlova, vydavatelství Karolinum, Praha, 1995. [30] M. Neusel, Invariant Theory, Student Mathematical Library, American Mathematical Society, Providence, Rhode Island, 2006. [31] J. Pišút, L. Gomolčák, V. Černý, Úvod do kvantovej mechaniky, Alfa, Bratislava, 1983. [32] J. Slovák, Lineární algebra, skriptá PřF MU, Brno, 1995, elektronický učebný text dostupný na sieti, http://www.math.muni.cz/∼ slovak [33] J. Smítal, E. Gedeonová, Lineárna algebra, skriptá MFF UK, Bratislava, 1981. [34] G. Strang, Linear Algebra and its Applications, Thomson Brooks/Cole, 2006. [35] F. Šik, Lineární algebra zaměřená na numerickou analýzu, Masarykova univerzita, Brno, 1998. [36] K. Tapp, Matrix Groups for Undergraduates, Student Mathematical Library, American Mathematical Society, 2005. [37] V. Votruba, Základy speciální teorie relativity, Academia, Praha, 1969. Register λ-ERO, 438 λ-ESO, 438 λ-matica, 438 invertibilná, 438 konštantná, 438 v kanonickom tvare, 439 λ-matice λ-ekvivalentné, 438 K-algebra, 668 algebra Lieova maticovej grupy, 705 absolútna hodnota kvaterniónu, 682 aditívny zápis, 580 afinná kombinácia, 149 afinná transformácia, 161 afinné podpriestory čiastočne rovnobežné, 158 disjunktné, 157 mimobežné, 158 rovnobežné, 157 rôznobežné, 158 afinné rozšírenie lineárnej grupy, 638, 639 afinné súradnice bodu, 164 afinné zobrazenie, 159 afinný obal, 153 afinný podpriestor, 150 afinný priestor, 148 akcia grupy, 617 pravá, 618 ľavá, 617 algebra, 668 faktorová, 697 invariantov, 698 Lieova, 702 algebra polynomických funkcií, 673 algebra s delením, 684 algebraická váha spektra, 380 algebraický doplnok, 194 algebraický uzáver poľa, 389 algebry izomorfné, 669 amplitúda pravdepodobnosti, 358, 359 anihilačný operátor, 568 asymptotická plocha jednodielneho eliptického hyperboloidu, 517 automorfizmus grupy, 621 axiómy teórie grúp, 580 barycentrická kombinácia, 149 barycentrické súradnice bodu, 164 báza, 98, 105 duálna, 724 Hamelova, 106 Jordanova, 401 kanonická, 101 kladne orientovaná, 295 neusporiadaná, 106 ortogonálna, 251, 342 ortonormálna, 251, 342 usporiadaná, 105 vektorového priestoru, 98 vzhľadom na podpriestor, 418 záporne orientovaná, 295 báza lineárnej algebry, 668 bázy súhlasne orientované, 295 Besselovu nerovnosť, 261 Bianchiho klasifikácia, 715 bilineárna forma, 208, 212 antisymetrická, 212 regulárna, 211 singulárna, 211 symetrická, 212 bilineárne zobrazenie, 207 binomická veta, 429 blok ekvivalencie, 27 bod funkcie Register 797 kritický, 234 sedlový, 237 stacionárny, 234 body afinne nezávislé, 153 kolineárne, 163 komplanárne, 163 nekolineárne, 163 nekomplanárne, 163 boost, 652 Cauchyho-Schwartzova nerovnosť, 248, 340 Cayleyho čísla, 684 centralizátor podgrupy, 631 prvku, 622 centrum grupy, 623 cesta, 655 uzavretá, 661 cirkulant, 398 cirkulatná matica, 398 Cramerovo pravidlo, 200 cyklická báza, 433 cyklická grupa, 585 cyklický generátor, 433, 576 cyklický podpriestor, 433, 576 cyklický rád, 433 časopriestorová odľahlosť, 310 časové vektory súhlasne orientované, 316 časový šíp, 316 číslo celé, 39 komplexné, 39 komplexne združené, 51 prirodzené, 39 racionálne, 39 reálne, 39 čistý stav, 357 de Broglieova vlnová funkcia, 549 bezčasová, 549 normovaná, 557 definičný obor potenčného radu, 447 deliteľnosť polynómov, 379 derivácia grupy, 615 determinant, 189 Gramov, 247 determinantové delitele λ-matice, 439 diagonála matice, 56 dimenzia afinného priestoru, 153 vektorového priestoru, 99 dimenzia lineárnej algebry, 668 dimenzia maticovej grupy, 711 Diracova δ-funkcia, 551 disjunktné množiny, 17 diskrétna Fourierova transformácia, 676 disperzia náhodnej premennej, 286 disperzia pozorovateľnej, 546 dĺžka permutácie, 24 dĺžka vektora, 245, 248, 340 dotykový vektor, 704 duál, 723 druhý, 723 duál vektorového priestoru, 127 dualita, 723 duálny priestor, 723 Einsteinova konvencia, 741 ekvivalentné sústavy, 69 elementárna matica, 136 elementárna riadková operácia na λ-matici, 438 elementárna stpĺpcová operácia na λ-matici, 438 elementárne operácie, 73 riadkové, 73 stĺpcové, 73 elipsa, 510 elipsoid rotačný pretiahnutý, 516 sploštený, 516 vajcovitý, 516 elipsoid trojosý, 516 endormorfizmus grupy, 621 ERO, 73 ESO, 73 euklidovská grupa, 645 euklidovský priestor, 245 Eulerov vzťah zovšeobecnený, 685 Eulerova funkcia, 613 Eulerove parametre, 688 Eulerove uhly, 493, 716 Eulerove vzťahy, 324 excentricita elipsy, 522 hyperboly, 523 798 Register exponenciála, 452 faktorová algebra, 697 faktorová grupa, 595 faktorový priestor, 182 Feynmanov integrál, 360 forma p-homogénna, 673 bilineárna, 208, 212 kvadratická, 213 lineárna, 723 multilineárna, 736 polárna, 213 poldruhalineárna, 336 formálna derivácia polynómu, 430 formálna derivácia potenčného radu, 447 Fourierov rad exponenciálny, 539 komplexný, 539 trigonometrický, 539 Fourierova transformácia, 346, 559 diskrétna, 346, 676 diskrétna dvojrozmerná, 349 spojitá, 559 fundamentálna matica sústavy, 464 fundamentálny systém riešení, 167 funkcia, 18 Hamiltonova, 351 periodická, 261 polynomická homogénna, 673 rozložiteľná, 726 funkcionál lineárny, 127 fyzikálny priestor okamžitý, 319 subjektívny, 319 Galileova transformácia, 125, 164 Gaussova eliminácia, 79 Gaussova rovina, 51 Gaussova-Jordanova eliminácia, 73 generátor voľný, 603 generujúca množina, 85 geometrická váha spektra, 380 goniometrický tvar kvaterniónu, 685 gradient, 235 gradient funkcie, 750 graduácia, 671 Gramov determinant, 247, 307 Gramov-Schmidtov ortogonalizačný proces, 252 Gramova matica, 247, 307 grupa, 579 abelovská, 580 alternujúca, 584 automorfizmov grupy, 621 cyklická, 585 dihedrálna, 583 duálna, 609 euklidovská, 645 faktorová, 595 charakterov, 609 komplexných jednotiek, 584 komutatívna, 580 konečná, 580 konečne generovaná, 585 konečne prezentované, 606 kvaterniónová, 630 lineárnych operátorov jednoparametrická, 589 Lorentzova, 647 Möbiova, 666 maticová, 636 jednoparametrická, 589 metacyklická, 606 nekonečná, 580 ortogonálna, 644 Poincarého, 647 prezentovaná množinou generátorov a množinou slov, 605 priamo nerozložiteľná, 599 pseudoortogonálna, 646 pseudounitárna, 653 spinorová, 692 symetrická, 581 symplektická, 693 špeciálna lineárna, 637 špeciálna ortogonálna, 644 špeciálna pseudoortogonálna, 646 špeciálna pseudounitárna, 653 špeciálna unitárna, 653 unitárna, 653 vlastná špeciálna pseudoortogonálna, 660 voľná, 603 všeobecná afinná, 639 všeobecná lineárna, 581, 635 Register 799 všeobecná projektívna, 666 grupa automorfizmov vektorového priestoru, 635 grupa transformácií, 616 grupa vnútorných automorfizmov, 622 grupová algebra, 674 grupové slovo redukované, 603 grupy izomorfné, 587 hamiltonián, 351, 563 modifikovaný, 569 hamiltonián kvantového harmonického oscilátora, 568 Hamiltonov operátor, 564 Hamiltonova funkcia, 351 harmonický oscilátor, 535 Heisenbergov vzťah neurčitosti, 546 Heisenbergove komutačné vzťahy, 557 Hermitove polynómy, 572 hermitovský lineárny operátor, 526 kladný, 526 nezáporný, 526 pozitívny, 526 Hilbertov priestor, 357 hladká krivka, 704 hlavné osi kvadratickej formy, 505 kvadriky, 509 hodnosť kvadratickej formy, 215 lineárneho zobrazenia, 119 matice, 133 hodnosť kvadriky, 506 holomorf grupy, 626 holomorfizmus grupy, 633 homomorfizmus nakrývajúci, 690 homomorfizmus algebier, 669 homomorfizmus graduovaných algebier, 671 homomorfizmus grúp, 586 triválny, 586 homomorfný obraz grupy, 596 homotopia, 660 hustota normálneho rozdelenia, 575 hyperbola, 510 rovnoosá, 510 hyperboloid eliptický dvojdielny, 516 jednodielny, 516 hyperboloid rotačný jednodielny, 517 charakter abelovskej grupy, 608 charakteristická hodnota, 368 charakteristický vektor, 368 charakteristika poľa, 42 ideál K-algebry, 697 ideál generovaný množinou, 697 imaginárna časť kvaterniónu, 681 imaginárna jednotka, 684 index kontravariantný, 740 kovariantný, 740 index podgrupy, 590 inerciálna svetočiara, 314 inerciálna vzťažná sústava, 320 infinitezimálny generátor jednoparametrickej grupy, 706 interpolačný polynóm, 203 invariant grupy, 698 invariantný podpriestor, 368 inverzná matica, 134 iterácia zobrazenia, 20 Iwasawov rozklad, 262, 362 izometria, 640 izometria kvadratickej formy, 640 izometria priestoru, 640 izomorfizmus kanonický, 723 lineárny, 119 izomorfizmus algebier, 669 izomorfizmus grúp, 587 Jacobiho identita, 304, 702 Jacobiho matica, 279 jadro homomorfizmu, 587 jadro lineárneho zobrazenia, 117 jakobián, 279 jednoducho súvislá množina, 661 jednotka kvaterniónová, 630, 682 jednotka grupy, 580 jednotka lineárnej algebry, 668 jednotkový prvok grupy, 580 Jordanov blok, 382 Jordanov kanonický tvar, 399 matice, 399 800 Register Jordanova báza, 401 Jordanova bunka, 382 zovšeobecnená, 410 kanonický tvar Jordanov, 399 primárny, 435 racionálny, 436 klasifikácia kvadrík afinná, 505 metrická, 505 Kleinova fľaša, 700 kolmý priemet vektora, 265 kombinácia afinná, 149 barycentrická, 149 lineárna, 47 komplexifikácia lineárneho zobrazenia, 392 vektorového priestoru, 391 komponenta súvislosti, 655 kompozícia zobrazení, 19 komutant, 615 komutatívny diagram, 19 komutátor, 702 komutátor asociatívnej algebry, 703 komutátor matíc, 471 komutátor prvkov v grupe, 615 konečnorozmerný priestor, 98 kongruencia na grupe, 594 kongruencia na lineárnej algebre, 696 konjugácia kvaterniónu, 687 kontrakcia tenzora, 746 konvergencia maticového radu, 449 postupnosti matíc, 448 konvergencia podľa stredu, 540 konvexná množina, 666 konvolúcia, 348, 674 cyklická, 348 funkcií, 542 postupností, 542 korelačný koeficient, 287 koreň polynómu, 379 koreňový podpriestor, 412 kosé pole, 684 kovariancia náhodných premenných, 290 kovektor, 725 krátka exaktná postupnosť rozštiepená, 628 kreačný operátor, 568 kritický bod funkcie, 234 Kroneckerov súčin vektorov, 752 Kroneckerov symbol, 60 kruhová frekvencia, 535 kružnica, 510 kužeľosečka, 505, 510 kužeľová plocha eliptická, 515 rotačná, 516 kvadratická forma, 213 indefinitná, 230 kladne definitná, 230 kladne semidefinitná, 230 regulárna, 215 singulárna, 215 záporne definitná, 230 záporne semidefinitná, 230 kvadratická plocha, 515 kvadrika, 505 nestredová, 506 stredová, 506 kvadrika nestredová, 508 regulárna, 508 singulárna, 508 kvadrika stredová homogénna, 507 nehomogénna, 507 regulárna, 507 singulárna, 507 kvantová mechanika, 353 kvantový harmonický oscilátor, 567 kvaternión skalárny, 681 vektorový, 681 združený, 681 kvaterniónová jednotka, 682 kvaternióny, 679 Laplaceov integrál, 570 Laplaceov operátor, 564 Laplaceov rozvoj determinantu, 194, 203 podľa vybraných riadkov, 203 podľa vybraných stĺpcov, 203 lema Burnsideova, 619 lema o piatich homomorfizmoch, 614 Register 801 Lieova algebra, 702 komutatívna, 703 Lieova algebra asociatívnej algebry, 703 Lieova algebra maticovej grupy, 705 Lieove zátvorky, 702 lineárna algebra, 668 asociatívna, 668 graduovaná, 671 komutatívna, 668 s jednotkou, 668 lineárna diferenciálna rovica maticová, 463 vektorová, 462 lineárna forma, 127, 723 lineárna grupa, 636 lineárna grupa vektorového priestoru, 636 lineárna kombinácia, 47 lineárna nezávislosť vektorov, 87 lineárna regresia, 281 lineárna transformácia, 119 lineárna varieta, 150 lineárna závislosť vektorov, 86 lineárne operátory adjungované, 477 duálne, 477 združené, 477 lineárne zobrazenie, 114 lineárny funkcionál, 127, 723 lineárny izomorfizmus, 119 lineárny obal, 84 lineárny operátor, 119 antihermitovský, 496 diagonalizovateľný, 367 hermitovský, 479 nilpotentný, 415 normálny, 496 ortogonálny, 484 samoadjungovaný, 479 symetrický, 479 unitárny, 483 lineárny oscilátor, 535 lineárny podpriestor, 82 indefinitný, 307 kladne definitný, 307 regulárny, 307 singulárny, 307 záporne definitný, 307 lineárny priestor, 46 Liouvilleova formula, 454 Lorentzova grupa, 647 Lorentzova transformácia, 328, 647 ortochrónna, 647 špeciálna, 329 vlastná, 647 vlastná ortochrónna, 648 Möbiova grupa, 666 Möbiova páska, 700 matica, 54 adjungovaná, 336 afinného zobrazenia, 162 algebraických doplnkov, 194 bilineárnej formy, 208, 212 bloková, 56 blokovo diagonálna, 62 diagonálna, 62 elementárna, 136 Gramova, 247, 307 hermitovská, 338 hermitovsky združená, 336 Hesseho, 235 charakteristická, 371 inverzná, 134 Jacobiho, 279 jednotková, 60 kososymetrická, 338 kvadratickej formy, 215 lineárneho zobrazenia, 121 lineárnej transformácie, 122 nilpotentná, 415 nulová, 58 ortogonálna, 258 poldruhalineárnej formy, 336 prechodu, 138 pseudoinverzná, 529 regulárna, 134 rozložiteľná, 752 singulárna, 134 sústavy lineárnych rovníc, 68 rozšírená, 68 symetrická, 56 štvorcová, 54 transponovaná, 55 typu m × n, 54 unitárna, 343 v redukovanom stupňovitom tvare, 70 v stupňovitom tvare, 70 802 Register matice G-kongrunetné, 637 G-podobné, 637 hermitovskej G-kongruencie, 637 hermitovsky kongruentné, 337 komutujúce, 429 kongruentné, 218 Pauliho, 694 podobné, 366 riadkovo ekvivalentné, 73 stĺpcovo ekvivalentné, 73 maticová funkcia komutujúca, 465 polynomická, 426 spojitá, 458 maticová funkcia reálnej premennej komplexná, 458 reálna, 458 maticová grupa, 636 diskrétna, 706 maximum ostré lokálne, 237 metóda najmenších štvorcov, 282 minimálny polynóm lineárneho operátora, 431 matice, 430 minimum ostré lokálne, 237 Minkowského časopriestor, 310 minor matice, 194, 202 hlavný, 202 mnohočlen, 49 množina faktorová, 27 fixpunktov, 619 generátorov, 85 jednoducho súvislá, 661 konvexná, 666 ortogonálna, 342 ortonormálna, 342 pevných bodov, 619 súvislá, 655 transverzálna, 618 vektorov lineárne nezávislá, 94 zvyškových tried, 43 množina generátorov grupy, 585 mocnina matice, 61 mocninný rad, 446 modul matice pravý, 527 ľavý, 527 moment hybnosti, 562 Mooreova-Penroseova pseudoinverzia lineárneho zobrazenia, 531 Mooreova-Penroseova pseudoinverzia matice, 531 multiplikatívny zápis, 580 nadrovina, 153 náhodná premenná, 286 náhodné premenné nekorelované, 290 najmenší spoločný násobok, 444 najväčší spoločný deliteľ polynómov, 439 nakrytie dvojnásobné, 690 násobnosť vlastnej hodnoty algebraická, 379 geometrická, 380 nekonečnorozmerný priestor, 98 norma vektora, 245, 248, 340 normalizátor podgrupy, 631 normovaný priestor, 248 objem k-rozmerný, 293 orientovaný, 297 oblúk, 655 obor konvergencie potenčného radu, 447 obraz lineárneho zobrazenia, 117 množiny, 20 zobrazenia, 20 obraz homomorfizmu, 587 očakávaná hodnota náhodnej premennej, 286 odchýlka afinných podpriestorov, 272 lineárnych podpriestorov, 272 vektora od podpriestoru, 267 vektorov, 249 odmocnina z jednotky primitívna, 602 ohniská elipsy, 522 hyperboly, 523 ohnisko paraboly, 523 okruh Register 803 invariantov, 698 komutatívny s jednotkou, 52 súradnicový, 673 s jednotkou, 66 okruh s delením, 684 oktonión, 684 operácia, 18 asociatívna, 21 binárna, 21 komutatívna, 21 unárna, 18 operátor lineárny, 119 orbita prvku, 618 ortogonálna grupa, 644 ortogonálna matica, 258 ortogonálna projekcia vektora, 265 ortogonálny doplnok, 264 ortokomplement množiny, 264, 342, 725 ortonormálny systém, 251 osová súmernosť, 124 otočenie, 123 parabola, 511 paradox dvojčiat, 323 parameter nestredovej kvadriky, 509 paraboly, 523 párovanie, 723 Parsevalova rovnosť, 252 Pauliho matice, 694 permanent, 204 permutácia, 23 inverzná, 23 nepárna, 25 párna, 25 plocha guľová, 516 sférická, 516 počiatočná podmienka, 462 počiatočná úloa, 463 podalgebra lineárnej algebry, 669 podgrupa, 582 generovaná množinou, 584 invariantná, 592 nevlastná, 583 normálna, 592 triviálna, 583 podgrupa generovaná množinou normálna, 593 podpole, 42, 388 podpriestor afinný, 150 invariantný, 368 koreňový, 412 lineárny, 82 smerový, 152 Poincarého grupa, 647 Poincarého transformácia, 329 polárne súradnice, 277 poldruhalineárna forma, 336 hermitovská, 337 kososymetrická, 337 pole, 40 algebraicky úplné, 389 algebraicky uzavreté, 389 polomer konvergencie mocninného radu, 447 polos elipsy hlavná, 510 vedľajšia, 510 polos hyperboly hlavná, 510 vedľajšia, 510 polynóm, 49 homogénny, 672 charakteristický, 371 interpolačný, 203 ireducibilný, 435 polynomická maticová funkcia, 426 polynómy Hermitove, 263 Legendreove, 254 nesúdeliteľné, 435, 439 postupnosť exaktná, 597 krátka, 597 postupnosť vektorov lineárne nezávislá, 94 posunutie, 159 potenčný rad, 446 pozorovateľná, 544 energie, 563 kinetickej , 564 potenciálnej, 564 hybnosti, 555 polohy, 550 súradníc, 553 pozorovateľné momentov hybnosti, 563 804 Register pravdepodobnostné rozdelenie Gaussovo, 575 normálne, 575 pravdepodobnostné rozdelenie rovnomerné, 285 pravdepodobnostný priestor, 285 pravdepodobnosť, 285 pravidlo pravej ruky, 296 priamka, 149 priamy súčin grúp, 598 pridružená matica polynómu, 432 priečka afinných podpriestorov, 270 prienik lineárnych podpriestorov, 85 množín, 17 priestor afinný, 148 euklidovský, 245 Hilbertov, 357 lineárny, 46 pravdepodobnostný, 285 projektívny, 691 pseudoeuklidovský, 306 stavový, 350, 357 unitárny, 339 vektorový, 46 projekcia, 288 kanonická, 27 prirodzená, 27 projektívna priamka, 666 projektívny priestor, 691 projektor, 288 prvky konjugované, 622 prvok inverzný, 22, 40 matice, 54 neutrálny, 21 opačný, 40 pseudoeuklidovský priestor, 306 pseudoortogonálna grupa, 646 pseudoriešenie sústavy lineárnych rovníc, 281, 533 pseudoskalárny súčin, 306 pseudounitárna grupa, 653 QR-rozklad, 262, 362 racionálna lineárna transformácia, 666 rad Campbellov-Bakerov-Hausdorffov, 708 rád konečnej grupy, 580 koreňového vektora, 412 nilpotentného operátora, 415 prvku v grupe, 585 vlastnej hodnoty, 412 reálna časť kvaterniónu, 680 reálne zúženie vektorového priestoru, 337 regulárna matica, 134 relativistická dilatácia času, 325 relativistická kontrakcia, 332 relativistické skladanie rýchlostí, 333 repér, 163 ortogonálny, 508 ortonormálny, 508 reprezentácia hybnostná, 560 polohová, 560 súradnicová, 560 reprezentácia grupy, 618 riadiaca priamka paraboly, 523 riadok matice, 55 riešenie sústavy lineárnych rovníc, 68 minimálne, 283 rovnica charakteristická, 371 kvadriky, 505 lineárna, 68 rovnice Hamiltonove, 352 rovnice afinného podpriestoru parametrické, 170 všeobecné, 171 rovnosť tried, 619, 623 rovnoľahlosť, 125 rozdelenie pravdepodobnosti, 285 rozdiel množín, 17 rozklad orbitálny, 618 polárny, 528 singulárny, 528 rozklad množiny, 27 rozptyl náhodnej premennej, 286 rozptyl pozorovateľnej, 546 rozšírenie grupy pomocou grupy, 598 Register 805 rozšírenie poľa, 388 algebraické, 388 konečné, 388 rozvrstvenie, 671 Sarrusovo pravidlo, 189 sedlo, 237 semilineárne zobrazenie, 336 sféra dvojrozmerná, 684 sférické súradnice, 277, 278 Schrödingerova rovnica, 564 bezčasová, 565 stacionárna, 565 v integrálnom tvare, 565 signatúra diagonálnej matice, 226 kvadratickej formy, 228 pseudoeuklidovského priestoru, 306 symetrickej bilineárnej formy, 227 symetrickej matice, 227 signatúra kvadriky, 506 singulárna matica, 134 singulárne číslo matice, 527 skalár, 39 skalárna časť kvaterniónu, 680 skalárna funkcia maticového argumentu, 455 skalárny súčin, 244 komplexný, 339 komplexný štandardný, 342 štandardný, 246 slučka, 661 smerodajná odchýlka, 286 smerový podpriestor, 152 spektrálny polomer lineárneho operátora, 498 spektrálny polomer štvorcovej matice, 451 spektrálny rozklad normálneho operátora, 497 samoadjungovaného operátora, 483 unitárneho operátora, 486 spektrum lineárneho operátora, 380 matice, 380 spinorová grupa, 692 spojenie afinných podpriestorov, 154 spustenie indexu, 747, 748 stabilizátor množiny, 631 bodový, 631 stabilizátor prvku, 618 stacionárny bod funkcie, 234 stav excitovaný, 573 vzbudený, 573 základný, 573 stavový priestor, 350, 352, 357 stĺpec matice, 55 stopa zovšeobecnená tenzora, 746 stopa matice, 367 stred kvadriky, 509, 523 stredná hodnota náhodnej premennej, 286 stredná hodnota pozorovateľnej, 545 stredná kvadratická odchýlka, 286 stredná kvadratická odchýlka pozorovateľnej, 546 stupeň tenzora, 738 stupeň rozšírenia, 388 subdeterminant, 194 súčet lineárnych podpriestorov, 85 množín, 85 súčet lineárnych podpriestorov direktný, 86 priamy, 86, 96 súčet vektorových priestorov priamy, 131 súčin grúp priamy, 598 matíc, 59 pseudoskalárny, 306 skalárny, 244 vektorový, 299 vnútorný, 244 vonkajší, 298 zmiešaný, 299 súčin grúp polopriamy, 626 súčin množín karteziánsky, 17 súčin tenzorov, 745 súčin vektorových priestorov priamy, 50, 131 súradná sústava inerciálna, 320 806 Register pravotočivá, 296 ľavotočivá, 296 súradnice polárne, 277 sférické, 277, 278 súradnice bodu afinné, 164, 508 barycentrické, 164, 508 súradnice kovektora kontravariantné, 748 kovariantné, 748 súradnice tenzora, 740 súradnice vektora kontravariantné, 748 kovariantné, 748 súradnice vektora vzhľadom na bázu, 100, 106 sústava elementárnych deliteľov, 435 sústava invariantných faktorov, 436 sústava lineárnych diferenciálnych rovníc, 462 autonómna, 467 homogénna, 463 s konštantnými koeficientmi, 467 sústava lineárnych rovníc, 68 homogénna, 68 nehomogénna, 68 sústavy lineárnych rovníc ekvivalentné, 69 súvislá komponenta, 655 súvislá množina, 655 svetelné vektory, 333 súhlasne orientované, 333 svetelný kužeľ, 310 budúcnosti, 311 minulosti, 311 svetelný vektor súhlasne orientovaný s časovým vektorom, 316 svetobod, 310 svetočiara inerciálneho pozorovateľa, 314 Sylvestrov zákon zotrvačnosti, 227 Sylvestrovo kritérium, 233 symplektická grupa, 693 systém riešení fundamentálny, 464 systém štruktúrnych konštánt, 669 šíp času, 316 špeciálna lineárna grupa, 637 špeciálna ortogonálna grupa, 644 špeciálna pseudoortogonálna grupa, 646 špeciálna pseudounitárna grupa, 653 špeciálna unitárna grupa, 653 štvorgrupa, 648 Taitove-Bryanove uhly, 493 tenzor metrický, 747 nerozložiteľný, 738 pseudometrický, 747 tenzorom typu p q , 738 tenzorový súčin funkcií, 726 podpriestorov, 726 vektorov, 729 vektorových priestorov, 729, 733 totálna derivácia druhá, 235 prvá, 235 transformácia afinná, 161 Galileova, 125 lineárna, 119 Lorentzova, 328, 647 špeciálna, 329 množiny, 18 Poincarého, 329 racionálna lineárna , 666 translácia, 159 translácia kvaterniónu pravá, 686 ľavá, 686 transpozícia, 24 trieda konjugácie, 622 trieda ekvivalencie, 27 trieda rozkladu grupy podľa podgrupy pravá, 590 ľavá, 590 udalosti súčasné, 318 udalosť, 310 uhlová frekvencia, 548 uhol afinných podpriestorov, 272 lineárnych podpriestorov, 273 vektora a podpriestoru, 267 vektorov, 249 Register 807 hyperbolický, 325 unitárna grupa, 653 unitárna matica, 343 unitárny priestor, 339 valcová plocha eliptická, 516 hyperbolická, 516 rotačná, 516 varieta lineárna, 150 vektor, 39 anizotropný, 307 časový, 310 charakteristický, 368 izotropný, 307 kladne definitný, 307 kontravariantný, 725 koreňový, 412 kovariantný, 725 opačný, 47 parametrov, 170 priestorový, 310 riadkový, 48 stavový, 357 stĺpcový, 49 vlastný, 368 záporne definitný, 307 vektorová časť kvaterniónu, 680 vektorová funkcia reálnej premennej komplexná, 458 reálna, 458 vektorová pozorovateľná hybnosti, 558 momentu hybnosti, 563 polohy, 554 vektorový priestor, 46 duálny, 127 funkcií, 50 konečnorozmerný, 98 matíc, 58 nekonečnorozmerný, 98 vektorový súčin, 299 vektory kolmé, 250, 251 lineárne nezávislé, 87 lineárne nezávislé vzhľadom na podpriestor, 418 lineárne závislé, 86 ortogonálne, 250, 251 veta Cauchyho, 192, 624 Cayley, 616 Cayleyova-Hamiltonova, 427 Eulerova, 613 Fermatova malá, 591 Frobeniova, 169 Jacobiho, 231 kosinusová, 250 kosoštvorcová o izomorfizme, 182 Lagrange, 591 o hlavných osiach, 504 o homomorfizme, 596 o izomorfizme druhá (o dvojnom), 614 prvá (kosoštvorcová), 614 tretia, 614 Pytagorova, 250 Schurova o triangularizácii, 384 Steinitzova, 97 vlastná hodnota, 368 m-násobná, 379 jednoduchá, 379 vlastná špeciálna pseudoortogonálna grupa, 660 vlastné číslo, 368 vlastný podpriestor lineárneho operátora, 380 vlastný vektor, 368 vnútorný súčin, 244 vnútorný súčin komplexný, 339 voľná grupa, 603 voľný generátor, 603 vrchol kvadriky, 509 všeobecná afinná grupa, 639 všeobecná lineárna grupa, 635 všeobecná projektívna grupa, 666 vzdialenosť afinných podpriestorov, 270 bodov, 249 množín, 270 vzor množiny, 21 vzťah ekvivalencie, 26 reflexívny, 26 symetrický, 26 tranzitívny, 26 808 Register základná veta algebry, 389 zameranie, 152 zdvih indexu, 748 zdvih poľa skalárov, 735 zhodné zobrazenie, 640, 645 zhodnosť, 645 nepriama, 645 priama, 645 zjednotenie množín, 17 znamienko permutácie, 24 zobrazenie, 18 afinné, 159 alternujúce, 186 antisymetrické, 185 bijektívne, 19 bilineárne, 207 exponenciálne, 707 identické, 20 injektívne, 18 inverzné, 19 lineárne, 114 logaritmické, 708 multilineárne, 185 na množinu, 18 prosté, 18 pseudoinverzné, 529 semilineárne, 336 súradnicové, 100 surjektívne, 18 vzájome jednoznačné, 19 zhodné, 640, 645 zložené, 19 zreálnenie vektorového priestoru, 337 zúženie tenzora, 746 zúženie zobrazenia, 20 zvyšok po delení, 395