MASARYKOVA UNIVERZITA Matematika drsně a svižně Jan Slovák, Martin Panák, Michal Bulant a kolektiv Brno 2013 Projekt netradiční základní učebnice matematiky pro studenty přírodních věd, informatiky, technických věd, ekonomie, sociálních věd apod., přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek. Práce na učebnici byly podpořeny projektem Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203). INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Autorský kolektiv: Mgr. Michal Bulant, Ph.D. Mgr. Aleš Návrat, Dr. rer. nat. Mgr. Martin Panák, Ph.D. prof. RNDr. Jan Slovák, DrSc. RNDr. Michal Veselý, Ph.D. Grafický návrh publikace a ilustrace: Mgr. Petra Rychlá © 2013 Masarykova univerzita ISBN 978-80-210-6307-5 ISBN 978-80-210-6308-2 (online : pdf) DOl:10.5817/CZ.MUNl.O210-6308-2013 Obsah Kapitola 1. Rozcvička 6 1. Čísla a funkce 6 2. Kombinatorické veličiny 10 3. Diferenční rovnice 14 4. Pravděpodobnost 17 5. Geometrie v rovině 26 6. Relace a zobrazení 38 Kapitola 2. Počítaní s vektory 65 1. Vektory a matice 65 2. Determinanty 76 3. Vektorové prostory a lineárni zobrazení 84 4. Vlastnosti lineárních zobrazení 100 Kapitola 3. Lineárni modely a maticový počet 123 1. Lineárni procesy 123 2. Diferenční rovnice 129 3. Iterované lineární procesy 136 4. Více maticového počtu 144 5. Rozklady matic a pseudoinverze 163 Kapitola 4. Analytická geometrie 191 1. Afinní a euklidovská geometrie 191 2. Geometrie kvadratických forem 210 3. Projektivní geometrie 218 Kapitola 5. Zřízení ZOO funkcí 234 1. Interpolace polynomy 234 2. Reálná čísla a limitní procesy 243 3. Derivace 261 4. Mocninné řady 273 Kapitola 6. Diferenciální a integrální počet 325 1. Derivování 325 2. Integrování 341 3. Nekonečné řady 360 Kapitola 7. Spojité modely 396 1. Fourierovy řady 396 2. Metrické prostory 408 3. Integrální operátory 424 Kapitola 8. Spojité modely s více proměnnými 435 1. Funkce a zobrazení na W 435 2. Integrování podruhé 465 3. Diferenciální rovnice 487 Kapitola 9. Statistické a pravděpodobnostní metody 523 1. Popisná statistika 523 2. Pravděpodobnost 532 3. Matematická statistika 570 Kapitola 10. Teorie čísel 589 1. Základní pojmy 589 2. Prvočísla 593 3. Kongruence 599 4. Řešení kongruencia jejich soustav 610 5. Aplikace - počítaní s velkými čísly, kryptografie 623 Kapitola 11. Algebraické struktury 641 1. Grupy 641 2. Okruhy polynomů 656 3. Systémy polynomiálních rovnic 668 4. Uspořádané množiny a Booleovská algebra 685 5. Kódovaní 697 Kapitola 12. Kombinatorické metody, grafy a algoritmy 708 1. Grafy a algoritmy 708 2. Příklady využití grafových technik 734 3. Kombinatorické výpočty 747 Předmluva Příprava tohoto učebního textu byla motivována přednáškami pro informatické obory na Masarykově univerzitě. Studijní programy jsou tam založeny na precizním matematickém přístupu. Chtěli jsme proto rychle, ale zároveň pořádně, pokrýt zhruba tolik matematiky, jako je obvyklé u větších kurzů v klasických technických oborech opřených o matematické metody. Zároveň jsme ale nechtěli rezignovat na úplný a matematicky korektní výklad. Chtěli jsme vedle sebe vyložit i obtížnější partie matematiky a spoustu elementárních i náročnějších konkrétních příkladů, jak s uvedenými postupy ve skutečnosti pracovat. Nechtěli jsme přitom za čtenáře řešit, v jakém pořadí a kolik „teorie" či „praxe" pročítat. Z těchto podnětů vznikl dvousloupcový formát s oddělenými teoretickými úvahami a praktickými postupy. Snažíme se tím vyjít vstříc jak čtenářům, kteří si napřed chtějí procvičit postupy při řešení úloh a teprve pak přemýšlet, proč a jak algoritmy fungují, tak těm druhým, kteří si napřed chtějí dělat jasno o tom proč a jak věci fungují a pak případně zkouší řešit konkrétní příklady. Zároveň tím čtenáře nutíme, aby se sami rozhodli o pořadí i rozsahu toho, co chtějí číst, a snad je zbavujeme i stresu, že by měli přečíst úplně vše. Naopak, měli by mít radost z brouzdání textem a prožitku objevování vlastní cestičky k matematickému příběhu. Text se v obou svých částech snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah představovaných matematických metod. Řešené úlohy procvičují základní pojmy, ale zároveň obsahují i komplexnější příklady užití matematických modelů. Teoretický text je prezentován dosti kompaktním způsobem, mnoho prostoru je ponecháno pro dotažení podrobností čtenáři. Uváděné příklady se snaží pokrýt celou škálu složitosti, od velmi jednoduchých až po perličky ke skutečnému přemýšlení. Čtenářům bychom rádi pomohli: • přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení, • vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití matematických nástrojů, • vstřebat návody na užívání matematických modelů a osvojit si jejich využití. K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechuti). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že se tento postup může jevit jako chaotický. Domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají. Vstup do matematiky je skoro pro každého obtížný — pokud už rozumíme", nechce se nám přemýšlet o podrobnostech, pokud „nerozumíme", je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je hledat porozumění v mnoha pokusech, a to pokud možno při četbě v různých zdrojích a přemýšlení o souvislostech. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Doufáme, že může být dobrým začátkem a případně i dlouhodobým pomocníkem zvláště pro ty, kdo se k jednotlivým částem budou znovu a znovu vracet. Pro ulehčení vícekolového přístupu ke čtení je text doprovázen emotivně laděnými ikonkami, které snad nejen oživí obvyklou strohou strukturu matematického textu, ale naznačí čtenáři, kde by složitější text měl být čten pozorněji, ale určitě ne přeskakován, případně kde by bylo možná lépe náročné pasáže přinejmenším napoprvé vůbec nečíst. Volba jednotlivých ikonek samozřejmě odráží hlavně pocity a představy autorů. Měly by být přesto dobrým vodítkem pro jednotlivé čtenáře, kteří si sami postupně vytvoří jejich význam. Sloupec zaměřený na výklad teorie (užší a hustší sloupec) a sloupec zaměřující se na příkladovou část jsou přitom opatřeny odlišnými sadami ikonek. Co se týče sloupce teorie, používáme ikonky varující před pracností/složitostí/náročností, např. Další označují ne úplně pohodovou zdlouhavost práce a potřebu trpělivosti či nadhledu při pročítání následujících odstavců: P A konečně máme také ikonky vyjadřující pohodu nebo radost ze hry, třeba následující Co se týče příkladového sloupce, tak používáme ikonky pro základní příklady, které by čtenář rozhodně měl být schopen zvládnout a pokračovat ve čtení až po jejich vyřešení, ikonky pro obtížnější příklady se zajímavým obratem, či praktickou aplikací, ikonka značí velmi obtížný příklad a konečně ikonka indikuje, že při řešení příkladu je vhodné použít výpočetní software. Snažili jsme se sloupce s příklady sepsat tak, aby byly čitelné prakticky samostatně. Bez ambicí pochopit hlubší důvody, proč uváděné postupy fungují (nebo s prostým cílem „projít písemkou"), by mělo skoro stačit probírat se jen příklady. To ale neznamená, že by bylo možné je číst bezmyšlenkovitě a postupy jen mechanicky kopírovat. I v řešených příkladech počítáme s aktivní spoluprací čtenářů, kteří si většinou sami musí rozmyslet, jak uvedené řešení funguje a co se vlastně přesně dělá. Definice pojmů či popisy jejich vlastností používaných při řešení příkladů jsou v teoretickém sloupci často vyznačeny zatržením, aby o ně bylo možno snadno pohledem zavadit. Souvislost řešených příkladů s paralelně studovanou teorií je přitom spíše volná, snažili jsme ale ulehčit přeskakování „z praxe do teorie a zpět" co nejvíce. Obsahově je celá učebnice ovlivněna představou, že pro praktické využití jsou velmi podstatné metody tzv. diskrétní matematiky, zatímco tzv. spojité modely jsou matematicky dobře uchopitelná přiblížení veskrze diskrétního světa kolem nás. Počítat koneckonců stejně umíme vždy jen s konečně mnoha racionálními čísly naráz. Bez spojité matematiky si ale lze jen těžko dobře představit koncepty jako konvergence procesu k limitnímu stavu nebo robustnost výpočtu. Bylo by bez ní také obtížné pracovat s odhady chyb při numerických procesech. Všechna témata a velmi podstatnou část textu jsme v létech 2005-2013 postupně ověřovali při výuce studentů informatiky a později i matematiky na Masarykově univerzitě. Paralelně jsme přitom vytvořili také podklady pro praktické semináře matematického modelování a numerických metod. V nich se studenti věnují skutečnému využití výpočtových nástrojů a modelů. Celá učebnice plně pokrývá témata odpřednášená ve čtyřech semestrálních kurzech matematiky, a to v plné verzi se čtyřmi hodinami přednášek doplněnými dvěma hodinami cvičení týdně. V prvním semestru jsme odpřednášeli kapitoly 1 a 2 a výběr z kapitol 3 a 4. V dalším semestru pak byly odpřednášeny kapitoly 5 a 6 a částečně i kapitola 7. Třetí semestr je věnován podstatné části kapitol 8 a 9 a na čtvrtý semestr pak zbýval výběr z kapitol 10-12, přičemž ale teorie grafů byla již dříve přednášena v jiných informatických předmětech. Samozřejmě předpokládáme, že si čtenáři a přednášející vyberou témata a jejich pořadí sami. Následující obrázek naznačuje bloky, se kterými lze takto nezávisle zacházet. Bez vážných problémů s návaznostmi považujeme za možné začít druhou, pátou nebo desátou kapitolou, přičemž úvodní rozcvička bude více či méně užitečná pro všechny případy. Tučné šipky v obrázku naznačují podstatné závislosti, čárkovanými označujeme přímou závislost nebo alespoň doporučený postup pro některé části kapitol. Kapitoly 11a 12 jsou tedy do značné míry nezávislé na zbytku, naopak části náročnějších kapitol 3,4,7, 8,9 se patrně do základních kurzů matematiky vůbec nevejdou. Prakticky v libovolném pořadí, resp. paralelně lze přednášet bloky kapitol l^t, 5-6, případně i 10-12 (nebo jejich části). Naopak hodně závislé na některých předchozích částech jsou kapitoly 7-9. Úvodní motivační kapitola se snaží ilustrovat několik přístupů k matematickému popisu problémů. Považujeme ji skutečně za rozcvičku, kterou začínáme nejjednoduššími funkcemi (základní kombinatorické vzorce). Pak naznačujeme, jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravděpodobnosti. Předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme (relace, uspořádání, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku rychlým střídáním témat — cílem je nashromáždit něco málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme. Další dvě kapitoly jsou věnovány základům počtu, který umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu matematických modelů. Nejprve probíráme jednoduché postupy pro práci s vektory a maticemi, třetí kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Čtvrtá kapitola pak ilustruje použití maticového počtu v geometrických úlohách. Dozvíme se něco málo o afinní, euklidovské a projektivní geometrii. V tomto okamžiku přerušíme v textu diskusi diskrétních modelů a přejdeme ke spojitým. Ukazujeme, že pracovat i se složitými funkcemi bývá jednoduché. Stručně řečeno, velmi jednoduché úvahy spojené s popisem okamžitých změn sledovaných veličin umožňují dělat závěry pro jejich vlastnosti lokálně i globálně. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné. Začínáme proto kapitolou, kde diskutujeme jaké funkce potřebujeme pro nelineární modely. Po polynomech a splajnech postupně diskutujeme pojmy kontinuum reálných čísel, spojitost, limity posloupností a funkcí a derivace funkcí, připomeneme všechny základní elementární funkce a závěrem se seznámíme s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kapitole šesté s důrazem na co nejpřímočařejší pochopení souvislostí limitních procesů, integrace a aproximací. Sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům jednoduché lineární algebry. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi vektorovými prostory funkcí. Ty bývají definovány buďintegrálními nebo diferenciálními operátory. Zatímco diskusi diferenciální rovnic necháváme na později, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady). Pak se věnujeme základům tzv. Fourierovy analýzy, tj. souvislostem s některými integrálními operátory (např. konvoluce) a integrálními transformacemi (zejména Fou-rierova transformace). Po cestě nahlédneme na abstraktní pojem vzdálenosti v kontextu metrických prostorů a neodpustíme si ilustrace obecného principu, že spojité modely jsou zpravidla ideovým podkladem a zároveň dobrou aproximací pro modely diskrétní. Poslouží nám k tomu stručné nahlédnutí na problematiky tzv. waveletů & diskrétní Fourierovy transformace. V osmé kapitole pokračujeme v našem stručném nastínění analytických spojitých metod, tentokrát pro modely s více proměnnými veličinami. Nejprve rozšíříme základní postupy a výsledky týkající se derivací nu funkce více proměnných, včetně funkcí zadaných implicitně & tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování o tzv. násobné integrály a obecné integrování po křivkách, plochách apod., včetně výkladu obecné Stokesovy věty. Tuto pasáž je možné vnímat jako stručné nastínění základů tzv. globální analýzy. Poté se věnujeme modelům opřeným o známou okamžitou změnu našich objektů, tj. diferenciálním rovnicím. Devátá kapitola je věnována popisné statistice, pravděpodobnosti a matematické statistice. Po stručném přiblížení terminologie a metod popisné statistiky se seznámíme s pojmy pravděpodobnostní prostor, náhodná veličina, hustota pravděpodobnosti, střední hodnota náhodné veličiny, medián, kvantil, rozptyl. Potkáme přitom příklady prakticky důležitých diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat, tj. výběrovým statistikám a jejich spolehlivosti, včetně stručných náznaků rozdílů mezi klasickým frekvenčním a bayesovským přístupem. V další kapitole zamíříme zpět do světa diskrétních metod. Zabýváme se v ní elementární teorií čísel. Po zavedení základní terminologie a symboliky se spolu s řešením hravých teoretických úloh poměrně rychle snažíme dospět k tomu, jaké praktické úlohy teorie čísel pomáhá řešit a se kterými (vyřešenými i otevřenými) problémy se tyto úlohy pojí. V závěrečných pasážích kapitoly jsou stručně zmíněny výpočetní aspekty teorie čísel a základní postupy v kryptografii s veřejným klíčem. Předposlední kapitola se věnuje nejprve obecným algebraickým strukturám s důrazem na elementární poznatky z teorie grup a okruhů polynomů. Jako příklady použití jsou zmíněny základní metody počítačové algebry, zejména použití Grobnerových bází při eliminaci proměnných v polynomiálních systémech rovnic. Zmíníme i něco málo o uspořádáních, svazech a boolovských algebrách a závěrem uvádíme aplikace algebraických metod při kódování dat. Úplně poslední kapitola se vrací k diskrétní matematice z jiného pohledu. Je věnována základním pojmům a poznatkům teorie grafů a jejich využitím v praktických problémech (např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích, hry popisované stromy). V závěru kapitoly jsou také studovány některé další problémy a postupy související s kombinatorickými výpočty (zejména se vracíme k řešení rekurentních rovnic ve chvíli, kdy díky spolupráci spojitých a diskrétních metod můžeme využít vytvořující funkce, které se ukazují být v této situaci docela silným nástrojem). Použitá literatura. Jak je u učebnic obvyklé, původní je koncepce celkového uspořádání textu a výběr a kombinace obecných témat. Autoři přitom čerpali z mnoha zdrojů, často jistě i podvědomně, a nečiní si nároky na autorství žádných výsledků či použitých postupů při jejich důkazech. Několik učebnic výrazně ovlivnilo již přípravu přednášek, ze kterých tento text vznikal. Byly to zejména následující zdroje: K.F. Riley, M.P. Hobson, S.J. Bence, Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 2004, ISBN 0-521-89067-5, xxiii+1232 s. William J. Gilbert, W. Keith Nicholson, Modern algebra with applications, 2nd ed. John Wiley and Sons (Pure and applied mathematics), 2004, ISBN 0-471-41451-4, xvii+330 s. J. Herman, R. Kučera, J. Šimša, Metody řešení matematických úloh I, Brno: Masarykova univerzita, 2011. 278 s. ISBN 978-80-210-5636-7. J. Herman, R. Kučera, J. Šimša, Metody řešení matematických úloh II, Brno: Masarykova univerzita, 1997. 355 s. ISBN 80-210-1630-2. Paul. J. Nahin, When Least is Best, Princeton University Press, 2004, ISBN-13:978-0-691-13052-l, 370 s. Jiří Matoušek, Jaroslav Nešetřil, Kapitoly z diskrétní matematiky, Univerzita Karlova v Praze, Karolinum, Praha, 2000, ISBN 80-246-0084-6, 377 s. Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, Universita Karlova, 2006, ISBN 80-85863-93-6, 230 s. Občas jsou v textu přebírány teoretické pasáže nebo příklady z dalších zdrojů a v takových případech uvádíme odkazy formou poznámek pod čarou. Poděkování. Na vzniku učebního textu se podílel velmi široký tým spolupracovníků, vyučujících i studentů. Za celkovou koncepci a rozpracování jsou ale zodpovědní tři hlavní autoři - Jan Slovák, Martin Panák a Michal Bulant. Zatímco prvně jmenovaný má na svědomí celkový koncept učebnice a je autorem převážné většiny teoretických částí textu, Martin Panák s podporou širšího autorského kolektivu sestavil drtivou většinu příkladů. Michal Bulant vytvořil zejména celou desátou kapitolu a podstatné části kapitoly poslední. Na vyhledávání a rozpracování mnoha set praktických úloh v jednotlivých kapitolách (celkem přes 1600 úloh, z toho přes 1000 řešených) se významně podíleli také Aleš Návrat a Michal Veselý. Celkové grafické řešení knihy, včetně všech ilustrací, je dílem Petry Rychlé. Za to, že se knihu podařilo vysázet v netradičním dvousloupcovém formátu, který si autoři vymysleli, vděčíme Tomáši Janouškovi, který se také o sazbu učebnice skoro vzorně staral. Za úpravy textu vděčíme také Karolíně Malé a Monice Stančíkové, které nám hodně pomohly v závěrečné fázi tvorby textů. Nezanedbatelně obsahově i koncepčně přispěli Zdeněk Pospíšil, Lenka Přibylová, Jiří Zelinka a poděkování patří i Gabrielu Harangimu a Ottovi Suchánkovi za poskytnutí zpracovaných příkladů. Podrobnému čtení a komentování částí textu se věnovali Roman Šimon Hilscher, Lenka Přibylová, Zdeněk Pospíšil, Jiří Zelinka, Matej Hajnal, Lukáš Vokřínek, Ondřej Klíma, Petr Pupík, Milan Werl, Jana Soukopová. Mnoho chyb, nešikovností a nedostatků se podařilo odstranit jejich zásluhou a patří jim vřelý dík autorů. Za ty chyby a nedodělky, co zůstaly, si ale mohou autoři sami. Budeme čtenářům vděčni za všechna upozornění, na jejichž základě budeme občas vylepšovat elektronickou verzi učebního textu na stránkách projektu, s jehož podporou text vznikl, viz www.math.muni . cz/Matematika_ drsne_svizne. 19. srpna 2013, Jan Slovák, Martin Panák, Michal Bulant KAPITOLA 1 Rozcvička ,,hodnota, změna, poloha" - co to je a jak to uchopit? A. Čísla a funkce S přirozenými, celými, racionálními a reálnými čísly již počítat umíme. Zamyslíme se, proč racionální čísla nestačí (byť v počítači s jinými doopravdy počítat neumíme) a připomeneme si tzv. čísla komplexní (protože ani s reálnými čísly si při výpočtech nevystačíme). 1.1. Najděte nějaké reálné číslo, které není racionální. Řešení. Jedna z mnoha možných odpovědí je \/2. Již staří Řekové věděli, že předepíšeme-li plochu čtverce a2 = 2, pak nelze najít racionální a, které by předpisu vyhovovalo. Proč? Víme, že každé přirozené číslo n lze jednoznačným způsobem vyjádřit jako součin n = p[' ■ pr22... prkk, až na pořadí v součinu, kde P\,..., pk jsou po dvou různá prvočísla. Pokud by tedy platilo (p/q)2 = 2 pro přirozená čísla p & q, pak tedy p2 = 2q2. Na levé straně máme v rozkladu na prvočísla 2r se sudým r (případně r = 0), na pravé straně ale bude vždy mocnina dvojky lichá. To je spor s naším tvrzením a tedy předpoklad nemůže platit a žádné racionální číslo nemůže mít za svoji druhou mocninu dvojku. □ Cílem první kapitoly je uvést čtenáře do fascinujícího světa matematického myšlení. Vybíráme si k tomu co nejkonkrétnější příklady modelování reálných situací pomocí abstraktních objektů a souvislostí. Zároveň projdeme několik témat a postupů, ke kterým se postupně budeme vracet a v závěru kapitoly se budeme chvíli věnovat samotnému jazyku matematiky (se kterým budeme jinak zacházet spíše intuitivně). O co jednodušší jsou východiska a objekty, se kterými zde budeme pracovat, o to složitější je pochopit do důsledku jemnosti použitých nástrojů a postupů. Většinou je možné proniknout k podstatě věcí teprve v jejich souvislostech. Proto je také představujeme hned z několika pohledů zároveň. Přecházení od tématu k tématu se možná bude zdát jako zmatečné, ale to se jistě postupně spraví při našich návratech k jednotlivým úvahám a pojmům v pozdějších kapitolách. Název kapitoly lze chápat i jako nabádání k trpělivosti. 1 nej-jednodušší úlohy a úvahy budou snadné jen pro ty, kteří už podobné řešili. K postupnému poznání a ovládnutí matematického myšlení vede jen pozvolná a spletitá cesta. Začneme s tím nejjednodušším: obyčejnými čísly. 1. Čísla a funkce Lidé odjakživa chtějí mít jasno, „kolik" něčeho je, případně *••' „za kolik' to je, , jak dlouho" něco trvá apod. 'f^^^Sy^^x Výsledkem takových úvah je většinou nějaké ' '"^"u j* .WSŕ "číslo". Za číslo přitom považujeme něco, co umíme sčítat a násobit a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Například výsledek sčítání nezávisí na pořadí, vjakém čísla sčítáme. Máme k dispozici číslo nula, které přičtením výsledek nezmění, číslo jedna, kterým můžeme násobit, aniž bychom změnili výsledek, apod. Nejjednodušším příkladem jsou tzv. čísla přirozená, budeme je značit N = {0, 1, 2, 3, ...). Všimněme si, že jsme mezi přirozená čísla vzali i nulu, jak je obvyklé zvláště v informatice. Počítat , jedna, dvě, tři, ..." se učí děti už ve školce. O něco později se setkáváme s čísly celými Z = {..., —2, — 1, 0, 1, 2, ...) a nakonec si zvykneme na desetinná čísla a víme, co znamená 1,19-násobek ceny díky 19% dani z přidané hodnoty. 1.1. Vlastnosti čísel. Abychom mohli s čísly pracovat opravdu, • musíme se jejich definici a vlastnostem věnovat pořádněji. V matematice se těm základním tvrzením o vlastnostech objektů, jejichž platnost předpokládáme, aniž bychom se zabývali jejich dokazováním, KAPITOLA 1. ROZCVIČKA 1.2. Poznámka. Lze dokonce dokázat, že odmocnina přirozeného stupně z přirozeného čísla je buď přirozená, nebo není racionální (viz II1.95H). 1.3. Najděte řešení rovnice x2 = b pro libovolné reálné číslo b. Řešení. Víme, že tato rovnice má vždy řešení x v oboru reálných čísel, pokud je b nezáporné. Jestliže je b = —1, pak ale zjevně takové reálné x existovat nemůže. Musíme proto najít větší obor čísel, ve kterém už řešení existovat bude. K reálným číslům nejprve přidáme nové číslo i, tzv. imaginární jednotku a zkusíme dodefinovat sčítání a násobení tak, abychom i nadále zajistili obvyklé chování čísel, jak je shrnuto v odstavci 1.1. Jistě musíme umět nové číslo i násobit reálnými čísly a výsledky sčítat s jakýmikoliv reálnými čísly. Nutně proto musíme v novém číselném oboru komplexních čísel C pracovat s formálními výrazy z = a + i b. Aby byly splněny vlastnosti asociativity a distributivity, zavedeme sčítání tak, že se nezávisle sčítají reálné složky a imaginární složky. Stejně tak chceme násobení tak, jak by se násobily dvojčleny reálných čísel s jediným dodatečným pravidlem i2 = — 1, tj. (a + ib) + (c + id) = (a + c) + i (b + d), (a + i b) ■ (c + i d) = (ac — bd) + i (bc + ad). □ Reálnému číslu a říkáme reálná složka komplexního čísla z, reálnému číslu b pak imaginární složka komplexního čísla z, píšeme re(z) = a, im(z) = b. 1.4. Ověřte, že skutečně platí všechny vlastnosti (KG1-KG4), (01-04) a (P) skalárů z 1.1. Řešení. Nulou je číslo 0 + i 0, jedničkou číslo 1 + i 0, obě tato čísla pro jednoduchost opět píšeme jako 0 a 1. Všechny vlastnosti se ověří přímočarým výpočtem. □ Komplexní číslo je dáno dvojicí reálných čísel, jde tedy o bod v reálné rovině K2. 1.5. Ukažte, že vzdálenost komplexního čísla z = a +i b od počátku (značíme ji | z |) je dána výrazem z~z, kde ž je komplexně sdružené číslo a — i b. Řešení. Součin zž = (a2 + b2) + i {-ab + ba) = a2 + b2 je vždy reálné číslo a dává nám skutečně kvadrát vzdálenosti čísla z od počátku 0. Platí tedy \z\2 = z~z. □ říká axiomy. Vhodná volba axiomů předurčuje jak dosah z nich vycházející teorie, tak její použitelnost v matematických modelech skutečnosti. Uvedme si teď základní vlastnosti operací sčítání a násobení pro naše počty s čísly, která píšeme jako písmena a,b,c,____Obě tyto operace fungují tak, že vezmeme dvě čísla a, b a aplikací sčítání nebo násobení dostaneme výsledné hodnoty a + b a a ■ b. ____J Vlastnosti skalárů j___ Vlastnosti sčítání: (KG3) (KG4) (KG1) (a + b) + c = a + (b + c), pro všechna a, b, c (KG2) a + b — b + a, pro všechna a, b existuje číslo 0 tak, že pro všechna a platí a + 0 — a pro všechna a existuje b takové, že a + b — 0 Vlastnostem (KG1)-(KG4) říkáme vlastnosti komutativní grupy. Jsou to po řadě asociativita, komutativita, existence neutrálního prvku (říkáme u sčítání také nulového prvku), existence inverzního prvku (říkáme u sčítání také opačného prvku k a a značíme ho —a). Vlastnosti násobení: (01) {a ■ b) ■ c — a ■ (b ■ c), pro všechna a, b, c (02) a ■ b — b ■ a, pro všechna a, b (03) existuje číslo 1 tak, že pro všechna a platí l ■ a — a (04) a ■ (b + c) = a ■ b + a ■ c, pro všechna a, b, c Vlastnosti (01)-(04) se postupně nazývají asociativita, komutativita, existence jednotkového prvku a distributivita sčítání vůči násobení. Množiny s operacemi +, • a vlastnostmi (KG1)-(KG4), (01)-(04) se nazývají komutativní okruhy. Další vlastnosti násobení: (P) pro každé a ^ 0 existuje b takové, že a • b — 1. (Ol) je-li a ■ b — 0, potom buďa = 0 nebo b — 0. Vlastnost (P) se nazývá existence inverzního prvku vzhledem k násobení (tento prvek se pak značí a ~1) a vlastnost (Ol) říká, že neexistují „dělitelé nuly". Vlastnosti těchto operací sčítání a násobení budeme soustavně využívat, aniž bychom museli přesně vědět, s jakými objekty skutečně pracujeme. Tak se dostaneme k obecným matematickým nástrojům, je však vždy -i%í^ii(«»-J_- dobré mít představu o typických příkladech. Celá čísla Z jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují (KG4) (a případně neobsahují neutrální prvek, pokud někdo nulu do N nezahrnuje). Když komutativní okruh navíc splňuje i vlastnost (P), hovoříme o poli (často také o komutativním tělese). Poslední uvedená vlastnost (Ol) je automaticky splněna, pokud platí (P). Opačně to ovšem neplatí a tak říkáme, že vlastnost (Ol) je slabší než (P). Např. okruh celých čísel Z nesplňuje (P), ale splňuje (Ol). Hovoříme v takovém případě o oboru integrity. Všimněme si, že množina všech nenulových prvků v poli společně s operací násobení splňuje (Ol), (02), (03), (P), a je proto také komutativní grupa. Jen se místo sčítání mluví o násobení. Jako příklad můžeme vzít všechna nenulová reálná čísla. 7 KAPITOLA 1. ROZCVIČKA 1.6. Poznámka. Vzdálenost \z\ nazýváme též absolutní hodnotou komplexního čísla z. 1.7. Goniometrický tvar komplexního čísla. Nejprve uvažme komplexní čísla tvaru z = cos

n. 1.7. Tvrzení. Pro všechna přirozená čísla k an platí w © = C-t). (2) (£1) = © + (41). (3) ELoG) = 2". (4) ELo*©^2""1- Důkaz. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou stranu z tvrzení (2), dostáváme / n\ í n \ n\ n\ \k) + \k + l)~ k\{n-k)\ + (k + l)!(n -k - 1)! ~ _(k + l)n! + (n - k)n\ _ (k + l)!(n -k)\ (n + 1)! (ifc+ !)!(«-*)! 11 KAPITOLA 1. ROZCVIČKA 1.18. Během schůze má vystoupit 8 řečníků. Stanovte počet všech pořadí, v nichž dva předem určení řečníci nevystupují ihned po sobě. Řešení. Označme si zmíněné dva řečníky jako osoby A a B. Pokud hned po vystoupení osoby A následuje vystoupení osoby B, můžeme na to nahlížet jako na projev jediného řečníka. Počet všech pořadí, v nichž vystupuje B ihned po A, je tedy roven počtu všech permutací ze sedmi prvků. Stejný je pochopitelně také počet všech pořadí, v nichž vystupuje A ihned po B. Neboť počet všech možných pořadí 8 řečníků je 8!, číslo 81 — 2-7! udává hledaný počet pořadí. □ 1.19. Kolik existuje přesmyček slova PROBLÉM takových, že v nich a) písmena B a R stojí vedle sebe, b) písmena B a R nestojí vedle sebe. Řešení, a) Dvojici písmen B a R můžeme považovat za jedno nedělitelné dvojpísmeno. Celkem tedy máme k dispozici šest různých písmen a šestipísmenných slov složených z různých písmen je 6!. V našem případě však tento počet musíme ještě vynásobit dvěma, neboť naše dvojpísmeno může být jak BR tak RB. Celkem dostáváme 2-6! různých přesmyček. b) 7! — 2 • 6! (doplněk části a) do počtu všech sedmipísmenných slov složených z různých písmen). □ 1.20. Kolika způsoby může sportovec umístit 10 různých pohárů do 5 polic, jestliže se na každou polici vejde všech 10 pohárů? Řešení. K pohárům přidáme 4 navzájem nerozlišitelné předměty, kupř. tužky. Počet všech různých pořadí pohárů a tužek je zřejmě 14!/4! (tužky jsou nerozlišitelné). Každé umístění pohárů do polic ovšem odpovídá právě jednomu seřazení pohárů a tužek. Stačí třeba říci, že poháry před první tužkou v pořadí dáme do první police (při zachování pořadí), poháry před druhou tužkou do druhé police atd. To znamená, že číslo 14!/4! je výsledkem. □ 1.21. Určete počet čtyřciferných čísel sestavených z právě dvou různých cifer. Řešení. Dvě různé cifry použité na zápis můžeme vybrat (j0) způsoby, ze dvou vybraných cifer můžeme sestavit 24 — 2 různých čtyřciferných čísel (dvojku odečítáme za dvě čísla složená pouze z jedné cifry). Celkem máme (2°)(24 - 2) = 630 čísel. Nyní jsme ale započítali 1) = 63. Celkově dostáváme □ i čísla začínající nulou, těch je (j) (23 630 - 63 = 567 čísel. 1.22. Určete počet sudých čtyřciferných čísel sestavených z právě dvou různých cifer. což je ale levá strana tohoto tvrzení. Tvrzení (3) dokážeme tzv. matematickou indukcí. Tento typ ff> důkazu je vhodný právě pro tvrzení, která říkají, že ^T"^ něco má platit pro všechna přirozená čísla n. Mate-'^--^^ -+ matická indukce se skládá ze dvou kroků. V prvním se tvrzení dokáže pro n — 0 (popřípadě n — 1 nebo další hodnoty ti). V druhém, tzv. indukčním, kroku předpokládáme, že tvrzení platí pro nějaké n (a všechny předešlé hodnoty), a za pomoci tohoto předpokladu dokážeme, že tvrzení platí i pro n + 1. Dohromady z toho pak vyvodíme, že tvrzení platí pro všechna přirozená n. Tvrzení (3) zjevně platí pro n — 0, protože (g) = 1 = 2°. (Stejně tak je přímo vidět i pro n — 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme JI+l / .i JI+l T- , N / \ E-r -e G-.K n , n ři+1 , _2" 2"_ k=-l x ' k=0 Všimněme si, že vzorec (3) udává počet všech podmnožin n-prvkové množiny, neboť (^) je počet všech jejích k -prvkových podmnožin. Všimněme si také, že tvrzení (3) plyne přímo z (1.5) volbou a — b — l. Tvrzení (4) dokážeme opět matematickou indukcí, podobně jako (3). Zjevně platí pro n — 0, čímž je hotov první krok. Indukční předpoklad říká, že (4) platí pro nějaké n. Spočtěme nyní příslušnou sumu pro n + 1 s využitím tvrzení (2) a indukčního předpokladu. Dostaneme +?("* ,í>+.>(i)+x>(; ■- 2" + n2n -n2n ■(« + 1)2". Tím je proveden indukční krok a tvrzení je dokázáno pro všechna přirozená n. □ Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně nad ním ležících sousedů: n = 0 n = 1 n = 2 n — 3 n — 4 n = 5 1 1 1 10 1 10 1 Všimněme si, že v jednotlivých řádcích máme právě koeficienty ujednotlivých mocnin z výrazu (1.5), napr. poslední uvedený řádek říká (a + b)5 12 KAPITOLA 1. ROZCVIČKA Řešení. Obdobně jako v předchozím příkladu se nejprve nebudeme ohlížet na cifru nula. Dostaneme tak (l)(24 — 2) + 5 • 5(23 — 1) čísel (nejprve počítáme čísla pouze ze sudých cifer, druhý sčítanec udává počet sudých čtyřciferných čísel složených ze sudé a liché cifry). Opět musíme odečíst čísla začínající nulou, těch je (23 — 1)4 + (22 — 1)5. Hledaný počet cifer tak je @(24 - 2) + 5 • 5(23 - 1) - (23 - 1)4 - (22 - 1)5 = 272 . □ 1.23. Jak se může rozsadit pět osob v pětimístném autě, když jen dva z nich mají řidičský průkaz? Jak se může rozsadit 20 cestujících a dva řidiči v 25-místném minibuse? Řešení. Na místě řidiče máme dvě možnosti a na zbylých místech už je pořadí libovolné, tzn. pro spolujezdce 4 možnosti, pro další místo 3, pak 2 a 1. Celkově 2-4! =48 možností. Podobně v minibuse máme dvě možnosti na místě řidiče a druhý řidič plus cestující mohou na zbylých 24 místech sedět libovolně. Nejprve vybereme místa, která budou obsazená, tj. Qt) a na těchto místech může být 21! různých pořadí. Dohromady máme 2 • (21)21! = ^ možností. □ 1.24. Určete počet různých vět, které vzniknou přesmyčkami v jednotlivých slovech věty SKOKAN NA KOKS (vzniklé věty ani slova nemusejí dávat smysl). Řešení. Určíme nejprve počty přesmyček jednotlivých slov. Ze slova SKOKAN dostaneme 6!/2 různých přesmyček (permutace s opakováním P(l, 1,1,1, 2)), obdobně ze slova NA dvě a ze slova KOKS 4!/2. Celkem podle pravidla součinu (6!/2) • 2 • (4!/2) = 8640. □ 1.25. Kolika způsoby můžeme do pěti různých důlků vybrat po jedné kouli, vybíráme-li ze čtyř bílých, čtyř modrých a tří červených koulí? Řešení. Nejprve řešme úlohu v případě, že bychom měli k dispozici alespoň pět koulí od každé barvy. V tomto případě se jedná o volný výběr pěti prvků ze tří možností, tedy o variace s opakováním (viz 1.8). Máme V(3, 5) = 35. Nyní odečteme ty výběry, ve kterých se vyskytují buď pouze koule stejné barvy (takové výběry jsou tři), nebo právě čtyři koule červené (takových výběrů je 2 • 5 = 10; nejprve vybereme barvu koule, která nebude červená - dvě možnosti - a poté důlek, ve kterém bude - pět možností). Celkem tedy máme 10 = 230 možných výběrů. □ 1.8. Výběr s opakováním. Pořadí n prvků, z nichž mezi některými nerozlišujeme, nazýváme permutace s opakováním. Nechť je mezi n danými prvky p\ prvků prvního druhu, p2 prvků druhého druhu, až pk prvků k-tého druhu api+p2H-----h Pk = n. Potom počet pořadí těchto prvků s opakováním budeme značit P{p\, ..., pk). Podobně jako u permutací a kombinací bez opakování, pro výběr prvního z nich máme n možností, pro další n — 1 a tak dále, až po poslední, který zbude. Přitom ale za stejná považujeme pořadí nerozlišitelných objektů. Těch je pro každou skupinku o pí objektech právě pí!, takže zřejmě platí ___J Permutace s opakováním |___ P(pu , Pk) PV- ■Pk'- Volný výběr k prvků z n možností, včetně pořadí, nazýváme k-prvkové variace s opakováním, jejich počet budeme značit V(n,k). Volný výběr v tomto případě znamená, že předpokládáme, že stále máme pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí ___j Variace s opakováním j___.- V {n, k) = nk Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním a pro jejich počet píšeme C(n, k). Zde se na první pohled nezdá tak jednoduché, jak výsledný počet zjistit. Důkaz následující věty je pro matematiku typický - podaří se nám nový problém převést na problém jiný, který jsme už dříve zvládli. V našem případě je to převedení na problém standardních kombinací bez opakování. .___I Kombinace s opakováním J___ Věta. Počet k-prvkových kombinací s opakováním z n prvků je pro všechna k > 0 a n > 1 C(n,k) ■- rr1)- Důkaz. Důkaz je opřen o trik (jednoduchý, jakmile ho pochopíme). Uvedeme dva různé postupy. Představme si nejprve, že taháme postupně karty z balíku n různých karet. Abychom mohli případně některou z nich vytáhnout vícekrát, přidáme si k balíku ještě k — 1 různých žolíků (alespoň jednou určitě chceme jednu z původních karet). Řekněme, že postupně vytáhneme r původních karet a s žolíků, tj. r + s = k. Zdá se, že bychom měli vymyslet postup, jak z těch s žolíků poznat, které karty nám zastupují. Ve skutečnosti nám ale stačí diskuse počtů možností takových voleb. K tomu můžeme použít matematickou indukci a předpokládat, že dokazovaná věta platí pro menší argumenty než jsou n a k. Skutečně potřebujeme obsáhnout s-prvkové kombinace s opaková- ním z pouze r původních karet, což dává (r l) = r 13 KAPITOLA 1. ROZCVIČKA 1.26. Pro libovolné pevné n e N určete počet všech řešení rovnice x\ + *2 H----+ xt = n v množině nezáporných celých čísel. Řešení. Každé řešení (n,..., n), J^f=i n = n můžeme jednoznačně zašifrovat jako posloupnost jedniček a nul, ve které napíšeme nejprve r\ jedniček, pak nulu, pak r-i jedniček, nulu a tak dále. Posloupnost bude celkem obsahovat n jedniček a k — 1 nul. Každá taková posloupnost navíc zřejmě určuje nějaké řešení dané rovnice. Je tedy řešení tolik, kolik je posloupností, tedy □ Další kombinatorické příklady naleznete v doplňujících úlohách ke kapitole od strany 44. C. Diferenční rovnice Diferenční rovnice (jinak řečeno též rekurentní vztahy) jsou vztahy mezi členy nějaké posloupnosti, přičemž následující člen je dán pomocí členů předchozích. Vyřešit diferenční rovnici pak znamená najít explicitní vzorec pro n-tý (libovolný) člen dané posloupnosti. Rekurentní vztah nám totiž po zadání několika prvních členů posloupnosti zadává n-tý člen přímo pouze pomocí postupného vyčíslení všech předchozích členů. Pokud je následující člen posloupnosti určen pouze předchozím členem, hovoříme o diferenčních rovnicích prvního řádu. S nimi se můžeme v životě opravdu setkat, například, pokud si chceme zjistit dobu splácení nějaké půjčky při pevné měsíční splátce, nebo naopak chceme zjistit výši měsíční splátky, zadáme-li si dobu, za kterou chceme půjčku splatit. 1.27. Mirek si chce koupit nové auto, které stojí 300 000 Kč. Mirek by chtěl auto koupit na měsíční splátky. Prodávající společnost mu nabízí půjčku na koupi auta s ročním úrokem 6%. Mirek by chtěl auto splatit za tři roky. Jak vysoká bude měsíční splátka? Řešení. Označme S Mirkovu měsíční splátku. Předpokládejme, že při „koupi" auta Mirek zaplatí jednu měsíční splátku a pak po měsíci vždy další. Částku, kterou bude Mirek dlužit po uplynutí k měsíců, označme dk. Cenu auta označme C a měsíční úrok u (je tedy u = ^). Po prvním měsíci bude Mirek dlužit d\ = C — S + u(C — S) je právě počet s-prvkových kombinací (bez opakování) ze všech žolíků. Tím je věta dokázána. Druhý přístup (bez matematické indukce): Na množině 5 = {ai, ...,a„), ze které vybíráme kombinace, si zafixujeme uvedené pořadí prvků a pro naše volby prvků z 5 si připravíme n přihrádek, do kterých si již předem dáme v námi zvoleném pořadí po právě jednom prvku z 5. Jednotlivé volby xj e S přidáváme do přihrádky, která již tento prvek obsahuje. Nyní si uvědomme, že pro rozpoznání původní kombinace nám stačí vědět, kolik je prvků v jednotlivých přihrádkách. Například a | bbb | cc | d ~ * | * * * | ** | * vypovídá o volbě b, b, c z množiny S — {a,b, c, d). V obecném případě výběru k prvků z n možných tedy máme řetězec n + k znaků a počet C(n,k) je roven počtu možných umístění přihrádek | mezi jednotlivé znaky. To odpovídá výběru n — 1 pozic zn+t-1 možných. Protože je ín + k-\\ í n + k-l \ ín + k-l\ \ k ) ~ \n + k - 1 -k) ~ V "-I /' je věta dokázána i podruhé. □ 3. Diferenční rovnice V předchozích odstavcích jsme viděli vzorce, které zadávaly hodnotu skalární funkce definované na přirozených číslech (fak-toriál) nebo dvojicích čísel (binomická čísla) pomocí předcházejících hodnot. Zatímco v odstavci 1.5 jsou kombinační čísla definována přímo spočítatelným výrazem, lze rozumět vztahům v 1.8 také tak, že místo hodnoty naší funkce zadáváme její změnu při odpovídající změně nezávislé proměnné. Takto se skutečně velice často postupuje při matematické for-JjukMSS' mulaci modelů, které popisují reálné systémy v eko-^J^iSÍ^'''' nomice, biologii apod. My si tu povšimneme jen ^^^fjšř;- několika jednoduchých případů a budeme se k této tématice postupně vracet. 1.9. Lineární diferenční rovnice prvního řádu. Obecnou diferenční rovnicí prvního řádu rozumíme výraz f(n + 1) = F(n, /(«)), kde F je známá skalární funkce závislá na dvojici přirozených čísel. Známe-li „počáteční" hodnotu /(0), můžeme spočítat f (ľ) = F(0, /(0)), poté /(2) = F(l, /(l)) atd. Tímto postupným způsobem můžeme tedy nakonec spočítat hodnotu f (ti) pro libovolné n e N. Všimněme si, že tato úvaha je podobná konstrukci přirozených čísel z prázdné množiny nebo principu matematické indukce. Jako příklad může sloužit definiční formule pro faktoriál, tj. (n + 1)! = (n + 1) -ni Vidíme, že skutečně vztah pro f(n + 1) závisí na n i na hodnotě /(«)• Dalším obzvlášť jednoduchým příkladem je f(n) = C pro nějaký pevný skalár C a všechna n a tzv. lineární diferenční rovnice (1.6) /(« + 1) =a •/(«) + b, kde a ^0,ai jsou známé skaláry. 14 KAPITOLA 1. ROZCVIČKA (na počátku Mirek splatí jednu splátku, zbytek dluhu se pak úročí). Obecně po uplynutí fe-tého měsíce dluží Mirek (1.2) dk = 4-i - S + udk-\. Podle vztahu (1.9) v teoretické části je dk dáno následovně (při označení q = 1 + u. ' 1, yi = 1. O Lineární rekurentní vtahy se mohou vyskytnout například v geometrických problémech: 1.30. Na kolik nejvýše oblastí může dělit rovinu n přímek? Řešení. Označme hledaný počet oblastí p„. Pokud v rovině nemáme dánu žádnou přímku, je celá rovina jedinou oblastí, je tedy po = 1. Pokud j e v rovině dáno n přímek, tak přidáním (n+1). přímky přibude nejvýše (n+1) oblastí: oblastí přibude právě tolik, kolika (původními) oblastmi bude přímka procházet (každou takovou oblast rozdělí na dvě části, jedna oblast tedy přibude). Přidaná přímka může mít nejvýše n různých průsečíků s n přímkami, které už v rovině byly. Část přímky Takovou diferenční rovnici umíme snadno řešit, je-li b — 0. Pak se totiž jedná o dobře známou rekurentní definici geometrické posloupnosti a platí /(l)=a/(0), f (2) = af(l) = a2 f (O) atd. Máme tedy pro všechna n f (n) ' a" f (O). To je např. vztah pro tzv. Malthusiánský model populačního růstu, který vychází z představy, že za zvolený časový interval vzroste populace s konstantní úměrou a vůči předchozímu stavu. Dokážeme si obecný výsledek pro rovnice prvního řádu, které se podobají lineárním, ale připouští proměnné koeficienty a ab, (1.7) f{n + l)=an- f{n) + bn. Nejdříve se ale zamysleme, co mohou takové rovnice popisovat. Lineární diferenční rovnici (1.6) můžeme pěkně interpretovat jako matematický model pro spoření nebo splácení úvěru s pevnou úrokovou mírou a a pevnou splátkou b (tyto dva případy se liší pouze znaménkem u parametru b). S proměnnými parametry dostáváme obdobný model, ovšem s proměnlivými jak úroky, tak splátkami. Můžeme '*^TJ^"* si představit třeba n jako počet měsíců, an bude vy-^ Y jadřovat úrokovou míru v měsíci n, bn příslušnou M -4-— splátku v měsíci n. Neděste se zdánlivě složitého sčítání a násobení v následujícím výsledku. Jde o typický příklad technického matematického tvrzení, kdy těžké je „uhodnout", jak zní. Naopak důkaz je už pak jen docela snadné cvičení na základní vlastnosti skalárů a matematickou indukci. Skutečně zajímavé jsou teprve důsledky, viz 1.11 níže. Ve formulaci používáme vedle obvyklých znaků pro součet 2^ také obdobné znaky pro součin \\. V dalším budeme vždy používat také konvenci, že pokud u součtu je množina uvedených indexů prázdná, pak je součet nula, zatímco u součinu je ve stejném případě výsledek jedna. 1.10. Tvrzení. Obecné řešení diferenční rovnice (1.7) prvního řádu s počáteční podmínkou f (O) = yo je dáno vztahem (n-\ \ n-2 i n-\ \ n^po+xi na'\bi+bn-i=o I j=o y=j+i / (1-8) /O Důkaz. Tvrzení dokážeme matematickou indukcí. Zjevně tvrzení platí pro n — l, kdy se jedná právě o definiční vztah f (ľ) = aoyo +bo-Předpokládáme-li, že tvrzení platí pro nějaké pevně zvolené n, můžeme snadno spočíst Í/n-l \ n-2 / n-1 \ \ (Yla-)yo + J2\ n a>\bi + + V/=0 / j=0 \i=j+l J J n \ n — l i n \ i=0 / j=0 \i=j+l / jak se přímo vidí roznásobením výrazů. □ 15 KAPITOLA 1. ROZCVIČKA mezi libovolnými dvěma sousedními průsečíky prochází právě jednou oblastí, celkem může přidaná přímka procházet nejvýše n+1 oblastmi, tedy může přibýt maximálně n + 1 oblastí, navíc v rovině bylo před přidáním (n + l)-ní přímky nejvýše p„ oblastí (tak jsme číslo p„ totiž definovali). ^>r. datu Celkem dostáváme rekurentní vztah Pn+1 = Pn + (n + 1), ze kterého získáme explicitní formuli pro p„ buď pomocí vzorce 1.10 nebo přímo: Pn = Pn-l + n = p„-2 + in - 1) + n = = Pn-3 + in - 2) + (n - 1) + n = ■ n(n + l) n2 + n+2 po+J2' □ Rekurentní vztahy mohou mít i složitější podobu než je rekurze prvního řádu. Uvedme si příklady kombinatorických úloh, při jejichž řešení můžeme rekurze s výhodou využít. 1.31. Kolik existuje slov délky 12 složených pouze z písmen A a B, které neobsahují skupinu BBB1 Řešení. Nechť an značí počet slov délky n složených pouze z písmen A a B neobsahujících skupinu BBB. Pak pro a„ (n > 3) platí rekurentní vztah Un = an-\ + Cln-2 + Cln-3, neboť slova délky n splňující danou podmínku musí končit buď na A, nebo na AB, nebo na ABB. Slov končících na A je právě a„_i (před posledním A může být libovolné slovo délky n — 1 splňující danou Opět si všimněme, že jsme pro důkaz nepotřebovali o použitých skalárech nic víc než vlastnosti komutativního okruhu. 1.11. Důsledek. Obecné řešení lineární diferenční rovnice (1.6) Sílala počáteční podmínkou f (O) = yo je (1.9) f(n) = a"y0 + l-an 1 -a Důkaz. Dosazením konstantních hodnot za a, a £>, do obecného vzorce (1.8) dostáváme f(n) = a"y0 + y n—2 bii + Y,^-'-1 Pro vyčíslení součtu součinů v druhém sčítanci si je třeba všimnout, že se jedná o výrazy (l+a - )b. Součet této geometrické řady spočteme ze vztahu 1 — a" — (1 — a)(l + a dostaneme právě požadovaný výsledek. z""1) a □ Všimněme si, že pro výpočet součtu geometrické řady jsme potřebovali existenci inverze pro nenulové skaláry. To bychom nad celými čísly neuměli. Poslední vý-gg, sledek tedy platí pro pole skalárů a můžeme jej bez problému použít pro lineární diferenční rovnice, kde koeficienty a, b a počáteční podmínka /(O) = yo jsou racionální, reálné nebo komplexní, ale také nad okruhem zbytkových tříd Zfc s prvočíselným k (zbytkové třídy budeme definovat v odstavci 1.41). Pozoruhodné je, že ve skutečnosti vzorec (1.9) platí i s celočíselnými koeficienty a počáteční podmínkou. Pak totiž předem víme, že všechny f(n) budou také celočíselné, a celá čísla jsou podmnožinou v číslech racionálních. Musí proto nutně náš vzorec dávat ta správná celočíselná řešení. Při pozornějším pohledu na důkaz je zřejmé, že 1 —a™ je vždy dělitelné 1 — a, takže nás poslední pozorování nemělo překvapit. Nicméně je vidět, že třeba nad skaláry ze Z4 a třeba a = 3 už neuspějeme, protože pak 1 — a = 2 je dělitelem nuly. 1.12. Nelineární příklad. Vraťme se na chvíli k rovnici prvního ^\ řádu (1.6), kterou jsme použili na velice primitivní model populačního růstu závisející přímo úměrně na okamžité velikosti populace p. Na první pohled je W zřejmé, že takový model vede při úměře a > 1 k příliš rychlému a hlavně neomezenému růstu. Realističtější model bude mít takto úměrnou změnu populace Ap(n) = p(n+ľ)— p(n) jen při malých hodnotách p,tj. Ap/p ~ r > 0. Pokud tedy budeme chtít nechat růst populaci o 5% za období při malém p, budeme r volit 0,05. Při určité limitní hodnotě p = K > 0 ale naopak už populace neroste a při ještě větších už klesá (třeba protože zdroje pro její obživu jsou omezené, jedinci ve veliké populaci si navzájem překáží apod.). Předpokládejme, že právě hodnoty y„ — Ap(n)/p(n) se v závislosti na p (ti) mění lineárně. Graficky si tedy tuto závislost můžeme představit jako přímku v rovině proměnných p a y, která prochází body [0, r] (tj. při p — 0 máme y — r) a [-K", 0] (což dává druhou podmínku, že při p — K se populace nemění). Položíme proto y = ~P + r. 16 KAPITOLA 1. ROZCVIČKA podmínku). Obdobně pro zbylé dvě skupiny. Dále snadno vyčíslíme a\ = 2, ai = 4, fl3 = 7. Postupným dopočítáním an = 1705. Též bychom dle uvedené teorie mohli odvodit explicitní vzorec pro n-tý člen takto zadané posloupnosti (viz 3.10). Charakteristický polynom dané rekurentní rovnice je — x2 — x — 1 s jedním reálným a dalšími dvěma komplexními kořeny, které můžeme vyjádřit pomocí vztahů (|| 1.11|). □ 1.32. Skóre basketbalového utkání mezi týmy České republiky a Ruska vyznělo po první čtvrtině 12 : 9 pro ruský tým. Kolika způsoby se mohlo vyvíjet skóre? Řešení. Označíme-li P(t,i) počet způsobů, kterými se mohlo vyvíjet skóre basketbalového utkání, které skončilo k : l, tak pro k, l > 3 platí rekurentní vztah: P(k,l) = P(k-3,1) + P(k-2,1) + P(k-l,l) + P(k,l-V) + P(k,l-2) + + P(k,l-3)- (Způsoby, kterými se mohlo vyvíjet utkání s výsledným skóre k : /, si rozdělíme na šest po dvou disjunktních podmnožin podle toho, které družstvo vstřelilo koš a za kolik bodů (1, 2, či 3).) Ze symetrie úlohy zřejmě platí P(k,i) = P 3 platí: P(k,2) = P(k-3,2) + P(k-2,2) + ^(t—1,2) + P(k,l) + P(k,0), P(k,l) = P(k-3,l) + P(k-2,\) + P(k-l,l) + P(k,0), P(k,0) = P(k-3,0) + P(k-2,0) + P(k-1,0), což spolu s počátečními podmínkami P(o,o) = l,-P(i,o) = 1.^(2,0) = 2, P(3,0) = 4, P(1,1) = 2, -P(2,l) = -P(l,l) + P(0,l) + P(2,0) = 5, "(2,2) P(0,2) + P(l,2) + P(2,l) + P(2,0) 14 dává (12,9) : 497178513. □ Poznámka. Vidíme, že rekurentní vztah v tomto příkladu má složitější formu, než kterou jsme se zabývali v teorii a tudíž neumíme vyčíslit libovolné číslo P(k,i) explicitně, nýbrž pouze postupným výpočtem od počátečních členů. Takové rovnice nazýváme parciální diferenční rovnice, protože členy posloupnosti jsou značeny dvěma nezávislými proměnnými (k, ľ). Dosazením yn za y a p(n) za p dostáváme p(n + 1) - p(n) p(n) = —ZP(") + r' tj. roznásobením dostáváme diferenční rovnici prvního řádu (kde hodnota p(n) vystupuje v první i v druhé mocnině) (1.10) p(n + l)=p(n)(l-—p(n) + r) Zkuste si promyslet nebo vyzkoušet chování tohoto modelu pro různé hodnoty r a K. Na obrázku je průběh hod-^ not pro parametry r = 0,05 (tj. pětiprocentní nárůst v ideálním stavu), K = 100 (tj. zdroje limitují hodnotu na 100 jedinců) a p(0) jsou dva jedinci. Nelineaihi-zaviuoí r 1»" W6 Zco Všimněme si, že počáteční přibližně exponenciální růst se skutečně později zlomí a hodnota se postupně blíží kýženému limitu 100 jedinců. Pro p blízké jedné a K daleko větší než r bude pravá strana rovnice (1.10) přibližně p(n)(l + r), tzn. chování je obdobné Malthusiánskému modelu. Naopak při p přibližně K bude pravá strana přibližně p(n). Pro větší počáteční hodnoty p než K budou hodnoty klesat, pro menší než K růst, takže systém bude zpravidla postupně oscilovat kolem hodnoty K. 4. Pravděpodobnost Teď se podíváme na jiný obvyklý případ skalárních hodnot funkcí - sledované hodnoty často nejsou známy ani explicitně vzorcem, ani implicitně nějakým popisem. Jsou výsledkem nějaké nahodilosti a my se snažíme popsat s jakou pravděpodobností nastane ta či ona možnost. 1.13. Co je pravděpodobnost? Jako jednoduchý příklad může sloužit obvyklé házení kostkou se šesti stěnami s označeními 1, 2, 3, 4, 5, 6. Pokud popisujeme matematický model takového házení „poctivou" kostkou, budeme očekávat a tudíž i předepisovat, že každá ze stran padá stejně často. Slovy to vyjadřujeme „každá předem vybraná stěna padne s pravděpodobností g". Pokud si ale třeba sami nožíkem vyrobíme takovou kostku z kusu dřeva, je jisté, že skutečné relativní četnosti výsledků nebudou stejné. Pak můžeme z velikého počtu pokusů usoudit na relativní četnosti jednotlivých výsledků hodů a tyto ustanovit jako pravděpodobnosti v našem matematickém popisu. Nicméně při sebevětším počtu pokusů nemůžeme vyloučit možnost, že se náhodou povedla velice nepravděpodobná kombinace výsledků a že jsme proto náš matematický model skutečnosti pro naši kostku nevybrali dobře. 17 KAPITOLA 1. ROZCVIČKA O lineárních rekurentních formulích (diferenčních rovnicích) vyšších řádů s konstantími koeficienty si povíme více v kapitole 3. D. Pravděpodobnost Uvedme si několik jednoduchých příkladů na klasickou pravděpodobnost, kdy zkoumáme nějaký pokus, který má konečně mnoho možných výsledků („všechny případy") a nás zajímá, kdy výsledek pokusu bude náležet nějaké podmnožině možných výsledků („příznivé případy"). Hledaná pravděpodobnost je pak rovna poměru počtu příznivých případů ku počtu všech případů. Klasickou pravděpodobnost můžeme použít tam, kde předpokládáme (víme), že každý z možných výsledků má stejnou pravděpodobnost toho, že nastane (například při hodech kostkou). 1.33. Jaká je pravděpodobnost, že při hodu šestibokou kostkou padne číslo větší než 4? Řešení. Všech možných výsledků je šest (tvoří množinu {1,2,3,4,5,6}), příznivé možnosti jsou dvě ({5,6}). Hledaná pravděpodobnost je tedy 2/6 =1/3. □ 1.34. Ze skupiny osmi mužů a čtyř žen náhodně vybereme skupinu pěti lidí. Jaká je pravděpodobnost, že v ní budou alespoň tři ženy? Řešení. Pravděpodobnost spočítáme jako podíl počtu příznivých případů ku počtu všech případů. Příznivé případy rozdělíme podle toho, kolik je v náhodně vybrané skupině mužů: mohou v ní být buď dva, nebo jeden muž. Skupinek o pěti lidech s jedním mužem je osm (záleží pouze na výběru muže, ženy v ní musí být všechny), skupinek se dvěma muži je potom c(8, 2) • c(4, 3) = (*) • (3) (vybereme dva muže z osmi a nezávisle na tom tři ženy ze čtyř, tyto dva výběry můžeme nezávisle kombinovat a podle pravidla součinu dostáváme uvedený počet skupin). Všech možných skupin o pěti lidech pak můžeme sestavit c(12, 5) = (!52). Hledaná pravděpodobnost je tedy 8 + G)@ e52) □ Uvedme si příklad, při jehož řešení není vhodné používat klasické pravděpodobnosti: 1.35. Jaká je pravděpodobnost toho, že čtenář této úlohy vyhraje příští týden alespoň milión dolarů v loterii? Řešení. Takováto formulace úlohy je neúplná, neposkytuje dostatek údajů. Předvedeme chybné řešení. Základní prostor všech možný jevů je dvouprvkový: buď vyhraje nebo nevyhraje. Příznivý jev je jeden (vyhraje), hledaná pravděpodobnost je tedy 1/2 (a to je zjevně špatná od-pověd). □ V dalším budeme pracovat s abstraktním matematickým popisem pravděpodobnosti v nejjednodušším přiblížení. To, do jaké míry je takový popis adekvátní pro konkrétní pokusy či jiný problém, je záležitostí mimo samotnou matematiku. To ale neznamená, že by se takovým přemýšlením neměli zabývat matematici (nejspíše ve spolupráci s jinými experty). Později se vrátíme k pravděpodobnosti coby teorii popisující chování nahodilých procesů nebo i plně determinovaných dějů, kde ovšem neznáme přesně všechny určující parametry. Matematická statistika pak umožňuje posuzovat, do jaké míry lze očekávat, že vybraný model je ve shodě s realitou, resp. umožňuje určit parametry modelu tak, aby docházelo k co nejlepší shodě s pozorováním a zároveň umí odhadnout míru spolehlivosti zvoleného modelu. K matematické pravděpodobnosti i statistice ovšem budeme potřebovat dosti rozsáhlý matematický aparát, který budeme mezitím několik semestrů budovat. Na příkladu naší neumělé kostky si to můžeme představit tak, že v teorii pravděpodobnosti budeme pracovat s parametry p, pro pravděpodobnost jednotlivých hodnot stran a budeme požadovat pouze, aby všechny tyto pravděpodobnosti byly nezáporné a jejich součet byl P\ + P2 + P3 + P4 + P5 + P6 = 1- Při volbě konkrétních hodnot pí pro konkrétní kostku pak v matematické statistice budeme schopni odhadnout s jakou spolehlivostí tento model naší kostce odpovídá. Naším skromným cílem je teď pouze naznačit, jak abstraktně s — zachytit pravděpodobnostní úvahy ve formalizova-K~~ltL ných matematických objektech. Následující odstavce < <0 k, \ ^ bud°u ve syé podstatě pouhými cvičeními v jed-íf:'*±=s—noduchých operacích nad množinami a jednoduché kombinatorice (tj. výpočtech počtu možností, jak mohou být splněny dané podmínky kladené na konečné množiny prvků). 1.14. Náhodné jevy. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Pro jednoduchost bude pro nás Q konečná množina s prvky a>\, ... ,a>n představujícími jednotlivé možné výsledky. Každá podmnožina A c ň představuje možný jev. Systém podmnožin A základního prostoru se nazývá jevové pole, jestliže • Q e A (tj. základní prostor je jevem), • jsou-li A, B e A, pak A \ B e A (tj. pro každé dva jevy je jevem i jejich množinový rozdíl), • jsou-li A, B e A, pak A U B e A (tj. pro každé dva jevy je jevem i jejich sjednocení). Zjevně je i komplement Ac = Q \ A jevu A jevem, který nazýváme opačný jev k jevu A. Průnik dvou jevů je opět jevem, protože pro každé dvě podmnožiny A, B c Q platí A \ (Q \ B) = A n B. Slovy se tak dá jevové pole charakterizovat jako systém podmnožin (konečného) základního prostoru uzavřený na průniky, sjednocení a rozdíly. Jednotlivé množiny A e A nazýváme náhodné jevy (vzhledem k A). 18 KAPITOLA 1. ROZCVIČKA Poznámka. V předchozím příkladě je porušena základní podmínka použití klasické pravděpodobnosti, totiž to, že každý z elementárních jevů má stejnou pravděpodobnost toho, že nastane. 1.36. Do řady v kině o 2n místech je náhodně rozmístěno n mužů a n žen. Jaká je pravděpodobnost, že žádné dvě osoby stejného pohlaví nebudou sedět vedle sebe? Řešení. Všech možných rozmístění lidí v řadě je (2n)\, rozmístění splňujících podmínky je 2(n\)2: máme dvě možnosti výběru pozice mužů, tedy i žen - buď všichni muži budou sedět na lichých místech (a tedy ženy na sudých), nebo všichni muži na sudých (a tedy ženy na lichých místech); na nich jsou pak muži i ženy rozmístěny libovolně. Výsledná pravděpodobnost je tedy 2{n\f (2n)\ p(2) = 0,33, p(5) = 0,0079, p(S) = 0,00016 . □ 1.37. Do výtahu osmipatrové budovy nastoupilo 5 osob. Každá z nich vystoupí se stejnou pravděpodobností v libovolném poschodí. Jaká je pravděpodobnost, že vystoupí i) všichni v šestém poschodí, ii) všichni ve stejném poschodí, iii) každý v jiném poschodí? Řešení. Základní prostor všech možných jevů je prostor všech možných způsobů vystoupení 5 osob z výtahu. Těch je 85. V prvním případě je jediná příznivá možnost vystoupení, hledaná pravděpodobnost je tedy p, ve druhém případě máme osm možností, hledaná pravděpodobnost je tedy p a konečně ve třetím je počet příznivých případů dán pětiprvkovou variací z osmi prvků (z osmi pater vybíráme pět, ve kterých se vystoupí a dále kteří lidé vystoupí ve vybraných poschodích), celkem je hledaná pravděpodobnost ve třetím případě rovna (viz 1.6 a 1.8) v(5,8) 8-7---4 V(5, 8) 85 0,2050781250. □ 1.38. Náhodně vybereme celé kladné číslo menší než 105. Jaká je pravděpodobnost, že bude složeno pouze z cifer 0,1,5a zároveň bude dělitelné číslem 5? Řešení. Čísel splňující danou podmínku je 2 • 34 — 1 (kromě poslední cifry máme na každý řád na výběr ze tří cifer, případné číslice 0 na začátku slova nepíšeme. Všech celých kladných čísel menších než 105 je 105 — 1, podle klasické pravděpodobnosti dostáváme, že hledaná pravděpodobnost je 2^z\ ■ D Pro naše házení kostkou je Q = {1, 2, 3, 4, 5, 6) ajevovépole je tvořeno všemi podmnožinami množiny Q. Např. náhodný jev {1, 3, 5) pak interpretujeme jako „padne liché číslo". Něco málo terminologie, která by měla dále připomínat souvislosti s popisem skutečných modelů: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 e A se nazývá nemožný jev, • jednoprvkové podmnožiny {»} c Q se nazývají elementární jevy, • společné nastoupení jevů A;, i e I, odpovídá jevu n,€/A;, nastoupení alespoň jednoho zjevů A,, i e I, odpovídá jevu Ui€/A;, • A, B e A jsou neslučitelné jevy, je-li A n £ = 0, • jev A má za důsledek jev B, když A c B, Přestavte si příklady všech uvedených pojmů pro jevový prostor popisující házení kostkou nebo obdobně pro házení mincí! 1.15. Definice. Pravděpodobnostní prostor je trojice (Q, A , P), kde A je jevové pole podmnožin (konečného) základního prostoru Q, na kterém je definována skalární funkce P : A -» K s následujícími vlastnostmi: • P je nezáporná, tj. P (A) > 0 pro všechny jevy A, • P je aditivní, tj. P (A U B) = P (A) + P (B), kdykoliv je A, B e AaAC\B = V>, • pravděpodobnost jistého jevu je 1, tj. P(Q) = 1. Funkci P nazýváme pravděpodobností na jevovém poli A. Zjevně je okamžitým důsledkem našich definic řada prostých, ale užitečných tvrzení. Např. pro všechny jevy platí P(AC) = 1 - P (A), kde Ac = Q \ A je jev opačný (používá se též pojmů doplňkový či komplementární) k jevu A. Dále můžeme matematickou indukcí 19 KAPITOLA 1. ROZCVIČKA 1.39. Ze sáčku s pěti bílými a pěti červenými koulemi náhodně vytáhneme tři (koule do sáčku nevracíme). Jaká je pravděpodobnost, že dvě budou bílé a jedna červená? Řešení. Rozdělme uvažovaný jev na sjednocení tří disjunktních jevů: podle toho, kolikátou vytáhneme červenou kouli. Pravděpodobnosti, 14 5 15 1 2 ' 9 ' 8' 2 ' 9 ' 2' že vytáhneme koule přesně ve zvoleném pořadí jsou: 1 45151 5 • 5 • 5- Celkem Ti- Jiné řešení. Uvažme počet všech možných trojic vytažených koulí (koule jsou mezi sebou rozlišitelné), tedy (j0). Trojic, které obsahují právě dvě bílé kouleje potom Q • (j) (dvě bílé koule můžeme vytáhnout (j) způsoby, k nim pak červenou pěti způsoby). □ 1.40. Z klobouku, ve kterém je pět bílých, pět červených a šest černých koulí, náhodně vytahujeme koule (bez vracení). Jaká je pravděpodobnost, že pátá vytažená koule bude černá? Řešení. Spočítáme dokonce obecnější úlohu. Totiž pravděpodobnost toho, že í-tá vytažená koule bude černá, je stejná pro všechna i, 1 < i < 16. Můžeme si totiž představit, že vytáhneme postupně všechny koule. Každá taková posloupnost vytažených koulí (od první vytažené koule po poslední), složená z pěti bílých, pěti červených a šesti černých koulí, má stejnou pravděpodobnost vytažení a pro výpočet hledané pravděpodobnosti můžeme opět použít model klasické pravděpodobnosti. Zmíněných posloupností je P(5, 5, 6) = gi^'g,. Počet posloupností, kde na i-tém místě je černá koule, zbytek libovolný, je tolik, kolik je libovolných posloupností pěti bílých, pěti červených a pěti černých koulí, tedy P(5, 5, 5) = Celkem je tedy hledaná pravděpodobnost 15! P(5,5,5) _ Jijjjj _ 3 P(5,5,6) ~ 16! ~ 8' □ 6!5!5! Poznámka. Vraťme se k házení kostkou a zkusme popsat jevy ze základního prostoru Q vznikající při házení tak dlouho, dokud nepadne šestka, ne však více než stokrát. Pro jeden hod samostatně je základním prostorem šest čísel od jedné do šesti a jde o klasickou pravděpodobnost. Pro celé série našich hodů bude základní prostor daleko větší - bude to množina konečných posloupností čísel od jedné do šestky, které buď končí šestkou, mají nejvýše 100 členů a všechna předchozí čísla jsou menší než šest, nebo jde o 100 čísel od jedné do pěti. Jevem A může být např. podmnožina „házení končí druhým pokusem". Všechny příznivé elementární jevy pakjsou [1,6], [2,6], [3,6], [4,6], [5,6]. snadno rozšířit aditivitu na jakýkoliv konečný počet vzájemně neslučitelných jevů A, c Q, i e I, tj. kdykoliv A; n Aj = 0, pro všechna i, j e I,i 7^ j. 1.16. Definice. Nechť Q je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v Q. Klasická pravděpodobnost je pravděpodobnostní prostor (Q, A, P) s pravděpodobnostní funkcí P : A P(A) = |A| kde |A| značí počet prvků množiny A e A. Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, ověřte si samostatně všechny požadované axiomy. 1.17. Sčítání pravděpodobností. U neslučitelných jevů je sčítání ■J: pravděpodobností pro výskyt alespoň jednoho z nich přímo i požadováno v základní definici pravděpodobnosti. Obecně JAj^ř je sčítání pravděpodobností pro výskyty jevů složité. Pro-• '■P ' blém totiž je, žepokudjsou jevy slučitelné, částečně máme v součtu pravděpodobností započteny příznivé výskyty vícekrát. Nejjednodušší je si nejprve představit situaci se dvěma slučitelnými jevy A, B. Uvažme nejprve klasickou pravděpodobnost, kde jde vlastně o počítání prvků v podmnožinách. Pravděpodobnost výskytu alespoň jednoho z nich, tj. pravděpodobnost jejich sjednocení, je dána vztahem (1.11) P (A U B) = P (A) + P(B) - P(A D B), protože ty prvky, které patří do množiny A i B, jsme nejprve započetli dvakrát, a tak je musíme jednou odečíst. Tentýž výsledek dostaneme i pro obecnou pravděpodobnost P na nějakém jevovém poli. Protože A n B a A \ B jsou nezávislé jevy, platí P(A) = P(A \B) + P(A n B). Podobně pro A U B máme P(A U B) = P(A \B) + P(B \ A) + P(A n B). Dosazením za pravděpodobnosti množinových rozdílů dostáváme opět vztah (1.11). Následující věta je přímým promítnutím tzv. kombinatorického principu inkluze a exkluze do naší konečné pravděpodobnosti a říká, jakým způsobem vícenásobné započítávání výsledků kompenzovat v obecném případě. Jde patrně o dobrý příklad matematického tvrzení, kde nejtěžší je najít dobrou formulaci a pak se dá říci, že (intuitivně) je tvrzení zřejmé. Na obrázku je situace znázorněna pro tři množiny A, B, C a pro klasickou pravděpodobnost. Jednoduše šrafované oblasti v prostém součtu máme dvakrát, dvojitě šrafované třikrát. Pak ty jednoduše šrafované jednou odečteme, přitom ty dvojitě šrafované opět třikrát odečteme, proto je tam nakonec ještě jednou započteme. 20 KAPITOLA 1. ROZCVIČKA Ze známé klasické pravděpodobnosti pro jednotlivé hody umíme odvodit pravděpodobnosti našich jevů v Q. Není to ale jistě klasická pravděpodobnost. Tak pro diskutovaný jev chceme popsat, s jakou pravděpodobností nepadne šestka při prvém hodu a zároveň padne při druhém. Vnucuje se řešení 5 1 5 P(A)=6-6 = 36' protože v prvém hodu padne s pravděpodobností 1 — g jiné číslo než šest a druhý hod, ve kterém naopak požadujeme šestku, je zcela nezávislý na prvním. Samozřejmě toto není poměr počtu příznivých výsledků k velikosti celého stavového prostoru! Obecněji můžeme říci, že po právě 1 < k < 100 hodech pokus skončí s pravděpodobností • \. Ze všech možností je tedy nej- pravděpodobnější, že skončí již napoprvé. Jiný příklad, jak z házení kostkou dostat různě pravděpodobné jevy, je pozorovat součty při hodu více kostkami. Uvažujme takto: při hodu jednou kostkou je každý výsledek stejně pravděpodobný s pravděpodobností g. Při hodu dvěma kostkami je každý předem zvolený výsledek (a, b), tj. dvojice přirozených čísel od jedné do šesti (včetně pořadí), stejně pravděpodobný s pravděpodobností ^. Pokud se budeme ptát po dvou pětkách, je tedy pravděpodobnost poloviční než u dvou různých hodnot bez uvedení pořadí. Pro jednotlivé možné součty uvedené v horním řádku nám vychází počet možností v řádku dolním: | Součet 2 | 3 4 5 6 7 8 | 9 | 10 11 12 | | Počet 1 | 2 3 4 5 6 5 | 4 | 3 2 1 | Podobně vyjde pravděpodobnost ^ jednotlivých výsledků hodu třemi kostkami, včetně určeného pořadí. Pokud se budeme ptát na pravděpodobnost výsledného součtu při hodu více kostkami, musíme pouze určit, kolik je možností, jak daného součtu dosáhnout a příslušné pravděpodobnosti sečíst. 1.41. Princip inkluze a exkluze. Sekretářka má rozeslat šest dopisů šesti různým lidem. Dopisy pro různé adresáty vkládá do obálek s adresami náhodně. Jaká je pravděpodobnost, že alespoň jeden člověk dostane dopis určený pro něj? Obecně si díky aditivní vlastnosti pravděpodobnosti můžeme představit, že každý jev rozložíme na elementární (tj. jednobodové) jevy, jakkoliv ve skutečnosti nemusí jednoprvkové podmnožiny do uvažovaného jevového pole patřit. Pak je pravděpodobnost každého jevu dána součtem pravděpodobností jednotlivých elementárních jevů do něj patřících a můžeme při vyjádření pravděpodobnosti nastoupení alespoň jednoho zjevů postupovat takto: sečteme všechny pravděpodobnosti výsledků pro všechna A, zvlášť, pak ovšem musíme odečíst ty, které tam jsou započteny dvakrát (tj. prvky v průnicích dvou). Teď si ovšem dovolujeme odečíst příliš mnoho tam, kde ve skutečnosti byly prvky třikrát, tj. korigujeme přičtením pravděpodobností ze třetího členu, atd. Věta. Buďte A\, ..., Ai e A libovolné jevy na základním prostoru Q s jevovým polem A. Pak platí k k-1 k p (uLi A,-) = E p(A<) - E E p(A'n Ai)+ í = l 1 = 1 j=i + \ k-2 k-1 k + E E E PiAi^Aj^At)- ...+ i=l j=i+l l=j+l + (-i)Mp(A,nA2n...nAt). Důkaz. Aby se výše naznačený postup stal důkazem, je zapotřebí si ujasnit, že skutečně všechny korekce, tak jak jsou popsány, jsou skutečně s koeficienty jedna. Místo toho můžeme snáze dát dohromady formálnější důkaz matematickou indukcí přes počet k jevů, jejichž pravděpodobnosti sčítáme. Zkuste si průběžně porovnávat oba postupy, mělo by to vést k vyjasnění, co to znamená „dokázat" a co „porozumět". Pro k — 1 tvrzení zjevně platí, vztah pro k — 2 je totožný s rovností (1.11) a tu jsme pro obecné pravděpodobnostní funkce již dokázali také. Předpokládejme tedy, že věta platí pro všechny počty množin až do pevně zvoleného k > 1. Nyní můžeme pracovat v indukčním kroku se vztahem pro k + 1 jevů, když sjednocení prvních k jevů bereme jako A ve vzorci (1.11) výše, zatímco zbývající jev hraje roli B: uřÍ1Ař) = p((uř=1Ař)uAi+1) = = E((-1)>fl E P(Ahn---nAij)\ + 7=1 y 1<í'i < — = li (pravděpodobnosti násobíme, protože se jedná o nezávislé jevy). Dále je ze zadání P(A2) = \. Celkem Metodu geometrické pravděpodobnosti, (viz 1.21 můžeme použít v případě, že daný základní prostor sestává z nekonečně mnoha elementárních jevů, které dohromady vyplňují nějakou oblast na přímce, rovině, prostoru (u které umíme určit její délku, obsah, objem, ...). Předpokládáme, že pravděpodobnost toho, že nastane elementární jev Jak je vidět přímo z definice, hypotéza H a jev A jsou skutečně nezávislé tehdy a jen tehdy, je-li P(A) = P(A\H). Přímo z definice také vyplývá tzv. „věta o násobení pravděpodobností". Máme-li dva jevy A\, A2 splňující P{A\ n A2) > 0, potom P(Ai n A2) = P(A2)P(Ai\A2) = P(Ai)P(A2\Ai). Všechna tato čísla vyjadřují pravděpodobnost toho, že nastanou oba jevy A\ i A2, jenom jinými způsoby. Například v posledním případě nejprve sledujeme, zda nastane první jev. Potom za předpokladu, že ten první nastal, sledujeme zda nastane i ten druhý. Podobně pro tři jevy A\, A2, A3 splňující P{A\ n A2 n A3) > 0 dostaneme P(Ai n A2 n A3) = P(Ai)P(A2|Ai)P(A3|Ai n A2). Slovy to lze opět popsat tak, že pravděpodobnost výskytu všech tří jevů zároveň můžeme spočítat tak, že se nejprve zabýváme výskytem pouze prvního z nich, potom druhého za předpokladu, že první už nastal, a naposledy třetího za předpokladu, že oba předešlé jevy již nastaly. Máme-li obecný počet k jevů A1, ..., A t splňujících P{A\C\ • • • n Aj-) > 0, pak věta říká následující: p(Ai n • • • n Ak) = P(Ai)P(A2|Ai)- • -P{Ak\Ai n • • • n Ak-i). Skutečně, dle předpokladu jsou i pravděpodobnosti všech průniků, které jsou brány ve výrazu za hypotézy, nenulové. Pokrácením čitatelů a jmenovatelů získáme i napravo právě pravděpodobnost jevu odpovídajícího průniku všech uvažovaných jevů. 1.21. Geometrická pravděpodobnost. V praktických problémech se často setkáváme s daleko složitějšími modely, kde základní prostor není konečnou množinou. Nemáme momentálně k dispozici ani základní nástroje pro dostatečné zobecnění pojmu pravděpodobnosti, nicméně můžeme uvést alespoň jednoduchou ilustraci. Uvažme rovinu R2 dvojic reálných čísel a v ní podmnožinu Q se známým obsahem vol Q (symbol „vol" je od anglického „volume", tj. obsah/objem). Příkladem může sloužit třeba jednotkový čtverec. Náhodné jevy budou reprezentovány podmnožinami A c Q a za jevové pole A bereme nějaký vhodný systém podmnožin, u kterých umíme určit jejich obsah. Nastoupení nebo nenastoupení jevu je dáno výběrem bodu v Q, kterým se trefíme nebo netrefíme do množiny reprezentující jev A. Uvažme jako příklad problém, kdy náhodně vybereme dvě hodnoty a < b v intervalu [0, 1] c R. Všechny hodnoty a i b jsou stejně pravděpodobné a otázka zní , jaká je pravděpodobnost, že interval (a, b) bude mít velikost alespoň jedna polovina?'. Volba čísel a, b j e volbou libovolného bodu [a, b] ve vnitřku trojúhelníku Q s hraničními vrcholy [0, 0], [0, 1], [1, 1] (viz obrázek). 24 KAPITOLA 1. ROZCVIČKA z určité podoblasti je rovna poměru její velikosti (délce, obsahu,...) k velikosti celého základního prostoru. 1.45. Z Těšína vyjíždí vlaky co půl hodinu (směrem na Bohumín) a z tohoto směru přijíždějí také každé půl hodiny. Předpokládejme, že vlaky se mezi těmito dvěma stanicemi pohybují rovnoměrnou rychlostí 72 km/h a jsou dlouhé 100 metrů, cesta trvá 30 minut, vlaky se míjejí někde na trase. Nevyspalý hazardér Jarek si vybere jeden z těchto vlaků a během cesty z Těšína do Bohumína náhodně vystrčí hlavu z okna na pět vteřin nad kolejiště pro protější směr. Jaká je pravděpodobnost, že mu bude uražena? (Předpokládáme, že jiné než zmíněné vlaky na trati nejezdí.) Řešení. Vzájemná rychlost protijedoucích vlaků je 40m/í, protijedoucí vlak mine Jardovo okno za dvě a půl sekundy. Prostor všech možností je tedy interval [0,1800 s], prostor „příznivých" možností je potom interval délky 7,5 s ležící někde uvnitř předchozí úsečky. Pravděpodobnost uražení hlavy je tedy 7,5/1800 = 0,004. □ 1.46. Jednou denně někdy mezi osmou hodinou ranní a osmou hodinou večerní vyjíždí náhodně autobus z Koločavy do Užhorodu. Jednou denně ve stejném časovém rozmezí jezdí jiný autobus náhodně opačným směrem. Cesta tam trvá pět hodin, zpět též pět hodin. Jaká je pravděpodobnost, že se autobusy potkají, jezdí-li po stejné trase? Řešení. Prostor všech možných jevů je čtverec 12 x 12, Označíme-li doby odjezdu obou autobusů x, resp. y, pak se tyto na trase potkají právě když \x — y\ < 5. Tato nerovnost vymezuje v daném čtverci oblast „příznivých jevů". Obsah zbylé části spočítáme přímo jednodušeji, neboť je sjednocením dvou pravoúhlých rovnoramenných trojúhelníků o odvěsnách délky 7, tedy je roven 49, obsah části odpovídající „příznivým jevům" je tedy 144 — 49 = 95, celkem je hledaná pravděpodobnost p = Ä = 0,66. Koloowa - uznám? 2° z K ■ □ 1.47. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že alespoň jeden díl bude nejvýše 20 cm dlouhý. Úlohu si můžeme představit jako popis problému, kdy se hodně unavený účastník večírku nad ránem pokouší dvěma řezy rozdělit párek na tři díly pro sebe a své dva kamarády. Jaká je pravděpodobnost, že se na někoho dostane aspoň půlka? Odpověď je docela jednoduchá: Podobně jako u klasické pravděpodobnosti definujeme pravděpodobnostní funkci P : A -» K vztahem vol A vol S2 kde A jsou podmnožiny v rovině, které odpovídají námi vybraným jevům. Potřebujeme tedy znát plochu podmnožiny, která odpovídá bodům s b > a + j, tj. vnitřku trojúhelníku A ohraničeného vrcholy [0, i], [0, 1], [i, 1]. Evidentně dostáváme P (A) = \. Zkuste si samostatně odpovědět na otázku „pro jakou požadovanou minimální délku intervalu (a,b) dostaneme pravděpodobnost jedna polovina?". 1.22. Metody Monte Carlo. Jednou z účinných výpočetních me-^i' , tod přibližných hodnot je naopak simulace známé tako-rfjj^ veto pravděpodobnosti pomocí relativní četnosti nastou-r%>ä^ pení vhodně zvoleného jevu. Např. známá formule pro ob-'1 ! sah kruhu o daném poloměru říká, že obsah jednotkového kruhu je roven právě konstantě n = 3, 1415..., která vyjadřuje poměr obsahu kruhu a druhé mocniny jeho poloměru. (Tady si také povšimněme východiska, které jsme nedokázali - proč by měl být obsah kruhu roven konstantnímu násobku druhé mocniny poloměru? Matematicky to budeme umět ukázat, až zvládneme tzv. integrování. Experimentálně si to ale můžeme ověřit níže uvedeným postupem s různými velikostmi strany čtverce.) Pokud zvolíme za Q jednotkový čtverec a za A průnik Q a jednotkového kruhu se středem v počátku, pak vol A — \ti. Máme-li tedy spolehlivý generátor náhodných čísel mezi nulou a jedničkou a počítáme relativní četnosti, jak často bude vzdálenost bodu [a, b] (určeného vygenerovanou dvojicí a, b) od počátku menší nezjedná, tj. a2 + b2 < 1, pak výsledek bude při velkém počtu pokusů s velikou jistotou dobře aproximovat číslo \n. 25 KAPITOLA 1. ROZCVIČKA Řešení. Náhodné rozdělení tyče na tři díly je dáno dvěma body řezu, čísly x a y (nejprve tyč rozřízneme ve vzdálenosti x od počátku, nehýbeme s ní a dále ji rozřízneme ve vzdálenosti y od počátku). Pravděpodobnostní prostor je tedy čtverec C o straně 2 m. Umístíme-li čtverec C tak, aby dvě jeho strany ležely na kartézských osách v rovině, tak podmínka, že alespoň jeden díl má být nejvýše 20 cm dlouhý, nám vymezuje ve čtverci následující oblast O: O = {(x, y)€C\ (x < 20) v (x > 180) v (y < 20)v V (y > 180) V (\x - y\) < 20}. Jak snadno nahlédneme, zaujímá takto vymezená oblast čtverce. PvoutiEtta/*,' 7rc obsahu 2oz ~ Ido 16 1s 10 □ E. Geometrie v rovině Vraťme se na chvíli ke komplexním číslům. Komplexní rovina je totiž „normami*' rovina, kde ovšem máme dáno něco navíc: 1.48. Interpretujte násobení imaginární jednotkou a vzetí komplexně sdruženého čísla jako geometrickou transformaci v rovině. Řešení. Imaginární jednotka i odpovídá bodu (0, 1) a všimněme si, že vynásobení jakéhokoliv čísla z = a + i b imaginární jednotkou dává výsledek i ■ (a + i b) = —b + i a což v interpretaci v rovině znamená otočení bodu z o pravý úhel v kladném smyslu, tj. proti směru hodinových ručiček. Přiřazení komplexně sdruženého čísla je symetrie podle osy reálných čísel: z = (a + i b) i-» (a — i b) = ž ■ □ Nyní jeden známý, ale velmi pěkný příklad. 1.49. Určete součet úhlů, které v rovině K2 svírají s osou x postupně vektory (1,1), (2,1) a (3,1) Řešení. Uvážíme-li rovinu K2 jakožto Gaussovu rovinu komplexních čísel, tak uvedené vektory odpovídají komplexním číslům 1 + i, 2 + i Numerickým postupům založeným na tomto principu se říká metody Monte Carlo. 5. Geometrie v rovině V posledních odstavcích jsme intuitivně používali elementární "ĚL-f<: pojmy z geometrie reálné roviny. Teď budeme po-drobněji zkoumat, jak se vypořádávat s potřebou po-*&§jB~b_ľS pisovat „polohu v rovině", resp. dávat do souvislostí polohy různých bodů roviny. Nástrojem k tomu budou opět zobrazení, tentokrát to ale budou velice speciální pravidla přiřazující dvojicím hodnot (x, y) dvojice (w, z) = F(x, y). Zároveň půjde o předzvěst úvah z oblasti matematiky, které se říká lineární algebra a kterou se budeme podrobně zabývat v dalších třech kapitolách. 1.23. Vektorový prostor R2. Podívejme se na „rovinu" jakožto na množinu dvojic reálných čísel (x, y) e R2. Budeme jim říkat vektory v R2. Pro takové vektory umíme definovat sčítání „po složkách", tj. pro vektory u — (x, y) a v — (x1, y') klademe u + v = (x+x',y + y). Protože pro jednotlivé složky platí všechny vlastnosti komutativní grupy, evidentně budou tyto vlastnosti platit i pro naše nové sčítání vektorů. Zejména tedy máme tzv. nulový vektor 0 = (0, 0), jehož přičtením k jakémukoliv vektoru v dostaneme opět vektor v. Záměrně teď používáme tentýž symbol 0 pro vektor i jeho skalární složky - z kontextu je vždy jasné, jakou „nulu" máme kdy na mysli. Dále definujeme násobení vektorů a skalárů tak, že pro a e R a v — (x, y) e R2 klademe a ■ v — (ax, ay). Zpravidla budeme znak • vynechávat a pouhé zřetězení znaků a v bude označovat skalární násobek vektoru. Přímo se ověří další vlastnosti pro násobení skaláry a, b a sčítání vektorů u, v, např. a (u + v) = a u + a v, (a + b)u — au + bu, a(bu) — (ab)u, kde opět používáme stejný znak plus pro sčítání vektorů i skalárů. Tyto operace si můžeme dobře představit, jestliže uvažujeme vektory v jako šipky začínající v počátku 0 = [0, 0] a končící v bodě [x, y] v rovině. Takové šipky pak můžeme přikládat jednu za druhou a to přesně odpovídá sčítání vektorů. Násobení skalárem a pak odpovídá natažení dané šipky na a-násobek. UNBAKNt KjOHBINACB. •2 a*/ +0r + rt/r- 26 KAPITOLA 1. ROZCVIČKA a 3 + i a máme najít součet jejich argumentu, tedy podle Moivreovy věty argument jejich součinu. Jejich součin je (1+0 (2+í) (3+0 = = (1 + 30 (3 + 0 = 10i, tedy ryze imaginární číslo s argumentem ji/2 a tedy hledaný součet je roven právě ji/2. □ 1.50. Napište obecnou rovnici přímky p : x = 2 — t, y = 1 + 3t, t e K. Řešení. Vektor (—1,3) je směrovým vektorem přímky p. Proto vektor (3,1) je jejím normálovým vektorem a obecná rovnice přímky p má tvar 3x + y + c = 0 pro jisté c e K. Tuto konstantu c určíme dosazením x = 2, y = 1 (přímka p prochází bodem [2,1] daným volbou / = 0). Získáváme tak c = —7 a následně výsledek 3x + y — 1 = 0. □ 1.51. Je dána přímka p : [2,0] +/(3,2), t e K. Určete její obecnou rovnici a nalezněte průnik s přímkou q : [-1,2] +í(1,3), s e K. Řešení. Souřadnice bodů na přímce jsou dány dle daného parametrického zadání jako x = 2 + 3t a y = 0 + 2t. Vyloučením parametru / ze soustavy těchto dvou rovnic dostáváme obecnou rovnici přímky p: 2x — 3y ■ 0. Průnik s přímkou q získáme dosazením parametrického vyjádření bodů přímky q, tedy x = —1+say = 2 + 3 s, do obecné rovnice přímky p: 2(-1+í)-3(2 + 3í)-4 = 0, odkud s = —12/7 a dosazením do parametrického vyjádření přímky q dostáváme souřadnice průsečíku P: P = [-*-*]■ □ 1.52. Stanovte průsečík přímek p : x + y — 4 = 0, q : x = -1 + 2t, y = 2 +t, t e Řešení. Nejdříve poznamenejme, že směrovým vektorem přímky p je up = (1,-1) (libovolný nenulový vektor kolmý k vektoru (1,1) z obecné rovnice přímky) a směrovým vektorem přímky q je uq = (2, 1). To, že vektor up není násobkem vektoru uq, pak zaručuje, že se přímky protínají (přímky nejsou rovnoběžné). Nyní můžeme udělat podstatný krok: jestliže si zapamatujeme ■J: .i dva významné vektory e\ — (1, 0) a ei = (0, 1), pak ka-ždý jiný vektor dostaneme j ako '• Tfp,\ u — (x, ý) — x e\ + y ei- Výrazu napravo říkáme lineární kombinace vektoru e\ae2. Dvojici vektorů e — (e\,ei) říkáme báze vektorového prostoru M?. Jestliže si ale vybereme jiné dva vektory u, v, které nejsou jeden násobek druhého, tj. jinou bázi v R2, budeme moci udělat totéž. Lineární kombinace w — xu + y v nám pro všechny různé dvojice (x, y) dá právě všechny vektory w v rovině. Nakonec můžeme nahlížet vektory jako naše šipky v abs-j*8ä traktní poloze, tj. zapomeneme na ztotožnění bodů v rovině s dvojicemi čísel. Jenom budou naše šipky /"rsíivtí všechny „upoutány" v bodě 0, který je zároveň nu-' lovým vektorem. Zůstanou nám operace sčítání a násobení skaláry a teprve volbou báze e\, e% ztotožníme naši rovinu šipek s R2. 1.24. Afinní rovina. Když si pevně vyvolíme nějaký vektor u e R2, můžeme jej přičítat (tj. coby šipku přikládat) k libovolnému bodu P = [x, y]. Máme tak tedy s pevným vektorem definované posunutí, které každý bod roviny P zobrazí na P + u. Zkusme teď úplně zapomenout na souřadnice a vnímat celou rovinu jako množinu, na které fungují naše posunutí. Takovou množinu A — M? si můžeme představit z pohledu pozorovatele, který sedí v některém pevně zvoleném místě (můžeme mu říkat třeba bod [xo, yo] ). Předpokládejme, že ji vnímá jako ne- konečnou desku bez jakýchkoliv zvolených měřítek a popisů a jenom ví, co to znamená posunout se o libovolný násobek nějakého vektoru «6l2. Takové rovině budeme říkat „afinní rovina". Aby mohl vidět kolem sebe „dvojice reálných čísel", musí si vybrat nějaký bod E\, kterému řekne „bod [1,0]" a jiný bod £2» kterému začne říkat „bod [0, 1]". Jinými slovy, zvolí si bázi e\ — (1, 0), i?2 = (0, 1) mezi vektory posunutí. Do všech ostatních se pak dostane tak, že poskočí „a-krát ve směru e\" a pak „Ŕ-krát ve směru «2" a takovému bodu bude říkat „bod [a, b]". Pokud to bude dělat obvyklým způsobem, nebude výsledek záviset na pořadí, tzn. může také napřed jít Ŕ-krát ve směru «2 a pak teprve ve směru e\. To, co jsme popsali, se nazývá volba (afinního) souřadného systému v rovině, bod Oje jeho počátkem, a obecně každý bod P roviny je ztotožněn s dvojicí čísel [a, b], kterou také budeme psát jako posunutí P — O. 27 KAPITOLA 1. ROZCVIČKA Bod [x, y] je hledaným průsečíkem, právě když jeho souřadnice vyhovují rovnici přímky p a současně existuje reálné číslo /, pro které x = -l + 2t, y = 2 + t. Dosadíme-li odsud do obecné rovnice p, obdržíme (-1+2/)+ (2 + r)-4 = 0. Této rovnici vyhovuje právě / = 1, což dává průsečík se souřadnicemi x = l,y = 3. □ 1.53. Najděte obecnou rovnici přímky p, jež prochází bodem [2, 3] a je rovnoběžná s přímkou x — 3y + 2 = 0, a parametrickou rovnici přímky q procházející body [1,3] a [—2,1]. Řešení. Každá přímka rovnoběžná s přímkou x— 3y+2 = Oje zadána rovnicí x — 3y + c = 0 pro nějaké cel. Přímka p prochází bodem [2, 3]. Musí tedy platit 2 - 3 • 3 + c = 0, tj. c = 7. Pro přímku q lze ihned uvést její parametrické vyjádření q : [1, 3] + t (1 - (-2), 3 - 1) = [1, 3] + t (3, 2), t e K. □ 1.54. Zjistěte, zda některé z přímek pi : 2x + 3y - 4 = 0, p3 : — 2x + 2y = —6, p2 : x - y + 3 = 0, 3 p5 : x = 2 + t, y : (ne)jsou totožné. Řešení. Je vidět, že p4 : -x 2-t, t e R ■y + 2 = 0, x--y + 2j=2x + 3y-4. Obecné rovnice pi&pn tudíž zadávají stejnou prímku. Normálový vektor přímky p\ je (2, 3), pro přímku P2 je (1, —1), pro pi je (—2, 2) aproř>5je(l, 1) (kolmý vektor k vektoru (1, — l)).Přímky ^a^jsou rovnoběžné (normálový vektor jedné je násobkem normálového vektoru druhé). Další dvojice rovnoběžných přímek neexistují. Neboť soustava x-y + 3 = 0, -2x + 2y+( 0 zjevně nemá řešení, přímky p\ a pn tvoří jedinou dvojici totožných přímek. □ Budeme dále pracovat v pevně zvolených souřadnicích, tj. s dvojicemi reálných čísel, ale pro lepší orientaci budeme vektory zapisovat s kulatými závorkami místo hranatých u souřadnic bodů v afinní rovině. -zornice- T&Utcf 1.25. Přímky v rovině. Když se náš pozorovatel umí posouvat jí1 ., o libovolný násobek pevného vektoru, pak také ví, co je to přímka. Je to podmnožina p c A v rovině taková, že existují bod O a nenulový vektor v takové, že p — {P e A; P - O — t ■ v, t e R). Popišme si P = P (t) e p ve zvolených souřadnicích s volbou v = (a, P): x(t) — xo+a - t, y(t) — yo + /3 • t. Protože vektor v — (a, p) je nenulový, musí být aspoň jedno z čísel a, fi různé od nuly. Když pro určitost předpokládáme, že třeba «/0, pak vyloučíme t z parametrického vyjádření pro x a y a jednoduchým výpočtem dostaneme -fix + ay — -fixo + ayo. To je obecná rovnice přímky (1.13) ax+by = c se známým vztahem dvojice čísel (a, b) = (—fi, a) a směrového vektoru přímky v — (a, p) (1.14) aa + bfi = 0. 28 KAPITOLA 1. ROZCVIČKA 1.55. Určete přímku která je kolmá k přímce q : 6x — 7v+13 = 0 a prochází bodem [—6, 7]. Řešení. Protože normálový vektor přímky q je směrový vektor přímky p, můžeme bezprostředně napsat výsledek p : x = -6 + 6/, y = 1 - It, t e K. □ 1.56. Udejte příklad čísel a, b e K, pro něž je vektor u normálovým vektorem přímky AB, je-li A = [1, 2], S = [2fc, u = (a — b, 3). Řešení. Směrovým vektorem přímky AS je (2b — 1, b — 2) (tento vektor je vždy nenulový), a proto jejím normálovým vektorem je (2 — b, 2b — 1). Položíme-li 2-b = a-b, 2b-1 = 3, dostáváme a 2. □ 1.57. Určete vzájemnou polohu přímek p a q v rovině, jestliže je p : 2x — y — 5 = Oaq : x + 2y — 5 = 0. Pokud se jedná o různoběžky, nalezněte souřadnice jejich průsečíku. Řešení. Z obecných rovnic přímek p, q známe jejich normálové vektory (2, — 1), (1, 2). Přímky jsou rovnoběžné právě tehdy, je-li normálový vektor jedné násobkem normálového vektoru druhé, což zřejmě pro přímky p, q splněno není. Jde tedy o různoběžky. Průsečík nalezneme vyřešením soustavy 2x - y - 5 = 0, x + 2y - 5 = 0. Když z první rovnice vyjádříme y = 2x — 5 a dosadíme za y do druhé, získáme x + 2(2x - 5) - 5 = 0, tj.x = 3. Poté snadno určíme y = 2 ■ 3 — 5 = 1. Přímky se tak protínají v bodě [3,1]. □ 1.58. Uvažujme rovinu K2 se standardní soustavou souřadnic. Z počátku [0, 0] je vyslán laserový paprsek ve směru (3,1). Dopadne na zrcadlovou přímku p danou parametricky jako p: [4,3] + /(-2, 1) a poté se odrazí (úhel dopadu je shodný s úhlem odrazu). V jakém bodě dopadne odražený paprsek na přímku q danou parametricky jako q : [7,-10]+/(-l,6)? Řešení. Směr paprsku svírá s přímkou p úhel 45°, odražený paprsek tedy bude kolmý na dopadající, jeho směrový vektor bude (1, —3) (Pozor na orientaci! Daný směrový vektor můžeme též získat například Výraz nalevo v rovnici přímky (1.13) můžeme vidět jako skalární funkci F závislou na bodech v rovině a s hodnotami v R, samu rovnici pak jako požadavek na její hodnotu. Časem uvidíme, že vektor (a, b) je v tomto — případě právě směrem, ve kterém F nejrychleji roste. Proto bude směr kolmý na (a, b) právě tím směrem, ve kterém zůstává naše funkce F konstantní. Konstanta c pak určuje, kterou ze všech rovnoběžných přímek rovnice určuje. Mějme nyní dvě přímky p aq a ptejme se po jejich průniku p n q. Ten bude popsán jako bod, splňující obě rovnice přímek současně. Pišme je takto ax +by — r, (1.15) cx + dy — s. Opět můžeme levou stranu vnímat jako přiřazení, které každé dvojici souřadnic [x, y] bodů P v rovině přiřadí vektor hodnot dvou skalárních funkcí F\ a F2 daných levými stranami jednotlivých rovnic (1.15). Můžeme tedy naše rovnice napsat jako jediný vztah F (v) = w, kde F je přiřazení, které vektor v popisující polohu obecného bodu v rovině (v našich souřadnicích) zobrazí na vektor zadaný levou stranou rovnic, a požadujeme, aby se toto zobrazení strefilo do předem zadané hodnoty w = (r, s). 1.26. Lineární zobrazení a matice. Přiřazení F, se kterými jsme pracovali při popisu průniku přímek, mají jednu ve-»--^/S lice podstatnou společnou vlastnost: respektují operace sčítání a násobení s vektory a skaláry, tj. respektují lineární kombinace: F(a - v + b ■ w) pro všechna a, i2 do 3>2 F(v)+b- F(w) v,w e R2. Říkáme, že F je lineární zob- t B>2 razeni z JK^ do Kŕ, a píšeme F : Rz -> R/. Slovy lze podmínku také vyjádřit tak, že lineární kombinace vektorů se zobrazuje na tutéž lineární kombinaci jejich obrazů, tj. lineární zobrazení jsou ta zobrazení, která zachovávají lineární kombinace. Se stejným chováním jsme se setkali i v rovnici (1.13) pro přímku, kde šlo o lineární zobrazení F : R2 -> R a jeho předepsanou hodnotu c. To je také důvodem, proč jsou hodnoty zobrazení z — F(x, y) na obrázku vyobrazeny jako rovina v R3. Stručně budeme zapisovat taková zobrazení pomocí tzv. matic a jejich násobení. Maticí rozumíme obdélníkové schéma skalárů, např. A = C nebo v — hovoříme o (čtvercové) matici A a (sloupcovém) vektoru v. Jejich násobení definujeme takto: A-v=(a j)-(x) = (axt'7)- \c d J \y J \cx + dyj Podobně, můžeme místo vektoru v zprava násobit jinou maticí B stejného rozměru jako je A. Prostě aplikujeme předchozí formule po jednotlivých sloupcích matice B a obdržíme jako výsledek opět čtvercovou matici. Neumíme násobit vektor v zprava maticí A protože nám ne-@ vychází počty skalárů na řádcích v s počty skalárů ve fiŠSl' sloupcích A. Umíme však napsat vektor w do řádku / ij íj skalárů (tzv. transponovaný vektor) wT — (a, b) a ten 'Sjí-*-r£* zprava našimi maticemi A nebo vektory v již násobit umíme. 29 KAPITOLA 1. ROZCVIČKA zrcadlením (osovou symetrií) podle kolmého vektoru k přímce p.). Paprsek dopadne v bodě [6, 2], odražený paprsek tedy bude mít rovnici [6,2] +/(1, -3), t > 0. Průnik přímky dané odraženým paprskem s přímkou q je bod [4, 8], což je mimo polopřímku, kteráje daná odraženým paprskem (/ = —2). Odražený paprsek tedy přímku q neprotne. □ Poznámka. Odraz paprsku v třírozměrném prostoru je studován v příkladu ||3.42||. 1.59. Z bodu [—2, 0] vyrazila v pravé poledne konstantní rychlostí 1 ms_1 ve směru (3, 2) úsečka délky 1. Rovněž v poledne vyrazila zbodu [5, —2] druhá úsečka délky 1 ve směru (—1,1), ovšem dvojnásobnou rychlostí. Srazí se? Řešení. Přímky, po kterých se pohybují dané úsečky, můžeme popsat parametrickým vyjádřením: p:[-2,0]+r(3,2), q :[5,-2]+í(-1,1). Obecná rovnice přímky p je 2x - 3y + 4 = 0. Dosazením parametrického vyjádření přímky q získáme průsečík P = [1,2]. Nyní se snažme zvolit jediný parametr / pro obě úsečky tak, aby nám odpovídající bod na přímkách p, resp. q, popisoval polohu počátku první, resp. druhé, úsečky v čase /. V čase 0 je první úsečka v bodě [—2, 0], druhá v bodě [5, —2]. Za čas / sekund urazí první úsečka / jednotek délky ve směru (3, 2) druhá pak 2t jednotek délky ve směru (—1, 1). Odpovídající parametrizace jsou tedy p : [-2,0] + -J=(3, 2), v 13 í :[5,-2] + /V2(-l,l). Počátek první úsečky dorazí do bodu [1, 2] v čase t\ = VIŠ s, počátek druhé úsečky v čase / = 2\/2 s, tedy více než o půl vteřiny dříve. Tedy v době, kdy dorazí do průsečíku P počátek první úsečky, bude již konec druhé úsečky pryč a úsečky se tak nesrazí. □ 1.60. Rovinný fotbalista vystřelí míč z bodu F = [1, 0] ve směru (3,4) na bránu (úsečku) ohraničenou body A = [23,36] a B = [26, 30]. Směřuje míč do brány? Řešení. Vzhledem k tomu, že se situace odehrává v prvním kvadrantu, stačí uvažovat směrnice vektorů FA, (3, 4), FB. Tvoří-li (v tomto pořadí) buďrostoucí nebo klesající posloupnost, míč směřuje na bránu. Snadno ověříme tzv. asociativitu násobení (propočítejte pro obecné matice A, B a vektor v detailně): (A ■ B) ■ v — A ■ (B ■ v). Místo vektoru v můžeme samozřejmě psát i libovolnou matici C správného rozměru. Stejně snadno je vidět i distributivita A-(B + C) = A-B + A-C. Neplatí však komutativita a existují „dělitelé nuly". Např. /0 l\ /0 0\ _ /0 l\ /0 0\ /0 l\ _ /0 \0 o)'\o 1/ V° °) ' \° V \° °) ~ \° Zejména vidíme, že násobení vektorů pevnou maticí zadává lineární zobrazení, a naopak, pomocí hodnot lineárního zobrazení F na dvou pevných vektorech báze už dostaneme celé příslušné zobrazení. Body v rovině jsou tedy obecně vzory hodnot lineárních zobrazení F roviny do roviny, přímky jsou obecně vzory hodnot lineárních zobrazení z roviny do reálné přímky M. S maticemi a vektory umíme rovnice pro přímky a body psát (a *)•(■ C i)-Q-C A - v — Ve zvláštních situacích tomu tak být nemusí. Tak třeba průnikem dvou stejných přímek je opět sama přímka (a vzorem vhodné hodnoty pro takové lineární zobrazení bude celá přímka), nulové zobrazení má za vzor nuly celou rovinu. V prvém případě to poznáme tak, že jsou nalevo v rovnicích (1.15) stejné výrazy až na skalární násobek (nebo jinak řečeno, řádky matice A jsou stejné až na skalární násobek). V takovém případě buď nebude v průniku příslušných přímek žádný bod (rovnoběžné různé přímky) nebo tam budou všechny body přímky (stejné přímky). Tuto podmínku může vyjádřit tak, že poměry a/c ab/d musí být stejné, neboli (1.16) ad — bc — 0. Všimněme si, že toto vyjádření už zahrnuje i případy, kdy c nebo d je nulové. 1.27. Determinant matice. Výrazu nalevo v (1.16) říkáme determinant matice A a píšeme pro něj detA — a b — ad — bc. Naši diskusi teď můžeme vyjádřit takto: Tvrzení. Determinant je skalární funkce det A definovaná na všech čtvercových maticích A a rovnice A ■ v — u je jednoznačně řešitelná, právě když je det Zkuste promyslet, že pro tuto úvahu bylo podstatné, že pra-. jL. , čujeme s polem skalárů. Například nad celými čísly obecně neplatí. Když prostě spočteme řešení rovnic s celočíselnými koeficienty (tj. matice A má pouze W celočíselné vstupy), tak toto řešení celočíselné být ne- 30 KAPITOLA 1. ROZCVIČKA Tato posloupnost je 36/22, 4/3, 30/25, což je klesající posloupnost, míč tedy směřuje do brány. 1.61. Upravte (A — B)T ■ 2C ■ u, přičemž □ c 2 -2 4 5 2 0 -1 1 Řešení. Dosazením A - B = -2 5 -1 1 , (A - B)' 2C -- a násobením matic dostáváme - í-2 -1 5 1 -4 10 (A -B)T -2C-u 4 -4 8 10 -2 -1 5 1 -52 64 □ 1.62. Uvedie příklad matic A a B, pro něž (a) (A + B) • (A - B) ^ A-A - B ■ B, (b) (A + S) • (A + B) ŕ A ■ A +2A ■ B + B ■ B. Řešení. Připomeňme, že uvažujeme dvojrozměrné (čtvercové) matice A a B. Pro libovolné matice A a S ovšem platí (A + B) ■ (A- B) = A ■ A -A-B + B-A - B ■ B. Identitu (A + B) ■ (A - B) = A ■ A - B ■ B tak dostaneme, právě když je — A ■ B + B ■ A nulovou maticí, tj. právě když matice A a S komutují. Příkladem hledaných matic jsou tedy právě ty dvojice matic, které nekomutují (matice součinu se při záměně pořadí násobených matic změní). Můžeme např. zvolit 1 2 3 4 neboť při této volbě je A • B = B , BA 4 3 2 1 13 20 5 v20 13, Analogicky pro každou dvojici matic A, B platí (A + B) ■ (A + B) = A ■ A +A-B + B- A + B ■ B. To znamená, že (A + B)-(A + B) = A-A + A- B + A- B + B- B 1.28. Afinní zobrazení. Podíváme se, jak maticová symbolika , umožňuje pracovat s jednoduchými zobrazeními v afinní rovině. Viděli jsme, že násobením maticí f^Lrz. je dáno lineární zobrazení. Posunutí v afinní rovině i2 o pevný vektor t — (r, s) e M.2 umíme v maticové formě také snadno zapsat: '-GH+'-GKK::)- Jestliže k výsledku lineárního zobrazení ještě dovolíme přičíst pevný vektor t — (r, s), pak naše zobrazení bude mít tvar A -v + t ■- íax +by + r\ \cx + dy + s J ' [ex + dy + s i Takto jsou popsána právě všechna tzv. afinní zobrazení roviny do sebe. Taková zobrazení nám umožní přepočítávání souřadnic vzniklých různými volbami počátků a bází směrů pro posunutí. Co se stane, když náš pozorovatel z odstavce 1.23 bude tutéž rovinu shlížet z jiného bodu nebo si aspoň vybere jiné body E\, E^l Zkuste si promyslet, že na úrovni souřadnic to skutečně bude právě změna realizovaná pomocí afinního zobrazení. Časem budeme vidět obecné důvody, proč tomu tak je ve všech dimenzích. 1.29. Euklidovská rovina. Přidejme nyní schopnost našeho pozorovatele vidět vzdálenosti. Např. může věřit obvyklému vzorci pro velikost vektoru v — {a,b) \\v\\ — Va2 + b2 v jím zvolených afinních souřadnicích. Okamžitě pak můžeme definovat pojmy jako jsou úhel a otočení v rovině. Jednoduše si to můžeme představit takto: náš člověk se rozhodne o nějakých bodech E\ a E2, že jsou od něj ve \.-W/> vzdálenosti jedna, a zároveň si řekne, že jsou na sebe kolmé. Vzdálenosti ve směrech souřadných os pak jsou dány příslušným poměrem, obecně používá Euklidovu (nebo Pythagorovu) větu. Odtud vyjde právě výše uvedený vzorec. ŽUKLIVOVSty/ 1/ZM't-ĚNOST IMI=Hľ-tlll = WíiF 31 KAPITOLA 1. ROZCVIČKA je splněno tehdy a jenom tehdy, když AB = B-A. Ve druhém případě jsou tak hledané dvojice matic A, B zcela totožné s případem prvním. □ 1.63. Rozhodněte, zda jsou zobrazení F, G : K2 přiřazeními Ix — 3y zadaná F : G -2x + 5y 2x + 2y - 4 4x-9y + 3 x,y € K, , x, y e I lineární. Řešení. Pro libovolný vektor (x, y)T e K2 můžeme vyjádřit □ Odtud vyplývá, že obě zobrazení jsou afinní. Připomeňme, že afinní zobrazení je lineární, právě když se nulový vektor zobrazí sám na sebe. Víme, že platí ÍS))-(S)--((S))-(3 a proto je zobrazení F je lineární, zobrazení G nikoli 1.64. Spočtěte délky stran trojúhelníka s vrcholy A = [2,2] B = [3,0] C = [4, 3]. Řešení. Užitím známého vzorce pro velikost vektoru 11« II u\ + u\, u = (iíi, «2) € K2 obdržíme výsledky \AB\ = U -BII \BC\ = \\B -C|| \AC\ = \\A -C|| Náš pozorovatel roviny může samozřejmě postupovat i jinak. Může použít nějaký standard pro skutečné měření vzdálenosti bodů P a Q v rovině a říci, že to je právě velikost vektoru Q — P, který potřebujeme na posunutí z P do Q. Pak si vybere nějaký z vektorů, které skutečně mají velikost 1 a třeba pomocí trojúhelníku o stranách s velikostmi 3,4 a 5 zkonstruuje kolmý vektor o velikosti jedna a dále pokračuje jako výše. Euklidovská rovina je afinní rovina s výše zavedeným pojmem vzdálenosti. 1.30. Úhel vektorů. Jak jsme již používali při diskusi komplexních čísel coby bodů v rovině, tzv. goniometrická funkce cos

2 + v\ = = (U1 + V1)2 + (U2 + V2)2 + + («i - Dl)2 + (u2 - V2)2 = = \\u + v\\2 + \\u — v\\2. □ 1.66. Určete úhel, který svírají vektory (a) u = (-3, -2), v = (-2, 3); (b) u = (2,6), v = (-3,-9). Řešení. Hledaný úhel

Rý ■ v = (cos Ý [sin ý — sin ý cos ý Nyní, když už víme, jak vypadá matice otočení v rovině, ' můžeme ověřit, že otočení zachovává vzdálenosti a úhly (definované předešlým vzorcem). Označíme-li obraz vektoru v jako : sin ý + Vy cos ý a podobně platí Rf ■ w, pak lze snadno přepočítat, že opravdu VXWX + VyWy = VXWX + VyWy. Předchozí výraz lze pomocí vektorů a matic napsat následovně (RÝ -w)T(RÝ -v) = wTv. Transponovaný vektor (Rf ■ w)T je roven wT ■ R^, kde je tzv. transponovaná matice k matici Rf. To je matice, jejíž řádky tvoří sloupce původní matice a sloupce naopak tvoří řádky původní matice. Vidíme tedy, že matice otočení splňují vztah R ^ ■ R f — I, matice / (někdy píšeme prostě 1 a máme tím na mysli jednotku v okruhu matic) je tzv. jednotková matice I = (i!)- 33 KAPITOLA 1. ROZCVIČKA Řešení. Nechť (x, y)T je nadále libovolný reálný vektor. Pro matici A\ dostáváme (;)-(-)• 0=©- což znamená, že lineární zobrazení, které tato matice zadává, je (kolmá) projekce na osu x. Podobně vidíme, že matice A 2 určuje zrcadlení vzhledem k ose y, protože CM".1 KH7 Matici A 3 lze vyjádřit ve tvaru /cos

+ |J, [l-|V3,V3 + f]. □ 1.72. Najděte matice A takové, že 1 2 2 2 1 2 Tím jsme odvodili pozoruhodné tvrzení — matice F s vlastností, že F ■ Rf — I (budeme takové říkat inverzní matice k matici rotace R f) je maticí transponovanou k původní. To je logické, neboť inverzní zobrazení k rotaci o úhel Ý je opět rotace, ale o úhel —ý, tj. inverzní matice R^ je rovna matici R-,i. ( cos(—ý) — sin(—ý) cos(—ý) )"(- sin ý cos ý Pokud bychom chtěli zapsat rotaci kolem jiného bodu P = O + w, P = [Wj, wy] opět pomocí matice, snadno napíšeme potřebný vzorec pomocí posunutí: DOTACE S TOSUNUTl'rl Stačí si k tomu uvědomit, že můžeme místo rotace kolem daného bodu P napřed posunout P do našeho počátku, pak provést rotaci a pak udělat opačné posunutí, kterým celou rovinu vrátíme tam, kde měla celou dobu být, viz obrázek. Počítejme tedy Rf ■ (v - ► Rý ■ (v - w) w) + w — ( cos ý(x — Wj) — sin ý(y — wy) + wx ^sin Ý(x + COS Ý(y ~ wy)) + wy 1.32. Zrcadlení. Dalším dobře známým příkladem zobrazení, - která zachovávají velikosti, je tzv. zrcadlení vzhledem ■*í'"\**' k přímce. Opět nám bude stačit popsat zrcadlení vzhledem k přímkám procházejícím počátkem O a ostatní se z nich odvodí pomocí posunutí, resp. rotací. Hledejme tedy matici Z f zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel Ý s vektorem (1, 0). Nejprve si uvědomme, že Nápověda: jaké geometrické zobrazení v rovině zadává matice A ? Z0 = /l 0 Vo -1 34 KAPITOLA 1. ROZCVIČKA Řešení. A2 je matice rotace o 60° v kladném smyslu, takže hledané matice jsou A = ± 2 1 2 _ 1 2 VI 2 tj. jsou to matice rotace o 30°, resp. o 210°. 1.73. Stanovte A ■ A pro A □ cos cp sin

5 — (X — 5), neboli íh> 2S — X. (Obraz bodu X ve středové symetrii podle středu 5 dostaneme tak, že k souřadnicím bodu 5 přičteme souřadnice vektoru opačného k vektoru X — 5.) Postupnou aplikací tří středových souměrností se středy 5, T a U tak dostáváme X i-» 25 - X i-» 2T - (25 - X) i-» 2U - (2T - (25 - X)) = 6vW (iß) Obecně můžeme každou přímku otočit do směru vektoru (1,0) a tedy zapsat obecnou matici zrcadlení jako Zý — Rý ■ Zo ■ R-ý, kdy nejprve otočíme maticí R-ý přímku do „nulové" polohy, od-zrcadlíme maticí Zo a vrátíme zpět otočením R f. Můžeme proto (díky asociativitě násobení matic) spočíst: /cos ý — sin ý\ A 0 \ í cos * ^siní/f cos ý ) \0 —l) \— svciý cos ý cos ý sin ý ( )( sin ý - sin ý cos ý 2 sin ý cos ý - (cos2 ý — sin2 ý) cos ý sin ý — cos ý ícos2 ý — sin2 ý \ 2 sin ý cos ý /cos2i/f sin2i/f ysin2i/f — cos2i/f Použili jsme přitom obvyklé součtové vzorce pro goniometrické funkce. Povšimněme si také, že Zf ■ Zo je dáno: C /l 0 \ _ /cos2i/f -sin2^ sin2i/f — cos2ý J \0 —IJ \sin2ý cos2i/f cos2i/f sin2i/f Toto pozorování lze zakreslit a zformulovat následovně. Tvrzení. Otočení o úhel ý obdržíme následným provedením dvou zrcadlení vzhledem ke směrům, které spolu svírají úhel jý. Pokud umíme odůvodnit předchozí tvrzení ryze geometric-a\ kou úvahou (zkuste si zahrát na „syntetického geometra"), dokázali jsme právě standardní vzorce pro goniometrické funkce dvojnásobného úhlu. 35 KAPITOLA 1. ROZCVIČKA = 2(U — T + S) — X, celkem X i-» 2(U - T + S) - X, což je středová souměrnost se středem S—T+U. Složení libovolného lichého počtu středových souměrností tak postupně redukujeme až na složení tří středových souměrností, jde tedy o středovou symetrii (v principu se jedná o důkaz matematickou indukcí, zkuste si jej sami zformulovat). □ 1.76. Sestrojte (2n + l)-úhelník, jsou-li dány všechny středy jeho stran. Řešení. K řešení využijeme toho, že složením lichého počtu středových souměrností je opět středová souměrnost (viz příklad || 1.75||). Označme vrcholy hledaného (2n + l)-úhelníku po řadě A\, Á2, ■ ■ ■, A2„+\ a středy stran (počínaje středem strany A\ A2) postupně Si, 52,..., 52n+i. Provedeme-li středové souměrnosti po řadě podle těchto středů, tak bod A\ je zjevně pevným bodem výsledné středové souměrnosti, tedy jejím středem. K jeho nalezení tedy stačí provést uvedenou středovou souměrnost s libovolným bodem X roviny. Bod A\ leží pak ve středu úsečky XX', kde X' je obrazem bodu X ve zmíněné středové symetrii. Další vrcholy A2,..., A2n+\ získáme zobrazováním bodu A\ ve středových souměrnostech podle S\,..., S2n+i. □ 1.77. Určete obsah trojúhelníka ABC, je-li A = [-8, 1], B = [-2, 0], C = [5, 9]. Řešení. Víme, že obsah je roven polovině determinantu matice, jejíž první sloupec je dán vektorem B —A a druhý sloupec vektorem C —A, tj. determinantu matice -2-(-8) 5 -(-8) 0-1 9-1 Jednoduchý výpočet tak dává výsledek 1 61 2 ((-2 - (-8)) • (9 - 1) - (5 - (-8)) • (0 - 1)) 2 . Dodejme, že při záměně pořadí vektorů by hodnota determinantu měla opačné znaménko (její absolutní hodnota by tedy zůstala stejná) a že by se vůbec nezměnila, kdybychom vektory (při zachování pořadí) napsali do řádků. □ 1.78. Spočtěte obsah 5 čtyřúhelnika vymezeného jeho vrcholy [1, 1], [6, 1], [11,4], [2,4]. Řešení. Nejprve si označme vrcholy (proti směru pohybu hodinových ručiček) A = [1, 1], B = [6, 1], C = [11,4], D = [2,4]. Hlubší je následující rekapitulace předchozích úvah (skoro si můžeme říci, že už umíme dokázat skutečně zajímavý matematický výsledek): Zobrazení zachovávající velikosti 1.33. Věta. Lineární zobrazení euklidovské roviny je složeno zjed-noho nebo více zrcadlení, právě když je dáno maticí R splňující R = ía b \c d ab + cd = 0, ď = 1. To nastane, právě když toto zobrazení zachovává velikosti. Otočením je takové zobrazení přitom právě tehdy, když je determinant matice R roven jedné, což odpovídá sudému počtu zrcadlení. Při lichém počtu zrcadlení je determinant roven —1. Důkaz. Zkusme napřed spočíst, jak může vypadat obecně ■ matice A, když příslušné zobrazení zachovává velikosti. Tj. máme zobrazení ~íx\ (a b\ íx\_íax+by\ \y)^\c d)'\y)-\cx+dy)- Zachování velikosti tedy znamená, že pro všechna x a y je x2 + y2 = (ax + by)2 + (cx + dy)2 = = (a2 + c2)x2 + (b2 + d2)y2 + 2(ab + cd)xy. Protože má tato rovnost platit pro všechna x ay, musí si být rovny koeficienty u jednotlivých mocnin x2, y2 axyna pravé i levé straně. Tím jsme spočetli, že rovnosti kladené na matici R v prvním tvrzení dokazované věty jsou ekvivalentní vlastnosti, že příslušné zobrazení zachovává velikosti. Díky vztahu a2 + c2 — 1 můžeme předpokládat, že a — cos

, w). ob sak- A-f/z oí>£.Aku £7 ticjne obsahy LINEAKJTA V AT&MENTU Nakonec ještě přidáme k našemu zadání požadavek vol A(v, w) — — vol A(w, v), který odpovídá představě, že opatříme plochu znaménkem podle toho, v jakém pořadí bereme vektory (tj. jestli se na ni díváme shora nebo zespodu). Pokud vektory v aw napíšeme do sloupců matice A, pak A — (v, w) \-> det A splňuje všechny tři naše požadavky. Kolik takových zobrazení ale může být? Každý vektor umíme vyjádřit pomocí dvou bázových vektorů ei = (1,0) a «2 = (0,l)a díky linearitě je tedy každá možnost pro vol A jednoznačně určena už vyčíslením na těchto vektorech. Protože ale pro obsah, stejně jako pro determinant, je zjevně vol A(ei,ei) — vol A(i?2, £2) = 0 (kvůli požadované an-tisymetrii), je nutně každá taková skalární funkce jednoznačně zadána hodnotou na jediné dvojici argumentů (e\, ej). Jsou si tedy všechny možnosti rovny až na skalární násobek. Ten umíme určit požadavkem 1 vol A(ei, ^2) = —, tj. volíme orientaci a měřítko pomocí volby bázových vektorů, a chceme, aby jednotkový čtverec měl plochu jedna. Vidíme tedy, že determinant zadává plochu rovnoběžníku určeného sloupci matice A a plocha trojúhelníku je tedy poloviční. 37 KAPITOLA 1. ROZCVIČKA Tato strana je tudíž vidět. Zbývají strany CD a DA. Pro ně dostáváme po řadě 3-3 1 - 3 0 -2 3 - {ji - 2) 4- {ji - 2) 5 — jt 6 — jí = 0-(-2) (5 - ji) > 0, 1-3 -2- 3 -2 -5 4- (jt - 2) -2- (jt -2) 6 — ji —jt = - -2 (-7t) - ( -5)- (6 — - ji) > 0. Z bodu Z jsou tedy vidět právě strany určené dvojicemi vrcholů [-2, -2], [2, 1] a [2, 1], [3, 3]. □ 1.80. Uvedie strany pětiúhelníku s vrcholy v bodech [—2, —2], [-2,2], [1,4], [3,1] a [2,-11/6], které je možné vidět z bodu [300, 1]. Řešení. Pro zjednodušení zápisů „tradičně" položme A = [-2, -2], B = [2, -11/6], C = [3, 1], D = [1,4], E = [-2,2]. Strany BC a CD jsou zjevně z pozice bodu [300, 1] viditelné; naopak strany DE a E A být vidět nemohou. Pro stranu AB raději určeme -2 - 300 2 - 300 -2-1 -II-l = -302 • (^-^Pj ~ (-298) • (-3) < 0. Odsud plyne, že tato strana je z bodu [300, 1] vidět. □ F. Zobrazení a relace 1.81. Rozhodněte, zda následující relace na množině M jsou relace ekvivalence: i) M = {/ : K K}, kde (/ ~ g), pokud /(0) = g(0). ii) M = {/ : K K}, kde (/ ~ g), pokud /(0) = g(l). iii) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže se neprotínají. iv) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže jsou rovnoběžné. v) M = N, kde (m ~ n), pokud S{m) + S{n) = 20, přičemž S(n) značí ciferný součet čísla n. vi) M = N, kde (m ~ n), pokud C{m) = C{n), kde C{n) = S{n), pokud je ciferný součet S(n) menší než 10, jinak definujeme C{n) = C{S{n)) (je tedy vždy C{n) < 10). Řešení. i) Ano. Ověříme tři vlastnosti ekvivalence: m 1.35. Viditelnost v rovině. Předchozí popis hodnot pro ori-J: entovaný obsah nám dává do rukou elegantní nástroj pro určování pozice bodu vůči orientovaným úsečkám. | Orientovanou úsečkou rozumíme dva body v rovině s určeným pořadím. Můžeme si ji představit jako šipku od prvého k druhému bodu. Taková orientovaná úsečka nám rozděluje rovinu na dvě poloroviny, říkejme jim „levou" a „pravou". Pro daný bod chceme poznat, jestli je v té levé nebo pravé. Takové úlohy často potkáváme v počítačové grafice při řešení viditelnosti objektů. Pro zjednodušení si zde jen představme, že úsečku ,je vidět" z bodů napravo a není vidět z těch nalevo (což odpovídá představě, že objekt ohraničený orientovanými hranami proti směru hodinových ručiček má nalevo od nich svůj vnitřek, přes který tedy není hranu vidět). Máme-li dán nějaký bod C, spočtěme orientovanou plochu příslušného trojúhelníku zadaného vektory A — C a B — C. Pokud jsme s bodem C nalevo od úsečky, pak při obvyklé kladné orientaci proti směru hodinových ruček bude vektor A — C dříve než ten druhý a proto výsledná plocha (tj. hodnota determinantu matice jejímiž sloupci jsou tyto dva vektory) bude kladná. Naopak, při opačné poloze bude výsledkem záporná hodnota determinantu a podle záporné hodnoty determinantu zjistíme, že je náš bod od úsečky napravo. Uvedený jednoduchý postup je skutečně často využíván pro testování polohy při standardních úlohách v 2D grafice. 6. Relace a zobrazení V této závěrečné části úvodní motivační kapitoly se vrá-jgj tíme k formálnímu popisu matematických struktur, flfcgg- Budeme se je ale průběžně snažit ilustrovat na již / | ís známých příkladech. Zároveň můžeme tuto část '^t*1 ~—ri** brát jako cvičení ve formálním přístupu k objektům a konceptům matematiky. 1.36. Relace mezi množinami. Nejprve potřebujeme definovat kartézský součin A x B dvou množin A a B. Je to množina všech uspořádaných dvojic {a, b) takových, že a e A a b e B. Binární relací mezi množinami A a B pak rozumíme libovolnou podmnožinu R kartézského součinu A x B. Často píšeme a —r b pro vyjádření skutečnosti, že (a, b) e R, tj. že body a e A a b e B jsou v relaci R. Definičním oborem relace je podmnožina D c A, D ■- e A; 3b e B, (a, b) e R}. 38 KAPITOLA 1. ROZCVIČKA i) Reflexivita: pro libovolnou reálnou funkci / je /(o) = /(o). ii) Symetrie: jestliže platí /(o) = g(0), pak i g(0) = /(o). iii) Tranzitivita: jestliže platí /(o) = g (Q) a g (Q) = h(0), pak platí i /(o) = h(0). ii) Ne. Definovaná relace není reflexivní, např pro funkci sin máme sin 0 7^ sin 1 a není ani tranzitivní. iii) Ne. Relace opět není reflexivní (každá přímka protíná sama sebe) ani tranzitivní. iv) Ano. Třídy ekvivalence pak tvoří množinu neorientovaných směrů v rovině. v) Ne. Relace není reflexivní. 5(1) + 5(1) = 2. vi) Ano. □ 1.82. Máme množinu {3, 4, 5, 6, 7}. Napište explicitně relaci i) a dělí b, ii) a dělí b nebo b dělí a, iii) a a b jsou soudělná. O 1.83. NechťjenaK2 definována relace R tak, že ((a, b), (c, d)) e R pro libovolná a, b,c,d e K, právě když b = d. Zjistěte, zda se jedná o relaci ekvivalence. Pokud jde o relaci ekvivalence, popište geometricky rozklad, který určuje. Řešení. Z ((a, b), (a, b)) e i? pro všechnaa, b e K plyne, že relace je reflexivní. Stejně snadno vidíme, že relace je symetrická, neboť v rovnosti (druhých složek) můžeme zaměnit levou a pravou stranu. Je-li ((a, b), (c, ď)) € R& ((c, d), (e, /)) e R, tj. platí-li b = dnd= f, lehce dostáváme splnění tranzitivní podmínky ((a, b), (e, /)) e R, tj. b = f. Relace R je relací ekvivalence, kdy body roviny jsou spolu v relaci, právě když mají stejnou druhou souřadnici (přímka jimi zadaná je kolmá na osu y). Příslušný rozklad proto rozdělí rovinu na přímky rovnoběžné s osou x . □ 1.84. Určete, kolik různých binárních relací lze zavést mezi množinou X a množinou všech jejích podmnožin, má-li množina X právě 3 prvky. Řešení. Nejprve si uvědomme, že množina všech podmnožin X má 23 = 8 prvků, a tudíž její kartézský součin s množinou X má 8-3 = 24 prvků. Uvažovanými binárními relacemi jsou právě podmnožiny tohoto kartézského součinu, kterých je celkem 224. □ Slovy vyjádřené, je to množina prvků a z množiny A takových, že existuje prvek b z množiny B tak, že {a, b) patří do relace R. Stručněji, jsou to takové prvky z A, které mají alespoň jeden obraz v B. Podobně oborem hodnot relace je podmnožina / c B, I = {b e B;3a e A, (a, b) e R}, to znamená takové prvky v B, které mají vzor v A. Speciálním případem relace mezi množinami je zobrazení /§g>ýí, z množiny A do množiny B. Je to případ, kdy pro každý prvek definičního oboru relace existuje právě jeden prvek z oboru hodnot, který je s ním v relaci. Nám známým případem zobrazení jsou všechny skalární funkce, kde oborem hodnot zobrazení je množina skalárů, třeba celých nebo reálných čísel. Pro zobrazení zpravidla používáme značení, které jsme také u skalárních funkcí zavedli. Píšeme / : D c A ->ICB, f (a) = b pro vyjádření skutečnosti, že (a, b) patří do relace, a říkáme, že b je hodnotou zobrazení / v bodě a. Dále říkáme, že / je • zobrazení množiny A do množiny B, jestliže je D — A, • zobrazení množiny A na množinu B, jestliže je D — A a I — B, často také surjektivní zobrazení, • prosté (často také injektivní zobrazení), jestliže je D — A a pro každé bel existuje právě jeden vzor a e A tak, že f (a) = b. Vyjádření zobrazení / : A —> B jakožto relace /cAxB, f = {(a, f (a)); a e A] známe také pod názvem graf zobrazení f. humriÁ^ zobhazeru'' ober kodfwt havaruj? SdŕjeAtíi/ľi^ 1.37. Skládání relací a funkcí. U zobrazení je jasná koncepce, jak se skládají. Máme-li dvě zobrazení / : A —> B a g : B —> C, pak jejich složení g o f : A —> C je definováno (g o f)(a) = g(f(a)). Ve značení používaném pro relace totéž můžeme zapsat jako /cAxB, f = {{a,f{a));aeA}, gCBxC, g = {{b,g{b));beB), gofcAxC, g o f = {{a,g{f{a)));aeA). Zcela obdobně definujeme skládání relací, v předchozích vztazích jen doplníme existenční kvantifikátory, tj. musíme uvažovat všechny „vzory" a všechny ^'Ěh^% „obrazy". Uvažme relace R c A x B, S c B x C. J- Potom S o R c A x C, S o R — {(a, c); 3b e B, (a, b) e R, (b, c) e 5). 39 KAPITOLA 1. ROZCVIČKA 1.85. Uvedie definiční obor D a obor hodnot I relace R = {(a, v), (b, x), (c, x), (c, u), (d, v), (f, y)} mezi množinami A = {a, b, c, d, e, f] a B = {x, y, u, v, w}. Je relace R zobrazení? Řešení. Přímo z definice definičního oboru a oboru hodnot relace dostávame D = [a, b, c, d, f] Q A, I = [x, y, u, v] C B. Nejedná se o zobrazení, protože (c, x), (c, u) e R, tj. c e D má dva obrazy. □ 1.86. O každé z následujících relací na množině {a, b, c, d] rozhodněte, zda se jedná o relaci uspořádání (příp. zda se jedná o úplné uspořádání): Zvláštním případem relace je identické zobrazení idA — {(a, a) e A x A; a e A} na množině A. Je neutrální vzhledem ke skládání s každou relací s definičním oborem nebo oborem hodnot A. Ra = {(fl a), (b,b), (c c),(d,d),(b,a),(b,c),(b,d)}, Rb = {(fl a), (b,b), (c c), (d, d), (d, a), (a, d)}, Rc = {(fl a), (b,b), (c c),(d,d),(a,b),(b,c),(b,d)}, Rd = {(fl a), (b,b), (c c), (a, b), (a, c), (a, d), (b, c), (b, d),(c,d)}, Re = {(fl a), (b,b), (c c), (d, d), (a, b), (a, c), (a, d), (b, c), (b,d), (c,d)}. Řešení. Ra je uspořádání, které není úplné (např. (a,c) £ Ra ani (c, a) £ Ra). Relace Rb není antisymetrická (je totiž (a, d) e Rb i (d, a) € Rb), a tudíž se nejedná o uspořádání (jde o ekvivalenci). Relace Rc a Rj rovněž nejsou uspořádáními, protože Rc není tranzitivní ((a, b), (b, c) € Rc,(a,c) £ Rc) a Rj není reflexivní ((d, d) £ Rd). Relace Re je úplné uspořádání (pokud budeme (a,b) e R interpretovat jako a < b, pak a < b < c < d). □ 1.87. Rozhodněte, zda je zobrazení / injektivní, resp. surjektivní, jestliže (a) / : Z x Z Z, f((x, y)) = x + y - I0x2, (b) /:N^NxN, f(x) = (2x, x1 + 10). Řešení. Ve variantě (a) je uvedeno surjektivní zobrazení (postačuje položit x = 0), které není injektivní (stačí zvolit (x, y) = (0, —9) a (x, y) = (1, 0)). Ve variantě (b) se naopak jedná o injektivní zobrazení (obě jeho složky, tj. funkce y = 2x a y = x2 +10, jsou evidentně rostoucí na N), které není surjektivní (např. dvojice (1, 1) nemá vzor). □ &bžan/' V relaci jzeu bod^f kteve lze Spojit Pro každou relaci R c A x B definujeme inverzní relaci R~l = {(b, a); (a, b) e R} C B x A . Pozor, u zobrazení je stejný pojem užíván ve specifičtější situaci. Samozřejmě že existuje pro každé zobrazení jeho inverzní relace, ta však nemusí být zobrazením. Zcela logicky proto hovoříme o existenci inverzního zobrazení, pokud každý prvek b e B je obrazem pro právě jeden vzor v A. V takovém případě je samozřejmě inverzní zobrazení právě inverzní relací. Všimněme si, že složením zobrazení a jeho inverzního zobrazení (pokud obě existují) vždy vznikne identické zobrazení, u obecných relací tomu tak být nemusí. 1.38. Relace na množině. V případě A — B hovoříme o relaci na množině A. Říkáme, že relace R je: • reflexivní, pokud id^ c R, tj. (a, a) e R pro všechny a e A, • symetrická, pokud R~l — R, tj. pokud (a,b) e R, pak i (b,a) e R, • antisymetrická, pokud R~l n R c id^, tj. pokud (a, b) e R a zároveň (b, a) e R, pak a — b, • tranzitivní, pokud R o R c Ä, tj. pokud z (a, b) e R a (b, c) e R vyplývái (a, c) e R. Relace se nazývá ekvivalence, pokud je současně reflexivní, symetrická i tranzitivní. Relace se nazývá uspořádání jestliže je reflexivní, tranzitivní a antisymetrická. Relaci uspořádání obvykle značíme symbolem <, tj. skutečnost, že prvek a je v relaci s prvkem b, značíme a < b. Zde je dobré si uvědomit, že relace <, tj. „býti ostře menší než", mezi reálnými (racionálními, celými, přirozenými) čísly není relace uspořádání, protože není reflexivní. Dobrým příkladem uspořádání je inkluze. Uvažme množinu 2A všech podmnožin konečné množiny A (značení je speciálním případem obvyklé notace BA pro množinu všech zobrazení množiny A do množiny B; prvky množiny 2A jsou tedy zobrazení A —> {0, 1), které "říkají", zda určitý prvek je či není v dané podmnožině). Na množině 2A máme relaci c danou vlastností 40 KAPITOLA 1. ROZCVIČKA 1.88. Stanovte počet zobrazení množiny {1, 2} do množiny {a, b, c}. Kolik z nich je surjektivních a kolik injektivních? Řešení. Prvku 1 můžeme v rámci zobrazení přiřadit libovolně jeden ze tří prvků a, b, c. Podobně také pro prvek 2 máme tři možnosti. Podle (kombinatorického) pravidla součinu tak existuje celkem 32 zobrazení množiny {1, 2} do množiny {a, b, c}. Surjektivní žádné z nich být nemůže, neboť konečná množina {a,b,c} má více prvků než množina {1, 2}. Při libovolném zobrazení prvku 1 (tři možnosti) obdržíme injektivní zobrazení, právě když prvek 2 zobrazíme na jiný prvek (dvě možnosti). Vidíme tedy, že injektivních zobrazení množiny {1,2} do množiny {a, b, c) je 6. □ 1.89. Určete počet injektivních zobrazení množiny {1,2,3} do množiny {1, 2, 3,4}. Řešení. Libovolné injektivní zobrazení mezi uvažovanými množinami je dáno výběrem (uspořádané) trojice z množiny {1,2, 3,4} (prvky ve vybrané trojici budou po řadě obrazy čísel 1,2, 3) a obráceně každé injektivní zobrazení nám zadává takovou trojici. Je tedy hledaných injektivních zobrazení stejně jako možností výběru uspořádaných trojic ze čtyř prvků, tedy v(3,4) = 4 • 3 • 2 = 24. □ 1.90. Určete počet surjektivních zobrazení množiny {1, 2, 3,4} na množinu {1, 2, 3}. Řešení. Hledaný počet určíme tak, že od počtu všech zobrazení odečteme ta, která nejsou surjektivní, to jest ta, jejichž oborem hodnot je buďjednoprvková nebo dvouprvková množina. Všech zobrazení je V(3,4) = 34, zobrazení, jejichž oborem hodnot je jednoprvková množina, jsou tři. Počet zobrazení, jejichž oborem hodnot je dvouprvková množina, je (32) (24 — 2) (Faktor (32) udává počet způsobů, kterými můžeme vybrat obor hodnot, a máme-li již dva prvky fixovány, máme 24 — 2 možností, jak na ně zobrazit čtyři prvky). Celkem je tedy počet hledaných surjektivních zobrazení (1.4) (24 - 2) - 3 = 36. □ 1.91. Vypište všechny relace na dvouprvkové množině {1,2}, jež současně nejsou reflexivní, jsou symetrické a nejsou tranzitivní. Řešení. Reflexní relace jsou právě ty.které obsahují obě dvojice(l, 1), (2, 2). Tím jsme vyloučili relace {(1,1), (2, 2)}, {(1,1), (2, 2), (1,2)}, {(1, 1), (2, 2), (2, 1)}, {(1, 1), (2, 2), (1, 2), (2, 1)}. „být podmnožinou". Je tedy X c Z právě, když je X podmnožinou v Z. Evidentně jsou přitom splněny všechny tři vlastnosti pro uspořádání: skutečně, je-li X c Y a zároveň Y c X, musí být nutně množiny XaY stejné. Je-li X c Y c Z, je také X c Z. Reflexivita je také zřejmá. Říkáme, že uspořádání < na množině A je úplné, když pro každé dva prvky a, b e A platí, že jsou srovnatelné, tj. buď a < b nebo b < a. Všimněme si, že ne všechny dvojice (X, Y) podmnožin v A jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než jeden prvek, existují podmnožiny XaY, kdy není ani X c Y ani Y c X. Připomeňme rekurentní definici přirozených čísel N = {0,1,2,3,...), kde 0 = 0, n + 1 = {0, 1,2, ...,«}. Na této množině N definujeme relaci < následovně: m < n, právě když m e n nebo m — n. Evidentně jde o úplné uspořádaní. Např. 2 < 4, protože 2 = {0, {0)) e {0, {0), {0, {0)), {0, {0), {0, {0)))) = 4. Jinak řečeno, samotná rekurentní definice zadává vztah n < n + 1 a tranzitivně pak n < k pro všechna k, která jsou tímto postupem definována později. 1.39. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává zároveň rozklad množiny A na podmnožiny vzájemně ekvivalentních prvků, tzv. třídy ekvivalence. Pro libovolné a e A uvažujeme třídu (množinu) prvků, které jsou ekvivalentní s prvkem a, tj. Ra = [b e A; (a,b) e R}. Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci jde. Zjevně Ra — Rb, právě když (a, b) e R a každá taková třída ekvivalence je tedy reprezentována kterýmkoliv svým prvkem, tzv. reprezentantem. Zároveň RaC\ Rb ^ 0, právě když Ra — Rb, tj. třídy ekvivalence j sou po dvou disjunktní. Konečně, A — UaeARa, tj. celá množina A se skutečně rozloží na jednotlivé třídy. Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a „až na ekvivalenci". 1.40. Konstrukce celých a racionálních čísel. Na přirozených >!' ., číslech umíme sice sčítat a víme, že přičtením nuly se tčíslo nezmění. Umíme i definovat odečítání, při něm ale jen někdy existuje výsledek v množině N. l Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící rozdíly. To můžeme udělat tak, že místo výsledku odečítání budeme pracovat s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují. Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové dvojice ekvivalentní. Potřebný vztah tedy je: (a, b) ~ (a', b') a — b = a — b' a + b' — a + b. Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme, výrazy vpravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a její třídy označíme jako celá čísla Z. Na nich definujeme operaci sčítání (a s ní i odečítání) pomocí reprezentantů, např. [(a, b)] + [(c, d)] = [(a +c,b + d)], 41 KAPITOLA 1. ROZCVIČKA Zbývající relace, které jsou symetrické a nejsou tranzitivní, musejí obsahovat (1, 2), (2, 1). Pokud taková relace obsahuje jednu z těchto dvou uspořádaných dvojic, musí obsahovat rovněž druhou (podmínka symetrie). Kdyby neobsahovala ani jednu z těchto dvou uspořádaných dvojic, pak by očividně byla tranzitivní. Z celkového počtu 16 relací na dvouprvkové množině jsme tak vybrali {(1,2), (2,1)}, {(1,2), (2,1), (1,1)}, {(1,2), (2, 1),(2,2)}. Je vidět, že každá z těchto 3 relací není reflexivní, je symetrická a není tranzitivní. □ 1.92. Určete počet relací ekvivalence na množině {1, 2, 3,4}. Řešení. Ekvivalence můžeme počítat podle toho, kolik prvků mají jejich třídy rozkladu. Pro počty prvků tříd rozkladu ekvivalencí na čtyřprvkové množině jsou tyto možnosti: Počty prvků ve třídách rozkladu Počet ekvivalencí daného typu 1, 1, 1, 1 1 2, 1, 1 0 2,2 \0 3,1 (?) 4 1 Celkem tedy máme 15 různých ekvivalencí. □ Poznámka. Obecně počet tříd rozkladu rc-prvkové množiny udává Bellovo číslo Bn, pro které lze odvodit rekurentní formuli n B„+\ = J2 (l)Bk- k=0 1.93. Kolik existuje relací na n -prvkové množině? Řešení. Relace je libovolná podmnožina kartézského součinu množiny se sebou samou. Tento kartézský součin má n2 prvků, a je 2 tedy počet všech relací na rc-prvkové množině 2™ . □ V 1.41 jsme si zavedli zbytkové třídy a ukázali, že Zp je těleso pro libovolné prvočíslo p. Přesto se v tomto tělese vyskytují jevy, na které nejsme u reálných či komplexních čísel zvyklí: 1.94. Nenulový mnohočlen s nulovými hodnotami. Najděte nenulový mnohočlen jedné neznámé s koeficienty v Z7, tj. výraz typu anx" + • • • + a\x + flo, a-i £ Z7, an ^ 0, takový, že na množině Z7 nabývá pouze nulových hodnot (tj. dosadíme-li za x libovolný z prvků Z7 a výraz v Z7 vyčíslíme, dostaneme vždy nulu). Řešení. Při konstrukci tohoto mnohočlenu se opřeme o Malou Fer-matovu větu, která říká, že pro libovolné prvočíslo p a číslo a s ním což zjevně nezávisí na výběru reprezentantů. Lze si přitom vždy volit reprezentanty (a, 0) pro kladná čísla a reprezentanty (0, a) pro čísla záporná, se kterými se nám bude patrně počítat nejlépe. Tento jednoduchý příklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence jako na celistvý objekt a soustředit se na vlastnosti těchto objektů, nikoliv formální popisy jejich konstrukcí. Ty jsou však důležité k ověření, že takové objekty vůbec existují. U celých čísel nám už platí všechny vlastnosti skalárů (KG1)-(KG4) a (01)-(04), viz odstavec 1.1. Pro násobení je neutrálním prvkem jednička, ale pro žádné číslo a různé od nuly a jedničky neumíme najít číslo a-1 s vlastností a ■ a~l — 1, tzn. chybí nám inverzní prvky pro násobení. Zároveň si povšimněme, že platí vlastnost oboru integrity (Ol), viz 1.1, tzn. je-li součin dvou čísel nulový, musí být alespoň jedno z nich nula. Díky poslední jmenované vlastnosti můžeme zkonstruovat racionální čísla Q přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali Z z množiny N. Na množině uspořádaných dvojic (p, q), q +- 0, celých čísel definujeme relaci ~ tak, jak očekáváme, že se mají chovat podíly p/q: (p, q) ~ (p, q) p/q = p Iq p-q =p -q. Opět neumíme očekávané chování v prostřední rovnosti v množině Z formulovat, nicméně rovnost na pravé straně ano. Zjevně jde o dobře definovanou relaci ekvivalence (ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když budeme formálně psát p/q místo dvojic (p, q), budeme definovat operace násobení a sčítání právě pomocí formulí, které nám jsou jistě dobře známy. 1.41. Zbytkové třídy. Jiným dobrým a jednoduchým příkladem jsou tzv. zbytkové třídy celých čísel. Pro pevně zvo-, '^Tj^ * lené přirozené číslo k definujeme ekvivalenci ~t tak, ^ V • že dvě čísla a, b e Z jsou ekvivalentní, jestliže je-M — jich zbytek po dělení číslem k je stejný. Výslednou množinu tříd ekvivalence označujeme Zj. Nejjednodušší je tato procedura pro k = 2. To dostáváme Z2 = {0, 1), kde nula reprezentuje sudá čísla, zatímco jednička čísla lichá. Opět lze snadno zjistit, že pomocí reprezentantů můžeme korektně definovat násobení a sčítání na každém Zj-. Věta. Zbytkové třídy TLi jsou komutativním tělesem skalárů (tj. splňují i vlastnost (P) z odstavce 1.1), právě když je k prvočíslo. Pokud k prvočíslem není, obsahuje Z vždy dělitele nuly. Není proto ani oborem integrity. Důkaz. Okamžitě je vidět druhé tvrzení. Jestliže x ■ y — k pro přirozená čísla x, y, pak samozřejmě je výsledek násobení příslušných tříd [x] ■ [y] nulový. Naopak, jsou-li x a k nesoudělná, existují podle tzv. Bezoutovy rovnosti, kterou dovodíme později (viz 10.2), přirozená čísla a a b splňující a x +b k — l, což pro odpovídající třídy ekvivalence dává [a] • [x] + [0] = [a] • [x] = [1], a proto je [a] inverzním prvkem k [x]. □ 42 KAPITOLA 1. ROZCVIČKA nesoudělné platí a"-1 = l(modp). Hledaný polynom je tedy například polynom x1 — x (polynom x6 by neměl nulovou hodnotu v čísle 0). Tělesa TLV mají některé vlastnosti, na které nejsme v tělesech R či Q zvyklí. Zkoumejme například mnohočlen x2 +x v tělese Z2. Dosadíme-li za x libovolný prvek tělesa Z2 (tj. nulu nebo jedničku), hodnota daného mnohočlenu bude vždy nulová. Přesto tento mnohočlen není nulovým mnohočlenem. Jak uvidíme v odstavci 5.2, tak to je možné pouze v tělesech s konečným počtem prvků. 43 KAPITOLA 1. ROZCVIČKA G. Doplňující příklady k celé kapitole 1.95. Nechť tam jsou kladná celá čísla. Ukažte, že číslo Zjt je buďpřirozené, nebo není racionální. |^|) Řešení. Ukažte, že pokud uvažovaná odmocnina není přirozená, pak není ani racionální. Po-kud Zft není přirozená, tak existuje prvočíslo r a přirozené s taková, že ŕ dělí /, r!+1 nedělí tam nedělí s (zápis ordr t = s). Předpokládejte, že Z/t = |, p, q e Z, neboli t ■ pm = qm. Uvažte ordr L a ordr R a jejich dělitelnost číslem m (L značí levou stranu rovnice,...). □ 1.96. Stanovte (2+3i)(l+iy/3) Řešení. Neboť absolutní hodnota součinu (podílu) dvou libovolných komplexních čísel je součin (podíl) jejich absolutních hodnot a každé komplexní číslo má stejnou absolutní hodnotu jako číslo s ním komplexně sdružené, platí | <2+3i-?3r] | = I2 + 3i'l • JTľ§l = I2 + 3i'l = = VÍ3- □ 1.97. Číslo (5^3 + 5;') ' zapište v co nejjednodušším tvaru. Řešení. Úpravy jako postupné umocňování nebo rozvoj podle binomické věty jsou v tomto případě časově náročné. Při vyjádření 5^3 + 5;' = 10 + f) = 10 (cos f + i sin |) užitím Moivreovy věty však snadno obdržíme (5V3 + 5ŕ) = 1012 (cos if, + i'sin = 1012. □ 1.98. Vyjádřete z\ + zi, z\ ■ zi, l\, \zi\, g-, pro a) z\ = 1 - 2i, Z2 = 4i - 3 b) z\ =2,Z2 = i O 1.99. Uvedie vzdálenost d čísel z, z v komplexní rovině, je-li J = VSI _ • 3 z — 2 1 2- Řešení. Není obtížné si uvědomit, že komplexně sdružená čísla jsou v komplexní rovině souměrně sdružená podle osy x a že vzdálenost komplexního čísla od osy x je rovna absolutní hodnotě jeho imaginární části. To již dává d = 3. □ 1.100. Setkání se zúčastnilo šest mužů. Pokud si všichni navzájem potřásli rukama, vyčíslete počet potřesení. Řešení. Počet potřesení rukou zřejmě odpovídá počtu způsobů, jak lze vybrat neuspořádanou dvojici ze 6 prvků, tj. výsledek je c (6, 2) = Q = 15. □ 44 KAPITOLA 1. ROZCVIČKA 1.101. Určete, kolika způsoby lze z 15 poslanců vybrat čtyřčlennou komisi, není-li možné, aby jistí 2 poslanci pracovali spolu. Řešení. Výsledek je (145)-(123) = 1 287. Obdržíme ho tak, že nejprve určíme počet všech možných výběrů čtyřčlenné komise, potom od něj odečteme počet těch výběrů, kdy oba zmínění poslanci budou vybráni (v takovém případě vybíráme pouze 2 další členy komise ze 13 poslanců). □ 1.102. Kolika způsoby můžeme rozdělit 8 žen a 4 muže do 2 šestičlenných skupin (v nichž nerozlišujeme pořadí - jsou neuspořádané) tak, aby v obou skupinách byl alespoň 1 muž? Řešení. Rozdělení 12 osob do 2 šestičlenných skupin bez jakýchkoli podmínek je dáno libovolným výběrem 6 z nich do první ze skupin, což lze provést (g2) způsoby. Skupiny ale nejsou rozlišitelné (nevíme, která z nich je první), aprotoje počet všech možných rozdělení \ ■ (g2). V Q) případech pak budou všichni muži v jedné skupině (volíme 2 ženy z 8, které skupinu doplní). Správná odpověď je tudíž I.C2)-©=434. □ 1.103. Kolika způsoby lze do tří různých obálek rozmístit pět shodných stokorun a pět shodných tisícikorun tak, aby žádná nezůstala prázdná? Řešení. Nejdříve zjistíme všechna rozmístění bez podmínky neprázdnosti. Těch je podle pravidla součinu (rozmísťujeme nezávisle stokoruny a tisícikoruny) C(3, 5)2 = Q . Odečteme postupně rozmístění, kdy je právě jedna obálka prázdná, a poté kdy jsou dvě obálky prázdné. Celkem C(3, 5)2 - 3(C(2, 5)2 - 2) - 3 = Q 2 - 3(62 - 2) - 3 = 336. □ 1.104. Jaký je počet čtyřciferných čísel složených z číslic 1,3,5,6, 7 a 9, ve kterých se žádná z cifer neopakuje? Řešení. K dispozici máme šest různých číslic. Ptáme se: Kolik různých uspořádaných čtveřic z nich můžeme vybrat? Výsledek je proto v (6,4) = 6 • 5 • 4 • 3 = 360. □ 1.105. Řecká abeceda se skládá z 24 písmen. Kolik různých slov majících právě pět písmen z ní lze utvořit? (Bez ohledu na to, zda tato slova mají nějaký jazykový význam.) Řešení. Pro každou z pěti pozic ve slově máme 24 možností, neboť písmena se mohou opakovat. Výsledek je tedy V(24, 5) = 245. □ 1.106. Noví hráči se sejdou v jednom volejbalovém týmu (6 lidí). Kolikrát si při seznamování (každý s každým) podají ruce? Kolikrát si hráči podají ruce se soupeřem po odehrání zápasu? Řešení. Seznamuje se každá dvojice z šesti hráčů. Počet podání rukou je teda roven kombinaci C(2, 6) = © = 15. Po zápase si každý z šesti hráčů podá ruku šestkrát (s každým z šesti soupeřů). Počet je tedy dohromady 62 = 36. □ 1.107. Na koncertě je 730 lidí. Mají někteří z nich stejné iniciály? (Neuvažujeme háčky ani čárky) O 45 KAPITOLA 1. ROZCVIČKA 1.108. K vytrvalostnímu závodu, v němž běžci vybíhají jeden po druhém s danými časovými odstupy, se přihlásilo k závodníků, mezi nimi také tři kamarádi. Stanovte počet startovních listin, v rámci kterých žádní dva z trojice kamarádů nestartují těsně po sobě. Pro jednoduchost uvažujte k > 5. Řešení. Ostatních k — 3 závodníků můžeme seřadit (k—3)\ způsoby. Pro uvažované tři kamarády pak máme k — 2 míst (začátek, konec a k — 4 mezer), na které je můžeme rozmístit v (k — 2, 3) způsoby. Podle (kombinatorického) pravidla součinu je tak výsledek (k - 3)! • (k - 2) • (k - 3) • (k - 4) = (k - 2)! • (k - 3) • (k - 4). □ 1.109. Kolik existuje různých přesmyček slova KRAKATIT takových, že mezi písmeny K je právě jedno jiné písmeno? Řešení. V uvažovaných přesmyčkách je šest možností, jak umístit skupinu dvou K. Fixujeme-li pevně místa pro dvě písmena K, pak ostatní písmena můžeme rozmístit na zbylých šest míst libovolně, tedy P(l, 1, 2, 2) způsoby. Celkem podle pravidla součinu je hledaný počet 6- P(l, 1,2,2) = ff = 1080. □ 1.110. Turnaje se zúčastní 32 lidí. Podle požadavků organizátorů se musí libovolným způsobem rozdělit do čtyř skupin tak, aby první skupina měla 10 účastníků, druhá 8, třetí také 8 a poslední čtvrtá potom 6. Kolika způsoby se mohou takto rozdělit? Řešení. Můžeme si představit, že z 32 účastníků vytvoříme řadu, kdy prvních 10 utvoří první skupinu, dalších 8 druhou atd. Celkem můžeme účastníky seřadit 32! způsoby. Uvědomme si ovšem, že na rozdělení do skupin nemá vliv, když zaměníme pořadí osob, které patří do stejné skupiny. Proto je počet navzájem různých rozdělení roven P (10, 8, 8, 6) = TgrUrsj. □ 1.111. Je potřeba ubytovat 9 osob v jednom čtyřlůžkovém, jednom třílůžkovém ajednom dvoulůžkovém pokoji. Zjistěte, kolika způsoby to lze provést. Řešení. Jestliže např. hostům ve čtyřlůžkovém pokoji, přiřadíme číslici 1, v třílůžkovém pokoji číslici 2 a v dvoulůžkovém číslici 3, pak vytváříme permutace s opakováním ze tří prvků 1, 2, 3, v nichž jednička se vyskytuje čtyřikrát, dvojka třikrát a trojka dvakrát. Příslušný počet permutací je P(4,3,2) = ÍJ^ = 1260. □ 1.112. Kolika způsoby můžeme do řady posadit 50 lidí tak, aby Pavel s Petrem ob jedno místo a Martin sousedil alespoň s jedním z nich? (Ve skupině je právě jeden Pavel, Petr i Martin) O 1.113. Určete počet způsobů, jak lze rozdělit mezi tři osoby A, S a C 33 různých mincí tak, aby osoby A a S měly dohromady právě dvakrát více mincí, než má osoba C. Řešení. Ze zadání vyplývá, že osoba C má obdržet 11 mincí. To lze provést (j j) způsoby. Každou ze zbývajících 22 mincí může získat osoba A nebo B, což dává 222 možností. Z (kombinatorického) pravidla součinu plyne výsledek (") • 222. □ 1.114. Kolika způsoby můžete mezi 4 chlapce rozdělit 40 stejných kuliček? Řešení. Přidejme ke 40 kuličkám troje zápalky. Poskládáme-li kuličky a zápalky do řady, rozdělí zápalky kuličky na 4 úseky. Náhodně seřadme chlapce. Dáme-li prvnímu chlapci všechny kuličky z prvního úseku, druhému chlapci všechny kuličky z druhého úseku atd., je již vidět, že všech rozdělení je právě (f) = 12 341. □ 46 KAPITOLA 1. ROZCVIČKA 1.115. Podle kvality dělíme výrobky do skupin /, //, IV. Zjistěte počet všech možných rozdělení 9 výrobku do těchto skupin. Při rozdělení hledíme pouze na počet výrobků v jednotlivých skupinách. Řešení. Zapisujeme-li přímo uvažované devítičlenné skupiny z prvků /, //, IV, vytváříme kombinace s opakováním deváté třídy ze čtyř prvků. Počet takových kombinací je (!92) = 220. □ 1.116. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní, že žádné dva z trojice týmů Zbrojovka Brno, Baník Ostrava a Sigma Olomouc spolu v tabulce „nesousedf'? (Ligu hraje 16 mužstev.) Řešení. První způsob. Hledaný počet spočítáme podle principu inkluze a exkluze tak, že od počtu všech možných tabulek odečteme počet tabulek, ve kterých sousedí některá dvojice z uvedených tří týmů a přičteme počet těch tabulek, ve kterých sousedí všechny tři týmy. Hledaný počet tedy je 16! - Q • 2! • 15! + 3! • 14! = 13599813427200. Jiné řešení. Zmíněné tři týmy budeme považovat za „oddělovače". Zbylých třináct týmů musíme rozdělit tak, aby mezi libovolnými dvěma oddělovači byl alespoň jeden tým. Navíc zbylé týmy můžeme mezi sebou nezávisle permutovat a rovněž tak oddělovače. Celkem tedy dostáváme (™) • 13! • 3! = 13599813427200 možností. □ 1.117. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní pouze, že alespoň jeden z týmů z dvojice Ostrava, Olomouc je v tabulce za týmem Brna (ligu hraje 16 mužstev). Řešení. Nejprve určíme tři místa, na kterých se umístily celky Brna, Olomouce a Ostravy. Ty lze vybrat c(3, 16) = (j6) způsoby. Z šesti možných pořadí zmíněných tří týmů na vybraných třech místech vyhovují podmínce ze zadání čtyři. Pro libovolné pořadí těchto týmů na libovolně vybraných třech místech pak můžeme nezávisle volit pořadí zbylých 13 týmů na ostatních místech tabulky. Podle pravidla součinu je tedy hledaný počet tabulek roven (j6) • 4 • 13! = 13948526592000. □ 1.118. Kolik je možných uspořádání (v řadě) na fotce volejbalového týmu (6 hráčů), když i) Gouald a Bamba chtějí stát vedle sebe, ii) Gouald a Bamba chtějí stát vedle sebe a uprostřed, iii) Gouald a Kamil nechtějí stát vedle sebe. Řešení. i) Goualda a Bambu můžeme v tomto případě počítat za jednoho, rozlišíme jen jak stojí vzájemně. Máme 2 • 5! = 240 pořadí. ii) Tady je to podobné jen pozice Goualda a Bamby je pevně daná. Dostáváme 2-4! =48 možností. iii) Nejjednodušší je asi odečíst případy, kdy stojí vedle sebe (viz (i)) od všech pořadí. Dostaneme 6! - 2 • 5! = 720 - 240 = 480. □ 1.119. Házení mincí. Šestkrát hodíme mincí. 47 KAPITOLA 1. ROZCVIČKA i) Kolik je všech různých posloupností panna, orel? ii) Kolik je takových, že padnou právě čtyři panny? iii) Kolik je takových, že padnou aspoň dvě panny? O 1.120. Kolik existuje přesmyček slova BAZILIKA takových, že se v nich střídají souhlásky a samohlásky? Řešení. Protože souhlásky i samohlásky jsou v daném slově čtyři, tak se v každé takové přesmyčce střídají pravidelně souhlásky a samohlásky. Slovo tedy může být typu BABABABA nebo ABABABAB. Na daných čtyřech místech můžeme pak samohlásky permutovat mezi sebou (P0(2, 2) = způsoby) a nezávisle na tom i souhlásky (4! způsoby). Hledaný počet je pak dle pravidla součinu 2 • 4! • ^ = 288. □ 1.121. Kolika způsoby lze rozdělit 9 děvčat a 6 chlapců do dvou skupin tak, aby každá skupina obsahovala alespoň dva chlapce? Řešení. Rozdělíme zvlášť děvčata a chlapce: 29(25 — 7) = 12800. □ 1.122. Materiál je tvořen pěti vrstvami, každá z nich má vlákna v jednom z daných šesti směrů. Kolik takových materiálů existuje? Kolik je jich takových, že dvě sousední vrstvy nemají vlákna ve stejném směru? Řešení. 65 a6-55. □ 1.123. Pro libovolné pevné n e N určete počet všech řešení rovnice x\ + *2 H----+xt = n v množině kladných celých čísel. Řešení. Hledáme-li řešení v oboru kladných celých čísel, tak si všimněme, že přirozená číslami,.. .xk jsou řešením dané rovnice, právě když jsou celá nezáporná čísla y,= x, — 1, i = 1,..., k, řešením rovnice y\ + yi H-----\-yt = n - k. Podle ||1.26|| jejich (nkz\). □ 1.124. Kolik peněz naspořím na stavebním spoření za pět let, vkládám-li 3000 Kč měsíčně (vždy k 1. v měsíci), vklad je úročen roční úrokovou mírou 3% (úročení probíhá jednou za měsíc) a od státu obdržím ročně příspěvek 1500 Kč (státní příspěvek se připisuje vždy až 1. května následujícího roku)? 48 KAPITOLA 1. ROZCVIČKA Řešení. Označme množství naspořených peněz po rc-tém roce jako x„. Potom dostáváme (pro n > 2) následující rekurentní formuli (navíc předpokládáme, že každý měsíc je přesně dvanáctina roku) xn+x = 1, 03(x„) + 36000 + 1500+ / 11 1 + 0,03 • 3000 í 1 + — + • • • + — úroky z vkladů za aktuální rok + 0,03 • ^ • 1500 1-,-■ úrok ze státního příspěvku připsaného v aktuálním roce = l,03(xn) + 38115. Tedy xn = 38115 ^(1,03)'' + (1,03)""^! + 1500, i=0 přičemž xx = 36000 + 0,03 • 3000 (l + |i +----h i) = 36585. Celkem x5 = 38115 q3q3~ ^ + (l03)4 • 36585 + 1500 = 202136. □ 1.125. Poznámka. Ve skutečnosti úročení probíhá podle počtu dní, které jsou peníze na účtu. Obstarejte si skutečný výpis ze stavebního spoření, zjistěte si jeho úročení a zkuste si spočítat připsané úroky za rok. Porovnejte je se skutečně připsanou sumou. Počítejte tak dlouho, dokud sumy nebudou souhlasit. 1.126. Na kolik maximálně částí dělí rovinu n kružnic? Řešení. Pro maximální počet p„ oblastí, na které dělí rovinu kružnice odvodíme rekurentní vzorec Pn+\ = Pn+ 2fl. Všimněme si totiž, že (n + l)-ní kružnice protíná n předchozích maximálně v 2n průsečících (a tato situace skutečně může nastat). 49 KAPITOLA 1. ROZCVIČKA Navíc zrejme p\ = 2. Pro počet p„ tedy dostávame Pn = Pn-l + 2(n - 1) = p„_2 + 2(n - 2) + 2(n - 1) = .. . n-l = p\ + ^ 2i = n2 — n + 2. □ 1.127. Na kolik nejvýše částí dělí třírozměrný prostor n rovin? Řešení. Označme hledaný počet r„. Vidíme, že r0 = 1. Podobně jako v příkladu ||1.30|| uvažujme, že máme v prostoru n rovin, přidejme jednu další a ptejme se, kolik nejvýše částí prostoru přibude. Opět to bude přesně tolik, kolika původními částmi prostoru přidaná rovina prochází. Kolik to může být? Počet částí prostoru, kterými (n + l)-ní rovina prochází je roven počtu částí, na které je přidaná (n + l)-ní rovina rozdělena průsečnicemi s n rovinami, které v prostoru již byly rozmístěny. Těchto částí však může být podle příkladu ||1.30|| nejvýše l/2-(n2+n+2), dostáváme tak rekurentní formuli n2 + n + 2 rn+\ = r„ H----. Danou rovnici opět můžeme vyřešit přímo: („-1)2 + („-!) + 2 rn = r„-\ H----= r„_i + : r„_2 + 2 (n - l)2 - (n - 1) + 2 n2 - n + 2 _ 2 + 2 ~ , n2 , (n-l)2 n (n-l) = r„-2 H----------h 1 + 1 = 2 2 2 2 n2 (n - l)2 (n - 3)2 n (n-l) (n - 2) - r„_3 + — + — + — - - —+ +1+1+1= = ---=ro + -E!'2-2E'+E1 = í = l í = l í = l n(n + í)(2n + í) n(n + 1) = 1 H-----h = 12 4 _ rc3 + 5rc + 6 ~ 6 ' kde jsme použili známého vztahu y^.2 _ + l)(2n + 1) í=i který lze snadno dokázat matematickou indukcí. □ 1.128. Na kolik maximálně částí dělí trojrozměrný prostor n koulí? O 1.129. Na kolik částí dělí prostor n navzájem různých rovin, které všechny prochází jedním daným bodem? Řešení. Pro hledaný počet x„ odvodíme rekurentní formuli Xn = *n-\ +2(n - 1), dále x\ = 2, tedy xn = n(n — 1) + 2. □ 50 KAPITOLA 1. ROZCVIČKA 1.130. Z balíčku 52 karet náhodně vybereme 16 karet. Vyjádřete pravděpodobnost, že vybereme právě 10 červených a 6 černých karet. Řešení. Nejdříve si uvědomme, že nemusíme zohledňovat pořadí výběru karet. (Ve výsledném zlomku bychom uspořádané výběry získali tak, že bychom číslem 16! vynásobili čitatele i jmenovatele.) Počet všech možných (neuspořádaných) výběrů 16 karet z 52 je (jg). Podobně je počet všech možných výběrů 10 karet z 26 roven (2g) a 6 karet z 26 pak (2g6). Neboť vybíráme nezávisle na sobě 10 karet z 26 červených a 6 karet z 26 černých, užití (kombinatorického) pravidla součinu dává výsledek H4^ = o,ii8. □ (l6) 1.131. V urně je 7 bílých, 6 žlutých a 5 modrých koulí. Vylosujeme (bez vracení) 3 koule. Určete pravděpodobnost, že právě 2 jsou bílé. Řešení. Celkem máme (7+3+5) způsobů, jak lze vybrat 3 koule. Vylosovat právě 2 bílé umožňuje Q výběrů bílých a současně (Y) výběrů zbylé (třetí) koule. Podle pravidla součinu je tak počet způsobů, jak lze vylosovat právě 2 bílé, roven Q ■ (Y). Odsud již plyne výsledek = 0,283. □ 1.132. Z karetní hry o 108 kartách (2x52+4 žolíci) bez vracení vybereme 4 karty. Jaká je pravděpodobnost, že aspoň jedna z nich je eso nebo žolík? Řešení. Lehce můžeme určit pravděpodobnost opačného (komplementárního) jevu znamenajícího, že ve vybrané čtveřici není žádná z 12 uvažovaných karet (8 es a 4 žolíků). Tato pravděpodobnost je dána poměrem počtu výběrů 4 karet z 96 a počtu výběrů 4 karet ze 108, tj. je rovna {9^)/{W4&)- Opačný jev má tudíž pravděpodobnost 1 - M = 0,380. □ l 4 ) 1.133. Při házení kostkou padla jedenáctkrát po sobě čtyřka. Uvedie pravděpodobnost, že padne podvanácté. Řešení. Předchozí výsledky (podle našich předpokladů) nijak neovlivňují, co padne na kostce při dalších hodech. Proto je hledaná pravděpodobnost 1 /6. □ 1.134. Z balíčku 32 karet náhodně vypadne 6 karet. Jaká je pravděpodobnost, že jsou všechny téže barvy? Řešení. K tomu, abychom získali výsledek = 1,234 • HT4, stačí nejprve zvolit jednu ze 4 barev a uvědomit si, že existuje (g) způsobů, jak vybrat 6 karet z 8 této barvy. □ 1.135. Tři hráči dostanou po 10 kartách a 2 zbudou (z balíčku připraveného na mariáš nebo prší -32 karet, z toho 4 esa). Je pravděpodobnější, že někdo dostane listovou sedmu, osmu a devítku, nebo to, že zbyla dvě esa? Řešení. Protože pravděpodobnost, že nějaký z hráčů dostane uvedené tři karty, je rovna hodnotě zatímco pravděpodobnost, že zbudou dvě esa, je rovna číslu 51 KAPITOLA 1. ROZCVIČKA ÉL (?)' je pravděpodobnější, že nějaký z hráčů dostal zmíněné tři karty. Poznamenejme, že nerovnost Mí) >ÉL (m) (?) lze dokázat úpravou obou jejích stran, kdy opakovaným krácením (po vyjádření kombinačních čísel dle definice) lehce dostaneme 6 > 1. □ 1.136. Dva přátelé střílejí nezávisle na sobě do jednoho terče, každý po jednom výstřelu. Pravděpodobnost zásahu terče pro prvního je 0,4, pro druhého je 0, 3. Nalezněte pravděpodobnost P jevu, že po střelbě bude v terči právě jeden zásah. Řešení. Výsledek stanovíme tak, že sečteme pravděpodobnosti těchto dvou neslučitelných jevů: trefil se první střelec a druhý nikoli; první střelec minul, zatímco druhý terč zasáhl. Při nezávislosti jevů (která se zachovává také tehdy, když uvažujeme komplementy některých z jevů) je pravděpodobnost společného nastoupení dána součinem pravděpodobností jednotlivých jevů. Užitím toho dostáváme P = 0,4 • (1 — 0,3) + (1 - 0,4) • 0,3 = 0,46. □ 1.137. Dvanáctkrát po sobě házíme třemi mincemi. Jaká je pravděpodobnost, že alespoň v jednom hodu padnou tři líce? Řešení. Uvážíme-li, že při opakovaní téhož pokusu jsou jednotlivé výsledky nezávislé, a označíme-li pro i € {1,..., 12} jako A, jev „při i-tém hodu padly tři líce", určujeme P (Ô Ař) = 1 - (1 - P(A!)) • (1 - P(A2)) ■■■(!- P(An)). Pro každé i e {1,..., 12} je však P(A,) = 1/8, neboť na každé ze tří mincí padne líc s pravděpodobností 1 /2 nezávisle na tom, zda na ostatním mincích padl líc, příp. rub. Nyní již můžeme napsat výsledek i-(D12- ° 1.138. V jisté zemi mají parlament, ve kterém zasedá 200 poslanců. Dvě hlavní politické strany, které v zemi existují, si při „volbách" házejí o každý poslanecký mandát zvlášť mincí. Každá z těchto stran má přidělenu jednu stranu mince. Té straně, jejíž strana mince padne, náleží mandát, o který se právě losovalo. Jaká je pravděpodobnost, že každá ze stran získá 100 mandátů? (mince je „poctivá") Řešení. Všech možných výsledků losování (uvažovaných jako dvousetčlenné posloupnosti rubů a líců) je 2200. Pokud každá strana získá právě sto mandátů, je ve vylosované posloupnosti právě sto líců a sto rubů. Takových posloupností je (jgg) (taková posloupnost je jednoznačně určená výběrem sto členů z dvou set možných, na kterých budou např. líce). Celkem je hledaná pravděpodobnost /2O0\ 200! uoo/ _ íooMoo! — n n^A n 2200 — 2200 _ U>UJU- LJ 1.139. Sedm Čechů a pět Angličanů náhodně rozdělíme na dvě (neprázdné) skupiny. Jaká je pravděpodobnost, že v jedna ze skupin bude tvořena pouze Čechy? Řešení. Všech možností je 212 — 1. Jestliže jsou v jedné skupině pouze Češi, znamená to, že všichni Angličané jsou v jedné skupině (buď v první nebo druhé). Zbývá rozdělit Čechy na dvě neprázdné skupiny, to můžeme 27—1 způsoby. Na závěr ještě přičíst rozdělení, kdy jsou skupiny podle národností: 2-(27-l)+l n 52 KAPITOLA 1. ROZCVIČKA 1.140. Zjistěte pravděpodobnost, že při hodu dvěma kostkami padla alespoň na jedné kostce čtyřka, jestliže padl součet 7. Řešení. Příklad řešíme pomocí klasické pravděpodobnosti, kdy podmínku interpretujeme jako zúžení pravděpodobnostního prostoru. Ten má vzhledem k podmínce tedy 6 prvků, z čehož právě 2 jsou příznivé vyšetřovanému jevu. Správná odpověďje 2/6 =1/3. □ 1.141. Hodíme dvěma kostkami. Určete podmíněnou pravděpodobnost, že na první kostce padla pětka za podmínky, že padl součet 9. Na základě tohoto výsledku rozhodněte o nezávislosti jevů „na první kostce padla pětka" a „padl součet 9". Řešení. Označíme-li jev „na první kostce padla pětka" jako A a jev „padl součet 9" jako H, pak platí P(A\H) = «4 = J. Uvědomme si, že součet 9 můžeme získat tak, že na první kostce padne 3 a na druhé 6, na první 4 a na druhé 5, na první 5 a na druhé 4 nebo na první 6 a na druhé 3. Z těchto čtyř (stejně pravděpodobných) výsledků jevu A vyhovuje právě jeden. Protože pravděpodobnost jevu A je očividně 1/6^1 /4, nejsou uvedené jevy nezávislé. □ 1.142. Uvažujme rodiny se dvěma dětmi a pro jednoduchost předpokládejme, že všechny možnosti v množině Q = [kk, kh, hk, hh), kde k značí „kluk" a h znamená „holka" při zohlednění stáří dětí, jsou stejně pravděpodobné. Zavedme náhodné jevy H\ - rodina má kluka, A\ - rodina má 2 kluky. Vypočtěte P (A\\H\). Podobně uvažujme rodiny se třemi dětmi, kdy je Q = {kkk, kkh, khk, hkk, khh, hkh, hhk, hhh}. Jestliže Hi - rodina má kluka i holku, Ai- rodina má nej výše jednu holku, rozhodněte o nezávislosti náhodných jevů A2 a H2. Řešení. Uvážením, které ze čtyř prvků množiny Q (ne)vyhovují jevu A\, resp. H\, lehce získáváme p (A.\JJ.\ - PJAinHQ _ PiAi! _ i _ 1 Dále máme zjistit, zda platí P (A2 n H2) = P (A2) ■ P (H2). Opět si stačí pouze uvědomit, že jevu A2 vyhovují právě prvky kkk, kkh, khk, hkk množiny Q, jevu H2 prvky kkh, khk, hkk, khh, hkh, hhk a jevu A2 n H2 prvky kkh, khk, hkk. Odtud plyne P (A2 n H2) = f = I • f = P (A2) • P (H2), což znamená, že jevy A2 a H2 jsou nezávislé. □ 1.143. V osudí je 9 červených a 7 bílých koulí. Postupně vytáhneme 3 koule (bez vracení). Určete pravděpodobnost, že první dvě budou červené a třetí bílá. Řešení. Příklad budeme řešit pomocí věty o násobení pravděpodobností. Nejprve požadujeme vytažení červené koule, což se podaří s pravděpodobností 9/16. Pokud byla poprvé vytažena červená koule, při druhém tahu vytáhneme znovu červenou kouli s pravděpodobností 8/15 (v osudí je 15 koulí, z toho 8 červených). Konečně, pokud byla dvakrát vytažena červená koule, pravděpodobnost, že 53 KAPITOLA 1. ROZCVIČKA potom bude vytažena bílá, je 7/14 (v osudí je 7 bílých koulí a 7 červených koulí). Celkem dostáváme 16 ' 15 A ■ á = 0,15. □ 1.144. V osudí je 10 koulí, a to 5 černých a 5 bílých. Postupně budeme losovat po jedné kouli, přičemž vytaženou kouli nevrátíme zpět. Stanovte pravděpodobnost, že nejprve vytáhneme bílou, poté černou, pak bílou a v posledním čtvrtém tahu opět bílou kouli. Řešení. Použijeme větu o násobení pravděpodobností. V prvním tahu vytáhneme bílou kouli s pravděpodobností 5/10, poté černou s pravděpodobností 5/9, následně bílou s pravděpodobností 4/8 a na závěr bílou s pravděpodobností 3/7. Dohromady to dává _5_ 5 4 3 _ _5_ r-n 10 ' 9 ' 8 ' 7 — 84- U 1.145. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel menších než 1 bude menší než 3/7? Řešení. Je vidět, že jde o jednoduchý příklad na geometrickou pravděpodobnost, kdy jako základní prostor Q se nabízí čtverec s vrcholy [0, 0], [1, 0], [1,1], [0,1] (volíme dvě čísla mezi 0 a 1). Zajímá nás pravděpodobnost jevu udávajícího, že pro náhodně zvolený bod [x, y] v tomto čtverci bude platit x + y < 3/7; tj. pravděpodobnost toho, že zvolený bod se bude nacházet uvnitř trojúhelníku A s vrcholy [0, 0], [3/7, 0], [0, 3/7]. Nyní již snadno vyčíslíme 1.146. Nechť je náhodně rozlomena tyč na tři části. Stanovte pravděpodobnost, že délka druhé (prostřední) části bude větší než dvě třetiny délky tyče před jejím rozlomením. Řešení. Nejprve si označme délku uvažované tyče jako d. Rozlomení tyče ve dvou místech je dáno volbou bodů, kde ji zlomíme. Označme jako x bod, ve kterém je první (např. blíže nějakému předmětu) zlom, a jako x + y bod, ve kterém je druhý zlom. To nám říká, že za základní prostor lze považovat množinu {[x, y]; x e (0, d), y e (0, d — x)}, tj. trojúhelník s vrcholy v bodech [0, 0], [d, 0], [0, d]. Délka prostřední části je dána hodnotou y. Požadavek ze zadaní lze nyní zapsat v jednoduchém tvaru y > 2d/3, což odpovídá trojúhelníku s vrcholy [0, 2d/3], [d/3, 2d/3], [0, d]. Obsahy uvažovaných pravoúhlých rovnoramenných trojúhelníků jsou d2 /2 a (d/3)2/2, a proto je hledaná pravděpodobnost 4- lf = 9- C 2 1.147. Tyč o délce 2 m je náhodně rozřezána na tři části. Nalezněte pravděpodobnost jevu, že třetí část měří méně než 1, 5 m. Řešení. Tento příklad je na užití geometrické pravděpodobnosti, kdy hledáme pravděpodobnost toho, že součet délek prvních dvou částí je větší než čtvrtina délky tyče. Určeme pravděpodobnost opačného jevu, tj. pravděpodobnost, když budou náhodně (a nezávisle na sobě) zvolena dvě místa, ve kterých bude tyč rozřezána, že budou obě v první čtvrtině tyče. Pravděpodobnost tohoto jevu je 1 /42, neboť pravděpodobnost výběru místa v první čtvrtině tyče je zřejmě 1/4 a tento výběr se (nezávisle) jednou opakuje. Pravděpodobnost hledaného (opačného) jevu je tak 15/16. □ 1.148. Mirek a Marek chodí na obědy do univerzitní menzy. Menza má otevřeno od llh do 14h. Každý z nich stráví na obědě půl hodiny a dobu příchodu (mezi llh a 14h) si vybírá náhodně. Jaká je pravděpodobnost, že se na obědě v daný den potkají, sedávají-li oba u stejného stolu? 54 KAPITOLA 1. ROZCVIČKA Řešení. Prostor všech možných jevů je čtverec 3x3. Označíme-li x dobu příchodu Mirka a y dobu příchodu Marka, tak tito se potkají, právě když \x — y\ < 1/2. Tato nerovnost vymezuje ve čtverci možných událostí oblast, jejíž obsah je roven 11/36 obsahu čtverce. Tomuto zlomku je tedy rovna i hledaná pravděpodobnost. □ 1.149. Z Brna vyrazí náhodně někdy mezi polednem a čtvrtou hodinou odpolední Honza autem do Prahy a opačným směrem někdy ve stejném intervalu autem Martin. Oba si dávají půl hodiny pauzu v motorestu v polovině cesty (přístupném pro oba směry). Jaká je pravděpodobnost, že se tam potkají, jezdí-li Honza rychlostí 150 km/h a Martin 100 km/h? (Vzdálenost Brno-Praha je 200 km) Řešení. Označíme-li dobu odjezdu Martina x a dobu odjezdu Honzy y a pro menší výskyt zlomků v následujících výpočtech zvolíme za jednotku deset minut, tak stavovým prostorem bude čtverec 24 x 24. Doba příjezdu Martina do motorestu je x + 6, do příjezdu Honzy x + 4. Stejně jako v předchozím příkladu to, že se v motorestu potkají, je ekvivalentní tomu, že doby jejich příjezdu se neliší o více než o půl hodiny, tedy | (x + 6) — (y + 4) | < 3. Tato podmínka nám pak ve stavovém čtverci vymezuje oblast o obsahu 242 — ^(232 + 192) (viz obr.) a hledaná pravděpodobnost je □ 1.150. Mirek vyjede náhodně mezi desátou hodinou dopolední a osmou hodinou večerní z Brna do Prahy. Marek vyjede náhodně ve stejném intervalu z Prahy do Brna. Oběma trvá cesta 2 hodiny. Jaká je pravděpodobnost, že se po cestě potkají (jezdí po stejné trase)? Řešení. Řešíme naprosto analogicky jako v předchozím příkladě. Prostor všech možných jevů je čtverec 10x10, Mirek, vyjíždějící v čase x, potká Marka, vyjíždějícího v čase y právě když | x—y\ < 2. Hledaná pravděpodobnost je p = = ^ = 0,36. □ 55 KAPITOLA 1. ROZCVIČKA 1.151. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že ze vzniklých dílů půjde sestavit trojúhelník. Řešení. Rozdělení tyče je dáno stejně jako v předchozím příkladě body řezu iaya jevovým prostorem je opět čtverec 2x2. Aby z částí bylo možno sestavit trojúhelník, musejí jejich délky splňovat tzv. trojúhelníkové nerovnosti, tedy součet délek libovolných dvou částí musí být větší než délka třetí části. Vzhledem k tomu, že součet délek je roven 2 m, je tato podmínka ekvivalentní podmínce, že každá s částí musí být menší než 1 m. To pomocí řezů x a y vyjádříme tak, že nesmí platit současně x < la v < 1 nebo současně x > la v > 1 (odpovídá podmínkám, že krajní díly tyče jsou menší než 1), navíc \x — y\ < 1 (prostřední díl musí být menší nezjedná). Tyto podmínky splňuje vyšrafovaná oblast na obrázku a jak snadno nahlédneme, její obsah je 1 /4. □ 1.152. Jsou rovnice (a) 4x\ - -J3x2 = 3, X\ - 2^1X2 = -2 Ax\ — */3x2 = 16, Xl - 2-Jlx2 = -7 Ax\ + 2x2 = 7, —1x\ - X2 = -3 (b) (c) jednoznačně řešitelné (mají právě 1 řešení)? Řešení. Soustava lineárních rovnic je jednoznačně řešitelná právě tehdy, když je nenulový determinant matice určené koeficienty na levé straně soustavy. Zejména tedy absolutní členy rovnic (čísla na pravé straně) neovlivňují jednoznačnost řešení soustavy. Musíme tedy ve variantách (a) a (b) dostat stejnou odpověď. Protože 4 -VŠ -2^7 : 4 • (-2V7) - (-V3 • l) ŕ :4-(-l)-(2-(-2)) = 0, 0, -2 -1 mají soustavy ve variantách (a) a (b) právě 1 řešení a poslední soustava nikoliv. Vynásobíme-li druhou rovnici v (c) číslem —2, vidíme, že tato soustava nemá řešení. □ 56 KAPITOLA 1. ROZCVIČKA 1.153. V K2 určete vrcholy nějakého rovnostranného trojúhelníka ABC o straně délky 1, s bodem C = [1, 1] a základnou A B rovnoběžnou s přímkou 3x + 4y = 105. O 1.154. Vypočítejte obsah S čtyřúhelníku zadaného vrcholy [0,-2], [-1,1], [1,5], [1,-1]. Řešení. Při obvyklém označení vrcholu A = [0,-2], S = [1,-1], C = [1,5], D = [-1,1] a neméně obvyklém rozdělení čtyřúhelníku na trojúhelníky ABC a ACD s obsahy S\ a S2, dostáváme S = Si + s2 1-0 1-0 -1+2 5 + 2 1-0 5 + 2 -1-0 1 + 2 i(7-l) + I(3 + 7) □ 1.155. Určete obsah čtyřúhelníka ABCD s vrcholy A = [1, 0], B = [11, 13], C = [2, 5] a D = [-2, -5]. Řešení. Čtyřúhelník rozdělíme na dva trojúhelníky ABC a ACD. Jejich obsahy pak spočítáme pomocí patřičných determinantů, viz 1.34, 1 5 10 13 1 5 -3 -5 47 2 • □ 1.156. Spočítejte obsah rovnoběžníku s vrcholy v bodech [5, 5], [6, 8] a [6, 9]. Řešení. Přestože takový rovnoběžník není zadán jednoznačně (není uveden čtvrtý vrchol), trojúhelník s vrcholy [5, 5], [6, 8] a [6, 9] musí být nutně polovinou každého rovnoběžníku s těmito třemi vrcholy (jedna ze stran trojúhelníku se stane úhlopříčkou rovnoběžníku). Proto je hledaný obsah vždy roven determinantu 1.4-1-3 = 1. □ 6-5 6-5 1 1 8-5 9-5 3 4 1.157. Stanovte rozlohu louky, která je na pozemkové mapě ohraničena body o kótách [—7, 1], [—1, 0], [29, 0], [25,1], [24, 2] a [17, 5]. (Jednotky neuvažujte. Jsou určeny poměrem pozemkové mapy vůči skutečnosti.) Řešení. Uvažovaný šestiúhelník můžeme rozdělit např. na čtyři trojúhelníky s vrcholy [-7, 1], [-1, 0], [17, 5]; [-1, 0], [24, 2], [17, 5]; [-1, 0], [25, 1], [24, 2]; [-1, 0], [29, 0], [25, 1]. Jejich obsahy jsou po řadě 24, 89/2, 27/2 a 15, což dává výsledek 24 + 44 i + 13 i + 15 = 97. □ 1.158. Určete obsah trojúhelníka A2A3An, kde A0Ai... Au jsou vrcholy pravidelného dvanáctiúhelníka vepsaného do kružnice o poloměru 1. Řešení. Vrcholy dvanáctiúhelníka můžeme ztotožnit s dvanáctými odmocninami z čísla 1 v komplexní rovině. Zvolíme-li navíc A0 = 1, pak můžeme psát Ak = cos(2fcjr/12) + i sin(2fcjr/12). Pro vrcholy zkoumaného trojúhelníka máme: A2 = cos(jt/3) + i sin(jr/3) = 1/2 + iVŠ/2, a3 = cos(jr/2) + i sin(jr/2) = 1, Au = cos(—jt/6) + i sin(—jt/6) = V3/2 — i/2, 57 KAPITOLA 1. ROZCVIČKA neboli souřadnice těchto bodů v komplexní rovnině jsou A2 = [1/2, V3/2], A3 [■s/3/2, - i]. Podle vzorce pro obsah trojúhelníka je potom hledaný obsah S roven [0, 1], Ai 1 A2 - A„ 1 2 A3 "2 I _ V3 i _1_ V3 2 2 2 vš 3 2 2 V3 Vzhledem ke kladnosti předchozího determinantu jsme mohli z estetických důvodů vynechat jeho absolutní hodnotu. □ 1.159. Je dán trojúhelník s vrcholy A vidět z bodu P = [0, 1]. [5, 6], B = [7, 8], C = [5, 8]. Určete, které jeho strany je Řešení. Uspořádáme vrcholy v kladném smyslu, tedy proti směru hodinových ručiček: [5, 6], [7, 8], [5, 8]. Pomocí příslušných determinantů určíme, zda-li je bod [0, 1] „nalevo" či „napravo" od jednotlivých stran trojúhelníka uvažovaných jako orientované úsečky B - P 1 7 C - P 5 7 A - P 5 5 B - P 7 7 > o, = 0. 5 7 5 5 < 0, Z nulovosti posledního determinantu vidíme, že body [0,1], [5, 6] a [7, 8] leží na přímce, stranu A B tedy nevidíme. Stranu BC rovněž tak nevidíme, na rozdíl od strany AC, pro kterou je příslušný determinant záporný. □ 1.160. Určete, které strany čtyřúhelnika s vrcholy A = [95, 99], B = [130,106], C = [40,60], D = [130,120]. jsou viditelné z bodu [2, 0]. Řešení. Nejprve je třeba určit strany čtyřúhelnika („správné" pořadí vrcholů): ACBD. Po spočítání příslušných determinantů jako v předchozích příkladech zjistíme, že je vidět pouze strana CB. □ 1.161. Určete počet relací na množině {1, 2, 3, 4}, které jsou současně symetrické i tranzitivní. Řešení. Relace uvedených vlastností je relací ekvivalence na nějaké podmnožině množiny {1,2,3,4} Celkem 1 + 4 • 1 + Q ■ 2 + Q ■ 5 + 15 = 52. 1.162. Určete počet relací uspořádání na tříprvkové množině. □ O 1.163. Určete počet relací uspořádání na množině {1,2,3,4} takových, že prvky 1 a 2 jsou nesrovnatelné (tedy neplatí 1 -< 2 ani 2 < 1, kde -< je označení uvažované relace uspořádání). O 1.164. Určete počet surjektivních zobrazení / množiny {1, 2, 3, 4, 5} na množinu {1,2, 3} takových, že /(l) = f (2). Řešení. Každé takové zobrazení je jednoznačně dáno obrazem prvků {1, 3, 4, 5}, těchto zobrazení je tedy přesně tolik, kolik je zobrazení surjektivních zobrazení množiny {1, 3, 4, 5} na množinu {1,2, 3}, tedy 36, jak víme z předchozího přikladu. □ 58 KAPITOLA 1. ROZCVIČKA 1.165. Výčtem prvků zadejte S o i?, je-li R = {(2,4), (4, 4), (4, 5)} c N x N, S = {(3,1), (3, 2), (3, 5), (4,1), (4,4)} c N x N. Řešení. Uvážením všech výběrů dvou uspořádaných dvojic (2, 4), (4,1); (2,4), (4, 4); (4, 4), (4,1); (4, 4), (4, 4) splňujících, že druhá složka první uspořádané dvojice, která je prvkem i?, je rovna první složce druhé uspořádané dvojice, která je prvkem S, dostáváme SoR = {(2, 1), (2,4), (4, 1), (4,4)}. □ 1.166. Nechť je dána binární relace R = {(0,4), (-3,0), (5, it), (5, 2), (0,2)} mezi množinami A = Z a B = K. Vyjádřete R~l a R o R^1. Řešení. Ihned vidíme, že R-1 = {(4, 0), (0, -3), (it, 5), (2, 5), (2, 0)}. Odtud pak dále R o R-1 = {(4,4), (0, 0), (ji, ji), (2, 2), (4, 2), (jr, 2), (2, ji), (2, 4)}. □ 1.167. Rozhodněte, zdaje relace R určená podmínkou (a) (a, b) e R ^=> \a\ < \b\; (b) (a, b) € R |a| = \2b\ na množině celých čísel Z tranzitivní. Řešení. V prvním případě relace R tranzitivní je, protože platí \a\ <\b\, \b\ <\c\ => \a\<\c\. Ve druhém případě relace R tranzitivní není. Stačí např. uvážit, že (4, 2), (2, 1) e R, (4,1) £ R. □ 1.168. Najděte všechny relace na M = {1, 2}, které nejsou antisymetrické. Které z nich jsou tranzitivní? Řešení. Hledané relace, jež nejsou antisymetrické, jsou čtyři. Jsou to právě ty podmnožiny {1,2} x {1, 2}, které obsahují prvky (1, 2), (2,1) (jinak nemůže být podmínka antisymetrie porušena). Z těchto čtyř je tranzitivní pouze jediná relace {(1, 1), (1, 2), (2, 1), (2, 2)} = M x M, protože nezahrnutí dvojic (1,1) a (2, 2) do tranzitivní relace by znamenalo, že nemůže obsahovat zároveň (1, 2) a (2,1). □ 1.169. Existuje relace ekvivalence, která je současně relací uspořádání, na množině všech přímek v rovině? Řešení. Relace ekvivalence (příp. relace uspořádání) musí být reflexivní, a proto každá přímka musí být v relaci sama se sebou. Dále požadujeme, aby hledaná relace byla symetrická (ekvivalence) a zároveň antisymetrická (uspořádání). To dává, že přímka může být v relaci pouze sama se sebou. Zavedeme-li ovšem relaci tak, že dvě přímky jsou v relaci právě tehdy, když jsou totožné, dostaneme 59 KAPITOLA 1. ROZCVIČKA „velmi přirozenou" relaci ekvivalence i relaci uspořádání. Stačí si uvědomit, že je triviálně tranzitivní. Hledanou relací je právě identické zobrazení množiny všech přímek v rovině. □ 1.170. Určete, zdaje relace R = {(k,l) e Z x Z; \ k\ > |/|} na množině Z ekvivalence, uspořádání. Řešení. Relace i? není ekvivalencí: není symetrická (kupř. (6, 2) e Ä, (2, 6) ^ i?); není uspořádáním: není antisymetrická (mj. (2, —2) e R, (—2, 2) e R). □ 1.171. Ukažte, že průnik libovolných relací ekvivalence na libovolně dané množině X je rovněž relace ekvivalence a že sjednocení dvou relací uspořádání na X nemusí být relace uspořádání. Řešení. Postupně uvidíme, že průnik relací ekvivalence je reflexivní, symetrický a tranzitivní. Všechny relace ekvivalence na X musí obsahovat dvojici (x, x) pro každé x e X, a proto ji musí obsahovat také daný průnik. Pokud v průniku ekvivalencí je prvek (x, y), musí v něm být rovněž prvek (y, x) (stačí využít toho, že každá ekvivalence je symetrická). To, že do průniku ekvivalencí náleží prvky (x, y) a (y, z), znamená, že se jedná o prvky každé z ekvivalencí. Z tranzitivnosti všech jednotlivých ekvivalencí již vyplývá, že do průniku náleží také prvek (x, z). Zvolíme-li X = {1, 2} a relace uspořádání Ri = {(1, 1), (2, 2), (1, 2)}, R2 = {(1, 1), (2, 2), (2, 1)} na X, dostáváme relaci Ä1UÄ2 = {(1,1),(2, 2), (1,2), (2,1)}, která zřejmě není antisymetrická, a tedy ani uspořádáním. □ 1.172. Na množině M = {1, 2,..., 19, 20} je zavedena relace ekvivalence ~ tak, že a ~ b pro libovolná a, b e M právě tehdy, když první cifry čísel a, b jsou stejné. Sestrojte rozklad daný touto ekvivalencí. Řešení. Dvě čísla z množiny M jsou ve stejné třídě ekvivalence, právě když jsou spolu v relaci (první cifra je stejná). Rozklad jí určený se tedy skládá z množin {1,10,11,..., 18, 19}, {2, 20}, {3}, {4}, {5}, {6}, {7}, {8}, {9}. □ 1.173. Je dán rozklad se dvěma třídami {b, c], {a, d, e) množiny X = {a,b,c, d, e). Napište relaci ekvivalence R na množině X příslušnou tomuto rozkladu. Řešení. Ekvivalence R je určena tím, že v relaci jsou spolu ty prvky, které jsou ve stejné třídě rozkladu, a to v obou pořadích (R musí být symetrická) a každý sám se sebou (R musí být reflexivní). Proto R obsahuje právě (a, a), (b, b), (c, c), (d, d), (e, e), (b, c), (c, b), (a, d), (a, e), (d, a), (d, e), (e, a), (e, d). □ 60 KAPITOLA 1. ROZCVIČKA 1.174. Na předchozích třech obrázcích jsou ikony spojeny čarami tak, jak by je možná přiřadili lidé v různých částech světa. Určete, zda jde o zobrazení, zdaje injektivní, surjektivní nebo bijektivní. Řešení. V prvním případě jde o zobrazení, které je surjektivní, ale není injektivní, protože had i pavouk jsou označeni jako jedovatí. Druhý případ není zobrazení ale jen relace, protože pes je určen jako domácí zvíře i na jídlo. V třetím případě máme opět zobrazení. Tentokrát není ani injektivní, ani surjektivní. □ 1.175. Mějme množinu {a, b, c, d] a na ní relaci {(a, a), (b, b), (a, b), (b, c), (c, b)}. Jaké členy je potřeba minimálně doplnit do této relace, aby to byla ekvivalence? Řešení. Postupně projdeme všechny tři vlastnosti, které definují ekvivalenci. Za prvé je to reflexivita. Musíme tedy doplnit dvojice {(c, c), (d, d)}. Za druhé symetrie -musíme doplnit (b, a) a za třetí musíme udělat tzv. tranzitivní obal. Protože je a v relaci s b a b v relaci s c, musí být i a v relaci s c. Nakonec tedy potřebujeme přidat (a, c) a (c, a). □ 1.176. Uvažme množinu čísel, které mají pět cifer ve dvojkovém zápisu a relaci takovou, že dvě čísla jsou v relaci, právě když jejich ciferný součet má stejnou paritu. Napište příslušné třídy ekvivalence. Řešení. Dostáváme dvě třídy ekvivalence (o osmi členech): [10000] = {10000, 10011, 10101, 10110,11001,11010, 11100, 11111} odpovídá množině {16, 19, 21, 22, 25, 26, 28, 31} a [10001] = {10001, 10010, 10100, 11000,10111,11011, 11101, 11110} odpovídá množině {17, 18, 20, 24, 23, 27, 29, 30}. □ 1.177. Uvažme množinu čísel, které mají tři cifry ve trojkové soustavě a relaci takovou, že dvě čísla jsou v relaci, právě když v této soustavě i) začínají stejným dvojčíslím. ii) končí stejným dvojčíslím. Napište příslušné třídy ekvivalence. Řešení. 61 KAPITOLA 1. ROZCVIČKA i) Dostáváme šest tříprvkových tříd [100] = {100, 101,102} odpovídá {9,10,11}, [110] = {110, 111,112} odpovídá {12, 13, 14}, [120] = {120, 121,122} odpovídá {15, 16, 17}, [200] = {200, 201, 202} odpovídá {18, 19, 20}, [210] = {210, 211, 212} odpovídá {21, 22, 23}, [220] = {220, 221, 222} odpovídá {24, 25, 26}. ii) V tomto případě máme devět dvouprvkových tříd [100] = {100, 200} odpovídá {9, 18}, [101] = {101, 201} odpovídá {10, 19}, [102] = {102, 202} odpovídá {11, 20}, [110] = {110, 210} odpovídá {12, 21}, [111] = {111, 211} odpovídá {13, 22}, [112] = {112, 212} odpovídá {14, 23}, [120] = {120, 220} odpovídá {15, 24}, [121] = {121, 221} odpovídá {16, 25}, [122] = {122, 222} odpovídá {17, 26}. □ 1.178. Pro jaký maximální definiční obor D a obor hodnot H je zobrazení bijektivní a jaká je v tom případě inverzní funkce? i) X h-» X4 , ii) X i-» X3 , iii) X h-» -4t. Řešení. i) D = [0, oo) a H = [0, oo) nebo také D = (—oo, 0] a H = [0, oo). Inverzní funkce je X I ^* ^/X. ii) D = H = K a inverze je x h-» ýx. iii) D = K \ {-1} a H = K \ {0}. Inverzní funkce je x ^ 1 - 1. □ 1.179. Uvažme relaci naRxl. Bod je v relaci, pokud pro něj platí (x-lf + (y + 1)2 = 1. Můžeme body popsat pomocí funkce y = f(x)l Nakreslete obrázek bodů v relaci. 62 KAPITOLA 1. ROZCVIČKA Řešení. Nemůžeme, protože např. y = — 1 má dva vzory: x = 0 a x = 2. Body leží na kružnici se středem v bodě (1, — 1) s poloměrem 1. □ 1.180. Nechťpro libovolná celá čísla k, l platí (k, ľ) e i? právě tehdy, když je číslo ^ — ^celočíselným násobkem 7. Je takto zavedená relace R ekvivalence, uspořádání? Řešení. Uvědomme si, že dvě celá čísla jsou spolu v relaci R, právě když dávají stejný zbytek po dělení 7. Jde tedy o příklad tzv. zbytkové třídy celých čísel. Proto víme, že relace R je relací ekvivalence. Její symetrie (např. (3,10), (10, 3) e R, 3 ^ 10) pak implikuje, že se nejedná o uspořádání. □ 1.181. Nechť je na množině N = {3, 4, 5,..., n, n + 1, ...} definována relace R tak, že dvě čísla jsou v relaci, právě když jsou nesoudělná (tedy neobsahuje-li prvočíselný rozklad uvažovaných dvou čísel ani jedno stejné prvočíslo). Zjistěte, zda je tato relace reflexivní, symetrická, antisymetrická, tranzitivní. Řešení. Pro dvojici stejných čísel platí, že (n,n) £ R. Nejedná se tedy o reflexivní relaci. Být „soudělný" nebo „nesoudělný" pro dvojici čísel z N je zřejmě vlastnost neuspořádané dvojice - nezávisí na uvedeném pořadí uvažovaných čísel, a proto je relace R symetrická. Ze symetrie relace R plyne, že není antisymetrická (např. (3, 5) e R, 3 ^ 5). Neboťje R symetrická a(n,n) £ R pro libovolné číslo n € N, volba dvou různých čísel, která jsou spolu v této relaci, dává, že R není tranzitivní. □ 1.182. Kolik existuje reflexivních relací na rc-prvkové množině? Řešení. Relace na množině M je reflexivní, právě když je diagonální relace AM = {(a, a), kde a e M] její podmnožinou. U zbylých n2 — n uspořádaných dvojic v kartézském součinu M x M máme 2 nezávislou volbu, jestli daná dvojice v dané relaci bude či ne. Celkem tedy máme 2™ ~" různých reflexivních relací na rc-prvkové množině. □ 1.183. Kolik existuje symetrických relací na rc-prvkové množině? Řešení. Relace na množině M je symetrická, právě když je její průnik s každou množinou {(a, b), (b, a), kde a ý= b, a,b e M) buď celá daná dvouprvková množina, nebo je tento průnik prázdný. Dvouprvkových podmnožin množiny M je Q, a pokud kromě průniků s těmito množinami ještě určíme průnik dané relace s diagonální relací AM = {(a, a), kde a e M}, je tímto daná relace jednoznačně určena. Celkem můžeme provést Q + n nezávislých voleb mezi dvěma alternativami: každá množina typu {(a, b), (b, a), kde a ^ b,a,b e M} je buď podmnožinou dané relace, nebo ani jeden z jejích prvků v dané relaci neleží a každá dvojice (a, a), a e M, potom také buď v relaci leží nebo ne. Celkem tedy máme 2(2)+™ symetrických relací na rc-prvkové množině. □ 1.184. Kolik existuje antisymetrických relací na rc-prvkové množině? Řešení. Relace na množině M je antisymetrická, právě když její průnik s každou množinou {(a, b), (b, a), kde a 7^ b, a, b € M] není dvojprvkový (jsou tedy tři možnosti, jak průnik vypadá, buď je to množina {(a, b)}, nebo {(b, a)}, nebo je průnik prázdný). Průnik s diagonální relací pak může být libovolný. Určením těchto všech průniků je relace jednoznačně určena. Celkem máme 3©2» antisymetrických relací na n -prvkové množině. □ 63 KAPITOLA 1. ROZCVIČKA Řešení cvičení 1.29. yn = 2(|)" - 2. 1.82. i) (3, 3), (4, 4), (5, 5), (6, 6), (7, 7), (3, 6) overte, že jde o relaci uspořádání. ii) opět (i, i) pro i = 1, ..., 7 a k tomu (3, 6), (6, 3) ověřte, že jde o relaci ekvivalence. iii) (i, i) pro i = 1, ..., 7 a k tomu (3, 6), (6, 3), (4, 6), (6, 4) ověřte, že nejde o relaci ekvivalence, protože není splněna tranzitivita. 1.98. a) 1 - 3 - 2i + 4i = -2 + 2i, 1 • (-3) - 8i2 + 6i + 4i = 5 + lOi, 1 + 2i, J42 + (-3)2 = 5, S = = 1 • (-3) + 8r + 6Í - 4/25 = -B + ÍL b) 2 + i, 2i 2, 1, l = -li. 1.107. Písmen v abecedě (včetně CH) je 27. Počet všech možných iniciálu je tedy 272 — 729. Proto aspoň 2 lidé budou mít stejné iniciály. 1.112. (3-46+ 2-2)-2-47! 1.119. i) 26 = 64. ii) (4) = 15. iii) Žádná panna je jedna možnost (q) — 1,jedna panna (j) — 6 možností. Posloupností s nejvýše jednou pannou je teda jen 7 a proto posloupností, kde jsou aspoň dvě panny je 64 — 7 = 57. 1.128. Maximální počet y„ částí, na které rozdělí n kružnic rovinu, je y„ — yn-\ + 2(n — 1), y\ — 2, tedy y„ = n2 - n + 2. Pro maximální počet p„ částí, na které potom rozdělí n koulí prostor, pak dostáváme rekurentní vztah Pn+\ = Pn+ yn, P\ = 2, tedy celkem p„ = |(n2 - 3n + 8). 1.153. Směry stran jsou (3^3/2 — 2, 3/2 + 2\/3) a (3^3/2 + 2, 2\/3 — |). Jedna ze dvou možných dvojic potom je A = [-ft- + 5, -Š- + B = [-ft- + 5, -n, + ^-], Í.Í62. 19. Í.Í65. 87. 64 KAPITOLA 2 Počítání s vektory neumíte ještě počítat se skaláry? - zkusme to rovnou s maticemi... ■3X\ < i V minulé kapitole jsme se snad rozehřáli s relativně jednoduchými úlohami, k jejichž řešení nebylo potřeba složitých nástrojů. Vystačili jsme si přitom se sčítáním a násobením skalárů. V této a dalších kapitolách se postupně budeme věnovat jednotlivým tématům souvisleji. Hned tři kapitoly budou věnovány nástrojům pro práci s daty, kdy operace spočívají v obzvlášť jednoduchých úkonech se skaláry, jen je těch skalárů povíce naráz. Hovoříme o „lineárních objektech" a „lineární algebře". Jakkoliv to teď může vypadat jako hodně speciální nástroj, uvidíme později, že složitější objekty a závislosti stejně studujeme hlavně pomocí jejich „lineárních přiblížení". V této kapitole budeme pracovat přímo s konečnými posloup- x3 = — 1. _J Matice typu m /n {_ Maticí typu m/n nad skaláry K rozumíme obdélníkové schéma Asm řádky a n sloupci A = «21 «22 «ln\ a2n \{lm\ «m2 ■ ■ ■ «mfi / kde aij e K pro všechna l < i < m, l < j < n. Pro matici A s prvky «y používáme také zápis A = (ay). Vektory («n, «;2, ■ ■ ■. «m) 6 K" nazýváme (í—té) řádky matice A,i — 1, ..., m, vektory (aij, aij, ..., amj) e Km nazýváme 0'-té) sloupce matice A, j = 1, ..., n. j Matici můžeme také chápat jako zobrazení A : {1, ...,m) x {1, ...,n) -» K, kde A(i, j) = aij. Matice typu 1/n nebo n/1 jsou vlastně právě vektory v K". 1 obecné matice lze chápat jako vektory v Km'n, prostě zapo-• meneme na řádkování. Zejména tedy je definováno sčítání matic a násobení matic skaláry: A + B — {aij + bij), a- A = {a ■ ay), kde A = (aij), B = (bij), aeK. Matice —A = (—aij) se nazývá matice opačná k matici A a matice /0 ... 0\ 0 h u Vo ... 0/ se nazývá nulová matice. Zapomenutím řádkování tak získáme následující tvrzení, že matice jsou jen specificky zapsané vektory: Tvrzení. Předpisy pro A + B, a-A, —A, 0 zadávajína množině všech matic typu m/n operace sčítania násobení skaláry splňující axiomy (V1)-(V4). 2.3. Matice a rovnice. Velmi častý nástroj pro popis nějakých matematických modelů jsou systémy lineárních rovnic. Právě matice lze vhodně využít pro jejich zápis. Zavedeme si k tomu účelu pojem skalární součin dvou vektorů, který vektorům (a\, ... ,a„) a(x\, ... ,xn) přiřadí jejich součin (a\, ,a„) ■ (x\, ...,x„) =«1*1 H-----hanxn tj. postupně násobíme po dvou souřadnice vektorů a výsledky sčítáme. Každý systém m lineárních rovnic v n proměnných «11*1 + «12*2 H-----h «l„*n = b\ «21*1 + «22*2 H-----V a2„xn = b2 «ml*l + «m2*2 H-----h «mn*n — bm lze tedy vidět jako požadavek na hodnoty m skalárních součinů neznámého vektoru (*i,...,*„) s vektory souřadnic (au, ..., a,-„). 67 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Ihned vidíme, že X3 = —1. Dosadíme-li X3 = —1 do rovnice X2 + xí = 1, dostaneme x2 = 2. Podobně dosazení získaných hodnoty = —1,X2 = 2 do první rovnice dává x\ = 1. □ Systémy lineárních rovnic tedy lze zapisovat v maticovém tvaru. Ale je to nějaká výhoda, když je stejně umíme řešit, aniž bychom hovořili o maticích? Ano je, o řešení můžeme hovořit koncepčněji, snadno v řeči matic určíme, kolik má soustava řešení a jazyk matic pak daleko lépe navádí k počítačovému zpracování problému. Zkusme si tedy osvojit lépe různé operace, které můžeme s maticemi provádět. Jak jsme viděli v předchozích příkladech, tak ekvivalentní úpravy lineárních rovnic odpovídají v řeči matic elementárním řádkovým (sloupcovým) úpravám. Dále jsme viděli, že převedeme-li těmito úpravami matici soustavy do schodovitého tvaru (tomuto procesu říkáme Gaus-sova eliminace, viz 2.7), tak je již vyřešení soustavy velmi jednoduché. Ukažme si to ještě na dalších příkladech, na kterých uvidíme, že soustava lineárních rovnic může mít nekonečně mnoho řešení. 2.3. Vyřešte soustavu lineárních rovnic 2x\ 3xi 3*1 -lx\ X2 + 3^3 1ÓJC2 + 7^3 5X2 + 4X3 7X2 + —10x3 0, 0, 0, 0. / 2 -1 3 \ / 2 -1 3 \ 3 16 7 0 35/2 5/2 3 -5 4 0 -7/2 -1/2 v -? 7 -10 / \o 7/2 1/2 / 0 35/2 0 -7/2 0 7/2 5/2 -1/2 1/2 J 3 í 2 -1 3 \ 5/2 0 7 1 0 0 0 0 0 ) 1° 0 °) Vektor proměnných můžeme také vidět jako sloupec v matici ■©..g typu n/l, a podobně hodnoty b\.....b„ můžeme •jjY vnímat jako vektor m a to opět jako jediný sloupec SS=sg5cí3 v matici typu n/l. Náš systém rovnic lze pak formálně psát ve tvaru A ■ x — u takto: Řešení. Vzhledem k nulovosti pravých stran všech rovnic (jedná se tedy o homogenní systém) budeme upravovat pouze matici systému. Řešení nalezneme převodem na schodovitý tvar pomocí elementárních řádkových transformací, které odpovídají záměně pořadí rovnic, vynásobení rovnice nenulovým číslem a přičítání násobků rovnic. Navíc můžeme kdykoli od maticového zápisu přejít zpět k zápisu rovnic s neznámými x,. Postupně dostáváme: Odtud je vidět, že druhá, třetí a čtvrtá rovnice jsou násobky rovnice 7x2 + X3 = 0. Pokračujme však v úpravách matice: / 2 -1 3 \ / 2 -1 Přestože byly zadány čtyři rovnice pro tři neznámé, má celá soustava nekonečně mnoho řešení, neboť pro libovolné 13 e R mají zbylé rovnice 2xj — X2 + 3x3 = 0, 7x2 + X3 = 0 (a\ (xx\ \ajn\ ■ ■ ■ amnJ \Xn) \bir, kde levou stranu interpretujeme jako m skalárních součinů jednotlivých řádků matice vytvářejících sloupcový vektor, jehož hodnotu rovnice určují. To znamená, že skutečně rovnost í-tých souřadnic zadává podmínku původní rovnice a;i*H-----YainXn = h a zápis A ■ x — u tak dává skutečně původní systém lineárních rovnic. 2.4. Součin matic. V rovině, tj. pro vektory dimenze 2, jsme už • jRjjjí- zavedli počet s maticemi a viděli jsme, že s ním lze fĽ£ pracovat velice efektivně (viz 1.26). Nyní budeme íy3$*S% postupovat obecněji a zavedeme všechny nástroje již tyn*im 1 známé z roviny pro všechny dimenze n. Násobení matic je možné definovat pouze, když to rozměry sloupců a řádků v maticích dovolí, tj. když je pro ně definován skalární součin jako výše: I Součin matic |___ Pro libovolnou matici A — (ay) typu m/na libovolnou matici B — (bjk) typu n/q nad okruhem skalárů K definujeme jejich součin C — A ■ B — (c,-fc) jako matici typu m/q s prvky n cik — a'j b jt' Pro libovolná l 1 proto netvoří obor integrity, zejména tedy nejsou ani (nekomutativním) tělesem. Důkaz. Asociativita násobení -(Ol): Protože skaláry j sou asociativní, distributivní i komutativní, můžeme pro tři matice A — (ay) typu m/n, B — (bjk) typu n/p a C = (ch) typu p/q spočíst A-B (A -B)-C \Y2aij 'bik (e(e^-. B C 'jk I • Ckl v k (e« V : 1. •jk ■ Ckl ij ■ Ojk ■ cu A ■ (B ■ C) — \ 2__aij ■ I 2__Djk ■ Ckl j V k Všimněme si, že jsme při výpočtu vycházeli z toho, že je jedno v jakém pořadí uvedené součty a součiny provádíme, tj. využívali jsme podstatně našich vlastností skalárů. Velmi snadno vidíme, že násobení jednotkovou maticí má skutečně vlastnost jednotkového prvku: (l 0 ••• 0\ 0 1 ••• 0 / a\ k-E = a\„ \0 0 = A 1/ a stejně pro násobení E zleva. Zbývá ukázat distributivitu násobení a sčítání. Opět díky dis-tributivitě skalárů snadno spočteme pro matice A = (ay) typu m/n, B = (bjk) typu n/p,C = (cjk) typu n/p,D = (dki) typu p/q A ■ (B + Q ((e« A- B (bjk + Cjk) ■ij Ojk A-C (j2aijcjk (B + C)-D = (y^(bjk + Cjk)dki\ = ^ k ' = (J^2bjkdkl^ + (y^^Cjkdki k B D ídkl J CD Jak jsme již viděh v 1.26, dvě matice dimenze 2 nemusí komutovat: /l 0\ /O l\ /O 1 ^0 0/ \o oj \o o /O 1\ /l o\ _ /o o [o 0) ' [o 0) ~ [o o Tím jsme získah zároveň protipříklad na platnost (02) i (Ol). Pro matice typu 1/1 ovšem oba axiomy samozřejmě platí, protože je mají samy skaláry. Pro větší matice získáme protipříklady snadno tak, že právě uvedené matice umístíme do levého horního rohu příslušných čtvercových schémat a doplníme nulami. (Ověřte si sami!) □ 69 KAPITOLA 2. POČÍTÁNÍ S VEKTORY (xu x2, x3, X4) 2s ■ 3s — 1, 3í s e Množinu řešení můžeme tudíž zapsat (pro / = 3s) ve tvaru 5-, 2S-2-, 3 3 Nyní se vraťme k rozšířené matici naší soustavy a upravujme ji dále užitím řádkových transformací tak, aby (při schodovitém tvaru) první nenulové číslo každého řádku (tzv. pivot) bylo právě číslo 1 a aby všechna ostatní čísla v jeho sloupci byla 0. Platí / 1 -1 1 1 -2 \ 1 1 -1 1 -1 -1 \ 0 3 -3 1 1 0 1 -1 1/3 1/3 0 0 3 - 3 -3 0 0 1 -1 -1 l 0 0 0 0 0 ) \ 0 0 0 0 0 / / 1 -1 0 0 -1 \ / 1 0 0 2/3 -5/3 \ 0 1 0 -2/3 -2/3 0 1 0 2/3 -2/3 0 0 1 -1 -1 0 0 1 -1 -1 l. o 0 0 0 0 ) \ 0 0 0 0 0 / AA X2 X3 w /-5/3\ ■2/3 -1 0 + t (2/3\ 2/3 1 V 1 ) t e Volné proměnné jsou totiž ty, jejichž sloupce neobsahují žádného pi-vota (v našem případě neobsahuje pivota čtvrtý sloupec, je tedy volná čtvrtá proměnná, tj. používáme ji jako parametr). □ 2.5. Určete řešení systému rovnic 3x\ + 3^3 — 5^4 = 8, x\ ~ x2 + x3 — Xá, = —2, —2x\ — X2 + 4x3 — 2x4 = 0, 2xj + x2 — x3 — x4 = —3. Řešení. Uvědomme si, že soustava rovnic v tomto příkladu se od soustavy z předešlého příkladu liší pouze v hodnotě 8 (místo —8) na pravé straně první rovnice. Provedeme-li totožné řádkové úpravy jako v minulém příkladu, obdržíme 3 0 3 -5 8 \ / 1 -1 1 -1 -2 1 -1 1 -1 -2 2 1 -1 -1 -3 -2 -1 4 -2 0 -2 -1 4 -2 0 v 2 1 -1 -1 -3 ) \ 3 0 3 -5 8 ) / 1 -1 1 -1 -2 \ / 1 -1 1 -1 -2 \ 0 3 -3 1 1 0 3 -3 1 1 0 0 3 -3 -3 0 0 3 -3 -3 l. o 0 3 -3 13 j \ 0 0 0 0 16 j V důkazu jsme vlastně pracovali s maticemi obecnějšího typu dokázali jsme tedy příslušné vlastnosti obecněji: Asociativita a distributivita násobení matic Důsledek. Násobení matic je asociativní a distributivní, tj. A- (B ■ C) = (A- B) ■ C, A-(B + Q= A- B + A-C, kdykoliv jsou všechny uvedené operace definovány. Jednotková matice je neutrálním prvkem pro násobení deva i zprava. přičemž nejdříve jsme vynásobili druhý a třetí řádek číslem 1/3, pak přičetli třetí řádek ke druhému a jeho (—l)násobek k prvnímu a na závěr přičetli druhý řádek k prvnímu. Z poslední matice snadno dostáváme výsledek 2.6. Inverzní matice. Se skaláry umíme počítat tak, že z rovnosti a ■ x — b umíme vyjádřit x — a~l ■ b, kdykoliv inverze k a existuje. Podobně bychom to chtěli umět i s maticemi, máme ale problém, jak poznat, zda taková matice existuje, a jak ji spočítat. Říkáme, že B je matice inverzní k matici A, když A ■ B — B ■ A — E. Píšeme pakB — A-1 a z deflniceje zřejmé, že obě matice musí mít být čtvercové se stejnou dimenzi n. Matici, k níž existuje matice inverzní, říkáme invertibilní matice nebo také regulární čtvercová matice. V následujících odstavcích mimo jiné odvodíme, že B je inverzní k A, jakmile platí jedna z požadovaných identit (tj. druhá je pak důsledkem). Pokud A-1 a B~l existují, pak existuje i inverze k součinu A • B (2.1) (A • By1 = B~l ■ A-1. Je totiž, díky právě dokázané asociativitě násobení, (B~l ■ A"1) • (A • B) = B~l ■ (A-1 ■ A) ■ B — E (A- B)- (B~l ■ A"1) = A ■ (B ■ B~l) ■ A"1 = E. Protože s maticemi umíme počítat podobně jako se skaláry, (■©i jen mají složitější chování, může nám existence in-*ÍKTT^' verzní matice skutečně hodně pomoci s řešením sys-témů lineárních rovnic: Jestliže vyjádříme soustavu j§%_=> - n rovnic pro n neznámých součinem matic A • x í au \am\ /V a jestliže existuje matice inverzní k matici A, pak lze násobit zleva A-1 a dostaneme ■ u — A ■ A ■ x — E ■ x — x, tj. A-1 • u je hledané řešení. Naopak rozepsáním podmínky A • A ~1 — E pro neznámé skaláry v hledané matici A-1 dostaneme n systémů lineárních rovnic se stejnou maticí na levé straně a různými vektory napravo. 70 KAPITOLA 2. POČÍTÁNÍ S VEKTORY kde poslední úpravou bylo odečtení třetího řádku od čtvrtého. Ze čtvrté rovnice 0 = 16 vyplývá, že soustava nemá řešení. Vyzdvihněme, že při úpravě na schodovitý tvar obdržíme rovnici 0 = a pro nějaké a ^ 0 (tj. nulový řádek na levé straně a nenulové číslo za svislou čarou) právě tehdy, když soustava nemá řešení. □ Další příklady na systémy lineárních rovnic naleznete na straně 109 B. Manipulace s maticemi V této podkapitole budeme pracovat pouze s maticemi, abychom si osvojili jejich vlastnosti. 2.6. Násobení matic. Provedte násobení matic a zkontrolujte si výsledek. Všimněte si, že proto, abychom mohli dvě matice násobit, je nutná a postačující podmínka, aby měla první matice stejně sloupců jako druhá řádků. Počet řádků výsledné matice je pak dán počtem řádků první matice, počet sloupců je roven počtu sloupců druhé matice. 7 18), Poznámka. Body i) a ii) v předchozím příkladu ukazují, že násobení čtvercových matic není komutativní, v bodě iii) vidíme, že dané obdélníkové matice můžeme mezi sebou násobit pouze v jednom ze dvou možných pořadí. V bodech iv) a v) si pak všimněme, že (A ■ B)T = BT ■ AT. 2.7. Vypočítejte A5 a A-3, je-li O li 2 -1 1 -1 2 -1 0 0 1 2.7. Ekvivalentní úpravy matic. Zkusme se praktičtěji zorientovat v předchozí úvaze o systémech rovnic a jejich maticích. Samozřejmě nás nalezení inverzní matice stojí jisté úsilí - větší než přímé vyřešení rovnice. Podstatné však je, že pokud máme mnohokrát za sebou řešit systémy se stejnou maticí A ale různými pravými stranami u, pak se nám nalezení A-1 opravdu hodně vyplatí. Z hlediska řešení systémů rovnic A • x — u je jistě přirozené považovat za ekvivalentní matice A a vektory u, které zadávají systémy rovnic se stejným řešením. Zkusme se teďzamyslet nad možnostmi, jak zjednodušovat matici A tak, abychom se k řešení blížili. Začneme jednoduchými manipulacemi s řádky rovnic, které řešení ovlivňovat nebudou, a stejným způsobem pak můžeme upravovat i vektor napravo. Když se nám u čtvercové matice podaří vlevo dostat systém s jednotkovou maticí, bude napravo řešení původního systému. Pokud při našem postupu nějaké řádky úplně vypadnou (při úpravách se vynulují), bude to také dávat další přímé informace o řešení. Naše jednoduché úpravy jsou: ._\ Elementární řádkové transformace [_ -- • záměna dvou řádků, • vynásobení vybraného řádku nenulovým skalárem, • přičtení řádku k jinému řádku. Těmto operacím říkáme elementární řádkové transformace. Je zjevné, že odpovídající operace na úrovni rovnic v systému skutečně nemohou změnit množinu všech jeho řešení, pokud je náš okruh oborem integrity. Analogicky, elementární sloupcové transformace matic jsou • záměna dvou sloupců, • vynásobení vybraného sloupce nenulovým skalárem, • přičtení sloupce k jinému sloupci, ty však nezachovávají řešení příslušných rovnic, protože mezi sebou míchají samotné proměnné. Systematicky můžeme použít elementární řádkové úpravy k postupné eliminaci proměnných. Postup je algo-'(/ ritmický a většinou se mu říká Gaussova eliminace proměnných. Gaussova eliminace proměnných |___ Tvrzení. Nenulovou matici nad libovolným okruhem skalárů K lze konečně mnoha elementárními řádkovými transformacemi převést na tzv. (řádkově) schodovitý tvar: • Je-li au — 0 pro všechna k — 1, ..., j, potom aij — 0 pro všechna k > i. • Je-li a.(i-\)j první nenulový prvek na (i — 1)-ním řádku, pak a: i = 0. Důkaz. Matice v řádkově schodovitém tvaru vypadá takto 0 o V 0 a\„ 0 aip 71 KAPITOLA 2. POČÍTÁNÍ S VEKTORY 4 0 "5\ / 2 7 15 ,B=[ \2 7 i3 y \ 2.8. Nechť je Lze matici A převést na matici B pomocí elementárních řádkových transformací (pak říkáme, že jsou řádkově ekvivalentní)? Řešení. Obě matice jsou zřejmě řádkově ekvivalentní s trojrozměrnou jednotkovou maticí. Snadno se vidí, že řádková ekvivalence na množině všech matic daných rozměrů je relací ekvivalence. Matice A a S jsou tudíž řádkově ekvivalentní. □ 2.9. Nalezněte nějakou matici B, pro kterou je matice C = B ■ A ve schodovitém tvaru, kde /3 5 1 V7 -1 3 2\ -3 2 3 -3 -5 0 -5 1 4/ /O 0 1 0\ 0 10 0 10 0 0 \0 0 0 1/ / 1 0 o 0\ 0 10 0 -3010 y 0 0 0 1/ /l 0 0 0\ E2 Et- obdržíme 0 0 \o /l 0 0 V° 1/3 0 0 0 1 0 0 E6 0 1/ 0 0\ 0 o 1 o 0 1/ /1 0 0 0\ -5 1 0 0 0 0 1 0 \o 0 0 v (1 0 0 0\ 0 1 0 0 0 0 1 0 V1 0 0 v (l 0 0 0\ 0 1 0 0 0 -2 1 0 0 0 v (1 0 0 0\ 0 1/4 0 0 0 0 1 0 1° 0 0 v S = £8 £7 £6 £5 £4 £3 £2 £i /0 0 1 o 1/12 -2/3 -4/3 1 0\ -5/12 0 1/3 0 -1/3 V /l 0 o -5 o \ 9/4 1/4 0 0 o o / a může, ale nemusí, končit několika nulovými řádky. K převodu libovolné matice můžeme použít jednoduchý algoritmus, kterým se postupně, řádek za řádkem, blížíme k výslednému schodovitému tvaru: _I Algoritmus Gaussovy eliminace |_„ (1) Případnou záměnou řádků docílíme, že v prvním řádku bude v prvním nenulovém sloupci nenulový prvek, nechť je to 7-tý sloupec. (2) Pro i —2,... vynásobením prvního řádku prvkem , í-tého řádku prvkem a\j a odečtením vynulujeme prvek na í-tém řádku. (3) Opakovanou aplikací bodů (1) a (2), vždy pro dosud neupravený zbytek řádků a sloupců v získané matici, dospějeme po konečném počtu kroků k požadovanému tvaru. Řešení. Budeme-li matici A postupně násobit zleva elementárními maticemi (uvažte, jakým řádkovým úpravám toto násobení matic odpovídá) Tím je tvrzení dokázáno. □ Uvedený postup je skutečně právě obvyklá eliminace proměnných v systémech lineárních rovnic. Zcela analogickým postupem definujeme sloupcově schodovitý tvar matic a záměnou řádkových na sloupcové transformace obdržíme algoritmus převádějící matici na takový tvar. Poznámka. Gaussovu eliminaci jsme zformulovali pro obecné skaláry z nějakého okruhu. Zdá se být přirozené, že ve schodovitém tvaru ještě vynásobením vhodnými skaláry dosáhneme jednotkových koeficientů na výsledné nenulové „diagonále" nad nulami v matici a dopočítáme řešení. To ale pro obecné skaláry nepůjde, představte si třeba celá čísla Z. Pro řešení systémů rovnic nemá ale vůbec uvedený postup rozumný smysl, když jsou mezi skaláry dělitelé nuly. Promyslete si pečlivě rozdíl mezi K = Z, K = R a případně Z2 nebo Z4. 2.8. Matice elementárních transformací. Nyní už budeme pracovat s polem skalárů K, každý nenulový skalár tedy má inverzní prvek. Všimněme si, že elementární řádkové (resp. sloupcové) transformace odpovídají vynásobením zleva (resp. zprava) následujícími maticemi: (1) Přehození í-tého a 7-tého řádku (resp. sloupce) /l 0 ... \ 1 0 V 1/ (2) Vynásobení í-tého řádku (resp. sloupce) skalárem a: /l \ 1 □ V 72 KAPITOLA 2. POČÍTÁNÍ S VEKTORY 2.10. Komplexní čísla jako matice. Uvažme množinu ma-r/^>tic C = {( "b ba); a, b e K}. Všimněte si, že C je uzavřená na sčítání a násobení matic a dále ukažte, že přiřazení / : C —► C, ^ a^ ^ i-* a + fci splňuje /(M + AO = /(M) + f (N) i /(M • A0 = f (M) ■ f (N) (na levých stranách rovností se jedná o sčítání a násobení matic, na pravých o sčítání a násobení komplexních čísel). Na množinu C spolu s násobením a sčítaním matic lze tedy nahlížet jako na těleso C komplexních čísel. Zobrazení / se pak nazývá izomorfismem (těles). Je tedy například 3 5 -5 3 69 13 -13 69 což odpovídá tomu, že (3 + 5i) • (8 — 9i) = 69 — 13i. 2.11. Vyřešte maticové rovnice '\ 3\ „ (\ 2 3 4 , X2- 1 3 3 8 1 2 3 4 Řešení. Zjevně neznámé X\ a X2 musejí být matice 2x2 (aby uvažované součiny matic existovaly a výsledkem byla matice 2x2). Položme Xl = h bj), x2 = h bA \ci di J \c2 d2J a roznásobme matice v první zadané rovnici. Má platit / ai + 3ci bi + 3rfi \ _ (l 2\ \3ai + 8cj 3bi + Sdi) 3 4 tj. má být 3ai + 3ci + 8ci 3bi 3di Sdí 1, 2, 3, 4, Sečtením (—3)násobku první rovnice se třetí dostáváme ci = 0 a následně ai = 1. Podobně sečtením (—3)násobku druhé rovnice se čtvrtou dostáváme di = 2 a poté bi = —A. Je tedy X-i Hodnoty a2,b2, c2 vztah (a fc\~' 1 ~ ad -bc který platí pro libovolná čísla a, b,c,d e také přímo z 2.2), spočtěme 1 3 i i n 2 ^2 najdeme odlišným způsobem. Využijeme d -b} —c a l (lze snadno odvodit; plyne (3) Sečtení í-tého řádku (resp. sloupce) s j-tým: (10 \ o '■■ 1/ Toto prostinké pozorování je ve skutečnosti velice podstatné, protože součin invertibilních matic je invertibilní (viz rovnost (2.1)) a všechny elementární transformace jsou nad polem skalárů invertibilní (sama definice elementárních transformací zajišťuje, že inverzní transformace je stejného typu a je také snadné určit její matici). Pro libovolnou matici A tedy dostaneme násobením vhodnou invertibilní maticí P — Pk ■ ■ ■ Pi zleva (postupné násobení k maticemi zleva) její ekvivalentní řádkový schodovitý tvar A' — P ■ A. Jestliže obecně aplikujeme tentýž eliminační postup na sloupce, dostaneme z každé matice B její sloupcový schodovitý tvar B1 vynásobením zprava vhodnou invertibilní maticí 2 = 2l • • • Qi- Pokud ale začneme s maticí B — A' v řádkově schodovitém tvaru, eliminuje takový postup pouze všechny dosud nenulové prvky mimo diagonálu matice a závěrem lze ještě i tyto elementárními operacemi změnit na jedničky. Celkem jsme tedy ověřili důležitý výsledek, ke kterému se budeme mnohokrát vracet: 2.9. Věta. Pro každou matici A typu m/n nad polem skalárů K existují čtvercové invertibilní matice P dimenze m a Q dimenze n takové, že matice P ■ A jev řádkově schodovitém tvaru a P-A-Q = /l 0 0 0 0 ...... 1 o ... 0 1 o 0 0 0 0 0 0 o o o 0/ 2.10. Algoritmus pro výpočet inverzní matice. V předchozích úvahách jsme se dostali prakticky k úplnému algoritmu pro výpočet inverzní matice. Během jednoduchého níže uvedeného postupu buď zjistíme, že inverze neexistuje, nebo bude inverze spočtena. 1 nadále pracujeme nad polem skalárů. Ekvivalentní řádkové transformace se čtvercovou maticí A dimenze n vedou k matici P' takové, že matice P' ■ A bude v řádkově schodovitém tvaru. Přitom může (ale nemusí) být jeden nebo více posledních řádků nulových. Jestliže má existovat inverzní matice k A, pak existuje i inverzní matice k P'-A. Jestliže však je poslední řádek v P' ■ A nulový, bude nulový i poslední řádek v P'-A-B pro jakoukoliv matici B dimenze n. Existence takového nulového řádku 73 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Vynásobení zadané rovnice touto maticí zprava dává '\ 2\ /-8 3 .3 4 ' l 3 -1, a tudíž X2 -2 1 -12 5 2.12. Řešte maticovou rovnici Ml 3) = (2 1 □ O 2.13. Výpočet inverzní matice. Spočtěte inverzní matice k maticím B : Poté určete matici (Ar • S) Řešení. Inverzní matici nalezneme tak, že vedie sebe napíšeme matici A a matici jednotkovou. Pomocí řádkových transformací pak převedeme matici A na jednotkovou. Tímto matice jednotková přejde na matici A-1. Postupnými úpravami dostáváme -4 -2 -7 11 -9 přičemž v prvním kroku jsme odečetli od prvního řádku třetí, ve druhém jsme (—5)násobek prvního přičetli ke druhému a současně jeho (—3)násobek ke třetímu, ve třetím kroku jsme odečetli od druhého řádku třetí, ve čtvrtém jsme (—2)násobek druhého přičetli ke třetímu, v pátém kroku jsme (—5)násobek třetího řádku přičetli ke druhému a jeho 2násobek k prvnímu, v posledním kroku jsme pak zaměnili druhý a třetí řádek. Zdůrazněme výsledek (3 -4 3\ A 1 = 1 -2 2 . \-7 11 -9/ Upozorněme, že při určování matice A-1 jsme diky vhodným řádkovým úpravám nemuseli počítat se zlomky. Přestože bychom si mohli obdobně počínat při určování matice B~1, budeme raději provádět více názorné (nabízející se) řádkové úpravy. Platí ve výsledku (řádkové) Gaussovy eliminace tedy vylučuje existenci A-1. Předpokládejme nyní, že A-1 existuje. Podle předchozího nalezneme řádkově schodovitý tvar bez nulového řádku, tzn. že všechny diagonální prvky v P' ■ A jsou nenulové. Pak ovšem pokračováním eliminace pomocí řádkových elementárních transformací od pravého dolního rohu zpět a vynormováním diagonálních prvků na jedničky získáme jednotkovou matici E. Jinými slovy, najdeme další invertibilní matici P" takovou, že pro P — P"P'platí P ■ A — E. Výměnou řádkových a sloupcových transformací lze za předpokladu existence A-1 stejným postupem najít Q takovou, že A • Q = E. Odtud P = P ■ E = P ■ (A • Q) = (P • A) • Q = Q. To ale znamená, že jsme nalezli hledanou inverzní matici A'1 = P = Q k matici A. Zejména se tedy v okamžiku nalezení matice P s vlastností P-A — E už nemusíme s žádnými dalšími výpočty namáhat, protože víme, že již jistě jde o inverzní matici. Prakticky tedy můžeme postupovat takto: [ výpočet inverzní matice |__ Vedle sebe napíšeme původní matici A a jednotkovou matici E, matici A upravujeme řádkovými elementárními úpravami nejprve na schodovitý tvar, potom tzv. zpětnou eliminací na diagonální matici a v té násobíme řádky inverzními prvky z K. Tytéž úpravy postupně prováděné s E vedou právě k hledané matici A-1. Pokud tento algoritmus narazí na vynulování celého řádku v původní matici, znamená to, že matice inverzní neexistuje. 2.11. Lineární závislost a hodnost. V předchozích úvahách a počtech s maticemi jsme stále pracovali se sčítáním řádků nebo sloupců coby vektorů, spolu s jejich násobením skaláry. Takové operaci říkáme lineární kombinace. V abstraktním pojetí se k operacím s vektory vrátíme za chvíli v 2.24, bude ale užitečné pochopit podstatu už nyní. Lineární kombinací řádků (nebo sloupců) matice A = (ay) typu m/n rozumíme výraz či";. kde c i jsou skaláry, (aji, ,) jsou řádky (nebo , amj) jsou sloupce) matice A. Jestliže existuje lineární kombinace daných řádků s alespoň jedním nenulovým skalárním koeficientem, jejímž výsledkem je nulový řádek, říkáme, že jsou tyto řádky lineárně závislé. V opačném případě, tj. když jedinou možností jak získat nulový řádek je vynásobení výhradně nulovými skaláry, jsou tyto řádky lineárně nezávislé. Obdobně definujeme lineárně závislé a nezávislé sloupce matice. Předchozí výsledky o Gaussově eliminaci můžeme teď inter-^ ., pretovat tak, že počet výsledných nenulových „schodů" v řádkově nebo sloupcově schodovitém tvaru je vždy roli ven počtu lineárně nezávislých řádků matice, resp. počtu lineárně nezávislých sloupců matice. Označme Ei, matici z věty 2.9 s h jedničkami na diagonále a předpokládejme, že dvěma různými postupy dostaneme různá h' < h. Pak ovšem podle 74 KAPITOLA 2. POČÍTÁNÍ S VEKTORY 1 0 1 1 0 0 0 3 1 -3 1 0 0 2 1 -2 0 1 1 0 1 1 0 0 1 1 5 -1 1 0 0 1 5 0 2 ~? 1 0 0 1 2 0 1 0 -1 1 0 0 1 0 -2 -3 -1 3 tj- Využitím identity {AT -BY1 = B-1 -(A7)-1 B-1 ■ (A-1)7 a znalosti výše vypočítaných inverzních matic lze obdržet 1 2.14. Vypočítejte inverzní matici k matici /i 0 -2^ A =12 -2 1 \5 -5 2 I 2.15. Nalezněte inverzní matici k matici /8 3 0 0 0\ 5 2 0 0 0 0 0 -1 0 0 0 0 0 1 2 0 0 3 V 2.16. Zjistěte, zda existuje inverzní matice k matici C : /i 1 1 V1 1 1 \ 1 -1 Pokud ano, určete tuto matici C 1 2.17. Stanovte A"1, je-li 1 i -i 3 (a) A: , přičemž i je imaginární jednotka; našeho postupu budou existovat také invertibilní matice P a Q takové, že P-Eh,-Q = Eh. V součinu Ey ■ Q bude více nulových řádků ve spodní části matice, než kolik má být jedniček v E h a přitom sek nim máme dostat už jen řádkovými transformacemi. Zvýšit počet lineárně nezávislých řádků ale pomocí elementárních řádkových transformací nelze. Proto je počet jedniček v matici P ■ A-Q ve větě 2.9 nezávislý na volbě našeho postupu eliminace a je roven jak počtu lineárně nezávislých řádků v A, tak počtu lineárně nezávislých sloupců v A. Tomuto číslu říkáme hodnost matice a značíme je h(A). Zapamatujme si výsledné tvrzení: Věta. Nechť A je matice typu m/n nad polem skalárů K. Matice A má stejný počet h(A) lineárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost vidy nejvýše rovna menšímu z rozměrů matice A. Algoritmus pro výpočet inverzních matic také říká, že čtvercová matice A dimenze m má inverzi, právě když je její hodnost rovna počtu řádků m. 2.12. Matice jako zobrazení. Zcela stejně, jak jsme s maticemi pracovali v geometrii roviny, viz 1.29, můžeme každou čtvercovou matici A interpretovat jako zobrazení A : K" ^ K", xh^A-x. Díky distributivitě násobení matic je zřejmé, jak jsou zobrazovány lineární kombinace vektorů takovými zobrazeními: A • (a x + b y) = a (A • x) + b (A • ý). □ Přímo z definice je také vidět (díky asociativitě násobení matic), že skládání zobrazení odpovídá násobení matic v daném pořadí. Invertibilní matice tedy odpovídají bijektivním zobrazením. Z tohoto pohledu je velice zajímavá věta 2.9. Můžeme ji číst tak, že hodnost matice určuje, jak velký je obraz celého K" v tomto zobrazení. Skutečně, je-li A = P ■ Ei ■ Q s maticí-Ej s&jedničkamijako v 2.9, Q pak invertibilní Q napřed jen bijektivně „zamíchá" n-rozměrné vektory v K", matice Ei pak „zkopíruje" prvních k souřadnic a vynuluje n — k zbývajících. Tento „^-rozměrný" obraz už pak následně násobení invertibilní P nemůže zvětšit. 2.13. Řešení systémů lineárních rovnic. K pojmům dimenze, lineární nezávislost apod. se vrátíme ve třetí části této kapitoly. Již teď si ale můžeme povšimnout, co právě odvozené výsledky říkají o řešení systému lineárních rovnic. Jestliže budeme uvažovat matici systému rovnic a přidáme k ní ještě sloupec požadovaných hodnot, hovoříme o rozšířené matici systému. Postup, který jsme předvedli, odpovídá postupné eliminaci proměnných v rovnicích a vyškrtání lineárně závislých rovnic (ty jsou prostě důsledkem ostatních). Dovodili jsme tedy kompletní informaci o velikosti množiny řešení systému lineárních rovnic v závislosti na hodnosti matice systému. Pokud nám při přechodu na řádkově schodovitý tvar zůstane v rozšířené matici více nenulových řádků než v matici sys-O tému, pak žádné řešení nemůže existovat (prostě se daným lineárním zobrazením do požadované hodnoty vůbec netrefíme). Pokud je hodnost obou matic stejná, pak nám při zpětném dopočtu řešení zůstane právě tolik volných parametrů, kolik je rozdíl mezi počtem proměnných n a hodností h(A). O 75 KAPITOLA 2. POČÍTÁNÍ S VEKTORY O 2.18. Napíšte inverzní matici k n x n matici {n > 1) (2-n 1 1 2-n \ 1 1 1 1 \ 1 2-n 1 1 2-n) O C. Permutace Abychom mohli definovat stěžejní pojem kalkulu matic, totiž determinant, je nutné se věnovat permutacím (bijekcím na konečné množině), zejména pak jejich paritě. Pro zápis permutací (tj. bijektivních zobrazení na dané konečné množině) budeme používat tzv. dvouřádkový zápis (viz 2.14). V prvním řádku uvedeme všechny prvky uvažované množiny, libovolný sloupeček je pak tvořen dvojicí vzor, obraz (v dané permutaci). Protože permutace je bijekce, je druhý řádek vskutku permutací (pořadím) řádku prvního, v souladu s názvoslovím používaným v kombinatorice. 2.19. Rozložte permutaci 1 2 3 4 5 6 3 1 6 7 8 9 7 8 9 5 4 2 na součin transpozic. Řešení. Nejprve rozložíme permutaci na součin nezávislých cyklů: začneme s prvním prvkem (jedničkou) a ve druhém řádku odečteme, na jaký prvek se v dané permutaci zobrazuje. Je to trojka. Nyní se podíváme na sloupeček začínající trojkou a odečteme z něj, že se zobrazuje na šestku, atd. Pokračujeme tak dlouho, dokud se nám nějaký prvek nezobrazí na počáteční prvek (v tomto případě jedničku). Dostáváme následující posloupnost prvků, které se na sebe v dané permutaci zobrazují: lh^3h^6i-^9i-^2i-^l. Zobrazení, které zobrazuje prvky výše uvedeným způsobem, je tzv. cyklus (viz 2.16), který zapisujeme (1, 3, 6, 9, 2). Nyní vezmeme prvek, který není obsažený v získaném cyklu, a opakujeme s ním postup jako s jedničkou. Dostáváme cyklus 2. Determinanty V páté části první kapitoly jsme viděli (viz 1.27), že pro ''j&*í, čtvercové matice dimenze 2 nad reálnými čísly exis-'i '\ tuje skalární funkce det, která matici přiřadí nenu- Sbr=ssESw-? l°vé číslo, právě když existuje její inverze. Neříkali jsme to sice stejnými slovy, ale snadno si to ověříte (viz odstavce počínaje 1.26 a vzorec (1.16)). Determinant byl užitečný i jinak, viz odstavce 1.33 a 1.34, kde jsme si volnou úvahou odvodili, že obsah rovnoběžníku by měl být lineárně závislý na každém ze dvou vektorů definujících rovnoběžník a že je užitečné zároveň požadovat změnu znaménka při změně pořadí těchto vektorů. Protože tyto vlastnosti měl, až na pevný skalární násobek, jedině determinant, odvodili jsme, že je obsah dán právě takto. Nyní uvidíme, že podobně lze postupovat v každé konečné dimenzi. V této části budeme pracovat s libovolnými skaláry K a maticemi nad těmito skaláry. Naše výsledky o determinantech tedy budou vesměs platit pro všechny komutativní okruhy, zejména tedy třeba pro celočíselné matice. 2.14. Definice determinantu. Připomeňme, že bijektivní zobrazení množiny X na sebe se nazývá permutace množiny X, viz 1.7. Je-li X — {1, 2, ..., n), lze permutace zapsat pomocí výsledného pořadí ve formě tabulky: í 1 2 1 a(b). Permutace a se nazývá '.'^v*isg*~X,- sudá (resp. lichá), obsahuje-li sudý (resp. lichý) počet inverzí. Parita permutace a je (— l)^06^ mverzí a značíme ji sgn(cr). Tolik tedy definice znamének našich členů determinantu. Chceme ale vědět, jak s paritou počítat. Z následujícího tvrzení o permutacích už je jasně vidět, že Sarrusovo pravidlo skutečně počítá determinant v dimenzi 3. Věta. Na množině X — {1,2, ..., n) je právě n\ různých permutací. Ty lze seřadit do posloupnosti tak, že každé dvě po sobě jdoucí se liší právě jednou transpozicí. Lze při tom začít libovolnou permutací. Každá transpozice mění paritu. Důkaz. Pro jednoprvkové a dvouprvkové X tvrzení samozřejmě platí. Budeme postupovat indukcí přes dimenzi. Předpokládejme, že tvrzení platí pro všechny množiny s n — 1 prvky a uvažme permutaci 1, je právě \n \ sudých a \n \ lichých permutací. Jestliže složíme dvě permutace za sebou, znamená to provést napřed všechny transpozice tvořící první a pak druhou. Proto pro libovolné permutace a, i] : X -» X platí a proto také sgn(c ot]) = sgn(o-) • sgn(ij), sgn(c ) = sgn(c). 2.16. Rozklad permutace na cykly. Dobrým nástrojem pro praktickou práci s permutacemi je jejich rozklad na tzv. cykly. _( Cykly (__ Permutace a na množině X — {1,...,«} se nazývá cyklus délky jestliže je možné najít prvky a\, ..., ak e X, 2 < k < n, takové, že cr(a;) = a,-+i, i = 1, ... ,k — 1, zatímco a(ak) — a\ a ostatní prvky v X jsou pro a samodružné. Cykly délky dva jsou právě transpozice. Každá permutace je složením cyklů. Cykly sudé délky mají paritu — 1, cykly Uché délky mají paritu 1. O r Poslední tvrzení musíme ještě dokázat. Jestliže definujeme pro danou permutaci a relaci R tak, že dva prvky x, y e X jsou v relaci, právě když ar (x) — y pro nějakou iteraci permutace a, pak zjevně jde o relaci ekvivalence (ověřte si podrobně!). Protože je X konečná množina, musí pro nějaké í být al(x) — x. Jestliže zvolíme jednu třídu ekvivalence {x, o(x), ..., ol~l(x)} c X a ostatní prvky definujeme jako samodružné, dostáváme cyklus. Evidentně je pak celá původní permutace X složením všech těchto cyklů pro jednotlivé třídy naší ekvivalence a je jedno, v jakém pořadí cykly skládáme. Pro určení parity si nyní stačí povšimnout, že cykly sudé délky lze napsat jako Uchý počet transpozic, proto mají paritu —1. Obdobně cyklus liché délky dostaneme ze sudého počtu transpozic, a proto mají paritu 1. 2.17. Jednoduché vlastnosti determinantu. Poznání vlastností ^frk ^ permutací a jejich parit z předchozích odstavců nám je(j> umoznf rychle odvodit základní vlastnosti deter- >VA^» - Pro každou matici A — (ay) typu m/n nad skaláry z K definujeme matici transponovanou k A. Jde o matici AT — (aý) s prvky — cíp, která je typu n/m. Čtvercová matice A s vlastností A — AT se nazývá symetrická. JestUže platí A — —AT, pak se A nazývá antisymetrická. Jednoduché vlastnosti determinantů _. Věta. Pro každou čtvercovou matici A — (ay) platí následující tvrzení: (1) \AT\ = \A\. (2) Je-li jeden řádek v A tvořen nulovými prvky zK, pak\A\ = 0. (3) Jestliže matice B vznikla z A výměnou dvou řádků, pak \A\ = - 78 KAPITOLA 2. POČÍTÁNÍ S VEKTORY znaménko determinantu. Použitím elementárních úprav postupně dostáváme: /l 3 5 6\ /l 1 1 2\ (l 1 1 2\ 1 2 2 2 1 2 2 2 0 1 1 0 1 1 1 2 1 3 5 6 0 2 4 4 v° 1 2 V 1° 1 2 V v° 1 2 V /l 1 1 2\ /l 1 1 2\ ŕl 1 1 2\ 0 1 1 0 0 1 1 0 0 1 1 0 0 0 2 4 0 0 1 1 0 0 1 1 v° 0 1 V 1° 0 2 V v° 0 0 v Determinantem horní (i dolní) trojúhelníkové matice je ovšem pouze součin čísel na hlavní diagonále. V průběhu úprav jsme dvakrát prohodili dva řádky, výsledek tedy dvakrát změní znaménko, tedy vlastně nezmění. Determinant je tedy roven číslu 2. Jiný způsob výpočtu je založen na rozvíjení podle řádků (sloupců) matice, viz 2.21 Řešení. Začneme rozvíjet podle prvního sloupce, kde máme nejvíce (jednu) nul. Postupně dostáváme 1 1 0 1 2 2 2 3 5 6 3 5 6 1 • 1 1 2 - 1 • 1 1 2 + 1- 2 2 2 1 2 1 1 2 1 1 2 1 Podle Sarrusova pravidla ■2 + 1 □ 2.23. Nalezněte všechny hodnoty argumentu a takové, že a 1 1 0 a 1 0 1 a 0 0 0 Pro komplexní a uvedte buďjeho algebraický nebo goniometrický tvar. Řešení. Spočítáme determinant rozvinutím podle prvního sloupce matice: D : a 1 1 0 a 1 0 1 a 0 0 0 a 1 1 a ■ 1 a 1 0 0 —a dále rozvíjíme podle posledního řádku: D = a ■ (—a) , la -a2(a2 ■ 1). (4) Jestliže matice B vznikla z A vynásobením řádku skalárem a eK, pak \B\ — a \ A\. (5) Jsou-li prvky k-tého řádku v A tvaru ay = cy +bkj a všechny ostatní řádky v maticích A, B — (bij), C = (c,-j) jsou stejné, pak\A\ = |B| + |C|. (6) Determinant \A \ se nezmění, přičteme-li k libovolnému řádku A lineární kombinaci ostatních řádků. důkaz. Členy determinantů \A\ a \A | jsou v bijektivní korespondenci. Členu sgn(cr)ai(r(i) • a2a(2) ■■■ana(n) přitom v AT odpovídá člen (na pořadí skalárů v součinu totiž nezáleží) sgn(cr)a(r(i)i aa(2)2 ■ ■ ■ a i. Řešení. Odečtením prvního řádku od všech ostatních řádků a následným rozvojem podle prvního sloupce obdržíme Vn{xi,x2, ...,xn)- 1 X\ X2 0 X2 — X\ x\ — x\ 0 xn x\ x2^ x2 x\- X-l — X\ ^-1 _ j/l-'í Xn X\ X^ Xy Vytkneme-li z í-tého řádku xi+\ — x\ pro ŕ e {1, 2,..., n — 1}, dostaneme Vn{xi,x2, ...,xn) = = (X2 - Xl) ■ ■ ■ (Xn -Xl) 1 X2 + X\ n-j-2 j A^j=0 x2 -1! ři—2 n—j—2 j 1 i -r-^n—2 n — j—2 j 1 X2 + Xl ... 2^j=0X2 A 1 Xn + X\ ... ^j_q xn xj 1 X2 1 X„ xT Všimněme si také hezkého důsledku prvního tvrzení před-íiV chozí věty o rovnosti determinantů matice a matice "áTTJ*' transponované. Zaručuje totiž, že kdykoliv se nám 'w^ž*./ podaří dokázat nějaké tvrzení o determinantech for-^í*«=ř- mulované s využitím řádků příslušné matice, pak analogické tvrzení platí i pro sloupce. Např. tedy můžeme okamžitě všechna tvrzení (2)-(6) této věty přeformulovat i pro přičítání lineárních kombinací ostatních sloupců k vybranému. To můžeme hned použít pro odvození následujícího vzorce pro přímý výpočet řešení systémů lineárních rovnic: [ Cramerovo pravidlo I__ Uvažme systém n lineárních rovnic pro n proměnných s maticí sytému A — (ay) a sloupcem hodnot b = {b\, ..., bn), tj. v maticovém zápisu řešíme rovnici A ■ x — b. Jestliže existuje inverze A-1, pak jsou jednotlivé komponenty jediného řešení x — {x\, ..., xn) dány vztahem \Ai\_ \A\ ' kde matice A, vznikne z matice systému A výměnou í-tého sloupce za sloupec hodnot b. 1 _l \^n—z ) J- Xn -\- X\ ... j=0 x> Odečtením od každého sloupce (počínaje posledním a konče druhým) xj-násobku předcházejícího lze docílit úpravy -2 Skutečně, jak jsme viděli, inverze k matici systému existuje právě tehdy, když má systém jediné řešení. Jestliže tedy takové řešení x máme, můžeme za sloupec b dosadit do matice A, příslušnou kombinaci sloupců matice A, tj. hodnoty bi — anx\ + ... + ainxn. Pak ale odečtením xj-násobků všech ostatních sloupců zůstane v í-tém sloupci pouze -násobek původního sloupce z A. Číslo tedy můžeme vytknout před determinant a získáme rovnost | A; 11A | ~1 — x,-1A11A | ~1 — x;, což je požadované tvrzení. Dále si všimněme, že vlastnosti (3)-(5) z předchozí věty říkají, že determinant, jakožto zobrazení, které n vektorům dimenze n (řádkům nebo sloupcům matice) přiřadí skalár, je antisymetrické zobrazení lineární v každém svém argumentu, přesně jako jsme podle analogie z dimenze 2 požadovali. 2.19. Další vlastnosti determinantu. Časem uvidíme, že skutečně stejně jako v dimenzi dva je determinant matice roven orientovanému objemu rovnoběžnostěnu určeného jejími sloupci. Uvidíme také, že když uvážíme zobrazení x \-> A ■ x zadané čtvercovou maticí A na M", pak můžeme determinant této matice vidět jako vyjádření poměru mezi objemem rovnoběžnostěnů daných vektory x\, ..., xn a jejich obrazy A • x\, ..., A ■ xn. Protože skládání zobrazení x \-> A ■ x \-> B ■ (A • x) odpovídá násobení matic, je snad docela pochopitelná tzv. Cauchyova věta: ^^____^__^^_| Cauchyova věta__ Věta. Nechť A — (aij), B — (bij) jsou čtvercové matice dimenze n nad okruhem skalárů K. Pak \ A ■ B\ — \ A\ ■ \B\. Všimněme si, že z Cauchyovy věty a z reprezentace elementárních řádkových transformací pomocí násobení vhodnými maticemi (viz 2.8) okamžitě vyplývají tvrzení (2), (3) a (6) z Věty 2.17. 80 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Proto Vn(x\, X2, X„) = (x2 - X\) ■ ■ ■ (x„ - X\) Vn-\(x2, ... ,x„). Neboť je zrejme V2(xn_i,xn) = x„- xn_i, platí (uvažme matematickou indukci) Vn(x\, X2, Xn) = Y[ (Xj-Xi). li*íti_i - 2n (používáme tzv. blokovou symboliku, tj. píšeme matici jakoby složenou ze (sub)matic A, B atd.) (a\\ A 0 -E B -1 V o 0 0 0 -1 0 \ 0 bln b„„ j Laplaceovým rozvojem podle prvních n řádků obdržíme právě \n\ = \A\-\B\. Nyní budeme k posledním n sloupcům postupně přičítat line-k jejímu řešení inverzní matice využít. Taková soustava pak má jiný ární kombinace prvních n sloupců tak, abychom obdrželi matici O Co když však matice soustavy není invertibilní? Potom nemůžeme 82 KAPITOLA 2. POČÍTÁNÍ S VEKTORY počet než jedno řešení. Jak možná čtenář již ví, tak systém lineárních rovnic nad nekonečným tělesem buďnemá řešení, nebo má jedno řešení, nebo jich má nekonečně mnoho (například nemůže mít právě dvě řešení). Prostor řešení je buď vektorový prostor (v případě, že pravá strana všech rovnic v systému je nulová, hovoříme o homogenním systému lineárních rovnic) nebo afinní prostor, viz 4.1, (v případě, že pravá strana alespoň jedné z rovnic je nenulová, hovoříme o nehomogenním systému lineárních rovnic). Ukažme si tedy různé možné typy řešení soustavy lineárních rovnic na příkladech. 2.28. Pro jaké hodnoty parametrů a, b e 1 x\ — ax-i — 2xi x\ + (1 — a)x2 + + ■ a)x2 + ax3 : má lineární systém = b, = b -3, = 2b - 1 xi + (1 (a) právě 1 řešení; (b) žádné řešení; (c) alespoň 2 řešení? Řešení. Soustavu „tradičně" přepíšeme do rozšířené matice a upravíme (! Dodejme, že v prvním kroku jsme první řádek odečetli od druhého a od třetího a ve druhém kroku pak druhý od třetího. Vidíme, že soustava bude mít právě jedno řešení (které lze určit zpětnou eliminací) tehdy a jenom tehdy, když a ^ 0. Pro a = 0 totiž ve třetím sloupci není první nenulové číslo nějakého řádku. Je-li a = Oab = — 2, dostáváme nulový řádek, kdy volba x3 e K jako parametru dává nekonečně mnoho různých řešení. Pro a = Oab ^ —2 poslední rovnice a = b+2 nemůže být splněna - soustava nemá řešení. Poznamenejme, že pro a = 0, b = —2 jsou řešeními (xu x2, x3) = (-2 + 2t, -3 -2í,í) , / e K, a pro a ^ 0 je jediným řešením trojice -3a2 -ab-4a + 2b + 4 2b + 3a+ 4 b + 2 □ 2.29. Nechť j e dáno A 4 5 1\ 3 4 ° , X = \X2\ , b=\b2 1 1 1/ w \b3 Najděte taková reálná čísla b\,b2, b3, aby systém lineárních rovnic A ■ x = b měl: s nulami v pravém dolním rohu. Dostaneme (a\\ ... a\n c\\ ... c\n \ K ■ -1 0 Ľni 0 o o 7 V o -ío Prvky submatice nahoře vpravo přitom musí splňovat Cij =anb\j +ai2b2j H-----Yainbnj, neboli jde právě o prvky součinu A ■ B a \K\ = \H\. Přitom rozvojem podle posledních n sloupců dostáváme \K\ = (-l)"+1+"'+2"|A • B\ = (_l)2»-(»+l) . |A • B\ = \A • B\. Tím je Cauchyova věta bezezbytku dokázána. 2.23. Determinant a inverzní matice. Předpokládejme nejprve, že existuje matice inverzní k matici A, tj. A ■ A-1 — E. Protože pro jednotkovou matici platí vždy \E\ — 1, je pro každou invertibilní matici vždy \A\ invertibilní skalár a díky Cauchyově větě platí |A-J| = \A\-\ My však nyní kombinací Laplaceovy věty a Cauchyho věty umíme říci víc. .___| Vzorec pro inverzní matici J___ Pro libovolnou čtvercovou matici A = (ay) dimenze n definujeme matici A* = (afj), kde a *. — A jí jsou algebraické doplňky k prvkům a jí v A. Matici A* nazýváme algebraicky adjungovaná matice k matici A. Věta. Pro každou čtvercovou matici A nad okruhem skalárů K platí (2.2) AA* A*A = |A| • E. Zejména tedy (1) A-1 existuje jako matice nad okruhem skalárů K, právě když |A|_1 existuje v K. (2) Pokud existuje A-1, pak platí A-1 — |A|_1 • A*. 1 Důkaz. Jak jsme již zmínili, Cauchyova věta ukazuje, že z existence A-1 vyplývá invertibilita | A| el. Pro libovolnou čtvercovou matici A spočteme přímým výpočtem A • A* = (ty), kde n n Cij — ^2,aitatj = y^QitAjt- k=\ k=\ Pokud i — j, je to právě Laplaceův rozvoj | A | podle í-tého řádku. Pokud i j, jde o rozvoj determinantu matice, v níž je i-tý a j-tý řádek stejný, a proto je = 0. Odtud plyne A ■ A* — \A\ ■ E a dokázali jsme rovnost (2.2). Předpokládejme navíc, že |A| je invertibilní skalár. Jestliže zopakujeme předešlý výpočetpro A* A, obdržíme |A|_1 A* -A — E. Proto náš výpočet skutečně dává inverzní matici A, jak je tvrzeno ve větě. □ 83 KAPITOLA 2. POČÍTÁNÍ S VEKTORY (a) nekonečně mnoho řešení; (b) právě jedno řešení; (c) žádné řešení; (d) právě 4 řešení. Řešení. Pro čtenáře jistě nebude problém najít odpovídající hodnoty v případech a) a c) (stačí volit b\ = b2 + b3 v případě a) a naopak b\ ^ í>2 + í>3 v případě c)). Povšimněme si dále, že |A| = 0, soustava tak má buď nekonečně mnoho, nebo žádné řešení. Obecně tvoří množina řešení homogenní soustavy lineárních rovnic vektorový prostor, varianta d) je proto apriori vyloučena. Varianta b) je možná pouze pro regulární matici soustavy (jediným řešením je pak nulový vektor). □ 2.30. Nalezněte matici algebraicky adjungovanou a matici inverzní k matici (1 0 2 0\ 0 3 0 4 5 0 6 0 7 0 V Řešení. Adjungovaná matice je (An An A2\ An A31 A32 VA41 A13 A23 A33 AuY A24 A34 A42 A43 A44 / kde Aij je algebraický doplněk prvku matice A, tedy součin čísla (— a determinantu trojrozměrné matice vzniklé z A vynecháním i-tého řádku a 7-tého sloupce. Platí 3 0 4 0 0 4 Au = 0 6 0 = -24, An = 5 6 0 = 0, 7 0 8 0 0 8 1 0 0 1 0 2 a43 = 0 3 4 = 0, a44 = 0 3 0 = -12. 5 0 0 5 0 6 Dosazením získáme /-24 0 20 0 \ T Í-2A 0 8 0 \ á* — 0 -32 0 28 0 -32 0 16 A — 8 0 -4 0 20 0 -4 0 \ 0 16 0 -12) l 0 28 0 -12) Inverzní matici A 1 určíme ze vztahu A 1 = |A|- i.A» Determi nant matice A je (rozvojem podle prvního řádku) roven |A| 10 2 0 0 3 0 4 5 0 6 0 0 7 0 8 3 0 4 0 3 4 0 6 0 + 2 5 0 0 7 0 8 0 7 8 16. Jako přímý důsledek této věty můžeme znovu ověřit Cra-merovo pravidlo pro řešení systémů lineárních rovnic, viz 2.18. Skutečně, pro řešení systému A-x — b stačí důsledně přečíst v rovnosti x — A" 1 = \A\-lA* poslední výraz jako Laplaceův rozvoj determinantu matice A, vzniklé výměnou í-tého sloupce v A za sloupec hodnot b. 3. Vektorové prostory a lineární zobrazení 2.24. Abstraktní vektorové prostory. Vraťme se teď na chvilku k systémům m lineárních rovnic pro n proměnných z 2.3 a předpokládejme navíc, že jde o homogenní systém rovnic A-x — 0, tj. Vml (xi\ Díky vlastnosti distributivity pro násobení matic je zřejmé, že součet dvou řešení x — (x\, ... ,xn) ay — (y\, ... ,y„) splňuje A-(x + y) = A- x + A-y = 0, a je tedy také řešením. Stejně tak zůstává řešením i skalární násobek a ■ x. Množina všech řešení pevně zvoleného systému rovnic je proto uzavřená na sčítání vektorů a násobení vektorů skaláry. To byly základní vlastnosti vektorů dimenze n v K", viz 2.1. Teď ale máme vektory v prostoru řešení s n souřadnicemi a „rozměr" tohoto prostoru je dán rozdílem počtu proměnných a hodností matice A. Můžeme tedy snadno mít při řešení 1000 souřadnic jen jeden nebo dva volné parametry. Celý prostor řešení se pak bude chovat jako rovina nebo přímka, jak jsme je poznali již v odstavci 1.25 na straně 28. Už v odstavci 1.9 jsme ale potkali ještě zajímavější příklad prostoru všech řešení homogenní lineární diferenční rovnice (prvního řádu). Všechna řešení jsme dostali z jednoho pomocí násobení skaláry a jsou tedy také uzavřená na součty a skalární násobky. Tyto „vektory" řešení jsou ovšem nekonečné posloupnosti čísel, přestože intuitivně očekáváme, že „rozměr" celého prostoru řešení by měl být jedna. Potřebujeme proto obecnější definici vektorového prostoru a jeho dimenze: I Definice vektorového prostoru__ rozumíme Vektorovým prostorem V nad polem skalárů množinu, na které jsou definovány • operace sčítání splňující axiomy (KG1)-(KG4) z odstavce 1.1 na straně 6, • násobení skaláry, pro které platí axiomy (V1)-(V4) z odstavce 2.1 na straně 65. Připomeňme také naši jednoduchou konvenci ohledně značení: skaláry budou zpravidla označovány znaky z počátku abecedy, tj. a, b, c, ..., zatímco pro vektory budeme užívat znaky z konce abecedy, tj. u, v, w, x, y, z. Přitom ještě navíc většinou x, y, z budou opravdu n-tice skalárů. Pro úplnost výčtu, písmena z prostředka, např. i, j, k, í, budou nejčastěji označovat indexy výrazů. 84 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Dostáváme tedy /-3/2 0 1/2 0 \ 0 -2 0 1 5/4 0 -1/4 0 V 0 7/4 0 -3/4/ □ F. Vektorové prostory Vlastnosti vektorového prostoru, kterých jsme si všimli u roviny či třírozměrného prostoru, ve kterém žijeme, má celá řada jiných množin. Ukažme si to na příkladech. 2.31. Vektorový prostor ano či ne? Rozhodněte o následujících množinách, jestli jsou vektorovými prostory nad tělesem reálných čísel: i) Množina řešení soustavy X\ + x2 + X\ + x2 + X\ + X2 + + + + *98 x98 + + Xgg X99 X\ + X2 ii) Množina řešení rovnice lOOxj, 99xu 2xi. x\ + x2 H-----h xioo = 0. iii) Množina řešení rovnice X\ + 2X2 + 3x3 + • • • + lOOxioo = 1. iv) Množina všech reálných, resp. komplexních, posloupností. (Reálnou, resp. komplexní posloupností rozumíme zobrazení / : N K, resp. / : N C. O obrazu čísla n pak hovoříme jako o n-tém členu posloupnosti, většinou jej označujeme dolním indexem, např. an.) v) Množina řešení homogenní diferenční rovnice. vi) Množina řešení nehomogenní diferenční rovnice, vil) {/ : K K | /(l) = f (2) =c,c€ K}. Řešení. i) Ano. Jsou to všechny reálné násobky vektoru (1, 1, 1,..., 1), 100 jedniček tedy vektorový prostor dimenze 1 (viz dále (2.29)). ii) Ano. Jedná se o prostor dimenze 99 (odpovídá počtu volných parametrů řešení). Obecně tvoří množina řešení libovolné homogenní soustavy lineárních rovnic vektorový prostor. iii) Ne. Např. dvojnásobek řešení x\ = 1, x; = 0, i = 2,..., 100 není řešením dané rovnice. Množina řešení však tvoří tzv. afinní prostor (viz 4.1). Abychom se trochu pocvičili ve formálním postupu, ověříme ■ jednoduché vlastnosti vektorů, které pro n-tice skalárů byly samozřejmé, nicméně teď je musíme odvodit z axiomů. 2.25. Tvrzení. Nechť V je vektorový prostor nad polem skalárů K, dále uvažme a,b,ai e K a vektory u,v,uj e V. Potom (1) a ■ u —0, právě když a — 0 nebo u — 0, (2) (— 1) • u — —u, (3) a ■ (u — v) = a ■ u — a ■ v, (4) (a — b) ■ u — a ■ u — b ■ u, (5) (Eľ=i «0 • (Em "í) = Eľ=i E7=i «<• • "i- Důkaz. Můžeme rozepsat í i m (v2) i n (a +0) • u — a ■ u +U-m — a ■ u, což podle axiomu (KG4) zaručuje 0 • u = 0. Nyní u + (-1) • u ( = ' (1 + (-1)) -11=0-11 =0 a odtud —u = (—1) • u. Dále (V2, V3) a ■ (u + (—1) - v) = a ■ u + (—a) • v = a ■ u — a ■ v, což dokazuje (3). Platí (V2, V3) (a — b) ■ u = a ■ u + (—b) ■ u = a ■ u — b ■ u a tím je ověřeno (4). Vztah (5) plyne indukcí z (V2) a (VI). Zbývá (1): a ■ 0 = a ■ (u — u) = a ■ u — a ■ u = 0, což spolu s prvním tvrzením tohoto důkazu ukazuje jednu implikaci. K opačné implikaci poprvé potřebujeme axiom pole pro skaláry a axiom (V4) pro vektorové prostory: je-li p-u = 0apj^0, pak u = 1 • u = (p-1 ■ p) ■ u = p-1 ■ 0 = 0. □ 2.26. Lineárni (ne(závislost. V odstavci 2.11 jsme pracovali s tzv. lmeárními kombinacemi řádků matice. S obecnými vektory budeme zacházet zcela analogicky: ._| Lineární kombinace a nezávislost (_—-- Výrazy tvaru ai-vi+- ■ ■+aií-viínazývámelineárníkombinace vektorů v\,... ,vk e V. Konečnou posloupnost vektorů v\, ..., vi nazveme lineárně nezávislou, jestliže jediná jejich nulová lineární kombinace je ta s nulovými koeficienty, tj. jestliže pro skaláry a\, ..., ai e K platí a\-v\-\-----h ak ■ vt = 0 a\ = a2 = • • • = ai = 0. Je zjevné, že v nezávislé posloupnosti vektorů jsou všechny po dvou různé a nenulové. Množina vektorů M c V ve vektorovém prostoru V nad K se nazývá lineárně nezávislá, jestliže každá konečná &-tice vektorů ni, ..., vi e M je lineárně nezávislá. Množina M vektorů je lineárně závislá, jestliže není lineárně nezávislá. Přímo z definice vyplývá, že neprázdná podmnožina M vektorů ve vektorovém prostoru nad polem skalárů K je závislá, právě když je jeden z jejích vektorů vy-ifřti'iv% jádřitelný jako konečná lineární kombinace ostatních vektorů v M. Skutečně, alespoň jeden koeficient v příslušné nulové lineární kombinaci musí být nenulový, a protože jsme nad polem skalárů, můžeme jím podělit a vyjádřit tak u něj stojící vektor pomocí ostatních. 85 KAPITOLA 2. POČÍTÁNÍ S VEKTORY iv) Ano. Množina všech reálnych, resp. komplexních, posloupností tvoří zřejmě reálný, resp. komplexní, vektorový prostor. Sčítání posloupností a násobení posloupnosti skalárem je totiž definováno člen po členu, kde se jedná o vektorový prostor reálných, resp. komplexních, čísel. v) Ano. Abychom ukázali, že množina posloupností vyhovujících dané diferenční homogenní rovnici (více si o nich povíme v 3.9) tvoří vektorový prostor, stačí ukázat, že je uzavřená vzhledem ke sčítání i násobení reálným číslem (neboť se jedná o podmnožinu vektorového prostoru). Mějme posloupnosti (xj)^L0 a (yj)^L0 vyhovující stejné homogenní diferenční rovnici, tedy anx„+k + an-\xn+k-\ + ■ ■ ■ + aoxk = 0, anyn+k + Hn-iyn+k-l + • • • + a^k = 0. Sečtením těchto rovnic dostaneme 1n(xn+k + yn+k) + <^n-\{xn+k-\ + Ä+i-l) + ' ' ' ----h a0(xk + yk) = 0, tedy i posloupnost (xj + yj)^L0 vyhovuje stejné diferenční rovnici. Rovněž pokud posloupnost (xj)^L0 vyhovuje dané rovnici, tak i posloupnost (uxj)^L0 , kde aei vi) Ne. Součet dvou řešení nehomogenní rovnice anx„+k + an-\xn+k-\ + ■ ■ ■ + aoxk = c, anyn+k + an-iyn+k-i H-----h aoyk = c, c e K - {0} vyhovuje rovnici 0-n(xn+k + yn+k) + <^n-\{xn+k-\ + Ä+i-l) + ' ' ' ----h a0(xk + yú = 2c, zejména pak nevyhovuje původní nehomogenní rovnici. Množina řešení však tvoří afinní prostor, viz 4.1. vii) Je to vektorový prostor, právě když c = 0. Vezmeme-li dvě funkce/agzdanémnožiny,pak(/+g)(l) = (f+g)(2) = = /(l) + g(í) = 2c. Má-li funkce f + g být prvkem dané množiny, musí být (/ + g)(í) = c, tedy 2c = c, tedy c = 0. □ 2.32. Zjistěte, zdaje množina f/i = {(x1,x2,x3)eK3; |*i| = |*2| = l*3l} podprostorem vektorového prostoru K3 a množina f/2 = {ax2 + c; a, c e K} podprostorem prostoru polynomů stupně nejvýše 2. Každá podmnožina lineárně nezávislé množiny M je samozřejmě také lineárně nezávislá (požadujeme stejné podmínky na méně vektorů). Stejně snadno vidíme, že M c V je lineárně nezávislá právě tehdy, když každá konečná podmnožina v M je lineárně nezávislá. 2.27. Generátory a podprostory. Podmnožina M c V se na-jřj zývá vektorovým podprostorem, jestliže spolu se zúženými operacemi sčítání a násobení skaláry je sama ISt? vektorovým prostorem, tzn. požadujeme Va, b e K , Vd, w e M, a ■ v + b ■ w e M. Rozeberme si hned několik příkladů: Prostor m-tic skalárů W" se sčítáním a násobením po složkách je vektorový prostor nad M, ale také vektorový prostor nad Q. Např. pro m — 2 jsou vektory (1, 0), (0, 1) e R2 lineárně nezávislé, protože z a ■ (1,0) + b ■ (0, 1) = (0,0) plyne a — b — 0. Dále vektory (1,0), (y/2, 0) e R2 jsou lineárně závislé nad R, protože \Í2 -(1,0) — (\Í2, 0), ovšem nad Q jsou lineárně nezávislé! Nad R tedy tyto dva vektory „generují" jednorozměrný podprostor, zatímco nad Q je „větší". Polynomy stupně nejvýše m tvoří vektorový prostor Rm[x]. Polynomy můžeme chápat jako zobrazení / : R —> R a sčítání a násobení skaláry definujeme takto: (/ + g)(x) = f (x) + g(x), (a •/)(*) = a ■ f(x). Polynomy všech stupňů také tvoří vektorový prostor RooM a Rm[x] c R„[jc] je vektorový podprostor pro všechna m < n < oo. Podprostory jsou také např. všechny sudé polynomy nebo liché polynomy, tj. polynomy splňující /(-at) = ± /(*). Úplně analogicky jako u polynomů můžeme definovat strukturu vektorového prostoru na množině všech zobrazení R —> R nebo všech zobrazení M —> V libovolné pevně zvolené množiny M do vektorového prostoru V. Protože podmínka v definici podprostoru obsahuje pouze , í> » univerzální kvantifikátory, je jistě průnik podpro- tstorů opět podprostor. Snadno to ověříme i přímo: Nechť Wi, i e /, jsou vektorové podprostory ve V, , a, b e K, m, ľ e n,€/ W;. Pak pro všechna i e /, a ■ u + b ■ v e Wi, to ale znamená, že a ■ u + b ■ v e n,-€/ Wi. Zejména je tedy podprostorem průnik (M) všech podprostoru W c V, které obsahují předem danou množinu vektorů M c. V. Říkáme, že množina M generuje podprostor (M), nebo že prvky M jsou generátory podprostoru (M). Zformulujme opět několik jednoduchých tvrzení o generování podprostoru: Tvrzení. Pro každou neprázdnou podmnožinu M c V platí (1) (M) — {a\ ■ u\ + ... + at ■ Uk\k e N, a; e K, u j e M, j — 1, ... , k}; (2) M — (M), právě když M je vektorový podprostor; (3) jestliže N c M, pak (N) c (M) je vektorový podprostor. Podprostor (0) generovaný prázdnou podmnožinou je triviálnípod-prostor {0} c V. Důkaz. (1) Množina všech lineárních kombinací a\u\ -akUk na pravé straně (1) je jistě vektorový podprostor a samozřejmě obsahuje M. Naopak, každá z jednotlivých lineárních kombinací nutně musí být v (M) a první tvrzení je dokázáno. 86 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Řešení. Množina U\ není vektorovým (pod)prostorem. Vidíme např., že je (l,l,l) + (-l,l,D = (0, 2, 2) i f/i. Množina U2 ovšem podprostor tvoří (nabízí se přirozené ztotožnění s K2), protože (aix2 + ci) + (a2x2 + c2) = (fli + a2)x2 + (c\ + c2), k ■ (ax2 + c) = (ka)x2 + kc pro všechna čísla a\, c\, a2, c2, a, c, k e K. □ G. Lineární závislost a nezávislost, báze 2.33. Výpočtem determinantu vhodné matice rozhodněte o lineární nezávislosti vektorů (1,2,3,1), (1,0,-1,1), (2,1,-1,3) a (0,0, 3, 2). Řešení. Protože je determinant 12 3 1 10-11 2 1-13 0 0 3 2 10 ŕ 0 nenulový, jsou uvedené vektory lineárně nezávislé. □ 2.34. Nechť j sou dány libovolné lineárně nezávislé vektory u,v,w,z ve vektorovém prostoru V. Rozhodněte, zda jsou ve V lineárně závislé či nezávislé vektory u — 2v, 3u + w — z, u — 4v +w + 2z, 4v + 8uj + 4z. Řešení. Uvažované vektory jsou lineárně nezávislé právě tehdy, když jsou lineárně nezávislé vektory (1,-2,0,0), (3,0,1,-1), (1, -4, 1, 2), (0,4, 8, 4) v K4. Je však 1-200 3 0 1-1 1-412 0 4 8 4 -36 ŕ 0, tudíž jsou uvažované vektory lineárně nezávislé. □ 2.35. Určete všechny konstanty a e K takové, aby polynomy ax2 + x + 2, —2x2 + ax + 3 a x2 + 2x + a byly lineárně závislé (ve vektorovém prostoru p3w polynomů jedné proměnné stupně nejvýše 3 nad reálnými čísly). Řešení. V bázi 1, x, x2 jsou souřadnice zadaných vektorů (polynomů) následující: (a, 1, 2), (—2, a, 3), (1, 2, a). Polynomy budou lineárně závislé, právě když bude mít matice, jejíž řádky jsou tvořeny souřadnicemi zadaných vektorů, menší hodnost, než je počet vektorů. V tomto případě tedy hodnost dvě a menší. V případě čtvercové matice nižší Tvrzení (2) vyplývá okamžitě z (1) a z definice vektorového podprostoru a obdobně jez prvního tvrzení zřejmé i tvrzení třetí. Konečně, nejmenší vektorový podprostor je {0), protože prázdnou množinu obsahují všechny podprostory a každý z nich obsahuje vektor 0. □ 2.28. Součty podprostoru. Když už máme představu o generátorech a jimi vytvářených podprostorech, měli bychom rozumět i možnostem, jak několik podprostoru může vytvářet celý vektorový prostor V. I Součty podprostoru ]___.- Nechť Vj, i e /, jsou podprostory ve V. Pak podprostor generovaný jejich sjednocením, tj. (U,€/ Ví), nazýváme součtem podprostoru Ví. Značíme zZíei Vi- Zejména pro konečný počet podprostoru V\, ..., Vk c V píšeme Vi + ■ ■ ■ + Vk = (ViU V2U ■ ■ ■ U Vk). Vidíme, že každý prvek v uvažovaném součtu podprostoru můžeme vyjádřit jako lineární kombinaci vektorů z podprostoru V,. Protože však je sčítání vektorů komutativní, lze k sobě poskládat členy patřící do stejného podprostoru a pro konečný součet k podprostoru tak dostáváme V\ + V2 + ■ ■ ■ + Vk — {v\ + ■ ■ ■ + Vk\ ví e Ví,i — 1,... ,k}. Součet W = V\ + ■ ■ ■ + Vk c V se nazývá přímý součet podprostoru, jsou-li průniky všech dvojic triviální, tj. V; n V) = {0) pro všechna i 7^ j. Ukážeme, že v takovém případě lze každý vektor w e W napsat právě jedním způsobem jako součet w — V\ + ■ Vk, kde vi e Ví. Skutečně, pokud by tento vektor šlo zároveň vyjádřit jako w = v[ + • • • + v'k, potom 0 : ■-{v\-v[)-\-----h (vk - v'k). Pokud bude v, — v'i první nenulový člen na pravé straně, pak tento vektor z V, umíme vyjádřit pomocí vektorů z ostatních podprostoru. To je ale ve sporu s předpokladem, že V, má se všemi ostatními nulový průnik. Jedinou možností tedy je, že všechny vektory na pravé straně jsou nulové a tedy je rozklad w jednoznačný. Pro přímé součty podprostoru píšeme W = Vi ( ■®vk = ®f=iV. 2.29. Báze. Nyní máme vše připravené pro pochopení minimálních množin generátorů tak, jak jsme ses nimi vypořádali v rovině B>2 _J BÁZE vektorových prostoru Podmnožina M c V se nazývá báze vektorového prostoru V, jestliže (M) = V a M je lineárně nezávislá. Vektorový prostor, který má konečnou bázi, nazýváme konečně rozměrný, počet prvků báze nazýváme dimenzí V. Nemá-li V konečnou bázi, říkáme, že V je nekonečně rozměrný. Píšeme dim V — k,k e N, případně k = 00. 87 KAPITOLA 2. POČÍTÁNÍ S VEKTORY hodnost nezje počet řádkuje ekvivalentní nulovosti determinantu dané matice. Podmínka na a tedy zní a 1 2 -2 a 3=0, 1 2 a tj. a bude kořenem polynomu a3 — 6a — 5 = (a + l)(a2 — a — 5), tj. úloha má tři řešení ai = — l,fl2,3 = ^j^-- □ 2.36. Vektory (1, 2, 1), (—1, 1, 0), (0, 1, 1) jsou lineárně nezávislé, a proto společně tvoří bázi K3, (v bázi je nutné zadat i jejich pořadí). Každý trojrozměrný vektor je tak nějakou jejich lineární kombinací. Jakou jejich lineární kombinací je vektor (1, 1,1), nebo-li jaké jsou souřadnice vektoru (1, 1,1) v bázi dané zmíněnými vektory? Řešení. Hledáme a,b,ceR taková, aby a(l, 2,1) + b(-l, 1, 0) + c(0, 1, 1) = (1, 1, 1). Rovnost musí platit v každé souřadnici, dostáváme tak soustavu tří lineárních rovnic o třech neznámých: a — b =1, la + b + c = 1, a + c = 1, jejímž vyřešením získáme a = ^ b ■■ \. Je tedy (1,1,1) = \ ■ (1, 2, 1) - \ ■ (-1, 1,0) + |- (0,1, 1), neboli souřadnice vektoru (1,1,1) v bázi ((1,2,1), (—1,1,0), (0,1,1)) jsou (±,-±,±). □ 2.37. Uvažme komplexní čísla C jako reálný vektorový prostor. Určete souřadnice čísla 2 + i v bázi dané kořeny polynomu x2 + x + 1. Řešení. Protože kořeny polynomu jsou — j + i-^a — \ — i-^,máme určit souřadnice (a, b) vektoru 2 + i v bázi (— \ + i^j-, —\ — i^j-). Tato reálná čísla a, b jsou jednoznačně určena požadavkem 1 Vš 1 Vš a ■ (---h i-) +b ■ (---i-) = 2 + i. v 2 2 ; 2 2 ' Rozepsáním rovnosti zvlášť pro reálnou a imaginární složku dostáváme soustavu dvou lineárních rovnic o dvou neznámých: \b = 2 1. 2" ■ ¥ ■ f b = -2+^, b-. -2— hledané souřad- □ Jejím vyřešením získáme a nice tedy jsou (—2 + —2 — -^). 2.38. Poznámka. Jak pozorný čtenář jistě postřehl, úloha není zadána jednoznačně, nemáme totiž zadáno pořadí kořenů polynomu, tudíž ani pořadí bázových vektorů. Výsledek je tedy dán až na změnu pořadí souřadnic. Abychom s takovou definicí dimenze mohli být spokojeni, potřebujeme vědět, že různé báze téhož prostoru budou mít vždy stejný počet prvků. To skutečně brzy dokážeme. Všimněme si hned, že triviální podprostor je generován prázdnou množinou, která je „prázdnou" bází. Má tedy triviální podprostor dimenzi nulovou. Bázi ^-rozměrného prostoru budeme obvykle zapisovat jako uspořádanou k-tici v — (v\ ..., Vk) bázových vektorů. Jde tu především o zavedení konvence: U konečně rozměrných podpro-storů budeme totiž vždy uvažovat bázi včetně zadaného pořadí prvků, i když jsme to takto, striktně vzato, nedefinovali. Zjevně, je-li (v\, v„) bází V, je celý prostor V přímým součtem jednorozměrných podprostorů v = (i-i>e---e(i-„>. Okamžitým důsledkem výše odvozené jednoznačnosti rozkladu jakéhokoliv vektoru ve V do komponent v přímém součtu dává jednoznačné vyjádření w = x\v\ H-----\-x„v„ a dovoluje nám tedy po volbě báze opět vidět vektory jako řítíce skalárů. K tomuto pohledu se vrátíme vzápětí v odstavci 2.33, jak jen dokončíme diskusi existence bází a součtů podprostorů v obecné poloze. 2.30. Věta. Z libovolné konečné množiny generátorů vektorového prostoru V lze vybrat bázi. Každá báze konečněrozměrného prostoru V má přitom stejný počet prvků. Důkaz. První tvrzení ukážeme snadno indukcí přes počet ge-, i' .i nerátorů k. tJedině nulový podprostor nepotřebuje žádný generátor N a tedy umíme vybrat prázdnou bázi. Naopak, nulový vektor i vybrat nesmíme (generátory by byly lineárně závislé) a nic jiného už v podprostorů není. Abychom měli indukční krok přirozenější, probereme ještě přímo případ k — 1. Máme V — ({v}} protože {v} je li- neárně nezávislá množina vektorů. Pak je ovšem {v} zároveň báze vektorového prostoru V. Předpokládejme, že tvrzení platí pro k = n, a uvažme V = (vi, vn+\ ). Jsou-li ni, vn+\ lineárně nezávislé, pak tvoří bázi. V opačném případě existuje index i takový, že Vi =a\v\ H-----\-ai-\vi-\ + ai+\vi+\ H-----\-an+\vn+\. Pak ovšem V — {v\, ..., d,-_i, ..., vn+\) a již umíme vybrat bázi (podle indukčního předpokladu). Zbývá ověřit, že báze mají vždy stejný počet prvků. Uvažujme bázi (v\, ... ,vn) prostoru V a libovolný nenulový vektor u — a\v\ + • • • + anvn e V s a; 0 pro jisté i. Pak 1 , , ví = —tu - (a\vi H-----ha;-iu;_i + ai+\vi+\ H-----\-anvn)), a-i a proto také (u, v\, ..., d,-_i , d,-+i , ..., vn) — V. Ověříme, že je to opět báze: Kdyby přidáním u k lineárně nezávislým vektorům v\, ..., d,-_i , d,-+i , ..., v„ vznikly lineárně závislé vektory, pak by u bylo jejich lineární kombinací. To by znamenalo V = (vi,..., Vi-i, vi+i, vn), což není možné. 88 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Dále se na tomto místě vyjádřeme k tzv. „usměrňování" zlomků, tedy odstraňování odmocnin z jejich jmenovatele. Autoři nemají vyhraněný názor, zda by se usměrňovat mělo, či ne (Je hezčí nebo -jj?)- V některých případech však je usměrňování nežádoucí: ze zlomku okamžitě odečteme, že jeho hodnota je o něco málo větší než 1 (neboť \/35 je jen o málo menší než 6), kdežto z usměrněného zlomku nevidíme na první pohled nic. 2.39. Uvažme komplexní čísla C jako reálný vektorový prostor. Určete souřadnice čísla 2 + i v bázi dané kořeny polynomu x2 — x + 1. 2.40. Pro jaké hodnoty parametrů a,b,c e K jsou vektory (1, 1, a, 1), (1, b, 1,1), (c, 1, 1, 1) lineárně závislé? 2.41. Nechť je dán vektorový prostor V a nějaká jeho báze složená z vektorů u, v, w, z. Zjistěte, zda jsou vektory u — 3v + z, v — 5w — z, 3w — lz, u —w + z lineárně (ne)závislé. 2.42. Doplňte vektory 1— x2+x3,l+x2+x3,l — x — x3 na bázi prostoru polynomů stupně nejvýše 3. 2.43. Tvoří matice 1 0\ A 4\ (-5 0\ íl -2\ 1-2/' ^0-1/' \3 OJ' \0 3 ) bázi vektorového prostoru čtvercových dvourozměrných matic? Řešení. Uvedené čtyři matice jsou jako vektory v prostoru 2x2 matic lineárně nezávislé. Vyplývá to z toho, že matice / 1 1 —5 1 \ 0 4 0 -2 10 3 0 \-2 -10 3 ) je tzv. regulární, což je mimochodem ekvivalentní libovolnému z následujících tvrzení: její hodnost je rovna rozměru; lze z ní pomocí řádkových elementárních transformací obdržet jednotkovou matici; existuje k ní matice inverzní; má nenulový determinant, roven 116; jí zadaná homogenní soustava lineárních rovnic má pouze nulové řešení; každý nehomogenní lineární systém s levou stranou určenou touto maticí má právě jedno řešení; obor hodnot lineárního zobrazení, jež zadává, je vektorový prostor dimenze 4; toto zobrazení je injektivní. □ 2.44. V K3 jsou dány podprostory í/aľ generované po řadě vektory (1, 1,-3), (1,2,2) a (1,1,-1), (1,2, 1), (1,3,3). Nalezněte průnik těchto podprostorů. Takže jsme dokázali, že pro libovolný nenulový vektor u e V existuje i, 1 < i < n, takové, že (u, v\, ..., u,-_i , d,-+i, ..., vn) je opět báze V. Dále budeme místo jednoho vektoru u uvažovat lineárně nezávislou množinu u i, ..., u k a budeme postupně přidávat u \, u2, vždy výměnou za vhodné v, podle předchozího postupu. Musíme přitom ověřit, že takové v, vždy bude existovat (tj. že se nebudou vektory u vyměňovat vzájemně). Předpokládejme tedy, že již máme umístěné u\, ..., ui. Pak se ui+\ jistě vyjádří jako lineární kombinace těchto vektorů a zbylých v j. Pokud by pouze koeficienty u u\, ..., u t byly nenulové, znamenalo by to, že již samy vektory u\,..., ui+\ byly lineárně závislé, což je ve sporu s našimi předpoklady. Pro každé lc < n tak po k krocích získáme bázi, ve které z původní báze došlo k výměně k vektorů za nové. Pokud by k > n, pak již v n-tém kroku obdržíme bázi vybranou z nových vektorů u i, což znamená, že tyto nemohou být lineárně nezávislé. Zejména tedy není možné, aby dvě báze měly různý počet prvků. □ Ve skutečnosti jsme dokázali silnější tvrzení, tzv. Steinitzovu větu o výměně, která říká, že pro každou konečnou bázi v a každý systém lineárně nezávislých vektorů ve V umíme najít podmnožinu bázových vektorů v,, po jejichž záměně za zadané nové vektory opět dostaneme bázi. 2.31. Důsledky Steinitzovy věty o výměně. Díky možnosti volně volit a vyměňovat bázové vektory můžeme okamžitě dovodit pěkné (a intuitivně snad také pET očekávané) vlastnosti bází vektorových prostorů: Tvrzení. (1) Každé dvě báze konečně rozměrného vektorového prostoru mají stejný počet vektorů, trn. Že naše definice dimenze nezávisí na volbě báze. (2) Má-li V konečnou bázi, lze každou lineárně nezávislou množinu doplnit do báze. (3) Báze konečně rozměrných vektorových prostorů jsou právě maximální lineárně nezávislé množiny. (4) Báze prostoru s konečnou dimenzí jsou právě minimální množiny generátorů. Malinko složitější, ale nyní snadno zvládnutelná, je situace kolem dimenzí podprostorů a jejich součtů: Důsledek. Nechť W,Wi,W2 c V jsou podprostory v prostoru V konečné dimenze. Pak platí (1) dimW < dimV, (2) V — W, právě když dim V — dim W, (3) dim Wi + dim W2 = dim(Wi + W2) + dim(Wi n W2). Důkaz. Zbývá dokázat pouze poslední tvrzení. To je zřejmé, pokud je dimenze jednoho z prostorů nulová. Předpokládejme tedy dimWi = r > 1, dimW2 = s > 1 a nechť (w\ ..., wt) je báze W\ n W2 (nebo prázdná množina, pokud je průnik triviální). Podle Steinitzovy věty o výměně lze tuto bázi průniku doplnit na bázi (wi, ...,wt, ut+\, ..., ur) pro W\ a na bázi (w\ ...,wt, vt+\, ...,vs) pro W2. Vektory , wt, ut+\, , vt+i 89 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Řešení. Podprostor V má dimenzi pouze 2 (nejedná se tedy o celý prostor K3), neboť jistě generují W\+W2 ■ Ukážeme, že jsou přitom lineárně nezávislé. Nechť tedy 1 1 -1 1 1 1 a\w\ + • • + a,w, 4 bt+\ "í+1 + ■ ■ ■ 1 2 1 = 1 2 3 = 0 • + brur 4 ct+i vt+\ 4 • • + CjDj = 0 1 3 3 -1 1 3 Pak nutně a neboť libovolná dvojice z uvažovaných třech vektorů je očividně lineárně nezávislá. Stejně snadno vidíme, že také podprostor U má dimenzi 2. Současně je 111 1 2 1 = 2^0, ,-3 2 -1 a proto vektor (1, 1, — 1) nemůže náležet do podprostoru U. Průnikem rovin procházejících počátkem (dvojrozměrných podprostoru) v trojrozměrném prostoru musí být alespoň přímka. V našem případu je jím právě přímka (podprostory nejsou totožné). Určili jsme dimenzi průniku - je jednodimenzionální. Všimneme-li si, že 1-(1, 1, -3) +2 -(1,2, 2) = (3,5, 1) = 1-(1, 1,-1) + 2- (1,2, 1), dostáváme vyjádření hledaného průniku ve tvaru množiny všech skalárních násobků vektoru (3, 5, 1) (jedná se o přímku procházející počátkem s tímto směrovým vektorem). □ 2.45. Stanovte vektorový podprostor (prostoru K4) generovaný vektory wi = (-1, 3, -2, 1), u2 = (2, -1, -1, 2), u3 = (-4, 7, -3, 0), 114 = (1, 5, —5, 4) vybráním nějaké maximální množiny lineárně nezávislých vektorů w, (tj. vybráním báze). Řešení. Sepíšeme vektory w, do sloupců matice a obdrženou matici upravíme pomocí řádkových elementárních transformací. Takto získáme '-1 2 -4 1 \ /1 2 0 4\ /l 2 0 4\ 3 -1 7 5 -1 2 -4 1 0 4 - 4 5 -2 -1 -3 - -5 3 -1 7 5 0 -7 - -7 \ 1 2 0 4/ \~2 -1 -3 -v \° 3 - 3 3 / 'l2 0 4 \ /l 2 0 4 \ íl 0 2 o\ 0 1 -1 5/4 0 1 -1 5/4 0 1 -1 0 0 1 -1 1 0 0 0 -1/4 0 0 0 1 0 0 0 0 ) v° 0 0 0 ) 1° 0 0 °) Odtud vyplývá, že lineárně nezávislejšou právě vektory u\, u2, u4, tj. právě ty vektory odpovídající sloupcům, které obsahují první nenulové číslo nějakého řádku. Navíc odsud plyne (viz třetí sloupec) 2 • (-1, 3, -2, 1) - (2, -1, -1, 2) = (-4, 7, -3, 0). □ 2.46. Ve vektorovém prostoru K4 jsou dány trojrozměrné podprostory U = (ui,u2,u3), V = (vi, v2, u3), - (C(+l • Vt+l H-----h Cs • Dj) = = a\ ■ w\ H-----ha, -w, + bt+\ ■ ut+\ H-----h br ■ ur musí patřit do W\ C\W2. To ale má za následek, že bt+i = ■ ■ ■ = br = 0, protože tak jsem doplňovali naše báze. Pak ovšem i a\ ■ w\ H-----\-at-wt + ct+l ■ vt+l H-----h cs -vs=0, a protože příslušné vektory tvoří bázi W2, jsou všechny koeficienty nulové. Tvrzení (3) nyní vyplývá z přímého přepočítání generátorů. □ 2.32. Příklady. (1) K" má (jako vektorový prostor nad K) dimenzi n. Bází je např. n-tice vektorů ((1,0, ...,0), (0, 1, ...,0),..., (0, ...,0, 1)). Tuto bázi nazýváme standardní báze v W. Všimněme si, že v případě konečného pole skalárů, např. TLi, má celý vektorový prostor K" jen konečný počet k" prvků. (2) C jako vektorový prostor nad R má dimenzi 2, bázi tvoří např. čísla 1 a i. (3) Km [x], tj. prostor polynomů stupně nejvýše m, má dimenzi m + 1, bází je např. posloupnost 1, x, x2 ,..., x™ . Vektorový prostor K[x] všech polynomů má dimenzi 00, umíme však ještě stále najít bázi (i když s nekonečně mnoha prvky): l,x,x2, .... (4) Vektorový prostor R nad Q má dimenzi 00 a nemá spočetnou bázi. (5) Vektorový prostor všech zobrazení / : R —> R má také dimenzi 00 a nemá spočetnou bázi. 2.33. Souřadnice vektorů. Jestliže pevně zvolíme bázi (di, ..., v„) konečně rozměrného prostoru V, pak můžeme každý vektor w e V vyjádřit jako lineární kombinaci v = a\v\ + ■ ■ ■ + anvn. Předpokládejme, ■-a^v^m*--»— že to uděláme dvěma způsoby: w =aivi H-----Yanvn =b\v\ H-----\-b„v„. Potom ale 0 = (a\ - b\) ■ v\ H-----\-(a„- b„) ■ vn, a proto a, = £>, pro všechna i = 1,..., n. Dospěli jsme proto k závěru: V konečně rozměrném vektorovém prostoru lze každý vektor zadat právě jediným způsobem jako lineární kombinaci bázových vektorů. Koeficienty této jediné lineární kombinace vyjadřující daný vektor w e V ve zvolené bázi v — (v\, ..., vn) se nazývají souřadnice vektoru w v této bázi. Kdykoliv budeme mluvit o souřadnicích (a\, ..., a„) vektoru w, které vyjadřujeme jako posloupnost, musíme mít pevně zvolenu i posloupnost bázových vektorů y_ — (v\, ..., vn). Jakkoliv jsme tedy báze zavedli jako minimální množiny generátorů, ve 90 KAPITOLA 2. POČÍTÁNÍ S VEKTORY pricemz /1\ 1 1 w /1 \ 1 -1 v-v U2 : 1)2 : /1\ (l\ 1 0 0 «3 = 1 v) v) í 1 ^ í 1 ^ -i -i i V3 = -i \- ) Určete dimenzi a libovolnou bázi podprostoru U n V. Řešení. Do podprostoru U n V náleží právě ty vektory, které j e možné obdržet jako lineární kombinaci vektorů w, a také jako lineární kombinaci vektorů u;. Hledáme tedy čísla xj, x2, x3, yi, y2, ^ e 1 taková, aby platilo (l\ /l\ /l\ ( 1 ^ / 1 \ / 1 \ 1 1 0 i -1 -1 1 + X2 0 + *3 1 = y\ -i + )>2 1 + V3 -1 w Iv v) \-V W tj. hledáme řešení soustavy + X3 X\ Xl Xl + + x2 x2 x2 + + x3 X3 yi + yi + y\ — yi — ä, -y-i + yi — ä, -y\ - yi + Při maticovém zápisu této homogenní soustavy (a při zachování pořadí proměnných) je /l 1 1 -1 -1 /l 1 1 -1 -1 -!\ 1 1 0 -1 1 1 0 0 -1 0 2 2 1 0 1 1 -1 1 0 -1 0 2 0 2 \p 1 1 1 1 -1/ \P 1 1 1 1 -1/ ll 1 1 -1 -1 -!\ /l 1 1 -1 -1 0 1 1 1 1 -1 0 1 1 1 1 -1 0 0 -1 0 2 2 0 0 1 0 -2 -2 \o 0 1 3 1 1 ) \o 0 0 1 1 1 ) /l 1 1 0 0 °\ /l 0 0 0 0 2\ 0 1 1 0 0 -2 0 1 0 0 2 0 0 0 1 0 -2 -2 0 0 1 0 -2 -2 \p 0 0 1 1 1 ) \p 0 0 1 1 1 ) U y2 = s, y3 Dostáváme tak řešení x\ = —2t, x2 = —2s, X3 = 2s + 2t, yi í.jeI. Odtud dosazením získáváme obecný vektor průniku (x\ + x2 + x-\ ( 0 \ X\ + x2 X\ + x3 \ x2+x3 ) ■2/ - 2s 2s \ 2t skutečnosti s nimi budeme pracovat jako s posloupnostmi (tedy s uspořádanými množinami, kde je pevně zadáno pořadí bázových prvků). ___| přiřazení souřadnic vektorům j_--- Přiřazení, které vektoru u — a\v\ + • • • + anvn přiřadí jeho souřadnice v bázi v, budeme značit stejným symbolem v : V -> W. Má tyto vlastnosti: (1) v(u + w) = v(u) + v(w); Vm, w e V, (2) v(a-u)=a- v(u); Va El,V« e V. Všimněme si, že operace na levých a pravých stranách těchto rovnic nejsou totožné, naopak, jde o operace na různých vektorových prostorech! Při této příležitosti ^SSšSgřLlJ se také můžeme zamyslet nad obecným případem báze M (možná nekonečně rozměrného) prostoru V. Báze pak nemusí být spočetná, pořád ale ještě můžeme definovat zobrazení M : V —> KM (tj. souřadnice vektoru jsou zobrazení z M do K). Uvedené vlastnosti přiřazení souřadnic jsme viděli už dříve u zobrazení, kterým jsme v geometrii roviny říkali lineární (zachovávaly naši lineární strukturu v rovině). Než se budeme věnovat podrobněji závislosti souřadnic na volbě báze, podíváme se obecněji na pojem linearity zobrazení. 2.34. Lineární zobrazení. Pro jakékoliv vektorové prostory (konečné i nekonečné dimenze) definujeme „linearitu" zobrazení mezi prostory obdobně, . jako jsme to viděli již v rovině M?: _J Definice lineárních zobrazení |___ Nechť V a W jsou vektorové prostory nad týmž polem skalárů K. Zobrazení / : V —> W se nazývá lineární zobrazení (homo-morfismus), jestliže platí: (1) f(u + v) = f (u) + f (v), Vu, v e V, (2) f(a-u)=a- f(u), Va El, Vu e V. Samozřejmě, že jsme taková zobrazení již viděli ve formě násobení matic: / : K" -» Km,x t-> A -x s maticí typu m/n nad K. Obrazím f :— f (V) c Wje vždy vektorový podprostor, protože lineární kombinace obrazů /(«;) je obrazem lineární kombinace vektorů m, se stejnými koeficienty. Stejně tak je vektorovým podprostorem množina všech vektorů Ker/ :— /_1({0)) V, protože lineární kombinace nulových obrazů bude vždy zase nulovým vektorem. Podprostor Ker / se nazývá jádro lineárního zobrazení f. Lineární zobrazení, které je bijekcí, nazýváme izomorfismus. Podobně jako u abstraktní definice vektorových prostorů, opět je třeba ověřit zdánlivě samozřejmá tvrzení vyplývající z axiomů: Tvrzení. Nechť f : V —> W je lineární zobrazení mezi libovolnými vektorovými prostory nad týmž polem skalárů K. Pro všechny vektory u, u\, ..., ui e V a skaláry a\, ... ,ak e K platí: (1) /(O) = 0, (2) f (-u) = -f (u), (3) f(a\ • u\ H-----h &k * uk) ~ a\ ' f(ul) H-----Yak- f(uk), 91 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Vidíme, že /0\ /0\ -1 -1 1 ' 0 w □ dim í/ n V = 2, u n V 2.47. Uvedie nějakou bázi podprostoru U vektorového prostoru reálnych matic 3x2. Tuto bázi doplňte na bázi celého prostoru. Řešení. Připomeňme, že bázi podprostoru tvoří množina lineárně nezávislých vektoru, které generují uvažovaný podprostor. Protože -1 ■ + 2- + 3- celý podprostor U je generován pouze prvními dvěma maticemi. Ty jsou potom lineárně nezávislé (jedna není násobkem druhé), a tak zadávají bázi. Chceme-li ji doplnit na bázi celého prostoru reálných matic 3x2, musíme najít další čtyři matice (dimenze celého prostoru je zjevně 6) takové, aby výsledná šestice byla lineárně nezávislá. Můžeme využít toho, že známe např. standardní bázi (l 0\ /O 1 0 0,0 o iO 0/ lo o 0 0\ /O 0) 0 0,0 o 1 o/ lo li prostoru reálných matic 3x2, který lze přímo ztotožnit s K . Sepíšeme-li dva vektory báze U a vektory standardní báze celého prostoru v tomto pořadí, výběrem prvních 6 lineárně nezávislých vektorů dostaneme hledanou bázi. Pokud však uvážíme, že kupř. 1 0 0 0 0 0 2 1 0 0 0 0 3 2 1 0 0 0 4 3 0 1 0 0 5 4 0 0 1 0 6 5 0 0 0 1 můžeme ihned bázového vektory (4) pro každý vektorový podprostor V\ c V je jeho obraz f (V\) vektorový podprostor ve W, (5) pro každý podprostor W\ c W je množina rl(Wi) = {v e V; f (v) e W\) vektorový podprostor ve V. Důkaz. Počítáme s využitím axiomů, definic a již dokázaných výsledků (dohledejte si případně samostatně!): /(0) = f(u -ú) = /((l - 1) • u) = 0 • f(u) = 0, f(-u) = /((-l) • u) = (-1) • f(u) = f (u). Vlastnost (3) se ověří snadno z definičního vztahu pro dva sčítance indukcí přes počet sčítanců. Z platnosti (3) nyní plyne, že (f(Vi)) = f(V\), je to tedy vektorový podprostor. Je-li naopak f (u) e ffi a /(u) e W\, pak pro libovolné skaláry bude i f (a ■ u + b ■ v) — a ■ f (u) + b ■ f (v) eW\. □ 2.35. Jednoduché důsledky. (1) Složenígo/ : V -» Z dvou lineárních zobrazení / : V —> W a g : W —> Z je opět lineární zobrazení. (2) Lineární zobrazení / : V —> W je izomorfismus, právě když Im / = W a Ker / = {0) c V. Inverzní zobrazení k izomor-fismu je opět izomorfismus. (3) Pro libovolné podprostory V\, V*2 c V a lineární zobrazení / : V -> W platí f(Vi + V2) = f(Vi) + f(V2), f(Vi n ví) c f(vi) n f(v2). (4) Zobrazení „přiřazení souřadnic" u : v —> K" dané libovolně zvolenou bází u = (mi, ..., u„) vektorového prostoru v je izomorfismus. (5) Dva konečně rozměrné vektorové prostory jsou izomorfní, právě když mají stejnou dimenzi. (6) Složení dvou izomorfismů je izomorfismus. Důkaz. Ověření prvního tvrzení je velmi snadné cvičení. w\: Pro důkaz druhého si uvědomme, že je-li / line- ^~~-<0 - ární bijekce, pak je vektor w vzorem lineární kombinace au + bv, tj. w — f~l(au + bv), právě když " f(w) =au+bv = f (a ■ f~l(u)+b- f~\v)). Je tedy také w — af~l (u) + bf~l(v) a tedy je inverze k lineární bijekci opět lineární zobrazení. Dále, / je surjektivní, právě když Im / — W, a pokud Ker / = {0), pak f (u) — f (v) zaručuje f(u — v) = 0, tj. u — v. Je tedy v tom případě / injektivní. Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v dokazované inkluzi opravdu nemusí nastat rovnost! Zbývající body jsou již zřejmé. □ 2.36. Opět souřadnice. Uvažujme libovolné vektorové prostory ^ ., v a w nad K s dim v — n, dim w — m a mějme lineární zobrazení / v —> w. Pro každou volbu '.. bá/í » = (u\, a„) na ľ, b = (v\, vn) na W máme k dispozici příslušná přiřazení souřadnic a celou situaci několika právě zmíněných zobrazení zachycuje následující diagram: 92 KAPITOLA 2. POČÍTÁNÍ S VEKTORY podprostoru U doplnit maticemi (vektory prostoru matic) ■ W na bázi. Upozorněme, že výše uvedený determinant lze vyčíslit velmi snadno - je roven součinu prvků na diagonále, neboť matice je v dolním trojúhelníkovém tvaru (nad diagonálou jsou všechny prvky nulové). □ H. Lineární zobrazení Jak popsat analyticky shodná zobrazení v rovině či prostoru jako je rotace, osová symetrie či zrcadlení, nebo projekci třírozměrného prostoru na dvojrozměrné plátno? Jak popsat zvětšení obrázku? Co mají společného? Jsou to všechno lineární zobrazení. Znamená to, že zachovávají jistou strukturu roviny či prostoru. Jakou strukturu? Strukturu vektorového prostoru. Každý bod v rovině je popsán dvěma v prostoru pak třemi souřadnicemi. Pokud zvolíme počátek souřadnic, tak má smysl mluvit o tom, že nějaký bod je dvakrát dál od počátku stejným směrem než jiný bod. Také víme, kam se dostaneme, posuneme-li se o nějaký úsek v jistém směru a pak o jiný úsek v jiném směru. Tyto vlastnosti můžeme zformalizovat, hovoříme-li o vektorech v rovině, či prostoru a o jejich násobcích, či součtech. Lineární zobrazení má pak tu vlastnost, že obraz součtu vektorů je součet obrazů sčítaných vektorů a obraz násobku vektoru je ten stejný násobek obrazu násobeného vektoru. Tyto vlastnosti právě mají zobrazení zmíněná v úvodu tohoto odstavce. Takové zobrazení je pak jednoznačně určeno tím, jak se chová na vektorech nějaké báze (to je v rovině obrazem dvou vektorů neležících na přímce, v prostoru obrazem tří vektorů neležích v rovině). A jak tedy zapsat nějaké lineární zobrazení / na vektorovém prostoru VI Začněme pro jednoduchost s rovinou K2: předpokládejme, že obraz bodu (vektoru) (1, 0) je (a, b) a obraz bodu (0,1) je (c, d). Tím už je jednoznačně určený obraz libovolného bodu o souřadnicích (u, v): /((«, v)) = f(u(l, 0) + v(0,1)) = 11/(1, 0) + vf(l, 0) = = (ua, ub) + (vc, vd) = (au + cv, bu + do), což můžeme výhodně zapsat následujícím způsobem: a c \ I u b d) [v au + cv bu + dv Lineární je tedy zobrazení jednoznačně dané maticí. Navíc pokud máme další lineární zobrazení g, dané maticí ^ eg { ^, tak snadno spočítáme (čtenář si jistě ze zájmu sám ověří), že jejich složení g o / jedánomaticí^^). Spodní šipka je definována zbylými třemi, tj. jako zobrazení jde o složení fu.v — v o f oiT1. .___| Matice lineárního zobrazení |___ Každé lineární zobrazení je jednoznačně určeno svými hodnotami na libovolné množině generátorů, zejména tedy na vektorech báze u. Označme /(mi) = au -vi+a2i-V2-\-----Yam\vm, f(u2) = an ■ v\ +a22 ■ v2 H-----Yam2vm, f(un) = au - ví +a2„ -i>2H-----Yam„vm, tj. skaláry tvoří matici A, kde sloupce jsou souřadnice hodnot f(uj) zobrazení / na bázových vektorech vyjádřené v bázi v na cílovém prostoru W. Matici A = (aij) nazýváme maticí zobrazení f v bázích u, v. Pro obecný vektor u — x\u\ + • • • + xnun e V spočteme (vzpomeňme, že sčítání vektorů je komutativní a distributivní vůči násobení skaláry) f(u) = x\f(u\) H-----h x„f(u„) = = x\(auv\H-----Yam\vm) H-----h + xn(a\nv\^-----Yamnvm) — = (x\a\\^-----Yx„a\n)v\ H-----Y (x\am\^-----Yx„amn)vm. Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení fu,v(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že vektory v Kr chápeme jako sloupce, tj. matice typu r/1 f„,„(u(w)) = v (f(w)) = A ■ u(w). Naopak, máme-li pevně zvoleny báze na V i W, pak každá volba matice A typu m/n zadává jednoznačně lineární zobrazení K" —> Km a tedy i zobrazení f : V —> W. Máme-li tedy zvoleny báze prostorů V a W, odpovídá každé volbě matice typu m/n právě jedno lineární zobrazení V —> W. Ukázalijsmebijekcimezi maticemi příslušného rozměru a lineárními zobrazeními V —> W. 2.37. Matice přechodu mezi souřadnicemi. Jestliže za ľiff zvolíme tentýž prostor ale s různými bázemi, a za / identické zobrazení, vyjadřuje postup z předchozího odstavce vektory báze u v souřadnicích vzhledem k i). Označme výslednou matici T. Když pak zadáme vektor u u — x\u\ + • • • + xnun v souřadnicích vzhledem k m a dosadíme za m, jejich vyjádření pomocí vektorů z v, obdržíme souřadné vyjádření x — (x\, ..., x„) téhož vektoru v bázi v. Stačí k tomu přeskládat pořadí sčítanců a vyjádřit skaláry u jednotlivých vektorů báze. Ve skutečnosti teď děláme totéž, co v předchozím odstavci pro speciální případ identického zobrazení idy na vektorovém prostoru 93 KAPITOLA 2. POČÍTÁNÍ S VEKTORY To nás vede k tomu, abychom násobení matic definovali tímto způsobem, tedy aby aplikace zobrazení na vektor byla dána maticovým násobením matice zobrazení se zobrazovaným vektorem a aby složení zobrazení bylo dáno součinem matic jednotlivých zobrazení. Obdobně to funguje v prostorech vyšší dimenze. Zároveň tato úvaha znovu ukazuje to, co již bylo dokázáno v (2.5), totiž že násobení matic je asociativní, ale není komutativní, neboť tomu tak je u skládání zobrazení. To je tedy další z motivací, proč se zabývat vektorovými prostory. Připomeňme si nyní, že v první kapitole jsme již pracovali s maticemi některých lineárních zobrazení v rovině K2, zejména rotace kolem bodu a osové symetrie (viz 1.31 a 1.32). Nyní zkusme zapsat matice lineárních zobrazení z K3 do K3. Jak vypadá matice rotace ve třech rozměrech? Začněme speciálními (pro popis jednoduššími) rotacemi kolem souřadnicových os. 2.48. Matice rotací kolem os v K3. Napište matice zobrazení rotací o úhel

- v r=(idv)«,ii rotace kolem osy y: (cosip 0 sin^\ 0 10, — sin

I . \0 sinip cosip / U matice rotace kolem osy y máme jinak znaménko u Z a označme příslušnou matici g&M. f s V--—*■ w---^Z Složení g o f na horním řádku odpovídá matici zobrazení K" -» K* dole a přímo spočteme (píšeme A pro matici f a B pro matici g ve zvolených bázích): gv.w o fu,v(x) = w o g o y^1 o v o f o uTl = — B ■ (A ■ x) — (B ■ A) ■ x — (g o f),±,u,(x) pro všechna x e K". Skládání zobrazení tedy odpovídá násobení příslušných matic. Všimněte si také, že isomorfismy odpovídají právě invertibilním maticím. Stejný postup nám dává odpovědna otázku, jak se změní matice zobrazení, změníme-li báze na definičním oboru i oboru hod- not: -A t A idy t idw V--—--—--— kde T je matice přechodu od m' k u a S je matice přechodu od v' k v. Je-li tedy A původní matice zobrazení, bude nová dána jako A' = rr1 AT. Ve speciálním případě lineárního zobrazení / : V —> V, tj. zobrazení má stejný prostor V jako definiční obor i obor hodnot, vyjadřujeme zpravidla / pomocí jediné báze u prostoru V. Pak tedy přechod k nové bázi m' s maticí přechodu ľ od a' k u bude znamenat změnu matice zobrazení na A' — T~l AT. 94 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Znalost matic rotací kolem souřadnicových os nám již umožňuje napsat matici rotace kolem libovolné (orientované) osy. Začněme s konkrétním příkladem: 2.49. Nalezněte matici rotace v kladném smyslu o úhel it/3 kolem přímky procházející počátkem s orientovaným směrovým vektorem (1,1, 0) ve standardní bázi K3. Řešení. Uvedené otočení lze získat složením po řadě těchto tří zobrazení: • rotace o jí/4 v záporném smyslu podle osy z (osa rotace přejde na osu x), • rotace o ji/3 v kladném smyslu podle osy x, • rotace o ji/4 v kladném smyslu podle osy z (osa x přejde na osu rotace). Matice výsledné rotace bude součinem matic odpovídajících uvedeným třem zobrazením, přičemž pořadí matic je dáno pořadím provádění jednotlivých zobrazení - prvnímu zobrazení odpovídá v součinu matice nejvíce napravo. Takto dostaneme hledanou matici (A 2 A 2 0 3 4 1 4 Vě 4 _A 2 V2 2 0 1 4 3 4 V6 4 (i 0 0 V Vě \ V6 4 : ) 0 1 2 A 2 o \ V5 / A 2 A 2 V 0 A o 2 u A Q 2 " 0 V Uvědomme si, že výslednou rotaci bylo možné získat např. také složením následujících tří zobrazení: • rotace o jt/4 v kladném smyslu podle osy z (osa rotace přejde na osu y), • rotace o ji/3 v kladném smyslu podle osy y, • rotace o ji/4 v záporném smyslu podle osy z (osa y přejde na osu rotace). Analogicky tak dostáváme / A k 2 \ 0 / 3 4 1 4- \ _ VI \ 4 A k 2 0 1 4 3 k 4 í 1 2 0 V3\ 2 0 0 1 0 V V3 2 0 u VI \ - Vě 4 : ) ÍA k 2 \0 _V2 2 0 o\ 0 1 □ 2.50. Matice obecné rotace v K3. Odvodte matici obecné rotace 1D>3 2.39. Lineární formy. Obzvlášť jednoduchým a zároveň důležitým případem lineárních zobrazení jsou tzv. lineární ' formy. Jde o lineární zobrazení z vektorového prostoru V nad polem skalárů K do skalárů K. Jsou-li dány souřadnice na V, je přiřazení jednotlivé i-té souřadnice vektorům právě takovou lineární formou. Přesněji řečeno, pro každou volbu báze v — (v\, ... ,vn) máme k dispozici lineární formy v* : V -» K takové, že vf(vj) = 8jj, tj. nula pro různé indexy i a j a jednička pro stejné. Vektorový prostor všech lineárních forem na V značíme V* a říkáme mu duální prostor k vektorovému prostoru V. Předpokládejme nyní, že prostor V má konečnou dimenzi n. Bázi V* sestavenou z přiřazování jednotlivých souřadnic jako výše nazýváme duální báze. Skutečně se jedná o bázi prostoru V*, protože jsou tyto formy zjevně lineárně nezávislé (prověřte si!). Je-li a libovolná forma, pak pro každý vektor u — x\v\ + • • • + x„v„ platí a(u) = x\a(v\) H-----h xna(vn) = = a(vi)v*(u) H-----h a(vn)v*(u), a je tedy a lineární kombinací forem v*. Při pevně zvolené bázi {1} na jednorozměrném prostoru skalárů K jsou s každou volbou báze v na V lineární formy a ztotožněny s maticemi typu l/n, tj. s řádky y. Právě komponenty těchto řádků jsou souřadnicemi obecných lineárních forem v duální bázi ti*. Vyčíslení takové formy na vektoru je pak dáno vynásobením příslušného řádkového vektoru y se sloupcem souřadnic x vektoru u e V v bázi v: a(u) = y ■ x = y\x\ H-----Yynxn- Zejména tedy vidíme, že pro každý konečně rozměrný prostor V je V* izomorfní prostoru V. Realizace takového izomorflsmu je dána např. naší volbou duální báze ke zvolené bázi na prostoru V. V tomto kontextu tedy znovu potkáváme skalární součin řádku n skalárů se sloupcem n skalárů, jak jsme s ním pracovali již v odstavci 2.3 na straně 67. U nekonečně rozměrného prostoru se věci mají jinak. Např. ^vA už nejjednodušší příklad prostoru všech polynomů K[x] v jedné proměnné je vektorovým prostorem se spočetnou bází s prvky v,■ = x1 a stejně jako ^ výše můžeme definovat lineárně nezávislé formy v*. Jakýkoliv formální nekonečný součet YľhLoa'vf Je nyní dobře definovanou lineární formou na K[x], protože bude vyčíslován vždy pouze na konečné lineární kombinaci bázových polynomů x', i = 0, 1, 2, .... Spočetná množina všech v* tedy není bází. Ve skutečnosti lze ukázat, že tento duální prostor ani spočetnou bázi mít nemůže. 2.40. Velikost vektorů a skalární součin. V úvahách o geometrii roviny M? jsme již v první kapitole v odstavci 1.29 pracovali nejen s bázemi a lmeárními zobrazeními, ale také s velikostí vektorů a jejich úhly. Pro zavedení těchto pojmů jsme také použili skalárního součinu dvou vektorů v = (x, y) a v' = (x1, y') ve tvaru v ■ v' — xx' + y ý. Skutečně, souřadné vyjádření pro velikost v — (x, y) je dáno + J2 =- 95 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Řešení. Úvahu z předchozího příkladu můžeme provést i s obecnými hodnotami. Uvažme libovolný jednotkový vektor (x, y, z). Rotace v kladném smyslu o úhel

: V x V —> M, které je symetrické ve svých argumentech, lineární v každém z nich a takové, že (v, v) > 0 a |v||2 = (v, v) — 0 pouze při v — 0. Číslu II ľ II = *J(v, v) říkáme velikost vektoru v. Vektory v,w e V se nazývají ortogonální nebo kolmé, jestliže (v, w) = 0. Píšeme také v ± w. Vektor v se nazývá normovaný, jestliže II ľ II = 1. Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze. Skalární součin se také často zapisuje pomocí obvyklé tečky, tj. (u,v) = u ■ v. Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je skalár) nebo něco jiného (stejně jsme značili součin matic a také někdy součin skalárů). Protože je skalární součin lineární v každém ze svých argumentů, bude jistě úplně určen již svými hodnotami na dvojicích bázových vektorů. Skutečně, zvolme si bázi u — (u\, ... ,un) prostoru V a označme Si j = (Ui, Uj). Pak ze symetričnosti skalárního součinu plyne = s jí a z linearity součinu v každém z argumentů dostáváme: (X!' " • zO' " ) = Y2xiyj(ui'uj) = Y2SiiXiyj- i j i,j i,j Pokud je báze ortonormální, je matice 5 jednotkovou maticí. Tím jsme dokázali následující užitečné tvrzení: _ skalární součin a ortonormální báze _. Tvrzení. Skalární součin je v každé ortonormální bázi dán v souřadnicích výrazem (x, y) = xT ■ y. Pro každou obecnou bázi prostoru V existuje symetrická matice S taková, že souřadné vyjádření skalárního součinu je (x, y) =xT ■ S -y. 96 KAPITOLA 2. POČÍTÁNÍ S VEKTORY do sloupců matice přechodu t. Máme tedy Matice přechodu od standardní báze k bázi / je potom Matice zobrazení v bázi / je potom t'1 at □ 2.52. Uvažme vektorový prostor mnohočlenů jedné neznámé stupně nejvýše 2 s reálnými koeficienty. V tomto prostoru uvažme bázi 1, x, x2. Napište matici zobrazení derivace v této bázi a také v bázi 1 + x2, X, X + x2. /O 1 0\ /O 1 1 \ Řešení. 002,21 3. □ \0 0 0/ \0 -1 -1/ 2.53. Ve standardní bázi v K3 určete matici rotace o 90° v kladném smyslu kolem přímky (/, t,t),t e K, orientované ve směru vektoru (1,1, 1). Dále určete matici této rotace v bázi g = ((1,1,0), (1,0,-1), (0,1,1)). Řešení. Snadno určíme matici uvažované rotace, a to ve vhodné bázi, totiž v bázi dané směrovým vektorem přímky a dále dvěma navzájem kolmými vektory v rovině x + y + z = 0, tedy v rovině vektorů kolmých k vektoru (1, 1,1). Uvědomme si, že matice rotace v kladném smyslu o 90° v nějaké ortonormální bázi v R2 je (J^1), v ortogonální s velikostmi vektorů k, l potom ^ ®k ^. Zvolíme-li v rovině x + y + z = 0 kolmé vektory (1, —1, 0) a (1,1, —2) o velikostech V2 a V6, tak v bázi / = ((1,1, 1), (1, -1, 0), (1,1, -2)) máuvažo-/i o o \ vaná rotace matici o o —yš |. Abychom získali matici uvažované \0 1/vf 0 / rotace ve standardní bázi, stačí nám transformovat matici již známým způsobem (viz 2.38). Matici přechodu t od báze / ke standardní dostaneme zapsáním souřadnic (ve standardní bázi) vektorů báze / do /li i \ — sloupců matice t: t = I j -i i I. Celkem tedy pro hledanou matici R máme Poznámka. Matice 5 z předchozí věty je dokonce pozitivně defi-nitní (pro definici pojmu pozitivní definitnosti viz 3.31) 2.41. Ortogonální doplňky a projekce. Pro každý pevně zvo-S. * ^ený P°dprostor W c V v prostoru se skalár-•^TjV ním součinem definuj eme j eho ortogonální doplněk W± = {u e V; u _L v pro všechny v e W}. Přímo z definice je zjevné, že W1- je vektorový podprostor. Jestliže W c V má bázi (mi, ..., uk),}e podmínka pro W1- dána jako k homogenních rovnic pro n proměnných. Bude tedy mít W1- dimenzi alespoň n — k. Zároveň ale m e WH W1- znamená (m, u) = 0 a tedy i u = 0 podle definice skalárního součinu. Zřejmě je tedy vždy celý prostor V přímým součtem V = W9W1. Lineární zobrazení / : V —> V na libovolném vektorovém prostoru se nazývá projekce, jestliže platí /"/ = /■ V takovém případě je pro každý vektor v e V: v = f (v) + (v - f (v)) e Im(/) + Ker(/) = V, a je-li v e Im(/) a f (v) = 0, pak je i v = 0. Je tedy předchozí součet podprostorů přímý. Říkáme, že / je projekce na podprostor W = Im(/) podél podprostorů U = Ker(/). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor na komponentu ve W a v U a tu druhou zapomeneme. Je-li na V navíc skalární součin, říkáme že jde o kolmou projekci, když je jádro kolmé na obraz. Každý podprostor W ^ V tedy definuje kolmou projekci na W. Je to projekce na W podél W±, která je dána pomocí jednoznačného rozkladu každého vektoru m na komponenty uw e W a uw± e W±, tj. lineární zobrazení, které u w +uwi_ zobrazí na u w ■ 2.42. Existence ortonormální báze. Povšimněme si, že na každém konečně rozměrném reálném vektorovém prostoru jistě existují skalární součiny. Prostě si stačí vybrat libovolnou bázi, prohlásit ji za ortonormální a hned jeden dobře definovaný skalární součin máme. V této bázi pak skalární součiny počítáme podle vzorce v Tvrzení 2.40. Umíme to ale i naopak. Máme-li zadán skalární součin na vektorovém prostoru V, můžeme vcelku jednoduše početně využít vhodných kolmých projekcí a jakoukoliv zvolenou bázi upravit na ortonormální. Jde o tzv. Gramův-Schmidtův ortogonalizačníproces. Cílem této procedury bude z dané posloupnosti nenulových generátorů v\, ... ,vk konečně rozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V. __\ Gramova-Schmidtova ortogonalizace I___ Tvrzení. Nechť (u\,..., uk) je lineárně nezávislá k-tice vektorů prostoru V se skalárním součinem. Pak existuje ortogonální systém vektorů (i>i, vk) takový, že d; e (mi, m,->, i = 1, ..., k. Získáme jej následující procedurou: • Nezávislost vektorů m,- zaručuje, že u\ ^ 0; zvolíme v\ = u\. 97 KAPITOLA 2. POČÍTÁNÍ S VEKTORY /l 0 0 \ r = t ■ o o -Vš r 1 = \0 l/VŠ 0 / / 1/3 1/3-VŠ/3 l/3 + VŠ/3\ = 1/3 +VŠ/3 1/3 1/3-VŠ/3 . \l/3-VŠ/3 1/3 +VŠ/3 1/3 / Tento výsledek můžeme ověřit dosazením do matice obecné rotace (||2.50||), místo vektoru (1, 1, 1) však musíme použít jednotkový vektor stejného směru, tedy vektor dostáváme vektor (x,y,z) = (l/VŠ, 1/VŠ, l/VŠ),cos

2 do (viŕ c ({vi,v2}). Výsledek bude nenulový, právě když je v2 nezávislé na v\. Ve všech dalších krocích budeme postupovat obdobně. V í-tém kroku tedy chceme, aby pro vi+\ — ui+\ + a\v\ + + ... + aivi platilo ( vi+\, ví) — 0 pro všechna i — 1, ..., í. Odtud plyne 0 = (ui+\ +a\v\ H-----hatvt, v;) = (uí+\, v;) +a;(u;, v;) a je vidět, že vektory s požadovanými vlastnostmi jsou určeny jednoznačně až na násobek. □ Kdykoliv máme ortogonální bázi vektorového prostoru V, stačí vektory vynormovat a získáme bázi ortonormální. Dokázali jsme proto: Důsledek. Na každém konečně rozměrném reálném vektorovém prostoru se skalárním součinem existuje ortonormální báze. V ortonormální bázi se obzvlášť snadno spočtou souřadnice a kolmé projekce. Skutečně, mějme ortonormální bázi (e\, ..., en) prostoru V. Pak každý vektor v — x\e\ + ■ ■ ■ + xnen splňuje (ei,v) = (ei,x\e\ H-----Yxnen) =*,-, a platí tedy vždy (2.3) v = (e\, v )e\ H-----h (en,v)e„. Pokud máme zadán podprostor W c V a jeho ortonormální bázi (e\, ... ,ei), jde ji jistě doplnit na ortonormální bázi (e\, ... ,en) celého V. Kolmá projekce obecného vektoru v e V do W pak bude dána vztahem v t-> (e\,v)e\ H-----h (e„, v)ek. Pro kolmou projekci nám tedy stačí znát jen ortonormální bázi pod-prostoru W, na nějž promítáme. Povšimněme si také, že obecně jsou projekce / na podprostor W podél U a projekce g na U podél W svázány vztahem g = idy — /. Je tedy u kolmých projekcí na daný podprostor W vždy výhodnější počítat ortonormální bázi toho podprostoru z dvojice W, W±, který má menší dimenzi. Uvědomme si také, že existence ortonormální báze nám zaručuje, že pro každý reálný prostor V dimenze n se skalárním součinem existuje lineární zobrazení, které je izomorflsmem mezi V a prostorem M" se standardním skalárním součinem. Podrobně to bylo ukázáno již v Tvrzení 2.40, kde jsme ukázali, že hledaným izomorflsmem je právě přiřazení souřadnic. Řečeno volnými slovy - v ortonormální bázi se skalární součin pomocí souřadnic počítá stejnou formulí jako standardní skalární součin v M". K otázkám velikosti vektorů a projekcím se vrátíme ještě v příští kapitole v obecnějších souvislostech. 98 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Řešení. Abychom určili matici lineárního zobrazení v nějaké bázi, stačí určit obrazy bázových vektoru. a) Pro konjugaci je 1 14 1, i h-» —i, zapsáno v souřadnicích (1,0) i-» (1, 0) a (0, 1) i-> (0, —1). Zapsáním obrazů do sloupců dostáváme matici (J _°j), V bázi / pak konjugace prohazuje bázové vektory, čili (1,0) i-» (0,1) a (0,1) i-» (1, 0) a matice konjugace v této bázi je (j J). b) Pro bázi (1, i) dostáváme 1 i-» 2 + i, i h-» 2i — 1, tedy (1,0) i-» (2, 1), (0, 1) i-» (2, —1). Celkem je matice násobení číslem 2 + i v bázi (1, i) tato: (\ ~2l). Nyní určeme matici v bázi /. Násobením číslem 2 + i dostáváme: 1 — i i-» (1 — i)(2 + 0 = 3 — i, 1 + i i-» 1 + 3i. Souřadnice (a,b)f vektoru 3 — i v bázi / jsou dány, jak již dobře víme, rovnicí a ■ (1 - 0 + b ■ (1 + i') = 3 + í, tedy (3 + i')/ = (2, 1). Obdobně (1 + 3i)/ = (—1, 2). Dohromady jsme získali matici (\ ~2l). Zamyslete se, proč nám matice násobení číslem 2 + i vyšla stejná v obou bázích. Byla by stejná matice násobení libovolným jiným komplexním číslem v těchto bázích? □ 2.56. Určete matici A, která ve standardní bázi prostoru K3 zadává kolmou projekci do vektorového podprostoru generovaného vektory ui = (-1,1,0) aw2 = (-1,0, 1). Řešení. Nejprve poznamenejme, že uvedený podprostor je rovinou procházející počátkem s normálovým vektorem 113 = (1,1,1). Uspořádaná trojice (1,1, 1) je totiž očividným řešením soustavy -xi + x2 + X3 tj. vektor w3 je kolmý na vektory u\, u2. Při dané projekci se vektory iiiau2 musejí zobrazit na sebe a vektor w3 potom na nulový vektor. V bázi složené po řadě z vektorů u\, u2, w3 je proto matice této projekce Pomocí matic přechodu -1 1) 2 _3i 13 3 2.43. Úhel dvou vektorů. Jak jsme již zmínili, úhel dvou lineárně nezávislých vektorů musí být stejný, když je budeme uvažovat v dvourozměrném podprostoru, který generují, nebo v okolním prostoru větším. Ve své podstatě je proto pojem úhlu dvou vektorů nezávislý na dimenzi okolního prostoru a pokud si zvolíme ortonormální bázi, jejíž první dva vektory budou generovat tentýž podprostor jako dané vektory u a v, můžeme doslova převzít definici z rovinné geometrie. 1 bez volby báze tedy musí platit: .___I Úhel dvou vektorů {--- Úhel

K, kde pro jakékoliv vektory u, v, w, z a skaláry a,b,c ad platí, stejně jako u skalárního součinu, že ce(au + bv, cw + dz) = aca(u, w) + ada(u, z)+ + bca(v, w) + bda(v, z). Pokud navíc platí a(u, w) = a(w, u), hovoříme o symetrické bilineární formě. Jestliže záměna argumentů vede k obrácení znaménka výsledku, hovoříme o antisyme-trické bilineární formě. Již v rovinné geometrii jsme zavedli determinant jako bilineární antisymetrickou formu a, tj. a(u, w) = — a(w, u). Obecně víme z věty 2.17, že je na determinant v dimenzi n možno nahlížet jako na n-lineární antisymetrickou formu. Jako u lineárních zobrazení je zřejmé, že každá ^-lineární forma je úplně určena svými hodnotami na všech k-ticích bázových prvků v pevné bázi. V analogii k lineárním zobrazením tyto hodnoty můžeme vnímat jako ^-rozměrné analogie matic. Ukážeme si to v případě k — 2, kde půjde doopravdy o matice, jak jsme je zavedli. ___j Matice bilineární formy j___ Jestliže zvolíme bázi anaVa definujeme pro danou bilineární formu a skaláry — a(ui,Uj), pak zjevně dostaneme pro vektory v, w se souřadnicemi x a y (jakožto sloupce souřadnic) n a (v, w) = aijXiyj = yT ■ A ■ x, i,j=\ kde A je matice A = (ay). 99 KAPITOLA 2. POČÍTÁNÍ S VEKTORY -1 1\ /l 0 0 1 0 1 ľ 0 1 0 0 1 1° 0 0 ' 2 1 1\ 51 25 n I \ . 3 3 3 / od báze (wi, u2, w3) ke standardní bázi a od standardní báze k bázi (u\, u2, uí) získáme □ I. Báze a skalární součiny Pomocí skalárního součinu umíme řešit jiným způsobem (lépe?) problémy, které jsme již dříve zvládli pomocí transformace souřadnic. 2.57. V prostoru K3 napište matici zobrazení kolmé projekce do roviny procházející počátkem a kolmé na vektor (1,1, 1). Řešení. Obraz libovolného bodu (vektoru) x = (xi,x2,x3) e K3 v uvažovaném zobrazení získáme tak, že od daného bodu odečteme jeho kolmou projekci do normálového směru dané roviny, tedy do směru (1, 1, 1). Tato projekce p je dána (viz 2.3) jako y -A ■ x). 4. Vlastnosti lineárních zobrazení Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k lepšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabízejí. 2.45. Začneme čtyřmi příklady v nejnižší zajímavé dimenzi. Ve standardní bázi roviny R2 se standardním skalárním součinem uvažujme následující matice zobrazení / : R2 -» R2: *-(; s)-'-G i)-c-C !)■»-(! «')■ Matice A zadává kolmou projekci podél podprostoru W c {(0,a); íiel]cl2 na podprostor V c {(íz,0); ii6i|c; tj. projekce na osu x podél osy y. Evidentně pro toto zobrazení / : R2 -» R2 platí f o f = fa tedy zúžení /1 v daného zobrazení na obor hodnot je identické zobrazení. Jádrem / je právě podprostor W. Matice B má vlastnost B2 = 0, platí tedy totéž o příslušném zobrazení /. Můžeme si jej představit jako matici derivování polynomů RiM stupně nejvýše jedna v bázi (1, x) (derivacemi se budeme podrobně zabývat v kapitole páté, viz 5.6). Matice C zadává zobrazení /, které první vektor báze zvětší a-krát, druhý b-krát. Tady se nám tedy celá rovina rozpadá na dva podprostory, které jsou zobrazením / zachovány a ve kterých jde o pouhou homotetíi, tj. roztažení skalárním násobkem (první příklad byl speciální případem s a = 1, b = 0). Např. volba a = 1, b = — 1 odpovídá osové symetrii (zrcadlení) podle osy x, což je totéž jako komplexní konjugace x +iy \-> x —iy na dvourozměrném reálném prostoru R2 ~ C v bázi (1,0- Toto je lineární zobrazení dvourozměrného reálného vektorového prostoru C, nikoliv však jednorozměrného komplexního prostoru C. Matice D je maticí rotace o pravý úhel ve standardní bázi a na první pohled je vidět, že žádný jednorozměrný podprostor není zobrazením zachováván. Taková rotace je bijekcí roviny na sebe, proto jistě umíme najít (různé) báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto případě totéž s jednou bází na definičním oboru i oboru hodnot. 100 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Uvedená matice je tedy hledanou maticí uvažovaného zrcadlení. Uvedený postup můžeme technicky také provést následujícím (myšlenkově shodnýym) způsobem. Normovaný normálový vektor je n = ■^j(l, 1, 1). Zrcadlení Z na vektoru v lze pak vyjádřit Zv = v — 2{v, n)n = v — 2n ■ (nT ■ v) = v — 2{n ■ nT) ■ v = ((E — 2n ■ nT)v (pro standardní skalární součin je (v, n) = v ■ nT; dále jsme využili asociativity násobení „•" matic). Matice zrcadlení je tedy E — 2n ■ n □ 2.59. V K3 je dána standardní souřadnicová soustava. V rovině z = 0 je umístěno zrcadlo a v bodě [4, 3, 5] svíčka. Pozorovatel v bodě [1, 2, 3] o zrcadle neví, ale pozoruje odrazem v něm svíčku. V jakém bodě se mu jeví, že je svíčka umístěna? Řešení. V zrcadle vidíme vždy (nezávisle na naší poloze) zrcadlový obraz pozorovaných objektů. Svíčka se tedy jeví v bodě, který je zrcadlovým obrazem skutečné polohy podle roviny zrcadla, tedy podle roviny z = 0. Zrcadlení podle této roviny má jednoduchý předpis, stačí změnit znaménko u souřadnice z zobrazovaného bodu (rozmysli). Svíčku tudíž vidí pozorovatel v bodě [4, 3, —5]. □ Pomocí skalárního součinu můžeme určovat odchylky vektorů: 2.60. Určete odchylku kořenů polynomu x2 — i uvažovaných jako vektory v komplexní rovině. Řešení. Kořeny daného polynomu jsou druhé odmocniny z i. Argumenty druhých odmocnin z libovolného nenulového komplexního čísla se podle Moivreovy věty liší o jt. Jejich odchylka tedy bude vždy 7t. □ 2.61. Určete cosinus odchylky přímek p,q vR3 daných obecnými rovnicemi jako p : —2x + y + z = 1, x + 3y-4z= 5, q : x — y = —2, 2.62. Pomocí Gramova-Schmidtova ortogonalizačního procesu získejte ortogonální bázi podprostoru U = {(x\, X2, X3, Xi)T € K4 | X\ + X2 + X3 + X4 = 0} prostoru K4. Zkusme však uvažovat matici D jako matici zobrazení : C2 -> C2 ve standardní bázi komplexního vektorového prostoru C2. Pak umíme najít vektory (i, 1), (0 - -1 o - (—i, 1), pro které bude platit ČR/)-- (tm:;: To ale znamená, že v bázi (u, v) na C2 má zobrazení g matici K = (ó 0 Povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky a — cos( jtt) + i sin(^) a komplexně sdružené ä. Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení. Tomu lze snadno porozumět, když si označíme reálnou a imaginární část vektoru u takto iyu — Re u + / Im u — Vektor v je komplexně sdružený k u. Zajímá nás zúžení zobrazení g na reálný vektorový podprostor V — R2 n {u, v) c C2. Evidentně j e V = {u +ú, i(u - ú)) = (xu, -yu) celá reálná rovina R2. Zúžení zobrazení g na tuto rovinu je právě původní zobrazení dané maticí A a z definice násobení komplexní jednotkou jde o otočení o úhel \n v kladném smyslu ve vztahu ke zvolené bázi xu, —yu (ověřte si přímým výpočtem a uvědomte si také, proč případné prohození pořadí vektorů uav povede k témuž výsledku, byť v jiné reálné bázi!). 2.46. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v předchozích příkladech byly odpovědi na otázku , jaké jsou vektory splňující rovnici f(u) = a ■ m pro nějaké vhodné skaláry a?". Zvolme tedy pevně lineární zobrazeni / : V —> V na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých bázích, jde o výraz A ■ x — a ■ x — (A — a ■ E) ■ x — 0. Zdřívějška víme, že takovásoustavarovnicmájediné řešení* = 0, právě když je matice A — a E invertibilní, viz odstavec 2.13. My tedy chceme najít takové hodnoty a e K, pro které naopak A—a E invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta 2.23) (2.4) det(A - a-E) = 0. Jestliže považujeme A. = a za proměnnou v předchozí skalární rovnici, hledáme ve skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše, kořeny mohou, ale nemusí existovat podle volby pole skalárů K. .__| Vlastní čísla a vlastní vektory |__-- Skaláry k vyhovující rovnici f(u) — k-u pro nenulový vektor u e V nazýváme vlastní čísla zobrazení f, příslušné nenulové vektory u pak vlastní vektory zobrazení f. 101 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Řešení. Množina řešení uvedené homogenní lineárni rovnice je zrejmé vektorovým prostorem s bází /-l\ 1 0 V 0 / U2 ■ 0 1 Vo/ «3 0 o V 1 J Vektory ortogonální báze získané užitím Gramová-Schmidtova orto-gonalizačního procesu. Budeme značit v\, v2, v3. Nejprve položme v\ = u\. Dále 1 V2 = U2 • V\ = U2 ■ 1 1 -,—, 1,0 2 2 Ikill2 2 resp. zvolme násobek v2 = (— 1, — 1, 2, 0)r. Následně je T T «3 = «3 ul ■ V\ ul ■ V2 1 1 Dl 1 1 1 "3'~3'~3 Máme tedy celkem V2 = U3 - - Dl - - V2 ■■ \\v2\\2 2 6 , 1 /-A /-A /-A l -l -l Dl = 0 2 -l w w W Dodejme, že pro jednoduchost příkladu lze bezprostředně uvést ortogonální bázi z vektorů (1,-1,0, O)7-, (0,0, 1,-l)r, (1,1,-1,-l)r nebo (-1,1, 1,-l)r , (1,-1, 1,-l)r , (-1,-1, 1, l)r . □ 2.63. Určete nějakou bázi vektorového prostoru antisymetrických reálných čtvercových matic typu 4x4. Uvažte standardní skalární součin v této bázi a pomocí tohoto součinu vyjádřete velikost matice /O 3 1 0\ -3 0 1 2 -1 -1 0 2 v 0 -2 -2 °/ 2.64. Najděte ortogonální doplněk f/± podprostoru U = {{x\, x2, *3, Xa) I X\ = x3, x2 = X3 + 6x4} c K4. Řešení. Ortogonální doplněk f/± tvoří právě ty vektory, které jsou kolmé na každé řešení soustavy x\ — x3 = 0, 0. x3 x2 — X3 — 6x4 Vektor je ovšem řešením této soustavy tehdy a jenom tehdy, když je kolmý na oba vektory (1, 0, —1, 0), (0,1, —1, —6). Je tedy U± = {a- (1, 0, -1, 0) + b ■ (0, 1, -1, -6) I a, b e K}. □ Jsou-li u, v vlastní vektory příslušné k témuž vlastnímu číslu A., pak i pro jejich jakoukoliv lineární kombinaci platí f (au + bv) = af(u) + b f (v) — X(au + bv). Proto tvoří vlastní vektory příslušné k vlastnímu číslu A., společně s nulovým vektorem, netriviální vektorový podprostor Vx, tzv. vlastní podprostor příslušný A.. Např., je-li X — 0 vlastním číslem, je jádro Ker / vlastním podprostorem Vq. Z definice vlastních čísel je zřejmé, že jejich výpočet nemůže záviset na volbě báze a tedy matice zobrazení /. Skutečně, jako přímý důsledek transformačních vlastností z odstavce 2.38 a Cau-chyovy věty 2.19 pro výpočet determinantu součinu dostáváme jinou volbou souřadnic matici A' — P^1 AP s invertibilní maticí P a \P~lAP - XE\ = \P^AP - P^XEP\ = = \P-\A-XE)P\ = \P-1\\(A-XE\\P\ = = \ A-\E\, protože násobení skalárů je komutativní a — | P|~1. Z těchto důvodů používáme pro matice a zobrazení společnou terminologii: Charakteristický polynom matice a zobrazení [ Pro matici A dimenze n nad K nazýváme polynom \A — XE\ e Kn[X] charakteristický polynom matice A. Kořeny tohoto polynomu jsou vlastní čísla matice A. Je-li A matice zobrazení / : V —> V v jisté bázi, pak \A — XE\ nazýváme také charakteristický polynom zobrazení f. Protože je charakteristický polynom lineárního zobrazení / : V —> V nezávislý na volbě báze V, jsou i jeho koeficienty u jednotlivých mocnin proměnné X skaláry vyjadřující vlastnosti zobrazení /, tj. nemohou záviset na naší volbě báze. Zejména jako jednoduché cvičení na počítání determinantů vyjádříme koeficienty u nejvyšších a nejnižších mocnin (předpokládáme dim V — n a matici zobrazení A — (ay) v nějaké bázi): \A - X ■ E\ = (-lfXn + (-l)n-\an -+ --- + \A\-X°. ■ + ann) ■ X" l + Koeficient u nejvyšší mocniny jen říká, zda je dimenze prostoru V sudá nebo lichá. O determinantu matice zobrazení jsme už zmiňovali, že vyjadřuje, kolikrát dané lineární zobrazení zvětšuje objemy. Zajímavé je, že i součet diagonálních členů matice zobrazení nezávisí na volbě báze. Nazýváme jej stopa matice a značíme TrA. Stopa zobrazení je definována jako stopa jeho matice v libovolné bázi. Ve skutečnosti to natolik překvapivé není, protože metodami z kapitoly osmé je snadné ověřit, že stopa je ve skutečnosti lineárním přiblížením determinantu v okolí jednotkové matice E (uvažujeme determinant vyčíslený na maticích v křivce t \-> E + t A, tj. tzv. derivaci determinantu ve směru A). V dalším si uvedeme několik podstatných vlastností vlastních podprostoru. 2.47. Věta. Vlastní vektory lineárního zobrazení f : V —> V příslušné různým vlastním hodnotám jsou lineárně nezávislé. 102 KAPITOLA 2. POČÍTÁNÍ S VEKTORY 2.65. Nalezněte nějakou ortonormální bázi podprostoru ľcl, kde V = [(xi,x2, x3, xí) € K4 | x\ + 2*2 + x3 = 0}. Řešení. Vidíme, že čtvrtá souřadnice se v omezení na podprostor nevyskytuje, bude tedy vhodné volit za jeden z vektorů hledané ortonormální báze vektor (0, 0, 0, 1) a redukovat problém do prostoru K3. I dále se zkusíme vyhnout počítání: vidíme, že položíme-li druhou souřadnici rovnu nule, tak ve vyšetřovaném prostoru leží vektory s opačnou první a třetí souřadnicí, zejména jednotkový vektor (■^j, 0, — 0). Na tento vektor je kolmý libovolný vektor, který má stejnou první a třetí souřadnici. Abychom se dostali do uvažovaného podprostoru, volíme druhou souřadnici rovnu záporné hodnotě součtu první a třetí souřadnice a normujeme, tedy volíme vektor <7S' 7S' °> aJsme hotovi- □ J. Vlastní čísla a vlastní vektory 2.66. Nalezněte vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice /-l 1 0\ A = 1-1 3 0 . \2 -2 2/ Řešení. Nejprve sestavíme charakteristický polynom dané matice: -1 - X -1 2 1 3-A. -2 0 0 2 — X X' ■ 4X3 + 2X+4. Tento polynom má kořeny 2,1 + \/3,1 — VŠ, což jsou tak vlastní čísla zadané matice. Jejich algebraická násobnost je jedna (jsou to jednoduché kořeny charakteristického polynomu), každému tedy bude odpovídat právě jeden (až na nenulový násobek) vlastní vektor (tj. jejich tzv. geometrická násobnost bude také jedna, viz 2.52). Určeme vlastní vektor příslušný vlastnímu číslu 2 (je řešením homogenní lineární soustavy s maticí A — 2E): -3xi + —x\ + 2x\ — Soustava má řešení x\ = x2 = 0, x3 e K libovolné, vlastním vektorem příslušným vlastní hodnotě 2 je tedy například vektor (0, 0, 1) (a libovolný jeho nenulový násobek). Analogickým způsobem určíme i zbývající dva vlastní vektory jakožto řešení soustavy [A — (1 + */3)E]x = 0, respektive [A — (1 + */3)E]x = 0. Řešením soustavy (-2 - V3)*i + x2 = 0, -x-i + (2 - V3>2 = 0, 2xi - 2x2 + (1 - V3)x3 = 0 x2 x2 2x2 Důkaz. Nechť a\, ..., ai jsou různé vlastní hodnoty zobrazení / a u\, ..., u k vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet lineárně I nezávislých vektorů mezi zvolenými. Předpokládejme, že u\, ... ,ui jsou lineárně nezávislé a ui+\ — c,m; je jejich lineární kombinací. Alespoň í — 1 lze zvolit, protože vlastní vektory jsou nenulové. Pak ovšem f (ui+\) — ai+\ ■ "í+i — y!í=i ai+\ ■ q ■ uí, tj. l l l /("í+l) = Odečtením druhého a čtvrtého výrazu v rovnostech dostáváme 0 — lZ\=\(ai+\ — cli) ■ cí ■ uí. Všechny rozdíly vlastních hodnot jsou však nenulové a alespoň jeden koeficient c, je nenulový. To je spor s předpokládanou nezávislostí u \, ..., m, takže i vektor m;+i musí být lineárně nezávislý na předchozích. □ Na právě dokázané tvrzení se můžeme podívat jako na rozklad lineárního zobrazení / na součet jednoduchých zobrazení. Pro vesměs různé vlastní hodnoty A., charakteristického polynomu budeme dostávat jednorozměrné vlastní podprostory Vx, ■ Každý z nich pak zadává projekci na tento invariantní jednorozměrný podprostor, na němž je zobrazení dáno jako násobení vlastním číslem A.,. Celý prostor V je tak rozložen na přímý součet jednotlivých vlastních podprostoru. Navíc lze tento rozklad na vlastní podprostory snadno spočíst: __\ báze z vlastních vektorů |___ Důsledek. Jestliže existuje n navzájem různých kořenů xí charakteristického polynomu zobrazení f : V —> V na n-rozměrném prostoru V, pak existuje rozklad V na přímý součet vlastních podprostoru dimenze 1. To znamená, že existuje báze V složená výhradně z vlastních vektorů a v této bázi má f diagonální matici. Tato báze je určena jednoznačně až na pořadí prvků. Příslušnou bázi (vyjádřenou v souřadnicích vzhledem k libovolně zvolené bázi V) obdržíme řešením n systémů homogenních lineárních rovnic o n neznámých s maticemi (A — A.,- • E), kde A je matice f ve zvolené bázi. 2.48. Invariantní podprostory. Viděli jsme, že každý vlastní vektor v zobrazení / : V —> V generuje podprostor (v) c V, který je zobrazením / zachováván. Obecněji říkáme, že vektorový podprostor W c V je invariantní podprostor pro lineární zobrazení /Jestliže platí f(W) c W. Jestliže je V konečně rozměrný vektorový prostor a vybereme něj akou bázi (u i, ..., u j-) podprostoru W, můžeme ji vždy doplnit na bázi (mi, ..., ui, Uk+\, ... ,u„) celého V a v každé takové bázi má naše zobrazení matici A tvaru (2.5) A = / B C kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n — k a C je matice typu n/(n — k). Naopak, jestliže je v nějaké bázi (mi, ..., u„) matice zobrazení / tvaru (2.5), je W — (u\, ... ,uk) invariantní podprostor zobrazení /. 103 KAPITOLA 2. POČÍTÁNÍ S VEKTORY je prostor {((^r ~~ l) ř> ~~ §) > r £ I^J. To je tedy prostor vlastních vektoru příslušných vlastní hodnotě 1 + VŠ (mimo nulového vektoru, který sice je řešením dané soustavy, ale za vlastní vektor jej nepovažujeme; tuto záležitost již nebudeme více zmiňovat a nebudeme nulový vektor explicitně vylučovat z množiny řešení). Obdobně pak dostaneme, že prostor vlastních vektoru příslušných vlastní hodnotě 1 - VŠ je ((-1 - ^, -\, 1)). □ 2.67. Příklad i se změnou báze. Určete vlastní čísla a vlastní vektory matice /l 1 0\ A = 1 2 1 . V 2 V Popište geometrickou interpretaci tohoto zobrazení a napište jeho matici v bázi: e2 e3 (1,-1,1), (1,2, 0), (0, 1, 1). Řešení. Charakteristický polynom dané matice je 1 - X 1 1 1 0 2 — X 1 2 1 - X -X3 + 4X2 ■ ■2X -X(X — 4X + 2). Kořeny tohoto polynomu, vlastní čísla, udávají, kdy nebude mít matice íl — X (: plnou hodnost, tedy soustava rovnic íl — X 1 0 1 2-X 1 \ 1 2 l-X bude mít i jiné řešení než řešení x = (0, 0, 0). Vlastní čísla tedy jsou 0, 2 + \fl, 2 — 42. Spočítejme vlastní vektory příslušné jednotlivým vlastním hodnotám: • 0: Rešíme tedy soustavu Jejím rešením je jednodimenzionální vektorový prostor vlastních vektoru ((1,-1, 1)). • 2 + 42: Řešíme soustavu /_(! + 42) 1 0 \ íxx\ 1 -42 1 \\x2 \ 1 2 -(1 + 42)) W 0. Pochopitelně bude v naší matici zobrazení (2.5) submatice C nulová právě tehdy, když bude i podprostor (mí+i , ..., un) generovaný doplněnými vektory báze invariantní. Z tohoto pohledu jsou vlastní podprostory lineárního zobrazení extrémní případy invariantních podprostorů a zejména v případě existence n — dim V různých vlastních čísel zobrazení / dostáváme rozklad V na přímý součet n vlastních podprostorů. V příslušné bázi z vlastních vektorů má pak naše zobrazení diagonální tvar s vlastními čísly na diagonále. 2.49. Vlastní čísla a vlastní vektory mohou sloužit k názornému popisu lineárních zobrazení, zejména vE2ar. (1) Uvažme zobrazení s maticí ve standardní bázi Pak dostáváme |A-A.£| = s kořeny A.12 = L A. = 1 se spočtou: —A. 0 1 x3 ■ o 1 — A. 0 -1. Vlastní vektory s vlastní hodnotou 0 0 s bází prostoru řešení, tj. všech vlastních vektorů s touto vlastní hodnotou ui = (0,1,0), M2 = (1,0,1). Podobně pro X — — 1 dostáváme třetí nezávislý vlastní vektor 1 0 0 2 1 0 1 0 0 2 0 0 m3 ■ ■(-1,0,1). V bázi u\, u2, m3 (všimněte si, že «3 musí být lineárně nezávislý na zbylých dvou díky větě 2.47 a u\, u2 vyšly jako dvě nezávislá řešení) má / diagonální matici 10 0 0 1 0 ,0 0 -1 Celý prostor R3 je přímým součtem vlastních podprostorů, M3 = V\ e V2, dimVi = 2, dim72 = 1. Tento rozklad je dán jednoznačně a vypovídá mnoho o geometrických vlastnostech zobrazení /. Vlastní podprostor V\ je navíc přímým součtem jednorozměrných vlastních podprostorů, které lze však zvolit mnoha různými způsoby (takový další rozklad nemá tedy již žádný geometrický význam). (2) Uvažme lineární zobrazení / : K2W —»■ R2M definované derivováním polynomů, tj. f (ľ) = 0, f (x) = 1, f (x2) — 2x. Zobrazení / má tedy v obvyklé bázi (1, x, x2) matici /0 1 0^ A = 0 0 2 \0 0 oJ 104 KAPITOLA 2. POČÍTÁNÍ S VEKTORY 0. Řešením je prostor |(l,l + VI, 1 +Vi)), který je jednodi menzionální. • 2 — VI Rešíme soustavu ({sfl - 1) 1 0 1 VI 1 v 1 2 (VI-1) Řešením je prostor vlastních vektoru ((1, 1 - VI, 1 - vi) Daná matice má vlastní čísla 0, 2 + VI a 2 — VI, kterým přísluší po řadě jednorozměrné prostory vlastních vektorů ((1, —1,1)), <(1, 1 + VI, 1 + VI)) a <(1,1 - VI, 1 - VI)). Zobrazení tedy můžeme interpretovat jako projekci podél vektoru (1, —1,1) do roviny dané vektory (1, 1 + VI, 1 + VI) a (1,1 — VI, 1 — VI) složenou s lineárním zobrazením daným „natažením" daným vlastními čísly ve směru uvedených vlastních vektorů. Nyní jej vyjádřeme v uvedené bázi. K tomu budeme potřebovat matici přechodu T od standardní báze k dané nové bázi. Tu získáme tak, že souřadnice vektorů staré báze v bázi nové napíšeme do sloupců matice T. My však snadněji zapíšeme matici přechodu od dané báze Charakteristický polynom je | A—A.-E\ — —k , existuje tedy pouze jediná vlastní hodnota A. = 0. Spočtěme vlastní vektory: Souřadnice vektorů nové báze k bázi standardní, tedy matici T l. pouze zapíšeme do sloupců: Potom 0 0 1 \ 1 0 -1 , \-2 1 3/ a pro matici B zobrazení v nové bázi pak máme (viz 2.38) /O 5 2\ B = T AT'1 =0 -2 -1 . \0 14 6 / 1-1 □ 2.68. Pro libovolnou n x n matici A je její charakteristický polynom \ A — X E \ stupně n tvaru I A - X E I = c„ X" + c„_i X"-1 H-----h ci X + c0, cn ^ 0, přičemž platí cn = (-!)", c_i = (-l)"-1trA, co = \A\. Jestliže je matice A trojrozměrná, obdržíme \A-XE\ = -X3 + (tr A) X2 + c\ X + | A |. Volbou X = 1 dostáváme |A-£| = -l+trA + ci + |A|. 0 1 0 0 0 2 0 0 0 0 1 0 0 0 1 0 0 0 Prostor vlastních vektorů je tedy jednorozměrný, generovaný konstantním polynomem 1. 2.50. Ortogonální zobrazení. Podívejme se teď na speciální W případ zobrazení / : V -» W mezi prostory se „ ,0*^ skalárními součiny, která zachovávají velikosti pro <^mj*á^-~^ všechny vektory u e V. __\ Definice ortogonálních zobrazení - Lineární zobrazení / : V -» W mezi prostory se skalárním součinem se nazývá ortogonální zobrazení, jestliže pro všechny u e V platí Z linearity / a ze symetrie skalárního součinu vyplývá pro všechny dvojice vektorů rovnost (f(u + v),f(u + v)} ■ (f(u), f(u)) + (f(v), f(v)) + + 2(f(u),f(v)). Proto všechny ortogonální zobrazení splňují i zdánlivě silnější požadavek, aby platilo pro všechny vektory u, v e V (f(u),f(v)) = (u,v). V úvodní diskusi o geometrii v rovině jsme ve Větě 1.33 dokázali, že lineární zobrazení M? —> M? zachovává velikosti vektorů, právě když jeho matice ve standardní bázi (a ta je ortonormální vzhledem ke standardnímu skalárnímu součinu) splňuje AT ■ A = £,tj. A-1 = AT. Obecně, ortogonální zobrazení / V —> W musí být vždy injektivní, protože podmínka (f(u), f (u)) — 0 znamená i ( u,u } = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru /. Pak ovšem je dimenze obrazu rovna dimenzi oboru hodnot a víme, že / : V —> Im / je bijekce. Pokud Im / 7^ W, doplníme ortonormální bázi na obrazu / na ortonormální bázi cílového prostoru a matice zobrazení bude obsahovat čtvercovou regulární matici A doplněnou nulovými řádky na potřebnou velikost. Bez újmy na obecnosti tedy předpokládejme W — V. Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a y v prostoru K" toto: (A-x)' ■(A-y)=x1 ■ (A -A)-y- ■y- Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že AT ■ A — E, tedy tentýž výsledek jako v dimenzi dvě. Dokázali jsme tak následující tvrzení: ._ Matice ortogonálních zobrazení I___ Věta. Nechť V je reálný vektorový prostor se skalárním součinem a f : V —> V je lineární zobrazení. Pak f je ortogonální, právě když v některé ortonormální bázi (a pak už ve všech) má matici A splňující AT — A-1. 105 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Odsud získáváme vyjádření |A-A£| = -A3 + (trA)A2 + (|A-£| + l-trA-|A|)A. + |A|. Využijte toto vyjádření k určení charakteristického polynomu a vlastních hodnot matice /32 -67 47 \ A = 7 -14 13 . \-7 15 -6/ Další základní příklady na vlastní čísla a vektory matic naleznete na straně 116 2.69. Paulino matice. Ve fyzice se stav částice se spinem \ popisuje Pauliho maticemi. Jsou to následující matice 2x2 nad komplexními čísly /O A /O -i\ (l 0 a' = \i o)'ff2 = {i oJ'ff3 = (o -1, Pro čtvercové matice definujeme jejich komutátor (značený hranatými závorkami) jako [o\, a2] := o\o2 — o2o\. Ukažte, že platí [ffi,^] = 2icr3 a podobně [cri,cr3] = 2ia2 a [a2, 03] = 2io\. Dále ukažte, že a2 = a\ = a2 = 1 a že vlastní hodnoty matic a\,a2, cr3 jsou ±1. Ukažte, že pro matice popisující stav částice se spinem 1 fo 1 o\ 1 /O -i 0 \ /l 0 o \ 1 0 1 , — i 0 -1,00 o to 1 0/ ^2 \0 i o / \o o -1/ platí stejné komutační relace jako v případě Pauliho matic. Ekvivalentně lze ukázat, že při označení 1 0 0 1 103, / := ia2, K := io\ tvoří vektorový prostor s bází (1,1, J, K) algebru kvaternionů (algebra je vektorový prostor s binární bilineární operací násobení; v tomto případě je toto násobení dáno násobením matic). K tomu, aby uvažovaný prostor byl skutečně algebrou kvaternionů, je nutné a stačí ukázat následující vlastnosti: I2 = J2 = K2 = —1 a IJ = — JI = K, J K = -KJ = 1 nKI = -IK = J. 2.70. Uvedte dimenze vlastních podprostorů jednotlivých vlastních hodnot A, matice (4 0 0 0\ 1 4 0 0 5 2 3 0 \o 4 0 V O 2.71. Lze vyjádřit matici 5 6 6 5 Důkaz. Skutečně, jestliže zachovává / velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. □ Čtvercovým maticím, které splňují rovnost AT — A-1, říkáme ortogonální matice. Důsledkem předchozí věty je také popis všech matic přechodu 5 mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení K" —> K" zachovávající velikosti a splňují tady také právě podmínku — ST. Při přechodu od jedné ortonormální báze ke druhé se tedy matice (libovolných) lineárních zobrazení mění podle vztahu A' = STA S . 2.51. Rozklad ortogonálního zobrazení. Podívejme se nyní po-^ ., drobněji na vlastní vektory a vlastní čísla ortogonálních C«J^> zobrazení na reálném vektorovém prostoru V se skalárním ŕdJ^ součinem. ' ÍÍUVažujme pevně zvolené ortogonální zobrazení / : V -> V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako s maticí rotace D v příkladu 2.45. Nejprve se ale podívejme obecně na invariantní podprostory ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W c V a ortogonální zobrazení / : V —> V platí f(W) c W, pak také platí pro všechny v e W±, w e W (f(v), w) = (f(v), f o f-\w)) = (v, r\w)) = 0, protože i f~l(w) e W. To ale znamená, že také f (W^) c W^. Dokázali jsme tedy jednoduché, ale velice důležité tvrzení: Tvrzení. Ortogonální doplněk k invariantnímu podprostorů je také invariantní. Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení / na ortogonální doplněk invariantního podprostorů je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zobrazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Zformulujeme rovnou výsledek: I Rozklad ortogonálních zobrazení _. L Věta. Nechť f : V —> V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům X — ±1 a dvourozměrné podprostory Px -k, na kterých působí f rotací o úhel rovný argumentu komplexního čísla A. v kladném směru. Všechny tyto různé podprostory jsou po dvou ortogonální. Důkaz. Bez újmy na obecnosti můžeme pracovat s prostorem V = W" se standardním skalárním součinem. Zobrazení tedy bude dáno ortogonální matici A, kterou můžeme stejně považovat za matici lineárního zobra-*' zení na komplexním prostoru Cm (která je jen shodou okolností reálná). Zaručeně bude existovat právě m (komplexních) 106 KAPITOLA 2. POČÍTÁNÍ S VEKTORY ve tvaru součinu B = PlDP pro nějakou diagonální matici D a invertibilní matici PI Pokud je to možné, udejte príklad takové dvojice matic D, P a zjistěte, kolik takových dvojic existuje. O Jak jsme viděli v ||2.67||, na základě vlastních hodnot a vektorů dané matice 3x3 umíme často geometricky interpretovat zobrazení, které tato matice zadává ve standardní bázi v K3. Umíme to zejména v těchto situacích: Má-li matice vlastní číslo 0 a vlastní číslo 1 s geometrickou násobností 2, tak se jedná o projekci ve směru vlastního vektoru příslušného vlastní hodnotě 0 na rovinu vlastních vektorů příslušných vlastní hodnotě 1. Pokud je vlastní vektor příslušný vlastní hodnotě 0 kolmý na rovinu vlastních vektorů příslušných hodnotě 1, pak se jedná o kolmou projekci. Má-li matice vlastní číslo — 1 s vlastním vektorem kolmým na rovinu vlastních vektorů příslušných vlastní hodnotě 1, jde o zrcadlení podle roviny vlastních vektorů příslušných vlastní hodnotě 1. Má-li matice vlastní číslo 1 s vlastním vektorem kolmým na rovinu vlastních vektorů příslušných vlastní hodnotě —1, jedná se o osovou symetrii (v prostoru) podle osy dané vlastním vektorem příslušným vlastní hodnotě 1. 2.72. Určete geometrický význam lineárního zobrazení K3 —► K3 zadaného maticí Řešení. Matice má dvojnásobnou vlastní hodnotu — 1, jí příslušný prostor vlastních vektorů je ((2,0, 1), (1,1,0)). Dále má matice vlastní hodnotu 0, s vlastním vektorem (1, 4, —3). Zobrazení dané touto maticí ve standardní bázi je tudíž projekce podle vektoru (1,4, 3) následovaná středovou symetrií podle počátku. □ 2.73. Věta 2.51 nám dává do ruky nástroje, jak poznat matici rotace v K3: má tři různá vlastní čísla s absolutní hodnotou 1, jedno z nich je přímo číslo 1 (jemu příslušný vlastní vektor je osa rotace). Argument zbylých dvou, tedy nutně komplexně sdružených, vlastních čísel potom udává úhel rotace v kladném smyslu v rovině určené bází ux + ul, i[uk - wl]. 2.74. Určete, jaké lineární zobrazení zadává matice kořenů charakteristického polynomu, včetně jejich algebraické násobnosti (viz tzv. základní věta algebry, 11.20 na str. 663). Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů A. a A.. Příslušné vlastní vektory v Cm k takové dvojici komplexně sdružených vlastních čísel budou řešením dvou komplexně sdružených systémů homogenních lineárních rovnic, neboť příslušné matice systémů rovnic jsou celé reálné, až na samotná dosazená vlastní čísla. Evidentně proto budou také řešení těchto systémů komplexně sdružené vektory. Nyní využijeme skutečnost, že ke každému invariantnímu pod-prostoru je i jeho ortogonální doplněk invariantní. Nejprve si najdeme všechny vlastní podprostory V±\ příslušné k reálným vlastním hodnotám a zúžíme naše zobrazení na ortogonální doplněk k jejich součtu. Bez újmy na obecnosti tedy můžeme předpokládat, že naše ortogonální zobrazení nemá žádná reálná vlastní čísla a že je dim V — 2n > 0. Zvolme nyní nějaké vlastní číslo A. a označme ux vlastní vektor příslušný k vlastnímu číslu X — a + ifi, fi ^ 0. Zcela stejně jako v případě rotace v rovině zadané v odstavci 2.45 maticí D nás zajímá reálná část součtu dvou jednorozměrných podprostorů ("x) © (tik), kde úx je vlastní vektor příslušný k vlastnímu číslu A.. Jde o průnik uvedeného součtu komplexních podprostorů s R2™, který je generovaný vektory ux + ux & i(uk — "ú, tj. reálný vektorový podprostor Px c a imaginární částí ux generovaný bází danou reálnou xx=reux, -yx = -imux. Protože A - (ux + ux) ~ Ama + Xúx a podobně s druhým bázovým vektorem, jde zjevně o invariantní podprostor vůči násobení maticí A a dostáváme A-xk= axk + fiyx, A-yk = -ayx + fixk. Protože naše zobrazení zachovává velikosti, musí být navíc velikost vlastní hodnoty A rovna jedné. To ale neznamená nic jiného, než že zúžení našeho zobrazení na Px je rotací o argument vlastní hodnoty A. Všimněme si, že volba vlastního čísla Ä místo A vede na stejný podprostor se stejnou rotací, pouze ji dostaneme vyjádřenou v bázi xx, yx, tj. musíme v souřadnicích rotovat o úhel s opačným znaménkem. Důkaz celé věty je tím dokončen, protože zúžením našeho zobrazení na ortogonální doplněk a opakováním předchozí úvahy dostaneme celý rozklad po n krocích. □ K myšlenkám tohoto důkazu se ještě vrátíme v kapitole třetí, když budeme studovat komplexní rozšíření euklidovských vektorových prostorů, viz 3.26. Poznámka. Speciálně v dimenzi tři musí být alespoň jedno vlastní číslo ±1, protože je trojka liché číslo. Pak *ÍSPj^ ovšem příslušný vlastní podprostor je osou rotace '^^CL trojrozměrného prostoru o úhel daný argumentem — dalších vlastních čísel. Zkuste si rozmyslet, jak poznat, kterým směrem jde rotace a také, že vlastní číslo —1 znamená ještě dodatečné zrcadlení podle roviny kolmé na osu rotace. 107 KAPITOLA 2. POČÍTÁNÍ S VEKTORY Řešení. Již známym postupem zjistíme, že matice má následující vlastní čísla ajim příslušné vlastní vektory: 1, (1, 2, 0); | + (1,1+ i, — 1 — i); f — j', (1, 1 ——1 + 0- Přesto, že absolutní hodnoty všch vlastních hodnot jsou rovny jedné, nejedná se o rotaci, neboť daná matice není ortogonální. Jde tedy o matici rotace (všechna vlastní čísla mají absolutní hodnotu 1 a jedna z vlastních hodnot je přímo 1). Navíc víme, že se jedná o rotaci o arccos (|) = 0,295jr, což je argument vlastního čísla | + |i. Zbývá určit smysl otáčení. Nejprve je dobré si připomenout, že smysl otáčení se mění s orientací osy (nemá tedy smyslu hovořit o smyslu otáčení, pokud nemáme orientovánu jeho osu. Dle úvah v důkazu věty 2.51 působí daná matice otáčením o arccos (|)) v kladném smyslu v rovině dané bází ((0,1, —1), (1, 1, —1)). První vektor báze je imaginární částí vlastního vektoru příslušného vlastní hodnotě | +11, druhý pak je (společnou) reálnou částí vlastních vektorů příslušných komplexním vlastním hodnotám. Tady je důležité pořadí vektorů v bázi (prohozením vektorů se změní smysl otáčení). Osa otáčení je kolmá na uvažovanou rovinu. Pokud ji orientujeme podle pravidla pravé ruky (daný kolmý směr také dostaneme vektorovým součinem vektorů v bázi), tak bude smysl otáčení v prostoru souhlasit se smyslem otáčení v rovině s uvedenou bází. V našem případě dostaneme vektorovým součinem (0, 1, —1) x (1, 1, —1) = (0, —1, —1). Jedná se tedy o rotaci o arccos (f) v kladném smyslu kolem vektoru (0, — 1, — 1), neboli o rotaci o arccos (|) v záporném smyslu kolem vektoru (0, 1, 1). □ 2.75. Bez počítání napište spektrum lineárního zobrazení / : K3 —► K3 zadaného přiřazením (xu X2, 3) H» (xi + X3, X2, X\ + x3). O K diskusi vlastností matic a lineárních zobrazení se budeme vracet. Před pokračováním obecné teorie si napřed ukážeme v následující kapitole několik aplikací, ještě ale uzavřeme naši diskusi obecnou definicí: _ Spektrum lineárního zobrazení__ 2.52. Definice. Spektrum lineárního zobrazení f : V -» V (resp. matice) je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jakožto kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů. Spektrálním poloměrem lineárního zobrazení (matice) je nej větší z absolutní hodnot vlastních čísel. V této terminologii můžeme naše výsledky o ortogonálních zobrazeních zformulovat tak, že jejich spektra jsou vždy celá podmnožinou jednotkové kružnice v komplexní rovině. To znamená, že v reálné části spektra mohou být pouze hodnoty ± 1, jejichž algebraické a geometrické násobnosti jsou stejné. Komplexní hodnoty spektra pak odpovídají rotacím ve vhodných dvourozměrných pod-prostorech, které jsou na sebe po dvou kolmé. 108 KAPITOLA 2. POČÍTANÍ S VEKTORY K. Doplňující příklady k celé kapitole 2.76. Řešte soustavu X\ + x2 2x2 —X\ — X2 —2x\ + 3^2 + + x3 2X3 X3 3X3 X4 — 2X5 2X4 — 4X5 X4 + 2X5 — 6x5 3, 5, o, 2. Řešení. Rozšírená matice soustavy je / 1 1 1 1 -2 3 \ 0 2 2 2 -4 5 -1 -1 -1 1 2 0 V -2 3 3 0 -6 2/ Přičtením prvního řádku ke třetímu a jeho dvojnásobku ke čtvrtému a poté přičtením (—5/2)násobku druhého řádku ke čtvrtému obdržíme /1 1 1 1 -2 3 \ ( 1 1 1 1 -2 3 \ 0 2 2 2 -4 5 0 2 2 2 -4 5 0 0 0 2 0 3 0 0 0 2 0 3 v° 5 5 2 -10 *) 1° 0 0 -3 0 -9/2 / Poslední řádek je zřejmě násobkem předposledního, a tak jej můžeme vynechat. Pivoti se nacházejí v 1., 2. a 4. sloupci, proto jsou volné proměnné x3 a x5, které nahradíme reálnými parametry /, s. Uvažujeme tak soustavu X\ + x2 2X2 + + + + X4 2x4 2X4 2s As Víme tedy, že x4 = 3/2. Druhá rovnice dává 2x2 + 2r + 3 - As = 5, tj. x2 = 1 - t + 2s. Z první potom plyne xx + 1 - t + 2s + t + 3/2 - 2s = 3, tj. xx = 1/2. Celkem máme (2.1) (xi, x2, x3, x4, x5) = (1/2, 1 - t + 2s, t, 3/2, s), t,s el. Také v tomto příkladu znovu uvažujme rozšířenou matici a převedme ji pomocí řádkových úprav do schodovitého tvaru, kde první nenulové číslo v každém řádku je 1 a kde ve sloupci, ve kterém tato 1 je, jsou ostatní čísla 0. Ještě připomeňme, že čtvrtou rovnici, jež je kombinací prvních třech rovnic, budeme vynechávat. Po řadě vynásobením druhého a třetího řádku číslem 1/2, odečtením třetího řádku od druhého a od prvního a odečtením druhého řádku od prvního získáme ( 1 1 1 0 2 2 \ 0 0 o 1110 0 110 0 0 0 1 3\ / 1 1 1 1 -2 3 5 K - 0 1 1 1 -2 5/2 3/ v° 0 0 1 0 3/2 3/2 \ 0 0 0 0 1/2 1 ~ - 0 1 1 0 -2 1 3/2 / 0 0 1 0 3/2 109 KAPITOLA 2. POČÍTANÍ S VEKTORY Pokud opět zvolíme x3 = t, x5 = s (t, s e K), dostaneme odsud obecné řešení (||2.11|) ve stejném tvaru, a to bezprostředně. Uvažte příslušné rovnice xi = 1/2, x2 + t — 2s = 1, x4 = 3/2. □ 2.77. Najděte řešení soustavy lineárních rovnic zadané rozšířenou maticí / 3 3 2 1 3 \ 2 1 1 0 4 0 5 -4 3 1 \ 5 3 3 -3 5 J Řešení. Uvedenou rozšířenou matici upravíme na schodovitý tvar. Nejprve první a třetí řádek opíšeme a do druhého řádku napíšeme součet (—2)násobku prvního a 3násobku druhého řádku a do čtvrtého řádku součet 5násobku prvního a (—3)násobku posledního řádku. Takto získáme / 3 3 2 1 3 \ / 3 3 2 1 3 \ 2 1 1 0 4 0 -3 -1 -2 6 0 5 -4 3 1 0 5 -4 3 1 \5 3 3 -3 5 ) \0 6 1 14 °/ Opsání prvních dvou řádků a přičtení 5násobku druhého řádku k 3násobku třetího a jeho 2násobku ke čtvrtému řádku dává 2 1 -1 -2 -17 -1 -1 10 / 3 0 0 0 1 1 -2 3 14 3 \ 1 °J / 3 0 0 0 3 \ 33 12/ Pokud první, druhý a čtvrtý řádek opíšeme a ke třetímu přičteme čtvrtý, dostaneme / 3 3 2 1 3 í 3 3 2 1 3 \ 0 -3 -1 -2 6 0 -3 -1 -2 6 0 0 -17 -1 33 0 0 -18 9 45 v° 0 -1 10 12 ) 1° 0 -1 10 12 / Dále je (řádkové úpravy jsou již „obvyklé") ( 3 3 2 1 3 í 3 3 2 1 3 \ 0 -3 -1 -2 6 0 -3 -1 -2 6 0 0 -18 9 45 0 0 2 -1 -5 1° 0 -1 10 12 ) 1° 0 1 -10 -12 / / 3 3 2 1 3 / 3 3 2 1 3 \ 0 -3 -1 - -2 6 0 -3 -1 -2 6 0 0 1 - -10 -12 0 0 1 -10 -12 \ 0 0 2 - -1 -5 ) 1° 0 0 19 19 / Vidíme, že soustava má právě 1 řešení. Určeme ho zpětnou eliminací (3 3 2 0 -3 -1 0 0 1 1° 0 0 / 3 3 0 0 0 -3 0 0 0 0 1 0 1° 0 0 1 1 -2 -10 3 \ -12 / / 1 0 0 2 -1 1 0 2 \ -2 -2 1 2 \ -2 1 / 1 0 0 0 0 4 0 0 -2 1 0 -2 0 1 1 ) 110 KAPITOLA 2. POČÍTANÍ S VEKTORY Výsledek je tak x\ = 4, x2 = —2, x3 = —2, x4 = 1. □ 2.78. Uvedie všechna řešení homogenního systému x + y = 2z + v, z + 4u + v = 0, — 3u = 0, z =—v 4 lineárních rovnic 5 proměnných x, y, z, u, v. Řešení. Systém přepíšeme do matice tak, že v prvním sloupci budou koeficienty u x, ve druhém sloupci koeficienty u v, až v pátém sloupci koeficienty u v, přičemž všechny členy v každé rovnici převedeme na levou stranu. Tímto způsobem přísluší systému matice /l 1 —2 0 -l\ 0 0 14 1 0 0 0-30 \0 0 1 0 1 / Přičteme-li (4/3)-násobek třetího řádku ke druhému a odečteme-li poté druhý řádek od čtvrtého, obdržíme /l 1 0 0 0 o o -1\ 1 o /I 1 0 o o o o -1\ 1 o Dále vynásobíme třetí řádek číslem — 1 /3 a přičteme 2násobek druhého řádku k prvnímu, což dává /l 1 —2 0 -l\ /l 1 0 0 l\ 0 0 0 0 \0 0 0 0 1 0 0 0 10 1 0 0 0 1 0 \0 0 0 0 0/ /x\ /-A f-l\ y 1 0 z = t 0 + s -1 u 0 0 v) \°) K1) Z poslední matice můžeme přímo vypsat všechna řešení t, s e neboť máme matici ve schodovitém tvaru, přičemž první nenulové číslo v každém řádku je 1 a ve sloupci, kde se taková 1 nachází, jsou na ostatních pozicích 0. Výše uvedené řešení ve tvaru lineární kombinace dvou vektorů je určeno právě sloupci bez prvního nenulového čísla nějakého řádku, tj. druhým a pátým sloupcem, kdy volíme 1 jako druhou složku pro druhý sloupec a jako pátou složku pro pátý sloupec a kdy čísla v příslušném sloupci bereme s opačným znaménkem a umisťujeme je na pozici danou sloupcem, ve kterém je první 1 v jejich řádku. Dodejme, že výsledek je ihned možné přepsat do tvaru (x, y, z, u, v) = (—t — s, t, —s, 0, s) , t, s e K. □ 2.79. Zjistěte počet řešení soustav (a) + VŠx2 + \2xi Xl Xl 11X3 5X3 2X3 111 KAPITOLA 2. POČÍTANÍ S VEKTORY (b) 4xi + 2X2 — \2x3 = o, 5x-[ + 2X2 — x3 = o, 1x\ - X2 + 6x3 = 4; (c) 4xi + 2X2 — 12x3 = 0, + 2X2 — X3 = 1, 2x\ - x2 + 6x3 = 0. Řešení. Vektory (1,0, —5), (1, 0, 2) jsou očividně lineárně nezávislé (jeden není násobkem druhého) a vektor (12, */5,11) nemůže být jejich lineární kombinací (jeho druhá složka je nenulová), a proto matice, jejímiž řádky jsou tyto tři lineárně nezávislé vektory, je invertibilní. Soustava ve variantě (a) má tedy právě jedno řešení. U soustav ve variantách (b), (c) si stačí povšimnout, že je (4,2, -12) = -2(-2, -1,6). V případě (b) tak sečtení první rovnice s dvojnásobkem třetí dává 0 = 8- soustava nemá řešení; v případě (c) je třetí rovnice násobkem první - soustava má zřejmě nekonečně mnoho řešení. □ 2.80. Najděte (libovolný) lineární systém, jehož množina řešení je právě {(/ + 1, 2t, 3t, 4/); t e K}. Řešení. Takovým systémem je např. 2xi — X2 = 2, 2x2 — X4 = 0, 4x3 — 3x4 = 0. Těmto rovnicím totiž uvedené řešení vyhovuje pro každé rela vektory (2,-1,0,0), (0,2,0,-1), (0,0,4,-3) zadávající levé strany rovnic jsou zřejmě lineárně nezávislé (množina řešení obsahuje jeden parametr). □ 2.81. Stanovte hodnost matice / 1 -3 0 1 \ 1 -2 2-4 1 —10 1 v-2 -1 1 -2j Poté stanovte počet řešení systému lineárních rovnic X\ + X2 + X3 — 2X4 —3xi — 2x2 — X3 — X4 + 2x2 + X4 X\ — 4x2 + X3 — 2X4 a také všechna řešení systému Xl + x2 + x3 —3xi — 2x2 — X3 + 2x2 Xl — 4X2 + x3 112 = 4, = 5, = 1, = 3 - 2x4 = 0, - X4 = 0, + x4 = 0, - 2x4 = 0 KAPITOLA 2. POČÍTANÍ S VEKTORY a systému X\ — 3X2 = 1, x\ — 2x2 + 2*3 = —4, Xi — X2 =1, —2xi — X2 + X3 = —2. Řešení. Protože je det A = — 10, tedy nenulový, jsou sloupce matice A lineárně nezávislé, a tudíž se její hodnost rovná jejímu rozměru. První z uvedených třech systémů je zadán rozšířenou maticí / 1 1 1 -2 4 \ -3 -2 -1 -1 5 0 2 0 1 1 \ 1 -4 1 -2 3/ Ovšem levá strana je právě AT s determinantem \AT\ = \A\ ^ 0. Existuje tedy matice (AT) a soustava má právě 1 řešení (xux2, x3, x4)T = (ATy1 -(4,5, 1,3/ . Druhý ze systémů má totožnou levou stranu (určenou maticí AT) s prvním. Protože absolutní členy na pravé straně lineárních systémů neovlivňují počet řešení a protože každý homogenní systém má nulové řešení, dostáváme jako jediné řešení druhého systému uspořádanou čtveřici (x-i, x2, x3, xA) = (0,0, 0, 0). Třetí systém má rozšířenou matici / 1 -3 0 1 \ 1 -2 2 -4 1 -1 0 1 \ -2 -1 1 "2/ což je matice A (pouze poslední sloupec je uveden za svislou čarou). Pokud budeme tuto matici upravovat na schodovitý tvar, musíme obdržet řádek ( 0 0 0 I a ), kde a ^ 0. Víme totiž, že sloupec na pravé straně není lineární kombinací sloupců na levé straně (hodnost matice je 4). Tento systém nemá řešení. □ 2.82. Vyřešte systém homogenních lineárních rovnic zadaný maticí /0 V2 VŠ V6 0 \ 2 2 VŠ -2 -VŠ 0 2 VŠ 2V3 -VŠ \3 3 VŠ -3 0 / O 2.83. Určete všechna řešení systému X2 + X4 = 1, 3xi — 2^2 — 3x3 + 4x4 = —2, X\ + X2 — X3 + X4 = 2, X\ — x3 =1. O 113 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.84. Vyřešte 3x 5x llx 5y + 2u ly - Au 3j + + Az - 6z + 2z 2, 3, O 2.85. Rozhodněte o řešitelnosti soustavy lineárních rovnic 3^1 + 3X2 + X3 = 1, 2xi + 3x2 — X3 = 8, 2xi — 3x2 + X3 = 4, 3xi — 2X2 + X3 = 6 třech proměnných x\, x2, x3. 2.86. Stanovte počet řešení 2 soustav 5 lineárních rovnic O kde (1,2,3,4, 5)', (X1,X2,X3) (1, 1, 1, 1, 1) (3 1 7 5 0) 0 0 0 0 1 i2 1 4 3 0) O 2.87. Určete řešení soustavy lineárních rovnic flXl 2xi + 4x2 + 2x3 + 3X2 — X3 v závislosti na parametru sel. 2.88. V závislosti na hodnotě parametru a e K rozhodněte o počtu řešení soustavy (A 1 4 a \ (xA / 2 \ O 2 3 6 3 2 5 \6 -1 2 "V x2 X3 \X4/ 5 3 v-v o 2.89. Rozhodněte, zda existuje homogenní soustava lineárních rovnic tří proměnných, jejíž množinou řešení je (a) {(0,0,0)}; (b) {(0,1,0), (0,0,0), (1,1,0)}; (c) {(x, 1, 0); x e K}; (d) {(x, y, 2y); x, y e K}. O 2.90. Řešte soustavu lineárních rovnic v závislosti na reálných parametrech a, b. x + 2y + bz = a, x — y + 2z = 1, 3x — y =1. O 114 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.91. Najděte algebraicky adjungovanou matici F*, je-li (a P 0\ F = \y S 0 , a, p, y, S € R. \° 0 V O 2.92. Vypočítejte algebraicky adjungované matice k maticím /3 -2 0 -1\ 0 2 2 1 1 -2 -3 -2 \0 1 2 1 / přičemž i označuje imaginárni jednotku. O 2.93. Rozložte na transpozice následující permutace: '1 2 3 4 5 6 7^ (a) . 1 + i 2í (b) U-2i 6 '^7 6 5 4 3 2 1 A 2 3 4 5 6 7 8 U) ^6 4 1 2 5 8 3 7 .. A 2 3 4 56789 10 m) ^4 6 1 10 2 5 9 8 3 7 2.94. Určete paritu následujících permutací: A 2 3 4 5 6 7 v7 5 6 4 1 2 3 A 2345678 v6 7 1 2 3 8 4 5 '1 2 3 4 56789 10 i9 71 10 25493 6 i) u) 11i) 2.95. Je množina ľ = {(l,i); i e K)s operacemi 0 : V x V ^ V, (1, v) e (1, z) = (1, z + v), O: Ex V -+ V, z O (1, v) = (1, v- z), kde v, z e K, vektorovým prostorem? O 2.96. Vyjádřete vektor (5, 1,11) jako lineární kombinaci vektoru (3, 2, 2), (2, 3,1), (1, 1, 3), tj. nalezněte čísla p, q, r e K, pro která je (5, 1, 11) = p (3, 2, 2) + í (2, 3, 1) + r (1, 1,3). O 2.97. V K3 určete matici rotace o 120° v kladném smyslu kolem vektoru (1,0,1) (stačí uvést ve tvaru součinu matic). O 2.98. Ve vektorovém prostoru K3 určete matici kolmé projekce na rovinu x + y — 2z = 0. O 2.99. Ve vektorovém prostoru K3 určete matici kolmé projekce na rovinu 2x — y + 2z = 0. O 2.100. Je dána přímka p : [1, 1] + (4, 1)/, t € K. Určete parametrické vyjádření všech přímek q, které procházejí počátkem souřadnic a s přímkou p mají odchylku 60°. O 115 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.101. Napište nějakou bázi reálného vektorového prostoru matic 3x3 nad K s nulovou stopou (součet prvků na diagonále) a napište souřadnice matice v této bázi. 2.102. Zavedte nějaký skalární součin na vektorovém prostoru matic z předchozího příkladu. Spočítejte normu matice z předchozího příkladu, která je indukovaná Vámi zavedeným součinem. 2.103. Určete, zda jsou podprostory U = <(2, 1,2,2)), V = ((-1, 0, -1, 2), (-1, 0, 1, 0), (0, 0, 1, -1)) prostoru K4 na sebe kolmé. Pokud ano, je K4 = U 0 V, tj. je U± = V? 2.104. V závislosti na parametru r e K stanovte dimenzi podprostoru U vektorového prostoru K3, je-li U generován vektory (a) wi = (1, 1, 1), u2 = (1, /, 1), u3 = (2, 2, /); (b) líi = (í, í, 0. "2 = (-4/, -4/, 4/), «3 = (-2, -2, -2). 2. i 05. Sestrojte ortogonální bázi podprostoru prostoru K4. 2.106. V prostoru K4 nalezněte nějakou ortogonální bázi podprostoru všech lineárních kombinací vektorů (1, 0, 1, 0), (0,1, 0, —7), (4, —2, 4, 14) a podprostoru generovaného vektory (1, 2, 2, —1), (1,1,-5,3), (3,2, 8, -7). 2.Í07. Pro jaké hodnoty parametrů a, b e K jsou vektory (1,1,2,0,0), (1,-1,0, 1, a), (l,ž>,2, 3,-2) v prostoru K5 po dvou ortogonální? 2.108. V prostoru K5 uvažujte podprostor generovaný vektory (1,1,—1,—1,0), (1,—1,—1,0,—1), (1, 1, 0, 1,1), (—1, 0, —1,1,1). Najděte nějakou bázi jeho ortogonálního doplňku. 2.109. Popište ortogonální doplněk podprostoru V prostoru K4, je-li V generován vektory (-1, 2, 0, 1), (3, 1, -2, 4), (-4, 1, 2, -4), (2, 3, -2, 5). 2.110. V prostoru K5 určete ortogonální doplněk W1- podprostoru W, jestliže (a) W = {(r + s + t, -r + t, r + s, -t, s + t) | r, s, t e K}; (b) W je množina řešení soustavy rovnic x\ — x3 = 0, x\ — x2 + x3 — X4 + x5 = 0. 2.111. Nechť jsou v prostoru K4 dány vektory (1, —2, 2, 1), (1, 3, 2, 1). Doplňte tyto dva vektory libovolným způsobem na ortogonální bázi celého K4. (Můžete k tomu využít Gramův-Schmldtův ortogonalizační proces.) O O ((1,1,1,1), (1,1,1,-1), (-1,1,1,1)) 116 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.112. Nalezněte vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice / 1 Řešení. Charakteristický polynom matice je X3 — 6X2 + 12A. — 8, což je (X — 2)3 s trojnásobným kořenem 2. Číslo 2 je tedy vlastní hodnotou s algebraickou násobností tři. Její geometrická násobnost tedy bude jedna, dvě, nebo tři. Určeme tedy vlastní vektory příslušné této vlastní hodnotě jako řešení soustavy (A - 2E)x ■■ 0, tj. -xi 2x\ + + x2 x2 2x2 Jejím řešením j e dvojrozměrný prostor ((1, —1, 0), (0, 0, 1)). Vlastní hodnota 2 má tedy algebraickou násobnost tři, ale geometrickou pouze dva. 2.113. Stanovte vlastní hodnoty matice □ /-13 0 -30 V-12 5 4 2\ -10 0 12 9 5 6 4 1/ O 2.114. Víte-li, že čísla 1, —1 jsou vlastní hodnoty matice /-ll 5 4 l\ -3010 -21 11 8 2 \-9 5 3 1/ uvedie všechna řešení charakteristické rovnice | A — X E | = 0. Nápověda: Označíme-li kořeny polynomu \ A — X E \ jako Xi, X2, A3, A4, je | A | = X-[ ■ X2 ■ A3 • X4, ti A = X-[ + X2 + X3 + X4 . Q 2.115. Udejte příklad čtyřrozměrné matice s vlastními čísly X2 jako kořene charakteristického polynomu byla 3 a aby (a) dimenze podprostoru vlastních vektorů X2 byla 3; (b) dimenze podprostoru vlastních vektorů X2 byla 2; (c) dimenze podprostoru vlastních vektorů X2 byla 1. 6 a X2 = 7 takové, aby násobnost O 2.116. Nalezněte vlastní čísla a vlastní vektory matice: -1 1 K ° "j Í o \ -h O 2.117. Určete charakteristický polynom \A — X E \ , vlastní čísla a vlastní vektory matice 117 KAPITOLA 2. POČÍTANÍ S VEKTORY 4 -1 6\ 2 1 6 V2 -1 8/ O 2.118. Určete geometrický význam zobrazení v K , které je zadáno maticí v1 o oj o 2.119. Rozhodněte, zda ||Aluuuu|| < 1, kde v = (3, 2, 1), kde A = I -f 7/2 -f I . Q 118 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.7. AJ = / 122 -121 121 -121 122 -121 y 0 0 1 Řešení cvičení '14 13 -13^ 13 14 13 v0 0 21 ) 1 27 2.Í2. Taková matice X existuje právě jedna, a to ^18 -32^ 5 —£ 2.Í5. íl 10 -4\ A-1 = 1 12 -A \o 5 -2) /2 -3 0 0 o\ -5 8 0 0 0 0 0 -1 0 0 0 0 0 -5 2 V° 0 0 3 -v 2.16. C -i _ i ~~ 2 /O 1 1 o \ 0 10-1 1-10 0 \1 -1-1 1/ 2.i 7. V prvním případě dostáváme ve druhém potom 2.18. Platí 1 1 1\ i 0 1 1 , 1 A- =- i i 1 0 n — 1 1 i o) 2.21. -3,17,-1 2.27. (1 1 1 i > —i (í i 1 1 \ 1 1 -1 -i 1 1 i -1 -1 1 -1 1 -i 4 1 -i 1 -1 \1 -1 -1 i) U -i -1 1/ Následně lze snadno získat 13 3 3 1 x\ — ~4' *3 = ~4' x4 ~~ 4' 2.59. (2- V3 2 119 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.40. Vektory jsou závislé, je-li splněna alespoň jedna z podmínek a — b — l, a — c — l, b — c — 1. 2.41. Vektory jsou lineárně nezávislé. 2.42. Stačí připojit např. polynom x. 2.61. cos = ^1. 2.68. Je | A - X E | = -X3 + 12X1 - 47A. + 60, tj. A.) = 3, X2 = 4, Xs = 5. 2.70. Dimenze je 1 pro X\ = 4 a 2 pro A.2 = 3. 2.71. Matice B má dvě různá vlastní čísla, a proto takové vyjádření existuje. Např. platí /5 6\_i/V2 -V2 Existují právě dvě diagonální matice D, a to ^11 0 0 -1 11 0 0 -1 -1 V2 V2 -y/2 V2 o ovšem sloupce matice P 1 můžeme nahradit za jejich libovolné nenulové skalární násobky, tedy uvažovaných dvojic D, P je nekonečně mnoho. 2.75. Výsledkem je posloupnost 0, 1,2. 2.82. Řešeními jsou právě všechny skalární násobky vektoru (l + VŽ, -V3, 0, 1, o). *2 = §, 2.83. x! = l + t. 2.84. Soustava nemá řešení. 2.85. Soustava má řešení, protože je í3\ (3\ 2 3 -3 \V V-2/ 2.86. Systém lineárních rovnic 3*i xi lxx 5xi nemá řešení, zatímco systém 3jci -vi 7-Vi 5a i x3 — t, x4 — — ~ *2 X2 -Í,X2 ■ ( 1 \ -1 1 V i / 2*3 *3 4x3 3x3 2x3 *3 4x3 3x3 1,x3 má právě jedno řešení x\ 2.87. Množina všech řešení j e {(-10ř, (a + 4)ř, (3a - 8)ř) 8 4 w = 1. _ -> = 3, = 4, = 5 2.88. Pro a — 0 nemá uvažovaný systém řešení; pro a ^ 0 má nekonečně mnoho řešení. 120 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.89. Při zachovaní pořadí jsou správné odpovědi „ano", „ne", „ne" a „ano". 2.90. i) Pro Ŕ ^ -7 je* = z = (2 + a)/(b + 7), y = (3a-b-í)/(b + 7) (lb). ii) Pro b -(lb) nemá řešení (lb), pro a = — 2 je řešením * = z, 3 z — 1 (2b). 2.91. Ze znalosti inverzní matice F-1 dostáváme -7(lb)aa + -2 F* = (aS - /3y) F~ pro libovolná a, fi, y, S e R. 2.92. Hledanými maticemi jsou / 1 1 -2 -4\ 0 10-1 -1-13 6 V 2 1-6 -10/ V o o (a) (b) 6 -3 + 2i 2.93. i) (1, 7)(2, 6)(5, 3), ii) (1, 6)(6, 8)(8, 7)(7, 3)(2, 4), iii) (1, 4)(4, 10)(10, 7)(7, 9)(9, 3)(2, 6)(6, 5) 2.94. i) 17 inverzí, lichá, ii) 12 inverzí, sudá, iii) 25 inverzí, lichá 2.95. Lehce se ověří, že se jedná o vektorový prostor. První souřadnice neovlivňuje výpočty součtů vektorů ani hodnoty skalárních násobků vektorů: jedná se o přeznačený prostor (M, +, •)• 2.96. Úloha má jediné řešení P — 2, q = -2, = 3. 2.97. ( 1/4 -V6/4 3/4 \ Vó/4 -1/2 -Vó/4 V 3/4 Vó/4 1/4 ) ( 5/6 -1/6 1/3 -1/6 5/6 1/3 V 1/3 1/3 1/3 2.100. ' 5/9 2/9 -4/9^ 2/9 8/9 2/9 v-4/9 2/9 5/9 ) 1\ ^,2V3 + Í|ř, q2: f,-2V3 + i., 2.102. Například skalární součin, který vyplývá z izomorflsmu prostoru všech reálných matic 3 x 3 s M.9. Použijeme-li součin z M.9 dostáváme skalární součin, který dvěma maticím přiřadí součet součinů po dvou odpovídajících si složek. Pro danou matici dostaneme = 7l2 + 22 + O2 + O2 + 22 + O2 + l2 + (-2)2 + (-3)2 = V23. 121 KAPITOLA 2. POČÍTANÍ S VEKTORY 2.103. Vektor, který zadává podprostor U, je kolmý na každý ze tří vektorů, které generují V. Podprostory jsou tak na sebe kolmé. Avšak není pravda, že R4 — U © V. Podprostor V je totiž pouze dvojdimenzionální, protože (-1,0, -1,2) = (-1,0, 1,0) -2(0,0, 1, -1). 2.104. V prvním případě j e dim U — 2 pro t e {1, 2), jinak je dim U = 3. Ve druhém případu je dim U — 2 pro t ^ 0 a dim U — 1 pro t — 0. 2.105. Gramovým-Schmidtovým ortogonalizačním procesem lze obdržet výsledek ((1, 1, 1, 1), (1, 1, 1, -3), (-2, 1, 1,0)). 2.106. Při zachování pořadí podprostorů ze zadání jsou ortogonálními bázemi např. ((1, 0, 1, 0), (0, 1,0, -7)) a ((1, 2, 2, -1), (2, 3, -3, 2), (2, -1, -1, -2)). 2.107. Výsledek je a = 9/2, Ŕ = —5, neboť musí mj. platit 1+6 + 4 + 0 + 0 = 0, 1-6 + 0 + 3-2a = 0. 2.108. Hledaná báze obsahuje jediný vektor. Jejím nějaký nenulový skalární násobek vektoru (3, -7, 1, -5,9). 2.109. Ortogonální doplněk (komplement) V1- je množina všech skalárních násobků vektoru (4, 2, 7, 0). 2.110. (a) W1- = ((1, 0, -1, 1, 0), (1, 3, 2, 1, -3) > ; (b) W1- = ((1, 0, -1, 0, 0), (1, -1, 1, -1, 1) >. 2.111. Hledaných doplnění je pochopitelně nekonečně mnoho. Jedním (skutečně jednoduchým) je např. (1,-2,2,1), (1,3,2,1), (1,0,0,-1), (1,0,-1,1). 2.113. Daná matice má pouze jedno vlastní číslo, a to — 1 2.114. Kořen —1 polynomu | A — X E | je trojnásobný. 2.115. Kupř. /6 0 0 0\ 0 7 10 (a) (6 0 0 0\ 0 7 0 0 0 0 7 0 \0 0 0 ij (b) 0 0 7 0 \0 0 0 ij (c) (6 0 0 0\ 0 7 1 0 0 0 7 1 \o 0 0 7y* 2.116. Trojnásobná vlastní hodnota —1, příslušný vektorový prostor je ((1, 0, 0), (0, 2, 1)>. 2.117. Charakteristický polynom je — (A.—2)2(A.—9), tj. vlastní čísla jsou 2a9 s přišlu nými (po řadě) vlastními vektory (1,2,0), (-3,0, 1) a (1,1,1). 2.118. Zrcadlení podle roviny ((1,0, 1), (0, 1,0)}. 2.119. Daný vektor je vlastním vektorem dané matice s vlastní hodnotou 1/2. Je tedy G) "-(i)' IIdII < 1. 122 KAPITOLA 3 Lineární modely a maticový počet kde jsou matice užitečné? - nakonec skoro všude... Otázkou počtu řešení soustavy lineárních rovnic jsme se již zabývali v příkladech na straně 83 a několika následujících. A. Procesy s lineárními omezeními Ukažme si příklad velmi jednoduché lineární optimalizační úlohy, se kterými se lze setkat v praxi: 3.1. Firma vyrábí šroubky a matičky. Šroubky i matičky jsou lisovány - vylisování krabičky šroubků trvá 1 minutu, krabička matiček je lisována 2 minuty. Šroubky i matičky balí do krabiček, ve kterých je pak prodává - krabička šroubků se balí 1 minutu, krabička matic 4 minuty. Firma má k dispozici 2 hodiny času pro lisování a 3 hodiny času pro balení výrobků. Vzhledem k poptávce je třeba vyrobit alespoň o 90 krabiček šroubků více než krabiček matic. Z technických důvodů nelze vyrobit více než 110 krabiček šroubků. Zisk z jedné krabičky šroubků je 40 Kč a z jedné krabičky matic 60 Kč. Firma nemá potíže s odbytem výrobků. Kolik krabiček šroubků a matic má firma vyrobit, chce-li dosáhnout maximálního zisku? Řešení. Zapišme si zadané údaje do tabulky: Máme už vybudován docela slušný balíček nástrojů a tak je na čase, abychom si maticový počet zkusili použít. Na docela jednoduchých úlohách uvidíme, že teorie nám umožňuje kvalitativní i kvantitativní analýzy a někdy i překvapivě snadno vede k nečekaným výsledkům. Jakkoliv se může zdát, že předpoklad linearity vztahů mezi veličinami je příliš omezující, v reálných úlohách naopak často právě lineární závislosti buď vystupují přímo neboje skutečný proces výsledkem iterace mnoha lineárních kroků. 1 když tomu tak není, můžeme tímto způsobem skutečné procesy alespoň aproximovat. V této kapitole proto nejprve zrekapitulujeme nejjednodušší případ, kdy celý proces je popsán jediným lineárním •T zobrazením. O co méně tady bude nové teorie, tím více snad bude zajímavé, jak takové modely vznikají v různých oblastech využití matematických nástrojů. Poté se vrátíme k tzv. lineárním diferenčním rovnicím, které lze chápat buďjako rekurentně definované funkce nebo také jako specifický případ lineárního iterovaného procesu. Právě takovým procesům bude věnována část třetí, kde si ukážeme, k jakým kouzlům vede pochopení vlastností vlastních hodnot matic. Na matice (resp. lineární zobrazení) se také někdy rádi díváme j.í1 ., jako na objekty, se kterými bychom rádi pracovali tak, jak 1 [ to umíme se skaláry. K tomu ale bude třeba docela usilovná ŕ&fä práce ve čtvrté části kapitoly. Rychlé a užitečné použití pak ' 0 1 ukážeme na tzv. rozkladech matic, které jsou potřebné pro numerické zvládnutí maticového počtu co nejrobustnějším způsobem. 1. Lineární procesy 3.1. Řešení systému lineárních rovnic. Jednoduché lineární pro- X2 + 90, xi < 110. Účelová funkce (funkce udávající zisk při daném počtu vyrobených šroubků a matic) je 40*1 + 60x2. Předchozí soustava nerovnic zadává v K2 určitou oblast a optimalizace zisku znamená najít v této oblasti bod (případně body), ve kterém bude mít účelová funkce nejvyšší hodnotu, tj. najít největší k takové, že přímka 40*1 + 60x2 = k bude mít s danou oblastí neprázdný průnik. Graficky můžeme najít řešení například tak, že umístíme přímku p do roviny tak, aby splňovala rovnici 40xi + 60x2 = 0 a začneme ji rovnoběžně posunovat „nahoru" tak dlouho, dokud bude mít nějaký společný průnik s danou oblastí. Je zřejmé, že tímto posledním průnikem může být buďbod, nebo hraniční přímka dané oblasti (pokud by byla rovnoběžná s p). Dostaneme tak (viz obrázek), bod x\ = 110 a X2 = 5. Maximální možný zisk tedy činí 40 • 110 + 60 • 5 = 4700 Kč. □ 3.2. Minimalizace nákladů na krmení. Hříbárna v Nišovicích u Volyně nakupuje na zimu krmivo: seno a oves. Výživné hodnoty krmiv a požadované denní dávky pro jedno hříbě jsou v tabulce g/kg Seno Oves POŽADAVKY Sušina 841 860 Alespoň 6300 g SNL 53 123 Nejvýše 1150 g Škrob 0,348 0,868 Nejvýše 5,35 g Vápník 6 1,6 Alespoň 30 g Fosfor 2,8 3,5 Nejvýše 44 g Sodík 0,2 1,4 Přibližně 7 g CENA 1,80 1,60 Každé hříbě musí v krmné dávce denně dostat alespoň 2 kg ovsa. Průměrná cena včetně dopravy činí 1,80 Kč za lkg sena a 1,60 Kč za 1 kg ovsa. Sestavte denní dávku krmení pro jedno hříbě tak, aby náklady byly minimální. O Předchozí dva příklady šlo řešit pouze graficky, vyznačením oblasti v rovině K2, která je určena danými omezeními, a potom snadno je vektorovým podprostorem. Pokud je dimenze V konečná, řekněme n, a dimenze obrazu zobrazení

0,kde A = (ciij), 1 < j < n, 1 < i < m, b = (b\,..., bm). Zadání přepíšeme do tabulky takto: -Cl . . -c„ 0 flll .. bi bm Pokud se nám podaří v matici A nalézt m sloupců takových, že postupnou eliminací vůči vhodně vybraným prvkům v těchto sloupcích (v každém jeden), dosáhneme toho, že vybrané sloupce budou tvořit (ve vhodném pořadí) jednotkovou matici a pravý sloupec bude po eliminaci splňovat podmínky úlohy (např. nezápornost), můžeme zahájit 3.4. Optimalizační lineární modely. Ve vedlejším sloupci jsme , druhou kapitolu začali problémy natěračů (||2.1||). Budeme v tom pokračovat. Představme si, že náš j&Á r::^ velice specializovaný natěrač v černobílém světě je ochoten natírat fasády buď malých rodinných domků nebo naopak velikých veřejných budov a že pochopitelně používá jen černou a bílou barvu. Může si zcela volně vybírat, v jakém rozsahu bude dělat x jednotek plochy prvého typu nebo y jednotek druhého. Předpokládejme však, že jeho maximální pracovní zátěž je ve sledovaném období L jednotek plochy, jeho čistý výnos (tj. po odečtení nákladů) je na jednotku plochy c\ u malých domků a c2 u veřejných staveb. Zároveň má k dispozici maximálně W kg bílé a B kg černé barvy. Konečně na jednotku plochy rodinného domu potřebuje w\ kg bílé barvy a b\ kg černé, zatímco u veřejných staveb jsou to hodnoty w2 a b2. Když si to celé shrneme do (ne)rovnic, dostáváme omezení (3.1) xi+x2, přičemž opět uvažujeme nezáporné proměnné. 125 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET výpočet (uvidíme, že při zadání úlohy ve tvaru Ax < b, kde b je nezáporné, je možné matici A jednoduše rozšířit tak, že toho lze snadno docílit). Dále postupujeme v následujících krocích: Vybereme první sloupec zleva, který má na prvním řádku nekladný prvek. V tomto sloupci vybereme z kladných čísel to číslo x, pro které je poměr čísla ve stejném řádku a nejpravějším sloupci ku x minimální. Eliminujeme celý sloupec této tabulku podle čísla x, říkejme mu pivot (tzn. elementárními řádkovými transformacemi dané tabulky dosáhneme toho, že ve vybraném sloupci bude číslo 1 na místě x, jinak samé nuly). Ukažme si postup na konkrétním příkladu: 3.3. Minimalizujte funkci — 3x y y — 2z za podmínek x, y, z > 0 a x - y + z > -4, 2x + z S 3, x + y + 3z S 8. Řešení. Vynásobením účelové funkce a první nerovnice číslem — 1 dostáváme ekvivalentní úlohu maximalizovat funkci 3x + y + 2z za podmínek -x + y - z < 4, 2x + z S 3, x + y + 3z S 8. Zavedením nezáporných proměnných u, v, w dostáváme již tabulku (účelová funkce je 3x + y + 2z + 0 • u + 0 • v + 0 • w): -3 -1 -2 0 0 0 0 - 1 1 -1 1 0 0 4 © 0 1 0 1 0 3 1 1 3 0 0 1 8 Nyní vybereme první sloupec tabulky, ve kterém je v prvním řádku záporné číslo (tedy celkově první sloupec tabulky) a v něm vybereme řádek s dvojkou (u řádků s kladnou hodnotou porovnáváme velikosti čísel § a y, vybereme řádek odpovídající menší hodnotě). V dalším eliminujeme první sloupec podle prvku 2 (vynásobíme třetí řádek číslem \, a odečteme jeho vhodné násobky od ostatních tak, aby v nich zůstaly v prvním sloupci samé nuly; nezapomínáme na první řádek tabulky): 0 -1 -i 0 % 0 0 © 1 o 0 1 _ 1 2 1 2 5 2 1 2 1 2 _ 1 2 Nyní vybíráme z druhého sloupce a podle již aplikovaného pravidla vybereme první řádek (— < —), pivotem tedy bude jednička ve Je snadné nahlédnout, že každý obecný problém lineárního programování lze převést na kterýkoliv ze standardních. Kromě změn znamének můžeme ještě pracovat s rozdělením případných proměnných bez omezení znaménka na rozdíl dvou kladných. Bez újmy na obecnosti se tedy budeme dále věnovat jen standardnímu maximalizačnímu problému. Jak takový problém řešit? Hledáme maximum lineární formy h na podmnožinách M vektorového prostoru, které jsou zadány lineárními nerovnostmi, tj. v rovině pomocí průniku polorovin, obecně budeme v další kapitole hovořit o poloprostorech. Všimněme si, že každá lineární forma na reálném vektorovém prostoru h : V -» R (tj. libovolná lineární skalární funkce) v každém vybraném směru buď stále roste nebo stále klesá. Přesněji řečeno, jestliže vybereme pevný počáteční vektor u e V a „směrový" vektor v e V, pak složením naší formy h s parametrizací dostaneme t h-» h(u + t v) — h(u) + t h (v). Tento výraz je skutečně s rostoucím parametrem t vždy buď rostoucí nebo klesající, případně konstantní (podle toho, zdaje h(v) kladné nebo záporné, případně nulové). Jistě tedy musíme očekávat, že problémy podobné tomu s natěračem budou buď nesplnitelné (když je množina zadaná omezením prázdná) nebo bude výnos neohraničený (když omezení zadají neomezenou část celého prostoru a forma h v některém z neomezených směrů bude nenulová) nebo budou mít maximální řešení v alespoň jednom z „vrcholů" množiny M (přičemž zpravidla půjde o jediný vrchol, může ale jít o konstantní maximální hodnotu na části hranice oblasti M). 3.5. Formulace pomocí lineárních rovnic. Ne vždy je nalezení optima tak snadné jako v předchozím případě. Problém může zahrnovat velmi mnoho proměnných a velmi mnoho omezení a jen rozhodnout, zda je množina M splnitelných bodů neprázdná, je problematické. Nemáme tu prostor na úplnou teorii, zmíníme ale alespoň dva směry úvah, které ukazují, že ve skutečnosti bude řešení naleznu-telné vždy podobně, jako tomu bylo v dvojrozměrném problému v předchozím odstavci. Začneme srovnáním se systémy lineárních rovnic - těm už totiž rozumíme dobře. Zapišme si rovnice (3.1)—(3.3) vektorově v obecném tvaru: A ■ x < b, kde x je nyní n-rozměrný vektor, b je m-rozměrný vektor a A odpovídající matice a nerovností myslíme jednotlivé nerovnosti po řádcích. Maximalizovat chceme součin c • x pro daný řádkový vektor koeficientů lineární formy h. Jestliže si pro každou z rovnic přidáme jednu pomocnou proměnnou a ještě si primyslíme proměnnou z jako hodnotu lineární formy h, můžeme celý problém přepsat jako systém lineárních rovnic (i 0 En-, kde matice je složena z bloků o 1 + n + m sloupcích a 1 + m řádcích a tomu odpovídají jednotlivé komponenty vektorů. Dodatečně přitom požadujeme pro všechny souřadnice (proměnné) x i xs nezápornost. 126 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET druhém řádku i sloupci tabulky. Eliminujeme podle ní: 0 0 -1 1 2 0 10 0 1 -\ 1 1 2 0 11 2 1 o i 0 1 2 0 3 2 0 0 ® -1 -1 1 1 Pivotem bude nyní číslo 3 ve třetím sloupci a čtvrtém řádku: o o o I | \ 0 i o \ 1 o o i 0 0 1 -\ - Z výsledné tabulky odečteme řešení (hodnoty v pravém sloupci udávají hodnoty neznámých, zastoupených v , jednotkové podmatici", pokud se proměnná v podmatici nevyskytuje, je její hodnota nulová - to ovšem není tento případ): x\ = |, x2 = y, x3 = |. Maximální hodnota účelové funkce na zadané množině je pak y (můžeme ji vyčíst v pravém horním rohu tabulky). Z tabulky lze vyčíst i řešení duální úlohy, totiž minimalizovat Au + 3 v + 8 u; za podmínek u + 2v + w < 3, —u + w > 1, u + v + 3w > 2. Hodnota tohoto minima je totiž dle věty o dualitě (3.7) také —, odpovídající hodnoty proměnných odečteme v horním řádku tabulky ve sloupcích odpovídajících neznámým u, v, w, tedy ve sloupcích 4, 5 a 6: u = |, u = |, ui = |. Není těžké si rozmyslet, že pro tři čísla fli4, fli5, fljg v prvním řádku tabulky a zmíněných sloupcích a hodnotu h v pravém horním rohu tabulky platí v průběhu výpočtu neustále 4fli4 +3ai5 +8ai6 = h. (Čísla v prvním řádku zmíněných sloupců totiž udávají, kolikrát byl řádek odpovídající doplňkové proměnné přičten k prvnímu, tedy nejpravější hodnota v prvním řádku bude odpovídající lineární kombinací nejpravějších hodnot ostatních řádků.) □ 3.4. Špetka teorie her. Uvažme hru, kterou mezi sebou hrají dva hráči, burzián a osud. Burzián chce investovat do zlata, stříbra, diamantů či do akcií významné softwarové firmy. Jsou známy zisky či ztráty těchto investic v posledních čtyř letech (pro jednoduchost výpočtu uvažujeme pouze poslední čtyři roky a zapišme je do matice a = (fly)): zlato stříbro diamanty ovoce 2001 2% 1% 4% 3% 2002 3% -1% -2% 6% 2003 1% 2% 3% -4% 2004 -2% 1% 2% 3% Pokud tedy má daný systém rovnic řešení, hledáme v této množině řešení takové hodnoty proměnných z,x axs, aby všechna x byla nezáporná a z maximální možné. K diskusi, jak to obecně může dopadat se vrátíme z pohledu afinní geometrie v odstavci 4.11 na straně 199. Konkrétně v našem problému černobílého natěrače bude systém lineárních rovnic vypadat takto: (z\ (l -ci —C2 0 0 0\ x\ 0 1 1 1 0 0 *2 L 0 m 0 1 0 *3 W v° bi bi 0 0 X4 w w 3.6. Dualita v lineárním programování. Uvažujme reálnou ma-• » tici Asm řádky a n sloupci, vektor omezení b a řádkový 'ľVJ^ vektor c zadávající účelovou funkci. Z těchto dat můžeme r\y^ sestavit dva problémy lineárního programování pro x e R™ ' íf* 1 a y e W". Maximalizační problém: Maximalizuj c • x za podmínky A ■ x < b a zároveň x > 0. Minimalizační problém: Minimalizuj yT - b za podmínky yT ■ A > cT a zároveň y > 0. Říkáme, že tyto problémy jsou vzájemně duální. K odvození dalších vlastností problémů lineárního programovaní zavedeme trochu terminologie. Řekneme, že jde o řešitelný problém, jestliže existuje nějaký přípustný vektor x, který vyhoví všem omezujícím podmínkám. Řešitelný maximalizační, resp. minimalizační problém je ohraničený, jestliže je účelová funkce na množině vyhovující omezením ohraničená shora, resp. zdola. Lemma. Je-li x e W přípustný vektor pro standardní maximalizační problém a y e W" je přípustný vektor pro duální minimalizační problém, pak pro účelové funkce platí c ■ x < yT ■ b Důkaz. Jde vlastně jen o snadné pozorování: x > 0 a c < yT ■ A, ale také y >0 a A ■ x 3, yn) odpovídající rozdělení jeho vkladu. Výhra burziána je pak Ylt j=i xiyjaij-) Řešení. Problém úlohy je najít pravděpodobnostní vektor (yi> 32, 33 > 3*4)> který maximalizuje minimum ze všech hodnot Ya,j=\ xiyjaij pro (yi, y2, yt, y*) pevné a {xx,x2,x3, xA) libovolný pravděpodobnostní vektor. Velmi bystrý čtenář si rozmyslí, že tento problém je ekvivalentní problému maximalizovat z\ + z2 + Z3 + za za podmínky ATz 5 (1, Í)T, z > 0 (hledaný pravděpodobnostní vektor y pak dostaneme pravděpodobnostním normováním vektoru z). 1 Řešme tedy tuto úlohu lineárního programování. Zavedeme pomocné proměnné w\, w2, ui3, u)4, převedeme úlohu do standardního tvaru max {zi + z2 + Z3 + z4 I (AT\E4) (z, w) = (1, 1, 1, l)r} a zapíšeme do tabulky: -1 -1 -1 -1 0 0 0 0 0 2 3 1 -2 1 0 0 0 1 1 -1 2 1 0 1 0 0 1 © -2 3 2 0 0 1 0 1 3 6 -4 3 0 0 0 1 1 0 3 2 1 4 1 2 0 o \ 0 1 4 0 4 1 2 -3 1 o -i 0 1 2 0 1 2 5 4 1 2 0 1 "4 0 3 4 1 1 2 3 4 1 2 0 o \ 0 1 4 0 ( D 25 4 3 2 0 o -I 1 1 4 0 0 3 2 1 5 0 0 1 10 1 5 3 10 0 0 © ~lí 1 0 1 10 8 15 11 30 0 0 5 6 3 5 0 1 3 10 1 15 23 30 1 0 1 3 3 5 0 0 1 5 1 15 4 15 0 1 5 6 1 5 0 0 1 10 2 15 1 30 Povšimněme si ještě pěkného přímého důsledku právě zformulované věty o dualitě: Důsledek (Věta o ekvilibriu). Uvažme přípustné vektory x a y pro standardní maximalizační problém a jeho duální problém z definice 3.6. Pak jsou oba tyto vektory optimální, právě tehdy, když y; = 0 pro všechny souřadnice s indexem i, pro které 2_7/=i aijxj < b i a zároveň x j — 0 pro všechny souřadnice s indexem j, pro které Y17=l yiaij > ci- Důkaz. Předpokládejme, že platí oba vztahy z předpokladu implikace ve větě. Pak tedy můžeme v n sleduj c m výpočtu počítat s rovnostmi, protože sčítance s ostrou iifivtí nerovností mají stejně u sebe nulové koeficienty: : m n m n í=1 í=1 7=1 í=1 7=1 a ze stejného důvodu také m n n i=l j=l j=l Tím máme dokázánu jednu implikaci z tvrzení díky větě o dualitě. Předpokládejme nyní, že x a y jsou skutečně optimální vektory. Víme tedy, že platí m m n n zĹ>h - Y. Y. y * - J2cJxj' ;=i ;=i j=i j=i ale zároveň jsou si levé a pravé strany rovny. Nastává tedy všude rovnost. Přepíšeme-li prvou rovnost jako m , n n 'Toto j e klíčová úvaha v proslulé von Neumannově větě, která říká, že pravděpodobnostní rozšíření libovolné maticové hry má rovnovážnou situaci. 7=1 vidíme, že může být naplněna jen za podmínek ve větě, protože jde o nulový součet samých nezáporných čísel. Z druhé rovnosti stejně plyne i druhé zbylé tvrzení a důkaz je ukončen. □ Věty o dualitě a ekvilibriu jsou užitečné při řešení problémů lineárního programování, protože nám ukazují souvislosti mezi nulovostí jednotlivých dodatečných proměnných a naplňování omezujících podmínek. 3.8. Poznámky o lineárních modelech v ekonomii. Náš velice schematický problém černobílého natěrače z odstavce 3.4 můžeme použít jako ilustraci jednoho z typických ekonomických modelů, tzv. model plánování výroby. Jde přitom o zachycení problému jako celku, tj. se zahrnutím vnitřních i vnějších vztahů. Levé strany rovnic (3.1), (3.2), (3.3) i účelové funkce h(x\,x2) jsou vyjádřením různých výrobních vztahů. Podle povahy problému pak jsou požadovány na pravé straně buď přesné hodnoty (pak řešíme systém rovnic) nebo požadujeme kapacitní omezení a optimalizaci účelu (a pak dostáváme právě problémy lineárního programování). Můžeme tak tedy obecně řešit problém alokace zdrojů při dodavatelských omezeních a přitom bud'minimalizovat náklady nebo maximalizovat zisk. Z tohoto pohledu lze také nahlížet dualizaci problémů. Jestliže by náš natěrač chtěl hypoteticky nastavit svoje 128 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET 0 0 0 188 85 9 17 0 4 85 7 85 42 85 0 0 1 114 85 6 17 0 3 85 16 85 11 85 0 0 0 146 85 5 17 1 23 85 19 85 56 85 1 0 0 2 17 0 18 85 11 85 19 85 0 1 0 78 85 5 17 0 11 85 2 85 12 85 188 89 0 0 0 25 89 0 44 89 17 89 86 89 114 89 0 1 0 18 89 0 21 89 2 89 37 89 146 89 0 0 0 9 89 1 55 89 1 89 26 89 85 89 0 0 1 10 89 0 18 89 11 89 19 89 78 89 1 0 0 17 89 0 5 89 8 89 30 89 Závěrečná tabuľka již je optimálni, neboť v prvním řádku se vyskytují jenom nezáporné hodnoty. Z tabulky odečteme optimální řešení úlohy: zi = |§, Z3 = §5, za = 55, z\ = 0. Optimální hodnota (pravý horní roh) je pak z\ + Z2 + Z3 + za = §§• Po přeškálování na pravděpodobnostní vektor (vynásobením hodnotou ||) dostáváme řešení původní úlohy: y\ = 0, y2 = §|, y3 = |g, y4 = |f s optimální hodnotou ||. Podotkněme, že závěry úlohy byly udělány bez vysvětlení s tím, že vzbudí zájem čtenáře o danou problematiku. Více viz početné zdroje na internetu. □ B. Rekurentní rovnice Různé lineární závislosti mohou být dobrým nástrojem pro popsání rozličných modelů růstu. Začněme s velmi populárním populačním modelem, který využívá lineární diferenční rovnici druhého řádu: 3.5. Fibonacciho posloupnost Na začátku jara přinesl čáp na louku ■) dva čerstvě narozené zajíčky, samečka a samičku. Samička je schopná od dvou měsíců stáří povít každý měsíc dva Bi- malé zajíčky (samečka a samičku). Nově narození zajíci plodí potomky po jednom měsíci a pak každý další měsíc. Každá samička je březí jeden měsíc a pak opět porodí samečka a samičku. Kolik párů zajíců bude na louce po devíti měsících (pokud žádný neuhyne a žádný se tam „nepřistěhuje")? Řešení. Po uplynutí prvního měsíce je na louce pořád jeden pár, nicméně samička zabřezne. Po dvou měsících se narodí první potomci, takže na louce budou dva páry. Po uplynutí každého dalšího měsíce se narodí (tedy přibude) tolik zajíců, kolik zabřezlo zaječic před měsícem, což je přesně tolik, kolik bylo před měsícem párů schopných mít potomka, což je přesně tolik, kolik bylo párů před dvěma měsíci. Celkový počet p„ zajíců po uplynutí rc-tého měsíce tak je tak součtem počtů náklady spojené se svojí prací yt, bílou barvou yw a černou barvou yB, pak bude chtít minimalizovat účelovou funkci L ■ yl + Wyw + ByB při omezujících podmínkách yi + w\yw +b\yB > ci, y L + w2yw + b2yB > c2- To je právě duální problém k původnímu a hlavní věta 3.7 říká, že optimální stav je takový, kdy účelové funkce mají stejnou hodnotu. V ekonomických modelech najdeme mnoho modifikací. Jednou z nich jsou úlohy finančního plánování, související s optimalizací portfolia. Určujeme přitom objemy investic do jednotlivých investičních variant s cílem držet se daných omezení na rizika a optimalizovat přitom zisk, resp. při očekávaném objemu minimalizovat rizika. Dalším obvyklým modelem jsou marketingové aplikace, např. alokace nákladů na reklamy v různých médiích nebo umísťování reklam do časových termínů. Omezujícími podmínkami bude disponibilní rozpočet, rozložení cílových skupin apod. Velmi obvyklé jsou modely výživových problémů, tj. návrh ná-vek různých komponent výživy s daným složením a omezujícími požadavky na celkové objemy výživových látek. Problémy lineárního programování se objevují při personálních úlohách, kdy jsou pracovníci s různými kvalifikacemi a dalšími předpoklady rozdělováni do směn. Obvyklé jsou také problémy směšování, problémy dělení a problémy distribuce zboží. 2. Diferenční rovnice Diferenčními rovnicemi jsme se stručně zabývali již v první kapitole, byť pouze těmi prvního řádu. Nyní si ukážeme obecnou teorii pro lineární rovnice s konstantními koeficienty, která poskytuje nejen velmi praktické nástroje, aleje také pěknou ilustrací pro koncepty vektorových podprostorů a lineárních zobrazení. __\ Homogenní lineární rovnice řádu k |___ 3.9. Definice. Homogenní lineární diferenční rovnice řádu k je dána výrazem aoxn + a\x„-\ H-----h aixn-i = 0, ao ^ 0, at ^ 0, e {0, .. .k), jsou skaláry, které mohou kde koeficienty a, případně i záviset na n. Říkáme také, že taková rovnost zadává homogenní lineární rekurenci řádu k a často zapisujeme hledanou posloupnost jako funkci ■/(«) = --/(«-ao 1) at —/(« -ao -k). Řešením této rovnice nazýváme posloupnost skalárů x\, pro všechna i e N, případně i e Z, které vyhovují rovnici pro všechna n. 129 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET párů v předchozích dvou měsících. Pro počet párů zajíců na louce tedy dostáváme homogenní lineární rekurentní formuli (3.1) Pn+2 = Pn+l + Pn «eN, která spolu s počátečními podmínkami p\ = 1 a p2 = 1 jednoznačně určuje počty párů zajíců na louce v jednotlivých měsících. Linearita formule znamená, že všechny členy posloupnosti (pn) jsou ve vztahu v první mocnině, rekurence je snad jasná a homogenita značí, že v předpisu chybí absolutní člen (viz 3.14 pro nehomogenní rovnice). Pro hodnotu rc-tého členu můžeme odvodit explicitní formuli. V hledaní formule nám pomůže pozorování, že pro jistá r je funkce r" řešením diferenční rovnice bez počátečních podmínek. Tato r získáme tak, že dosadíme do rekurentního vztahu: r"+2 = r"+1 + ŕ , apo vydělení r" dostaneme r2 = r + 1, což je tzv. charakteristická rovnice daného rekurentního vztahu. Naše rovnice má kořeny a a tedy posloupnosti a„ = (^~2^j a b„ = (^f^) > " — 1> vyhovují danému vztahu. Vztah také splňuje jejich libovolná tzv. lineární kombinace, tedy posloupnost c„ = san + tb„, s,t € K. Čísla s a / můžeme zvolit tak, aby výsledná kombinace splňovala dané počáteční podmínky, v našem případě ci = 1, c2 = 1. Pro jednoduchost je vhodné navíc ještě dodefinovat nultý člen posloupnosti jako c0 = 0 a spočítat saíz rovnic pro c0 a ej. Zjistíme, že s y? a tedy (3.2) Pn (i + Vs)" - (i - Vš)" 2»(V5) ' Takto zadaná posloupnost splňuje danou rekurentní formuli a navíc počáteční podmínky c0 = 0, c\ = 1, jedná se tedy o tu jedinou posloupnost, která je těmito požadavky zadána. Všimněte si, že hodnota vzorce (||3.2||) je celočíselná pro libovolné přirozené n (zadává totiž celočíselnou Fibonacciho posloupnost), i když to tak na první pohled nevypadá. □ 3.6. Zjednodušený model chování hrubého národního produktu. Uvažujme diferenční rovnici Libovolným zadáním k po sobě jdoucích hodnot x\ jsou určeny i všechny ostatní hodnoty jednoznačně. Skutečně, pracujeme nad polem skalárů, takže hod--i""_-£gľzi^r noty ízo i jsou invertibilní, a proto z definičního vztahu lze vždy spočíst hodnotu x„ ze známých ostatních hodnot a stejně tak pro x„-k. Indukcí tedy okamžitě dokážeme, že lze jednoznačně dopočítat všechny hodnoty jak pro kladná tak pro záporná celá n. Prostor všech nekonečných posloupností x i je vektorový prostor, kde sčítání i násobení skaláry je dáno po složkách. Přímo z definice je zjevné, že součet dvou řešení homogenní lineární rovnice nebo skalární násobek řešení je opět řešení. Stejně jako u homogenních systémů lineárních tedy vidíme, že množina všech řešení je vektorový podprostor. Počáteční podmínka na hodnoty řešení je dána jako k- rozměrný vektor v K*. Součtu počátečních podmínek odpovídá součet příslušných řešení a obdobně se skalárními násobky. Dále si všimněme, že dosazením nul a jedniček do zadávaných počátečních k hodnot snadno získáme k lineárně nezávislých řešení naší rovnice. Jakkoliv jsou tedy zkoumané vektory nekonečné posloupnosti skalárů, samotný prostor všech řešení je konečněrozměrný. Předem víme, že jeho dimenze bude rovna řádu rovnice k, a umíme snadno určit bázi všech těchto řešení. Opět hovoříme o fundamentálním systému řešení a všechna ostatní řešení jsou právě jejich lineárními kombinacemi. Jak jsme si již ověřili, vybereme-li k po sobě jdoucích indexů i, i + 1, ..., i + k — 1, zadává homogenní lineární diferenční rovnice lineární zobrazení -» K°° ^-rozměrných vektorů počátečních hodnot do nekonečně rozměrných posloupností týchž skalárů. Nezávislost různých takových řešení je ekvivalentní nezávislosti počátečních hodnot, ale tu umíme snadno rozpoznat pomocí determinantu. Máme-li k-licí řešení (x^ , ..., x^), pak jde o nezávislá řešení, právě když následující determinant, tzv. Ca-soratián, je nenulový pro jedno (a pak už všechna) n [l] ři+l .tu ln-Ht-l xlk] xík] Xn+k-l 3.10. Rekurence s konstantními koeficienty. Těžko bychom hledali univerzální postup, jak hledat řešení obecných homogenních lineárních diferenčních rovnic, tj. přímo spočítatelný výraz pro obecné řešení x„. V praktických modelech ale velice často vystupují rovnice, ytaa kde jsou koeficienty konstantní. V tomto případe se C~^Í uhodnout vhodnou formu řešení a skutečně se r"v5tiv% nam P°darí naJft ^ lineárně nezávislých možností. 'fe»-**B»-i" Tím budeme mít problém vyřešený, protože všechna ostatní řešení budou jejich lineární kombinací. Pro jednoduchost začneme rovnicemi druhého řádu. Takové potkáváme obzvlášť často v praktických problémech, kde se vyskytují vztahy závisející na dvou předchozích hodnotách. Lineární diferenční rovnicí druhého řádu s konstantními koeficienty (resp. lineární rekurencí druhého řádu s konstantními koeficienty) tedy rozumíme předpis (3.3) yk+2 - a{\ + b)yk+i + abyk = 1, (3.4) f(n + 2) = a ■ f(n + 1) + b ■ f (n) + c, 130 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET kde yt je národní produkt v roce k. Konstanta a je takzvaný mezní sklon ke spotrebe, což je makroekonomický ukazatel, který udává jaký zlomek peněz, které mají obyvatelé k dispozici, utratí, a konstanta b popisuje, jak závisí míra investic soukromého sektoru na mezním sklonu ke spotřebě. Předpokládáme dále, že velikost národního produktu je normována tak, aby na pravé straně rovnice vyšlo číslo 1. Spočítejte konkrétní hodnoty pro a = |, b = |, y0 = 1, y\ = 1. Řešení. Nejprve budeme hledat řešení homogenní rovnice (pravá strana nulová) ve tvaru r1. Číslo r musí být řešením charakteristické rovnice 1 a(l + b)x + ab = 0, tj. x2 — x + ■ 0, která má dvojnásobný kořen \. Všechna řešení homogenní rovnice jsou potom tvaru a(j)" + bn(^)n, viz 3.12. Dále si všimněme, že najdeme-li nějaké řešení nehomogenní rovnice (tzv. partikulární řešení), tak pokud k němu přičteme libovolné řešení homogenní rovnice, obdržíme jiné řešení nehomogenní rovnice. Lze ukázat, že takto získáme všechna řešení nehomogenní rovnice (viz 3.14). V našem případě (tj. pokud jsou všechny koeficienty i nehomogenní člen konstantami) je partikulárním řešením konstanta yn = c. Dosazením do rovnice máme c — c + = 1, tedy c = 4. Všechna řešení diferenční rovnice 1 yt+2 — yk+\ + ■ y k i jsou tedy tvaru 4 + a (i)™ + bn (i)™. Požadujeme yo = y\ = 1 a tyto dvě rovnice dávají a = b = —3, tedy řešení naší nehomogenní rovnice je »=4-3Q)"-3»(£ Opět protože víme, že posloupnost zadaná touto formulí splňuje danou diferenční rovnici a zároveň dané počáteční podmínky, jedná se vskutku o tu jedinou posloupnost, která je těmito vlastnostmi charakterizována. □ V předchozím příkladu jsme použili tzv. metodu neurčitých koeficientů. Ta spočívá v tom, že na základě nehomogenního členu dané diferenční rovnice „uhodneme" tvar partikulárního řešení. Tvary partikulárních řešení jsou známy pro celou řadu nehomogenních členů. Např. rovnice kde a, b, c jsou známé skalární koeficienty. Např. v populačních modelech můžeme zohlednit, že jedinci v populaci dospívají a pořádně se rozmnožují až o dvě období později (tj. přispívají k hodnotě /(n + 2) násobkem/) - f (ti) s kladným b > 1), zatímco nedospělí jedinci vysílí a zničí část dospělé populace (tj. koeficient a pak bude záporný). Navíc si je třeba někdo pěstuje a průběžně si ujídá konstantní počet c < 0 v každém jednotlivém období. Speciálním takovým příkladem s c = 0 je např. Fibonacciho posloupnost čísel yo, yi, ..., kde yn+2 = yn+l + yn. Jestliže při řešení matematického problému nemáme žádný nový nápad, vždy můžeme zkusit, do jaké míry funguje známé řešení podobných úloh. Zkusme proto dosadit do rovnice (3.4) s koeficientem c — 0 podobné řešení jako u rovnic prvního řádu, tj. f (ti) — X" pro nějaké skalární X. Dosazením dostáváme A"+2 - aXn+l - bX" = X" (x2 -aX-b)=0. Tento vztah bude platit buď pro A. = 0 nebo při volbě hodnot A.1 = i (a + sja1 + 4bj , X2 = ^(a- j a1 + 4bj . Zjistili jsme tedy, že skutečně opět taková řešení fungují, jen musíme vhodně zvolit skalár X. To nám ale nestačí, protože my chceme najít řešení pro jakékoliv počáteční hodnoty /(O) a /(l), a zatím jsme našli jen dvě konkrétní posloupnosti splňující danou rovnici (a nebo dokonce jen jednu, pokud je A.2 = X\). Jak jsme již dovodili i u zcela obecných lineárních rekurencí, součet dvou řešení f\ (n) a f2(11) naší rovnice f(n + 2)-a-f(n + l)-b-f(n) = 0 je zjevně opět řešením téže rovnice a totéž platí pro konstantní násobky řešení. Naše dvě konkrétní řešení proto poskytují daleko obecnější řešení f(n) = CiX\ + C2Xn2 pro libovolné skaláry C\ a C2. Pro jednoznačné vyřešení konkrétní úlohy se zadanými počátečními hodnotami /(O) a f (ľ) nám zbývá jennajít příslušné konstanty C\ aC2. (A také si musíme ujasnit, zda to pro všechny počáteční hodnoty půjde). 3.11. Volba skalárů. Ukažme si, jak to může fungovat alespoň na jednom příkladě. Soustředíme se přitom na problém, že kořeny charakteristického polynomu nevychází obecně ve stejném oboru skalárů, jako jsou koeficienty v rovnici. Řešme tedy problém: (3.5) 1 y„+2 = y„+i + -y„ yo = 2, yi = 0. V našem případě je tedy A.i,2 1±V3) a zjevné (3.4) yn+k + aiyn+k--i H-----h akyn = Pm(n), yo = Ci + Ci = 2, yi = \ci (l + V3) + Íc2(l-V3) je splněno pro právě jednu volbu těchto konstant. Přímým výpočtem C\ — 1 — 5 \/3, C2 = 1 + 5 \/3 a naše úloha má jediné řešení /(n) = (l-iV3)i(l + V3)" + 1 + IVŠ) i (l - V3~)". 131 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET kde Pm{n) je polynom stupně m a příslušná charakteristická rovnice má reálné kořeny, má (skoro vždy) partikulární řešení tvaru Qm(n) a kde Qm(n) je polynom stupně m. Další možným způsobem řešení je tzv. metoda variace konstant, kdy nejprve najdeme řešení y(n) = ^Cifiin) zhomogenizované rovnice a poté uvažujeme konstanty c, jako funkce c, (n) proměnné n a hledáme partikulární řešení dané rovnice ve tvaru y(n) = ^2ci(n)fi(n). Na následujícím obrázku jsou vyneseny hodnoty/(ri)prori < 35, kde / vyhovuje rovnici f(n) = 9-f{n - 1) - lf(n - 2) + i /(O) = /(l) = 1. 10 15 20 25 30 35 Dále si procvičme, jak řešit lineární diferenční rovnice druhého řádu s konstantními koeficienty. Posloupnost vyhovující dané rekurentní rovnici druhého řádu je dána jednoznačně, pokud zadáme navíc nějaké dva její sousední členy. Znovu si povšimněme dalšího využití komplexních čísel: pro určení explicitního vzorce pro n-tý člen posloupnosti reálných čísel můžeme potřebovat výpočty s čísly komplexními (to nastává tehdy, pokud má charakteristický polynom dané diferenční rovnice komplexní kořeny, viz též 3.14). 3.7. Nalezněte explicitní vzorec pro posloupnost vyhovující následující lineární diferenční rovnici s počátečními podmínkami: xn+2 = 2xn +n, xi= 2, x2 = 2. Řešení. Zhomogenizovaná rovnice je ■Xn+2 — 2xn Všimněme si, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o samotném řešení dopředu víme, že je celočíselné též. Bez tohoto „úkroku" do většího oboru skalárů bychom ovšem obecné řešení napsat neuměli. S podobnými jevy se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého vyčíslování konstant diskutovat kvalitativní chování posloupnosti čísel /(«), tj. zda se budou s rostoucím n blížit k nějaké pevné hodnotě nebo budou oscilovat v nějakém rozsahu nebo utečou do neomezených kladných nebo záporných hodnot. 3.12. Obecný případ homogenních rekurencí. Zkusme nyní stejně jako v případě druhého řádu dosadit volbu xn — X" pro nějaký (zatím neznámý) skalár A do obecné homogenní rovnice z definice 3.9. Dostáváme pro každé n podmínku X"-k (a0Xk + axXk ■+ak)=0, což znamená, že buď A = 0 neboje A kořenem tzv. charakteristického polynomu v závorce. Charakteristický polynom ale už není závislý na n. Předpokládejme, že má charakteristický polynom k různých kořenů X\, ..., Xk. Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na R nebo R na C, protože výsledkem výpočtu pak stejně budou řešení, která opět zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno možné řešení Xn = Q-iY- Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení. K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n — 0, ... ,k — 1 pro k možností A, do Casoratiánu, viz 3.9. Dostaneme tak tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným) cvičením spočíst, že pro všechna k a jakékoliv &-tice různých A, je determinant takovéto matice nenulový, viz příklad II 2.241| na straně 80. To ale znamená, že zvolená řešení jsou lineárně nezávislá. Nalezli jsme tedy fundamentální systém řešení homogenní diferenční rovnice v případě, že všechny kořeny jejího charakteristického polynomu jsou po dvou různé. Uvažme nyní násobný kořen A a dosaďme do definiční rovnice předpokládané řešení x„ — n A™. Dostáváme podmínku aonX" + • • • + at(n — k)X" ■- 0. Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu (viz 5.6 na straně 239), kterou značíme apostrofem: A(a0A" ■ + akXn-k)' = 0 a hned na začátku kapitoly páté uvidíme, že kořen polynomu / je vícenásobný, právě když je kořenem i jeho derivace /'. Naše podmínka je tedy splněna. Při vyšší násobnosti í kořenu charakteristického polynomu můžeme postupovat obdobně a využijeme skutečnosti, že ^-násobný kořen je kořenem všech derivací polynomu až do (í — l)-ní derivace včetně. Tuto skutečnost dokážeme na začátku páté kapitoly. 132 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Její charakteristický polynomje x2 — 2, jeho kořeny jsou ±V2. Řešení zhomogenizované rovnice je tedy tvaru pro libovolná a, b e K. Partikulární řešení budeme hledat metodou neurčitých koeficientu. Nehomogenní část dané rovnice je lineární polynom n, partikulární řešení proto budeme nejprve hledat ve tvaru lineárního polynomu v proměnné n, tedy kn + /, kde k,l e K. Dosazením do původní rovnice dostáváme k{n + 2) + / = 2{kn + l) + n. Porovnáním koeficientů u proměnné n na obou stranách rovnice dostáváme vztah k = 2k + 1, tedy k = — 1, porovnáním absolutních členů pak vztah 2k + l = 21, tedy / = —2. Celkem je tedy partikulárním řešením je posloupnost — n — 2. Řešení dané nehomogenní diferenční rovnice druhého řádu bez počátečních podmínek jsou tedy tvaru a (y^2j + b(—*f2j —n — 2, a, b e K. Nyní dosazením do počátečních podmínek určíme neznámé a, b € K. Pro početní jednoduchost použijeme malého triku: z počátečních podmínek a daného rekurentního vztahu vypočteme člen x0 : x0 = | (x2 — 0) = 1. Daný rekurentní vztah spolu s podmínkami x0 = 1 a x\ = 1 pak zřejmě splňuje tatáž posloupnost, která splňuje původní počáteční podmínky. Máme tedy následující vztahy pro a, b: x0 : a (V2)0 + b (-Vž)" -2=1, tedy a + b = 3, x\ : V2a — */2b = 5, jejichž řešením dostáváme a = 6+54^, b sloupnost 6 l^2. Řešením je po- 6+5 4 (V2)" + ^(-V2)"-,-2. □ 3.8. Určete reálnou bázi prostoru řešení homogenní diferenční rovnice Xn+4 = Xn+3 + Xn+\ — Xn, Řešení. Charakteristický polynom dané rovnice je xA — x3 — x + 1. Hledáme-li jeho kořeny, řešíme reciprokou rovnici (to znamená, že koeficienty u (n — k)-té a k-té mocniny x, k = l,... ,n, jsou shodné) x4 - x3 - x + 1 = 0. Standardním postupem nejprve vydělíme rovnici výrazem x2 a poté zavedeme substituci / = x + i, tedy t2 = x2 + ^ + 2. Obdržíme Derivace přitom postupně vypadají takto: f(X)=a0Xn + ---+akX"-k, /'(A.) =a0nkn-1 H-----V ak(n - k)Xn~k~l, /"(A.) = a0«(«-l)A"~2H-----Vak(n-k)(n-k-l)kn-k-2, /<ť+1» ^a0n...(n-l)X"-1-1 + ... ----Vak(n-k)...(n-k- QA"-""1. Podívejme se na případ trojnásobného kořenu A a hledejme řešení ve tvaru n2A™. Dosazením do definiční podmínky dostaneme rovnost a0«2A" + • ■+ak(n- k)2l"-k = 0. Zjevně je levá strana rovna výrazu A2/"(A) + A/'(A), a protože je A kořenem obou derivací, je podmínka splněna. Indukcí snadno dokážeme, že i obecnou podmínku pro hledané řešení ve tvaru x„ — nlXn, a0nlXn + . ..ak(n - k)lXn~k = 0, dostaneme jako vhodnou lineární kombinaci derivací charakteristického polynomu začínající výrazem Ať+1 /<ť+1» 1 / -Xlí(í - 1)/ čímž jsme téměř dokázali následující: Věta. Každá homogenní lineární diferenční rovnice řádu k nad libovolným číselným oborem K obsaženým v komplexních číslech K má za množinu všech řešení k-rozměrný vektorový prostor generovaný posloupnostmi xn — nlXn, kde X jsou (komplexní) kořeny charakteristického polynomu, a í — 0, ... s — 1, kde s je násobnost příslušného kořenu X. Důkaz. Výše použité vztahy násobnosti kořenů a derivací uvidíme později, a nebudeme tu dokazovat tvrzení, že každý komplexní polynom má právě tolik kořenů, včetně násobnosti, jaký má stupeň. Zbývá tedy ještě dokázat, že nalezená &-tice řešení je lineárně nezávislá. 1 v tomto případě lze induktivně dokázat nenulovost příslušného Casoratiánu, jako jsme odkazovali u případu Vander-mondova determinantu výše. Pro ilustraci postupu ukážeme, jak výpočet vypadá pro případ jednoduchého kořenu Ai a dvojnásobného kořenu A2 charakteristického polynomu: ,»+2 Xi nX\ A™+1 (n + 1)A^+1 Aj+2 (n + 2)Xn+2 1 1 n Ai A2 (n + 1)A2 A 2 i2 1 A2 (n + 2)A2 1 1 n Ai - X2 0 A2 Ai(Ai - - A2) 0 X\ 2n Aj — A-2 A-2 2 Ai(Ai - A2) X\ (Ai - X2Y + 0. 133 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET rovnici t1 - t - 2 = 0 s kořeny t\ = — 1, t2 = 2. Pro obě tyto hodnoty neznámé / pak řešíme zvlášť rovnici danou substitučním vztahem: 1 x + - = -l. x 1 /T Ta má dva komplexní kořeny x\ = — j + i^f- = cos(2jt/3) + + i sin(2jr/3) ax2 = —\ — i^- = cos(2jt/3) — i sin(2jr/3). Pro druhou hodnotu neznámé / dostáváme rovnici 1 x + - = 2 x s dvojnásobným kořenem 1. Celkem je tedy bází hledaného vektorového prostoru posloupností, které jsou řešením dané diferenční rovnice, následující čtveřice posloupností: ^—\ + , (—\ — i^f) (konstantníposloupnost) a (n)^Lj. Hledáme-li V / ři=l však reálnou bázi, musíme nahradit dva generátory (posloupnosti) z této báze s komplexními hodnotami generátory reálnými. Protože tyto generátory jsou geometrické řady, jejichž libovolné členy jsou komplexně sdružená čísla, můžeme vzít jako vhodné generátory posloupnosti dané polovinou součtu, resp. polovinou i-násobku rozdílu, daných komplexních generátorů. Takto dostaneme následující reálnou bázi řešení: (l)^ (konstantní posloupnost), (n)™=l, (cos(rc • 2it/3))™=1, (sin(n • 2jt/3))~ i- □ 3.9. Najděte posloupnost, která vyhovuje nehomogenní diferenční rovnici s počátečními podmínkami: xn+2 = xn+\ + 2xn + 1, xx = 2, x2 = 2. Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(— 1)™ + b2". Partikulárním řešením je konstanta —1/2. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy x„ = a(-l)n + bT - ^. Dosazením do počátečních podmínek zjistíme konstanty a = —5/6, b = 5/6. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost xn = --(-1)" + -2"-1 --. □ 6 3 2 3.10. Řešte následující diferenční rovnici: xn+4 = xn+3 ~ xn+2 + xn+l ~ xn- Řešení. Z teorie víme, že prostor řešení této diferenční rovnice bude čtyřdimenzionální vektorový prostor, jehož generátory zjistíme V obecném případě vedeme podobně důkaz nenulovosti příslušného Casoratiánu indukcí. □ 3.13. Reálné báze řešení. Pro rovnice s reálnými koeficienty po- vedou reálné počáteční podmínky vždy na reálná řešení. Přesto ale budou příslušná fundamentální řešení z právě odvozené věty často existovat pouze v oboru komplexním. Zkusme proto najít jiné generátory, se kterými se nám bude pracovat lépe. Protože jsou koeficienty charakteristického polynomu reálné, každý jeho kořen bude buď také reálný nebo musí kořeny vystupovat po dvou komplexně sdružených. Jestliže si řešení popíšeme v goniometrickém tvaru jako A.™ = |A.|™(cosnip + i svcitup), A.™ = |A.|™(cosnip — i svcitup), okamžitě je vidět, že jejich součtem a rozdílem dostáváme jiná dvě lineárně nezávislá řešení (nezávislost snadno ověříme pomocí Casoratiánu) xn ~ \X\n cos n (vzhledem k tomu, že všechny kořeny rovnice mají absolutní hodnotu 1, tak jsou to reálné, resp. imaginární, části příslušných kořenů). □ 3.11. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 2xn+\ — 2xn se členy x\ = 2,x2 = 2. Řešení. Kořeny charakteristického polynomu x2 — 2x + 2 jsou 1 + i a 1 — i. Báze (komplexního) vektorového prostoru řešení je tedy tvořena posloupnostmi yn = (1 + i)" a z„ = (1 — i)". Hledanou posloupnost můžeme vyjádřit jako lineární kombinaci těchto posloupností (s komplexními koeficienty). Je tedy x„ = a ■ y„ + b ■ z„, kde a = a\ + ia2, b = b\ + ib2. Z rekurentního vztahu dopočteme x0 = \{2x\ — x2) = 0 a dosazením rc = 0arc = ldo uvažovaného vyjádření xn dostáváme 1 = xq = a\ + ia2 + b\ + ib2, 2 = x\ = (a\ + i'fl2)(l + 0 + (b\ + ib2)(l — i), Např. rovnice xn —xn-2 — 2 nemůže mít konstantní řešení, ale dosazením xn — ao + a\n dostáváme řešení a\ — 1 (a koeficient ao může být libovolný), a proto je obecné řešení naší rovnice xn = Ci+C2(-l)"+n. Všimněme si, že skutečně matice příslušného systému rovnic pro polynom nižšího stupně nula je nulová a rovnice 0 • ao — 2 nemá řešení. Další poznámky o vhodných postupech nalézání partikulárních řešení jsou za příkladem ||3.6||. 3.15. Lineární filtry. Uvažujme nyní nekonečné posloupnosti , X-n, X-n+\, ,X-\,X(,,X\, ■ )■ Budeme, podobně jako u systémů lineárních rovnic, pracovat s operací T, která zobrazí celou posloupnost x na posloupnost z — T x se členy zn = aoxn + a\xn-\ H-----h akxn-k. S posloupnostmi x můžeme opět pracovat j ako s vektory vzhle--i • » dem ke sčítání i násobení skaláry po složkách. Pouze bude ttento velký vektorový prostor nekonečněrozměrný. Naše zobrazení T je zjevně lineárním zobrazením na takovém i vektorovém prostoru. Posloupnosti si představme jako diskrétní hodnoty nějakého signálu, odečítané zpravidla ve velmi krátkých časových jednotkách, operace T pak může být filtrem, který signál zpracovává. Bude nás zajímat, jak odhadnout vlastnosti, které takový „filtr" bude mít. Signály jsou velice často ze své podstaty dány součtem několika částí, které jsou samy o sobě víceméně periodické. Z naší definice je ale zřejmé, že periodické posloupnosti xn, tj. posloupnosti splňující pro nějaké pevné přirozené číslo p budou mít i periodické obrazy z — T x Zn+p = aoxn+p +a\xn-\+p H-----h aixn-k+v = = a0xn + a\xn-\ H-----h akxn-k = z„ se stejnou periodou p. Pro pevně zvolenou operaci T nás bude zajímat, které vstupní periodické posloupnosti zůstanou přibližně stejné (případně až na násobek) a které budou utlumeny na nulové hodnoty. Ve druhém případě tedy hledáme jádro našeho lineárního zobrazení T. To je ale dáno právě homogenní diferenční rovnicí aoxn + a\x„-\ H-----h akxn-k =0, ao 7^ °. ak ^ °. kterou jsme se už naučili řešit. 3.16. Špatný ekvalizér. Jako příklad uvažujme velmi jednoduchý lineární filtr zadaný rovnicí Zn (Tx)n = Xn+2+Xn. Výsledky takového zpracování signálu jsou naznačeny na následujících čtyřech obrázcích pro postupně se zvyšující frekvenci periodického signálu '^^CL \„ — cos(prc). Signály se stejnou amplitudou * -^r* na všech obrázcích jsou původní signály, další jsou výsledky po zpracování filtrem. Nerovnoměrnosti křivek jsou důsledkem nepřesného kreslení, všechny signály jsou samozřejmě rovnoměrnými sinusovkami. 135 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET a porovnáním reálné a komplexní složky obou rovnic dostáváme lineární soustavu čtyř rovnic o čtyřech neznámých fli + b\ = 1, a2 + b2 = 0, a-[ — a2 + b-[ + b2 = 2, ai + a2 — b\ + b2 = 0 s řešením a\ =b\ = b2 = \ a a2 = —1/2. Celkem můžeme hledanou posloupnost vyjádřit jako 5-ľ)(i+!)"+G+ľ)(i-!)"- Posloupnost můžeme však vyjádřit i pomocí reálné báze (komplexního) vektorového prostoru řešení, totiž posloupností u„ = \ (y„ + zn) = (V2) cos (f) a v„ = \i{zn — yn) = {^2j sin (äf). Matice přechodu od komplexní báze k reálné je r:=(l ~é \2 21 inverzní matice je T~l = Pro vyjádření posloupnosti x„ po- mocí reálné báze, tj. souřadnice (c, d) posloupnosti xn v bázi [un ,v„], pak máme SK Máme tedy alternativní vyjádření posloupnosti x„, ve kterém se nevyskytují komplexní čísla (ale zase jsou v něm odmocniny): ,n = (V2)"cos(^) + (V2)"sin(^), které jsme samozřejmě mohli získat též řešením dvou lineárních rovnic o dvou neznámých c, d, totiž 1 = xo = c ■ uo + d ■ vo = c a 2 = x\ = c ■ u \ + d ■ v-i = c + d. □ 3.12. Dokažte, že každý člen posloupnosti zadané rekurentním vztahem xn = 2xn-\ + 8xn-2 - 9, n > 2, se členy x\ = 1, x2 = 25, je druhou mocninou přirozeného čísla. O C. Populační modely Populační modely, kterými se budeme zabývat, budou rekurentní vztahy ve vektorových prostorech. Neznámou veličinou tedy nebude posloupnost čísel nýbrž posloupnost vektorů. Roli koeficientů pak budou hrát matice. Začneme s jednoduchým (dvourozměrným) příkladem. Všimněme si, že v oblastech, kde je výsledný signál přibližně stejně silný jako původní, dochází k dramatickému posuvu fáze signálu. Levné ekvalizéry skutečně podobně špatně fungují. 3. Iterované lineární procesy 3.17. Iterované procesy. V praktických modelech se často setkáváme se situací, kdy je vývoj systému v jednom časovém období dán lineárním procesem, zajímáme .. -,tf _. se ale o chování systému po mnoha iteracích. Často přitom samotný lineární proces zůstává pořád stejný, z pohledu našeho matematického modelu tedy nejde o nic jiného než opakované násobení stavového vektoru stále stejnou maticí. Zatímco pro řešení systémů lineárních rovnic jsme potřebovali jen minimum znalostí o vlastnostech lineárních zobrazení, k pochopení chování iterovaného systému budeme účelně používat znalosti vlastních čísel, vlastností vlastních vektorů a další strukturní výsledky. V jistém smyslu se pohybujeme v podobném prostředí jako u lineárních rekurencí a skutečně můžeme náš popis filtrů v minulých odstavcích takto také popsat. Představme si, že pracujeme se zvukem a uchováváme si stavový vektor (x„, , Xn-k+\) všech hodnot od aktuální až po poslední, kterou ještě v našem lineárních filtru zpracováváme. V jednom časovém intervalu (ve vzorkovací frekvenci audio signálu mimořádně krátkém) pak přejdeme ke stavovému vektoru , Xn-k+l), kde první hodnota xn+\ = a\xn + • • • + akXn-k+\ je spočtena jako u homogenních diferenčních rovnic, ostatní si jen posunujeme o jednu pozici a poslední zapomeneme. Příslušná čtvercová matice 136 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET 3.13. Spoření. S kamarádem spoříme na společnou dovolenou následujícím způsobem. Na začátku dám 10 EUR a on 20 EUR. Každý další měsíc pak dá každý z nás tolik, co minulý měsíc plus polovinu toho, co dal ten druhý z nás předchozí měsíc. Kolik budeme mít za rok dohromady naspořeno? Kolik peněz budu platit dvanáctý měsíc? Řešení. Obnos peněz, který budu platit n-tý měsíc já označím x„ a to, co bude platit kamarád označím y„. První měsíc tedy dáme x\ = 10, y\ = 20. Pro další platby můžeme psát rekurentní rovnice: xn+l Pokud označíme společný vklad z„ rovnic dostaneme vztah z„+\ = z„ + jz„ = §z„. To je geometrická řada a dostáváme tedy z„ = 30 • (§)" \ Za rok budeme mít celkem naspořeno z\ + zi + ■ ■ ■ + z\i- Tento částečný součet umíme lehce spočítat 1 1 : xn + -y„, yn+x =y„ + -x„. : xn+yn, pak sečtením uvedených z +íz - 3- (i)""1 z\ 3 1 + 2 + - '3 '+l2 : 30 1 7725. Za rok tedy dohromady naspoříme více než 7724 euro. Rekurentní soustavu rovnic popisující systém spoření můžeme napsat pomocí matice následovně ' Xn+l |=í 2 I í X" Jde tedy opět o geometrickou řadu. Jejími prvky jsou teď ovšem vektory a kvocient není skalár, ale matice. Řešení lze nicméně najít obdobně g)-(í tra Mocninu matice působící na vektor (x\, vi) můžeme nalézt, když vyjádříme tento vektor v bázi vlastních vektorů. Charakteristický polynom matice je (1 — A.)2 — j a vlastní čísla jsou tedy A.1,2 = §, \. Příslušné vlastní vektory jsou po řadě (1, 1) a (1, —1). Pro počáteční vektor (x\,y\) = (10, 20) spočítáme 15 xn = 15 a proto To znamená, že já zaplatím 12. měsíc '3 euro a můj kamarád v podstatě stejně. 1297 □ Poznámka. Předchozí příklad lze řešit i bez matice následujícím řádu k splňující Yn+\ — A (a\ A = Y„ bude vypadat takto: a2 ... ak-i ak\ 0 ... 0 0 1 o o yo o ... 1 0/ Pro takovou j ednoduchou matici j sme si odvodili explicitní postup pro úplné řešení otázky, jak vypadá formule pro řešení. Obecně to tak snadno nepůjde ani pro velice podobné systémy. Jedním z typických případů je studium dynamiky populací v různých biologických systémech. Všimněme si také, že vcelku pochopitelně má matice A za charakteristický polynom právě p(X) = r -a\kk jak snadno dovodíme pomocí rozvoje podle posledního sloupce a rekurencí. To je vysvětlitelné i přímo, protože řešení x„ — A.™, X 7^ 0, vlastně znamená, že matice A vynásobením převede vlastní vektor (Xk, ..., X)T na jeho A-násobek. Musí být tedy takové A vlastním číslem matice A. 3.18. Leslieho model růstu populací. Představme si, že zkoumáme nějaký systém jednotlivců (pěstovaná zvířata, hmyz, buněčné kultury apod.) rozdělený do m skupin, třeba podle stáří, fází vývoje hmyzu, apod. Stav X„ je tedy dán vektorem X„ = (mi, ..., um)T závisejícím na okamžiku t„, ve kterém systém pozorujeme. Lineární model vývoje takového systému je dán maticí A dimenze n, která zadává změnu vektoru X„ na ■ A-Xn (fl h h ■ f m — 1 f m ^ 0 0 . 0 0 0 t2 0 . 0 0 0 0 0 0 0 0 . ■ rm_i 0 / přepsáním rekurentní rovnice: x„ při přírůstku času z t„ na tn+\. Uvažujme jako příklad tzv. Leslieho model růstu, ve kterém vystupuje matice A = jejíž parametry jsou svázány s vývojem populace rozdělené do m věkových skupin tak, že /, označuje relativní plodnost příslušné věkové skupiny (ve sledovaném časovém skoku vznikne z N jedinců v í—té skupině fiN jedinců nových, tj. ve skupině první), zatímco r, je relativní úmrtnost i-té skupiny během jednoho období. Pochopitelně lze použít takový model s libovolným počtem věkových skupin. Všechny koeficienty jsou tedy nezáporná reálná čísla a čísla r, jsou mezi nulou a jedničkou. Všimněme si, že pokud jsou všechna r, rovna jedné, jde vlastně o lineární rekurenci s konstantními koeficienty, a tedy buď exponenciálním růstem/poklesem (pro reálné kořeny A charakteristického polynomu) nebo oscilováním spojeným s případným růstem či poklesem (pro komplexní kořeny). 137 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Předcházející příklad byl vlastně modelem růstu (v daném případě růstu množství naspořených peněz). Nyní přejděme k modelům růstu popisujícím primárně růst nějaké populace. Leslieho model růstu, který jsme detailně rozebrali v teorii, velmi dobře popisuje nejen populace ovcí (podle kterých byl sestaven), ale uplatňuje se například i při modelování následujících populací: 3.14. Zajíci podruhé. Ukažme si, jak můžeme Leslieho modelem popsat populaci zajíců na louce, kterou jsme se zaobírali v příkladu (||3.5||). Uvažujme, že zajíci umírají po dovršení devátého měsíce věku (v původním modelu byl věk zajíců neomezen). Označme počty zajíců (resp. zaječic) podle stáří v měsících v čase / (měsíců) jako xi(ť), xi(t), ■ ■ ■, xg(t), tak počty zajíců v jednotlivých věkových skupinách budou po jednom měsíci xi(r+l) = X2(t)+xi(t)+- ■ ■ +xg(t), Xi(t + 1) = Xi-i(t), pro i = 2, 3,..., 10, neboli A,(ř + l)\ (° 1 1 1 1 1 1 1 1\ Ai(0\ x2(t + 1) 1 0 0 0 0 0 0 0 0 x2(t) x3(t + 1) 0 i 0 0 0 0 0 0 0 x3(t) x4(í + 1) 0 0 1 0 0 0 0 0 0 x4(í) x5(t + 1) = 0 0 0 1 0 0 0 0 0 x5(t) x6(t + 1) 0 0 0 0 1 0 0 0 0 x6(í) x-i(t + 1) 0 0 0 0 0 1 0 0 0 x-i(í) xg(t + l) 0 0 0 0 0 0 1 0 0 x$(t) W'+1)/ v> 0 0 0 0 0 0 1 o) Charakteristický polynom uvedené matice je l9 }7 }6 }5 }4 }3 }2 i i A — A — A — A — A — A — A — A — 1. Kořeny této rovnice nejsme schopni explicitně vyjádřit, jeden z nich však velmi dobře odhadnout, Xi = 1, 608 (proč musí být menší než (VB~ +1)/2)?). Populace bude tedy podle tohoto modelu růst přibližně s geometrickou řadou s kvocientem 1, 608'. Obecněji můžeme zpracovat předcházející model takto: 3.15. Nechť je v populačním modelu dravec-kořist určen vztah mezi počtem dravců Dk a kořisti Kk v daném a následujícím měsíci (k € N U {0}) lineárním systémem (a) Dk+1 = 0,6 Dt + 0,5 Kk, Kk+l = -0,16 Dk + 1,2 Kk; (b) Dk+X = 0,6 Dk + 0,5 Kk, Kk+l = -0,115 Dk + 1,2 Kk; (c) Dk+X = 0,6 Dk + 0,5 Kk, Kk+l = -0,135 Dk + l,2Kk. Analyzujte chování tohoto modelu po velmi dlouhé době. Řešení. Všimněme si, že jednotlivé varianty se od sebe navzájem liší pouze v hodnotě koeficientu u Dk ve druhé rovnici. Můžeme proto Než se pustíme do obecnější teorie, trochu si pohrajeme s tímto konkrétním modelem. Přímým výpočtem pomocí Laplaceova rozvoje podle posledního sloupce spočteme charakteristický polynom pm(X) matice A pro model s m skupinami: Pm(X) = \A- XE\ = -XPm-l(X) + (-I/"-1/™*! . . . Tm_L Vcelku snadno dovodíme indukcí, že tento charakteristický polynom má tvar pm(k) = (-l)mQ,m - aikm-1-----am_iA - am) s vesměs nezápornými koeficienty a\, ... ,am, pokud jsou všechny parametry r, a /, kladné. Např. je vždy Zkusme kvalitativně odhadnout rozložení kořenů polynomu j.^1 ., pm. Bohužel, detaily budeme umět přesně vysvětlit a ověřit až po absolvování příslušných partií tzv. matematické analýzy v kapitole páté a později, přesto by ale postup měl být intuitivně jasný. Vyjádříme si charakteristický polynom ve tvaru pm(X) = ±\m{l-q(X)), kde q(X) — a\X~l + • • • + amX~m je ostře klesající a nezáporná funkce pro A. > 0. Evidentně bude proto existovat právě jedno kladné X, pro které bude q(X) — la tedy také pm (X) — 0. Jinými slovy, pro každou Leslieho matici existuje právě jedno kladné reálné vlastní číslo. Pro skutečné Leslieho modely populací bývají všechny koeficienty r, i f j mezi nulou a jedničkou a typicky nastává situace, kdy jediné reálné vlastní číslo X\ je větší nebo rovno jedné, zatímco absolutní hodnoty ostatních vlastních čísel jsou ostře menší než jedna. Jestliže začneme s libovolným stavovým vektorem X, který bude dán jako součet vlastních vektorů X — X-[ + ■ ■ ■ + xm s vlastními hodnotami á,, pak při iteracích dostáváme Ak ■X^x\xl+...XkmXm, takže za předpokladu, že |á,| < 1 pro všechna i > 2, budou všechny komponenty ve vlastních podprostorech velmi rychle mizet, kromě komponenty X\Xk. Rozložení populace do věkových skupin se tak budou rychle blížit poměrům komponent vlastního vektoru k dominantnímu vlastnímu číslu X\. Například pro matici (uvědomme si význam jednotlivých koeficientů, jsou převzaty z modelu pro chov ovcí, tj. hodnoty r zahrnují jak přirozený úhyn tak případné aktivity chovatelů na jatkách) / 0 0,2 0,8 0,6 0\ 0,95 0 0 0 0 0 0,8 0 0 0 0 0 0,7 0 0 \ 0 0 0 0,6 0/ vyjdou vlastní hodnoty přibližně 1,03; 0; -0,5; -0,27 + 0,74/; -0,27-0,74/ 138 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET všechny tři případy vyjádřit jako 0,6 0,5\ /On -a 1,2 ' Uh k e N, kde budeme postupně klást a = 0,16, a = 0,175, a = 0,135. Hodnota koeficientu a zde reprezentuje průměrný počet kusů kořisti zahubených jedním (očividně „nenáročným") dravcem za měsíc. Při označení ^0,6 0,5\ -a 1,2/ bezprostředně dostáváme rlc . f D0 , Ko i eN. Pomocí mocnin matice T tak. můžeme určit vývoj populací dravce a kořisti po velmi dlouhé době. Snadno stanovíme vlastní čísla (a) Xi = 1, X2 = 0,8; (b) Xi = 0,95, X2 = 0,85; (c) Xi = 1,05, X2 = 0,75 matice T a jim (při zachování pořadí) příslušné vlastní vektory (a) (5,4)r, (5,2)r; (b) (10,7)r, (2,l)r; (c) (10,9)r, (10,3)r. Víme, že matice T má v bázi dané vlastními vektory diagonální tvar s vlastními čísly na diagonále. Vlastní vektory zapsané do sloupců pak zadávají matici přechodu od standardní báze k bázi tvořené vlastními vektory. Je tedy /i ii \ ^ T 5 5 4 2 a pro k € N tudíž platí (a) 5 5 4 2 1 0 0 0,8 1 0 0 0,8 5 5 4 2 5 5 4 2 (b) (c) 7 1/ V 0 0,85/ V 7 1 10 10\ /1,05 0 Ý /10 10^ 1 9 3) \ 0 0,75) \ 9 3 Odtud dále pro velká k e N plyne s velikostmi 1,03; 0; 0,5; 0,78; 0,78 a vlastní vektor příslušný dominantnímu vlastnímu čísluje přibližně XT = (30 27 21 14 8). Zvolili jsme rovnou jediný vlastní vektor se součtem souřadnic rovným stu, zadává nám proto přímo výsledné procentní rozložení populace. Pokud bychom chtěli místo tříprocentního celkového růstu populace setrvalý stav a předsevzali si ujídat více ovce třeba z druhé věkové skupiny, řešili bychom úlohu, o kolik máme zmenšit r2, aby bylo dominantní vlastní číslo rovno jedné. 3.19. Matice s nezápornými prvky. Reálné matice, které nemají žádné záporné prvky mají velmi speciální vlastnosti. Zároveň jsou skutečně časté v praktických modelech. Naznačíme proto teď proto tzv. Perronovu-Frobeniovu teorii, která se právě takovým maticím věnuje. Začneme definicí několika pojmů, abychom mohli naše úvahy vůbec formulovat. .___| Kladné a primitivní matice J___ Definice. Za kladnou matici budeme považovat takovou čtvercovou matici A, jejíž všechny prvky jsou reálné a kladné. Primitivní matice je pak taková čtvercová matice A, jejíž nějaká mocnina Ak je kladná. Připomeňme, že spektrálním poloměrem matice A nazýváme maximum absolutních hodnot všech jejích (reálných i komplexních) vlastních čísel. Spektrálním poloměrem lineárního zobrazení na (konečněrozměrném) vektorovém prostoru rozumíme spek- 2 trální poloměr jeho matice v některé bázi. Normou matice A e W nebo vektoru x e W rozumíme součet absolutních hodnot všech jejich prvků. U vektorů x píšeme pro jejich normu \x\. Následující výsledek je mimořádně užitečný a snad i dobře srozumitelný. Jeho důkaz se svou náročností dosti vymyká této učebnici, uvádíme ale alespoň jeho stručný nástin. Pokud by čtenář měl problém s plynulým čtením nástinu důkazu, doporučujeme jej přeskočit. Věta (Perronova). Jestliže je A primitivní matice se spektrálním poloměrem X e R, pak je X jednoduchým kořenem charakteristického polynomu matice A, který je ostře větší než absolutní hodnota kteréhokoliv jiného vlastního čísla matice A. K vlastnímu číslu X navíc existuje vlastní vektor x s výhradně kladnými prvky xj. . 1 V důkazu se budeme opírat o intuici elementární geometrie. Částečně budeme použité koncepty upřesňovat už v analytické geometrii ve čtvrté kapitole, některé analytické aspekty budeme studovat podrobněji v kapitolách páté a později, přesné důkazy některých analytických kroků v této učebnici nepodáme vůbec. Snad budou následující úvahy nejen osvětlovat dokazovaný teorém, ale budou také samy o sobě motivací pro naše další studium geometrie i matematické analýzy. Začneme docela srozumitelně znějícím pomocným lemmatem: inspirováno materiálem na webu, viz http://www-users.math.umd.edu/ ~mmb/475/spec.pdf 139 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET (a) (b) 5 5 4 2 1 Tô 10 2 7 1 0 0 0 0 1 0 o o 10 25 -8 20 0 0 0 0 5 5 4 2 10 2 7 1 (c) 1,05* 0 0 0 10 10 9 3 - h^L í'30 100 " 60 v-27 90 neboť právě pro velká k e N můžeme položit (a) 10 10 9 3 (b) (c) 1 0 0 0,8 0,95 0 0 0,85 i oy 0 0/ ' o o o o '1,05 0 \\, (l,05k 0\ 0 0,75/ \ 0 0/ " Podotkněme, že ve variantě (b), tj. pro a = 0,175, nebylo nutné vlastní vektory počítat. Obdrželi jsme tak (a) 'z>*\ j_/-10 25\ /iV .*j~10\-8 20 ľ\K0, J_ (5 (-2D0 + 5K0)\ 10 U(-2Do + 5K0) ľ (b) (c) 0 0 0 0 t)- hOÝ(-30 100\ (Do 60 v"27 90 / ' \Ko. _ l,05k (10 (-3D0 + 10K0)\ 60 v 9 (-3/50 + 10X0)/" Tyto výsledky lze interpretovat následovně: (a) Pokud 2D0 < 5K0, velikosti obou populací se ustálí na nenulových hodnotách (říkáme, že jsou stabilní). Jestliže 2 D0 > 5 K0, obě populace vymřou. Lemma. Uvažme libovolný mnohostěn P obsahující počátek 0 e R". Jestliže nějaká iterace lineárního zobrazení ý : W -» M" zobrazuje P do jeho vnitřku, pak je spektrální poloměr zobrazení ý ostře menší než jedna. Uvažme matici A zobrazení ý ve standardní bázi. Protože vlastní čísla Ak jsou k-té mocniny vlastních čísel matice A, můžeme rovnou bez újmy na obecnosti předpokládat, že samotné zobrazení ý již zobrazuje P do vnitřku P. Zjevně tedy nemůže mít ý Žádnou vlastní hodnotu s absolutní hodnotou větší než jedna. Důkaz dále povedeme sporem. Předpokládejme, že existuje vlastní hodnota A s |A| = 1. Máme tedy dvě možnosti. Buď je Ař = l pro vhodné k nebo takové k neexistuje. Obrazem P je uzavřená množina (to znamená, že pokud se body v obrazu budou hromadit k nějakému bodu jvl", bude y opět v obrazu) a hranici P tento obraz vůbec neprotíná. Nemůže tedy mít ý pevný bod na hranici P ani nemůže existovat žádný bod na hranici, ke kterému by se mohly libovolně blížit body v obrazu. První argument vylučuje, že by nějaká mocnina A byla jedničkou, protože to by takový pevný bod na hranici P jistě existoval. Ve zbývajícím případě jistě existuje dvourozměrný podprostor W c W, na nějž se ý zužuje coby rotace o iracionální argument a jistě existuje bod y v průniku W s hranicí P. Pak by ale byl bod y libovolně přesně přiblížen body z množiny i/r (y) při průchodu přes všechny iterace, a tedy by musel sám být také v obrazu. Došli jsme tedy ke sporu a lemma je ověřeno. Nyní se dáme do důkazu Perronovy věty. Naším prvním krokem bude ověření existence vlastního vektoru, který má všechny prvky kladné. Uvažme za tím účelem tzv. standardní simplex ■ \x = (*1, ,xny- \x\ = i,Xi>o,i- 1, Protože všechny prvky v matici A jsou nezáporné, obraz A-x bude mít samé nezáporné souřadnice stejně jako x a alespoň jedna z nich bude vždy nenulová. Zobrazení x \-> \A ■ x\~l(A ■ x) proto zobrazuje 5 do sebe, Toto zobrazení 5^5 splňuje všechny předpoklady tzv. Brouwerovy věty o pevném bodě a proto existuje vektor y e 5 takový, že je tímto zobrazením zobrazen sám na sebe. Důkaz Brouwerovy věty v této učebnici nepodáváme, zájemci snadno najdou odkazy na wikipedii. To ale znamená, že A • y = A y, A = |A • y| a našli jsme vlastní vektor, který leží v 5. Protože ale má nějaká mocnina Ak podle našeho předpokladu samé kladné prvky a samozřejmě je také Ak ■ y — Xky, všechny souřadnice vektoru y jsou ostře kladné (tj. leží ve vnitřku S) a A > 0. Abychom dokázali zbytek věty, budeme uvažovat zobrazení zadané maticí A ve výhodnější bázi a navíc ho vynásobíme konstantou A-1: B = A_1(F_1 ■ A ■ Y), kde Y je diagonální matice se souřadnicemi y, právě nalezeného vlastního vektoru y na diagonále. Evidentně je B také primitivní (1, 1) jejím vlastním vektorem, matice a navíc je vektor z : protože zjevně Y ■ z = y. Jestliže nyní dokážeme, že /j, = 1 je jednoduchým kořenem charakteristického polynomu matice B a všechny ostatní kořeny mají absolutní hodnotu ostře menší nezjedná, bude Perronova věta dokázána. 140 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET (b) Obě populace vymřou. (c) Pro3Z)o < lOKo nastává populační exploze obou druhů. Pro 3Do > ÍOKo obě populace vymřou. To, že extrémně malá změna velikosti a může vést ke zcela odlišnému výsledku, je zapříčiněno neměnností hodnoty a v závislosti na velikosti obou populací. Poznamenejme, že toto omezení, kdy a v našich modelech považujeme za konstantní, nemá oporu ve skutečnosti. Přesto získáváme odhad velikosti a pro stabilní populace. □ V lineárních modelech hrají významnou roli tzv. primitivní matice (viz 3.19). 3.16. Které z matic 1/7' 6/7 D /1/3 1/2 1/2 1/3 0 1/6 1/6 \l/6 0 5/6 jsou primitivní? Řešení. Neboť 1/7 6/49 6/7 43/49 (3/8 C3 1/4 l/4> 1/4 1/21 1/4 3/8 ^3/8 3/8 matice A a C jsou primitivní. Dále platí rovnost \l/2 0 1/6/ \0/ \o/ a tak bude prostřední sloupec matice B" vždy (pro libovolné n e N) vektorem (0,1, 0)r, tj. matice B nemůže být primitivní. Součin /l/3 1/2 0 0 \ /0\ / 0 \ 1/2 1/3 0 0 0 1/6 1/6 1/3 \l/6 0 5/6 2/3/ 0 a \b) 0 a/6 + b/3 \5a/6 + 2b/3 J a, b e implikuje, že matice D2 bude mít v pravém horním rohu nulovou dvourozměrnou (čtvercovou) submatici. Opakováním této implikace dostáváme, že stejnou vlastnost mají matice D3 = D ■ D2, D4 = D ■ D3, ..., D" = D ■ Z)"-1,..., tudíž matice D není primitivní. Matice E je permutační (v každém řádku a sloupci má právě jeden nenulový prvek, a to 1). Není obtížné si uvědomit, že mocniny permutační matice jsou opět permutační matice. Matice E proto také není primitivní. To lze rovněž ověřit výpočtem mocnin E2, E3, E4. Matice E4 je totiž jednotková. □ Nyní uvedme poněkud obsáhlejší model. K tomu se nám teď bude hodit dříve dokázané pomocné lemma. Uvažujme matici B jako matici lineárního zobrazení, které zobrazuje řádkové vektory u = (mi, ..., un) i—> u • B ~ v , tj. pomocí násobení zprava. Díky tomu, že jez = (1, ..., l)r vlastním vektorem matice B, je součet souřadnic řádkového vektoru v roven n n ^ Uibij = Y^uí = 1, i,j=\ í=l kdykoliv je m e S. Proto toto zobrazení zobrazuje simplex 5 na sebe a má také jistě v 5 vlastní (řádkový) vektor w s vlastní hodnotou jedna (pevný bod, opět dle Brouwerovy věty). Protože nějaká mocnina ti1 obsahuje samé ostře pozitivní prvky, je nutně obraz simplexu 5 v k-té iteraci zobrazení daného B uvnitř 5. To už jsme blízko použití našeho lemmatu, které jsme si pro důkaz připravili. Budeme i nadále pracovat s řádkovými vektory a označme si P posunutí simplexu 5 do počátku pomocí vlastního vektoru w, který jsme právě našli, tj. P = — w+S. Evidentně je P mnohostěn obsahující počátek a vektorový podprostor V c W generovaný P je invariantní vůči působení matice B pomocí násobení řádkových vektorů zprava. Zúžení našeho zobrazení na P tedy splňuje předpoklady pomocného lemmatu, a proto nutně musí být všechny jeho vlastní hodnoty v absolutní hodnotě menší nezjedná. Ještě se musíme vypořádat se skutečností, že právě uvažované zobrazení je dáno násobením řádkových vektorů zprava maticí B (zatímco nás původně zajímalo chování zobrazení, zadaného maticí B pomocí násobení sloupcových vektorů zleva). To je ale ekvivalentní násobení transponovaných sloupcových vektorů transponovanou maticí B obvyklým způsobem zleva. Dokázali jsem tedy vlastně potřebné tvrzení o vlastních číslech pro matici transponovanou k naší matici B. Transponování ale vlastní čísla nemění. Dimenze prostoru V je přitom n — 1, takže důkaz věty je ukončen. □ 3.20. Jednoduché důsledky. Následující velice užitečné tvrzení má při znalosti Perronovy věty až překvapivě jedno-^ duchý důkaz a ukazuje, jak silná je vlastnost primi-tivnosti matice zobrazení. Důsledek. Jestliže A = (ay) je primitivní matice a x e W její vlastní vektor se všemi souřadnicemi nezápornými a vlastní hodnotou X, pak X > 0 je spektrální poloměr A. Navíc platí n n Důkaz. Uvažme vlastní vektor x z dokazovaného tvrzení. Protože je A primitivní, můžeme zvolit pevně k tak, aby A* už měla samé pozitivní prvky, a pak je samozřejmě i Ak ■ x — Xkx vektor se samými ostře kladnými souřadnicemi. Nutně proto je X > 0. Z Perronovy věty víme, že spektrální poloměr /j, je vlastním číslem a zvolme takový vlastní vektor y k /í, že rozdíl x — y má samé kladné souřadnice. Potom nutně pro všechny mocniny n 0 < A" • (x - ý) = Xnx - iŕy, ale zároveň platí X < /j,. Odtud již vyplývá X = /j,. Zbývá odhad spektrálního poloměru pomocí minima a maxima součtů jednotlivých sloupců matice. Označme je bmin a £>max, 141 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET 3.17. Model šíření jednoletých bylin. Budeme uvažovat rostliny, které na začátku léta vykvetou, na jeho vrcholu vyprodukují semena a samy uhynou. Některá ze semen vyklíčí ještě na konci podzimu (ozimé rostliny), jiná přečkají zimu v zemi a vyklíčí na začátku jara (jarní rostliny). Ozimé rostlinky (sazenice), které přes zimu nezmrz- nou, jsou na jaře větší než jarní a většinou z nich vyrostou větší rostliny než z jarních sazenic. Větší rostlina vyprodukuje více semen. Pak se celý vegetační cyklus opakuje. Rok je tedy rozdělen na čtyři vegetační období a v každém z těchto období můžeme rozlišit několik „forem" rostliny: Období stadia rostliny začátek jara malé a velké sazenice začátek léta malé, střední a velké kvetoucí rostliny vrcholné léto semena podzim sazenice a přezimující semena Označme x\(t), resp. x2(t), počet malých, resp. velkých, sazenic na začátku jara roku / a 31(/), resp. yi(t), resp. 33 (/), počet malých, resp. středních, resp. velkých rostlin v létě téhož roku. Z malých sazenic mohou vyrůst malé nebo střední rostliny, z velkých sazenic mohou vyrůst střední nebo velké rostliny. Kterákoliv ze sazenic samozřejmě může uhynout (uschnout, být spasena krávou a podobně) a nevyroste z ní nic. Označme pravděpodobnost, že ze sazenice j-té velikosti, j = 1,2, vyroste rostlina i-té velikosti, i = 1, 2, 3. Pak je 0<ž>n 0, tak najdeme hranici na počet iterací k po níž už všechny komponenty uvedené matice se od té limitní budou Ušit o méně než £. Důsledek. Nechť T je primitivní stochastická matice z Markovova procesu a x^ je stochastický vlastní vektor k dominantnímu číslu 1 jako ve větě výše. Pak iterace Tk konvergují k limitní matici Tca, jejíž všechny sloupce jsou rovny x^. Důkaz. Sloupce v matici Tk jsou obrazy vektorů standardní báze v příslušném iterovaném lineárním zobrazení. To ale jsou obrazy pravděpodobnostních vektorů, a proto všechny konvergují k x0 □ Nyní se ještě na rozlučku s Markovovými procesy zamyslíme nad problémem, zda existují pro daný systém stavy, do kterých se má systém tendenci dostat a setrvat v nich. 143 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET rekurentní formule: x(t + 1) = Fw(t) = F(Dz(t)) = (FD)z(t) = (FD){Cy(t)) = = (FDQy(t) = (FDQ(Bx(t)) = (FDCB)x(t), y(t + 1) = Bx(t + 1) = B(Fw(t)) = (BF)w(t) = = (BF)(Dz(t)) = (BFD)z(t) = (BFD){Cy(i)) = = (BFDQy(t), z(t + 1) = Cy(t + 1) = C(Bx(t + 1)) = (CB)x(t + 1) = = (CB)(Fw(t)) = (CBF)w(t) = (CBF)(Dz(t)) = = (CBFD)z(t), w(t + 1) = Dz(t + 1) = D(Cy(t + 1)) = (DC)y(t + 1) = = (DQ(Bx(t + 1)) = (DCB)x(t + 1) = = (DCB)(Fw(t)) = (DCBF)w(t). Při označení AT = FDCB, Av = BFDC, A7 = CBFD, A„, = DCBF je zjednodušíme na formule x(t + 1) = Axx(t), Z(t + 1) = Azz(t), y(t + 1) = Ayy(t), w(t + 1) = Aw(t). Z těchto formulí již můžeme vypočítat složení populace rostlin v libovolném období libovolného roku, pokud známe složení populace v nějakém období počátečního (nultého) roku. Nechť je například známo složení populace v létě, tj. počet z(0) vysetých semen. Pak složení populace na začátku jara /-tého roku je x(t) = Axx(t - 1) = A2xx(t - 2) = • • • = A'-lx(l) = = A'-1 Fw(0) = A'-1 FDz(O). Povšimněme si, že matice Az = CBFD je typu lxl. Není to tedy matice, ale skalár. Můžeme tedy označit X = Az, vypočítat (3.5) X = CBFD = (cn cn cl3)(l: = (cnbn + cnb2\ cnb22 + ci3fc32) ^^2^21) = = bncndnfn + b2-icndufu + b22cnd2if22 + b32c13d21f22 a předchozí výpočet uspořádat do výhodného tvaru x(t) = (FDCB)'-1 FDz(0) = FD(CBFD)'-2CBFDz(G) = = FD(CBFD)'-lz(G) = FDA'-lz(G) = X'-1 FDz(0). Tímto způsobem zůstanou pouze dvě násobení matic. O stavu systému řekneme, že je přechodový, jestliže v něm systém setrvává s pravděpodobností ostře menší nezjedná. Za absorpční označíme stav, ve kterém systém setrvává s pravděpodobností 1 a do kterého se lze dostat s nenulovou pravděpodobností z kteréhokoliv z přechodových stavů. Konečně, Markovův řetězec xn je absorpční, jestliže jsou jeho všechny jeho stavy buď absorpční nebo přechodové. Je-li v absorpčním Markovově řetězci prvních r stavů systému absorpčních, pro stochastickou matici T systému to znamená, že se rozpadá na „blokově" horní trojúhelníkový tvar (E Vo Q) kde E je jednotková matice, jejíž rozměr je dán počtem absorpčních stavů, zatímco R je kladná matice a Q nezáporná. V každém případě iteracemi této matice budeme pořád dostávat stejný blok nulových hodnot v levém dolním bloku, a tedy zcela jistě nebude primitivní, např. T = (o E R + R-Q 1 o takových maticích lze získat hodně informací pomocí plné Perronovy-Frobeniovy teorie a se znalostí pravděpodobnosti a statistiky také odhadovat střední doby, po kterých se systém dostane do jednoho z absorpčních stavů apod. 4. Více maticového počtu Na vcelku praktických příkladech jsme viděli, že porozumění vnitřní struktuře matic a jejich vlastnostem je silným nástrojem pro konkrétní výpočty nebo analýzy. Ještě více to platí pro efektivitu numerického počítání s maticemi. Proto se budeme zase chvíli věnovat abstraktní teorii. Budeme přitom zkoumat další speciální typy lineárních zobrazení na vektorových prostorech ale také obecný případ, kdy je struktura zobrazení popsána tzv. Jordánovou větou. 3.23. Unitární prostory a zobrazení. Už jsme si zvykli, že je užitečné pracovat rovnou v číselném oboru komplexních čísel a to i v případě, kdy nás zajímají jen reálné objekty. Navíc v mnohých oblastech jsou komplexní vektorové prostory nutnou součástí úvah. Jasným příkladem je například tzv. kvantové počítání, které se stalo velmi akční oblastí teoretické informatiky, přestože kvantové počítače zatím zkonstruovány ve funkční podobě nebyly. Proto navážeme na ortogonální zobrazení a matice z konce druhé kapitoly následující definicí: _I Unitární prostory |__, Definice. Unitární prostor je komplexní vektorový prostor V spolu se zobrazením V x V —> C, (u, v) i-> u ■ v, které splňuje pro všechny vektory u, v, w e V a skaláry a e C (1) u ■ v = v ■ u (zde pruh značí komplexní konjugaci), (2) (au) ■ v = a(u ■ v), (3) (u + v) ■ w = u ■ w + v ■ w, (4) je-li pak u ■ u > 0 (zejména je výraz reálný). Toto zobrazení nazýváme skalární součin na V. Reálné číslo V11 • v nazýváme velikostí vektoru v, značíme ||ií|| a vektor je normovaný, jestliže má velikost jedna. Vektory m a v nazýváme ortogonální, jestliže je jejich skalární součin nulový, 144 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Uvedeme konkrétní hodnoty matic B, C, D, F. Jedná se o parametry hypotetické rostliny, které ale byly inspirované skutečnou trávou Vulpia ciliata: f 0,3 0 \ B= 0,1 0,6 , C= (1 10 100), V 0 0,2/ D : 0,5 0,5 0,05 0 0 0,1 Nyní můžeme vypočítat jednotlivé matice, které zobrazují vektor popisující složení populace v nějakém vegetačním období na vektor složení populace v temže období následujícího roku: /nm?s n«nn\ Z0'0075 °'0750 0,7500\ A* = (o 0650 ^= 0,0325 0,3250 3,2500 , V0'0650 i'3000/ 10,0100 0,1000 1,0000 i 1,3325, _ /0,0325 1,3000\ ~ 10,0325 1,3000/' Hodnota A = Az = 1,3325 vyjadřuje meziroční relativní přírůstek populace. Přesvědčete se, že každá z matic Ax, Ay, Aw má jedinou nenulovou vlastní hodnotu X = 1,3325; ostatní vlastní hodnoty jsou rovny 0. Ukážeme ještě jedno využití uvedeného modelu. Může nás zajímat, jak „pružně" reaguje meziroční relativní přírůstek X na změnu jednotlivých „demografických parametrů", jak např. změna pravděpodobnosti přežití semene přes zimu ovlivní meziroční přírůstek. Tuto otázku poněkud upřesníme. Za pružnost reakce charakteristiky X na parametr s, označenou e(X,s) prohlásíme relativní změnu hodnoty X vztaženou k relativní změně parametru s. Ještě přesněji: označíme X(s) meziroční přírůstek závislý na parametru s. Potom AX(s) = X(s + As) — X(s) vyjadřuje absolutní změnu relativního přírůstku X při absolutní změně parametru soAs. Relativní změna X tedy je AX(s)/X(s). Relativní změna přírůstku parametru í je As /s. Hledaná pružnost je tedy podíl těchto relativních změn, tj. AX(s)/X(s) s X(s + As) - X(s) e(X, s) =-=--. As /s X(s) As Konkrétně meziroční relativní přírůstek populace závislý na přežití semen přes zimu je podle (||3.5||) M/22) = d2l(b22cl2 + h2C\i)fi2 + dn(bncnfn + b2lcl2fn) a pro konkrétní zvolené hodnoty ostatních parametrů X(f22) = 13/22 + 0,0325. Poněvadž f22 = 0,1, můžeme počítat A(0,1) = 1,3325, A(0,1+Aí) = 1,3325+13Aí, AA(0,1) = 13Aí, bázi sestavenou z po dvou ortogonálních a normovaných vektorů nazýváme ortonormální báze V. Na první pohled jde o rozšíření definice euklidovských vektorových prostorů do komplexního oboru. Nadále budeme také používat alternativní značení (u, v } pro skalární součin vektorů u a v. Zcela stejně jako v reálném oboru také okamžitě z definice vyplývají následující jednoduché vlastnosti skalárního součinu pro všechny vektory ve V a skaláry v C: u ■ u e R, u ■ u — 0 právě tehdy, když u — 0, u ■ (au) — ä(u ■ v), u ■ (v + w) — u ■ v +u ■ w, u ■ 0 — 0 • u ■- 0, i j i, j kde poslední rovnost platí pro všechny konečné lineární kombinace. Podrobné ověření je skutečně jednoduchým cvičením, např. první vztah plyne okamžitě z definiční vlastnosti (1). Standardním příkladem skalárního součinu na komplexním vektorovém prostoru C" je (xi, ,xn) -(ji, ,xny -- x\y\ -xnyn. Díky konjugování souřadnic druhého argumentu toto zobrazení splňuje všechny požadované vlastnosti. Prostor C" s tímto skalárním součinem budeme nazývat standardní unitární prostor v dimenzi n. Maticově můžeme tento skalární součin psát jako y -T y Zcela obdobně jako u euklidovských prostorů a ortogonálních zobrazení budou důležitá lineární zobrazení, která respektují skalární součiny. ,__\ Unitární zobrazení J___ Lineární zobrazení q> : V —> W mezi unitárními prostory se nazývá unitární zobrazení, jestliže pro všechny vektory u, v e V platí u ■ v — (p(u) ■ i, ..., vt) 146 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET je X - 2aXl 5 1 -aX--a. 2 2 Požadujeme-li, aby měl kořen 1, musí být a = i (dosadíme za X číslo 1 a položíme rovno nule). Farmár tedy může prodat \ — \ = ^ ovci, které se mu v daný rok narodí. Odpovídající vlastní vektor k vlastnímu číslu 1 dané matice je (20, 4, 2,1) a v těchto poměrech se taky ustálí populace ovcí. □ 3.19. Uvažujme Leslieho model růstu pro populaci krys, které máme rozděleny do tří věkových skupin: do jednoho roku, od jednoho do dvou let a od dvou let do tří. Předpokládáme, že se žádná krysa nedoživá více než tří let. Průměrná porodnost v jednotlivých věkových skupinách připadajících na jednu krysu je následující: v 1. skupině je to nula a ve druhé i třetí 2 krysy. Krysy, které se dožijí jednoho roku, umírají až po druhém roce života (úmrtnost ve druhé skupině je nulová). Určete úmrtnost v první skupině, víte-li, že daná populace krys stagnuje (počet jedinců v ní se nemění). O Další zajímavé populační modely můžete najít počínaje stranou 170. D. Markovovy procesy 3.20. Mlsný hazardér. Hazardní hráč sází na to, která strana mince padne. Na začátku hry má tři kremrole. Na každý hod vsadí jednu kremroli a když jeho tip vyjde, tak k ní získá jednu navíc, pokud ne, tak kremroli prohrává. Hra končí, pokud všechny kremrole prohraje, nebo jich získá pět. Jaká je pravděpodobnost, že hra neskončí po čtyřech sázkách? Řešení. Před j-tým stav, ve kterém se kolem (sázkou) můžeme popsat hráč nachází náhodným vektorem xi = (poU), Pi(j), P2U), PíU), P4(j), PsU)), kde pt je pravděpodobnost, že hráč má i kremroli. Pokud má hráč před 7-tou sázkou i kremroli (í = 2, 3,4), tak po sázce má s poloviční pravděpodobností (1 — 1) kremroli a s poloviční pravděpodobností (1 + 1) kremroli. Pokud dosáhne pěti kremroli nebo všechny prohraje, už se počet kremroli nemění. Vektor Xj+\ tak získáme podle podmínek zadání z Xj vynásobením maticí (1 0,5 0 0 0 0\ 0 0 0,5 0 0 0 0 0,5 0 0,5 0 0 0 0 0,5 0 0,5 0 0 0 0 0,5 0 0 1° 0 0 0 0,5 v je nějaká báze (A), vybraná z prvků A, (mi, ..., ut) ortonormální báze vzniklá z Gramovy-Schmidtovy ortogonalizace vektorů (i>i, ..., Vk). Doplňme ji na ortonormální bázi celého V (obojí existuje podle již dokázaných částí věty). Protože se jedná o ortogonální bázi, je nutně (ut+i, ■ ■ ■, un) = (mi, ..., uiĹ)± = A1- a A c (uk+\, ..., Un)1- (jak plyne z vyjádření souřadnic v ortonormální bázi). Je-li m _l (uk+i, ■ ■ ■, m„>,pakMJenutněUneárníkom-binací vektorů mi, ..., ui, to je ale právě tehdy, když je lineární kombinací vektorů v\, ..., vi, což je ekvivalentní příslušnosti u do (A). (8): Je pouze ekvivalentní formulaci existence ortonormální báze. □ 3.25. Důležité vlastnosti velikosti. Nyní máme vše připraveno pro základní vlastnosti spojené s naší definicí velikostí vektorů. Hovoříme také o normě definované ,ja|P]» skalárním součinem. Všimněme si také, že všechna '%/tr*i*p~^— tvrzení se týkají vždy konečných množin vektorů a jejich platnost proto nezávisí na dimenzi prostoru V, ve kterém se vše odehrává. Věta. Pro libovolné vektory u, v v prostoru V se skalárním součinem platí (1) ||m+d|| < \\u\\ + \\v\\, přitom rovnost nastane, právě když jsou u a v lineárně závislé. (trojúhelníková nerovnost) (2) \u ■ v\ < ii u ii ii d ii, přitom rovnost nastane, právě když jsou u a v lineárně závislé. (Cauchyova nerovnost) (3) Pro každý ortonormální systém vektorů (e\, ..., e^) platí |m||2 > |m • e\|2 - |m • ek\ (Besselova nerovnost) (4) Pro ortonormální systém vektorů (ei, ..., ei) patří vektor u do podprostoru {e\, ..., ei), právě když ||2 = |M-ei|2 + --- + |M-et|2 (Parsevalova rovnost) (5) Pro ortonormální systém vektorů (e\, je vektor , eic) a vektor u e V w = (m • e\)e\ H-----h (m • et)et jediným vektorem, který minimalizuje velikost \\u — v\\ pro všechny v e (e\, ..., ei). Důkaz. Všechny důkazy spočívají v přímých výpočtech: (2): Definujme vektor w := u — ^jjju, tzn. w ± v, a počítejme o < ii»n2 = nu2 - m(u. „> - s(„. m) + ^«ii,ii2, 0 < ||iw|| Iwlňl11!!2 ~ 2(m • v)(u ■ v) + (m • v)(u ■ v). Odtud již přímo plyne, že ||m||2||i;||2 > \u ■ v\2 a rovnost nastane právě tehdy, když w = 0, tj. když jsou »1» lineárně závislé. 147 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Na začátku máme X\ = (0, 0, 1,0, 0)r, po čtyřech sázkách bude situaci popisovat náhodný vektor (1): Opět stačí počítat Z, = A X-i 13 5 3 8'16'°'16'°'8 tedy pravděpodobnost, že hra skončí do čtvrté sázky (včetně) je polovina. Všimněme si ještě, že matice A popisující vývoj pravděpodobnostního vektoru X je pravděpodobnostní, tedy má součet prvků v každém sloupci 1. Nemá ale vlastnost vyžadovanou v Perronově-Frobeniově větě a snadným výpočtem zjistíte (nebo přímo uvidíte bez počítání), že existují dva lineárně nezávislé vlastní vektory příslušné k vlastnímu číslu 1 - případ, kdy hráči nezůstane žádná krémrole, tj. x = (1, 0, 0, 0, 0, 0)r, nebo případ kdy získá 5 krémrolí a hra tím pádem končí a všechny mu už zůstávají, tj. x = (0, 0, 0, 0, 0, l)r. Všechna ostatní vlastní čísla (přibližně 0,8, 0,3, —0,8, —0,3) jsou v absolutní hodnotě ostře menší než jedna. Proto komponenty v příslušných vlastních podprostorech při iteraci procesu s libovolnou počáteční hodnotou vymizí a proces se blíží k limitní hodnotě pravděpodobnostního vektoru tvaru (a, 0, 0, 0, 0, 1 — a), kde hodnota a závisí na počtu kremrolí, se kterými hráč začíná. V našem případě je to a = 0,4, kdyby začal se 4 kremrolemi, bylo by to a = 0,2 atd. □ 3.21. Na základě teploty ve dvě hodiny odpoledne se rozdělují dny na teplé, průměrné a chladné. Dle celoročních statistik následuje po teplém dni teplý v polovině případů a průměrný ve 30 % případů, po průměrném dnu průměrný ve 40 % případů a chladný ve 30 % případů, po chladném dnu chladný v polovině případů a ve 30 % případů průměrný. Bez dalších informací zjistěte, kolik lze během roku očekávat teplých, průměrných a chladných dnů. Řešení. Pro každý den musí nastav právě jeden ze stavů „teplý den", „průměrný den", „chladný den". Pokud vektor x„ má za složky pravděpodobnosti toho, že jistý (označený jako n-tý) den bude teplý, průměrný, chladný (při zachování pořadí), potom složky vektoru xn+l (0,5 0,3 0,2\ 0,3 0,4 0,3 \0,2 0,3 0,5/ udávají postupně pravděpodobnosti, že následující den bude teplý, průměrný, chladný. Pro ověření stačí dosadit přičemž např. pro třetí volbu musíme dostat pravděpodobnosti, že po chladném dnu bude následovat teplý, průměrný, chladný (v tomto - 2 Re(w • v) < -2\u ■ v\ < = oiw|| + \\v\\y. Protože se přitom jedná o nezáporná reálná čísla, je opravdu || m + d || < II m II + II ľ II. Navíc, při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je ekvivalentní podmínce, že m a ľ jsou lineárně závislé (podle předchozí části důkazu). (3), (4): Nechť (e\, ..., ek) je ortonormální systém vektorů. Doplníme jej do ortonormální báze (e\, ..., e„) (to vždy jde podle předchozí věty). Pak, opět podle předchozí věty, je pro každý vektor!/ e V: n n k \\u\\2 = ^(w • ěí)(u ■ efi = ^ \u ■ e;|2 > ^ \u ■ et\2. í=1 í=1 í=1 To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě tehdy, když u ■ e,• — 0 pro všechny i > k, a to dokazuje Parsevalovu rovnost. (5): Zvolme libovolný v e (e\,... ,ek) a doplňme daný ortonormální systém na ortonormální bázi (e\,...,en). Nechť («!,..., u„) a (x\, ..., xk, 0, ..., 0) jsou souřadnice u av v této bázi. Pak II" - "II2 = l"l -*lP h-----h \uk -xk\2 + |wí+i|2 h-----h |wn|2 a tento výraz je zjevně minimalizován při volbě jednotlivých vek-torů x\ — mi, ..., xk — uk. □ 3.26. Vlastnosti unitárních zobrazení. Vlastnosti ortogonál-nich zobrazení mají přímočarou obdobu v komplexním oboru. Můžeme je snadno zformulovat a dokázat společně: Tvrzení. Uvažme lineárnízobrazení(endomorfismus)

V na prostoru se skalárním součinem. Pak jsou následující podmínky ekvivalentní: (1) (p je unitární nebo ortogonální transformace, (2)

(2): Zobrazení

(3): Standardní skalární součin je v K" vždy dán pro sloupce x, y skalárů výrazem x ■ y — xT Eý, kde E je jednotková matice. Vlastnost (2) tedy znamená, že matice A zobrazení

~\~ X^ "t- X3^ kde poslední podmínka znamená, že vektor x^ je pravděpodobnostní. Snadno se vypočítá, že tato soustava má jediné řešení 1 3' x2 -x3 Lze tedy očekávat přibližně stejný počet teplých, průměrných a chladných dnů. Zdůrazněme, že součet všech čísel z libovolného sloupce matice T musel být roven 1 (jinak by se nejednalo o Markovův proces). Protože TT = T (matice je symetrická), je součet všech čísel z libovolného řádku matice také roven 1. O matici s nezápornými prvky a s vlastností, že součet čísel v každém řádku a rovněž součet čísel v každém sloupci je 1, mluvíme jako o dvojnásobně (dvojitě, dvojně) stochastické. Důležitou vlastností každé dvojnásobně stochastické primitivní matice (pro jakýkoli rozměr - počet stavů) je, že jí příslušný vektor xx má všechny složky stejné, tj. po dostatečně dlouhé době vyhodnocování se všechny stavy v odpovídajícím Markovově procesu jeví jako stejně časté. □ 3.22. Půjčovna aut. Firma půjčující každý týden auta má dvě pobočky - jednu v Brně a jednu v Praze. Auto zapůjčené v Brně lze vrátit i v Praze a naopak. Po čase se zjistilo, že na konci týdne je vždy v Praze vráceno zhruba 80 % z aut vypůjčených v Praze a 90 % z aut vypůjčených v Brně. Jak je potřeba rozdělit auta mezi pobočky, aby na obou byl na začátku týdne vždy stejný počet aut jako předchozí týden? Jak bude vypadat situace po jisté dlouhé době, pokud jsou auta mezi pobočky na začátku náhodně rozdělena? xT (ATy — A ly) — 0 pro všechny x e K". Zejména dosazením výrazu v závorce za x zjistíme, že to je možné pouze při ät = a-K (3) o (4): Je-li AT — A-1 v některé ortonormální bázi, pak to zaručuje platnost podmínky (2): (5) Dokazované tvrzení je vyjádřeno prostřednictvím matice A zobrazení

(1): Ve vybrané ortonormální bázi je (p(u) ■ V jsou vždy také invariantní. Skutečně, je-li ((KU) c(/, u e U av e U1- libovolné, pak V je unitární zobrazení komplexních vektorových prostorů. Pak je V ortogonálním součtem jednorozměrných vlastních podprostorů. Důkaz. Jistě existuje alespoň jeden vlastní vektor v e V. Pak je zúžení

V* vztahem (3.6) (v, Ý* (oO) — (Ý(v)' a)> kde (, > značí vyčíslení formy (druhý argument) na vektoru (první argument), v e V aa e W* jsou libovolné. Zvolme si báze v na V, w na W a pišme A pro matici zobrazení ý v těchto bázích. Pak snadno spočteme matici zobrazení ijr v příslušných duálních bázích na duálních prostorech. Skutečně, definiční vztah říká, že pokud bychom reprezentovali vektory zW* v souřadnicích jako řádky skalárů, pak je zobrazení ý* je dáno toutéž maticí jako ý, pokud jí násobíme řádkové vektory zprava: ,an) ■ A- (v, ý* (.<*))■ To znamená, že maticí duálního zobrazení ý* je transponovaná matice AT, protože a • A = (AT ■ aT)T. Předpokládejme nadále, že se pohybujeme ve vektorovém prostoru se skalárním součinem. Jestliže tedy zvolíme pevně jeden vektor v e V, dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení V —> V* = Hom(V, K) V 3 v 1 (w i-> (v, w) e K). Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Zároveň víme, že jde skutečně o lineární zobrazení nad komplexními nebo reálnými skaláry, protože jsme pevně zvolili druhý argument. Na první pohled je vidět, že vektory ortonormální báze jsou takto zobrazeny na formy tvořící bázi duální, a každý vektor můžeme prostřednictvím skalárního součinu chápat také jako lineární formu. V případě vektorových prostorů se skalárním součinem proto převádí naše ztotožnění vektorového prostoru se svým duálem také duální zobrazení ijr na zobrazení ý* : W —> V zadané formulí (3.7) (f(u),v) = (u,Ý*(v)), kde stejným značením závorek jako v definičním vztahu (3.6) nyní myslíme skalární součin. Tomuto zobrazení se říká adjungované zobrazení k ý. Ekvivalentně lze brát vztah (3.27) za definici adjungovaného zobrazení ý*, např. dosazením všech dvojic vektorů ortonormální 150 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Student, který vnímá: s pravděpodobností 50% zůstane vnímat, 40% přestane vnímat a 10% odejde do hospody. Student, který je na přednášce a nevnímá: začne vnímat s pravděpodobností 10%, zůstane ve stejném stavu 50%, odejde do hospody 40%. Student, který sedí v hospodě má nulovou pravděpodobnost, že se vrátí na přednášku. Jak se bude tento model vyvíjet v čase? Jak se situace změní, pokud budeme předpokládat aspoň desetiprocentní pravděpodobnost toho, že se student vrátí z hospody na přednášku (tu ovšem samozřejmě nevnímá)? Řešení. Ze zadání se jedná o Markovův proces s maticí /0,5 0,1 0\ 0,4 0,5 0 . \0,1 0,4 1/ Její charakteristický polynom je (0,5 — A)2(l — A.) — 0,4(1 — X). Evidentně je tedy 1 vlastní číslo této matice (další kořeny jsou pak 0,3 a 0,7). Postupem času se tedy studenti rozdělí do skupin tak, že stav bude popsán příslušným vlastním vektorem. Ten je řešením rovnice /-0,5 0,1 0\ /x\ 0,4 -0,5 0 y = 0, \ 0,1 0,4 0/ \zj což jsou právě násobky vektoru (0, 0, 1). Jinými slovy, všichni studenti po čase skončí v hospodě. Tento výsledek je zřejmý i bez počítání - tím, že je nulová pravděpodobnost odchodu studenta do školy, se budou studenti postupně hromadit v hospodě. Přidáním desetiprocentní možnosti odchodu studenta do školy se toto změní. Příslušná matice bude /0,5 0,1 0\ 0,4 0,5 0,1 . \0,1 0,4 0,9/ Opět platí, že se stav ustálí na vlastním vektoru příslušnému vlastnímu číslu 1. Ten je v tomto případě řešením rovnice /-0,5 0,1 0 \ íx\ 0,4 -0,5 0,1 y = 0. 0,1 0,4 -0,1; Řešením je například vektor (1, 5, 21). Poměrné rozložení studentů v jednotlivých skupinách pak dá násobek tohoto vektoru, který má součet složek roven 1, tj. vektor (^, ^, ||). Opět tedy většina stu- dentů skončí v hospodě, někteří ale ve škole budou. □ 3.24. Ruleta. Hráč rulety má následující strategii: přišel hrát se 100 Kč. Vždy všechno, co aktuálně má, sází vždy na černou (v ruletě je 37 čísel, z toho je 18 černých, 18 červených a nula). Hráč skončí, pokud nic nemá, nebo pokud získá 800 Kč. Uvažte tuto úlohu jako Markovův proces a napište jeho matici. báze za vektory u a v dostáváme přímo všechny hodnoty matice zobrazení i/ŕ ■ Předchozí výpočet pro duální zobrazení v souřadnicích nyní můžeme zopakovat, pouze musíme mít na paměti, že v ortonormálních bázích na unitárních prostorech vystupují souřadnice druhého argumentu konjugované: /V (Ý(v), w) — (u>i, ..., w„) ■ A ■ \vn/ AT (v, Ý* (>*>)). Vidíme proto, že je-li A matice zobrazení Ý v ortonormální bázi, pak matice adjungovaného zobrazení i/ŕ je matice transponovaná a konjugovaná, kterou značíme A* — AT. Matici A* se říká adjungovaná matice k matici A. Všimněme si, že adjungované matice jsou dobře definované pro jakékoliv obdélníkové matice a nepleťme si je s maticemi algebraicky adjun-govanými, které jsme u čtvercových matic používali při úvahách o determinantech. Můžeme si tedy shrnout, že má-li jakékoliv lineární zobrazení ý : V —> W mezi unitárními prostory v ortonormálních bázích matici A, bude mít jeho duální zobrazení v bázích duálních matici AT. Pokud přitom ztotožníme pomocí skalárního součinu vektorové prostory s jejich duálními prostory, pak nám duální zobrazení představuje adjungované zobrazení ý* : W -» V (které je zvykem značit stejně jako to zobrazení duální), které ale má matici A*. Rozdíl mezi maticemi duálního a adjungovaného zobrazení je tedy v dodatečné konjugaci, ta ale samozřejmě je důsledkem toho, že ztotožněni unitárního prostoru s jeho duálním prostorem není komplexně lineární zobrazení (neboť z druhé pozice ve skalárním součinu se skaláry vytýkají konjugované). 3.28. Samoadjungovaná zobrazení. Zvláštním případem lijí* neárních zobrazení jsou tedy ta, která splývají *ľ<\ se svým adjungovaným zobrazením: ý* — ý. ■ " . fi Takovým zobrazením říkáme samoadjungovaná. Ekvivalentně můžeme říci, že jsou to ta zobrazení, jejichž matice A v jedné a tedy ve všech ortonormálních bázích splňují A — A*. V případě euklidovských prostorů jsou samoadjungovaná zobrazení tedy ta, která mají v některé ortonormální bázi (a pak už všech) symetrickou matici. Často se jim proto říká symetrické matice a symetrická zobrazení. V komplexním oboru se maticím splňujícím A — A* říká hermiteovské matice. Občas se také hermiteovským maticím říká samoadjungované matice. Všimněme si, že hermiteovské matice tvoří reálný vektorový podprostor v prostoru všech komplexních matic, není však podprostorem v komplexním oboru. Poznámka. Obzvlášť zajímavý je v této souvislosti následující postřeh. Jestliže hermiteovskou matici A vynásobíme imaginární jednotkou, dostáváme matici B — i A, která má vlastnost B* — i AT — —B. Takovým maticím říkáme anti-hermiteovské. Tak jako je tedy každá reálná matice součtem své symetrické a 151 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Řešení. V průběhu a na konci hry může mít hráč pouze následující peněžní obnosy (v Kč): 0,100, 200,400, 800. Budeme-li na danou situaci nahlížet jako na Markovův proces, toto budou jeho stavy a snadno také sestavíme jeho matici: antisymetrické části /l a 0 0 a a 0 0 0 b 0 0 0\ 0 0 0 0 \o o o o v kde a = || a b = ||. Všimněme si, že matice je pravděpodobnostní a singulární. Vlastní hodnota 1 je dvojnásobná. Hra nebude konvergovat k jedinému vektoru xx, nýbrž skončí na jednom z vlastních vektorů příslušných vlastní hodnotě 1, totiž (1, 0, 0, 0, 0) (hráč prohraje vše), nebo (0, 0, 0, 0,1) (hráč vyhraje 800 Kč). Navíc snadno nahlédneme, že hra skončí po třech sázkách, tedy posloupnost {A" }™=l, je konstantní pro n > 3: (l a + ab + ab2 a + ab a 0\ 0 0 0 0 0 A°° := A3 = A" = 0 0 0 0 0 0 0 0 0 0 1° b3 b2 b V snadno zjistíme, + ab + ab2 = že hra skončí s pravděpodobností 0,885 prohrou a s pravděpodobností cca 0,115 výhrou 800 Kč. (Maticí A°° vynásobíme počáteční vektor (0,1, 0, 0, 0) a dostáváme vektor (a + ab + ab2, 0, 0, 0, b3).) □ 3.25. Uvažujme situaci z předchozího případu a předpokládejme, že pravděpodobnost výhry i prohry je 1/2. Označme matici procesu A. Bez použití výpočetního software určete A 10°. O 3.26. Roztržitý profesor. Uvažujme následující situaci: Roztržitý profesor s sebou nosí deštník, ale s pravděpodobností 1 /2 jej zapomene tam, odkud odchází. Ráno odchází do práce. V práci chodí na oběd do restaurace a zpět. Po skončení práce odchází domů. Uvažujme pro jednoduchost, že nikam jinam po dostatečně dlouhou dobu profesor nechodí a že v restauraci zůstává deštník na profesorově oblíbeném místě, odkud si ho může následující den vzít (pokud nezapomene). Uvažte tuto situaci jako Markovův proces a napište jeho matici. Jaká je pravděpodobnost, že se po mnoha dnech po ránu deštník bude nalézat v restauraci? (Je vhodné za časovou jednotku vzít jeden den - od rána do rána.) Řešení. Platí /11/16 3/8 l/4\ A = 3/16 3/8 1/4 . I 1/8 1/4 1/2/ 1 A + A' 1 A - A' 2 V / 2 je v komplexním oboru obdobně A = -(A + A*)+i—(A-A*), 2 v ' 2i y ' a můžeme proto vyjádřit každou komplexní matici právě jedním způsobem jako součet A = B + i C s hermiteovskými maticemi B a C. Jde o obdobu rozkladu komplexního čísla na reálnou a ryze imaginární komponentu a skutečně se často v literatuře setkáme i se značením 1 . B = re A = - (A C = im A = — (A - A* V řeči lineárních zobrazení to tedy znamená, že každý komplexní lineární automorflsmus můžeme takto jednoznačně vyjádřit pomocí dvou samoadjungovaných zobrazení. 3.29. Spektrální rozklad. Uvažujme samoadjungované zobra--i1 » zení i/r : V —> V s maticí A v nějaké ortonormální bázi a tzkusme postupovat obdobně jako v 2.51. Opět se nejprve obecně podíváme na invariantní podprostory samoadjun-l govaných zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor w c V a samoadjungované zobrazení ý : v —> oplatí ý(W) c w, pak také platí pro všechny v e w±, w eW (ý(v), w) = (v, ý(w)} = 0. To ale znamená, že také ^(W^) c w±. Uvažme nyní matici A samoadjungovaného zobrazení v nějaké ortonormální bázi a nějaký vlastní vektor x e C™, tj. A ■ x — Xx. Dostáváme X(x,x) = (Ax, x) — (x, Ax) — (x, Xx) —X(x,x). Kladným reálným číslem (x, x) můžeme krátit, a proto musí být X — X, tj. vlastní čísla jsou vždy reálná. Komplexních kořenů má charakteristický polynom det(A — XE) tolik, kolik je dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme tak důležitý obecný výsledek: Tvrzení. Ortogonální doplněk k invariantnímu podprostoru pro samoadjungované zobrazení je také invariantní. Navíc jsou všechna vlastní čísla hermiteovské matice A vidy reálná. Ze samotné definice je zřejmé, že zúžení samoadjungovaného zobrazení na invariantní podprostor je opět samoadjungované. Předchozí tvrzení nám tedy zaručuje, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení Ý na ortogonální doplněk invariantního podprostoru je opět samoadjungované zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Vlastní vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností ý(u) = Xu, ý(v) = /J,v vyplývá X(u, v) = (ý(u), v) = (u, ý(v)} = jl(u, v } = /j,(u, v). Obvykle bývá náš výsledek formulován pomocí projekcí na vlastní podprostory. O projektoru P : V —> V říkáme, že je kolmý, 152 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET l 2- 16- n 16- Spočítejme třeba prvek aj, tedy pravděpodobnost, že deštník začne den doma a skončí doma (bude tam i druhý den ráno): deštník může putovat třemi disjunktními cestami: D Profesor ho hned ráno zapomene doma: p\ DPD Profesor si ho vezme do práce, pak ho zapomene vzít na oběd a poté ho večer odnese domů: P2 = \ ■ \ ■ \ = \. DPRPD Profesor bere deštník všude a nikde ho nezapomene: — I I I f>3 — 2 ' 2 ' 2 Celkem a\ = p\ + p2 + pi Vlastní vektor této matice příslušný dominantní vlastní hodnotě 1 je (2, 1, 1), je tedy hledaná pravděpodobnost 1/(2 + 1 + 1) = 1/4. □ 3.27. Algoritmus na určování důležitosti stránek. Internetové vyhledávače umí na internetu vyhledat (skoro) všechny stránky obsahující dané slovo či frázi. Jak ale setřídit vyhledané stránky tak, aby uživatel dostal pokud možno seznam seřazený podle relevance daných stránek? Jednou z možností je následující algoritmus: soubor všech nalezených stránek považujme za systém a každou z nalezených stránek za jeden z jeho možných stavů. Popíšeme náhodné procházení těchto stránek jako Markovův proces. Pravděpodobnosti přechodu mezi jednotlivými stránkami jsou dány odkazy: každý odkaz, řekněme ze stránky A na stránku B určuje pravděpodobnost (l/(celkový počet odkazů ze stránky A)), se kterou se dostaneme ze stránky A na stránku B. Pokud z některé stránky nevedou žádné odkazy, tak ji uvažujeme jako stránku, ze které vedou odkazy na všechny ostatní. Tímto dostaneme pravděpodobnostní matici M (prvek m y odpovídá pravděpodobnosti, se kterou se dostaneme z i-té stránky na 7'-tou). Bude-li tedy člověk náhodně klikat na odkazy v nalezených stránkách (pokud se dostane na stránku, ze které nevede odkaz, vybere si náhodně další), tak pravděpodobnost toho, že se v daný okamžik (dostatečně vzdálený od počátku klikání) bude nalézat na i-té stránce odpovídá i-té složce jednotkového vlastního vektoru matice M, odpovídajícího vlastnímu číslu 1. Podle velikosti těchto pravděpodobností pak určíme důležitost jednotlivých stránek. Tento algoritmus lze modifikovat tím, že budeme předpokládat, že uživatel po nějaké době přestane klikat z odkazu na odkaz a opět začne náhodně na nějaké nové stránce. Řekněme, že s pravděpodobností d vybere náhodně novou stránku a s pravděpodobností (1 — d) klikne na nějaký odkaz na ní. V takovéto situaci je nyní pravděpodobnost přechodu mezi libovolnými dvěma stránkami 5, a S j nenulová, je to totiž d/n + (1 — d)/(celkový počet odkazů ze stránky Si), pokud je-li Im P _L Ker P. Dva kolmé projektory P, Q jsou vzájemně kolmé, je-li Im P _L Im Q. Věta (O spektrálním rozkladu). Pro každé samoadjungované zobrazení Ý : V -» V na vektorovém prostoru se skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li X\, ..., Xk všechna různá vlastní čísla Ý a P\, ..., Pk příslušné kolmé a navzájem kolmé projektory na vlastní podprostory k odpovídajícím vlastním číslům, pak f = XlPl + --- + XkPk. Dimenze obrazů těchto projektorů je přitom vždy rovna algebraické násobnosti vlastních čísel A;. 3.30. Ortogonální diagonalizace. Zobrazení, pro která lze najít ortonormální bázi jako v předchozí větě o spektrálním rozkladu, se nazývají ortogonálně diagonalizo-vatelná. Jsou to samozřejmě právě ta zobrazení, pro která umíme najít ortonormální bázi tak, aby v ní jejich matice zobrazení byla diagonální. Zamysleme se, jak mohou vypadat. Pro euklidovský případ je to snadné: diagonální matice jsou zejména symetrické, jedná se tedy právě o samoadjungovaná zobrazení. Jako důsledek získáváme tvrzení, že ortogonální zobrazení euklidovského prostoru do sebe je ortogonálně diagonalizovatelné, právě když je zároveň samoadjungované (jsou to právě ta samoadjungovaná zobrazení s vlastními hodnotami ±1). U komplexních unitárních prostorů je situace složitější. Uvažme libovolné lineární zobrazení

+ i imD, kde reálná a imaginární část jsou právě matice ýaij (plyne z jednoznačnosti rozkladu). Zejména tedy platí Ý°V~V0'tl/a také

(2) jsme již diskutovali. (2) (3): Stačí provést přímý výpočet qxp* = (ý + ÍT])(ý - irj) = i/f2 + r]2 + i(r]ij/ - if/rj), (p*

(1): Nechť u e V je vlastní vektor normálního zobrazení A > B > D. 3.28. Sledujte určitou vlastnost daného živočišného druhu, která je podmíněna nezávisle na pohlaví jistým genem - dvojicí alel. Každý jedinec získává po jedné alele od obou rodičů zcela náhodně a nezávisle na sobě. Existují formy genu dané různými alelami a, A. Ty určují tři možné stavy aa, aA = Aa, AA vyšetřované vlastnosti. (a) Předpokládejte, že každý jedinec jisté populace se bude rozmnožovat výhradně s jedincem jiné populace, ve které se vyskytuje pouze vlastnost podmíněná dvojicí aA. Právě jeden jejich (náhodně zvolený) potomek bude ponechán na stanovišti a také on se bude rozmnožovat výhradně s jedincem té jiné populace atd. Stanovte výskyt kombinací aa, a A, A A v uvažované populaci po dostatečně dlouhé době. (b) Řešte úlohu uvedenou ve variantě (a), pokud je jiná populace tvořena pouze jedinci s dvojicí alel A A. (c) Náhodně zvolené dva jedince opačného pohlaví zkřížíte. Z jejich potomstva opět náhodně vyberete dva jedince opačného pohlaví, které zkřížíte. Pokud takto budete pokračovat velmi dlouho dobu, vypočtěte pravděpodobnost, že oba křížení jedinci budou mít dvojici alel AA, příp. aa (proces křížení skončí). (d) Řešte úlohu uvedenou ve variantě (c) bez kladení podmínky, že křížení jedinci mají stejné rodiče. Pouze tedy křížíte jedince jisté velké populace mezi sebou, potom křížíte potomky mezi sebou atd. q>* (u) — Xu. Tzn., že q> a q>* mají stejné vlastní vektory a konjugo-vané vlastní hodnoty. Stejně jako u samoadjungovaných teď snadno dokážeme ortogonální diagonalizovatelnost. K tomu je nutné a stačí, aby ortogonální doplněk každého vlastního podprostoru pro normální

(4): Výraz J2íj \aij I2 je právě stopa matice AA*, to je matice zobrazení

0 pro všechny vektory x. Navíc zjevně B* = (A* • A)* = A* • A — B. Hermiteovským maticím B s takovou vlastností říkáme pozitivně semidefinitní a pokud nastane nulová hodnota pouze pro x — 0, pak jim říkáme pozitivně definitní. Obdobně hovoříme o pozitivně definitních a a pozitivně semidefinitních zobrazeních Ý : V —> V. 154 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Řešení. Prípad (a). Jedná se o Markovův proces zadaný matici A/2 1/4 0 \ T = 1/2 1/2 1/2 , V 0 1/4 1/2/ přičemž pořadí stavů odpovídá pořadí dvojic alel aa, aA, AA. Hodnoty v prvním sloupci plynou z toho, že potomek jedince s dvojicí alel aa a jedince s dvojicí alel a A má s pravděpodobností 1/2 dvojici aa a s pravděpodobností 1 /2 dvojici a A. Analogicky postupujeme pro třetí sloupec. Hodnoty ve druhém sloupci potom vyplývají z toho, že každý ze čtyř případů dvojic alel aa, a A, Aa, A A je stejně pravděpodobný u jedince, jehož oba rodiče mají dvojici alel aA. Uvědomme si, že na rozdíl od počítání pravděpodobností, kdy musíme rozlišovat dvojici aA od Aa (která z alel pochází od kterého z rodičů), vlastnosti podmíněné dvojicemi a A a.Aa jsou samozřejmě stejné. Pro určení výsledného stavu stačí nalézt pravděpodobnostní vektor, který přísluší vlastnímu číslu 1 matice T, protože matice /3/8 1/4 l/8\ T2 = 1/2 1/2 1/2 \l/8 1/4 3/8/ splňuje podmínku Perronovy-Frobeniovy věty (všechny její prvky jsou kladné). Hledaný pravděpodobnostní vektor je íir" v4' 2' 4y což již dává pravděpodobnosti 1/4, 1/2, 1/4 výskytu po řadě kombinací aa, aA, AA po velmi dlouhé (teoreticky nekonečné) době. Případ (b). Pro pořadí dvojic alel AA, aA, aa nyní dostáváme pravděpodobnostní matici přechodu /l 1/2 0\ T = 0 1/2 1 . \0 0 0/ Ihned vidíme všechna vlastní čísla 1, 1/2 a 0 (odečteme-li je od diagonály, hodnost obdržené matice nebude 3, tj. touto maticí zadaná homogenní soustava bude mít netriviální řešení). Těmto vlastním číslům přísluší po řadě vlastní vektory um Proto je 1 0 0\ /l -1 i\~! 0 1/2 0 0 1 -2 = 0 0 0/ \0 0 1 / 1 0 0^ 0 1/2 0 o o oi Pro každé pozitivně semideflnitní zobrazení Ý '■ V -» V umíme najít jeho odmocninu, tj. zobrazení i] takové, že i] o i] = i/f. Nejjednodušeji to uvidíme v ortonormální bázi, ve které bude mít Ý diagonální matici. Taková podle našich předchozích úvah vždy existuje a matice A zobrazení ývní bude mít na diagonále nezáporná reálná vlastní čísla zobrazení ý. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat zobrazení i] pomocí matice B s odmocninami příslušných vlastních čísel na diagonále. Dokázali jsme: Věta. Pro každou pozitivně semideflnitní matici A > 0 existuje její odmocnina B = VÄ = PDPT, kde P je vhodná ortogonální matice a D je diagonální matice s odmocninami vlastních čísel matice A na diagonále. 3.32. Spektra a nilpotentní zobrazení. Na závěr této části se vrátíme k otázce, jak se mohou chovat lineární zobrazení v úplné obecnosti. Budeme i nadále pracovat s reálnými nebo komplexními vektorovými prostory. Připomeňme, že spektrum lineárního zobrazení f : V -» V je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného pod-prostoru vlastních vektorů. Lineární zobrazení / : V -» V se nazývá nilpotentní, jestliže existuje celé číslo k > 1 takové, že iterované zobrazení fk je identicky nulové. Nejmenší číslo k s touto vlastností se nazývá stupněm nilpotentnosti zobrazení /. Zobrazení / : V -» V se nazývá cyklické, jestliže existuje báze (u\, u„) prostoru V taková, že /(mi) = 0 a f(uj) = iij-i pro všechna i = 2, ..., n. Jinými slovy, matice / v této bázi je tvaru /0 1 0 ...\ A = | 0 0 1 j Je-li f (v) — a ■ v, pak pro každé přirozené k je fk(v) — ak ■ v. Zejména tedy může spektrum nilpotentního zobrazení obsahovat pouze nulový skalár (a ten tam vždy je). Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň nilpotentnosti roven dimenzi prostoru V. Operátor derivování na polynomech, D(xk) — kxk~l, je příkladem cyklického zobrazení na prostorech K„ [x] všech polynomů stupně nejvýše n nad skaláry K. Kupodivu to platí i naopak a každé nilpotentní zobrazení je přímým součtem cyklických. Důkaz tohoto tvrzení nám dá hodně práce, proto napřed zformulujeme výsledky, ke kterým směrujeme, a pak se teprve dáme do technické práce. Ve výsledné větě o Jordánově rozkladu vystupují vektorové (pod)prostory a lineární zobrazení na nich s jediným vlastním číslem A. a maticí (X 1 0 ... 0\ 0 X 1 ... 0 / = \o 0 0 ... XJ Takovýmto maticím (a odpovídajícím invariantním podprostorům) se říká Jordánův blok. 155 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Odsud pro libovolné n e N plyne /l -1 1 \ /l 0 0\" /l 1 1> r" = 0 1 -2 • 0 1/2 o I • I 0 1 2 | \0 0 1 -1 1 0 1 iO o 1 to o o n o 0 2-" to o 1 -1 1\ i 0 0 0 1 -2 0 0 0 0 o i / \o 0 0 Zřejmě pro velká nei můžeme nahradit 2 ™ za 0, což implikuje Pokud tedy plodí potomky jedinci původní populace výhradně s členy populace, ve které se vyskytuje pouze dvojice alel AA, nutně po dostatečně velkém počtu křížení dojde k tomu, že dvojice a A a aa zcela vymizí (bez ohledu na jejich původní četnost). Případ (c). Tentokráte budeme mít 6 možných stavů (v tomto pořadí) AA, AA; aA, AA; aa, AA; aA,aA; aa,aA; aa,aa, přičemž tyto stavy jsou dány různými případy genotypů rodičů. Matice odpovídajícího Markovova řetězce je fl 1/4 0 1/16 0 0\ 0 1/2 0 1/4 0 0 0 0 0 1/8 0 0 0 1/4 1 1/4 1/4 0 0 0 0 1/4 1/2 0 1° 0 0 1/16 1/4 v Pokud budeme např. uvažovat situaci (druhý sloupce), kdy jeden z rodičů má dvojici alel AA a druhý a A, pak zjevně může nastat každý ze čtyř případů (jde-li o dvojice alel jejich dvou náhodně zvolených potomků) AA,AA; AA,aA; aA,AA; aA,aA se stejnou pravděpodobností. Pravděpodobnost setrvání ve druhém stavu je proto 1/2 a pravděpodobnost přechodu ze druhého stavu do prvního je 1/4 a do čtvrtého také 1 /4. Nyní bychom měli opět určit mocniny t" pro velká nei. Uvážením podoby prvního a posledního sloupce, vidíme, že (l,0,0,0,0,0)r a (0, 0, 0, 0, 0, l)r jsou vlastní vektory matice t příslušné vlastnímu číslu 1. Přechodem ke čtyřrozměrné podmatici matice t (vynecháním právě prvního a šestého řádku a sloupce) nalezneme poté zbylá vlastní čísla I I 1 ~ 1 +V5 2' 4' 4 ' 4 ' Věta (Jordánova věta o kanonickém tvaru). Nechť V je vektorový prostor dimenze n a f : V -» V je lineární zobrazení s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný rozklad prostoru V na přímý součet podprostorů v = Vi e • • • e vk takových, že f (Ví) c Ví, zúžení f na každé Ví má jediné vlastní číslo A; a zúžení f — A; • id na Ví je buď cyklické nebo nulové zobrazení. Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální tvar s Jordánovými bloky podél diagonály. Celkový počet jedniček nad diagonálou v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou násobností vlastních čísel. 3.33. Poznámky. Všimněme si, že jsme Jordánovu větu již dříve plně dokázali v případech, kdy jsou všechna vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních čísel stejné. Zejména jsme ji plně dokázali pro unitární, normální a samoadjungovaná zobrazení. Další užitečné pozorování je, že pro každé lineární zobrazení přísluší ke každému vlastnímu číslu jednoznačně určený invariantní podprostor, který odpovídá Jordánovým blokům s příslušnou vlastní hodnotou. Také si všimněme jednoho velice užitečného důsledku Jordáni1 ., novy věty (který jsme už použili u diskuse chování Marko- §vových řetězců). Předpokládejme, že jsou vlastní hodnoty našeho zobrazení / všechny v absolutní hodnotě menší než i jedna. Potom opakované působení lineárního zobrazení na jakémkoliv vektoru v e V vede k rychlému zmenšování všech souřadnic fk(v) nad všechny meze. Skutečně, předpokládejme pro jednoduchost, že na celém V má zobrazení / jediné vlastní číslo A a / — A idy je cyklické (tj. omezujeme se na jediný Jordánův blok), a nechť v\, ..., v t je příslušná báze. Pak podmínka z věty říká, že f(v2) — Xv2 + v\, f2(v2) — k2v2 + Ai>i + kv\, a podobně pro ostatní v, a vyšší mocniny. V každém případě při iterování dostáváme stále vyšší a vyšší mocniny A u všech nenulových komponent, přičemž nejnižší z nich může být nejvýše o stupeň impotentnosti nižší než násobnost iterace. Tím je tvrzení dokázáno (a stejný argument s absolutní hodnotou vlastních čísel ostře větší nezjedná vede k neomezenému růstu všech souřadnic iterací fk(v)). Zbytek této části třetí kapitoly je věnován důkazu Jordánovy věty a několika k tomu potřebným pojmům. Je výrazně obtížnější než dosavadní text a čtenář jej může případně přeskočit až do začátku 5. části této kapitoly. 3.34. Kořenové prostory. Na příkladech jsme viděli, že vlastní podprostory popisují dostatečně geometrické vlastnosti jen některých lineárních zobrazení. Zavedeme nyní jemnější nástroj, tzv. kořenové podprostory. Definice. Nenulový vektor u e V se nazývá kořenovým vektorem lineárního zobrazení

V, jestliže existuje a e K a celé číslo k > 0 takové, že (

] = [v+w],a-[u] = [a-u], tvoří vektorový prostor, který nazýváme faktorový vektorový prostor prostoru V podle podprostoru U. Ověřte si korektnost definice operací a platnost všech axiomů vektorového prostoru! Třídy (vektory) ve faktorovém prostoru V/U budeme často označovat jako formální součet jednoho reprezentanta se všemi vektory podprostoru U, např. u + U e V/U, u e V. Nulový vektor ve V/f/ je právě třída 0 + U, tj. vektor u e V reprezentuje nulový vektor ve V/U, právě když je u e U. Jako jednoduché příklady si rozmyslete V/{0) = V, V/V == {0) a faktorový prostor roviny M? podle libovolného jednorozměrného podprostoru (zde je každý jednorozměrný podprostor U c M? přímkou procházející počátkem), kde třídy ekvivalence jsou rovnoběžky s touto přímkou. 157 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Podotkněme, že za definiční obor (a pochopitelně i obor hodnot) T vlastně bereme pouze vektory h \b\, kde a, b, c e [0, 1], a + b + c = 1. Chtěli bychom zadat operaci T pomocí násobení vektoru (a, b, c)T jistou konstantní maticí. To však očividně není možné (zobrazení T není lineární). Nejedná se tedy o Markovův proces a nelze zjednodušit určování, co se stane po velmi dlouhé době, jako v předešlých případech. Můžeme ale vypočítat, co se stane, když aplikujeme zobrazení T dvakrát po sobě. Ve druhém kroku dostáváme / a2 + ab + b2/4 \ ít\\ T : \ab + bc + 2ac + b2/2 i-» I t\ , \ c2 + bc + b2/4 J \ř2J kde t\ = (a2 + ab + — I + I a2 + ab + ~— ) | ab + bc + 2ac + ^ ) + H— ( ab + bc + 2ac -\--I , 4\ 2 ) 2 12 b2\( b2\ Ú, = { tr + ab + — I I ab + bc + 2ac + — | + + | ab + bc + 2ac + — I I tŕ + bc + — | + + 2la/+ai+— I [cí + bc+— I + -lab + bc + 2ac + — Á = [ c2 + bc + — ) + ( ab + bc + 2ac + — ) ( c2 + bc + — ) + H— ( ab + bc + 2ac -\-- 4 \ 2 Lze ukázat (využitím a + b + c = 1), že b2 b2 b2 t\ =a2 + ab-\--, ň = ab + bc + 2ac H--, ň = c2 + bc H--, / a2 + ab + b2/4 \ í a2 + ab + b2/4 \ T : \ab + bc + 2ac + b2/2 I ab + bc + 2ac + b2/2 . \ c2 + bc + b2/4 J \ c2 + bc + b2/4 J Získali jsme tak překvapivý výsledek, že dalším aplikovaním transformace T se vektor obdržený v prvním kroku nezmění. To znamená, že výskyt uvažovaných dvojic alel je po libovolně dlouhé době totožný jako v první generaci potomstva. Pro velkou populaci jsme tak dokázali, že evoluční vývoj by se realizoval během jediné generace, kdyby nedocházelo k mutacím nebo k selekci. □ Tvrzení. Nechť U c V je vektorový podprostor a (u\, ... ,un) je taková báze V, že (u\,..., ui) je báze U. Pak dim V/U = n — k a vektory Uk+l + U,...,u„ + U tvoří bázi V/U. Důkaz. Protože V = {u\, ... ,un), je i V/U = = {u\ + U, un +U). Přitom aleje prvních k generátorů nulových, takže je V/U = ("t+i + U, ..., un + U). Předpokládejme, že ak+\ ■ (uk+i +U)-\-----h an ■ (un + U) = (ak+\ ■ uk+\ + ... + + a„ ■ u„) + U = 0e V/U. To je ale ekvivalentní příslušnosti lineární kombinace vektorů Uk+\, ..., un do podprostoru U. Protože U je generováno zbylými vektory, je nutně tato kombinace nulová, tj. všechny koeficienty a, jsou nulové. □ 3.36. Indukovaná zobrazení na faktorových prostorech. Předpokládejme, že U c V je invariantní podprostor vzhledem k lineárnímu zobrazení

V , a zvolme takovou bázi u\, ..., un prostoru V, že prvních k vektorů této báze je bází U. V této bázi má

V je lineárni zobrazení, jehož spektrum obsahuje n prvků (tj. všechny kořeny charakteristického polynomu leží v K a počítáme je včetně násobnosti). Pak existuje posloupnost invariantních podprostoru {0} = Vo c V\ c • • • c V„ = V s dimenzemi dim Vi = i. V bázi u\, ...,«„ prostom V takové, že Vi = («!,...,«;), má

(u + Vk) e V/Ví. To znamená, že v každé třídě rozkladu V/Ví existuje právě jeden vektor z V^~. Skutečně, tuto vlastnost má faktorový prostor podle libovolného podprostorů v unitárním prostoru - pokud u, v e Vj^- jsou v jedné třídě, pak jejich rozdíl patří do Ví n V^~, tedy jsou stejné. Můžeme tedy jako reprezentanta u^+\ nalezené třídy, tedy vlastního vektoru (pv/vt, zvolit právě vektor z V^~. Touto modifikací dojdeme k ortogonální bázi s vlastnostmi požadovanými v tvrzení o triangulovatelnosti. Proto existuje i taková ortonormální báze: Důsledek (Schurova věta o ortogonální triangulovatelnosti). Nechť

V je libovolné lineární zobrazení (reálného nebo komplexního) unitárního prostoru s m — dim V vlastními hodnotami (včetně násobnosti). Pak existuje ortonormální báze prostoru V taková, že

) a (

V, jehož celé spektrum je v K, je V — 1Zxx © • • • © 1Zx„ přímým součtem kořenových podprostorů. Zvolíme-li vhodně báze těchto podprostorů, pak

V je nilpotentní lineární zobrazení. Pak existuje rozklad V na přímý součet podprostorů V = V\ ©• • • © 14 takových, že zúžení

Oje dimenze Pk-i. Z definice plyne, že Pk-\ cKenp,tj. vždy (p(ekrl) = 0. Předpokládejme, že Pk-i ^ V. Protože Pk-\ ~ n. Odtud plyne, že pokud matice / zobrazení

nale efektivní algoritmický postup pro jejich hle-y!/py£:_' dání. Nyní shrneme již odvozený postup explicitního 5*feŕt- - výpočtu báze, v níž má dané zobrazení

V matici v kanonickém Jordánově tvaru. (1) Najdeme kořeny charakteristického polynomu. (2) Jestliže jich je méně než n = dim V, včetně násobností, kanonický tvar neexistuje. (3) Je-li n lineárně nezávislých vlastních vektorů, získáme bázi V z vlastních vektorů a v ní má

; rovnic (

, atd.). Najdeme tak „řetízky" bázových vektorů zadávajících podprostory, kde

A = 0 2 1 \0 0 2) dostaneme dvourozměrný podprostor vlastních vektorů ((1,0,0),(0,1,0)>. Potřebujeme proto najít řešení rovnic (A — 2E)x — (a, b,0)T pro vhodné konstanty a, b. Tento systém je ovšem řešitelný pouze pro a — b a jedno z možných řešení je v — (0, 0, 1), a — b — 1. Celá hledaná báze pak je (1,1, 0), (0, 0, 1), (1, 0, 0). Všimněme si, že jsme měli spoustu voleb a bází s požadovanými vlastnostmi je tedy mnoho. 162 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Řešení, i) Nejprve spočítame charakteristický polynom matice A -1 — X \A-\E\ 1 A — X : A/ 3a. + 2. Vlastní čísla matice A jsou kořeny tohoto polynomu, to znamená Xi,2 = 1, 2. Protože matice je řádu dva a máme dvě různé vlastní hodnoty, je Jordánův tvar diagonálni matice / = ^ ^ • Vlastní vektor (x, y) příslušný vlastní hodnotě 1 splňuje 0 = (A — E)x = 6 3) (y)' ^' J = ®' T° Jsou právě násobky vektoru (1.2) . Podobně zjistíme, že vlastním vektorem k vlastní hodnotě 2 je (1.3) . Jordánův tvar nám říká, že matice A určuje takové lineární zobrazení, které má v bázi vlastních vektorů (1,2), (1,3) výše uvedený diagonální tvar. To znamená, že ve směru (1,2) se nic neděje a ve směru (1, 3) se každý vektor protáhne na svůj dvojnásobek. Matici P takovou, že A = P ■ J ■ P_1, pak dostaneme napsáním těchto vlastních vektorů do sloupců, tj. P 1 1 V2 3 máme A = P-J P _1. Inverzní matice k P má tvar P 1 a dohromady pak dostáváme -1 1\ /l 1\ /l 0\ / 3 -1 . Pro matici A pak 5 4/ \2 3J \0 2J \-2 1 ii) Charakteristický polynom matice A je v tomto případě \A-XE\ -l-X -4 1 3-X Dostáváme tedy dvojnásobný kořen X (x, y) splňuje 0 = (A — E)x : : X1 - 2X + 1 = 0. 1 a příslušný vlastní vektor -2 1 -4 2 To jsou, opět jako v minulém příkladu, násobky vektoru (1, 2). To, že řešením této rovnice nejsou dva lineárně nezávislé vektory, říká, že Jordánův tvar v tomto případě nebude diagonální, ale bude to matice Bázi, ve které má matice A tento tvar, tvoří vlastní vektor (1, 2) a vektor, který se na tento vektor zobrazí zobrazením A — E. Je tedy řešením soustavy rovnic -2 1 -4 2 -2 1 0 0 To jsou násobky vektoru (1, 3). Dostáváme tedy stejnou bázijako v minulém příkladu a můžeme psát ' ' 3 -ŕ -2 1 Zobrazení teď působí na vektor tak, že složka ve směru (1, 3) zůstává stejná a ke složka ve směru (1, 2) se bude násobit součtem koeficientů, které určují složky ve směrech (1, 3) a (1, 2). □ -1 1 -4 3 2 3 1 1 0 1 5. Rozklady matic a pseudoinverze V minulé části jsme s soustředili na geometrický popis struktury zobrazení. Teď naše výsledky přeložíme do jazyku tzv. rozkladů matic, což je obzvlášť důležité téma pro numerické postupy a maticový počet obecně. 1 při počítání s reálnými čísly užíváme pro zjednodušení rozklady na součiny. Nejjednodušším je vyjádření každého reálného čísla jednoznačně ve tvaru a = sgn(a) • \a\, tj .jako součin znaménka a absolutní hodnoty. V dalším textu si uvedeme stručně přehled několika takových rozkladů pro různé typy matic, které bývají nesmírně užitečné při numerických výpočtech s maticemi. Například jsme vhodný rozklad pro pozitivně semi-deflnitní symetrické matice využili v odstavci 3.31 pro konstrukci odmocniny z matice. 3.42. LU-rozklad. Začneme přeformulováním několika vý- sledků, které jsme už dávno odvodili. V odstavcích ^ a ^ Jsme upravovali matice nad skaláry z libo-/j/äE^í volného pole na řádkový schodovitý tvar. K tomu -im*im ' jsme používali elementární úpravy, které spočívaly v postupném násobení naší matice invertibilními dolními trojúhelníkovými maticemi P;, které postihovaly přičítání násobků řádků pod právě zpracovávaným řádkem. Předpokládejme pro jednoduchost, že naše matice A je čtvercová a že při Gaussově eliminaci nejsme nuceni přehazovat řádky, a proto všechny naše matice P; mohou být dolní trojúhelníkové s jedničkami na diagonálách. Konečně, stačí si povšimnout, že inverzní matice k takovýmto P, jsou opět dolní trojúhelníkové s jedničkami na diagonálách a dostáváme U — P ■ A = Pk ■ ■ ■ P\ ■ A, kde U je horní trojúhelníková matice a tedy A = L-U, kde L je dolní trojúhelníková matice s jedničkami na diagonále a U je horní trojúhelníková. Tomuto rozkladu se říká L U-rozklad matice A. V případě obecné matice můžeme při Gaussově eliminaci na řádkově schodovitý tvar potřebovat navíc permutace řádků, někdy i sloupců matice. Pak dostáváme obecněji: Věta. Pro každou matici A existujípermutačnímatice P, Q, dolní trojúhelníková matice L a horní trojúhelníková matice U tak, že A = P ■ L-U ■ Q. 3.43. Poznámky. Přímým důsledkem Gaussovy eliminace bylo také zjištění, že až na volbu vhodných bází na de- (/ flničním oboru a oboru hodnot je každé zobrazení ~~. / : V -» W zadáno maticí v blokově diagonálním tvaru s jednotkovou maticí, s rozměrem daným dimenzí obrazu / a s nulovými bloky všude kolem. To lze přeformulovat takto: Každou matici A typu m/n nad polem skalárů K lze rozložit na součin S)-»- kde Pag jsou vhodné invertibilní matice. 163 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET 3.38. Najděte Jordánův tvar matice A a napište príslušný rozklad. Jaká je geometrická interpretace rozkladu této matice? A1 = |(_52 -;)aA2 = lg -^anakresleteínarýsujteXjak se vektory v = (3, 0), A\ v a A2v rozkládají vzhledem k bázi vlastních vektoru matice A i, resp. A2. Řešení. Matice mají stejné Jordánovy tvary jako matice v minulém příkladu a obě je mají v bázi tvořenou vektory (1, 2) a (1, —1), tj. 1 1 0 0 2 1 1 1 1 1 0 1 1 -ľ 3 \4 Pro vektor v = (3, 0) dostáváme v = (1,2) + 2(1, —1) a pro jeho obrazy Axv = (5,-2) = (1, 2) + 2 • 2 • (1,-1) a A2v = (5,4) = = (2 + 1)-(1,2)+ 2-(1,-1). □ F. Rozklady matic 3.39. Vyvraťte nebo dokažte: • Nechť A je čtvercová matice n x n. Pak je matice AT A je symetrická. • Nechť čtvercová matice A má pouze kladné reálné vlastní hodnoty. Pak j e A symetrická. 3.40. Nalezněte LU-rozklad následující matice: -2 1 0 -4 4 2 -6 1 -1 Řešení. Rozklad je roven Nejprve vynásobíme matice odpovídající Gaussově eliminaci, dostáváme tak pro původní matici A, XA = U, kde X je dolní trojúhelníková daná zmíněným součinem, U horní trojúhelníková. Z této rovnosti máme A = X~lU, což je hledaný rozklad (musíme tedy spočítat inverzi k Z). □ 1 3.41. Nalezněte L fZ-rozklad matice -1 O Pro čtvercové matice jsme v 3.32 ukázali při diskusi vlastností lineárních zobrazení / : V -» V na komplexních vektorových prostorech, že každou čtvercovou matici A dimenze m umíme rozložit na součin A — P ■ B ■ P'1, kde B je blokově diagonální s Jordánovými bloky příslušnými k vlastním číslům na diagonále. Skutečně jde o pouhé přepsání Jordánovy věty, protože násobení maticí P a její inverzí z opačných stran odpovídá v tomto případě právě změně báze na vektorovém prostoru V a citovaná věta říká, že ve vhodné bázi má každé zobrazení Jordánův kanonický tvar. Obdobně jsme také při diskusi samoadjungovaných zobrazení dokázali, že pro reálné symetrické nebo komplexní hermiteovské matice existuje vždy rozklad na součin A — P ■ B ■ P*, kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále, včetně násobností. Skutečně, jde opět o součin s maticemi vystihující změnu báze, nicméně připouštíme nyní pouze změny mezi mezi ortonormálními bázemi a proto i matice přechodu P musí být ortogonální. Odtud P~l — P*. Pro reálná ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických, pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podpro-storům. 3.44. Věta o singulárním rozkladu. Nyní se vrátíme k obecným lineárním zobrazením mezi (obecně různými) vektorovými prostory. Jestliže na nich je definován skalární součin a omezíme se přitom na ortonormální báze, musíme postupovat o hodně rafinovaněji, než v případě bází libovolných: Věta. Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární matice U a V dimenzím a n, a reálná diagonální matice D s nezápornými prvky, dimenze r, r < minjm, n), takové, že ■ usv* (Ô a r je hodnost matice AA*. Přitom je S určena jednoznačně až na pořadí prvků a prvky diagonální matice D jsou druhé odmocniny vlastních čísel di matice AA*. Pokud je A reálná matice, pak i matice U a V jsou ortogonální. Důkaz. Předpokládejme nejprve m < n a označme

n, můžeme aplikovat předchozí část důkazu na matici A*. Odtud pak přímo plyne požadované tvrzení. Pokud pracujeme nad reálnými skaláry, jsou všechny naše kroky v důkazu výše také realizovány v reálném oboru. □ Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít pro výpočet unitárních, resp. ortogonálních, matic U, V a diagonálních nenulových prvků matice 5. 3.45. Geometrická interpretace. Diagonálním hodnotám matice D z předchozí věty se říká singulární hodnoty matice A. Přeformulujme si tuto větu v reálném případě geometričtěji. Pro příslušné lineární zobrazení

Rm mají singulární hodnoty skutečně jednoduchý geometrický význam: Nechť K c W je jednotková sféra pro standardní skalární součin. Obrazem Km s maticí A ve standardních bázích můžeme zvolit novou ortonormální bázi ■ na Km tak, aby potom

n (máme tedy více rovnic než neznámých) a chceme tuto závislost „co nejlépe" odhadnout pomocí lineární funkce, tj. vyjádřit hodnotu majetku jakožto lineární funkci f(x\,..., xn) = b\x\ + b2x2 + ... + + bnxn + c. Definujeme tedy „co nejlépe" tím, že chceme minimalizovat E - Ysbix>+c> j v závislosti na reálných konstantách b\,..., bn, c. Naším cílem je najít takovou lineární kombinaci sloupců matice A = (a1-) (s koeficienty b\,..., bn), která bude mít co nejmenší vzdálenost od vektoru (yi,..., yk) v Rk, tedy vlastně najít kolmou projekci vektoru (yi,..., yk) na podprostor generovaný sloupci matice A. Podle věty 3.49 je touto projekcí vektor (b\,..., bn)T = A\y\,..., bn). Tuto metodu už jsme také použili na výpočet vzdálenosti bodu od podpro-storu v příkladu ||4.75||. q> v bázi z věty o singulárním rozkladu, tj. v této bázi bude mít q> matici 5 z definice pseudoinverze . Bez újmy na obecnosti nyní budeme pracovat v této bázi, tj. můžeme předpokládat, že v blokovém tvaru S)-*-(V 2) nulov zjevní (o s diagonální maticí D všech nenulových singulárních čísel, a B je matice splňující předpoklady. Zjevně A'A = a tedy dostáváme Odtud vidíme, že -(V í) pro vhodné matice P, Q a R. Nyní však *)(ô Z / E 0 \QD 0 mábýthermiteovská, proto je QD = Oatedyi Q = 0 (matice £>je diagonální a invertibilní). Obdobně požadavek na hermiteovskost A B vede na nulovost P. Zároveň ještě platí Na pravé straně aleje v pravém dolním rohu nula, proto také R = 0 a tvrzení je dokázáno. (4) : Uvažme zobrazení

n. Např. máme experimentem dáno mnoho naměřených reálných hodnot b j a chceme najít lineární kombinaci několika funkcí /,, která bude co nejlépe aproximovat hodnoty b j. Skutečné hodnoty zvolených funkcí v bodech e R zadají matici = fjiyi), jejíž sloupce jsou dány hodnotami jednotlivých funkcí fj v uvažovaných bodech, a naším úkolem je tedy určit koeficienty xj e R tak, aby součet kvadrátů odchylek od skutečných hodnot m , , n , , 2 m , , n \\2 El* - (E* <-<)) = El* - (E*w í=1 7=1 í=1 7=1 byl minimální. Jinými slovy, hledáme lineární kombinaci funkcí f i takovou, abychom „dobře" proložili zadané hodnoty £>,. Díky předchozí větě jsou hledané optimální koeficienty A^b. Abychom měli konkrétnější představu, uvažujme pouze dvě funkce f\ (x) — x, f2 (x) — x2 a předpokládejme, že „naměřené hodnoty" jejich neznámé kombinace g(x) — y\x + yix2 v celočíselných hodnotách pro x mezi 1 a 10 jsou bT — (1,44 10,64 4,48 14,56 31,12 39,20 54,88 71,28 85,92 104,16). Tento vektor vznikl výpočtem hodnot x + x2 v daných bodech posunutých o náhodné hodnoty v rozmezí ±8. Matice A = (bij) je tedy v našem případě rovna /l 2 3 4 5 6 7 \l 4 9 16 25 36 49 a hledané koeficienty v kombinaci jsou i,61^ A' = 64 10 100 y ■- ■AJ-b- 99 Výsledné proložení je nejlépe vidět v grafickém zobrazení Pokud jste spřáteleni s Maplem nebo Matlabem (nebo jiným podobným softwarem), zkuste si zaexperimentovat s podobnými úlohami a výslednými obrázky. 169 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET G. Doplňující příklady k celé kapitole 3.48. Určete posloupnost reálnych čísel, která vyhovuje následující nehomogenní diferenční rovnici s počátečními podmínkami: 2xn+2 = —x„+i +xn + 2, x\ = 2, x2 = 3. Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(— 1)™ + b(l/2)n. Partikulárním řešením je konstanta 1. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy xn = a(-l)n+b(^j +1. Dosazením do počátečních podmínek zjistíme konstanty a = 1, b = 4. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost ^ = (-l)"+4(i)" + l. □ 3.49. Určete jedinou posloupnost vyhovující rekurentnímu vztahu x„ = lxn-\ — 10x„_2 + 8n — 22 s počátečními členy x\ = 6, x2 = 8. O 3.50. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 3xn+í + 3xn se členy x\ = \& x2 = 3. O 3.51. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {x„}™=l vyhovující následujícím podmínkám: Xn+2 = Xn+\ - X„, X\ = 1, X2 = 5. O 3.52. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {*n}^Li vyhovující následujícím podmínkám: -x„+3 = 2xn+2 + 2xn+i + x„, xi = 1, x2 = 1, x3 = 1. O 3.53. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}™=l vyhovující následujícím podmínkám: -x„+3 = 3xn+2 + 3xn+i + x„, xi = 1, x2 = 1, x3 = 1. O 3.54. Jezírko. Mějme jednoduchý model jezírka, ve kterém žije populace bílé ryby (plotice, ouklej, podoustev, ostroretka atd.). Předpokládáme, že druhého roku se dožije 20 % rybího plůdku a od tohoto stáří už jsou ryby schopny se reprodukovat. Z mladých ryb přežije z druhého do třetího roku přibližně 60 % a v dalších letech je už úmrtnost zanedbatelná. Dále předpokládáme, že roční přírůstek nových plůdků je třikrát větší než počet ryb (schopných reprodukce). Tato populace by evidentně jezírko brzy přeplnila. Rovnováhu chceme dosáhnout nasazením dravé ryby, např. štiky. Předpokládejme, že jedna štika sní ročně asi 500 dospělých bílých ryb. Kolik štik pak musíme do jezírka nasadit, aby populace stagnovala? Řešení. Pokud označíme p počet plůdku, m počet mladých ryb a r počet dospělých ryb, pak je stav populace v dalším roce popsán následovně: /p\ / 3m + 3r \ m Q,2p \r I \0,6m + Tr) 170 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET kde 1—t je relativní úmrtnost dospělé ryby způsobená štikou. Příslušná matice popisující tento model je tedy Pokud má populace stagnovat, pak musí mít tato matice vlastní hodnotu 1. Jinými slovy, jednička musí být kořenem charakteristického polynomu této matice. Ten je tvaru A2(t— A)+0,36—0,6.(t— A.) = 0. To znamená, že t musí splňovat Do dalšího roku tedy může přežít jen 10 % z dospělých ryb a zbytek by měla sníst štika. Označíme-li hledaný počet štik x, pak dohromady sní 500* ryb, což by mělo odpovídat podle předchozího výpočtu 0,9r. Poměr počtu bílé ryby ku počtu štik by tedy měl býtr- = To je přibližně jedna štika na 556 3.55. Model vývoje populace velryb. Pro vývoj populace jsou podstatné samice a u nich není důležitý věk, ale plodnost. Z tohoto hlediska můžeme samice rozdělit na novorozené neboli juve-nilní, tj. dosud neplodné samice, mladé plodné samice, dospělé samice s největší plodností a samice postmenopauzní, které již plodné nejsou, ale mají velký význam při ochraně mláďat nebo vyhledávání zdrojů potravy. Budeme modelovat vývoj takové populace v čase. Za časovou jednotku zvolíme dobu dosažení dospělosti. Novorozená samice, která tuto dobu přežije, dospěje k plodnosti. Vývoj mladé samice do plné plodnosti a vývoj dospělé samice k menopauze závisí na podmínkách prostředí. Přechod do další plodnostní kategorie je tedy náhodný jev. Stejně je náhodným jevem i úmrtí samice. Mladá plodná samice má za jednotku času průměrně méně mláďat, než samice plodná. Tyto poznatky vyjádříme formalizovane. Označme x\(t), resp. x2(t), resp. x3(t), resp. x4(r), množství juvenilních, resp. mladých, resp. plně plodných, resp. postmenopauzních, samic v čase /. Množství může vyjadřovat počet jedinců, ale také počet jedinců vztažených na jednotkový areál (tzv. populační hustotu), případně také celkovou biomasu a podobně. Dále označme p\ pravděpodobnost, že juvenilní samice přežije jednotkový časový interval a tedy během něho dospěje, a p2, resp. p3, pravděpodobnost, že během jednotkové doby mladá, resp. plně plodná, samice, která neuhyne, dospěje do následující kategorie, tj. mladá do plné plodnosti a plně plodná k menopauze. Dalším náhodným jevem je umírání (pozitivně řečeno: přežívání) samic, které nedospějí do další kategorie; označme pravděpodobnosti přežití po řadě q2, q3 a qn pro mladé, plně plodné a postmenopauzní samice. Každé z čísel p\, p2, p3, q2, q3, q$ jakožto pravděpodobnost je z intervalu [0, 1]. Mladá samice může přežít, dospět do plné plodnosti nebo uhynout; tyto jevy jsou neslučitelné, společně tvoří jev jistý a možnost úmrtí nelze vyloučit. Platí tedy p2 + q2 < 1. Z podobných důvodů platí p3 +q3 < 1. Nakonec ještě označíme f2, resp. f3 průměrný počet dcer mladé, resp. plně plodné, samice. Tyto parametry splňují nerovnost 0 < f2 < f3. Očekávaný počet novorozených samic v následujícím časovém období je součtem dcer mladých a plně plodných samic, tj. t - 1 + 0,36-0,6(t-1)=0, 0,4t - 0,04 = 0. kusů bílé ryby. □ Xl(t + 1) = f2X2(t) + f3X3(t). 171 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Označme na okamžik X2,i(t+ľ) množství mladých samic v čase /+1, které byly v předchozím období, tj. v čase / juvenilními, a X2,2(r+1) množství mladých samic, které již v čase / byly plodné, jednotkový časový interval přežily, ale nedosáhly plné plodnosti. Pravděpodobnost p\, žejuvenilní samice přežije jednotkový časový interval, můžeme vyjádřit jako klasickou, tj. jako poměr X2,\(t + l)/x\(t), a podobně můžeme vyjádřit pravděpodobnost qi jako poměr x20.it + l)/x2(t). Poněvadž mladé samice v čase / + 1 jsou právě ty, které dospěly z juvenilnflio stádia, a ty, které již plodné byly, přežily a nedospěly k plné plodnosti, platí x2(t + 1) = x2,i(t + í)+x2,2(t + 1) = PiXi(t) + q2X2(t). Analogicky odvodíme očekávaný počet plně plodných samic jako X3(t + 1) = p2X2(t) + #3X3 (/) a očekávaný počet postmenopauzních samic x4(t + 1) Nyní můžeme označit /O Í2 A p3x3(t) + q4x4(t). P\ 0 Í2 P2 0 Í3 P3 o\ o o 94 J X(t) : íxi{t)\ X2(t) x3(t) \x4(t) / a předchozí rekurentní formule přepsat v maticovém tvaru x(t + 1) = Ax(t). Pomocí této maticové diferenční rovnice snadno spočítáme očekávané množství velrybích samic v jednotlivých plodnostních kategoriích, pokud známe složení populace v nějakém počátečním čase. Konkrétně pro populaci kosatek dravých byly odpozorovány populační parametry pi= 0,9775, $2 = 0,9111, f2 = 0,0043, p2 = 0,0736, q3 = 0,9534. f3= 0,1132, p3 = 0,0452, q4 = 0,9804; časovou jednotkou je v tomto případě jeden rok. Začneme-li v čase / = 0 s jednotkovým množstvím mladých samic v nějakém neobsazeném areálu, tj. s vektorem x(0) = (0,1, 0, 0)r, můžeme spočítat x(l) x(2) í 0 0,0043 0,9775 0,9111 0 0,0736 l 0 0 / 0 0,0043 0,9775 0,9111 0 0,0736 l 0 0 0,1132 0 0,9534 0,0452 0,1132 0 0 \ 0 0 0,9804/ 0 0 0 0,9804/ M 1 o W /0,0043\ /0,0043\ 0,9111 0,0736 0 ) /0,01224925\ 0,9111 _ 0,83430646 0,0736 ~ 0,13722720 0,0452 0,9804/ \ 0 / \0,00332672/ a tak můžeme pokračovat dále. Výsledky výpočtu můžeme také znázornit graficky; to je provedeno na obrázku. Vyzkoušejte si výpočet a grafické znázornění jeho výsledků i pro jiné počáteční složení populace. Výsledkem by mělo být pozorování, že celková velikost populace roste jako exponenciální funkce, poměry velikostí jednotlivých plodnostních tříd se postupně ustálí na konstantních hodnotách. Matice A má vlastní hodnoty X1 = 1,025441326, X2 = 0,980400000, X3 = 0,834222976, X4 = 0,004835698, vlastní vektor příslušný k největší vlastní hodnotě Xi je w = (0,03697187, 0,31607121, 0,32290968, 0,32404724). 172 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Obrázek i. Vývoj populace kosatky dravé. Na vodorovné ose je čas v letech, na svislé velikost populace. Jednotlivé plochy zobrazují množství ju venil-ních, mladých, plné plodných a postmenopauzních samic v tomto pořadí zdola. Tento vektor je normován tak, aby součet jednotlivých složek byl roven 1. Porovnejte vývoj velikosti populace s exponenciální funkcí F(t) = X\xq, kde x0 je celková velikost počáteční populace. Vypočítejte také relativní zastoupení jednotlivých plodnostních kategorií v populaci po jisté době vývoje a porovnejte ho se složkami vlastního vektoru w. Shoda je způsobena pouze tím, že matice A má jednu vlastní hodnotu, která má absolutní hodnotu největší z absolutních hodnot všech vlastních hodnot matice A, a tím, že vektorový podprostor generovaný vlastními vektory příslušnými k vlastním hodnotám A.2, A.3, A.4 má s nezáporným orthantem jednoprvkový průnik (pouze nulový vektor). Struktura matice A však sama nezaručuje takto jednoduše předvídatelný vývoj, je totiž tzv. reducibilní. 3.56. Model růstu populace bodláků Dipsacus sylvestris. Tuto rostlinu můžeme vidět ve čtyřech podobách. Buď jako kvetoucí rostlinu nebo jako růžici listů, přičemž u růžic můžeme rozlišit trojí velikost - malé, střední a velké. Životní cyklus této jednodomé víceleté byliny můžeme popsat následovně. Kvetoucí rostlina vyprodukuje v pozdním létě větší množství semen a uhyne. Ze semen některá vyklíčí ještě v temže roce a vyroste z nich růžice listů, nejčastěji střední velikosti. Jiná semena zůstanou v zemi a přezimují. Některá z přezimujících semen na jaře vyklíčí a vyroste z nich růžice listů; poněvadž jsou ale prezimovaním oslabena, bude tato růžice s nejvyšší pravděpodobností malá. Většina z přezimujících semen zůstane v zemi, a ta z nich, která přežijí, na jaře vyklíčí a vyrostou z nich malé růžice. Po třech nebo více zimách „spící*' (odborně řečeno dormantní) semena hynou, ztrácí schopnost vyklíčit. Podle podmínek prostředí, kde rostlina roste, může malá nebo střední růžice listů do dalšího roku vyrůst, kterákoliv z růžic může zůstat ve své velikostní kategorii nebo uhynout - uschnout, být sežrána nějakým hmyzem a podobně. Střední nebo velká růžice může v následujícím roce vykvést. Kvetoucí rostlina produkuje semena a celý cyklus se opakuje. Abychom mohli předpovídat, jak rychle se bude populace uvažovaných bodláků v krajině šířit, potřebujeme popsané procesy nějak kvantifikovat. Botanici zjistili, že kvetoucí rostlina vyprodukuje průměrně 431 semen. Pravděpodobnosti klíčení různých semen, růstu růžic listů a vykvetení jsou shrnuty v tabulce: 173 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET jev pravděpodobnost semeno vyprodukované rostlinou uhyne ze semene vyroste malá ružice v temže roce ze semene vyroste střední ružice v temže roce ze semene vyroste velká ružice v temže roce ze semene přezimujícího rok vyroste malá ružice ze semene přezimujícího rok vyroste střední ružice ze semene přezimujícího rok vyroste veľká ružice ze semene přezimujícího dva roky vyroste malá ružice semeno po prvním prezimovaní uhyne malá ružice přežije a nevyroste střední ružice přežije a nevyroste velká ružice přežije a nevyroste z malé ružice vyroste střední z malé ružice vyroste velká ze střední růžice vyroste velká střední růžice vykvete velká růžice vykvete 0,172 0,008 0,070 0,002 0,013 0,007 0,001 0,001 0,013 0,125 0,238 0,167 0,125 0,036 0,245 0,023 0,750 Povšimněme si, že všechny relevantní jevy v životním cyklu rostliny mají pravděpodobnost přiřazenu a že se jedná o jevy neslučitelné. Budeme si představovat, že populaci pozorujeme vždycky na začátku vegetačního roku, řekněme v březnu, a že ke všem uvažovaným jevům dochází ve zbytku času, dejme tomu od dubna do února. V populaci se vyskytují kvetoucí rostliny, růžice tří velikostí, vyprodukovaná semena a semena dor-mantní jeden nebo dva roky. Toto pozorování by mohlo svádět k tomu, že populaci rozdělíme do sedmi tříd - semena čerstvá, dormantní první rok a dormantní druhý rok, růžice malé střední a velké, kvetoucí rostliny. Avšak z vyprodukovaných semen se v temže roce vyvinou buďrůžice nebo semena přezimují. Čerstvá semena tedy netvoří samostatnou třídu, jejíž velikost bychom na začátku roku mohli určit. Označme tedy: x\ (t) — počet semen dormantních první rok na jaře roku /, xi(t) — počet semen dormantních druhý rok na jaře roku /, x3(t) — počet malých růžic na jaře roku /, xn(t) — počet středních růžic na jaře roku /, xs(t) — počet velkých růžic na jaře roku /, xň(t) — počet kvetoucích rostlin na jaře roku /. Počet vyprodukovaných semen v roce / je 431x6(0- Pravděpodobnost, že semeno zůstane jako dormantní první rok, je rovna pravděpodobnosti, že ze semena nevyroste žádná růžice a že neuhyne, tedy 1 - (0,008 + 0,070 + 0,002 + 0,172) = 0,748. Očekávaný počet semen dormantních jednu zimu v následujícím roce tedy je xx{t + 1) = 0,748 • 431x6(t) = 322,388x6(r). Pravděpodobnost, že semeno, které již jeden rok bylo dormantní, zůstane dormantním i druhý rok je rovna pravděpodobnosti, že ze semena dormantního jeden rok nevyroste žádná růžice a že neuhyne, tedy 1 — 0,013 — 0,007 — 0,001 — 0,013 = 0,966. Očekávaný počet semen dormantních dvě zimy v následujícím roce tedy bude Malá růžice může vyrůst ze semena bezprostředně, ze semena dormantního jeden rok nebo dormantního dva roky. Očekávaný počet malých růžic vyrostlých bezprostředně v roce / je roven x2(t + 1) = 0,966xi (r). 174 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET 0,008 • 431*6(0 = 3,448;t6(r). Očekávaný počet malých růžic vyrostlých ze semen dormantních jeden a dva roky je 0,013x1 (/) a 0,010x2(0- S těmito nově vyrostlými malými růžicemi jsou v populaci rostlin také malé růžice starší, které nevyrostly; těch je 0,125x3(0. Celkový očekávaný počet malých růžic tedy je x3(r + 1) = 0,013xi(0 + 0,010x2(0 + 0,125x3(0 + 3,448x6(0-Analogicky určíme očekávaný počet středních a velkých růžic x4(r + 1) = 0,007xi(0 + 0,125x3(0 + 0,238x4(0 + 0,070 • 431x6(0 = = 0,007xi(0 + 0,125x3(0 + 0,238x4(0 + 30,170x6, x5(r + 1) = 0,245x4(0 + 0,167x5(0 + 0,002 • 431x6(0 = = 0,245x4(0 + 0,167x5(0 + 0,862x6(0- Kvetoucí rostlina může vyrůst ze střední nebo velké růžice. Očekávaný počet kvetoucích rostlin tedy bude x6(t + 1) = 0,023x4(0 + 0,750x5(0. Dospěli jsme tedy k šesti rekurentním formulím pro jednotlivé složky populace studované rostliny. Označíme nyní / 0 0 0 0 0 0,966 0 0 0 0 0,013 0,010 0,125 0 0 0,007 0 0,125 0,238 0 0,008 0 0,038 0,245 0,167 \ 0 0 0 0,023 0,750 322,388\ 0 3,448 30,170 0,862 0 / x(0 /xj(0\ x2(0 x3(0 x4(0 x5(0 Ve(0 / a předchozí rovnosti zapíšeme v maticovém tvaru vhodném pro výpočet x(t + 1) = Ax(0- Pokud známe počty jednotlivých složek populace v nějakém počátečním roce / = 0, můžeme vypočítat očekávané počty rostlin a semen v letech následujících. Můžeme také počítat celkový 6 počet jedinců n(t) v čase /, n(t) = ^x,(0, relativní zastoupení jednotlivých složek x; (/)/«(/), i = 1, 2, 3,4, 5, 6 a meziroční relativní změnu populace n(t + 1)/«(/). Výsledky takového výpočtu pro patnáct let a případ, že na nějakou lokalitu jsme přesadili jednu kvetoucí rostlinu, jsou uvedeny v tabulce || 11|. Na rozdíl od populace velryb by nyní obrázek nebyl příliš přehledný, počty rostlin jsou oproti počtům semen zanedbatelné, v obrázku by splynuly. Matice A má vlastní hodnoty Aj= 2,3339, A4 = 0,1187 + 0,1953i, A.2 = -0,9569 + l,4942i, A5 = 0,1187 - 0,1953i, A3 = -0,9569 - 1,4942i, A6 = -0,1274. Vlastní vektor příslušný k vlastní hodnotě Ai je w = (0,6377, 0,2640, 0,0122, 0,0693 , 0,0122, 0,0046). Tento vektor je normován tak, aby součet jeho složek byl roven jedné. Vidíme, že s rostoucím časem / se relativní změna velikosti populace přibližuje vlastní hodnotě Ai, relativní zastoupení jednotlivých složek populace se přibližují složkám normovaného vlastního vektoru příslušného k vlastní hodnotě A i. Každá nezáporná matice, která má nenulové prvky na stejných pozicích jako matice A, je primitivní. Vývoj populace tedy zákonitě spěje ke stabilizované struktuře. 175 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET t x\ x2 x3 X4 x5 Xf, n(t) 0 0,00 0,00 0,00 0,00 0,00 1,00 1,00 1 322,39 0,00 3,45 30,17 0,86 0,00 356,87 2 0,00 311,43 4,62 9,87 10,25 1,34 337,50 3 432,13 0,00 8,31 43,37 5,46 7,91 497,18 4 2550,50 417,44 33,93 253,07 22,13 5,09 3 282,16 5 1 641,69 2463,78 59,13 235,96 91,78 22,42 4514,76 6 7227,10 1 585,88 130,67 751,37 107,84 74,26 9877,12 7 23 941,29 6981,37 382,20 2486,25 328,89 98,16 34218,17 8 31646,56 23 127,29 767,29 3768,67 954,73 303,85 60568,39 9 97958,56 30570,58 1786,27 10381,63 1 627,01 802,72 143 126,78 10 258788,42 94627,97 4570,24 27597,99 4358,70 1 459,04 391402,36 11 470376,19 249989,61 9912,57 52 970,28 10991,08 3 903,78 798 143,52 12 1258532,41 454383,40 23 314,10 134915,73 22317,98 9461,62 1902925,24 13 3 050 314,29 1215742,31 56442,70 329291,15 55 891,57 19 841,54 4727523,56 14 6396675,73 2946603,60 127280,49 705 398,22 133 660,97 49492,37 10359111,38 15 15 955 747,76 6 179 188,75 299 182,59 1721756,52 293 816,44 116469,89 24566161,94 f Xl(t) x2(t) x3(t) x4(t) x5(t) x6(t) n(t + 1) L n (í) n (í) n (í) n (í) n (í) n (í) n (í) 0 0,000 0,000 0,000 0,000 0,000 1,000 356,868 1 0,903 0,000 0,010 0,085 0,002 0,000 0,946 2 0,000 0,923 0,014 0,029 0,030 0,004 1,473 3 0,869 0,000 0,017 0,087 0,011 0,016 6,602 4 0,777 0,127 0,010 0,077 0,007 0,002 1,376 5 0,364 0,546 0,013 0,052 0,020 0,005 2,188 6 0,732 0,161 0,013 0,076 0,011 0,008 3,464 7 0,700 0,204 0,011 0,073 0,010 0,003 1,770 8 0,522 0,382 0,013 0,062 0,016 0,005 2,363 9 0,684 0,214 0,012 0,073 0,011 0,006 2,735 10 0,661 0,242 0,012 0,071 0,011 0,004 2,039 11 0,589 0,313 0,012 0,066 0,014 0,005 2,384 12 0,661 0,239 0,012 0,071 0,012 0,005 2,484 13 0,645 0,257 0,012 0,070 0,012 0,004 2,191 14 0,617 0,284 0,012 0,068 0,013 0,005 2,371 15 0,650 0,252 0,012 0,070 0,012 0,005 Tabulka i. Modelovaný vývoj populace bodláku Dipsacus sylvestris. Velikosti jednotlivých složek populace, celková velikost populace, relativní zastoupení jednotlivých složek a relativní přírůstky velikosti. 3.57. Nelineární model populace. Prozkoumejte podrobně vývoj populace pro nelineární model 1.12 z první kapitoly a hodnoty K = 1 a i) míru růstu r = 1 a počáteční stav p(l) = 0,2, ii) míru růstu r = 1 a počáteční stav p(l) = 2, iii) míru růstu r = 1 a počáteční stav p(l) = 3, iv) míru růstu r = 2, 2 a počáteční stav p(l) = 0,2, 176 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET v) míru růstu r = 3 a počáteční stav p(í) = 0,2. Spočítejte několik prvních členů a odhadněte, jak bude populace dále růst. Řešení, (i) Prvních deset členů posloupnosti p(n) je v následující tabulce. Odtud je vidět, že velikost populace konverguje k hodnotě 1. n p(n) 1 0,2 2 0,36 3 0,5904 4 0,83222784 5 0,971852502 6 0,999207718 7 0,999999372 Graf vývoje populace pro r = 1 a p(í) = 0, 2: --1-1-1-1-1-1 0 0,2 0,4 0,6 0,8 1 1,2 (ii) Pro počáteční hodnotu p(í) = 2 dostaneme p(2) = 0 a dál už se populace měnit nebude. (111) Pro p(l) = 3 dostáváme n p(n) 1 3 2 -15 3 -255 4 -65535 a odtud je vidět, že populace bude klesat pode všechny meze. (iv) Pro míru růstu r = 2, 2 a počáteční stav p(l) = 0, 2 dostáváme 177 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET n p(n) 1 0,2 2 0,552 3 1,0960512 4 0,864441727 5 1,122242628 6 0,820433675 7 1,144542647 8 0,780585155 9 1,157383491 10 0,756646772 11 1,161738128 12 0,748363958 13 1,162657716 14 0,74660417 Vidíme, že místo konvergence dostáváme v tomto případě oscilaci-po nějaké době bude populace přeskakovat mezi hodnotami 1,16 a 0,74. Graf vývoje populace pro r = 2,2 a p(l) = 0,2 pak vypadá následovně: 3,2 1 0.s 0.1 0.2 0 c 0,2 0,4 0,6 0,8 1 1,2 1,4 (v) Pro míru růstu r = 3 apočáteční stav p(í) = 0, 2 je už situace složitější-populace začne oscilovat mezi více hodnotami. Abychom lépe viděli mezi kterými, bylo by potřeba spočítat ještě víc členů. 1,4 Tabulka vývoje populace: 178 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET n p(n) 1 0,2 2 0,68 3 1,3328 4 0,00213248 5 0,008516278 6 0,033847529 7 0,131953152 8 0,475577705 9 1,223788359 10 0,402179593 11 1,123473097 12 0,707316989 13 1,328375987 14 0,019755658 15 0,077851775 16 0,293224403 17 0,91495596 18 1,148390614 19 0,63715945 20 1,330721306 21 0,010427642 22 0,041384361 23 0,160399447 □ 3.58. Sledovanost televizí. V jisté zemi vysílají jisté dvě televizní stanice. Z veřejného výzkumu vyplynulo, že po jednom roce přejde 1/6 diváků první stanice ke druhé stanici, 1 /5 diváků druhé stanice přejde k první stanici. Popište časový vývoj počtu diváků sledujících dané stanice jako Markovu v proces, napište jeho matici, nalezněte její vlastní čísla a vlastní vektory. O 3.59. Výrobní linka nefunguje spolehlivě: jednotlivé výrobky se od sebe co do kvality nezanedbatelně liší. Navíc jistý pracovník ve snaze zvýšit kvalitu neustále zasahuje do výrobního procesu. Při rozdělení výrobků do tříd I, II, III podle kvality se zjistilo, že po výrobku třídy I následuje výrobek stejné kvality v 80 % případů a třídy II v 10 % případů, po výrobku třídy II se nezmění kvalita v 60 % případů a změní se na třídu I ve 20 % případů a že po výrobku třídy III následuje výrobek stejné kvality v polovině případů a se stejnou četností pak výrobky tříd I, II. Spočtěte pravděpodobnost, že 18. výrobek je třídy I, pokud 16. výrobek v pořadí náležel do třídy III. Řešení. Nejprve úlohu vyřešme bez uvážení Markovova řetězce. Sledovanému jevu vyhovují případy (16. výrobek je třídy III) • 17. výrobek byl zařazen do třídy I a 18. do třídy I; • 17. výrobek byl zařazen do třídy II a 18. do třídy I; • 17. výrobek byl zařazen do třídy III a 18. do třídy I po řadě s pravděpodobnostmi • 0,25-0,8 = 0,2; • 0,25 • 0,2 = 0,05; • 0,5-0,25 = 0,125. 179 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Lehce tak získáváme výsledek 0,375 = 0,2 + 0,05 + 0,125. Nyní na úlohu nahlížejme jako na Markovův proces. Ze zadání plyne, že pořadí možných stavů „výrobek je třídy I", „výrobek je třídy II", „výrobek je třídy III" odpovídá pravděpodobnostní matice přechodu 0,8 0,2 0,25\ 0,1 0,6 0,25 . 0,1 0,2 0,5 / Situaci, kdy výrobek patří do třídy III, zadává pravděpodobnostní vektor (0, 0, l)r. Pro následující výrobek dostáváme pravděpodobnostní vektor 0,25\ /0,8 0,2 0,25\ /0\ 0,25 = 0,1 0,6 0,25 0 0,5 / \0,1 0,2 0,5 / \1/ a pro další výrobek v pořadí potom vektor 0,375\ /0,8 0,2 0,25\ /0,25\ 0,3 = 0,1 0,6 0,25 • 0,25 , 0,325/ \0,1 0,2 0,5 / \0,5/ jehož první složka je hledanou pravděpodobností. Doplňme, že první metoda řešení (bez zavedení Markovova procesu) vedla k výsledku zřejmě rychleji. Uvědomme si, jak výrazně by se však první metoda znepřehlednila, kdybychom např. místo 18. výrobku uvažovali 20., 22. nebo až 30. výrobek v pořadí. Ve druhé metodě se lze omezit na do jisté míry „bezmyšlenkovité" násobení (umocňování) matic. Při zavedení Markovova procesu jsme také současně vyšetřovali situace, kdy 18. výrobek náleží do tříd II a III. □ 3.60. Jistá populace malých hlodavců se množí následujícím způsobem: hlodavci stáří do jednoho měsíce splodí v průměru jednoho hlodavce, na jednoho hlodavce stáří mezi jedním a dvěma měsíci připadá v průměru 12 nově narozených hlodavců. Starší hlodavci neplodí. Umírá polovina hlodavců stáří do jednoho jednoho měsíce i polovina hlodavců stáří mezi měsícem a dvěma měsíci. Více než tří měsíců se nedožije žádný. Na jakém poměru se ustálí počet hlodavců stáří do jednoho měsíce ku počtu hlodavců stáří mezi jedním a dvěma měsíci ku počtu hlodavců stáří mezi dvěma a třemi měsíci. O 3.61. Opakovaně házíme hrací kostkou. Napište pravděpodobnostní matici přechodu T pro Markovův řetězec „maximální počet ok dosažených do n-tého hodu včetně" pro pořadí stavů 1,..., 6. Poté určete T" pro každé nei. Řešení. Ihned můžeme uvést /1/6 0 0 0 0 0\ 1/6 2/6 0 0 0 0 1/6 1/6 3/6 0 0 0 1/6 1/6 1/6 4/6 0 0' 1/6 1/6 1/6 1/6 5/6 0 \l/6 1/6 1/6 1/6 1/6 1/ kde první sloupec je určen stavem 1 a pravděpodobností 1 /6 pro jeho zachování (v dalším hodu padne 1) a pravděpodobností 1/6 jeho přechodu do libovolného ze stavů 2,..., 6 (po řadě padne 2,..., 6), druhý sloupec je zadán stavem 2 a pravděpodobností 2/6 pro jeho zachování (v dalším hodu padne 1 nebo 2) a pravděpodobností 1/6 pro přechod do jakéhokoli ze stavů 3,..., 6 (padne 180 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET 3,..., 6), až poslední sloupce získáme ze skutečnosti, že stav 6 je trvalý (pokud již padla šestka, nemůže padnout vyšší počet ok). Rovněž pro n e N lze přímo určit / (*)" (§)"-(*)" (I)" (i)"-(i)" (i)"-© 0 o\ 0 0 0 0 0 0 D" 0 (i)' ©"-(!)" ©"-(!)" (i)"-(i (I)"-©" (I)"-©" (I)"-©" (§)*-(! \ '-(!)" '-(!)" '-(!)" '-(§)* Hodnoty v prvním sloupci totiž odpovídají postupně pravděpodobnostem, že n -krát po sobě padne 1, n-krát po sobě padne 1 nebo 2 a alespoň jednou 2 (odečítáme proto pravděpodobnost uvedenou v prvním řádku), n-krát po sobě padne 1, 2 nebo 3 a alespoň jednou padne 3, až v posledním řádku je pravděpodobnost, že aspoň jednou během n hodů padne 6 (tu lze snadno určit z pravděpodobnosti opačného jevu). Podobně např. ve čtvrtém sloupci jsou postupně nenulové pravděpodobnosti jevů „rc-krát po sobě padne 1, 2, 3 nebo 4", „rc-krát po sobě padne 1, 2, 3, 4 nebo 5 a alespoň jednou 5" a „alespoň jednou během n hodů padne 6". Interpretace matice t jako matice přechodu jistého Mar-kovova procesu tak umožňuje rychlé vyjádření mocnin t",n eN. □ 3.62. V laboratoři je prováděn pokus se stejnou pravděpodobností úspěchu i neúspěchu. Pokud se pokus podaří, bude pravděpodobnost úspěchu druhého pokusu 0,7. Jestliže skončí první pokus neúspěchem, bude pravděpodobnost úspěchu druhého pokusu pouze 0,6. Dále se bude pokračovat v provádění pokusů, kdy úspěšnost předešlého znamená, že pravděpodobnost úspěchu následujícího bude 0,7, a jeho neúspěšnost způsobí, že pravděpodobnost úspěchu následujícího bude 0,6. Pro libovolné n € N stanovte pravděpodobnost, že n-tý pokus se podaří. Řešení. Zavedme pravděpodobnostní vektor xn = {xi, x2n)T , neN, kde x\ je pravděpodobnost úspěchu rc-tého pokusu &x\ = 1 — x\ je pravděpodobnost jeho neúspěchu. Podle zadání je '1/2^ Xl a zřejmě také x2 0,7 0,6 0,3 0,4 1/2 1/2 /l3/20\ l 7/20 i' Při označení platí (3.6) 7/10 3/5\ 3/10 2/5/ xn+\ = t ■ x„, n e N, neboť pravděpodobnostní vektor xn+\ závisí pouze na xn a tato závislost je totožná jako pro x2 &x\. Ze vztahu (||3.6||) bezprostředně plyne (3.7) xn+x = t ■ t ■ xn-i = ■ ■■ = t" ■ xx, n > 2, n e N. Proto vyjadríme t", n e N. Jedná se o Markovův proces, a tudíž je 1 vlastní číslo matice t. Druhé vlastní číslo 0,1 můžeme snadno získat, pokud si všimneme, že stopa (součet prvků na diagonále) 181 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET je rovna součtu všech vlastních čísel (každé vlastní číslo bereme tolikrát, jaká je jeho algebraická násobnost). Těmto vlastním číslům pak přísluší vlastní vektory Dostáváme tak T 2 1 \ /l 0 \ (2 1 x 1 1 -ij \o i/ioy yi -i tj. pro n € N je -G _\Hi ,;,„)■■ (i j,)"' 2 1 \ (V 0 \ /2 1 x 1 .1 -1/ \0 10""/ U -1 Dosazení 2 IV1 1 /l 1 .1 -l) " 3 U - a roznásobení dává 1/2+10- 2-2.10- , 3^1-10"" 1 + 2-10-"1' Odtud z (113.611) a (113.711) plyne /2 11 1 , jc„ i! =---, - H--, n € N. + V 3 6- 10" 3 6 - 10",' Zvláště vidíme, že pro velká n je pravděpodobnost úspěchu rc-tého pokusu blízká 2/3. □ 3.63. Dva hráči A, B hrají o peníze opakovaně jistou hru, která může skončit pouze vítězstvím jednoho z hráčů. Pravděpodobnost výhry hráče A je v každé jednotlivé hře p e [0,1 /2) a oba sází vždy (v libovolné hře) jen 1 Kč, tj. po každé hře s pravděpodobností p dá 1 Kč hráč B hráči A a s pravděpodobností 1 — p naopak 1 Kč dá hráč A hráči B. Hrají ovšem tak dlouho, dokud jeden z nich nepřijde o všechny peníze. Jestliže má hráč A na začátku x Kč a hráč B má y Kč, určete pravděpodobnost, že hráč A vše prohraje. Řešení. Tato úloha se nazývá Rumování hráče. Jedná se o speciální Markovův řetězec (viz také příklad Mlsný hazardér) s mnoha důležitými aplikacemi. Hledaná pravděpodobnost činí (3.8) Povšimněme si, jaká je tato hodnota pro konkrétní volby p,x,y. Kdyby hráč B chtěl mít téměř jistotu a požadoval, aby pravděpodobnost, že hráč A s ním prohraje 1 000 000 Kč, byla alespoň 0,999, potom stačí, aby měl 346 Kč, je-li p = 0,495 (či 1727 Kč, je-li p = 0,499). Proto je ve velkých kasinech možné, aby „vášniví" hráči mohli hrát téměř spravedlivé hry. □ 182 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET 3.64. Jirka má ve zvyku si každý večer zaběhat. Má tři trasy - krátkou, střední a dlouhou. Pokud si někdy zvolí krátkou trasu, následující den si to vyčítá a rozhodne se libovolně (tj. se stejnou pravděpodobností) pro dlouhou, nebo střední. Jestliže si v některý den zvolí dlouhou trasu, v následujícím dnu volí zcela libovolně jednu z tras. Pokud běžel středně dlouhou trasu, cítí se dobře a druhý den si se stejnou pravděpodobností vybere buď střední, nebo dlouhou. Předpokládejte, že takto běhá každý večer už velmi dlouhou dobu. Jak často volí krátkou a jak často dlouhou trasu? Jaká je pravděpodobnost, že si zvolí dlouhou trasu, když šiji zvolil přesně před týdnem? Řešení. Sejme se jedná o Markovův proces se třemi možnými stavy, a to volbami krátké, střední a dlouhé trasy. Toto pořadí stavů dává pravděpodobnostní matici přechodu / 0 0 l/3\ T = 1/2 1/2 1/3 . \l/2 1/2 1/3/ Stačí si uvědomit, že např. druhý sloupec odpovídá volbě střední trasy v minulém dnu, která znamená, že s pravděpodobností 1/2 bude opět zvolena střední trasa (druhý řádek) a s pravděpodobností 1/2 bude zvolena dlouhá trasa (třetí řádek). Neboť je /1/6 1/6 l/9\ T2 = 5/12 5/12 4/9 , \5/12 5/12 4/9/ můžeme využít důsledků Perronovy-Frobeniovy věty pro Markovovy procesy. Není obtížné vypočítat, že vlastním vektorem, který přísluší vlastnímu číslu 1 a který je pravděpodobnostní, je právě 1 3 3X 7 J 7 7/ Hodnoty 1/7, 3/7, 3/7 pak udávají po řadě pravděpodobnosti, že v náhodně určeném dnu volí trasu krátkou, střední, dlouhou. Nechť si Jirka v jistý den (v čase n e N) vybere dlouhou trasu. Tomuto rozhodnutí odpovídá pravděpodobnostní vektor xn = (0, 0, l)r . Pro následující den tedy platí / 0 0 xn+l = 1/2 1/2 \l/2 1/2 až po sedmi dnech je Vyčíslením dostáváme jako složky xn+1 hodnoty 0,142 861225...; 0,428 569 387...; 0,428 569 387.... Tedy pravděpodobnost, že zvolí dlouhou trasu za podmínky, že si ji zvolil před sedmi dny, činí přibližně 0,428 569 ^ 3/7 = 0,428 571. □ 3.65. V rámci jisté společnosti fungují dvě navzájem si konkurující oddělení. Vedení společnosti se rozhodlo, že každý týden bude poměřovat relativní (vzhledem k počtu zaměstnanců) zisky dosažené těmito dvěma odděleními. Do oddělení, které bude úspěšnější, pak budou přeřazeni dva pracovníci 183 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET z druhého oddělení. Tento proces má probíhat tak dlouho, až jedno z oddělení zanikne. Získali jste zaměstnání v této společnosti a můžete si vybrat jedno z těchto dvou oddělení, kde budete pracovat. Chcete si zvolit to, které nebude v důsledku vnitropodnikové konkurence zrušeno. Jaká bude Vaše volba, když jedno oddělení má nyní 40 zaměstnanců, druhé 10 a když odhadujete, že to v současnosti 3.66. Student na koleji je značně společensky unaven (v důsledku toho není schopen plně vnímat smyslové podněty a koordinovat své pohyby). V tomto stavu se přesto rozhodne, že na právě probíhající večírek pozve známou, která má pokoj na jednom konci chodby. Na opačném konci chodby však bydlí někdo, koho pozvat rozhodně nehodlá. Je ovšem natolik „unaven", že rozhodnutí udělat krok zvoleným směrem se mu podaří realizovat pouze v 53 ze 100 pokusů (ve zbylých 47 jde přesně na opačnou stranu). Za předpokladů, že vyjde v polovině chodby a že vzdálenost k oběma dveřím na koncích chodby odpovídá jeho 20 krokům, stanovte pravděpodobnost, že nejdříve dorazí ke správným dveřím. O 3.67. Nechť n e N osob hraje tzv. tichou poštu. Pro jednoduchost předpokládejte, že první osoba zašeptá druhé právě jedno (libovolně zvolené) ze slov „ano", „ne". Druhá osoba pak potichu řekne třetí osobě to ze slov „ano", „ne", o kterém si myslí, že ho řekla první osoba. Takto to pokračuje až k íí-té osobě. Jestliže pravděpodobnost toho, že při libovolném předání se zamění (nechtě, úmyslně) šířené slovo na to druhé, je p e (0,1), stanovte pro velká n e N pravděpodobnost, že n-tá osoba určí správně slovo zvolené první osobou. Řešení. Na tuto úlohu lze nahlížet jako na Markovův řetězec se dvěma stavy nazvanými Ano a Ne, kdy řekneme, že proces je ve stavu Ano v čase m e N, pokud si m-tá osoba bude myslet, že předávané slovo je „ano". Pro pořadí stavů Ano, Neje pravděpodobnostní matice přechodu Součin matice Tm_1 a pravděpodobnostního vektoru počáteční volby první osoby potom udává pravděpodobnosti toho, co si bude myslet m-tá osoba. Mocniny této matice ovšem počítat nemusíme, neboť všechny prvky matice T jsou kladná čísla. Navíc tato matice je dvojnásobně stochastická. Víme tudíž, že pro velká n e N bude pravděpodobnostní vektor blízký vektoru (1 /2,1 /2)T. Pravděpodobnost, že n-tá osoba řekne „ano", je proto přibližně stejná jako pravděpodobnost, že řekne „ne", a to nezávisle na tom, pro které slovo se rozhodla první osoba. Pro velký počet zúčastněných tak platí, že zhruba polovina z nich uslyší „ano" (zopakujme, že nezávisle na tom, které slovo bylo na začátku vybráno). Pro úplnost zjistěme, jak by úloha dopadla, kdybychom předpokládali, že pravděpodobnost záměny „ano" na „ne" je u libovolné osoby p e (0, 1) a pravděpodobnost záměny „ne" na „ano" je obecně odlišné q e (0, 1). V tomto případě pro stejné pořadí stavů dostáváme pravděpodobnostní matici přechodu menší z nich bude mít větší relativní zisky v 54 % případů? O která vede (pro velká neN)k pravděpodobnostnímu vektoru blízkému vektoru 184 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET což kupř. plyne z vyjádření matice p + q l\P P J \-P 1 Rovněž tentokrát při dostatečném počtu lidí nezáleželo na volbě slova, kterou učinila první osoba. Stručně řečeno, v tomto modelu platí, že nezáleží na původním rozhodnutí, protože o tom, jakou informaci si lidé předávají, rozhodují oni sami; přesněji řečeno, lidé sami rozhodují o četnosti výskytu „ano" a „ne", pokud je jich dostatečný počet (a chybí-li jakékoli ověřování). Doplňme ještě, že výše uvedený závěr byl experimentálně ověřen. V psychologických pokusech byl mj. jedinec opakovaně vystaven vjemu, který šlo vnímat dvěma různými způsoby, a to v časových intervalech zaručujících, aby si subjekt pamatoval předešlý vjem. Viz např. „T. Havránek a kol.: Matematika pro biologické a lékařské vědy, Praha, Academia 1981", kde je uveden experiment, v němž je zábleskem osvětlován v pevných časových odstupech nejednoznačný obraz (třeba náčrt krychle vnímatelný jako nadhled i podhled). Takový proces je totiž Markovovým řetězcem s maticí přechodu 1 - P 1 P 1 - í kde p, q e (0,1). □ 3.68. V jisté hře si můžete vybrat jednoho ze dvou soupeřů. Pravděpodobnost, že porazíte lepšího, je 1/4, zatímco horšího ze soupeřů porazíte s pravděpodobností 1/2. Soupeři ale nejsou rozlišeni, a tak nevíte, který z nich je ten lepší. Čeká Vás velké množství her (pro každou můžete zvolit jiného soupeře) a samozřejmě chcete dosáhnout celkově co největšflio podílu vítězných her. Uvažte tyto dvě strategie: 1. Pro první hru si vyberete soupeře náhodně. Pokud nějakou hru vyhrajete, pokračujete se stejným soupeřem; jestliže ji prohrajete, změníte pro další hru soupeře. 2. Pro první dvě hry si vyberete (jednoho) soupeře náhodně. Dále se řídíte výsledkem předchozích dvou her, kdy na další dvě hry změníte soupeře, právě když obě předchozí prohrajete. Kterou ze strategií (moudře) zvolíte? Řešení. Obě strategie jsou vlastně Markovovým řetězcem. Pro jednoduchost horšího ze soupeřů označujme jako osobu A a lepšího ze soupeřů jako osobu B. V prvním případě pro stavy „hra s osobou A", „hra s osobou S" (a toto jejich pořadí) dostáváme pravděpodobnostní matici přechodu 1/2 3/4 1/2 1/4 Tato matice má všechny prvky kladné, a proto stačí najít pravděpodobnostní vektor xx, který přísluší vlastnímu číslu 1. Platí _ /3 2xT Xco~ \5' 5 Jeho složky odpovídají pravděpodobnostem, že po dlouhé řadě her bude soupeřem osoba A, resp. B. Lze tedy očekávat, že 60 % her bude hráno proti horšímu ze soupeřů. Neboť 2 _ 3 1 2 1 5 ~ 5 ' 2 + 5 ' 4' vítězných her bude kolem 40 %. 185 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Pro druhou strategii zavedme stavy „dvě hry po sobě s osobou A" a „dvě hry po sobě s osobou B", které vedou na pravděpodobnostní matici přechodu 3/4 9/16 1/4 7/16 Snadno určíme, že nyní je 9_ 4_ 13' 13, Proti horšímu ze soupeřů by se tak hrálo (9/4)-krát častěji než proti lepšímu z nich. Připomeňme, že pro první strategii to bylo (3/2)-krát častěji. Druhá strategie je proto výhodnější. Ještě poznamenejme, že při druhé strategii bude přibližně 42,3 % her vítězných. Stačí totiž vyčíslit 11 — 2. 1 _l_ ± 1 26 — 13 ' 2 13 ' 4- 0 423 = 11 = 2.. l + ±.l □ 3.69. Petr se pravidelně setkává se svým kamarádem. Je ovšem „proslulý" svou nedochvilností. Snaží se ale změnit, a proto platí, že v polovině případů přijde včas a v jedné desetině případů dokonce ještě dříve, pokud na minulé setkání přišel pozdě. Jestliže minule přišel včas nebo dříve, než měl přijít, vrátí se ke své „bezstarostnosti" a s pravděpodobností 0,8 dorazí pozdě a pouze s pravděpodobností 0,2 včas. Jaké je pravděpodobnost, že na dvacáté setkání přijde pozdě, když na jedenácté přišel včas? Řešení. Zřejmě se jedná o Markovův proces se stavy ,J?etr přijde pozdě", „Petr přijde včas", „Petr přijde dříve" a s pravděpodobnostní maticí přechodu (pro uvedené pořadí stavů) /0,4 0,8 0,8\ t = 0,5 0,2 0,2 . \0,1 0 0 / Jedenácté setkání je určeno pravděpodobnostním vektorem (0,1, 0)r (s jistotou víme, že Petr přišel včas). Dvacátému setkání pak odpovídá pravděpodobnostní vektor 0,571 578 368\ 0,371316224 . 0,057 105 408/ Hledaná pravděpodobnost je tudíž 0,571 578 368 (přesně). Dodejme, že je /0,571 316224 0,571578 368 0,571578 368\ t9 = 0,371512832 0,371316224 0,371316224 . \0,057 170944 0,057105 408 0,057105 408/ Odtud vidíme, jak málo záleží na tom, zda přišel na jedenácté setkáni pozdě (první sloupec), včas nebo dříve (druhý a současně třetí sloupec). □ 3.70. Dva studenti A a S tráví každé pondělní odpoledne hraním jisté počítačové hry o to, kdo z nich večer zaplatí společnou útratu v restauraci. Hra může rovněž skončit remízou, kdy večer oba platí právě polovinu útraty. Výsledek předešlé hry částečně ovlivňuje hru následující. Pokud tedy před týdnem vyhrál student A, potom s pravděpodobností 3/4 vyhraje opět a s pravděpodobností 1 /4 skončí hra remízou. Remíza se opakuje s pravděpodobností 2/3 a s pravděpodobností 1/3 vyhraje ve hře následující po remíze student B. Pokud před týdnem vyhrál student B, pak s pravděpodobností 1/2 své vítězství zopakuje a s pravděpodobností 1 /4 vyhraje student A. Nalezněte pravděpodobnost, že dnes bude každý platit polovinu útraty, jestliže první hru před velmi dlouhou dobou vyhrál student A. 186 KAPITOLA 3. LINEÁRNI MODELY A MATICOVÝ POČET Řešení. Vlastně je zadán Markovův proces se stavy „vyhraje student A", „hra skončí remízou", „vyhraje student B" (v tomto pořadí) pravděpodobnostní maticí přechodu /3/4 0 l/4\ T = 1/4 2/3 1/4 . V 0 1/3 1/2/ Chceme najít pravděpodobnost přechodu z prvního stavu do druhého po velkém počtu n e N kroků (týdnů). Matice T je primitivní, protože /9/16 1/12 5/16 \ T2 = 17/48 19/36 17/48 . \ 1/12 7/18 1/3 / Stačí tak najít vlastní pravděpodobnostní vektor xx matice T příslušný vlastnímu číslu 1. Snadno lze spočítat, že v7 7 7, Víme, že vektor xx se jen velmi málo liší od pravděpodobnostního vektoru pro velká n a téměř nezávisí na počátečním stavu, tj. pro velká n e N můžeme klást (2/1 2/1 2/l\ T" & 3/7 3/7 3/7 . \2/l 2/1 2/1/ Hledaná pravděpodobnost je prvkem této matice na druhé pozici v prvním sloupci (je druhou složkou vektoru x^). Poměrně rychle jsme nalezli výsledek 3/7. □ 3.71. Adam, Bedřich a Čeněk si házejí balónem. Adam jej s pravděpodobností \ hodí Čeňkovi, s pravděpodobností \ Bedřichovi. Bedřich jej s pravděpodobností \ hodí Adamovi a s pravděpodobností | Čeňkovi. Konečně Čeněk jej hodí s pravděpodobností \ Adamovi a s pravděpodobností \ Bedřichovi. Sestavte matici tohoto Markovova procesu a určete, s jakou pravděpodobností se míč bude nacházet po velkém počtu hodů u Bedřicha (každý potřebuje stejný čas na odhození balónu). O 3.72. Sheldon a Leonard si hážou balónem přes síť. Pravděpodobnost, že Sheldon dokáže přehodit síť jsou 3/5 (s pravděpodobností 2/5 zůstane míč na jeho straně). Pravděpodobnost, že Leonard přehodí síť jsou 4/5 (s pravděpodobností 1 /5 zůstane míč na jeho straně). Jaká je pravděpodobnost, že po velkém počtu pokusů obou pánů bude míč na Sheldonově straně? Formulujte úlohu jako Markovův proces a uvedte jeho matici. O 3.73. Ukažte, že symetrická matice /O 1 ... 0 0\ 1 0 ... 0 0 0 0 ... 0 1 \0 0 ... 1 0/ má vlastní hodnoty Xt = cos resP-^3 ij ' vlastní vektor příslušný vlastní hodnotě 1 je (1, 4/3), resp. (4/3, 1), hledaná pravděpodobnost 4/7. 190 KAPITOLA 4 Analytická geometrie poloha, incidence, projekce? - a zase skončíme u matic... A. Afinní geometrie 4.1. Napište parametrické vyjádření přímky určené v K3 rovnicemi x 2x - 2y + y + z — z Řešení. Zrejmé postačuje vyřešit uvedenou soustavu rovnic. Jde o dvě lineární rovnice o třech neznámých. Jejím řešením je jednoparametrický systém (x, y, z) = (t, 3t — 7, 5/ — 12), což je již hledané parametrické vyjádření. Můžeme ale postupovat také odlišně. Potřebujeme totiž najít nenulový (směrový) vektor, který bude kolmý na (normálové) vektory (1, —2,1), (2, 1, —1). Ten můžeme najít jednak vyřešením soustavy rovnic X\ — 2X2 + x3 = 0, 2x\ + X2 — x3 = 0 vystihující, že skalární součin hledaného vektoru (x\, x2, x3) s vektory (1, —2,1) i (2, 1, —1) bude nulový (jde o zhomogenizovaný původní systém). Řešením je jednoparametrický systém kolmých vektorů (/, 3t, 5t). Vektor (x\, x2, x3) můžeme také určit přímo, pomocí Vrátíme se teď k našemu pohledu na geometrii, když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.23. Budeme se nejprve zajímat o vlastnosti prostorových objektů vymezených pomocí bodů, přímek, rovin apod. Podstatné přitom bude vyjasnění, jak jejich vlastnosti souvisí s pojmem vektorů a zda závisí na pojmu velikosti vektorů. V další části pak použijeme lineární algebru pro studium objektů, které už lineárně definované nejsou. Opět přitom budeme potřebovat trochu více maticového počtu. Výsledky budou důležité později při diskusi technik pro optimalizace, tj. hledání extrémů funkčních hodnot. Projektivní rozšíření afinních prostorů nám v závěru kapitoly ukáže, jak lze překvapivě snadno dosáhnout zjednodušení i stability algoritmických postupů typických pro práci s počítačovou grafikou. 1. Afinní a euklidovská geometrie Když jsme si ujasňovali strukturu řešení systémů lineárních rovnic v první části předchozí kapitoly, zjistili jsme l 7 v odstavci 3.1, že všechna řešení nehomogenních sys-~~. témů rovnic sice netvoří vektorové podprostory, vždy ale vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je vždy řešením soustavy homogenní. Obdobně se chovají lineární diferenční rovnice, jak jsme již viděli v odstavci 3.14. 4.1. Afinní prostory. Návod na teoretické uchopení takové situace dává již diskuse geometrie roviny, viz odstavec 1.25 a dále. Tam jsme totiž popisovali přímky a body jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla jednorozměrným" prostorem, přestože její body byly popisovány dvěma souřadnicemi. Parametricky jsme ji zadá vah tak, že k jednomu bodu (tj. dvojici souřadnic) jsme přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i teď v libovolné dimenzi. ____| Standardní afinní prostor |_ - Standardní afinní prostor A„ je množina všech bodů vl" — An spolu s operací, kterou k bodu A — (a\, ..., an) e A„ a vektoru v = (uj, ..., vn) e R™ = V přiřadíme bod A + v = (ai + vi, ..., an + vn) e R" = A„. Tyto operace splňují následující tři vlastnosti: (1) A + 0 = A pro všechny body A e A„ a nulový vektor 0 e V, (2) A + (v + w) — (A + v) + w pro všechny vektory v, w e V a body A e A„, KAPITOLA 4. ANALYTICKÁ GEOMETRIE tzv. vektorového součinu (viz 4.24): (1, -2, 1) x (2, 1, -1) = (1,3,5). Všimneme-li si navíc, že např. uspořádaná trojice {x, y, z) = (2,-1,-2) vyhovuje dané soustavě, dostaneme výsledek [2,-1,-2] +r (1,3, 5), r e K. Čtenář jistě postřehl, že alternativní postup pouze geometricky interpretoval řešení nehomogenní lineární soustavy rovnic. □ 4.2. V K4 je parametricky dána rovina q : [0, 3, 2, 5] + t (1, 0, 1, 0) + s (2, -1, -2, 2), t, s e K. Vyjádřete tuto rovinu implicitně. Řešení. Úkolem je najít soustavu lineárních rovnic čtyř proměnných x,y,z,u (čtyři proměnné jsou dány dimenzí prostoru), jíž budou vyhovovat právě souřadnice bodů uvedené roviny. Poznamenejme, že hledaná soustava bude obsahovat 2 = 4 — 2 lineárně nezávislé rovnice. Příklad vyřešíme tzv. eliminací parametrů. Body [x, y, z,u] e q splňují t + 2s, 3 -s, 2 + t - 2s, 5 + 2s, (3) pro každé dva body A, B e A„ existuje právě jeden vektor v e V takový, že A + v = B. Značíme jej v — B — A, někdy také AB. Vektorový prostor W nazýváme zaměření standardního afinního prostoru A„. Všimněme si několika formálních nebezpečí. Používáme "j^jň, stejný symbol „+" pro dvě různé operace: přičtení vektoru ze zaměření k bodu v afinním prostoru, ale S5Ssfc4^? také sčítání vektorů v zaměření V = M". Také nezavádíme zvláštní písmena pro samotnou množinu bodů afinního prostoru, tj. A„ pro nás představuje jak samotnou množinu bodů, tak i celou strukturu definující afinní prostor. Proč vlastně chceme rozlišovat množinu bodů prostoru A„ od jeho zaměření V, když se jedná jakoby o stejné M"? Jde o velice podstatný formální krok k pochopení geometrie v W: Geometrické objekty jako přímky, body, roviny apod. nejsou totiž přímo závislé na vektorové struktuře na množině M" a už vůbec ne na tom, že pracujeme s n-ticemi skalárů. Potřebujeme jen umět říci, co to znamená pohybovat se „rovně v daném směru". K tomu právě potřebujeme na jedné straně vnímat třeba rovinu jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme umět diskutovat „rovinnou geometrii" pro dvourozměrné podprostory, tj. roviny ve vícerozměrných prostorech, „prostorovou" pro třírozměrné atd., aniž bychom museli přímo manipulovat &-ticemi souřadnic. Tento pohled je zachycen v následující definici: 4.2. Definice. Afinním prostorem A se zaměřením V rozumíme množinu bodů V, spolu se zobrazením V x V - (A, v) i kde V je vektorový prostor a naše zobrazení splňuje vlastnosti (l)-(3) z definice standardního afinního prostoru. Pro libovolný pevně zvolený vektor v e V je tak definováno posunutí rv : A -» A jako zúžené zobrazení r,:P~Px|»|^P, A i-» A + v. přičemž t,s el. Odtud můžeme ihned přejít k maticovému zápisu Dimenzí afinního prostoru A rozumíme dimenzi jeho zaměření. /1 2 -1 0 0 0 0 \ 0 -1 0 -1 0 0 3 1 -2 0 0 -1 0 2 2 0 0 0 -1 5 / kde první dva sloupce jsou směrové vektory roviny, za svislou čarou následuje záporně vzatá jednotková matice a za druhou svislou čarou jsou souřadnice bodu [0, 3, 2, 5]. Tento přepis vzniká tak, že na výše uvedenou soustavu rovnic nahlížíme jako na soustavu rovnic pro neznámé t,s,x,y,z,u a všechny členy přitom převádíme na jednu stranu rovnic. Získanou matici převedeme pomocí elementárních řádkových transformací do tvaru, kdy před první svislou čarou bude maximální možný počet nulových řádků. Přičtením (— l)-násobku prvního Nadále nebudeme rozlišovat ve značení důsledně množinu bodů A a množinu vektorů V, budeme místo toho hovořit o bodech a vektorech afinního prostoru A. Z axiomů okamžitě plyne pro libovolné body A, B, C v afinním prostoru A (4.1) A - A = 0 e V, (4.2) B — A — —(A — B), (4.3) (C - B) + (B - A) = C - A. Skutečně, (4.1) vyplývá z toho, že A + 0 = 0 a takový vektor musí být jednoznačný (první a třetí definiční vlastnost). Postupným přičtením 5 — AaA — 5kA(v uvedeném pořadí), zjevně dostaneme podle druhé definiční vlastnosti opět A, tedy jsme přičetli nulový vektor a to dokazuje (4.2). Obdobně z definiční vlastnosti 4.1 (2) a jednoznačnosti vyplývá (4.3). 192 KAPITOLA 4. ANALYTICKÁ GEOMETRIE a současně (—4)-násobku druhého řádku ke třetímu řádku a dvojnásobku druhého ke čtvrtému řádku dostáváme /1 2 -1 0 0 0 0 \ 0 -1 0 -1 0 0 3 1 -2 0 0 -1 0 2 1° 2 0 0 0 -1 5 ) /1 2 -1 0 0 0 0 0 -1 0 -1 0 0 3 0 0 1 4 -1 0 -10 1° 0 0 -2 0 -1 11 ) Odkud plyne výsledek x + 4y -2y 10: 11 : 0, 0. Koeficienty za první svislou čarou v řádcích, které jsou před touto svislou čarou nulové, určují totiž koeficienty obecných rovnic roviny. Upozorněme, že kdybychom např. přepsali soustavu rovnic do matice /1 0 0 0 1 2 0 \ 0 1 0 0 0 -1 3 0 0 1 0 1 -2 2 v° 0 0 1 0 2 5 / která odpovídá situaci, kdy proměnné x, y,z,u zůstávají na levé straně rovnic, totožná úprava / 1 0 0 0 1 2 0 \ / 0 1 0 0 0 -1 3 0 0 10 1-22 \00010 2 5/ \ 0 dává výsledek ve tvaru —x — 4y + z 2y 0 o o o -10, 11. 2 -1 0 0 o 3 -10 11 Při přepisování soustavy do matice je tudíž nutné zohledňovat, zda svislá čára odděluje levou stranu rovnic od pravé (či nikoliv). Jak jsme částečně viděli v tomto přikladu, metoda eliminace parametrů může být zdlouhavá a při jejím použití se lze snadno dopustit chyb. Jiné řešení. Řešení můžeme do značné míry urychlit naší „šikovností*'. Pokud si všimneme, že dva lineárně nezávislé normálové vektory, tj. vektory kolmé na vektory (1, 0, 1, 0), (2, —1, —2, 2). jsou např. (0, 2, 0, 1), (-1, 0,1, 2), dosazením x = 0, y = 3, z = 2, u = 5 do rovnic + u = fl, z + 2u = b 12, následně hledané implicitní vy- bychom obdrželi a jádření 2y 11, b 2y + + u 2u 11, 12. Všimněme si, že volba jednoho pevného bodu Ao e A nám určuje bijekci mezi V a A. Při volbě pevné báze u ve V tak dostáváme pro každý bod A e A jednoznačné vyjádření A = Ao +x\u\ H-----hxnun. Hovoříme o afinní soustavě souřadnic (Ao; u\, ..., u„) zadané počátkem afinní souřadné soustavy Ao a bází zaměření u nebo také o afinním repéru (Ao, u). Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě (Ao, u) jsou souřadnicemi vektoru A — Ao v bázi u zaměření V. Volba afinního souřadného systému ztotožňuje jakýkoliv n-rozměrný afinní prostor A se standardním afinním prostorem A„. 4.3. Afinní podprostory. Jestliže si vybereme v A jen body, (, jsuja které budou mít některé předem vybrané souřadnice nulové (třeba poslední jednu). Dostaneme opět množinu, která se bude chovat jako afinní prostor. -fer*i^J-i.^ Takto budeme skutečně parametricky popisovat tzv. afinní podprostory ve smyslu následující definice. __\ Podprostory afinního prostoru - Definice. Neprázdná podmnožina Q c A afinního prostoru A se zaměřením V se nazývá afinnípodprostor v A, je-li podmnožina W = {B — A; A, B e Q) c V vektorovým podprostorem a pro libovolné AeQ,veWjeA + veQ. □ Je podstatné mít obě podmínky zahrnuty v definici, protože je snadné najít příklady podmnožin, které budou splňovat první, ale nikoliv druhou podmínku. Přemýšlejte např. o přímce v rovině s vyjmutým jedním bodem. Pro libovolnou množinu bodů M c A v afinním prostoru se zaměřením V definujeme vektorový podprostor Z(M) = {{B - A; B, A e M}} c V všech vektorů generovaných rozdíly bodů z M. Zejména je V = Z(A) a každý afinní podprostor Q c A splňuje sám axiomy afinního prostoru se zaměřením Z(Q). Přímo z definic je také zřejmé, že průnik libovolné množiny afinních podprostorů je buď opět afinní podprostor nebo prázdná množina. Afinní podprostor (M) v A generovaný neprázdnou podmnožinou M c A je průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M. __| Afinní obal a parametrický popis podprostorů Afinní podprostory si můžeme pěkně popsat pomocí jejich zaměření, jakmile si zvolíme jeden jejich bod Ao e M v generující množině bodů M. Skutečně, dostáváme (M) = {A0 + v; v e Z(M) c Z(A)}, tj. pro generování afinního podprostorů vezmeme vektorový podprostor Z(M) v zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M v A. Naopak, kdykoliv zvolíme podprostor U v zaměření Z (A) a jeden pevný bod A e A, pak podmnožina A + U vzniklá všemi možnými součty jediného bodu A se všemi vektory v U je afinní 193 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.3. Nalezněte parametrické vyjádření roviny procházející body A = [2, 1,1], S = [3,4,5], C = [4,-2,3]. podprostor. Takový postup vede k pojmu parametrizace podpro-storů: Nechť Q = A+Z(Q) je afinní podprostor v A„ a(«i, ..., uk) je báze Z(Q) c W. Pak vyjádření podprostoru Q = {A + tiu\ H-----Ytkuk\t\,...,tk 6 K) j nazýváme parametrický popis podprostoru Q. Již jsme viděli jinou možnost zadávání afinních podprostoru: Jestliže máme zvoleny afinní souřadnice, pak lze zaměření podprostoru popsat pomocí homogenního systému lineárních rovnic v těchto souřadnicích. Dosazením souřadnic jednoho bodu našeho podprostoru Q do získaného systému rovnic dostaneme pravou stranu nehomogenního systému se stejnou maticí a celý podprostor Q je pak právě množinou řešení tohoto systému. Zadání podprostoru Q systémem rovnic v daných souřadnicích nazýváme implicitní popis podprostoru Q. Následující obecná věta říká, že takto umíme ve skutečnosti zadat všechny afinní podprostory a tím také ukazuje geometrickou podstatu vlastností množiny všech řešení systémů lineárních rovnic. 4.4. Věta. Nechť(Ao; u) je afinní souřadný systém v n-rozměrném afinním prostoru A. Afinní podprostory dimenze k v A, vyjádřené v daných souřadnicích, jsou právě množiny řešení řešitelných systémů n — k lineárně nezávislých lineárních rovnic v n proměnných. Důkaz. Uvažujme libovolný řešitelný systém n — k lineárně nezávislých rovnic ai(x) — bi, bi e R, i = 1, ..., n — k. Je-li A — (a\,..., an)T e M." libovolné pevně zvolené řešení tohoto (nehomogenního) systému rovnic a je-li U c W vektorový podprostor všech řešení zhomogenizovaného systému a, (x) — 0, pak dimenze U je k a podmnožina všech řešení daného systému je tvaru {B; B = A + (yi, .... ynf', y = (yi ..., ynf eí/|c W, viz 3.1. Příslušný afinní podprostor je tím popsán parametricky ve výchozích souřadnicích (Ao; u). Naopak, uvažme libovolný afinní podprostor Q c A„ a zvolme nějaký jeho bod B za počátek afinního souřadného systému (B, v) pro afinní prostor A. Protože Q — B + Z (Q), potřebujeme popsat zaměření podprostoru Q jako podprostor řešení homogenního systému rovnic. Zvolme tedy bázi v na Z (A) tak, aby prvních k vektorů tvořilo bázi Z(Q). Pak v těchto souřadnicích jsou vektory v e Z(Q) dány rovnostmi aj(v)=0, j = k + 1, ..., n, kde a, j sou lineární formy z tzv. duální báze k v, tj. funkce přiřazení jednotlivých souřadnic v naší bázi v. Náš vektorový podprostor Z(Q) dimenze k v n-rozměrném prostoru W je tedy skutečně dán jako řešení homogenního systému n — k nezávislých rovnic. Popis zvoleného afinního podprostoru v námi nově vybraném souřadném systému (B; v) je proto dán systémem homogenních lineárních rovnic. Zbývá nám se vypořádat důsledky přechodu z původního zadaného souřadného systému (A; u) do našeho přizpůsobeného (B; v). Z obecné úvahy o transformacích souřadnic v následujícím odstavci vyplyne, že výsledný popis podprostoru bude opět pomocí systému rovnic, tentokrát ale už obecně nehomogenních. □ Poté parametricky vyjádřete otevřenou polorovinu obsahující bod C a vymezenou přímkou zadanou body A, B. Řešení. K parametrickému vyjádření roviny potřebujeme jeden bod ležící v této rovině a dva směrové (lineárně nezávislé) vektory. Stačí zvolit bod A a vektory B-A = (l,3,4)aC-A =(2,-3,2), které jsou očividně lineárně nezávislé. Bod [x, y, z] náleží do dané roviny právě tehdy, když existují čísla t,s el, pro která je x = 2+1-t+ 2-s, y = l + 3-/-3-í, z=1+4-/ + 2-í; tj. hledané parametrické vyjádření roviny je [2, 1, 1] + t (1, 3, 4) + s (2, -3, 2), t, s e K. Volba s = 0 zjevně dává přímku, která prochází body A, B. Pro t = 0, s > 0 dostáváme polopřímku začínající v bodě A a procházející bodem C. Libovolně pevně zvolené / e K a měnné s > 0 pak zadávají polopřímku s počátkem na hraniční přímce a s body v polorovině, ve které se nachází bod C. To znamená, že hledanou otevřenou polorovinu můžeme vyjádřit parametricky takto [2, 1,1]+ t (1,3,4) + s (2, -3,2), íel,s >0. □ 4.4. Určete vzájemnou polohu přímek p : [1,0, 3]+1 (2,-1,-3), r e K, q : [1,1, 3]+í (1,-1,-2), í e K. Řešení. Hledejme společné body zadaných přímek (průnik podprostoru). Dostáváme soustavu 1 + 2t = 1 + s, 0 - t = 1 - s, 3 - 3t = 3 - 2s. Vyřešením prvních dvou rovnic vzhledem k neznámým saí získáme hodnoty / = 1, s = 2. Ty ovšem nevyhovují třetí rovnici. Soustava tak nemá řešení. Protože směrový vektor (2, —1, —3) přímky p není násobkem směrového vektoru (1, —1, —2) přímky q, přímky nejsou rovnoběžné. Jedná se proto o mimoběžky. □ 4.5. Pro jaká čísla a e K jsou přímky p : [4, -4, 8]+ t (2, 1,-4), r e K, q : [a, 6, -5] + s (1,-3,3), s e R, různoběžné? 194 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Řešení. Přímky jsou různoběžné tehdy a jenom tehdy, když má soustava 4 + 2t = a + s, -4 + t = 6 - 3s, 8 - 4t = -5 + 3s právě 1 řešení. V maticovém zápisu řešíme (první sloupec odpovídá proměnné /, druhý pak s) 2 -1 fl-4 \ ( 1 3 10 \ 1 3 10 ~ 2 -1 a-4 -4 -3 -13 ) V -4 -3 -13 ) fl 3 10 \ 0 -7 a-24 x 0 1 Vidíme, že soustava má právě 1 řešení tehdy a jenom tehdy, když je druhý řádek násobkem třetího. To je splněno pouze pro a = 3. Dodejme, že průsečíkem je v tomto případě bod [6, —3,4]. □ 4.6. V K3 stanovte vzájemnou polohu přímky p zadané implicitně rovnicemi x + y — z = 4, x - 2y + z = -3 a roviny q : y = 2x — 1. Řešení. Normálový vektor q je (2, — 1,0) (uvažte zápis q : 2x — y + Oz = 1). Lze postřehnout, že platí (1,1,-1)+ (1,-2, 1) = (2,-1,0), tj. že normálový vektor roviny q je lineární kombinací normálových vektorů p. Zaměření přímky (zadané nenulovým směrovým vektorem kolmým na uvedené dva normálové vektory) je proto podprostorem zaměření roviny q (směrový vektor přímky je nutně kolmý na vektor (2, — 1, 0)). Lehce jsme zjistili, že přímka p je rovnoběžná s rovinou q. Zajímá nás, zda se protínají (zda p leží v q). Soustava rovnic x + y - z = 4, x - 2y + z = -3, 2x — y =1 má nekonečně mnoho řešení, neboť sečtením prvních dvou rovnic dostaneme právě třetí z rovnic. Přímka p tak musí ležet v rovině q. □ Následuje standardní příklad na průnik vektorových prostorů. Čtenář by měl být schopen následující příklad vyřešit. Doporučujeme nepokračovat ve čtení této učebnice, 1 dokud tomu tak nebude. 4.5. Transformace souřadnic. Dvě libovolně zvolené afinní soustavy souřadnic (Ao,u), (Bq,v) se obecně liší posunutím počátku o vektor (Bq — Ao) a jinou bází zaměření. Transformační rovnice mezi příslušnými souřadnicemi tedy vyčteme ze vztahu pro obecný bod X e A X = Bo + x\v\ H-----hx'nvn = = Bo + (Ao - -Bo) + x\u\ H-----hxnun. Označme y — (y\, ..., yn)T sloupec souřadnic vektoru (Ao — Bo) v bázi v a M = (ay) buď matice vyjadřující bázi u prostřednictvím báze i). Potom xx = y\ +011*1 + • - a\nxn an\x\ tj. maticově x — y + M ■ x. Jako příklad si můžeme vyjádřit dopad takové změny báze na ^i' souřadné vyjádření podmnožin pomocí systémů lineárních rfjj^ rovnic. Nechť má v souřadnicích (Ao; u) náš systém rovnic r-viji^ tvar 1' 5 • x = b s maticí systému 5. Potom S-x = S- AT1 -(y + M-x)-S- AT1 ■ y = b. Proto v nových výše uvažovaných souřadnicích (Bq ; v) bude mít náš systém rovnic tvar (5 • M~l) ■ x' = b' = b + (5 • AT1) ■ y. Pokud tedy máme nějakou podmnožinu popsánu systémem lineárních rovnic v jednom afinním repéru, pak tomu tak bude i ve všech ostatních afinních souřadných systémech. To plně dokončuje důkaz předchozí věty. 4.6. Příklady afinních podprostorů. (1) Jednorozměrný (standardní) afinní prostor je množina všech bodů reálné přímky A\. Její zaměření je jednorozměrný vektorový prostor R (a nosná množina také M). Afinní souřadnice dostaneme volbou počátku a měřítka (tj. báze ve vektorovém prostoru M). Všechny vlastní afinní podpro-story jsou 0-rozměrné, jsou to právě všechny body reálné přímky M. (2) Dvourozměrný (standardní) afinní prostor je množina všech bodů prostoru Ai se zaměřením M?. (Nosnou množinou je R2.) Afinní souřadnice dostaneme volbou počátku a dvou nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body a přímky v rovině (0-rozměrné a 1-rozměrné). Přímky přitom jednoznačně zadáme jejich jedním bodem a jedním generátorem zaměření (tzv. parametrický popis přímky). (3) Trojrozměrný (standardní) afinní prostor je množina všech bodů prostoru ^3 se zaměřením R3. Afinní souřadnice dostaneme volbou počátku a tří nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body, přímky a roviny (0-rozměrné, 1-rozměrné a 2-rozměrné). (4) Podprostor všech řešení jedné lineární rovnice a ■ x — b pro 195 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.7. Nalezněte průnik podprostorů Q\ a Q2, je-li Qi : [4, -5, 1, -2] + /! (3, 5, 4, 2) + r2 (2,4, 5, 1) + r3 (0, 3, 1, 2), Q2 : [4, 4, 4, 4] + Sl (0, -6, -2, -4) + í2 (-1, -5, -3, -3), kde t\, t2, t3, íi, í2 € K. Řešení. Bod Z = [x\, x2, x3, x4] e K4 náleží do Q \ n (?2 právě tehdy, když je ' 4 " /3\ (2\ /0\ x2 x3 = -5 1 + íi 5 4 + t2 4 5 + Í3 3 1 X4 -2 \V l2J pro nějaká čísla t\,t2,t3 e K a současně, když je x\ '4 f-l\ x2 x3 = 4 4 -6 -2 + s2 -5 -3 X4 4 \-4) pro nějaká si, s2 e K. Porovnáním získáváme (3\ (2\ fo\ (4-4\ f-l\ 5 4 3 4 + 5 -6 -5 h 4 + t2 5 + t3 1 — 4- 1 -2 + s2 -3 \V v) {4 + 2) Při maticovém zápisu (pro pořadí proměnných t\, t2, t3, s\, s2 a po převodu vektorů u si a s2 na levou stranu) řešme pomocí řádkových operací / 3 2 0 0 1 0 \ ( 3 2 0 0 1 0 \ 5 4 3 6 5 9 0 2 9 18 10 27 4 5 12 3 3 0 1 3 6 5 9 v 2 1 2 4 3 6) -1 6 12 7 18 / / 3 0 0 0 0 0 \ 0 2 0 0 0 0 0 0 1 2 0 3 0 0 0 1 °/ Itud vidíme, že t\ - = h = s2 = 0 a pro s\ = t e K je t3 = 3 - 2/. Podotkněme, že k určení Q\C\Q2 stačilo znát buď/j, t2, t3 nebo íj , s2. Vraťme se nyní k vyjádření x\ "4" /0\ /-1\ "4" x2 x3 = 4 4 + íi -6 -2 -5 -3 = 4 4 + t -6 -2 X4 4 1-3^ 4 Průnikem zadaných podprostorů je tedy přímka (s ■■ [4, 4,4,4]+í (0,3,1,2), s e -2i) neznámy bod [x\, ..., x„] e A„, známý nenulový vektor koeficientů (a\, ..., a„) a skalár b e R je afinní podprostor dimenze n—1 (říkáme také, že je jeho kodimenze 1), tj. tzv. nadrovina v A„. 4.7. Aíinní kombinace bodů. Zavedeme nyní obdobu lineárních kombinací vektorů. Nechť Aq , ..., Ai jsou body v afinním prostoru A. Jejich afinní obal ({Ao ..., Aj}) můžeme zapsat jako {A0 + ři(Ai - A0)H-----\-tk(Ak- A0);ti,...,tk e R) a v libovolných afinních souřadnicích (tj. každý bod A, je vyjádřen sloupcem skalárů) můžeme tutéž množinu zapsat jako (A0, ,Ak) = = *oA0 - t\Ai - ■ + tkAk; ti e R, ^ti — 1 Afinní kombinace bodů f tk Ak s koeficienty splňujícími 2~lř=ot' — 1 rozumíme body Aq + lľr=i ři (A; — Aq) a nazý- Obecně výrazy řo Ao + ři Ai i 5Zf=oř' ~ 1 rozumíme bod váme je afinní kombinace bodů. Body Ao ..., Ak jsou v obecné poloze, jestliže generují k-rozměrný afinní podprostor. Z našich definic je vidět, že to nastane, právě když pro kterýkoliv bod A, z nich platí, že vektory vzniklé pomocí rozdílů tohoto bodu A, a ostatních bodů Aj jsou lineárně nezávislé vektory. Všimněme si také, že zadání posloupnosti (dimyl) + 1 bodů v obecné poloze je ekvivalentní zadání afinního repéru s počátkem v prvním z nich. 4.8. Simplexy. Afinní kombinace je obdobná konstrukce pro body afinního prostoru jako byla lineární kombinace pro vektorové prostory. Skutečně, afinní podprostor generovaný body Ao, ..., Ak je roven množině všech afinních kombinací svých generátorů. Můžeme však nyní dobře zobecnit i pojem „mezi dvěma body na přímce". V dvojrozměrném případě tomu dopovídá vnitřek trojúhelníku. Obecně budeme postupovat takto: | rozměrné simplexy |__ Nechť Ao, ..., Ak je k + 1 bodů afinního prostoru A v obecné poloze. Množina A = A(Ao, ..., Ak) definovaná jako množina všech afinních kombinací bodů A, s pouze nezápornými koeficienty, tj. ř0A0 + řiAi + • • • + tkAk; n e [0, 1] c R, = 1 se nazývá ^-rozměrný simplex generovaný body A,. Jednorozměrný simplex je úsečka, dvourozměrný trojúhelník, j nula-rozměrný simplex je bod. Všimněme si, že každý ^-rozměrný simplex má právě k + 1 stěn, které jsou postupně zadány rovnicemi ř, — 0,i — 0, ..., k. Přímo z definice je vidět, že jde opět o simplexy, a to s dimenzí k — 1. Hovoříme o hranici simplexu. Např. trojúhelník má za svou hranici tři hrany, každá z nich pak dva body. Zadání podprostorů jako množiny afinních kombinací bodů v obecné poloze je ekvivalentní parametrickému popisu. Obdobně pracujeme s parametrickými popisy simplexů. 196 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Pro kontrolu rovněž dosadme Xl ' 4 " (3\ (2\ /0\ X2 X3 = -5 1 + íi 5 4 + t2 4 5 3 1 X4 -2 \v v) \y + (3 - 2i) (ti) ~4 (0\ 3 4 -6 1 — 4 + t -2 v) 4 □ 4.8. Zjistěte, zda leží body [0, 2,1], [-1,2, 0], [-2, 5, 2] a [0, 5,4] z K3 v jedné rovině. Řešení. Libovolná dvojice zadaných bodů z afinního prostoru K3 určuje vektor (viz definice afinního prostoru; jeho souřadnice jsou dány po složkách rozdíly souřadnic daných dvou bodů). To, že dané čtyři body leží v rovině je ekvivalentní tomu, že jsou tři vektory dané jedním vybraným bodem a vždy jedním ze tří zbylých lineárně závislé. Vybereme např. bod [0, 2,1] (na výběru nezáleží), pak uvažujeme vektory [0, 2, l]-[-l,2,0] = (1,0,1),[0,2, l]-[-2,5,2] = = (2, -3, -1) a [0, 2, l]-[0, 5,4] = (0, -3, -3). Vidíme, že součet dvojnásobku prvního vektoru a třetího vektoru je roven druhému vektoru, vektory jsou tedy lineárně závislé (jinak má taky matice, jejíž řádky jsou tvořeny souřadnicemi daných vektorů, hodnost nižší než tři; v tomto případě se tedy jedná o matici □ která má hodnost dva). Dané body tedy leží v rovině. 4.9. Na kolik částí mohou dělit prostor (K3) tři roviny? Pro každou možnost popište odpovídající případ. O 4.10. Rozhodněte, zda leží bod [2, 1, 0] uvnitř konvexního obalu bodů [0, 2, 1], [1, 0, 1], [3, -2, -1], [-1, 0, 1]. Řešení. Sestavíme nehomogenní lineární soustavu, pro koeficienty t\, t2, í3, í4, afinní kombinace daných bodů, která dává první bod (jsou určeny jednoznačně, pokud dané body neleží v rovině). /o 1 3 -1\ (h\ /2\ 2 0 -2 0 12 1 1 1 -1 1 ti 0 v1 1 1 w Poslední rovnice udává, že jde o afinní kombinaci. Řešením této soustavy je čtveřice (t\, t2,t3, U) = (1,0, 1/2, —1/2), jediná afinní kombinace, kterou je bod [2,1, 0] pomocí čtyř zadaných bodů určen tedy 4.9. Konvexní množiny. Podmnožina M afinního prostoru se nazývá konvexní, jestliže s každými svými dvěma body A, B obsahuje i celou úsečku A(A, B). Přímo z definice je vidět, že každá konvexní množina obsahuje s každými k + l body v obecné poloze i celý jimi definovaný simplex (formální ověření je také obsaženo v důkazu následující věty). Konvexními množinami jsou např. (1) prázdná podmnožina, (2) afinní podprostory, (3) úsečky, polopřímky p — {P + t ■ v; ŕ > 0), (4) obecněji k- rozměrné poloprostory a = {P + ti ■ vi H-----\-tk ■ vk; t\, ..., tk e R, tk > 0), (5) úhly v dvojrozměrných podprostorech P — {P + t\ ■ v\ + t2 ■ V2\ t\ > 0, t2 > 0). Přímo z definice také plyne, že průnik libovolného systému konvexních množin je opět konvexní. Průnik všech konvexních množin obsahujících danou množinu M nazýváme konvexní obal K(M) množiny M. Věta. Konvexní obal libovolné neprázdné podmnožiny M c A je K(M) = t\A\ H-----h tsAs; ^2ti = 1, n > 0, A; e M Důkaz. Označme 5 množinu všech afinních kombinací ' na pravé straně dokazované rovnosti. Nejprve ověříme, že je 5 konvexní. Zvolme 1, ■ si, t- tedy dvě sady parametrů ŕ,, j — 1, ..., S2 s požadovanými vlastnosti. Bez újmy na obecnosti můžeme předpokládat, že s\ — S2 a že v obou kombinacích vystupují stejné body z M (jinak prostě přidáme sčítance s nulovými koeficienty). Uvažme libovolný bod úsečky zadané takto získanými body: e(řiAi H-----htsAs) + (1 - ex/jAi H-----\-ťsAs), 0 < £ < 1. Zřejmě jsou opět všechny v 5. Zbývá ukázat, že konvexní obal bodů A\, ..., As nemůže být menší než 5. Samotné body A, odpovídají volbě parametrů t j — 0 pro všechny j 7^ i a t,• — 1. Předpokládejme, že tvrzení platí pro všechny množiny s nejvýše s — 1 body. To znamená, že konvexní obal bodů A\, ..., As_i je (podle předpokladu) tvořen právě těmi kombinacemi z pravé strany dokazované rovnosti, kde ts — 0. Uvažme nyní libovolný bod A — t\A\+- —hřjAj e S,ts < 1, a afinní kombinace e(ři Ai H-----h řs-i Aj_i) + (1 - e(l - ts))As, 0 < £ < Jde o úsečku s krajními body určenými parametry £ = 0 (bod As) a £ = 1/(1 — ts) (bod v konvexním obalu bodů A\, As_i). Bod A je vnitřním bodem této úsečky s parametrem £ = 1. □ Konvexní obaly konečných množin bodů se nazývají konvexní mnohostěny. Jsou-li definující body Ao, ■ ■ ■, Ak konvexního mnohostěnu v obecné poloze, dostáváme právě k -rozměrný simplex. V případě simplexu je vyjádření jeho bodů ve tvaru afinní kombinace definujících vrcholů jednoznačné. Zvláštním příkladem jsou konvexní mnohostěny generované jedním bodem a konečně mnoha vektory: Nechť u\, ... ,uk, jsou 197 KAPITOLA 4. ANALYTICKÁ GEOMETRIE není konvexní kombinací, a tedy bod nemůže ležet v jejich konvexním obalu. □ 4.11. V K3 je dán čtyřstěn ABC D, kde A = [4,0,2], B = [-2,-3,1], C = [1,-1,-3], D = [2,4,-2]. Rozhodněte, zda leží bod X = [0, —3, 0] uvnitř tohoto čtyřstěnu. Řešení. Daný bod uvnitř daného čtyřstěnu neleží. Vyjádříme-li X jakožto afinní kombinaci jeho vrcholů (řešením soustavy čtyř lineárních rovnic o čtyřech neznámých a, b, c ad dané rovností X = aA + bB +cC + dD),obdržímeX = \A + \B + \C -\D. To znamená, že X neleží v daném čtyřstěnu, tj. v konvexním obalu bodů A, B,C a D (a, b, c id by musela být v intervalu (0, 1)). □ 4.12. Afinní transformace souřadnic bodů V afinní bázi {[1, 2, 3], (1, 1, 1), (1,-1, 2), (2, 1, 1)} v K3 jsou vyjádřeny souřadnice bodu X jako [2,2,3]. Určete jeho souřadnice ve standardní bázi, tj. v bázi {[0, 0, 0], (1, 0, 0), (0, 1, 0), (0, 0,1)}. Řešení. Souřadnice [2,2,3] v bázi {[1, 2, 3], (1,1, 1), (1,-1, 2), (2,1, 1)} určují předpisem [1, 2, 3] + 2 • (1,1, 1) + 2 • (1, -1, 2) + + 3 • (2,1, 1) = [11, 5,12] souřadnice bodu X ve standardní bázi. □ 4.13. Afinní transformace předpisu zobrazení. Nalezněte předpis afinního zobrazení / v souřadné soustavě dané bází u = {(1,1), (—1,1)} a počátkem [2, 0], které je ve standardní bázi v K2 dáno jako '1^ f(.xux2) 2 1 0 1 5)+u Řešení. Matice přechodu od dané báze u ke standardní bázi k je 1 -1 1 1 Matici zobrazení v bázi ([2, 0], u) získáme tak, že nejprve transformujeme souřadnice v bázi ([2, 0],u) na souřadnice ve standardní bázi, tedy v bázi ([0, 0], (1, 0), (0,1)), poté aplikujeme matici zobrazení / ve standardní bázi a na závěr výsledek transformujeme zpět do souřadnic v bázi ([2, 0], u). Transformační rovnice přechodu od souřadnic yi, y2 v bázi ([2, 0], u) k souřadnicím x\, x2 v standardní bázi jsou fxi\ (l -ŕ x2j \l 1 ) \y2) + (o Odtud máme, že '1 -1 ,1 1 SMI1 libovolné vektory v zaměření M", A e A„ je libovolný bod. Rovnoběžnostěn Vk(A; mi, ..., Mj) c A„ je množina Vk(A; mi, , mí) = {A + čími H-----h ckut; 0 < c; < 1). Jsou-li vektory u i, ..., uk nezávislé, hovoříme o ^-rozměrném rovnoběžnostěnu Vk(A;u\, ...,uk) c A„. Z definice je zřejmé, že rovnoběžnostěny jsou konvexní. Ve skutečnosti jde o konvexní obaly jejich vrcholů. 4.10. Příklady standardních afinních úloh. (1) K podprostoru zadanému implicitně nalézt parametrický popis a na-"-KTy^*' opak: "L^íM Nalezením partikulárního řešení nehomogen- nflio systému a fundamentálního řešení zhomoge-nizovaného systému rovnic získáme (v souřadnicích, ve kterých byly rovnice zadány) právě hledaný parametrický popis. Naopak, zapíšeme-li parametrický popis v souřadnicích, můžeme volné parametry ři.....řfe vyeliminovat a získáme právě rovnice zadávající daný podprostor implicitně. (2) Nalézt podprostor generovaný několika podprostory Ql, ■ ■ ■, Qs (obecně různých dimenzí, např. v R3 nalézt rovinu danou bodem a přímkou, třemi body apod.) a zadat jej implicitně či parametricky: Výsledný podprostor Q je vždy určen jedním pevně zvoleným bodem A, v každém z nich a součtem všech zaměření. Např. Q = Ai + (Z({Ai, ,Ak}) + Z(Qi) + --- + Z(Qs)). Pokud jsou podprostory zadány implicitně, je možné je nejdříve převést na parametrický tvar. V konkrétních situacích bývají funkční i jiné postupy. Všimněme si, že obecně je skutečně nutné využít jednoho bodu z každého podprostoru. Např. dvě paralelní přímky v rovině vygenerují celou rovinu, ale sdílí totéž jednorozměrné zaměření. (3) Nalézt průnik podprostoru Qi, Qs: Pokud jsou zadány v implicitním tvaru, stačí sjednotit všechny rovnice do jednoho systému (a případně vynechat lineárně závislé). Pokud je vzniklý systém neřešitelný, je průnik prázdný. V opačném případě získáme implicitní popis afinního podprostoru, který je hledaným průnikem. Pokud máme dány parametrické tvary, můžeme také hledat přímo společné body jako řešení vhodných rovnic, podobně jako při hledání průniků vektorových podprostoru. Získáme tak přímo opět parametrický popis. Pokud je podprostoru více než dva, musíme průnik hledat postupně. Máme-li jeden prostor zadaný parametricky a ostatní implicitně, stačí dosadit parametrizované souřadnice a řešit výsledný systém rovnic. (4) Nalezení příčky mimoběžek p, q v a3 procházející daným bodem nebo mající předem daný směr (tj. zaměření): Příčkou rozumíme přímku, která má neprázdný \ průnik s oběma mimoběžkami. Výsledná příčka r tedy bude jednorozměrným afinním podprostorem. Pokud máme zadán jeho bod Aer, pak afinní podprostor generovaný p a A je buď přímka (A e p) nebo rovina (A ^ p). V prvém případě máme nekonečně mnoho řešení, jedno pro každý bod z q, v druhém stačí najít průnik B roviny (p U A) s q a r = ({A, B}}. Pokud je průnik prázdný, úloha nemá řešení, v případě že q c (p U A), máme opět nekonečně mnoho řešení, a pokud je průnik jednoprvkový, dostáváme právě jedno řešení. ittř. 198 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Pro předpis zobrazení pak dostáváme fiyuyi) = 1 \ 2 2 2 1 0 1 2 0 -1 1 □ 4.14. Mějme dánu standardní souřadnou soustavu v prostoru K3. Agent K sídlí v bodě S o souřadnicích [0,1,2] a ústředí mu přidělilo pro používání souřadnou soustavu s počátkem S a bází {(1, 1,0), (-1,0,1), (0, 1,2)}. Agent Sokol bydlí domě D na kótě [1,1,1] a používá souřadnou soustavu s bází {(0,0,1), (-1,1, 2), (1,0,1)}. Agent K žádá Sokola o schůzku v cihelně, která leží podle jeho souřadné soustavy v bodě [1,1, 0]. Kam má přijít Sokol (podle jeho souřadnic)? Řešení. Matice přechodu od báze agenta K k Sokolově bázi (při stejných počátcích) je -4 2 -1 1 0 1 2 -1 1 Vektor (0,1, 2) má tedy souřadnice T ■ (0, 1, 2)T = (0, 2, l)r, posunutím počátku (přičteme vektor (—1,0, 1)) dostáváme výsledek (-1,2,2). □ 4.15. Najděte příčku přímek (úsečku, jejíž jeden koncový bod leží na jedné z přímek, druhý pak na druhé z nich) p : [l,l,l]+r(2,1,0), q : [2,2,0] +/(1, 1, 1), takovou, že přímka jí určená prochází bodem [1, 0, 0]. Řešení. Nalezneme průsečík hledané příčky s přímkou q (nazveme jej <2). Hledaná příčka obsahuje nějaký bod na přímce p a bod [1, 0, 0], nutně tedy leží v rovině p určené tímto bodem a přímkou p, tedy v rovině [1, 1,1] +/(2, 1,0) + í(0, 1, 1). Bod Q je pak průnikem této roviny s přímkou q. Ten nalezneme vyřešením soustavy 1 + 2t = 2 + u, 1 + s + t = 2 + u, 1 + s = u. Levé strany rovnic reprezentují postupně všechny tři souřadnice libovolného bodu roviny p, pravé pak souřadnice libovolného bodu na Máme-li místo bodu dán směr u e R™, tj. zaměření r, pak uvažujeme opět podprostor Q generovaný p a zaměřením Z(p) + (u) c R™. Opět, pokud q c Q, máme nekonečně mnoho řešení, jinak uvážíme průnik Qsq a úlohu dokončíme stejně jako v předchozím případě. Řešení mnoha dalších praktických geometrických úloh vesměs spočívá v systematickém používání výše uvedených kroků. 4.11. Poznámky k lineárnímu programování. Na začátku třetí ^ ľ kapitoly jsme se zastavili v odstavcích 3.4-3.8 u praktických problémů, které jsou zadány pomocí systémů lineárních nerovnic. Snadno ověříme, že každá taková jednotlivá nerovnice a\x\ ■ + anxn < i zadává v standardním afinním prostoru R™ poloprostor ohraničený nadrovinou, kterou zadává příslušná rovnice (srovnej s definicí v odstavci 4.9(4)). Skutečně, jestliže zvolíme parametrický popis příslušné nadroviny {P + hvi H-----h ř„_iu„_i} s vektory zaměření v\, ..., i>„_ i, pak doplněním těchto vektorů do báze celého R™ vektorem v, nutně musí být hodnota a\x\ H-----\-a„x„ - b na lineární kombinaci tivi H-----\-t„-iv„-i +tnv vždy kladná pro všechny vektory buď s kladným nebo záporným t„. Zároveň tedy vidíme, že množina všech přípustných vektorů pro problém lineárního programování je vždy průnikem konečně mnoha konvexních množin a tedy je sama buď konvexní nebo prázdná. Pokud je zároveň průnik neprázdný a omezený, pak jde zřejmě o konvexní mnohostěn. Jak jsme zdůvodnili již v 3.4, každá lineární forma je podél každé (parametrizované) přímky v afinním prostoru buď stále rostoucí nebo stále klesající nebo konstantní. Pokud je tedy daný problém lineárního programování řešitelný a omezený, pak musí mít optimální řešení v jednom z vrcholů příslušného konvexního mnohostěnu. Čtenář by si měl umět toto tvrzení bez problémů představit v případě dvourozměrného nebo třírozměrného problému. Přímočaré zdůvodnění z těchto malých dimenzí však platí pro všechny konečněrozměrné případy. Tím jsme podali „geometrický důkaz" existenční části základní věty 3.7. Také jsme tak původní problém převedli k diskrétní (tj. konečné) úvaze o hodnotách dané cenové funkce v konečně mnoha bodech prostoru. K příkladu praktického algoritmu, jak příslušné vrcholy konvexního mnohostěnu co nejsnáze najít a vyhodnotit, se vrátíme ještě v kapitole o diskrétní matematice. 4.12. Afinní zobrazení. Zobrazení / : A —> B mezi afinními prostory nazýváme afinní zobrazení, jestliže mezi jejich zaměřeními existuje lineární zobrazení

Z(B) takové, že pro všechny A e A, v e Z (A) platí f(A + v) = f(A) + B. Přímo z definice je zřejmé, že stačí vyjádřit obraz f (Ao) počátku souřadnic v A v souřadnicích na B, tj. vyjádřit vektor f (Ao) — Bo v bázi v jako sloupec souřadnic yo a vše ostatní je pak určeno násobením maticí zobrazení

1' 1) = [-1- ~2' -3]- Souřadnice hledaného obrazu X" jsou X" = X' + (0, 0, 1) = = [—1, —2, —2]. Při zrcadlení bodu [3, 2, 1] jsme samozřejmě mohli použít přímo matice získané v příkladu ||2.58||. □ 4.19. Určete vzdálenost přímek v K3: p : [1,-1,0] +/(-l,2, 3) a q : [2, 5,-1] + r(-l, -2, 1). Řešení. Vzdálenost je dána jako velikost kolmého průmětu libovolné příčky (spojnice) daných přímek do ortogonálního doplňku vektorového podprostoru generovaného jejich zaměřeními. Tento ortogonální doplněk zjistíme například pomocí vektorového součinu: <(-l, 2, 3), (-1, -2, l))x = <(-l, 2, 3) x (-1, -2, 1)) = = ((8,-2,4)) = ((4,-1,2)). Spojnicí daných přímek je například úsečka [1, — 1, 0][2, 5, —1], promítneme tedy vektor [1, —1, 0] — [2, 5, —1] = (—1, —6, 1). Pro vzdálenost přímek pak dostáváme: p(p, q) =- 1)-(4,-1,2)1 ll(4,-l,2)|| 4 21 □ 4.20. Jarda stojí v bodě [2, 1, 2] a má tyč délky 4. Může se touto tyčí současně dotknout přímek p aq, kde p : [-1,4, l] + í(-l,2,0), q : [4,4,-1] + í(1,2,-4)? (Tyč musí procházet bodem [2, 1,2].) a přičtením výsledku. Každé afinní zobrazení tedy v souřadnicích vypadá takto: x H» yo + Y ■ x, kde yo je jako výše a F je matice zobrazení p(A,C). (4) V každé kartézské souřadné soustavě (Ao; e) mají body A = Ao +a\e\ + ... + a„e„, B = Ao + b\e\ H-----hbnen vzdálenost ^JY^"=\(ai —bi)2. (5) Je-li dán bod A a podprostor Q v £„, pak existuje bod P e Q minimalizující vzdálenosti bodů Q od A. Vzdálenost bodů A a P je rovna velikosti kolmého průmětu vektoru A — B do ZiQ)1- pro libovolný B e Q. (6) Obecněji, pro podprostory QalZv £„ existují body P e Q a Q e TZ minimalizující vzdálenosti bodů B e Q a A e TZ. Vzdálenost bodů Q a P je rovna velikosti kolmého průmětu vektoru A—B do (Z(Q)+Z(7Z))± pro libovolné body B e Q aAelZ. Důkaz. První tři vlastnosti vyplývají přímo z vlastností velikosti vektorů v prostorech se skalárním součinem, xí^ čtvrtá plyne přímo z vyjádření skalárního součinu v libovolné ortonormální bázi. Podívejme se na vztah pro minimalizaci vzdálenosti p(A, B) pro B e Q. Vektor A — B se jednoznačně rozkládá na A — B — u\ + u2, u\ e Z(Q), u2 e Z(Q)^. Přitom u2 nezávisí na volbě B e Q, protože případná změna bodu B se projeví přičtením vektoru ze Z(Q). Nyní zvolme P — A + (—u2) — B + u\ e Q. Dostáváme ■ 511 \\ul ii 11 í/21 \\u2 li □ Odtud již vyplývá, že nejmenší možné vzdálenosti je skutečně dosaženo, a to právě pro náš bod P. Vypočtená vzdálenost je skutečně \\u2\\. Obdobně ukážeme obecný výsledek. Pro volbu libovolných bodů A e 1Z a B e Q je jejich rozdíl dán jako součet vektorů ui e Z(1Z) + Z(Q)au2 e (Z(1Z) + Z(Q))±, přičemž komponenta u2 nezávisí na volbě bodů. Přičtením vhodných vektorů ze zaměření TZaQ zjevně obdržíme body A' aB1, jejichž vzdálenost je právě ||M2ll- n Rozšíříme nyní náš stručný přehled elementárních úloh v analytické geometrii. 4.17. Příklady standardních úloh. (1) Najděte vzdálenost bodu A e £„ od podprostoru Q c £n: Postup při řešení je dán ve větě 4.16. (2) V £2 vedie bodem A přímku q svírající s danou přímkou p daný úhel: Připomeňme, že na úrovni rovinné geometrie jsme s odchylkami vektorů jižpracovali (viz např. 2.43). Najdeme vektor!/ e R2 ležící v zaměření přímky q a zvolíme vektor v mající od u zadanou odchylku. Hledaná přímka je dána bodem A a zaměřením (v). Úloha má dvě nebo jedno řešení. (3) Spočtěte patu kolmice vedené bodem na danou přímku: Postup je uveden v důkazu předposledního bodu věty 4.16. (4) V £3 určete vzdálenost dvou přímek p, q: Zvolíme libovolně jeden bod z každé přímky, A e p, B e q. Komponenta vektoru A — B v ortogonálním doplnku (Z (p) + Z (q))1- má velikost rovnu vzdálenosti p a q. (5) V £3 najděte osu dvou mimoběžek p a q: Osou zde rozumíme příčku, která realizuje nejmenší možnou vzdálenost daných mimoběžek pomocí bodů průniku. Opět 202 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.22. V euklidovském prostoru K4 stanovte vzdálenost bodu A = [2, —5, 1, 4] od podprostoru daného rovnicemi U : Ax\ — 2x2 — 3^3 — 2x4 + 12 = 0, 2x\ — x2 — 2x3 — 2x4 + 9 = 0. Řešení. Nejdříve nalezneme parametrické vyjádření podprostoru U. Např. je B = [0,3,0, 3] e U. Víme, že vzdálenost A od f/ se rovná velikosti kolmého průmětu vektoru A — B do ortogonálního doplnku zaměření podprostoru U. Ortogonální doplněk zaměření U ovšem známe (zadává tento podprostor) -jako množinu (lineárních kombinací normálových vektorů) V := {t (4, -2, -3, -2) + s (2, -1, -2, -2); t, s e K}. Potřebujeme najít kolmý průmět Pa-b vektoru A — B do V, který náleží do V, a proto je PA_B = a (4, -2, -3, -2) + b (2, -1, -2, -2) pro jisté hodnoty fl,Jel. Zjevně musí platit (A — B — Pa-b) -L V, tedy ((A — B) — Pa-b) -L (4, -2, -3, -2), ((A - S) -PA_B) ±(2,-1,-2, -2). Dosazením za. A — B a. Pa-b odsud vyplývá ((2, -8, 1, 1) - a(4, -2, -3, -2) - ž>(2, -1, -2, -2))- •(4, -2, -3, -2) = 0, ((2, -8, 1, 1) - a(4, -2, -3, -2) - ž>(2, -1, -2, -2))- •(2,-1,-2,-2)) = 0, tj. (2,-8, 1, l)-(4, -2,-3,-2)--a(4, -2, -3, -2)-(4, -2, -3, -2)--ž>(2, -1, -2, -2)-(4, -2, -3, -2) = 0, ((2,-8, l,l)-(2,-1,-2,-2))--a(4, -2, -3, -2)-(2, -1, -2, -2)--ž>(2, -1, -2, -2)-(2, -1, -2, -2 = 0. Vyčíslíme-li tyto skalární součiny, obdržíme soustavu 19 - 33a - 20b = 0, 8 - 20a - 13b = 0, která má jediné řešení a = 3, b = —A. Je tudíž PA_B = 3 (4, -2, -3, -2) - 4 (2, -1, -2, -2) = (4, -2, -1,2), lze postup dovodit z důkazu věty 4.16 (poslední bod). Nechť i] je podprostor generovaný jedním bodem A e p a součtem Z(p) + (Z(p) + Z(q))±. Pokud nejsou přímky p a q rovnoběžné, půjde o rovinu. Pak průnik i] n q spolu se zaměřením (Z (p) + Z (q))1- dávají parametrický popis hledané osy. Pokud jsou přímky rovnoběžné, bude mít úloha nekonečně mnoho řešení. 4.18. Odchylky. Stejně jako vzdálenost, i řada dalších geometrických pojmů jako odchylky, orientace, objem apod. je v bodových prostorech £„ zaváděna prostřednictvím vhodných pojmů ve vektorových euklidovských prostorech. Připomeňme, že odchylku dvou vektorů jsme definovali na konci třetí části druhé kapitoly, viz 2.43. Skutečně, z Cauchyovy nerovnosti plyne 0 < < 1, má tedy smysl definice odchylky ||2 = ||m||2 + ||i>||2 — 2(u ■ v) — = ||m||2 + ||i;||2 — 2||m|| ||d|| cos roven (0, 0, 0, 3, 0). Velikost vektoru (0, 0, 0, 3, 0) dává výslednou vzdálenost 3. Případ či, a2. Součet zaměření rovin o\, a2 je generován směrovými vektory. Označme je Všimněme si, že odchylka je vždy dobře definována, zejména v posledním případě je (Ui n (Ui n f/2)±) n (u2 n (Ui n f/2)±) = {0}. Můžeme tedy opravdu odchylku určit podle bodu (2). Všimněme si také, že vpřípadě U\ n U2 = {0},jsouf/i a U2 kolmé podle našich dřívějších definic, právě když jejich odchylka je ti/2. Pokud však mají netriviální průnik, nemohou být kolmé v dřívějším smyslu. Ke korektnosti definice zbývá ukázat, že ve skutečnosti vždy existují vektory u e U\, v e U2, pro které nabývá výraz pro odchylku požadovaného minima. Nejdříve speciální případ: 4.20. Lemma. Nechť v je vektor v euklidovském prostoru V a U c V libovolný podprostor. Označme v\ e U, v2 e U1- (jednoznačně určené) komponenty vektoru v, tj. v — v\ + v2. Pak pro odchylku

2 ("1, «1 - q2{v2, ui) = 0, <(- -3,2, -5, -7, - 3), «2 + Pl ("1, "2 + q\ (u2, u2) - - />2 ("1, «2 - q2{v2, u2) = 0, <(- -3,2, -5,-7,- -3),«i + Pl ("1, "1 + q\ {u2, ui) - - P2{V\, Vi ) -q2{v2,v1) = 0, <(- -3,2, -5,-7,- -3), «2 + Pl ("1, "2 + qi {u2,v2) - - />2 ("1, "2) -q2{v2,v2) = 0. Vyčíslením těchto skalárních součinů získáváme soustavu lineárních rovnic 7, 6pi - 4qi -Api + 6qi 3pi - 6q\ 9p2 - 3q2 + 6q2 33p2 - q2 p2 - 9q2 31, -11, kterou vyřešíme pomocí řádkových transformací v maticovém zápisu / 6 -4 -9 -3 7 ( 1 0 0 0 0 \ -4 6 0 6 6 0 1 0 0 -1 9 0 -33 -1 31 0 0 1 0 -1 \ 3 -6 -1 -9 -11 ) 1° 0 0 1 2 / Řešením této soustavy je tedy čtveřice (p\, q\, p2, q2) = = (0,-1,-1,2). Určili jsme Xx-X2 = (-3, 2, -5, -7, -3)-u2 + Vl-2v2 = (-3, 4, -2, -4, 2). Velikost vektoru (—3, 4, —2, —4, 2) a současně vzdálenost rovin o\, a2 činí 7 = VX-3)2 + 42 + (-2)2 + (-4)2 + 22. Vzdálenost q\ oág2 jsme určovali odlišným způsobem ne vzdálenost a\ od a2. Uvedené metody jsme samozřejmě mohli použít v obou případech. Zkusme znovu vypočítat vzdálenost rovin a\, a2 postupem budeme promítat větší prostor U do jednorozměrného (v) a pak kolmo zpět do U. Zjistíme, že odchylku poznáme podle směru vlastního vektoru takového zobrazení, jeho vlastní číslo bude kvadrátem příslušného kosinu úhlu. Uvažujme tedy dva obecné podprostory U\, U2 v euklidovském vektorovém prostoru V, předpokládejme U\ n U2 = {0), a zvolme pevně ortonormální báze e, a e' celého prostoru V tak, aby Ui = (ei, ek), U2 = (e[, e\). Uvažujme kolmý průmět

U2. Zobrazení Ý : U2 —> U\ nechť vznikne podobně z kolmého průmětu na U\. Tato zobrazení mají v bázích (e\, ..., ek) a (ej, ..., ej) matice fe\ -e[ ... ek-e[\ (e'\-el ■■■ e'i ■ «l\ 1 ; ; « ; ; \e\-e\ ... ek-e[/ \e\ ■ ek ... e'rekJ Protože jde o skalární součiny na reálném vektorovém prostoru, platí e; • e'. — e'. ■ e, pro všechny indexy i, j a proto zejména platí B = AT. Složené zobrazení Ý o

U\ má tedy symetrickou pozitivně semideflnitní matici AT A a Ý je zobrazení adjungované k (v)\\. \\v\\ Protože jsme zvolili za A.i největší z vlastních hodnot a součet kvadrátů souřadnic af je jedna, dostáváme (cosa)2 = || S (Ml, . . . , Mi_l>±n (Ml, . . . , Uk). V tomto rozkladu se Uk jednoznačně vyjádří jako Uk — u'k + ek, kde ek -L (ui, ..., Uk-\). Absolutní hodnotu objemu rovnoběžnostěnu definujeme induktivně tak, abychom naplnili představu, že jde o součin objemu „základny" a „výšky": |Vo1|-Pi(A;mi) = ||mi||, I Vol\Vk(A; ui,...,uk) = \\ek\\\ Vol \Vk-i(A; mi, ..., uk-i). 206 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Skalární součiny (Zi -X2,ux) = 0, 2 ■■ 9 45 19 1 39 2'Y'Y'~ '~T 9 45 19 39" 2' T' T' ~ ' ~T Nyní ji snadno ověříme, že vzdálenost bodů X\, X2 (a současně vzdálenost rovin qu q2) je || Xx - X2\\ = || (0, 0, 0, 3,0) || =3. □ 4.24. Najděte průnik kolmé roviny spuštěné z bodu A = [1,2,3,4] e K4 na rovinu q : [1, 0, 1, 0] + (1, 2, -1, -2)s + (1, 0, 0, 1)/, s,íel. Řešení. Nalezněme nejprve kolmou rovinu k q. Její zaměření bude kolmé na zaměření q, pro vektory (a,b,c,d) patřící do jejího zaměření dostáváme tedy soustavu rovnic (a, b,c,d)- (1, 2, -1, -2) = 0 = a + 2b - c - 2d = 0, (a, b, c, d) ■ (1, 0, 0, 1) = 0 = a + d = 0. Jejím řešením je dvoudimenzionální vektorový prostor ((0, 1, 2, 0), (—1, 0, —3,1)). Rovina t kolmá k rovině q procházející bodem A má tedy parametrické vyjádření t : [1, 2, 3, 4] + (0, 1, 2, 0)w + (-1, 0, -3, l)v, i.uel. Průnik rovin potom můžeme získat pomocí obou parametrických vyjádření. Pro parametry popisující průnik tedy dostáváme soustavu rovnic 1 + s + t = 1 -v, 2s = 2 + u, 1 — s = 3 + 2u — 3v, - 2s + t = 4 + v, která má jediné řešení (musí tomu tak být, protože sloupce matice soustavy jsou dány lineárně nezávislými vektory zaměření obou rovin) s = -8/19, t = 34/19, u = -54/19, v = -26/19. Dosazením hodnot parametrů s a / do parametrického vyjádření roviny q pak dostaneme souřadnice průniku [45/19, —16/19,11/19, 18/19] Je-li mi , ... ,u„ báze souhlasná s orientací V, definujeme (orientovaný) objem rovnoběžnostěnu VolTMA; mi, ..., un) = I Vol\Vk(A; mi, ..., m„), v případě nesouhlasné báze klademe Vol7\(A; mi, ..., m„) = -I Vol \Vk(A; uu ..., u„). Následující tvrzení objasňuje naše dřívější poznámky, že determinant je v jistém smyslu nástroj vyjadřující objem. První tvrzení totiž říká právě, že na ^-rozměrném prostoru dostaneme objem rovnoběžnostěnu nataženého na k vektorů tak, že jejich souřadnice (v ortonormální bázi) napíšeme do sloupců matice a spočteme determinant. Výrazu ve druhém tvrzení se říká Gramův determinant. Jeho výhoda je, že je zcela nezávislý na volbě báze a zejména se s ním proto lépe pracuje v případě k menšího než je dimenze celého prostoru. Věta. Nechť Q c £n je euklidovský podprostor a nechť (e\, ..., ei) je jeho ortonormální báze. Pak pro , uk e Z(Q) a A e Qplatí '/ libovolné vektory u i, (1) \o\Vk(A;ui,...,uk) = mi •ek .. Ml • Ml (2) (Vol Pi (A; mi, Důkaz. Matice A = ,uk))2 = /mi • e\ u\ • uk uk ■ e\ uk ■ ek uk • u\ uk ■ uk uk ■ e\' má ve sloupcích souřadnice vektorů m i mátni bázi. Platí \mi • ek ... uk- et) mí ve zvolené ortonor- |A|2 = |A||A| = |Ar||A| = |ArA| = Ml • Ml Ml • Uk Uk • U\ Uk ■ Uk Vidíme tedy, že pokud platí (1), platí i (2). Přímo z definice je neorientovaný objem roven součinu | Wo\\Vk(A; mi, ..., mt) = ||Ľ21| ■ ■ ■ IIVili, kdeví — u\,v2 — u2+a2v\, ... ,vk — uk+akv-i + - ■ ■+aklvk-\ je výsledek Gramova-Schmidtova ortogonalizačního procesu. Je tedy (Vo17'í(A;mi,...,mí))í = Dl • V\ 0 VI ■ VI ví ■ vk 0 ... Vk-Vk Vk ■ VI Vk ■ Vk 201 KAPITOLA 4. ANALYTICKÁ GEOMETRIE (stejný výsledek pochopitelně obdržíme, dosadíme-li hodnoty parametru u st v do parametrického vyjádření roviny t). □ 4.25. Nechťje dána krychle ABCDEFGH (při obvyklém významu zápisu, tedy vektory E —A, F —B, G—C, H—D jsou kolmé na rovinu určenou vrcholy A, B, C, D) v euklidovském prostoru K3. Vypočtěte odchylku

= 60 °. To je ovšem velikost úhlu, který svírá směrový vektor p s normálovým vektorem q. Hledaný úhel je doplňkem tohoto úhlu, a tak je výsledek 30° = 90° -60°. □ m lij Označme B matici jejíž sloupce jsou souřadnice vektorů ■J: .i v\,...,vk v ortonormální bázi e. Protože v\,...,vk vznikly z«i,...,m jako obrazy v lineární transformaci I s horní trojúhelníkovou maticí C s jedničkami na diagonále, je B = CA a \B\ = \C\\A\ = |A|. Pak ovšem |A|2 = \B\2 = \A\\A\, proto VolVk(A; uu ■ ■ ■ ,uk) = ±|A|. Přitom pokud jsou vektory u\,...,ui závislé vyjde objem nulový, pokud jsou nezávislé, pak znaménko determinantu je kladné, právě když je báze u\, ..., uk zadává stejnou orientací jako báze e. □ V geometrické formulaci dostáváme jako velice důležitý důsledek následující tvrzení: 4.23. Důsledek. Pro každé lineární zobrazení

[u\, ..., un] je antisymetrické n-lineární zobrazení, tzn. že je lineární ve všech argumentech a výměna dvou argumentů se vždy projeví změnou znaménka výsledku. (2) Vnější součin je nulový, právě když jsou vektory u\, ..., u„ lineárně závislé. (3) Vektory u\, ..., u„ tvoří kladnou bázi, právě když je jejich vnější součin kladný. V technických aplikacích v prostoru R3 se často používá velmi úzce související operace, tzv. vektorový součin, který dvojici vektorů přiřazuje vektor třetí. Uvažme obecný euklidovský vektorový prostor V dimenze n > 2 a vektory mi, ..., u„-\ e V. Dosadíme-li těchto n — 1 vektorů jako prvních n — 1 argumentů n-lineárního zobrazení definovaného pomocí determinantu při výpočtu objemu výše, pak nám zbude jeden volný argument, tj. lineární forma na V. Protože však máme k dispozici skalární součin, odpovídá každá lineární forma právě jednomu vektoru. Tento vektor v e V nazveme vektorový součin vektorů mi, ..., m„_i, tj. pro každý vektor w e V platí (v, w) = [mi, _1, w]. Značíme v = mi x ... x m„_i. Jsou-li v nějaké ortonormální bázi souřadnice našich vektorů (yi. ,yny ,Xn) a m ; ("lj, •"ní) 208 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.28. V reálné rovině nalezněte přímku, která prochází bodem [—3, 0] a s přímkou p : -J3x + 3y + 5 = 0 svírá úhel 60°. Řešení. Nejprve si uvědomme, že podmínkám úlohy musí vyhovovat právě dvě přímky. Obecná rovnice přímky v rovině má tvar ax + by + c = 0, přičemž lze volit a2 + b2 = 1. Nalezněme tedy taková čísla a,b,c e K, aby byly splněny uvedené podmínky. Dosadíme-li x = —3, y = 0 do této rovnice (přímka má procházet bodem [—3, 0]), dostaneme c = 3a. Podmínka, že přímka má svírat úhel 60 ° s přímkou p, potom dává VŠa + 3b I tj. VŠ: naše definice má vyjádření - = cos60° : 2 12 | VŠa + 3b J. a2 + 3b2 + lsÍ3ab. Další úpravou obdržíme ±1 = a + 43b a umocněním 1 Využijeme-li a2 + b2 = 1, získáme 0 = 2b2 + 2-Sab, tj. 0 = b (b + 4Šaj . Celkem tak máme možnosti (připomeňme, že c = 3a a a2 + b2 1) : ±1, b = 0, c = ±3; ±l-,b. 2 V3 ±- Snadno se ověří, že těmito koeficienty určené přímky x + 3 = 0, 1 V3 2"y + 2 : 0 zadání skutečně vyhovují. □ Jiný přístup k řešení téhož problému jako v předchozím příkladě, ukazuje řešení příkladu následujícího: 4.29. Bodem [1,2] e K2 vedle přímku, která má odchylku 30° od přímky p: [0, 1]+/(1,1). Řešení. Odchylka dvou přímek je dána úhlem, který svírají jejich směrové vektory. Stačí tedy najít směrový vektor v hledané přímky. Ten získáme například rotací směrového vektoru přímky p o 30°. Matice rotace o 30° je cos 30° - sin 30° sin 30° cos 30° 2 1 2 Hledaný vektor uje tedy V3 2 1 2 ví; vi 2 V3 _ ym - ynx„ = "n "l(n-l) X\ un\ ■■■ un(n-\) ■ Odtud je přímo vidět, že vektor v je zadán jednoznačně a jeho souřadnice spočteme formálním rozvojem tohoto determinantu podle posledního sloupce. Zároveň jsou přímo z definice očeká-vatelné následující vlastnosti vektorového součinu: Věta. Pro vektorový součin v — u\ x ... x u„-\ platí (1) v e (mi, ..., m„_i>±, (2) v je nenulový vektor, právě když jsou vektory u\, ..., un_\ lineárně nezávislé, (3) velikost || ľ || vektorového součinu je rovna absolutní hodnotě objemu rovnoběžnostěnu V(0; mi, ..., m„_i), (4) (mi, ..., m„_i, v) je souhlasná báze orientovaného euklidovského prostoru V. Důkaz. První tvrzení plyne přímo z definičního vztahu pro v, • protože dosazením libovolného vektoru u j za w máme nalevo skalární součin v-u j a napravo determinant s dvěma shodnými sloupci. Hodnost matice s n — 1 sloupci u j je dána maximální velikostí nenulového minoru. Minory, které zadávají souřadnice vektorového součinu jsou stupně n — 1 a tím je dokázáno tvrzení (2). Jsou-li vektory mi, ..., m„_i závislé, pak platí i (3). Nechť jsou tedy nezávislé, v je jejich vektorový součin a zvolme libovolnou ortonormální bázi (e\, ..., e„-\) prostoru (mi, ..., m„_i>. Z již dokázaného vyplývá, že existuje nějaký násobek (l/a)v, 0 / a e 1, takový, že (e\, ... ,ei, (l/a)u) je ortonormální báze celého V. Souřadnice našich vektorů v této bázi jsou U j = (U\j, . . . , M(„_ Proto je vnější součin [mi , rového součinu) [Ml, ... , M„_l, V] ■ 1W 0)' v = (0, ...,0,a)' . , v] roven (viz definice vekto- "11 "l(n-l) 0 "(n-l)l ■■■ "(n-l)(n-l) 0 0 ... 0 a — (v, v) — a2. Rozvojem determinantu podle posledního sloupce zároveň obdržíme a2 = a Vol7^(0; mi, ..., i„-i). Odtud už vyplývají obě zbylá tvrzení věty. □ 4.25. Afinní a euklidovské vlastnosti. Nyní se můžeme zamyslet nad tím, které vlastnosti jsou vlastní už afinním prostorům a zobrazením a na co skutečně teprve potřebujeme v zaměření skalární součin. Je samozřejmé, že všechny euklidovské transformace, tj. bi-■J: jektivní afinní zobrazení euklidovských prostorů, které za- i chovává vzdálenosti bodů, zachovávají všechny výše stu-JAj^ř dováné objekty. Tj. zachovávají kromě vzdáleností také ne-• '■P ' orientované úhly, neorientované objemy, odchylky podpro-storů apod. Pokud chceme, aby zachovávaly i orientované úhly, vektorové součiny, objemy, pak musíme navíc předpokládat, že naše transformace zachovávají orientaci. 209 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Rotovat jsme mohli i v opačném smyslu. Hledaná přímka (jedna ze dvou možných) má tedy parametrické vyjádření [l,2]+(f+ i)r. □ 4.30. Určete obecnou rovnici všech rovin, které svírají odchylku 60° s rovinou x+y+z—í = 0 a obsahují přímku p : [1, 0, 0]+/ (1,1, 0). O 4.31. Určete odchylku rovin a: [1,0,2] + (1,-1, l)r + (0, 1,-2)í, p: [3,3, 3] + (l,-2,0)r + (0, 1,1)í. Řešení. Průsečnice má směrový vektor (1,-1,1), kolmá rovina na ni má pak s danými rovinami průniky generované vektory (1,0, —1) a (0,1,1). Tyto jednorozměrné podprostory svírají úhel 60°. □ 4.32. Je dána krychle ABCDA'B C D' (ve standardním označení, tj. ABCD a A'B'C'D' jsou stěny, AA' pak hrana). Určete odchylku vektorů AB' a AD'. Řešení. Uvažujme krychli o hraně 1 a umístěme ji v K3 tak, že bod A bude mít ve standardní bázi souřadnice [0, 0, 0], bod B pak souřadnice [1, 0, 0] a bod C souřadnice [1,1, 0]. Potom má bod B souřadnice [1, 0,1] a bod D' souřadnice [0, 1, 1]. Pro vyšetřované vektory tedy můžeme psát AB = B - A = [1, 0, 1] - [0, 0, 0] = (1, 0,1), AD' = D' — A = [0, 1, 1] - [0, 0, 0] = (0, 1,1). Podle definice odchylky

M. Stejně dobře můžeme přemýšlet o obecné symetrické bilineární formě na libovolném vektorovém prostoru. Pro libovolnou bázi na tomto vektorovém prostoru bude hodnota f(x) na vektoru x — x\e\ + ■ ■ ■ + xnen dána vztahem f(x) = F(x, x) = ^XiXjFiei, ej) = xT ■ A ■ x, ',j kde A = (ajj) je symetrická matice s prvky = F(e,-, ej). Takovýmto zobrazením / říkáme kvadratické formy a výše uvedený vzorec pro hodnotu formy s použitím zvolených souřadnic se nazývá analytický tvar formy. Obecně rozumíme kvadratickou formou zúžení f(x) jakékoliv symetrické bilineární formy F(x, y) na argumenty tvaru (x, x). Evidentně umíme z hodnot f(x) zrekonstruovat celou bilineární formu F, protože f(x + y) = F(x+y,x + y) = f(x) + f(y) + 2F(x, y). Jestliže změníme bázi e; na jinou bázi e j, ... ,e'n, dostaneme pro stejný vektor jiné souřadnice x — S ■ x' (zde 5 je příslušná matice přechodu) a tedy f(x) = (5 • x'f -A ■ (5 • x) = (x')T • (5r -A-S)-x . Předpokládejme opět, že je na našem vektorovém prostoru zadán skalární součin. Předchozí výpočet pak můžeme shrnout slovy, že matice bilineární formy F a tedy i kvadratické formy / se transformuje při změně souřadnic způsobem, který pro ortogonální změny souřadnic splývá s transformací matic zobrazení (skutečně, pak je — ST). Tento výsledek můžeme interpretovat také jako následující pozorování: Tvrzení. Nechť V je reálný vektorový prostor se skalárním součinem. Pak vztah (p i-> F, F (u, u) = ( K, f (x\, x2, xí) = 3x\ + 2x\x2 + x\ + 4x2*3 + 6x\. Řešení. Její matice je Podle bodu (1) Lagrangeova algoritmu (viz věta 4.30) provedeme úpravy /(xi,x2,x3) -(3xi + x2)2 + -x\ + 4x2xí + 6x3 = 1,32 , = 2^ + 2{3y2 + 2y3) 1 2 3 2 a vidíme, že forma má hodnost 2 a matice přechodu do příslušné polární báze w se získá posbíráním provedených transformací: Z3 = V3 = x3, Z2 = -yi + 2y3 -x2 + 2^3, z\=y\= 3x\ + x2, tedy matice přechodu od standardní báze k polární bázi je (3 1 0\ r = o f 2 . \o o 1; Matici jsme získali tak, že jsme odvozené vyjádření souřadnic v polární bázi pomocí souřadnic ve standardní bázi napsali do řádků uvažované matice (čtenář si rozmyslí, že sloupce této matice jsou souřadnice vektorů standardní báze v polární bázi). Souřadnice vektorů polární báze pak snadno odečteme z matice T~l (jsou to její sloupce). 1 hledaná polární báze tedy je ((5,0,0), (-{, |,0), (1, -3, 1)). □ 4.40. Určete polární bázi formy: / : K3 K3. /(xi,x2,x3) = 2xjx3 +x Řešení. Matice dané formy je Hned v prvním kroku můžeme přehodit proměnné: y\ = x2, y2 = x\, y3 = x3. Aplikace bodu (1) Lagrangeova algoritmu je pak triviální (nejsou tu žádné společné členy), pro další krok ale nastane situace 0 = x2 /a2 + y2 /b2 + 1 0 = x2 /a2 + y2 /b2 - 1 0 = x2 /a2 - y2 /b2 - 1 0 = x2 /a2 -2py 0 = x2 /a2 + y2 /b2 0 = x2 /a2 - y2 /b2 O^x2 - a2 O^x2 O^x2 +a2 prázdná množina elipsa hyperbola parabola bod dvě různoběžné přímky dvě rovnoběžné přímky dvě splývající přímky prázdná množina Počátek kartézských souřadnic je středem zkoumané kuželosečky, nalezená ortonormální báze zaměření zadává směr poloos, výsledné koeficienty a, b pak dávají velikosti poloos v nedegene-rovaných směrech. O typu kuželosečky můžeme rozhodnout i bez úpravy na některý z tvarů uvedený v seznamu 4.29. Jak již víme, každou kuželosečku můžeme napsat ve tvaru ailJí2 + 2a\2xy + «22}^ + 2a\3X + 2a23y + a33 : : 0. Determinanty au an ízi3 A = det A = a\2 a22 a2% "13 a32 "33 S = an an an a22 jsou tzv. invarianty kuželosečky, což znamená, že se nemění při euklidovské transformaci souřadnic (rotace a posunutí) navíc různé typy kuželoseček mají různá znaménka těchto determinantů. • A/0 vlastní (regulární) kuželosečky: elipsa pro S > 0, hyperbola pro S < 0 a parabola pro S = 0 Aby šlo o reálnou elipsu, nikoliv imaginární, musí být navíc (au +3 — y2 = = x3 — x\. Matice přechodu T do příslušné polární báze je tedy / 0 1 o\ /o 1 o\ r = i oo a r_1 = i o o , l-l 0 1/ \0 1 1/ polární báze je tedy ((0,1,0), (1,0,1) (0,1,1)). 4.41. Nalezněte polární bázi kvadratické formy / : K3 je ve standardní bázi dána předpisem □ , která fixux2,x3) = X\X2 + XXX3. Řešení. Aplikací uvedeného Lagrangeova algoritmu dostáváme: fixu x2, x3) = 2xxx2 + x2x3 = substituce podle bodu (4) algoritmu y2 = x2 — x\, y\ — x\ yh = xy. = 2xu\.x\ + y2) + ix\ + y2)x3 =2x\+ 2xxy2 + xxx3 + y2x3 = 1 1 2 1 2 1 2 = + yi + 2X3) ~ 2^2 ~ š 3 + yiX3 = substituce y\ — 2x\ + y2 + \x3: = r1 ~ r2 ~ s*3 + y2X3 = 2yi ~ 2(-2y2 ~ 2Xi) + š*3 = substituce y3 — \y2 — \x3: = \ý\-2yl + 3-x\. V souřadnicích y\, y3,x3 má tedy daná kvadratická forma diagonální tvar, to znamená že báze příslušná těmto souřadnicím je polární bází dané kvadratické formy. Pokud ji máme vyjádřit musíme získat matici přechodu od této polární báze ke standardní bázi. Z definice matice přechodu jsou pak její sloupce bázovými vektory polární bázi. Matici přechodu získáme tak, že buď vyjádříme staré proměnné (x\, x2, x3) pomocí nových proměnných iy\, y3, x3), nebo ekvivalentně vyjádříme nové proměnné pomocí starých (což jde jednodušeji), pak ale musíme spočítat inverzní matici. Máme y\ = 2x\ + y2 + \x3 = 2x\ + (x2 — x\) + \x3 a y3 = \y2 — \x3 = — jx\ + jx3 — ^x3. Matice přechodu od zvolené polární báze ke standardní bázi je 2 1 Dosazením vztahu X = MX' do rovnice kuželosečky, pak dostáváme rovnici kuželosečky v nových souřadnicích, tj. XT AX = 0, (MX')TA(MX') =0, X'TMT AMX' = 0. Označme A' matici kvadratické formy kuželosečky v nových souřadnicích. Pak tedy A' — MT A M, kde matice (cos a —siná cA siná cos a c2 I má jednotkový determinant, tedy 0 0 l) det A' — det MT det A det M — det A — A. Nutně také determinant A33, který je algebraickým doplňkem prvku a33 je nezávislý na změně souřadnic, protože pro nulové posunutí-tedy pouze otočení-je vztah det A' — detMT det A det M (cos a —siná 0\ siná cosa 0 I 0 0 l) a det Aj3 = det A33 = S. Pro samotné posunutí je matice /l 0 cA M — I 0 1 ci I a tento subdeterminant neovlivňuje. \0 0 l) 4.30. Afinní pohled. V předchozích dvou odstavcích jsme hle- f\ dali podstatné vlastnosti a standardizované analy-^^^2^ tické popisy objektů zadávaných v euklidovských =-"=^_ ŕ prostorech kvadratickými rovnicemi. Hledali jsme přitom co nejjednodušší rovnice v mezích daných volností výběru kartézských souřadnic. Geometrická formulace našeho výsledku pak může být taková, že pro dva různé objekty - kvadriky, zadané v obecně různých kartézských souřadnicích, existuje euklidovská transformace na £„ (tj. afinní bijektivní zobrazení zachovávající velikosti) tehdy a jen tehdy, pokud výše uvedený algoritmus vede na stejný analytický tvar, až na pořadí souřadnic. Navíc můžeme při našem postupu přímo získat kartézské souřadnice, ve kterých jsou naše objekty dány výslednými kanonickými tvary, a tím i explicitní vyjádření euklidovské transformace, která naše objekty na sebe převádí (jak víme bude vždy složena z operací posunutí, otočení a zrcadlení vůči nadrovině). Pochopitelně se můžeme ptát, do jaké míry umíme podobnou věc v afinních prostorech s volností výběru jakékoliv afinní souřadné soustavy. Např. v rovině to bude znamenat, že neumíme rozlišit kružnici od elipsy, samozřejmě bychom přitom měli odlišit hyperbolu a všechny ostatní typy kuželoseček. Hlavně ale splynou mezi sebou všechny hyperboly atd. Ukážeme si hlavní rozdíl postupu na kvadratických formách a k záležitosti se pak ještě vrátíme ve třetí části této kapitoly. Uvažme nějakou kvadratickou formu / na vektorovém prostoru V a její analytické vyjádření f(u) — xT Ax vzhledem ke zvolené bázi na V. Pro vektor u = x\u\ + • • • + xnun pak také zapisujeme formu / ve tvaru f (xi n) — ^ \aijXjXj . _ 1 1 _ 1 2 2 2 0 0 1 , V předchozích odstavcích jsme již s využitím skalárního součinu ukázali, že pro vhodnou bázi bude matice A diagonální, tj. že pro příslušnou symetrickou formu F bude platit F(uj,uj) = 0 při 214 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Pro inverzní matici pak máme Jedna z polárních bází dané kvadratické formy (polární báze není určena jednoznačně) je tedy například báze (je dána sloupci poslední matice) ((1/3, 1/3, 0), (-2/3,4/3, 0), (-1/2,1/2, 1)). □ 4.42. Určete typ kuželosečky dané rovnicí: 3x\ — 3x\X2 + X2 — 1 = 0. Řešení. Pomocí algoritmu úpravy na čtverec postupně dostáváme: 2 T 3xj — 3x\x2 + x2 — 1 = — ( 3xi 2 4 (3 x2 3 V 4 -x2 ■ 3 1 , 4 , 2 2* - 3?2-3- 4 r2 2 x2, + x2 — l + 3-1 □ Podle seznamu kuželoseček 4.29 se tedy jedná o hyperbolu. 4.43. Pomocí doplnění na čtverce vyjádřete kvadriku -x2 + 3y2 + z2 + 6xy - 4z = 0 ve tvaru, ze kterého lze vyčíst její typ. Řešení. Všechny členy obsahující x připojíme k —x2 a provedeme doplnění na čtverec. Tím získáme -(x - 3yf + 9y2 + 3y2 + z2 - 4z = 0. Žádné „nežádoucí" členy obsahující y nemáme, a proto postup opakujeme pro proměnnou z, což dává -(x - 3yf + 12y2 + (z - 2)2 - 4 = 0. Odtud plyne, že existuje transformace proměnných, při které obdržíme (rovnici můžeme nejdříve vydělit 4) rovnici -x2 + y2 + I2 - 1 = 0. □ 4.44. Určete typ kuželosečky 2x2 — 2xy + 3y2 2 -1 -i . .2 Řešení. Determinantje A ■ x + y - 1 = 0. 23 ^ 0. Jde tedy -1 3 i i "2 2 o regulární kuželosečku. Navíc je 8 = 5 > 0, tedy jde o elipsu. Dále (au + fl22)A = (2 + 3) • (—^) < 0, jde tedy o reálnou elipsu. □ 4.45. Určete typ kuželosečky x2 — 4xy — 5y2 + 2x + 4y + 3 = 0. 1 -2 1 -2 -5 2 = -34 ŕ 0, 1 2 3 Řešení. Determinantje A dále je S 1 -2 -2 -5 -9 < 0, jde tedy o hyperbolu. □ i j. Každou takovou bázi nazýváme polární báze kvadratické formy /. Samozřejmě si pro takový účel můžeme vždy skalární součin vybrat. Dokážeme si ale toto tvrzení znovu bez využití skalárních součinů tak, že získáme daleko jednodušší algoritmus na to, jak takovou polární bázi najít mezi všemi bázemi. Tím se zároveň dovíme podstatné informace o afinních vlastnostech kvadratických forem. Následující věta bývá v literatuře uváděna pod názvem Lagrangeův algoritmus. Věta. Nechť V je reálný vektorový prostor dimenze n, f : V -» R kvadratická forma. Pak na V existuje polární báze pro f. Důkaz. (1) Nechť A je matice / v bázi u = (u\,..., u„) na V a předpokládejme a\\ ^ 0. Pak můžeme psát f(xi, ...,x„)= a\\x\ + 2a\2x\x2 H-----h«22*2 ^----= = a^{a\\x\ + a\2x2 H-----^a\nxn)2+ + členy neobsahující x\. Provedeme tedy transformaci souřadnic (tj. změnu báze) tak, aby v nových souřadnicích bylo x\ = a\\x\ + «12*2 H-----h a\nxn, x'2 = x2,..., x'n = xn. To odpovídá nové bázi (spočtěte si jako cvičení příslušnou matici přechodu!) vi = a^u\, v2 = u2 - a tak, jak lze očekávat, v nové bázi bude příslušná symetrická bilineární forma splňovat g(v\,vi) = 0 pro všechny i > 0 (přepočtěte!). Má tedy / v nových souřadnicích analytický tvar allx\2 + ^> kde h je kvadratická forma nezávislá na proměnné x\. Z technických důvodů bývá lepší zvolit v nové bázi v\ = u \, opět dostaneme výraz / = f\ + h, kde f\ závisí pouze na x'^, zatímco v h se x'j nevyskytuje. Přitom pak g(v\, v\) = a\\. (2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu o jedničku menšího) s koeficientem u xí,2 různým od nuly. Pak můžeme zopakovat přesně stejný postup a získáme vyjádření / = f\ + fi + h, kde v h vystupují pouze proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buď provedeme n — 1 kroků a získáme diagonální tvar, nebo v řekněme í-tém kroku bude prvek a„ právě získané matice nulový. (3) Nastane-li poslední možnost, ale přitom existuje jiný prvek ajj 0 s j > i, pak stačí přehodit i-tý prvek báze s j -tým a pokračovat podle předešlého postupu. (4) Předpokládejme, že jsme narazili na situaci ajj = 0 pro všechny j > i. Pokud přitom neexistuje ani žádný jiný prvek ajk 0 s j > i, k > i, pak jsme již úplně hotovi, neboť jsme již dosáhli diagonální matici. Předpokládejme, že aji ^ 0. Použijeme pak transformaci vj = u j + uk, ostatní vektory báze ponecháme (tj. acj = xk — Xj, ostatní zůstávají). Pak h(vj, vj) = = h(uj,Uj) + h(uk,Uk) + 2h(uk,Uj) = 2aji ^ 0 a můžeme pokračovat podle postupu v (1). □ 4.31. Afinní klasifikace kvadratických forem. Po výpočtu polární báze Lagrangeovým algoritmem můžeme ještě vylepšit bázové vektory pomocí násobení skalárem tak, aby v příslušném analytickém vyjádření naší lormy vystupovaly v roh koeficientů u kvadrátů jednotlivých souřadnic pouze skaláry 1, — 1 a 0. Následující věta o setrvačnosti říká navíc, že počet jedniček a mínus jedniček nezávisí - a^y a\2u\, - axla\nu\ 215 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.46. Určete rovnici kuželosečky (a poté její typ), která prochází body [-2,-4], [8,-4], [0,-2], [0,-6], [6,-2]. Řešení. Do obecné rovnice kuželosečky awx1 + ci22y2 + 2a\2xy + a\x + (12y + a = 0 postupně dosadíme souřadnice zadaných bodů. Takto obdržíme soustavu 4an 64a n 36fli 16fl22 16fl22 4fl22 36fl22 4fl22 16fll2 64fli2 2fli 8fli 24fli2 + 6fli 4fl2 4fl2 2fl2 6fl2 2fl2 + + + + + V maticovém zápisu provedeme úpravy (4 16 16 -2 -4 1\ 64 16 -64 8 -4 1 0 4 0 0 -2 1 0 36 0 0 -6 1 \36 4 -24 6 -2 l) (4 16 16 -2 -4 1 \ 0 4 0 0 -2 1 0 0 64 -8 12 - 9 0 0 0 24 -36 27 v° 0 0 0 3 - V /48 0 0 0 0 -l\ 0 12 0 0 0 -1 0 0 64 0 0 0 0 0 0 24 0 3 v° 0 0 0 3 -2, Hodnotu a můžeme zvolit. Zvolíme-li a = 48, dostaneme a\\ = 1, fl22 = 4, a\2 = 0, a\ = —6, fl2 = 32. Kuželosečka má tudíž rovnici x1 + 4y2 - 6x + 32y + 48 = 0. V této rovnici doplníme výrazy x2 — 6x, 4y2 + 32y na druhé mocniny dvojčlenů, což dává (x - 3)2 + 4(y + 4)2 - 25 = 0, resp. (x - 3)2 + (y + 4)2 _ i = o 52 (tr Vidíme, že se jedná o elipsu se středem v bodě [3, —4]. na našich volbách v průběhu algoritmu. Tyto počty nazývame signaturou kvadratické formy. Opět tedy dostáváme úplný popis kvadratických forem ve smyslu, že dvě takové formy jsou prevoditeľná jedna na druhou pomocí afinní transformace tehdy a jen tehdy, když mají stejnou signaturu. Věta. Pro každou nenulovou kvadratickou formu hodnosti r na reálném vektorovém prostoru V existuje celé číslo 0 < p < r a r nezávislých lineárních forem • • • > Vr = *J—Xrxr, yr+i = xr+i,..., yn — xn již vede na požadovaný tvar. Formy 0 zatímco pro v e Q je f (v) < 0. Nutně tedy platí P n Q — {0}, a proto dimP + dim Q < n. Odtud plyne p + (n — q) < n, tj. p < q. Opačnou volbou podprostorů však získame i q < p. Je tedy p nezávislé na volbě polární báze. Pak ovšem pro dvě matice se stejnou hodností a stejným počtem kladných koeficientů v diagonálním tvaru příslušné kvadratické formy získáme stejný analytický tvar. □ Při diskusi symetrických zobrazení jsme hovořili o definit-ních a semidefinitních zobrazeních. Tatáž diskuse má jasný smysl i pro symetrické bilineární formy a kvadratické formy. Kvadratickou formu / forma na reálném vektorovém prostoru V nazýváme (1) pozitivně definitní, je-li f(u) > 0 pro všechny vektory (2) pozitivně semidefinitní, je-li f(u) > 0 pro všechny vektory u e V, (3) negativnědefinitní, je-li / (u) < 0 pro všechny vektory m 7^0, (4) negativně semidefinitní, je-li f(u) < 0 pro všechny vektory u e V, (5) indefinitní, je-li f(u) > 0 a f (v) < 0 pro vhodné vektory u, v e V. 216 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.47. Další charakteristiky kuželoseček. Zabývejme se ještě podrobněji některými dalšími pojmy, které se pojí s kuželosečkami. Osa kuželosečky je přímka, podle které je kuželosečka osově souměrná. Z kanonického vyjádření kuželosečky v polární bázi (4.29) plyne, že elipsa má dvě osy (x = 0 a y = 0), parabola má jenu osu (x = 0) a hyperbola má dvě osy (x = 0 a y = 0). Průniky os se samotnou kuželosečkou se nazývají vrcholy kuželosečky. Čísla a, b z kanonického vyjádření kuželosečky (které udávají vzdálenost vrcholů od počátku) se nazývají délky poloos. V případě elipsy a hyperboly se osy navzájem protínají v počátku. Podle tohoto bodu je pak kuželosečka zřejmě středově souměrná. Takový bod se nazývá středem kuželosečky. Kromě vrcholů a středů existují ještě další význačné body ležící na ose kuželosečky. Pro elipsu jsou to ohniska elipsy E, F charakterizované vlastností \EX\ + \FX\ = 2a pro libovolný bod X ležící na elipse. Následující příklad ukazuje, že takové body E a F skutečně existují. 4.48. Existence ohnisek. Pro elipsu o velikostech poloos a > fcjsou body E = [—e, 0] a F = [e, 0], kde e = -Ja1 — b1 jejími ohnisky (v polárních souřadnicích). Řešení. Uvažujme body X = [x, y], které splňují podmínku \EX\ + \FX\ = 2a a ukážeme, že to jsou právě body elipsy. V souřadnicích má tato rovnice tvar y/{x + e)2 + ý + y/{x -e)2 + ý = 2a. Umocněním rovnice a její úpravou dostaneme ekvivalentní rovnici (a2 - e2)x2 + flV = a2(a2 - e2). Dosazením e2 rovnici elipsy b2 a vydělením a2b2 dostaneme kanonickou a2 + b2~l □ Poznámka. Číslo e z předchozího příkladu se nazývá excentricita (výstřednost) elipsy. Podobně definujeme ohniska hyperboly jako body E, F, které splňují \\EX\ — \FX\\ = 2a pro libovolný bod X ležící na hyperbole. Můžete si ověřit, že tuto vlastnost splňují v polární bázi body [—e, 0] a [e, 0], kde e = yja2 + b2. Ohnisko paraboly je bod F, který má v polární bázi souřadnice F = [0, |] a je charakterizován tím, že jeho vzdálenost od libovolného bodu X paraboly je stejná jako jako vzdálenost X od přímky y £ 2M 4.49. Určete ohniska elipsy x2 + 2y2 = 2. Řešení. Z rovnice přímo odečteme, že velikosti poloos jsou a = *J2 a b = 1. Poté již snadno dopočítáme z předchozího příkladu (||4.48||): e = v'a2 — b2 = 1, souřadnice ohnisek jsou tedy [—1, 0] a [1, 0]. □ Stejné názvy používáme i pro symetrické reálné matice, j sou-li maticemi patřičných kvadratických forem. Signaturou symetrické matice pak rozumíme signaturu příslušné kvadratické formy. 4.32. Věta (Sylvestrovo kritérium). Symetrická reálná matice A je pozitivně definitní, právě když jsou všechny její vedoucí hlavní mi-nory kladné. Symetrická reálná matice A je negativně definitní, právě když (—1)'|A,-| > 0 pro všechny vedoucí hlavní submatice A,-. Důkaz. Budeme si muset podrobněji rozebrat, jak vypadají transformace použité v Lagrangeově algoritmu pro konstrukci polární báze. Transformace použité v prvním kroku tohoto algoritmu mají vždy horní trojúhelníkovou matici T a navíc, při použití technické modifikace zmíněné v důkazu věty 4.30, má tato matice jedničky na diagonále: «11 ''' «n \ 0 1 ... 0 T = v: Taková matice přechodu od báze u k bázi v má několik pěkných vlastností. Zejména její vedoucí hlavní submatice Tk tvořené prvními k řádky a sloupci jsou matice přechodu podprostorů Pk ~ ("i, ■ ■ ■, ui) od báze (mi, ..., uk) k bázi (v\ ..., vk). Hlavní submatice Ak matice A formy / jsou maticemi zúžení formy / na Pk. Při přechodu oduki) daném maticí přechodu T jsou tedy matice Ak a A'k zúžení na podprostory Pk ve vztahu Ak — TkT A'k(Tk)~l. Inverzní matice k horní trojúhelníkové matici s jedničkami na diagonále je přitom opět horní trojúhelníková matice s jedničkami na diagonále, můžeme tedy podobně vyjádřit i A' pomocí A. Podle Cauchyovy věty jsou tedy determinanty matic Ak a A'k stejné. Celkem jsme tak dokázali velice užitečné pomocné tvrzení: Nechť je f kvadratická forma na V, dim V — n, a nechť je u báze V taková, že při hledání polární báze Lagrangeovým algoritmem není nikdy potřebné použit body (3) a (4). Pak je výsledkem analytické vyjádření f(xi , Xn) = k\x\ + A.2*2 ■ + Kxt kde r je hodnost formy f,X\,...,Xr ^ 0 a pro vedoucí hlavní submatice (původní) matice A kvadratické formy f platí \Ak\ = A.iA.2 ...Xk,k l A l 2 lA2l 2 , , \Ar\ Jsou-li tedy všechny vedoucí hlavní minory kladné, pak podle právě dokázané Jacobiho věty je jistě / pozitivně definitní. 217 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.50. Dokažte, že součin vzdáleností ohnisek elipsy od její libovolné tečny je konstantní a zjistěte velikost této konstanty. Řešení. Uvažme polární bázi. V ní má matice elipsy diagonální tvar diag(^-, p, — l) a rovnice poláry (tečny) v bodě X=[x0, y0] má tvar fi* + fi)1 = 1- Vzdálenost ohnisek E,F= [+~e, 0] od této přímky je rovna a jejich součin je tedy 1 ±ei "4 Ir l-e2^ _ 0. Nechťw je zvolená báze, ve které má forma / matici A. Zúžení / na podprostory Vj = («i, ..., uk) je opět pozitivně definitní forma fi, jejíž maticí v bázi u\, ..., u k je vedoucí hlavní submatice Aj. Proto je podle předchozí části důkazu také \ Ak\ > 0. Tvrzení o negativně definitních vyplývá z předchozího a skutečnosti, že A je pozitivně definitní právě, když —A je negativně definitní. □ 3. Projektivní geometrie V mnoha elementárních textech o analytické geometrii autoři ytsa končí afinními a euklidovskými objekty popsanými C~^Í výše. Na spoustu praktických úloh euklidovská nebo i''^^v% afinní geometrie stačí, na jiné bohužel ale nikoliv. -wrSrgi-i— Tak třeba při zpracovávání obrazu z kamery nejsou zachovávány úhly a rovnoběžné přímky se mohou (ale nemusí) protínat. Dalším dobrým důvodem pro hledání širšího rámce geometrických úloh a úvah je požadovaná robustnost a jednoduchost numerických operací. Daleko jednodušší jsou totiž operace prováděné prostým násobením matic a velice těžko se od sebe odlišují malinké úhly od nulových, proto je lepší mít nástroje, které takové odlišení nevyžadují. Základní ideou projektivní geometrie je rozšíření afinních prostorů o body v nekonečnu způsobem, který bude dobře umožňovat manipulace s lmeárními objekty typu bodů, přímek, rovin, projekcí, apod. 4.33. Projektivní rozšíření afinní roviny. Začneme tím nejjed-nodušším zajímavým případem, geometrií v rovině. Jestliže si body roviny Ai představíme jako rovinu z = 1 v 1Z3, pak každý bod P naší afinní roviny představuje vektor u — (x, y, 1) e R3 a tím i jednorozměrný podprostor (u ) c R3. Naopak, skoro každý jednorozměrný podprostor v R3 protíná naši rovinu v právě jednom bodě P a jednotlivé vektory takového podprostoru jsou dány souřadnicemi (x, y, z) jednoznačně, až na společný skalární násobek. Žádný průnik s naší rovinou nebudou mít pouze podprostory s body o souřadnicích (x, y, O). __( Projektivní rovina [__, Definice. Projektivní rovina V2 je množina všech jednorozměrných podprostorů v R3. Homogenní souřadnice bodu P — (x : y : z) v projektivní rovině jsou trojice reálných čísel určené až na společný skalární násobek, přičemž alespoň jedno z nich musí být nenulové. Přímka v projektivní rovině je definována jako množina jednorozměrných podprostorů (tj. bodů v V2), které vyplní dvourozměrný podprostor (tj. rovinu) v R3. Abychom měli před očima konkrétní příklad, podívejme se v afinní rovině R2 na dvě rovnoběžné přímky 1=0, L2 : y -x + 1 = 0. Jestliže budeme body přímek ti a L2 chápat jako konečné body v projektivním prostoru V2, budou zjevně jejich homogenní souřadnice (x : y : z) splňovat rovnice -1 : y - :0, L2:y-x+z = 0. 218 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Řešení. Směrový vektor přímky je (1, k) a proto je parametrické vyjádření přímky x = — 4+t, y = 2+kt. Průsečík s elipsou pak splňuje (-4 +Q2 (2 + kt)2 _ 9 4 Tato kvadratická rovnice má diskriminant roven k D = —9(7k + 16). To znamená, že v intervalu k e (——, 0) má dvě řešení, tj. přímka je sečna, a pro směrnici k = — — a k = 0 jediné řešení, tj. přímka je tečna. □ 4.53. Najděte rovnici tečny k elipse 3x2 + 7y2 =30, jejíž vzdálenost od středu elipsy je rovna 3. Řešení. Střed elipsy jev počátku souřadnic a pro vzdálenost d přímky ax + by + c = 0 od počátku se odvodí d = -7==. Tečna ze za- dání tedy splňuje a2 + b2 = Rovnice tečny v bodě [xT, yT] je 3xxT + lyyT — 30 = 0. Pro souřadnice bodu dotyku tak dostáváme soustavu (3xT)2 3x\ + + (7vr)2 7y2 100, 30. -I- /55 v ±J—, yr Jejím řešením je xT elipsy dostáváme čtyři řešení ±3 J^x ± TJj^y — 30 = 0. i V 14 • Vzhledem k symetrii □ 4.54. Je dána hyperbola x2 — y2 = 2. Určete rovnici hyperboly, která má stejná ohniska a prochází bodem [—2, 3]. Řešení. Výstřednost zadané hyperboly je e = *J2 + 2 = 2. Rovnice 2 2 hledané hyperboly bude ^ — |j = 1 a její výstřednost bude splňovat e2 = a2 + b2 = 4. Podmínka, že bod [—2, 3] leží na hyperbole dává ^2 — p = 1. Řešením této soustavy je a2 hyperbola je tedy x2 — — = 1. 1, b2 3. Hledaná □ 4.55. Určete rovnice tečen hyperboly Ax2 — 9y2 = 1, kolmých na přímku x — 2y + 1 = 0. Řešení. Všechny přímky kolmé na zadanou přímku mají tvar 2x + y + c = 0 pro nějaké c. Hledaná přímka má mít právě jeden průnik se zadanou hyperbolou, tj. rovnice Ax2 — 9(—2x — c)2 = 1 má mít jedno řešení. To nestane tehdy, když D = (36c)2 - 4.32. (9c2 + 1) = 0. Odtud c ± 2V2 3 • □ Je vidět, že průnikem L\ n L2 bude v tomto kontextu bod (—1 : 1 : 0) e Vi, tj. nevlastní bod odpovídající společnému zaměření obou přímek. 4.34. Afinní souřadnice v projektivní rovině. Pokud začneme ^í> 1 naopak projektivní rovinou Vi a budeme v ní chtít uvidět •5^ aflnnírovinu jako její „konečnou" část, pak můžeme místo x roviny z = 1 vzít v R" zející počátkem 0 e norozměrné podprostory, které mají neprázdný průnik s rovinou jakoukoliv jinou rovinu a neprochá-J3. Konečné body pak budou ty jed- Pokračujme v našem příkladu rovnoběžných přímek z předchozího odstavce a podívejme se, jak budou jejich rovnice vypadat v souřadnicích v afinní rovině, která bude dána jako y = 1. Za tím účelem stačí dosadit y = 1 do předchozích rovnic: L[:l-x-z = 0, L'2 : 1 - x + z = 0. Nyní jsou „nekonečné" body naší původní afinní roviny dány vztahem z = 0 a vidíme, že naše přímky L\ a L'2 se protínají v bodě (1, 1,0). To odpovídá geometrické představě, že rovnoběžné přímky L\, L2 v afinní rovině se protínají v nekonečnu a to v bodě (1 : 1 : 0). 4.35. Projektivní prostory a transformace. Náš postup v afinní rovině se přirozeným způsobem zobecňuje na každou konečnou dimenzi. Volbou libovolné afinní nadroviny A„ ve vektorovém prostoru R™+1, která neprochází počátkem, můžeme ztotožnit body P e A„ s jednorozměrnými podprostory, které tyto body generují. Zbylé jednorozměrné podprostory vyplní nadrovinu rovnoběžnou s A„ a říkáme jim nekonečné body nebo také nevlastní body v projektivním rozšíření V„ afinní roviny A„. Zjevně je vždy množina nevlastních bodů v V„ projektivním prostorem dimenze o jedničku nižším. Afinní přímka má ve svém projektivním rozšíření pouze jediný nevlastní bod (oba konce přímky se „potkají" v nekonečnu a projektivní přímka proto vypadá jako kružnice), projektivní rovina má projektivní přímku nevlastních bodů, trojrozměrný projektivní prostor má projektivní rovinu nevlastních bodů atd. Ještě obecněji zavádíme projekttvizaci vektorového prostoru: pro libovolný vektorový prostor V dimenze n + 1 definujeme V(V) = {P c V; P c V, dim V = 1). Volbou libovolné báze u ve V dostáváme tzv. homogenní souřadnice na V(V) tak, že pro P e V(V) použijeme jeho libovolný nenulový vektor u e V a souřadnice tohoto vektoru v bázi u. Bodům projektivního prostoru V(V) říkáme geometrické body, zatímco jejich nenulové generátory ve V nazýváme říkáme aritmetické reprezentanty. Při zvolených homogenních souřadnicích je možné jednu z jejich hodnot zafixovat na jedničku (tj. vyloučíme všechny body projektivního prostoru s touto souřadnicí nulovou) a získáme tak vložení n-rozměrného afinního prostoru A„ C V( V). To je přesně konstrukce, kterou jsme použili v našem příkladu projektivní roviny. 219 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.56. Projektivní pohled na kuželosečky. Pojem projektivního prostoru nám také umožňuje se novým pohledem podívat na již známé kuželosečky (srovnej s 4.42). Kuželosečku v £2 zadanou kvadratickou formou f(x, y) = awx1 + 2anxy + fl22V2 + 2a\3x + 2any + «33 můžeme chápat jako množinu bodů v projektivní rovině V2 s homogenními souřadnicemi (x : y : z), které jsou nulové body homogenní kvadratické formy f(x, y, z) = anx2 + 2anxy + a22y2 + 2al3xz + 2a2j,yz + a33z2. Tu můžeme jednoduše psát jako f (v) = vTAv, kde v je sloupcový vektor o souřadnicích (x, y, z) a matice A je symetrická matice (fly). Podle věty 4.31 existuje báze, ve které má tato kvadratická forma jeden z následujících tvarů f(x, y, z) = x2 + y2 + z2, fix, y,z) = x2 +ý -z2. V prvním případě je řešením f(x, y, z) = 0 jediný (nevlastní) bod a proto původní forma nezadávala reálnou kuželosečku. Druhá kvadratická forma zadává kužel v K3. Příslušnou kuželosečku dostaneme přechodem zpět k nehomogenním souřadnicím. To znamená řezem tohoto kužele rovinou, která měla v původní bázi rovnici z = 1. Odtud dostaneme ihned klasifikaci kuželoseček z 4.29., která odpovídá řezům kužele v K3 různými rovinami. Řezy, které dávají vlastní kuželosečky jsou znázorněny na obrázku. Nevlastní kuželosečky odpovídají řezům rovinami, které prochází vrcholem kužele. Pro kuželosečku v projektivní rovině definujeme následující užitečné pojmy: Body P, Q € V2 příslušné jednorozměrným podprostorům (p),(q) (generovanými vektory p,q e K3) se nazývají polárně sdružené vzhledem ke kuželosečce /, pokud platí F(p, q) = 0, tj. pTAq = 0. Bod P = (p) se nazývá singulárním bodem kuželosečky /, jestliže je polárně sdružený vzhledem k / se všemi body roviny, tj. F(p, x) = 0 pro všechna x e V2. To jinými slovy znamená Ap = 0. Tím pádem matice A kuželosečky se singulárním bodem 4.36. Perspektivní projekce. Velmi dobře jsou výhody pro-íiV jektivní geometrie vidět na perspektivní projekci ~?í~\"? K3 -» K2. Přestavme si, že pozorovatel sedící w^tífe/ v počátku pozoruje „polovinu světa", tj. body ^íô—rí (X, Y, Z) e R3 se Z > 0 a obraz vidí „promítnutý" na plátně daném rovinou Z — f > 0. Bod (X, Y, Z) „reálného světa" se mu tedy promítá na bod (x, y) na průmětně takto: y = f- To je nejen nelineární formule, ale navíc při Z malém bude velice problematická přesnost výpočtů. Při rozšíření této transformace na zobrazení V3 —> V2 dostáváme zobrazení (X : Y : Z : W) m> (x : y : z) = (fX : f Y : Z), tj. popsané prostým lineárním vztahem / 0 0 0 0/00 0 0 10 Y Z Tento jednoduchý výraz zadává perspektivní projekci pro konečné body v R3 C P3, které dosazujeme jako výrazy s W — 1. Přitom jsem elegantně odstranili problémy s body, jejichž obraz utíká do nekonečna. Skutečně, je-li Z-ová souřadnice skutečného bodu scény blízká nule, bude hodnota třetí homogenní souřadnice obrazu mít souřadnici blízkou nule, tj. bude představovat bod blízký nekonečnu. 4.37. Afinní a projektivní transformace. Každé prosté lineární j.if.' » zobrazení

V2 mezi vektorovými prostory sa-Hí^> mozřejmě zobrazuje jednorozměrné podprostory na jedno-r\i^- rozměrné podprostory. Tím vzniká zobrazení na projekti vi-:í'- ! žacích T : V(V\) —> Viyi)- Takovým zobrazením říkáme projektivní zobrazení, v literatuře je používán také pojem koline-ace, pokud je toto zobrazení invertibilní. Jinak řečeno, projektivní zobrazení je takové zobrazení mezi projektivními prostory, že v každé soustavě homogenních souřadnic na definičním oboru i obrazu je toto zobrazení zadáno násobením vhodnou maticí. Obecněji, pokud naše pomocné lineární zobrazení není prosté, definuje projektivní zobrazení pouze mimo svoje jádro, tj. na bodech, jejichž homogenní souřadnice se nezobrazují na nulu. Prostá zobrazení V —> V vektorového prostoru na sebe jsou invertibilní, všechna projektivní zobrazení projektivního prostoru Vn na sebe jsou tedy invertibilní též. Říká se jim také regulární kolineace nebo projektivní transformace. Odpovídají v homogenních souřadnicích invertibilním maticím dimenze n +1. Dvě takové matice zadávají stejnou projektivní transformaci, právě když se liší o konstantní násobek. Jestliže si zvolíme první souřadnici jako tu, jejíž nulovost určuje nevlastní body, budou transformace, které zachovávají nevlastní body, dány maticemi, jejichž první řádek musí být až na první člen nulový. Jestliže budeme chtít přejít do afinních souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku, musí být první prvek na prvním řádku být také rovný 220 KAPITOLA 4. ANALYTICKÁ GEOMETRIE nemá maximální hodnost a tak zadává nevlastní kuželosečku. Vlastní kuželosečky tedy neobsahují singulární body. Množinu všech bodů X = (x) polárně sdružených s bodem P = (p) nazýváme polámu bodu P vzhledem ke kuželosečce /. Je to tedy množina bodů, pro které platí F (p, x) = pTAx = 0. Protože je polára zadaná lineární kombinací souřadnic, je to vždy (v nesingu-lárním případě) přímka. Geometrický význam poláry vysvětluje následující věta. 4.57. Charakterizace polár. Uvažme vlastní kuželosečku / Polárou bodu P € f vzhledem k projektivní kuželosečce / je tečna k / s bodem dotyku P. Polárou bodu P £ f je přímka daná body dotyku tečen sestrojených z bodu P ke kuželosečce /. Řešení. Nejprve uvažujme P € f a ukážeme sporem, že polára má s kuželosečkou právě jeden společný bod (bod dotyku). Předpokládejme tedy, že polára bodu P, určená rovnicí F(p,x) = 0, protne vlastní kuželosečku / v bodě Q = (q) ^ P. Pak zřejmě platí F(p,q) = 0a/(í) = F(q,q) = 0. Pro libovolný bod X = (x) ležící na přímce určené body P a Q pak máme x = ap + fiq pro nějaké a, fi e K. Díky bilinearitě a symetrii F pak dostáváme f(x) = F(x, x) = a2F(p, p) + 2a/3F(p, q) + /32 F(q, q) = 0 a to znamená, že každý bod X přímky leží na kuželosečce /. Když ale kuželosečka obsahuje přímku, pak musí být nevlastní, což je spor s předpokladem. Zároveň vidíme, že v případě nevlastní kuželosečky je polárou samotná (tzv. tvořící) přímka kuželosečky. Tvrzení pro případ P £ f vyplývá z následujícího důsledku symetrie bilineární formy F. Pokud bod Q leží na poláře bodu P, pak bod P leží na poláře bodu Q. □ Pomocí polárně sdružených bodů můžeme také nalézt bez použití Lagrangeova algoritmu rovnice os kuželoseček i střed kuželosečky. Napišme matici kuželosečky jako blokovou matici A=(\ a\ jedné. Matice kolineací zachovávajících konečné body našeho afinního prostoru tedy mají tvar: /l 0 ••• 0 \ b\ au ■■■ au \b„ an\ ■■■ a„„J kde b — (b\, ..., bn)T e R™ a A = (ay) je invertibilní matice dimenze n. Působení takové matice na vektoru (\,x\, ... ,xn) je právě obecná afinní transformace, kde b zadává posunutí a A její lineární část. Jsou tedy afinní zobrazení právě ty kolineace, které zachovávají nadrovinu nevlastních bodů. 4.38. Určení kolineací. K zadání afinního zobrazení je nutné a stačí libovolně zadat obraz afinního repéru. V právě \, uvedeném popisu afinních transformací jako speciálního případu projektivních zobrazení to odpovídá vhodné volbě obrazu vhodné aritmetické báze vekto- rového prostoru V. Obecně ale neplatí, že obraz aritmetické báze V jednoznačně určí kolineací. Ukažme si podstatu problému na jednoduchém příkladu afinní roviny. Jestliže si zvolíme v rovině čtyři body A, B, C, D tak, aby každá z nich utvořená trojice byla v obecné poloze (tj. žádné tři z nich neleží na jedné přímce), můžeme si libovolně zvolit jejich obraz v kolineací následujícím způsobem: Zvolme jakkoliv jejich čtyři obrazy A', É, C, D' se stejnou vlastností a zvolme si jejich homogenní souřadnice u, v, w, z, u', v', w', z' v R3. Vektory z a z' pak můžeme jistě zapsat pomocí lineárních kombinací z = c\u + C2V + c3u), z = c\u! + c'iv + c3u/, přičemž všech šest koeficientů musí být nenulových, neboť jinak by některá trojice z našich bodů nebyla v obecné poloze. Nyní si zvolíme nové aritmetické reprezentanty bodů A, B a C po řadě jako u — c\u, v = civ a w — c3w a stejně ú' = c\u', v' — C2v' aw' — cjw' pro body A', É a C. Tato volba zadává jediné lineární zobrazení

apodobněpro Az, a proto i čtveřice obrazů našich bodů bude mít stejný dvojpoměr. Zastavme se ještě u charakterizace projektivních transformací. Opět platí, že jsou to právě ta zobrazení, která zachovávají dvojpoměry. Ve skutečnosti to ale není příliš praktická charakterizace, protože implicitně obsahuje i tvrzení, že taková zobrazení musí zobrazovat projektivní přímky na projektivní přímky. Lze ale dokázat daleko silnější tvrzení, že zobrazení jakkoliv malé otevřené oblasti v afinním prostoru M" (např. koule bez hranice), do téhož afinního prostoru, které zobrazuje přímky na přímky, je ve skutečnosti zúžením jednoznačně určené projektivní transformace projektivního rozšíření VRn+l původního afinního prostoru M". A tyto transformace tedy nutně zachovávají i dvojpoměry. 4.40. Dualita. Projektivní nadroviny jsou definovány projek-, í> .i tivním prostoru V(V) dimenze n jako projektivizace tn-rozměrných vektorových podprostoru ve vektorovém N prostoru V. Jsou tedy v homogenních souřadnicích i definovány jako jádra lineárních forem a e V*, které jsou opět určeny až na skalární násobek. Ve zvolené aritmetické bázi jsou tedy projektivní nadroviny dány řádkovým vektorem a = (ao, a„). Přitom ale j sou formy a dány jednoznačně, až na skalární násobek. Každá nadrovina ve V tedy je identifikována s právě jedním geometrickým bodem v pro-jektivizaci duálního prostoru V(V*). Hovoříme o duálním projektivním prostoru a dualitě mezi body a nadrovinami. 222 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Kosinus úhlu, který tečna svírá s osou paraboly (x = 0) je daný skalárním součinem příslušných jednotkových směrových vektorů. Jednotkový směrový vektor tečny je , 1 (p, xo), a proto pro kosinus platí Vp2+*o Na formách působí lineární zobrazení zadávající danou koli-neací pomocí násobení řádkových vektorů zprava toutéž maticí xo p2+X2 yjp2+x20 Nyní ukážeme, že kosinus úhlu, který tečna svírá se spojnicí ohniska F=[0, |] a bodem dotyku X je stejný. Jednotkový směrový vektor spojnice je y*2o+(yo-§)2V 27 Pro kosinus úhlu pak máme :{x0y0 + — j. Dosazením y o = jj; a úpravou výrazu dostaneme Tento příklad ukazuje, že paprsky světla dopadající rovnoběžně s osou na parabolické zrcadlo, se odrážejí do ohniska a naopak, paprsky světla vyzařovaného z ohniska se odráží stejným směrem (rovnoběžně s osou). To je principem mnoha zařízení, např. parabolický reflektor, parabolická anténa. □ 4.61. Najděte rovnici tečny v bodě P = [1, 1] ke kuželosečce Ax2 + 5y2 - %xy + 2y - 3 = 0. Řešení. Projektivizací dostaneme kuželosečku zadanou kvadratickou formou (x, y, z)A(x, y, z)T s maticí / 4 -4 0 \ A = -4 5 1 . \° 1 -v Podle předchozí věty je tečna polárou bodu P, který má homogenní souřadnice (1:1: 1). Taje dána rovnicí (1,1, í)A(x, y, z)T = 0, což v našem případě dává rovnici 2y-2z = 0. Přechodem zpět k nehomogenním souřadnicím dostaneme rovnici tečny y = 1. □ 4.62. Určete souřadnice bodu dotyku osy y s kuželosečkou zadanou rovnicí 5x2 + 2xy + y2 - Sx = 0. Řešení. Osa y, tj. přímka x = 0, je polárou hledaného bodu P s homogenními souřadnicemi (p) = (p\ : p2 : pí). To znamená, že rovnice a = (ao, a ■ A . tj. matice duálních zobrazení je AT. Duální zobrazení ovšem zobrazuje formy opačným směrem z „cílového prostoru" ne „počáteční", proto potřebujeme pro současné studium vlivu regulární kolineace na body a jejich duální nadroviny zobrazení inverzní ke kolineaci /. To j e dáno maticí A ~1. Matice příslušného působení kolineace na formách j e proto (Ar)_1. Protože je přitom inverzní matice rovna algebraicky adjungované matici A*]g, až na násobek inverzí determinantu, viz vztah (2.2) na str. 83, můžeme rovnou pracovat s projektivní transformací prostoru V(V*) zadanou maticí (A^g)r (nebo bez transponování, pokud násobíme řádkové vektory zprava). Okamžitě z definic je vidět, že projektivní bod X patří nadro-vině a, když pro jejich aritmetické souřadnice platí a ■ x — 0. To samozřejmě zůstává v platnosti i po působení libovolnou kolineaci, protože opět (a ■ A-1) ■ (A ■ x) — a ■ x — 0. 4.41. Samodružné body, středy a osy. Uvažujme regulární kolineaci / zadanou v nějaké aritmetické bázi projektivního prostoru V(V) pomocí matice A. Samodruíným bodem kolineace / rozumíme bod A, který je zobrazen na sebe, tj. /(A) = A, samodruinou nadrovinou kolineace f rozumíme nadrovinu a, která je zobrazována na sebe, tj. f (a) c a. Přímo z definice tedy vidíme, že samodružné body mají za aritmetické reprezentanty právě vlastní vektory matice A. V geometrii roviny jsme se s mnoha typy kolineaci již jistě setkali: symetrie podle středu, zrcadlení podle přímky, posunutí, stejnolehlost atd. Možná vzpomeneme i na různé typy promítání, např. promítání jedné roviny v R3 na druhou z nějakého středu 5 e R3. Všimněme si, že kromě samodružných bodů se u všech takových afinních zobrazení objevovaly také samodružné přímky. Např. u symetrie podle středu se zachovávají také všechny přímky tímto středem procházející, u posunutí se (obdobně) zachovávají nevlastní body roviny. Zastavíme se u tohoto jevu v obecné dimenzi. Nejprve zavedeme velmi klasický pojem související s incidencí bodů a nadro-vin. Trs nadrovin procházejí bodem A e V(V) je množina všech nadrovin, které obsahují bod A. Z definice je zřejmé, že pro každý bod A je příslušný trs nadrovin sám nadrovinou v duálním prostoru V(V*) (je zadán jednou homogenní lineární rovnicí v aritmetických souřadnicích). Pro kolineaci / : V(V) -> V(V) řekneme, že bod 5 e V(V) je středem kolineace f jestliže všechny nadroviny v trsu nadrovin určeném bodem 5 jsou samodružné. Řekneme, že nadrovina a je osou kolineace / Jestliže jsou všechny její body samodružné. Přímo z definice je zřejmé, že osa kolineace je středem kolineace duální, zatímco trs nadrovin zadávajících střed kolineace je sám osou kolineace duální. Protože matice kolineace na původním a duálním prostoru se liší pouze transpozicí, jejich vlastní čísla splývají (vlastní vektory 223 KAPITOLA 4. ANALYTICKÁ GEOMETRIE x = 0 je ekvivalentní rovnici poláry F(p, v) = pTAv = 0, kde v = (x, y, z)r.To je splněno právě v případě, když Ap = (a, 0, 0)r pro nějaké a e K. Tato podmínka dává pro matici naší kuželosečky -4\ soustavu rovnic 5pi + Pí - 4p3 Pl + P2 -4pi a, 0, 0. Buď můžeme najít souřadnice bodu P pomocí inverzní matice, p = A-1 (a, 0, 0)r, nebo vyřešit tuto soustavu rovnic přímo, zpětným dosazováním. V tomto případě takto dostaneme lehce řešení p = (0,0,-ia). Osa y se tedy dotýká kuželosečky v počátku. □ 4.63. Určete bod dotyku přímky x = 2 s kuželosečkou z předchozího přikladu. Řešení. Přímka má v projektivním rozšíření rovnici x — 2z = 0, a proto v tomto případě dostaneme pro bod dotyku P podmínku Ap = (a, 0, —2a), což dává soustavu 4p3 = 5pi + Pi P\ + Pi -4pi a, 0, -2a. Jejím řešením je p = {^a, —\a, \a). Tyto homogenní souřadnice jsou ekvivalentní souřadnicím (2, —2,1) a proto proto má bod dotyku souřadnice [2, —2]. □ 4.64. Najděte rovnice tečen sestrojených z bodu P = [3, 4] ke kuželosečce zadané rovnicí 2X2 - Axy + y2 2x+6y-3 = 0. Řešení. Předpokládejme, že bod dotyku T hledané tečny má homogenní souřadnice dané násobky vektoru / = (t\, t2, /3). Podmínka, že T leží na kuželosečce je f At = 0, což dává 2řx - Atxt-i + 4 - 2txt3 + 6t2t3 - 3t\ = 0. Podmínka, že bod P leží na poláře bodu T je pT At = 0, kde p = (3,4, 1) jsou homogenní souřadnice bodu P. Tato rovnice v našem případě dává jsou sloupcové, resp. řádkové, k týmž vlastním číslům). Např. v projektivní rovině (a ze stejného důvodu v každém reálném projektivním prostoru sudé dimenze) má každá kolineace alespoň jeden samodružný bod, protože charakteristické polynomy příslušných lineárních zobrazení jsou Uchého stupně a tedy mají alespoň jeden reálný kořen. Nebudeme se již zde dále věnovat obecné teorii, ale budeme aspoň krátce ilustrovat její užitečnost na několika výsledcích pro projektivní roviny. Tvrzení. Projektivní transformace roviny různá od identity má buď právě jeden střed a právě jednu osu, nebo nemá ani střed ani osu. Důkaz. Uvažme kolineaci / na VM? a uvažme, že by měla dva různé středy A a B. Označme í přímku zadanou těmito středy a zvolme bod X v projektivní rovině mimo t. Jsou-li p a q po řadě přímky procházející dvojicemi bodů (A, X) a (B, X), pak také f(p) = p a f(q) = q a tedy zejména je i bod X samodružný. To ale znamená, že všechny body roviny mimo t jsou samodružné. Každá přímka různá od í má tedy všechny body mimo í samodružné a proto je i její průnik s í samodružný. Je tedy / identické zobrazení a dokázali jsme, že neidentická projektivní transformace může mít nejvýše jeden střed. Tatáž úvaha pro duální projektivní rovinu nám dává výsledek o nejvýše jediné ose. Jestliže má / střed A, pak všechny přímky procházející A jsou samodružné a odpovídají proto dvourozměrnému podprostoru vlastních řádkových vektorů příslušné matice pro transformaci /. Proto bude existovat dvourozměrný prostor sloupcových vlastních vektorů ke stejnému vlastnímu číslu a ten bude reprezentovat právě přímku samodružných bodů, tedy osu. Tatáž úvaha v obráceném pořadí dokazuje i opačné tvrzení — jestliže má projektivní transformace roviny osu, má i střed. □ Pro praktické problémy je užitečné i pro reálnou rovinu pracovat v jejím komplexním projektivním rozšíření a geometrické chování transformací je pak velmi dobře čitelné z případné existence reálných či imaginárních středů a os. 4.42. Projektivní klasifikace kvadrik. Závěrem se ještě vrátíme ke kuželosečkám a kvadrikám. V n-rozměrném afinním prostoru M" zadáváme kvadriku Q v afinních souřadnicích pomocí obecné kvadratické rovnice (4.4), viz str. 210. Pohlížíme-li na afinní prostor M" jako na afinní souřadnice v projektivním prostoru TW+l, můžeme chtít tutéž množinu Q popsat pomocí homogenních souřadnic v projektivním prostoru. V nich by mělo jít o výraz, jehož všechny členy jsou druhého řádu, protože pouze vynulování takového homogenního výrazu bude mít pro homogenní souřadnice bodu smysl nezávisle na zvoleném konstantním násobku souřadnic (xq,x\, ... ,xn). Hledáme tedy takový výraz, jehož zúžením na afinní souřadnice, tj. dosazením xq = 1, získáme původní výraz z (4.4). To je ale mimořádně jednoduché, prostě dopíšeme dostatek xq ke všem výrazům - žádný ke kvadratickým členům, jedno k lineárním a Xq ke konstantnímu členu v původní afinní rovnici pro Q. Získáme tak dobře definovanou kvadratickou formu / na vektorovém prostoru R™+1, jejíž nulové body korektně definují tzv. projektivní kvadriku Q. Průnik „kužele" Q C R™+1 nulových bodů této formy s afinní rovinou:to = 1 jepůvodní kvadrika Q, jejíž body označujemejako 224 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Nyní můžeme dosadit například t2 = 3/i — 6/3 do předchozí (kvadratické) rovnice. Potom dostaneme -t\ +4/1/3 - 3/2 = 0. Protože pro t3 = 0 rovnice není splněna, můžeme přejít k nehomogenním souřadnicím 'f}, lj, pro které dostáváme + 4 h íh ■ 3 = 0 a - = 3 ' tj. i = 1 a f = -3, nebo f = 3 a ? = 3. Body dotyku tedy '3 '3 '3 '3 mají homogenní souřadnice (1 : —3 : 1) a (3 : 3 : 1). Rovnice tečen dostaneme jako poláry těchto bodů. Výsledné rovnice tečen jsou Ix - 2y - 13 = Oax = -3. □ 4.65. Napište rovnici tečny vedené počátkem ke kružnici zadané rovnicí x2 + y2 - lOx - 4y + 25 = 0. Řešení. Bod dotyku (t\ : t2 : t3) splňuje / 1 0-5 (0,0, 1) 0 1 -2 1-5 -2 25 -5/i - 2/2 + 25 = 0. Odtud vyjádříme např. t2 a dosadíme do rovnice kuželosečky (kružnice), kterou musí bod (t\ : t2 : t3) také splňovat. Dostaneme kvadratickou rovnici 29/f - 250/1 + 525 = 0, která ma resem h = 5 a t\ Souřadnici t2 dopočítáme a získáme body dotyku [5, 0] a [j^, ^]. Hledané tečny jsou pak poláry těchto bodů. Ty mají rov- . 29 ' 29 nice y = 0 a 20* — 21y = 0 □ 4.66. Najděte rovnice tečen ke kružnici x2 + y2 =5 rovnoběžných s přímkou 2x + y + 2 = 0. Řešení. V projektivním rozšíření se tyto tečny protínají v nevlastním bodě splňujícím 2x + y + z = 0tj.v bodě s homogenními souřadnicemi (1 : —2 : 0). Jsou to tedy tečny spuštěné z tohoto bodu ke kružnici a postupovat můžeme stejně jako v předchozím příkladě. Matice kuželosečky (kružnice) je diagonální s diagonálou (1,1, —5), a proto bod dotyku (t\ :t2:t3) hledaných tečen splňuje t\ — 2t2 = 0. Dosazením do rovnice kružnice dostaneme 5t\ =5. Odtud máme t2 = ±1 a body dotyku proto jsou [2, 1] a [—2, —1]. □ Tečna v nevlastním bodě kuželosečky se nazývá asymptota kuželosečky. Počet asymptot kuželosečky se tedy rovná počtu průsečíků kuželosečky s přímkou nevlastních bodů, tj. elipsa nemá žádnou reálnou asymptotu, parabola má jednu (která je ovšem nevlastní přímkou) a hyperbola dvě. vlastní body kvadriky, zatímco další body Q \ Q v projektivním rozšíření jsou body nevlastní. Klasifikace reálných či komplexních projektivních kvadrik, až na projektivní transformace, je úlohou, kterou jsme již zvládli — jde prostě o nalezení kanonické polární báze, viz odstavec 4.29. Z této klasifikace dané v reálném případě signaturou formy, v komplexním pouze hodností, vcelku snadno můžeme dovodit i klasifikace kvadrik afinních. Stačí si všímat množiny nekonečných bodů v projektivním rozšíření naší afinní kvadriky. Ukážeme si podstatu postupu na případu kuželoseček v afinní a projektivní rovině. Projektivní klasifikace dává následující možnosti, popsané v homogenních souřadnicích (x : y : z) v projektivní rovině VM?: • imaginární regulární kuželosečka zadaná x2 + y2 + z2 — 0, • reálná regulární kuželosečka s rovnicí x2 - z2 = 0, • dvojice imaginárních přímek s rovnicí x2 + y2 = 0, • dvojice reálných přímek s rovnicí x2 -y2 =0, • dvojnásobná přímka x2 — 0. Klasifikaci uvažujeme jako reálnou, tj. klasifikace kvadratických forem je dána nejen hodností, ale i signaturou, nicméně body kvadrik pak uvažujeme i v komplexním rozšíření. Tak je třeba chápat uvedené názvy, např. imaginární kuželosečka nemá žádné reálné body. 4.43. Afinní klasifikace kvadrik. Pro afinní klasifikaci musíme omezit projektivní transformace na ty, které zachovávají přímku nevlastních bodů. To ale můžeme také realizovat opačným postupem — pro zvolený projektivní typ kuželosečky g, tj. její kužel gcť budeme postupně různě volit afinní rovinu a c R3 neprocházející počátkem a sledovat, jak se mění množina bodů Q n a, které jsou v afinních souřadnicích realizovaných pomocí roviny a vlastními body Q. V případě reálné regulární kuželosečky tedy máme k dispozici skutečný kužel Q zadaný rovnicí z2 — x2 + y2 a za rovinu a berme třebas tečné roviny jednotkové sféry. Začneme-li s rovinou z = 1, dostaneme jako průnik samé konečné body v ní ležící jednotkové kružnice Q. Postupným nakláněním a budeme dostávat protaženější a protaženější elipsy, až dosáhneme náklonu a rovnoběžného s jednou z přímek kužele. V tom okamžiku se již objeví jeden (dvojnásobný) nekonečný bod naší kuželosečky, jejíž konečné body ale stále tvoří jednu souvislou komponentu, a dostáváme parabolu parabola. Pokračováním nakláněni vzniknou nekonečné body dva a množina konečných bodů přestane být souvislá a tak dostáváme poslední regulární kvadriku v afinní klasifikaci, hyperbolu. Z uvedeného postupu si můžeme vzít poučení, které nám snadno umožní pokračovat do vyšších dimenzí. Předně, si všimněme, že průnikem naší kuželosečky s projektivní přímkou nevlastních bodů je vždy opět kvadrika v dimenzi o jedničku nižší, tj. v našem případě šlo o prázdnou množinu nebo dvojnásobný bod nebo dva body jakožto typy kvadrik na projektivní přímce. Dále jsme zjistili, že afinní transformaci převádějící jednu z možných realizací zvoleného projektivního typu na druhou jsme našli jen tehdy, když příslušné kvadriky v nevlastní přímce byly projektivně ekvivalentní. Takovýmto způsobem lze pokračovat v klasifikaci kvadrik v dimenzi tři a dále. 225 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.67. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí Ax2 - %xy + 3y2 - 2y - 5 = 0. Řešení. Nejprve napíšeme rovnici kuželosečky v homogenních souřadnicích: Ax2 - %xy + 3y2 - 2yz - 5z2 = 0. Nevlastní body kuželosečky jsou pak body určené homogenními souřadnicemi (x : y : 0) splňující tuto rovnici, to znamená Ax2 - %xy + 3y2 = 0. Pro podíl - dostaneme dvě řešení: - = — I a £ = —I. Zadaná ku- ľ y y 2 y 2 želosečka je tedy hyperbola s nevlastními body P = (—1:2:0) 0). Asymptoty jsou potom poláry bodů P a g, tj. = -I2x + 10y -2 = 0 = -20* + 18y - 2 = 0. □ Další příklady na kuželosečky naleznete na straně 231. 4.68. Harmonický dvojpoměr. Je-li dvojpoměr čtyř bodů ležících na přímce roven —1, hovoříme o tzv. harmonické čtveřici. Harmonickou čtveřici lze snadno zkonstruovat: mějme čtyřuhelník ABCD. Označme K průsečík přímek AS a CD, M průsečík přímek AD a BC. Dále nechť L, resp. N, je průsečík přímky KM s přímkou AC, resp. BD. Potom body K, L, M, N tvoří harmonickou čtveřici. 226 KAPITOLA 4. ANALYTICKÁ GEOMETRIE D. Doplňující příklady k celé kapitole 4.69. Parametricky vyjádřete průnik následujících rovin v K3: a:2x + 3y-z+l=0ap: x-2y + 5 = 0. O 4.70. Nalezněte osu mimoběžek: p : [1, 1, 1] + /(2, 1,0), a q : [2,2,0] +/(1, 1, 1). O 4.71. Určete příčku mimoběžek p : [0, 1, 1] + /(l, 2, 3), í : [0, 5, 5] + s(2, 1, 0), tj. body Pag, kde P e p a Q € q, takové, že přímka P Q prochází bodem [—7,7,12]. O 4.72. Jarda stojí v bodě [—1,1, 0] a má tyč délky 4. Může se touto tyčí současně dotknout přímek p a q, kde p : [0,-1,0] + /(1,2, 1), q : [3,4, 8] + í(2, 1,3)? (Tyč musí procházet bodem [—1,1,0].) O 4.73. Rozhodněte, za existuje úsečka P Q, kde P e p, Q e q, přičemž přímky p a q jsou dány vztahy p: [1,-1,2] + /(1,0,1), r e K, q : [2, -3, 1] +í(-l, -1, 1), í e K a navíc bod [0,1, 3] leží na úsečce P Q. O 4.74. V prostoru K3 je dána zrcadlová rovina y = 0. Určete délku dráhy, kterou urazí světelný paprsek při cestě z bodu [1, 2, 3] odrazem o zrcadlovou rovinu do bodu [2,1,2]. O 4.75. Ve vektorovém prostoru K4 spočtěte vzdálenost v bodu [0, 0, 6, 0] od vektorového podpro-storu U : [0, 0, 0, 0] + h (1, 0,1, 1) + h (2,1,1, 0) + h (1, -1, 2, 3), tu h, h e K Řešení. Úlohu budeme řešit postupem založeným na tzv. problému nejmenších čtverců. Vektory generující U napíšeme do sloupců matice /l 2 1 \ 0 1 -1 1 1 2 VI 0 3/ a bod [0, 0, 6, 0] nahradíme jemu odpovídajícím vektorem b = (0, 0, 6, 0)r. Budeme řešit soustavu A ■ x = b, tj. soustavu lineárních rovnic x\ + 2x2 + x3 = 0, X2 — X3 = 0, X\ + *2 + = 6, x; + 3x3 = 0 právě metodou nejmenších čtverců. (Upozorněme, že tato soustava nemá řešení - jinak by vzdálenost byla rovna 0.) Systém A ■ x = b vynásobíme zleva maticí AT. Rozšířená matice soustavy 227 KAPITOLA 4. ANALYTICKÁ GEOMETRIE b pakje 12 / Pomocí elementárních řádkových transformací ji postupně převedeme na schodovitý tvar / 3 3 6 3 6 3 \ 6 3 15 12 Provedeme-li ještě zpětnou eliminaci 3 3 6 6\ /l 1 2 2 0 3 -3 0 - - 0 1 -1 0 0 -3 3 0/ \o 0 0 0 můžeme ihned napsat řešení x = (2 - 3/, t,t)T, t € . Dodejme, že existence nekonečně mnoha řešení je zapříčiněna nadbytečností třetího ze zadávajících vektorů podprostoru U, neboť j e 3 (1, 0,1,1) - (2, 1, 1, 0) = (1, -1, 2, 3). Libovolná (/ e K) lineární kombinace (2 - 3r) (1, 0, 1, 1) + t (2, 1, 1, 0) + t (1, -1, 2, 3) = (2, 0, 2, 2) však odpovídá bodu [2, 0, 2, 2] podprostoru U, který je nejblížebodu [0, 0, 6, 0]. Prohledanou vzdálenost proto platí v = || [2, 0,2, 2]-[0,0, 6,0] || = y/22 + 0 + (-4)2 + 22 = 2V6. □ 4.76. V euklidovském prostoru K5 vypočtěte odchylku

(l,2,2,0,l) | _1 . „ ^ ||(2,-1,2,0,1)|H|(1,2,2,0,1)|| 2' LJ- V 3- Varianta (d). Označme « = (0,0,0,1,-1), ui = (1,-1,2,1,0), u2 = (0,1,3,2,0), u3 = (1,0,0, 1,0), u4 = (1,3, 1,0,0) a jako pu označme ortogonální projekci (kolmý průmět) vektoru u do zaměření podprostorů V (do vektorového podprostorů generovaného vektory v\, v2, «3,1)4). Určíme-li pu, ze vzorce », II Pu I I (4.2) cos

3 + dv4 pro jisté hodnoty a, b, c, d e K a že má být (pu - U, V\ ) = 0, ( Pu - u, v2 ) = 0, (Pu-u,v3)=0, (pu-u,v4)=0. Odtud (dosazením za pu) dostáváme systém lineárních rovnic la + 1b + 2c = 1, la + 14b + 2c + 6d = 2, 2a + 2b + 2c + d = 1, 6b + c + lid = 0. Řešením této soustavy je (a, b,c,d) = (-8/19, 7/19, 13/19, -5/19), atak P« = "ji"! + T§v> + ^ " ^ = (°. °. °. L °) • II (0,0,0, 1,0) n 1 42 cosib =-= —— = —. ||(0,0,0,1,-1)|| 42 2 Je tedy

, Z(V) n (Z(U) n Z(V))1- = ((i, i, o, i, i), (i, i, o, i, 0) >. Postačuje totiž vyjádřit Z(U) jako lineární kombinaci vektorů (0,0,1,0,0), (1,0,0,1,1) a podprostor Z(V) pomocí vektorů (0,0,1,0,0), (1,1,0,1,1), (1,1,0,1,0). 230 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Protože dimenze prostoru Z(U) n (Z(U) n Z(V))± je 1, můžeme použít vzorec (||4.2||), kde u = (1, 0, 0,1,1) a pu je kolmá projekce u do Z (V) n (Z(f7) n Z(V))±. Má být pM = a(l,l,0, 1,1) + b (1,1, 0,1,0) a má platit (p„-1,0,1,1)) =0, (p„-u, (1,1,0, 1,0)) =0, což vede na soustavu rovnic 4a + 3b = 3, 3a + 3b = 2 s jediným řešením a = l,b = —1/3. Tímto jsme určili pB = (§,§,0,f,l) a z (114.211) již plyne c°sy=T(moľŕľíľ'=^ * ^ = 0,49(^28°). □ 4.77. JedánakrychleABCD£FGff.NechťbodriežínahraněBF,\BT\ = \ \ B F |. Určete kosinus odchylky rovin ATC a BZ)£. O 4.78. Je dána krychle ABCDEFGH. Nechť bod T leží na hraně AE, \ AT\ = ±| A£| a 5 je střed strany AD. Určete kosinus odchylky rovin BDT a SCH. O 4.79. JedánakrychleABCD£FGff.NechťbodriežínahraněBF,\BT\ = ||SF|. Určete kosinus odchylky rovin AT C a BDE. O 2 2 4.80. Určete tečnu k elipse fg + — = 1 rovnoběžnou s přímkou x + y — 1 = 0. Řešení. Rovnoběžky s danou přímkou se s ní protínají v nevklastním bodě (1 : —1 : 0). Z tohoto bodu spustíme tečny k dané elipse. Bod dotyku T= (t\ : t2 : t3) leží na jeho poláře, a proto splňuje — |- = 0, tj. í2 = -fg/i. Dosazením do rovnice elipsy pak dostáváme t\ = ±y. Body dotyku hledaných tečen tak jou [y, f ] a [—y, —f]. Tečny jsou pak poláry těchto bodů. Ty mají rovnice x + y = 5 a x + y = — 5. □ 4.81. Určete nevlastní body a asymptoty kuželosečky zadané rovnicí 2X2 + 4xy + 2y2 - y + 1 = 0. Řešení. Rovnice nevlastních bodů 2r + 4xy + 2y2 = 0, tj. 2(x + y)2 = 0 má řešení x = —y. Jediným nevlastním bodem j e tedy (1 : —1 : 0) (daná kuželosečka je parabola). Asymptota je polára tohoto bodu a tou je nevlastní přímka z = 0 (jedná se tedy o parabolu). □ 4.82. Dokažte, že součin vzdáleností bodu libovolného bodu hyperboly od jejích asymptot je konstantní a určete velikost této konsatnty. Řešení. Označme bod na hyperbole P. Rovnice asymptot hyperboly v kanonickém tvaru je bx ± ay = 0. Jejich normály jsou tedy (b, ±a) a odtud určíme průměty P\, P2 bodu P na asymptoty. Pro vzdálenost bodu P od asymptot pak dostáváme \ PP\2\ = ^af±bv\. Hledaný součin \j a z+bz je tedy roven " f2^2P = J-^i, protože bod P leží na hyperbole. □ 4.83. Určete úhel asymptot hyperboly 3r — y2 = 3. Řešení. Pro kosinus úhlu, který svírají asymptoty hyperboly v kanonickém tvaru lze odvodir cos a = fj^fj-. V našem případě tak dostáváme úhel 60°. □ 231 KAPITOLA 4. ANALYTICKÁ GEOMETRIE 4.84. Určete středy kuželoseček: (a) 9x2 + 6xy-2y-2 = 0, (b) x2 + 2xy + y2 + 2x + y + 2 = 0, (c) x2 - 4xy + 4y2 + 2x - 4y - 3 = 0, (d) ^ + = L Řešení, (a) Soustava As + a = 0 pro výpočet vlastních středů má tvar 9í! + 3s2 = 0, 3í! -2 = 0 a jejím vyřešením dostaneme střed [|, —2]. (b) V tomto prípade máme íl + Í2 + 1 = 0, íl + í2 + 5 = 0, a proto žádný vlastní střed neexistuje (kuželosečka je parabola). Pokud přejdeme do homogenních souřadnic, dostaneme nevlastní střed (1 : — 1 : 0). (c) Souřadnice středu v tomto případě splňují íl - 2í2 + 1 = 0, -2íi + 4í2 - 2 = 0 a řešením je tedy celá přímka středů. Je to proto, že kuželosečka je degenerovaná do dvojice rovnoběžných přímek. (d) Z rovnic pro výpočet středu okamžitě plyne, že středem je (a, /S). Souřadnice středu tedy udávají posunutí počátku souřadnic k repéru, ve kterém má elipsa základní tvar. □ 4.85. Určete rovnice os kuželosečky dané rovnicí 6xy + Sy2 + 4y + 2x - 13 = 0. Řešení. Hlavní směry kuželosečky (směrové vektory os) jsou vlastní vektory matice ^ • Charakteristická rovnice má tvar A2—8A—9 = 0 a vlastní čísla jsou proto Ai = — 1, A2 = 9. Příslušné vlastní vektory jsou pak (3, —1) a (1, —3). Osy jsou polárami nevlastních bodů určených těmito směry. Pro (3, —1) tak dostáváme rovnici osy — 3x + y + 1 = 0 a pro (1, —3) osu — 9x — 21 v — 5 = 0. □ 4.86. Určete rovnice os kuželosečky dané rovnicí 4x2 + 4xy + y2 + 2x + 6y + 5 = 0. (4 2\ Řešení. Vlastní čísla matice I ^ j] jsou \\ = 0, A2 = 5 a příslušné vlastní vektory (—1, 2) a (2,1). Pro osy pak dostáváme rovnice 5 = 0a2x + v + l = 0. První z nich očividně není splněna pro žádný bod. Existuje tedy jen jedna osa (zadaná kuželosečka je parabola). □ 232 KAPITOLA 4. ANALYTICKÁ GEOMETRIE Řešení cvičení 4.9. 2, 3, 4, 6, 7, 8. Polohy rovin, které realizují dané počty si rozmyslete samostatně. 4.30. Pro normálový vektor (a, b, c) hledaných rovin máme rovnice a + b — 0 (kolmost na p) a volbou 1 (vektor (0, 0, 1) nevyhovuje podmínkám, takže vhodným pronásobením můžeme dosáhnout i, celkem pak hledané *j3J2+č- podmínky a — — b — 1) pak dostáváme z podmínky pro odchylku rovnice přímek jsou x — y ± Vó —1=0. 4.69. Přímka (2ř, t, li) + [-5, 0, -9]. 4.70. [3,2, l][8/3, 8/3,2/3]. 4.71. P = [-1, -1, -2], g = [-4, 3, 5]. 4.72. Příčka [1, 1, l][-3, 1, -1], délky VŽÔ, tyč stačit nebude. 4.73. Neexistuje. Přímka procházející daným bodem a protínající jak p tak q je daná body P = [1,-1,2] (e p) a g = [2, —3, 1] (e g). Daný bod však na úsečce P Q neleží. 4.74. vTT. 4.77. 4.78. 4.79. 2^6 9 ■ 6 ■ VI VTT 233 KAPITOLA 5 Zřízení ZOO funkcí jaké funkce potřebujeme pro naše modely? -pořádný zvěřinec... A. Interpolace polynomy Na úvod této kapitoly se budeme snažit odhadnout funkce pomocí polynomů. Předpokládejme, že o neznámé funkci máme pouze kusé informace, totiž její hodnoty v několika bodech, popřípadě i hodnoty její první či druhé derivace v těchto bodech. Budeme se snažit najít polynom (co nejmenšího stupně) splňující tyto závislosti. 5.1. Nalezněte polynom P splňující následující podmínky: P(2) = 1, P(3) = 0, P(4) = -1, P(5) : Řešení. Řešme příklad nejprve sestavením soustavy čtyř lineárních rovnic o čtyřech neznámých. Předpokládáme polynom ve tvaru a^x3 + + a^x1 + a\x\ + a0. Víme, že polynom stupně nejvýše tři splňující V této kapitole začneme budovat nástroje umožňujících modelování závislostí, které nejsou ani lineární ani diskrétní. S takovou potřebou se často setkáme, když popisujeme systém vyvíjející se v čase a to nejen v několika vybraných okamžicích, ale „souvisle", tj. pro všechny možné okamžiky. Někdy je to přímo záměr či potřeba (třeba ve fyzikálních modelech klasické mechaniky), jindy je to vhodné přiblížení diskrétního modelu (třeba u ekonomických, chemických nebo biologických modelů). Klíčovým pojmem budou stále funkce. Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat dobré modely pro reálné situace vůbec. Cílem následujících dvou kapitol bude proto explicitně zavést několik typů elementárních funkcí, implicitně popsat daleko více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se tomu říká diferenciální a integrální počet jedné proměnné. Zatímco dosud jsme se spíše pohybovali v oblasti matematiky nazývané algebra, nyní se budeme postupně blížit k tzv. matematické analýze. 1. Interpolace polynomy V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných nebo komplexních čísel, tj. se skalárními funkcemi N -» K nebo Z -» K, kde K byl zvolený číselný obor. Případně jsme pracovali s posloupnostmi vektorů nad reálnými nebo komplexními čísly. Připomeňme si diskusi z odstavce 1.4, kde jsme přemýšleli nad způsoby, jak pracovat se skalárními funkcemi. Na této diskusi není třeba nic doplňovat a rádi bychom (pro začátek) uměli pracovat s funkcemi R -» R (reálné funkce reálné proměnné) nebo R -» C (komplexní funkce reálné proměnné), případně funkcemi Q Q (funkce jedné racionální proměnné s racionálními hodnotami) apod. Většinou půj dou naše závěry snadno rozšířit na případy s vektorovými hodnotami nad stejnými skaláry, ve výkladu se ale zpravidla omezíme jen na případ reálných a komplexních čísel. Začneme od nejednodušších funkcí, které umíme zadat explicitně pomocí konečně mnoha algebraických operací se skaláry. 5.1. Polynomy. Skaláry umíme sčítat a násobit a tyto operace splňují řadu vlastností, které jsme vyjmenovali už v odstavcích 1.1 a 1.3. Když připustíme konečný počet těchto operací, přičemž jednu proměnnou ponecháme jako neznámou a další vstupující skaláry budou pevně zvolené, dostáváme tzv. polynomy: KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ podmínky v zadání je dán jednoznačně. Polynomy a0 a0 2a-[ 3ai 4fli 5ai 4a2 + 9a2 + 16fl2 + 25 a2 + 8fl3 27fl3 64fl3 125fl3 Každá rovnice vznikla z jedné z podmínek v zadání. Druhou možností řešení je vytvořit hledaný polynom pomocí fundamentálních Lagrangeových polynomů (viz 5.4): (x - 3)(x - 4)(x - 5) Pix) = 1 (2-+ (-1) ■3)(2-4)(2-5) (x - 2)(x - 3)(x + 0-(. 5) . ■)+ + e 4 (4 - 2)(4 - 3)(4 - 5) (x - 2){x - 3)jx - 4) _ (5-2X5-3)(5-4) " , 101 X2X2 + —x ■ 29. Koeficienty tohoto polynomu jsou samozřejmě jediným řešením výše sestavené soustavy lineárních rovnic. □ 5.2. Nalezněte polynom P splňující následující podmínky: Pil + i) = i, P{2) = 1, P(3) = -i. O 5.3. Pro navzájem různé body xo,... ,xn e K uvažme elementární Lagrangeovy polynomy (5.4) (X - X0) ■ ■ ■ (X - (X - Xi + l) ■ ■ ■ (X - X„) lj(x) :=-, (Xi -X0)--- (Xi - (Xi - Xi + l) ■ ■ ■ (Xi - Xn) kde x € K, i = 0,..., n. Dokažte, že platí (x) = 1 pro všechna lei. Řešení. Zřejmě je n J2h(xo) = l + 0 + -..+0= 1, n ^;;(Xl) = 0+l + ...+0= 1, n (jc„) = 0 + 0 +----h 1 = 1. To znamená, že polynom Yl"=o ^ W stupně nejvýše n nabývá v n + 1 bodech x0,.. ■, xn stejné hodnoty 1. Takový polynom (stupně nejvýše ri) však existuje právě jeden, a to konstantní polynom y = 1 . □ Polynomem nad okruhem skalárů K rozumíme zobrazení / : K —> K dané výrazem /(*) — a„x" + a„_ijc™_1 H-----h ai* + ao, kde ai,i — 0, ... ,n, jsou pevně zadané skaláry, násobení je znázorněno prostým zřetězením symbolů a „+" označuje sčítání. Pokud je an 0, říkáme, že polynom / je stupně n. Stupeň nulového polynomu není definován. Skaláry a, označujeme jako koeficienty polynomu f. Polynomy stupně nula jsou právě konstantní nenulová zobrazení x \-> ao. V algebře jsou častěji polynomy definovány jako formální výrazy uvedeného tvaru f(x), tj. jako posloupnosti koeficientů ao,ai, ... s konečně mnoha nenulovými prvky. Vzápětí si ale ukážeme, že v analýze budou oba přístupy ekvivalentní. Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh, kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot polynomů, tzn. (/ • g)(x) = f(x) ■ g(x), (f + g)(x) = /(*) + g(x), kde nalevo a napravo musíme správně interpretovat příslušné operace v okruhu polynomů a v samotném okruhu skalárů. 5.2. Dělení polynomů se zbytkem. Jak jsme již zmínili, budeme v dalším pracovat výhradně s poli skalárů Q, R nebo C. Pro všechna pole skalárů však platí Tvrzení (O dělení polynomů se zbytkem). Pro libovolné polynomy f stupně n a g stupně m, existují jednoznačně určené polynomy q ar takové, ief — q-g + ra přitom je stupeň r menší než m nebo je r — 0. Důkaz. Začněme jednoznačností. Předpokládejme, že máme .i1 ., dvě požadovaná vyjádření polynomu / s polynomy g, g', r a ŕ, tj. platí í- / = q- g + r = q ■ g + r . Pak také odečtením dostaneme 0 — (q — q') ■ g + (r — / ). Jestliže q — q', pak také r — r'. Je-li q ^ q', pak člen s nejvyšším stupněm v (q — q') ■ g nemůže být vykompenzován r — ŕ, což vede na spor. Dokázali jsme tedy jednoznačnost výsledku dělení, pokud existuje. Zbývá dokázat, že umíme polynom / vždy napsat požadovaným způsobem. Pokud by stupeň g byl větší než stupeň /, pak můžeme rovnou psát / = 0 • g + /. Předpokládejme proto n > m a dokažme tvrzení indukcí přes stupeň /. Pokud je / polynom stupně nula, je tvrzení zřejmé. Předpokládejme tedy, že tvrzení platí pro stupně menší než n > 0 a uvažme výraz h(x) = f(x) — jf-xn~m g(x). Buď je h(x) přímo nulový polynom a pak máme, co jsme hledali, nebo jde o polynom nižšího stupně a tedy jej již umíme napsat potřebným způsobem h(x) = q ■ g + r a tedy také fix) - h(x) + p-^gix) = iq + ^X- a tvrzení je dokázáno. )gix) - □ Je-li pro nějaký prvek b e K hodnota fib) — 0, pak to znamená, že v podílu fix) = qix)ix— b)+r musíbýtr = 0.Jinakby totiž nebylo možné dosáhnout fib) — q(b) • 0 + r, kde stupeň r je 235 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.4. Nalezněte polynom P splňující následující podmínky: P(\) = 0, P'(l) = 1, P(2) = 3, P'(2) = 3. Řešení. Opět ukážeme dvě možnosti řešení. Dané podmínky určují čtyři lineární rovnice pro koeficienty hledaného polynomu. Budeme-li hledat polynom třetího stupně, dostáváme tedy přesně tolik rovnic, kolik je neznámých koeficientů polynomu (nechť např. P(x) = a^x3 + a2x2 + a\x + a0): P(í) = fl3 + a2 + fll + ao = 0, P'(l) = 3a3 + 2a2 + fli =1, P(2) = 8a3 + 4a2 + 2ax + a0 = 3, P'(2) = I2a3 + 4a2 + fli =3. Vyřešením tohoto systému obdržíme polynom: P(x) = -2X3 + lOx2 - 13x + 5. Jiné řešení. Použijeme fundamentální Hermiteovy polynomy: 2 (x- 1) ) (2 - x)1 = (2x - l)(x - 2)2, h\(x) = --X o + c-ir h\{x) = (5- 2x)(x - l)2, h\{x) = (x- ■ 1)0 - 2)2, h\(x) = (x- 2)0 - I)2- Celkem P(x) = 0 • h\(x) + 3 ■ h. = - ■2r + 10x2 - + 5. □ 5.5. Pomocí Lagrangeovy interpolace spočítejte přibližnou hodnotu cos2 1. Použijte k tomu hodnoty funkce v bodech j, | a f. Řešení. Nejprve určíme funkční hodnoty v zadaných bodech: cos2(f) = 1/2, cos2(|) = 1/4, cos2(|) = 0. Dále určíme elementární Lagrangeovy polynomy, přitom můžeme spočítat hodnoty přímo v zadaném bodě: (! " !)(!-!) 00-3)0-2) 'o(l) U 3JU l) / m = = .0-4)0-2) 1U (f-f)(f-f) -2 ' /2(1) = í1 - f j j1 - f) = 2^ ~ " 3> ÍJľ_ _ Tľ_\ ÍJľ_ _ Tľ_\ v2 4M2 3J Celkem tedy P(l) 1 O - 3)0 - 2) 1 O - 4)0 - 2) - • 8---- - - • 9-^--- + 0 : 2 jt2 4 jt2 nulový. Říkáme, že b je kořen polynomu f. Stupeň g je pak právě n — 1. Pokud má q opět kořen, můžeme pokračovat a po nejvýše n krocích dojdeme ke konstantnímu polynomu. Dokázali jsme tedy, že každý nenulový polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již snadno dovodíme i následující pozorování: Důsledek. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si rovny jako zobrazení, právě když mají shodné koeficienty. Důkaz. Předpokládejme f — g, tj. f—g = 0, jako zobrazení. Polynom (/ — g)(x) tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým polynomem. □ Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Jednoduchým příkladem je např. polynom x2 + x nad Z2, který představuje nulové zobrazení. 5.3. Interpolační polynom. Často je užitečné zadat snadno 5?X počítatelný vztah pro funkci, pro kterou máme * zadány hodnoty v předem daných bodech xq, ... ,x„. !%^jíjfe.' Pokud by šlo o nulové hodnoty, umíme přímo zadat polynom stupně n + 1 f (x) = (x- x0)(x -x\)...(x- x„), který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není jediná polynomiální odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n. Obdobně to dopadne i v obecném případě: ^_^____^_| Interpolační polynomy__. Nechť K je nekonečné pole skalárů. Interpolační polynom f pro množinu po dvou různých bodů xq, ... ,x„ e K a předepsaných hodnot yo, ■ ■ ■, yn 6 K je polynom stupně nejvýše n nebo nulový polynom, který splňuje /(x,) = y, pro všechna i = 0, 1, n. Věta. Pro každou množinu n + 1 po dvou různých bodů xo, ..., x„ e K a předepsaných hodnot yo, ■ ■ ■, yn 6 K existuje právě jeden interpolační polynom f. (lit - 12) O - 2) 4ŤŤ2 : 0,288913. Důkaz. Začněme jednodušší částí, tj. jednoznačností. Jsou-li / a g dva interpolační polynomy se stejnými definičními hodnotami, pak je jejich rozdíl polynomem stupně n, který má n+1 kořenů, a proto je / - g = 0. Zbývá existence. Označme si prozatím neznámé koeficienty polynomu / stupně n f — anx" H-----haix +ao. Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet neznámých koeficientů a, ao + xoa\ H-----h (xo)"an = yo, ao + xna\ H-----h (x„)"a„ - y„. 236 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Vidíme, že při výpočtu třetí elementární polynom nebyl potřeba. Skutečná hodnota je cos2 1 = 0,291927. □ 5.6. Franta potřebuje počítat hodnoty funkce sin, ale má k dispozici jen mobilní telefon s jednoduchou kalkulačkou, která umí základní operace. Protože si pamatuje hodnoty funkce sin v bodech 0, \, j I a j a ví, že přibližné hodnoty n, \fl a VŠ" jsou 3,1416, 1,4142 a 1,7321, rozhodl se, že použije k přibližnému výpočtu interpolaci. Pomozte mu sestrojit přibližný vztah s využitím všech hodnot. Řešení. Sestrojíme elementární Lagrangeovy polynomy: (* -!)(*-1) (* -1) (* - f) ,, l0(x) l2(x) h(x) k(x) (o-|) (o-f) (o-f)(o-f) 1,4783/ - 5,8052/ + 8,1057*2 - 4,7746* + 1, (x - Q) (x - f) (x - f) (x - f) ,, U "h 6 4 m 6 3 m 6 21 -13,3046/ +45,2808/ -49,2419/ + 17,1887*, (*-Q) (*-!)(*-!)(*-?) ■_ \4 "/ v 4 6 / v 4 3 / v 4 21 23,6526/ - 74,3070/ + 71,3298/ - 20,3718*, (*-0)(*-t)(*-7)(*-l) ^ \3 UM3 6 h 3 4 h 3 2j -13,3046/ + 38,3146/ - 32,8279/ + 8,5943*, (*_o) (*-f)(* -f)(*-f) ^ \2 v)\2 6) \ 2 4M2 3j 1,4783/ 3,4831/ +2,6343/ ■ 0,6366*. Hodnota interpolačního polynomu je pak P (x) = 0 • c(x) + \h(x) + =äl2{x) + ^h(x) + k(x) = = 0,0288/ - 0,2043/ + 0,0214/ + 0,9956* . □ Doplňující otázky: Může Franta tento přibližný výsledek použít i pro výpočet funkce sin na intervalu [ \, ji ] ? A pokud ne, jak by měl postupovat? Jak by vypadaly přibližné vztahy, pokud by Franta nepoužil všechny uzly, ale pro každý bod jen tři uzly nejbližší? 5.7. Další den potřeboval Franta spočítat dvojkový logaritmus 25. x\^_Lv (Ve skutečnosti potřeboval přirozený logaritmus, ale pro-^St?o to^e ^e Je znruba 0,6931, vystačí si i s dvojko-9 vým.) Nejprve tedy vzal uzly 16 a 32 s funkčními hodnotami 4 a5 a sestrojil interpolační polynom (přímku) P (*) = j^x + 3, takže P (25) = II = 4,5625. Kvůli zpřesnění výsledku přidal další uzel 8 s funkční hodnotou 3. V tomto případě vyšel interpolační polynom Existenci řešení tohoto systému rovnic můžeme snadno ukázat přímou konstrukcí patřičného polynomu pomocí tzv. Lagran-geových polynomů pro dané body xo, ...,x„, viz další odstavec textu níže. Nyní ale důkaz dokončíme pomocí jednoduchých znalostí z lineární algebry. Tento systém lineárních rovnic má totiž právě jedno řešení pokud je determinant jeho matice invertibilní skalár, tj. pokud je nenulový (viz 3.1 a 2.23). Jde o tzv. Vandermondův rfeřer-minant, který jsme již diskutovali v příkladu ||2.24|| na straně 80. Protože jsme ale už ověřili, že pro nulové pravé strany existuje řešení právě jedno, víme, že tento determinant nenulový být musí. Protože polynomy jsou jako zobrazení stejné, právě když mají stejné koeficienty, věta je dokázána. □ 5.4. Užití interpolací. Na první pohled se může zdát, že reálné nebo případně racionální polynomy, tj. polynomiálně zadané funkce R —> R nebo Q —> Q, tvoří hezkou ve-ij likou třídu funkcí jedné proměnné. Můžeme jimi pro-Ä* rííi ložit jakékoliv sady předem zadaných hodnot. Navíc se zdají být snadno vyjádřitelné, takže by s jejich pomocí mělo být dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné. Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik problémů. Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme. Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat čas úměrný třetí mocnině počtu bodů, což při objemnějších datech je jistě těžko přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého stupně v zadaném bodě. Obojí lze částečně obejít tak, že zvolíme vhodné vyjádření interpolačního polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x"). Ukážeme si pouze jediný příklad takového postupu: __\ Lagrangeovy interpolační polynomy |___ Lagrangeův interpolační polynom snadno zapíšeme pomocí tzv. elementárních Lagrangeových polynomů stupně n s vlastnostmi U(Xj) = ' = h i + j. 237 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ roven P (x) = —^x2 + -^x + f, což dává P (25) = 4,7266. Franta chtěl výsledek ještě zpřesnit, přidal tedy rovnou dva uzly, a to 2 a 4 s funkčními hodnotami 1 a 2. Jaké však bylo jeho překvapení, když mu vyšla hodnota P(25) = 5,892, která je určitě nesprávná vzhledem k tomu, že logaritmus je rostoucí funkce. Dokážete vysvětlit, kde se vzala taková chyba? Řešení. Franta trochu pátral na internetu a zjistil, že chyba při interpolaci se dá vyjádřit ve tvaru f(x) - PJX) : (x -x0)(x -xi)...(x -x„) f(n+1) (n + iy. /("+1)(?), kde bod £ není znám, ale leží v intervalu daném nejmenším a nej větším uzlem. Člen v čitateli zlomku způsobuje, že přidávání dalších vzdálených uzlů přesnost spíše zhoršuje. □ 5.8. O týden později potřeboval Franta určit -Ji. Napadlo ho problém otočit a použít tzv. inverzní interpolaci, tedy zaměnit roli uzlů a funkčních hodnot a určit přibližnou hodnotu vhodné funkce v nule. Jak postupoval? Řešení. -Ji je nulový bod funkce x2 — 7. Franta vzal uzly x0 = 2, x\ = 2,5, x2 = 3, příslušné funkční hodnoty jsou —3, —0,75 a 2. Pak prohodil úlohu uzlů a funkčních hodnot a získal elementární Lagran-geovy polynomy k(x) h(x) (x + 0J5)(x - 2) (-3 + 0,75)(-3-2) 45 16 4 x2 1 2 ~ ~9*~15' 16 32 --x"--x H--, 99 99 33 6 2 3 9 hu = —x H--x H--• ' 55 11 55 Pro \/7 tak dostal přibližnou hodnotu 2 • /0(0) + 2.5 • h(0) + 3 • l2(0) = fi = 2,6485. Doplňující otázky: Frantovi se do výpočtu jednoho elementárního polynomu vloudila chyba, pokuste se ji vypátrat. Má tato chyba vliv na výslednou hodnotou? Jak bychom mohli využít také hodnotu derivace v bodě 2,5? □ 5.9. Nalezněte přirozený splajn 5, který splňuje podmínky 5(-l) = 0, 5(0) = 1, 5(1) = 0. Řešení. Hledaný přirozený splajn bude složen ze dvou kubických polynomů, jednoho, řekněme 5i, pro interval [—1,0], druhého, řekněme 52, pro interval [0,1]. Slůvko „přirozený" navíc určuje, že hodnoty druhých derivací polynomů 5i, resp. 52, budou nulové v bodě — 1, resp. 1. Diky předepsané společné hodnotě v bodě 0 víme že absolutní člen obou polynomů je 1, ze symetrie úlohy plyne, že Zřejmě musí být tyto polynomy až na konstantu rovny výrazům (x - xo)... (x - xí-\)(x - xi+\) ...(x- x„), a proto ii(x)-- Y\m(xi -xj)' Hledaný Lagrangeův interpolační polynom je pak dán vztahem f(x) = y0e0(x) + y\i\(x) + ■■■ + y„e„(x). Použití Lagrangeových polynomů je obzvlášť efektivní, když opakovaně prokládáme zadané hodnoty závislé proměnné y, pro stále stejné hodnoty nezávislé proměnné x j. Pak totiž máme elementární polynomy předem připraveny. Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých rozdílech zadaných hodnot x j, protože se v něm těmito rozdíly dělí. Další nepříjemností je velice špatná stabilita hodnot reálných nebo racionálních polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle znaménka koeficientu u nej vyšší mocniny polynomu se hodnoty velice rychle při rostoucím x vydají buď do plus nebo mínus nekonečna. Ani toto znaménko koeficientu u nej vyššího stupně se ale u interpolačního polynomu při malých změnách prokládaných hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo jedenáct hodnot funkce sin(jc) s různými malými náhodnými změnami hodnot. Je na nich vynesena aproximovaná funkce, kolečka jsou malinko posunuté hodnoty a jimi proložený jednoznačně zadaný interpolační polynom. Zatímco uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná. Kolem interpolačních polynomů existuje bohatá teorie, zájemce odkazujeme na speciální literaturu. 5.5. Poznámka. Numerická nestabilita způsobená případnou blízkostí (některých) z bodů xj je dobře viditelná i na systému rovnic z důkazu Věty 5.3. Při řešení systémů lineárních rovnic totiž nestabilita do značné míry souvisí s velikostí determinantu matice systému, tj. v našem případě Vandermondova determinantu. Ten umíme vcelku snadno přímo spočíst: Lemma. Pro posloupnost po dvou různých skalárů xo, x„ e K platí n V(x0, ...,x„)= Y\ (xí - xk). i>k=0 238 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ společná hodnota první derivace v bodě Oje nulová. Můžeme tedy psát Si(x) = ax3 + bx2 + 1 a 52 (x) = cx3 + dx2 + 1, pro neznámé reálné parametry a,b,c ad. Dosazením těchto tvarů do čtyř podmínek Si(-l) = 0, Si"(-1) = 0, 52(1) = 0a 52"(1) = 0 dostáváme čtyři lineární rovnice pro tyto parametry: —a + b -6a + 2b + 1 c + d + 1 6c + 2d 0, 0, 0, 0. Jejich vyřešením pak S\ (x) \x2 + 1. Celkem tedy 5(x) 1 ^3 3 „2 x2 + 1, S2(x) = ix3 2^ 2 3 2 x2 + 1 pro* € [-1,0], l-x3 - 1x2 + 1 proxe[0,1]. □ 5.10. Nalezněte splajn 5, který splňuje podmínky 5(-l) = 0, 5(0) = 1, 5(1) = 0, 5"(-l) = 1, 5(1) = 1. Řešení. Hledaný splajn se od splajnu z předchozí úlohy liší pouze hodnotami derivací v bodech —1 a 1. Obdobně jako v předchozí úloze tak dostáváme části 5i a 52 splajnu ve tvaru 5i (x) = ax3 + bx2 + 1 a 52(x) = cx3 + dx2 + 1, pro neznámé reálné parametry a, b, c a d. Dosazením do podmínek 5i(—1) = 0, 5j(—1) = 1, 52(1) = 0 a 5^(1) = 1 dostáváme nyní soustavu —a + b 3a — 2b + 1 s resemm a funkce -l,b c + d + 1 3c + 2d -2, c = 3 a d 4, tedy hledaný splajn je 5(X): -x3 -2x2+1 pro x e [-1, 0], 3x3-4x2 + l proxe[0, 1]. □ 5.11. Nalezněte polynom nejvýše druhého stupně, který v bodech Xo = — 1, X\ = 1, X2 = 2 nabývá po řadě hodnot yo = 1, y\ = -3, y2 = 4. 5.12. Sestrojte Lagrangeův interpolační polynom pro O -2 -1 1 2 1 -1 -1 1 Důkaz. Vztah dokážeme indukcí přes počet bodů x\. Evidentně je správný pro n — 1 (a pro n — 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný pro n — 1, tj. V(x0, k=0 -l za pevné a hodnotu xn po- Nyní považujme hodnoty xo,..., x, nechrne jako volnou proměnnou. Rozvojem determinantu podle posledního řádku (viz 2.21) obdržíme hledaný determinant jako polynom (5.1) V(x0, ...,*„) = (x„T V(x0, *„_!) - (xnf-1 Toto je polynom stupně n, protože víme, že jeho koeficientu (xn)n je nenulový dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv hodnoty xn — xi pro i < n, protože bude v takovém případě obsahovat původní determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem (x„ - x0)(x„ -*!)••• (x„ - xn_i), který má sám již stupeň n. Odtud vyplývá, že celý Vandermondův determinant coby polynom v proměnné xn musí být tomuto výrazu roven až na konstantní násobek, tj. V(x0, ...,x„)=c-(x„- x0)(xn - x\) ■ ■ ■ (xn - x„_i). Porovnáním koeficientů u nej vyšší mocniny v (5.1) a tomto výrazu dostáváme c = V(x0, .. .,x„-i) a tím je důkaz lemmatu ukončen. □ Opět tedy vidíme, že determinant bude velmi malý, pokud jsou malé vzdálenosti bodů x j. 5.6. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou rychle míří k nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje (jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně lepší výsledky budeme alespoň mezi body x j dosahovat, když si budeme kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou. Za tímto účelem zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy. Můžeme přitom pracovat opět s reálnými, komplexními nebo racionálními polynomy. Rychlost růstu v bodě x e R pro reálný polynom f(x) dobře vyjadřují podíly fix + A*) - fix) (XZ) Ax a protože umíme spočíst (nad libovolným okruhem) ix + Axf = ŕ + kx*-1 Ax H-----h iAxý-' H-----h iAx)k, dostaneme pro polynom fix) ve tvaru nX"- t-ao výše vedený podíl fix+Ax)-fix) Ax ■- na„x"~ + in - nx" AjcH-----h(A*r 1 l ^ Ax - l)an^x"-2 +•••+«! • -+a\ - Axi. Ax ~A~x ■■), kde výraz v závorce je polynomiálně závislý na Ax. Evidentně pro hodnoty Ax velice blízké nule dostaneme hodnotu libovolně blízkou následujícímu výrazu: 239 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Pak uvedte libovolný polynom vyššího než třetího stupně, jenž vyhovuje podmínkám uvedeným v tabulce. O 5.13. Nalezněte polynom p(x) = ax3 + bx2 +cx +d, pro který platí p(0) = l, p(l) = 0, p(2) = l, p(3) = 10. O 5.14. Určete polynom p nejvýše třetího stupně splňující p(0) = 2, p(l) = 3, p(2) = 12, p(5) = 147. O Q(-i) -11, -9, P(l) e(i) i, p'(-í) -i, e'(-i) 12, 10, P'(l) =4; g'(l) = 2. O 5.17. Nahradte funkci / Hermiteovým polynomem, víte-li Xi -1 1 2 /(*/) 4 8 -4 -8 -8 11 O 5.18. Bez počítání uvedie Hermiteův interpolační polynom, je-li požadováno, aby x0 = 0, v0 = 0, y'0 = o, y\ y\ ■ 2, : 4, : 4, x2 ■■ yi ■ y'i-- O Derivace polynomů L Derivací polynomu f(x) — a„y +----h «o podle proměnné x rozumíme polynom f'(x) = nanx"-1 +(n- lK-ix""2 H-----h au 5.15. Nechť jsou libovolně zvoleny hodnoty y o, ■ ■ ■, y„ e K v navzájem různých bodech xo,..., xn el. Kolik existuje polynomů stupně právě n + 1, které nabývají v uvedených bodech zadaných hodnot? O 5.16. Stanovte Hermiteovy interpolační polynomy P, Q, jestliže má být 5.19. Nalezněte polynom nejvýše třetího stupně, který v bodě x = 1 nabývá hodnoty y = 4, v bodě x = 2 hodnoty y = 9 a který má v bodě x = 0 derivaci rovnu —2, zatímco v bodě x = 1 je jeho derivace rovna 1. Poté určete polynom nejvýše třetího stupně, jenž v bodech i=lax = -1 nabývá hodnoty y = 6 a jenž má v bodě x = 1 a zároveň v bodě x = — 1 derivaci rovnu 2. O 5.20. Kolik existuje navzájem různých polynomů stupně nejvýše 4, které v bodech x0 = 5, x\ = 55 nabývají po řadě hodnot vo = 55, y\ = 5 a jejichž první a druhá derivace v bodě x0 je nulová? O 5.21. Napište libovolný polynom P vyhovující těmto podmínkám: P(0) = 6, P(í) = 4, P(2) = 4, P'(2) = l. Q Z definice je jasné, že právě hodnota f'(xo) derivace polynomu nám dává dobré přiblížení jeho chování v okolí bodu xq. Přesněji řečeno přímky f(x0 + Ax) - f(x0) r y =---(x - x0) + f(x0), Ax tj. sečny grafu polynomu procházející body [xq, f(xo)] a [xo + Ax, f(xo + Ax)], se, se zmenšujícím se Ax, přibližují přímce y = f'(x0)(x - x0) + f(x0), což tedy musí být tečna grafu polynomu /. Hovoříme o lineárním přiblížení polynomu / jeho tečnou. Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně nejvýše n polynomy stupně nejvýše n — 1. Iterací této operace dostáváme druhé derivace /", třetí derivace /*3' a obecně po ^-násobném opakování polynom stupně n — k. Po n + 1 derivacích je výsledkem nulový polynom. Toto lineárním zobrazení je příkladem tzv. cyklického nilpotent-nflio zobrazení, která jsou podrobněji rozebírána v odstavci 3.32 o nilpotentních zobrazeních. 5.7. Hermiteův interpolační problém. Uvažme opět m + 1 po dvou různých reálných hodnot xo, ... ,xm,tj.xi ^ x j pro všechna i / j. Budeme chtít zase prokládat po-^yijV mocí polynomů předem dané hodnoty, tentokrát ale budeme vedle hodnot předepisovat i první derivace. Tj. předepíšeme y, a ýi pro všechna i. Hledáme polynom /, který bude nabývat těchto předepsaných hodnot a derivací. Zcela analogicky jako u interpolace pouhých hodnot obdržíme pro neznámé koeficienty polynomu f(x) = anxn +• —h«o systém 2(m + 1) rovnic ao + xoa\ H-----h (xo)"an = yo, a0 +xma\ H-----h (xmfan — ym, a\ + 2xoa2 H-----V n{xo)n~la„ = y'0, a\ + 2xma2 H-----h n(xmf y m Opět bychom mohli ověřit, že při volbě n — 2m + 1 bude determinant tohoto systému rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, obdobně ke konstrukci Lagrange-ova polynomu lze zkonstruovat takový polynom / přímo. Prostě si vytvoříme jednu sadu polynomů s hodnotami nula nebo jedna jak u derivací tak u hodnot, abychom jejich jednoduchou lineární kombinací uměli dosáhnout potřebné hodnoty. Ověření následující definice a tvrzení necháme na čtenáři: 240 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.22. Sestrojte přirozený kubický interpolační splajn pro body xo = —1, x\ = 0, X2 = 1 a hodnoty yo = 1, yi = 0, yi = 1 v těchto bodech. O 5.23. Zkonstruujte přirozený kubický interpolační splajn pro funkci f(x) = \x\, xe[-l,l], pokud jsou zvoleny body xo = — 1, x\ = 0, xi = \. O 5.24. Napište přirozený kubický interpolační splajn pro body xo = —3, x\ = 0, X2 = 3 a hodnoty yo = —3, y\ = 0, V2 = 3. O 5.25. Bez počítání uvedie přirozený kubický interpolační splajn pro bodyxo = —l,x\ = 0ax2 = 2ahodnotu yo = yi = y2 = 1 vtěchto bodech. O 5.26. Určete xo = —3, x\ = —2, X2 = —1 a pro hodnoty yo = 0, y\ = 1, y2 = 2, y'0 = 1, y2 = 1. Hermiteův interpolační polynom o 5.27. Sestrojte přirozený kubický interpolační splajn pro funkci 1 y při volbě bodů 1 +x2 xo = 0, x\ = 1, x2 ■ o Více příkladů k interpolačním polynomům najdete na straně 288. B. Topologie komplexních čísel a jejich podmnožin 5.28. Nalezněte hromadné, izolované, hraniční a vnitřní body množin N, Q, X = [x e K; 0 < x < 1} v K. Řešení. Množina N. Pro libovolné n e N očividně platí Oi (n) n N = (n - 1, n + 1) n N = {n}. Existuje tedy okolí bodu n e N v K, které obsahuje pouze jeden prvek množiny N (pochopitelně právě uvažované n), tj. každý bod n e N je izolovaný. Množina vnitřních bodů je proto prázdná (je-li bod izolovaný, nemůže být vnitřní). Bod a e K je pak hromadným bodem A právě tehdy, když každé jeho okolí obsahuje nekonečně mnoho bodů A. Ovšem množina Oi (a) n N = (a - 1, a + 1) n N, přičemž a e R, Hermiteův interpolační polynom definujeme pomocí fundamentálních Hermiteových polynomů: hj(x) (x - Xi) {ii{x)Y hj(x) = (X - Xi) (li(x))2 , kde€(*) = nľ=l(* - xí). Tyto polynomy splňují: 1 pro i = j, 0 pro i ^ j, h} (Xj) = */ = (hh'ixj) = o, h2 (X j) = o, (h2)'(xj) = 4 a proto je Hermiteův interpolační polynom dán výrazem f(x)^J2(yihj(xi)+y'ih2(xi)). 5.8. Príklady Hermiteových polynomů. Úplně nejjednodušší případ je zadání hodnoty a derivace v jediném bodě. Tím určíme beze zbytku polynom stupně jedna f(x) = f(x0) + f'(xo)(x-xo), tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě xq. Když zadáme hodnotu a derivaci ve dvou bodech, tj. yo = f {xo), y0 = f'(x0), yi = f(xi),y'1 = f'(x\) pro dva různé body dostaneme ještě pořád snadno počítatelný problém. Ukažme si jej ve zjednodušeném provedení, kdy xo — 0, x\ — 1. Pak matice systému a její inverze budou /0 0 0 l\ / 2 -2 1 1 \ 1111 j _ —3 3 —2 —1 OOIO'O 0 1 0 v3 2 1 0/ \ 1 0 0 0 ) Přímým vynásobením A ■ (yo, y i, yo, y\)T pak vyjde vektor koeficientů (a3, a2, a\, ao)T polynomu /, tj. f(x) = (2y0 - 2yi + y'0 + y'Jx3 + + (-3y0 + 3yi - 2y0 - y\)x2 + y'0x + y0. 5.9. Interpolace splajny. Obdobně můžeme předepisovat libovolný konečný počet derivací v jednotlivých bodech jŠ?,', a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace. Nebudeme zde uvádět podrobnosti. Bohužel, u všech těchto interpolací pořád zůstávají problémy zmíněné už v případě jednoduchých interpolací hodnot - složitost výpočtů a nestabilita. Použití derivací však podbízí jednoduché vylepšení metodiky: Jak jsme viděli na obrázcích demonstrujících nestabilitu interpolace jedním polynomem dostatečně vysokého stupně, malé lokální změny hodnot zapříčiňovaly dramatické celkové změny chování výsledného polynomu. Nabízí se tedy využití malých polynomiálních kousků nízkých stupňů, které ale musíme umět rozumně navazovat. 241 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ je konečná, z čehož plyne, že N hromadné body nemá. To, že tato množina je konečná, dále implikuje á j, := inf I b — n I inf I b - n I > 0 pro b e K \ N. n€Oi(6)nN Odsud máme Osb (i)(lN = 0, tj. žádné e K \ N není hraničním bodem N. Současně víme, že každý bod dané množiny, který není vnitřním bodem, je nutně jejím hraničním bodem. Množina hraničních bodů tak obsahuje N. Shrneme-li to, množina hraničních bodů N je N. Množina Q. Racionální čísla tvoří tzv. hustou podmnožinu množiny všech reálných čísel. To znamená, že ke každému reálnému číslu konverguje posloupnost racionálních čísel (představme si např. nekonečný desetinný rozvoj reálného čísla a jemu odpovídající posloupnost, kdy v následujícím členu přidáváme další cifru rozvoje). O této posloupnosti lze navíc předpokládat, že všechny její členy jsou navzájem různé (na poslední pozici konečného desetinného rozvoje se můžeme záměrně dopouštět chyby nebo kupř. číslu 1 přiřadíme desetinný rozvoj 0,999 ... apod.). Množina hromadných bodů Q v K je proto celé K a každý bod x e K \ Q je hraniční. Zvláště dostáváme, že libovolné á-okolí O* ■8, - + 8 , kdep,q e Z, q ^ 0, Nejjednodušší je propojení vždy dvou sousedních bodů polynomem stupně nejvýše jedna. Tak se nejčastěji zobrazují data. Z pohledu derivací to znamená, že budou na jednotlivých úsecích konstantní a pak se skokem změní. O něco sofistikovanější možností je předepsat v každém bodě hodnotu a derivaci, tj. pro dva body budeme mít 4 hodnoty a jednoznačně tím určíme Hermiteův polynom 3. stupně, viz výše. Tento polynom pak můžeme použít pro všechny hodnoty nezávislé proměnné mezi krajními hodnotami xq < x\. Hovoříme o intervalu [xq , x i ]. Takové polynomiální přiblíženi po kouskách už bude mít tu vlastnost, že první derivace na sebe budou navazovat. V praxi ale není pouhé navazování první derivace dostatečné a navíc při naměřených datech nemíváme hodnoty derivací k dispozici. Přímo se proto vnucuje pokus využívat pouze zadané hodnoty ve dvou sousedních bodech, ale požadovat zároveň rovnost prvních i druhých derivací u sousedních kousků polynomů třetího stupně. To totiž bude znamenat stejné množství rovnic a neznámých a pravděpodobně tedy i obdobnou praktickou řešitelnost problému: [ Kubické splajny |__, P ví/ \í racionálního čísla p/q musí obsahovat nekonečně mnoho racionálních čísel, což dává neexistenci izolovaných bodů. Číslo «/2/10" není racionální pro žádné nei. Předpokladem opaku (opět p, q e Z, q ^ 0) ^ = p-, tj. V2- = H^, 10" q J q totiž okamžitě obdržíme spor - o číslu víme, že není racionální. Libovolné okolí racionálního čísla p/q tak zároveň obsahuje nekonečně mnoho reálných čísel p/q + \/2/10" (n e N), která nejsou racionální (množina Q jako těleso je uzavřená vzhledem k odečítání). Všechny body p/q € Q jsou tudíž rovněž hraniční a vnitřní body množina Q nemá. Množina X = [0,1). Nechť a e [0,1) je zvoleno libovolně. Posloupnosti {a + {l — zjevně konvergují po řadě k hodnotám a, 1. Snadno jsme tak ukázali, že množina hromadných bodů obsahuje interval [0, 1]. Jiné hromadné body neexistují: pro jakékoli b i [0, 1] existuje 8 > 0 takové, že Os (b) n [0,1] = 0 (pro b < 0 postačuje položit á = —fcaprofc > 1 potom á = b—ľ). Protože každý bod intervalu [0, 1) je hromadným bodem, množina izolovaných bodů je prázdná. Pro a e (0, 1) označme menší z kladných čísel a, 1 — a jako 8a. Uvážíme-li 0Sa (a) = (a-8a, a + 8a) c (0, 1), a e (0, 1), Nechť xq < x\ < ■ ■ ■ < xn jsou reálné hodnoty, ve kterých jsou zadány požadované hodnoty yo, ■ ■ ■, yn. Kubickým inter-polačním splajnem pro toto zadání je funkce 5 : R —> R, která splňuje následující podmínky: • zúžení 5 na interval [jc,_i , *,•] je polynom 5; nejvýše třetího stupně, i = 1, ..., n, • Sí(xí-\) = yi-\ a Si(xi) = j>; pro všechna i = 1, ... n, • S^xi) — Si+l(xi) pro všechna i — 1, ..., n — 1, • 5^' (xi) = (xj) pro všechna i = 1, ..., n — 1. Kubický splajn1 pro n + 1 bodů sestává z n kubických polynomů, tj. máme k dispozici 4n volných parametrů (první definiční podmínka). Další podmínky přitom zadávají 2n+(n—1)+(n — 1) rovností, tj. dva parametry zůstávají volné. Při praktickém použití se dodávají předpisy pro derivace v krajních bodech, tzv. úplný splajn, nebojsou tyto zadány jako nula, tzv. přirozený splajn. Pro srovnání se podívejme na interpolaci stejných dat jako v případě Lagrangeova polynomu, nyní pomocí splajnů: ^Ošklivé české slovo „splajn" vzniklo fonetickým přepisem anglického ekvivalentu „spline", který znamenal tvárné pravítko užívané inženýry pro kreslení křivek. 242 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ vidíme, že libovolný bod intervalu (0, 1) je vnitřním bodem intervalu [0,1). Pro každé S e (0, 1) je os (0) n [o, i) = (-s, s) n [o, i) = [0, á), os (i) n [o, i) = (i - á, i + á) n [o, i) = (i - á, i), tj. každé á-okolí bodu 0 obsahuje jisté body intervalu [0, 1) a hodnoty z intervalu (—5,0) a každé á-okolí bodu 1 má neprázdný průnik s intervaly [0, 1), [1, 1 + S). Body 0 a 1 jsou tedy hraničními body. Celkem jsme zjistili, že množina všech vnitřních bodů odpovídá intervalu (0, 1) a množina hraničních bodů je {0, 1}. Stačí si uvědomit, že bod nemůže být současně vnitřní a hraniční a že hraniční bod musí být izolovaný, nebo hromadný. □ 5.29. Určete suprema a inrima množin v K: A =(-3,0]U(l,jr)U{6}; B (-1)" neN C = (-9,9)n( 5.30. Nalezněte sup A a inf A pro O ín + (-i)" A = i----; neN Cl. O 5.31. Jsou dány následující množiny: N= {1,2, ...,n, ...}, M = I--; neN [ n J=(0, 2]U[3,5]\{4}. Určete inf N, sup M, inf J a sup J v K. O 5.32. Napište příklad množiny M c E, která nemá v K infimum, ale má zde supremum; a udejte příklad množiny N C K, která nemá v K supremum, ale má zde infimum. O 5.33. Uvedie podmnožinu X množiny K, pro kterou je sup X < inf X. O 5.34. Udejte příklad množin A, i, C c 1 takových, aby platilo Ans = 0, Anc = 0, sne = 0, sup a = M s = mc = sup c. o Obrázek naznačuje, že je aproximace daleko stabilnější než tomu bylo u aproximace polynomy. Výpočet celého splajnu už není bohužel tak jednoduchý jako u nezávislých výpočtů Hermiteových polynomů třetího stupně, protože data se prolínají vždy mezi sousedními intervaly. Při vhodném uspořádání se však dosáhne matice systému, která má nenulové prvky prakticky jen ve třech diagonálách, a pro takové existují vhodné numerické postupy, které umožní splajn počítat také v čase úměrném počtu bodů. 2. Reálná čísla a limitní procesy Je důležité mít dostatečně velkou zásobu funkcí, se kterými bude možné možné vyjadřovat všechny běžné závislosti, zároveň ale musí být výběr šikovně omezen, abychom uměli vybudovat nějaké univerzální a hlavně účinné nástroje pro práci s nimi. Ve skutečnosti se budeme muset hned z kraje soustředit na to, jak vůbec hodnoty funkcí definovat, když pomocí konečně mnoha násobení a sčítání dostáváme jen polynomy a navíc skutečně počítat umíme jen s čísly racionálními. S těmi ale nevystačíme ani při počítání odmocnin, protože už \Í2 racionální číslo není. Prvním naším krokem tedy musí být pořádné zavedení tzv. limitních procesů, tj. dáme přesný obsah tvrzením, že se nějaké hodnoty blíží jejich hodnotě limitní. Všimněme si také, že výraznou vlastností polynomů je jejich „spojitá" závislost hodnot na nezávislé proměnné. Intuitivně řečeno, když dostatečně málo změníme x, určitě se nám moc nezmění ani hodnota f'(x). Takové chování naopak nemáme u po částech konstantních funkcí / : R -» R v okolí „skoků". Např. u tzv. Heavisideovy funkce 2 10 pro všechna x < 0, 1/2 prox=0, 1 pro všechna x > 0 taková „nespojitosť" nastane pro x —0. Začneme formalizací takovýchto intuitivních výroků. 5.10. Reálná čísla. Prozatím jsme docela dobře vystačili s alge-., braickými vlastnostmi reálných čísel, které říkaly, že R je tpole. Už jsme ale používali i relaci uspořádání reálných čísel, kterou značíme „<" (viz odstavec 1.38). Vlastnosti i (axiomy) reálných čísel, včetně souvislostí uspořádání a ostatních relací, jsou shrnuty v následující tabulce. Formálně vzato, pracujeme se čtveřicí (R, +, •, <) s nosnou množinou R, s binárními operacemi + a • a s relací uspořádání <. Dělící čáry v tabulce naznačují, jak axiomy postupně zaručují, že jsou reálná čísla komutativní grupou vůči sčítání, že R \ {0) je komutativní grupa vůči násobení, R je pole, množina R spolu s operacemi +, • a s relací uspořádání je tzv. uspořádané pole a konečně poslednímu axiomu můžeme rozumět tak, že R je „dostatečně husté", tj. nechybí nám tam body, jako např. chybí \Í2. v číslech racionálních. 2Často také bývá Heavisideova funkce definována s hodnotami — 1 pro záporné argumenty, + 1 prokladnéasnulovouhodnotouvnule.Imyjitakpoužijeme v kapitole sedmé. 243 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.35. Řešení. Vyznačte v komplexní rovině následující množiny: i) {zeC||z-l| = |z + l|}, ii) [z e C| 1 < \z - i\ S 2}, iii) [z e q Re(z2) = 1}, iv) {z € C| Re(I) < i}, (i) imaginární osa, Axiomy reálných čísel (Rl) (R2) (R3) (R4) AI (ii) mezikruží okolo i, (a + £>) + c = a + (£> + c) pro všechna a, b, c e R, a + b = Ŕ + a pro všechna a, Ŕ e R, existuje prvek 0 e R takový, že pro všechna a e platia + 0 — a, pro každé a e R existuje opačný prvek (—a) e takový, že platí a + (—a) = 0, 1?a (R5) (a ■ b) ■ c — a ■ (b ■ c) pro všechna a, Ŕ, c e R, (R6) a ■ b — b ■ a pro všechna a, Ŕ e R, (R7) existuje prvek 1 e R takový, že pro všechna a e R platí 1 • a — a, (R8) pro každé a e R, a ^ 0, existuje inverzní prvek a-1 e R takový, že platí a ■ a~l — 1, (R9) ■ (6 + c) ■ c pro všechna a, , c e - (RIO) (Rll) (R12) (iii) hyperbola a2 — b2 = l,(iv) vnějšek jednotkového kruhu, střed v 1. (R13) i_ ^ Iľfcv J V/ ^ \ relace < je úplné uspořádání, tj. reflexivní, antisymet- rická, tranzitivní a úplná relace na R, pro všechna a, b, c e R platí, že z a < b vyplývá také a + c < b + c, pro všechna a,£>eR,a>0,£>>0, platí také a - b > 0,_ každá neprázdná shora ohraničená množina A c R má supremum. Pojem supremum musíme ale také zavést pořádně. Má smysl pro každou uspořádanou množinu, tj. množinu s pevně zadanou relací uspořádání, a budeme se s ním takto i později setkávat ve více algebraických souvislostech. Připomeňme, že v obecné úrovni je uspořádáním jakákoliv binární relace na množině, která má vlastnosti reflexivity, antisymetrie a tranzitivity, viz odstavec 1.38. [ Supremum a infimum [_^ □ C. Limity V následujících příkladech se budeme zabývat výpočtem limit posloupností, tedy tím, jak posloupnosti „vypadají v nekonečnu". Tj. pokud bychom chtěli předepsat n-tý člen posloupnosti pro hodně velké n, tak nám jej limita posloupnosti (pokud existuje) velmi dobře přiblíží. Limitám posloupností a posléze funkcí věnujeme v příkladovém sloupci hodně prostoru, proto s nimi začínáme dříve (a končíme později), než ve sloupci teorie. Začněme s limitami posloupností. Potřebné definice nalezne čtenář v oddílu 5.12. 5.36. Spočítejte následující limity posloupností: Definice. Uvažme podmnožinu A c B v uspořádané množině B. Horní závorou množiny A je každý prvek b e B, pro který platí, že b > a pro všechna a e A. Obdobně definujeme dolní závory množiny A jako prvky b e A takové, že b < a pro všechna a e A. Nejmenší horní závora podmnožiny A, pokud existuje, se nazývá supremum této podmnožiny a značíme ji sup A. Obdobně, největší dolní závora, pokud existuje, se nazývá infimum, píšeme inf A. 2nz+3n+l n+l ' i) lim ii) lim 2p^2±L, n+l ~ iii) lim iv) lim„^_0O 2n2+3n+l ' 2"-2- 2"+2- Posledním axiomem v naší tabulce vlastností reálných čísel tedy předpokládáme, že pro každou množinu reálných čísel A platí, že pokud existuje nějaké číslo a větší nebo rovno než všechna x e A, pak existuje také nejmenší takové číslo a. Např. volbou A — {x e Q, x2 < 2) dostaneme jako její supremum sup A právě číslo \/2. Okamžitým důsledkem je také existence infim pro každou zdola ohraničenou neprázdnou množinu reálných čísel (stačí si všimnout, že obrácením znaménka všech čísel zaměníme suprema a infima). Pro formální výstavbu další teorie ale potřebujeme vědět, zda námi požadované vlastnosti reálných čísel lze realizovat, tj. zda existuje taková uspořádaná čtveřice (R, +, •, <) s nosnou množinou R s binárními operacemi + a • a s relací uspořádání, které všech třináct axiomů skutečně splňují. Zatím jsem zkonstruovali korektně jen čísla racionální, která tvoří uspořádané pole, tj. splňují axiomy (Rl) - (R12), což si čtenář jistě snadno ověří. 244 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ v) lim J4n2+n vi) lim -jAn2 + n — 2n. Řešení. i) lim 2"2+3"+1 fi^OO ii) lim fi^OO iii) lim n+\ 2b2+3b+1 3n2+n+l ,. 2n+3+^ : hm —j* fi^OO * + ~ lim ■ = oo. 2+J + ? _ 2 n+1 1+1 lim 3- 1 n^oo 2n2+3n + l 2n+3+± oo : 0. iv) lim„^_ oo 2"+2-" lim v) Podle věty o třech limitách (5.21): Vrc e N : — < JAn2+n *--. Dále pak lim ^2- = lim ^ = 2, lim *- lim ^+i = 2. Tedy i lim = 2. vi) lim v^TTľ - 2n = lim (A^^xA,^^) ři^oo ři^oo V4" +řJ+2ři j_ _ 1 4- lim >oo v4ři2+ři+2ři lim >co V4»z+» i 2 □ 5.37. Buď c e K+ (kladné reálné číslo). Ukážeme, že lim ýč = 1. řl^OO Řešení. Uvažme nejprve c > 1. Funkce tfč je vzhledem k n klesající a její hodnoty jsou stále větší než 1 a proto musí mít posloupnost tfč limitu a tou je inrimum jejich členů. Předpokládejme, že by tato limita byla větší než 1, řekněme 1 + e, kde e > 0. Pak by podle definice limity byly všechny hodnoty dané posloupnosti od jistého m menší než 1 + e + ^, tj. zejména ^fč < 1 + e + ŠL. Potom by však c < ,/l + £+ ■ l + - l,n e N. Můžeme tedy položit Z/n = 1 + a„ pro jistá čísla an > 0, n e N. Užitím binomické věty získáváme (i + a„)n = i + í K + Odsud plyne odhad (všechna čísla a„ jsou nezáporná) n (n — 1) n > 2(n e N). n > n > 2 (n e N), Ve skutečnosti lze reálná čísla nejen zkonstruovat, ale také lze ukázat, že až na izomorflsmus to jde jediným způsobem. Pro naši potřebu vystačíme s intuitivní představou reálné přímky. Jednoznačnosti i existenci se ještě budeme věnovat později. 5.11. Komplexní rovina. Připomeňme, že komplexní čísla jsou dána jako dvojice reálných čísel, které jsme zvyklí zapisovat jako z = rez + iimz. Dobrou představou o komplexních číslech je proto rovina C — R2. Se sčítáním a násobením splňuje pole komplexních čísel axiomy (R1)-(R9), není na nich ale žádným rozumným způsobem definováno uspořádání, které by naplnilo axiomy (R10)-R(13). Nicméně s nimi budeme také pracovat a již dříve jsme viděli, že rozšíření skalárů na komplexní čísla je často pro výpočty mimořádně užitečné nebo dokonce nutné. Důležitou operací na komplexních číslech je tzv. konjugace. Je to zrcadlení podle přímky reálných čísel, tj. obrácení znaménka u imaginární složky. Značíme ji pruhem nad daným číslem z e C, z = re z Protože je pro z — x + iy z - z — (x + iy)(x - iy) ■■ zadává nám tento výraz právě kvadrát vzdálenosti komplexního čísla od nuly. Odmocnině z tohoto reálného nezáporného čísla říkáme absolutní hodnota komplexního čísla z, píšeme (5.3) \z\=z-l. Absolutní hodnotu máme definovánu také na každém uspořádaném poli skalárů K, prostě definujeme absolutní hodnotu \a\ takto \a\ a je-li a > 0, —a je-li a < 0. Samozřejmě platí pro každá dvě čísla a, b e K (5.4) \a+b\<\a\ + \b\. Této vlastnosti říkáme trojúhelníková nerovnost a splňuje ji také absolutní hodnota komplexních čísel definovaná výše. Zejména pro pole racionálních a reálných čísel, která jsou podmnožinami v komplexní rovině, zjevně obě definice absolutní hodnoty splývají. 5.12. Konvergence posloupností. V dalších odstavcích budeme pracovat s některým z číselných oborů K racionálních, reálných nebo komplexních čísel. V tomto kontextu je tedy třeba chápat absolutní hodnotu a skutečnost, že ve všech případech platí trojúhelníková nerovnost. Budeme chtít formalizovat představu, že se hodnota nějakých čísel blíží dané limitě. Základním objektem pro nás proto budou posloupnosti čísel a,, kde index i bude zpravidla probíhat všechna přirozená čísla. Posloupnosti budeme zapisovat buď volně jako ao, a\, ..., nebo jako nekonečné vektory (ao,a\, ...), případně v obdobě k zápisu matic jako (a,)^j. 245 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ tj. po úpravě máme 0 S an < n — 1 Podle Věty o třech limitách je n > 2 (n € N). 0 = lim 0 £ lim an < lim řl^OO řl^OO řl^OO V h — 1 0. Obdrželi jsme tak výsledek lim ifň = lim (1 + a„) = 1 + 0=1. Poznamenejme, že další užití Věty o třech limitách mj. dává 1 = lim 1 < lim ifc < lim ifň = 1 pro libovolné reálné číslo c > 1. 5.39. Určete limitu lim (72.^2.^2... 72). Řešení. Ke stanovení limity postačuje její členy vyjádřit ve tvaru i i i i i , i , i , , i 2i . 2? • 2« • • • 2^ = 22+í+s+"'+2>r. Dostáváme tak lim (V2 ■i/l-i/l-- - 72) = lim 2 2 + 4 + 8"^ ^2" : 2»=1 Pomocí známého vzorce pro součet geometrické řady je odkud plyne lirn^ (v2 • ^ • ^2 • • • 75) = 21 = 2 . 5.40. Stanovte ,1 2 n — 2 n — l lim _ + — + ■■■ + —j- + —j- □ 5.4i. Vypočítejte lim v«3 — 1 1?í2 + 2 + ŽJn1 — 2n5 — n3 — n + sin2 n 2-^5^+2^+5 5.42. Určete limitu n\ + (n - 2)! - (n -4)! lim -—-. n^oo n50 + n! — (ři — 1)! Cauchyovské posloupnosti Uvažme libovolnou posloupnost čísel (ao,i!i,...)vK takovou, že pro libovolné pevně zvolené kladné číslo £ > 0 platí pro všechny dvojice prvků a,•, a j posloupnosti, až na konečně mnoho výjimek (které závisí na volbě s), |a; -aj\ < s. Jinak řečeno, pro každé pevné £ > 0 existuje index N takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká cauchyovská posloupnost. Intuitivně jistě cítíme, že buď jsou v takové posloupnosti všechny prvky stejné až na konečně mnoho z nich (pak bude od určitého indexu N počínaje vždy \ai — aj\ = 0) nebo se taková posloupnost „hromadí" k nějaké hodnotě. Dobře je to představitelné v komplexní rovině: ať vybereme jakkoliv malý kruh (o po-'-' loměru s), tak se nám jej u cauchyovské posloupnosti vždy musí podařit položit do komplexní roviny tak, že zakryje všechny body nekonečné posloupnosti a,, až na konečně mnoho z nich. Můžeme si pak představit, že postupným zmenšováním se kruh smrští až do jediné hodnoty a, viz obrázek. TOíLOUTNOST , O KoHrLEXNltff £iS£L- Pokud by taková hodnota a e K pro cauchyovskou posloupnost skutečně existovala, očekávali bychom od ní patrně následující vlastnost konvergence: ____1 Konvergující posloupnost |_„ Jestliže pro posloupnost čísel (ao, a\, ...) v K, pevně zvolené číslo a e K a pro libovolné kladné reálné číslo £ platí pro všechna i, až na konečně mnoho výjimek (závisejících na volbě £), |a; - a\ < £, říkáme, že posloupnost (a;);^o konverguje k hodnotě a. Číslu a říkáme limita posloupnosti (a,)^0. O Jestliže nějaká posloupnost čísel a; e K, i — 0, 1, ..., konverguje k číslu a e K, pak pro každé pevně zvolené kladné £ víme, že \ai — a\ < e pro všechna i větší než vhodné N e N. Pak ovšem, díky trojúhelníkové nerovnosti, pro každou dvojici indexů i, j > N dostáváme |a; - a j \ = |a; - aN + aN - a j \ < |a; - aN | + \aN - a j \ <2s. Dokázali jsme tedy: Lemma. Každá konvergující posloupnost čísel je cauchyovská. V poli racionálních čísel se ovšem může snadno stát, že pro Q cauchyovské posloupnosti příslušná hodnota a neexistuje. Např. číslo \Í2 můžeme libovolně přesně přiblížit racionálními čísly a,, dostaneme tedy konvergentní posloupnost s limitou \Í2, ale samotná limita již není racionální. Uspořádaná pole skalárů, ve kterém všechny cauchyovské posloupnosti konvergují, se nazývají úplná. Následující tvrzení říká, O že axiom (R13) takové chování reálných čísel zaručuje: 246 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.43. Udejte příklad posloupností majících nevlastní limity se členy x„,y„,n € N, pro které je lim (xn + y„) = 1, lim (x„ y\) = +°°- 5.44. Napište všechny hromadné body posloupnosti dané členy (-1)"2« 5.45. Spočtěte je-li 5.46. Určete V4rc2 + 5n + 3 lim sup a„ a lim inf a„, ři2 + 4n — 5 , říjr =--- sin —, n e N. n2+ 9 4 O O lim inf I (-1)" I 1 + - ) +sin^ n^ca \ \ n ) 4 O o 5.47. Nyní přejděme k určování limit funkcí. Definice viz strana 252. Určete (a) (b) (c) (d) lim sin x; x^n/3 x2 + x — 6 x"i x2 - 3x + 2' lim lim ( arccos- . , c^+oo \ x + 1 / lim arctg —, lim arctg x , lim arctg (sin x) . x^—oo x x^—oo x^—oo Řešení. Případ (a). Připomeňme, že funkce je spojitá v jistém bodě, když je v tomto bodě její limita rovna funkční hodnotě. O funkci y = sin x však víme, že je spojitá na K. Dostáváme tak ,. . . 7t V3 lim smx = sin — =-. x^it/i 3 2 Případ (b). Přímé dosazení x = 2 dává nulový čitatel i jmenovatel. Přesto je příklad velmi snadno řešitelný. Jednoduché krácení x2+x-6 (x - 2) (x + 3) x + 3 2 + 3 c lim ■ lim ■ lim ■ »2l2 - 3x + 2 x-,2 (X-2)(x-\) x-,2x-\ 2-1 totiž vedlo ke správnému výsledku (díky spojitosti obdržené funkce v bodě x0 = 2). Uvědomme si zde, že limitu můžeme počítat pouze Věta. Každá cauchyovská posloupnost reálných čísel a; konverguje k reálné hodnotě a e R. Důkaz. Každá cauchyovská posloupnost je zjevně jfj ohraničená množina, protože pro libovolnou volbu £ ohraničíme všechny členy posloupnosti až -■^Sga.^, na kQjjegjjg mnoho z nich. Definujme si množinu B všech reálných čísel x, pro které platí x < aj pro všechny prvky a j posloupnosti, až na konečně mnoho z nich. Zřejmě má B horní závoru, tudíž podle axiomu (R13) má i supremum. Definujme a = sup B. Nyní pro nějaké pevně zvolené £ > 0 zvolme N takové, aby |a; — a j \ < e pro všechna i, j > N. Zejména tedy a j > au — e a a j < a n + £ pro všechny indexy j > N, takže a^ — £ patří do B, zatímco au + e už nikoliv. Souhrnně z toho dostáváme, že \a — a^ | < e, a proto také \a — aj \ < \a — a/t \ + \a/t — aj \ < 2s pro všechna j > N. To ale značí právě, že a je limitou uvažované posloupnosti. □ Důsledek. Každá cauchyovská posloupnost komplexních čísel zi konverguje k nějakému komplexnímu číslu z. Důkaz. Pišme z; — a; +i bi. Protože je \ai—aj |2 < |z,-— zj\2 a podobně i pro hodnoty £>,, jsou obě posloupnosti reálných čísel a, a bi cauchyovské. Existují tedy jejich limity a resp. b a snadno ověříme, že z = a + i b je limitou pro posloupnost z;. □ 5.13. Poznámka. Předchozí diskuse nám dává návod na jeden z možných postupů, jak korektně vybudovat reálná čísla. Postupujeme podobně jako při zúplňování přirozených čísel na celá (abychom přidali opačné hodnoty) a celých na racionální (abychom přidali podíly nenulových čísel). Tentokrát k racionálním číslům „přidáme" limity všech cauchyovských posloupností. Skutečně se podbízí zavést vhodně relaci ekvivalence na množině všech cauchyovských posloupností racionálních čísel tak, že dvě cauchyovské posloupnosti (fli)£o a (^')Eo Jsou ekvivalentní, když vzdálenosti |a, — b i \ konvergují k nule (to je totéž jako požadavek, že jejich sloučením do jediné posloupnosti tak, že první posloupnost bude představovat liché, zatímco druhá sudé členy výsledné posloupnosti obdržíme opět posloupnost cauchyovskou). Nebudeme zde teď podrobně ověřovat, že jde o ekvivalenci, • V -ífc*.. ^ zavádět operace násobení a sčítání, ani dokazovat, :Jj?--^|y že všechny požadované axiomy skutečně dojdou na-%mh^ĚĚ' P'ncm- Mohou se o to ale pokusit čtenáři samostatně, *vX' protože to není složité počínání. Všechny uvedené definice lze opřít o již existující sčítání a násobení jednotlivých členů posloupností, stejně jako definici vzdálenosti čísel. Jediný náročnější bod je v důkazu, že takto definovaných „nových" reálných čísel již bude dost, tj. že již bude platit axiom (R13) o existenci suprema. Tady je asi nejjednodušší ukázat, že každé úplné pole splňuje tento axiom, tj. že stačí ověřit, že cauchyovské posloupnosti vždy konvergují (a to v našem případě již není složité). Stejně tak je docela snadné dokázat, že axiomy (R1)-(R13) definují reálné čísla jednoznačně až na izomorfismus, tj. až na bi-jektivní zobrazení, která zachovávají jak algebraické operace, tak uspořádání. Ještě se k těmto poznámkám později vrátíme v souvislosti se zúplněním metrických prostorů, která budeme diskutovat ve druhé části 7. kapitoly na straně 414. 247 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ z funkčních hodnot v libovolně malém okolí daného bodu xo a že přitom limita nezávisí na hodnotě přímo v tomto bodě. Při počítání limit tedy můžeme využívat krácení a rozšiřování výrazů, které nemění hodnoty uvažované funkce v libovolně zvoleném ryzím okolí bodu xq. Případ (c). Dvojnásobná záměna pořadí limity a vnější funkce převádí původní limitu na 3 arccos | lim -- x^+ca x + 1 Lehce určíme, že lim 1 0. i^+oo x + 1 Neboť je funkce y = arccos x spojitá v bodě 0, ve kterém nabývá hodnoty jt/2, a funkce y = x3 je spojitá v bodě ji/2, platí lim (arccos- ) = (arccos ( lim - ) ) = (—\ . X^+C*D \ x + lJ \ \x^ + C*D X + 1 / / V 2/ Případ (d). Funkce y = arctgx má vlastnosti „užitečné při počítání limit" - je spojitá a prostá (rostoucí) na celé reálné ose. Tyto vlastnosti vždy (bez dalších podmínek či omezení) umožňují vnořit vyšetřovanou limitu do argumentu takové reálné funkce. Proto uvažujme arctg ( lim — | , arctg ( lim x4 |, arctg ( lim sin* Zřejmě je lim - = 0, X^-OG x a limita lim^-oo sin* neexistuje, což již implikuje lim arctg - = arctg 0 = 0, lim arctg x4 = lim arctg y = — x^ — oo x x^—oo y^+oo 2 a neexistenci poslední limity. □ 5.48. Určete limitu 1 — cos* lim , . x-*o xl sin(jr) Řešení. lim 1-cosjc .. 2sin2(§) lim x-*o xl sm(xl) x^o xl sm(xl) :(f) lim (f) sin(x2) 1/,. sin (f) y 1 1 lim —-— • lim —;-= — • oo : 2 U"-i~ô í / *^osin2(js;2) 2 Předchozí výpočet je nutné chápat „odzadu". Protože existují limity na pravé straně (ať už vlastní či nevlastní) a výraz \ ■ oo má smysl 5.14. Uzavřené množiny. Pro další práci s reálnými nebo komplexními čísly budeme potřebovat podrobnější pochopení pojmů jako blízkost, omezenost, konvergence apod. Pro jakoukoliv podmnožinu A bodů v K nás budou zajímat nejen její body a e A ale také body, ke kterým se umíme dostat limitně, tj. pomocí limit posloupností. __^^__^_J Hromadné body množiny__. Uvažme jakoukoliv množinu A bodů v K. Bod x e K nazýváme hromadný bod množiny A, jestliže existuje posloupnost ao,a\, ... vybraná z prvků A, j ejíž všechny členy j sou různé od x a která konverguje k hodnotě x. Hromadné body podmnožiny A racionálních, reálných nebo komplexních čísel jsou tedy ta čísla x, která jsou limitami takových posloupností čísel z A, které samotný bod x neobsahují. Všimněme si, že hromadný bod množiny do ní může, ale nemusí, patřit. Pro každou neprázdnou množinu A c K a pevný bod x e K je množina všech vzdáleností \x — a\, a e A, zdola ohraničená množina reálných čísel, má tedy inflmum d(x, A), kterému říkáme vzdálenost bodu x od množiny A. Všimněme si, že d(x, A) = 0, právě když buď x e A nebo je x aspoň hromadným bodem A(do-kažte si podrobně z definic). [ Uzavřené množiny |__, Uzávěr Ä množiny A c K je množina všech bodů, které mají od A vzdálenost nulovou (všimněme si, že pro prázdnou množinu není vzdálenost bodů od ní definována, je tedy automaticky 0 = 0). Uzavřená podmnožina v K je taková, která splývá se svým uzávěrem. Jsou to tedy právě množiny, které obsahují i všechny své hromadné body. Typickou uzavřenou množinou je tzv. uzavřený interval [a, b] = {x e R, a < x < b) reálných čísel, kde a a b jsou daná reálná číslo. Pokud některá z hraničních hodnot intervalu chybí, píšeme a = —oo (mínus nekonečno) nebo podobně b = +oo, a takové uzavřené intervaly značíme (—oo, b], [a, oo) a (—oo, oo). Uzavřené množiny jsou tedy ty, které v sobě mají i vše, k čemu umí „dokonvergovat". Uzavřenou množinu bude tvořit např. posloupnost reálných čísel bez hromadného bodu nebo posloupnost s konečným počtem hromadných bodů spolu s těmito body. Uzavřený je také např. jednotkový kruh v rovině komplexních čísel včetně hraniční kružnice. Snadno ověříme, že libovolný průnik a libovolné konečné sjednocení uzavřených množin opět uzavřená množina. Skutečně, pokud všechny body nějaké posloupnosti patří do průniku našeho systému množin, pak jistě patří do každé z nich, a proto do každé z nich patří i všechny hromadné body. Pokud bychom ale chtěli totéž říci o obecném sjednocení systému množin A,, pak bychom neuspěli, protože např. jednobodové množiny jsou zjevně uzavřené, ale z nich utvořená posloupnost bodů už uzavřená nebývá. Pokud ale jde o konečné sjednocení množin a hromadný bod nějaké posloupnosti ležící v tomto sjednocení, pak takový hromadný bod musí být hromadným bodem i vybrané podposloupnosti, která ale už bude celá v jedné z našich množin. Každá je ale uzavřená, takže i hromadný bod do ní a tedy i celého sjednocení patří. 248 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ (viz Poznámka za větou 5.22), existuje i původní limita. Kdybychom původní limitu rozdělili na součin limit lim(l — cosx) ■ lim —-—, *->o jc^o xz sin(xz) jednalo by se o součin typu 0 • oo, tedy nedefinovaný výraz, ale tento fakt nevypovídá nic o existenci původní limity. □ 5.49. Určete následující limity: i) linwz-SŽ., ii) lim^ n(sin x) iii) lim^o^r^, iv) lim^oe* Řešení, i) lim^^.2 ■ = 2 = 0. x2-4 lim*- i-2 y/(x-2)(x+2) : lim*. Jx+2 (5.27) x2-4 lim^n ^ 1, kde jsme využili toho, že ii) limI^2 ■ lim sin* = 0. x->0 iii) lim^o^ = lim^osinx • lim^0 = 0-1 = 0. Opět původní limita existuje, protože existují obě limity na pravé straně rovnosti a jejich součin je definován. iv) Při výpočtu této limity musíme být obezřetní, protože obě jednostranné limity v bodě nula existují, jejich hodnoty se však liší, zkoumaná limita tedy neexistuje: limitu, e* = elim~o+ \ = eoo = lůn* i >0- e* limx^o_ 5.50. Určete (a) linwz^ :0. (b) lim^2^ □ (c) lim^^+oo (2 + j))x , (d) lim^^+oo x x . Řešení. V tomto příkladu se budeme věnovat tzv. neurčitým výrazům. Přesněji řečeno, budeme se zabývat situacemi, kdy se o ně nejedná. Čtenáři doporučujeme, aby neurčité výrazy vnímal jako pojem pomocný, který mu má pouze usnadnit orientování se při prvním počítání limit, neboť obdržený neurčitý výraz pouze znamená, že jsme „nic nezjistili". Víme, že limita součtu je součet limit, limita součinu je součin limit a že limita podílu je podíl limit, pokud jednotlivé limity existují a nezískáme-li některý z výrazů oo — oo, 0 • oo, 0/0, oo/oo, o kterých právě hovoříme jako o neurčitých. Pro úplnost dodejme, že tato pravidla můžeme kombinovat (pro limity všech složek určené současně) a že za neurčitý výraz pak považujeme také ten, jenž obsahuje alespoň jeden neurčitý výraz. Např. tedy výrazy 5.15. Otevřené množiny. Dalším užitečným příkladem podmnožin jsou otevřené intervaly reálných čísel (a, b) — {x e R; a < x < b}, kde opět a i b jsou pevná reálná čísla nebo nekonečné hodnoty ±oo. Jde o typickou otevřenou množinu v následujícím smyslu: __j Otevřené množiny a okolí bodů j___ Otevřená množina v K je taková množina, jejíž doplněk je uzavřenou množinou. Okolím bodu a e K nazýváme libovolnou otevřenou množinu O, která a obsahuje. Je-li okolí definované jako Os(a) = [x e K, \x -a\ < 8} pro kladné číslo 8, hovoříme o 8-okolí bodu a. Všimněme si, že pro libovolnou množinu A je a e K hromadným bodem A, právě když v libovolném okolí a leží také alespoň jeden bod b e A, b ^ a. Lemma. Množina čísel A c K je otevřená, právě když každý její bod a e A do ní patří i s nějakým svým okolím. Důkaz. Nechť je A otevřená a a e A. Kdyby neexistovalo žádné okolí bodu a uvnitř A, musela by existovat posloupnost an f A, \a — a„\ < l/n. Pak je ovšema e A hromadným bodem množiny K \ A, což není možné, protože doplněk A je uzavřený. Naopak předpokládejme, že každé a e A leží v A i s nějakým svým okolím. To přirozeně zabraňuje, aby nějaký hromadný bod b pro množinu K \ A ležel v A. Je proto K \ A uzavřená a tedy je A otevřená. □ Z právě dokázaného lemmatu okamžitě vyplývá, že je libovolné sjednocení otevřených množin opět otevřenou množinou a že každý konečný průnik otevřených množin je opět otevřená množina. V případě reálných čísel jsou S-okolí právě otevřené intervaly o délce 28 s a uprostřed. V komplexní rovině je S-okolí kruh o poloměru 8 se středem v a. 5.16. Ohraničené a kompaktní množiny čísel. Uzavřené a otevřené množiny představují základní pojmy tzv. topologie. Aniž bychom zacházeli do hlubších podrobností a souvislostí, seznámili jsme se právě s topologií reálné přímky a topologií komplexní roviny. Velice užitečné budou i následující pojmy: ___| Ohraničené a kompaktní množiny |___ Množina A racionálních, reálných nebo komplexních čísel se nazývá ohraničená, jestliže existuje kladné reálné číslo r takové, že \z\ < r pro všechna čísla z e A. V opačném případě je neohraničená. Ohraničená a uzavřená množina se nazývá kompaktní. Uzavřené konečné intervaly reálných čísel jsou typickým příkladem množin kompaktních. Pro podmnožiny A reálných čísel definujeme jejich průměr d(A) = sup{|x — y\, x, y e A). Zjevně platí, že A je ohraničená, právě když d(A) < oo, a A je neohraničená, právě když d(A) = oo. Přidejme ještě několik topologických pojmů, které nám umožní účinné vyjadřování: 249 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ -oo + 00 = 00 — 00, 0 (—oo)3 + 00 označujeme jako neurčité a o výrazech 0 3 + 00 0 • (00 — 00y 00 00' 0 3 + 00 (—oo)3 — 00 můžeme říci, že jsou „určité" (pro ně jsme schopni ihned příslušnou limitu stanovit - výrazy odpovídají po řadě hodnotám — 00, 0, 0). V případě (a) podíl limit čitatele a jmenovatele dává výraz 4/0. Zápis, ve kterém dělíme nulou, je sám o sobě přinejmenším nežádoucí (později bychom se mu měli být schopni vyvarovat). Přesto nám umožní stanovit výsledek: nejedná se o neurčitý výraz. Všimněme si, že jmenovatel se blíží k nule zprava (pro x ^ 2 je (x — 2)6 > 0). To zapisujeme jako 4/ + 0. Čitatel a jmenovatel tak mají stejné znaménko v jistém ryzím okolí bodu x0 = 2 a lze říci, že jmenovatel jev limitě „nekonečněkrát menší" než čitatel, tj. lim x + 2 x^2 (x - 2f +00, což odpovídá položení 4/ + 0 = +00 (podobně se klade 4/ — 0 = = — 00). Při určování druhé limity lze postupovat analogicky. Protože čísla a € K a a5 mají stejná znaménka, dostáváme lim x + 2 >2+ (x - 2)5 +00 ^ —00 ■■ lim x + 2 >2- (x - 2) 5 ' tj. oboustranná limita neexistuje. Tomu odpovídá zápis 4/ ± 0 (nebo obecnější a/ ±0, a 7^ 0, a e K*), který je „určitým výrazem". Při důsledném oddělování symbolů +0 a —0 od ±0 vždy a/±0 pro a^O znamená, že limita neexistuje. Případy (c), (d). Je-li f(x) > 0 pro všechna uvažovaná x e K, platí g(i)-ln f(i) Využijeme-li toho, že exponenciální funkce je spojitá a prostá na reálné přímce, můžeme nahradit limitu lim f(x)g{x) lim (g(i).ln /(*)) Vnitřním bodem množiny A reálných nebo komplexních čísel nazveme takový bod, který do A patří i s nějakým svým okolím. Hraniční bodem množiny A rozumíme takový bod, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem K \ A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A. Otevřené pokrytí množiny A je takový systém otevřených množin U i, i e I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny A rozumíme bod a e A, který má okolí, jehož průnik s A je právě jednobodová množina {a}. 1 0TĚVK£NE/ / fOKW 5.17. Věta. Pro podmnožiny A reálných čísel platí: (1) neprázdná množina A je otevřená, právě když je sjednocením nejvýše spočetného systému otevřených intervalů, (2) každý bod a e A je buď vnitřní nebo hraniční, (3) každý hraniční bod množiny A je buď izolovaným nebo hromadným bodem A, (4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A, (5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné podpokrytí. Důkaz. (1) Zjevně je každá otevřená množina sjednocením nějakých okolí svých bodů, tj. otevřených intervalů. Jde tedy pouze o to, jestli nám jich vždy stačí spočetně mnoho. Zkusme tedy najít „co největšr" intervaly. Řek-'^ť---í?* neme, že body a, b e A jsou v relaci, jestliže celý otevřený interval (minja, b), maxja, b}) je podmnožinou v A. To je zjevně relace ekvivalence (otevřený interval (a, a) je prázdná množina a ta je podmnožinou, symetrie relace i tranzitivita jsou zřejmé). Třídy této ekvivalence budou zjevně intervaly, které budou navíc po dvou disjunktní. Každý z těchto intervalů jistě musí obsahovat nějaké racionální číslo a tyto musí být různé. Všech racionálních čísel je ale spočetně mnoho, proto máme tvrzení dokázané. (2) Přímo z definic vyplývá, že bod nemůže být vnitřní a hraniční zároveň. Nechť tedy a e A není vnitřní. Pak ovšem existuje posloupnost bodů a, ^ A s hromadným bodem a. Zároveň a patří do každého svého okolí. Proto je a hraniční. (3) Předpokládejme, že a e A je hraniční a není izolovaný. Pak stejně jako v argumentaci předchozího odstavce existují body a,-, tentokrát uvnitř A, jejichž hromadným bodem je a. (4) Předpokládejme, že je A kompaktní, tj. uzavřená a ohraničená, a uvažme nějakou nekonečnou posloupnost bodů a, e A. Tato podmnožina má jistě supremum b i infimum 250 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Připomeňme, že jedna z těchto limit existuje právě tehdy, když existuje druhá; a doplňme lim (g(x) ■ ln f(x)) =íiel => lim f(x)gix) = ď, X—^XQ X—^XQ lim (g(x) ■ ln f(x)) = +00 => lim f(x)gix) = +00, X-?X0 X-?X0 lim (g(x) ■ ln f(x)) = -00 x^xq Můžeme tudíž psát lim f(x)s(x) = 0. X—rXQ lim f(x)s{x) = e™° ™° jestliže obě limity vpravo existují a neobdržíme-li neurčitý výraz 0 • 00. Není obtížné si uvědomit, že tento neurčitý výraz lze získat pouze ve třech případech odpovídajících zbylým neurčitým výrazům 0°, oo°, I00, kdy postupně je lim f(x) = 0 x-?x0 a lim g(x) X-*X0 = 0, lim f(x) = +00 x—rxo a lim g(x) x^xíí = 0, lim f{x) = 1 a lim g(x) = ±00 V ostatních případech nám tedy znalost (a pochopitelně existence) limit lim f(x), lim g(x) X^Xfi x^xa umožňuje uvést výsledek (při dodefinování některých zápisů) lim f(x)s(x) = lim f(x) x-?x0 \x-?x0 lim g(x) Protože je lim (2-1—) =2, lim — = 0, lim x = +00, x^+00 \ x) x^+00 X x^+00 lim 2 + - = 2u = 1, x^+oo \^ x ) lim x~x = lim (= 0 x^+00 x^+00 \xl nebo lim x x = lim (ŕ) 1 = 0. x^+00 x^+00 Poslední výsledek pak bychom mohli vyjádřit zápisem 0°° = 0 či oo°° = 00, oo-1 = 0 (zdůrazněme, že se nejedná o neurčité výrazy). Přestože jsme kladli důraz na to, aby čtenář raději upřednostňoval úvahy o limitním chování funkcí před škatulkováním výrazů na určité a neurčité (a tyto pojmy vnímal jen jako pomocné), je snad dobře patrný důvod, proč se budeme nadále zabývat především neurčitými výrazy. □ a (nebo můžeme zvolit libovolnou horní a dolní závoru množiny A). Rozdělme nyní interval [a, b] přesně na dvě poloviny ^a, j(b — a)J a (fe — a), £>J. V alespoň jedné z nich musí být nekonečně mnoho prvků a,-. Vyberme takovou polovinu, jeden z prvků v ní obsažených a následně tento vybraný interval opět rozdělme na poloviny. Pak znovu vybereme tu polovinu, kde je nekonečně mnoho prvků posloupnosti a vybereme si jeden z nich. Tímto způsobem dostaneme posloupnost, která bude cauchyovská (dokažte si detailně - vyžaduje to jen pozorné hraní si s odhady, podobně jako výše). O cauchyovských posloupnostech ovšem už víme, že mají vždy hromadné body nebo jsou konstantní až na konečně mnoho výjimek. Existuje tedy podposloupnost s námi hledanou limitou. Z uzavřenosti A zase vyplývá, že námi nalezený bod musí opět ležet v A. Opačně, jestliže každá v A obsažená nekonečná podmnožina má hromadný bod v A, znamená to, že všechny hromadné body jsou v A a tedy je A uzavřená. Pokud by nebyla množina A zároveň ohraničená, uměli bychom najít posloupnost stále rostoucí nebo klesající s rozdíly dvou po sobě jdoucích čísel třeba alespoň 1. Taková posloupnost bodů z A ale nemůže mít hromadný bod vůbec. (5) Nejprve se věnujme snadnější implikaci, tj. předpo-^- rfe\\\ kládejme, že z každého otevřeného pokrytí lze J^'^9f vybrat konečné a dokazujme, že pak A je uzavřená %m!;yĚh- i ohraničená. Jistě lze A pokrýt spočetným sys-'Si' témem intervalů /„ — (n — 2, n + 2), n e Z, a jakýkoliv výběr konečného podpokrytí z nich říká, že je množina A ohraničená. Předpokládejme nyní, že a e R \ A je hromadným bodem posloupnosti a; e A a předpokládejme rovnou, že \a — an \ < i (jinak bychom mohli vybrat takovou podposloupnost). Množiny J n 1 1 a--, a H— pro všechna n e N, n > 0, jsou sjednocení dvou otevřených intervalů a jistě také pokrývají naši množinu A. Protože je možné vybrat konečné pokrytí A, bod a je uvnitř doplňku R \ A včetně nějakého svého okolí a není tedy hromadným bodem. Proto musí být všechny hromadné body A opět v A a tato množina je i uzavřená. Opačný směr důkazu je založený na existenci a vlastnostech suprema. Předpokládejme, že je A kompaktní a že je dáno nějaké její otevřené pokrytí C. Z předchozího je zjevné, že v A existují největší a nejmenší prvek, které jsou zároveň rovny b — sup A aa = inf A. Označme si teď „nejzazšímez",pro kterou ještě půjde konečné pokrytí z C vybrat, tj. definujeme množinu B = {x e [a, b]; existuje konečné podpokrytí [íi,i]í1A|. Evidentně a e B, jde tedy o neprázdnou shora ohraničenou množinu a existuje proto c = sup B. Jde nám o to dokázat, že ve skutečnosti musí být c — b. Argumentace je trochu nepřehledná, dokud si ji nenačrtneme na obrázku, podstata je ale snadná: Víme, že a +oo 2 cos X — 1 Ohraničenost výrazů lim + 7T | sin x | < 1, | 2 cos x — 1 | < 3 pro x e ' ai2 ^ +oo pro x —► +oo pak dávají výsledek lim ■ 1 0 + 71 0-1 V předešlé úvaze jsme vlastně použili Větu o třech limitách a zápis c/oo = 0 platný pro c e K (nebo přímo ohr./oo = 0, kde „ohr." značí ohraničenou funkci). Tento postup lze zobecnit. Pro limitu tvaru Mx) + f2(x) + ■ ■ ■ + fm(x) lim «o gi(x) + g2(x) +----\-g„(x) pncemz lim x^x0 f^x) ,. gi(x) lim :0, :0, i e (2, i e (2, platí lim x^xo gl(x) Mx) + f2(x) + ••• + /„ (x) , rn), ,n), lim Mx) «0 gl (X) + gl{x) H-----h gn(X) x^x0 g\(X) pokud limita na pravé straně existuje. Je přitom výhodné si uvědomit (třetí z limit lze určit např. pomocí 1'Hospitalova pravidla, se kterým se seznámíme později), že lim — c^+oo x? X* 0, lim — x^+oo x> : 0, lim — ■ 0, lim — = 0 t^+oo bx pro c e 0 < a < j3, 1 < a < b. ale značí, že q > c leží v B, což není možné. Původní volba c < b tedy vedla ke sporu, což dokazuje požadovanou rovnost b = c. Nyní ale s pomocí okolí b, které patří do C umíme najít konečné pokrytí v C pro celé A. □ 5.18. Limity funkcí a posloupností. Pro diskusi limit je vhodné rozšířit množinu reálných čísel R o dvě nekonečné ^ hodnoty ±oo, takjakjsme to už dělali při označování intervalů. Okolím nekonečna rozumíme interval (a, oo), resp. (—oo, a) je okolí —oo. Pojem hromadného bodu množin rozšiřujeme tak, že oo je hromadným bodem množiny A c R jestliže každé okolí oo s ní má neprázdný průnik, tj. jestliže je A shora neohraničená. Obdobně pro —oo. Hovoříme o nevlastních hromadných bodech množiny A. _I „počítání s nekonečny"__, Zavádíme i pravidla pro počítání s formálně přidanými hodnotami ±oo a pro libovolná „konečná" čísla a e R: a + oo ■ a — oo ■ a ■ oo ■ a ■ oo ■ a ■ (—oo) ■ a ■ (—oo) ■ a ±oo ■ oo, ■- — oo, ■- oo, je-li a > 0, ^ —oo, je-li a < 0, ^ —oo, je-li a > 0, ^ oo, je-li a < 0, ; 0 pro všechna a ^0. Následující definice pokrývá mnoho případů Umitních procesů a bude třeba ji zvládnout dokonale. Jednotlivými případy se budeme podrobně zabývat vzápětí. _^______J Reálné a komplexní limity___ Definice. Uvažme libovolnou podmnožinu A c R a reálnou U ,;i funkci / : A -» R, případně komplexní funkci / : A -» C, definovanou na A. Uvažme dále hro-madný bod množiny A (tj. buď reálné číslo nebo případně ±oo). Říkáme, že / má v xq limitu a e R, případně komplexní limitu a e C, a píšeme lim f(x) = a, x^xo jestliže pro každé okolí 0(a) bodu a lze najít okolí 0(xq) bodu xq takové, že pro všechna x e A n (O(xo) \ {xo}) je f(x) e O (a). V případě reálné funkce může také být limitní hodnotou a = ±oo a v takovém případě se limita a reálné funkce nazývá nevlastní. V případě a e R je o limitu vlastní. Je důležité si všimnout, že hodnota / v bodě xq v definici nevystupuje a / v tomto hromadném bodě vůbec nemusí být definována (a v případě nevlastního hromadného bodu ani nemůže)! Často také hovoříme o ryzím okolí 0(xq) \ {xq}, ve kterém nás funkční hodnoty zajímají. Nevlastní limity komplexních funkcí zatím definovat nebudeme. 252 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Odtud ihned plyne 3x+l+r-4x 3-3* lim -— = lim -= 3; X—r+OD 3X + 2X + x X—r+OD 3X lim 4X - 8x6 - 2X - 167 lim 4X i^+oo y - 45x - *jTijtx+n x^+oc-vTbr12 • 7tx Uvědomíme-li si, že je lim arctgji; = — > 1, stejně snadno dostaneme V* — sin3 x + x arctg x xwz\%x lim - —-= lim -—— = i^+oo Vl + 2x + x2 x-r+oo j£ 7t = lim arctgx = —. x^+cv 2 □ 5.52. Určete limity ,. / 1 1 1 1 hm--1---1---1-----1-- n^co^l.2 2-3 3-4 (n-l)-n /ll 1 lim —=== + —=== +----h —=== n^oo \ ^/n2 _|_ i ^Jn2 _|_ 2 ^/n2 _|_ „ Řešení. Neboť pro každé přirozené číslo k > 2 je (provádíme tzv. rozklad na parciální zlomky - budeme jej probírat u integrování racionálních lomených funkcí viz 6.23) 1 1 1 (k-l)k k-1 k platí 1 v . 1 1 1 hm--1---1---1-----h >oo V 1 - 2 2-3 3-4 (n - 1) • n \ 1 1 1 1 1 1 1 = km----1-----1-----1-----1---- n^ooVj 22334 n-1 n -- lim ( 1 - - 1. Poznamenejme, že stanovení této kmity je důležité: určuje součet jedné z tzv. teleskopických řad (se kterou pracoval již Johann I. Ber-noulk). Ke stanovení druhé kmity využijeme Větu o třech limitách. Odhady 1 11 1 +----1- —=== > -=== +----1- ■ Vři2 + 1 Vři2 + n \ln2 + n \/n2 + n n Vři2 + n 1 11 1 + —y- —=== s —=== + —h ■ V«2 + 1 V«2 + n *Jn2 + 1 V«2 + 1 n 5.19. Nejčastější varianty definičních oborů. Naše definice limity pokrývá zdánlivě velice rozdílné koncepty: (1) Limity posloupností. Jestliže je A — N, tj. funkce / je definována pouze pro přirozená čísla, hovoříme o limitách posloupností reálných nebo komplexních čísel. Jediným hromadným bodem definičního oboru A je pak oo a zpravidla píšeme hodnoty posloupnosti f(n) — an a limitu ve tvaru lim an — a. Podle definice to pak znamená, že pro každé okolí O (a) limitní hodnoty a existuje index N e N takový, že an e 0(a) pro všechna n > N. Ve skutečnosti jsme tedy v tomto speciálním případě přeformulovali definici konvergence posloupnosti (viz 5.12). Přidali jsme pouze možnost nevlastních limit. Říkáme také, že posloupnost an konverguje k a? Přímo z naší definice pro komplexní hodnoty je opět vidět, že komplexní posloupnost má limitu a, právě když reálné části a, konvergují k re a a zároveň imaginární části konvergují k im a. (2) Limita funkce ve vnitřním bodě intervalu. Jestliže je / definována na intervalu A — (a, b) a xq je vnitřním bodem tohoto intervalu, hovoříme o limitě funkce ve vnitřním bodě jejího definičního oboru. Většinou v tomto případě píšeme lim f(x) — a. X^XQ Podívejme se, proč je důležité v definici požadovat f(x) e 0(a) pouze pro body x ^ xq i v tomto případě. Vezměme jako příklad funkci / : R -» R je-li x ŕ o, je-li x — 0. Pak zjevně limita v nule je dobře definována a v souladu s naším očekáváním bude lim^o f (x) — 0, přestože hodnota /(O) = 1 do malých okolí limitní hodnoty 0 nepatří. (3) Limity funkce zprava a zleva. Je-li A — [a, b} ohraničený interval a xq — a nebo xq — b, hovoříme o limitě zprava, resp. zleva, funkce / v bodě xq. Jestliže je bod xq vnitřním bodem definičního oboru funkce /, můžeme pro účely výpočtu limity definiční obor zúžit na [xq , b] nebo [a, xq] . Výsledným limitám pak také říkáme limita zprava, resp. limita zleva pro funkci / v bodě xq. Označujeme je výrazy linLt_).;[+ f(x), resp. lún^^.^- f(x). Jako příklad nám může sloužit limita zprava a zleva v xq = 0 pro Heavisideovu funkci h z úvodu této části. Evidentně je 1, lim h(x) = 0. i->o- lim h(x) ■ Limita lim^o f(x) přitom neexistuje. Přímo z našich definic je zjevné, že limita ve vnitřním bodu definičního oboru libovolné reálné funkce / existuje, právě když existují limity zprava i zleva a jsou si rovny. 5.20. Další příklady limit. (1) Limita komplexní funkce /: A -» C existuje tehdy a jen tehdy, jestliže existují limity její reálné a imaginární části. V takovém případě je pak lim f(x) ■- X~>XQ lim (re/0:)) - X->XQ i lim (im /00)- X—^XQ Budeme v dalším i v případě nevlastní limity a — ±00 říkat, že an konverguje k a. V literatuře se ale často takovým posloupnostem říká divergentní a říká se o nich, že divergují k ±00. Sami budeme tuto termilogii používat u součtů řad. 253 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ pro n e N dávají n lim < lim < lim V«2 + n \ V«2 + 1 n 1 1 +----h V^TT Protože lim lim —-== V«2 +1 lim - : lim —— \/rP- + ři : 1, : 1, je rovnez 5.53. Spočtěte (a) (b) f ' 4-) n2+n j □ lim Vl + x — Vi— x cos x — sin x lim COS (2x) (c) lim Vx7 (l/x2 + 2x + 3 - a/x2 + 2x + 2) . x^+00 V / Řešení. Všechny uvedené limity vypočítáme pomocí vhodného rozšíření zadaného výrazu. V případě první limity vynásobíme čitatele i jmenovatele výrazem Vl +x + Vl -x a využijeme známého vztahu (a — b) (a + b) = a2 — b2. Takto obdržíme Jl+x-Jl-x (1 + x) - (1 - x) lim-= lim x->0 X x^O x (Vl + X + Vl -x) 2 2 lim Podobně vypočítáme cos x — sin x lim x-nt/4 cos (2x) o Vi +x + Vi - x VT + VT (cos x + sin x) (cos x — sin x) ■■ lim -= x-m/4 (cosx + sinx) cos (2x) lim r->ir/4 (COSX + SUlx) COS (2x) 1 1 lim V2 x^-ti/4 COSX + SinX vf 1 . 2 T 2 V2 , V2 U provedeného krácení připomeňme identitu cos (2x) = cos2 x — sin2 x, xel Abychom mohli při určování poslední limity použít (a - b) (a2 + ab + b2) = a3 - b3, Důkaz je přímočarý a vychází přímo z definice vzdáleností a okolí bodů v komplexní rovině. Skutečně, příslušnost do S-okolí komplexní hodnoty z je zajištěna pomocí reálných (l/V2)<5-okolí reálné a imaginární složky z. Odtud již tvrzení bezprostředně vyplývá. (2) Nechť / je reálný nebo komplexní polynom. Pak pro každý bod x e R je Skutečně, je-li fix) lim fix) = fix0). x^xq a„x" + ■ ao, pak roznásobením ixo+S)k = Xq+Ic Sx1^1 H-----\-8k a dosazením pro k = 0,..., n vidíme, že volbou dostatečně malého S se hodnotou libovolně blízko přiblížíme f(xo). (3) Uvažme nyní docela ošklivou funkci definovanou na celé reálné přímce /(*) = 1 je-li x e{ 0 jestliže x Přímo z definice je zjevné, že tato funkce nemá limitu v žádném bodě (dokonce ani zleva nebo zprava). (4) Následující funkce je ještě záludnější, než jsme viděli v předchozím případě. Funkce / - jestliže x = I 0 jestliže x£Q). R je definována takto: p aq nesoudělná, Zvolíme-li libovolný bod x, ať už racionální či iracionální, a veliké přirozené m, bude x v právě jednom z intervalů f-, 2±i) pro nějaké n (je-li x , uvazujeme jen nesoudělná m > g). Za Sk si zvolíme minimum ze vzdáleností bodu x od hranic těchto intervalů pro uvažovaná m menší než k. Samozřejmě vždy platí St < |. Uvažme nyní nějaké £ > Oai taková, že j < £. Pak pro všechna y v ryzím S-okolí bodu x je buď fiy) = 0, jde-li o iracionální hodnotu, nebo fiy) < £ pro r > k, jde-li o hodnotu racionální. V každém případě j e tedy \fiy)\ < s. Tato funkce má proto limitu ve všech reálných bodech x nulovou. Jen v iracionálních bodech je ale tato limita rovna funkční hodnotě. 5.21. Věta (O třech limitách). Buďte f, g, h reálné funkce se shodným definičním oborem A a takové, že existuje ryzí okolí hromadného bodu xo e R definičního oboru, kde platí fix) < gix) < h(x). Pokud existují limity lim fix) = /o, lim hix) = ho x^xo x^xo a navíc fo = ho, pak také existuje limita lim gix) = go a platí go = fo = ho- ^Této funkci se říkává Thomaeova (ale též Riemannova) funkce podle německého matematika J. Thomae z druhé poloviny 19. století. 254 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ k rozšíření potřebujeme výraz tři UHÍTX (x2 +2x + if+1/x2 +2x + 'x2 +2x + 2+y (x2 +2x + 2)2 který odpovídá a2 + ab + b2, resp. volíme a = ijx2 + 2x + 3, b = ijx2 +2x + 2. Tímto rozšířením převedeme limitu ze zadání na ((x2 + 2x + 3) - (x2 +2x + 2)) lim lim (x2 +2x + 3) + ^x2 + 2x + 3 • ^x2 + 2x + 2 + J(x2 + 2x + 2) _^_ ^(x2 + 2* + 3)2 + j 0 okolí O(xo) bodu xo e A c K, ve kterém jsou pro všechna i hodnoty /(*) i h(x) obsaženy v intervalu (/o — e, /o + e). Z podmínky /O) < gO) < h(x) vyplývá, že i g(x) e (/o — e, /o + e), tedy linwxo gO) = /0. Drobnou modifikací předchozího postupu si čtenář doplní i argumentaci pro nevlastní hodnoty limit nebo limity v nevlastním bodu xq. Určitě bude dobré si tyto případy podrobně promyslet! □ Všimněme si, že věta dává možnost výpočtu limit pro všechny typy diskutované výše, tj. limity posloupností, limity funkcí ve vnitřních bodech, jednostranné limity atd. 5.22. Věta. Nechť A c Uje definiční obor reálných nebo komplexních funkcí f a g, xq nechť je hromadný bod A a existují limity lim f(x) — a e X^XQ lim g(x) — b e . X^XQ Potom: (1) limita a je určena jednoznačně, (2) limita součtu f + g existuje a platí lim (/(*) + g(x)) =a + b, x^xíí (3) limita součinu f ■ g existuje a platí lim (f(x) ■ g(x)) =a-b, x-?xt) (4) pokud navíc 6/0, pak limita podílu f/g existuje a platí .. fix) a lim -— —. X^rXO g(x) b Důkaz. (1) Předpokládejme, že a a a' jsou dvě hodnoty li-r mity lim,^,, fix). Pokud je a ^ a', pak existují *gy£ disjunktní okolí Oia) a 0(a'). Pro dostatečně malá »-r okolí xo ale mají hodnoty / ležet v obou naráz, což je spor. Proto je a = a'. (2) Zvolme si nějaké okolí a + b, třeba 02e(0 - lim x->0 (l+2nx)n - (l + nx)z (2n3 (n - 1) - n3 (2n - 1)) x2 + (P(x) - Q(x)) x3 -- lim (-n3 + (P(x) - Q(x)) x) = -n3 + 0 = □ 5.55. Spočítejte Řešení. Limity typu 1±0° (jako je v zadání) lze počítat podle vzorce lim (tgx)tg(2l) . lim f{x) x^xq g(x) lim ((/(*)-l)g(x)) jestliže limita na pravé straně existuje a fix) ^ 1 pro x z jistého ryzího okolí bodu x0 € K. Určeme proto lim (tgx-l)tg(2x) x-m/4 lim smx sin (2x) x-m/4 \cosx ) cos (2x) sin x —cos x 2 sin x cos x : lim lim cos x -2 sinx cosz x — sin x Odtud máme lim (tg x) x^n/4 tg Qx) Doplňme, že použitý vzorec platí obecněji pro „typ i0*011", tj. bez kladení jakýchkoli podmínek týkajících se limity lim^^ gix), která tak ani nemusí existovat. □ 5.56. Ukažte, že je sin x lim- x->0 X Řešení. Uvažujme jednotkovou čtvrtkružnici v prvním kvadrantu a její bod [cosx, sinx], x e (0, ji/2). Délka kruhového oblouku mezi body [cos x, sinx] a [1, 0] je rovna x. Zřejmě tedy je sinx < x, x € (i), — ^ . Hodnotu tgx potom vyjadřuje délka úsečky s krajními body [1, sinx/cosx] a [1,0]. Vidíme, že je (příp. si nakreslete obrázek) x < tgx, x e (o, ^ . Tato nerovnost rovněž vyplývá z toho, že trojúhelník s vrcholy [0, 0], [1, 0], [1, tgx] má očividně větší obsah než uvažovaná kruhová výseč. Dohromady jsme získali sinx < x < IX / jt\ - xe (0,- . ix V 2 / Poznámka. Podrobnějším sledováním důkazů jednotlivých bodů věty můžeme její tvrzení rozšířit i na některé nekonečné hodnoty limit reálných funkcí: V prvém případě je zapotřebí, aby buďalespoň jedna z limit byla konečná nebo aby obě měly stejné znaménko. Pak opět platí, že limita součtu je součet limit s konvencemi z 5.18. Případ „oo — oo" ale není zahrnut. V druhém případě může být jedna z limit nekonečná a druhá nenulová. Pak opět platí, že limita součinu je součin limit. Případ „0 • (±oo)" není ale zahrnut. V případě podílu může být a e M. ab = ±oo, kdy výsledek limity bude nula, nebo a = ±oo aieB, kde výsledek bude ±oo podle znamének čitatele a jmenovatele. Případ „§|" není zahrnut. Zdůrazněme, že naše věta jako speciální případ pokrývá také odpovídající tvrzení o konvergenci posloupností i o Umitách zprava a zleva funkcí definovaných na intervalu. Pro úvahy o Umitách bývá technicky užitečný i následující jednoduchý důsledek definic, který uvádí do souvislosti limity posloupností a funkcí obecně. 5.23. Důsledek. Uvažme reálnou nebo komplexní funkci f definovanou na množině A c R a hromadný bod xq množiny A. Funkce f má v bodě xq limitu y, právě když pro každou posloupnost bodů xn e A konvergující k xq a různých od xq má i posloupnost hodnot f(x„) limitu y. T£5r KÓNVEJ&ENCt- 7^ xlx3 x Důkaz. Předpokládejme nejprve, že Umita / v bodě xq je skutečně y. Pak pro libovolné okoU V bodu y musí existovat okoU V bodu xo takové, že pro všechna x e VC\A,x ^ xq, je fix) e U. Pro každou posloupnost x„ —> xq bodů různých od xq ale budou pro všechna n větší než vhodné N i všechny body x„ e V. Budou tedy posloupnosti hodnot f(x„) konvergovat k hodnotě y. Předpokládejme naopak, že funkce / nekonverguje k y při x —> xq. Pak pro nějaké okolí U hodnoty y existuje posloupnost bodů xm ^ xq v A, které jsou bližší kxo než l/m a přitom hodnota f(xm) nepatří do U. Tím jsme zkonstruovaU posloupnost bodů z A různých od xq, pro které hodnoty f(x„) nekonvergují k y a důkaz je ukončen. □ Nyní máme nachystány nástroje na korektní formulaci vlastnosti spojitosti, se kterou jsme dříve intuitivně nakládali u polynomů. [ Spojitost funkcí |__, Definice. Nechť / je reálná nebo komplexní funkce definovaná na intervalu A c R. Říkáme, že / je spojitá v bodě xo e A, jestliže je KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ tj. X 1 / 71 \ 1<^<-, *e(0,-), sin x cos x \ 2/ sin x / Tt\ 1 > - > cos x, x e ( 0, — I . x V 2/ Z Věty o třech limitách nyní plynou nerovnosti 1 = lim 1 > Dokázali jsme tak, že smx 1 = hm 1 > lim - > lim cos x = cos 0=1. x^0+ x^0+ x x^0+ smx lim -= 1. x^0+ X Funkce y = (sin x) jx definovaná pro x ^ 0 je ovšem sudá, a tudíž je sin x sin x lim -= lim -= 1. x-rO- x x^0+ x Protože obě jednostranné limity existují a jsou si rovny, existuje oboustranná limita a platí pro ni lim- x->0 X lim - x->0± X 1. Poznamenejme ještě, že uvedenou limitu by sice šlo velmi snadno vyčíslit za pomoci ľ Hospitalova pravidla, nicméně k odvození ľ Hospi-talova pravidla je používána právě tato limita, tudíž se při jejím výpočtu na zmíněné pravidlo odvolávat nemůžeme. □ 5.57. Stanovte limity lim . . , n-?OD \n 4- 1 / lim - lim 1 + lim *->o x „2 , lim 3 tg2 x *->■<> sin x sin (3x) x^o 5x2 lim lim 1 - - arcsinx lim-; x->0 X tg (3x) lim - >o sin (5x) lim lim ■ *o sin (5x) x^o x x^o sin (2x) Řešení. Při určování těchto limit využijeme znalosti limit (a e K) (1 + -) =e' Víme tedy, že je -i smx eř — 1 lim 14- = ď; lim-= 1; lim-= 1. ři^oo V n / X x^Q X 1\" ín-l lim 1 - - = lim - n—?oo \ n 1 n—?oo \ n Substituce m = n — 1 dává lim lim m—?oo \ m -(- 1 Celkem máme lim I-1 • lim -. m-?oo \ m + 1/ m-?oo m 4 1 lim m 4 1 lim fix) = fix0). x^xa Funkce / je spojitá na množině A, jestliže je spojitá ve všech bodech xo e A. > m 4 1 Všimněme si, že pro hraniční body intervalu A říká naše definice, že f v nich má hodnotu rovnou limitě zleva, resp. zprava. Říkáme, že je v takovém bodě spojitá zprava, resp. zleva. Již jsme také viděli, že každý polynom je spojitou funkcí na celém M, viz 5.20(2). Potkali jsme také funkci, která je spojitá jen v iracionálních reálných číslech, přestože má limity i ve všech číslech racionálních, viz 5.20(4). Z předchozí Věty 5.22 o vlastnostech limit okamžitě vyplývá většina následujících tvrzení 5.24. Věta. Nechť f a g jsou (reálné nebo komplexní) funkce definované na intervalu A a spojité v bodě xq e A. Pak (1) součet f + g je funkce spojitá v xq, (2) součin f ■ g je funkce spojitá v xq, (3) pokud navíc g(xo) ^ 0, pak podíl f/g je dobře definován v nějakém okolí xq a je spojitý v xq, (4) pokud je spojitá funkce h definována na okolí hodnoty f'(xo) reálné funkce f, pak složená funkce h o f je definována na okolí bodu xo a je v bodě xo spojitá. Důkaz. Tvrzení (1) a (2) jsou zřejmá, doplnit důkaz potřebujeme u tvrzení (3). Jestliže je g(xo) ^ 0, pak také celé £-okolí čísla g(xo) neobsahuje nulu pro dostatečně malé £ > 0. Ze spojitosti g pak vyplývá, že na dostatečně malém S-okolí bodu xo bude g nenulové a podíl // g tam bude tedy dobře definován. Pak bude ovšem i spojitý v xo podle předchozí věty. (4) Zvolme nějaké okolí O hodnoty h(f (xo)). Ze spojitosti h k němu existuje okolí O' bodu f (xo), které je celé zobrazeno funkcí h do O. Do tohoto okolí O' spojité zobrazení / zobrazí dostatečně malé okolí bodu xo. To je ale právě definiční vlastnost spojitosti a důkaz je ukončen. □ Nyní si vcelku snadno můžeme odvodit zásadní souvislosti spojitých zobrazení a topologie reálných čísel: 5.25. Věta. Nechť f : R —> M. je spojitá funkce. Pak (1) vzor f~l(U) každé otevřené množiny U je otevřená množina, (2) vzor f~l(W) každé uzavřené množiny W je uzavřená množina, 257 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Druhá z limit je zjevně rovna 1. Když změníme označení (nahradíme n za m), můžeme napsat výsledek lim n + 1 Dále platí lim ( 1 + -Y] = lim (1 + lim 1(1 + —) I = e° = 1 lim (1 - - ) = lim ((1 - - ) ) =0. n-?OD y n) n^coXX^ n) ) Upozorněme, že první z předešlých vyčíslení vyplývá z limit / 1\"2 / IV 1 lim 1 + -r = lim 1 + — = e, lim - = 0 ři^oo \ n I m^oo \ ml ři^oo n a druhé potom z / iv lim I 1--I = e , lim n = +oo, přičemž klademe e~°° = 0 (zápis označuje limI^_0O ď = 0 - jedná se o určitý výraz). Snadno lze získat lim ■ srn* lim sin* • lim-=0-1=0. x^q x x^q x^q x Zřejmě je a limita lim-= l"1 = 1 i->o sin x 1 lim ■ *->o sin* neexistuje (zapisujeme 1 / ± 0). Kdybychom tedy k výpočtu limity lim ■ *->-o sin x užili pravidla o limitě součinu, obdrželi bychom 1- 1/ ± 0 = 1 / ± 0. To znamená, že tato limita neexistuje (opět jde o určitý výraz). Ke stanovení arcsin x lim- x->0 x použijeme identitu x = sin (arcsin x) platnou pro x e (—1,1), tj. v jistém okolí bodu 0. Pomocí substituce y = arcsin x dostáváme arcsinx arcsinx y lim-= lim-= lim-= 1. *->o x x^o sin (arcsin x) y^osiny Poznamenejme, že y —► 0 plyne z dosazení x = 0 do y = arcsin x a ze spojitosti této funkce v počátku (to také zaručuje, že jsme tuto substituci mohli „bez obav" zavést). (3) obraz f(K) každé kompaktní množiny K je kompaktní množina, (4) na libovolné kompaktní množině K dosahuje spojitá funkce svého maxima a minima. Důkaz. (1) Uvažme nějaký bod xq e f~l(U). Nějaké okolí ^.tf.' i O hodnoty f(xo) je celé v U, protože je U otevřená. Pak 'ľVJ^ ovšem existuje okolí O' bodu xq, které se celé zobrazí do O, patří tedy do vzoru. Každý bod vzoru je tedy vnitřní a tím je důkaz ukončený. (2) Uvažme nějaký hromadný bod xo vzoru f~l(W) a nějakou posloupnost xi, f(xj) e W, která k němu konverguje. Ze spojitosti / nyní zjevně vyplývá, že f(xj) konverguje k f (xq), a protože je W uzavřená, musí i f(xo) e W. Zřejmě jsou tedy všechny hromadné body vzoru množiny W ve W také obsaženy. (3) Zvolme libovolné otevřené pokrytí f(K). Vzory jednotlivých intervalů budou sjednoceními otevřených intervalů a tedy také vytvoří pokrytí množiny K. Z něho lze vybrat konečné pokrytí a proto nám stačí konečně mnoho odpovídajících obrazů k pokrytí původní množiny f(K). (4) Protože je obrazem kompaktní množiny opět kompaktní množina, musí být obraz ohraničený a zároveň musí obsahovat svoje supremum i inflmum. Odtud ale vyplývá, že tyto musí být zároveň maximem a minimem hodnot. □ 5.26. Důsledek. Nechť f : R -> R je spojitá. Potom (1) obraz každého intervalu je opět interval, (2) f na uzavřeném intervalu [a, b] nabývá všech hodnot mezi svou maximální a minimální hodnotou.5 Důkaz. (1) Uvažme nejprve nějaký otevřený interval A a předpokládejme, že existuje bod y e R takový, že f (A) obsahuje body menší i větší než y, ale y ^ /(A). Znamená to tedy, že pro otevřené množiny B\ — (—oo, y) a B2 — (y, 00) jejich vzory Ai = f~l(B\) n A a A2 = /_1(B2) n A pokrývají A. Tyto množiny jsou přitom opět otevřené, jsou disjunktní a obě mají neprázdný průnik s A. Stejnou úvahou jako v důkazu prvního bodu v 5.17 dospějeme k závěru, že musí existovat bod x e A, který neleží v A1, je ale jejím hromadným bodem. Musí pak tedy ležet v A2 a to u disjunktních otevřených množin není možné. Dokázali jsme tedy, že pokud nějaký bod y nepatří do obrazu intervalu, musí být všechny hodnoty buď zároveň větší nebo zároveň menší. Odtud vyplývá, že obrazem bude opět interval. Všimněme si, že krajní body tohoto intervalu mohou a nemusí do obrazu patřit. Pokud obsahuje definiční interval A i některý ze svých hraničních bodů, musí jej spojitá funkce zobrazit opět buď na hraniční nebo vnitřní bod obrazu vnitřku A. Tím je tvrzení ověřeno. (2) Toto tvrzení je přímým důsledkem předchozího, protože obrazem ohraničeného uzavřeného intervalu (tj. kompaktní množiny) musí být opět uzavřený interval. □ Na závěr naší úvodní diskuse spojitosti funkcí uvedeme ještě tvrzení, která jsou užitečným nástrojem při počítání limit. 5.27. Věta (O limitě složené funkce). Nechť f, g funkce, lim^^a f(x) = b. í JSOU Tomuto tvrzení se (zejména v české literatuře) říká Bolzanova věta. Bernard Bolzano pracoval na začátku 19. století v Praze. 258 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Ihned vidíme, že je 3 tg2* lim x^-o 5 x2 ( 3 sin x sin x *->o ^ 5 x x 3 sin* sin* 1 lim-• lim-• lim 5 *->o x 3 3 : - - 1 - 1 - 1 = - 5 5 x->0 X x^O cos2 X Vhodné rozšíření a substituce dávají sin (3x) /sin (3x) lim-= lim i->o sin (5x) 5* 3* sin(3x) : lim-• lim x->o 3x sin (5x) 5 / 5x 3 ■ô sin (5x) 5 ,. siny z lim-• lim y^O y z^O sin z 5 Pomocí předešlého výsledku pak lehce spočítáme 3 3 - = 1-1--5 lim tg (3*) '"o sin (5x) lim sin (3x) 1 o \ sin (5x) cos (3x) 1 sin(3x) lim —-• lim x-*o sin (5x) x^o cos (3x) Podobně můžeme stanovit 3 : - • 1 5 lim ■ x->0 (5-2)i _ , lim ( e2*-(5 - 2) x^o\ (5-2)x „3x lim- *->o sin (2x) „5x , : lim = lim e2* • lim - i->0 x^O -_ eo . iim £- y^O y ' -1 í 1 3x ■ 3 = 1-1-3 = lim x->0 a5x -- lim - 5x - 1 x^o 5x e-* - 1 ■o \ sin (2x) sin (2x) 2x 5 e-* - 1 2x sin (2x) 2 —z 2x 5 *->o sin (2x) 2 sin (2x) - lim = lim- M^o u 5 1 = 2 + 2 = ■ lim lim 2x o sin (2x) . iim z . — z^o sin z 2 - lim- i>^0 v ■ lim- z^o sin z □ 5.58. Vypočtěte limity lim x->0 1 — cos (2x) lim ■ x->0 1 — cos x Řešení. Využijeme faktu, že lim- x->0 X (1) Pokud je funkce g spojitá v bodě b, potom lim g (/(*)) = g (lim f (x)) = g(b). x^a \x^a / (2) Jestliže existuje limita lim^j g(y) a zároveň pro všechna x z nějakého ryzího okolí bodu a platí f(x) ^ b, potom lim g (/(*)) : lim g(y). y^b Důkaz. První tvrzení se dokazuje podobně jako tvrzení 5.24(4). Ze spojitosti g v bodě b vyplývá, že pro jakékoliv okolí V hodnoty g(b) umíme najít dostatečně malé okolí U bodu b, na kterém jsou už všechny hodnoty g ve V. Pokud ale / má bod b jako limitu v bodě a, pak se do U trefíme všemi hodnotami / pro dostatečně malé ryzí okolí bodu a, což již ověřuje první tvrzení. Pokud nemáme k dispozici spojitost funkce g v bodě b, bude předchozí argumentace obecně platit také, když zajistíme, aby dostatečně malá ryzí okolí bodu a byla funkcí / zobrazena do ryzího okolí bodu b. □ 5.28. Kdo už je v ZOO. Začali jsme budovat náš zvířetník funkcí s polynomy a s funkcemi, které se z nich >T dají vyrobit „po částech". Zároveň jsme dovodili spoustu vlastností pro patrně obrovskou třídu spojitých funkcí, nemáme ale zatím moc prakticky zvladatelných příkladů, kromě polynomů. Jako další příklad si prohlédneme podíly polynomů. Nechť / a g jsou dva polynomy, které mohou mít i komplexní hodnoty (tj. připouštíme výrazy anxn + • • • + ao s komplexními a, e C, ale dosazujeme jen reálné hodnoty za proměnnou*). Funkce k:I\(ieí, g(x) = 0) -» C, m je dobře definována ve všech reálných bodech x kromě kořenů polynomu g. Takové funkce nazýváme racionální funkce. Z Věty 5.24 vyplývá, že racionální funkce jsou spojité ve všech bodech svého definičního oboru. V bodech, kde definovány nejsou, mohou mít • konečnou limitu, když jde o společný kořen obou polynomů / a g, přičemž jeho násobnost je v / alespoň taková jako v g (v tomto případě rozšířením jejich definice o limitní hodnotu v tomto bodě dostaneme funkci i v tomto bodě spojitou), • nevlastní limitu, když nevlastní limity zprava a zleva v tomto bodě jsou stejné, • různé nevlastní limity zprava a zleva. Názorně je možné tuto situaci vidět na obrázku, který ukazuje hodnoty funkce (x - 0,05a)(x - 2 - 0,2a)(x - 5) h(x): h(x) = x(x-2)(x -4) 259 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Snadno získáváme 1 — cos (2x) 1 — (cos2 x — sin2 x) lim---—- = lim ■ V ; x^o xsmx x^o (l — cos x) + sin x ■■ lim----= i->o xsmx 2 sin2 x sin x ■ lim-;-= lim 2-= 2; *->o x sin x *->-o x resp. 1— cosx /l—cosx 1 + cosx lim---= lim x^O X1 lim 1 — cos X lim- I • lim 1 + cos X lim 1 o X2 (1 + cos X) x^O X2 (1 + cos x) 2 _ 1 [x^Ó x J i->0 1 + cosx 2 Dodejme, že jsme také mohli hned použít vyjádření 1 — cos (2x) = 2 sin x, x € □ D. Spojitost funkcí 5.59. Zkoumejte existenci limit a spojitost funkce (x — 1)~sgn x v bodech 0 a 1. Řešení. Spočítejme nejprve jednostranné limity v bodě nula: lim (x - iysgni = lim (x - 1) = -1, x->0- x^O- lim (x - íy^x = lim _j_ = _1; i^0+ i^0+ X — 1 odtud lim (x —1)~sgnjc = —1, nicméně funkční hodnota této funkce j e x^O v bodě 0 rovna 1, tudíž zkoumaná funkce není v bodě 0 spojitá. Dále je lim (x - íy^x = lim _j_ = _00> x-*l- x-*l- X — 1 lim (x - l)-sgni = lim —!— = oo. x->l+ x^l+ X — 1 V bodě 1 tedy existuje levostranná i pravostranná limita dané funkce, jejich hodnoty se ovšem liší, funkce tudíž nemá v bodě 1 limitu (a tak není v tomto bodě ani spojitá). □ 5.60. Bez použití Věty o třech limitách dokažte, že funkce \x, x e {i; n e N); R(x) = \ 1 ' [0, iel\(i;neN) je spojitá v bodě 0. Řešení. Funkce R je spojitá v bodě 0, právě když je lim R(x) = R(0)= 0. x^0 Z definice limity ukážeme, že tato limita se skutečně rovná 0. Při „obvyklém" značení je a = 0, x0 = 0. Nechť S > 0 je nadále libovolné. pro hodnoty a — 0 (obrázek vlevo tedy vlastně zobrazuje racionální funkci (x — 5)/(x — 4)) a pro a = 5/3. 5.29. Funkce mocninné a exponenciální. Polynomy jsou po-:-fp\, mocí sčítání a násobení skaláry seskládány z jedno-*SÍ-y1*' duchých mocninných funkcí x t-> x" s přirozeným ^tf-fw*-' exponentem n — 0, 1, 2,____Samozřejmý smysl má také funkce x pro všechna x 0. Tuto defi- nici teď rozšíříme na obecnou mocninnou funkci ŕ s libovolným a e R. Budeme vycházet z vlastností mocnin a odmocnin, které patrně považujeme za samozřejmé. Pro záporné celé číslo —a proto definujeme x~a = (xaTl = (x-1)". Dále jistě chceme, aby ze vztahu bn — x pro n e N vyplývalo, že b je n-tou odmocninou z x, tj. b — X". Je třeba ale ověřit, že taková b pro kladná reálná x skutečně existují. Z binomického rozkladu mocniny dvoj členu je vidět, že funkce y \-> y™ je pro y > 0 stále rostoucí. Předpokládejme x > 0 a uvažujme množinu 8 = |j 6 Ij > 0, / < jc}. To je zřejmě shora ohraničená množina a zvolíme Ŕ = sup 5. 0 mocninné funkci s přirozeným n již víme, že je to funkce spojitá, snadno tedy ověříme, že skutečně platí b" — x. Skutečně, určitě je b" < x a kdyby platila ostrá nerovnost, našli bychom jistě 1 y s hodnotou bn < y™ < x, což nutně znamená i b < y a tedy jde o spor s definicí suprema. Máme tedy již korektně definovánu mocninnou funkci pro všechna racionální a — ^,x" — (xp)ž = (x^)p. Konečně, pro hodnoty a e R a x > lsi povšimněme, že jde pro racionální a o striktně rostoucí výraz (pro větší a je vždy větší výsledek). Proto klademe xa = supi*3', y e Q, y < a). Pro 0 < x < 1 buď definujeme analogicky (je třeba si jen pohrát s nerovnítky) nebo klademe přímo x" — (j)~a- Pro x — 1 je pak 1" = 1 pro libovolné a. Obecnou mocninnou funkci x i-> x" máme tedy dobře definovanou pro všechny x e [0, oo) a a e R. Naši konstrukci ale můžeme také číst následujícím způsobem: Pro každé pevné reálné c > 0 existuje dobře definovaná funkce na celém R, y h> cy. Této funkci říkáme exponenciální funkce o základu c. Vlastnosti, které jsme použili při definici mocninné a exponenciální funkce f (y) — cy, tj. c = /(l), lze shrnout do jediné rovnosti pro libovolné reálné kladné x a y. f(x+y) = f(x)- f(y) 260 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Pro jakékoli x e (—8, 8) je R (x) = 0, nebo R (x) = x, a tudíž (v obou případech) dostáváme R (x) e (—8,8). Jinými slovy, vezmeme-li libovolné á-okolí (—8, 8) hodnoty a apřiřadíme-li mu (—8, 8) (jako okolí bodu xo), pak pro každé x e (—8, 8) (z uvažovaného okolí xo) platí, že R (x) € (—8, 8) (zde na interval (—8, 8) nahlížíme jako na okolí a). To odpovídá znění definice limity (nemuseli jsme ani požadovat, aby bylo x ^ x0). Uvažovaná funkce R se nazývá Riemannova funkce (proto označení R). V literatuře se ovšem uvádí v různých modifikacích. Např. o funkci f(x) 1, xeZ; ) pro nesoudělná p,q € Z aq > 1; se „často" hovoří jako o Riemannově. 5.61. Dodefinujte funkci □ f(x) = {x2 - 1) i 2x - 1 x £ ±1 (x € K) v bodech —1,1 tak, aby byla spojitá na K. Řešení. Daná funkce je spojitá ve všech bodech svého definičního oboru. V bodech —1,1 bude spojitá, právě když položíme 2x-V /(-l) /(l) lim x^-l (x2-l)> 1 lim I (x2 — l) sin „ 2x - 1 Pokud by jedna z těchto limit neexistovala, příp. byla nevlastní, funkci by nešlo spojitě dodefinovat. Očividně je 2x-l 1 < 1, i^ll(ie K), odkud plyne -\r Protože 1 I S f (x) S I x2 - 1 I , x ŕ ±1 (x e K). lim I x2 1 I = 0, z Věty o třech limitách již dostáváme výsledek /(±1) := 0. □ 5.62. Zjistěte, jestli má rovnice e2x jedno kladné řešení. Řešení. Uvažujme funkci ■ x4 +3X3 — 6x2 = 5 alespoň /(*) pro mzje /(O): ■ x4 + 3x3 lim f(x) c—^+oo 6x2 x>0, lim e2* +00. společně s požadavkem spojitosti. Skutečně, pro y —0 dostáváme z této rovnosti /(O) = 1, odtud pak 1 = /(O) = f(x - x) = f(x) ■ (f(x)Tl a konečně pro přirozené n je zjevně f(nx) — (f(x))n. Takto jsme již jednoznačně určili hodnoty x" pro všechny x>0aaeQa požadavkem spojitosti byla již funkce určena všude. Zejména tedy pro exponenciální funkci platí známé vztahy (5.5) (ax)y =ax 5fCt- 5.30. Logaritmické funkce. Viděli j sme právě, že exponenciální funkce f(x) = ax je pro a > 1 stále rostoucí a pro 0 < a < 1 je stále klesající. V obou případech tedy existuje k f (x) funkce inverzní /_1 (x) kterou nazýváme logaritmickou funkcí se základem a. Píšeme loga(x) a definiční vztah tedy je log^a1) = x. Rovnosti (5.5) jsou proto ekvivalentní vztahům loga(x ■ y) = loga(x)+loga(y), loga(^) = y • loga(x). Logaritmické funkce jsou definovány jen pro kladné hodnoty argumentu a jsou pro základ a > 1 rostoucí, pro základ 0 < a < 1 klesající na celém definičním oboru. Pro každé a je loga(l) = 0. Brzy uvidíme, že obzvlášť důležitou hodnotou pro a je tzv. Eu-lerovo číslo e, viz odstavec 5.42. Funkci loge(jc) nazýváme přirozeným logaritmem. Tuto funkci pak značíme ln(x). 3. Derivace U polynomů jsme již v odstavci 5.6 diskutovali, jak popisovat jednoduše velikost růstu hodnot polynomu kolem daného bodu jeho definičního oboru. Tehdy jsme pozorovali podíl (5.2), který vyjadřoval směrnici sečny mezi body [x, f(x)] e R2 a [x +Ax, f (x +Ax)] e R2 pro (malý) přírůstek Ax nezávisle proměnné. Tehdejší úvaha funguje zrovna stejně pro libovolnou reálnou nebo komplexní funkci /, jen musíme místo intuitivního „zmenšování" přírůstku Ax pracovat s pojmem limity. Uvádíme definici pro vlastní i nevlastní derivace, tj. připouštíme i nekonečné hodnoty. Všimněte si, že na rozdíl od limity funkce, u derivace v daném bodě xo je nutné, aby byla sama funkce v tomto bodě definovaná. ._j Derivace funkce jedné reálné proměnné |___ 5.31. Nechť / je reálná nebo komplexní funkce definovaná na intervalu A cRaxo e A. Jestliže existuje limita f(x) - f(x0) lim x^x0 x - xo pak říkáme, že / má v bodě xo derivaci a. Hodnotu derivace zapisujeme jako f'(xo) nebo U-(xo), případněa — 4rf(xo). 261 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Ze spojitosti funkce / na celém jejím definičním oboru tudíž vyplývá, že nabývá všech hodnot v e [—4, +00). Zvláště její graf nutně protíná kladnou poloosu x, tj. rovnice fix) = 0 má řešení. □ 5.63. V jakých bodech x e K je funkce gCos(x+2)—x3 -11 -X12 s maximálním definičním oborem spojitá? 5.64. Rozhodněte, zdaje funkce y = cos arctg | 12^' + 11 + sin (sin (sin x)) O /(*) x, 0, x, 0, x, 1 x-3' x < 0; 0 < x < 1; x = 1; 1 < x < 2; 2 < x < 3; x > 3 spojitá; spojitá zleva; spojitá zprava v bodech —ji, 0,1, 2, 3, ji. 5.65. Dodefinujte funkci fix) = arctg 1 + x e ■ MO} pro x = 0 tak, aby byla v tomto bodě spojitá. 5.66. Uvedie jieR, pro které je funkce sin (6x) f(x) 3x iel \ {0}; /(O) spojitá v počátku. 5.67. Zvolte reálnou hodnotu a tak, aby funkce xA -1 A (x) =-, x > 1; h(x) = a, x < 1 x — 1 byla spojitá v K. 5.<5& Vypočtěte sin8 x sin8 x lim ——; lim ——. x^0+ X5 x-r-co X5 O o o o o 5.69. Určete všechny hodnoty parametru a e K tak, aby byla nerovnice (a - 2)x2 - (a - 2)x + 1 > 0 splněna pro všechna reálná x. Řešení. Všimněme si, že pro a = 2 je nerovnost triviálně splněna (levá strana je konstanta 1). Pro a 7^ 2 je levá strana kvadratickou funkcí f{x) proměnné*, přičemž je /(O) = 1. Vzhledem ke spojitosti funkce fix) tak bude nerovnost fix) > 0 platit pro všechna reálná x, právě když rovnice f(x) = 0 nebude mít řešení v K (graf funkce / pak bude celý „nad" osou x) a to nastane, právě když diskriminant Derivace reálné funkce je vlastní, resp. nevlastní, když je takovou příslušná limita. Jednostranné derivace (tj. derivaci zprava a zleva) definujeme zcela stejně pomocí limity zprava a zleva. O funkci mající v bodě xq derivaci říkáme, že je v tomto bodě diferencovatelná. O funkci diferencovatelné v každém bodě intervalu říkáme, že je diferencovatelná na tomto intervalu. S derivacemi se vcelku snadno počítá, dá nám ale dost práce korektně odvodit derivace i některých z funkcí, které už v našem zvěřinci máme. Proto s předstihem vsunujeme do textu souhrnnou tabulku, jak derivace pro několik z nich vychází. V posledním sloupci je odkaz na odstavec, kde se dá údaj skutečně i s úplným výkladem najít. Všimněme si také, že inverzní funkce k řadě z našich funkcí sice neumíme přímo vyjádřit elementárním způsobem, přesto ale budeme umět počítat jejich derivace, viz 5.35 ^_^____^_J NĚKTERÉ DERIVACE FUNKCÍ__. funkce definiční obor derivace polynomy f (x) celé R fix) je opět polynom 5.6 kubické splajny celé R h'(x) má spojitou 5.9 h(x) pouze první derivaci racionální funkce f(x)lg(x) celé R kromě kořenů g racionální funkce: f(x)g(x)-f(x)g,(x) g(x)2 5.34 mocninné interval fix) =axa-[ 5.36, funkce (0, co) 5.44 fix) = X* exponenciála celé R fix) = ln(a).a* 5.36, fix) = a\ 5.44 a > 0, a 7^ 1 logaritmus interval fix) = 5.36, fix) = lna(x), (0, co) (ln(a)M • i 5.44 a > 0, a 7^ 1 X4A* Z formulace definice lze očekávat, že f'(xo) bude umožňovat dobře aproximovat danou funkci pomocí přímky y = fiX0) + f'(XQ)(x - X0). 262 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ kvadratické rovnice (a — 2)x2 — (a — 2)x + 1=0 bude záporný. Dostáváme tak nutnou a postačující podmínku D = (a - 2)2 - 4(a - 2) = (a - 2)(a - 6) < 0. Taje splněna pro a e (2, 6). Celkem je nerovnice splněna pro všechna reálná x pro a e [2, 6). □ 5.70. V K řešte rovnici 2X + 3X + 4X + 5X + 6X = 5 . Řešení. Funkce na levé straně rovnice je součtem pěti rostoucích funkcí na K, je tedy sama rostoucí funkcí na celém K. Hodnota levé strany je pro x = 0 rovna 5, což je tedy jediným řešením dané rovnice. □ 5.71. V K řešte rovnici 2X + 3X + 6X = 1 . O 5.72. Rozhodněte, zda polynom x31 + 5x21 - 4x9 + 5x4 - 2x - 3 má v intervalu (—1, 1) alespoň jeden reálný kořen. O E. Derivace Ukažme si nejprve, že derivace funkcí uvedené v tabulce v odstavci 5.31 jsou skutečně správně. Určíme je přímo z definice derivace. 5.73. Z definice (viz 5.31) určete hodnoty derivací funkcí x" (x je proměnná, n kladná celá konstanta), sfx, sin x Řešení. Nejprve podotkněme, že označíme-li v definici derivace výraz x — xq jako h, pak dostáváme f(x) - f(x0) f(x0 + h)-f(x0) lim -= lim-. *->-*o X — Xq h^O h V následujících výpočtech budeme pracovat s druhým vyjádřením téže limity. Takto lze rozumět následujícímu lemmatu, které říká, že nahrazením konstantního koeficientu f'(xo) ve vyjádření přímky spojitou funkcí ý(x) dostaneme přímo hodnoty /. Odchylka hodnot ý(x) na okolí bodu xq od hodnoty ý(xo) pak přímo říká, jak se liší směrnice sečen a tečny v bodě xq. Lemma. (Carathéodoryho) Reálná nebo komplexní funkce f (x) má v bodě xq vlastní derivaci, právě když existuje na nějakém okolí O(xo) funkce Ý spojitá v xq a taková, že pro všechny x e 0(xq) platí f(x) = f(x0) + f(x)(x - x0). Navíc pak vždy ý(xo) = f'(xó) a sama funkce f je v bodě xq spojitá. Důkaz. Nejprve předpokládejme, že f'(xó) je vlastní derivace. Pokud má Ý existovat, má jistě pro všechny x e O \ {xq} tvar Ý(x) = (f(x)- f(x0))/(x-x0). V bodě xq naopak definujme hodnotu derivací f'(xo)- Pak jistě lim ý(x) = f'(x0) = f(xo) jak je požadováno. Naopak, jestliže taková funkce Ý existuje, tentýž postup vypočte její limitu v xq. Proto existuje i f'(xo) a je ý(xo) rovna. Z vyjádření / pomocí spojitých funkcí je zřejmé, že je sama spojitá v bodě xq. □ 5.32. Geometrický význam derivace. Předchozí lemma lze názorně vysvětlit geometricky a tím popsat smysl de-'(/ rivace. Říká totiž, že na grafu funkce y = f (x), tj. ^d. ~^ na příslušné křivce v rovině se souřadnicemi x a y, poznáme, zda existuje derivace podle toho, jestli se spojitě mění hodnota směrnice sečny procházející body [xq, f(xo)] a [x, f(x)]. Pokud ano, pak limitní hodnota této směrnice je hodnotou derivace. __\ Rostoucí a klesající funkce v bodě |___ Důsledek. Má-li reálná funkce f v boděxq e M. derivaci f (xq) > 0, pak pro nějaké okolí 0(xq) platí f(x) > f (xq) pro všechny body x e 0(xq), x > xq a f(x) < f (xq) pro všechny body x e 0(xq), x < xq. Je-li derivace f (xq) < 0, pak naopak pro nějaké okolíC'(xq) platí f(x) < f (xq) pro všechny body x e 0(xq), x > xq, a f (x) > f (xq) pro všechny body x e 0(xq), x < xq. Důkaz. Uvažme prvý případ. Pak podle předchozího lemmatu platí f (x) — f (xq) + ý(x)(x — xq) a Ý(xo) > 0- Protože je ale ývio spojitá, musí existovat okolí 0(xq), na kterém bude Ý(x) > 0. Pak ale s rostoucím x > xq nutně poroste i hodnota f(x) > f (xq) a naopak pro x < xq. Stejná argumentace ověří i tvrzení se zápornou derivací. □ Funkce, které mají na nějakém okolí bodu xq vlastnost f (x) > f (xq), kdykoliv x > xq, a f (x) < f (xq), když x < xq, se nazývají rostoucí v bodě xq. Funkce rostoucí ve všech bodech nějakého intervalu se nazývá rostoucí na intervalu. Samozřejmě pro funkce rostoucí na intervalu platí f (b) > f (a) pro všechny a < b z tohoto intervalu. 263 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ -.nŕ- (VI)' = lim a=-0 (sin x)' = lim a=-0 ■■ lim a=-0 a=-0 h (y/x + h + yfx) a->0 V* + a + V* 2VI' sin(x + /í) — sin x sinx cos/í + cosx sin h — sinx cosxsin/í sinx(cos/í — 1) : hm--h hm-- a->0 h h^O h sin Ä 2(sin|)2 : cos x ■ lim--lim - = a->0 Ä a->0 h siní : cos x ■ 1 + lim siní- = cos x. t->0 t □ 5.74. Zderivujte a výsledek upravte: i) x sin x, u) stax iii) ln(x + y/x2 — a2), a ^ 0, |jc| > \a\, iv) arctan ^-^==^, |x| < 1, v) x1. Řešení, (i) Podle pravidla o derivování součinu funkcí, tedy Leibni-zova pravidla, viz 5.33 dostáváme (x sinx)' = x ■ sinx + x • (sinx)' = sinx + x cosx. (ii) Podle pravidla o derivování podílu funkcí (5.34) je sinx Y (sinx)'• x — sinx • x' x cosx —sinx x (iii) Použijeme pravidla pro derivování složené funkce (5.33). Označíme-li h(x) = ln(x), /(x) = x + y/x2 — a2, máme ln(x + y/x2 - a2)' = h(f(x))' = h'(f(x)) ■ f'(x) = (x+y/x2-^)' 1 + ^ X + yfx2 X + yfx2 kde jsme pro derivování výrazu *Jx2 — a2 použili opět pravidlo o derivování složené funkce. Podobně je funkce klesající v bodu xo, jestliže má na nějakém okolí bodu xo vlastnost f(x) < f(xo), kdykoliv x > xo, a f(x) > f(xo), když x < xq. Funkce je klesající na intervalu, jestliže je klesající ve všech bodech tohoto intervalu. Náš důsledek tedy říká, že funkce, která má v bodě nenulovou konečnou derivaci, je v tomto bodě buďrostoucí nebo klesající podle znaménka této derivace. Pokud má funkce / v okolí bodu xo spojitou derivaci f'(xo) 0, pak je tato funkce na nějakém okolí bodu xo rostoucí nebo klesající, podle znaménka derivace. Skutečně, jako spojitá nenulová funkce má f'(xo) v nějakém okolí xo stále stejné znaménko. Jako ilustraci jednoduchého použití vztahu derivace k růstu hodnot funkce se podívejme na existenci inverzí polynomů. Protože polynomy jen zřídka jsou výhradně rostoucí nebo klesající funkce, nemůžeme očekávat, že by k nim existovaly globálně definované inverzní funkce. Naopak ovšem inverzní funkce k polynomu / existují na každém intervalu mezi kořeny derivace /', tj. tam kde derivace polynomu je nenulová a nemění znaménko. Tyto inverzní funkce nebudou nikdy polynomy, až na případ polynomů stupně jedna, kdy z rovnice spočteme přímo y — ax + b c = -(y - b). U polynomu druhého stupně obdobně y — ax + bx + c vede ke vztahu -b ± y/b2 - 4a(c - y) x = - la a inverze tedy existuje (a je dána touto formulí) jen pro x na inter- valech (- 2a)' \ 2a' Pro práci s inverzními funkcemi k polynomům nevystačíme s dosavadními funkcemi a dostáváme v našem zvířetníku nové přírůstky. 5.33. Pravidla pro počítání derivací. Uvedme si nyní několik základních tvrzení o výpočtech derivací. Říkají nám, jak dobře se snáší operace derivování s algebraickými operacemi sčítání a násobení na reálných nebo komplexních funkcích. Poslední z pravidel pak umožňuje efektivní výpočet derivace složených funkcí a říkává se mu „řetězové pravidlo". Intuitivně jim můžeme všem velice snadno rozumět, když si derivaci funkce y — f (x) představíme jako podíl přírůstků závislé proměnné y a nezávislé proměnné x: f = ^. Ax Samozřejmě pak při y — h(x) — f (x) + g(x) je přírůstek y dán součtem přírůstků /aga přírůstek závislé proměnné zůstává stejný. Je tedy derivace součtu součtem derivací. U součinu musíme být malinko pozornější. Pro y — f(x)g(x) je přírůstek Ay = f(x + Ax)g(x + Ax) - f(x)g(x) = = f(x+Ax)(g(x+Ax)-g(x)) + (f(x+Ax)- f(x))g(x). 264 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ (iv) Opět derivujeme složenou funkci: arctan vr i i + rS VVT Vl - x2 + -r \-xz 1— xL yjl-x2 X2 1 (v) Funkci je nejprve převedeme na funkci o konstantním základu (nej lépe o základu é), kterou už umíme derivovat. (x1)' = (ieinx)x)' = (exinx)' = = (x lnx)' ■ ex lni = (1 + lnx) • x1 . □ 5.75. Určete derivaci funkce y = ŕm x, x > 0. Řešení. Platí (xsini)' = (esini lni)' = esini lni | cosx lnx + cos x ln x + sinx x □ 5.76. Pro kladná x uvedie derivaci funkce f(x) = xi"x. O 5.77. Pro x e (0, it/2) spočtěte derivaci funkce y = (smx)cosx. O Doporučujeme čtenáři si vymyslet funkce, které potom sám zde-rivuje. Výsledek si může ověřit v celé řadě matematických výpočetních programů. V následujícím příkladu si uvědomíme geometrický význam derivace bodě, totiž, že určuje směrnici tečny ke grafu v daném bodě (viz 5.32) 5.78. Za pomoci diferenciálu přibližně určete arccotg 1,02. Řešení. Diferenciál funkce / se spojitou první derivací v bodě x0 je roven /' (x0) dx = f (x0) (x - x0) . Rovnice tečny ke grafu funkce / v bodě [x0, /(x0)] je pak y - f (*o) = /' (*o) (x - x0). Odtud je vidět, že diferenciál funkce je přírůstek funkce na tečně. Hodnoty na tečně ovšem aproximují hodnoty fix), je-li rozdíl x — xo „malý". Získáváme tak vzorec pro přibližné určení funkční hodnoty pomocí diferenciálu ve tvaru / (.X) S3 / (X0) + /' (X0) (X - X0) . Položíme-li tedy fix) := arccotgx, x0 := 1, g = ■ Nyní ale když budeme zmenšovat přírůstek Ax, jde vlastně o výpočet limity součtu součinů a o tom už víme, že jej lze počítat jako součet součinů limit. Proto z naší formulky lze očekávat pro derivaci součinu f g výraz f g' + f g, kterému se říká Leibnizovo pravidlo. Ještě zajímavěji se chová derivace složené funkce g = h o f, kde definiční obor funkce z = h(y) obsahuje obor hodnot funkce y — f (x). Opět vypsáním přírůstků dostáváme Az _ Az Ay Ax Ay Ax' Můžeme tedy očekávat, že pravidlo pro výpočet bude (ho f)'(x) = h'(f(x))f'(x). Podáme nyní korektní formulace a důkaz: .__\ Pravidla pro derivování j___ Věta. Nechť f a g jsou reálné nebo komplexní funkce definované na okolí bodu xq ela majícív tomto bodě vlastní derivaci. Potom (1) pro každé reálné nebo komplexní číslo c má funkce x c • fix) derivaci v xo a platí (cf)'(x0) = c(f'(x0)), (2) funkce f + g má v xo derivaci a platí {f+g)'{xo) = f'ixo)+g'ixo), (3) funkce f ■ g má v xo derivaci a platí if ■ g)'{xo) = f'ixo)giXo) + fiXo)g'ixo). (4) Je-li dále h funkce definovaná na okolí obrazu yo = fixo), která má derivaci v bodě yo, má také složená funkce h o f derivaci v bodě xq a platí iho f)'ixo)=h'ifiXo))- fixo). Důkaz. (1) a (2) Přímé použití věty o součtech a součinech limit funkcí dává výsledek. (3) Přepíšeme vztah pro podíl přírůstků, který jsme zmínili před formulací věty, takto ifg)ix) - ifgKxo) x0 gix)-gixo) , fix)-fixo) gixo)- x - xo x - xo Limita tohoto výrazu pro x —> xo dá právě požadovaný výsledek, protože je funkce / spojitá v xo. (4) Podle lemmatu 5.31 existují funkce ýa^> spojité v bodech xo a yo = fixo) takové, že hiy) = h(y0) + R inverzní funkce /_1 existuje (nezaměňujme značení ■ifcif^š^-^— s funkcí x kterýmkoliv ze vztahů (f(x)) l), pak je dána jednoznačně / 1 o / = id« / o / 1 = idK, a druhý již pak platí také. Pokud je / definováno na podmnožině A c R a f (A) — B, je existence /_1 podmíněna stejnými vztahy s identickými zobrazeními id^ resp. id# na pravých stranách. Jak je vidět z obrázku, graf inverzní funkce prostě dostaneme záměnnou os závislé a nezávislé proměnné. 266 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ v bodě [2, ?]. Uvedie také všechny body, ve kterých je tečna rovnoběžná s osou x. O 5.90. Pod jakým úhlem protíná graf funkce y = ln x osu xl (Úhlem protnutí rozumíme úhel tečny s kladnou poloosou x v kladném smyslu otáčení.) O 5.91. Určete rovnice tečny a normály ke křivce dané rovnicí x3 + y3 - 2xy = 0 v bodě [1,1]. O 5.92. Dokažte, že platí Y^- < ln (1 + x) < x pro všechna x > 0 . O F. Extremální úlohy Jednoduché pozorování 5.32 o geometrickém významu derivace nám také říká, že extrémy diferencovatelné reálné funkce jedné reálné proměnné mohou nastat pouze v bodech, kde je derivace dané funkce nulová. Tohoto prostého faktu lze využít při řešení množství zajímavých praktických úloh. 5.93. Určete x-ovou souřadnici xA bodu paraboly y = x2, který je nejblíže bodu A = [1,2]. Řešení. Není obtížné uvědomit si, že příklad má právě jedno řešení a že úkolem je vlastně najít absolutní minimum funkce f(x) = J(x - l)2 + (x2 - 2)2, iěI. Funkce / má zjevně nejmenší hodnotu ve stejném bodě jako funkce g(x) = (x- l)2 + (x2 - 2)2, iěI. Neboť g'(x) = 4x3 - 6x - 2, x e K, řešením rovnice 0 = 2x3 — 3x — 1 dostáváme nejprve stacionární bod x = — 1 a po vydělení polynomu 2x3 — 3x — 1 polynomem x + 1 také zbývající dva stacionární body i-Vš í + Vš - a -. 2 2 Protože funkce g je polynomem (má derivaci na celé reálné ose), z geometrického významu úlohy již získáváme í + Vš xA 5.94. Je dána elipsa 3x2 + y2 = 2. Napište rovnici tečny, která vytína v prvním kvadrantu trojúhelník o nejmenším obsahu a určete jeho velikost. Řešení. Přímka zadaná rovnicí ax + by + c = 0 má s osami průsečíky [—0], [0, — f] a obsah trojúhelníka s vrcholy v těchto bodech a Pokud bychom věděli, že pro diferencovatelnou funkci x — f (y) je i y — f~l(x) diferencovatelná, pravidlo pro derivaci složené funkce nám okamžitě říká 1 = (id)'(*) = (/ o (x) = f'(y) ■ (x) a tedy pak přímo dostáváme vzorec (zjevně f'(y) v takovém případě nemůže být nulové). .___| Derivace inverzní funkce J___ (5.6) f'(y) To dobře odpovídá intuitivní představě, že pro y = f (x) je přibližně f — ^ zatímco pro x — f~l(y) je to přibližně (/_1)'Cy) = if- Takto skutečně můžeme derivace inverzních funkcí počítat: Věta. Je-li f reálná funkce diferencovatelná v bodě yo a v tomto bodě platí /'(yo) 7^ 0, pak existuje na nějakém okolí bodu xo = f (yo) funkce f ~l inverzní k f, funkce f ~l je diferencovatelná v bodě xo a platí vztah (5.6) v bodě xo. Důkaz. Nejprve si povšimněme, že nenulovost derivace v xo znamená, že na nějakém okolí bodu xo je naše funkce / buďrostoucí nebo klesající, viz důsledek 5.32. Proto na nějakém okolí nutně existuje inverzní funkce. Protože je obrazem ohraničeného uzavřeného intervalu ve spojité funkci opět uzavřený interval, nutně je také pro každou otevřenou množinu U v definičním oboru / i obraz f(U) otevřený. Potom ale přímo z definice spojitosti pomocí okolí je tato inverzní funkce také spojitá. Pro odvození našeho tvrzení nyní postačí pozorně znovu pročíst důkaz čtvrtého tvrzení věty 5.33. Jen volíme / místo funkce íia/-1 místo / a místo předpokladu existence derivací pro obě funkce víme, že funkce složená je diferencovatelná (a víme, že je to identická funkce): Skutečně, podle lemmatu 5.31 existuje funkce Ý spojitá v bodě yo taková, že f(y) - f(yo) = 0. Minimalizovat tento obsah znamená maximalizovat součin xTyr = xT^2 — 3x2T, což je v prvním kvadrantu to samé, jako maximalizovat (xjyj)1 = = x\(2 — 3x\) = —3(x\ — \Ý + Hledané minimum obsahu je tedy v x j = . Tečná má rovnici V3x + y = 2 a velikost tohoto obsahuje Smin = 2^. □ 5.95. V čase / = 0 se začaly pohybovat tři body P, Q, R v rovině a to bod P z bodu [—2,1] směrem (3, 1) rovnoměrnou rychlostí «/TÔ m/s, bod Q z bodu [0,0] směrem (—1,1) rovnoměrně zrychleným pohybem se zrychlením 2\/2 m/s2 abod R zbodu [0,1] směrem (1, 0) rovnoměrnou rychlostí 2 m/s. V jakém čase bude obsah trojúhelníku PQR minimální? Řešení. Rovnice bodů P, Q, R v čase jsou P Q R [-2,1] + (3, l)t, [0,0] +(-M)?2, [0,1] + (2,0)/. Obsah trojúhelníka PQR je určený např. polovinou absolutní hodnoty determinantu, jehož řádky jsou souřadnice vektorů R P a R Q (viz 1.34). Minimalizujeme tedy determinant: -2 +t -f - 2t -l + t2 2ř - t + 2. ±j-6. Vzhle- Derivace je 6t2 — 1, extrémy tedy nastávají pro / dem k tomu, že uvažujeme pouze nezáporný čas, vyšetřujeme pouze / = -j=. Druhá derivace uvažované funkce je v tomto bodě kladná, funkce obsahu zde tedy nabývá svého lokální minima. Navíc je její hodnota v tomto bodě kladná a menší, než hodnota v bodě 0 (krajní bod intervalu, na kterém hledáme extrém), jedná se tudíž o globální minimum obsahu v čase. □ 5.96. V devět hodin ráno vylezl starý vlk z nory N a v rámci ranní rozcvičky začal běhat proti směru hodinových ručiček po kružnici o poloměru lkm, kolem svého oblíbeného pařezu P a to rovnoměrnou rychlostí 4 km/h. Ve stejnou dobu vyrazila Karkulka z domu D k babičce sídlící v chaloupce C rychlostí 4 km/h (po přímce). Kdy si budou nejblíž a jaká tato vzdálenost bude? Souřadnice (v kilometrech): N = [2, 3], P = [2, 2], D = [0, 0], C = [5,5]. Vztah pro derivaci inverzní funkce platí i v případě, kdy je f'(yo) = 0- Pak je derivace (f~l)'(xo) nevlastní, tj. ±oo, podle toho zdaje / rostoucí nebo klesající v bodě yo- 5.36. Derivace dalších funkcí. Podívejme se konečně, jak je to ■>T s derivováním exponenciály f(x) = ax. Pokud exis-*M0W>/ tuje derivace ax ve všech bodech x, bude jistě platit f\x) = lim - Ax aAx - 1 ■-ax lim - = f'(0)ax. Ajc^O Ax Naopak, pokud existuje derivace v nule, pak tento výpočet ověřuje existenci derivace v kterémkoliv bodě a dává její hodnotu. Zároveň jsme ověřili platnost téhož vztahu pro derivace zprava a zleva. Zanedlouho ověříme (viz 5.44, případně také 6.43), že derivace exponenciálních funkcí skutečně existují. Vyjděme teď ze (zatím nedokázaného) vztahu (eX)' = e* pro základ e, tzv. Eulerovo číslo. Když tomuto vztahu uvěříme, okamžitě vidíme, že exponenciální funkce mají derivace úměrné hodnotám s konstantním koeficientem úměrnosti: (ax)' = (eln(a)1)' = ln(a) (eln(a)l) = ln(a) • ax. Z definičního vztahu pro přirozený logaritmus pak snadno spočteme: (5.7) (ln)'(y) = (ln)'(ŕ) = -4-7 = 1 = 1. (ex) ex y Pravidlo pro derivování obecné mocninné funkce (5.8) (?) =axa-x můžeme nyní snadno odvodit s pomocí vztahu pro derivaci exponenciální funkce a logaritmické funkce: (ŕ)' = (ea ln*)' = ea inx(a Inx)' = ax"-1. 5.37. Věty o střední hodnotě. Než se pustíme do dalšího tématu na naší pouti za různorodými definicemi funkcí, odvodíme ještě několik jednoduchých výsledků o deri-•.""ľT-"*' .' vacích. Všechny jsou velice snadno intuitivně jasné z přiložených obrázků a důkazy vlastně jen rozepisují vizuální představu. Věta. Nechťfunkce f : R —> R/e spojitá na konečném uzavřeném intervalu [a,b]a diferencovatelná uvnitř tohoto intervalu. Jestliže platí f (a) = f(b), pak existuje c e (a, b) takové, že f'(c) = 0. 268 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Řešení. Vlk se pohybuje po jednotkové kružnici, jeho úhlová rychlost je tedy stejná jako jeho absolutní rychlost a jeho dráhu můžeme v závislosti na čase popsat následujícími parametrickými rovnicemi: xit) = 2 - cos(4r), yit) = 2 - sin(4r), Karkulka se pak pohybuje po dráze xit) = 2V2t, yit) = 2V2t. Nalezněme extrémy (čtverce) vzdálenosti p jejich drah v čase: p(t) = [2 - cos(4r) - 2V2r]2 + [2 - sin(4r) - 2sÍ2if, pit) = 16(cos(4r) - sin(4r))(V2r - 1) + 32t+ + 4V2(cos(4r) + sin(4/)) - lóVŽ Řešit algebraicky rovnici p' (/) = 0 se nám nepodaří (ani to nelze), zbývá pouze najít řešení numericky (pomocí výpočetního softwaru). Je jasné, že extrémů bude nekonečně mnoho: při každém kolečku je směr pohybu vlka v jistý časový okamžik rovnoběžný se směrem Karkulky, jejich vzdálenost se tedy po jistou dobu snižuje; Karkulka se však neustále vzdaluje konstantní rychlostí od středu kruhu, kolem kterého obíhá vlk. Zjistíme, že první lokální minimum nastává pro / = 0,31 a poté pro / = 0,97, kdy bude vzdálenost vlka a Karkulky asi 5 metrů. Je zřejmé, že půjde i o globální minimum. Situace, kdy neumíme explicitně vyřešit daný problém, je v praxi velmi častá a použití numerických metod výpočtu má velký význam. □ Další rozličné úlohy na hledání extrémů funkcí jedné proměnné viz strana 292. 5.97. Dokažte, že polynom Pix) = x5 —x4+ 2x" — x2 + x + 1 má právě jeden reálný kořen. Řešení. Libovolný polynom lichého stupně má alespoň jeden reálný kořen, neboť pro x jdoucí k — oo jsou hodnoty polynomu velké (v absolutní hodnotě) záporné, pro velká kladná x jsou hodoty polynomu velké kladné. Ze spojitosti polynomu tak tento musí mít reálný kořen. Také je možné argumentovat základní větou algeby (viz 11.20), neboť v oboru komplexních čísel má podle zmíněné věty daný polynom pět kořenů a protože komplexní kořeny polynomů s reálnými kořeny se vyskytují v komplexně sdružených dvojicích, musí být alespoň jeden kořen reálný. Kdyby měl polynom alespoň dva reálné kořeny, řekněme a, b, pak by podle věty o střední hodnotě musela mít jeho derivace v nějakém bodě c e (a, b) hodnotu P'(x) = 0, avšak P'(x) = 5x4 -Ax3 +6x2 -2x + l= 2x2 (x - l)2 + 3xA + 3x2 + (x - l)2 > 0. Polynom má tedy právě jeden reály kořen. □ t£0U£OVrt VETA" Důkaz. Protože je funkce / spojitá na uzavřeném intervalu (tj. kompaktní množině), má na něm maximum a minimum. Pokud by maximum i minimum mělo stejnou hodnotu f (a) = f(b), pak by funkce / byla konstantní a tedy i její derivace by byla nulová ve všech bodech intervalu (a, b). Předpokládejme tedy, že buď maximum nebo minimum je jiné. Pak ovšem nastává jedno z nich ve vnitřním bodě c. Kdyby platilo f'(c) ^ 0, pak by v tomto bodě byla byla funkce / buďrostoucí nebo klesající (viz 5.32) a jistě by tedy v okolí bodu c nabývala větších i menších hodnot, než je f(c). Je tedy nutně/'(c) = 0. □ Právě dokázanému tvrzení se říká Rolleova věta. Z ní snadno vyplývá následující důsledek, známý jako Lagrangeova věta o střední hodnotě. 5.38. Věta. Nechť funkce f : R —> M. je spojitá na intervalu [a,b] a diferencovatelná uvnitř tohoto intervalu. Pak existuje c e (a, b) takové, že f(b) - f (a) f'(c) = ■ větA 0 STf-E^Nt HODNOTE. Důkaz. Důkaz je prostým zápisem geometrického významu tvrzení: k sečně mezi body [a, f (a)] a [b, f(b)] existuje tečna, která je s ní rovnoběžná (podívejte se na obrázek). Rovnice naší sečny je y = g(x) = f (a) + f(b) - f (a) (x - a). Rozdíl h(x) — fix) — g(x) udává vzdálenost grafu od sečny (v hodnotách ý). Jistě platí hia) — hib) a fib) - fia) h\x) = fix) - ■ u — a Podle předchozí věty existuje bod c, ve kterém je h'(č) — 0. □ 269 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ G. ĽHospitalovo pravidlo 5.98. Ověřte, že je limita (a) (b) (c) (d) (e) (f) (g) sin (2x) — 2 sin x 0 lim, ti—2—ô—ô lypu ň; i->o 2e* — jr — 2x — 2 0 ln x oo lim - typu —; i->0+COtgX oo ■ * 1 lim---— I typu oo — oo; jc->i+ \ x - 1 ln x ' lim (ln (x — 1) • lnx) typu 0 • oo; x^\ + lim (cotg x)1" typu oo°; x^q+ í sin x \ 7 ]To( —) typul (7tx \ ^n * cos —) typu 0 . 2 / Poté ji spočtěte užitím 1'Hospitalova pravidla. Řešení. Bezprostředně můžeme potvrdit, že je (a) lim (sin (2x) — 2 sin x) =0 — 0 = 0, lim (2e* - x2 - 2x - 2) = 2 - 0 - 0 - 2 = 0; (b) Větu o střední hodnotě můžeme také přepsat do tvaru: (5.9) f(b) = f(a) + f'(c)(b-a). V případě parametricky zadané křivky v rovině, tj. dvojice funkcí y = f (ť), x = g (t), je stejný výsledek o existenci rovnoběžné tečny k sečně krajními body popsán ve tvaru tzv. Cauchy-ovy věty o střední hodnotě: Důsledek. Necht'funkce y = f (i) a x — g (t) jsou spojité na intervalu [a, b] a diferencovatelné uvnitř tohoto intervalu a g'\i) ^ 0 pro všechny t e (a, b). Pak existuje bod c e (a, b) takový, že platí f(t>) - f (fl) = £(£) g(b) - g(a) g'(c) ■ Důkaz. Opět spoléháme na použití Rolleovy věty. Položíme proto h(f) = (f(b) - f(a))g(t) - (g(b) - g(a))f(f). NyníMa) = f(b)g(a)-f(a)g(b),h(b) = f (b)g(a)-f (a)g(b), takže existuje c e (a, b) takový, žeh' (c) = 0. Protože je g'(c) ^ 0, dostáváme právě požadovaný vztah. □ Podobná úvaha jako v posledním tvrzení vede k mimořádně užitečnému nástroji pro počítání limit podílu funkcí. Tvrzení je znám jako ĽHospitalovo pravidlo: 5.39. Věta. Předpokládejme, že f a g jsou funkce diferencovatelné v okolí bodu xo e K, ne však nutně v bodě xq samotném, a nechť existují limity ■- 0. lim f(x) = 0, x^xíí lim g(x) ■ x^xíí Jestliže existuje limita pak existuje i limita a jsou si rovny. lim /'(*) x^x0 g'(x) lim - x^x0 g(x) (c) (d) (e) (f) (g) lim Inx = —oo, lim cotg x = +oo; x^0+ x^0+ X 1 lim -= +oo, lim -= +oo; x^\+ x — 1 mx lim mx = 0, lim m{x — 1) = — oo; lim cotg* = -\-oo, lim -= 0; jc->o+ x^o+ mx smx 1 lim-= 1, lim — = +oo; x^0 X x^0 X2 lim cos — = 0, lim ln x = 0. x->l- 2 x->l- Důkaz. Bez újmy na obecnosti můžeme předpokládat, že v xo mají funkce / a g nulovou hodnotu. Výsledek je opět jednoduše představitelný pomocí obrázku. . Uvažujme body [g(x), f(x)] e M.2 parametrizované ■"/ proměnnou x. Podíl hodnot pak odpovídá směrnici sečny mezi body [0, 0] a [f (x), g(x)]. Zároveň víme, že podíl derivací odpovídá směrnici tečny v příslušném bodě. 270 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Případ (a). Aplikování ľHospitalova pravidla převádí limitu sin (2x) — 2 sin x na limitu lim x^o 2ex - x2 - 2x - 2 2 cos (2x) — 2 cos x lim x^o 2eř -2x -2 ' která je ovšem typu 0/0. Dalšími dvěma aplikacemi ľHospitalova pravidla dostáváme —4 sin (2x) + 2 sin x lim- x^o 2ex - 2 a (výše uvedená limita je opět typu 0/0) —8 cos (2x) + 2 cos* —8 + 2 lim-=-= —3. x->o 2ex 2 Celkem tak máme (vrátíme se k původní limitě) sin (2x) — 2 sin x lim-r-= —3. x^o 2ex -x2 -2x -2 Dodejme, že opakované užití ľHospitalova pravidla vjednom příkladu je běžné. Nadále budeme klást, že se limity podílů derivací získané 1'Hospi-talovým pravidlem přímo rovnají původním limitám podílů. Takto si můžeme počínat, pokud obdržené limity na pravých stranách budou existovat, tj. o platnosti zápisů se vlastně budeme přesvědčovat dodatečně. Případ (b). Tentokráte derivování čitatele a jmenovatele dává lim Inx lim >0+ COtgX x^0+ ■ lim - x^0+ x Poslední limitu umíme snadno určit (dokonce ji známe). Z lim — sin* = 0, x^0+ sin x lim -= 1 x^0+ X plyne výsledek 0 = 01. Také jsme mohli znovu použít 1'Hospitalovo pravidlo (nyní pro výraz 0/0) s výsledkem — sin2* — 2 • sin* • cos x —2-0-1 lim -= lim -=-= 0. x^0+ X x^0+ 1 1 Případ (c). Pouze převodem na společného jmenovatele lim 1 ► i+ \x — 1 Inx jsme obdrželi typ 0/0. Je lim x Inx — (x — 1) >i+ (x — 1) Inx x Inx - (x - 1) lnx + --l Inx lim -= lim -:—--= lim x^\+ (x-l)lnx x^\+ i^i + Inx x^\+ 1 - I + Inx' X X Máme podíl 0/0, pro který (opět dle 1'Hospitalova pravidla) platí Inx ..7 11 lim lim ^i+l-i + lnx x^i+Jj + I 1 + 1 2 x xL x Návratem k původní limitě zapíšeme výsledek x 1 \ 1 2' lim x^\+ \ x — 1 Inx Z existence limity směrnic tečen tedy chceme dovodit existenci limity směrnic sečen. Technicky lze využít věty o střední hodnotě v parametrickém tvaru. Předně si uvědomme, že v tvrzení věty implicitně předpokládáme existenci výrazu f'(x)/g'(x) na nějakém okolí xq (kromě bodu xq samotného), zejména tedy pro dostatečně blízké body c k xo bude g'(c) ^ O.6 Díky větě o střední hodnotě nyní lim - x^x0 g(x) lim fix) - f(x0) lim f'(cx) x^x0 g(x) - g(x0) x-?x0 g'(cx) kde cx je číslo mezi xq a x, závislé na x. Z existence limity ,. fix) lim - x^x0 g'(x) vyplývá, že stejnou hodnotu bude mít i limita libovolné posloupnosti vzniklé dosazením hodnot x — xn jdoucích k xq do f'(x)/g'(x). Zejména tedy můžeme dosadit jakoukoliv posloupnost cXn pro xn -» xq a proto bude existovat i limita ,. f'(cx) lim - x^xo g'(cx) a poslední dvě limity zjevně budou mít stejnou hodnotu. Dokázali jsme tedy, že naše hledaná limita existuje a má také stejnou hodnotu. □ Z důkazu věty je samozřejmé, že její tvrzení platí i pro jednostranné limity. 5.40. Důsledky. 1'Hospitalovo pravidlo můžeme jednoduše rozšířit i pro limity v nevlastních bodech ±oo a pro případ nevlastních hodnot limit. Je-li, např. lim fix) = 0, lim gix) = 0, potomje linwo+ /(!/*) = 0 a liaix^0+ gií/x) = 0. Zároveň z existence limity podílu derivací v nekonečnu dostaneme jfjí/x))' /'(1/+K-1/X2) lim -— lim x^0+ Ígil/X))' x^0+ g'il/x) {-l/X2) lim lim f'(x) *^0+ g'il/x) i^oo g'ix) Použitím předchozí věty tedy dostáváme, že v tomto případě bude existovat i limita podílu fix) fjl/x) fix) lim -= lim -= lim -. i^oo gix) x^0+ gil/x) x^ca g'ix) Ještě jednodušší je postup při výpočtu limity v případě, kdy lim fix) — ±oo, lim gix) — ±oo. x^xo x^xo Stačí totiž psát lim fix) lim 1/«« x^x0 gix) x-?x0 l/fix) což je již případ pro použití ľHospitalova pravidla z předchozí věty. Lze ale i dokázat, že 1'Hospitalovo pravidlo platí ve stejné formě pro nevlastní limity: samu existenci limity v obecném smyslu to vždy nutné není, nicméně pro tvrzení L'Hospitalovy věty je to potřebné. Podrobnou diskusi je možné najít (vygooglovat) v populárním článku 'R. P. Boas, Counterexamples to L'HSpital's Rule, The American Mathematical Monthly, October 1986, Volume 93, Number 8, pp. 644-645.' 271 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Případ (d). Uvedený výraz převedeme na typ 00/oo (přesněji řečeno, na typ — 00/00) vytvořením zlomku in (x - 1) lim ln (x — 1) • lux = lim ■ Podle 1'Hospitalova pravidla je ln (x - 1) 1 ln x lim x-r\ + 1 ln x lim ■ x-r\ + 1 x-l lim - • - x~^\+ X-l ln2* 1 Pro tento neurčitý výraz (typu 0/0) lze pokračovat 1' Hospitalovým pravidlem a stanovit „2 _ o_ i„ _ 1 1 —x ln x — ln x — 2x ln x lim -= lim - jc->1+ X — 1 1^1 + Případy (e), (f), (g). Protože lim (cotg x) 0 + 0 0. lim 1^0 lim cos — 1 x-,\- V 2 / lim (lnx-ln(cos ^-)) postačuje vypočítat limity uvedené v argumentu exponenciální funkce. Pomocí 1'Hospitalova pravidla a jednoduchých úprav získáváme lim i->o+ ln (cotg*) Inx typ +00 : lim x^o+ lim 1 _ -1 cotg x sin2 x x^o+ cos x • sin 1; lim ty? 0 x^o+ cos2 x — sin2 x -1 lim ■ ln§mx *o xr typ ■ 1-0 lim^± x->0 -1; x cos x —sin x 2x x cos x — sin x 1™ „ -i x^o 2x2 sin 1; typ; lim lim ■ cos 1; — x smx — cosx ô 4x sin x + 2x2 cos x — sinx >o 4 sin x + 2* cos x — cosx 0' ty? 0 lim ■ >o 4 cos x + 2 cos x — 2x sin x -1 1 a tudíž 4 + 2-0 lim (cotg x) i /sin i;\ ? lim - 1 = e x->0 \ X Věta. Nechť f a g jsou funkce diferencovatelné v okolí bodu xo e K, ne však nutně v bodě xq samotném, a nechť existují limity liiiLt^,, f(x) = ±00 a lim^^^,, g(x) = ±00. Jestliže existuje limita lim /'(*) pak existuje i limita a jsou si rovny. x^xo g'(x) lim - x^x0 g(x) Důkaz. Opět lze vyjít z věty o střední hodnotě. Základem je vyjádření podílu tak, abychom dostali do hry derivaci: /(*) g(x) fix) fix) - fiy) gix) - giy) fix)-fiý) gix)-giý) gix) kde za y volíme nějaký pevný bod ze zvoleného okolí xq a x necháme blížit k xq. Protože jsou limity / i g v xq nekonečné, můžeme jistě předpokládat, že rozdíly hodnot vxayjsouu obou funkcí při pevném y nenulové. Pomocí věty o střední hodnotě můžeme nyní nahradit prostřední zlomek podílem derivací ve vhodném bodě c mezi x a y a výraz ve zkoumané limitě dostává tvar /(*) gix) 1 g(x) f (c) 1 Ľ2l e'(c) ' kde c závisí na x i y. Při pevném y a x jdoucím k xo jde první zlomek zjevně k jedničce. Když zároveň budeme y přibližovat k xq, bude se nám druhý zlomek libovolně přesně blížit k limitní hodnotě podílu derivací. □ 5.41. Příklad použití. Vhodnými úpravami sledovaných výrazů lze využít Ľ Hospitalova pravidla také na výrazy typu 00 — 00, 100, 0 • 00 apod. Zpravidla jde o prosté přepsání výrazů nebo o využití nějaké hladké funkce, např. exponenciální. Ukážeme si pro ilustraci takového postupu souvislost aritmetického a geometrického průměru z n nezáporných hodnot x j. Aritmetický průměr Ml ix\, ..., x„) — *H-----h x„ je speciálním případem tzv. mocninného průměru stupně r: Af ix-i ,x„) = JÍ +•••+< Speciální hodnota M~ se nazývá harmonický průměr. Spočtěme si nyní limitní hodnotu Mr pro r jdoucí k nule. Za tímto účelem spočteme limitu pomocí LHospitalova pravidla (jde o výraz 0/0 a derivujeme podle r, zatímco jsou při výpočtu konstantní parametry). Následující výpočet, ve kterém užíváme pravidla pro derivování složených funkcí a znalosti hodnot derivace mocninné funkce, musíme číst odzadu. Z existence poslední limity plyne existence 272 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Obdobně lze postupovat při určování poslední limity. Platí lim (Inx) ■ ln (cos — 1 = lim ln (cos ?y) i ln x typ ■ : lim ■ x->l- -V (- sin ^-) f )s ^f- v 2/2 1 1 ln2* ' x n x sin 2f • ln x = — lim---. 2 x->i- cos f- Neboť je tento výraz typu 0/0, mohli bychom pokračovat k součinu limit / 7cx\ m x m x lim (x sin — 1 • lim -= 1 • lim - *->i-V 2/ x^-l- cos ^ *->i- cos 2i Teprve nyní aplikujeme 1'Hospitalovo pravidlo pro lim hŕx typ ■ 0' 21n;c • i : Um--r-— x^-í- (-f)sinf- Celkem máme lim x->l- n (inx ■ ln (cos = ^ • 1 • 0 = 0, tj. lim. / JlX\h (COS-j 1 . □ 5.99. Jak jsme již implicitně zmínili, použití 1'Hospitalova pravidla může vést k limitě, která neexistuje, ačkoliv původní limita existuje: určete limitu x + sin x lim -. X—rOD Y Řešení. Limita je typu ^, použitím 1'Hospitalova pravidla dostáváme x + sin x 1 + cos x lim -= lim -, x^oo x x^oo 1 a protože neexistuje limita lim^oo cos x, neexistuje ani limita lim^oo 1 + cos x. Původní limita ovšem existuje, je totiž x — 1 x + sin x x + 1 - < - < -, a podle věty o třech limitách je x — 1 x + sinx x + 1 1 = lim^co- < lim^co- < lim^oo-= 1 . □ 5.100. Určete lim -, lim xln—, lim ic x^+oo x x^0+ X x^0+ lim x e x->0- lim — x^0 XV lim (ln x — x) : x^+oo lim lim l/x~+l lim x-r+co x -\-\ľlX ■ COSX x^+ca x + 3 x^+ca ^/x2 + 1 předposlední a její hodnota atd. lim ln (Af (xi, lim ■ ln(l(4+... + ^)) x\ ln^iH-----Yxr \xvxn = lim ■ x\^-----Yxr \cíx\ + • • • + ln xn = ln yx\.....x„. Odtud tedy je přímo vidět, že lim Af (x\, ..., xn) = yx\ . ..x„, což je hodnota známá pod názvem geometrický průměr. 4. Mocninné řady 5.42. Jak se počítá e*. Kromě sčítání a násobení už umíme také počítat s limitami posloupností. Podbízí se proto SI'.- ■} přibližovat nepolynomiální funkce pomocí posloup-ností spočítatelných hodnot. Když se takto podíváme na funkci e*, hledáme vlastně funkci, jejíž okamžitý přírůstek je v každém bodě roven hodnotě této funkce. To si můžeme dobře představit jako úžasné úročení vkladu se sazbou rovnou okamžité hodnotě. Když budeme roční sazbu úroku realizovat jednou za měsíc, za den, za hodinu atd., budeme pro výnos vkladu x po jednom roce dostávat výsledné hodnoty -Y 365 ) Dalo by se tedy tušit, že bude platit: —Y 8760 / : lim ( Zároveň tušíme, že čím jemněji budeme postupovat při úročení, tím vyšší bude výnos, takže by posloupnost čísel na pravé straně měla být rostoucí. Podívejme se tedy podrobně na číselnou posloupnost jejíž limita má být Eulerovo číslo e. Bude se nám přitom hodit velice užitečná Bernoulliova nerovnost: Lemma. Pro každé reálné číslo li > -1,1)^0,« přirozené n > 2 platí (l + b)n > 1 +nb. Důkaz. Pro n = 2 dostáváme (1 + bf = l+2b + b2 > 1 +2b. Dále postupujeme indukcí za předpokladu b > —1. Předpokládejme, že tvrzení platí pro nějaké k > 2 a počítejme (1 + b)k+l = (1 + b)k{l +£>)>(! + kb){l + b) = = 1 + (k + l)b + kb1 > 1 + (k + l)b. Tvrzení zřejmě platí také pro / -1. □ 273 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Řešení. Snadno lze zjistit (např. n -násobným užitím ľ Hospitalova pravidla), že pro libovolné n e N je xn e* lim — =0, tj. lim — = +00. X^ + CO qx X^+OG Xn Z Věty o třech limitách potom pro reálná čísla a > 0 ihned plyne zobecnění x" e* lim — =0, tj. lim — = +00. X^ + CO qx X^+OG Xf1 Uvážíme-li, že grafy funkcí y = e1 a y = ln x (inverzní funkce k y = ď) jsou symetrické vzhledem k přímce y = x, víme dále Inx x lim -= 0, tj. lim -— = +00. x^+00 x x^+00 \nx Získali jsme tak první výsledek. Ten přitom dává rovněž 1'Hospi-talovo pravidlo, podle kterého je Inx 7 1 lim -= lim — = lim - = 0. x^+00 X x^+00 1 x^+00 x Upozorněme, že 1'Hospitalovo pravidlo lze použít k vyčíslení každé z dalších pěti uvedených limit. Je ovšem možné určit tyto limity jednoduššími způsoby. Např. substituce y = 1/x vede na 1 lny lim x ln — = lim -= 0; x^0+ X y-?+OD y lim ic = lim — = +00. x^0+ y^+OD y Samozřejmě x —► 0+ dává y = 1/x —► +00 (píšeme 1/ + 0 = +00). Pomocí substitucí u = — 1 /x, v = 1 /x2 po řadě dostáváme lim xeT* = lim--= —00; e" i v50 lim —77- = lim — = 0, přičemž x —► 0— odpovídá u = — 1/x —► +00 (píšeme —1/ — 0 = = +00) a x —► 0 potom u = 1/x2 —► +00 (znovu 1/ + 0 = +00). Již dříve jsme také objasnili, že platí lim (Inx — x) = lim — x = —00. Případné pochyby snad rozptýlí limita Inx — x lim —--= lim x^+00 Inx x^+00 která dokazuje, že při zmenšení absolutní hodnoty uvažovaného výrazu (aniž by došlo ke změně znaménka) stále výraz v absolutní hodnotě roste nade všechny meze. Pro dva po sobě jdoucí členy an naší posloupnosti můžeme nyní s využitím Bernoulliovy nerovnosti odhadnout jejich podíl an-\ ^l + _L_y-1 (^j)""1 "^c""1) \ nl) n — 1 \ n) n — \ Je tedy naše posloupnost skutečně rostoucí. Následující obdobný výpočet (opět s využitím Bernoulliovy nerovnosti) ověřuje, že posloupnost čísel -Kr-K)K)" je klesající a jistě je b„ > an. , I n+l \ n+2 / 2 1 o 1 , \ n+2 6„+l _ n + l + n2+2n ) n + 1 V n(n + 2)J n ( n + 2 \ > - 1 +--- = 1. n + 1 V n(n + 2)J Posloupnost a„ je tedy shora ohraničená a rostoucí, a proto je její limita dána jejím supremem. Zároveň vidíme, že je tato limita rovna také limitě klesající posloupnosti b„, protože lim b„ — lim (l + I)fl„ lim a„ Tato limita proto zadává jedno z nejdůležitějších čísel v matematice (vedle nuly, jedničky a Ludolfova čísla rr), Eulerovo číslo e. Je tedy e = lim ím(i + IV. 5.43. Mocninná řada pro e*. Exponenciální funkci jsme defi-iř|' ., novali jako jedinou spojitou funkci splňující f (ľ) = e ta /(at +y) = f(x) ■ f(y). Základ e máme vyjádřen jako limitu posloupnosti čísel an, nutně tedy je, pro každé pevné 1 - reálné číslo x, ex = lim (anf. Počítejme nyní pro jednoduchost s pevně zvoleným kladným x. Jestliže v hodnotách a„ z minulého odstavce zaměníme n za n /x, opět dostaneme stejnou limitu (rozmyslete si podrobně), a proto také e — lim (1 X\x e* = lim 1 + - H—>00 V Ti / 274 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Stejně snadno umíme určit lim lim x^+ca x + ln X ■ cos X ,. Zlx + 1 lim - = lim £ = x^+oo i/x +3 i^+oo ^/jč lim - = lim _ x-,+oo ^Jx2 _|_ 1 +oo; 1. Viděli jsme, že 1'Hospitalovo pravidlo nemusí být nejlepší metodou výpočtu limity j ednoho z typů 0/ 0, oo / oo. Na předchozích třech příkladech lze ilustrovat, že jej ani nelze vždy (pro neurčité výrazy) aplikovat. Kdybychom jej použili k řešení prvního z nich, obdrželi bychom pro x > 0 podíl 1 _ x 1 + ^sli _ ln x ■ sin x x + cos x — x ln x ■ sin x' který je složitější než původní. Dokonce pro x —► +oo limitu nemá. Není tedy splněn jeden z předpokladů 1'Hospitalova pravidla. Ve druhém případě pak (libovolný počet opakovaných) použití 1'Hospitalova pravidla vede na neurčité výrazy. Pro poslední limitu nás ľ Hospitalovo pravidlo vrátí do zadání: dává nejdříve zlomek 1 a následně 2Vx2+l i v^TT Odsud můžeme odvodit, že limita je rovna 1 (hledáme nezápornou hodnotu a e K takovou, aby platilo a = a-1), pouze když dříve dokážeme, že vůbec existuje. □ Další příklady na výpočet limit užitím ĽHospitalova pravidla naleznete na straně 310. H. Nekonečné řady Nekonečné řady se přirozeně vyskytují v celé řadě (problémů). 5.101. Sierpiňského koberec. Jednotkový čtverec se rozdělí na devět shodných čtverců a odstraní se prostřední čtverec. Každý ze zbývajících čtverců se znovu rozdělí na devět shodných čtverců a v každém z nich se odstraní prostřední čtverec. Určete obsah zbylého obrazce po prodloužení tohoto postupu do nekonečna. Řešení. V prvním kroku se odstraní 1 čtverec o obsahu 1/9. Ve druhém kroku se odstraní 8 čtverců o obsahu 9-2, tj. o celkovém obsahu 8 • 9~2. V každé další iteraci se odstraní osminásobek počtu čtverců Označme n-tý člen této posloupnosti un(x) — (1 + x/n)n a vyjádřeme jej pomocí binomické věty: nlx" _ nln" x n(n — l)x2 un(x) = !+«- + ■ 2!n2 1+x (5.10) x ' ~2\ 4H)H)+-+ +-fi-iKi--v--íi-—v n\ \ n/ \ n J \ «/ Protože jsou všechny závorky v součinech menší než jedna, dostáváme také ^ 1 i u„(x) < v„(x) = > — x'. — / Pokud se přitom budeme dívat na un pro hodně veliká n, budou první sčítance těchto výrazů hodně blízké hodnotám -px1. Skutečně pro všechna x platí následující věta. .__\ Mocninná řada pro e* j___ 5.44. Věta. Exponenciální funkce sx je pro každé x e M vyjádřena jako limita částečných součtů lini/t^oo vk ve výrazu 1 + x h—xr 2! co . y-x". Funkce ex je diferencovatelná a platí (ex)' = ex Důkaz. Technický důkaz věty je pouze rozpracováním výše uvedené úvahy. Nejprve ukážeme, že formální nekonečný součet má, jakožto limita částečných součtů v„, skutečně smysl, a pak dalším jemným odhadem ukážeme, že skutečně dává požadovanou hodnotu hodnotu lim^co u„. Uvažme tedy formální nekonečný součet oo oo ^ (5.11) Y.- • ve kterém je v„ (x) právě součet prvních n členů. Podíl dvou po sobě jdoucích členů v řadě je Cj+\/cj — x/(n + 1). Pro každé pevné x tedy existuje N e N takové, že cj+\ /cj < 1/2 pro všechny j > N. Pro takto velká j je ovšem Cj+\ < jCj < 2~^~N+^ ca/. To ale znamená, že částečné součty prvních n členů v našem formálním součtu jsou shora ohraničeny součty JV-l . . n-N . Vn N pro nějaké pevné N (hodně velké) a k < N pevné (docela malé) a označíme si u„k prvních k členů ve výrazu (5.10) pro '1 »»• Prodané* as > 0, umíme zvolit k tak, aby »„(í+£ > m„,pro všechna n > k (skutečně, zbylé členy jsou všechny kladné a ještě menší, než ty ve v„, které jsme odhadli výše). Přitom zároveň pro naše pevné k můžeme volbou dostatečně velikého N zařídit, aby pro všechna n > N bylo také < Vk < u„tk + £ (protože pro pevné k máme ve výrazech pro jen konečně mnoho závorek a volbou velikého n budou všechny libovolně blízko k jedničce). Celkem tedy pro libovolné £ vedou naše volby indexů tank odhadu \vk — u„\ < e. Když budeme volit posloupnost £, = l/i, dostaneme takovépodposloupnosti auni s hodnotami vzdálenými nejvýše o 1/ i, a proto také lim vi — lim u„, což jsme měli dokázat. Podívejme se ještě na derivaci funkce ex v bodě x —0. Přímo z definice musíme spočíst limitu lim x->0 (1+X + : 0-1 lim ■ x->0 X + Diskutujeme tedy limitní výraz / " 1 lim ( lim — Nyní lirn„^ pro k=\ každé / " 1 - liml lim y^— x1^1 N kV £ 1-1 > 0 můžeme < £ pro všechna — 1 < x k=2 najít N tak, < 1. aby Pak jistě pro dostatečně malá x můžeme zmenšit i součet prvních N — 2 sčítanců na nejvýše £. Půjdeme-li přitom s číslem £ k nule, zjistíme, že limita limitního výrazu napravo je nulová, a proto zkoumaná limita skutečně existuj e a j e rovna j edné. □ Čtenáři, kteří předchozí řádky přeskočili (ať už schválně nebo v nouzi) mohou v klidu počkat, až odvodíme předchozí výsledek z obecných teoretických úvah jednodušeji. Časem totiž ukážeme, že jsou funkce zadané jako nekonečné polynomy vždy diferencovatelné a že je lze derivovat člen po členu. Ještě později ukážeme, že podmínky f'(x) = f(x) a f (O) = 1 určují funkci / jedno- 5.45. Číselné řady. Při odvození předchozí důležité věty • o funkci ex jsme mimoděk pracovali s několika mimořádně užitečnými pojmy a nástroji. Zformulujeme si je nyní obecněji: číselné nekonečné řady i--, Definice. Nekonečná řada čísel je výraz n=0 -- ao + a\ + «2 H-----V ak + . kde an jsou reálná nebo komplexní čísla. Posloupnost částečných součtů je dána svými členy st — Yln=o a" a říkáme, že řada konverguje a je rovna s, jestliže existuje konečná limita částečných součtů s = lim Sk- 276 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Podobně v dalším kroku obdržíme obsah útvaru jako So So So + 3.J + 4.3.-. Počet přidávaných trojúhelníků je čtyřnásobný a délky jejich stran třetinové. Nyní již není obtížné odvodit, že obsah vločky je roven limitě So lim (50 + 3.|+4.3.^ + . 114 1/4 -S0 lim 1 + - + -.- + ... + -. - n^ca \ 3 3 9 3 \ 9 + 4" • 3 • On+l -So -So 1/4 A 1 + - hm 1 H---1-----h - 3 n^oo v 9 \9 /,—n \ / ;,_n \ / 1 + 3 1 - í 9. Obsah vločky je tedy 8/5 obsahu původního trojúhelníka, tj. 8 _ 8 VŠ _ 2^3 Zopakujme, že tato vločka je příkladem toho, jak nekonečně dlouhá křivka může ohraničovat konečnou plochu. 5.103. Sečtěte řadu □ ři=l ' (b) e h n=0 (c) £( ři=l co (d) e f n=l (e) e (3n+l)(3n+4)-ři=0 Řešení. Případ (a). Podle definice je součet řady /n +1 = lim v/n + 1 /n + 1 Případ (b). Zjevně se jedná o pětinásobek konvergentní geometrické řady s kvocientem q = 1/3, a tudíž je 15 Jestliže posloupnost reálných částečných součtů řady má nevlastní limitu, říkáme že řada diverguje k 00 nebo —00, pokud limita částečných součtů neexistuje, říkáme, že je řada osciluje. Z obecných vět o limitách posloupností okamžitě vyplývá, že součet konvergentních řad J2an a J2b" Je konvergentní řada J2(an + b„) a obdobně pro násobek řady konstantou. Z věty o třech limitách také okamžitě dostáváme tzv. srovnávací kritérium, které říká, že při 0 < a„ < bn vyplývá z konvergence řady ~}2bni konvergence řady an, zatímco z divergence řady an vyplývá divergence řady bn. K tomu, aby posloupnost částečných součtů s„ konvergovala, je nutné a stačí, aby byla cauchyovská. Tzn. že km -s„\ = |a„+i H-----haj musí být libovolně malé pro dostatečně velká m > n. Protože je k+ll H-----\- \am \ > k+l H-----ham|, vyplývá z konvergence řady YlT=(t \an I i konvergence řady E00 k=0an- ___j Absolutně konvergentní řady j_—-- Říkáme, že řada YlT=(ta" konverguje absolutně, jestliže konverguje řada J27=o \a"\- 1 Absolutní konvergenci jsme zavedli, protože se často daleko snadněji ověřuje. Navíc, pokud konverguje řada . IZSi \ai\> tok konverguje i řada 2^£i ai ■ Důkaz oka- ^jdfcL\ mzitč vyplývá z předchozí úvahy o cauchyovskosti %ir?%zp~J— posloupností částečných součtů. Zároveň následující věta ukazuje, že se v případě absolutně konvergentních řad i jednoduché algebraické operace chovají všechny velice dobře: 5.46. Věta. Nechť S = Z^Lo an aT — Y^=o b„ jsou dvě absolutně konvergentní řady. Pak (1) jejich součet absolutně konverguje k součtu 00 00 00 s +t = j2a" + Y2b"- Y.ui° ■ ři=0 ři=0 ři=0 (2) Jejich rozdíl absolutně konverguje k rozdílu co co co s — t — y^an - y^&w = y^Mn - ři=0 ři=0 ři=0 (3) jejich součin absolutně konverguje k součinu (00 \ / OO \ OO / TI \ J2an . j> =£ E«»-a ■ n=0 I \n=0 I n=0 \k=0 I Důkaz. První i druhé tvrzení j sou bezprostředním důsledkem obdobných vlastností limit. Třetí tvrzení vyžaduje větší pozornost. Označme si n Cn — y^.an-kbk- k=0 Z předpokladů a podle pravidel pro limitu součinu posloupností dostáváme 277 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Případ (c). Platí (při substituci m = n — 1) L^i l 42/1-1 + 42n j — 4 (42^-2 j + ig (42^-2 ři=i ři=i ři=i Máme tedy dokázat, že 3 2 \ ^ 1 14 ^ / 1 00 / 1 \ m 4 16/ ^ 42m 16 ^ v 16 m=0 m= 14 1 14 16 l-± 15- Řadu lineárních kombinací jsme zde vyjádřili jako lineární kombinaci řad (přesněji řečeno, jako součet řad s vytknutím konstant), což je platná úprava, pokud obdržené řady jsou absolutně konvergentní. Případ (d). Z částečného součtu 12 3 n 3 32 33 3" bezprostředně získáváme sn 1 2 n — 1 ři - = ^ + ^ + ■■■ + —^ + ^-7, "ěN. 3 32 33 Je tedy sn 1 1 1 ln Protože lim = 0, dostáváme E«_ _ lim 3 / _ £„ \ _ 3 J_ _ 3" ~ 2 V" 3 / _ 2 ^ 3k ~ n=\ k=\ 3™fl\k 31 1 2fe\3/ 2 \1 -i Případ (e). Stačí použít vyjádření (jde o tzv. rozklad na parciální zlomky) 1 1111 -=-------, řieNUÍO), (3n + l)(3« + 4) 3 3n + l 3 3n + 4 které dává ^ 1 ,.1/11111 > -= lim - 1---1-----1-----1---- (3n + l)(3n + 4) «^oo 3 \ 4 4 7 7 10 1 1 3rc + l 3n + 4 :Hmi(l—U = i. n^°o 3 V 3n + 4/ 3 □ 5.104. Ověřte, že platí e n2 < e 2»" ři=l ři=0 Řešení. Dined je vidět, že 11 111111 11 151, T2 + 3~2<2-T2=ř 42+T2+ě + Tl<4-4l=4> Porovnejme si nyní výrazy °W(e4(&)-e4 \ \n=0 I \n=0 / n=0 / týní výrazy Ea»)■ (Em = E aibj, J2C"= E i+j=n i+jsi Dostáváme tedy odhad Ea») ' (EM ~EC» = E - E i+j>k i+j>k K odhadu posledního výrazu nám poslouží jednoduchý trik: aby mohl být součet indexů větší než k, musí být alespoň jeden z nich větší než k/2. Jistě tedy výraz nezmenšíme, když do něj přidáme více členů, tj. vezmeme všechny jako v součinu a odebereme pouze ty, u kterých jsou oba nejvýše k/2. \aibj\< \aibi\- Yl \aibi\- i+j>k 0 l.Při\q\ = 1 může řada konvergovat ale nemusí. (3) Jestliže existuje limita lim i \a„ \ = q, pak při q < 1 řada konverguje absolutně, zatímco při q > 1 nekonverguje. Je-li q — 1, může konvergovat i divergovat. Důkaz. (1) Víme, že existence a případná hodnota limity posloupnosti komplexních čísel je dána pomocí limit posloupností reálných a imaginárních složek. První tvrzení tedy stačí dokázat pro posloupnosti reálných čísel. Jestliže lim^oo a„ neexistuje neboje nenulová, existuje pro dostatečně malé číslo £ > 0 nekonečně mnoho členů ak s \ak | > £. Zároveň tedy musí mezi nimi existovat nekončené mnoho kladných nebo nekonečně mnoho záporných. Pak ovšem při přidání kteréhokoliv z nich do částečného součtu dostáváme rozdíl dvou po sobě 278 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ resp. obecný odhad 1 +■■■+.. ... <2"--rJ-^ = j-, n e N. (2„)2 (2"+1 - l)2 (2")2 2"' Odsud (porovnáním členů obou řad) dostáváme zadanou nerovnost, z níž mj. plyne absolutní konvergence řady E^li • Ještě upřesněme, že je °° 1 7T2 °° 1 □ V — = — <2= V - 5.105. Vyšetřete konvergenci řady ~ n + 1 Řešení. Pokusme se uvedenou řadu sečíst. Platí + 1 / 2 3 4 n + 1 ) ln-= hm ln —h ln —h ln —I-----h ln- t—? n n-?oD V 1 2 3 n 2 • 3 • 4 • • • (n + 1) = lim ln-= lim ln (n + 1) = +oo. ři^oo 1 . 2 • 3 • • • n ři^oo Řada tudíž diverguj e k + oo. □ 5.106. Prokažte, že řady ^ n2 + 2n + 3^/n~ + 4 ^ 3" + l / arcts-1-; / -3—i— ^ n + 1 ^ n3 +n2 - n ři=0 ři=l nekonvergují. Řešení. Protože lim arctg n2 + 2n + 3 + 4 n + 1 lim arctg — = — řl^OO ří 2 3" + l 3" lim —;-t-= lim —r = +oo, ři^oo ří -t- ří — /J^oo řlj není splněna nutná podmínka konvergence lim an = Ořady YJ^n 5.107. Zjistěte, zda řada □ (a) EôTTT l)-3" (b) E rr+l. (C) E n-lnn konverguje. Řešení. Všechny tři uvedené řady mají nezáporné členy, a tak mohou v jednotlivých variantách nastat jen dvě možnosti - součet je konečný, součet je roven +oo. Platí oo oo (a) E 5 E = < +°°; oo , oo , oo (b) E^E^E^^; ři=i ři=i ři=i jdoucích í„ a s„+i o velikosti alespoň £. Posloupnost částečných součtů proto nemůže být cauchyovská a tedy ani konvergentní. (2) Protože chceme dokazovat absolutní konvergenci, můžeme rovnou předpokládat, že členy řady j sou reálná čísla a, > 0. Důkaz jsme pro speciální hodnotu q — 1/2 provedli při odvození hodnoty e* pomocí řady. Uvažme nyní q < r < 1 pro nějaké reálné r. Z existence limity podílů dovodíme pro všechna j větší než dostatečně veliké N Jj-N+I) aN. aj^i < r • lij ^ i To ale znamená, že částečné součty s„ jsou pro velká n > N shora ohraničeny součty n-N N , ^-N+l N Protože 0 < r < i=o j=o 1 1 1, je množina všech částečných součtů shora ohraničená rostoucí posloupnost, a proto je její limitou její supre-mum. Při hodnotě q > r > 1 použijeme obdobný postup, ale z existence limity podílu q hned na začátku odvodíme aj+i > r - aj > r(J~N+l) aN > 0. To ale znamená, že absolutní hodnoty velikostí jednotlivých členů řady nejdou k nule, a proto tato řada nemůže konvergovat podle již dokázané části věty. (3) Důkaz je zde velmi podobný předchozímu případu. Z existence limity q < 1 vyplývá, že pro každé q < r < 1 existuje N takové, že pro všechny n > N platí -í/|a„| < r. Umocněním pak dostáváme \a„\ < ŕ , takže jsme opět v situaci, kdy srovnáváme s geometrickou řadou. Důkaz se proto dokončí stejně jako v případě podílového testu. □ V důkazu druhého i třetího tvrzení jsme využívali slabšího tvrzení, než je existence limity. Potřebovali jsme pro studované posloupnosti nezáporných výrazů pouze tvrzení, že od určitého indexu už budou větší nebo menší než dané číslo. K takovému odhadu nám ale postačí pro danou posloupnost bn uvažovat s každým indexem n supremum hodnot členů s indexy vyššími. Tato suprema vždy existují a budou tvořit nerostoucí posloupnost. Její inflmum pak označujeme jako limes superior dané posloupnosti a značíme lim sup bn. řl^OO Výhodou je, že limes superior vždy existuje, můžeme proto předchozí výsledek (aniž bychom měnili důkaz) přeformulovat v silnější podobě: Důsledek. Nechť S — Yľí^Lo a" Je nekonečná řada reálných nebo komplexních čísel. (1) Je-li an+\ q — lim sup řl^OO pak řada S konverguje absolutně při q < 1 a nekonverguje při q > 1. Při q — 1 může řada konvergovat ale nemusí. (2) Je-li q = lim sup $\a„ |, řl^OO pak při q < 1 řada konverguje absolutně, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i divergovat. 279 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ (c) E —\— > E 1 = +°°- n=l n=l Odtud plyne, že řada (a) konverguje; (b) diverguje k +oo; (c) diverguje k+oo. □ 5.108. Ukažte, že tzv. harmonická řada CO zZ- n=l diverguje. Řešení. Pro libovolné přirozené k je součet prvních 2h členů řady větší než k/2: 1111111 1 + 2+3+4+5 + 6 + 7 + 8 + "-' součet členů od 21 + 1 do 2Í+1 je totiž vždy větší než 2'-krát (jejich počet) číslo 1/2' (nejmenší z nich), což je dohromady 1/2. Divergenci této řady můžeme také ověřit integrálním kriteriem konvergence řad, viz 6.36 □ Další zajímavé příklady k číselným řadám naleznete na straně 311. I. Mocninné řady V předchozí podkapitole jsme zkoumali, jestli lze přiřadit smysl součtu nekonečně mnoha čísel. Nyní se budeme zajímat o to, jaký může mít význam součet nekonečně mnoha funkcí. 5.109. Určete poloměr konvergence následujících mocninných řad: oo i) EtA n=\ co U) E ňTiř*"- Řešení, (i) Podle 5.50 je lim sup Daná mocninná řada tedy konverguj e pro reálná x € (—j, y, případně pro komplexní \x\ < \. Všimněme si, že řada je divergentní pro x = \ (jde o harmonickou řadu) a naopak konverguje pro x = — \ (alternující harmonická řada). Rozhodnout o konvergenci pro libovolné x ležící v komplexní rovině na kružnici o poloměru \ je těžší otázka a přesahuje rámec našeho kurzu. 1 I _ V2 5.48. Alternující řady. Podmínka an -» 0 je nutnou, ale nikoliv dostatečnou podmínkou konverce řady Z^Li an- Platí ale naásle-dující tzv. Leibnizovo kritérium konvergence: Řadu 2~2nLi(~l)"an> kde a„ je neklesající posloupnost kladných reálných čásel, nazýváme alternující řadou. Věta. Alternující řada je konvergentní, právě když platí limn^oo a„ — 0. Její součet a se liší od částečného součtu s2k o nejvýše a2k+i- Důkaz. Přímo z definičních vlastností dostáváme pro částečné součty sk alternující řady *2(i+l)+l = S2k+\ - a2k+2 + «2i+3 < S2k+l *2(i+l) = S2k + a2k+l - a2k+2 > S2k S2k+l - S2k = a2k+l -> 0 S2 < S2k < S2k+1 < Si. Z posledního řádku vyplývá, že posloupnost lichých částečných součtů konverguje ke svému infimu, zatímco posloupnost sudých částečných součtů ke svému supremu. Předchozí řádek ale zaručuje, že tyto limity musí být stejné. Zároveň vidíme, že součet a naší řady je vždy menší než s^fc+l a větší než S2k- Tyto částečné součty se proto nemohou lišit od limity o více než a^+i. □ 5.49. Mocninné řady. Jestliže máme místo posloupnosti čísel an ^ k dispozici posloupnost funkcí f„(x) se stejným definičním oborem A, můžeme bod po bodu použít definici součtu číselné řady a dostáváme pojem součtu řady funkcí oo S(X) = £/„(*)■ n=0 j Konvergence mocninné řady |_, Mocninná řada je dána výrazem oo 5(*) = y>„x". n=0 Řekneme, že S(x) má poloměr konvergence p > 0, jestliže S(x) konverguje pro každé x splňující \x\ < p a nekonverguje při |*| > p. 5.50. Vlastnosti mocninných řad. Ačkoliv na podstatnou část důkazu následující věty si budeme muset počkat až na konec příští kapitoly, zformuluj eme si základní vlastnosti mocninných řad hned: _ Absolutní konvergence a derivování _.. (ii) r = lim supn_ j_ 00 i v (!+')" I lim supn_ •oo I 1+i I □ Věta. Nechť S(x) — Y1T=0 an-t" Je mocninná řada a existuje limita r = lim yjaTf. řl^OO Pak je poloměr konvergence řady S roven p — r~l. když r > 0, p — oo pro r — 0, a p — 0, když r — oo. Mocninná řada S(x) konverguje na na celém svém intervalu konvergence absolutně a je na něm spojitá (včetně krajních bodů, 280 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.110. Určete poloměr konvergence r mocninné řady oo , , (a) co (b) £(-471)"*»; n=\ oo 2 (O Z(i + ±r (d) E (2+(-l)")' n=\ Řešení. Platí (a) lim VI an I = lim ^ = I; (b) lim VI an I = lim 4n = +oo; (c) lim VKrr = lim (1 + j-Y = e; _ >T~5 (Jn )5 (d) lim sup VI an I = lim sup 2+^"1)n = lim sup 2+(-i)" = 1. řl^OO řl^OO řl^OO Proto je poloměr konvergence (a) r = 8, (b) r = 0, (c) r = 1 /e, (d) r = 1. □ 5.111. Stanovte poloměr konvergence r mocninné řady ■(x-2f. V«3 + « • 3" V«4 + 2n3 + 1 • Řešení. Poloměr konvergence libovolné mocninné řady se nezmění, pokud posuneme její střed nebo nahradíme koeficienty členů tak, že se nezmění jejich absolutní hodnota. Určeme tedy poloměr konvergence řady V«3 + n ■ 3" -x". V«4 + 2n3 + 1 • jt" Protože lim V"" = ( lim V"^ = 1 Pro fl > 0, můžeme dále přejít k řadě ^ 71" n=l se stejným poloměrem konvergence r = jr/3. □ 5.112. Napište mocninnou řadu se středem v počátku, jejíž součet je na intervalu (—3, 3) funkce 1 12 Řešení. Neboť 1 12 (x-4)(x + 3) 7\x-4 x + 3 pokud v nich konverguje také) a na tomto intervalu existuje její derivace ^(i) = ^„fl„/-l. Důkaz. Pro ověření absolutní konvergence řady můžeme pro každou pevnou hodnotu x použít odmocninový test z věty 5.47(3). Počítáme přitom lim d\anxn | = rx a řada konverguje absolutně, resp. nekonverguje, jestliže je tato limita různá od 1. Odtud plyne, že skutečně konverguje pro \x\ < p a diverguje pro \x\ > p. Tvrzení o spojitosti a derivaci dokážeme později v obecnějším kontextu, viz 6.43-6.45. □ Všimněme si také, že můžeme při důkazu konvergence použít silnější variantu odmocninového testu a tedy lze poloměr konvergence r pro každou mocninnou řadu přímo zadat vztahem rl = lim sup ^/|rz„|. 5.51. Poznámky. Pokud koeficienty řady velmi rychle rostou, • např. an = n", pak je r = oo, tj. poloměr konvergence je nula. Skutečně taková řada pak konverguje pouze v jediném bodě x = 0. Podíváme se na příklady konvergence mocninných řad oo oo 1 ři=0 ři=l včetně krajních bodů příslušného intervalu. První příklad je geometrická rada, kterou jsme se zabývali již dříve, a její součet je pro všechna x, \x\ < 1, S(x) = 1 l-x zatímco \x\ > 1 zaručuje divergenci. Pro x = 1 dostáváme také zjevně divergentní řadu 1 + 1 + 1 + ... s nekonečným součtem, při x = — 1 jde o řadu 1 — 1 +1 —... Jejíž částečné součty nemají limitu vůbec, tj. řada osciluje. Věta 5.47(2) ukazuje, že poloměr konvergence druhého příkladu je také jedna, protože existuje lim řl^OO fi+1_ = x lim Lx" >oo n + 1 Pro x = 1 tu dostaneme divergentní řadu 1 + \ + \ + ..., protože umíme odhadnout částečné součty tak, že vždy postupně pro k = 1,2,3,..., sečteme 2i_1 po sobě jdoucích členů l/2i_1, ..., 1/ (2k — 1) a nahradíme všechny 2~k. Do spodního odhadu tedy každá taková část přispěje 1/2 a odhad tedy roste nad všechny meze. Naopak, řada T{— 1) = — 1 + 5 — 5 + ... konverguje i když samozřejmě nemůže konvergovat absolutně. Vyplývá to z obecnějšího platného tvrzení, které ukážeme až v příští kapitole. 281 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 1 x -4 1 1 / XX2 "4 1 + 4 + 4Í + ' 1 x + 3 l-(-f) x x x" ■ + —+ • dostáváme 12 1 CO v" 28 „to 4» ^ /(-1)"+1 n=0 _^ » (-*)" 21 „to 3» 1 21 • 3" 28-4" x". □ 5.113. Nalezněte přibližnou hodnotu čísla sin 1° s chybou ostře menší než 10~10. Řešení. Víme, že je 1 3 1 , 1 7 sinx — x--x H—xr--x +■ 3! 5! 7! e (-Ír (2n + 1)! x2" +1 Dosadíme-li x = jr/180, pak částečné součty řady vpravo budou aproximacemi sin 1°. Zbývá určit počet členů, které je třeba sečíst, aby chyba byla prokazatelně menší než 1CT10. Číselná řada 7t 1 / 7t \3 l8Ô~3!\18Ô7 +5lll807 7! Vl80/ e (-1) 7Í \2n+l (2n + 1)! V180/ je alternující s vlastností, že posloupnost absolutních hodnot jejích členů je klesající. Pokud libovolnou takovou konvergentní řadu nahradíme jejím částečným součtem, chyba, jíž se tím dopustíme, bude menší než absolutní hodnota prvního členu uvažované řady nezahrnutého do částečného součtu. (Důkaz tohoto tvrzení uvádět nebudeme.) Chyba aproximace ,^ sinl° 18Ô 1803 -3! je tak menší než 1805 -5! < 10" 5.114. Určete poloměr konvergence r mocninné řady Z (2„) ■X" . 5.115. Stanovte poloměr konvergence pro Yľ^Ĺi • 5.116. Bez počítání uvedte poloměr konvergence mocninné řady Z ■xn~ □ O O O m lij 5.52. Goniometrické funkce. S mocninnými řadami nám ■J: .i do našeho společenství funkcí přibyla spousta nových příkladů hladkých funkcí, tj. funkcí libovolně krát diferen-I covatelných na celém svém definičním oboru. Podobně jako polynomy mají všechny tyto přírůstky do zvěřince navíc vlastnost, že jsou ve skutečnosti zadány vztahem, který definuje funkci C -» C. Skutečně, naše úvahy o absolutní konvergenci jsou bezezbytku platné i pro komplexní číselné řady. Proto mocninné řady budou, po dosazeni komplexních čísel za x, na celém kruhu v komplexní rovině se středem v počátku a poloměrem r představovat konvergentní číselné řady komplexních čísel. Pohrajme si chvíli s nejvýznamnějším příkladem, exponenci- álou 1 "i 1 ex = 1 + x + -xř H-----h —x" + .... 2 n\ Tato mocninná řada má poloměr konvergence nekonečný a dobře proto definuje hladkou funkci pro všechna komplexní čísla x. Její hodnoty jsou limitami hodnot (komplexních) polynomů s reálnými koeficienty a každý polynom je zcela určený konečně mnoha svými hodnotami. Zejména tedy jsou hodnoty mocninných řad i v komplexním oboru zcela určeny jejich hodnotami na reálných argumentech x. Proto i pro komplexní exponenciálu musí platit i obvyklé vztahy, které jsme pro reálné hodnoty proměnné x již odvodili. Zejména tedy platí viz vztah (5.5) a věta 5.46(3). Dosadme si hodnoty x i e C je imaginární jednotka, t e M libovolné. s" = 1 + it - -t2 - i—ř + —ř + i—l5 -2 3! 4! 5! a zjevně tedy je komplexně konjugované číslo k z z = e~". Proto .|2 ^ - it -it „0 ■ t, kde = e" číslo Izľ ■ z ■ z 1 a všechny hodnoty z = e" leží na jednotkové kružnici v komplexní rovině. Reálné a imaginární složky bodů na jednotkové kružnici jsme popisovali pomocí goniometrických funkcí cos 9 a sin 9, kde 9 je patřičný úhel. Derivací parametrického popisu bodů kružnice, t i-> e" dostáváme vektory „rychlostí*', které budou dány výrazem (pokud zatím nevěříme derivování mocninných řad člen po členu, lze také zderivovat zvlášť reálnou a imaginární složku) t \-> (e")' = i • e" a jejich velikost proto také bude pořád jednotková. Odtud lze tušit, že celou kružnici oběhneme po dosažení hodnoty parametru rovného délce oblouku, tj. In (k pořádné definici délky křivky budeme potřebovat integrální počet, pak toto tvrzení ověříme). Tímto 282 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.117. Nalezněte obor konvergence mocninné řady EVb+1 řl=l x" 5.118. Určete, pro jaká x e Krada oo (-3)" (x _ 2)™ O o konverguje. 5.119. Je pro libovolnou posloupnost reálných čísel {an}^Lo poloměr konvergence mocninných řad E«, a-\ E^^1 ři=0 ři=l O stejný? 5.Í20. Rozhodněte o platnosti implikací: (a) Pokud existuje vlastní limita lim í/aj, pak mocninná řada oo Y,an(x - x0)n n=\ konverguje absolutně alespoň ve dvou různých bodech x. (b) Z neabsolutní konvergence řad E^i fl»> E^i ^» plyne> že rovněž řada E^i ~ 5bn) konverguje. (c) Jestliže pro číselnou řadu E^o a" Je lim a2 = 0, pak tato řada konverguje. (d) Pokud řada E^i an konverguje, potom řada E - n=l konverguje absolutně. O 5.121. Určete cos s chybou menší než 10~5. O 5.122. Pro konvergentní řadu oo z^ v^+ioo ři=0 odhadněte chybu aproximace jejího součtu částečným součtem sg ggg. O 5.123. Funkci y = eř definovanou na celé reálné přímce vyjádřete jako nekonečný polynom se členy tvaru a„(x — 1)™ a funkci y = 2X definovanou na K vyjádřete jako nekonečný polynom se členy anx". O 5.124. Nalezněte funkci /, k níž pro x e K konverguje posloupnost funkcí fn(x) "V n € N. postupem můžeme definovat tzv. Ludolfovo číslo1 tc —je to délka poloviny jednotkové kružnice v euklidovském R2. Můžeme se ale nyní aspoň částečně ujistit pohledem na nejmenší kladné kořeny reálné části částečných součtů naší řady, tj. příslušných polynomů. Již při řádu deset nám vyjde číslo ti přesně na 5 desetinných míst. Dostáváme tedy přímou definici goniometrických funkcí pomocí mocninných řad: cosř — re e i - -ř2 + — ŕ —ŕ 2 4! 6! • + (-1)' 1 ■í2* sin í = ime • + (-1)" (2ky.' 1 J 1 Ji 1 7 ř--ť H--ť--ť 3! 5! 7! 1 (2k + 1)! ř2^1 + .... St Ilustraci konvergence řady pro funkci cos je vidět na dalším obrázku. Jde o graf příslušného polynomu stupně 68. Při postupném vykreslení částečných součtuje vidět, že aproximace v okolí nuly je velice dobrá a prakticky beze změn. S rostoucím řádem se pak zlepšuje i dále od počátku. Přímo z definice vyplývá známý vztah e" e~" — sin2ř + cos21 — 1 a také z derivace (e")' = i e" vidíme, že (siní)' — cosř, (cosř)' — — sinř. Tento výsledek lze samozřejmě ověřit přímo derivací našich řad člen po členu. Označme řo nejmenší kladné číslo, pro které je e~"° = — e"°, tj. první kladný nulový bod funkce cos ř. Podle naší definice Ludolfova čísla je řo = \ti. n2i2+l ' 7 Číslo udávající poměr mezi průměrem a obvodem používali už Babyloňané a Řekové ve starověku. Označení Ludolfovo číslo je odvozeno od jména německého matematika Ludolfa van Ceulena, který Archimedovým postupem aproximace pomocí pravidelných mnohoúhelníků spočetl ji na 35 platných desetinných míst již v 16. století. 283 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Je tato konvergence stejnoměrná na K? 5.125. Konverguje řada oo E-ffr. kde xe n=\ stejnoměrně na celé reálné ose? 5.126. Odhadněte O o "1-5. (a) kosinus deseti stupňů s přesností alespoň 10 T^T[ s nřp.snnstí alp.snnň 10~3 (b) určitý integrál JQ1/2 pq-j- s přesností alespoň 10 O 5.127. Určete mocninný rozvoj se středem v bodě xo = 0 funkce f{x) = jď dt, xe!. o O 5.128. Užitím integrálního kritéria nalezněte hodnoty a > 0, pro které řada oo t-^ na n = \ konverguje. O 5.129. Určete, pro která xel konverguje řada 5.130. Určete všechna x e K, pro která konverguje mocninná řada oo ^ ES- O 5.131. Pro jaká x e Krada Eln(n!) nx O konverguje? 5.132. Rozhodněte, zda řada oo ZC-D-Hg^ konverguje absolutně, příp. relativně, nebo zda diverguje k +oo, resp. k —oo, či nic z toho (říkáme, že osciluje). O 5.133. Stanovte součet číselné řady oo ^ pomocí součtu vhodné mocninné řady. 5.134. Pro x € (-1,1) sečtěte x - Ax2 + 9X3 - \6xA + ■ ■ ■. 5.135. Je-li \ x | < 1, určete součet řady oo (a) Es^t*2"-1; n=\ co (b) X>V-1- n=\ O o Pak čtverec této hodnoty je e'2í° = e"''2'0 = (e"''0)2 a jde tedy o nulový bod funkce sin ř. Samozřejmě přitom platí pro libovolné ř ei(4ií0+í) _ (fjtoýk . eií _ i . eií Jsou tedy obě goniometrické funkce sin a cos periodické s periodou 2ti. Z našich definic je přitom vidět, že je to nejmenší jejich perioda. Současně je vidět, že v komplexním oboru je exponenciální funkce periodická s periodou 2ni, neboť ez+2m — ez ■ e2m — ez. Nyní můžeme snadno odvodit všechny obvyklé vztahy mezi goniometrickými funkcemi. Uvedeme na ukázku několik z nich. Nejprve si všimněme, že definice vlastně říká 1 cosř = -(e" +e "), 2 siní = — (e;í -e_íí). 2i (5.12) (5.13) Součin těchto funkcí jde tedy vyjádřit jako siní cosř = j. (s" - e"''') (ei( + e-;í) = 4i v 12 Dále můžeme využít naši znalost derivací: cos 2t — I - sin 2t I — (sin ř cos ř) = cos ř — sin ř. Vlastnosti dalších goniometrických funkcí siní tgř = cosř cotgř = (tgř)" se snadno odvodí z jejich definice a pravidel pro derivování. Grafy funkcí sinus, cosinus, tangens a cotangens jsou na obrázcích: Cyklometrické funkce jsou inverzní ke goniometrickým. Protože j sou goniometrické funkce všechny periodické s periodou 2jt, jsou jejich inverze definované vždy jen v rámci jedné periody a to ještě jen na části, kdy je daná funkce buď rostoucí nebo klesající. Jsou to funkce arcsin = sin-1 s definičním oborem [—1, 1] a oborem hodnot [—ti/2, jt/2]. Dále arccos = cos-1 s definičním oborem [—1, 1] a oborem hodnot [0, rr], viz obrázek vlevo. 284 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ O 5.136. Spočtěte E (-2)"" pomocí součtu mocninné řady J2 (-1)" (2n + l)x2' n=0 pro jisté x e (—1,1). 5.137. Pro x € K sečtěte řadu ^ 2"-ři! J. Přírůstky do ZOO 5.138. Stanovte maximální podmnožinu K, kde může být funkce gCos(^x—21+cosx)+x —256;t3 _ 1 ^ O o y = arctg (x21 + sinx) definována. 2 + x2: 5.139. Napište maximální definiční obor funkce arccos (ln x) Jx^í ' y ■ O O 5.140. Uvedie definiční obor, obor hodnot a inverzní funkci funkce y ■ x-1 2-3x O 5.141. Je funkce (a) y COS X . - x3 ' (b) y _ £OS£ , j X* (c) y COS X . _ x1 ' (d) y = £2|i + 1; x* (e) y = sin x + tg |; (f) y = ln (g) y = sinhx = ŕ~e * (h) y = coshx = ŕ+2e * s maximálním definičním oborem lichá? 5.142. Je funkce O (a) y COS X . - I3 ' (b) y _ cosx , j x* (c) y COS X . (d) y = £2|i + 1; (e) y = sin x + tg |; (f) y = ln 1— x ' (g) y = sinhx = £-^-1 (h) y = coshx = ŕ+2e * Zbývají ještě funkce (zobrazené na obrázku vpravo) arctg = tg-1 s definičním oborem R a oborem hodnot (—n/2, jt/2) a konečně arccotg = cotg 1 s definičním oborem R a oborem hodnot (0, jt). Velice často se také využívají tzv. hyperbolické funkce sinhx = - (ex 2 y '), coshx = - (e1 +e *). Název naznačuje, že by funkce mohly mít něco společného s hyperbolou. Přímý výpočet dává (druhé mocniny se v roznásobených dvojčlenech všechny odečtou a zůstanou smíšené členy) (coshx)2 - (sinhx)2 = 2- (e* e~ 1. Body [coshí, sinhř] e R tedy skutečně parametricky popisují hyperbolu v rovině (viz 4.31). Pro hyperbolické funkce lze snadno odvodit podobné identity jako pro funkce goniometrické. Mimo jiné je přímo z definice snadno vidět (dosazením do vztahů (5.12) a (5.13)) coshx = cos(íx), (cosh)'(x) = sinh(x), i sinh x = sin(í'x) (sinh)'(x) = cosh(x). 5.53. Poznámky. (1) Jestliže mocninnou řadu 5(x) vyjádříme Jg^ s posunutou hodnotou proměnné x o konstantní posuv irSí xo, dostaneme funkci T(x) = S(x — xo). JestUže je I ,\; p poloměr konvergence 5, bude T dobře definovaná ■ "*• -~ri^ na intervalu (xo — p, xo + p). Říkáme, že T je mocninná řada se středem v xo. Mocninné řady proto můžeme přímo definovat takto: 5(x) = ^a„(x-x0)" kde xo je libovolné pevně zvolené reálné číslo. Všechny naše předchozí úvahy jsou pořád platné, jen je třeba mít na paměti, že se vztahují k bodu xo. Zejména tedy taková řada konverguje na intervalu (xo — p, xo + p), kde p je její poloměr konvergence. Dále platí, že má-li mocninná řada y = T (x) hodnoty v intervalu, kde je dobře definována řada S(y), potom i hodnoty funkce 5 o T jsou vyjádřeny mocninnou řadou, kterou dostaneme formálním dosazením y = T (x) za y do S(y). (2) Jakmile máme k dispozici mocninné řady s obecným středem, lze docela přímočaře počítat koeficienty mocninných řad 285 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ s maximálním definičním oborem sudá? 5.143. Rozhodněte, zdaje funkce (a) y = sin x ■ ln | x |; (b) y = arccotgx; (c) y = x8 - iflx6 +3x2-6; (d) y = cos (jí — x); Cel v - 'gx+x W y — 3+7 cosi s maximálním definičním oborem lichá, sudá. 5.144. Je funkce (a) y = ln (cos x) ; (b) v = tg (3x) + 2 sin (6x) s maximálním definičním oborem periodická? O zadávajících inverzní funkce. Nebudeme zde uvádět seznam formulí, snadno se k nim dostaneme například v Maplu procedurou „series". Pro ilustraci se podívejme alespoň na dva příklady: Viděli jsme, že e* = 1 + x + \^ + 7*3 + xt*4 + ■ ■ ■ ■ 2 6 24 Protože je e° = 1, budeme hledat pro inverzní funkci ln x mocninnou řadu se středem v x — 1, tj. ln* = a0+a\(x-l)+a2(x-l)2 +a3(x-l)3 +a4(x-l)4 +____ Využijeme tedy rovnosti x — eln x — \n(sx) a přeskupením koefi-Q cientů podle mocnin x po dosazení příslušných řad dostaneme: O 5.145. Nakreslete grafy funkcí /(x) = e|x|, xeK; g(x) ■■ 5.146. Načrtněte graf funkce y = 2-1*1, ln|x|, xeK\{0}. O x e O 5.147. Hyperbolickými funkcemi rozumíme sinhx tghx 2 sinhx x e x e coshx cotghx eř + e x 2 ' coshx x e x e \ {0}. coshx sinhx Stanovte derivace těchto funkcí na jejich definičních oborech. O 5.148. V libovolném bodě x e K vypočítejte derivaci argumentu hyperbolického sinu, tj. derivaci inverzní funkce (značené jako argsinh) k funkci y = sinh mat. O Poznámka. Inverzní funkce k hyperbolickým funkcím y = cosh x, x e [0, +oo), y = tghx, x e May = cotghx, x e (—oo, 0)U(0, +oo) se nazývají hyperbolometrické (řadíme k nim rovněž y = argsinh x). Označují se po řadě argcosh, argtgh, argcotgh (čteme argument hyperbolického kosinu, argument hyperbolického tangens, argument hyperbolického kotangens) a jsou definovány pro x e [l,+oo), x e (— 1,1), resp. x e (—oo, —1) U (1, +oo). Dodejme, že platí (argcosh x)' = 1 , x > 1, \fx z —1 (argtgh x)' = |x| 1. x — ao + / 1 2 1 3 1 a\\x + -xí + -x5 H-- V 2 6 24 •«.-(» ... j ■-1 2 tj. napište á(e)-předpis jako v minulém příkladu. O 5.155. Ukažte z definice limity, že O o o o o o 288 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.161. Určete lim (vjí! + x — x) 5.162. Stanovte lim (xJl+^-x2). 5.163. Vypočítejte V2 — Vl + cosx lim-,-. *->■<> sin" x 5.164. Určete sin (4x) lim -o V*+T - i 5.165. Spočtěte Vl + tgx - V1 - tg* lim -. jc->o- sin x 5.166. Stanovte 2X + Vl + x2 - x9 - lŕ + 44X2 lim --====-. <^-~ 3* + V6;r + x2 - 18x5 - 592a4 O O O O O O 5.767. Nechť lim;t^_0O fix) = 0. Je pravda, že lim;t^_0o(/(.y) • g(x)) = 0 pro každou rostoucí funkci g : K K? O 5.i<5& Určete limitu / \ 2ří~i lim ( -1— ) O 5.76~9. Spočítejte sin x — x lim -5-. o 5.170. Pro x > e určete znaménko derivace funkce lnx fix) = arctg ——-—. — 1 + ln x O 5.171. Stanovte všechna lokální maxima a minima funkce y = x ln2 x definované na intervalu (0, +oo). O 5.172. Existuje a e K, pro které má funkce y = ax + sin x v bodě x0 = 5jt/4 absolutní minimum na intervalu [0, 2jt]? O 289 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.173. Nalezněte absolutní minimální hodnotu, jež v nějakém bodě svého definičního oboru nabývá funkce y = e x — lnx, x > 0. O 5.174. Určete maximální hodnotu funkce y = ^ixt~x, O 5.175. Stanovte absolutní extrémy polynomu pix) = x3 — 3x + 2 na intervalu [—3, 2], O 5.176. Nechť je uražená vzdálenost (v metrech) hmotného tělesa popsána funkcí s(t) = -(/ - 3)2 + 16, r e [0,7], kde / je čas v sekundách. Stanovte (a) počáteční (tj. v čase / = 0 s) rychlost tělesa; (b) čas a polohu, ve kterých má těleso nulovou rychlost; (c) rychlost a zrychlení tělesa v čase / = 4 s. Doplňme, že rychlost je derivace dráhy a zrychlení je derivace rychlosti. O 5.177. Z definice derivace /' funkce / v bodě x0 spočtěte /' pro fix) = ^fx v libovolném bodě x0 > 0. O 5.178. Rozhodněte o existenci derivace funkce fix) = x arctg-, iel \ {0}, /(O) = 0 x v bodě x0 = 0. O 5.179. Má funkce (/ ecos(i+2)-i3\ \ arctg I I I2x21 —I— lil--— I I + sm(sin(sin(sinx))), x € K derivaci v bodě x0 = ji3 + 311? O 5.180. Zjistěte, jestli má funkce /(x) = (x2-l)sin-L, jjí-lfjeR), /(-1) = 0 derivaci v bodě x0 = — 1. O 5.181. Udejte přiklad funkce / : K —► K, která je spojitá na celé reálné ose, ale v bodech x\ = 5, x2 = 9 nemá derivaci. O 5.182. Uvedie funkce / a g, které nemají derivaci v žádném reálném bodě, ale jejich kompozice / og má derivaci na celé reálné přímce. O 5.183. Pomocí základních vzorců spočtěte derivaci funkce (a) y = (2 — x2) cos x + 2x sinx, (b) y = sin (sin x) , (c) y = sin (ln (x3 + 2x)) , x e (0, +oo); i+j-j2 l-x+x2 290 (d)y = j&, xe KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ O 5.184. Libovolným způsobem určete derivaci funkce (a) y = ^x y1 x *Jx, x e (0, +oo); (b) y = ln |tg f | , \ {nit; n e Z}. O 5.185. Napište derivaci funkce y = sin (sin (sin*)), iěI. O 5.186. Pro funkci fix) = arccos ^ + i/x3 s největším možným definičním oborem vypočítejte /' na maximální podmnožině reálných čísel, kde tato derivace existuje. O 5.187. V libovolném bodě x £ [nit; n € 1) určete první derivaci funkce y = i/sinx. O 5.188. Pro iéI derivujte výraz x^/l + x2 + ď (x2 -2x + 2). 5.189. Vyčíslete /'(l), je-li fix) = ix-l)ix-2)2ix-3)3, x€ O O 5.190. Stanovte derivaci funkce o 5.191. Derivujte (v reálné proměnné x) x ln2 (x + Vl +*2) - 2Vl + x2 ln (x + Vl + x2^j + 2x všude, kde derivace existuje. Obdržený výraz zjednodušte. O 5.192. Určete /' na maximální množině, jestliže fix) = logx e. O 5.193. Vyjádřete derivaci součinu čtyř funkcí [fix)gix)hix)kix)] ' ve tvaru součtu součinů daných funkcí či jejich derivací za předpokladu, že všechny tyto funkce mají derivaci. O 291 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.194. Uvedie derivaci funkce _ x3 (x + 1)2V*T2 y~ (x + 3)2 pro x > 0. O 5.195. Vrtulník dálniční hlídky letí 3 km nad rovnou silnicí rychlostí 120 km/h. Pilot zaměří radarem auto jedoucí proti směru letu vrtulníku a naměří, že auto se při vzdušné vzdálenosti 5 km od vrtulníku k němu přibližuje rychlostí 160 km/h. Spočítejte rychlost auta (vůči předmětu pohozenému na vozovce). Řešení. Pro jednoduchost budeme v celém příkladu vynechávat fyzikální jednotky, a to kilometry pro dráhu a hodiny pro čas (rychlost tedy bude v km/h). Pozici vrtulníku v čase / vyjádřeme bodem [y(t), 3] a auta potom bodem [x(t), 0]; tj. 1 jednotka na osách odpovídá 1 km a současně osy volíme tak, aby „auto jelo po ose x". Jako s(t) označme vzdušnou vzdálenost vrtulníku od auta a jako t0 ten časový okamžik, ze kterého jsou údaje v zadání. Spočtěme rychlost auta vzhledem k předmětu umístěnému do počátku soustavy souřadnic. Můžeme předpokládat, že x(t) > y(t) > 0. Za tohoto předpokladu je x' (t) 5 0,/ (/) > 0 pro uvažovaná /. Auto se totiž blíží k bodu [0, 0] zprava-hodnota x(t) se zmenšuje pro zvětšující se /, a tudíž x' (t) < 0. Podobně dostáváme / (/) > 0 a také s' (t) < 0. Ještě dodejme, že např. / (/) udává, jak rychle se mění funkce y v čase /, tedy rychlost vrtulníku. Víme, že je í(/o) = 5, /(/o) = -160, /(/o) = 120 a že platí (s(t) je přepona pravoúhlého trojúhelníku) (5.1) (x(t)-y(t))2 + 32 = s2(t). Odtud plyne (x(t) > y(t) > 0) (x (t0) - y (t0))2 + 32 = 52, tj. x (to) - y (to) = 4. Derivováním identity (||5.11|) získáváme 2(x(t)-y(t)) (*'(/)-/(0) =2sW(t) a následně pro t = to 2 ■ 4 (xf (to) - 120) = 2 • 5 • (-160), tj. xf (t0) = -80. Vypočítali jsme, že auto se blíží k předmětu na vozovce rychlostí 80 km/h. Stačí si uvědomit, s jakými jednotkami jsme pracovali. To, že jsme jako výsledek obdrželi zápornou hodnotu, je pak zapříčiněno naší volbou souřadnicového umístění. □ 5.196. Do rovnoramenného trojúhelníku o základně z a výšce v (nad základnou) vepište obdélník (jedna jeho strana bude částí základny trojúhelníku) s největším obsahem. Stanovte obsah S tohoto obdélníku. Řešení. Pro vyřešení příkladu postačuje uvažovat úlohu, kdy se snažíme vepsat do pravoúhlého trojúhelníku s odvěsnami délek z/2 a v obdélník s maximálním možným obsahem, přičemž dvě jeho strany musí být částmi odvěsen tohoto trojúhelníku. Úlohu takto převedeme na otázku maximalizace funkce proměnné x (délka strany hledaného obdélníka): f(x) = x(v-2-f) na intervalu / = [0, z/2]. Neboť je f'(x) = v — — pro všechna x e I 292 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ a dále /(O) = /(§) = 0, f{x) > 0, x € I, v jediném svém stacionárním bodě x0 = z/4 nutně nabývá funkce / maxima na /. Proto jsou strany hledaného obdélníku dlouhé z/2 (dvojnásobek x0: uvažujeme původní úlohu) au/2 (to lze získat dosazením z/4 za x do výrazu v — 2vx/z). Odsud dostáváme, že S = vz/4. □ 5.197. Mezi obdélníky, jejichž dva vrcholy leží na ose x a další dva s kladnými druhými souřadnicemi na parabole y = 8 — 2x2, najděte obdélník s maximálním obsahem. Řešení. Základna obdélníku s maximálním obsahem měří 4/V3, jeho výška pak 16/3. Tento výsledek lze obdržet nalezením absolutního maxima funkce Six) = 2x(S-2x2) na intervalu / = [0,2]. Neboť tato funkce je na / nezáporná, v krajních bodech / nulová a má derivaci na celém /, přičemž její derivace je nulová pouze v jednom bodě intervalu /, a to v bodě x = 2/V3, nabývá zde maximální hodnoty. □ 5.198. Pro jaká a e K je kubický polynom P vyhovující vztahům P (0) = 1, P'iO) = 1, P(l) = 2a + 2, P'(l) = 5a + 1, monotónní funkcí na celém K? Řešení. Z podmínek P(0) = 1 aP'(0) = 1 plyne, že Pix) = bx3 +cx2 +x + 1, kde b, c e K, zbylé dvě podmínky určují dvě rovnice pro neznámé bac: b+c+2 = 2a+2,3b+2c+1 = 5a+1 s jediným řešenímfc = c = a,polynomy vyhovující zadaným vztahům jsou tedy tvaru Pix) = ax3 +ax2+x+l, a € K. Podmínka na to, aby byl monotónní funkcí na celém K, je ekvivalentní tomu, že polynom nemá lokální extrém. Extrémy mohou nastat v kritických bodech, tedy v bodech, kde jeho derivace mění znaménko. Pokud tedy derivace nebude na celém K měnit znaménko, funkce bude monotónní. Derivace je P'ix) = 3ax2 + 2ax + 1 a nebude měnit znaménko, bude-li její diskriminant nekladný. Dostáváme tedy podmínku 4a2 - 12a < 0, 4a(fl - 3) < 0, což odpovídá a e [0, 3]. Pro a = 0 však P sice je monotónní funkcí, nikoliv však kubickým polynomem. Dané podmínky splňují právě a e (0, 3]. □ 5.199. Regiomontanův problém, 1471. V muzeu na stěně visí obraz. Jeho dolní okraj je a metrů nad zemí a horní okraj pak b metrů nad zemí (tj. výška obrazu je b — a). Na obraz se dívá turista, jehož oči jsou ve výšce h < a metrů nad zemí. (Důvodem nerovnosti h < a může např. být, že se tak dá umožnit výhled stejně vysokým návštěvníkům muzea stojícím v několika řadách.) Jak daleko od stěny má turista stát, aby maximalizoval velikost svého úhlu pohledu na obraz? 293 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Řešení. Jako x označme vzdálenost (v metrech) turisty od stěny a jako

Mze postupovat analogicky a že pro h e [a, b] se zřejmě úhel

0 pro x e (O, j (b - h) (a - h)j , f (x) < 0 pro * e (y (b - h){a - h), +00J . Funkce / má proto globální maximum v bodě x0 = *J(b — h) (a — h) (připomeňme nerovnosti h < a < b). Určit bod x0 lze samozřejmě i jinými způsoby. Můžeme např. místo hledání maxima kladné funkce / na intervalu (0, +00) pomocí diferenciálního počtu hledat globální minimum funkce g(x) = 7h = *2+(b-h)(°-h) =-r^ + Ě^a_h) (Q } 0 v ' f{x) x{b—a) b—a x(b—a) ' v ' ' využitím tzv. A-G nerovnosti (mezi aritmetickým a geometrickým průměrem) ^>^yTň, ynyi>o, ve které rovnost nastává právě pro yi = y2. Volba totiž dává g(x) = yi(x) + y2(x) > 2 y'y1(x)y2(x) = ^ J(b - h) (a - h). Pokud tak existuje x > 0, pro které je y\(x) = y2(x), má funkce g v bodě x globální minimum. Rovnice = tj. Ä = ít^41, má jediné kladné řešení x0 = *J{b — h)(a — h). Dvěma odlišnými způsoby jsme stanovili ideální vzdálenost turisty od stěny. Hodnotě x0 odpovídá W = arCtS x2+ Q 0339 8 ~ 195 — '° dokládá, jak výrazně má otec lepší výhled. □ 5.200. Halleyova úloha, 1686. Hráč stojí před basketbalovým košem ve vzdálenosti / od obroučky, ^> která je ve výšce h nad bodem odhodu. Určete minimální počáteční rychlost i>o, kterou musí udělit míči, aby skóroval, a příslušný elevační úhel

o. Řešení. Opět vynecháváme fyzikální jednotky: můžeme předpokládat, že údaje o vzdálenostech jsou uváděny v metrech a časové údaje v sekundách (rychlosti pak v metrech za sekundu). Nechť hráč hodí míč v čase / = 0 a nechť míč projde obroučkou v čase t0 > 0. Pozici míče (během jeho letu) vyjádříme body [x(t), y(t)] pro / e [0, t0], přičemž požadujeme, aby x(0) = 0, y(0) = 0, *(ío) = y(t0) = h. 295 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Zřejmě je x' (t) = vo cos o, pro kterou bude existovat

) =0, tj. t 2Vn 2hVn tg2^--^tg^ + —^ + 1=0. gl S12 Z poslední rovnice (kvadratické rovnice pro neznámou p = tg 0. Také nyní nám substituce (tentokráte q = Dg) umožní přejít ke kvadratickému výrazu (na levé straně nerovnice) a následně získat 296 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ („g _ g \h + VP+T]) (w02 - s [h - Vž?Tp]) > o. Protože h < ^Jh1 + P, musí být v20 > g [h + VPTŕ], tj. y0 > +VPTŕ]. Nejmenší přípustné hodnotě (5.5) v0 = ]jg[h + Vh2 + P] potom odpovídá (viz (||5.4||)) v2 h + ^JW+F . h + ^JW+F (5.6) Xgip = —- =---, tj.

—^ = y. Tím jsme ukázali, že při počáteční rychlosti uvedené v (||5.5||) může hráč koš dát. Při trestném hodu, kdy hráč odhazuje míč ve výšce 2 m, je h = 1,05 m, /= 4,225 m, g = 9,80665 m • s~2, a tudíž minimální počáteční rychlost míče činí v0 9,80665 [l,05 + 7(1,05)2 + (4,225)2] m • s"1 7,28 m-s"1. Této rychlosti odpovídá úhel "o2

o. Podle obrázku je 2/3 + (ji - a) = it a a + y = f, 297 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ odkud vyplývá a n y ^ ~ 2 ~ 4 ~ 2' Platí tedy Obdrželi jsme, že elevační úhel při hodu s minimální energií je aritmetickým průměrem pravého úhlu a úhlu pohledu na obroučku (z pozice míče). Problém stanovení minimální nutné rychlosti odhazovaného míče vlastně vyřešil Edmond Halley už v roce 1686, když určil minimální potřebné množství střelného prachu k tomu, aby vystřelená dělová koule mohla zasáhnout cíl na výše položeném místě (např. za hradbami). Halley dokázal (tzv. Halleyovo kalibrační pravidlo), že pro zasažení cíle v bodě [/, h] při střelbě z pozice [0, 0] je potřeba stejné minimální množství prachu jako pro zasažení horizontálního cíle ve vzdálenosti h + y?h2 + P (při úhlu

) coszio / jr\ = °2 . 9 9 ' , ■

v\ sin ^ cos (p Stačí ověřit, že u2 sin 2^ — 2gR(o = lim - arccos —z-= - arccos 0 = — rad = 45 h^o+2 vl + gh 2 4 míček dopadne do největší vzdálenosti R ( 0, a proto jsme si mohli pomoci příslušnou jednostrannou limitou. □ 5.202. Snellův zákon. Určete lomený světelný paprsek mezi bodem A v homogenním prostředí s rychlostí šíření světla «i a bodem B v homogenním prostředí s rychlostí šíření světla v2. Řešení. V celém příkladu nebudeme uvádět fyzikální jednotky: můžeme kupř. předpokládat, že údaje o vzdálenostech budou v metrech a rychlosti v\, v2 jsou v metrech za sekundu (čas bude vyjádřen v sekundách). Paprsek je určen principem minimálního času, kdy k přenosu energie elektromagnetickým vlněním mezi body A a B dochází takovým způsobem, aby se odehrál v co nejkratším čase. V homogenních prostředích bude paprsek úsečkou. Stačí tedy stanovit bod R (určený hodnotou x), kde dojde k lomu. Vzdálenost mezi body A a. R činí ^Jh\ + x2 a mezi body RaB pak ^Jh\ + (d — x)2. Celková doba přenosu energie mezi body A a S je tak dána funkcí T(x) = v proměnné x e [0,d\. Zdůrazněme, že chceme nalézt bod x e [0, d], ve kterém je hodnota T(x) minimální. 301 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Derivace r (x) v\ ^jh2x+x2 D2 ^jh\+(d-x)2 je spojitou funkcí na intervalu [0, d], a proto o znaménku derivace můžeme snadno rozhodnout pomocí jejích nulových bodů. Z rovnice T'(x) = 0, jednoduchou úpravou dostáváme i>l ^]h\+x2 D2 ^Jh\+(d-x)2 Jh2+(d-x)2 Tento tvar je pro nás užitečný, neboť (viz obrázek) sin^i = -j-Z—, sin ^2 — d~x jh2+x2 ^h2+(d-x)2 Existuje tudíž nejvýše jeden stacionární bod; a ten je určen vztahem siniBi Di (5.10) -t-^ = —. sin 0, existuje právě jeden stacionární bod x0. Z nerovností T'(x) < 0 pro x e [0, x0) a T'(x) > 0 pro x e (x0, d] již plyne, že ve stacionárním bodě x0 je globální minimum. Shrňme předchozí. Paprsek je zadán bodem lomu R (hodnotou x0) a bod R je potom určen identitou (||5.10||), která se ve fyzice označuje jako Snellův zákon. Podíl rychlostí «i a v2 je pro uvedená homogenní prostředí konstantní a vyjadřuje důležitou veličinu, jež popisuje rozhraní optických prostředí. Nazývá se index lomu a značí se n. Obvykle se požaduje, aby první z prostředí bylo vakuum, tj. klade se v\ = c a v2 = v, se ziskem (absolutního) indexu lomu n = c/v. Pro vakuum je n = 1. Také pro vzduch se používá n = 1, neboť při standardních podmínkách (tj. při tlaku 101 325 Pa, teplotě 293 K a absolutní vlhkosti 0,9 gm~3) je pro vzduch n = 1,000272. U ostatních prostředí se uvádí n > 1 (např. se klade n = 1,31 pro led, n = 1,33 pro vodu, n = 1,5 pro běžné sklo). Index lomu ovšem rovněž závisí na vlnové délce uvažovaného elektromagnetického vlnění (kupř. pro vodu a světlo se jedná o rozsah od n = l,331ažporc = 1,344), kdy index lomu zpravidla klesá s rostoucí vlnovou délkou. Rychlost světla v optickém prostředí s indexem lomu n > 1 totiž závisí na frekvenci světla. Hovoří se o tzv. disperzi světla. Právě disperze světla způsobuje, že se paprsky světla různých barev lámou pod různými úhly. (Nejvíce se láme paprsek fialového světla a nejméně paprsek světla červeného.) To je mj. příčina vzniku duhy. Můžeme dále vzpomenout slavný Newtonův pokus se skleněným jehlanem (optickým hranolem) z roku 1666. Na závěr ještě doplňme, že naše úloha měla vždy řešení, protože jsme mohli volit bod R libovolně. Pokud by byl s rychlostmi v\ a v2 zadán také úhel r = arcsin^, z něhož již plyne / sin (f>i \ (5.11) a = 4arcsin - — 2(pt. \ n ) Pro paprsky vycházející z kapky je hodnota a odlišná. Konkrétní přípustné hodnoty a však nejsou rozloženy rovnoměrně. Je-li R poloměr kapky a y udává vzdálenost bodu A od horizontální roviny procházející středem kapky, platí (5.12) smVi = ^ pro y e [0, R]. Samozřejmě můžeme předpokládat (vzhledem k výrazné vzdálenosti Slunce), že množství sluneční energie pro y e [a — S, a + S] nezávisí na a e [á, R — S], ale závisí pouze na velikosti uvažovaného rozsahu hodnot y pro dostatečně malá S > 0. Má tak smysl analyzovat funkci (viz (||5.11||)a(||5.12||)) a(y) = 4arcsin^ — 2arcsin j, y e [0, R]. Volbou vhodné jednotky délky (pro kterou je R = 1) přejdeme k funkci a(x) = 4arcsin^ — 2arcsinji;, x e [0,1]. Po výpočtu derivace ď(x) = -^== - x € (0, 1), /i x2 VI— * n V--2 snadno určíme, že rovnice a'(x) = 0 má jediné řešení x0 = e (o, i), pokud n2e(l,4). Položme n = 4/3 (což je přibližně index lomu pro vodu). Dále je 303 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ a'(x) > 0, x € (0,xo), a'(x) < 0, x e (xq, 1). Zjistili jsme, že v bodě = 0, 86 má funkce a globálni maximum a(x0) = 4 arcsin ^ - 2 arcsin |^| = 0,734 rad ^ 42 °. Přestože je zajímavé, že vrchol duhy nemůže být nad úrovní přibližně 42 ° vůči tomu, kdo ji pozoruje, ještě zajímavější jsou vyčíslení a(0,74) = 39,4°, a(0,94) = 39,2°, a(0,8) = 41,2°, a(0,9) = 41,5 °. Ta totiž implikují (funkce a roste na intervalu [0, x0] a klesá na intervalu [x0, 1]), že více než 20 % hodnot a leží v úzkém pásu zhruba od 39 ° do 42 ° a 10 % v pásu o šířce menší než 1 °. Pokud navíc uvážíme např. a(0,84) = 41,9°, a(0,88) = 41,9 °, vidíme, že paprsky, pro které je a blízké hodnotě 42 °, mají nej větší intenzitu. Vyzdvihněme, že se jedná o případ tzv. principu minimální odchylky, kdy platí, že k největší koncentraci rozptýleného světla dochází právě u paprsků s minimální odchylkou. Celková úhlová odchylka paprsku se totiž rovná úhlu S = ji — a. Kapky, ze kterých směřují paprsky k pozorovateli vidícímu duhu, tak leží na povrchu kuželu s centrálním úhlem 2a(xo). Nadzemní část tohoto kuželu se pak jeví pozorovateli právě jako kruhový oblouk duhy. Při západu Slunce by tedy měla duha tvar půlkružnice. Uvažte také, že duha se realizuje vzhledem k pozorovateli - není nikde v prostoru. Na závěr poznamenejme, že onen kruhový tvar duhy podrobně zdokumentoval již René Descartes, který duhu vědecky zkoumal v letech 1635-1637. □ 5.204. L'Hospitalova kladka. Ke stropu je v bobě A uvázáno lano délky r. Na jeho druhém konci je připevněna kladka. Ve §,, vzdálenosti d (v bodě B) od bodu A je ke stropu přivázáno druhé lano délky / > Vd2 +r2, které prochází kladkou. Na tomto druhém laně je zavěšeno závaží. V jaké pozici se závaží v ustálí (systém přejde do stacionární polohy)? Při řešení úlohy zanedbejte hmotnost i velikost lan a kladky. 304 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Řešení. Systém bude ve stacionární poloze, pokud bude minimalizována jeho potenciální energie, tj. vzdálenost závaží od stropu fix) bude maximální. To však znamená, že pro r > d se kladka pouze přesune pod bod B. Nadále proto budeme předpokládat, že r < d. Podle Pythagorovy věty je vzdálenost kladky od stropu Vr2 — x2 a vzdálenost kladky a závaží je l-y/(d- x)2 + r2 - x2 , coz dává fix) = sir2 - x2 + l - vV - x)2 + r2 -x2 . Poloha systému je zcela popsána hodnotou x e [0, r] (viz obrázek), a tudíž stačí najít globální maximum funkce / na intervalu [0, r]. Nejprve spočítáme derivaci f(x) — -*__-(d-x)-x _ -x , d x e (0 r) Jy> vV-*)2+r2-*2 vV-*)2+r2-*2' -lfc^''-'- Umocnění rovnice fix) = 0 pro x e (0, r) vede na X2 _ d2 r2-x2 (d-x)2+r2 -x2 ' Vynásobením obou stran výrazem (r2 — x2) (id — x)2 + r2 — x2) pak (po úpravě) dostaneme 2dŕ - (2ef +r2) x2 +d2r2 = 0, x e (0, r). Všimneme-li si, že jedním z kořenů polynomu na levé straně je zřejmě x = d, snadno převedeme poslední rovnici do tvaru (x-d) (2dx2 -r2x-dr2) = 0, x e (0,r), resp. (pro kvadratickou rovnici máme vzorec) 2dix-d)(x-^^l)(x-Č^l)=0, xe(0,r). Odsud vidíme, že rovnice fix) = 0 má v intervalu (0, r) nejvýše jedno řešení. (Neboť je r < d a Vr2 + Sd2 > r, dva kořeny uvažovaného polynomu v proměnné x určitě v intervalu (0, r) neleží.) Zbývá rozhodnout, zda _ r2+ryr2+&d2 X° - Ad ^[z + yÔf + š]e(0,r). Když však uvážime, že r, d > 0 a r < d, snadno získáme 0 < xo < \ r [l + VF+Š] = r. Vzhledem ke spojistosti funkce /' na intervalu (0, r) může dojít ke změně jejího znaménka pouze v bodě xo. Z limit lim fix) = jJ=, lim fix) = -oo 1^0+ Vír+r2 i-*r- takjiž vyplývá, že fix) > 0, x e (0, xo), fix) < 0, x e (x0, r). Funkce / má proto globální maximum na intervalu [0, r] v bodě x0. □ 5.205. Nejmenovaná poštovní společnost má ve svých podmínkách uvedeno, že délka jí přepravo- N\^v váného balíku nesmí být větší než 108 palců a že součet jeho délky a maximálního obvodu 'At?o nesmí přesáhnout hodnotu 165 palců. Nalezněte balík největšího objemu, který podle svých 9 podmínek společnost může doručit. 305 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Řešení. Nechť M označuje hodnotu 165 in (tj. palců) a x délku balíku (v palcích). Hledaný balík bude mít zřejmě takový tvar, že jeho průřez pro libovolné / e (0, x) bude mít stejný (ten maximální) obvod, který (rovněž vyjádřen v palcích) budeme značit jako o. Chceme, aby balík měl maximální objem, a tudíž aby průřez daného obvodu měl maximální obsah. Není obtížné si uvědomit, že rovinný útvar, který má při daném obvodu maximální obsah, je kruh. Tím jsme dospěli k závěru, že hledaný balík největšího objemu má tvar válce o výšce x a poloměru podstavy r = o/2tí. Jeho objem je přičemž musí být o + x < M a také x < 108 in. Uvažujme proto balík, pro který je právě o + x = M. Ten má objem V(X) = = *3-^2+m^ ^ kde xe((u08]. Spočítáme-li derivaci r{x) = ^-amx+ml = ^^ZŽl, x e (o, 108), snadno zjistíme, že funkce V roste na intervalu (0,55] = (0, M/3] a klesá na intervalu [55, 108] = [M/3, min {108, M}]. Největší objem tak dostáváme pro x = M/3, přičemž v(f) = 27J = 0,011 789 M3 ^ 0,867 8 m3. Pokud by společnost v přepravních podmínkách požadovala, aby měl balík tvar kvádru, příp. jistého hranolu, můžeme předchozí úvahy zopakovat pro daný průřez o obsahu S, aniž bychom specifikovali, jak tento průřez vypadá. Stačí si uvědomit, že nutně S = ko2 pro jisté k > 0, které je právě určeno tvarem průřezu. (Když se pouze změní velikost mnohoúhelníku, jenž je průřezem, tak se změní ve stejném poměru také jeho obvod. Obsah se však např. zdevítinásobí při trojnásobné velikosti - trojnásobném obvodu.) Objem balíku je tedy funkcí V(x) = Sx = ko2x = k (M — x)2 x, x e (0, 108]. Konstanta k neovlivňuje bod, kde je globálni maximum funkce V, a proto toto maximum nastává opět pro x = M/3. Např. pro nejobjemnější kvádr s podstavou čtverce je o = M — x = 2M/3, tj. délka strany jeho podstavy je a = M/6 a objem potom y = a2x = ^ = 0,009 259M3 ^ 0,6816 m3. Pro balík ve tvaru koule, kdy je x průměrem, podmínku o + x < M můžeme ihned přepsat do tvaru Jtx + x < M, tj. x < M/(jt + 1) < 108 in. Pro x = M/(ir + 1) tak získáváme maximální objem V = U (f)3 = --^4t3 = 0,007370M3 ^ 0,5426m3. Podobně pro balík ve tvaru krychle, kdy x udává délku hrany, podmínka o + x < M znamená, že x S M/5 < 108 in. Takže pro x = M/5 dostáváme maximální objem V = x3 = (f )3 = 0,008 M3 m 0,588 9 m3. Ještě doplňme, že krychle, která má stejný objem jako nalezený válec, má délku hrany a = -!£== 0,227 595 M ^ 0,953 849 m. Uvědomme si, že pro ni je součet její délky a obvodu roven 5a = 1,138M, tj. o bezmála 14% překračuje hodnotu stanovenou společností. □ 306 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.206. Rozlehlý vojenský prostor (nadále zkráceno na VP) s půdorysem čtverce o rozloze 100 km2 je kolem dokola ohraničený úzkou cestou. Z výchozího místa v jednom rohu VP se lze dostat do cílového místa uvnitř VP tak, že se jde 5 km po cestě a poté 2 km kolmo k ní. Ovšem můžete jít libovolnou dobu po cestě rychlostí 5 km za hodinu a potom šikmo přes VP rychlostí 3 km za hodinu. Kolik (kilo)metrů musíte jít po cestě, abyste došli na místo určení co nejdříve? Řešení. K tomu, abychom po cestě ušli x km, přičemž x e [0, 5], potřebujeme x/5 hodin. Naše cesta přes VP pak bude měřit V"22 + (5 - x)2 = V*2 - 10* + 29 kilometrů a ujdeme ji za *Jx2 — 10x + 29/3 hodin. Celkem bude naše cesta trvat fix) = \x + \s/x2 - 10* + 29 hodin (připomeňme, že x e [0, 5]). Jediný nulový bod funkce /'O) 1,1 x-5 5 3 je x = 7/2. Protože derivace /' existuje v každém bodě intervalu [0, 5] a protože /(!) = § 2 km/h? Jak dlouho Vám bude cesta trvat? Řešení. Optimální strategie j e zřejmě dána tím, že dorazíte ke břehu v jistém bodě [0,x] pro x e [0,/] a poté budete běžet podél břehu do cílového místa [0, /] (viz obrázek), kdy je tedy trajektorie složena ze dvou úseček (příp. z jedné pro x = ľ). Doplout ke břehu v bodě [0, x] Vám bude trvat hodin a běh po pobřeží pak l-x u2 hodin. Jde o to, aby celkový čas byl minimální, tj. je potřeba minimalizovat funkci tix) 307 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ na intervalu [0, l\. Navíc lze předpokládat, že v\ < v2. (Pro ui > v2 je nepochybně nejrychlejší veslovat přímo k cílovému místu, čemuž odpovídá x = /.) Nejprve vypočítáme první derivaci ť(x): a poté druhou Dále vyřešíme rovnici Jejím umocněním obdržíme Jednoduchá úprava tak již dává t"(x) iWír+i2 »2' _ ě ť(x) = 0, tj. - tj. X = x € (0, 0, x € (0, l). 'ífi+x2 "2' Uvědomme si, že uvažujeme pouze x e (0,1). Zajímá nás proto, zdaje < /, po úpravě — < , ' „ . Pokud je tato nerovnost splněna, je rovněž vx < v2 a funkce ť mění znaménko pouze v bodě XQ ■ -m2 e (0,0, a to ze záporného na kladné (uvažte lim;t^o+ f (x) < 0 a f (x) > 0, x e (0, ľ)). To znamená, že v tomto případě je v bodě x0 globálni minimum funkce / na intervalu [0, l]. Jestliže nerovnost (||5.207||) splněna není, pak je ť (x) < 0 pro všechna x e (0, ľ), odkud plyne, že globální minimum funkce / na [0, l] je v pravém krajním bodě (funkce / je na svém definičním oboru klesající). Nejrychlejší cesta tedy bude trvat (v hodinách) Id2 +4 i_XQ 1 ' t(x0) v2 í^fd2 ^ \ 1 (Sľ 1 v2 l ■ \ ^-fe) ^i-(-) dvjjl 00 + lvi d J v2 - v2 1 v\v2 v\v2 v2 platili (115.20711), a / (/) =-hodin, "i když (115.20711) neplatí. □ 308 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.208. Firma hledá obdélníkovou parcelu o rozměrech 5a x b se záměrem ji po obvodu celou oplotit a pak ještě ploty kolmými na první stranu rozdělit na 5 stejně velkých parcel o rozměrech a x b. Pro jaké hodnoty a, b bude rozloha parcely S = 5ab maximální, má-li být celková délka plotů 2400 m? Řešení. Přeformulujme zadání: Chceme maximalizovat součin 5ab při splnění podmínky (5.13) 6b + 10a = 2400, a, b > 0. Lehce lze ukázat, že funkce definovaná pro a e [0, 240] nabývá maximální hodnoty v bodě a = 120. Proto je výsledek a = 120 m, b = 200 m. Doplňme, že uvedená hodnota b bezprostředně plyne z (||5.13||). □ 5.209. Do rovnostranného trojúhelníka o straně a je vepsán pravoúhelník (jedna jeho strana leží na straně trojúhelníka, zbylé dva vrcholy leží na zbylých stranách trojúhelníka). Jaký může mít maximálně obsah? O 5.210. Zvolte rozměry otevřeného bazénu se čtvercovým dnem o objemu 32 m3 tak, aby na natření jeho stěn a dna bylo potřeba nejmenší množství barvy. O 5.211. Číslo 28 rozložte na 2 nezáporné sčítance tak, aby součet druhé mocniny prvního sčítance a třetí mocniny druhého sčítance byl minimální. O 5.212. Pomocí první derivace nalezněte reálné číslo a > 0, pro které je součet a + l/a minimální. Poté tuto úlohu řešte bez použití diferenciálního počtu. O 5.213. Vepište do půlkruhu o poloměru r obdélník s největším možným obvodem. Uvedie jeho obvod. O 5.214. Existuje-li mezi obdélníky o obvodu 4c obdélník s maximálním obsahem, stanovte délky jeho stran. O 5.215. Zjistěte výšku v a poloměr podstavy r nejobjemnějšího kužele, který se vejde do koule o poloměru R. O 5.216. Ze všech trojúhelníků s konstantním obvodem o > 0 vyberte ten, jenž má největší obsah. O 5.217. Na parabole 2r —2y = 9 najděte body s minimální vzdáleností od počátku soustavy souřadnic. O 5.218. Vaším úkolem je vyrobit jednolitrovou plechovou konzervu „obvyklého" tvaru rotačního válce tak, aby na její výrobu bylo potřeba co nejméně plechu. Určete správný poměr mezi její výškou v a poloměrem podstavy r. O 5.219. Určete vzdálenost bodu [3, -1] e I2 od paraboly y = x2 — x + 1. O 5.220. Určete vzdálenost bodu [-4, -2] e K2 od paraboly y = x2 + x + 1. O 5.221. V čase / = 0 vyjelo auto z bodu A = [5, 0] rychlostí 4 jednotky za sekundu směrem (—1, 0). Ve stejném čase vyjelo druhé auto z bodu B = [—2, —1] rychlostí 2 jednotky za sekundu směrem (0, 1). Kdy si budou auta nejblíže a jaká bude tato vzdálenost? O 309 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.222. V čase/ = 0 vyjelo auto z bodu A = [0, 0] rychlostí 2 jednotky za sekundu směrem (1, 0). Ve stejném čase vyjelo druhé auto z bodu B = [1, —1] rychlostí 3 jednotky za sekundu směrem (0,1). Kdy si budou auta nejblíže a jaká bude tato vzdálenost? O 5.223. Určete maximální možný objem kužele o povrchu 3jt cm2 (do povrchu kužele počítáme i obsah podstavy). Povrch kužele spočítáme jako P = itr(r + v), objem jako V = |itr2 v, kde r je poloměr podstavy a v výška kužele. O 5.224. O dům je opřený žebřík dlouhý 13 stop. Náhle základna žebříku podklouzne a žebřík začne sjíždět k zemi (stále zůstává opřený o dům). Když je základna žebříku 12 stop od domu, klouže od něj rychlostí 5 stop/s. Jak rychle v tomto okamžiku (a) klesá vršek žebříku po zdi; (b) se mění obsah trojúhelníku vymezeného žebříkem, domem a zemí; (c) se mění úhel, který svírá žebřík se zemí? O 5.225. Předpokládejte, že vlastníte dostatek finančních prostředků bez možnosti investovat mimo svou továrnu s působností na cenově regulovaném trhu s takřka neomezenou poptávkou a omezeným přístupem k některým klíčovým surovinám, což Vám umožňuje produkovat nejvýše 10 000 výrobků denně. Víte, že pro hrubé výnosy v a náklady n jako funkce proměnné x, udávající v tisících průměrný počet výrobků vyrobených za den, platí v(x) = 9x, n(x) = ŕ - 6x2 + I5x, x e [0, 10]. Při jakém objemu výroby budete mít z Vaší továrny nej větší zisky? O 5.226. Určete lim I cotg*-- x^0 \ X Řešení. Uvědomíme-li si, že je lim cotg* = +oo, lim — = +oo, x^0+ x^0+ X lim cotg* = —oo, lim — = — oo, x->0- x^0- X vidíme, že v případě obou jednostranných limit dostáváme typ oo — oo. Můžeme tedy uvažovat najednou oboustrannou limitu. Funkci kotangens zapíšeme jako podíl kosinu a sinu a zlomky převedeme na společného jmenovatele, tj. / 1 \ x cos x — sin x lim I cotg*--I = lim-. i^oy x) x^o xsinx Obdrželi jsme výraz 0/0, pro který platí (podle 1'Hospitalova pravidla) xcosx —sinx cos* — x sinx — cos x —xsinx lim-= lim-= lim *o xsmx x^o sin x + x cos x i^o smi +icosi Druhým použitím 1'Hospitalova pravidla pro typ 0/0 pak již dostaneme —x sin x — sin x — x cos x 0 — 0 lim-= lim-=-= 0. i->o smx + x cosx i^o cosx + cosx — x sinx 1 + 1—0 □ 310 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.227. Určete limitu linwi_(l-*)tgf-. O 5.228. Stanovte lim (.J - *tg ■ 5.229. Pomocí 1'Hospitalova pravidla určete ä((3í-2íM 5.230. Vypočtěte 1 1 lim i V 2 ln x x2 - 1 5.231. Užitím 1'Hospitalova pravidla spočtěte limitu lim I cos — x^+oo \ x 5.232. Vypočtěte lim (1 - cosjc)si x^O 5.233. Určete následující dvě limity O o o o o lim x1", lim x^, přičemž a € M je libovolné. O 5.234. Libovolným způsobem ověřte, že je Hm^ = l. x->0 X o 5.235. Aplikací podílového (tzv. ďAlembertova) kritéria (viz 5.47) určete, jestli nekonečná řada co , (a) L 2^±i)i; n = l co n = l co n = l konverguje. Řešení. Protože (a„ > 0 pro všechna ri) (a) iim s*. = um ^'-f^ = lim = lim g = \ < 1; n^oo n^co 3"+'-2"-(n+l)3 „^oo 3(" + 1'3 n^co 3"J 3 (b) lim ^ = lim (7^ ■£)= lim 4r = 0 < 1; 311 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ (c) lim ^ = lim (. |"+2T"ni • ^) = lim t4uí ■ lim ^ = 1™ 4 • lim (1 + i)" = 1 - e > 1, řada (a) konverguje; (b) konverguje; (c) nekonverguje (diverguje k +oo). □ 5.236. Aplikací odmocninového (tzv. Cauchyova) kritéria určete, jestli nekonečná řada oo ^ (a) E ln"(n+l) ' ři=l (b) E n=\ co (c) Earcsin"f konverguje. Řešení. Opět máme řady s nezápornými členy, přičemž je (a) lim "/oT = lim , , 1 ., = 0 < 1; K ' - - V n - -t ln(ři+l) ' řl^OO (b) lim ýä~^ = lim V- = --3 = f < 1; (c) lim = lim arcsin = arcsin 0 = 0 < 1. ,~ ,~ 2" To znamená, že všechny zadané řady konvergují. □ 5.237. Rozhodněte, zda řada 00 (a) E(-l)" ln(l + £); (-2)"' (b) E (c) y (-3)" ^ (6+(-l)T ři=l konverguje. Řešení. Případ (a). Podle 1'Hospitalova pravidla je ln(1+_L) , lim ——- = lim ——,—w-= lim —— = 1, a proto platí 0 < ln (1 + i) < £ pro všechna dostatečně velká n e N. Ovšem o řadě E^i 2^ vmle> že je konvergentní. Musí tak být 5>(l + £) <+oo, tj. řada v zadání konverguje (absolutně). Případ (b). Podílové kritérium dává lim I 2*1 I = lim = lim 2ͱ1 = lim 2£ = +OG. Řada tedy nekonverguje. Případ (c). Nyní použijeme obecnou verzi odmocninového kritéria lim sup ý\an I = lim sup 6+(3_1}„ = | < 1, z níž plyne (absolutní) konvergence řady. □ 312 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.238. Libovolným způsobem dojděte k rozhodnutí o konvergenci alternující řady oo (a) E(-l)" (3n-2)2 ' řl=l /K\ i i\n-l 3ři4-3řiJ+9ři-l W l^K i-) (5řJ3_2).4" ' Řešení. Případ (a). Z toho, že je lim ait^ = lim |i = I ^ 0, n^oo (3n-2)2 9n2 9 T~ ihned vyplývá neexistence limity lim (—])" "2+3"-l Řada tudíž nekonverguje (není splněna nutná podmínka konvergence). Případ (b). Viděli jsme, že při použití podílového (nebo odmocninového) kritéria polynomy v čitateli ani jmenovateli členů řady neovlivňují hodnotu počítané limity. Uvažujme tedy řadu oo Eí-i)""1^, pro kterou je lim p±i = \ < 1. 1 4 To ovšem znamená, že rovněž původní řada je (absolutně) konvergentní. □ 5.239. Konverguje řada oo £(-l)"+1arctg^? Řešení. Posloupnost j 2/-Jlm \ je zřejmě klesající a funkce y = arctg x rostoucí (na celé reálné ose), a tudíž posloupnost I arctg (2/V3n) \ je klesající. Je tedy zadána alternující řada splňující, že posloupnost absolutních hodnot jejích členů je klesající. Taková alternující řada konverguje, právě když posloupnost jejích členů konverguje k 0 (tzv. Leibnizovo kritérium), což je ovšem splněno: lim arctg -4= = arctg 0 = 0, tj. lim ((-l)"+1arctg 4=) = 0. □ 5.240. Zjistěte, jestli řada oo (a) E W> (b) Y. £2ff1 n=l konverguje absolutně, příp. neabsolutně (relativně), nebo nekonverguje. Řešení. Případ (a). Ukázat, že tato řada konverguje absolutně, je snadné. Např. je oo oo oo £l^l<£á<££ = 2, ři=l ři=l ři=0 přičemž druhou nerovnost jsme dokázali dříve. Případ (b). Je vidět, že cos (irn) = (—l)",n € N. Máme tedy alternující řadu, jejíž posloupnost členů v absolutní hodnotě je klesající. Proto z limity lim 4= = 0 již plyne, že řada konverguje. Zároveň však je 313 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ T "Ä! = v i > v I = +00. „til 3? I „ti ^? - „tí" Řada tak konverguje neabsolutně. oo 5.241. Jaký je součet řady E ři=2 Řešení. Z nerovností (uvažte graf přirozeného logaritmu) 1 < lnrc < n, n > 3, n e K plyne y/l < \Íín~ň < ^/ň, n > 3, n e N. Podle Věty o třech limitách je lim \f\äň = 1, tj. lim -=== = 1. Řada tedy není konvergentní. Neboť má nezáporné členy, musí divergovat k +oo. 5.242. Rozhodněte o následujících řadách, jestli konvergují či divergují: oo n=\ co u) E -r co ^ iií) fj.2100000 □ □ iv) Zjéř Řešení. i) Budeme zkoumat konvergenci podílovým kritériem: 2(n + 1) 2»+l lim = lim řl^OO a„ řl^OO : lim 2 > 1, řada tedy diverguje. ii) Odhadneme řadu ze spodu: víme, že pro libovolné přirozené n platí i < -J=. Pro posloupnost částečných součtů í„ zkoumané řady a posloupnost částečných součtů harmonické řady íj, tedy platí: n ^ 71 1 í=i í=i A protože harmonická řada diverguje (viz předchozí příklad), diverguje i její posloupnost částečných součtů {^n}^L\, tedy diverguje i posloupnost částečných součtů {sn}^L\, tedy diverguje i zadaná posloupnost. iii) Diverguje, jedná se o násobek harmonické řady. iv) Jedná se o geometrickou řadu s koeficientem j^j, ta bude konvergovat, bude-li absolutní hodnota koeficientu menší než 1. Víme, že , 1 1 - i , 1 1 1 1 V2 - + - = — < 1, 4 4 2 1 + i1 1 2 1 12 2 1 řada tedy konverguje a umíme ji dokonce sečíst: 1 1 1 + í S(1 + !')" 1-TÍT 1 - i. 314 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ □ 5.243. Do čtverce o délce strany a > 0 je vepsán čtverec, jehož strany jsou spojnicemi středů stran zadaného čtverce. Do vepsaného čtverce je stejným způsobem vepsán další čtverec atd. Stanovte součet obsahů a součet obvodů všech těchto (nekonečně mnoha) čtverců. O 5.244. Nechť je dána posloupnost řádků půlkruhů, přičemž v rc-tém řádku je 2™ půlkruhů o poloměru 2~™ pro každé n e N. Jaký bude obsah libovolného obrazce složeného ze všech těchto půlkruhů, když nebudou umístěny přes sebe? O 5.245. Vyřešte rovnici 1 -tgx + tg2* -tg3x+tg4x-tg5x + --- = ^ffij . O 5.246. Určete O 5.247. Sečtěte CO Y, 5Vn2 + 2n + l. n = \ O 5.248. Dokažte konvergenci a nalezněte součet řady oo 3"+2" 2-, 6" • n=\ O 5.249. Stanovte součet řady co (a) E n=\ co (b) E n=0 O 5.250. Sečtěte CO J- + J- + J- + ... = T _!_ 1-3 T 3-5 T 5-7 T (2n-l)(2n+l) ■ ři=l O 5.257. Pomocí rozkladu na parciální zlomky vyčíslete co co ^ (b) I] «3+3^2+2^ ■ řl=l 315 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.252. Sečtěte konvergentní řadu ^ 4n2-l ' n=0 5.253. Určete součet řady ^ n2+3n ' ři=l 5.254. V závislosti na s : vyjádřete součty řad y- (-i)"-1 =1_I,I_I + I_I + I_I + . Z^ „ 1 2 T 3 4 T 5 6 T 7 8 T 5.255. Zjistěte, zda řada n=0 ři=l ři=2 5.260. Najděte všechna reálná čísla A > 0, pro která řada co YJ(-l)" ln(l + A2") O o o 2 4; 1 V3 6 (i+i-i)+a+7-i)+-- které z výše uvedené řady vznikly přerovnáním (tj. změnou pořadí členů). O konverguje. O 5.256. Dokažte následující tvrzení: Jestliže řada Eí^o a" konverguje, pak je lim sin (3a„ + ji) = 0. O 5.257. Pro jaké ael; f3 e Z; j/ e K \ {0} konvergují řady CO CO co E ^ £ £ O n=120 n=240 n=360 5.25& Rozhodněte, zda řada oo „ , ( j^rc -5fi°+2fi n=21 2 konverguje absolutně, konverguje neabsolutně (relativně), nebo nekonverguje. O 5.259. Zjistěte, jestli je limita lim (i + \ + ■ ■ ■ + S1) vlastní. Upozorněme, že k tomu nelze využít součtů O 316 KAPITOLA 5. ZŘÍZENI ZOO FUNKCI konverguje. O 5.261. Zopakujme, že harmonická řada diverguje; tj. platí oo V i = +00. t-^ n Rozhodněte, zda také řada 1 T 9 T 11 T T 19 T 21 T T 29 T ..._|__L_|_..._|__L_|_J--u . . . -|--?--1--?--V ■ ■ ■ 91 T 99 T 111 T T 119 T 121 T diverguje. O 5.262. Udejte příklad divergentních číselných řad YlT=i a»> 12T=-i b" s kladnými členy, pro které řada YlT=i (3a„ — 2bn) absolutně konverguje. O 5.263. Zjistěte, zda jednotlivé řady ; (2n)!' 2^ V V „8+2„6+„ ři=l ři=l konvergují absolutně, konvergují neabsolutně, či nekonvergují. O 5.264. Konverguje řada 00 v- v- , ři=l O 5.265. Nalezněte hodnoty parametru p e M, pro které řada co E(-l)" sin" f konverguje. O 317 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ Řešení cvičení 5.2. P(x) = (-§ - ^i)x2 + (2 + 3í)-v - | - 5.11. 3a2 - 2a - 4. 5.12. (2a2 - 5) /3; např. (f a2 - í)3. 5.73. a = 1, b = -2, c = 0, = 1. 5.14. a3 + a2 - a + 2. 5.75. Nekonečně mnoho. 5.16. P(x) = a3 - 2a2 + 5a - 3; 0(a) = a3 - 2a2 + 3a - 3. 5.17. a5 -2a4 -5a +2. 5.75. a2 . 5.19. a3 -2a+ 5; a3 - a + 6. 5.20. Nekonečně mnoho. 5.27. Např. a2 - 3a + 6. 5.22. Si (a) = \ (a + l)3 - \ (a + D- H,iě [-1,0];52(a) = M a3 + 5 a2, a s [0, 1] 5.23. 5i(a) = Í(a + 1)3-|(a + D- H,iě [-1,0];52(a) = -Ia3 + 5 a2, a e [0, 1] 5.24. 5i(a) = a; 52(a) = a. 5.25. 5i(a) = 1;52(a) = 1. 5.26. Si (a) = a + 3, a e [-3 + í - 1, -3 + í];í e {1,2). 5.27. 5i (a) = 1 - ii a + i a3 ; S2(a) = $-§(*- 1) + íjj (* D3. 5.29. sup A = 6, inf A = -3; 1 supi? = -. inf B = -1; sup C = 9, inf C = -9. 5.30. Lehce lze ukázat, že 3 sup A = -, inf A = 0. 5.37. Zřejmě je infN=l, supyV1 = 0, míj = 0, sup J = 5. 5.32. Lze položit kupř. M ■- Z \ N; TV := N. 5.33. Uvažte jakoukoli jednoprvkovou množinu XcR 5.34. Množina C musí být jednoprvková. Nechť je tedy např. C = {0}. Nyní můžeme zvolit A = (—1, 0), B = (0, 1). 5.40. Platí / 1 2 n-2 h - 1 \ / n n - 1 \ 1 lim — + -= + • • • + —5- + —t- = lim — • —— = -. n^oo \n- n1- nA n- 1 n-*oo \nz 2 / 2 5.47. Snadno lze ukázat, že Vn3 - lln2 + 2+ v//;7 - 2n5 - n3 - n - lim -r-=^- 2 - VŠTr + 2n3 + 5 318 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.42. Limita je rovna 1. 5.43. Kupř. lze položit -n + 1, n e N. 5.44. Správná odpověď je ±1. 5.45. Výsledek je lim sup a„ = 1. lim inf an —0. 5.46. Platí lim inf ((-ir(i + i)" 72 5.63. Uvedená funkce je spojitá na celém R. 5.64. V bodech —ji, 0, ji je spojitá; v bodě 2 je spojitá pouze zprava a v bodě 3 pouze zleva; v bodě 1 není spojitá ani z jedné strany. 5.65. Je nutné položit /(O) :— 0. 5.66. Funkce je spojitá právě pro p — -. 5.67. Správná odpověď je a = 4. 5.68. Je sin8 x sin8 x lim —r— = lun —5— = 0. x^0+ X5 x^-co xi 5.71. Jediné řešení x — — 1. 5.72. Ano. 5.76. f'(x) = 2aj" t-1 -In x (cotg x — ln (sina)) 5.77. (sinx)'- 5.79. | - 0,003. 5.80. a rí | +0,01; rí 4,125. 5.«i.(a)^-^;(b)^ + ^. 5.S5. Ano, má. 5.55. y = 74 (x + 1); y = (.t + 1). 5.56. y = 2x 5.57. y - ¥ = (|Ž -¥)(*- D; y - ¥ Ax -1). f; n : y = -6.t + 15; ■3 í + 11 5.90. jj/4. 5.91. y = 2 - x; y = x. 5.92. Nerovnosti plynou např. z Věty o střední hodnotě (tzv. Lagrangeovy věty) aplikované na funkci y = ln (1 +/),/ e [0,*]. 5.114. r = +oo. 319 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.115. 1. 5.116. 3. 5.117. [-1, 1]. 5.118. x e [2- i, 2 + f]. 5.119. Ano. 5.120. (a) Platí. (b) Neplatí. (c) Neplatí. (d) Platí. 5 717 1__2__i__2_ 1 1Q22 -t- 104 4,. 5.122. Chyba náleží do intervalu (0, 1/200). 5-123. E^^-lľ-íE^o^J". J.Í24. /(x) = x, x e K; ano. J.Í2J. Nikoli. 5.126.(a)l-^ + ^;(b)±-jy. Jln+l 5.127. J2T=0 (2n+l)n! J.Í28. a > 1. J.Í29. [-^2,^2). J.iJO. Pro x e [-1, 1]. J.iJi. x > 2. 5.132. Konverguje absolutně. 5.133. In (3/2). 5.135. (a) I ln j±f; (b) 5.Í56. 2/9. 5.Í57. xeT. J.iJS. K. 5.Í59. (l,e]. 5.140. (-co, f) U (f, +co); (-00, -i) U (-i, +co); y = x -i. 5.141. (a) ano; (b) ne; (c) ne; (d) ne; (e) ano; (f) ano; (g) ano; (h) ne. 5.142. (a) ne; (b) ne; (c) ano; (d) ano; (e) ne; (f) ne; (g) ne; (h) ano. 5.143. Lichá funkce je uvedena ve variantách (a), (e); sudá v (c), (d). 5.144. Je periodická s primitivní periodou (a) In; (b) n/3. 5.145. Funkce f a g jsou sudé - k vykreslení jejich grafů tak postačují grafy funkcí y = ex, x e [0, +00) a y = lnx, x e (0, +00). 5.146. Zadaná funkce je sudá, a proto k načrtnutí jejího grafu stačí znát graf funkce y = 2X, x e (—00, 0], 5.147. (sinhx)' = coshx; (coshx)' = sinhx; (tghx)' = c(Jh2x > (cotghx)' = — sh^2x ■ 5.148. 5.150. x4 + 2x3 - x2 + x - 2. 5.151. x4 + 2x3 - 2X2 + x + 2. 5.152. x4 + 3x3 - 3X2 - x - 1. 320 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.153. Pro každé £ > 0 stačí £-okolí bodu —2 přiřadit S-okolí bodu 0 předpisem £ H» S, S — £, přičemž bez újmy na obecnosti lze požadovat, aby e < 1. Pokud by totiž bylo £ > 1, lze položit 8 = 1. 5.154. Existence limity a rovnost ,. (l+x)2-3 3 lim -= — x-,-1 2 2 např. opět plyne z volby S := £ pro £ e (0, 1). 5.155. Neboť — (x — 2)4 < x pro x < 0, dostáváme 3 (x — 2)4/2 > — x pro x < 0. 5.Í56. Neboť 1 71 l 71 lim arctg — = —, lim arctg — =--, 1^0+ X 2 1^0- AT 2 uvažovaná oboustranná limita neexistuje. 5.157. První z limit je rovna +oo, druhá neexistuje. 5.158. Limitu lze spočítat více způsoby. Nabízí se např. tg x — sin x í tg x — sin x cotg x lim--.-= lim — *->■<> suť* i^0\ suť* cotg* 1 — COSJC 1 — cos X lim-;— = lim ■ x-?o cosx ■ sin2x x-?o cosx (1 — cos2x) 1 1 = lim x->0 cos x (1 + cos x) 2 5.159. Platí 2 sin3 jc + 7 sin2 x + 2 sin x — 3 sin* + 1 lim -5-;-= lim -= —3. 2 sin3 x + 3 sin2 x - 8 sin* + 3 x^it/6 smx - 1 5.160. Je x™ - 1 m lim -= —. x->l x" - 1 n 5.161. Po rozšíření výrazem lze lehce dostat J.Í52. Platí 5.Í65. Je V*2 +* + * Vjc2 + jc + jc lim (\fx?~-\~x — x) = —. x^+oo \ / 2 lim (* Vl +x2 - x2) = i. i^+oo V / 2 V2- ^/^+~čoš7 V2 lim-t.-= —. x^o sin x 8 5.164. Rozšířením zlomku ze zadání je možné obdržet sin (4x) lim ■ >o Ví + l - l 5.Í65. Platí Vl+tgx-vT^ti lim - i-*0- sin* 321 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.166. Zřejmě j e 2X + Vi +x2 -.v9 - iŕ + 44a2 7 lim ---— —. x^-ao y + V6a6 +a2 - 18a3 - 592a4 18 5.167. Výrok není pravdivý. Uvažte kupř. fix)---, xei-oo.O)- gix): x 5.168. 5.169. lim n^co \n + 5 / sin a — a 1 lim »0- XJ 6 5.170. f (x) < 0, a > e. 5.171. V bodě Ai = e-2 nabývá zadaná funkce lokálního maxima a v bodě x2 — 1 potom lokálního minima. 5.172. Neexistuje: pro a — \p2/2 nastává v daném bodě pouze lokální extrém. 5.173. 2 = eI- ln I. 5./74. 4=. 5./75. 4 = p (-1) = p (2), -16 = /> (-3). 5./7Ä. (a) u(0) = 6m/s; (b) ř = 3s, s(3) = 16m; (c) i>(4) = -2m/s, a(4) = -2m/s2. 5.177. f {x0) = ^. 5.178. Derivace neexistuje: jednostranné derivace, a to ti/2 (jednostranná derivace zprava) a — n/2 (jednostranná derivace zleva), se nerovnají. 5.179. Ano. 5.180. Nikoli. 5.181. fix) :=|a-5| + |a - 9 |. 5.182. Např. f — g pro funkci / definovanou tak, že v racionálních bodech nabývá hodnoty 1, zatímco v iracionálních hodnoty — 1. 5.183. (a) x2 sinx; (b) cos (sin*) ■ cos .v; (c) cos (ln (a3 + 2a) ); (d) J_\~^2)2- 5.184. (a)|A-š;(b) cosec.v = 5.185. cos a • cos (sin a) • cos (sin (sin a)). 5.186. fix) = . 1 , + 1, a e f 1 - V2, 1 + V2). yl+2;t — xl V / 5.Í87. 3 V sin2 x 5.188. l+2xz 5.189. -8. 5.191. ln2 (a + Vl +a2), x e M. 5.792. /'(a) = -I (log, e)2, a > 0, a / 1. 5.193. [fix)gix)hix)kixj\ ' = fix)giX)hiX)kix) + /(*)g'(*)&«*(*) + fix)gix)h'ix)kix) + + fix)gix)hix)k'ix). 322 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.194. x1 (x+l)23x+2 /3 (x+3): \x + 2 x+\ + 3(i+2) 2 i+3 ) 5.209. Vepsaný pravoúhelník má strany x, V3/2(a — x), tedy obsah V3/2(a — x)x. Maximum pro x — a/2, 5.210. 4mx4mx2m. 5.211. 28 = 24 + 4. 5.212. a = 1. 5.213. 2 VŠ r. 5.214. Jedná se o čtverec (s délkou strany c). 5.215. v — ÍR, r — h^R. 5.216. Největší obsah V? o2/36 má rovnostranný trojúhelník. 5.217. [2, -1/2], [-2, -1/2]. 5.218. v = 2r. 5.219. Nejbližší bod [1, 1], vzdálenost 2VŽ 5.220. Nejbližší bod [-1,1], vzdálenost 3VŽ 5.221. t = 1, 5í, vzdálenost VŠ jednotek. 5.222. V čase / = -f-j s si budou auta nejblíže a to jednotky. 5.223. P = nrv + jrr2 => ľ = P~^2 =!> ^ = tK-P — ^r2). Extrém r = 1/37 > dosazením do objemu tedy maximální obsah je (V3/8)a2. V = ^f cm3. 5.224. (a) 12ft/s; (b) -59, 5ft2/s; (c) -1 rad/s. 5.225. Při produkci zhruba 3414 výrobků denně. 5.226. Trojnásobné použití ľHospitalova pravidla dává lim x->0- 6 5.227. 2/ti. 5.228. lim í — — jej tg* = 1. 5.229. 5.230. 1/2. 5.25i. Platí 5.232. Dvojnásobnou aplikací ľHospitalova pravidla lze obdržet lim (1 -cos*)sini =e° = 1. 5.233. V obou případech je výsledek e". 5.234. Limitu lze snadno určit např. pomocí 1'Hospitalova pravidla. 5.244. jt/2. 5.245. x = f + kn, x = ^ + kn, k e Z. 323 KAPITOLA 5. ZŘÍZENÍ ZOO FUNKCÍ 5.246. 5. 5.247. +co. 5.248. 3/2. 5.249. (a) 3; (b) 9/4. 5.250. 1/2. 5.251. (a) 3/4; (b) 1/4. 5.252. -1/2. 5.255. 11/18. 5.254. s/2; 3s/2 (s = ln 2). 5.255. Konverguje. 5.256. Postačuje uvážit nutnou podmínku konvergence lim^co an — 0. 5.257. a > 0; p e {-2, -1, 0, 1, 2); y e (-oo, -1) U (1, +co). 5.258. Konverguje absolutně. 5.259. Limita je rovna 1/2. 5.260. A e [0, 1). 5.261. Součet uvedené řady je konečný - řada konverguje. 5.262. Např. a„ = n/3, bn = n/2, n e ľi. 5.263. První řada konverguje absolutně; druhá neabsolutně. 5.264. Ano. 5.265. pel. 324 KAPITOLA 6 Diferenciální a integrální počet zvěřinec teď máme, ale co s ním? - naučíme se s ním zacházet... A. Derivace vyšších řádů Nejprve zavedme konvenci, jak značit derivace vyšších řádů: druhou derivaci funkce / jedné proměnné budeme značit /" nebo /(2), derivace od třetího řádu výše pak pouze f(3\ f(4\ f(n\ Na připomenutí ale zahájíme trochu rafinovaným příkladem „pouze" na první derivace. 6.1. Derivujte výraz ■sVx^-T ■ (x + 2)3 e.*(x + 132)2 proměnné x > 1. Řešení. Úlohu vyřešíme pomocí tzv. logaritmické derivace. Nechť je / libovolná kladná funkce. Víme, že je [In/(*)]': /'(*) /(*)' tj. /'(*) = /(*)-[In/(*)]', V minulé kapitole jsme si postupně hráli buď s mimořádně velikými třídami funkcí — všechny spojité, všechny diferencovatelné apod. — nebo jen s konkrétními funkcemi — např. exponenciální, goniometrické, polynomy atd. Měli jsme ale přitom minimum nástrojů a vše jsme počítali tak říkajíc na koleně. Z kvalitativního pohledu jsme jen naznačili, jak využívat znalost lineárního přiblížení funkce její derivací k diskusi lokálního chování takové funkce kolem daného bodu. Teď dáme dohromady několik výsledků, které umožní snáze pracovat s funkcemi při modelování reálných problémů. Pomocí derivování jsme se naučili zaznamenávat velkosti okamžitých změn. V této kapitole se vyrovnáme i s úlohou, jak sčítat nekonečně mnoho takových „nekonečně malých" změn, tj. jak „integrovat". Nejdříve si ale uděláme více jasno o derivacích. V poslední části kapitoly se vrátíme k řadám funkcí a doplníme přitom i několik chybějících krůčků v naší dosavadní argumentaci. 1. Derivování 6.1. Derivace vyšších řádů. Jestliže má první derivace f'(x) re-_rgpr álné nebo komplexní funkce / v bodě xq derivaci \.-t)í/, (f')'(xo), říkáme že existuje druhá derivace funkce /, resp. derivace druhého řádu. Píšeme pak /"(xo) = (/')'Oo) nebo také /(2)Oo). Funkce / je dvakrát diferencovatelná na nějakém intervalu, jestliže má druhou derivaci v každém jeho bodě. Derivace vyšších řádů definujeme induktivně: ___j /c—KRÁT DIFERENCOVATELNÉ FUNKCE |___ Reálná nebo komplexní funkce / je (k + l)-krát diferencovatelná v bodě xo , pro nějaké přirozené číslo k, jestliže je &-krát diferencovatelná na nějakém okolí bodu xq a její k-tá derivace má v bodě xo derivaci. Pro k-tou derivaci funkce f(x) píšeme (x). Pro k — 0 rozumíme 0-krát diferencovatelnými funkcemi funkce spojité. Jestliže existují derivace všech řádů na intervalu, říkáme, že je tam funkce / hladká. Pro funkce se spojitou k-tou derivací používáme označení třída funkcí (ý (A) na intervalu A, kde k může nabývat hodnot 1, 2, ..., oo. Často píšeme pouze (ý, je-li definiční obor znám z kontextu. pokud derivace f'(x) existuje. Užitečnost tohoto vzorce je dána tím, že pro jisté funkce je jednodušší derivovat jejich logaritmus než je samé. Píšeme také C° (A) nebo C(A) pro funkce spojité na množině A. Jde-li o interval, píšeme bez závorek, např. C[a, b]. KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Takový je právě výraz v zadání. Dostáváme totiž ifx~^l ■ (x + 2)3 ex (x + 132)2 &(x + 132)2 ex (x + 132)2 yi^r ■ (x + 2)3 r i ----=--31n(jc + 2) + - In (x - 1) -x lne - 2 In (x + 132) eI(x + 132)2 L 4 i/I^l ■ (x + 2)3 f 3 1 . 2 e*(* + 132)2 ■ + x+ 2 4(x -1) x + 132 □ 6.2. Určete následující derivace: i) ix2 ■ sin*)", ii) (x1)", iv) (x")(n), v) (sin*)*"'-Řešení. (a) (x2 -sin x)" = (2x sinx +x2 cos x)' = 2 sinx +4x cosx — x2 sinx. (b) (x1)" = [(1 + lnx)xx]' = xx-1 +xx(l + hix)2. (C) (^\(3) - _!___6_ (d) (jť1)*"' = [(jť1)']*"-1' = (říje"-1)*"-1' = ...=«!. (e) (sin*)*™' = re(i™ sinx) + im (i" cosx). □ 6.3. Nechť n e N je libovolné. Najděte n-tou derivaci funkce -y = lnj±i, *€(_!,!). Řešení. Vzhledem k vyjádření ln i±* = ln (1 + x) - ln (1 - x) , x e (-1, 1) zavedeme pomocnou funkci f(x):=ln(ax + l), x e (-1, 1), a = ±1. Pro x e (—1, 1) lze snadno (postupně) vypočíst /'« = ^ • = (m+1)2 ' J W — (ax+1)1 ' f (4) ,Vl - Na základě těchto výsledků můžeme usoudit, že r„i (-1)"_1(« - l)!a" (6.1) fin)(x) =x ' J—, x e (-1,1), n e N. (ax + 1)™ Správnost tohoto vzorce ověříme matematickou indukcí. Protože pro n = 1, 2, 3,4 platí, zbývá ukázat, že z jeho platnosti pro k e N plyne jeho platnost pro k + 1. Neboť přímý výpočet dává f(k+V(r\ _ / -!)! 0 má právě k komplexních kořenů včetně násobností a můžeme jej vždy psát jednoznačně ve tvaru f(x) = b(x-air -(x-agY", kde b e C, b ^ 0, a\,..., aq jsou všechny kořeny polynomu / a 1 < ci, ..., cq < k jsou jejich násobnosti (tj. přirozená čísla). Derivací f(x) jakožto funkce reálné proměnné x dostaneme fix) = bciix - ai)c'-\ ..ix- aqf« +■■■ + + bcqix -ai)Ci...ix -aq)c«-x. Jestliže je c\ — 1 a kořen a\ je reálný, bude hodnota derivace /' vboděai nenulová, protože první člen výrazu je nenulový, zatímco všechny zbývající po dosazení hodnoty x — a\ íyíúií. Obdobně to bude i s ostatními kořeny. Ověřili jsme tedy užitečnou vlastnost, že reálný kořen a polynomu / je vícenásobný tehdy a jen tehdy, 326 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Odtud již dostáváme výsledek (]nfé)« = (B_l)1(^_í=12r) pro x e (-1,1) an e N. □ 6.4. Určete druhou derivaci funkce y = tg x na celém jejím definičním oboru, tj. pro cos x ^ 0. O 6.5. Stanovte pátou a šestou derivaci polynomu p (x) = (3x2 + 2x + 1) • (2x - 6) • (2x2 -5x + 9), O 6.6. Bez počítání uvedie 12. derivaci funkce y = e2* + cosx + xw - 5x7 + 6x3 - llx + 3, xel. O 6.7. Napište 26. derivaci funkce f(x) = sinx + x23 - xm + 15xn - 13x8 - 5x4 - llx3 + 16 + e2* pro iěI. O Ukažme si ještě některé zajímavé příklady na užití diferenciálního počtu. Nejprve však zmiňme Jensenovu nerovnost, která hovoří o konvexních, resp. konkávních funkcích a kterou dále využijeme. 6.8. Jensenova nerovnost Pro ostře konvexní funkci / na intervalu I a pro libovolné body x\,..., xn e la reálná čísla c\,..., cn > 0 taková, že c\ + • • • + c„ = 1, platí □ / £cř*ř <£cř/(*ř), v=i / i=l přičemž rovnost nastane, právě když je x\ = ■ ■ Řešení. Důkaz lze nalézt v literatuře. Poznámka. Jensenovu nerovnost lze zformulovat i více intuitivně: těžiště hmotných bodů umístěných na grafu ostře konvexní funkce leží nad tímto grafem. 6.9. Dokažte, že mezi všemi (konvexními) rc-úhelníky vepsanými do kružnice má nej větší obsah právě pravidelný n -úhelník (pro libovolné n > 3). l&acPuvažovat n-úhelníky, uvnitř kterých leží střed kružnice. Každý takový n -úhelník vepsaný do dané kružnice o poloměru r rozdělíme podle obrázku na n trojúhelníků s obsahy 5,, i € {1,..., n). Vzhledem k tomu, že když je zároveň kořenem jeho derivace /'. (Toto tvrzení si časem rozšíříme i na všechny komplexní kořeny.) 6.3. Význam druhé derivace. Již jsme viděli, že první derivace funkce je jejím lineárním přiblížením v okolí daného bodu a že ze znaménka nenulové derivace vyplývá, že funkce je v bodě xq rostoucí nebo klesající. Body, ve kterých je první derivace nulová se nazývají kritické body nebo také stacionární body dané funkce. i Je-li xo stacionární bod funkce /, může být chování funkce / v okolí bodu xq jakékoliv. Vidíme to již z chování funkce f(x) = xn v okolí nuly pro libovolné n. Pro lichá n > 0 bude f(x) rostoucí, pro sudá n naopak bude nalevo klesající a napravo rostoucí, dosáhne tedy v bodě xq své minimální hodnoty mezi body z (dostatečně malého) okolí bodu xq = 0. Tentýž pohled můžeme aplikovat na funkci /'. Jestliže totiž je druhá derivace nenulová, určuje její znaménko chování derivace první. Proto v kritickém bodě xq bude derivace f'(x) rostoucí při kladné druhé derivaci a klesající při záporné. Jestliže je ale rostoucí, znamená to, že nutně bude záporná nalevo od kritického bodu a kladná napravo od něj. Funkce / v takovém případě je klesající nalevo od kritického bodu a rostoucí napravo od něj. To znamená, že má funkce / v bodě xq minimum ze všech hodnot z nějakého malého okolí bodu xq. Naopak, je-li druhá derivace záporná v xq, je první derivace klesající, tedy záporná vlevo od xq a kladná vpravo. Funkce / bude tedy mít v bodě xq maximální hodnotu ze všech hodnot na nějakém okolí. Funkce diferencovatelná na (a, b) a spojitá na [a, b] má jistě na tomto intervalu absolutní maximum a minimum. Může ho dosáhnout pouze buď na hranici nebo v bodě s nulovou derivací, tj. v kritickém bodě. Pro diskusi extrémů nám tedy mohou stačit kritické body a druhé derivace pomůžou určit typy extrémů, pokud jsou nenulové. Pro přesnější diskusi ale potřebujeme lepší než lineární aproximace zkoumaných funkcí. Proto se nejprve budeme věnovat úvahám v tomto směru a teprve poté se vrátíme k diskusi průběhu funkcí. 6.4. Taylorův rozvoj. Jako překvapivě jednoduché využití ^ ., Rolleovy věty teď odvodíme mimořádně důležitý výsledek. L«J^ Říkává se mu Taylorův rozvoj se zbytkem. Intuitivně se AiÄ k němu můžeme dostat obrácením našich úvah kolem íi1 mocninných řad. středem v bodě a, Máme-li totiž mocninnou řadu se i e {1, S(*) = £>„(*-*)", n=0 a derivujeme-li ji opakovaně, dostáváme mocninné řady (víme, že je možné takový výraz derivovat člen po členu, i když jsme to ještě 327 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET platí Si = xí hi = r2 sin y cos — = j r2 sin^,-, í € {1,..., n}. Odsud plyne, že obsah celého n-úhelníku je n n S = E si = \ r2 E sin E £ smW- \i=l / i=l Navíc víme, že rovnost nastává právě pro ^i = vyjádříme (s pomocí (||6.2||)) S = T1 Ž ^ sinp,- < sin (£ ; 0), obvod se také zvětší a-krát a obsah a2-krát (jde o plošnou rníru). Takže IQ nezávisí na velikosti obrazce, nýbrž pouze na jeho tvaru. Uvažujme proto pravidelný n-úhelník vepsaný do jednotkové kružnice. což dává vyjádření pro jeho obvod o = n ■ x = 2n sin - " n i obsah S„ = n ■ i hx = n cos - sin -. "2 n n Pro pravidelný n-úhelník tak je 4nn cos ^ sin ^ IQ 4n2 s -cotg^, což můžeme ověřit kupř. pro čtverec (n = 4) s délkou strany a, kdy máme Aitá1 IQ (40, ^€(0,2), /'W<0, ^e(2,27r). Funkce / tedy nabývá maximální hodnoty pro (po = 2 a při středovém úhlu ^o = 2 (radiány) dostáváme největší IQ (2+p0)2 protože výrazy v sumě se postupně vzájemně ruší. Nyní si stačí všimnout, že F (a) = F(x) — f (x) (připomeňme, že x je libovolně zvolená ale pevná hodnota v intervalu (a, b)). Proto podle Rolleovy věty existuje číslo c, a < c < x, takové, že F'(c) = 0. To aleje právě požadovaný vztah. □ 6.5. Odhady pro rozvoje se zbytkem. Obzvlášť jednoduchý je Taylorův rozvoj libovolného polynomu f(x) — anx" +an--[Xn~1 H-----\-aix+ao, a„ ^ 0. Protože je (n + l)-ní derivace / identicky nulová, má Taylorův polynom stupně n nulový zbytek a tedy je pro každé ioel f(x) = f(x0) + f'(x0)(x -X0) + ... + Lf(n){xo){x _ XQ)n n\ a všechny derivace snadno vyčíslíme (např. poslední výraz je vždy tvaru an(x — xq)"). Tento výsledek je velmi speciálním odhadem chyby v Taylo-rově rozvoji se zbytkem. Víme totiž předem, že zbytek je odhadnutelný pomocí velikosti derivace a ta je u polynomu od určitého řádu identicky nulová. 1 obecněji vede odhad velikost k-té derivace na nějakém intervalu k odhadu chyby na temže intervalu. Speciálním případem je také věta o střední hodnotě coby aproximace Taylorovým rozvojem řádu nula, viz (5.9). Dobrým příkladem pro rozvoj libovolného stupně jsou goniometrické funkce sin a cos. Iterováním derivace funkce sin* dostaneme vždy buďsinus nebo cosinus s nějakým znaménkem, ale v absolutní hodnotě budou hodnoty vždy nejvýše jedna. Dostáváme tedy přímý odhad rychlosti konvergence mocninné řady \x\k+l I sin x — (TV n sin) (x) I < -. Odhad ukazuje, že pro x výrazně menší než k bude chyba malá, pro x srovnatelné s k nebo větší ale bude obrovská. Srovnej s obrázkem aproximace funkce cos x Taylorovým polynomem stupně 68 v odstavci 5.52. Jak jsme zmínili v úvodu diskuse Taylorova rozvoje funkcí, pokud začneme s mocninnou řadou f(x) se středem v bodě a, pak její částečné součty splývají s Taylorovými polynomy TiAf(x). Následující tvrzení je jednou z jednoduchých formulací opačné implikace, tj. kdy je daná funkce f(x) ve skutečnosti mocninnou řadou. Důsledek (Taylorova věta). Předpokládejme, že funkce f(x) je na intervalu (a — p, a + p) hladká a že všechny její derivace jsou zde omezeny stejnoměrně konstantou M > 0, tj. \f(k)(x)\ < M, k = 0, 1, ..., x e (a - p, a + p). Pak mocninná řada S(x) — 2~T,^o ^if^(a)(x — a)n konverguje na intervalu (a — p, a + p) k funkci f'(x). Důkaz. Důkaz je shodný s úvahou v konkrétním případě funkce cos x výše. Promyslete si podrobnosti! □ 6.6. Analytické a hladké funkce. Je-li / v bodě a hladká, pak můžeme napsat formálně mocninnou řadu S(x) = Y/^f(k\a)(x-ar ' k\ ři=u Pokud má tato mocninná řadanenulový poloměr konvergence a zároveň platí S(x) — f (x) na příslušném intervalu, pak říkáme, že 329 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Doplňme ještě, že pro těleso v trojrozměrném prostoru (přesněji řečeno, pro uzavřenou plochu, která je jeho hranicí) se klade IQ kde V je objem a S povrch tělesa. Porovnáváme tedy objem tělesa daného povrchu s objemem koule téhož povrchu.o □ 6.11. Je dán provázek délky /. Máte jej rozstříhat na n částí tak, aby ze vzniklých n menších provázků bylo možné vytvořit hranice předem daných geometrických obrazců (kupř. čtverce, trojúhelníku, kruhu, půlkruhu) s nejmenším součtem ploch. Řešení. K vyřešení příkladu použijeme izoperimetrický podíl křivek a Jensenovu nerovnost (uvedené v předchozích příkladech). Pro předem určené geometrické obrazce označujme hodnoty jejich izoperimetrických podílů jako -:=^r, ie{l,...,n], přičemž 5, je obsah a o, obvod i-tého obrazce. Ještě budeme používat označení i=\ Připomeňme, že izoperimetrický podíl je dán pouze tvarem obrazce a nezávisí na jeho velikosti. Zvláště hodnota A je konstantní (je určena tvarem zadaných obrazců). Naším úkolem je minimalizovat součet Yľi=\ & při dodržení podmínky Yľi=\ °i = Protože je však Si = é~, ie{l,...,n], jde nám o minimalizaci výrazu n 2 Použijeme-li Jensenovu nerovnost pro ostře konvexní funkci y = x2 (na celé reálné ose), obdržíme / n \ 2 n Z ci xi) < E ci A pro xi e Rac; > 0 s vlastností c\ + ■ ■ ■ + cn = 1. Dále víme, že v této nerovnosti nastane rovnost právě tehdy, když je x\ = ■ ■ ■ = xn. Volbou Ci *i i € [1, ... ,n} pak dostaneme / n \2 n / \ 2 Jednoduchými úpravami přejdeme k nerovnici 2 „ „ / je analytická funkce v bodě a. Funkce je analytická na intervalu, je-li analytická v každém jeho bodě. Ne všechny hladké funkce jsou ale analytické. Ve skutečnosti lze dokázat, že pro každou posloupnost čísel a„ umíme najít hladkou funkci, jejíž derivace řádů k budou tato čísla ak.1 Abychom si alespoň představili podstatu problému, ukážeme si (jak se později uvidí velice užitečnou) funkci, která má v nule všechny derivace nulové, je však všude kromě tohoto bodu nenulová. Uvažme funkci definovanou vztahem m = e-1/-2. Evidentně jde o dobře definovanou hladkou funkcí ve všech bodech x ^ 0. Ověříme, že bodě x — 0 existuje limita liiiLt^o f(x) = 0. Můžeme proto dodefinovat /(O) = 0 a získáváme spojitou funkci. Přímým výpočtem s použitím LHospitalova pravidla vyjádříme derivaci a stačí přitom počítat derivaci zprava, protože jde 0 sudou funkci. e-lA2 _o x~l 1 x /'(O) = lim -= lim —r = - lim —T = 0. Derivací funkce f(x) v obecném bodě x ^ 0 dostaneme f'(x) — e~l/x -2x~3 a opakovaným derivováním výsledků dostaneme vždy součet konečně mnoha členů tvaru C-e-^-x-J, kde C je nějaké celé číslo a j je přirozené číslo. Budeme tedy předpokládat, že jsme už dokázali, že derivace řádu k naší funkce f(x) existuje a je v nule nulová. Při výpočtu následující derivace budeme opět počítat stejně jako v případě k — 0 výše. Budeme počítat limitu výrazu (x)/x pro x -> 0+, tj. konečný součet limit výrazů x~i e~llx — x~i / el^x . To jsou samé výrazy typu oo/oo, na které můžeme opakovaně použít LHospitalovo pravidlo. Zjevně po několika derivacích čitatele 1 jmenovatele (a obdobné úpravě jako v případu výše) bude ve jmenovateli stále stejný výraz, zatímco v čitateli již bude mocnina nezáporná. Celý výraz tedy nutně má v nule limitu nulovou, stejně jako jsme spočítali v případě první derivace výše. Totéž tedy bude platit pro konečný součet takových výrazů a zjistili jsme, že bude v nule existovat i každá derivace (x) a její hodnota bude nula. Ukázali jsme, že naše funkce f(x) je hladká na celém M, je samozřejmě nenulovou funkci všude mimo x — 0, všechny její derivace v tomto bodě jsou ale nulové. Samozřejmě to tedy není analytická funkce v bodě xq = 0. Uvidíme v dalším (hlavně v kapitole deváté), že ještě důležitější je chování této funkce v nekonečnu, tj. bude nás _ 2 zajímat funkce x i-> e x v okolí bodu xq = 0. Této funkci se říká gaussián. A2 i=l ^Jde o speciální případ tzv. Whitneyho věty, která říká, že k tomu, aby existovala hladká reálná funkce s předepsanými parciálními derivacemi všech řádů na uzavřené množině M cl",je nutné a stačí, aby tento předpis derivací splňoval na libovolné komppaktní podmnožině K c M odhady Taylorova rozvoje se zbytkem (pro funkce více proměnných budeme Taylorův rozvoj diskutovat v osmé kapitole). Zadáním v jediném bodě (nebo v diskrétní množině bodů) je tedy podmínka ve Whitneyho větě prázdná. 330 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET a poté (uvažte, že E"=i °i = 0 t<±°l A - li přičemž opět rovnost nastává právě pro (6.3) x\ Odsud vyplývá, že S je nejmenší, právě když platí (||6.3||). Tato nejmenší hodnota S je l2/(4it A). Zbývá stanovit délky nastříhaných částí 0[. Pokud je (||6.31|) splněno, musí zjevně být o,- = k Xt pro každé i € [1,... ,n] ajistou konstantu k > 0. Z / a současně J2°i = k Z Ai A ihned plyne, že k = l/A, tj. Oi ■l, i e {1, Podívejme se na konkrétní situaci, kdy máme provázek o délce 1 m rozříznout na dva menší a z nich potom vytvořit čtverec a kruh tak, aby součet jejich obsahů byl co nejmenší. Pro čtverec a kruh je po řadě (viz příklad nazvaný Izoperimetrický podíl) Xi = -, X2 = l, tj. A = X1+X2 Délky příslušných částí tak jsou (v metrech) 4+ir Ol 1 4 4+ir :0,56, 02 1 4+ir : 0, 44. Obsah čtverce o obvodu 0, 56 m (s délkou strany a = 0,14 m) je 0, 019 6 m2 a obsah kruhu s obvodem 0,44 m (a poloměrem r = 0, 07 m) pak činí přibližně 0, 015 4 m2. Můžeme ověřit, že (vm2) 0,035 = 0,0196 + 0,0154. □ i1 4irA 1 4(4+ir) Taylorovy rozvoje. Derivace vyšších řádů nutně potřebujeme k tomu, abychom určili Taylorův rozvoj dané funkce. 6.12. Určete Taylorovy rozvoje Tk (fe-tého řádu v bodě x) z následujících funkcí: i) ro3 z funkce sin x, ii) T,3 z funkce —. 7 1 x Řešení, (i) Spočítáme hodnoty první až třetí derivace funkce / = sin v bodě 0: /'(0) = cos(0) = 1, /(2)(0) = - sin(0) = 0, /<3>(0) = -cos(0) = -1, dále /(0) = 0. Taylorův rozvoj 3-tího řádu funkce sin(x) v bodě Oje tedy T03(sm(x)) : 6.7. Příklady neanalytických hladkých funkcí. Snadno j^í.' ' můžeme naši funkci f(x) z předchozího odstavce "tijh modifikovat takto: g(x) = 0 je-U x < 0 e-lA2 je_jj x > Q Opět jde o hladkou funkci na celém M. Další úpravou můžeme získat funkci nenulovou ve všech vnitřních bodech intervalu [—a, a], a > 0 a nulovou jinde: h(x): 0 je-li |*| > a je-li |*| < a. Tato funkce je opět hladká na celém M. Poslední dvě funkce jsou na obrázcích, vpravo je použit parametr a — l. Nakonec ještě ukážeme, jak lze dostat hladké analogie Heavi-sideových funkcí. Pro dvě pevně zvolená reálná čísla a < b definujeme funkci /(*) s použitím výše definované funkce g takto: 1 (x) =-■ g(x -a) + g(b - x) Zjevně je pro každé * e R jmenovatel zlomku kladný (pro každý z intervalů určených čísly a a b je totiž alespoň jeden ze sčítanců jmenovatele nenulový a tedy je celý jmenovatel kladný). Dostáváme z našeho definičního vztahu proto hladkou funkci /(*) na celém M. Při * < a je přitom jmenovatel zlomku přímo dle definice funkce g nulový, při * >b je čitatel i jmenovatel stejný. Na dalších dvou obrázcích jsou právě funkce /(*) a to s parametry a — l — a,b — l + a, kde nalevo je a — 0.8 a napravo a — 0.4. Snadno nyní také vytvoříme hladkou obdobu charakteristické funkce intervalu [c,d\. Označme si jako fe(x) výše uvedenou funkci /(*) s parametry a — — e, b = +£. Nyní pro interval (c, d), s délkou d — ole definujeme funkci hs(x) = fs(x — č) ■ fs(d — *). Tato funkce je identicky nulová na intervalech (—oo, c — e) a (d + s, oo) a je 331 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET (ii) Opět /(l) = e, /'(l) = /(2,(D = /(3,(D = e* x ex x ex x x = \ 2 = o, 2ex 6ex e, 6ex ~ŕ -2e. Dostáváme tedy Taylorův rozvoj třetího řádu funkce ^- v bodě 1: % ex e e % x3 3X2 5 Tf(-) = e+-(x- lf - -(x - l)3 = e(-- + — -2x + -). x 2 3 3 2 6 □ 6.13. Určete Taylorův polynom T06 funkce sin a pomocí věty (6.4) odhadněte chybu polynomu v bodě it/4. Řešení. Podobně jako v předchozím příkladu určíme T06(sm(x)) 1 3 1 , -x5 H--ŕ. 6 120 Dle věty 6.4 pak odhadneme velikost zbytku (chyby) R. Podle věty existuje c e (0, j) takové, že R in/4) — cos(c)tt : 0, 0002 . □ 6.14. Rozviňte funkci ln(l + x) do mocninné řady v bodech 0 a 1 a určete všechna pro která tyto řady konvergují. Řešení. Nejprve určeme rozvoj v bodě 0. Rozvinout funkci do mocninné řady v daném bodě je to stejné, jako určit její Taylorův rozvoj v daném bodě. Snadno nahlédneme, že [ln(x + 1)] (») - t C""1)' (x + iy' takže vyčíslením derivací v nule máme ln(x + 1) = ln 1 + anx", n=\ kde (-!)"+> - 1)! (-1)" identicky rovna jedné na intervalu (c + £, d — s), přičemž je všude hladká a lokálně je buďkonstantní nebo monotónní. Čím menší je £ > 0, tím rychleji naše funkce přeskočí z nuly na jedničku kolem začátku intervalu nebo zpět na konci intervalu. Vidíme tedy, že hladké funkce jsou velice „plastické" — z lokálního chování kolem jednoho bodu nemůžeme říci vůbec nic o globálním chování takové funkce. Naopak, analytické funkce jsou zcela určené dokonce jen derivacemi v jediném bodě. Zejména jsou tedy bezezbytku určené svým chováním na libovolně malém okolí jediného bodu ze svého definičního oboru. Jsou tedy v tomto smyslu velice „rigidní". 6.8. Lokální chování funkcí. Viděli jsme, že znaménko první derivace určuje u každé diferencovatelné funkce, zda roste nebo klesá na nějakém okolí daného bodu. Pokud je ale derivace nulová, sama o sobě mnoho o chování funkce neříká. Už jsme se ale setkali s významem druhé derivace při popisu kritických bodů. Teď zobecníme diskusi kritických bodů pro všechny řády. Začneme diskusí lokálních extrémů funkcí, tj. hodnot, které jsou ostře větší nebo ostře menší než všechny ostatní hodnoty z nějakého okolí daného bodu. Budeme v dalším uvažovat funkce s dostatečným počtem spojitých derivací, aniž bychom tento předpoklad přímo uváděli. Řekneme, že bod a v definičním oboru funkce / je kritický bod řádu k, jestliže platí f (a) = ■■■ = f(k\a) = 0, f{k+l\a) + 0. Předpokládejme, že /(i+1> (a) > 0. Pak je tato spojitá derivace kladná i na jistém okolí 0(á) bodu a. Taylorův rozvoj se zbytkem nám v takovém případě dává pro všechna x z 0(á) fix) = fia) + 1 (* + !)! fk+lHc)ix - a)k Je proto změna hodnot fix) v okolí bodu a dána chováním funkce (x — a)k+l. Je-li přitom k + l sudé číslo, jsou nutně hodnoty fix) v takovém okolí větší než hodnota fia) a zjevně je proto bod a bodem lokálního minima. Pokud je ale k sudé číslo, pak jsou hodnoty vlevo menší a vpravo větší než než fia), extrém tedy ani lokálně nenastává. Zato si můžeme všimnout, že graf funkce fix) protíná svoji tečnu y — fia) bodem [a, /(a)]. Naopak, je-li f*-k+l\a) < 0, pak ze stejného důvodu jde o lokální maximum při lichém k a extrém opět nenastává pro k sudé. 6.9. Konvexní a konkávni funkce. Říkáme, že diferencovatelná v funkce / jev bodě a konkávni, jestliže se její graf na-/ chází v jistém okolí celý pod tečnou v bodě [a, fia)], tj. požadujeme Můžeme tedy psát Inix + 1) -x2 +-X3 - -x4 + ■ 2 3 4 00 / iyi+1 fix)< fia) + f'ia)ix-a). Říkáme, že funkce / je konvexní v bodě a, jestliže naopak je její graf nad tečnou v bodě a, tj. fix)> fia) + f'ia)ix-a). Funkce je konvexní nebo konkávni na intervalu, jestliže má tuto vlastnost v každém jeho bodě. 332 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Pro poloměr konvergence potom použijeme limitu podílu následujících koeficientu členů mocninné řady 1 1 1. lim„ lim„ Řada tedy konverguje pro libovolné x e (—1,1). Pro x = — 1 dostáváme harmonickou řadu (se znaménkem minus), pro x = 1 dostáváme alternující harmonickou řadu, která podle Leibnizova kriteria konverguje. Daná řada proto konverguje právě pro x e (—1, 1]. Pro rozvoj v bodě 1 dostáváme podobně vyčíslením výše uvedených derivací z ||6.14|| ln(x + 1) = ln(2) + X-{x - 1) 1 D2+ 1 3-23 (x - l)3 :ln(2) + £ÍiL-(,. n ■ 2" 1)" pro poloměr konvergence této řady pak dostáváme 1 1 linwoo lim„ První řada konverguje pro — 1 < x < 1, druhá pro — 1 < x < 3. □ 6.15. Nalezněte odhad chyby přibližného vyjádření ln(l +x) ^ x - y prox e (-1,0). O 6.16. Najděte Taylorův polynom 3. stupně funkce y = arctg x, x e K v bodě x0 = 1. O 6.17. Určete Taylorův rozvoj 3. řádu v bodě xo = 0 funkce (a) y = ^ (b) y = e-~; (c) y = sin (sin x) ; (d) y = tgx; (e) y = e* sin x definované v jistém okolí bodu xq. 6.18. Stanovte Taylorův rozvoj 4. řádu funkce y v bodě x0 = 1. O Inx2, x e (0,2) O 6.19. Napište Taylorův polynom 4. stupně funkce y = sinx, x e K se středem v počátku. Pomocí tohoto polynomu přibližně vyčíslete sin 1° a stanovte limitu lim x smj-j2 . O i^0+ x Předpokládejme navíc, že má funkce / spojité druhé derivace v okolí bodu a. Z Taylorova rozvoje druhého řádu se zbytkem dostáváme f(x) = f (a) + f'(a)(x -a) + jf"(c)(x-a)2 Proto je zjevně funkce konvexní, kdykoliv je f "(a) > 0, a je konkávni, kdykoliv f "(a) < 0. Pokud je druhá derivace nulová, můžeme použít derivace vyšších řádů. Stejný závěr ovšem umíme učinit pouze, pokud první další nenulová derivace po první derivaci bude sudého řádu. Pokud bude naopak první nenulová řádu lichého, budou zjevně body grafu funkce na různých stranách nějakého malého okolí zkoumaného bodu na opačných stranách tečny v tomto bodě. 6.10. Inflexní body. Bod a nazýváme inflexní bod diferencovatelné funkce / Jestliže graf funkce / přechází z jedné strany tečny na druhou. Předpokládejme, že / má spojité třetí derivace a napišme si Taylorův rozvoj třetího řádu se zbytkem: f(x) = f(a)+f\a)(x-a)+\f\a)(x-a)2 + ):f'''(c)(x-aý. Je-li a nulový bod druhé derivace takový, že f "(a) ^ 0, pak je třetí derivace nenulová i na nějakém okolí a jde proto zjevně o inflexní bod. Znaménko třetí derivace nám v takovém případě určuje, zda graf funkce přechází tečnu zdola nahoru nebo naopak. Pokud je bod a navíc izolovaným nulovým bodem druhé derivace a zároveň inflexním bodem, pak zjevně je na nějakém malém okolí bodu a funkce na jedné straně konkávni a na druhé konvexní. Inflexní body tedy můžeme také vnímat jako body přechodu mezi konkávním a konvexním chováním grafu funkce. mflemí bod 6.11. Asymptoty grafu funkce. Uvedeme ještě jednu dobrou #5^ pomůckou pro náčrtek grafu funkce. Zkusíme zjistit tzv. asymptoty, tj. přímky, ke kterým se blíží hodnoty Mr- funkce /. Asymptotou v nevlastním bodě oo je taková přímka y — ax +b, pro kterou je lim (fix) -ax-b) = 0. Říkáme jí také asymptota se směrnicí. Pokud taková asymptota existuje, platí lim (f(x) — ax) — b 333 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.20. Uvedte Taylorův polynom se středem v počátku stupně alespoň 8 funkce y = e2\x e K. O 6.21. Polynom x3 — 2x + 5 vyjádřete jako polynom v proměnné u = x — 1. O 6.22. Rozviňte funkci (a) y = ln|±i, xe(-l,l); (b) y = e*2 + x2e~2x, iěI do Taylorovy řady se středem v počátku. Řešení. Pokud lze funkci vyjádřit jako součet mocninné řady (s kladným poloměrem konvergence) na jejím oboru konvergence, pak je tato řada nutně Taylorovou řadou uvažované funkce (svého součtu). To nám umožní snadno najít příslušné Taylorovy řady. Případ (a). Víme, že je OO j ln(l+x)= £í^x", xe(-l,l), a tedy existuje i limita ln(l-*)= £ n = \ Celkem máme ^(-i)" = -E;r, ^ €(-1,1). n=\ lng=ln(l+x)-ln(l-x)= £ n=\ pro x € (—1,1). Případ (b). Podobně ze známé identity OO plyne a OO OO (-2)" ^n+2 — 2n-\ ■■x2 Jl±(-2xy = x € Platí tudíž lim Pokud ovšem existují poslední dvě limity, existuje i limita z definice asymptoty, jde proto i o podmínky dostatečné. Obdobně se definuje a počítá asymptota i v nevlastním bodě — oo. Tímto způsobem dohledáme všechny potenciální přímky splňující vlastnosti asymptot se směrnicí. Zbývají nám případné přímky kolmé na osu x: Asymptoty v bodech a e R jsou přímky x — a takové, že funkce / má v bodě a alespoň jednu jednostrannou Umitu nekonečnou. Hovoříme také o asymptotách bez směrnice. Např. racionální funkce lomené mají v nulových bodech jmenovatele, které nejsou nulovými body čitatele, asymptotu. Spočtěme aspoň jeden jednoduchý příklad: Funkce f (x) — x + i má za asymptoty přímky y — x a x — 0. Skutečně, jednostranné hmity zprava a zleva v nule jsou zjevně ±oo, zatímco limita f(x)/x — 1 + 1/x2 je samozřejmě v nevlastních bodech právě ±1, zatímco limita f(x) — x = l/x je v nevlastních bodech nulová. Derivací obdržíme f'(x) = l-x-2, f"(x) = 2x-3. Funkce /' (x) má dva nulové body ± 1. V bodě x — l má funkce lokální minimum, vbodě:t = —1 lokální maximum. Druhá derivace nemá nulové body v celém definičním oboru (—oo, 0) U (0, oo), proto nemá naše funkce žádný inflexní bod. e+x2e-2x = E x +(~„fx" x e 6.23. Určete Taylorovu řadu se středem v počátku funkce (a) y x e (-1, 1); (i+*)2 □ R (i+*)2 (b) y = arctgx, x e (—1,1). Řešení. Případ (a). Využijeme vzorec oo oo = £(-*)" = ZC-l)"*"* xe(-l,l) n=0 n=0 o součtu geometrické řady. Jeho derivováním dostáváme ]T(-l)^t" )= JT(-!)"«ie(-l,l), 6.12. Diferenciál funkce. Při praktickém používání diferenciál-'''(% yt: nflio počtu často pracujeme se závislostmi mezi •iíV různými veličinami, řekněme y a x, a není dána sí3j£í^ pevně volba závislé a nezávislé proměnné. Explicitní vztah y — f (x) s nějakou funkcí / je tedy jen jednou z možností. Derivování pak vyjadřuje, že okamžitá změna y — f (x) je úměrná okamžité změně x a to s úměrou f'(x) — ^(x). Tento vztah se často píše jako df(x) ■ d_f_ dx (x)dx, kde df(x) interpretujeme jako lineární zobrazení přírůstků dané df(x)(Ax) = f'(x) ■ Ax, zatímco dx(x)(Ax) = Ax. 334 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET přičemž (x0)' = 0, a tak je dolní index n = 1. Vidíme, že oo (1^,2 = £(-l)"+1rcx"-\ x e (-1,1). fi=l Případ (b). Derivaci funkce y = arctg í umíme vyjádřit jako co co (arctg/)' = 1^2 = E HT = E(-l)"í2"- t € (-1, 1). n=0 n=0 Protože pro x e (—1, 1) je x J (arctg t)' dt = arctgx — arctg 0 = arctgx o a x / oo \ oo/ x \ oo / E(-D"/2") * = E (-D"//2" <*) = E 0 \n=0 / n=0 \ 0 / n=0 máme již výsledek n+1 arctgx=ESr* , *€(-l,l). n=0 6.24. Najděte Taylorovu řadu se středem x0 = 0 funkce f(x) = fu cos u2 du, x e ' Řešení. Z vyjádření plyne COS t = E TŤ^TT í2" , í € (2n)l ' n=0 a následně (pro lei) f(x) = fu cosu2du= f ( £ "4"+1 ) 0 Vi=0 - E ( / "4"+1 d" ) - E (2„)! (2ľ+2) x4"+2 • 6.25. Na intervalu konvergence (—1, 1) stanovte součet řady oo E n (n + 1)x". Řešení. Platí J2n(n + l)x" = X>(*"+1)' E^x" n=\ + 1 Eřix"-1 X2 n=\ x2 E(x")' . n=l x2 (-i + e*" [",'-1 + ^'I=[jr-(T^ 2x (l-Xp pro všechna x e (—1, 1). □ □ □ 6.26. Rozviňte do mocninné řady funkci cos2 (x) (tj. určete Taylorův rozvoj funkce) v bodě 0 a určete pro která reálná čísla tato řada konverguje. Hovoříme o diferenciálu funkce f pokud platí aproximační vlastnost ,. f(x + Ax)-f(x)-df(x)(Ax) lim -= 0 Ax^O Ax Z Taylorovy věty tedy vyplývá, že funkce s ohraničenou derivací /' má diferenciál df. To zejména v bodě x nastane, když v něm první derivace f'(x) existuje a je spojitá. Pokud je veličina x vyjádřena pomocí další veličiny ř, tj. x = g (i), a to opět funkcí se spojitou první derivací, pak pravidlo o derivaci složené funkce říká, že i složená funkce f o g má opět diferenciál d f dx d f (i) = -f(x) — (t)dt. dx dt Můžeme proto vnímat df jako lineární přiblížení dané veličiny v závislosti na přírůstcích závislé proměnné, ať už je tato závislost dána jakkoliv. 6.13. Křivost grafu funkce. Budeme ted graf hladké funkce • _ jít, /(*) chvíli diskutovat jako zvláštní případ parametri-^ " " zované křivky v rovině. Můžeme si ji představit jako pohyb v rovině parametrizovaný pomocí nezávislé proměnné x. Pro libovolný bod x z definičního oboru naší funkce můžeme okamžitě výpočtem první derivace vidět vektor (1, f'(x)) e R2, který představuje okamžitou rychlost takového pohybu. Tečna bodem [x, f(x)] parametrizovaná pomocí tohoto směrového vektoru pak představuje lineární přiblížení křivky. Viděli jsme už také, že v případě, že f"(x) = 0 a zároveň f"'(x) 0, přechází graf naší funkce přes svoji tečnu, tzn. že tečna je i nejlepším přiblížením křivky v bodě x i do druhého řádu. To zpravidla popisujeme tvrzením, že má graf funkce / v bodě x nulovou křivost. Tak jak u první derivace nenulové hodnoty vyjadřovaly rychlost růstu (ať už s jakýmkoliv znaménkem), stejně asi intuitivně očekáváme, že druhá derivace bude popisovat míru zakřivení grafu. Zatím jsme jen viděli, že je graf funkce nad svojí tečnou pro kladnou hodnotu a pod tečnou v případě opačném. KŘIVOST 335 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.27. Rozviňte do mocninné řady funkci sm2(x) v bodě 0 a určete pro která reálná čísla tato řada konverguje. 6.28. Rozviňte do mocninné řady funkci mix3 + 3X2 + 3x + 1) v bodě 0 a určete, pro která xel konverguje. O 6.29. Rozviňte do mocninné řady funkci ln «J~x v bodě 1 a určete, pro která xel konverguje. O Další příklady na Taylorovy polynomy a řady naleznete na straně 388. Nyní uvedeme několik „klasických" příkladů, ve kterých budeme vyšetřovat průběh různých funkcí. 6.30. Stanovte obor hodnot funkce /(*) x e Řešení. Přímka y = 1 je zjevně asymptotou funkce / v +oo a přímka y = — 1 asymptotou v — oo, neboť lim x^oo Z nerovnosti lim 1, 2ex (e*+l)2 lim 0-1 0+1 -1. > 0, x e dále plyne, že / je spojitá a rostoucí na K. Oborem hodnot je tedy interval (-1,1). □ 2 6.31. Uvedte všechny intervaly, kde je funkce y = e-* , x e K konkávni. O 6.32. Uvažujte funkci )í = arctgi^1, i^Ofiel). Určete intervaly, kde je tato funkce konvexní a kde konkávni; a také všechny její asymptoty. O 6.33. Najděte všechny asymptoty funkce (a) y = x ď; (M v - (*+3>3 w y - (x-2ý s maximálním definičním oborem. 6.34. Stanovte asymptoty funkce ;y=2arctg l-^l, *^±1(*€R). 6.35. Uvažujte funkci y =m ,,, definovanou pro všechna reálná x. Nalezněte její asymptoty. 3e2x+ex+10 O o o Tečnu grafu v pevném bodě P = [x, f (x)] jsme dostali pomocí limity sečen, tj. přímek procházejícími body P a Q = [x + Ax, f (x + Ax)]. Chceme-li přiblížit druhou derivaci, budeme body P a Q ^ P prokládat kružnicí Cg, jejíž střed je na průsečíku kolmic na tečny, vztyčených v bodech P a Q- Z obrázku je patrné, že jestliže tečna v pevném bodě P svírá s osou x úhel a a tečna v Q úhel a + Aa, pak i úhel zmíněných kolmic v jejich průsečíku bude Aa. Označíme-li poloměr naší kružnice p, pak délka oblouku kružnice mezi body P a Q bude pAa. Jestliže budeme limitně přibližovat bod Q k pevnému bodu P, bude se zároveň délka oblouku kružnice blížit délce s studované křivky, tj. grafu funkce / (x), a kružnice limitně přejde do kružnice Cp. Dostáváme tedy pro limitní poloměr p kružnice C p základní vztah As ds p = lim -= —. Aa^O Aa da Křivost grafu funkce / v bodě P definujeme j ako číslo l/p. Nulová křivost tedy odpovídá nekonečnému poloměru p. Pro výpočet poloměru p potřebujeme umět vyjádřit délku oblouku s pomocí změny úhlu a a derivaci této funkce pak vyjádřit pomocí derivací funkce /. Všimněme si již teď, že při rostoucím úhlu a může délka oblouku buď také růst nebo klesat, podle toho, jestli má kružnice Cg střed nad nebo pod grafem funkce /. Znaménko p nám tedy odráží, zda je funkce konkávni nebo konvexní. Je třeba také pomyslet na zvláštní případ, kdy střed limitně „uteče" do nekonečna, tj. místo kružnice limitně dostaneme přímku a to opět tečnu. Evidentně nemáme přímý nástroj na vyčíslení derivace Víme však, že tg a = df/dx a derivováním této rovnosti podle x dostaneme (s využitím pravidla pro derivaci složených funkcí) 1 da „ (cos a)2 dx Na levé straně můžeme dosadit (cos a)' = l + (tga)2 = l + (/')2 a proto platí také (viz pravidlo pro derivování inverzní funkce) dx da 1 + (tg a)2 1 (f'Ý f" f" To už jsme ale skoro hotoví, protože přírůstek délky oblouku s v závislosti na proměnné x je dán vztahem ds dx = (l + (/')2)1/2 a tedy můžeme již snadno spočíst podle pravidla pro derivování složené funkce _ ds _ ds dx _ (1 + (/')2)3/2 ^ da dx da f" Nyní již můžeme vyčíst vztah křivosti a druhé derivace: čitatel našeho zlomku je, nezávisle na hodnotě první derivace, vždy kladný. Je roven třetí mocnině velikosti tečného vektoru ke studované křivce. Znaménko křivosti tedy je dáno jen znaménkem druhé derivace, což jen znovu potvrzuje naši úvahu o konkávních a konvexních bodech funkcí. V případě, že je druhá derivace nulová, dostaneme i křivost nulovou. Kružnici, pomocí které jsme křivost definovali nazýváme oskulační kružnicí. Zkuste si spočíst křivost jednoduchých funkcí sami a využijte oskulační kružnice při náčrtech jejich grafů. Nejjednodušší je 336 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.36. Vyšetřete průběh funkce fix) = ^Up + l. Řešení. Definičním oborem i oborem spojitosti je celá reálná osa (/ tedy nemá body nespojitosti). Postačuje např. uvážit, že funkce y = tfx je spojitá v každém bodě x e K (na rozdíl od odmocnin o sudém základě definovaných pouze na nezáporné poloose). Ihned je také vidět, že/ (x) > la/(-x) = fix) pro všechna x e K, tj. funkce / je kladná a sudá. Bod [0, 1] jako jediný průsečík grafu / s osami proto dostaneme dosazením x = 0. Limitní chování funkce má smysl uvažovat pouze v ±oo (neexistují body nespojitosti), kde lehce určíme (6.4) lim | x | = +00. lim y\x\3 + l = x^zkoo x^zkoo x^zkoo Nyní přistoupíme ke zkoumání průběhu funkce pomocí jejích derivací. Pro x > 0 je fix) = VxTTT=(x3 + iý, a tedy 1 _2 J (6.5) /'(*) = - (x3 + 1) 1 3X2 > 0, x > 0. Odtud vyplývá, že funkce / je rostoucí na intervalu (0, +oo). Vzhledem ke své spojitosti v počátku je však nutně / rostoucí na [0, +00). Neboť se jedná o sudou funkci, víme dále, že na intervalu (—00, 0] klesá. Má tak jediné lokální minimum v bodě x0 = 0, které je současně (ostrým) minimem globálním. Protože nekonstantní spojitá funkce zobrazuje interval na interval, je oborem hodnot / právě [1, +00) (uvažte fix0) = 1 a (||6.4||)). Všimněme si, že díky sudosti funkce jsme nemuseli počítat derivaci /' na záporné poloose, kterou lze však snadno určit náhradou | x |3 2 i-xY -x se ziskem /'(*) = i(-*3+ lf 3 (-3r) < 0, x < 0. Při výpočtu /'(0) můžeme vyjít přímo z definice nebo pomocí limit x2 X2 lim >0+ 3l 0: lim - x->0- i(x3 + iy j(-x3 + iy stanovit jednostranné derivace a následně /'(0) = 0. Ve skutečnosti jsme nemuseli počítat první derivaci ani na kladné poloose. K tomu, abychom obdrželi, že / roste na (0, +00), si stačilo uvědomit, že funkce y = Zfx a y = x3 + 1 jsou rostoucí na K a že kompozice rostoucích funkcí je funkce rostoucí. Snadno pro x > 0 však z (||6.5||) vypočítáme druhou derivaci 2xJ(x3 + lf - \x2^l(x3 + I)"1 (3x2) /"(*) =- (x3 + iy výpočet v Kritických bodech funkce /, protože v těch dostáváme poloměr oskulační kružnice jako reciprokou hodnotu druhé derivace opatřenou znaménkem. 6.14. Vektorový diferenciální počet. Jak jsme zmínili hned v úvodu k páté kapitole, pro naše úvahy o derivování bylo vesměs podstatné, že jsme zkoumali funkce definované na reálných číslech a že jejich hodnoty lze mezi sebou sčítat a lze je násobit reálnými čísly. Potřebujeme proto, aby naše funkce / : R -» V měly hodnoty ve vektorovém prostoru V. Budeme jim pro odlišení říkat vektorové funkce jedné reálné proměnné nebo stručněji vektorové funkce. Nyní se budeme podrobněji věnovat reálným funkcím s hodnotami v rovině nebo prostoru, tj. / : R -» R2 a / : R -» R3. Hovoříme o (parametrizovaných) křivkách v rovině a v prostoru. Obdobně bychom mohli pracovat s hodnotami v R™ pro jakoukoliv konečnou dimenzi n. Pro zjednodušení budeme pracovat v pevných standardních bázích e; v R2 a R3, takže naše křivky budou dány dvojicemi, resp. trojicemi obyčejných reálných funkcí jedné reálné proměnné. Vektorová funkce r v rovině, resp. v prostoru, je tedy dána rit) = xit)ei + yit)e2, rit) = xii)e\ + yit)e2 + z(i)e3. Derivace takové vektorové funkce je opět vektor, který přibližuje zobrazení r pomocí lineárního zobrazení přímky do roviny či prostoru. V rovině je to tedy árii) dt it) = r it)=xit)ex+y it)e2 a podobně v prostoru. V tomto kontextu je také třeba vnímat diferenciál vektorové funkce: dr ■ 'dx y dt e\ - dy dz . —e2 H--e3 \dt dt dt kde výraz na pravé straně chápeme tak, že se přírůstek skalární nezávislé proměnné t lineárně zobrazí pomocí vynásobení vektoru derivace a tím dostaneme příslušný přírůstek vektorové veličiny r. Jestliže vektor r(ř) představuje parametrizaci křivky, pak jeho derivace je vektorem rychlosti takto zadané dráhy. Speciální případ vektoru r(ř) = te\ +fit)e2 zadávajícího graf funkce / jsme zkoumali v minulém odstavci. Druhá derivace pak představuje zrychlení takto zadaného pohybu. Všimněme si, že samozřejmě zrychlení nemusí být kolineární s rychlostí. V případě grafu funkce je dokonce zrychlení kolineární s rychlostí pouze v bodech, kde je /" nulová, což odpovídá představě, že kolineární může zrychlení být pouze tehdy, když je křivost grafu nulová. 6.15. Derivování složených zobrazení. V lineární algebře a geo-,.if' . metriijsouveliceužitečnázobrazení,kterýmříkámeformy. tJako argumenty mají jeden nebo více vektorů a v každém ze svých argumentů jsou lineární. Zadáváme tak ve-1 likost vektorů (skalární součin je symetrická bilineární forma) nebo objem rovnoběžnostěnů (to je n-lineární antisymet-rická forma, kde n je dimenze prostoru), viz např. odstavce 2.44 a 4.22. Do těchto operací samozřejmě můžeme dosazovat vektory rif) závisející na parametru. Přímočarou aplikací Leibnizova pravidla pro derivaci součinu funkcí ověříme následující 337 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET tj. po úpravě máme (6.6) f (X) : Podobně můžeme spočítat 2x 2x (*3+l) > 0, x > 0. 2xJ(-xi + iy lx^{-ŕ+l)-1 (-3x1) H3 + i) > o, pro x > 0 a poté /"(O) = 0. Dále pak limitním přechodem: 2x .. 2x lim >0+ V(X3 + Xý lim 1(-x3 + l)3 Podle nerovnosti (||6.6||) je / ryze konvexní na intervalu (0, +oo). Také dostáváme ryzí konvexnost funkce / na (—oo,0). K tomuto závěru ovšem opět nebylo potřeba druhou derivaci pro x < 0 počítat: stačilo využít sudosti zadané funkce. Celkem jsme pak obdrželi, že / je konvexní na celém svém definičním oboru (nemá inflexní body). K vykreslení grafu funkce ještě potřebujeme nalézt asymptoty (vyčíslení funkce v jistých bodech přenecháváme čtenáři). Neboť je funkce / spojitá na K, asymptoty bez směrnice mít nemůže. Přímka y = ax + b je pak asymptotou se směrnicí pro x —► oo tehdy a jenom tehdy, když existují (jako vlastní) obě limity lim ^ = a, x^-oo x Analogické tvrzení platí pro x lim ^ ^ = lim x—^oo l-x) lim {fix) — ax) —oo. Z limit lim x^oo x lim {fix) x—>oo ( = lim lim (l/x3 + 1 - [^FTT-x] (x3 + 1) + xjx3 + 1 + x \ \ lim x3 + 1 - x3 (x3 + 1) + xjx3 + 1 + x2 j lim —r = 0 tak již J(x3 + lf + xJx3-TT + x2 plyne, že přímka y = x je asymptotou v +oo. Když znovu uvážíme, že funkce / je sudá, bezprostředně obdržíme přímku y = — x jako asymptotu v — oo. □ Další příklady na vyšetřování funkcí můžete najít na straně 373. Nyní přejděme od vyšetřování funkcí k dalším tématům spojených s derivacemi funkcí. Nejprve demonstrujme pojem křivosti a oskulační kružnice na elipse. 6.37. Určete křivost elipsy x2 + 2-y2 = 2 v jejích vrcholech (||4.47||). Udejte též rovnice oskulačních kružnic v těchto vrcholech. Věta. (1) Je-li r(f) : M —> W diferencovatelný vektor a : M" —> Rm lineární zobrazení, pak pro derivaci zobrazení ♦ or platí d(^> o r) ty o ■ dr dt dt (2) Uvažujme diferencovatelné vektory r\, ri : R —> W a k-lineární formu : R™ x ... x R™ na prostoru R™. Pak pro derivaci složeného zobrazení ,dr\ — = í>(—,r2, dt v dt , n-i, drt ^ dt ' (3) Předchozí tvrzení zůstává bezezbytku v platnosti i pokud má také hodnoty ve vektorovém prostoru (a je lineární ve všech k argumentech). Důkaz. (1) V lineární algebře se ukazuje, že lineární zobrazení jsou dána konstantní maticí skalárů A = (ay) tak, že * o r(t) = , n n [y^aiiri(i), ...,'^2, V: 1 : 1 (i) ■ Derivaci nyní provádíme po jednotlivých souřadnicích výsledku. Víme ale, že derivace se chová lineárně vůči skalárním lineárním kombinacím, viz Věta 5.33. Proto skutečně dostaneme derivaci 1* o r(i) prostým vyčíslením původního lineárního zobrazení 1* na derivaci / (i). (2) Zcela obdobně dostaneme i druhé tvrzení. V souřadnicích rozepíšeme vyčíslení ^-lineární formy na vektorech r\.....ri takto n t>(rx(t),...,rk(t))= Bh..jt-(n)h(t)...(rk)it(t), i'l,...,ii=l kde skaláry 5,,...,,. jsou pro každou volbu indexů dány jako hodnota dané formy íKe;,, ..., e;t) na zvolené &-tici bázových vektorů. Pravidlo pro derivaci součinu skalárních funkcí nám dá právě dokazované tvrzení. (3) Pokud má vektorové hodnoty, je zadáno konečně mnoha komponentami a můžeme použít předchozí úvahu na každou z nich. □ Na euklidovském prostoru R3 máme kromě skalárního součinu, který dvěma vektorům přiřadí skalár, také vektorový součin, který dvěma vektorům u a v přiřadí vektor u x v e R3, viz 4.24. Tento vektor u x v je kolmý na oba vektory u a v, má velikost rovnou obsahu rovnoběžníku určeného vektory u a v (v tomto pořadí) a orientaci takovou, aby trojice u, v, u x v byla kladně orientovanou bází. Z předchozí věty okamžitě vyplývají užitečná tvrzení: Důsledek. V prostoru R3 uvažme vektory u (i) a v (i). Pro derivace jejich skalárního součinu (u(t), v (i)) a vektorového součinu u (i) x v (i) platí (6.1) í-(u(ť), v(t)) = (u'(t), v(t)) + (u(t), v'(t)) dt (6.2) dt (u(t) x v(t)) — u (i) x v(t) + u(t) x v (i) 338 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Řešení. Protože elipsa je v daných souřadnicích již v základním tvaru (nejsou přítomny ani smíšené ani lineární členy), je zadaná báze již bází polární. Jejími osami jsou souřadnicové osy x a y, vrcholy pak body [V2, 0], [-V2, 0], [0, 1] a [0, -1]. Spočítejme nejprve křivost ve vrcholu [0,1]. Uvážíme-li souřadnici y jakožto funkci souřadnice x (v okolí bodu [0, 1] je jednoznačně určena), pak derivací rovnice elipsy podle proměnné x dostáváme 2x + 4y-ý = 0, tedy / = — (/ značí derivaci funkce y(x) podle proměnné x; nejedná se vlastně o nic jiného, než o vyjádření derivace funkce dané implicitně, viz 8.18. Derivací této rovnice podle x pak obdržíme y" 2 V y2 V bodě [1,0] pak dostáváme / = 0 a y" = —\ (ke stejným výsledkům bychom došli, kdybychom explicitně vyjádřili z rovnice elipsy y = \-J2 — x2 a derivovali; výpočet by byl jen o něco složitější, jak si jistě čtenář sám ověří). Poloměr oskulační kružnice bude tedy dle vztahu v 6.13 (l + (/)2)5 (y"Y respektive 2 a znaménko nám říká, že kružnice bude „pod" grafem funkce. Z úvah v 6.13 a 6.16 vyplývá, že její střed bude ve směru opačném k normále této křivky, tedy na ose y (funkce y jakožto funkce proměnné x má derivaci v bodě [0,1], tečna k jejímu grafu v tomto bodě bude tudíž rovnoběžná z osou x, normála je pak kolmá na tečnu, což je v tomto bodě osa y. Poloměr je 2, střed tak bude v bodě [0, 1—2] =[0, —1]. Celkem bude rovnice oskulační kružnice elipsy x2 + 2y2 = 2 v bodě [0, 1] znít x2 + (y + l)2 = 4. Analogicky určíme rovnici oskulační kružnice v bodě [0, —1]: x2 + (y — l)2 = 4. Křivosti elipsy (jakožto křivky) v těchto bodech jsou pak rovny \ (absolutní hodnota křivosti grafu funkce). Pro určení oskulační kružnice v bodě [VI, 0] budeme uvažovat rovnici elipsy, jakožto předpis pro proměnnou x pomocí proměnné y, tedy x jako funkci y. (v okolí bodu [\Í2, 0] není totiž určena proměnná y jako funkce x jednoznačně, nemůžeme tedy použít předchozí postup - technicky by to dopadlo tak, že bychom dělili nulou). Postupně dostáváme: 2xx' + 4y = 0, tedy x' -2y-, a x" -2( 1 _ yx_ V bodě [\/2, 0] je tudíž x1 = 0 a x" = — V2 a poloměr oskulační i /? kružnice je podle 6.13 p = — = Normála směřuje v bodě [V2, 0] po ose x do —oo, střed oskulační kružnice tedy bude na ose x na druhou stranu ve vzdálenosti tudíž v bodě [VI — 0] = = [^,0]. Celkem rovnice oskulační kružnice ve vrcholu [VI, 0] bude (x — A'Ý _|_-y2 _ i _ Křivost je v obou těchto vrcholech rovna VI. 6.16. Křivost křivek. Nyní máme daleko mocnější nástroje pro studium křivek systematičtějším způsobem, než když jsme diskutovali křivost grafů funkcí. Podívejme se obecně na křivky r(i) v prostoru a předpokládejme, že jsou parametrizovány tak, aby jejich tečný vektor měl stále velikost jedna, tj. (/ (ř), ŕ (i)) — 1 pro všechna t. Říkáme, že je křivka r(t) parametrizována délkou. Další derivací tohoto j ednotkového vektoru ť (t) dostaneme vektor r" (i), pro který spočteme (využíváme symetrie skalárního součinu) 0= -(/(*),/«> =2(/'(*),/«> dt a je tedy vektor zrychlení r" (i) vždy kolmý na vektor rychlosti. To odpovídá představě, že při volbě parametrizace s konstantní velikostí rychlosti nemůže být zrychlení ve směru pohybu znatelné, musí tedy celé zrychlení být v rovině kolmé k vektoru rychlosti. Pokud je druhá derivace nenulová, nazýváme normovaný vektor 1 n(i) = -r (i) lk"(r)|| hlavní normálou křivky r(f). Skalární funkce k(í) splňující (v bodech, kde je rit) ^ 0) r"it) = K(ť)n(ť) se nazývá křivost křivky rit). V nulových bodech druhé derivace definujeme icii) také nulovou hodnotou. V nenulových bodech křivosti je dobře definován jednotkový vektor bii) — r' (ř) x nit), který nazýváme binormála křivky rit). Přímým výpočtem dostáváme 0 = í-(b{i), r'it)) = (b'it), r'it)) + (bit), r"it)) = dt = (b'it),r'it)) +k(t)(b(t),n(t)) = (b\t),r'it)), což ukazuje, že je tečný vektor k binormále kolmý jak na bii), tak na / (ř). Musí tedy být násobkem vektoru hlavní normály. Píšeme b'it) = -x(t)n(t) a skalární funkci r (ŕ) nazýváme torze křivky rif). Ještě jsme nespočetli rychlost změny hlavní normály, kterou můžeme také psát jako n (ř) = bii) x ŕ (ť). n'ii) = b'it) x r'it) + K(ť)b(ť) x h (ŕ) = = -t(ť)n(ť) x r'it) + Kit)i-r'it)) = = x(t)b(t) - icit)r'ii). Postupně jsme pro všechny body s nenulovou druhou derivací křivky r(t) parametrizované délkou oblouku odvodili význačnou bázi (/ (ř), nit), bit)), které se v klasické literatuře říká Frenetův repér a zároveň jsme v této bázi vyjádřili derivace jejích komponent formou tzv. Frenetových-Serretových vzorců -%-(?) = Kit)nit), -^-it) = xit)bit) - Kit)r'(i), dt dt db dt it) = -rit)nii). 339 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET □ 6.38. Poznámka. Vrcholy elipsy (obecně uzavřené hladké křivky v rovině) lze definovat jako body, ve kterých má funkce křivosti nějaký extrém. To, že elipsa měla čtyři vrcholy není náhoda. Platí tzv. „Věta o čtyřech vrcholech", sice že uzavřená křivka třídy C3 má alespoň čtyři vrcholy. (Křivka třídy C3 je lokálně dána parametricky body [/(/), g(t)] e K2, t e (a, b) c K, kde / i g jsou funkce třídy C3 (K).) Křivost elipsy v jakémkoli jejím bodě se tedy nalézá mezi křivostmi v jejích vrcholech, tj. mezi \ a V2. B. Integrování Nejprve několik jednoduchých příkladů, které by měl zvládnout každý. 6.39. Užitím základních vzorců vypočtěte (a) / -j= dx, x £ 0; (b) / tg2 x dx, x ^ | + ku, kel; (c) ľ dx, x ± -f + 2kit, k e Z; (d) / 6 sin 5x + cos | + 2 e^" ífa, iěI. Řešení. Případ (a). Ihned určíme fj,dx = fx-1'3 dx = 4 + C = l>Yxž + C, přičemž zápisu, ve kterém přičítáme C e K, je třeba rozumět tak, že všechny primitivní funkce získáme právě pomocí konstantního posunutí libovolné primitivní funkce. To ovšem platí pouze na intervalu. Jinak řečeno, hodnota C je obecně různá pro x < 0 a pro x > 0. Měli bychom tedy uvažovat hodnoty C\ a C2. Pro jednoduchost budeme ale používat zápis bez indexů a uvádění příslušných intervalů. Navíc si budeme pomáhat položeními aC = C pro aeK\{0}aC + fc = C pro b € K, která jsou založena na skutečnosti, že {C; C e K} = {aC; C e K} = {C + b; C e K} = K. Všimněme si, že pokud křivka r(ř) leží stále v jedné rovině, pak je její torze identicky nulovou funkcí. Ve skutečnosti platí i obrácené tvrzení, které tu nebudeme dokazovat, vyplývá ale z následujícího klasického výsledku geometrické teorie křivek: Dvě křivky v prostoru parametrizované délkou oblouku lze jednu na druhou zobrazit pomocí euklidovské transformace, právě když jejich funkce křivosti a torze splývají, až na konstantní posuv parametru. Navíc, pro každou volbu hladkých funkcí /car existuje hladká křivka s těmito parametry. Tento výsledek tu nebudeme dokazovat. Přímým výpočtem můžeme zkontrolovat, že křivost grafu funkce y — f (x) v rovině a křivost k této křivky zavedené v tomto odstavci splývají. Skutečně, výpočtem derivace složené funkce s pomocí diferenciálu délky oblouku pro graf funkce ve tvaru dt = (1 + (fx)2ý/2dx, dx = a + (fxfTlíldt (píšeme zde fx — ^) dostaneme pro náš jednotkový tečný vektor grafu křivky vztah r'(f) = (x'(f), y'(t)) = ((1 + (fxÝr1'2, fx(l + (fxÝr1'2) a poměrně nepřehledným, ale obdobným výpočtem druhé derivace a její velikosti skutečně obdržíme «2=l|/'l|2 = (^)2(l + (/x)2r3. 6.17. Aproximace derivací a asymptotické odhady. Hned na začátku této učebnice jsme v odstavcích 1.3, 1.9 a dále diskutovali, jak zadávat hodnotu funkce pomocí f"^x. \ změn, tj. diferencí. V další části textu budeme ob-•í^jrfa^-j— dobně rekonstruovat funkci / z jejích derivací, tj. okamžitých změn. Předtím se ale pozastavme u souvislosti derivací a diferencí. Klíčem nám k tomu bude Taylorův rozvoj se zbytkem. Předpokládejme, že z (dostatečně) diferencovatelné funkce f (x), definované na intervalu [a,b], známe hodnoty /; = /(*;) v bodech xq — a,x\,x2, ... ,xn — b, přičemž pro všechny indexy i — 1, ..., n platí xí — Xj-i — h > 0 pro nějakou konstantu h. Taylorův rozvoj pro funkci / v bodě pišme ve tvaru hl h3 f(xt ±h) = fi± hfixi) + y/"(*;) ± ^-/(3)fc) + ■ ■ ■ 340 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Zcela korektní vyjádření bychom pak obdrželi např. substitucemi C = aC, C = C + b. Tato zjednodušení prokáží svou užitečnost při počítání náročnějších příkladů. Činí totiž postupy a úpravy přehlednějšími. Případ (b). Postupné úpravy integrované funkce vedou na ■ dx = J 2 dx — J Idx = tgx — x + C, kde jsme si pomohli znalostí derivace (tgx)' = -^, xŕj + kjt,k e Z. Případ (c). Stačí si uvědomit, že se jedná o speciální případ vzorce fj$dx=hi\f(x)\+C, jenž můžeme přímo ověřit derivováním (In \m\+Q' = (In [±f(x)])'+(Q' = = W; = TU' Platí tudíž /iSíI x ŕ -L Řešení. Snadno získáváme (a) f erx dx = — f — erx dx (c) JzT^dx -e"1 + C; ífa = arcsin % + C; -Larctg^ + C: VŠ dx = ln\x + 3x + 2 \+ C, kde jsme využili vzorec / 4t^ dx = ln | f (x) \ + C . □ 6.41. Spočtěte neurčitý integrál f hx +4eT - i +9sin5x + 2cosf--V" + T~) dx J y 2X 2 cos2 x 3— x J pro x^z3,x^zj+kit,keZ. Řešení. Pouze spojením dříve odvozených vzorců dostáváme ľ hx +4eT - ± + 9sin5x +2cosf--3Í—h dx <> \ 2X 2 cosz x 3— x J Víme, že když v rozvoji skončíme členem řádu k v h, tj. výrazem obsahujícím /í*, pak se dopustíme chyby, která je omezená odhadem výrazu uk+l 11 f(k+\) ŕK+l,(x) (k + l)V na intervalu [x; — h, xj + h]. Pokud je (k + l)-ní derivace / spojitá, můžeme ji odhadnout konstantou. Vidíme pak, že se pro malá h chová chyba aproximace pomocí Taylorova polynomu stupně k stejně jako hk+l, až na konstantní násobek. Takovému odhadu se říká asymptotický odhad. Definice. Řekneme, že výraz G(h) je pro h -» 0 asymptoticky stejný s výrazem F (h) a píšeme G(h) = 0(F (h)), jestliže existuje konečná limita lim-=aei. h^O F(h) Označme si hledané odhady hodnot derivací f(x) v bodech x, jako f-1"1 a pišme Taylorův rozvoj stručně takto: r M r'" fi+l = fi ± fh + ±-h2 ± IL-h3 + ... 2 o Pro odhady první derivace můžeme okamžitě použít tři různé diference spočtené z Taylorova rozvoje: fi (1) fi+l - fi- l h2 2h 3! r(ľ) fi+l - Í } h Ji - h 2! J ,(1) fi ~ fi- Ji ~ h 2! f 0; Řešení. / in x dx u = In x u' = v' = 1 v = x \dx = x\nx—x-\-C, S ■ x in x — j x cos x dx u = x u' = 1 v' = cos x v = sin x J sinx dx = x sinx + cosx + C. □ 6.43. Metodou per partes vypočítejte (a) / (x2 + l) e,-* dx, x e K, (b) f (2x — 1) in x dx, x > 0, (c) f arctgx dx, x e K, (d) f e* sin x dx, x e K, Řešení. Nejdříve vyzdvihněme, že metodou per partes lze vypočítat každý integrál ve tvaru J P(x)abx dx, J P{x)sin{bx) dx, J P{x)cos{bx) dx, j P (x) log^ x dx, J ŕ log^ (kx) dx, J P (x) arcsin (bx) dx, J P (x) arctg (bx) dx, f abx sin (cx) dx, kde P je libovolný polynom a a e (0,1) U (1, +oo), i,cel\(0), n e N, k > 0. / P (x) arccos (bx) dx, J P (x) arccotg (bx) dx, f abx cos (cx) dx, dF — f(x)dx. Funkci F nazýváme primitivní funkce nebo neurčitý integrál funkce / a tradičně píšeme F(x) = J f(x)dx. Lemma. Primitivní funkce F(x) k funkci f (x) je na každém intervalu [a, b] určena jednoznačně až na aditivní konstantu. Důkaz. Tvrzení je okamžitým důsledkem Lagrange-ovy věty o střední hodnotě, viz 5.38. Skutečně, pokud je F'(x) = G'(x) = f(x) na celém intervalu [a, b], funkce (F — G)(x) má ve všech bodech c intervalu [a, b] nulovou derivaci. Pak ale podle věty o střední hodnotě pro všechny body x v tomto intervalu F(x) - G(x) = F(a) - G(a) + 0 • (x - a). Musí tedy být rozdíl hodnot funkcí F a G stejný na celém intervalu [a,b]. □ Předchozí lemma nás vede k tomu, že neurčitý integrál obvykle zapisujeme ve tvaru F(x)-- s neznámou konstantou C. f f(x)dx + C O" Xi yCy }o Hodnotu reálné funkce f(x) můžeme také považovat za okamžitý přírůstek plochy vymezené grafem funkce / a osou x a snažit se najít velikost této plochy mezi krajními hodnotami a a b nějakého intervalu. Zkusme tuto představu dát do souvislosti s neurčitým integrálem. Předpokládejme tedy, že na intervalu [a, b] známe reálnou funkci a její neurčitý integrál F(x), tj. F'(x) = f(x). Jestliže rozdělíme interval [a ,b]nan částí volbou bodů a — xq < x\ < ■ ■ ■ < xn — b a přiblížíme hodnoty derivací v bodech výrazy F(xi+i) - F(xí) f(xi) = F'(xí) : Xi + \ 342 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Proto víme, že (a) J (x2 + 1) e x dx (b) /(2x- 1) ln x dx S (c) / arctg x dx S (d) / ď sin x dx F (x) = x2 + 1 G'(x) = e-* F'(x) = 2x G(x) = — e~ - (x2 + l) e-* + J 2x e~x dx F (x) = 2x F'(x) = 2 G'(x) = e~x G(x) = -e-x -(x> + í)e-x-2xe-x + f2e-xdx - (x2 + 1) e"* - 2x e-x — 2eTx + C --e-* (x2 + 2x + 3) + C; F (x) = ln x G'(x) = 2x - 1 F'(x) = l/x G(x) = x2 - x2 (x2 — x) ln x — y-dx (x2 — x) ln x + y 1 — x dx = (x2 — x) ln x + x---h C; F (x) = arctg x G'(x) = 1 : x arctg : x arctg x F'(X) : G(x) = dx 1 l+I2 *-/iTx 1 ľ 2x X~2j T+x dx ■ ■ x arctg x — - ln (l + x2) + C; F (x) = e1 G'(x) = sin x F'(x) = e1 G(x) = — cos x e'cosx + yVcosx dx F (x) = e1 G'(x) = cos x F'(x) = e1 G (x) = sin x e*cosx+e*sinx-/Vsinxdx, odkud plyne J ex sinx dx = 5 e1 (sinx — cosx) + C □ Pro vyjádření následujících integrálů je výhodné použít substituční metodu (viz 6.21). 6.44. Integrujte (a) f cos5 x • sinx dx, x e K; (b) J cos5 x • sin2 x dx, x e K; (c) /-^dx,xe(-f,f); (d) l-fí+^ dx, x > 0. dostáváme součtem přes všechny intervaly našeho dělení odhad hledané velikosti plochy: > /(x;) • (x;+i - Xi) ~ > - • (xi+i - x;) = r-ť r-ť xi+i - x,- í=U í=U = F(b) - F (a). Dá se tedy očekávat, že pro „dostatečně pěkné" funkce f (x) velikost plochy vymezené grafem funkce a osou x skutečně spočteme jako rozdíl hodnot primitivní funkce v krajních bodech intervalu. Tomuto postupu se říká Newtonův integrál. Píšeme /* J a f(x)dx = [F(x)]ba = F(b) - F (a) a hovoříme také o (Newtonově) určitém integrálu v mezích a, b. V případě komplexní funkce / je reálná a imaginární část jejího neurčitého integrálu jednoznačně dána reálnou a imaginární částí /, budeme proto dále bez dalších komentářů pracovat s reálnými funkcemi a ke komplexním se vrátíme v aplikacích, jak je to bude třeba. 6.19. Integrace „po paměti". Ještě než si uděláme jasno, jak ■ Newtonův integrál skutečně souvisí s velikostí plochy a jak jej případně lze používat pro modelování praktických problémů, ukážeme několik postupů, jak Newtonův integrál spočítat. Budeme přitom využívat jen naše znalosti o derivacích. Nejsnadnější je případ, kdy v integrované funkci umíme derivaci přímo uvidět. K tomu v jednoduchých případech stačí číst tabulky pro derivace funkcí v našem zvěřinci naopak. Dostáváme tak např. následující tvrzení pro všechna aeManeZ, n^—1: / / / / / / / / / / / / a dx = ax + C ax" dx = -2tx"+1 e ' a — dx — ainx + C a cos(Ŕx) dx — I sin(Ŕx) + C a sin(Ŕx) dx — — | cos(foc) + C a cos(Ŕx) sin"(£>x) dx b(n+\) a sin(Ŕx) cos™ (bx) dx a Mn + \) a tg(bx) dx —--ln(cos(£>x)) + C b a únn+\bx) + C cosn+\bx) + C a1 + xŕ ■ dx = arctg (J) + C -1 1 dx ■ dx ■ c. Va2 - x2 Ve všech případech je zapotřebí dobře promyslet definiční obor, na kterém je neurčitý integrál dobře definován. 343 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Řešení. Případ (a). Jde o jednoduchý příklad na tzv. první substituční metodu, jejíž podstatou je zapsat integrál ve tvaru (6.7) j f( |; (b) f Oá^Äl dx, x > Q; / s f cos j: v ' j (l+sini): (d) / C0SX dx, x ŕ ^f^, k € Z; dx, x e K. K takovýmto tabulkovým pravidlům pro integraci lze relativně snadno dodávat další pravidla jednoduchými pozorováními vhodné struktury integrovaných funkcí. Např. /'(*) / dx = ln|/(x)| + C pro všechny spojitě diferencovatelné funkce / na intervalech, kde jsou nenulové. Samozřejmě také z pravidel pro derivaci součtu diferencovatelných funkcí a konstantních násobků diferencovatelných funkcí je zřejmé že obdobná pravidla platí neurčitý integrál také. 6.20. Integrace per partes. Výpočet integrálu pomocí primitivní funkce (neurčitého integrálu), spolu s pravidlem (F ■ G)'(t) = F'(t) ■ G(i) + F(i) ■ G'(i) pro derivaci součinu funkcí, dává následující formuli pro neurčitý integrál F(x)-G(x) + C = / F'(x)G(x) dx+ F(x)G'(x) dx. Tato formule se většinou používá tak, že jeden z integrálů napravo je ten, který máme spočíst, zatímco druhý umíme spočítat snáze. Nejlépe je princip vidět na příkladu. Spočteme I — j x sinx dx. V tomto případě pomůže volba F(x) — x, G'(x) — sinx. Odtud G(x) — — cos x a proto také I — —x cos x — j — cos x dx — —x cos x + sin x + C. Obvyklým trikem je také použít tento postup s F' (x) — l: jlax dx — J1 ■ Inx dx — x Inx — J —x dx — x Inx — x + C. 6.21. Integrace pomocí substituce. Další užitečný postup j e odvozen z derivování složených funkcí. Jestliže F'(y) = f(y), y = (l+sm;t) (d) / l+sin x cosx -dx u = t + Vi + t2 > o dt = - dx x I t = 1 + sin x dt = cos x dx t = sin x dt = cos x dx du í+Vi+í2 /í+? Jfdt _ r á ~ J fi = ľ^=dt = J */l+fi f - du = ln w + C + c + C: :ln + Vi +í2) + C = ln (sin* + y71 + sin2 x) + C. □ 6.46. Určete (a) f ífa, x ^ f + ifc jt, k e Z ; (b) / x2 e-3x dx, i6B; (c) f cos2 a: dx, ieR Řešení. Případ (a). Metodou per partes dostáváme f dx j cosz x F(X) = G'ix) = XtgX + f^^dx : & j cos x F'(x) = 1 G(x) = tgx x tg x + ln | cos a | + C xtgx — f tgx dx Případ (b). Tentokráte očividně integrujeme součin dvou funkcí. Aplikováním metody per partes integrál převádíme na jiný integrál tak, že jednu funkci derivujeme a druhou integrujeme. Integrovat umíme obě (derivovat umíme všechny elementární funkce). Musíme se proto rozhodnout, kterou ze dvou variant metody použijeme (zda budeme integrovat funkci y = x2, nebo y = e-3*). Uvědomme si, že per partes můžeme použít opakovaně a že rc-tá derivace polynomu stupně n e N je konstantní polynom. To nám dává způsob, jak lze spočítat j x2 e 3x dx e i x2 e,-3x F{x) = x2 G'ix) = e" + IJxí '■ dx a dále f xe 3x dx Fix)--G'ix) F'ix) Gix)-- F'ix) Gix)-- 2x ldx : "3 e 3 e _ I p-3* + c. Jako příklad ověříme touto metodou předposlední integrál v seznamu v 6.19. Pro integrál I = / VI- : dx VT^x2 zvolíme substituci x = sin t. Odtud dx — cos t dt a dostáváme ľ 1 /" 1 / — cos t dt — l —== ' s/l- sin2 ř V cos2 ř cos t dt ■- = J dt = ŕ + C. Zpětným dosazením t — acrsin x dopočítáme již známý vztah I — arcsinx + C. Při substitucích je třeba dát pozor na skutečnou existenci inverzní funkce k y = 2A + B = 2, A + B = 4. Odtud již přímo vychází náš rozklad. Říká se mu rozkladná parciální zlomky. Tento elementární postup lze snadno zobecnit. Jde o čistě algebraickou úvahu opírající se o vlastnosti polynomů, ke kterým se budeme vracet v kapitole jedenácté. Předpokládejme, že jmenovatel g(x) a čitatel f (x) nesdílí žádné reálné ani komplexní kořeny a že g(x) má právě n různých 346 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Případ (b). Podobně obdržíme t = x2 J x arcsin x2 dx = F (t) = arcsin/ G'(t) = 1 1-í2 | —2tdt I dt = 2x dx | 2 F'(i) ~ -± \ J arcsin / dt Git) = t h arcsin t — i f ,' . dt 1 1 J y/l-ŕ u ■ du i/arcsin/ + i f ^ = ^t arcsint + ^^/u + C ■ - \t arcsin / + \*J\ - t2 + C = \x2 arcsin x2 + 5 Vi - x4 + C. □ 6.48. Dvěma různými způsoby vypočítejte integrál f Vl — x2 dx, Řešení. Metoda per partes dává x e (-1,1). f V1 — x2 dx F{x) = -Jl-x2 Gix) = 1 F'ÍX) : \-x2 Gix) = x 1-'2-1 dx :xVT^X2+ í^=dx = XyT^X2 - fíjě^. = x Vl — x2 — f Vl — x2 dx + f , 1 , dx J J J\-x2 ■ x Vl — x2 — f V1 — x2 dx + i odkud plyne 2 f V1 — x2 dx = x Vl — x2 + arcsin x + C, J Vl — x2 dx = ť\(^x Vl — x2 + arcsinxj + c Substituční metodou pak s pomocí (||6.8||) dostáváme f V1 — x2 dx x = sin y dx = cos y dy J Vl — sin2 y ■ cos y dy = J cos2 y dy = | iy + sin y ■ cos y) + C = ť\ ^siny ■ Vl — sin2 y + yj + c = \ i^x Vl — x2 + arcsinx^j+c, kde y e i—it/2, it/2) pro x e (—1,1), amj. tak je 0 < cos y = I cos y | = Vcos2 y = \/l — sin2 y . □ 6.49. Stanovte / e^ dx, x > 0. Řešení. Touto úlohou lze ilustrovat možnosti kombinování substituční metody a metody per partes (v rámci jednoho příkladu). Nejprve použijeme substituci y = sfx, abychom odstranili odmocninu z argumentu exponenciální funkce. Tím přejdeme k integrálu y2=x 1 2y dy = dx Nyní pomocí per partes určíme / e^ dx 2fyeydy. Jyeydy- Fiy) = y G'iy) = e- F'iy) = 1 Giy) = ď yey — ey + C. v e i c í/v Celkem tedy je Je^dx = 2yey - 2ď + C = 2e^(V^-l) +C . □ reálných kořenů a\, ..., an. Pak jsou body a\, ... an právě všechny body nespojitosti funkce f (x)/g (x). Pro zjednodušení úvahy nejprve pišme g (x) jako součin gix) = pix)qix) dvou nesoudělných polynomů. Díky Bezoutově identitě (viz 11.21 na str. 664), která je důsledkem obyčejného dělení polynomů se zbytkem, existují polynomy a(x) a b(x) se stupni ostře menšími než je stupeň g takové, že a(x)p(x) +b(x)q(x) — 1. Vynásobením této rovnosti podílem fix)/g ix) dostáváme fix) aix) bix) - =-fix) H--fix). gix) qix) pix) Předpokládejme nyní, že náš polynom gix) nemá jiné než reálné kořeny, má tedy jednoznačný rozklad na faktory (x — a,-)"', kde n i jsou násobnosti kořenů a,-, i = 1, ..., k. Postupným použitím předchozího postupu s nesoudělnými polynomy pix) a qix) dostaneme vyjádření fix)/gix) pomocí součtu zlomků ve tvaru r\jx) njx) (*-ai)»i "' ix-ak)mr kde stupně polynomů r, (x) jsou ostře menší než stupně v jmenovatelích. Každý z nich ale jde velmi snadno rozepsat jako součet rjx) Ai A2 A„ ix — a)" x — a ix — a)2 ix — a)" ' když začneme od nej vyšších mocnin v polynomu r(x) a postupně počítáme A\, A2, ... vhodným doplňováním a odebíráním sčítanců v čitateli. Např. 1 5 6 5x - 16 x-2 ■ 5- ix - 2)2 ix - 2)2 (x-2)2 x-2 {x- 2)2' Zbývá ošetřit ještě případ, kdy reálných kořenů není dostatek. Vždycky ale existuje rozklad gix) na lineární faktory s případně komplexními kořeny. Opakování předchozí úvahy pro komplexní polynomy nám dá tentýž výsledek. Pokud ale předem víme, že koeficienty polynomů jsou reálné, budou komplexní kořeny v našich výrazech vystupovat vždy po dvojicích komplexně sdružených kořenů. Můžeme proto rovnou pracovat s kvadratickými faktory ve tvaru součtu čtverců (x — a)2 + b2 a jejich mocnin. Naše předchozí úvaha opět dobře funguje a zaručuje, že bude možné hledat příslušné sčítance ve tvaru Bx + C Hx - a)2 + b2)" ' Obdobně jako v případě reálných kořenů se tedy i v případě mocniny iix — a)2 + b2)" takového kvadratického (nerozložitelného) faktoru vždy podaří najít odpovídající rozklad na parciální zlomky tvaru Aix + Bi A„x + Bn ix - a)2 + b2 Hx - a)2 + b2)n ' Konkrétní výsledky lze také snadno ozkoušet v Maplu pomocí volání procedury „convert(h, parfrac, x)", které rozloží výraz h racionálně závislý na proměnné x na parciální zlomky. Všechny výše uvedené parciální zlomky už umíme integrovat. Připomeňme, že ty poslední zmíněné vedou mimo jiné na integrály diskutované v Příkladě 6.22. 347 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.50. Dokažte, že 1 . , 1 1 3 -- cos(2x) + — cos(4x) + — ■ Řešení. Snadnější, než porovnávat dané výrazy přímo, je ukázat, že funkce na pravé a levé straně rovnosti mají shodné derivace. Je totiž Ľ = 2 cos x sin3 x = sin(2x) sin2 x, P' = j sm(2x) — j sin(4x) = sin2x (\ — \ cos(2x)) = = sin(2x) sin2 x. Levá a pravá strana se tedy liší o konstantu. Tuto konstantu určíme porovnáním funkčních hodnot v jednom bodě, například bodě 0. Hodnota obou funkcí je v nule nulová, jsou si tedy rovny. □ C. Integrace racionálních lomených funkcí 6.51. Spočítejte dx, x^l. -\)2(x2+2x+2) Řešení. Protože je stupeň polynomu v čitateli nižší než ve jmenovateli, tyto polynomy nemají společný kořen a je zadáno vyjádření jmenovatele ve tvaru součinu kořenových činitelů, známe tvar rozkladu integrované funkce na parciální zlomky — A _1_ B _1_ Cx+D (x-l)2(x2+2x+2) ~ x-\ ^ (x-l)2 ' x2+2x+2 pro A, B,C, D € K. Pokud tuto rovnici vynásobíme jmenovatelem levé strany, dostaneme identitu x = = A (x - 1) (x2 + 2x + 2) + B (x2 + 2x + 2) + (Cx + D) (x - l)2 , která má platit pro všechna x e K \ {1}. Na obou jejích stranách jsou ale polynomy, a tak rovnost musí nastat rovněž pro x = 1. Dosazením této hodnoty ihned obdržíme, žel = B(l + 2 + 2), tj. B = 1/5. Mohli bychom volit další reálná (příp. komplexní) čísla a dosazovat je do uvedené rovnice. Nelze však již očekávat, že bychom tím přímo určili další z neznámých (pokud nedosadíme kořen jmenovatele). Raději proto budeme porovnávat koeficienty u stejných mocnin polynomů x - \ {x2 +2x + 2) = -\x2 + \x - \, A (x-l) (x2 + 2x + 2) + (Cx + D)(x- l)2 = = (A + Q x3 + (A - 2C + D) x2 + (C - 2D) x - 2A + D, čímž získáme systém rovnic 0 = A + C, -1/5 = A — 2C + D, 3/5 = C — 2D, -2/5 = -2A + D. Celkově můžeme shrnout, že racionální funkce f(x)/g (x) lze poměrně snadno integrovat, pokud se podaří najít příslušný rozklad polynomu ve jmenovateli g(x). Při výpočtu Newtonových integrálů jsou ale problematické body nespojitosti racionálních funkcí lomených, v jejichž okolí jsou tyto funkce neohraničené. Tomuto problému se budeme obecně ještě věnovat později (viz odstavec 6.30 níže). 6.24. Riemannův integrál. Myšlenku počítat integrál jako vyjádření plochy vymezené grafem funkce a osou x je třeba zpřesnit. To nyní učiníme a vzápětí dokážeme, . že pro všechny spojité funkce tato definice dává stejné výsledky jako Newtonův integrál. Uvažme reálnou funkci / definovanou na intervalu [a, b] a zvolme dělení tohoto intervalu spolu s výběrem reprezentantů f jednotlivých částí, tj. a = xq < x\ < ••• < x„ = b a zároveň f; e [xj-i, xi], i = 1, ..., n. Normou dělení nazýváme číslo S = min,- {xí — jc,-i). Riemannův součet odpovídající zvolenému dělení s reprezentanty = (x0, ...,*„; fi, ..., f„) definujeme jako Se = £/&)•(*; -*;-i). fi ^sl Šfr Řekneme, že Riemannův integrál funkce / na intervalu [a, b] existuje, jestliže pro každou posloupnost dělení s reprezentanty (Eí)^q s normami dělení jdoucími k nule existuje limita lim SSt = S , jejíž hodnota navíc nezávisí na volbě posloupnosti dělení a jejich reprezentantů. Píšeme v takovém případě 5 = t f(x)dx. Tato definice nevypadá příliš prakticky, nicméně nám dovolí snadno zformulovat a dokázat řadu jednoduchých vlastností Rie-mannova integrálu: Věta. (1) Je-li f omezená reálná funkce definovaná na intervalu [a, b] a c e [a, b] je nějaký vnitřní bod tohoto intervalu, potom 348 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Podotkněme, že tato soustava musí mít právě jedno řešení (které je jednoznačně určeno libovolnými třemi z uvedených rovnic). Hledané řešení potom je A - ±- r--i n — _JL " ~ 25' ^ ~ 25' ^ ~ 25 • Platí tak f _i_fix - f —^__I- f —^__f _í±8_fjx - J (x-l)2(x2+2x+2) UX ~ J 25(x-l) + J 5(x-l)2 ■> 25(x2+2x+2) "X ~ = élnl*-H- M-jj-i ln(x2 + 2x+2)-- ^ arctg (x + 1) + C, kde jsme využili / i2+if+2 dx = ! x2+2x+2 + i2+2i+2 dx = \! x2+2x+2 dx + + 7 / (i+/)2+1 dx = i ln (x2 + 2x + 2) + 7 arctg (x + 1) + C. □ 6.52. Integrujte (a) / dx, x ^ 2; (b) dx,x^-4; (oi-^r^xeK; dx, x e (i2-6i+13)z Řešení. Případy (a), (b). Platí ■) x—2 a podobně ľ — v = x — 2 dy = dx I /^dy =61n| v|+C = 61n|x-2|+C (fa : v =x + 4 dy = dx I + C: + C. -" -2y2 1 (x+4)2 Vidíme, že integrování typů parciálních zlomků, které odpovídají reálným kořenům jmenovatele racionální lomené funkce, je velmi snadné. Navíc zcela obecně lze obdržet f-t-dx f , A ,„dx y = x — x0 dy = dx | J y Aln|v|+C = Aln|x f$dy = xq I + C y = x - x0 dy = dx ■í^dy = A y~ -n+l ■ + c (l-n)(x-x0)" pro každé A, x0 e K, n > 2, n e N. Případ (c). Nyní máme integrovat parciální zlomek odpovídající dvojici komplexně sdružených kořenů. Ve jmenovateli je tedy polynom stupně 2 a v čitateli stupně nejvýše l.Pokudje stupně 1,zapíšeme parciální zlomek tak, abychom v čitateli měli násobek derivace jmenovatele a k tomu přičítali zlomek, v jehož čitateli je již pouze konstanta. Takto dostaneme / i2-4i+15 dx ln(x2 -4x + 15) + 13| — dx -Ax+\í (i-2)2+n integrál Ja f(x)dx existuje tehdy a jen tehdy, když existují oba integrály f(x)dxa J*6 f(x)dx. V takovém případě pak také platí ŕ f(x)dx = r f(x)dx + f f(x)dx. Ja Ja Jc (2) Jsou-li f a g dvě reálné funkce definované na intervalu [a, b]a jestliže existují integrály f% f(x)dx a g(x)dx, pak existuje také integrál jejich součtu a platí f (f(.x) + g(x))dx = í f(x)dx + í g(x)dx. Ja Ja Ja (3) Je-li f reálná funkce definovaná na intervalu [a,b], C e M. Je konstanta a jestliže existuje integrál f% f(x)dx, pak rb existuje také integrál ja C • f(x)dx a platí rb rb / C • f(x)dx — C ■ I f(x)dx. J a J a Důkaz. (1) Předpokládejme nejprve, že existuje integrál přes celý interval. Jistě se lze při jeho výpočtu omezit na limity Rie-mannových součtů, jejichž dělení mají bod c mezi svými dělícími body. Každý takový součet dostaneme j ako součet dvou dílčích Rie-mannových součtů. Pokud by tyto dílčí součty v limitě závisely na zvolených rozděleních a reprezentantech, pak by celkové součty nemohly být v limitě na volbách nezávislé (stačí ponechat jednu posloupnost dělení podintervalu stejnou a druhou měnit tak, aby se limita změnila). Naopak, jestliže existují Riemannovy integrály na obou podin-tervalech, jsou libovolně přesně aproximovatelné Riemannovými součty a to navíc nezávisle na jejich volbě. Pokud do libovolné posloupnosti Riemannových součtů přes celý interval [a, b] přidáme v jejich děleních jeden dělící bod c navíc, změníme hodnotu celého součtu i částečných součtů přes intervaly patřící do [a, c] a [c, b] nejvýše o násobek normy dělení a možných rozdílů omezené funkce / na celém [a,b]. To je číslo jdoucí libovolně blízko k nule při zmenšující se normě dělení. Proto nutně i částečné Riemannovy součty naší funkce nutně konvergují k limitám, jejichž součtem je Riemannův integrál přes [a, b]. (2) V každém Riemannově součtu se součet funkcí projeví jako součet hodnot ve vybraných reprezentantech. Protože je násobení reálných čísel distributivní, vyplývá odtud právě dokazované tvrzení. (3) Stejná úvaha jako v předchozím případě. □ Následující výsledek je zcela zásadní pro pochopení vztahu mezi integrálem a derivací: 6.25. Věta (Základní věta integrálního počtu). Pro každou spojitou funkci f na konečném intervalu [a, b] existuje její Riemannův integrál f(x)dx. Navíc je funkce F (i) zadaná na intervalu [a, b] pomocí Riemannova integrálu F(x) = f f(i)dt J a primitivní funkcí k f na tomto intervalu. Celý důkaz tohoto významného tvrzení bude poněkud delší. V prvním kroku pro důkaz existence integrálu použijeme alternativní definici, ve které nahrazuj eme výběr reprezentantů a příslušné hodnoty /(£;) pomocí suprem Ař; hodnot f (x) v příslušném intervalu [x;_i,x;], resp. pomocí infim m; funkce f (x) tamtéž. 349 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET í ln (x2 - 4x + 15) + |f / +i y lln(x2-4x + 15) +jLf^ x-2 Vri J y2+\ = f ln (x2 - 4x + 15) + -jL arctg y + C = = §ln(x2-4x + 15) + ^fTarctg^Tf+ C. Opět můžeme obecně vyjádřit í — r (fa : A r 2(x-xo) dx + (B + A XQ) f -1 2 J (x-x0f+a2 y u/ J (x-x0f+a2 dx sl spočítat f , 2(x-ln) 2 dx ■' (x-xof+a2 y = (x - x0)2 + a2 dy = 2 (x — xq) dx ■ f Úl í 7-\r-2 dx = \(- ■' (x-xof+a2 a2 J /x_ ln | y | + C = ln[(x - x0) + a2] + C, dz $x l-í a J dz z2+l iarctgz +C = Iarctg^ + C, f — J (x- : dx ln ((x - x0)2 + a2) + ^±fa xclg ^ + C, -xo)2+a2 kde hodnoty A, B, xq e K, a > 0 jsou libovolné. Případ (d). Zbývají parciální zlomky pro vícenásobné komplexní kořeny ve tvaru r, A*t* 21-. A,B,io e 1, a > 0,n e f}\ {1}, [(i-io) + 0 najdeme vždy N takové,že pro k > N bude 5at,SUp k 5SUp blíže než 350 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET I : dx y = x2 — 6x + 13 dy = (2x — 6)dx ■ dy_ + C: :dx = j x2-6x+\3 dx + c, (x2-6x+\iy J [fa-3)2+22]z ¥ (V ^1(3- 2) + \ (z-3f+22) = í(l^T + C + !?17+i) Celkem tak máme 30x-77 (i2-6i+13)z dx 12 ■ 16 ' TS arctS : x2-6x+13 2 i2-6i+13 + C. jfarctg^ 13x-159 i2-6i+13 + C 8(i2-6i+13) 6.53. Integrujte racionálni lomené funkce (a) / "r v / •> x (x + c. □ -+^1-5 dx, x ŕ 0, x ŕ 1; i-4 ^IjMt-3^^' (C> / (x-4)(x-2)1(x2+2x+2) dx,XŽ2,xŕ 4; (d) / rf^+i x *l> (e) /tí^w^^k; ® / i"-12i3+62i2-156i+169 ^ * € K- Řešení. Všechny zadané integrály budeme počítat takovým způsobem, jakým lze postupovat při integrování racionálních lomených funkcí vždy. Nepoužijeme tedy žádnou specifickou úpravu či substituci. Dokonce rekurentní vzorec ||6.52|| pro Kn+i(x0, a), který jsme odvodili v obecné podobě, použijeme pouze pro x0 = 0, a = 1 (a to také tehdy, když bude n = 0). Dříve uvedenými postupy tak získáváme (a) f — J x(x- ; dX ■ dx (x-iy ľ- 2m|*-l|--iT-7-L-I-ln|*|+C: fa-1)2 (b) dx = Tof Wx+6 5x2+6x+3 = ± ln (5x2 + 6x + 3) dx ■ dx 10 J 5x2+6x+3 23 25 J H) dx 23 r dx 5 J 5x2+6x+3 ±ln(5x2+6x + 3)-2if dt 5x+3 ŕ ~6dX = i.m{5x2+6x + 3)_2_3^J^_ i ln (5X2 + 6x + 3) -= i ln (5x2 + 6x + 3) 233^arctgr + C = -^arctg^ + C; (c) / fa-4 fa-4)fa-2)fa2+2;t+2) 1_ f dx___1_ ľ _dx_ , J_ f 4x+ll j i2 J i-4 20 J x-2 130 J ' ' " ' " "A 52 _ _i 20 i_lnU _2| + _|_ (2/_ =Lln|*-4|- $Ž+2 dx +11 ^+2!+2) = o £. Zároveň ale umíme podle předchozí úvahy najít S tak, že pro všechna dělení s normou menší než S budeme se součtem blíže než o 2e. Právě jsme proto ukázali, že pro libovolné číslo £ > 0 umíme najít takové S > 0, že pro všechna dělení s normou nejvýše S bude |5SUp — 5s | < £. To je přesně tvrzení, že číslo 5SUp je limitou všech posloupností horních součtů s normami dělení jdoucími k nule. Úplně stejně se dokáže i tvrzení pro součty dolní. Pokud Riemannův integrál neexistuje, existují posloupnosti dělení a reprezentantů s různými limitami Riemannových součtů. Pak ovšem z již dokázaného tvrzení plyne, že budou různé i limity horních součtů a dolních součtů. Naopak, předpokládejme, že ■Ssup — Siní, pak ovšem i všechny Riemannovy součty posloupností dělení musí mít tutéž limitu díky nerovnostem (6.3). □ 6.27. Stejnoměrná spojitost. Prozatím jsme ze spojitosti naší funkce / využili pouze to, že každá taková funkce je na konečném uzavřeném intervalu omezená. Zbývá " 0 existuje takové číslo 8 > 0, že pro všechny z, y e [a, b] splňující \y-z\ <8platí\f(y)- f(z)\ < e. Důkaz. Protože je každý konečný uzavřený interval kompaktní, umíme jej celý pokrýt konečně mnoha okolími Os(x)(x) zmiňovanými v souvislosti se spojitostí výše, přičemž jejich poloměr 8(x) závisí na středu x, zatímco čísla £ budeme uvažovat pořád stejná. Zvolíme konečně za 8 minimum ze všech (konečně mnoha) 8(x). Naše spojitá funkce / tedy má požadovanou vlastnost (pouze zaměňujeme čísla £ a S za jejich dvojnásobky). □ 351 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 260 "* | (x-2) t = x + 1 | _ j dt = dx | _ 260 (x-Aý(x1+2x+2) ln (x-4)5(x2+2x+2) (x-2)13 130 J (i+l)2+l i__7_ r dt ~*~ 130 J (2+1 " 26Ôln 1 260 ln (x-2)" (x-4)5(x2+2x+2)4 (x-2)13 + -r^r arctgr + C + 14 arctg (x + 1) + C; (d) f * AY — 1 f dx _ I ľ dx J xi-x^-x+l 3 J fa-1)2 3 J x2+x+l 1 3(x-l) 1 H) 3(x-l) z+i+l dt V3 3(i-l) í2 + 2 f dt 3J3J fi + l 3(i-l) 3v^ arctg /+C : 3(i-l) 3v^ arctg ^+C; (e) J (i2+4i+13)2 ■' (i2+4i+13)2 "A J J (i2+4i+13)2 2+4i+13)2 ' t = x2 + 4x + 13 dt = (2x + 4)dx I [(*+2)2+9]' 1__1_ " t 27 íl du x+2 1 i2+4i+13 i/l " 9 J (m2+1)2 1 l(larctgM +I^) + C: i2+4i+13 9 1 arctg^-i^E-^ + C i2+4i+13 18 3 18 ^+2^2 1 1 = -i arctg ^ - \ I2_^8hl3 + C; (f) \dx = íp 12i3+62i2-156i+169 J (i2-6i+13): dx 1 f 30i-77 dx ■■ s r_*__i_ r _^ J J i2-6i+13 ^ J (x2 -&C+13)' dx 5 I (x-3)2+4 + 15 / (i2-fa+13)2 dx + 13 / (i2-6i+13)2 [(x-3)2+4]z t = | « = jt2 - 6x + 13 dt = jdx \ du = (2x — 6)dx | ■ arctg / 15 1 Íl f dt « 8 J ľŕ+lT f arctg ^ 2 u ' H J [fi+l — + t(\^' + 12 7+i) + C x2-6x+13 15 x-3 5 arctg + i arctg ^ + || -^+C : 2 «"»6 2 x2-6*+13 t 16' f arctg M + H arctg 15 i2-6i+13 W+1 S arnt(J £^3 , 13x-159 , r 16 arctg 2 + Sŕl2_<„ 1 111 + *- (i-3)z+4 8(i2-6i+13) 1 □ 6.54. Určete (b) f^dx,xjí ±1. 6.28. Dokončení důkazu Věty 6.25. Nyní již snadno dokončíme celý důkaz existence Riemannova integrálu. Zvolme JSty si £ a S jako v předchozí větě o stejnoměrné spojitosti a uvažujme jakékoliv dělení H s n intervaly a normou nejvýš 8. Pak V sup / (f) • O; -xí _1)-V inf / (f) • (je,- -xí _1) n < V| sup /(£) - inf • - AT;_i) < li-1 *i-l 0 číslo S > 0 tak, aby \f(x + Ax)-f(x)\ <£ pro všechna 0 < Ax < S na celém intervalu [a, b]. Rozdíl derivace naší funkce F(x) a integrované funkce f(x) je vyjádřen pomocí limity výrazů fX+Ax fx f(t)dt-j f(t)dtj -f(x) pro Ax jdoucí k nule. Pokud však volíme 0 < Ax < S, pak v absolutní hodnotě je tento výraz odhadnut px+Ax \ f(t)dt) - f(x) < £, Ax protože ve výrazu nalevo můžeme libovolně přesně nahradit integrál jeho Riemannovým součtem a ve sčítancích f(Ši)(xi — s f; e [x, x + Ax] v jakémkoliv Riemannově součtu jsou /(f) vzdáleny od f (x) nejvýše o velikost £. Proto nahrazením f(x) za všechny /(£;) dostáváme nalevo nulový výraz a dopouštíme se chyby nejvýše £. To ovšem znamená, že existuje v bodě x derivace funkce F (x) zprava a je rovna f(x). Stejně dokážeme výsledek pro derivaci zleva a celá věta 6.25 je dokázaná. 6.29. Důležité poznámky. (1) Věty 6.25 a 6.24 nám říkají, že integrál je lineární zobrazení / C[a,b] vektorového prostoru spojitých funkcí na intervalu [a, b] do reálných čísel. Je to tedy lineární forma na prostoru C[a, b]. (2) Dokázali jsme, že každá spojitá funkce je derivací nějaké funkce. Newtonův a Riemannův integrál tedy jako koncepty pro spojité funkce splývají. Riemannův integrál spojitých funkcí lze proto spočíst pomocí rozdílu hodnot F(b) — F (a) primitivní funkce F. (3) V prvním kroku důkazu věty 6.25 jsme dokázali důležité tvrzení, že pro omezenou funkci / na intervalu [a, b] vždy existují 352 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Řešení. Případ (a). Nejdříve musíme provést dělení polynomů (x3 + 2x2 + x - 1) : (x2 - x + 1) = x + 3 + ^z^~v abychom uvažovali ryze lomenou racionální funkci (stupeň čitatele byl nižší než jmenovatele). Nyní už spočítáme ľ *3+^2+*-' dx = fx + 3dx+ f-^±-dx = ■J xL — x + 1 •> •> xL— x + 1 2 2 J x2-x+l 2 J ^_i)2+^2 = ^ + 3x + f ln (x2 - x + 1) - arctg 2^1 + C. Případ (b). Platí f^dx = fldx + lf^-lf^-lf^ + + 1/ 2^2,dx-U f2*+2dx = = x+ 'íni^-ii- iin|x + i|_ iarctgx + tf/i22^f+l&-_ i f_&__VJ r 2x+y^ r _ i f_&__ = x + iln|x-l|-|ln|x + l|-i arctgx + + ^ ln (x2 - V2x + l) - x arctS ~ 0 ~ - ^ ln (x2 + V2x + l) - x arctS + i) + C D 6.55. Integrujte (a) f jfpi dx, x e R; (b) f , 3 5 \\ „ x > 0, x ^ e. "x ln i+i ln2 x-2x ' Řešení. Případ (a). Výhodou výše popsané metody integrování racionálních lomených funkcí je její univerzálnost (umíme díky ní najít primitivní funkce každé racionální lomené funkce). Někdy je však výhodnější použití substituční metody nebo per partes. Např. je f dy _ lf dy _ J 2(l+y2) ~ 2 J U y=x-dy = 2x dx 2(l+y2) 2J 1+y = \ arctg y + C = r) arctg x2 + C. Případ (b). Pomocí substituce získáváme integrál racionální lo mené funkce í xln3 / ln3 x+x\ľi2x-2x J lnJ x+ln2 x-2 sy a„- ľ i _l -y+2 ■ dx ■ ■dy = y: dy ■■ lnx - dx f yl+y2-2 ^ ~ f y-1 + y2+2y+2 ' f^dy-y^dy + 31-^dy ln | y - 1 | - \ ln (y2 + 2y + 2) + 3 arctg (y + 1) + C = ln | lnx - 1 | - ±ln(ln2x + 2 lnx + 2) + 3 arctg (lnx + 1) + C. □ 6.56. Určete (a)/ 1 dx, x > 0; x+\ dx, x ^ ^ dx, x e K\ [-1, 1]; (i+4)Vi2+3i-4 dx, x € (-oo, -4) U (1, +oo); (e) f —. ' dx, x e (-1,2); ■' \+J-x2+x+2 limity horních součtů i dolních součtů. Říká se jim také horní Ri-emannův integrál a dolní Riemannův integrál a používá se pro ně často značení faf(x) dx a fb f(x) dx. Takto lze pro omezené funkce ekvivalentně definovat i Riemannův integrál (jak jsme konečně v důkazu i činili). (4) V dalším kroku v důkazu jsme odvodili důležitou vlastnost spojitých funkcí, které se říká stejnoměrná spojitost na uzavřeném intervalu [a, b]. Zjevně je každá stejnoměrně spojitá funkce také spojitá, naopak to ale na otevřených intervalech platit nemusí. Příkladem může sloužit třeba funkce f(x) = sin(l/jc) na intervalu (0, 1). (5) Uvažme funkci / na intervalu [a, b], která je pouzepo částech spojitá. To znamená, že je spojitá ve všech bodech c e [a, b] kromě konečně mnoha bodů nespojitosti c i•, a < c, < b, ve kterých ovšem má konečné jednostranné limity. Vzhledem k aditivnosti integrálu vůči intervalu přes který se integruje, viz 6.24(1), existuje podle poslední věty v takovém případě integrál F(x) = ľ f(i)dt pro všechna x e [a, b] a derivace funkce F(x) existuje ve všech bodech x, ve kterých je / spojitá. Navíc se snadno ověří, že ve zbývajících bodech je funkce F(x) spojitá, je to tedy spojitá funkce na celém intervalu [a, b]. Při výpočtu integrálu pomocí primitivních funkcí je zapotřebí volit její jednotlivé části tak, aby na sebe navazovaly. Pak bude i celý integrál vyčíslen jako rozdíl funkce F(x) v krajních hodnotách. (6) Lagrangeova věta o střední hodnotě diferencovatelné funkce má analogii, které se říká integrální věta o střední hodnotě. Uvažme funkci f (x) spojitou na intervalu [a, b] a její primitivní funkci F(x). Věta o střední hodnotě říká, že existuje vnitřní bod a < c < b takový, že í f(x)dx = F(b) - F(a) = F'(c)(b - a) = f(c)(b - a). Toto tvrzení lze vcelku snadno odvodit přímo z definice Rieman-nova integrálu a pak jej je možné přímočaře využít v závěrečném kroku důkazu základní věty integrálního počtu. 6.30. Nevlastní integrály. Při diskusi integrace racionálních lo-mených funkcí jsme viděli, že bychom rádi pracovali ^^"^^ také s určitými integrály přes intervaly, v nichž jsou ~ -^==sr=_,í i body, kde integrovaná funkce f(x) má nevlastní (jednostranné) limity. V takovém případě není integrovaná funkce ani spojitá ani omezená a proto pro ni nemusí platit námi odvozené výsledky. Hovoříme o „nevlastním integrálu". Jednoduchým východiskem je diskutovat v takovém případě určité integrály na menších intervalech s hranicí blížící se problematickému bodu a zkoumat, zda existuje limitní hodnota takovýchto určitých integrálů. Pokud existuje, řekneme, že příslušný nevlastní integrál existuje a je roven této limitě. Uvedeme postup na jednoduchém příkladě: I = L Í/ dx je nevlastní integrál, protože uvedená integrovaná funkce f(x) — (2 — x)-1/4 má v bodě b — 2 limitu zleva rovnou oo. V ostatních bodech je integrovaná funkce spojitá. Zajímáme se 353 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET (0/ (i-i)Vi2+i+i dx, x y= 1. Řešení. V tomto příkladu budeme ilustrovat použití substituční metody při integrování výrazů s odmocninami. Případ (a). Má-li počítaný integrál tvar ,{í/x) dx pro jistá čísla p(í), p(2),..., p(j) e N a racionální lomenou funkci / (více proměnných), doporučuje se substituce f = x, kde n je (nejmenší) společný násobek čísel p(í),..., p(j). Touto substitucí lze totiž převést integrand (integrovanou funkci) na racionální lomenou funkci, kterou umíme integrovat vždy. Dostáváme I x(^I+^x^ ťu = X, I lOt9 dt Yx = t - dx ■Í7 \aí> (ř+r) dt 10/4^ = 10/(1 = 10[ln/ + ± ln- 2fi + 3í3 i 10 .1 + 1 í2 + í3 1 J_ Aŕ 1 + 1 wr)dt ln(l +/)] + C = (1+ !í£)'0 ^ lfr ^ 3 2^5 Případ (b). Pro integrály Jf(x, "tyax + b, "tyax + b, .. + C. p('i/ax + b) dx, kde opět p(í),..., p(j) € N, f je racionální lomený výraz a a, b € K, volíme substituci ŕ = ax + b při zachování významu n. Takto obdržíme : dx ť 3x + 1 dx = t1 dt I ■ r2 = /^±5/dr = |/r4+2/dr = :|(£+í2) + C=f(^ + l) + C: ^(3x+l)2 lix+l - 3 ■ {^r- + 1) + C = ^(3* + l)2 ^ + C. Případ (c). Dalším zobecněním jsou integrály typu ľ f I X "'"/ax+b PÍ2)/ax+b J ■> \ ' y cx+ŕ/' y cx+d' přičemž se navíc požaduje pouze to, aby hodnoty a, b, c, d e K splňovaly nabízející se podmínku ad — bc ^ 0. Při zachování významu uvedených symbolů nyní klademe ŕ = fj^. Konkrétně je x v x — l -Ař - í+1 " x-\ At ř-l -Ař f r-l j (2+1 dt +i (í2-i)< dt -J ŕ+Dŕ-l) = In 11 + 1 I - :lnL/^4 + l * = /(^-^-?+t)* = - In 11 - 11 - 2arctgr + C = ' ' 2arctg7^i + C. ■lnL/*±i- 1 Úpravy proto o integrály z _ ŕ~s dx - ŕ - Jo i/2 — x Js 1/4 dy ■ = Í23/4 - is3/4 3 3 Všimněme si, že jsme ve výpočtu substitucí dostali integrál s přepočtenou horní mezí S a dolní mezí 2. Otočením mezí do obvyklé polohy jsme do výrazu přidali jedno znaménko minus navíc. Limita pro S -» 0 zprava zjevně existuje a spočítali jsme tedy nevlastní určitý integrál I = L Í/ dx = V4 3 Stejně budeme postupovat, pokud je zadáno integrování přes neohraničený interval. Často v tomto případě hovoříme o nevlastních integrálech 1. druhu, zatímco integrály z neohraničených funkcí na konečných intervalech jsou nevlastní integrály 2. druhu. Obecně tedy např. pro a e R I = poo pb I f(x)dx— lim / f(x)dx, J a J a pokud limita vpravo existuje. Obdobně můžeme mít horní mez integrování konečnou a druhou nekonečnou. Pokud jsou nekonečné obě, počítáme integrál jako součet dvou integrálů s libovolně pevně zvolenou pevnou mezí uprostřed, tj. /oo pa poo f{x)dx= / f(x)dx+ l f(x)dx. -00 J—00 Ja Existence ani hodnota nezávisí na volbě takové meze, protože její změnou pouze o stejnou konečnou hodnotu měníme oba sčítance, ovšem s opačným znaménkem. Naopak limita při které by stejně rychle šla horní i dolní mez do ±00 může vést k odlišným výsledkům! Např. / j — C x dx — x2 = o, přestože hodnoty integrálů x dx s jednou pevnou mezí utečou rychle k nekončených hodnotám. Při výpočtu určitého integrálu z racionální funkce lomené musíme pečlivě rozdělit zadaný interval podle bodů nespojitosti integrované funkce a spočítat jednotlivé nevlastní integrály každý zvlášť. Navíc je nutné rozdělit celý interval tak, abychom vždy integrovali funkci neohraničenou pouze v okolí jednoho z krajních bodů. 6.31. Přírůstky do ZOO. Z již spočítaných příkladů ,-i' ., se může zdát, že je obvyklé najít neurčitý in- ttegrál pomocí výrazů složených ze známých elementárních funkcí. To je úplně mylný do-^ jem. 354 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET ln L/£±i + l = ln ■lnL/*±i ln = ln fx+T i /!*+' i V *-i ln I l-U-i I = 21n(VU + l| + VU-l|)-ln2 pro x € (—oo, —1) U (1, oo) dále umožňují zapsat /\^xdx = 2m (VUTTT + VI*- U) - 2arctg Jšjž + C. Případy (d), (e), (f). Nyní se zaměříme na integrály J f (x, Vax2 + bx + cj dx, kde očekáváme a ^ 0 a b2 — Aac ^ 0 pro jinak libovolná čísla o,í),ceI. Připomeňme, že / je racionálni lomený výraz. Rozlišíme dva případy, kdy kvadratický polynom ax2 + bx + c má reálné kořeny a kdy reálné kořeny nemá. Pokud je a > 0 a polynom ax2 + bx + c má reálné kořeny xnx2, vyjádříme ' = sfa~ \ x — x\\ V ax2 + bx + c = «J~ä J(x — x\) / x—x2 x—x\ a položíme /2 . Pokud je a < 0 a polynom ax2 + fct + c má reálné kořeny xj < x2, vyjádříme / x2— x x—x\ V ax2 + bx + c = *J—a ^j(x — x\)2 = V~~a (x — x\) 1 a zavedeme t2 = Pokud polynom ax2 + bx + c nemá reálné kořeny (nutně musí být a > 0), volíme substituci V ax2 +bx + c = í^/a ■ x ± / při jakékoli volbě znamének. Poznamenejme, že znaménka samozřejmě volíme tak, abychom dostali co nejjednodušší výraz pro následné integrování. Ve všech uvedených případech potom tyto substituce vedou opět na racionální lomené funkce. Platí tedy (d) r_dx_ _ r_dx_ _ r dx J i,^a\.I,2^,_a — J (x+4)J-D2 J í2 +2ř-2 i2 - V*2 + x + 1 = x + r jt2 + x + 1 = x2 + 2xt + t2 x = dx t2+2t-2 2í-1 -2Q2 -í+1) (2í-l)2 + 1 z2 +2í-2 zr-1 zr-1 r z' ^_!__A_!_\ dt dt A ln / + 1 - V3 VŠ ln í+1-V3 í+l+VŠ + c ^ln|/ + l + V3|+C: . V3 ln --pi + C. □ 6.57. Pomoci vhodné substituce spočítejte x+Jx2+x-l dx. x € (-oo, =4=!) U (4=1, +oo) . Řešení. Přestože kvadratický polynom pod odmocninou má reálné kořeny xi, X2, nebudeme příklad řešit pomocí substituce t2 = jE^. Sice bychom tak postupovat mohli, ale raději použijeme metodu, kterou jsme zavedli pro případ komplexních kořenů. Tato metoda totiž dává velmi jednoduchý integrál racionální lomené funkce, jak vidíme z výpočtu x+Jx2+x-l •J X2 + X — 1 = X + t x2 + x - 1 = x2 + 2xt + i2 .-£±1 2 í+2 dx = \^)dt ■Jx2 + X - 1 - — l-2í -2í2 +2í+2 (l-2í)2 = t - 2 In ' -2<2+2t+2 (í+2)(l-2í) - 2 ln | / + 2 | (v? 1 ln I / ■ i 2mľ 2 T - x + 2) - + c 1 ln V*2 + x - 1 1 + C. Dodejme, že každou doporučenou substituci (viz dříve uvedené příklady) lze ve většině konkrétních úloh nahradit jinou substitucí, která umožní dospět k výsledku výrazně snazším způsobem. Nespornou výhodou doporučených substitucí však je univerzálnost: jejich a pomocí indukce snadno dovodíme, že pro všechna kladná celá čísla n dává tato funkce hodnotu faktoriálu: T(n) = (n - 1)! Následující obrázek ukazuje v logaritmickém měřítku závislé proměnné průběh funkce f(x) = ln(r(x)). Vidíme z něj tedy, jak rychle skutečně roste faktoriál. Než se pustíme do dalších témat matematické analýzy, uvedeme ještě několik přímých použití pro Riemannův integrál. 6.32. Riemannovsky měřitelné množiny. Sama definice Ri-emannova integrálu byla odvozena od představy velikosti plochy v rovině se souřadnicemi x a y ohraničené osou x, hodnotami funkce y = f (x) a hraničními přímkami x — a, x — b. Přitom je plocha nad osou x dána s kladným znaménkem zatímco hodnoty pod osou vedou ke znaménku zápornému. Ve skutečnosti víme zatím pouze, co je to plocha rovnoběžnostěnu určeného dvěma vektory, obecněji ve vektorovém prostoru W víme, co je to objem rovnoběžnostěnu. Plochy jiných podmnožin je teprve třeba definovat. Pro některé jednoduché objekty jako třeba mnohoúhelníky je definice dána přirozeně předpokládanými vlastnostmi. Námi vybudovaný koncept Riemannova integrálu můžeme teď přímo použít k měření „objemu" jednorozměrných podmnožin. O podmnožině A c K řekneme, že je (riemannovsky) měřitelná, jestliže je funkce x : K -» R Xa(x) = 1 jestliže je x e A O jestliže je x f A. riemannovsky integrovatelná, tj. existuj e integrál (ať už s konečnou nebo nekonečnou hodnotou) m (A) ■ Xň(x)dx. Funkci xa říkáme charakteristická funkce množiny A, hodnotě m(A) říkáme riemannovská míra množiny A. Všimněme si, že pro interval A = [a, b] jde vlastně o hodnotu ŕ Xa(.x) dx = I dx l XA(x)dx = / Joo Ja přesně jak jsme očekávali. Zároveň má takováto definice „velikosti" očekávanou vlastnost, že míra sjednocení konečně mnoha riemannovsky měřitelných a po dvou disjunktních množin vyjde jako součet. Zejména každá konečná množina A má riemannovskou míru nulovou. 356 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET zavedením lze vypočítat všechny integrály příslušných typů. □ Další metody integrování naleznete na straně 381 D. Určité integrály Pro libovolnou funkci / spojitou a ohraničenou na ohraničeném intervalu (a, b) platí tzv. Newtonův-Leibnizův vzorec (6 D •9) j f (x )dx = [F(x)]ba := lim F (x) - lim F (x), x^b— x^a+ kde F'(x) = f (x), x € (a, b). Zdůrazněme, že za uvedených podmínek vždy existuje primitivní funkce F a jako vlastní obě limity v (||6.9||). K výpočtu určitého integrálu nám tedy stačí najít antide-rivaci a určit příslušné jednostranné limity (příp. jen funkční hodnoty, je-li primitivní funkce spojitá v krajních bodech uvažovaného intervalu). 6.58. Vyčíslete určité integrály f í ľ tg2 x dx, ľ \ dx. Řešení. Pro x ^ j + k jt, kde k e Z , je f tg2 x dx = tg x — x + C, jak jsme vypočítali dříve. Odsud vyplývá, že J\g2xdx = [tgx-xYj; = V3 - f - - f) = j. - f. 7ľ/6 Určité integrály lze pochopitelně počítat také přímo. Substituce y = tg x kupř. dává 71/3 „ 71/3 ■ 2 y =tgx; dy = I / tg2.& = / ^dx = ;2 __ = n 16 7t/6 *>m x ~ l+tg2 x ~ l+y2 \ ^ 2 -ŕ* ^ = I tT?dy= J l-i+^^ = b-arclgy]1/^ = ^-|. Pouze je třeba nezapomenout změnit při substituci meze integrálu na hodnoty získané dosazením \/3 = tg (it/3), l/VŠ = tg (it/6). Druhý integrál vyčíslíme metodou per partes pro určitý integrál. (Poznamenejme, že primitivní funkce funkce y = x cos~2 x jsme také stanovili již dříve.) Platí ir/4 ľ -^Ť-dx j cosz x 0 F{x) = x F'(x) = 1 G'« = ^ G(x)=tgx IA 71/4 IA 71/4 nl4 f ...X-Lt..!1'4 i f -siní [xtgx]l - j tgxdx = [xtgx\l + f dx o o Pokud ale vezmeme spočetné sjednocení, taková vlastnost již neplatí. Např. stačí vzít množinu Q všech racionálních čísel jakožto sjednocení jednoprvkových podmnožin. Zatímco každá množina o konečně mnoha bodech má podle naší definice míru nulovou, charakteristická funkce xq není riemannovsky integrovatelná. Povšimněme si, že horní Riemannův integrál z charakteristické množiny xa odpovídá infimu součtů délek konečně mnoha disjunktních intervalu, kterými umíme pokrýt danou množinu A, zatímco dolní integrál je supremem součtu délek konečně mnoha disjunktních intervalů, které umíme vložit do množiny A. Takto lze postupovat i ve vyšších dimenzích při definici tzv. Jordánovy míry. Pro definici plochy (objemu) ve vícerozměrných prostorech budeme umět použít i přímo koncept Riemannova integrálu, až jej zobecníme do vícerozměrného případu. Nicméně je dobré si už teď povšimnout, že skutečně původní představa o ploše rovinného útvaru uzavřeného výše uvedeným způsobem grafem funkce bude bezezbytku naplněna. 6.33. Střední hodnota funkce. U konečné množiny hodnot jsme zvyklí uvažovat o jejich střední hodnotě a definujeme ji zpravidla jako aritmetický průměr. Pro riemannovsky integrovatelnou funkci fix) na intervalu (konečném nebo nekonečném) [a, b] je definována její středníhod-nota výrazem mif) = ■ -/' -a Ja fix) dx. Z definice je mif) výška obdélníka (s orientací podle znaménka) nad intervalem [a, b], který má stejnou plochu jako je plocha mezi osou x a grafem funkce / ix). Platí tedy obecně integrální věta o střední hodnotě Tvrzení. Je-li fix) riemannovsky integrovatelná reálná funkce na intervalu [a, b], pak existuje číslo mif), pro které platí rb fix)dx = mif)ib-a). f Na konci odstavce 6.29 jsme odvodili, že spojitá funkce / na intervalu [a, b] nabývá své střední hodnoty mif) uvnitř tohoto intervalu. 6.34. Délka prostorové křivky. Námi vybudovaný integrál jde také dobře použít pro výpočet délky křivky ve vícerozměrném vektorovém prostoru M". Pro jednodu- [xtgx]g/4 + [ln(cosx)]g ir/4 •Ji — T-2 ln 2 4 □ chost si to předvedeme na případu křivky v rovině R2 se souřadnicemi x, y. Mějme tedy parametrický popis křivky F : R -» R2, Fit) = [git), fit)] a představme si ji jako dráhu pohybu. Pro jednoduchost předpokládejme, že funkce fit) a git) mají po částech spojitou derivaci. Derivací zobrazení F (ŕ) dostaneme hodnoty, které budou odpovídat rychlosti pohybu po takovéto dráze. Proto celková délka křivky (tj. dráha uražená za dobu mezi hodnotami t — a, t — b) bude dána integrálem přes interval [a, b], kde integrovanou funkcí hit) budou právě velikosti vektorů F'(ř). Chceme tedy spočíst délku s rovnou s = f hii)dt= í 7(/'«)2+(ť(t))2 dt. J a J a 357 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.59. Vyčíslete určité integrály (a) fo -7^1 dx' Řešení. Platí (a) f^=dx y = l dy ■ -2x dx 0 -1/2 r—dy. 1 f^dy = [^yf0 = U (b) z = x + V*2 — 1 dz- jx2-\+x [ln z K 2+VŠ . ln 2+VŠ i (2 + Vš); (c) / ( ??T3 + ÍSPT )dx = f ??T3 dx + f ^27 dp = e1 ífa 1 1 (*) +1 :/V3 dp + tg 1 Ž5 ds = -j^dp f "/" jjL. + tg 1 = f [arctg í]f;^ + tg 1 i/VŠ V3 3 (arctg^-f)+tgl; 6.60. Dokažte, že platí 20 - J juTI - to-o Řešení. Neboť Q<^<-^L R je kladná a nerostoucí na intervalu (1, oo). Pak tato řada konverguj e právě tehdy, když konverguje integrál s: f(x)dx. 359 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET ľ sinxdx = [—cosx]?° = lim (— cosx) + cos 1. ^ x^oo Protože limita na pravé straně neexistuje, uvažovaný integrál osciluje. Případy (b), (c). Stejně lehce vypočítáme oo oo oo = lim (-i - arctgx) + \ + arctg 1=0—f + l + f = l — f a ještě snazší pak je /£ = [2VS]0 = 4-0 = 4, o kde je primitivní funkce v počátku spojitá zprava (uvažovaná limita je tak rovna funkční hodnotě). Případ (d). Kdybychom bezmyšlenkovitě vypočítali M = [4L = -i-i = -2, -i obdrželi bychom zjevně chybný výsledek (zápornou hodnotu při integrování kladné funkce). Důvodem, proč Newtonův-Leibnizův vzorec nejde takto aplikovat, je nespojitost uvažované funkce v počátku. Využijeme-li však tzv. pravidla návaznosti b c b f f(x)dx = f f(x)dx + f f(x)dx, a a c které platí vždy, když mají integrály na pravé straně smysl, nalezneme správný výsledek rdx_rdxj_rdx_\ l"|u , r 1V_ J x2 ~ J x2 + J x2 ~ L x 1-1 + L xlo - -1 -1 o = lim (--) - 1 - 1 - lim (--) =oo-2 + oo = +oo. Podotkněme, že ze sudosti funkce y = x~2 také plyne J é.=2j^ = 2-oo = +oo. -i o 6.64. Vyčíslete určité integrály □ (b) f_2ln\x\ dx; (C) j-» dx; (d) j\ ^ dx; (e) íl ih dx- Řešení. Platí (a) (b) o Důkaz. Pokud interpretujeme integrál, jako plochu pod krivkou, je kriterium zřejmé. Daná řada konverguje nebo diverguje, právě když se stejným způsobem chová i řada Z^Li /(")• Pro libovolné leN máme pro k-té částečné součty nerovnosti eL2 /(») < ň f w ^ < eLi /(») neboť levá strana je dolním součtem Riemannova integrálu rk Jj f(x) dx, zatímco pravá strana je součtem horním. Odtud již bezprostředně plyne dokazované tvrzení. □ 3. Nekonečné řady Již jsme se při budování našeho zvířetníku funkcí setkali s mocninnými řadami, které přirozeným způsobem rozšiřují skupinu všech polynomů, viz 5.45. Zároveň jsme si říkali, že takto získáme třídu analytických funkcí, ale nedokazovali jsme tehdy ani to, že jsou mocninné řady spojitými funkcemi. Snadno nyní ukážeme, že tomu tak je a že skutečně umíme mocninné řady i derivovat a integrovat po jednotlivých sčítancích. Právě proto ale také uvidíme, že není možné pomocí mocninných řad získat dostatečně širokou třídu funkcí. Např. nikdy tak nedostaneme jen po částech spojité periodické funkce, které jsou tak důležité pro modelování a zpracování audio a video signálů. 6.37. Jak ochočené máme řady funkcí? Vraťme se nyní ^!' » k diskusi limit posloupností funkcí a součtu řad funkcí *v|^ z pohledu uplatnění postupů diferenciálního a integrálního počtu. Uvažujme tedy konvergentní řadu funkcí oo S(*) = £/„(*) n=\ na intervalu [a, b]. Přirozené dotazy jsou: • Jsou-li všechny funkce f„(x) spojité v nějakém bodě xo e [a, b],je spojitá i funkce S(x) v bodě xq>. • Jsou-li všechny funkce f„(x) diferencovatelné v nějakém bodě a e [a, b], je v něm diferencovatelná i funkce S(x) a platí vztah 5- (*) = ££li/»(*)? • Jsou-li všechny funkce /„ (x) riemannovsky integrovatelné na intervalu [a, b], je integrovatelná i funkce S(x) a platí vztah SbaS(x)dx^1Zna=lSba fn(x)dx^ Ukážeme si nejprve na příkladech, že odpovědi na všechny tři takto kladené otázky jsou „NE!". Poté ale najdeme jednoduché dodatečné podmínky na konvergenci řady, které naopak platnosti všech tří tvrzení zajistí. Rady funkcí tedy obecně moc zvladatelné nejsou, nicméně si umíme vybrat velikou třídu takových, se kterými se už pracuje velmi dobře. Mezi ně naštěstí budou patřit mocninné řady. Poté se také zamyslíme nad alternativními koncepcemi integrování, které fungují více uspokojivě i pro větší třídy funkcí. 6.38. Příklady ošklivých posloupností. (1) Uvažme nejprve funkce /„(*) = (sin*)" na intervalu [0, n ]. Hodnoty těchto funkcí budou ve všech bodech 0 < x < ti nezáporné a menší nezjedná, kromě x — j, kde je 360 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 2 0 2 2 f ln | x | dx = f ln | x \ dx + f ln | x \ dx = 2 f ln x dx -2-2 0 0 2 I [x lnx]g — J Idx F (x) = m x G'(x) = 1 F'(x) = i ' ' x G(x) = x o 2([xlnx]2-[x]2) = : 2 I 21n2 - lim (x Inx) -2 + 0 i^0+ = 41n2-4; (c) (d) ľe-Pdx •> Jx r^dx dt t = = WxdX :2fe->dt=2[-e->]™ -2 f lim e"' - e"1) = -; u = l/x du = —K dx j u ď du ■ -i F(u) = u F'(u) = 1 G'(u) = e" G(u) = e" j u ď du [uď]zl- f ď du = [u ď]zl-lď]zl — CO ■ lim u ď M—>— CO (e) f d* J x ln j r dr ■ \nx : - dx - + lim e" ln2 f±r = [lnr]0n: o : ln (ln 2) — lim ln r = ln (ln 2) + oo = +oo. r-^0+ □ 6.65. Vypočítejte nevlastní integrály oo Jl --x av. C dx J x2 e x dx; o Řešení. Při výpočtu nevlastních integrálů můžeme používat metody, které jsme používali při výpočtu určitých integrálů. Metodou per partes získáváme j x2 e x dx F(x) = x2 G'(x) = e" [-x2 e-x]™ + 2 f x e-x dx F'(x) = 2x G(x) = —e F(x) = x G'(x) = e" F'(x) = 1 G(x) = —e~ = - lim 4 + 2 T-x e-x1™ + 2 fe-xdx = x^oo e 0 = 0 - 2 lim 4 + 2 r-e-*l!° = 0 + 2 f lim -e-* + l) = 2. x^oo e l ju Vx^oo / Substituční metoda potom dává f A - f ŕ dr J e*+e-* ~ J e2*+l V = e d)í = ex dx J y2+l = [arctgy]!0 = lim arctgy = f, kde nové meze integrálu plynou z limit 0, lim ex = +oo . x^oo lim e* x^—oo □ hodnota 1. Proto na celém intervalu [0, tt] budou bod po bodu tyto funkce konvergovat k funkci fix) = lim /„(*) : 0 pro všechna 1 pro x = j. Zjevně tedy je limita posloupnosti funkcí /„ nespojitou funkcí, ačkoliv jsou všechny funkce f„(x) spojité. Problematický je přitom dokonce vnitřní bod intervalu. Tentýž jev umíme najít i pro řady funkcí, protože součet je limitou částečných součtů. Stačí tedy v předchozím příkladě vyjádřit /„ jako n-tý částečný součet. Např. fi(x) = sinx, hix) = (sinx)/ sin*, atd. Levý obrázek vykresluje funkce f mix) pro m = n , n = 1, ..., 10. (2) Podívejme se nyní na druhou otázku, tj. na špatně se chovající derivace. Celkem přirozená je idea na podobném principu jako výše sestavit posloupnost funkcí, které budou mít v jednom bodě stále stejnou nenulovou derivaci, ale budou čím dál tím menší, takže bodově dokonvergují k funkci identicky nulové. Předchozí obrázek napravo vykresluje funkce f„ix) = xii-x2r na intervalu [—1, 1] pro hodnoty n = m2, m = 1, ..., 10. Na první pohled je zjevné, že lim f„ix) = 0 řl^OO a všechny funkce f„(x) jsou hladké. V bodě x = Oje jejich derivace /„'(0) = ((1 - x2)" - 2nx2il - x2)"-1)^ 1 nezávisle na n. Limitní funkce pro posloupnost /„ přitom má samozřejmě všude derivaci nulovou! (3) Protipříklad k třetímu tvrzení jsme už viděli v 6.32. Charakteristickou funkci xq racionálních čísel můžeme vyjádřit jako součet spočetně mnoha funkcí, které budou očíslovány právě racionálními čísly a budou vždy všude nulové, kromě jediného bodu, podle které jsou pojmenovány, kde jsou rovny 1. Riemannovy integrály všech takových funkcí budou nulové, jejich součet ale není riemannovsky integrovatelnou funkcí. Právě tento příklad ukazuje na zásadní nedostatek Rieman-nova integrálu, ke kterému se ještě vrátíme. Snadno ale najdeme i příklad, kdy limitní funkce / je integro-vatelná, všechny funkce /„ jsou spojité a přesto hodnota integrálu není limitou hodnot integrálů /„. Stačí lehce upravit posloupnost funkcí, které jsme použili výše: fnix) = 2nxil-x2)n. 361 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.66. Spočtěte jx2n+l I ' dx. n e N. Řešení. Příklad řešme nejprve substituční metodou a následně opakovaně aplikujme per partes se ziskem y = x2 ' j^n+l ' dx F(y) = f G'(y) = c-y \f f e~ydy F'(y) = nf-x G(y) = -e-y \ (\-f e-y]™ + njf-1 e-y dy\=\) f~l e~y dy F(ý) = f- G'(y) F'(y) = (n- l)y-G(y) = -e-y § [-f-1 e-y]™ + (n-í)f f-2 e-y dy r^l)f-2 e-y dy = ■■■ = "("-1>"2 J y e^ dy o o F(y) = y G'(y) = e F\y) = 1 G(y) = -t í[[-ye-y]7 + fe-ydy 6.67. V závislosti na a e K+ určete integrál J0 ^ dx. F. Délky, obsahy, povrchy, objemy 6.68. Určete délku křivky dané parametricky x = sin2 /, y = cos2 /, pro r e [0, f]. Řešení. Podle 6.34 je délka křivky daná integrálem □ O Jo *W + (yW dr: Jo ľ Jo sin li)2 + (- sin li)2 dt V2sin2rdr = \fl. 6.69. Určete délku křivky dané parametricky pro t e [0, VŠ]. x = t2, y = ŕ Snadno ověříme, že i hodnoty těchto funkcí konvergují pro každé x e [0, 1] k nule (např. vidíme, že ln(/„ (x)) —> — oo). Přitom Jo fn(x)dx ■ 1 1^0. 6.39. Stejnoměrná konvergence. Zjevným důvodem neúspěchu ve všech třech předchozích příkladech je skutečnost, že rychlost bodové konvergence hodnot fn (x) —> f (x) se bod od bodu velice liší. Přirozenou myšlenkou tedy je omezit se na takové případy, kdy bude naopak konvergence probíhat přibližně stejně rychle po celém intervalu. | Stejnoměrná konvergence |_^ Definice. Říkáme, že posloupnost funkcí /„ (x) konverguje stejnoměrně na intervalu [a, b] klimitě f(x), jestliže pro každé kladné číslo £ existuje přirozené číslo N e N takové, že pro všechna n > N a všechna x e [a,b] platí \fn(x) - f(x)\ < e. O řadě funkcí řekneme, že konverguje stejnoměrně na intervalu, jestliže stejnoměrně konverguje posloupnost jejích částečných součtů. Pokud si uvědomíme, že daná křivka je částí přímky y = 1 — x (neboť sin21 + cos21 = 1) a sice úsečka s koncovými body [0,1] (pro hodnotu / = 0) a [1, 0] (pro hodnotu r = |) tak okamžitě můžeme psát její délku, tedy V2. □ Tedy volba čísla N sice závisí na zvoleném £, je ale nezávislá na bodu x e [a, b]. To je rozdíl od bodové konvergence, kde N závisí na £ i x. Graficky si definici můžeme představit tak, že do pásu vzniklého posunutím limitní funkce f(x) na f(x) ± e pro libovolně malé, ale pevně zvolené kladné £, vždy padnou všechny funkce f„(x), až na konečně mnoho z nich. Tuto vlastnost zjevně neměl první a poslední z předchozích příkladů, u druhého ji postrádala posloupnost derivací f'n. Následující tři věty lze stručně shrnout tvrzením, že všechna gs^gp, tři obecně neplatná tvrzení v 6.37 platí pro stej-x^K/ noměrnou konvergenci (pozor ale na jemnosti u derivování). 6.40. Věta. Nechť f„ (x) je posloupnost funkcí spojitých na intervalu [a,b], která na tomto intervalu stejnoměrně konverguje k funkci f'(x). Pak je také f(x) spojitá funkce na intervalu [a,b]. Důkaz. Chceme ukázat, že pro libovolný pevně zvolený bod xo e [a, b] a jakékoliv pevně zvolené malé £ > 0 bude \f(x) - /(*o)| < £ pro všechna x dostatečně blízká k xo. Z definice stejnoměrné konvergence je pro nějaké £ > 0 \fn(x)-f(x)\ <£ pro všechna x e [a, b] a všechna dostatečně velká n. Zvolme si tedy nějaké takové n a uvažme S > 0 tak, aby také \fn(x) - fn(X0)\ < £ pro všechna x z S-okolí xq (to je možné, protože všechny f„(x) jsou spojité). Pak l/W - /(*o)| < l/W - fn {x)\ + \fn(x) - fn(X0)\ + + \fn(x0)- f(x0)\ <3E pro všechna x z námi zvoleného S-okolí bodu xq. □ 362 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Řešení. Délku / určíme opět využitím vztahu 6.34: ,_ ,Vš l : f vV + 9ŕ dt = f ryV Jo Jo + 4dt + 4dí = -[(9M+4)^ 335 6.70. Určete plochu ležící napravo od přímky x ohraničenou grafem funkce y - □ 3 a dále f°° 1 Řešení. Plocha je dána nevlastním integrálem J3 ^j—^ Vypočteme jej metodou rozkladu na parciální zlomky: 1 Ax + B C + dx. X2 + X + 1 ľ „o 1 X = 1 1 = C - B x : 0 = A + C a můžeme psát (Ax + B)(x - 1) + C(x2 + x + l), 1 C = -, 3 B = A = 2 ~3' 1 "3 h *3 - 1 3 h \x-l x2+x + lj x+2 Nyní určíme zvlášť neurčitý integrál f x2+x+l x + 2 J -z-- dx = x2 + x + 1 dx: J ľ x + {- 3 ľ 1 / -r-;-t dx H— / -r—-t- dx J (x + b2 + \ 2 J (x + i)2 + I 2' ' 4 t = x2 + x + 1 dt = 2(x + i) dx 1 /" 1 2 1 2 1 ln(x2 +x + í) + l f —-2 J í2 + í = x + 5 dí = dx dí 34 ■ ln((x2 + x + 1) + ■ 2 u ; 23 dí 2 dw V3 dí ln(x/ + x + 1) + 2— /-- du = 2 J u1 + 1 - ln(x2 + x + 1) + VŠ" arctan(w) = 1 , r (2x + \\ - ln(x2 + x + 1) + V3 arctan ^—7=—J Ve skutečnosti jsme v důkazu ověřili platnost o něco obecnějšího tvrzení. Tvrzení (Věta o záměně limit). Jestliže posloupnost funkcí f„ (x) konverguje na intervalu [a, b] stejnoměrně k funkci f(x) a jestliže existují limity lim /„(*) = a„, lim a„ = a, x^xq řl^OO pak také existuje limita lim^^ f(x) = a. Jinak řečeno, za uvedených podmínek platí lim ( lim /„(*)) = lim ( lim /„(*))- řl^OO x^xq x^xq řl^OO 6.41. Věta. Nechť f„ (x) je posloupnost riemannovsky integrova-telných funkcí na konečném intervalu [a,b], které na tomto intervalu stejnoměrně konvergují k funkci f(x). Pak také f(x) je riemannovsky integrovatelná a platí lim j fn(x)dx = j ^lm^/nOc)^ dx = j f{x)dx. Důkaz této věty se opírá o zobecnění vlastností cauchyovských posloupností čísel na stejnoměrnou konvergenci funkcí. Tímto způsobem umíme pracovat s existencí limity posloupnosti integrálů, aniž bychom ji potřebovali znát. ._j Stejnoměrně cauchyovské posloupnosti |___ Definice. Řekneme, že posloupnost funkcí f„(x) na intervalu [a, b] je stejnoměrně Cauchyovská, jestliže pro každé (malé) kladné číslo £ existuje (velké) přirozené číslo N takové, že pro všechna x e [a, b] a všechna n > N platí \fn(x) - fm(x)\ < £. Zřejmě je každá stejnoměrně konvergentní posloupnost funkcí na intervalu [a, b] také stejnoměrně Cauchyovská na temže intervalu, stačí si povšimnout obvyklého odhadu \fn(x) - fm{x)\ < \fn(x) - f(x)\ + \f(x) - fm{x)\ založeného na trojúhelníkové nerovnosti. Toto pozorování nám už stačí k důkazu naší věty, zastavíme se ale napřed u užitečného obráceného tvrzení: Tvrzení. Každá stejnoměrně Cauchyovská posloupnost funkcí fn (x) na intervalu [a, b] stejnoměrně konverguje k nějaké funkci f na tomto intervalu. Důkaz. Z podmínky cauchyovskosti posloupnosti funkcí vyplývá, že také pro každý bod x e [a, b] je posloupnost hodnot f„(x) Cauchyovskou posloupností reálných (případně komplexních) čísel. Bodově tedy nutně konverguje posloupnost funkcí /„ (x) k nějaké funkci f(x). Ukážeme, že ve skutečnosti konverguje posloupnost /„ (x) ke své limitě stejnoměrně. Zvolme N tak velké, aby \fn(x) - fm(x)\ < £ pro nějaké předem zvolené malé kladné £ a všechna n > N, x e [a, b]. Nyní zvolíme pevně jedno takové n a odhadneme !/„(*)-/(*)! = Um \fn(x) - fm(x)\ < s pro všechna x e [a, □ 363 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Celkem pak pro nevlastní integrál můžeme psát: Í3 x3 - 1 - lim ľln \x - 11 - - ln(x2 + x + 1) - VŠ arctan \ ~t ll 1 /l 1 9 r- /2S + 1 - hm ( — In | á — 11--ln(<52 + S + 1) - v3 arctan -— 3 ŕi^oo \3 2 \ V3 1 1 V3 7 - - in 2 + - in 13 H--arctan — 3 6 3 V3 1 1 V3 7 -in 13--in 2 H--arctan —= — 6 3 3 V3 1 ~3 S- lim in x - 1 v5+i + i 7 - In 13 H--— arctan —=--in 2 — 6 V3 V3 3 6 1 ,. p; /2<5 + l\ - lim V3 arctan -=— : 3 ä^oo V V3 / V3 □ 6.71. Určete povrch a objem rotačního paraboloidu, který vznikne rotací části paraboly y = 2x2 pro x e [0,1] kolem osy y. Řešení. Vzorce pro výpočet objemu rotačního tělesa uvedené v odstavci 6.35 platí pro tělesa vzniklá rotací křivky kolem osy x. Je tedy nutno buďintegrovat danou křivku podle neznámé y, nebo transformovat souřadnice. f 2 V áx = 71 í ~ Jo 2 ŕ íx~ I T ŕ [x T 2ic I J— JIH--ax=2ic I ,/—I--áx Jo V 2 V Sx J0 V 2 16 17-VT7- 1 24 ' □ 6.72. Vypočtěte obsah S obrazce složeného ze dvou částí roviny vymezených přímkami x = 0, x = l,x = 4, osou x a grafem funkce y _j_ Řešení. Nejprve si uvědomme, že -J= < 0, x € [0, 1), > 0, x € (1,4] \/x— 1 V* — 1 lim _____ == = —oo, lim -^y== i^l- V^-l x^\+ Jx- První část obrazce (ležící pod osou x) je proto ohraničena křivkami y = 0, x = 0, x = 1, y s obsahem daným nevlastním integrálem +00. _j_ Jx~U Si = - f -yL= dx; i* yx— 1 Důkaz Věty. Připomeňme, že každá stejnoměrně konvergentní posloupnost funkcí je také stejnoměrně Cauchyovská a že Riemannovy součty pro jednotlivé členy naší posloupnosti konvergují k j* fn (x) dx nezávisle na výběru dělení a reprezentantů. Proto, jestliže platí pro všechna x e [a, \fn(x) - fm(x)\ < £ ], pak také I f„(x)dx- fm(x)dx <-e\b-a\. J a J a Je tedy posloupnost čísel f„ (x) dx Cauchyovská a proto konvergentní. Současně ale také díky stejnoměrné konvergenci posloupnosti fn(x) platí pro limitní funkci f (x) ze stejného důvodu, že její Riemannovy součty jsou libovolně blízké Riemannovým součtům pro funkce /„ s dostatečně velkým n a limitní funkce f (x) bude tedy opět integrovatelná. Zároveň fb fb / f„(x)dx - / f(x)dx J a J a a musí proto jít o správnou limitní hodnotu. □ < s\b - a\ Pro příslušný výsledek o derivacích je třeba zvýšené pozornosti ohledně předpokladů: 6.42. Věta. Nechť f„ (x) je posloupnost funkcí diferencovatelných na intervalu [a,b], a předpokládejme fn(xo) —> f(xo) v nějakém bodě xq e [a, b]. Dále nechť jsou všechny derivace g„(x) = f'n(x) spojité a nechť konvergují na temže intervalu stejnoměrně k funkci g(x). Pak je také funkce f(x) = f* g(f) dt diferencovatelná na intervalu [a, b], funkce f„(x) konvergují k f(x) a platí f'(x) = g(x). Důkaz. Jestliže budeme místo f„(x) uvažovat funkce fn(x) — fn(x) — fn(xo), budou předpoklady i závěry ve větě platné nebo neplatné pro obě posloupnosti zároveň. Bez újmy na obecnosti můžeme proto předpokládat, že všechny naše funkce splňují f„(xo) = 0. Pak ovšem můžeme psát pro všechny x e [a, b] fn(x) = / g„(t)dt. Jxn Protože ale funkce g„ stejnoměrně konvergují k funkci g na celém [a, b], konvergují funkce /„ (x) k funkci f(x): ľ git) dt. zatímco druhá část (nad osou x) vymezená křivkami Protože je funkce g coby stejnoměrná limita spojitých funkcí opět spojitou funkcí, dokázali jsme vše potřebné, viz Věta 6.24 o Rie-mannově integrálu a primitivní funkci. □ Pro nekonečné řady můžeme předchozí výsledky shrnout takto: 6.43. Důsledek. Uvažme funkce f„(x) na intervalu [a,b]. (1) Jsou-li všechny funkce f„ (x) spojité na [a,b] a řada oo s(x) = j2mx) n=\ konverguje stejnoměrně k funkci S(x), je i funkce S(x) spojitá na [a, b]. 364 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 1, má obsah Neboť = 4, y 4 f^J=dx. _J_ jako součet S\ + S2 získáváme - fon (\^x~^W - f) + fon (|^9 - \^^W) = |(l+^). Ukázali jsme mj. to, že uvedený obrazec má konečný obsah, přestože není (shora ani zdola) ohraničený. (Blížíme-li se k x = 1 zprava, příp. zleva, jeho výška roste nade všechny meze.) Připomeňme zde neurčitý výraz typu 0 • oo. Obrazec je totiž ohraničený, když se omezíme na x e [0, 1 - á] U [1 + á, 4] při libovolně malém S > 0. □ 6.73. Určete průměrnou rychlost vp tělesa v časovém intervalu [1,2], pokud je jeho rychlost w(0 = ^=, t e [1,2]. Jednotky neuvažujte. Řešení. K vyřešení příkladu si stačí uvědomit, že hledaná průměrná rychlost je střední hodnota funkce v na intervalu [1,2]. Platí tak 2 5 •s/5 - V2, 2~l ■{ J\+t2 i 2-J* přičemž 1 + t2 = x,t dt = dx/2. □ 6.74. Vypočítejte délku s části křivky označované jako traktrix dané parametrickým popisem /(/) = r cos r + rln(tg|), g(r) = rsinr, t€[it/2,a], kde r > 0, a e (ji/2, ji). Řešení. Protože /'(/) = -r sinr + , ,r 2, = -r siní + -4- = r-^-, ■J v ' 2tg \ -cos2 í sin r sin r ' = r cos r na intervalu [tt/2, a], pro délku í dostáváme s = "f Jň^i + r2 co77 dr = f /Z^f-I dr ■> V sin2 í J v sin2 í ir/2 ir/2 = -rI if7* = -r[ln(sinOK/2 ir/2 -r ln (sin a) . □ 6.75. Spočtěte objem tělesa vzniklého otáčením omezené plochy, jejíž hranicí je křivka x4 — 9x2 + y4 = 0, kolem osy x. Řešení. Pokud je [x, y] bodem křivky x4 — 9r + y4 = 0, zřejmě tato křivka prochází rovněž body [—x, y], [x, —y], [—x, —y]. Je tedy (2) Jsou-li všechny funkce f„ (x) spojitě diferencovatelné na intervalu [a,b], řada S(x) = zY^i fn(x) konverguje pro nějaké xo e [a,b] a řada T(x) = zY^i fn(x) konverguje stejnoměrně na [a,b], pak také řada S(x) konverguje a je spojitě diferencovatelná na [a,b] a platí & (x) = T(x), tj. , OO n / oo (£/»(*>) = E ■/»'(*>■ (3) Jsou-li všechny funkce f„(x) riemannovsky integrovatelné na [a,b] a řada S(x) = J2fn(x) konverguje stejnoměrně k funkci S(x) na [a, b], je tamtéž in-tegrovatelná i funkce S(x) a platí vztah J (E f" w)dx = E / f" wdx- a n=l n=l a 6.44. Test stejnoměrné konvergence. Nejjednodušším způsobem pro zjištění stejnoměrné konvergence posloupnosti funkcí je porovnání s absolutní konvergencí vhodné posloupnosti čísel. Říkává se tomu často Weierstrassův test. Předpokládejme tedy, že máme řadu funkcí /„ (x) na intervalu I = [a, b] a že navíc známe odhad \fn(x)\ m dostáváme k k k \sk(x) - sm(x)\ = Yl /»(*) ^ E ^ E at- n=m + \ n=m+\ n=m+\ Pokud je řada (nezáporných) konstant 2^1i an konvergentní, pak bude samozřejmě posloupnost jejích částečných součtů cauchyov-ská. Právě jsme ale spočetli, že v takovém případě bude posloupnost částečných součtů s„ (x) stejnoměrně cauchyovská. Díky tvrzení dokázanému před chvílí v 6.41 jsme tedy právě dokázali následující Věta (Weierstrassův test). Nechť f„ (x) je posloupnost funkcí definovaných na intervalu [a,b] a platí |/„(x) | < a„ e R. Je-li řada čísel 5ľn=ia" konvergentní, pak řada S(x) = 5ľn=i fn(x) konverguje stejnoměrně. 6.45. Důsledky pro mocninné řady. Weierstrassův test je velice užitečný pro diskusi mocninných řad S(x) = ^a„(x n=0 -xo)" se středem v bodě xq. 365 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET souměrná vzhledem k oběma osám x, y. Pro y = 0 dostáváme x1 (x — 3) (x + 3) = 0, tj. osu x protíná hraniční křivka v bodech [—3, 0], [0, 0], [3, 0]. V prvním kvadrantu ji pak můžeme vyjádřit jako graf funkce f{x) = ij9x2 -x4, x €[0,3]. Hledaný objem je proto dvojnásobkem (zde uvažujeme x > 0) integrálu / jtf2(x)dx = ji f -J 9 x2 — x4 dx. o o Pomocí substituce / = V9 — x2 (xdx = —tdt) pak snadno spočítáme / V9x2 - x4 dx =Jx- V^x2 dx = - J t2 dt = 9, 0 0 3 a tak obdržíme výsledek 18jt. □ 6.76. Torricelliho trychtýř, 1641. Nechť část větve hyperboly xy = 1 pro x > a, kde a > 0, rotuje kolem osy x. Ukažte, že obdržené rotační těleso má konečný objem V a současně nekonečný povrch S. Řešení. Víme, že platí +00 : JI f (j) dx = JI f dx = JI lim 2ji J i-Jl + {-jžYdx = 2ji J ^^-dx>2ji j \dx (4) 2ji lim lnx x^+oo lna +oo. Skutečnost, že uvažované těleso (tzv. Torricelliho trychtýř) nelze natřít za pomoci konečného množství barvy, ale lze jej naplnit konečným množstvím kapaliny, se nazývá Torricelliho paradox. Uvědomme si však, že reálný nátěr barvou má nenulovou tloušťku, což jsme při výpočtu nijak nezohlednili. Kdybychom jej kupř. natírali zevnitř, jediná kapka barvy by nepochybně trychtýř nekonečné délky „ucpala". □ Další příklady na výpočet délek křivek, obsahů rovinných útvarů a objemů částí prostoru naleznete na straně 390. 6.77. Aplikace integrálního kriteria konvergence. Nyní se opět vraťme k (číselným) řadám. Díky integrálnímu kriteriu konvergence (viz 6.33) umíme rozhodnout o konvergenci širší třídy řad: Rozhodněte, zda následující sumy konvergují či divergují: oo a) J2 n~tan~> n=\ oo Při našem prvním setkání s mocninnými řadami jsme uká-íiV zali v 5.49, že každá taková řada konverguje na ixo — S, xo + &), kde tzv. poloměr konvergence w^tífe/ S > 0 může být také nula nebo oo (viz také ^íô—rí 5.53). Zejména jsme v důkazu věty 5.49 pro ověření konvergence řady S(x) používali srovnání s vhodnou geometrickou posloupností. Podle Weierstrassova testu je proto řada S(x) stejnoměrně konvergentní na každém kompaktním (tj. konečném) intervalu [a,b] uvnitř intervalu (xo — S, xo + S). Dokázali jsme tedy Věta. Každá mocninná řada S(x) je ve všech bodech uvnitř svého intervalu konvergence spojitá a spojitě diferencovatelná. Funkce S(x) je také integrovatelná a derivování i integrování lze provádět člen po členu. Ve skutečnosti platí také tzv. Ábelova věta, která říká, že mocninné řady jsou spojité i v hraničních bodech svého definičního oboru (včetně případných nekonečných limit). Tu zde nedokazujeme. Právě dokázané příjemné vlastnosti mocninných řad zároveň poukazují na hranice jejich použitelnosti při modelování závislostí nějakých praktických jevů nebo procesů. Zejména není možné pomocí mocninných řad dobře modelovat po částech spojité funkce. Jak uvidíme vzápětí, je možné pro konkrétněji vymezené potřeby nacházet lepší sady funkcí f„(x) než jsou hodnoty f„(x) = x™ . Nejznámějšími příklady jsou Fourierovy řady a tzv. wawelety, které přiblížíme v další kapitole. 6.46. Laurentovy řady. V kontextu Taylorových rozvojů se ještě podívejme na hladkou funkci f(x) z od- stavce 6.6. Viděli jsme, že není analytická v nule, protože tam má všechny derivace nulové. Takže zatímco ve všech ostatních bodech xo je tato funkce dána konvergentní Taylorovou řadou s poloměrem konvergence r — \xo\, v počátku řada konverguje jen v jediném bodě. Pokud ale do mocninné řady pro ex dosadíme za x výraz — 1/x2, dostaneme řadu funkcí oo 1 sw = E-r(-1>" (_1)M N! která bude konvergovat ve všech bodech i / Oa dává nám dobrý popis pro chování kolem výjimečného bodu x — 0. Podbízí se proto uvažovat následující obecnější řady docela podobné mocninným: [ Laurentovy řady j___ Řadu funkcí tvaru oo S(x) = Y an(x - xo)" n=—oo nazýváme Laurentova řada se středem vxq. Řadu nazveme konvergentní, jestliže konvergují samostatně její části s kladnými a zápornými exponenty. Smysl Laurentových řad je dobře viditelný u racionálních funkcí lomených. Uvažme takovou funkci S(x) — f (x)/g (x) s nesoudělnými polynomy /aga uvažme kořen xo polynomu g (x). Jeli násobnost tohoto kořenu s, pak vynásobením dostaneme funkci 366 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Řešení. Všimněme si nejprve, že ani u jedné z uvažovaných řad neumíme o její konvergenci rozhodnout na základě podílového či odmoc-ninového kriteria (všechny limity lim l^-li lim ýčh jsou rovny 1). Pomocí integrálního kriteria pro konvergenci řad pak dostáváme: a) r°° i r°° i / -dx = -dt = lim [ln(/)]„ : daná řada tedy diverguje. b) r°° i a daná řada tedy konverguje. dx = lim 2 ä^co □ 6.78. Pomocí integrálního kritéria rozhodněte o konvergenci řady Z (n+l)ln2(n+l)' Řešení. Funkce x € [1, +00) (x+1) ln2(i+l) ' je zjevně na svém definičním oboru kladná a nerostoucí, a proto řada v zadání konverguje, právě když konverguje integrál /j+0° f(x) dx. Užitím substituce y = ln (x + 1) (kdy je dy = dx/(x + 1)) můžeme vyčíslit ■ľ (x+1) ta2(x+l) dx - I j!2 ^ - ln 2' Řada tedy konverguje. G. Stejnoměrná konvergence 6.79. Konverguje posloupnost funkcí X4 yn = e*?, n e N stejnoměrně na K? Řešení. Posloupnost [y„}„^ bodově konverguje ke konstantní funkci y = 1 na K, neboť X4 lim e^1 = e° = 1, iěI. Z vyčíslení e > 2 pro každé n e N však vyplývá, že se nejedná o stejnoměrnou konvergenci. (V definici stejnoměrné konvergence postačuje uvážit e e (0,1).) □ S(x) — S(x)(x — xoY, která už bude na nějakém okolí bodu xo analytická a proto můžeme psát S(x) = a-i + ao + a\(x — xq) H----= (x - xo)s x - xo 00 = £ an(x-x0)n. n=—s Uvažujme nyní odděleně části obecné Laurentovy řady — 1 co S(x) = S- + 5+ = J2 a"(-x- *o)" + J2a»(x - xoT- n=—00 n=0 Pro řadu 5+ víme z Věty 5.49, že její poloměr konvergence R je dán rovností R~l — lim sup ý\an |. Když však aplikujeme tutéž úvahu na řadu 5- s dosazenými hodnotami 1 /x za x, zjistíme, že řada 5- (x) konverguje pro |x — xo \ > r, kde r~1 = lim sup ^/|rz_n|. Tyto úvahy platí bezezbytku i pro komplexní hodnoty x dosazované do našich výrazů. Věta. Laurentova řada S(x) se středem xo konverguje pro všechna x e C splňující r < \x — xo\ < R a diverguje pro všechna x splňující \x — xo\ < r nebo \x — xo\ > R. Vidíme tedy, že Laurentova řada nemusí konvergovat ve vůbec žádném bodě, protože klidně můžeme dospět k hodnotám R < r. Podíváme-li se ale např. na výše uvedený případ racionálních funkcí lomených rozvíjených do Laurentovy řady v některém z kořenů jmenovatele, pak zjevně je r = 0 a tedy, dle očekávání, bude konvergovat skutečně na prstencovém okolí tohoto bodu xo, zatímco R bude v tomto případě dáno právě vzdáleností k dalšímu nejbližšímu kořenu jmenovatele. V případě našeho prvního příkladu, funkce e~1//;t je r — 0 a R — 00. □ 6.47. Numerická priblížení integrace. Podobně jako na konci předchozí části textu (viz odstavec 6.17), nyní využijeme Taylorova rozvoje k návrhu co nejlepších a zároveň jednoduchých aproximací integrace. Budeme v_.->" -— pracovat s integrálem / — fb f(x)dx analytické funkce f(x) a rovnoměrným dělením intervalu [a, b] pomocí bodů a = xo, x\, ..., xn — b se vzdálenostmi x j — x j-1 = h > 0. Body uprostřed intervalů v děleních si označíme *;+i/2, hodnoty naši funkce v bodech dělení budeme psát jako f (x j) = fi. Příspěvek jednoho dílku dělení k integrálu spočteme pomocí Taylorova rozvoje a předchozí věty 6.45. Záměrně přitom integrujeme symetricky kolem středových hodnot, aby se nám při procesu integrace vzájemně vyrušily derivace lichých stupňů: fh/2 fh/2 / 00 1 \ / /fc+1/2 + t)dt = J2 -.řn\xi+V2)f dt = J-h/2 J-hl2\„,,n- / k=0 v_ co = e V2 x„=0 A/2 1 -A/2 k\ h2k+l 22k(2k+ 1)! f(k)(xMll)r dt ř2k)(xi+l,2) 367 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.80. Určete, zda řada n4+x stejnoměrně konverguje na intervalu (0, +oo). Řešení. Při označení AW = ^r. x > 0, n e N, je /;W= "<"4;f>, *>0, n € N. Nechť n e N je nadále libovolné. Nerovnosti f'n{x) > 0 pro x e (o,rc2/V3) a/„'(x) < Opro* e (V/VŠ, +oo) implikují, že maximum funkce /„ nastává právě v bodě x = n2/ V3. Protože ři=l ři=l podle Weierstrassova kritéria řada E^Li /»W konverguje stejnoměrně na intervalu (0, +oo). □ 6.81. Pro x € [-1, 1] sečtěte CO . , v (-!)"+■ n+í ^ n(n+l) ři=l Řešení. Nejprve upozorněme, že symbolem pro neurčitý integrál budeme označovat jednu konkrétní primitivní funkci (při zachování proměnné), kterou je vhodné chápat jako tzv. funkci horní meze, přičemž dolní mez je nula. Užitím věty o integraci mocninné řady pro x € (—1,1) obdržíme ^f^1 =£^i = /Eľ=i ((-irl!^-ldx)dx = f (I iZZl (-x)"-1 dx)dx=f(fl-x+x2-r+--- dx) dx = JUíJTxdx)dx. ln (1 + x) + Ci dx Jelikož j jr (J—^--x"^j dx = j ln (1 + x) + Ci dx, ze spojitosti uvažovaných funkcí víme, že CO j ^í^_x"=ln(l+i)+d, x e (-1,1). Volba x = 0 potom dává 0 = ln 1 + C\, tj. Ci =0. Dále je J ln (1 + x) dx = | per partes | u = ln (1 + x) u' = jl^r v' = 1 U = X dx = = x ln (1 + x) - j jf^ dx = x ln (1 + x) - j 1 - 1+x x ln (1 + x) - x + ln (1 + x) + C2 = (x + 1) ln (x + 1) - x + C2. Velmi jednoduchým numerickým přiblížením integrace na jednom dílku dělení je tzv. lichoběžníkové pravidlo, které pro aproximaci využívá plochu lichoběžníka určeného body [*,•, 0], [*,•, fi ], [0, xi+l], [xi+\, fi+i\. Tato plocha je Pi = \(fi + fi+l)h a celkem tedy integrál / odhadujeme hodnotou n — 1 ^ /lich = £ P<- = 2(/o + 2/l + • • • + 2/»-i + /»)■ i=0 Srovnáme nyní Zjich s přesnou hodnotou I spočtenou pomocí příspěvků po jednotlivých dílcích dělení. Hodnoty f můžeme vyjádřit pomocí prostředních hodnot a derivací f^\/2 takto: h i h2 n /i+l/2±l/2 = fi+1/2 ± 2/ŕ+1/2 + f (* + V2)± ^3 ni ±3!23/ (í' + 1/2) + ---' takže pro příspěvek P, do odhadu dostáváme 1 hl Pi = ^(// + /}+!)/! = Ä(/i+l/2 + ^pf" 0 existuje norma dělení S > 0 taková, že pro všechna dělení H s normou menší než S platí \SS-I\ < £. Např, jestliže zvolíme na intervalu [0, 1] za g(x) po částech konstantní funkci s konečně mnoha body nespojitosti c\, ..., a „skoky" a i = lim g(x) - lim g(x) pak Riemannův-Stieltjesův integrál existuje pro každou spojitou f (x) a je roven i = / f(x)dg(x) = y^aif(ck). JO 369 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Použitím (6.43) (3) dostávame y, 1 _ y\ ľ°° dx n2" ~ J2 xn+l ~ dx ľ°° 1 J2 x(x - 1) ľs lim : lim [(ln(á - 1) - ln(á) - ln(l) + ln 2] S—>oo ŕ i i j J2 x — 1 x dx ■ lim ln ln ( lim S - 1 S S - 1 + ln(2) = + ln2 = ln2. □ 6.83. Uvažme funkci f (x) = YlT=i ne nx. Určete / Jln: /(x)dx. Řešení. Obdobně jako v předchozím případě z Weierstrassova kriteria pro stejnoměrnou konvergenci vyplývá, že řada funkcí YlT=i ne~nx konverguje stejnoměrně na intervalu (ln 2, ln 3), neboť každá z funkcí ne~nx je menší než jň na (ln 2, ln 3) a řada Y^=\ jř konverguje, což plyne třeba z podílového kriteria pro konvergenci řad: (n + l)2-<"+1 1 n + 1 1 lim lim : lim n2n >oo 2 n Celkem podle (6.43) (3) platí ^ln3 ,.ln3 °° x) dx / f(x)dx = / V, Jln 2 Jln 2 ~[ ca .h - -u = Ď--"e = Ě(F-5r) = 14 = 3- řl = l řl=l V 7 ne-"1 dx □ 6.84. Určete následující limitu (postup výpočtu zdůvodněte): lim y00 cos Jo (77 ■ dx. Stejnou technikou, jako jsme používali u Riemannova integrálu, lze i nyní zavést horní a dolní součty a horní a dolní Rie-mannův-Stieltjesův integrál, které mají tu výhodu, že pro omezené funkce vždy existují a jejich hodnoty splývají, právě když existuje Riemannův-Stieltjesův integrál ve výše uvedeném smyslu. Již u Riemannova integrálu jsme měli problém s integrovatel-ností funkcí, které byly „příliš rozeskákané". Technicky pro funkci g(x) na konečném intervalu [a, b] zavádíme její variaci vztahem n var^J g = sup^ \g(xt) - g(*;_i)|, kde supremum bereme přes všechna dělení H intervalu [a, b]. Pokud j e supremum nekonečné, říkáme, žeg(x) má neomezenou variaci na [a ,b], v opačném případě říkáme, že je g funkce s omezenou variací na intervalu [a,b]. Podobně, jak jsme postupovali u Riemannova integrálu, můžeme docela snadno odvodit následující: Věta. Nechť f (x) a g(x) jsou reálné funkce na konečném intervalu [a,b]. (1) Pokud je g(x) neklesající a spojitě diferencovatelná, pak Rie-mannův integrál nalevo a Riemannův-Stieltjesův integrál napravo existují současně a jejich hodnoty jsou si rovny f f{x)g\x)dx = f f{x)dg{x) J a J a (2) Pokud je f(x) spojitá a g(x) je neklesající funkce s konečnou variací, pak integrál f% f(x)dg(x) existuje. 6.49. Kurzweilův integrál. Posledním zastavením bude modifikace Riemannova integrálu, která napravuje nešťastné chování ve třetím bodu v odstavci 6.37, tj. limity neklesajících posloupností integrovatelných funkcí budou opět integrovatelné. Pak budeme moci i v těchto případech měnit pořadí Umitního procesu a integrace, jak tomu bylo u stejnoměrné konvergence. Všimněme si napřed v čem je jádro problému. Intuitivně bychom měli předpokládat, že hodně malé množiny musí mít velikost nulovou, a tudíž by změny hodnot funkcí na takovýchto množinách neměly ovlivnit integraci. Navíc, spočetné sjednocení takových „pro integraci zanedbatelných" množin by mělo mít opět velikost nulovou. Jistě bychom tedy čekali, že např. množina racionálních čísel uvnitř konečného intervalu bude mít takovouto vlastnost a tedy její charakteristická funkce by měla být integrovatelná a hodnota takového integrálu má být nulová. Řekneme, že množina A c K má nulovou míru, když pro každé £ > 0 můžeme najít pokrytí množiny A spočetným systémem otevřených intervalů /;, i = 1, 2, ..., takových, že 2~^m(/;) < £. V dalším budeme vždy výrokem „funkce / má na množině B danou vlastnost skoro všude" myslet skutečnost, že má / tuto vlastnost ve všech bodech, až na podmnožinu A c B míry nula. Např. tedy charakteristická funkce racionálních čísel je skoro všude nulová, po částech spojitá funkce je skoro všude spojitá atd. Chtěli bychom nyní modifikovat definici Riemannova integrálu tak, abychom uměli při volbě dělení a příslušných Rieman-nových součtů ehminovat neblahý vliv hodnot integrované funkce 370 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Řešení. Určeme nejprve lim j^tw. Posloupnost těchto funkcí kon-verguje bodově a s využitím 5.43 máme cos(i) 1 1 lim (1 + i)" lim (1 + i)" Lze ukázat, že daná posloupnost konverguje stejnoměrně. Potom podle (6.41) raníte - ľ Jo (l + f)"dX " Jo = ľ Jo cos(£) lim--^ ^cc (1 + £)« dx 1 To Ověření stejnoměrné konvergence dané posloupnosti necháváme na čtenáři (podotýkáme jenom, že diskuze je složitější než v předchozích příkladech). □ na předem známé množině míry nula. Nabízí se zkusit zajistit, aby dílky v uvažovaných děleních s reprezentanty měly tu vlastnost, že kolem bodů takovéto množiny budou kontrolovatelně malé. Kladnou reálnou funkci S na konečném intervalu [a, b] nazýváme kalibr. Dělení H intervalu [a, b] s reprezentanty fnazýváme S-kalibrované, jestliže pro všechna i platí & - S(&) < Xi-i < & < xí < & + S(&). Pro další postup je podstatné ověřit, že ke každému kalibru S lze najít nějaké S-kaUbrované dělení s reprezentanty. Tomuto tvrzení se říká Cousinovo lemma a lze jej dokázat např. obvyklým postupem opřeným o vlastnosti suprem. Pro daný kalibr S na [a,b] si označíme M množinu všech bodů x e [a, b] takových, že na [a, x] lze S-kaUbrované dělení s reprezentanty najít. Jistě je M neprázdná a ohraničená a má tedy supremum s. Kdyby s ^ b, pak bychom uměli najít kalibrované dělení s reprezentantem v s a to vede na spor. Nyní již můžeme zavést zobecnění Riemannova integrálu takto: Definice. Funkce / definovaná na konečném intervalu [a, b] má Kurzweilův integrál I = J a f(x) dx, jestliže pro každé £ > 0 existuje kalibr S takový, že pro každé S-kalibrované dělení s reprezentanty H platí pro příslušný Rie-mannův součet 5a odhad |5a — I\ < s. 6.50. Vlastnosti Kurzweilova integrálu. Předně si povšimněme, \\ že jsme při definici Kurzweilova integrálu jen omezili množinu všech dělení, pro které Riemannovy součty bereme v úvahu. Pokud tedy bude naše funkce ri-W emannovsky integrovatelná, musí mít nutně i Kurzweilův integrál a tyto dva integrály jsou si rovny. Ze stejného důvodu můžeme zopakovat argumentaci ve Větě 6.24 o jednoduchých vlastnostech Riemannova integrálu a opět ověřit, že se stejně chová i integrál Kurzweilův. Zejména je lineární kombinace integrovatelných funkcí cf(x) + dg(x) opět integrovatelná a její integrál je c f(x)dx+d f£ g(x)dx atd. Při důkazu je potřeba jen promyslet drobné modifikace při diskusi zjemněných dělení, která navíc mají být S-kaUbrovaná. Podobně lze rozšířit pro případ monotónních posloupností bodově konvergentních funkcí argumentaci ověřující, že limity stejnoměrně konvergující posloupnosti integrovatelných funkcí /„ jsou opět integrovatelné a integrálem limity je limita hodnot integrálů /„. Konečně, Kurzweilův integrál se chová tak, jak bychom si přáli, i vůči množinám s nulovou mírou: Věta. Uvažme funkci f na intervalu [a, b], která je skoro všude rb nulová. Pak Kurzweilův integrál Ja f(x)d(x) existuje a je roven nule. Důkaz. Jde o pěknou ilustraci myšlenky, že se můžeme zbavit vlivu hodnot na malé množině pomocí chytré volby kalibru. Označme si M příslušnou množinu míry nula, vně které je f(x) = 0 a pišme c [a, b], k = 1pro podmnožinu bodů, pro které je k — 1 < \f(x)\ < k. Protože má každá z množin Mi nulovou míru, můžeme ji pokrýt spočetným systémem v součtu libovolně malých a po dvou disjunktních otevřených 371 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET intervalů Jkj. Definujme si nyní kalibr S(x) pro x e Jkj tak, aby celé intervaly (x — S(x),x + S(x)) byly stále obsaženy v Jkj. Mimo množinu M pak S dodefinujeme libovolně. Pro S-kalibrované dělení H intervalu [a, b] pak můžeme odhadnout příslušný Riemannův součet n—l n—l i=0 i=0 íi6M i=l i=0 OO , řl —1 7=0 Pokud tedy pro předem známé £ chceme dosáhnout, aby tento odhad byl menší než e, stačí volit pokrytí intervaly Jkj tak, aby OO Pak totiž v posledním výrazu v našem odhadu můžeme dosadit za vnitřní sumu, sečíst geometrickou řadu Y^h=\ ^' a dostaneme právě požadované £. □ Důsledek. Integrovatelnost dané funkce f(x) ve smyslu Kurzweila ani hodnotu jejího integrálu nezměníme, pozměníme-li hodnoty f(x) na množině míry nula. V literatuře lze najít mnoho krásných a užitečných výsledků o integrálech, které připouští záměnu limitních procesů daleko siřeji než je tomu i Riemannova integrálu. Kurzweilův integrál je jednou z možných cest, častější je použití integrálu Lebesgueova a souvislostí s abstraktní teorií míry. Nemáme tu nyní prostor pro další úvahy v těchto směrech. 372 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET H. Doplňující příklady k celé kapitole 6.85. Nechť je dána funkce / a bod z, přičemž platí /(z)=0, /'(z) = 0, /"(z) = 0, /(3)(z) = l-Která z následujících tvrzení: (a) tečnou ke grafu funkce / v bodě [z, f (z)] je osa x; (b) funkce / není polynomem druhého stupně; (c) funkce / v bodě z roste; (d) funkce / nemá v bodě z ostré lokálni minimum; (e) bod z je inflexním bodem funkce / jsou zcela jistě pravdivá? O 6.86. Vyšetřete průběh funkce f{x) = -22f. J v 7 cos 2x Řešení. Do definičního oboru náleží všechna pro která je cos 2x j^O. Rovnice cos 2:*; = Oje splněna právě pro 2x = f + kit, k e Z, tj. x = f + !f, k e Z. Jako definiční obor tak obdržíme množinu R\ {j + T' k e A ■ Zřejmě je fi-x) = = -^l = f (X) J - 7 cos(—2x) cos 2x J \ y pro všechna x z definičního oboru, a tudíž je / s definičním oborem symetrickým kolem počátku sudou funkcí, což vyplynulo ze sudosti funkce y = cos x. Když dále uvážíme, že kosinus je periodický s periodou 2jt (tj. y = cos 2x má periodu jt), dostaneme, že postačuje uvažovat funkci / pro x e V := [0, x] x {f + f; * e Z\ = [0, f) U (f, 3f) U (3f, n], neboť průběh zadané funkce na celém jejím definičním oboru lze odvodit s použitím toho, že je sudá a periodická s periodou 2jt. Zabývejme se proto pouze body nespojitosti x\ = jt/4ax2 = 3 ji/4 a stanovme pro ně příslušné jednostranné limity lim -SSf = +oo, lim -^if = _oo, x—> — — C0S x—>— + C0S lim -SSf = +oo, lim -SSf = -oo. 3^ cos ' 3jr cos ^^"5-- x^r-g- + Přihlédneme-li ke spojitosti / na intervalu in/4, 3jt/4), vidíme, že / na tomto intervalu nabývá všech reálných hodnot. Oborem hodnot / je tedy celé K. Rovněž jsme zjistili, že body nespojitosti jsou tzv. druhého druhu, kdy aspoň jedna jednostranná limita je nevlastní (příp. neexistuje). Tím jsme současně dokázali, že přímky x = ji/4 a x = 3jt/4 jsou asymptotami bez směrnice. Kdybychom předchozí výsledky formulovali bez omezení se na interval [0, jt], tak můžeme např. říci, že ve všech bodech xk = j + kf, k€Z má / nespojitost druhého druhu a že každá přímka x = E + !ft keZ 373 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET je asymptotou bez směrnice. Současně z periodičnosti funkce / vyplývá, že jiné asymptoty neexistují. Zvláště nemůže mít žádné asymptoty se směrnicí, ani nemohou existovat (jako nevlastní) limity lim^+oo fix), lim^-oo fix). Ještě určíme průsečíky s osami. Průsečík [0,1] s osou y nalezneme vyčíslením /(O) = 1. Při hledání průsečíků s osou x uvažujeme rovnici cos* = 0, x e V s jediným řešením x = ji/2. Snadno dále získáme intervaly [0, ji/4), in/2, 3jt/4), kde je funkce / kladná, a intervaly in/4, n/2), (3jt/4, ji], kde je záporná. Nyní přistoupíme k výpočtu derivace — sin x cos 2x — 2 cos x (— sin 2x) /'(*) =-~~-"-~ = cos2 2x — sin x (cos2 x — sin2 x) + 2 cos x (2 sin x cos x) cos2 2x sin3 x + 3 cos2 x sin x (sin2 x + cos2 x + 2 cos2 x) sin x cos2 2x cos2 2x (2cos2 x + l) sin x = ---j2-, *eD. cos2 2x Body, ve kterých je fix) = 0, jsou řešením rovnice sinx = 0, x e V, tj. derivace je nulová v bodech x3 = 0, x4 = n. Z nerovností 2cos2 x + 1 > cos2 2x > 0, sinx > 0, x e D n (0, n) plyne, že v každém vnitřním bodě množiny V funkce / roste, a tudíž / roste na každém podintervalu V. Sudost / potom implikuje, že klesá v každém bodě x e i—n, 0),x ^ —3n/4,x ^ —n/4. Funkce má proto ostré lokálni extrémy právě v bodech x k = kn, k e Z. Vzhledem k periodičnosti / tyto extrémy jednoznačně popíšeme pozorováním, že pro x3 = x0 = 0 dostáváme lokální minimum (zopakujme funkční hodnotu / (0) = 1) a pro x4 = x\ = n lokálni maximum s funkční hodnotou f in) = —1. Spočítejme druhou derivaci f"í \ [4 cosx(— s*n x) sin x+(2 cos2 x+í) cos x] cos2 1x— 4 cos 1x{— sin 2x)(2 cos2 x+l) sin x J W = l^Flx [—4 cos x sin2 x+2 cos3 x+cos x] (cos2 x— sin2 x)— 4(—2 sin x cos x)(2 cos2 x+l) sin x cos3 2x _ —6 cos3 * sin2 ;t+2 cos5 ;t+cos3 x+4 cos * sin4 x— cos * sin2 x+16 sin2 * cos3 ;t+8 sin2 x cos * cos3 2x [10 sin2 x cos2 x+2 cos4 x+cos2 x+4 sin4 x+1 sin2 cos x ^ = J-TI-1-, x e V. cosJ 2x Poznamenejme, že jednoduchými úpravami lze také vyjádřit , , (3+4 cos2 x sin2 jr+8 sin2 x) cos x ^ t (x) = --Tň-;-, x € V J - ' cos-* 2x nebo rn> , (11— 4 cos4 x—4 cos2 x) cos x m f (x) = ---■-, x e V. ■J - 7 cosJ 2x Protože 10 sin2 x cos2 x + 2 cos4 x + cos2 x + 4 sin4 x + 7 sin2 x > 0, x e K, resp. 3+4cos2 x sin2x + 8 sin2 x = 11 — 4cos4 x — 4cos2 x > 3, x e K, je/"(x) = 0 pro jisté x e V tehdy a jen tehdy, když cos x = 0. Tomu ale vyhovuje pouze x5 = n/2 e V. Je vidět, že v tomto bodě mění /" znaménko, tj. jedná se o infiexní bod. Jiný infiexní bod neexistuje (druhá derivace /" je spojitá na V). K dalším změnám znaménka /" dochází v nulových bodech 374 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET jmenovatele, které jsme již dříve určili jako body nespojitosti x\ = ji/4 & x-i = 3n/4. Znaménko se tedy mění právě v bodech x\, x-i, x5, a tak z nerovnosti f"(x) > 0 pro x 0+ vyplývá, že / je konvexní na intervalu [0, ji/4), konkávni na (ji/4, jt/2], konvexní na [ji/2, 3ji/4) a konkávni na (3jt/4, ji]. Konvexnost a konkávnost funkce / na jiných podintervalech je dána její periodičností a následujícím jednoduchým pozorováním. Je-li funkce sudá a konvexní na intervalu (a, b), kde 0 < a < b, potom je konvexní rovněž na (—b, —a). Zbývá jen vyčíslit derivaci (k odhadu rychlosti růstu funkce) v inflexním bodě se ziskem /' (ji/2) = 1. S pomocí všech předchozích výsledků lze již lehce sestrojit graf funkce /. □ 6.87. Vyšetřete celkový průběh funkce /« = -Í+T. *eK\{-l}. Tedy určete (má-li smysl): (a) definiční obor (ten je zadán) a obor hodnot; (b) případnou sudost, lichost, periodicitu; (c) body nespojitosti a jejich druh (včetně příslušných jednostranných limit); (d) průsečíky s osami x, y; (e) intervaly, kde je funkce kladná a kde záporná; (f) limity lim^-oo f(x), lim^^ f (x); (g) první a druhou derivaci; (h) kritické a tzv. stacionární body, ve kterých je první derivace nulová (příp. body, ve kterých neexistuje první nebo druhá derivace); (i) intervaly monotonie; (j) ostré i neostré lokální a absolutní extrémy; (k) intervaly, kde je funkce konvexní a kde konkávni; (1) inflexní body; (m) asymptoty bez směrnice a se směrnicí; (n) hodnoty funkce / a její derivace /' ve „významných" bodech; (o) graf. O 6.88. Vyšetřete průběh funkce f(x) = Vyšetřením průběhu funkce / se (nejen v tomto příkladu) rozumí udat definiční obor, obor hodnot a případnou lichost, sudost, periodicitu; spočítat limity lim f{x) a lim fix), x^—oo x^+oo jestliže existují; určit body nespojitosti a jejich druh včetně příslušných jednostranných limit (pokud existují), nulové body (pokud existují) a intervaly, kde je funkce kladná a kde záporná; stanovit první (a druhou, je-li potřeba) derivaci a intervaly, na kterých funkce roste, klesá, čije konstantní; nalézt stacionární (kritické) body a všechny lokální extrémy (pokud existují); určit inflexní body a intervaly, kde je funkce konvexní a kde konkávni; vypočítat hodnoty ve význačných bodech (tj. vyčíslit funkci 375 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET ve stacionárních a v inflexních bodech, pomůže-li to při kreslení grafu, a uvést průsečíky s osami, existují-li); načrtnout její graf s asymptotami". O 6.89. Vyšetřete průběh funkce ln(jc) a načrtněte její graf. O Řešení. i) Nejprve určíme definiční obor funkce: K+ \ {1}. ii) Nalezneme intervaly monotónnosti funkce: nejprve nalezneme nulové body derivace: ln(jc) - 1 f'{x) = —-i- = 0 \n2ix) Tato rovnice má kořen e. Dále vidíme, že fix) je na intervalu (0, 1) i (1, é) záporná, tedy je fix) na intervalu (0, 1) ina (1, é) klesající, dále je fix) na intervalu (e, oo) kladnáatedy fix) rostoucí. Má tedy funkce / jediný extrém v bodě e a to minimum, (také bychom o tom mohli rozhodnout pomocí znaménka druhé derivace funkce / v bodě e, je totiž /(2) (e) > 0) iii) Určíme inílexní body: 2 - Inix) x ln3 ix) Tato rovnice má kořen e2, který musí být inflexním bodem (extrém to již být nemůže vzhledem k předchozímu bodu). iv) Asymptoty. Funkce má asymptotu přímku x = 1. Dále hledejme asymptoty s konečnou směrnicí k: k = /ímj^M— = lim -= 0. x x-roo Inix) Pokud asymptota existuje, má tedy směrnici 0. Pokračujme tedy ve výpočtu x lim--0 • x = lim x = oo, x^OO ln(x) X-rOD a protože limita není konečná, asymptota s konečnou směrnicí neexistuje. Průběh funkce: f(2)(x)= ,3/ =0 376 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET □ 6.90. Vyšetřete průběh funkce f(x) ^2 xs-3xi+3x+l x-l O 6.91. Vyšetřete průběh funkce /(*) = O 6.92. Vyšetřete průběh funkce fix) = arctg 2Z7. O 6.93. Vyšetřete průběh funkce ^-, mimo jiné nalezněte extrémy, infiexní body, asymptoty a načrtněte její graf. O 6.94. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, infiexní body, asymptoty. Inix2 - 3x + 2) + x. 6.95. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, infiexní body a asymptoty. (x2 -2)ex2~\ 6.96. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, infiexní body a asymptoty. \ni2x2 - x-1). 6.97. Vyšetřete průběh funkce, mimo jiné nalezněte extrémy, infiexní body a asymptoty. x2 -2 x - 1 O O o o 6.98. Použitím základních vzorců určete libovolnou primitivní funkci k funkci (a) y = ijx y1 x *Jx, x € (0, +00); (b) y = Í2X + 3X)2 , 6.99. Využijte derivací funkcí y = tg x a y = cotg x k nalezení neurčitých integrálů funkcí O 377 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET (a) y = cotg2-v, x e (0, n); (b) y = .2 1 , , x e (0, f). v ' sirr x cos- x \ Z f 6.100. Uvedie primitivní funkci k funkci y = ď + 6.101. Určete / dx> x€ 6.102. Stanovte 6. i 03. Pro x e (0, 1) vypočtěte f ( f2,+l, + , 3 + 4 sin x — 5 cos x) dx. J \x(x2-\) ^A-Ax2 ) o jA-x2 na intervalu (—2, 2). O O o o 6.104. Vyjádřete neurčité integrály (a) J arctgx dx, x e k; (b) j ^ dx, x > 0 pomoci integrační metody per partes. O 6.105. Opakovaným užitím pravidla per partes pro všechna x € R vypočtěte (a) f x2 sin x dx; (b) / x2 e1 dx. O 6.106. Určete integrály sin2(.\)-cos2(jt) ' b) / x2s/2x + ldx. 378 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Řešení. Pro výpočet prvního z integrálů zvolíme substituci / = tg x, kterou lze často s výhodou uplatnit. dx / sin (x) — cos2(x) t = tg x dt = dx = (1 + tg2(x)) dx = (1 + t2) dx sinz(x) cosz x „2/„\ _ tg2(x) _ í2 cos2(x) i+tgHx) \+fi l+tg2(l) — T+fi = f^-*=1-[J—1-[—= J t2-í 2] t-l 2] t + l 2 \tg(x) +1j Nyní určeme druhý integrál: j x2V2x + ldx = u = x2 u' = 2x v' = V2x + 1 v = |(2x + l)i 1 3 4 ľ 2 3 = -x2(2x + l)2 - - / x2V2x + ldx - -(2x + l)2 + C, což můžeme chápat jako rovnici, kde neznámou je hledaný integrál. Převedením na jednu stranu pak / x2 V2x + 1 dx = -x2(2x + 1)2 - - [ xVlxTT = 7 1J u = x u' = 1 v' = V2x + 1 v = \sl2x + 1 ^(2x + 1)1 - Z QxV2x + 1 - i y"(2x + l)i dx^) 1 3 2 2 5 -x2(2x + 1)2--xV2x + 1 H--(2x + 1)2 = 1 ' 21 105 -x2(2x + 1)2 - — x(2x + 1)2 + — (2x + 1)2 + C. 7 v ; 35 105 (5. i 07. Například integrací per partes určete f x in2 x dx pro x > 0. (5.Í0& Pomocí metody per partes spočtěte / (2-x2)e*rfx na celé reálné ose. 6.109. Integrujte (a) J(2x + 5)wdx, x e : (c) / e^3x2 dx, x e K; □ O o 379 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET (d) / 15 ssitíí x €(-1,1); (e) J ^ dx, x > 0; (g) f-&idx> X€R> (h) / sin ^yjč dx, x > 0 aplikací substituční metody. 6.110. Vypočtěte f 2j4+2j2-5j+1 dx, x ^ 0. J x(x2-x + lf Řešení. Platí f ^f^t1 dx= + ľ dx + ľ J x(x2-x + lf J x J x2-x + \ J x-6 ^X\ + lf^dX + lfx^ + lfl^dX (x2-x+iy x-l -x + 1) dx t = x2 - x + 1 I dt = (2x - 1) dx | ~ 1 X 1 + II ľ ^ 2 J (x2-x+\)2 H) +§ 3 J m :ln|Wx2-.+ii+H/7-^-i-f/ * 2x-l [(^)2+Í 1 - ^ (3 arctgw + i ^) + C = ln | x Vx2 - x + 1 | + _|_ hĎ. amtíT 2id - 22VI arntíT 2*^1 - 1 _ 22VŠ , + 3 arCtS V3 9 V3 2(x2-x+l) 9 (2^)2+1 + + C = ln|xV*2 -x + l\-f arctg 2^ - I+ C O á.iii. Pro x e (0, 1) pomocí vhodných substitucí prevedie integrály i*2^^ /;—-— na integrály racionálních lomených funkcí. 6.112. Pro x € (—ji/2, ji/2) vypočtěte (x-l)jx2+x+l pomocí substituce / =tgx. 6.113. Libovolným způsobem určete f dx, x > 0. 6.114. Spočtěte (a) j x" lnx dx, x > 0, n —1; (b) / jfrjdx, x e K. □ o o o 380 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET O 6.115. Pro x > 0 stanovte (a)/^dr. Q»f£+£dx; (Oj-j^dx. Řešení. Všechny tři zadané integrály jsou tzv. binomické, tj. lze je zapsat jako f xm (a + bx")p dx pro jistá čísla a, b e K, m,n, p e Q. Binomické integrály se tradičně řeší aplikací substituční metody. Pokud p € Z (nikoli nutně p < 0), volí se substituce x = ŕ, kde s je společný jmenovatel čísel man; pokud ^ e Z a p i Z, klade se a + bx" = ŕ, kde s je jmenovatel čísla p; a pokud 2^ + p e Z (p £ Z, 2!±I £ Z), zavádí se a + fcť1 = ť x", kde í je jmenovatel p. V těchto třech případech je potom zaručen přechod k integrování racionální lomené funkce. Snadno tak vypočítáme (a) fS2^.dx = fx-l(2 + 5xýdx: peZ x = r dx = 4t3 dt | : 4 J (8 + 60r4 + 150í8 + 125r12) rfr = 4 (8/ + 12/= + f t9 + ±f r13) + C :4/(2 + 5r4) rfr : 4 (8Ví+ 12v?+ f vi") + C; (b) - , » 1 /, 1 \ 3 dx 12} t3 {t3 - 1) rfr p i Z, 2±1 e z 1 + xXi = t3 X = (P - i)4 dx = 12f (t3 - i)3 dt | 12/ ŕ - t3 dt = 12 (l - fy + c = 12V(1 + tfx)A - i) + C; (c) /?I+7f- cosx = Y^p-, dx = -^j- dt. S její pomocí určíme / J^n = f "Ä dt = 2f ^ = arctg (VšY) + C = 2-f arctg (VŠtg f) + C . □ (5. i i 7. Provedte naznačené dělení polynomů 2x5-x4+3x2-x+l x2-2x+4 pro x e K. O 6.118. Vyjádřete funkci _ 3xi+2x,-x2+l y — 3x+2 jako součet polynomu a ryze lomené racionální funkce. O 6.119. Rozložte racionální lomený výraz f \ 4x2+13x-2 . w i3+3i2-4i-12' íh\ 2x5+5x^-x2+2x-\ W x»+2x*+x2 na součet parciálních zlomků. O 6.120. Vyjádřete funkci _ 2j3+6j2+3j:-6 y - x*-2xi ve tvaru parciálních zlomků. O 6.121. Rozložte výraz 7x2-Wx+37 i3-3i2+9i+13 382 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET na parciální zlomky. O 6.122. Vyjádřete racionální lomenou funkci y -5x+2 xi-xi+2x2 ve tvaru součtu parciálních zlomků. O 6.123. Rozložte na parciální zlomky funkci ^ ~ x}(x + l) • o 6.124. Uvedie tvar rozkladu na parciální zlomky racionální lomené funkce — 2x2-114 " (x-2)x2(3x2+x+4)2' Neurčité koeficienty nepočítejte! O 6.125. Upravte funkci v _ xi+6x2+x-2 y - x*-2xi na součet polynomu a ryze lomené racionální funkce Q. Získanou funkci Q poté vyjádřete ve tvaru součtu parciálních zlomků. O 6.126. Napište primitivní funkci racionální lomené funkce (a) y = ^, x ± 2; (b) y = -^, x + 2. 6.127. Vyjádřete O o 6.128. Vypočtěte neurčitý integrál funkce (x2+x + \) o 6.129. Určete 6.130. Integrujte j-^dx, x^l. O O 6.131. Spočtěte integrál 383 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET O 6.132. Pro x € (0, §) vypočítejte (a) J sin3 x cos4 x dx; (b) (c) / 2 sin2 f dx; (d) / cos2* dx; (e) / cos5 x V sin* (f) f_íl_• sin2 x cos4 x ' (S) / sjn3 j. > (h) (4^. O 6.133. Nechť je dána funkce y = | x | na intervalu I = [— 1, 1] a dělení 3„ = (-1, - —, ...,--, 0, i, ..., 1) intervalu I pro libovolné n e N. Určete 5^, sup a 5a„> (tedy horní a dolní Riemannův součet odpovídající danému dělení). Na základě tohoto výsledku rozhodněte, zdaje funkce v = |x|na[—1,1] integrovatelná (v Rie-mannově smyslu). O 384 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET 6.134. Vyčíslete lim o 6.135. Kolik existuje různých primitivních funkcí k funkci y = cos (ln x) na intervalu (0, 10)? O 6.136. Zavedte funkci / na intervalu I = [0, 1] tak, aby k ní na I neexistovala primitivní funkce. O 6.137. Pomocí Newtonova integrálu vyčíslete (a) / sin x dx; 0 1 (b) / arctgx dx; b (c) f -r^- dx; V 7 J 1 +3111 .y ' -K/4 (d) / I lnx\dx. l/e 6.138. Spočtěte dx. 6.141. Např. opakovaným užitím pravidla per partes spočítejte ir/2 f e2jc cosx dx. 6.142. Stanovte x~ e 1 dx. 6.143. Vyčíslete integrál O o 6.139. Pro libovolná reálná čísla a < b určete b f sgnx dx. a Připomeňme, že sgn x = 1,je-li* > 0; sgnx = —1, je-li x <0;asgn0 = 0. O 6.140. Vyčíslete určitý integrál o O o o 385 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET f dx /5-4i -1 za pomoci substituční metody. O 6.144. Vypočtěte ln 2 (b) / i o O 6.145. Které z kladných čísel jr/2 jr p := J cos7 x dx, q'■= J cos2 x dx o o je větší? O 6.146. Určete znaménka těchto tří čísel (hodnot integrálů) 2 7t 2ir a := f ŕ 2X dx; b := J cos x dx; c := J ^ dx. -2 0 0 O 6.147. Seřadte čísla ir/2 ir/2 1 A := J cosx sin2x dx, B := J sin2x dx, C := J —x5 5X dx, o o-i 10 2ir ti D:=J^dx + J^dx + J^dx 2tc ti 10 podle velikosti. O 6.148. Uvážením geometrického významu určitého integrálu stanovte 2 (a) / | x - 1 | dx; -2 0,10 (b) f tgx dx; -0,10 2ir (c) / sinx dx. o O 6.149. Vypočtěte J_l\x \ dx. Q 6.150. Určete J x5 sin2 x dx. 6.151. S chybou menší než 1/10 přibližně vyčíslete 2 J (x -c-2jTfĹ)iax dx. O 386 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET O 6.152. Vyjádřete bez symbolu derivace a integrace výraz / 3/2 cos r dt\ V I s proměnnou x e K a reálnou konstantou a, je-li derivováno podle x. O 6.153. Spočtěte neurčitý integrál /■ - ' - x4 + 3x3 + 5x2 + 4x + 2 6.154. Vypočtěte integrál 2 siní --^-dt. 1 — cos/1 6.155. Vypočtěte integrál r1"2 dx J Jo e2x — 3e 6.156. Vypočtěte: (i) f q sinx sin 2x dx, (ii) J sin2 x sin 2x dx. 6.157. Vyčíslete nevlastní integrál (a) / fc- — CO +CO (b) / f; o (c) f2-^dx; o i (d) / ln | x | í/.t. -i ó~./5& Určete 3ir/2 /' cos j: J l+sinx 0 dx. 6.159. Spočítejte nevlastní integrál O o o o o o 387 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.160. Vyčíslete +00 í 2x dx. j ezx+e*+l 6.161. Užitím substituční metody vypočtěte 0 2 00 _L J x e-* dx; f dx. 6.162. Vyčíslete integrály 1 /r 4 - /r +°° - /í Z5^- 0 1 4 6.163. Uvedte hodnoty a e K, pro něž +00 (a) J £ e K; 1 1 (b) / I e 1; b +00 (c) J sinoa dx e K. 6.164. Pro jaká p,q € K je integrál +00 dx ľ d J xľ\ľfli 2 —00 v.. t-100 n=0 O o o o o konečný? O 6.165. Rozhodněte, zda platí (a) 7-^3 e K; — CO +CO (b) / ^e K; O friáč). Vyčíslete cos s chybou menší než 1CT5. O 6.167. Pro konvergentní řadu 388 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET odhadněte chybu aproximace jejího součtu částečným součtem Í9999. O 6.168. Bez počítání derivací uvedie Taylorův polynom 4. stupně se středem v bodě x0 = 0 funkce f(x) = cosx — 2sinx — ln(l + x) , x e (—1, 1). Poté rozhodněte, zdaje graf funkce / v okolí bodu [0, 1] nad tečnou, pod tečnou. O 6.169. Z Taylorova rozvoje se středem v počátku funkce y = sin x získejte pomocí derivace Taylorův rozvoj funkce y = cos x. O 6.170. Najděte analytickou funkci, jejíž Taylorova řada je x-lj? -ixT +... , přičemž x e [—1,1]. O 6.171. Ze znalosti součtu geometrické řady odvodte Taylorovu řadu funkce y = 5T27 se středem v počátku. Poté určete její poloměr konvergence. O 6.172. Rozviňte funkci y = 3^' *e H>!) v Taylorovu řadu se středem v počátku. O 6.173. Rozviňte do mocninné řady funkci cos2(x) v bodě jt/4 a určete pro která x e K tato řada konverguje. O 6.174. Funkci y = ď definovanou na celé reálné přímce vyjádřete jako nekonečný polynom se členy tvaru an (x — 1)™ a funkci y =2X definovanou na K vyjádřete jako nekonečný polynom se členy anx". O 6.175. Nalezněte funkci /, k níž pro x e K konverguje posloupnost funkcí Je tato konvergence stejnoměrná na K? O 6.176. Konverguj e řada T -řfj, kde n=\ stejnoměrně na celé reálné ose? O 6.177. Z Taylorova rozvoje se středem v počátku funkce y = sin x získejte pomocí derivace Taylorův rozvoj funkce y = cos x. O 6.178. Odhadněte (a) kosinus deseti stupňů s přesností alespoň 10-5; (b) určitý integrál JQ1/2 s přesností alespoň 1CT3. O 6.179. Určete mocninný rozvoj se středem v bodě x0 = 0 funkce x f(x) = Jeř dt, x € K. o 389 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET O 6.180. Najděte analytickou funkci, jejíž Taylorova řada je x-lj? -ij? +... , přičemž x e [—1,1]. O 6.181. Ze znalosti součtu geometrické řady odvodte Taylorovu řadu funkce y = 5T27 se středem v počátku. Poté určete její poloměr konvergence. O 6.182. Nechť je pohyb tělesa (dráha hmotného bodu) popsán(a) funkcí s(t) = -(/ - 3)2 + 16, r e [0,7] v jednotkách m, s. Stanovte (a) počáteční (tj. v čase / = 0 s) rychlost tělesa; (b) čas a polohu, ve kterých má těleso nulovou rychlost; (c) rychlost a zrychlení tělesa v čase / = 4 s. Doplňme, že rychlost je derivace dráhy a zrychlení je derivace rychlosti. O 390 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNI POČET Řešení cvičení 6.5. p<5Hx) = 12-5!; p<6Hx) = 0. 6.6. 212e2x +cosx 6.7. f(26)(x) = -sin* + 226 e2*. 6.15. 6.16. | + I (* - 1) - 1 (* - l)2 + Ä (* - l)3. 3(l+i)3' J + j — — 4 vi — -r j2 ' 6.Í7. (a) 1 + ^; (b) 1 - (c) * - f-; (d) * + ^; (e) * + x2 6.ÍS. 2 (x - 1) - O - l)2 + | O - l)3 -\(x- l)4. ň IQ r — — • sin 1° ss —___Zí?—• lim n , 1 sim-i2 _ _1 6.20. ELo n ^ •" - 8>" e N- 6.21. (x - l)3 + 3 (x - l)2 + O - 1) + 4. 6.26. 00 22n-l TVíy-x2", ^ (2n)! í=U konverguje pro libovolné reálné x. 6.27. 22n-l ^ (2n)! ři=i .2n konverguje pro libovolné reálné x. 6.28. konverguje pro x e (—1, 1]. 6.29. Je dobré si uvědomit, že rozvíjíme j ln(x). oo ^ /w = y^(-i)i+i-(x-i)'', i=0 ' Konverguje na intervalu (0, 2]. 6.31. (-#,#). 6.52. Konvexní je na intervalech (—oo, 0) a (0, 1/2); konkávni na intervalu (1/2, +oo). Má pouze jednu asymptotu, a to přímku y = jt/4 (v ±oo). 6.55. (a) y = 0 v — oo; (b) x = 2 - bez směrnice, y = 1 v ±oo. 6.54. y — 0 pro x -» ±oo. 6.55. y = ln 10, y = x + ln3. 6.67. ylj pro a e (0, 1), oo jinak. 6.S5. Všechna. 6.87. Oborem hodnot je (—oo, 0] U [4, +oo). Funkce / není lichá, sudá ani periodická. Má jediný bod nespo-jitosti, a to xo = — 1, přičemž lim f(x) — —oo, lim f(x) — +oo. Funkce protíná osu x pouze v počátku. Je kladná pro x < — 1 a nekladná pro x > — 1. Lehce lze ukázat, že lim f(x) — +oo, lim f(x) — —oo; 391 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Odtud plyne, že / roste na intervalech [—2, —1), (—1, 0] a klesá na intervalech (—oo, —2], [0, +oo). Ve stacionárním bodě x\ — 0 nabývá ostrého lokálního maxima a ve stacionárním bodě x2 — —2 má ostré lokálni minimum y2 — 4. Je konvexní na intervalu (—oo, — ľ), konkávni na intervalu (—1, +oo). Nemá inflexní bod. Přímka* = —1 je asymptotou bez směrnice. Asymptotou se směrnicí v ±oo j e přímka y = — x + 1. Dodejme např. /(-3) = 9/2, f (-3) = -3/4, /(l) = -1/2, /'(l) = -3/4. 6.88. Funkce je definována i spojitá na R \ {0}. Není Uchá, sudá ani periodická. Je záporná právě na intervalu (1, +00). Jediným průsečíkem grafu s osami je bod [1,0]. V počátku má / tzv. nespojitost druhého druhu a jejím oborem hodnot je M, neboť lim f(x) — +oo, lim f(x) — —oo, lim f(x) — +oo. x^O x^+oo x^—oo Platí f(x) = -^, I6lx[0], /"(*) = £• I6lx|0], Jediným stacionárním bodem je x\ — —1/2. Funkce / roste na intervalu [x\, 0), klesá na intervalech (—oo, jci], (0, +oo). V bodě x\ má tudíž lokální minimum y\ — 3/l/Á. Inflexní body daná funkce nemá. Je konvexní na celém svém definičním oboru. Asymptotou bez směrnice je přímka x — 0, přímka y — — x je pak asymptotou se směrnicí v ±oo. 6.90. Funkce je definována i spojitá na R \ {1). Není Uchá, sudá ani periodická. Průsečíky grafu / s osami jsou body [l - 1/2, O] a [0, —1]. V bodě xo — 1 má funkce / nespojitost druhého druhu a jejím oborem hodnot je M, což bezprostředně plyne z limit lim f(x) — —oo, lim f(x) — +oo, lim f(x) — +oo. x-*±oo Po úpravě f(x) = (x-l)2 + ^j, není obtížné spočítat f(x)=2^^-, f'\x) = 2^0^, i6lx|l]. Jediným stacionárním bodem je x\ — 2. Funkce / roste na intervalu [2, +oo), klesá na intervalech (—oo, 1), (1, 2]. V bodě x\ tudíž nabývá hodnoty lokálního minima y\ — 3. Je konvexní na intervalech (—oo, 1 — ^2^, (1, +oo) a konkávni na intervalu ^1 — \Í2, 1^. Bod x2 — 1 — 1/2 je tak inflexním bodem. Přímka x — 1 je asymptotou bez směrnice. Asymptoty se směrnicí daná funkce nemá. 6.91. Funkce je definována i spojitá na celém M. Není Uchá, sudá ani periodická. Nabývá kladných hodnot na kladné poloose, záporných na záporné. Průsečíkem grafu / s osami je pouze bod [0, 0]. Snadno se určí derivace f'(x) = lfi-2- 2 i^2+ 2 Platí /''^Č^Š+V' *6Rn{2}. První derivace nemá nulový bod. Funkce / proto roste v každém bodě svého definičního oboru. Neboť lim /(*) = -!, lim /(*) = -!, co x^+co oborem hodnot je množina (—iz/2, n/2) \ {—n/4). Funkce / je konvexní na intervalu (—oo, 1), konkávni na intervalech (1, 2), (2, +oo). Bod jci = 1 je tedy inflexním bodem, přičemž f (ľ) = ti/4. Jedinou asymptotou je přímka y = —n/4 v ±oo. 6.93. Def. obor R+, globální maximum x = e, infl. bod x = V?, rostoucí na int (0, é), klesající na (e, oo), konkávni (0, V?, konvexní (Vě3, oo), asymptoty i = 0 a )> = 0, lim^^o /(x) = — oo, lim^^co f(x) = 0. 6.94. Def. obor M \ [1, 2], Lokální maximum x = 1~2V^, na celém definičním oboru konkávni, asymptoty x = 1, x = 2. 6.95. Def. obor M. Lokální minima v — 1, 1, maximum v 0. Funkce sudá. Inflexní body =t-Jj, bez asymptot. 6.96. Def. obor R \ [—5, 1], Glob. extrémy nemá. Bez inflexních bodů, asymptoty x = — j, x = 1. 6.97. Def. obor M \ {1}. Bez extrémů. Bez infl. bodů, na int. (—00, 1) konvexní, (1, 00) konkávni, Asymptota bez směrnice x = 1. Asymptota se směrnicí y = x + 1. 6.98. (a) ^xV7; (b) & + 2^ + £j; (c) ffifií; (d) ln(1 + sin*). 6.99. (a) — cotg* — x + C; (b) tgx — cotg x + C. 6.100. £x +3arcsin f. 6.101. ±ln(l + x4) +C. 6.102. 2^2 arctg ^ + C. 2 1 I 3 6.103. ln —+H + 5 arcsinx — 4 cos x — 5 sin* + C. 6.104. (a) x arctg x - Ml+i!i + C; (b) ^ + C. 6.106. (a) -x2 cos x + 2x sinx + 2 cos x + C; (b) e1 (x2 - 2x + 2) + C. 6.107. ij- (2 ln2 x - 2 lnx + l) + C. 6.108. (2x - x2) e1 + C. 6.Í09. (a) (2l+5)" + C; (b) + C; (c) -A e"13 + C; (d) 5 arcsin3 x + C; (e) ^ + C; (f) arctg2 y/x + C; (g) ^ arctg e1) + C; (h) 2 sin y/x - 2^/x cos y/x + C. 6.111. Např. 1 — x = ŕ2x dává f , ~2 . dt: a Vx2 + x + 1 = x + y vede na f , ^ (l+í2) yz+2y-2 6.ÍÍ2. ^ arctg (Vžtgx) + C. 6iii. x -2,/x + 21n(l + ,/x) + C. 6.ÍÍ4. (a) ^ lnx - ^ + C; (b) =^ + C. 6.ÍÍ7. 2x3 + 3X2 - 2x - 13 + -219o+5^- AJJ9. (a) ^ + ^ - ^; (b) f - £ + ^ + 6./2(A^ - 393 KAPITOLA 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.121. + 6.122. -4 6.123. i + 6-124-ŕ-2+7T + 7 + T3 6J25. 1 + ± - I + jlj. (3i2+i+4)2 Dx+E + 3x2+x+A' 6.126. (a) 3 ln \x -2 |; (b) o.jzo. (.a; 3iii| x - _ |, (u; (l_2)2. 5.Í27. | ln (x2 + 4* + 8) - \ arctg ^±2 + C. 6.129. Iln^i + f arctg ^ + C. 6.ÍJ0. ±ln|* - 1| - ^ln(^ +x + 1) - -J= arctg + C. 6.Í5Í. ln (| x - 1 | (x - 2)4) - + * + C. 6.132. (a) 22|1a _ £9^i + c; (b)fc + f+C; (h)ln|tgf|+C. 6.Í55. Sa„, sup = 2±i, 53„,m = ano, je. 6.Í55. Nekonečně mnoho. 6.136. Např. funkce / může nabývat hodnoty 1 v racionálních bodech intervalu / a být nulová v iracionálních bodech. 6.138. S--J2. 6.139. \b\ - \a\. 6.140. ±ln2. 6.141. i (e11 - 2). 6.142. e-5e-1. 6.143. I. 6.144. (a)4;(b)i^. 6.Í45. p < q. 6.146. a > 0; b = 0; o 0. 6.Í47. C<£> = 02 + x + 1) + ±V3arctan + C. 6.154. ^ln(3 + 2V2"). 6.155. -i - |ln2. 6.156. (i) f, /■■\ 1 ■ 4 (u) j srn x (5.757. (a) n; (b) +co; (c) 20; (d) -2. 6/58. -co. 6/59. 4ť7t. v-1 6.760. ^ti. 6.767. -i; 1. 6.Z62. 2- 2; 2- 2 .2 e' e e2 e2 6.765. (a) a > 1; (b) a < 1; (c) a = 0. 6.764. Právě pro p > 1, e R a pro p = 1, q > 1. 6.765. (a) platí; (b) neplatí; (c) platí. 6.766. 1 - íoxj + i^jy. 6.767. Chyba náleží do intervalu (0, 1/200). 6.168. 1 — 3x + ^x4; nad tečnou. 6.169. Eľ=oyf^"- 6.170. v = arctgx 6.777. Právě pro x e (-5. f) je 1 1 / 2\" 5+27 = 5 ( 5 ) *™ ■ 6-172. i Eľ=o^ • 6.77i. + l->2i (2i + 1)! V 4/ 2/+1 1=0 Rada konverguje pro všechna x e R. 6-174. EZ0^(x-ir-,T.Z0^x". 6.175. f(x) =x,x e R; ano. 6.776. Nikoli. 6-177. £^o^2"- 6.m.(a)l-^ + ^-,(h)\-^. 2n+l 6.779. J2ľ=0 TŤn+TT' 6.180. y = arctgx 6.181. Právě pro x e (-í- 5) Je 5+2.1 "5^1 n=0 6.782. (a) i-(0) = 6m/s; (b) t = 3 s, í(3) = 16m; (c) v(4) = -2m/s, a(4) = -2m/s2 395 KAPITOLA 7 Spojité modely Jak zvládáme nelineární objekty? - zase lineárními nástroji... A. Ortogonální systémy funkcí Chceme-li zobrazit nějaký trojrozměrný objekt v rovině, uvážíme jeho (například kolmou) projekci do této roviny. Obdobně, chceme-li „vyjádřit" nějakou složitější funkci pomocí jednodušších, můžeme uvážit její projekci do (reálného) vektorového prostoru generovaného těmito jednoduššími funkcemi. Potom budeme schopni například integrovat složitější funkce stejně, jako jsme integrovali (či derivovali) funkce vyjádřené pomocí mocninných řad (pokud bude prostor jednodušších funkcí „dostatečně" velký, tak s libovolnou přesností). V této kapitole ukážeme využití nástrojů diferenciálního a integrálního počtu ve vybraných problémech, ve kterých si vystačíme s funkcemi jedné reálné nezávislé proměnné. Půjde o postupy a nástroje docela podobné těm z kapitoly třetí, tj. manipulace s lineárními kombinacemi vybraných generátorů a lineárními transformacemi (např. hledání jejich jader nebo vzorů předepsaných obrazů). Jen místo konečně rozměrných vektorů budeme pracovat s prostory funkcí, tzn. uvažované vektorové prostory často nebudou mít konečnou dimenzi. K těmto i dalším praktickým oblastem se vrátíme v příští kapitole v kontextu funkcí více proměnných a diferenciálních rovnic. Nejprve budeme aproximovat funkce pomocí lineárních kombinací z předem pevně zvolených sad generátorů. Po cestě si ale budeme muset ujasnit, jak vlastně lze pracovat s pojmy jako je vzdálenost. Půjde o náznaky teorie tzv. metrických prostorů a tato část je zároveň přípravou na analýzu v euklidovských prostorech W. V zásadě přitom budeme pokračovat v postupech, které již z euklidovských vektorových prostorů dobře známe. Zjistíme, že naše intuice z euklidovských prostorů nízké dimenze se docela dobře hodí i obecně. Pak se budeme stručně zabývat integrálními operátory, tj. lineárními zobrazeními na funkcích, které jsou definovány pomocí integrování. Půjde zejména o tzv. Fourierovu analýzu. Při našich úvahách se přitom budeme jako obvykle zamýšlet i nad diskrétními variantami dříve diskutovaných spojitých operací. V celé kapitole budeme pracovat s funkcemi jedné reálné proměnné, které ale budou mít buď reálné nebo (velmi často) komplexní hodnoty. 1. Fourierovy řady 7.1. Prostory funkcí. Jako obvykle začneme výběrem vhodných množin funkcí, se kterými chceme pracovat. Přitom ; / chceme mít dost funkcí pro praktickou použitelnost našich modelů, ale také musí být dostatečně „pěkné", abychom je uměli integrovat a derivovat tak, jak bude třeba. Budeme vesměs pracovat s funkcemi definovanými na nějakém intervalu I = [a,b] cl, případně nekonečném intervalu (tj. krajní hodnoty a i b mohou také nabývat hodnot ±oo, stále však půjde o uzavřené množiny). _ Prostory po částech hladkých funkcí _. Množina funkcí čP — 5° [a, b] obsahuje právě všechny po částech spojité funkce na / = [a, b] s reálnými nebo komplexními hodnotami, tj. předpokládáme, že v každém bodě intervalu KAPITOLA 7. SPOJITÉ MODELY Na vhodném (nekonečném) vektorovém prostoru funkcí na daném intervalu, můžeme zavést i skalární součin (takovým vhodným prostorem je například prostor L2, viz 7.3). Skalární součin tedy nezavedeme na prostoru všech funkcí na daném intervalu, ale na jistém jeho pod-prostoru, který však bude dostatečně veliký pro naše výpočty (mimo jiné bude obsahovat všechny spojité funkce na daném intervalu). Skalární součin nám umožní počítat projekce tak, jak jsme byli zvyklí u vektorových prostorů. Pokud máme dán konečně rozměrný vektorový (pod)prostor funkcí a chceme určit projekci nějaké funkce na něj, tak Gramovým-Schmidtovým ortogonalizačním procesem (viz 2.42) nejprve spočítáme ortogonální (či ortonormální) bázi tohoto podpro-storu a pak známým způsobem (2.3) dopočítáme kolmou projekci. 7.1. V prostoru reálných funkcí na intervalu [1, 2], je dán vektorový podprostor (x2, l/x). Doplňte funkci 1 /x na jeho ortogonální bázi, určete kolmou projekci funkce x na tento podprostor a spočítejte její vzdálenost od tohoto podprostoru. Řešení. Nejprve doplníme funkci 1 j x na ortogonální bázi. Jedním z vektorů báze tedy bude funkce 1 /x. Uvažovaný vektorový prostor je generován dvěma lineárně nezávislými funkcemi, bude tedy mít dimenzi 2 (a všechny vektory v něm jsou tvaru a- i+b-x2, kde a, b e K). Zbývá nám tedy najít pouze ještě jeden vektor báze, který bude kolmý na funkci f\ = 1 /x. Podle Gramova-Schmidtova ortogonalizačního + k ■ -,k e K. Reálnou kon- procesu ho hledáme ve tvaru f2 stantu k určíme z podmínky kolmosti: 0 = l-,x2 + k- -\x X l-A+klKl- XI \x X tedy 1 budeme také uvažovat množinu všech po částech spojitých funkcí / jejichž všechny derivace až do řádu k včetně patří do 5° (tj. nemusí existovat ve všech bodech, ale existují jejich jednostranné limity ve všech bodech). Budeme pro ni používat značení 5*. V případě neomezeného intervalu I budeme také pracovat často s podmnožinou 5* C 5* všech funkcí s kompaktním nosičem (tzn. že funkce jsou identicky nulové vně nějakého konečného uzavřeného intervalu). Na ohraničených intervalech samozřejmě mají všechny funkce kompaktní nosič v tomto smyslu. Když nás nebude zajímat, na jakém intervalu pracujeme, budeme proto psát jen 5^ ve všech případech. V případě konečného intervalu [a, b] nebo za předpokladu kompaktního nosiče jsou naše funkce z 5° vždy riemannovsky in-tegrovatelné na zvoleném intervalu I jak v absolutní hodnotě tak v kvadrátu, tzn. J a \f(x)\dx < oo, J a (f(x))ldx < oo. Naše úvahy lze rozšiřovat na podstatně větší definiční obory funkcí, často ale za cenu značné technické námahy. Budeme občas zmiňovat prostory kurzweilovsky (nebo lebesgueovsky) integro-vatelných funkcí, pro které jsou výsledky daleko ucelenější a pěknější. Zájemce odkazujeme na rozsáhlou specializovanou literaturu. Ve skutečnosti se budeme držet stejné strategie jako u racionálních a reálných čísel - počítáme jen s pěknými funkcemi a máme „nějak zvládnuto", jak vypadají limity cauchyovských posloupností ve zvolených metrikách (které většinou potřebujeme jen formálně). 7.2. Vzdálenost funkcí. Z námi již dokázaných vlastností limit a derivování je okamžitě vidět, že 5*, resp. 5^, jsou vektorové prostory. Na konečnědimenzionálních pro-.. -,tf _. storech jsme uvažovali vzdálenost vektorů pomocí rozdílů hodnot jednotlivých jejich souřadnic. Na prostorech funkcí můžeme postupovat podobě a využít absolutní hodnoty reálných nebo komplexních čísel (resp. euklidovské vzdálenosti) následujícím způsobem: .___| Vzdálenost funkcí j___ Definice. Pro funkce / a g z čPc je jejich ti-vzdálenost definována vztahem = t \f(x)-g(x)\dx. Obdobně je L2-vzdálenost funkcí / a g definována vztahem ll/-gll2 = (í \f(x)-g(x)\1dx 1/2 Velikostí funkce ||/||j nebo ||/||2 rozumíme její vzdálenost od funkce nulové. 397 KAPITOLA 7. SPOJITÉ MODELY prípade II* - Px 15 34 x2 dx 204 0,495. □ 7.2. Uvažujme reálny vektorový prostor funkcí na intervalu [1,2] generovaný funkcemi Jj. Doplňte funkci -j- na ortogonální bázi tohoto prostoru. Dále určete projekce funkcí ^ama tento vektorový prostor a určete jejich vzdálenosti od tohoto vektorového prostoru. Řešení. Analogicky jako v předcházejícím příkladu, použijeme Gramova-Schmidtova ortogonalizačního procesu (s daným skalárním součinem). Dostáváme tak postupně /iW 1 h(x) = - 2? + TM' Pomocí získané ortonormální báze pak již snadno zapíšeme hledané projekce: Px <*./!> , , (X,fl) f , (X,f3) f /l + 77-—77 ' h + 77—77 ' h (fuň) (Í2, fl) 2/!+96- (ln2-^) •/2 + 5760 ^-^ln2)/3 0,058. Pro projekci funkce -7 pak dostáváme 15 69 9 3^/l + 4Ô/2 + 4/3 : 0,002. 14 2240 Vidíme, že vzdálenost funkce, která má podobný průběh jako generátory, je menší. □ 7.3. V prostoru reálných funkcí na intervalu [0, jt], je dán vektorový podprostor (sin(x), x). Doplňte funkci x na jeho ortogonální bázi a určete kolmou projekci funkce \ sin(x) na tento podprostor. O 7.4. V prostoru reálných funkcí na intervalu [0, jt], je dán vektorový podprostor (cos(x),x). Doplňte funkci cos(x) na jeho ortogonální bázi a určete kolmou projekci funkce | cos(x) na tento podprostor O V prvním případě 11-vzdálenost funkcí / a g s pouze reálnými hodnotami vyjadřuje plochu uzavřenou mezi grafy těchto funkcí, nezávisle na tom, která funkce má větší či menší hodnoty. Protože uvažujeme po částech spojité funkce / a g, může být jejich vzdálenost rovna nule pouze když se od sebe liší nanejvýš svými hodnotami v bodech nespojitosti, tj. v nejvýše konečně mnoha bodech na ohraničených intervalech. Skutečně, jestliže se dvě naše funkce liší v jednom bodě xo, ve kterém jsou spojité, Uší se i na nějakém dostatečně malém okolí tohoto bodu a toto okolí přispěje do vzdálenosti nenulovou hodnotou integrálu. Máme-li tři funkce /, g a h, pak samozřejmě f \h(x)-f(x)\dx= f \h(x)-g(x) + g(x)- f(x)\dx< < t \h(x) - g(x)\dx + ŕ \g(x) - f{x)\dx, J a J a a platí tedy obvyklá trojúhelníková nerovnost. Všimněme si, že odvození této nerovnosti využívá pouze trojúhelníkovou nerovnost platnou pro velikost skalárů, platí proto i pro funkce /, g e 5^ s komplexními hodnotami. Podobné je to pro druhou definici. Čtverec velikosti ||/||2 funkce / je (Il/ll2)2= / l/«|2<& a je odvozen z dobře definovaného symetrického bilineárního zobrazení reálných funkcí do skalárů (/■ g) ľ f (x) g (x) dx dosazením / za obě funkce. U komplexních hodnot ale obdržíme podobně tuto velikost ze skalárního součinu s použitím komplexní konjugace, (/■ g) ■■ 7 J a f(x)g(x) dx, jak jsme viděli u unitárních prostorů v třetí kapitole. Určitě tedy bude platit i trojúhelníková nerovnost, protože celou diskusi můžeme odehrát v maximálně třírozměrném prostoru se skalárním součinem generovaným danými funkcemi /, g a h. 7.3. (Ne)konečnost dimenze a ortogonalita. Zůstaňme na chvíli u naší definice Í2-normy || ||2 na vektorovém prostoru 5^. Zjevně operace na konci posledního odstavce splňuje jak linearitu v prvním argumentu, tak symetrii (f,g) = (g,f), tj. v reálném případě je to symetrické bilineární zobrazení. Zároveň je pro spojité funkce splněna i podmínka nenulovosti velikosti pro nenulové funkce, zatímco pro naše po částech spojité funkce znamená nulovost velikosti nulovost funkce až na nejvýše spočetnou množinu bodů (konečnou na každém konečném intervalu). Pro vektorový podprostor spojitých funkcí jsme tedy skutečně definovali skalární součin. U obecnějších funkcí bychom, technicky vzato, měli ztotožňovat funkce, které se liší na konečných intervalech jen v konečně mnoha hodnotách. V našich dalších úvahách ale tato technická nepříjemnost nebude hrát podstatnou roh (a příležitostně se k ní budeme vracet v poznámkách). 398 KAPITOLA 7. SPOJITÉ MODELY B. Fourierovy řady Základním studovaným periodickým dějem, s nímž se setkáváme v aplikacích, je obecné jednoduché harmonické kmitání v mechanice. Jedná se o pohyb hmotného bodu po přímce. Je dobře známo, že funkce / Jež udává polohu kmitajícího hmotného bodu na přímce v závislosti na čase /, má tvar (7.1) f (i) = a sin (wt + b) pro jisté konstanty a, w > 0, b e K určené polohou a rychlostí bodu v počátečním čase. Funkci y = /(/) lze získat např. vyřešením homogenní lineární diferenciální rovnice (7.2) y" + ary = 0 vyplývající z aplikace Newtonova zákonu síly pro daný pohyb. Doplňme, že funkce / má zřejmě periodu T = 2it/w (v mechanice se však častěji mluví o kmitočtu neboli frekvenci l/T) a že kladná hodnota a (vyjadřující maximální výchylku kmitajícího bodu od počátku) se nazývá amplituda, hodnota b (vyjadřující polohu bodu v počátečním čase) počáteční fáze a hodnota w pak úhlová frekvence kmitavého pohybu. Podobně se můžeme zabývat funkcí z = g(t), která udává napětí v závislosti na čase / v elektrickém obvodu s indukčností L a kapacitou C a která je řešením diferenciální rovnice (7.3) Z +0) Z 0. Rozdíl mezi rovnicemi (||7.2||) a (||7.3||) (kromě odlišné fyzikální interpretace) je pouze v konstantě w. Pro rovnici (||7.2||) je w2 = k/m, kde k je konstanta úměrnosti a m je hmotnost hmotného bodu; a pro rovnici (||7.31|) je w2 = (LQ'1. Ve skutečnosti každý periodický děj, který lze zadat funkcí ve tvaru (||7.1||), se označuje jako harmonické kmitání a pro konstanty a, w, b se používá takřka výhradně výše zmíněné označení převzaté z jednoduchého harmonického kmitání hmotného bodu v mechanice. Když využijeme jednoho ze součtových vzorců sin (a + ji) = cos a sin j3 + sin a cos j3, tt,/)el, můžeme funkci / (viz (||7.11|)) zapsat jako (7.4) f(t) = c cos (wt) + d sin (wt) . přičemž c = a sin b, d = a cos b. Rovněž tedy funkce / z (||7.4||) vystihuje harmonické kmitání s amplitudou a = *Jc2 + d2 a s počáteční fází b e [0, 2jí) splňující sinfc = c/a, cosfc = d/a. V konečněrozměrném případě reálných nebo komplexních vektorových prostorů jsme uvažovali skalární součiny a velikost vektorů již ve druhé a třetí kapitole. Všimněme si teď, že při odvozování vlastností jsme vždy pracovali s dvojicemi nebo konečnými množinami vektorů. Nyní to ale můžeme dělat s funkcemi naprosto stejně a pokud zúžíme naši definici skalárního součinu na vektorový podprostor generovaný (podle potřeby nad reálnými nebo komplexními čísly) jen konečně mnoha funkcemi f\, ..., fk- Dostaneme opět dobře definovaný skalární součin na tomto konečněrozměrném vektorovém podpro-storu. Jako příklad uvažme funkce /j = x1 , i = 0, ..., k. Jimi je v5° generován (k + l)-rozměrný vektorový podprostor ftk[x] všech polynomů stupně nejvýše k. Skalární součin dvou takových polynomů je dán integrálem. Každý polynom stupně nejvýše k je vyjádřen jednoznačným způsobem jako lineární kombinace generátorů /o, ..., fk- Pokud by navíc naše generátory měly tu vlastnost, že (7.1) (fi-fj) = 0 pro i ^ j, 1 pro i = j, jde o tzv. ortonormální bázi. Připomeňme si v této souvislosti proceduru Gramovy-Schmidtovy ortogonalizace, viz 2.42, která z libovolného systému lineárně nezávislých generátorů /j vytvoří nové (opět lineárně nezávislé) ortogonální generátory g, téhož prostoru, tj. (gi.gj) — 0 pro všechny i ^ j. Spočteme je přitom postupně jako gi = f\ a vzorci (fi+l, gi) gl+l = fl+l +a\gl H-----Vaigi, a-i = — lig; II pro i > 1. Aplikujme tuto proceduru pro ilustraci na tři polynomy 1, x, x2 na intervalu [—1, 1]. Dostaneme g\ — 1, g2 ■ g3 ■ 7p(/: š(/> 1 dx \\g\ \\g\ ldx) -1 x dx = x2-1-. 3 Příslušná ortogonální báze prostoru R2 W všech polynomů stupně nejvýše tři na intervalu [—1, 1] je tedy 1, x, x2 — 1/3. Normalizací, tj. vhodným násobením skalárem tak, aby prvky v bázi měly velikost jedna, dostaneme ortonormální bázi h2 = h3 = /l 2' V 2 Takovým ortonormálním generátorům I polynomy. Qx2 - 1/3). 1 2V 2" lk [x] se říká Legendreovy 7.4. Ortogonální systémy funkcí. Právě jsme si připomněli výhody, které ortonormální báze podprostorů mají pro konečněrozměrné vektorové prostory. V předchozím příkladu Legendreových polynomů generujících M2W C V = Rklx], k > 2, bude pro libovolný polynom h e Vfunkce 399 KAPITOLA 7. SPOJITÉ MODELY Důležitou úlohou v aplikačních problémech je skládání (tzv. superpozice) různých harmonických kmitaní. Klíčovou pozici potom zaujíma superpozice konečného počtu harmonických kmitaní vyjádřených funkcemi ve tvaru fn(x) = a„ cos (ncox) + b„ sin (ncox) pro n € {1,..., m}. Tyto jednotlivé funkce mají základní periodu 2jt/(na>). Jejich součet m (7.5) [an cos (ncox) + bn sin (ncox)] n=\ je proto periodickou funkcí s periodou 2jt/w. Obecně platí, že superpozicí libovolných konečně mnoha jednoduchých harmonických kmitání majících souměřitelné periody je periodický proces, jehož periodou je nejmenší společný násobek primitivních period jednotlivých kmitání. Součet (||7.5||) doplněný o vhodné posunutí m ClQ ^—\ (7.6) --h 2, ian cos {ncox) + bn sin {ncox)} 2 n=\ je právě m-tým částečným součtem funkcionální řady co ClQ ^—\ (7.7) --h 2, ian cos (ncox) + bn sin (ncox)]. 2 n=\ Z fyzikálního hlediska jde o složený periodický proces, jenž může sloužit jako přirozená aproximace superpozice nekonečného počtu jednoduchých harmonických kmitání (tzv. harmonických složek) funkcionální řady (||7.7||). Nabízí se zde otázka, zda je možné naopak každý periodický proces „rozumně" vyjádřit superpozicí konečného a případně nekonečného počtu jednoduchých harmonických kmitání - zda každý periodický proces je výsledkem takové superpozice. Formulováno přesněji z pohledu matematiky, zda lze každou periodickou funkci vyjádřit jako konečný součet (||7.6||), příp. alespoň jako součet řady (||7.7||). Kladnou odpověď pro významnou a širokou třídu periodických funkcí samozřejmě dostáváme pouze pro součet nekonečný (viz teoretická část). Již jsme řekli, že periodické procesy hrají důležitou roli ve většině fyzikálních i technických oborů. Tradičně vyzdvihněme alespoň akustiku, mechaniku, elektrotechniku, kde se nepopiratelně ukazuje nutnost zodpovězení uvedené otázky. Kromě toho však hledání odpovědi vedlo ke vzniku svébytné matematické partie - teorie Fourierových řad. Ta se poté začala využívat při řešení dalších tříd problémů (mj. k řešení většiny důležitých typů obyčejných a parciálních diferenciálních rovnic) a přispěla k rozvoji samotných teoretických základů matematiky H = (h, h\)h\ + (h, h2)h2 + (h, hf)^ jednoznačně určenou funkcí, která minimalizuje naši L2-vzdálenost \\h — H\\ mezi všemi funkcemi v Mí[at], viz 3.25. Koeficienty pro nej lepší aproximaci zadané funkce pomocí funkce z vybraného podprostoru je možné tedy získat prostě integrací v definici skalárního součinu. Uvedený příklad podbízí následující zobecnění: Když provedeme proceduru Gramovy-Schmidtovy ortogonalizace pro všechny monomy 1, x, x2, ..., tj. pro spočetný systém generátorů, co z toho vznikne? [ Ortogonální systémy funkcí |__ Libovolný konečný nebo spočetný systém lineárně nezávislých funkcí v 5^ [a, b] takový, že každé dvě různé z nich mají nulový skalární součin, se nazývá ortogonální systém funkcí. Jestliže jsou všechny funkce /„ v posloupnosti po dvou ortogonální a zároveň je pro všechna n velikost ||/„||2 = 1, hovoříme o ortonormálním systému funkcí. Uvažme tedy jakýkoliv ortogonální systém funkcí /„ e 5° [a, b] a předpokládejme, že pro (reálné nebo komplexní) konstanty c„ konverguje řada co F(X) = 2^2L'nfn n=\ stejnoměrně na konečném intervalu [a,b]. Pak snadno vyjádříme skalární součin (F, /„) po jednotlivých sčítancích (viz důsledek 6.43) a dostaneme °° r b _ (F, fn) = Y C"> / fm(x)fn(x) dx = C„||/„||2, m=l Ja kde normou myslíme (stejně jako v dalších odstavcích) naši L2-velikost. Jistě teď už tušíme, v jakém smyslu lze případně rozšiřovat ., postupy z konečněrozměrných prostorů: Místo konečných LÍ^) lineárních kombinací bázových vektorů budeme pracovat AijP^ s nekonečnými řadami po dvou ortogonálních funkcí. Ná-''J ! sledující věta nám přitom dává přehlednou a velmi obecnou odpověďna otázku, jak dobře se konečnými součty takové řady umíme k dané funkci přiblížit: 7.5. Věta. Nechť f„, n — 1,2, je ortogonální posloupnost (reálných nebo komplexních) funkcí v prostoru íf[a,b], nechť g e 5° [a, b] je libovolná taková funkce a označme rb _ Cn = \\fn\r2 / g(x)f„(x) dx. J a (1) Pro libovolné pevné n e N má ze všech lineárních kombinací funkcí fi, fn nejmenší L2-vzdálenost od g funkce n K(x) = 2^2cifi(x). 1=1 (2) Číselná řada i I cn 1211 f n 112 vždy konverguje a platí co £m2ii/j2_ kil2. n=\ 400 KAPITOLA 7. SPOJITÉ MODELY (např. k presnému vymezení tak fundamentálních pojmů, jakými jsou funkce a integrál). Název Fourierovy řady je pak na počest francouzského matematika a fyzika Jeana B. J. Fouriera, který jako první prakticky využil trigonometrické výrazy (117.611) ve své práci z roku 1822 věnované problematice vedení tepla (problematikou se začal zabývat v roce 1804 a práci sepsal již v roce 1811). Význam tohoto Fourierova počinu pro teoretickou fyziku, přestože se fyzice věnoval spíše okrajově, byl nesmírný: zavedl tím do oboru matematické metody, které dodnes patří ke klasickým nástrojům teoretické fyziky. Fourierova matematická teorie tepla se také stala základem pro George S. Ohma při odvození jeho slavného zákonu vedení elektrického proudu. Upozorněme ještě, že jiní matematici studovali vlastnosti součtů (||7.6||) o mnoho let dříve než Fourier (kupř. L. Euler). Nedosáhli však zásadního výsledku směrem k možnému praktickému využití jako on. 7.5. Určete Fourierovy koeficienty funkce (a) g(x) = sin (2x) cos (3a) , a e [—jí, jí]; (b) g(x) = cos4 a, a e [—ji, Jí]. Řešení. Případ (a). Neboť pro a e K je sin (2a) cos (3a) = sin (2a) [cos (2a) cos a — sin (2a) sin a] = = ť\ sin (4a) cos a — sin2 (2a) sin a = l cos a sin (4a) 1— cos(4;t) ( = — j sin a + j cos a sin (4a) + | sin a cos (4a) = = —ť\ sin a + j sin (5a) , vidíme, že Fourierovy koeficienty jsou nulové s výjimkou b\ = —1/2, b5 = 1/2. Případ (b). Podobně z cos4 a = [cos2 a] 2 = [Hí|^]2 = = i [l + 2 cos (2a) + cos2 (2a)] = = \ [l + 2cos (2a) + 1+c02s(4j:)] = = | + \ cos (2a) + \ cos (4a) , a e K plyne, že ao = 3/4, a2 = 1/2, au = 1/8 a že ostatní koeficienty jsou nulové. V této úloze jsme si ukázali, že výpočet Fourierovy řady nemusí nutně vést na počítání integrálů (obvykle metodou per partes). Zvláště v situacích, kdy funkce g má tvar součinu (mocniny) funkcí y = sin (mi), y = cos (nx) pro m,n € N, stačí aplikovat středoškolské učivo (známé goniometrické vzorce). □ 7.6. Najděte Fourierovu řadu pro periodické prodloužení funkce (a) g(x) = 0, a e [—jí, 0), g(x) = shiA, a e [0, jí); (3) L2-vzdálenost funkce g od částečných součtů Sk YÍi=\ cnfn jde v limitě k nule, tj. lim ||g - sk\\ = 0, tehdy a jen tehdy, když £c2H/nl|2 = Ještě než se pustíme do důkazu, zkusme lépe porozumět významu jednotlivých tvrzení této věty. Protože pracujeme s úplně libovolně zvoleným ortogonálním systémem funkcí, nemůžeme očekávat, že lze dobře aproximovat jakoukoliv funkci pomocí lineárních kombinací funkcí f. Např. když se omezíme u Legendreových ortogonálních polynomů na intervalu [—1, 1] pouze na sudé stupně, určitě budeme dobře aproximovat pouze nanejvýš sudé funkce. Nicméně hned první tvrzení věty nám říká, že vždycky budeme dosahovat nej lepší možné aproximace částečnými součty (v Í2-vzdálenosti). Druhé a třetí tvrzení pak můžeme vnímat jako analogii ke kolmým průmětům do podprostorů vyjádřeným pomocí kartézských souřadnic. Skutečně, pokud pro danou funkci g bodově konverguje řada F(x) — Yun=i cnfn(x), pak je funkce F(x) v jistém smyslu kolmým průmětem g do vektorového podprostorů všech takovýchto řad. Druhému tvrzení se říká Besselova nerovnost a je obdobou konečněrozměrného tvrzení, že kolmý průmět vektoru nemůže být větší než původní vektor. Rovnost ze třetího tvrzení se nazývá Par-sevalova rovnost a říká, že jestliže se vektor kolmým průmětem do podprostorů ostře nezmenší, pak do tohoto podprostorů jistě sám patří. Na druhé straně ale naše věta neříká, že by částečné součty uvažované řady musely bodově konvergovat k nějaké funkci. To je jev, který v konečněrozměrném světě nemá obdobu. Rada F (x) obecně nemusí být konvergentní (tj. pokud bychom uvažovali obecnější funkce než je náš prostor 5° [a, b]) ani v případě, kdy nastane rovnost v (3). Pokud ale např. existuje konečná hodnota Yl^Li lc« I a všechny funkce /„ jsou stejnoměrně omezené na /, pak zřejmě řada F(x) = Z^,T=l cnfn(x) konverguje v každém x. Nemusí ale přitom konvergovat všude k funkci g. K těmto úvahám se brzy vrátíme. Důkaz všech třech tvrzení věty je velmi podobný jako u konečněrozměrných euklidovských prostorů. Není divu, protože odhady vzdálenosti g od částečného součtu / se vlastně dělají jen v konečněrozměrném lineárním obalu dotčených funkcí: Důkaz Věty 7.5. Zvolme libovolnou lineární kombinaci / — J2Í=i an f n a spočtěme její vzdálenost od g. Dostáváme k „b k 2 ||g - Xa»/»H2 = / g(x) -y2anfn(x) dx = 1 J & 1 ři=l ři=l rb b b k í \g(x)\2dx- f Ja Ja 1 - j \g(x)\ dx - j 2_^g(x)anfn(x) dx- n=\ *b k „fy k 2 ~ / ^anfn(x)g(x)dx+ / ^anfn(x) dx = Ja .__1 Ja .__1 401 KAPITOLA 7. SPOJITÉ MODELY (b) g(x) =\x\, X € [-Tt,Tt)\ (c) g(x) = 0, x e [-1,0), g(x) = x + 1, x e [0,1). Řešení. Případ (a). Přímými výpočty získáváme xq+2% 0 jr flo = x f S(x) dx = _/ Odx + ^ J sinx dx = xq — Tt 0 = i [-cosxJří = i, xo+2jr fl„ = y g(x) cos (nx) dx = x(í 0 Tt = ^f0dx + ^J sinx cos (fix) dx = -Tt 0 jr = 27 J sin ([1 + n]x) + sin ([1 — n]x) dx = o _ _J_ _cos([l+n];t) _ cos([l— n]x) _ 2jr ^ l+n 1—řj Jq _ J_ / cos([l+n]ir) _ cos([l-n]ir) .__1__.__1_\ j 0, jestliže pro každé x e R platí f (x +T) — f (x). Nejmenší perioda T (pokud existuje) se nazývá základní perioda funkce /. Je zjevné, že součty a skalární násobky periodických funkcí se stejnými periodami jsou opět periodické funkce s touž periodou. Integrál f*°+T f(x)dx periodické funkce / přes interval délky periody T nezávisí na volbě xo e R. J Poslední tvrzení se dokáže snadno: Zvolme si dva takové levé hraniční body integrace xo a yo- Pomocí substituce t — x + kT s vhodným k převedeme íyo+T f W dx na případ, kdy yo e [xo, xo + T]. Nyní rozdělením intervalu integrace na tři části dokončíme důkaz. Ortogonalitu Fourierova systému funkcí si můžeme spočíst docela snadno pomocí výletu do komplexních čísel, který se nám bude velice hodit později: Připomeňme, že pro reálná x je e'x = cos(jc) + i sin(x). Přímým derivováním součinu reálných funkcí ověříme, že pro funkce z(x) a W)' = z'(x) e'>W +i z(x) W . Primitivní funkce ke komplexní funkci f (x) s reálnou proměnnou x samozřejmě dostaneme pomocí primitivních funkcí k reálné a imaginární komponentě funkce /. Můžeme si tedy velmi snadno spočíst integrál (předpokládáme m y n) ľ imx -inx d = ľ i(m-n)x d = lr i(m-n)*]* / / í(m—fi) L J—7t' ť— tc j—tc což je vždy nula, protože je jedno jestli o násobky ti obíháme po jednotkové kružnici v jednom nebo druhém směru. Právě spočtený integrál vyjadřuje skalární součin (e'mx, e'nx). Vidíme tedy, že skutečně všechny dvojice našich funkcí e'nx (s komplexními hodnotami) jsou na sebe kolmé. Můžeme ale tento skalární součin rozepsat: {e'mx, e'nx) — (cos(mx) + i ún(mx), cos(nx) + i ún(nx)} — — ((cos(mjc), cos(nx)) + (sin(mx), sin(nx))) + i( (sin(mx), cos(nx)} — (cos(mx), sin(njc))). Všimněme si, že v imaginární části tohoto výrazu budeme integrovat liché funkce přes interval [—ti, ti] a tedy dostaneme zaručeně nulu. 403 KAPITOLA 7. SPOJITÉ MODELY □ 7.7. Nechť je dána Fourierova řada funkce / na intervalu [—jt, ji] s koeficienty am,bn,m e NU(0),n e N. Dokažte následující tvrzení: (a) Jestliže fix) = fix + ji), x e [—jt, 0], potom aik-i = b2t-i = 0 pro každé k e N. (b) Jestliže fix) = —fix + ji), x e [—jr,0], potom flo = a-ik = b2k = 0 pro každé k eN. Řešení. Případ (a). Tvrzení lze pro libovolné k e N dokázat přímo výpočty jt «2/1-1 = ^ J f(x)cos (t2^ - í]x) dx = —jt 0 jt = j-J fix) cos ([2fc - l]x) dx + f)J fix) cos ([2k - l]x) dx = -jt o — jt = |x = )í + jr| = i / f iy + ji) cos i[2k - l][y + ji]) dy + -lit jt + i / /(*) cos i[2k - l]x) dx = o = -\] fiy) cos i[2k - l][y + jt]) dy + o jt + -\ j fix) cos i[2k - l]x) dx = o = I / /(y)[cos i[2k - l]y) cos i{2k - l]jt) - o - sin i[2k - l]y) sin i[2k - l]jt) ] dy + Jt + -\ j fix) cos i[2k - l]x) dx = o = -I//(y)cos([2fc-l]y) dy + o jt + -\ j fix) cos i[2k - l]x) dx = 0, o jt b2k-\ = ^ f f (x) sin i[2k - l]x) dx = — jt 0 jt = - f fix) sin i[2k - l]x) dx + f)J fix) sin i[2k - l]x) dx = -ji o — jt = \x = y + jt\ = j) J fiy+ ji) sin i[2k- l][y + Jt]) dy + -2ji jt + fix) sin i[2k - l]x) dx = o = I / fiy) sin i[2k -l][y + Jt]) + 1 / fix) sin i{2k - l]x) dx = o o = -\] fiy) [sin i[2k - l]y) cos i{2k - l]jt) + o + sin([2fc - l]jr)cosi[2k - l]y)] dy + 71 + fix) sin i[2k - l]x) dx = Funkce sin(x) a cos(ť) se liší jen o fázový posun, tj. cos(mx — n 12) = sin(mjc). Proto jsou oba sčítance v reálné části našeho výrazu stejné. Musí tedy dát nulu oba. Tím jsme ověřili ortogonalitu našeho systému funkcí. Zároveň vidíme, že pro m = n je výsledkem reálné číslo f* dx = 2tz a přitom zjevně musí opět být velikosti jak sin(nx) tak cos(nx) stejné. Nutně proto pro kladná n dostáváme velikosti || cos(nx)||2 = n, || sin(nx)||2 = n. Jen pro n = 0 dostáváme 111|2 = 2ti. [ fourierovy řady |_„ Řadu funkcí F(x): ao ~2 Y~^(an cos(nx) + bn sin(nx)) z Věty 7.5, s koeficienty 1 í * Jx, b„ = - í X Jx, xí)+2jt g(x) cos(nx) dx, xq+27t g(x) sin(nx) dx, nazýváme Fourierova řada funkce g na intervalu [xq, xq + 2jt]. Koeficienty an a bn se nazývají Fourierovy koeficienty funkce g. V praktickém použití chceme pracovat s Fourierovými řadami ., s libovolnou délkou periody funkcí T místo hodnoty 2jt. pí^i Stačí k tomu jen přejít k funkcím cos(^-nx), sin(^-nx). , Jednoduchou substitucí proměnných t — ujx, kde co — í^1 ! y-, ověříme ortogonalitu našeho nového systému funkcí a přepočítáme koeficienty ve Fourierově řadě F(x) funkce g na intervalu [xq, xq + T]: F(x) = —- + Y^(an cos(na)x) + bn ún(tiú)x)^, které mají hodnoty 2 fxo+T r / g(x) cos(no)x) dx, Jxa r xo+r / g (x) sin(níiwc) dx. Jxt\ 1.1. Vyjádření s exponenciálou. Před chvílí jsme při ověřování ortogonality funkcí cos(nx), sin(nx) vyšli ze základního vztahu pro parametrizaci jednotkové kružnice v komplexní rovině pomocí goniometrických funkcí. Uvažujeme-li a> = 2jt/T jako rychlost obíhání kružnice, kde T je čas jednoho oběhu, dostáváme tutéž parametrizaci ve tvaru: ela" = cosfcíř + i sintóř. Pro (reálnou nebo komplexní) funkci f (i) a všechna celá čísla n si v tomto kontextu definujeme její komplexní Fourierovy koeficienty jako komplexní čísla C = ~/ f(t)e-wnt dt. 1 J-T/2 Přímo z definice jsou přitom jasné vztahy mezi koeficienty an a bn Fourierových řad (po přepočtu formulí pro tyto koeficienty pro 404 KAPITOLA 7. SPOJITÉ MODELY = -iff(y)ún([2k-l]y) dy + o ji + -}J f(x) sin ([2k - l]x) dx = 0. o Případ (b). Okamžitě máme a0 = -\f f(x)dx = -\f f(x)dx + -\jf(x)dx=0 — jt —jt 0 a poté analogicky jako v důkazu prvního tvrzení pro libovolné k e N dostáváme jt aik = -\ f /O) cos ([2k]x) dx = — jt 0 ji = - f f(x)cos([2k]x) dx + -f f(x)cos([2k]x) dx = -ji o — | x — y + ti | — — ji jt = £ / f(y + tz) cos ([2k][y + 7i]) dy + ^ f f(x) cos (\2k\x) dx = -2ji 0 = ~Ú cos (WKy + ^)dy + ^} f(x) cos ([2k]x) dx = o o jt = -~\ I f(y) [cos([2k]y) cos([2ifc]7r) - sm([2k]y) sin([2i]7r)] dy + 0 jt + -\ j f(x)cos([2k'\x) dx = 0 = -±f f(y)cos ')cos([2i]7r) + sin([2i]7r)cos([2i]>')] dy + o + 1/ /(*)sin([2/fc]*) dx = 0 = -h f f(y)sin (P^y) dy + y f(x) sin ([2*]*) = n/4. Tentokráte jsou však nulové koeficienty a„, n e N U {0}. K nalezení zbývajících koeficientu užitím metody per partes a (||7.8||) (součinem 2 lichých funkcí je funkce sudá) získáme 2 ľ bn = — J f (x) sin (ncox) dx = L nnx 1) sin-dx ■ ' 4 .o 2 nnx -(x — 1)— cos- nn 4 2 nnx -(x - 3)—cos—— nn 4 nnx ■ 3) sin-dx 4 i2n2 4 ■i2n2 4 2 r ,16 nn _[(_!)»_ 1] + sm n eN. nn nlnl 2 Ihned odsud vidíme, že pro sudá n je b„ = 0. Si-novu Fourierovou řadu díky tomu upravíme do tvaru oo E[(^[(-l)B-l] + ^-smf)sin2f] = 2-, l [2n-l]7r + [2n-l]2jr2 ) Sm 4 řl=l L 7 □ 7.10. Funkci g(x) = cosx, x e (0, n) zapište jako součet kosinové a sinové Fourierovy řady. Řešení. Samozřejmě platí cosx = cosx, x € (—n, n), přičemž na kosinus na levé straně nahlížíme jako na sudé rozšíření funkce g a na pravé straně jako na kosinovou Fourierovu řadu, která je dána jednoznačně. Pro sinovou řadu pak musí být a„ = 0, n e N U {0} a snadno také spočítáme 2 c i ř b\ =— I cosxsinxdx = — / sin(2x) dx = 0, n J n J o o 2 f bn =— I cosx sin (nx) dx = Tt J 0 jr i r = — I sin([n + l]x) + sin([n — l]x) dx = Tt J Pro n > 0 dvojnásobným využitím metody per partes dostáváme: 4 ■ f x2 cos(^fi)áx = 2 í x2 cos(7znx)dx '■ J-l Jo T2„2 (-1)" Zbývající koeficient je 2 íl 2 ŕ 2 2 a(, — — I xr dx — 2 j x dx — —. 2 J-\ Jo 3 Celá řada dávající periodické rozšíření x2 z intervalu [—1, 1] je tedy 1 4 (-1)" f(x) = - + —T > -r— cos(wnx). ři=l Z Weierstrassova kritéria je přímo zřejmé, že tato řada konverguje stejnoměrně a tedy bude f(x) spojitá. Z Věty 7.8 ale už víme, že ve skutečnosti j e f (x) — x2 na celém intervalu [—1, 1], protože aproximujeme spojitou funkci na celém R a konvergence musí být stejnoměrná. Aproximuje tedy naše řada funkci x2 na intervalu [0, 1] výrazně lépe, než bychom to uměli s periodickým rozšířením dané funkce jen z tohoto intervalu. Pojdme ale v našich ilustracích dále. Díky stejnoměrné konvergenci můžeme využít věty o derivování a integrování řad člen po členu a spočítat Fourierovy řady pro funkce x ax3. Jednodušší bude derivování: , (-1)"+1 — úa(nnx). Tato řada už evidentně nemůže konvergovat stejnoměrně, protože periodické rozšíření funkce x není spojitou funkcí. Docela snadno lze ale přímo odvodit, že bodově konvergovat bude (viz naše úvahy o alternujících řadách v 5.48), proto jsme skutečně dostali rovnost (viz věta 5.48 na straně 280). Obdobně můžeme člen po členu integrovat a dostaneme 1 2 4 ^ 3 T7-3 ^—y (-1)" sin(jr nx) a výslednou Fourierovu řadu dostaneme dosazením za x z předchozí rovnosti. 7.11. Obecné Fourierovy řady a wavelety. V případě obecného ortogonálního systému funkcí f„ a z něj vytvářených řad se často hovoří o obecných Fou-rierových řadách vzhledem k ortogonálnímu systému funkcí /„. Fourierovy řady a další z nich vycházející nástroje jsou využívány ke zpracování různých signálů, obrázků apod. Povaha použitých periodických goniometrických funkcí v klasických Fourie-rových řadách a jejich prosté škálování pomocí zvětšující se frekvence zároveň omezují jejich použitelnost. V mnoha oblastech aplikací proto vyvstala přirozená potřeba nalézt šikovnější úplné ortogonální systémy funkcí, které budou vycházet z předpokládané povahy dat a které bude možné efektivněji zpracovávat. Obvyklým požadavkem pro rychlá numerická zpracování bývá rychlá škálovatelnost měřítek a možnost snadného posuvu o konstantní hodnoty. V takový systém lze například doufat, jestliže zvolíme vhodnou spojitou funkci Ý s kompaktním nosičem, 407 KAPITOLA 7. SPOJITÉ MODELY cos ([n + l]x) cos ([n — l]x) n + 1 _ 2n [(-!)"+ 1] (n2 - 1)jt ' Jestliže uvážíme, že 1 n e N \ {1}. 0 pro lichá n e N a bn An (n2-l)ir pro sudá n, získáme CO p -i fi=l L J ix). □ 7.11. Napište Fourierovu řadu tx -periodické funkce, která se rovná kosinu na intervalu (—ji/2, ji/2), a kosinovou Fourierovu řadu 2 ji -periodické funkce y = | cos x |. Řešení. Není obtížné si uvědomit, že hledáme pouze jednu Fourierovu řadu (druhá část zadání je reformulací té první). Sestrojme tedy Fourierovu řadu pro funkci g(x) = cosx, x € [—ji/2, ji/2]. Ze sudosti g plyne bn = Q,n € N. Současně máme ir/2 a0 — f cos x dx ■■ Tí j -jt/2 Tt/2 an = — J cos x cos (2nx) dx = -it/2 Tt/2 = | j \ [cos ([2n + l]x) + cos ([2n - l]x)] dx = -Tt/2 _ 1 rsin([2n+l]j) , sin([2n-l]j)]'r/2 _ 2 [(-!)" , (-!)"+' ] _ ir [ 2n+l 2n-l J _%^ ir [ 2n+l ' 2n-\ J _ 4 (-!)"+■ ir 4n2-l pro každé n e N. Všimněme si, že výpočet a0 bylo možné zahrnout do výpočtu obecného an. Hledanou Fourierovou řadou je n=\ 1 J 7.12. Funkci g(x) = e* rozviňte do (a) Fourierovy řady na intervalu [O, 1); (b) kosinové Fourierovy řady na intervalu [0,1]; (c) sinové Fourierovy řady na intervalu (O, 1]. Řešení. V celé úloze budeme využívat vztahů (7.9) , , , e* [a sin(ax) + cos (ai)] e cos (ax) dx =-;—:—^--h C, □ / 1 + a2 a € (7.10) / eř [sin (Bx) - B cos (Bx) ] ex sin(fix) dx = —-—-"-+ C, /Se 1+/S2 které lze obdržet dvojí aplikací metody per partes. S jejich pomocí postupně vypočítáme ze které sestrojíme spočetně mnoho funkcí ýjk, j,k 6 Z, pomocí translací a dilatací: Ýjk(x) = 2J'2Ý(2jx-k). Pokud zároveň vyhovíme dvěma podmínkám: • tvar mateřské funkce Ý dobře vystihuje možné chování dat, • její potomci ýjk tvoří úplný ortogonální systém, pak bude dobře stačit k aproximaci konkrétního zpracovávaného signálu jen několika málo funkcí. Hovoříme o tzv. waveletech. Nemáme zde prostor pro podrobnosti, jde o mimořádně živý směr výzkumu i základ komerčních aplikací. Zájemce snadno najde spoustu literatury. Poznamenejme však, že ve skutečnosti se velmi často používají pouze diskrétní verze našich objektů, tzn. hodnoty všech funkcí Ýjk jsou pouze tabelovány v diskrétní (hodně velké) množině bodů a jsou v tomto smyslu i ortogonální. Dobrým příkladem jsou standardy JPEG2000, které tuto techniku používají a jsou nástrojem pro profesionální komprimaci obrazových dat ve filmovém průmyslu, nebo formát DjVu komprimace publikací. Jedny z prvních waveletů sestrojila Ingrid Daubechies na začátku devadesátých let. Na obrázku níže je tzv. Daubechies mateřská wavelet D4(x) a její dcera D4(2~3x — 1). Průběh funkce D4 není popsán analytickým způsobem. Funkce je zadána pouze tabelovanými hodnotami pro konečnou (byť velmi velkou) množinu argumentů. Je zvolena tak, aby měla ve svých různých částech všechny vlastnosti, které jsou třeba pro grafická data potřebné — pomalý i rychlý růst, ostrý zlom v obou extrémech apod. Složitost konstrukce spočívá samozřejmě v tom, abychom skutečně dostali pomocí výše uvedené konstrukce ortogonální systém! 2. Metrické prostory V této části kapitoly se abstraktně zamyslíme nad pojmy vzdálenost a konvergence. Bude se nám to hodit vzápětí při důkazech již formulovaných výsledků o Fourierových řadách a v nejrůznějších kontextech se k těmto pojmům budeme vracet. Berme proto další stránky jako velmi užitečný (a snad ještě stále stravitelný) výlet do matematiky pro zdatné či odvážné. 7.12. Metriky a normy. Při odvozování techniky Fourierových řad jsme volně hovořili o vzdálenosti na prostoru funkcí. Nyní se u tohoto pojmu zastavíme pořádněji. s53gg^_2! Euklidovská vzdálenost ve vektorových prostorech M" splňuje, stejně jako tomu bylo u naší L i-vzdálenosti d(f, g) = 11/ — na prostoru spojitých absolutně integrovatelných funkcích, následující tři abstraktní požadavky. Mějme v dalších odstavcích pořád na paměti tyto dva příklady. 408 KAPITOLA 7. SPOJITÉ MODELY a0 = 2fezdx=2(e- 1), a„ =2 }e cos (2mix) dx=2 [ŕ[2m sin(j2^^cos(2"m:)1]^ ■- (») =T2^r, n e N, l+4fizJTz 1 r ft„ —2 f ex sin (2nÄjc) dx — 2\ n L (b) Švf, n e N; l+4fizjrz a0 = 2fe?dx=2(c- 1), ex[sÍn(2ři7Tj:) —Init cos(2mľx) ] l+4fi2JT2 a„ = 2 / e1 cos (mix) dx = 2 sin(^+2c°s("m)1]^ = (c) 2[(-l)"e-l] l+n2ir2 ' n e N; fe„ = 2 JV sin(nnx) dx = 2 jVW"^-^^)]^ . = Mi+(-i2r+'.i, „eN l+řlz7tz a následně pouhým dosazením získáme příslušné Fourierovy řady (a) (b) (c) e - 1 + 2 (e - 1) E + (1 - e) E !frBf1- e-l+2£ [(—l)"e—1] cos(řira) ~ ^ riľl+(—l)"+1el sin (n to:) ^ / -1 i 2 2- ^ l+řizjrz □ 7.13. Funkci g(x) = n2 — x2 na intervalu [—jt, jt] vyjádřete jako součet Fourierovy řady. Pomocí tohoto vyjádření sečtěte číselné řady oo , oo v (-1)"+' v J_ n=\ n=\ Řešení. Také nyní bychom mohli využít sudosti zadané funkce g a metodou per partes spočítat nenulové koeficienty a„. V teoretické části je však odvozena Fourierova řada pro funkci f(x) = x2 na intervalu [—1, 1]. Tím je vlastně dokázána identita oo /(*) = ? + ££ í-1'"^', *e(-l,l). n=\ Odtud pak (s přihlédnutím k rovnosti g(—Jt) = g(zt)) plyne 2„2 _|_4 yj (-1)"+' cosfoj) x e [—jt, jt]. Stačilo přičíst Ti2 a původní řadu vynásobit —1. Dále je třeba si uvědomit, že v argumentu kosinů bude pouze nx místo nnx. Perioda je tak jt-násobná (mění se 2/T a meze integrálu ve vzorci pro an) a při integrování kosinů nyní nedostáváme ti ve jmenovatelích (při výpočtu a0 se projeví změna horní meze). Proto jsme museli původní řadu ještě __I Axiomy metriky a normy Množina X spolu se zobrazením d : X X -» R splňující pro všechny prvky x, y, z e X podmínky (7.2) d(x, y) > 0 a d(x, y) = 0, právě když x — y, (7.3) d(x,y) = d(y,x), (7.4) d(x, z) < d(x, y) + d(y, z) se nazývá metrický prostor. Zobrazení d je metrika na X. Je-li X vektorový prostor nad Ra|| || : X -» Rje funkce splňující (7.5) ||at|| > 0, přičemž ||at|| = 0, právě když x — 0 , (7.6) ||Ajc|| = |A.| ||jc||, pro všechny skaláry X , (7.7) \\x + y\\ < ||*|| + ||y||, pak funkci || || nazýváme norma na X a prostor X je normovaný vektorový prostor. Norma vždy zadává metriku d(x, ý) — \\x — y\\. Na začátku předchozí části této kapitoly jsme tedy ve skutečnosti definovali vzdálenost funkcí pomocí tzv. L \ -normy. V euklidovských vektorových prostorech pak šlo také o normu ||ať||, která je indukována z bihneárního skalárního součinu vztahem ||jc||2 — (x,x), a obdobně jsme pracovali s normou na prostorech unitárních. Úplně stejně jsme pak obdrželi na spojitých funkcích Í2-normu. Samozřejmě metriky zadané normou mají velmi specifické vlastnosti, protože jejich chování lze na celém prostoru X odvodit z vlastností v libovolně malém okolí nulového prvku x — 0 e X. 7.13. Konvergence. Na zcela abstraktních metrických prostoupila- rech lze zavést pojem (blízkých) okolí jednotlivých f+£ prvků, konvergence posloupností prvků a související rÄ^vt. „topologické" pojmy prakticky úplně stejně, jako -mtr^ggír-l-- jsme to udělali pro reálná a komplexní čísla a jejich posloupnosti na začátku páté kapitoly, viz 5.12-5.17. Můžeme tyto odstavce skoro zkopírovat, jen u věty 5.17 narazíme na výrazně složitější důkazy. Začneme konceptem konvergentních posloupností v metrickém prostoru X s metrikou d: ___| Cauchyovské posloupnosti J__-- Uvažme libovolnou posloupnost prvků xq,x\, ... v X takovou, že pro libovolné pevně zvolené kladné reálné číslo £ platí pro všechny dvojice prvků xi,Xj posloupnosti, až na konečně mnoho výjimek (které závisí na volbě £), d(Xi, Xj) < £. Jinak řečeno, pro každé pevné £ > 0 existuje index N takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká cauchyovská posloupnost. Stejně jako u reálných či komplexních čísel bychom rádi, aby každá cauchyovská posloupnost prvků Xj e X konvergovala k nějaké hodnotě x v následujícím smyslu: ___| Konvergentní posloupnosti J__-- Jestliže pro posloupnost prvků xo,x\,...€X, pevně zvolený prvek x e X a pro libovolné kladné reálné číslo £ platí pro všechna i, až na konečně mnoho výjimek (závisejících na volbě £), d(xi, x) < £, 409 KAPITOLA 7. SPOJITÉ MODELY vynásobit jr2. Jestliže čtenář není schopen projít si příslušné výpočty v hlavě a hned si uvědomit, kde vzniknou odlišnosti, doporučujeme mu, aby Fourierovu řadu funkce g raději vypočítal přímo. Když dosadíme x = 0 a x = jt, obdržíme již oo , oo , - -2 = f-2 + 4E^ tj. z4^ = 4, 0=§3r*+4£^^-, tj- JI l2 — ^ Jinak řečeno, nalezli jsme další způsob, jak lze vyjádřit 7r2 = 12(l-i + i- i + ...)=6(l + i + i + i + -- -). □ 7.14. Pomocí Fourierovy řady funkce g(x) = ď, x e [0, 2jt), vyčíslete zr=ii^2- Řešení. Platí (viz také (||7.9||), (||7.10||)) 2ir a0 =1/^^ = 1(^-1), n2ir 0 2ir r n 2 an =l-fď cos Ä = I [ŕ[cos("^+;2sm("j:)1]o = t£^-, n € N, 2ir fc„ = i J e1 sin (fix) ŕfa = o _ 1 I" ex[sin(nj:)-n cos(bj:)] "I _ n(e2n-l) ^ ir L 1+n2 Jg (l+n2)ir ' Proto je e1 = S-^i ^1 + f; £2£í2£l_£|mí2£l^ ; x g (0; 2jr). Žádnou volbou x e (0, 2jt) ale nelze na pravé straně získat řadu J2T=i T+n2, ^u bychom obdrželi pro x = 0. V tomto bodě zjevně není periodické prodloužení g na K spojité, a tak dostáváme e°+e2,r _ x^2»- 5v _ e2"-\ / 1 , cos 0-n sin 0 i v— cos U—n s + Z l+„2 ir \ 2 ' ^ 1+n ři=l odkud plyne a po úprave eín + \ n _ 1 i _J_ 2 ' e2*-l 2 ^ i+„ 1 _ (ir-l)e2,r+ir+l Z i+„2 2(e2*-l) ' n=l □ 7.15. Určete součet řady říkáme, že posloupnost Xj, i — 0, 1, ..., konverguje k prvku x, kterému říkáme limita posloupnosti xj, i = 0, 1, ... v metrickém prostoru X. Díky trojúhelníkové nerovnosti dostáváme pro každou dvojici prvků xj, xj z konvergentní posloupnosti, s dostatečně velikými indexy (značení jako v definici výše), d(xj, Xj) < d(xj, x) + d(x, Xj) < 2e, a proto je každá konvergentní posloupnost také cauchyovská. Metrické prostory, kde platí i obrácené tvrzení, tj. že každá cauchyovská posloupnost je konvergentní, nazýváme úplné metrické prostory. 7.14. Topologie, konvergence a spojitost. Stejně jako v případě reálných čísel můžeme zformulovat konvergenci pomocí „otevřených okolí". _ Otevřené a uzavřené množiny _„ y —í (2n-\)2 | Otevřené s-okolí prvku x v metrickém prostoru X (stručně £-okolí) je množina Oe(x) = {y e X; d(x,y) < s}. Podmnožina U C X je otevřená, jestliže obsahuje s každým svým bodem i nějaké jeho £-okolí. Podmnožina W C X je uzavřená, | jestliže je její doplněk X \ W otevřenou množinou. Namísto £-okolí hovoříme také o (otevřené) £-kouli se středem v x. V případě normovaného prostoru si vystačíme s £-koulemi se středem v nule, jejichž přičtením k danému prvku x dostaneme právě jeho £-okolí. Hromadné body podmnožiny A c X opět definujeme jako takové prvky x e X, ke kterým konverguje nějaká posloupnost bodů z A neobsahující samotný bod x. Snadno uvidíme, že množina je uzavřená, právě když obsahuje všechny své hromadné body: Skutečně, přímo z definice plyne, že množina A je uzavřená, právě když pro každý bod x f A existuje nějaké £ > 0 takové, že celé £-okolí Oe (x) má s A prázdný průnik. Pokud by tedy A byla uzavřená a x byl hromadný bod množiny A, který do A nepatří, pak jistě v libovolném takovém £-okolí takového x leží nekonečně mnoho bodů množiny A, což je spor. Naopak předpokládejme, že A obsahuje všechny své hromadné body a uvažme x e X \ A. Pokud by v každém £-okolí bodu x existoval bod xe e A, pak postupně volbami e — l/n dostaneme posloupnost bodů x„ e A konvergující k x. Pak by ovšem x musel být hromadným bodem, a tedy v A, takže opět máme spor. Pro každou podmnožinu A v metrickém prostoru X definujeme její vnitřek jako množinu těch bodů v A, které do A patří i s celým svým nějakým okolím. Dále definujeme uzávěr A množiny A jako sjednocení původní množiny A s množinou všech jejích hromadných bodů. Snadno jako u reálných čísel ověříme, že libovolný průnik a libovolné konečné sjednocení uzavřených množin v metrickém prostoru je opět uzavřená množina. U otevřených množin je to opět naopak: libovolné sjednocení otevřených množin je opět otevřená množina, ale jen konečný průnik otevřených množin je obecně opět otevřená množina. Dokažte si obě tvrzení podrobně sami! 410 KAPITOLA 7. SPOJITÉ MODELY Řešení. Ke stanovení součtu této řady lze s úspěchem využít známých Fourierových řad mnoha různých funkcí. Připomeňme např. Fourie-rovu řadu co 2 n (2n-l)2 ' ři=l kterou jsme vypočítali pro funkci g(x) = \x\,x e [—re, ji). Protože je tato funkce spojitá na [—ji, ji) a | — ji | = | ji |, víme, že dokonce platí co Dosazení x = 0 nám dává °-2 t JI (2n-l)2' ti- Iľ (2,-1)2- -j" ^ (2n-l)2 8 fi=l řl=l □ 7.16. Sečtěte řady co co , 2- n*' 2- „4 ři=l ři=l Řešení. Nejdříve připomeňme, že součty řad v -L — 2Í v — 2Í „2 — 6 » „2 —12 ři=l ři=l jsme určili už dříve. V této úloze naznačíme, jakým způsobem lze postupovat při počítaní součtů řad co co , „2k > n2k n=l n=l pro obecné ieN. Využijeme identit co . . , Esin (nx) -—. n (7.12) x € (0, 2ji), 2 4jt t-^ cos (nx) ■4-e sin (nx) x € (0, 2jt), které vyplývají z konstrukcí Fourierových řad postupně pro funkce g(x) = x a. g(x) = x2 na intervalu [0, 2it). Podle (||7.11||) je CO £52^1 = 2^ x€(Q,2lT). n=\ Dosazením do (||7.12||) získáme £ cosf^l = 3^-6g+2^ ^ ^ e (Q> 2jr)^ Pouhé dosazení pak dokáže platnost tohoto vztahu také v krajních bodech x = 0, x = 2ji. Řada na levé straně má zjevně majo-rantu Yľ^Ĺi ^> a proto konverguje absolutně a stejnoměrně na [0, 2ir]. Můžeme ji tak integrovat člen po členu: Sami si také podrobně ověřte, že vnitřek množiny A je právě sjednocením všech otevřených množin v A obsažených, zatímco uzávěr A je průnikem všech uzavřených množin obsahujících A. Uzavřené a otevřené množiny představují základní pojmy tzv. topologie. Aniž bychom zacházeli do hlubších podrobností a souvislostí, seznámili jsme se právě s topologií metrických prostorů. Poj em konvergence můžeme nyní zformulovat tak, že posloupnost prvků xí v metrickém prostoru X, i — 0, 1, ..., konverguje kiel, právě když pro každou otevřenou množinu U obsahující x jsou všechny body naší posloupnosti, až na konečně mnoho výjimek, obsaženy v U. Stejně jako u reálných čísel můžeme také definovat spojitá zobrazení mezi metrickými prostory: Zobrazení / : W -» Z je spojité jestliže vzor f-\V) každé otevřené množiny V C Z je otevřená množina ve W. Samozřejmě to neznamená nic jiného než tvrzení, že pro všechny prvky z = f(x) e Z, x e W a kladné číslo £ existuje kladné číslo S tak, že pro všechny prvky y e W se vzdáleností dw(x, y) < S je také dz(z, f(y)) < e. Zcela stejně jako u reálných funkcí je zobrazení / mezi metrickými prostory spojité právě tehdy, když respektuje konvergence posloupností. 7.15. tp-normy. Nyní máme k dispozici obecné nástroje, se kte-^ií.' i rými se můžeme podívat na příklady metrických prostorů «prjj^) tvořených konečněrozměrnými vektory nebo funkcemi. r\ů^' Omezíme se na obzvlášť užitečnou třídu norem. Začneme ífj na reálných nebo komplexních konečněrozměrných vektorových prostorech M" a C" a definujeme pro pevné reálné číslo Zn) 1/p p > 1 a libovolný vektor z = (zi ikiip = (í>r v;=i Dokážeme, že takto je definována norma. První dvě vlastnosti z definice jsou zřejmé. Zbývá dokázat trojúhelníkovou nerovnost. Vyjdeme přitom z tzv. Holderovy nerovnosti: Lemma. Pro pevné reálné číslo p > 1 a každé dvě n-tice nezáporných reálných čísel x j a y i platí E- (E> ) -(Ev 1/9 i=\ kde 1/3 = 1- l/p. Důkaz. Označme si X a Y výrazy v součinu na pravé straně dokazované nerovnosti. Pokud jsou všechna čísla x j % nebo všechna y, nulová, pak tvrzení platí. Předpokládejme tedy X ^ Oaľ ^ 0. Hôlderova nerovnost je užitečným přímým důsledkem konvexity exponenciální funkce. Definujme čísla vi a Wk tak, aby platilo Xk — X e "t/p yt = Ye Wkll Protože l/p+l/q — 1, můžeme uvažovat afinní kombinaci hodnot ^ Vk + ^ Wk a díky konvexitě exponenciály dostáváme vk/p+wk/q p I Pwk qe ■ Odtud již přímo dopočítáme 1 —xkyk < XY " - p Kf)"+K 411 KAPITOLA 7. SPOJITÉ MODELY ii x oo oo co i- -ix ly2-6icy+2ic2 ^ _ ií-3m2+2i2 x I x e [0, 2jt]. oo co r ni a co ... g 1-cos(bj:) _ yj cosl/iy) — f Sm("y^ dy - n=l ™ n=l ^ ™ 0 n=l ™ r ji3-3ir/+2ir2j. , _ x4-4m3+4ir2x2 x e [0, 2tt]. Dosazení x = jt vede na co y^ l+(-i)"TI _ y^ i-cos( Z. n4 _ i- n" _ y^ l-cos(nir) _ jťj_ ~ 48 ' řl = l f!=l S přihlédnutím k tomu, že čitatel na levé straně je nulový pro sudá n a je roven 2 pro lichá n, lze obdrženou řadu zapsat jako (7.13) Z vyjádření (2n - l)4 71 48' E „4 E (2n)4 ~*~ E (2n-l)4 ři = l ři=l ři=l 16 „4 + E 1 (2n-l)4 pak plyne oo oo . X — lá v i — lá I si „4 15 L (2n-l)4 15 ' 2 ' 48 ři=l ři=l čímž jsme sečetli první řadu. Součet druhé je co v tm Z. B4 El _ y- 1 _ y- 1 _ J_ y- _1_ Í2n-ll4 Z^ (2n)4 — Z^ (2n-l)4 16 Z^ n4 (2„-l)4 ^ (2„y n=\ miz pracujeme. □ 'Funkce ((p) = Y^Ll W se nazývá Riemannova zeta funkce. a sečtením přes k — l, ... ,n 1 n 1 n 1 n ^ ' ~~ nXP ' aYP ' ' pXP qYP Upozorněme, že ve skutečnosti lze člen po členu integrovat každou Fourierovu řadu. Analogicky dalším integrováním obdržíme -\x x oo í = l í = l í = l Na pravé straně ovšem jednotlivé sumy dávají právě Xp a Yq a celý výraz je tedy roven l/p + l/o = 1. Vynásobením této nerovnosti číslem XY dostáváme právě dokazovanou nerovnost. □ Teď už budeme umět dokázat, že | | je skutečně norma: [ MlNKOWSKÉHO NEROVNOST |__ L Pro každé p > 1 a všechny n-tice nezáporných reálných čísel (*!, ..., x„) a (yi, ... ,y„) platí / " \ l/p / " \ l/p / " \ l/p (J>+*)p) <(E*ľ) + (E^ I SĹ _ ± 2_ — Zit — 2 ' 48 16 ' 90 — 720 • Jak jsme řekli, obdobně lze postupovat při sčítání řad co oo , Y- J_ Y" řl=l řl=l pro další e N. Je proto přirozené ptát se např. na součet řady Eľ=i ^3 • O nalezení jejího součtu se však matematici marně pokoušejí (bez přehánění) už celá staletí. To může čtenáře oprávněně překvapit, neboť naznačený postup bychom měli být schopni provést i pro všechny liché mocniny. Můžeme třeba vyjít z identity co J2 2^ = -In (2 sin f), x e (0, 2jt), n=l kterou lze mimochodem opět dokázat tím, že funkci na pravé straně rozvineme do Fourierovy řady. Kdybychom stejně jako výše dvakrát integrovali člen po členu řadu na levé straně a v limitě dosadili x —► 0+, získali bychom právě řadu Yl™=\ ^- Mělo by tedy stačit dvojí integrování funkce na pravé straně a výpočet jedné limity. Integrování pravé strany ovšem vede na tzv. vyšší funkci, kterou není možné běžným způsobem vyjádřit pomocí funkcí elementárních, s ni- K ověření této praktické nerovnosti vede následující trik využívající Hôlderovu nerovnost. Jistě platí (všimněme si, že p > 1) 1/9 1/9 » /___ \ l'P /___ y>(*; + yiy-1 < (E*?) • (E(*+y^l)9 i=l \=1 ' \ = 1 a stejně tak n í 71 \ 1/p / " E^+^-ÍE^ •ÍE(*+»- i=l \=1 ' \=1 Nyní sečtením posledních dvou nerovností, s využitím skutečnosti, že p + q — pq a tedy (p — í)q = pq — q = p, dostaneme EU^i+ytV '— ^1/p '— ^1/p (ELifc - yt)p 1/9 alel — l/q — 1/p, takže jde právě o dokazovanou Minkowského nerovnost. Ověřili jsme si tedy, že na každém konečněrozměrném reálném nebo komplexním vektorovém prostoru máme třídu norem || ||p pro všechna p > 1. Kromě toho ještě klademe llzlloo = max{lz;l. i = 1,..., «}, což je zjevně také norma. Všimněme si, že Hôlderovu nerovnost můžeme v kontextu těchto norem zapsat pro všechna x = (x\,...,xn), y = (yi, ..., y„) jako Ei^-i-w ^ llyii provšechnap > 1 aq splňující l/p+l/q = l,přičemžprop = 1 klademe q — oo. 7.16. tp-normy pro posloupnosti a funkce. Nyní docela snadno zavedeme normy i na vhodných nekonečněrozměrných vektorových prostorech. Začněme posloupnostmi. Vektorový prostor tp, p > 1, je množina všech posloupností reálných nebo komplexních posloupností xo, x\, ... takových, že co Eklp < oo. ;=o 412 KAPITOLA 7. SPOJITÉ MODELY 7.17. Pomoci Parsevalovy rovnosti pro Fourierův ortogonální systém ověřte, že f i _ -ŕ 2-^ (2n-l)4 96 ' f! = l Řešení. Součet uvedené řady jsme již stanovili (viz (||7.13||)). Nyní odhalíme, že číselné řady lze pomocí Fourierových řad sčítat ještě snadněji. Tato cesta však podmiňuje znalost nemalého počtu Fourierových řad a může být pro čtenáře o něco náročnější. (Doporučujeme tak každému, aby porovnal řešení tohoto a předchozího příkladu.) Základem je volba vhodné Fourierovy řady. Vezměme kupř. Fou-rierovu řadu 7t _ 4_ v- cos([2ři — l]x) (2n-l)2 ' kterou jsme obdrželi pro funkci g(x) = \x\, x e [—jt, jr) a kterou jsme k určení součtu číselné řady již jednou použili. Parsevalova rov- nost 2 oo oo xq+T n=\ n = \ xq pro ni říká 4 + V^^ = I f \x\2dx = ± fx2dx = ^. 2 jc2 ^ (2n-l)4 I J 1 it J 3 V 1 _ (22Í _ 2Í\ £ 2^ (2n-l)4 — \ 3 2 ) h n=\ t-lŕ. 16 96 ■ □ Nyní budeme ilustrovat, jak lze použít Fourierovy řady v teorii diferenciálních rovnic. Diferenciální rovnice budeme podrobněji studovat v další kapitole, viz 3. Pro jednoduchost uvažujme pouze nehomogenní (srovnej s (||7.2||)) diferenciální rovnici (7.14) y" + a2y = f(x) s neznámou y v proměnné iel,s periodickou spojitě diferencovatelnou funkcí / : K —► K na pravé straně a konstantou a > 0. Nechť je T > 0 primitivní perioda funkce / a nechťje na [-T/2, T/2] známa její Fourierova řada, tj. identita (7.15) f(x) A CO 2 h 2itnx 2itnx An cos--h Bn sin- x € 7.18. Dokažte, že má-li rovnice (||7.14||) periodické řešení na K, pak perioda tohoto řešení musí být rovněž periodou funkce /. Dále dokažte, že rovnice (||7.14||) má právě jedno periodické řešení s periodou T právě tehdy, když je (7.16) 2ti n a y= pro každé nei. Všechny posloupnosti s omezenými absolutními hodnotami členů tvoří prostor £co- Limitním přechodem pro n -» oo okamžitě z Minkowského nerovnosti vidíme, že výraz , oo i/p je norma na ip. Obdobně klademe na £co IMIoo = supil*; I, i = 0, 1, . . . ) a opět dostáváme normu. Konečně, vraťme sek prostorům funkcí 5° [a, b] na konečném intervalu [a, b] nebo čPc[a,b] na neohraničenémintervalu. S normou || ||i jsme se již setkali. Zjevně ale pro každé p > 1 a pro všechny funkce v takovém prostoru funkcí existují Riemannovy integrály / J a \f(x)\"dx a můžeme tedy definovat / rb \ l/p 11/11? = (J i/wip^J ■ Riemannův integrál jsme definovali pomocí limitního přechodu vycházejícího z tzv. Riemannových součtů, které odpovídají dělením H s reprezentanty f,. V našem případě tedy jde o konečné součty n ss,í = x;i/&)ip(*i -xi-i). Hôlderova nerovnost použitá na Riemannovy součty součinu dvou funkcí f (x) a g(x) dá n El/feOllgfeOlte-*;-!)^ i=l n = -*;-i)1/plgfe)lte -xi-xýi" < i=l < (El/feO^fc-Xi-i)\ ■ [J2\8&)\9(xi-Xi-Ú) ■ \=1 ' \=1 ' přičemž napravo máme zjevně právě součin Riemannových součtů pro integrály ||/||p a ||g||9. Limitním přechodem tak ověřujeme tzv. Holderovu nerovnost pro integrály: j f(x)g(x) < (J f(xY dxj (J g(x)l dxj platnou pro všechny nezáporné reálné funkce f a g v našem prostoru po částech spojitých funkcí s kompaktním nosičem Přesně stejným postupem jako v předchozím odstavci odvodíme z Hôlderovy nerovnosti nerovnost Minkowského v její integrální formě: HZ + glIp < ll/llp + klip- Jetedy || |p je skutečně norma na vektorovém prostoru všech spojitých funkcí s kompaktními nosiči pro všechna p > 1 (a pro p = 1 jsme tuto skutečnost ověřili už dávno). Pro celý prostor 5° [a, b] po částech spojitých funkcí budeme sice také slovo norma v tomto kontextu používat, měli bychom ale přitom vědět, že musíme ztotožňovat funkce, které se od sebe liší jen hodnotami v bodech ne-spojitosti. 413 KAPITOLA 7. SPOJITÉ MODELY Řešení. Nechť je funkce y = g(x),x e K řešením rovnice (||7.14||) a má periodu p > 0. Aby bylo vůbec možné dosadit funkci g do diferenciální rovnice druhého řádu, musí existovat její druhá derivace g". Protože funkce g, g', g", ... mají stejnou periodu, také funkce g"(x) + a2g(x) = f (x) je periodická s periodou p. Jinak řečeno, funkce / je periodická jako lineární kombinace funkcí s periodou p. Tím jsme dokázali první tvrzení říkající, že p = IT pro jisté / e N. Nyní předpokládejme, že funkce y = g(x),x e K je periodickým řešením rovnice (||7.14||) s periodou Tas vyjádřením Fourierovou řadou co (7.17) g(x) =--h > [fl„ cos (conx) + bn sin (conx)], 2 n=\ kde co = 2it/T. Vyhovuje-li g rovnici (||7.14||), musí mít tato funkce spojitou druhou derivaci na K. Platí tedy co g'(x) = ^ ía)nbn cos (conx) — conan sin (conx)] , iěI, n=\ (7.18) co g"(x) = [—co2n2an cos (conx) — co2n2bn sin (ííotjc)] , iel. n = \ Dosazení (||7.15||), (||7.17||) a (||7.18||) do (||7.14||) dává : Y + [(—co2n2an + fl2fl„) cos (ncox) + n=\ + (—co2n2bn + a2by\ sin (řiojx)] = co 4p + Y, [A„ cos (ncox) + B„ sin (ncox) ]. 2ao Ao Ao a — = —, tj. a0 = —, 2 2 al Odsud vyplývá, že (7.19) a (7.20) (—co2n2 + a2) an = An, (—co2n2 + a2)bn = Bn, n e N. Je vidět, že těmto podmínkám vyhovuje právě jedna dvojice posloupností {a„}„€Nu{0), {b„}„efi tehdy a jenom tehdy, když je -co2n2 + a2 = - (2f^)2 + a2 ^ 0 pro každé n e N, tj. když platí (||7.16||). V tomto případě je jediné řešení (||7.14||) s periodou T určeno jediným řešením An . Bn (7.21) an -, fieN Mezi těmito normami je výjimečný případ p — 2, který jsme již dříve realizovali pomocí skalárního součinu. V tomto případě jsme mohli odvodit trojúhelníkovou nerovnost daleko jednodušeji pomocí Schwarzovy nerovnosti. Pro funkce z 5° [a, b] můžeme definovat i obdobu tco-normy na n-rozměrných vektorech. Protože jsou naše funkce po částech spojité, budou pro ně na konečném uzavřeném intervalu vždy existovat suprema absolutních hodnot a klademe tedy pro takovou funkci / ll/llco = suPÍ/0). x 6 [a,b]}. Všimněme si, že kdybychom za hodnoty f(x) v bodech nespoji-tosti považovali jak jednostranné limity (které podle naší definice vždy existují), tak samotnou hodnotu funkce, pak můžeme pracovat s maximy místo suprem. Opět je zřejmé, že jde o normu (až na problémy s hodnotami v bodech nespojitosti). 7.17. Zúplnění metrických prostorů. Samotná reálná čísla R nebo komplexní čísla C jsou (s metrikou danou absolutní hodnotou) úplným metrickým prostorem. To je vlastně obsahem axiomu o existenci suprema a připomeňme, že jsme reálná čísla vytvořili jako „zúplnění" prostoru racionálních čísel, který sám úplný naopak není. Je přitom zjevné, že uzávěrem množiny Q C R je už celé Husté a řídké podmnožiny Říkáme, že podmnožina A c X v metrickém prostoru X je hustá, jestliže je uzávěrem A celý prostor X. Množina A je řídká v X, jestliže je X \ Á hustá. Zjevně je A hustá v X, jestliže každá otevřená množina v celém prostoru X má s A neprázdný průnik. Ve všech případech norem na funkcích z předchozího odstavce je vcelku snadné vidět, že takto definované metrické prostory nebudou patrně úplné. Snadno se totiž stane, že cauchyovská posloupnost funkcí z našeho vektorového prostoru 5° [a, b] by měla mít za limitu funkci, která již v tomto prostoru nebude. Vezměme si třebas na intervalu [0, 1] funkce /„, které jsou nulové na [0, 1/n) a rovny sin(l/jc) na [1/n, 1]. Zjevně budou konvergovat ve všech L p normách k funkci sin( 1 /x), ta ale do našich prostorů již nepatří. _ zúplnění metrického prostoru__ Nechť X je metrický prostor s metrikou d, který není úplný. Metrický prostor X s metrikou d takový, že X c X, d je zúžením d na podmnožinu X a uzávěrem X je celý prostor X, se nazývá zúplnění metrického prostoru X. -co2n2 + a2 —co2n2 + a2 soustavy rovnic (||7.20||). Podotkněme, že jsme mlčky využili stejnoměrnou konvergenci řady v (||7.18||). Ta mj. vyplývá z hlubších výsledků obecné teorie Fourierových řad, kterým se však nebudeme podrobněji věnovat. □ Následující věta říká, že prakticky stejným postupem, jak jsme vytvořili reálná čísla z racionálních, můžeme nyní najít zúplnění libovolného (neúplného) metrického prostoru X. Ještě než se do docela složitého důkazu tohoto mimořádně důležitého a užitečného výsledku pustíme, všimněme si, že takové „zúplnění" X prostoru X může být dané v rozumném smyslu jediným způsobem: O zobrazení

X2 mezi metrickými prostory s metrikami d\ a d2 řekneme, že je izometrie, jestliže pro všechny prvky x,y e X platí d2((p(x), 0, x,y € X, (7.25) d(x, y) = d(y, x), x,y e X. Položíme-li však x = z v (||7.23||), z (||7.22||) dostaneme (||7.24||). Podobně z volby y = z v (||7.23||) s použitím (||7.22||) plyne t/(x, y) < d(y, x) pro všechny body x,y e X. Záměnou proměnných x a y dále obdržíme d(y, x) < d(x, v),tj. (||7.25||). Dokázali jsme, že definice jsou ekvivalentní. V literatuře lze nalézt i další ekvivalentní způsoby pro zavedení metrik. Stejně tak lze dohledat mnoho mírně odlišných definic, které ovšem vedou na jiné objekty než metriky (nejdůležitější mezi nimi jsou pseudometriky, ultrametriky a semimetriky). První axiomatickou Uvažme nyní dvě vložení hustých podmnožin i\ : X -» X\ a í 2 : X -» X2 do dvou zúplnění prostoru X. Evidentně je na husté podmnožině i\(X) c X\ dobře definované zobrazení

X2, které je bijektivní izometrií. Jsou tedy skutečně X\ a X2 stejné v tomto smyslu. 7.18. Věta. Nechť X je metrický prostor s metrikou d, který není úplný. Pak existuje jeho zúplnění X s metrikou d, které je jednoznačné až na bijektivní izometrie. Důkaz. Myšlenka konstrukce je zcela identická jako u kon-■ SÍl strukce reálných čísel. Dvě cauchyovské posloupnosti ■4&í'ĽsHŕ x' a bodů v X považujeme za ekvivalentní, jestliže cř(x;, y i) konverguje k nule pro / jdoucí do nekonečna. Tady jde o konvergenci reálných čísel, tedy korektní definici. Je vcelku zřejmé z vlastností konvergence na reálných číslech, že jde skutečně o relaci ekvivalence (ověřte si podrobně - např. tranzitivita plyne z toho, že součet dvou posloupností konvergujících k nule také konverguje k nule). Definujeme nyní X jako množinu tříd ekvivalence cauchy-ovských posloupností. Původní body x e X můžeme ztotožnit s třídou posloupností ekvivalentních s konstantní posloupností xi = x, i = 0, 1, .... Nyní j e nasnadě, j ak zadefinovat metriku d. Nabízí se uvažovat pro posloupnosti x = {xq, x\, ...) a ý = {yo, yi, ■ ■ ■) ď(x, ý) = lim d(xi, y i). Í^co Předně je třeba ověřit, že tato limita skutečně existuje a je konečná. Přímo z trojúhelníkové nerovnosti pro absolutní hodnotu na reálných číslech a skutečnosti, že obě posloupnosti x a ý jsou cauchyovské, plyne, že jde o cauchyovskou posloupnost reálných čísel d(xi, y i) a tedy j ejí limita skutečně existuj e. Pokud vybereme jiné reprezentanty x = {x'0, x\, ...) a y — {yá > /i > • • • L P3^ z trojúhelníkové nerovnosti pro vzdálenost reálných čísel (je třeba uvážit důsledky pro rozdíly vzdáleností) vidíme, že \d(x\, y\) - d(Xi, yi)\ < \d(x\, y\) - d(x\, yi)\+ + \d(x\, y i) - d(xi, yi)\ < < dixi.x';) +d(yi,y'i). Skutečně tedy na výběru reprezentantů v definici nezáleží. 415 KAPITOLA 7. SPOJITÉ MODELY definici „tradičnf' metriky pak vyslovil Maurice Fréchet v roce 1906. Název metrika pochází ale od Felixe Hausdorŕľa, který tento pojem poprvé použil ve své práci z roku 1914. □ 7.21. Uvažujte množinu všech podmnožin libovolné konečné množiny a rozhodněte, zda je zobrazení pro všechny uvažované podmnožiny Z, y definované vztahem (a) d\(X, ľ) :=|(IUľ)\(lnľ)|; (b) d2{X, y) := (XU^^ny)' > X u Y ŕ 0> d2(0, 0) := 0 metrikou. (Symbolem | X | se rozumí počet prvků množiny X.) Řešení. V konkrétních úlohách o rozhodnutí, zdaje nějaké zobrazení metrikou, budeme ověřování prvních dvou podmínek z definice metriky vynechávat. Čtenář by si měl sám hned uvědomit, že jsou splněny pro di i d2. Omezíme se tedy pouze na rozbor trojúhelníkové nerovnosti. Případ (a). Pro libovolné množiny X, y, Z platí (7.26) (xuz)\(inz) c [(x uľ)\(xn y)] u [(y u z) \ (y n z)]. Pokud totiž x € (ZUZ)\(ZnZ), pak nastává právě jedna z možností x € X a současně x ^ Z, x £ X a. současně x e Z. Má tak smysl zvažovat tyto 4 možnosti x € X, x i Z, x € y, x € X, x i Z, x i y, x i X, x e Z, x € y, x i X, x e Z, x i y, které mohou nastat pro x e (X U Z) \ (X n Z). Ve všech těchto 4 případech je však x prvkem právě jedné z množin (XUľ)\(Xn y), (y U Z) \ (y n Z). Tím jsme obdrželi inkluzi (||7.26||), z níž ihned plyne požadovaná trojúhelníková nerovnost rfi(Z, Z) = | (X U Z) \ (X n Z) i < < I [(Z u y) \ (X n y)] u [(y uz)\(ľnz)]|< < | (X U y) \ (X n y) I + I (y U Z) \ (y n Z) i = = rfi(Z, F) + di(y, Z). Případ (b). Lze postupovat podobně jako pro d\. Symbolem X' budeme označovat doplněk (komplement) množiny X. Z rovností (X U y) \ (X n y) = = (x n y' n Z) u (x n r n z') u(X'nľnz)u(ľnľn z'), (ľ u z) \ (ľ n z) = = (z n y n z') u (x n r n Z) u (Z' n y n z') u (Z' n y n Z), [(x u z) \ (x n Z)] u [ľ \ (x u Z)] = = (x n y n z') u (z n r n z') u(X'nľnz)u (Z' n y n Z)u u(Z' n y n z'), Dále ověříme, že je metrikou na X. První dvě vlastnosti jsou zřejmé. Pro odvození trojúhelníková nerovnosti zvolme tři cauchy-ovské reprezentanty prvků x, ý, ž a opět dostaneme snadno: d(x, ž) — lim d(xt, zí) < < lim d(xi, y i) + lim íí(y;, zí) = = d(x, ý) + íí(ý, i ). Zjevně je také zúžení právě zadefinované metriky d na původní prostor X shodný s původní metrikou, protože původní body jsou reprezentovány konstantními posloupnostmi. Zbývá nám ještě dokázat hustota X v X a úplnost nově zkonstruovaného metrického prostoru. Chceme tedy dokázat, že pro pevně vybranou cauchyovskou posloupnost x = {x,} vždy ke každému sebemenšímu £ > 0 najdeme v původním prostoru nějaké y takové, že vzdálenost konstantní posloupnosti prvků y od zvolené posloupnosti xi nebude větší než £. Protože je však posloupnost xi cauchyovská, budou všechny dvojice xn, xm jejích členů sobě blíže než o £ pro dostatečně veliké indexy man. Pak ale nutně také výběrem y — x„ pro jeden takový index budou již sobě prvky y a xm blíže než o £ a tedy i v limitě bude platit, že d(ý, x) < e. Závěrem je tedy ještě třeba ukázat, že cauchyovské posloupnosti bodů rozšířeného prostoru X vzhledem k metrice d jsou už nutně konvergentní. Jinak řečeno, chceme ukázat, že opakováním předchozí konstrukce již nedostaneme nové body. To uděláme tak, že budeme umět postupně body cauchyovské posloupnosti xi přiblížit body yi z původního prostoru X tak, aby výsledná posloupnost ý — {yi] byla limitou původní posloupnosti vzhledem k metrice d. Protože již víme, že je X v X hustou podmnožinou, můžeme pro každý prvek xi z naší dané posloupnosti vybrat prvek zk 6 X tak, aby pro konstantní posloupnost ík platilo d(xk, Zk) < Uvažme nyní posloupnost i = {zo.zi, ...). Původní posloupnost x je cauchyovská, tj. pro pevně zvolené číslo £ > 0 najdeme index n(g) takový, že d(xn, xm) < s/2, kdykoliv budou min větší než n(g). Bez obav můžeme přitom předpokládat, že námi zvolený index n(g) je větší nebo roven číslu 4/£. Nyní dostáváme pro min větší než n(g): d(Zm,Zn) — dCZm, In) < < ď(lm,Xm) + ď(xm,x„) + ď(x„, Ž.n) < < l/m + s/2 + l/n < 2- + - = s. 4 2 Jde tedy o cauchyovskou posloupnost z, prvků v X a tedy ž e X. Zkoumejme, zda vzdálenost d(xn, z) skutečně jdeknule, jak jsme se snažili konstrukcí zajistit. Z trojúhelníkové nerovnosti ď(z,x„) < ď(z, ln) + ďCz„,x„). Podle našich předchozích odhadů ale jdou oba sčítanci napravo k nule a tím je důkaz ukončen. □ V dalších třech odstavcích si uvedeme tři docela jednoduché věty o úplných metrických prostorech, které mají spoustu důležitých aplikací jak v samotné matematické analýze, tak v ověřování konvergence numerických metod. 416 KAPITOLA 7. SPOJITÉ MODELY které lze opět snadno dokázat výčtem možností, plyne zesílení (||7.26||) ve tvaru í(xuz)\(xnZ)]u[Y\(XuZ)] c C [(X UF)\(Xíl Y)] U [(Y U Z) \ (Y n Z)]. (xuzK(xnz) xuz Dále využijeme nerovnost ;(xuz)\(xnz)]u[y\(xuz)] y i i 7 ^ a XUZ U[ľ\(IUZ)] 1 ' ' ' Ta je založena pouze na počítání s nezápornými čísly, neboť obecně platí i < í±z, y > 0, z > 0, x e [0,z]. z — z+y J — Ze zřejmého vztahu XUZ U[ľ\(XUZ)] = IUľUZ tak již dostáváme d2(X, Z) (xuz)\(xnz) XUZ [(xuy)\(xny)]u[(yuz)\(ynz)] xuyuz [(xuz)\(xnz)]u[y\(xuz)] XUZ U[ľ\(XUZ)] 1 — (xuy)\(xny) 1+1 (yuz)\(ynz) xuyuz < i+^ z>' pokud XUZ ^ 0 a F 7^ 0. Pro Z = Z = 0 nebo F = 0 je však očividně trojúhelníková nerovnost splněna také. V obou případech se tudíž jedná o metriky. Metrika d\ má spíše pomocný charakter a nelze říci, že by měla tak široké uplatnění jako di, kterou lze dohledat v literatuře pod názvem Jaccardova metrika. Pojmenována byla podle biologa Paula Jaccarda, který v roce 1908 pomocí funkce 1 — d2 účinně vystihl míru podobnosti mezi hmyzími populacemi. □ 7.22. Nechťje Dokažte, že d je metrika na K. Řešení. Opět dokážeme jenom trojúhelníkovou nerovnost (ostatní je zřejmé). Zavedme pomocnou rostoucí funkci t (7.27) fit) 1+/ t > 0. Skutečnost, že / je rostoucí, ani není třeba ověřovat výpočtem první derivace. Stačí úvaha nebo jednoduchá úprava m — f(r) = T+l ~ T+7 (l+í)(l+r) > 0, s > r > 0. Platí proto d(x, z) 1 + 1 x-z x-y 1+1 *-y l+l y-z 1+1 x—y+y—z \y-z\ l+l x-y l+l y-z\ l+l x-y l+l y-z\ \x-y\ l+l x-y l l+l y-z d(x, y) + d(y, z), x,y,z el. □ 7.19. Banachova věta o kontrakci. Zobrazení F : X -> X na metrickém prostoru X s metrikou d se nazývá kon-ijLjr- trahujícízobrazení, jestliže pro nějakou reálnou kon-áfS^Sř stantu 0 < C < 1 a všechny prvky x,y v X platí d(F(x),F(y))0, i€[l,2] ■2+^- /1+22 Rostoucí funkce na uzavřeném intervalu totiž nabývá své maximální hodnoty v jeho pravém krajním bodě. □ 7.24. Zjistěte, jestli je posloupnost {x„}„€n, kde xi = l, xn = 1 + \ H-----h i, n € N \ {1}, cauchyovská v K. Uvažujte nejprve běžnou metriku danou rozdílem v absolutní hodnotě (tj. indukovanou normou, kterou je absolutní hodnota) a poté metriku d(x, y) : Řešení. Připomeňme, že x,y e (7.28) Platí tak ti. V - = oo, m 6 M. /c=m lim | x„ - xm | k=m+l m e N. Odsud je vidět, že posloupnost {*„} nemůže být cauchyovská. Nalezli jsme odpověď pro běžnou metriku. Mohli jsme však hned využít toho, že posloupnost {xn} není podle (||7.28||) konvergentní, a vzpomenout si, že se nacházíme v úplném metrickém prostoru, kde cauchyovské a konvergentní posloupnosti splývají. Pro metriku d si stačí uvědomit, že zobrazení / zavedené v (||7.27||) je spojitou bijekcí mezi množinami [0, oo) a [0,1) s vlastností, že /(O) = 0. Libovolná posloupnost je tak konvergentní Věta. Je-li A\ D A2 D • • • D A; D ... neklesající řetězec neprázdných uzavřených podmnožin v úplném metrickém prostoru X a diam A; -» 0, pak existuje právě jeden bod x e X patřící do průniku všech A,-. Důkaz. Vyberme z každé množiny A, jeden bod z;. Protože diam A; -» 0, můžeme pro sebemenší kladné £ najít index n(g) tak, aby všechny A; s indexy i > n(g) už měly průměr menší než £. Pak ale nutně pro takto veliké indexy i, j bude takérffo, Zj) < £ a tedy je naše posloupnost cauchyovská. Bude proto mít limitní bod z e X, který pochopitelně musí být hromadným bodem všech A,, a proto patří do všech A, (když jsou všechny uzavřené) a tedy patří do jejich průniku. Dokázali jsme tedy existenci z, zbývá odůvodnit jednoznačnost. Předpokládejme tedy, že máme body z a y, oba v průniku všech A,. Jejich vzdálenost pak ale musí být menší než průměr všech A,, ten ale konverguje k nule. Tím je důkaz ukončen. □ 7.21. Věta (Bairova věta). Je-li X úplný metrický prostor, pak průnik libovolného spočetného systému otevřených hustých množin Ai je množina hustá v metrickém prostoru X. Důkaz. Máme dán systém hustých a otevřených množin A, jf?s v X, i — 1, 2 ..., a chceme ukázat, že množina A = ní^jA; má s libovolnou otevřenou množinou jtjä U C X neprázdný průnik. Budeme postupovat induktivně s pomocí předchozí věty. Jistě existuje z i e Ainf/,protožejeale množina Ai otevřená, patří bod zi do tohoto průniku i s uzávěrem svého £i okolí U\ pro dostatečně malé £i. Označme si uzávěr této £i-koule U\ jako B\. Předpokládejme dále, že již jsou vybrány body z, a jejich otevřená £;-okolí Ui pro i — 1, ..., n. Protože je množina An+i otevřená a hustá v X, jistě existuje bod zn+\ 6 A„+i n U„, protože je ale A„+i n U„ otevřená, patří do ní bod zn+\ i s dostatečně malým £„+i okolím U„+i. Pak jistě také pro uzávěry platí Bn+\ — ř7„+i C U„ a tedy uzavřená množina Bn+\ je obsažena v A„+i n U„. Jistě přitom můžeme předpokládat i £„ < 1/n. Jestliže takto induktivně postupujeme od původního bodu zi a množiny B\, dostáváme neklesající posloupnost neprázdných uzavřených množin B„, jejichž průměr jde k nule. Existuje tedy společný bod z všech těchto množin, tj. z e n^f/i = n^Bi c n^An n u . což jsme chtěli dokázat. □ 7.22. Ohraničené a kompaktní množiny. Pro reálná čísla se nám osvědčily následující pojmy, které nám ulehčovaly vyjadřování. Pro metrické prostory je můžeme převzít skoro beze změn: ■T '~=t»-j_ Vnitřním bodem podmnožiny A v metrickém prostoru je takový prvek, který do A patří i s nějakým svým £-okolím. Hraniční bod množiny A je takový prvek x e X, jehož každé okolí má neprázdný průnik jak s A, tak s doplňkem X\A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A. Otevřené pokrytí množiny A je takový systém otevřených množin U i C X,i e I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny A rozumíme prvek a e A, který má v metrickém prostoru X £-okolí, jehož průnik s A je právě jednobodová množina {a}. 418 KAPITOLA 7. SPOJITÉ MODELY „v původním významu", právě když konverguje v metrickém prostoru K s metrikou d. Stejně tak platí, že posloupnost je cauchyovská v K vzhledem k běžné metrice právě tehdy, když je cauchyovská vzhledem k d. □ 7.25. Je metrický prostor 1; (b) ||/||0O = max{|/(x)|;xe[-l,l]} úplný? Řešení. Případ (a). Pro každé nei definujme funkci /„(*) = 0, x € [-1, 0), /„(*) = 1, x € [i, 1], fn(x) =nx, x e [0, i). Takto získaná funkční posloupnost {/„}„€n C n, m, n e N. Zabývejme se případnou limitou posloupnosti {/„} v n(s). Spojitá funkce / proto musí splňovat f(x) = 0, x € [-1, 0], f(x) = 1, x € [e, 1] pro libovolně malé e > 0. Tedy nutně f(x) = 0, x € [-1, 0], f(x) = 1, x € (0, 1]. Tato funkce však není spojitá na [—1, 1] - nepatří do uvažovaného metrického prostoru. Posloupnost {/„} tak nemá limitu v 0 (chcete-li, ke každému s/2) existuje n(s) e N, pro které platí e (7.29) max | fm(x) - fn(x) | < -, m, n > n(e). i€[-l,l] Z Zvláště tak pro každé x e [—1,1] dostáváme cauchyovskou číselnou posloupnost {f„(x)}neVj c K. Neboť metrický prostor K s běžnou metrikou je úplný, každá (pro x e [—1, 1]) posloupnost {/„(*)} je konvergentní. Označme f(x) := lim /„(*), x € [-1, 1]. Množina A prvků metrického prostoru se nazývá ohraničená nebo omezená, jestliže je její průměr konečný, tj. existuje kladné reálné číslo r takové, že d(x, y) < r pro všechny prvky x, y e A. V opačném případě je neohraničená nebo neomezená. Metrický prostor X se nazývá kompaktní, jestliže v něm má každá posloupnost x, e X podposloupnost konvergující k nějakému bodu x e X. U reálných čísel jsme si uváděli několik charakterizací kompaktnosti. U metrických prostorů to je o něco složitější s pojmem ohraničenosti. Pro libovolné podmnožiny A, B c X v metrickém prostoru X s metrikou d definujeme vzdálenost dist(A,B)= sup \d(x, y)\. x€A,y€b Je-li A = {x} jednobodová množina, hovoříme o vzdálenosti dist(x, B) bodu od množiny. Řekneme, že je metrický prostor X totálně omezený, jestliže ke každému kladnému číslu £ existuje konečná množina A taková, že dist(jc, A) < £ pro všechny body x e X. Připomeňme, že metrický prostor je omezený, jestliže má celé X konečný průměr. Je okamžitě vidět, že totálně omezený prostor je také omezený. Skutečně, průměr konečné množiny je vždy konečný a jeli A množina z definice totální omezenosti příslušná k £, pak vzdálenost dvou bodů d(x, ý) můžeme vždy shora odhadnout součtem dist(x, A), dist(y, A) a diam A, což je konečné číslo. V případě metriky na podmnožině konečněrozměrného euklidovského prostoru tyto pojmy splývají, neboť omezenost množiny zaručuje omezenost všech jednotlivých souřadnic v pevně vybrané ortonormální bázi a odtud již plyne i totální omezenost (ověřte si podrobně samostatně). Věta. Následující podmínky na metrický prostor X jsou ekvivalentní (1) X je kompaktní, (2) každé otevřené pokrytí X obsahuje konečné podpokrytí, (3) X je úplný a totálně omezený. Důkaz zde v detailech neuvádíme. Lze jej provést např. implikacemi (2) => (3), (3) => (1) a (1) => (2) a vcelku snadno jej lze dohledat v dostupné literatuře. Zastavíme se alespoň u prvního kroku, kde se zásadním způsobem objevuje pojem totální omezenosti. Je-li splněna druhá podmínka věty, pak je vcelku snadno vidět, že musí být prostor X totálně omezený. Skutečně, stačí si vybrat pokrytí X pomocí všech £-koulí se středy v bodech x e X. Z něho musí jít vybrat konečné pokrytí a množina středů x j koulí, které se v tomto konečném pokrytí vyskytují, již naplňuje podmínku z definice totální omezenosti. K důkazu implikace (2) =^ (3) ale ještě chybí důkaz úplnosti. 7.23. Kompaktnost na spojitých funkcích. Jako příklad odlišného chování pojmu kompaktnosti v euklidovských prostorech a v prostorech funkcích si uvedeme velice užitečné tvrzení známé pod jménem Arzelaova-Ascoliho věta. Říkáme, že jsou funkce / z nějaké množiny funkcí M na společném definičním oboru A rovnomocně spojité, jestliže pro každé x e A a každé kladné £ existuje (nezávisle na funkci /) 419 KAPITOLA 7. SPOJITÉ MODELY Lirnitním přechodem pro m —► oo v (||7.29||) obdržíme max | f (x) - fn(x) | < f < e, n > n (e). To ovšem znamená, že posloupnost {/„}„€n stejnoměrně konverguje kfunkci / na [—1, 1]. Jinak řečeno, {/„}„€n konvergujek / vzhledem k zadané normě. Již dříve jsme navíc zjistili, že stejnoměrnou limitou spojitých funkcí je funkce spojitá. Díky tomu nemusíme dokazovat, že / e 0, takové že pro všechna y z S-okolí bodu x bude d(f(y), /(*)) < e. Věta. Množina M c C[a, b] spjitých funkcí je kompaktní, právě když je omezená, uzavřená a rovnomocně spojitá. Důkaz zde nebudeme uvádět. Všimněte si rozdílu mezi použitou rovnomocnou a stejnoměrnou konvergencí! 7.24. Důkaz věty 7.8 o Fourierových řadách. Obecný kontext ■ i' ., metrik a konvergencí nám nyní umožní vrátit se k důkazu tvěty, ve které jsme dali částečný obrázek o bodové i jiné konvergenci Fourierových řad. Nejde nám přitom o nutné i podmínky konvergencia v literatuře lze najít mnoho jiných formulací. Naše věta 7.8 ale byla docela jednoduchá a postihla velké množství užitečných případů. Pro začátek si bude dobré uvědomit, jak se mohou lišit konvergence vůči různým Lp normám. Pro zjednodušení budeme vždy pracovat v zúplnění prostoru 5^! nebo Slc vzhledem k příslušné normě, aniž bychom dumali nad tím, o jaké přesně prostory jde (i když bychom je mohli popisovat docela snadno pomocí Kurzwei-lova integrálu). Hôlderova nerovnost (použitá na funkce / a konstantu 1) dává na čP [a, b] první z následujících odhadů l/p l/p kde p > 1 a l/p + l/q — 1, C > \f(x)\ na celém intervalu [a, b] (takové stejnoměrné omezení konstantou vždy existuje, když je / e čP [a, b]). Druhý odhad okamžitě plyne z odhadu \f(x)\P < CP-1 \f(x)\a vztahu 1 - l/p = l/q. Je tedy z prvního odhadu zjevné, že Lp-konvergence /„ —> / bude pro jakékoliv p > 1 vždy silnější než L i -konvergence (a drobně upraveným odhadem ukážeme i obdobné silnější tvrzení, že Lq konvergence je silnější než Lp konvergence, kdykolivjeg > p, zkuste si sami). Pro použití druhého odhadu ale musíme požadovat stejnoměrnou omezenost posloupnosti funkcí /„, tj. omezení funkcí /„ konstantou C musí být nezávislé na n. Pak totiž můžeme odhadnout | /„ (x) — f (x) \ < 2C a dostáváme z našeho odhadu, že Ll-konvergence je silnější než Lp-konvergence. Jsou tedy všechny Lp-normy na našem prostoru 5° [a, b] rovnocenné z hlediska konvergence stejnoměrně omezených posloupností funkcí. Nejtěžší (a také nejzajímavější) bude dokázat první tvrzení věty 7.8, které bývá v literatuře označováno jako Dirichletova podmínka (byla údajně odvozena již v roce 1824). Dokážeme proto nejprve, jak z této vlastnosti bodové konvergence vyplývají tvrzení (2) a (3) dokazované věty. Bez újmy na obecnosti můžeme předpokládat, že pracujeme na intervalu [—n, jt], tj. s periodou T —2ti. Jako první krok si připravíme jednoduché odhady pro koeficienty Fourierovy řady. Samozřejmý je odhad f \f(x)\dx < \a-b\lll(( \f(x)\"dx Ja \Ja < \a-b\x^Číq [j\f(x)\dx \a„ \ < i r * J-tí \f(x)\dx a totéž pro všechna bn, neboť jak cos(x), tak sin(x) jsou v absolutní hodnotě ohraničené jedničkou. Pokud je ale / spojitá funkce 420 KAPITOLA 7. SPOJITÉ MODELY 7.27. Dokažte, že metrický prostor h je úplný. Řešení. Uvažujme libovolnou cauchyovskou posloupnost {x„}„€n v prostoru h- Každým členem této posloupnosti je ovšem zase posloupnost, tj. xn = {x^}keVI, n e N. Poznamenejme, že samozrejmé nezáleží na rozsahu indexování - zda n, k e N, resp. n, k e N U {0}. Zavedme pomocné posloupnosti y k pro k e N tak, že Ä = [fk)nm = {4}„€N • Je-li [x„] cauchyovská v h, pak tím spíše musí být cauchyovská každá z posloupností yt v K (posloupnosti yt jsou posloupnostmi reálných čísel). Z úplnosti K (vzhledem k běžné metrice) plyne, že všechny posloupnosti y t jsou konvergentní. Jejich limity označme jako ik, k e N. Stačí nám dokázat, že z = [zkjkm £ h a že posloupnost {xn} konverguje pro n —► oo v h právě k posloupnosti z. Posloupnost {x„}nm C h je cauchyovská, a tak ke každému e > 0 existuje n (s) e N s vlastností, že 12 {An ~ Í) < e> m,n> n (e), m, n e N. Zvláště je i=l odkud limitním přechodem pro m —► oo lze obdržet ' 2 í e> ">n(f),n,leN, tj. (tentokráte / —► oo) (7.32) e (zt - 4) < e, n > n(e), n e N. i=l Speciálně máme co 2 X (z/t - xj) < oo, n > n(e), n € N i=l a současně co „ x (4) < °°> n e N> i=l což plyne přímo z {x„}„€N c Protože co co EM)< /Ezi-. E (4) . «eN t=i v t=i v fr=i E(^-4)2 = Efe-2zt4 + (4)2l, «6 i=l t=l L J N, musí být T.4 Tím jsme dokázali, že z e h- Skutečnost, že {xn} konverguje pro n —► oo k z v h, vyplývá z (||7.32||). □ v 51 [a, í>], můžeme integrovat per partes a dostaneme i z"1 a„(f) = — f (x) cos(nx)dx = * J-Tt 1 1 f =—[fix) sin(nx)]^--/ /'(x) sin(nx) dx = = --bn(f)- n Píšeme zde an (/) pro příslušný koeficient funkce / atd. Vidíme tedy, že čím „hladší" funkce, tím rychleji se blíží Fou-rierovy koeficienty k nule. Iterací této procedury skutečně dostaneme odhad pro funkce / v [—ti, ti] se spojitými derivacemi až do řádu k včetně: K(/)l < -^i- í \r+l\x)\dx n tt j a totéž pro bn(f). Jinak řečeno, pro dostatečně hladké funkce / jsou n^-násobky jejich Fourierových koeficientu an a bn ohraničeny L\-normou jejich k-té derivace /**'. Předpokládejme tedy, že máme spojitou funkci / v prostoru Sl [a, b], jejíž částečné součty Fourierovy řady bodově konvergují k /. Můžeme pak odhadnout co \sN(x)-f(x)\ = E (ak cos(kx) + bk sin(fcr)) k=N+l co < E tei+ i^i). k=N+l Pravou stranu můžeme dále odhadnout pomocí koeficientů a'n a b'n derivace /' (s použitím Hôlderovy nerovnosti pro Lp a Lq normy pro nekonečné řady s p = q = 2, viz 7.15, a Besselovy nerovnosti pro obecné Fourierovy řady. viz 7.5.(2)) \SN(x) - f(x)\ < CO ^ E TÍWk\ + \b'k\) k=N+\ / S > 0 definujeme funkci f s jako x/S pro \x\ < S a fs (x) = h(x) jinak. Zjevnějsou všechny funkce fs spojité, protože jsme bod nespojitosti překlenuli pomocí vhodné lineární funkce na intervalu, jehož velikost je kontrolována pomocí 8. Velmi jednoduše se spočte, že ||/; — /ä ||2 —> 0, neboť funkce / je omezená v absolutní hodnotě a tedy příspěvek integrace přes stále se zmenšující interval musí jít k nule. Zcela stejným způsobem můžeme ošetřit všechny body nespojitosti obecné funkce /, kterých je maximálně konečně mnoho a tedy jsou skutečně všechny uvažované funkce hromadnými body posloupností spojitých funkcí. Nyní je již náš důkaz jednoduchý, protože pro zadanou funkci / můžeme odhadnout vzdálenost od částečných součtů její Fou-rierovy řady pomocí spojitého přiblížení fs takto (všechny normy v tomto odstavci jsou L2 normy): 11/ -íjv(/)II < 11/ - Ml + IIA - íjv(/e)II + lkjv(/E) - íjv(/)II a jednotlivé sčítance napravo umíme kontrolovat. První z nich je nejvýše e, podle předpokladu o stejnoměrné konvergenci pro spojité funkce můžeme dosáhnout stejně malého ohraničení i druhého sčítance. U třetího je dobré si všimnout, že jde vlastně o velikost částečného součtu Fourierovy řady pro / — fs. Je tedy jistě \\f-fs-SN(f-fs)\\ < II/-/.II, a proto také (díky trojúhelníkové nerovnosti) lkiv(/-/E)ll < 2||/-Ml <2s. Celkem jsme tedy odhadli celou vzdálenost pro dostatečně blízké spojité funkce a dostatečně velká N číslem 4e. Tím je dokazovaná L2 konvergence potvrzena. 7.26. Dirichletovo jádro. A konečně se dáme do důkazu prvního ^ tvrzení věty 7.8. Přímo z definice Fourierovy řady F (i) funkce f (f) a s využitímjejího vyjádření s komplexní exponenciálou v 7.7 dostáváme pro částečné W součty s?/ (t) výraz 1 N fT/2 SN(t) = - T] / f(x)z-M*é"ktdx, kde T je základní perioda, se kterou pracujeme, a a> — 2n/T. Tento výraz můžeme přepsat jako fT/2 s n (i) = / KN(t -x)f(x)dx J-T/2 a funkci 1 N ,ky nazýváme Dirichletovo jádro. Všimněme si, že součet je částí geometrické řady s poměrem členů e'my. Můžeme ji tedy přímo vyjádřit pro všechna y Y 0 následujícím způsobem (po cestě násobíme čitatel i jmenovatel výrazem — e-'10^2, abychom uměli 422 KAPITOLA 7. SPOJITÉ MODELY prvku splývá s celým prostorem, pak znamená, že každá množina v (X, d) je ohraničená. (c) Znovu využijeme toho, že otevřené 1-okolí každého prvku obsahuje pouze tento prvek. Odsud vyplývá, že každý bod libovolné množiny je jejím vnitrním a současně izolovaným bodem a že žádná množina nemá ani jeden hraniční nebo hromadný bod. (d) Každá konečná množina v libovolném metrickém prostoru je zřejmě kompaktní (zadává kompaktní metrický prostor zúžením definičního oboru ď). Z popisu konvergentních posloupností (viz (a)) plyne, že žádná nekonečná množina nemůže být kompaktní v (X, ď). □ 7.30. Rozhodněte, zda je množina (nazývaná Hilbertova krychle) A = {{*n}n€N el2; \ xn | < i, n e N} kompaktní v h- Poté rozhodněte o kompaktnosti množiny B = {{x„}n(=t>í eloo; | x„ | < i, n e N} v prostoru lx. Řešení. Víme, že prostor h je úplný. Každá uzavřená podmnožina úplného metrického prostoru sama zadává úplný metrický prostor. Množina A je očividně uzavřená v h, a tak k její kompaktnosti stačí ukázat, že je totálně omezená. Vyjděme z nám dobře známého součtu oo - v -l — 2Í k=l Pro každé e > 0 tak existuje n(s) e N splňující oo 1 k=n(s) + \ Z každého z intervalů [—1/n, 1/n] pro n e {1, vybrat konečně mnoho bodů x\, x e [—1/n, 1/n] bylo ,n(s)} můžeme x^(n) tak, aby pro libovolné min x j€{l,...,m(n)) I J I •/¥ Uvažujme takové posloupnosti {v„}„€n z l2, jejichž členy s indexy n > n (e) jsou nulové a současně platí y\ e {x\ , Všech takových posloupností je konečně mnoho a tvoří e-síť pro A, neboť T + 52 + • • • + #r + f < e • 1 + f = e. Libovolnost e > 0 potom implikuje, že množina A je totálně omezená, což již dává její kompaktnost. Rozhodnout o kompaktnosti množiny B je velmi snadné. Každá kompaktní množina totiž musí být uzavřená, a to množina B není. Jejím uzávěrem je KN(y) = ^ _ Qicoy MN+l/2)coy přepsat následně pomocí reálné funkce sin): [ Q—iNcúy _ eí (N+\)coy Ť 1 T eic°y/2 — e~icoy/2 _ 1 ún((ú(N + 1/2) y) T sin(fc>y/2) V bodě y — 0 samozřejmé přímo vidíme K^(0) — j(2N + 1). Z posledního vyřazuje také vidět, že K^(y) je sudá funkce a pomocí LHospitalova pravidla přímo rychle spočteme, že je to funkce všude spojitá. Protože všechny částečné součty řady pro konstantní funkci f(x) = 1 jsou 1, dostáváme přímo z definice Dirichletova jádra fT/2 / KN(x)dx = 1. J-T/2 U periodických funkcí jsou jejich integrály přes intervaly délky periody nezávislé na volbě krajních bodů intervalu integrace. Proto můžeme pomocí změny souřadnic použít pro částečné součty též výraz fT/2 sn (x) = / KN (ý) f (x + y) dy. J-T/2 Teď konečně máme vše připraveno. Nejprve se budeme věnovat případu, kdy je funkce / v bodě x spojitá a diferencovatelná. Chceme pro tento případ dokázat, že Fourierova řada F(x) v bodě x konverguje k hodnotě f(x). Dostáváme fT/2 SN (x) - f{x) = (f(x+y)- f(x))KN (y) dy. J-T/2 Integrovaný výraz můžeme přepsat do tvaru, který bude připomínat opět Fourierovy koeficienty pro vhodné funkce: /(* + y) - m sin((AT + l/2)íuy) sin(fc>y/2) — y/2) pro y 0, zatímco ^(0) = f'(x). Všimněme si, že pro tento krok jsme potřebovali diferencovatelnost a spojitost / v bodě x. Nyní ale můžeme skutečně chápat rozdíl s^(x) — f(x) jako součet Fourierových koeficientů ftjvOW ^aNÍÝ2), kde T T Ýl(y) = j^(y)cos(»y/2), f2(y) = —yl2). To ale znamená, že s rostoucím N nutně tento výraz bNÍÝl + aNÍÝ2) konverguje k nule (viz 7.5.(2)). Závěrem se podíváme na konvergenci v případě, že v bodě x — 0 má funkce / nebo její derivace bod nespojitosti. Protože jde o funkci v S1, je v okolních bodech mimo x — 0 již spojitá a diferencovatelná. Rozložme si funkci / na její sudou část f\ a Uchou část f2, tj. f(x) = l-(f(x) + f(-x)) + l-(f(x) - f(-x)). 423 KAPITOLA 7. SPOJITÉ MODELY B = {{x„}„eF) € /oo; \xn | < i, n € N} . Množina B pak je kompaktní. Důkaz je výrazně jednodušší než pro množinu A, a proto jej přenecháváme čtenáři jako cvičení. □ D. Integrální operátory Konvoluce je jedním z nástrojů k vyhlazování funkcí. Zkusme spočítat konvoluci dvou funkcí, které mají obě konečný nosič (nosič je množina čísel, ve kterých je hodnota funkce nenulová). 7.31. Určete konvoluci f\ * f2, kde ň(x) -- fl(x) -- 1 - x2 pro x e [-1,1], 0 jinak, x pro x e [0,1], 0 jinak. Řešení. Hodnota konvoluce f\ * f2 v bodě / je dána integrálem přes všechna reálná čísla ze součinu funkce f\ (x) a funkce f2(t — x) podle proměnné* (viz 7.13). Je tedy tato hodnota nulová, jestliže je alespoň jedna z hodnot fi(x) a. f2(t — x) nulová pro libovolné reálné x. Obráceně hodnota konvoluce může být v bodě / nenulová, pouze pokud existují taková x, pro která f\ (x) ^ 0 ^ f2(t — x). Podle definice daných funkcí je to tehdy, pokud existují taková x e [—1,1] (fi(x) ^ 0), že (t - x) e [0, 1] (f2(t - x) ^ 0). Neboli f\ * f2(t) může být nenulové pokud [/ - 1, t + 1] n [0,1] ^ 0. To nastává pro r e [-1,2]. Integrujeme pak přes x náležící průniku intervalů [/ — 1, / +1] a [0,1]. Tento průnik se dále liší v závislosti na / e [—1,2]: a) pro r e [-1,0] je [/ - 1,/ + 1] n [0,1] = [0,/ + 1], b) pro t e [0,1] je [t - 1, t + 1] n [0, 1] = [0, 1], c) pro r e [1,2] je [t - l,t + 1] n [0,1] = [t - 1,1]. V závislosti od průniku těchto intervalů je potom: a) J —C fi(x)fi(t -x) dx t-t+i Jo í ( (1 - x )(t - x)dx fi(x)fi(t -x) dx 1 4 2 2 1 —r +r + -t —, 12 3 4 b) /CO p 1 Mx)f2(t-x)= / Mx)f2(t-x) -CO JO ľ 2 1 / (1 - x2)^ - x)dx = -t-- Jo 3 4 i (lim f(y)+ lim f (y)). 1 V=-0+ y->0_ V bodě x — 0 přitom definujeme hodnotu f\ (0) jako ŠI Pak se snadno přesvědčíme, že sudá část f\ (x) je spojitá a diferencovatelná v bodě x — 0 (díky tomu, že jednostranné limity existují) a tedy i na celém okolí tohoto bodu. Zároveň nás nepřekvapí, že lichá část splňuje /2(0) = 0 a stejně tak je v nule nulová i Fourierova řada, ve které jsou pouze členy se sin(nú)x). Můžeme proto využít předchozího spojitého případu a spočíst pro Fourierovu řadu F(x) naší funkce / F(0) = Fi(0) + F2(0) = I( lim f(y) + lim /(v)) + 0, což jsme chtěli dokázat. V případě nespojitosti v obecném bodě můžeme postupovat obdobně a celý důkaz dirichletovy podmínky je ukončen (a tím i důkaz tvrzení (2) a (3) věty 7.8, v jejichž důkazech jsme předpokládali správnost Dirichletovy podmínky). 3. Integrální operátory 7.27. Integrální operátory. V případě konečněrozměrných vek--p.. torových prostorů jsme mohli vnímat vektory jako ■"tŽTyýf' zobrazení z konečné množiny pevně zvolených gene-rátorů do prostoru souřadnic. Sčítání vektorů a náso-— bení vektorů skaláry pak bylo dáno odpovídajícími operacemi s takovými funkcemi. Stejným způsobem jsme pak pracovali i s vektorovými prostory funkcí jedné reálné proměnné, když jejich hodnotami byly skaláry (nebo případně i vektory). Nejjednodušší lineární zobrazení a mezi vektorovými prostory zobrazovala vektory do skalárů (tzv. lineární formy). Byla definována jako součet součinů souřadnic x j vektorů s pevně zvolenými hodnotami a, = a(e,-) na generátorech e,-, tj. pomocí jednořádkových matic: (xi, ,xny ,an) ■ (x\, ,xny Složitější zobrazení s hodnotami opět v tom samém prostoru pak byla obdobně zadána čtvercovými maticemi. Velice podobně umíme přistoupit k lineárním operacím na prostorech funkcí. Budeme chvíli pro jednoduchost pracovat s reálným vektorovým prostorem S všech po částech spojitých reálných funkcí s kompaktním nosičem definovaných na celém M nebo na intervalu / = [a,b]. Lineárním zobrazením S —> M budeme říkat (reálné) lineárnífunkcionály. Příklady takových funkcionálů můžeme velmi snadno zadat dvěma způsoby — pomocí vyčíslení funkce (případně jejích derivací) v jednotlivých pevně zvolených bodech nebo pomocí integrování. Příkladem funkcionálů L tedy může být vyčíslení v jediném pevném bodě xq e I L(f) = f(x0) a příklad s integrováním může být zadán pomocí pevně zvolené funkce g(x) L L(f)= / f(x)g(x)dx. Funkce g(x) zde hraje roli váhy, se kterou při definici Riemannova integrálu bereme jednotlivé hodnoty reprezentující funkci f (x). Nejjednodušším příkladem takového funkcionálů je samozřejmě Riemannův integrál samotný, tj. případ s g (x) = 1 pro všechny body x. 424 KAPITOLA 7. SPOJITÉ MODELY c) Dobrou představu dává volba funkce /CO p 1 Mx)f2(t-x)= / Mx)f2(t-x) -co Jt-\ -i (1 - x2)^ - x)áx = —ŕ - t2 + -t. 12 3 Celkem tak dostáváme: '-T2*4 + t2 + fř - i prore[-l,0], /l * /2(*) = 3' 4 n'4 ~ ^ + 3ř 0 pro t e [0, 1], pro t e [1, 2] jinak. 7.32. Určete konvoluci f\ * f2, kde 1 x \x pro x € [—1, 1] 0 jinak /2« pro x ^ 0 Řešení. Hodnota konvoluce v bodě / je dána integrálem J^oo Mx)Mf — x) dx. Integrovaná funkce je nenulová pokud je druhý z činitelů nenulový, tedy pokud (t — x) e [—1,1], tj. x € [/ — 1, / + 1]. Hodnotu konvoluce v bodě / tak můžeme interpretovat jako integrální průměr funkce f\ přes interval (/ — 1, / + 1). Při integrování přes tento interval musíme rozlišit, náleží-li číslo 0 tomuto intervalu, či nikoliv. V případě, že interval nulu obsahuje, tak musíme integrál rozdělit na dva integrály. Jeden bude typu J"a 1 jxdx a ten je jakožto integrál ve smyslu Cauchovy hlavní hodnoty nulový (intuitivně je plocha vymezená křivkou 1 j x pro x e (—a, a) středově symetrická podle nuly, integrál jakožto plocha pod křivkou by měl být nulový). Zbude integrál ^ dx (rozmyslete si, že předpis funguje i pro záporné /)• Dostáváme tak: J*l l- dx = ln |£f | pro t € (-oo, -1] U [1, oo], |11+íidx = ln||±í| pro r e [-1,1]. □ 7.33. Určete konvoluci f\ * f2 funkcí ň --h -- 1 — x pro x € [—2, 1], O jinak, 1 pro x e [0,1], O jinak. 8(x): O je-li |*| > £, A je-li |*| < £. pro jakákoliv £ > 0. Integrál funkce g přes M je jednotkový a náš lineární funkcionál můžeme vnímat jako (rovnoměrné) zprůměro-vání hodnot funkce / přes £-okolí počátku. Obdobně můžeme pracovat s funkcí g(x) = 0 je-li |*| > £ je-li |*| < £ se kterou jsme se setkali v odstavci 6.6 na straně 6.6. To je funkce hladká na celém R s kompaktním nosičem v intervalu (—e, £).Náš funkcionál má tentokrát význam vážené kombinace hodnot, tentokrát však bereme rychle se zmenšující váhy jednotlivých argumentů se vzrůstající vzdáleností od počátku. Jistě má g konečný integrál přes celé R, nebude to ale jednička. Vydělením g tímto integrálem bychom opět obdrželi funkcionál, který bude mít význam nerovnoměrného proměřování dané funkce /. Jiný velice obvyklý příklad je tzv. Gaussova funkce g(*) = -e-*2, 71 což je funkce opět s jedničkovým integrálem přes celé R (což časem také ukážeme), tentokrát mají všechny argumenty * v příslušném „průměru" nenulovou váhu, byť s rostoucí vzdáleností od počátku velmi rychle zanedbatelně malou. Další takový příklad s jedničkovým integrálem přes celé R jsme viděli před chvílí při diskusi Dirichletových jader g(x) — K n (*) u Fourierových řad. 7.28. Konvoluce funkcí. Integrální funkcionály z předchozího odstavce můžeme lehce modifikovat, abychom obdrželi „rozmlžené zprůměrovánf' hodnot funkce / kolem daného bodu y e R: Ly(f) ľ f(x)g(y - x)dx Konvoluce funkcí jedné reálné proměnné Volný parametr y v naší definici funkcionálu Ly(f) může být vnímán jako nová nezávislá proměnná a naše operace Ly tedy ve skutečnosti zobrazuje funkce opět na funkce / i-> f: /oo f(x)g(y-x)dx. -oo Této operaci se říká konvoluce funkcí f a g, značíme ji f * g. Budeme s konvoluci většinou používat pro reálné nebo komplexní funkce na R s kompaktním nosičem. Pomocí transformace t — z — * se snadno spočte (f*g)(z) = ľ f(x)g(z -x)dx = f •/co f(z-t)g(t)dt = (g*f)(z). O Je tedy konvoluce coby binární operace * : $c x $c —> $c 425 KAPITOLA 7. SPOJITÉ MODELY 7.34. Nalezněte Fourierovu transformaci J-~(f) = f funkce /(r)=sgnr, r e (-1,1); /(/) = 0, iel\(-l,l), tj. /(O) = 0, f (t) = 1 pro t e (0, 1) a f (i) = -1 pro t e (-1, 0). Řešení. Fourierova transformace uvedené funkce je oo W^ = 7t / f(t)e-"»dt = —oo 1 = J sgn / [cos (dj/) — i sin (oj/) ] dt. Protože součin dvou lichých funkcí je sudá funkce, součin sudé a liché je lichá funkce a protože integrál liché funkce přes interval [—1, 1] je 0 (pokud tento integrál existuje) a integrál sudé funkce přes interval [—1, 1] je roven dvojnásobku integrálu přes [0, 1], dostáváme dále Hf)(u) 2 f —i sin (cot) dt o 2i_ [cos(tot) "I1 L - Jo Kdybychom přímo využili známé vyjádření Fourierovy transformace liché funkce /, snadněji bychom obdrželi oo 1 T(f)(co) = -#= / /(/) sin (cot) dt = t=f sin (cot) dt = ■ ■ ■ = □ 7.35. Vyřešte integrální rovnici oo / f(x) sin (xt) dt x > 0 pro neznámou funkci /. Řešení. Pokud obě strany rovnice vynásobíme číslem *J2/jt, obdržíme na levé straně právě sinovou Fourierovu transformaci. Stačí tedy aplikovat na rovnici inverzní transformaci. Takto dostaneme oo f(t) = 2. J e.-J sin (xt) dx, t > 0. o Dvojnásobným použitím metody per partes pak lze spočítat f e-* sin (xt) dx = = [— sin (xt) — t cos (xt) ] + C, a tudíž je oo f e-* sin (xt) dx = o Mm (jgr [- sin (xt) - t cos (xt) ]) - & (-/) = j^t-Řešením rovnice je proto funkce /(0 = IttV' '>o. □ 7.36. Popište Fourierovu transformaci J-~(f) funkce f(t) = e-"ř, (gR, kde a > 0. Řešení. Naším úkolem je vypočítat Hf)(o>) i -at2 na dvojicích funkcí s kompaktními nosiči komutativní. Stejně tak můžeme konvoluce uvažovat s pomocí integrace přes konečný interval, musíme se jen postarat o to, aby byly dobře definovány funkce, které v nich vystupují. Zejména je to tedy dobře možné u periodických funkcí a integrování přes interval délky periody. Konvoluce je mimořádně užitečný nástroj pro modelování způsobu, jak pozorujeme data měřená v experimentu nebo jak se projevuje prostředí při přenosu informací (např. analogový audio nebo video signál ovlivňovaný šumy apod.). Argument / je přenášenou informací, funkce g je volena tak, aby co nejlépe vystihovala vlivy prostředí či zvoleného technického postupu při zpracovávání signálu, resp. jakýchkoliv dat. 7.29. Gibbsův efekt. Jeden velmi užitečný případ konvoluce jsme vlastně již viděli dříve. V odstavci 7.26 jsme interpretovali částečný součet Fourierovy řady pro funkci / jako konvoluci s Dirichletových jádrem T (2 iwky KN(y) = 2Z_T/2e' Tato interpretace umožňuje také vysvětlit tzv. Gibbsův jev zmíněný v odstavci 7.9. Jestliže totiž máme možnost předem omezit/odhadnout rozložení vah kolem nuly a zároveň víme, že je funkce / ohraničená, lze vcelku snadno odvodit, do jaké míry je efekt konvoluce na na funkci / lokální. Pomocí takového odhadu lokálnosti konvoluce lze totiž ověřit, že se konvoluce s Dirchleto-vými jádry budou kolem skoku chovat obdobně jako je tomu u skokové funkce z odstavce 7.9 a pro ni lze snadno spočíst pozorovaný efekt explicitně. Nebudeme tu uvádět podrobnosti, čtenář může buď dohledat jinde nebo si provést sám jako netriviální cvičení. 7.30. Fourierova transformace. Konvoluce jsou jedním z mnoha případů obecných integrálních operátorů na prostorech funkcí ve tvaru L(f)(y) ■- f f (x)k(y, x) dx. Funkce k (y, x) závislá na dvou proměnných, se nazývá jádro integrálního operátoru L. Definiční obor takových funkcionářů je nutné volit s ohledem na vlastnosti jádra tak, aby vždy existoval použitý integrál. Teorie integrálních operátorů s jádry a rovnic, které je obsahují, je velice užitečná a zajímavá zároveň, bohužel pro ni zde teď ale nemáme dost prostoru. Zaměříme se alespoň na jeden mimořádně důležitý případ, tzv. Fourierovu transformaci T, která úzce souvisí s Fourierovými řadami. Připomeňme, že funkce f (i), která je dána svojí konvergující Fourierovou řadou, je rovna 1 dt. kde c„ jsou komplexní Fourierovy koeficienty, o>n — nlrc/T se základní periodou T, viz odstavec 7.7. Při pevně zvoleném T vyjadřuje výraz Aa) = 2jt/T právě změnu ve frekvenci způsobenou nárůstem n o jedničku. Je to tedy právě diskrétní krok, se kterým při výpočtu koeficientů Fourierovy 426 KAPITOLA 7. SPOJITÉ MODELY Derivování (podle co) a poté užití metody per partes (pro F' = -ite-a,2,G = e-i£0í)dává CO CF(/)(„ pro všechna n e Z jako vyjí1 ., brané reprezentanty pro malé intervaly [a>n, a>n+\\ o délce Aú). Pak náš výraz ve vnitřní velké závorce v posledním vztahu pro f (i) ve skutečnosti vyjadřuje sčítance Rieman-nových součtů pro nevlastní integrál 1 f00 — / g(co)eMdco 271 J-co kde g(oJ) je funkce nabývající v bodech a>n hodnoty fT/2 g(">n) ■- -T/2 f (x) e' dx. Pracujeme s po částech spojitými funkcemi s kompaktním nosičem, proto je naše funkce / integrovatelná v absolutní hodnotě přes celé R. Limitním přechodem T -» 00 dojde ke zjemňování normy Aa> našich dělících intervalů v Riemannově součtu. Zároveň se dostaneme v posledním výrazu k integrálu ľ f (x) e' dx. Předchozí úvahy ukazují, že pro docela velkou množinu "ÉL -« Riemannovsky integrovatelných funkcí / na R ^-í^^ umíme zadefinovat dvojici vzájemně inverzních ". - * • integrálních operátorů: l- fourierova transformace Pro každou po částech spojitou reálnou nebo kompaktní funkci / na R s kompaktním nosičem definujeme HfKo>) = /(«) = l ľ° J2Ť1 J-c f We- rft. Této funkci / říkáme Fourierova transformace funkce /. Předchozí úvahy ukazují, že bude také platit f(f)=F-l(f)(t): 1 r \Í2k J-c fifů) e'0" dm. Tím říkáme, že k právě definované Fourierově transformaci T existuj e inverzní operace J7-1, které říkáme inverzní Fourierova transformace. Všimněme si, že Fourierova transformace a její inverze jsou integrální operátory se skoro shodným jádrem k(a>, t) = e±ia" . Samozřejmě tyto transformace mají smysl pro mnohem větší definiční obory, zájemce odkazujeme na speciální literaturu. 427 KAPITOLA 7. SPOJITÉ MODELY Jestliže použijeme substituci, kdy nahradíme — co za co v integrálu přes interval (—oo, 0], získáme fit) j_ 2ir j sinjs e-i£0í dw+J sin cu „íwí 2jť / Ž!ffir [cos (^o ~~ 1 sm (^o + cos i0**) + 1 sm (wt) ] ^ : I r< Tí J 0 cos (cot) dco. Poznamenejme, že předchozí vyjádření lze obdržet už z toho, že funkce y = s maximálním definičním oborem je sudá. Pomocí identity sin* • cos (xy) = | (sin [x(l + )>)] + sin [x(l — v)]), ijeR, která mj. vyplývá ze součtových vzorců (pro sinus), dostáváme fit) 2ir sin[m(l+t)] dco + f sinMl-Q] dco \0 o Substituce u = co(l + t), v = co (1 — t) potom dávají f(') = ^(fĚlřdu-f^dv 0, t > 1; f(') = ^[fĚirdu + f^dv) =±f^du, /€(-!,!) : 0, t < -1. /« = á (-f^du + f^dv \ 0 0 / Dokázali jsme tak, že funkce / je nulová pro \ t\ > la konstantní (nutně nenulová) pro \ t\ < 1. (Po celou dobu předpokládáme, že inverzní Fourierova transformace existuje.) Určeme funkční hodnotu /(O). Pro funkci g(/) = i, M<1; g(t) = o, \t\>i platí ' dt 2 2 sin o = f cos (coť) dt -1 o Odtud plyne, že /(O) = g(0)/2 = 1/2. Ještě vyzdvihněme vyčíslení integrálu ■) u 2 0 které jsme rovněž obdrželi. E. Laplaceova transformace 7.38. Stanovte Laplaceovu transformaci C(f)(s) funkce (a) /(/) = ď'; (b) /(/) =ciea" + c2e'J2í; (c) /(r) = cos (fa); (d) /(r) = sin (fa); (e) /(/) = cosh (fa); (f) /(r)=sinh(fa), □ 7.31. Jednoduché vlastnosti. Fourierova transformace zajímavým způsobem převrací lokální a globální chování funkcí. Začněme jednoduchým příkladem, ve kterém najdeme funkci f (i), která se transformuje na charakteristickou funkci intervalu [-Si, Si], tj. f (co) = 0 pro \ců\ > Si a / = 1 pro \co\ < Si. Inverzní transformace J7-1 nám dává f(f) i ŕ j2ťž J-í dco ■ 1 1 -(e'^-e-'"')^ \2jzt 2i _ 2Si sin(ňř) ~~ V2ŤŤ Í2ř Až na konstantní násobek a škálování proměnné, jde tedy o velice důležitou funkci sine (je) = Přímým výpočtem limity v nule (LHospitalovo pravidlo) spočteme, že /(O) = 2Si(2iz)~1/2, nejbližší nulové body jsou v t = ±Ti/ Si a funkce poměrně rychle klesá k nule mimo počátek x — 0. Na obrázku je tato funkce znázorněná rozvlněnou křivkou pro Si — 20. Zároveň je vynesena křivkou oblast, ve které se s rostoucím Si naše funkce f (i) stále vlní. Omega - 20.000 Vidíme, že charakteristická funkce intervalu [—Si, Si] přechází Fourierovou transformací na funkci /, která má velmi výraznou kladnou hodnotu v malém okolí nuly, přičemž hodnota v nule je pevným násobkem Si. Čím je tedy Si větší, tím více se soustředí / do okolí počátku. Dále si spočteme Fourierovu transformaci derivace f'(i) pro nějakou funkci /. Stále předpokládáme, že / má kompaktní nosič, tj, zejména T{f') i T(f) skutečně existují. Počítejme metodou per partes: 1 f00 F(f'Xco) = -= / /'(r)e-,£0í dt = V27T J co 1 ico ľ °° = -75= te -imt /(ř)] -» + -75= / /(ř) e~i£oí dt = = io>T(f){o>). Vidíme tedy, že Fourierova transformace převádí (limitní) operaci derivování na (algebraickou) operaci prostého násobení proměnnou. Samozřejmě můžeme tento vzorec iterovat a dostáváme Hf"Xo>) ■ -o?T(f), Hf< dt = o o = lim (s±±\ - = _L Případ (b). Pomocí výsledku varianty (a) a linearity nevlastního integrálu dostáváme £2_ + te-ib>) e-« A = ^ + ^ = Případy (d), (e), (f). Analogicky volby (d) ci = —1/2, c2 = i/2, fli = ib, a2 = —ib; (e) ci = 1/2 = c2, fli = b,a2 = —b; (f) ci = 1/2, c2 = —1/2, fli = b, a2 = —b vedou na (d) £(/)(í) = ^; (e) £(/)(í) = ^; (f) £(/)(í)--^ 2_62- 7.39. Pomocí vztahu (7.34) £ (/') (í) = í £ (/) (í) - lim /(/) odvodte Laplaceovy transformace funkcí y = cos / a y = sin t. Řešení. Nejprve si uvědomme, že z (||7.34||) plyne £(/")(í) = í£(/')(í)- i™ /'(/) = = s (sC(f) (í) - lim /(/)) - lim /'(/) = □ :ä2£(/)(í)-í lim /(/) - lim /'(/). Platí tedy -£ (sin/) (í) = £ (- sin/) (í) = £ ((sin/)") (s) = = s2 £ (sin /) (í) — í lim sin / — lim cos t = s2 £ (sin /) (s) — 1, odkud dostáváme -£ (siní) (s) = s2C (sin/) (s) - 1, tj. £ (sin/) (s) = 7.32. Vztah ke konvolucím. Další mimořádně důležitou vlastností je vztah mezi konvolucemi a Fourierovou transformací. Spočtěme, jak dopadne transformace konvoluce h = / * g, kde opět pro jednoduchost předpokládáme, že funkce mají kompaktní nosiče. Při výpočtu prohodíme pořadí integrování, což je krok, který ověříme teprve v diferenciálním a integrálním počtu později, viz 8.28. V dalším krůčku pak zavedeme substituci t — x — u. F(h)(co) = -L C ( r f(x)g(t - x) dx) e-i£0í dt = vztt J-Co\J-co J i= r /(*>( r g(.t-x)e-iM dt) dx= 2tt J-co \J-co / 1= í f(x)( í g(M)e-it0 du\áx = 7.7í J-co \J-co / )=(f°° /W^ dx) ■ (jT g(u)^" du] = 2^J-(/) • F(g) Podobný výpočet ukazuje i obrácené tvrzení, že Fourierova transformace součinu je, až na konstantu, konvoluce transformací. tu ■ g) = -4=hd * Hgy Jak jsme si uváděli výše, konvoluce / *g velice často modeluje proces našeho pozorovaní nějaké sledované veličiny /. Pomoci Fou-rierovy transformace a její inverze nyní můžeme snadno rozpoznat původní hodnoty této veličiny, pokud známe konvoluční jádro g. Prostě spočteme T(f * g) a podělíme obrazem T(g). Tak získáme Fourierovu transformaci původní funkce /, kterou obdržíme explicitně pomocí inverzní Fourierovy transformace. Hovoříme o de-konvoluci. 7.33. Diracova delta-funkce. Vraťme se nyní ještě k prvnímu příkladu s inverzní transformací k charakteristické funkci fa intervalu [—Q, Q]. Zkusme provést limitní přechod pro Q jdoucí k nekonečnu a označme V2Ťi8(ť) kýženou limitní „funkci" pro (fsi)(t)- Inverzní obraz součinu s libovolným obrazem Tig) umíme vyjádřit pomocí konvoluce: 1 T00 J^1 (fa ■ Hg))(.z) = -t= / g(i)J^1 yJZJÍ J—co (faKz - i) dt. Při limitním přechodu Q —> oo přejde výraz nalevo k hodnotě J-^1 (Jr(g))(z) = g(z), zatímco napravo dostáváme g(z)-- r g(t)S(z - i)dt. Naše hledaná S(i) tedy vypadá na „funkci", která je všude nulová, kromě jediného bodu t — 0, kde je tak „nekonečná", že integrováním jejího součinu s libovolnou integrovatelnou funkcí g dostaneme právě hodnotu g v bodě t — 0. Není to samozřejmě funkce v našem smyslu, nicméně jde o objekt často používaný. Říká sejí Diracova funkce S a korektněji lze popsat jako tzv. distribuci. Z nedostatku času nebudeme distribuce podrobněji rozebírat a omezíme se na konstatování, že si lze dobře Diracovo S představit jako jednotkový impulz v jediném bodě. Fourierova transformace jej pak pretransformuje na konstantní funkci Jr(S)(a>) — —js=. 429 KAPITOLA 7. SPOJITÉ MODELY Nyní užitím vzorce (||7.34||) snadno určime L (cos/) (s) = L ((sin/)') is) = s -^rn ~ 1™ sin / = -é-r . □ 7.40. Pro s > — 1 spočtěte Laplaceovu transformaci C (g) (s) funkce g{t) = t e"' a pro s > 1 Laplaceovu transformaci C (h) is) funkce hit) = t sinh/. Řešení. Užitím metody per partes získáváme co co . , £ (g) (s) = J t e-' e-sí dt = J t e-) : (8(n - a) +8(n + «)), což můžeme docela snadno vidět výpočtem Fourierovy transformace funkce fa cos(nx) a následným limitním přechodem Q -» oo. Obdobně dostaneme Fourierovu transformaci pro funkci sinus, můžeme pro to využít také skutečnost, že transformace derivace této funkce se bude lišit jen o násobek imaginární jednotkou a proměnnou. Tyto transformace jsou základem Fourierovy analýzy signálů. Jestliže totiž signál je čistou sinusoidou na dané frekvenci, pak to pomocí Fourierovy transformace identifikujeme jako dva bodové impulzy právě v kladné a záporné hodnotě frekvence. Pokud je signál lineární kombinací několika takových čistých signálů, dostaneme stejnou lineární kombinaci bodových impulzů. Protože ale vždycky zpracováváme signál jen v nějakém konečném časovém intervalu, dostáváme ve skutečnosti místo bodových impulzů rozvlněnou křivku podobnou funkci sine s výrazným maximem právě v hodnotě příslušné frekvence. Z velikosti tohoto maxima přitom umíme také přímo vyčíst původní amplitudu signálu. 7.34. Fourierova sinová a cosinová transformace. Pokud použijeme Fourierovu transformaci na lichou funkci f {i), tj. /(—i) = —fit), příspěvek integrace součinu f(t) a funkce cos(±fc)ř) se pro kladná a záporná t vyruší. Dostaneme proto přímým výpočtem Hf)(o>) ■- -n r V2ŤŽ Jo fit) sin (ůt dt. Výsledná funkce je opět lichá, proto ze stejného důvodu i inverzní transformaci lze spočíst obdobně: Fif)ia>) = —= \ fit) sin »r dt. y/2n Jo Vynecháním imaginární jednotky i dostáváme vzájemně inverzní transformace, kterým se říká Fourierova sinusová transformace pro liché funkce: fsi«>) = fit) = r Jo 2 r x Jo fit) sin(fc)ř) dt, f s (ŕ) sin(fc)ř) dt. □ Obdobně se definuje Fourierova kosinusová transformace pro sudé funkce: Í2 f00 fcioi) = J — I fit) cos(fc)ř) dt, V 71 Jo Í2 f°° -fit) —\ — I fsit) sinfcií dt. V n J0 7.35. Laplaceova transformace. Fourierovu transformaci nelze dobře využít pro funkce, které nejsou integrovatelné v absolutní hodnotě přes celé R (minimálně nedostáváme opravdové funkce). 430 KAPITOLA 7. SPOJITÉ MODELY 7.42. Nalezněte Laplaceovu transformaci Heavisideovy funkce H (/) a posunuté Heavisideovy funkce Ha(t) = Hit — a): 0 pro / < 0, H(t) = { \ pro / = 0, 1 pro / > 0. Řešení. L(H{t))(s) /•CO /*CO / H(t)e-St dt = / e-st dt Jo Jo 4(o-i) = i £{H{t - a)){s) ľ Jo Hit - a)e-st dt ■■ /» CO /*CO / e~st dt = / e-s dt = f(t)e = fit + a)e-s 1. Vektor reprezentující data pak ortogonálně rozložíme a některé bázové vektory (sloupce matice C) vypustíme. Tím je provedena redukce dat s rozumnou aproximací původních dat. Zpětná transformace je jednoduchá. Protože je C ortogonální, je dána násobením transponovanou maticí. Ukažte, že pro n = 2 je matice C rovna -j- ^ a že je ortogonální. Spočítejte ortogonální rozklad vektoru (3,4) vzhledem k bázi tvořené sloupci matice a určete vlastní čísla a vlastní vektory. Laplaceova transformace se chová docela podobně jako Fourie-rova a tuto vadu nemá: Cif)is) = fis) ■- ľ Jo /(ř)e-sí dt. Integrální operátor C má velice rychle se zmenšující jádro, pokud je s kladné reálné číslo. Obvykle proto Laplaceovu transformaci chápeme jako zobrazení vhodných funkcí na intervalu [0, od) do funkcí na témž nebo menším intervalu. Obraz C(p) bude existovat například pro každý polynom p (i) a všechna kladná s. Obdobně jako pro Fourierovu transformaci dostaneme prostým výpočtem per partes vztah pro Laplaceovu transformaci derivované funkce při s > 0: /■oo Cif'it))is) = / /'(ř)e-sí dt = Jo poo = [/«e-sí]g°+W /(t)e-"dt = Jo = -fi0) + sCif)is). Vlastnosti Laplaceovy transformace a řadu dalších zejména v technické praxi používaných transformací je možné snadno dohledat v literatuře. 7.36. Diskrétní Fourierovy transformace. Fourierova analýza signálů naznačená v předchozím odstavci byla dříve např. v radiotechnice realizována pomocí speciálních analogových obvodů. Dnes při zpracování signálů pomocí počítačových obvodů pracujeme pouze s diskrétními daty. Předpokládáme, že v (diskrétní) časové proměnné je dán nějaký pevný (malinký) vzorkovací interval r a že se naše vzorkovací signály opakují s periodou N r (pro hodně veliké přirozené N), což je maximální perioda zachytitelná v našem diskrétním modelu). Jistě nás nepřekvapí, že diskrétní aproximací našich spojitých metod dostaneme velmi podobně účinné nástroje. Budeme pracovat s W-rozměrným vektorem, který si můžeme představit jako funkci r i-> f (r) e C pro r = 0, 1, ..., N — 1. Označme si Aa> — ^ a a>k ~ kAa>. Diskrétní přiblížení integrálu z definice Fourierovy transformace napovídá, že definice 1 povede na transformaci / i-> f, pro kterou bychom mohli zkusit napsat něco blízkého inverzní transformaci pomocí vztahu /(*)= E/f/K' Ve skutečnosti dostáváme skutečně dvě vzájemně inverzní transformace: Věta. Pro výše definované transformace platí f (k) — f (k) pro všechna k — 0, 1, ..., N — 1. Důkaz. Důkaz je založen na jednoduchém lemmatu, které přesně vyjadřuje naši (již ve spojitém případě používanou) intuici, že sčítání hodnot e"™' se vzájemně úplně vyruší, pokud není 431 KAPITOLA 7. SPOJITÉ MODELY Řešení. Počítejme 1/1 1 Wl 1 \ _ 1 (2 0 2 U -1 j ' U -lj " 2 U 2 CC Matice C je tedy ortogonální a její sloupce tvoří ortonormální bázi e\ = (/pi' e2 = (75' — TI-*' Koeficienty ortogonálního rozkladu vektoru u = (3, 4) dostaneme jednoduše použitím transponované ma- Ortogonální rozklad má tedy následující tvar 1 Charakteristický polynom matice Cje(A+-^)(A— 75)— 5 = 0a vlastní čísla jsou tedy a42 = ±1 (jiná ani ortogonální matice nemůže mít). Příslušné vlastní vektory jsou určeny po řadě rovnicemi (J2-^ + T2y = °> (7-2 + ^ + ^ = ° a jsou to tedy například vektory (-^j, 1 — ^j), (-^j, —1 — -^) (které jsou automaticky ortogonální). □ Poznámka. Zkuste si nakreslit obrázek působení zobrazení určeného maticí A na nějaký vektor v rovině. k násobkem čísla N. Naopak, v případě, že k je násobek čísla N, dostáváme hodnotu N: n-l í v-* ,> 2í t I" je-li je násobek N ^6 " [O jinak. Doporučujeme provést si podrobný důkaz na základě náčrtku , i' .1 (všimněme si, že pro obecné N a dané & se všechny tsčítance rozpadnou do „cyklů" na jednotkové kružnici a je N třeba odlišně diskutovat cykly o sudé a liché délce; v obou 1 případech ale tyto cykly dají nulové součty, pokud nejde o triviální jednoprvkový cyklus e° — 1). Nyní můžeme velmi snadno přímo spočíst: n-l ,n-1 n-l n-l r=0 s=0 ->jj-<ík-s) _ ^ n-l n-l r=0 s=0 ■ f(k), kde Sks je nula pro t / sa 1 pro k = s (je nutné si všimnout, že mezi všemi možnostmi hodnot (k — s) jediná nula je násobkem N). □ Výpočet použitý v důkazu zároveň ukazuje, že při diskrétní Fourierově transformaci komplexního periodického signálu s jednou ze vzorkovacích period dostaneme jako diskrétní Fourierův obraz právě jeho amplitudu. Pokud tedy vznikne signál superpozicí vzorkovacích frekvencí, dostáváme dokonalý výsledek. Pokud bude ale frekvence mimo použité vzorky, dostaneme nenulové amplitudy u všech vzorkovacích frekvencí. V technické literatuře se tomuto jevu říká „prosakování frekvencí". Vlastnostem, využitím a rychlé implementaci diskrétní Fou-rierovy transformace a dalších obdobných diskrétních nástrojů se věnuje obrovské množství literatury a jde o aktivní oblast současného výzkumu. Nemáme tu prostor pro podrobnější diskusi. 432 KAPITOLA 7. SPOJÍTE MODELY F. Doplňující příklady k celé kapitole 7.45. Rozviňte do Furierovy řady funkci sin2(x) na intervalu [—ir, jt]. O 7.46. Rozviňte do Furierovy řady funkci cos2(i;) na intervalu [—jt, jt]. O 7.47. Určete konvoluci funkcí f\ a f2, kde [l pro x e [-1, 0] ň h 0 jinak x pro x € [0, 1] 0 jinak O ^ (O jinak se sebou. O 7.48. Určete konvoluci funkce [1 pro x e (0,1) 433 KAPITOLA 7. SPOJITÉ MODELY Řešení cvičení 7.3. x, —-^x + sin(jc), projekce funkci \ sin(x) nezmění, neboť leží v prostoru samotném. 7.4. cos(x), 4 cos(X) + x. Projekce funkci 5 cos(x) nezmění, neboť leží v prostoru samotném. 7.33. fl * flit) ^+4 l-t- -2ř + 2 pro t e [-2, -1] pro t e [-1, 1] proř e [1,2] jinak 7.45. \-\ cos(2x). 7.46. j + j cos(2x). 7.47. proř e [-1,0] x-^- pro t e [0, 1] 0 jinak 7.48. Íx pro x e (0, 1) 2-x pro* e (1,2) 0 jinak 434 KAPITOLA 8 Spojité modely s více proměnnými jedna proměnná nám k modelování nestačí? - nevadí, stačí vzpomenout na vektory! A. Funkce více proměnných 8.1. Určete definiční obor funkcí K2 —► K, které jsou zadány následujícími předpisy: a) xy b) c) y{x> + x2 + x + 1) ' Mx1 -ý), m(-*2 -y2), d) arcsin(2sgn(xQ(x)), kde xq značí charakteristickou funkci racionálních čísel, e) f(x, y, z) = y/lnx • arcsin^z). Řešení, a) Jedinou podmínkou proto, aby byl předpis korektně zadával nějakou hodnotu, je, aby jmenovatel uvedeného zlomku byl nenulový. Na samotném počátku našeho putování matematickou krajinou jsme hned viděli, že pracovat současně s více parametry nebylo obtížné, protože s vektory šlo počítat velice podobně jako se skaláry. Jen je třeba si věci dobře rozmyslet. Budeme se nyní znovu zabývat situacemi, kdy matematicky vyjádřené vztahy závisí na více (ale zatím konečně mnoha) parametrech. Uvidíme, že vlastně ani není třeba překvapivých nových nápadů, stačí vždy šikovně redukovat problémy na takové, které už řešit umíme. Zároveň se konečně budeme umět vrátit k diskusi situací, kdy hodnoty funkcí popisujeme pomocí jejich okamžitých změn - tj. malinko se zastavíme i u obyčejných a parciálních diferenciálních rovnic. Úplně závěrem zmíníme tzv. variační problémy. Průběžně se budeme také jako obvykle snažit komentovat diskrétní varianty přístupů či problémů. 1. Funkce a zobrazení na R™ Funkce více proměnných. Pro praktické modelování procesů (nebo objektů v grafice) jen velice zřídka vystačíme s funkcemi R -» R jedné proměnné, ír::. Přinejmenším bývají potřebné funkce závislé na parametrech a často právě změna výsledků v závislosti na parametrech bývá důležitější než výsledek samotný. Budeme proto uvažovat funkce / : R™ -» R, které budeme také psát ve tvaru zdůrazňujícím označení proměnných, f(xx,x2, ...,xn):VLn ->VL a budeme se snažit co nejlépe rozšířit naše metody pro sledování hodnot a jejich změn do této situace. Říkáme jim funkce více proměnných. Pro snazší pochopení pojmů budeme často pracovat s případy n — 2 nebo n = 3 a přitom budeme místo číslovaných proměnných používat písmena x, y,z. To znamená, že funkce / definované v „rovině" R2 budou značeny / a podobně v „prostoru" ] 3 (x, ý) h» f(x, y) e I 3 (x, y, z) h» fix, y,z)e Podobně jako u funkcí jedné proměnné hovoříme o definičním oboru A c R™, na kterém je příslušná funkce definována. Při zkoumání funkce zadané konkrétním výrazem bývá prvním úkolem zjistit co největší definiční obor, na kterém má tento výraz smysl. KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Předpis tak definuje funkci na množině K2 \ {(x, 0), (—1, y), x, y e K}. b) Předpis je korektní, pokud je argument logaritmu kladný, tj. \x\ > \y\. Definiční obor takto zadané funkce je tedy {(x, y) e K2, \x\ > | y\}. Na obrázku můžete vidět graf této funkce. c) Opět skládáme funkci logaritmus s polynomem více proměnných. Obor hodnot mnohočlenu — x2 — y2 jsou však nekladná reálná čísla, na nichž není logaritmus definován (jakožto funkce K —► K). d) Aby předpis zadával nějakou hodnotu, musí být argument funkce ar-csin v intervalu [—1,1], což je porušeno právě pro ty dvojice (x, y) e R2, které mají první složku racionální. Předpis tedy korektně definuje funkci na množině j(xj),ieI\Ql. e) Argument odmocniny musí být nezáporný, tj. argument funkce ln z intervalu [1, oo], tj. 1 < x arcsin()í2z) a argument funkce arcsin, tj. y2z, z intervalu [—1,1]. Představení dané plochy v prostoru K3 ponecháme na laskavém čtenáři. □ B. Topologie en 8.2. Známým faktem o prostoru en je, že nejkratší možná spojnice dvou bodů je přímka. Na prostoru W (či jeho podmnožinách) můžeme však definovat různé metriky, které tuto vlastnost nemají. Uvážíme-li mapu nějakého státu jako podmnožinu K2, lze definovat vzdálenost dvou bodů, jako dobu, za kterou se lze nejrychleji dostat z jednoho do druhého pomocí použití veřejné dopravy či pěšky. Například ve Francii má takto definovaná metrika hodně daleko k tomu, aby nejkratší spojnicí dvou bodů byla přímka. 8.3. Ukažte že každá vlastní podmnožina en má nějaký hraniční bod. (Ne nutně v ní ležící.) Řešení. Nechť u C en nemá hraniční bod. Uvažme bod x € u a y € u' := en\u a úsečku xy e en. Populárně řečeno, tato úsečka S každou takovou funkcí více proměnných bývá užitečné uvažovat její graf, tj. podmnožinu G/ C R™ xR = R™+1 definovanou vztahem ,x„) e A), kde A j e definiční obor /. Např. grafem funkce definované v rovině vztahem x + y /(*. y) = je docela pěkná plocha na obrázku a jejím maximálním definičním oborem jsou všechny body roviny kromě počátku (0, 0). Při definici a zejména při kreslení obrázku grafu jsme použili pevně zvolené souřadnice v rovině. Pokud pro některou z nich zvolíme pevnou hodnotu, zbude nám jen jedna proměnná. Pro pevně zvolenou hodnotu x tak např. dostáváme zobrazení R -» R3, yt-> (x, y, f (x, y)), tj. křivku v prostoru R3. Křivky jsou vektorové funkce jediné proměnné, se kterými jsme již pracovali v šesté kapitole (viz 6.14). Často jsou na obrázcích grafů funkcí čarami vyneseny obrazy takovýchto křivek pro některé pevně zvolené hodnoty souřadnic x a y- Křivky c : R -» R™ jsou vedle funkcí více proměnných nej-jednoduššími příklady zobrazení F : Rm -» R™, ke kterým se dostaneme brzy také. U funkcí jedné proměnné jsme celý diferenciální a integrální počet vybudovali na základě pojmů konvergence, otevřených okolí, spojitosti atd. Tyto pojmy jsme poté v druhé části sedmé kapitoly zobecnili nejen pro euklidovské prostory R™, ale i obecněji pro tzv. metrické prostory. Před čtením následujících odstavců bude vhodné si tyto pasáže pečlivě připomenout, případně dohledávat si tam potřebné pojmy a výsledky průběžně. Pro jistotu tady jen velice rychle shrneme aspoň něco málo. 8.2. Euklidovské prostory. Euklidovský prostor E„ vnímáme JSt 'á í3^0 mno™,) bodů v R™ bez volby souřadnic a na •TjY jeho zaměření R™ pohlížíme jako na vektorový pro-SSisise^ř stor možných přírůstků, které umíme k bodům prostoru En přičítat. 436 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI musí někdy „přejít" z U do U a tento přechod je možný jen na hranici (jak čtenář jistě zjistil při návštěvě cizích zemí). Formálně zvolme na úsečce XY bod A tak, aby \XA\ = sup{|ZZ|, XZ e U] (takový bod A je na úsečce XY právě jeden). Tento bod je zjevně hraničním bodem množiny U: z definice A leží libovolná úsečka XB, kde B e X A celá v U, zejména tedy bod B. Pokud by ovšem existovalo okolí A ležící celé v U, tak by existovala úsečka delší než úsečka XA, ležící celá v U, což by byl také spor s definicí bodu A. Libovolné okolí bodu X tak obsahuje jak bod z U tak z En\U. □ 8.4. Dokažte, že jedinou podmnožinou En, která je uzavřená i otevřená, je En samotné. Řešení. Podle předchozího přikladu || 8.31| by taková množina U měla hraniční bod. Protože předpokládáme uzavřenost, tak by množina U byla rovna svému uzávěru, tedy obsahovala svůj libovolný hraniční bod. Otevřená množina však z definice nemůže obsahovat žádné hraniční body. □ 8.5. Ukažte, že prostor En nelze zapsat jako sjednocení (alespoň dvou) disjunktních neprázdných otevřených množin. Řešení. Předpokládejme, že En takovým sjednocením vyjádřit lze, tedy En = U f/,, kde / je nějaká indexová množina. Vyberme pevně nějakou množinu U z tohoto sjednocení. Pak můžeme psát En = U U U, kde jak U, tak U (jakožto sjednocení otevřených) jsou obě otevřené. Tedy jsou obě, protože jsou doplňky otevřených, i uzavřené a dostáváme spor s tvrzením předchozího příkladu 118.411. □ 8.6. Dokažte nebo vyvraťte: sjednocení (případně i nekonečně mnoha) uzavřených podmnožin v ET je uzavřená podmnožina v E". Řešení. Tvrzení neplatí. Protipříkladem je sjednocení U 1 1 -, 1 - - i i uzavřených podmnožin K, které je rovno otevřené množině (0,1). □ 8.7. Dokažte nebo vyvraťte: průnik (případně i nekonečně mnoha) otevřených podmnožin v E" je otevřená podmnožina v E". Řešení. Tvrzení neplatí. Protipříkladem je průnik Q("f"í) Navíc je na M" zvolen standardní skalární součin n u-v = y"^;y,-, kde u = (x\,...,xn)av — (y\, ..., yn) jsou libovolné vektory. Tím je na E„ dána metrika, tj. funkce vzdálenosti | P — Q | dvojic bodů P, Q předpisem iip-2H2 = mi2 = £^ kde u je vektor, jehož přičtením k bodu Q obdržíme bod P. Např. v rovině E2 je tedy vzdálenost bodů P\ — (x\, y\) a P2 — (x2, y2) dána IIPi - P2\\2 = (xi - x2f + (yi - yi)2. Takto definovaná metrika splňuje trojúhelníkovou nerovnost pro každé tři body P, Q, R II(p - 2) + (2 - ä)II < ||(p-2)II 11(2 -ä)II viz 3.25(1) v geometrii, resp. axiomy metriky v 7.12 nebo stejnou nerovnost (5.4) pro skaláry. Můžeme proto bez problému přenést (rozšířit) pro body P; libovolného Euklidovského prostoru pojmy zavedené dosud pro reálné a komplexní skaláry a podrobně diskutované pro metrické prostory: __\ Topologie euklidovského prostoru |___ Cauchyovská posloupnost: posloupnost bodů P, taková, že pro každé pevně zvolené £ > 0 je ||P; — Pj\\ < £ pro všechny indexy, až na konečně mnoho výjimečných hodnot i, j, konvergentní posloupnost: posloupnost bodů P, konverguje k bodu P, jestliže pro každé pevně zvolené £ > 0 je || P, — P || < £, až na konečně mnoho výjimečných hodnot i, j; bod P pak nazýváme limitou posloupnosti P,, hromadný bod P množiny A c E„: existuje posloupnost bodů Xj^PvA konvergující k P, uzavřená množina: obsahuje všechny své hromadné body, otevřená množina: její doplněk je uzavřený, otevřené S-okolí bodu P: množina Os (P) = {Q e En\ \\P— g || < 8], S e R, S > 0, hraniční bod P množiny A: každé S-okolí bodu P má neprázdný průnik s A i s komplementem En\A, vnitřní bod P množiny A: existuje S-okolí bodu P, které celé leží uvnitř A, ohraničená množina: leží celá v nějakém S-okolí některého svého bodu (pro dostatečně velké 8), kompaktní množina: uzavřená a ohraničená množina. otevřených podmnožin K, který je roven uzavřené množině {1}. □ Čtenář by měl investovat přiměřené úsilí do pročtení odstavců ■ 3.25, 5.14-5.17 a 7.14-7.16 a 7.22 a zkusit si promyslet/připomenout definice a souvislosti všech těchto pojmů. Zejména by mělo být z definic přímo zřejmé, že posloupnosti bodů P, mají vlastnosti zmiňované v prvních dvou bodech předchozího výčtu tehdy a jen tehdy, když stejně nazvané vlastnosti mají reálné posloupnosti vzniklé z jednotlivých souřadnic bodů P, ve kterékoliv kartézské souřadné soustavě. Proto také z lemma 5.12 vyplývá, že každá cauchyovská posloupnost bodů v En je konvergentní. Zejména je tedy En vždy úplným metrickým prostorem. 437 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.8. Uvažme graf spojité funkce / : K2 —► K jako podmnožinu £3. Rozhodněte o této množině, zdaje otevřená, uzavřená, či kompaktní. Řešení. Množina není otevřená, neboť libovolné okolí bodu [xo, yo, f (xo, yo)] obsahuje nějakou úsečku ležící na přímce x = xo, y = yo- Na této úsečce však leží jediný bod grafu funkce a to právě bod [x0, yo, f(x0, yo)]. Množina je uzavřená díky spojitosti funkce /: ukážeme, že libovolná konvergentní posloupnost bodů na grafu funkce / konverguje k bodu ležícím rovněž na tomto grafu. Totiž je-li nějaká v £3 konvergující posloupnost bodů na grafu funkce, tak konverguje každá její složka, tudíž posloupnost [[xn, y„]}^Lj musí být konvergentní posloupnost v K2. Označme tuto limitu [a, b]. Potom z definice spojitosti funkce / musejí její funkční hodnoty v bodech [x„,y„] konvergovat k hodnotě f(a,b). To však znamená, že posloupnost [[xn, y„, f(xn, y„)]}^Li konverguje k bodu [a, b, f (a, b)]. To je bod na grafu funkce /. Graf je tedy uzavřená množina. Množina je sice uzavřená, ale není kompaktní, neboť není omezená (její kolmý průmět do souřadnicové roviny xy je celé K2. (Kompaktní množiny v E„ jsou právě právě množiny, které jsou současně uzavřené a omezené) □ C. Tečny, tečné roviny, grafy funkcí více proměnných 8.9. V bodě [1, 0, 0] se nachází v čase / = 0 auto o rychlosti dané vektorem (0,1,1). Auto se pohybuje se zrychlením dané v čase / vektorem (— cos /, — sin /, 0). Popište dráhu auta v čase /. Řešení. Jak bylo diskutováno v odstavci 8.4, s prostředky k řešení této úlohy jsme se již seznámili v kapitole 6. Všimněme si, že integrální křivka" C(t) z věty z odstavce 8.4, začíná v bodě (0, 0, 0). (resp. je C(0) = (0, 0, 0)). V afinním prostoru K™ ji můžeme posunout do libovolného bodu a na její derivaci se nic nemění (jde o přičtení konstanty v každé složce, v parametrickém vyjádření křivky). Až na toto posunutí je tak tato integrální křivka dána jednoznačně (nic jiného než konstanty v každé složce přičítat beze změny derivace nelze). Integrací křivky zrychlení, dostaneme křivku rychlostí (— sin /, cos t — 1,0), uvážením počáteční rychlosti, dostáváme křivku rychlostí auta: (—sinr, cosr, 1) (posouvali jsme o vektor (0, 1, 1), tedy tak, aby v čase / = 0 křivka rychlostí souhlasila se zadanou počáteční rychlostí). Další integrací dostáváme křivku (cos t — 1, sin /, /). Posunutím o vektor (1, 0, 0) se pak dostáváme do počáteční polohy auta. Auto se tedy pohybuje po křivce [cos /, sin /, /] (této křivce se říká šroubovice, někdy též převzatým slovem helix). □ 8.3. Kompaktní množiny. Naše hrátky s otevřenými, uzavřenými nebo kompaktními množinami mohly v případě reálné přímky E\ vypadat jako zbytečné, protože nakonec jsme stejně skoro vždy mluvili jen o intervalech. U metrických prostorů ve ve druhé části kapitoly sedmé to možná bylo až moc složité. Stejný přístup je ale v případě euklidovských prostorů R™ docela jednoduchý a zároveň velmi užitečný a podstatný (a je to samozřejmě speciální případ obecných metrických prostorů). Stejně jako v případě E\ definujeme otevřené pokrytí množiny (tj. systém otevřených množin, v jejichž sjednocení je daná množina obsažena) a platí s drobnými formulačními úpravami i Věta 5.17: Věta. Pro podmnožiny A c Env euklidovských prostorech platí: (1) A je otevřená, právě když je sjednocením nejvýše spočetného systému S-okolí, (2) každý bod a e A je buď vnitřní nebo hraniční, (3) každý hraniční bod je buď izolovaným nebo hromadným bodem A, (4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A, (5) A je kompaktní, právě když je uzavřená a omezená, (6) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné podpokrytí. Důkaz. Důkaz z 5.17 lze bez úprav použít v případě tvrzení (l)-(3), byť s novým chápání pojmů a nahrazením „otevřených intervalů" jejich vícerozměrnými S-okolími vhodných bodů. První charakterizace kompaktnosti je vlastně definice tohoto pojmu, kterou jsme použili v metrických prostorech. Zbylé dvě charakterizace kompaktnosti jsou speciálním případem obecných tvrzení pro metrické prostory, viz 7.22, které lze i přímo obdržet vhodnou modifikací našeho postupu z případu prostorů jednorozměrných. □ 8.4. Křivky v E„. Skoro celá naše diskuse kolem limit, derivací a integrálů funkcí v páté a šesté kapitole se týkala funkcí s jednou reálnou proměnnou a reálnými nebo £ÍL - komplexními hodnotami s odůvodněním, že používáme pouze trojúhelníkovou nerovnost platnou pro velikosti reálných i komplexních čísel. Již tehdy jsme si povšimli, že se tento argument do značné míry přenáší na jakékoliv funkce jedné reálné proměnné s hodnotami v euklidovském prostoru R™ a uvedli jsme několik nástrojů pro práci s křivkami v odstavcích 6.14-6.17. Připomeňme proto, že pro každou (parametrizovanou) křivku1, tj. zobrazení c : R -» R™ v n-rozměrném prostoru, můžeme pracovat s pojmy, které jednoduše rozšiřují naše úvahy z funkcí jedné proměnné: limita: lim(_^(o c(ť) e R™, derivace: c'(to) = linv^í0 integrál: f% c(t)dt e R™. (c(t) - c(t0)) e : geometrii se většinou rozlišuje mezi křivkou jakožto podmnožinou v En a její parametrizací R Rn. My zde pod pojmem „křivka" rozumíme výhradně parametrizované křivky. Těm se v české geometrické literatuře často říká „dráha". 438 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.10. Určete parametrické i implicitní rovnice tečny ke křivce c : K K3, c (f) = (ci(r), c2(r), c3(/)) = (t, t2, t3) v bodě odpovídajícím hodnotě parametru / = 1. Řešení. Parametru / = 1 odpovídá bod c(l) = [1,1, 1]. Derivace jednotlivých složek jsou c\(t) = l,c'2(t) = 2t, c^(t) = 312. Hodnoty derivací v bodě / = 1 jsou 1,2, 3. Parametrické rovnice tečny takjsou: x = c[(l)t + Ci(l) = t + 1, y = 4(l)/ + c2(l) = 2/ + l, z = ^(l)/ + c3(l) = 3/ + l. Vyloučením parametru / dostáváme implicitní rovnice tečny (nejsou dány kanonicky): 2x — y = 1, 3x - z = 2. □ 8.11. Množina diferencovatelných funkcí. Všimněme si, že s\^Lv mnohočleny více proměnných jsou diferencovatelné na ce-'Aí^c lém svém oboru. Rovněž tak složení diferencovatelné funkce í§> jedné proměnné s diferencovatelnou funkcí více proměnných je opět diferencovatelná funkce více proměnných. Je tedy například funkce sin(x + y) diferencovatelnou funkcí na celém K2, \n(x + y) je diferencovatelnou funkcí na množině x > y (polorovině bez hraniční přímky). Důkazy zmíněných tvrzení jsou cvičením na skládání limit. Poznámka. Značení parciálních derivací. Parciální derivaci funkce / : K™ —► K proměnných x\,..., xn podle proměnné x\ budeme značit jak J£, tak kratším zápisem fM. V příkladové části se budeme spíše držet druhého způsobu. Zápis pak lépe vystihuje fakt, že se jedná o derivaci funkce / ve směru vektorového pole (co je vektorové pole se dozvíte v odstavci 8.34). 8.12. Určete definiční obor funkce / : K2 —► R, f(x, y) = x2 ^fy. Určete parciální derivace tam, kde jsou na tomto oboru definovány. Řešení. Definičním oborem dané funkce je v K2 polorovina {(x, y), y > 0}. Při určení parciální derivace podle některé z proměnných postupujeme tak, že v předpisu pro funkci považujeme za proměnnou pouze tu, podle níž derivujeme. Ostatní proměnné pak považujeme za konstanty a derivujeme podle pravidel o derivování funkce jedné proměnné. Dostáváme tak: 1 x2 fx = 2xy/y afy = - — . Parciální derivace existují ve všech bodech definičního oboru mimo hraniční přímky y = 0. □ Všimněme si také, že jak limita tak derivace křivek mají smysl v afinním prostoru, aniž bychom volili souřadnice (přičemž limitou posloupnosti je opět bod v původním prostoru, zatímco derivace je vektor v zaměření!). V případě integrálu ale musíme uvažovat křivky ve vektorovém prostoru R™. Důvod je vidět už v jednorozměrném případě, kde potřebujeme znát počátek, abychom mohli vidět „plochu pod grafem funkce". Opět je přímo z definice zjevné, že limity, derivace i integrály lze spočíst po jednotlivých n souřadných složkách vl*a stejně se rozpozná i jejich existence. U integrálu můžeme také přímo formulovat pro křivky analogii souvislosti Riemannova integrálu a primitivní funkce (viz 6.25): Tvrzení. Nechť c je křivka v R™, spojitá na intervalu [a, b]. Pak rb existuje její Riemannův integrál Ja c(t)dt. Navíc je křivka C(t) = í c(s)ds e M" Ja dobře definovaná, diferencovatelná a platí C (i) — c(t) pro všechny hodnoty t e [a, b]. Horší je to s větou o střední hodnotě a obecněji s Tayloro-vou větou, viz 5.38 a 6.4. Ve zvolených souřadnicích je můžeme aplikovat na jednotlivé souřadné funkce diferencovatelné křivky c (i) — (c\(f), ..., c„(ť)) na konečném intervalu [a, b]. Dostaneme např. u věty o střední hodnotě existenci čísel ř, takových, že ci(b) - Ci(á) = (b - a) ■ cj(ř;)- Tato čísla ř, ale budou obecně různá, nemůžeme proto vyjádřit rozdílový vektor koncových bodů c(b) — c(a) jako násobek derivace křivky v jediném bodě. Např. v rovině E2 pro diferencovatelnou křivku c(ř) = (x(f), y(t)) takto dostáváme c(b) - c(a) = (x'(š)(b - a), y'(V)(b - a)) ~ (b — a) ■ (x (Š), y (v)) pro dvě (obecně různé) hodnoty f, i] e [a, b]. Pořád nám ale tato úvaha stačí na následující odhad. Lemma. Je-li c křivka v En se spojitou derivací na kompaktním intervalu [a,b], pak pro všechny a < s < t < b platí ||c(ř) - c(s)\\ < Vň(maxr€[(j>6] \\c'(r)\\) ■ \t - s\. Důkaz. Přímým použitím věty o střední hodnotě dostáváme pro vhodné body r, uvnitř intervalu [s,t]: n n \\c(t) - c(S)\\2 = £>;(*) - cí(s))2 < 5>;(r;)(r - S))2 < (ř - s)2 yjmaxr€M Cj'(r)2 < n(maxr€[s>í]> i=i,...,„ |c-(r)|)2(ř - s)2 < n maxreo.t] \\c'(r)\\2(t - s)2. □ Důležitým pojmem je tečný vektor ke křivce c : R —> E„ v bodě c(řo) e E„, který definujeme jako vektor v prostoru zaměření R™ daný derivací c'(to) 6 R™. 439 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.13. Určete směrovou derivaci funkce / : K3 —► K, f(x, y, z) = x2yz v bodě [1, —1, 2] ve směru v = (3, 2, —1). Řešení. Směrovou derivaci spočítáme dvěma různými způsoby. Jednak přímo z definice (viz odstavec 8.5), a také pomocí diferenciálu dané funkce, viz 8.6 a věta 8.7. Daná funkce je totiž mnohočlenem, tudíž diferencovatelnou funkcí na celém K3. Počítejme podle definice: /„(*,?, z) = lim^íf(x + 3t,y + 2t,z-t)-f(x,y,z)] = = lim-[(x + 3t)2(y + 2t)(z-t)-x2yz] = (-►0 / = lim - [/(6xyz + 2x2 z-x2y)+t2 (...)] = í-*0 / = 6xyz + 2x2 z — x2 y. Odvodili jsme tak směrovou derivaci ve směru vektoru (3,2, —1) jakožto funkci tří reálných proměnných, udávající bod, ve kterém derivaci zkoumáme. Pro zadaný bod pak dosazením získáme /„(l,-1,2) = -7. Pro výpočet směrové derivace z diferenciálu dané funkce budeme nejprve muset spočítat parciální derivace dané funkce: fx = 2xyz, fy =x2z, fz= x2 y- Podle poznámky za větou 8.7 pak můžeme vyjádřit Ml,-l, 2) = 3fAl, -1, 2) + 2/3,(1, -1, 2)+ + (-l)/z(l,-l,2) = = 3 • (-4) + 2 • 2 + (-1) •(-!) = -7. □ 8.14. Určete směrovou derivaci funkce / : K -cos(jc y) v bodě [0, 0, 2] ve směru vektoru (1, 2, 3). R, f(.x, y, z) Řešení. Definičním oborem dané funkce je K3 mimo roviny z = 0. Další výpočty budeme uvažovat pouze na tomto oboru. Funkce je v bodě [0, 0, 2] diferencovatelná (podle poznámky ||8.11||). Hodnotu zkoumané směrové derivace určíme podle 8.6 pomocí parciálních derivací. Určíme parciální derivace dané funkce (Jak jsme již popsali v příkladě ||8.12||, pro určení parciální derivace podle x, derivujeme danou funkci jako funkci jedné proměnné x, používáme pravidlo o derivaci složené funkce. Obdobně pro další parciální derivace.): _ 2xy sin(x2y) J x 1 J y x2 sin(x2y) . f z s(x2y) Pokud si představíme c jako dráhu nějakého předmětu v prostoru, pak tečný vektor v bodě to lze fyzikálně chápat jako okamžitou rychlost v tomto bodě. Přímka T zadaná parametricky T : c(ř0) + t ■ c'(to) se nazývá tečna ke křivce c v bodě to. Na rozdíl od tečného vektoru, tečna T coby neparametrizovaná přímka zjevně nezávisí na parametrizaci křivky c, protože při změně parametrizace dostaneme díky větě o derivování složených funkcí znovu stejný tečný vektor, až na násobek. 8.5. Parciální derivace. Pro každou funkci / : R™ -» R a libovolnou křivku c : R -» R™ máme k dispozici jejich . kompozici (/ o c)(t) : R -» R. Tato složená funkce gg, F o c vypovídá o chování funkce / podél křivky c. Nejjednodušší bude použít přímky. smerové a parciálni derivace Definice. Řekneme, že / : R™ -» R má derivaci ve směru vektoru v e R™ v bodě* e E„, jestliže existuje derivace íí„/(*) složeného zobrazení t \-> f (x + tv) v bodě t — 0, tj. dvf(x) ■ 1 lim-(/(* (-►0 t + tv)-f(x)). Hodnotě dv f také říkáme směrová derivace. Speciální volbou přímek ve směru souřadných os dostáváme tzv. parciální derivace funkce f, které značíme J£-, i — 1, ..., n, nebo bez odkazu na samotnou funkci jako operace -£-. Pro funkce v rovině tak dostáváme 9 z-f(.x,y) dx 1 lim-(/(* (-►0 t + t, y)-f (x, y)), ^-f(x, y) = lim-(f (x, y + i)- f (x, y)). dy t->0 t Zejména je vidět, že parciálně podle vybrané proměnné derivujeme tak, že prostě všechny ostatní proměnné považujeme za konstanty a postupujeme jako u funkcí jedné proměnné. 8.6. Diferenciál funkce / : R™ -> R. Se samotnými parciálními nebo směrovými derivacemi nevystačíme pro dobrou aproximaci chovaní funkce lmeárními výrazy. Asi bychom přirozeně očekávali, že „diferencovatelná" funkce více proměnných bude složením s jakoukoliv diferencovatelnou křivkou dávat diferencovatelné funkce jedné proměnné, které už dobře známe. Podívejme se ale např. na funkce v rovině zadané výrazy g(x, y) = h(x,y) = 1 když yx —0 0 jinak, 1 když y = x2 ^ 0 0 jinak. Evidentně žádná z nich neprodlužuje všechny hladké křivky procházející bodem (0, 0) na hladké funkce, protože už zúžení na přímky procházejících počátkem nejsou ani spojité. Přitom ale pro g existují obě parciální derivace v (0, 0) (a jsou nulové), ale jiné 440 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Dosazením konkrétních hodnot pak obdržíme MO, 0, 2) + 2 • fy(0, 0, 2) + 3 • fz(0, 0, 2) = 1-0 + 2-0 + 3- □ 8.15. Pro funkci lei* jednotkový směr v e '. maximální. S s diferenciálem d f (x) určete v bodě ,, ve kterém je směrová derivace dv (x) Řešení. Podle poznámky za větou 8.4 jde o maximalizaci funkce fv(x) = vifxx(x) + v2fX2ix) + ••• + vnfXn(x). v závislosti na proměnných v\,..., v„, které jsou vázány podmínkou v\ + • • • + u2 = 1. Stejný problém už jsme řešili kapitole 3, při lineární optimalizaci (viz ||3.1||). Hodnotu fv(x) totiž můžeme interpretovat jako skalární součin vektorů (fXí ,...,/*„) a (ui,..., v„). No a ten je maximální, pokud jsou vektory stejného směru. Vektor v tedy získáme normováním vektoru (fXí,..., fXn). Obecně říkáme, že funkce roste maximálně ve směru (fXí,..., fxJ. Tento vektor pak nazýváme gradientem funkce /. Podrobněji se jím budeme zabývat a tuto úvahu si ještě připomeneme v odstavci 8.19. □ 8.16. Rozhodněte, zda tečná rovina ke grafu funkce / : 1 x I+ -> K, fix, y)=x- ln(v) v bodě [1, ±] prochází bodem [1, 2, 3] e K3. Řešení. Určíme nejdříve parciální derivace: fxix,y) = ln(v), fyix,ý) = j, jejich hodnoty v bodě [1, j] jsou —1, e, dále /(l, j) = —1. Rovnice tečné roviny je tedy /[l,i)-r/I(l,I)(,-l) + /,(l,I y-- e = — 1 — x + ey. Této rovnici daný bod nevyhovuje, v tečné rovině tedy neleží. □ 8.17. Určete parametrické vyjádření tečny k průsečnici grafů funkcí / : K2 K, fix, y) = x2 + xy - 6, g : K x K+ K, gix, y) = x ■ In (v) v bodě [2,1]. Řešení. Tečna k průsečnici je průsečnici tečných rovin v daném bodě. Tečná rovina ke grafu funkce / procházející bodem [2, 1] je z = fi2,l) + fxi2,l)ix-x0) + fyi2,l)iy-y0) = 5x + 2y - 12. Tečná rovina k grafu g je pak z = gi2, 1) + gxix, y)i2, l)ix - x0) + gyix, y)i2, l)(y - y0) = 2y -2. směrové derivace neexistují. Pro h existují všechny směrové derivace v bodě (0, 0) a je dokonce dvh(0) = 0 pro všechny směry v (protože na každé přímce procházející počátkem je na aspoň malinkém okolí nuly funkce h nulová), takže jde o lineární závislost na ľ e R2. Snadno si také představíme funkci /, která bude mít podél přímek (r cos d, r sin d) s pevným úhlem 9 hodnoty k(9)r, přičemž k(9) je periodická lichá funkce v úhlu 9, s periodou 2jt. Její směrové derivace dvf v (0, 0) všechny existují, ale pro obecné funkce k(9) zcela jistě nepůjde o lineární výrazy v závislosti na směrech v. Budeme proto napodobovat případ funkcí jedné proměnné co nejdůsledněji a podobné patologické chování funkcí vyloučíme přímo definicí: .__j Diferenciál j___ Definice. Funkce / : M" —> R je diferencovatelná v bodě x, jestliže zároveň platí tři vlastnosti: (1) v bodě x existují směrové derivace dvf(x) pro všechny vektory v e R", (2) dvf (x) je lineární v závislosti na přírůstku v, (3) linwo (/(* + v)- fix) - dvf(x)) = 0. Lineární výraz dv f (ve vektorové proměnné v) nazýváme diferenciál funkce f vyčíslený na přírůstku v. Řečeno slovy, požadujeme, aby v bodě x existovalo dobré přiblížení přírůstků funkce / pomocí lineární funkce přírůstků proměnných veličin. Přímo z definice směrových derivací vyplývá, že můžeme také diferenciál definovat pouze pomocí vlastnosti (3). Skutečně, pokud existuje nějaká lineární forma df(x) taková, že pro přírůstky v v bodě x platí vlastnost (3) s dvf(x) = df(x)(v), pak je zjevně df(x)(v) právě směrovou derivací funkce / v bodě x a vlastnosti (1) a (2) jsou tedy splněny automaticky. Definici diferenciálu můžeme také přepsat ve tvaru \\f(x + v)-f(x)\\ < K(*)|| + ||a(i;)||, kde funkce a splňuje lim^o razení d f spojitá, dovodili jsme «(") 0. Protože jsou lineární zob- Lemma. Je-li funkce f diferencovatelná v bodě x, pak je v tomto bodě spojitá. Podívejme se, co umíme říci o diferenciálu funkce fix, ý) •Sjk v rovině za předpokladu, že obě parciální derivace |£, *Í*\J * §j existují a jsou spojité v okolí bodu (to, yo). Uvažme za tím účelem jakoukoliv hladkou ' &=?~ křivku t t-> ixii), yit)) s io = x(0), yo — yiO). S použitím věty o střední hodnotě na funkce jedné proměnné v obou sčítancích zvlášť dovodíme, že \{fixit),yit))- fixa,yo)) = \(fixii), yit))-fixo, yit))) + \(fixo, yit))-fixo, yo)) = i ixii) -xo)d-fixiš), yit)) + i iyii) -yo)d-f (*0 ■ y(v)) ox oy pro vhodná čísla f a rj mezi 0 a t. 441 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Průsečnicí těchto dvou rovin je přímka daná parametricky jako [2, /, 2t -2], t e K. Jiné řešení. Normála k ploše určené rovnicí fix, y, z) = Ovboděfc = [2, 1, 0] je ifxip), fy(b), fz(b)) = (5, 2, —1), normála k ploše určené jako g(x, y, z) = 0 v tomtéž bodě je (0, 2, — 1). Tečna je kolmá na obě normály, její směrový vektor získáme tedy např. vektorovým součinem normál, což je (0, 5, 10). Protože tečna prochází bodem [2, 1, 0], je její parametrické vyjádření [2,1 + /, 2t], t e K. □ 8.18. Určete všechny druhé parciální derivace funkce / dané předpisem fix, y, z) = */xy ln z. Řešení. Nejprve určíme definiční obor dané funkce: argument odmocniny musí být nezáporný a argument logaritmu musí být kladný, je tedy Df = [ix, y, z) e K3, (z > l&ixy > 0)) V (0 < z < l)&ixy < 0)}. Nyní spočteme první parciální derivace podle všech tří proměnných: y ln(z) 2^/xy ln(z) fy x ln(z) 2^/xy ln(z) fz xy 2z\/xy ln(z) Každá z těchto tří parciálních derivací je opět funkcí tří proměnných, můžeme tedy uvážit (první) parciální derivace těchto funkcí. To jsou druhé parciální derivace funkce /. Jako index k funkci / připíšeme proměnné, podle kterých derivujeme. fxx fxy fxz fyy fyz fzz 4(xylnz)š ' xy ln2 z 4(;rylnz)5 2V^vlnz lnz xy2 ln z y 4z(;rylnz)^ 2z*Jxy lnz' x2ln2z 4ixy lnz)5 x2ylnz x 4z(;rylnz)5 2z^/xy lnz' x2^ xy 4z2 ixy ln z) * 2z2*Jxy\nz Zejména tedy pro každou posloupnost čísel t„ jdoucí k nule získáme příslušné posloupnosti čísel f„ a r\n, které také budou konvergovat k nule, a pro všechny bude platit vyjádření výše. Limitním přechodem t —> 0 proto díky spojitosti parciálních derivací dostáváme (viz test konvergence funkce pomocí vybraných posloupností hodnot argumentů, 5.23, a Věta 5.22 o hmitách součtů a součinů funkcí) ^-f(x(i),y(i))\,=0 =x'(Q)?f(x0,y0) + y'(O)^-(x0, y0), cit dx dy což je příjemné rozšíření platnosti věty o derivování složených funkcí jedné proměnné pro vektorově hodnotové funkce. Samozřejmě, speciální volbou parametrizovaných přímek (*(*), y(i)) = (x0 + rf, yo + tri) přechází náš výpočet při v — (f, rf) na rovnost 3/ 3/ dvf(x0, yo) = —(x0, yo)Š + — (*o, yo)v dx dy a tento vztah můžeme pěkně vyjádřit způsobem, kterým jsme v lineární algebře zapisovali souřadná vyjádření lineárních funkcí na vektorových prostorech: 3/ 3/ df = —dx h--dy. dx dy Jinými slovy, směrová derivace dvf je skutečně lineární funkce M" —> R na přírůstcích, se souřadnicemi danými právě parciálními derivacemi. Podobným postupem nyní budeme umět dokázat, že předpoklad spojitých parciálních derivací v daném bodě zajišťuje i aproximační vlastnosti diferenciálu. Budeme už rovnou uvažovat obecné funkce více proměnných: 8.7. Věta. Nechť f : En —> R je funkce n proměnných, která má v okolí bodu x e En spojité parciální derivace. Pak existuje její diferenciál d f v bodě x a jeho souřadné vyjádření je dáno výrazem. df df df df — -dx\ h--dx2 + • • • h-- 3*1 3*2 3*n dxn Důkaz. Odvození věty je naprosto analogické výše uvedenému postupu v případě n — 2. Musíme být % jen opatrní v detailech a dokončit úvahu o aproximačních vlastnostech. Úplně stejně jako výše uvažujeme křivku c{i) = (ci(ř), ,c„it)), c(0) = (0,0), a bod * e R™ a vyjádříme pro složenou funkci /(c(í)) rozdíl /(* + cit)) - fix) takto Podle věty o záměnnosti parciálních derivací (viz 8.10) víme, že fxy = fyx, fxz = fzx, fyz = fzyy smíšené parciální derivace (smíšená znamená, že parciálně derivujeme podle více než jedné proměnné) tedy stačí určit pro jedno konkrétní pořadí derivování. □ /(*l +ci(ř), ...,*„ +c„(ř)) - /(*i,*2 +C2(ť), ...) + /(*!, *2+C2(ř),... ))-/(*! it)) + /(*1,*2, ■ ■ ■ ,X„ +C„it)) - /(*l,*2, ,x„). 442 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI D. Taylorovy polynomy 8.19. Napište Taylorův rozvoj druhého řádu funkce / : K2 f(x, y) = InCx2 + y2 + 1) v bodě [1, 1]. Řešení. Nejprve spočítáme první parciální derivace: 2x 7> A 2y x2+y2 + ľJy x2+y2 + ľ poté Hessián: B fix, y) Axy -lyl--lxl+2__ (i2+y2+l)2 (i2+y2+l)2 Axy 2x2-2y2+2 (i2+y2+l)2 (i2+y2+l)2 Hodnota Hessiánu v bodě [1, 1] je 2 _4 9„ „9 _4 2 9 9 celkem tedy je Taylorův rozvoj druhého řádu v bodě [1, 1]: T2(x,y) = f(l,l) + fx(l,l)(x-l) + fy(l,l)(y-l) + -hy- l)Hf(l, 1) ~ \ = ln(3) + l(x-l) + j(y-l) + ^(x-l)2- -A-{x - l)(y - 1) + l-(y - l)2 = ^(x2 +y2 +8x + 8y -Axy -14) + ln(3). □ Poznámka. Zejména je tedy Taylorův rozvoj (polynom) druhého stupně z libovolné diferencovatelné funkce v daném bodě mnohočlenem druhého stupně. 8.20. Určete Taylorův polynom druhého stupně funkce / : K2 —► K2, f(x, y) = xy cos y v bodě [ji, ji]. Určete, zda tečná rovina ke grafu této funkce v bodě [ji, ji, f (ji, ji)] prochází bodem [0, ji, 0]. Řešení. Jako v předchozích příkladech zjistíme, že T(x, y) = ^Jt2y2 - xy- jt3y + ^jt4. Rovnice tečné roviny ke grafu dané funkce v bodě [ji, ji] je dána Taylo-rovým polynomem prvního stupně v bodě [ji, jt], její obecná rovnice je tedy z = —Jty — jix + ji2, které zadaný bod [0, ji, 0] vyhovuje. □ 8.21. Určete Taylorův polynom třetího stupně funkce / : K3 —► K, f(x, y, z) = x3 y + xz2 + xy + 1 v bodě [0, 0, 0]. O 8.22. Určete Taylorův polynom druhého stupně funkce / : K2 —► K, fix, y) = x2 siny + y2 cos x v bodě [0, 0]. Rozhodněte, zda tečná Na všech n sčítanců teď můžeme uplatnit větu o střední hodnotě a stejně jako v případě dvou proměnných dostáváme 3/ (ci(ř) - ci(0))-^(*i + ci(ňi), x2 + c2it), ...,xn+ cnit)) dx\ + iciit) - C2(Q))-^-(xi,x2 + C2(92), ...,xn+ cnit)) OX2 3/ + iCnif) - C„iO))-^iXUX2, ...,X„+ Cl(0„)), ox„ pro vhodné hodnoty 0 < 6, < t. Jde o konečný součet, proto stejnou argumentací jako v případě dvou proměnných ověříme í-fix + cit))t=0 = c[(0)^(x) + ■■■ + c'niQ)^-ix). dt úx\ úxn Speciální volbou křivek c (ŕ) = x + tv pro směrový vektor v máme ověřeno tvrzení o existenci a linearitě směrových derivací v bodě x. Zároveň ale můžeme úplně stejně aplikovat větu o střední hodnotě na rozdíl fix + v)-fix) = dvfix+9v) 3/ 3/ = vi-—(x + 9v) H-----h v„-— 3*1 oxn ix + 9v) s vhodným 0 < 9 < 1, kde druhá rovnost platí, podle výše odvozeného výrazu pro směrové derivace, pro dostatečně malá v díky spojitosti parciálních derivací na okolí bodu x. Protože jsou všechny parciální derivace spojité v bodě x, víme, že pro libovolně malé £ > 0 můžeme najít okolí U počátku v M" takové, že se pro w e U budou všechny parciální derivace J£ (x + w) lišit od J£- (x) o méně než £. Dostaneme pak odhad —!—(/(jc + w) - fix) - dmfix + 9w)) < --í-||iw||e, a tedy i aproximační vlastnost diferenciálu je splněna. □ Funkce třídy C Říkáme, že je funkce / : M" -> R třídy C1 na množině A, jestliže má ve všech bodech této množiny spojité parciální derivace, píšeme / e C1 (A). Právě dokázaná věta tedy říká, že je-li funkce třídy C1 na nějakém okolí bodu x, pak má v tomto bodě diferenciál. 8.8. Tečná rovina ke grafu funkce. Lineární přiblížení chování '<© funkce diferenciálem můžeme také obdobně k funk-•t-Í^W cím jedné proměnné vyjádřit ve vztahu k jejímu K&ggj~5:í grafu. Jen místo tečen musíme pracovat s nadrovi-nami. Pro případ funkce na E2 a pevně zvoleného bodu (xo, yo) 6 E2 uvažme rovinu v £3 zadanou rovnicí z = fixo, yo) + dfix0, yo)ix - xo, y - yo) 3/ 3/ = fixo, yo) + — ixo, yo)ix - x0) + —(*o, yo)(y - yo)- dx dy Již jsme viděli, že přírůstek funkčních hodnot diferencovatelné funkce / : En —> R v bodech x + tv a x je vždy vyjádřen pomocí směrové derivace dvf ve vhodném bodě na jejich spojnici. 443 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI rovina ke grafu této funkce v bodě [0, 0, 0] prochází bodem [ji, ji, ji]. Tato rovina má tedy jako jediná ze všech rovin procházejících bo- O 8.23. Určete Taylorův polynom druhého stupně funkce ln(xy + 1) v bodě [1,1]. O 8.24. Určete Taylorův rozvoj druhého stupně funkce / : K2 —► K, fix, y) = tanixy + y) v bodě [0,0]. O E. Extrémy funkcí více proměnných 8.25. Určete stacionární body funkce / : K2 —► K, fix, y) = x1 y+ y2x — xy, a rozhodněte, které z těchto bodů jsou lokální extrémy a jakého druhu. Řešení. První derivace jsou fx = 2xy + y2 — y, fy = x2 + 2xy — x. Položíme-li obě parciální derivace současně nule, má soustava následující řešení: [x = y = 0}, [x = 0, y = 1}, [x = 1, y = 0}, [x = 1/3, y = 1/3}, což jsou čtyři stacionární body dané funkce. Hessián funkce f je ( - , ^ . ^x ~*~^ J \2x + 2y — 1 2x Jeho hodnoty ve stacionárních bodech jsou postupně Vo'KiiXííMi í tedy první tři Hessiány jsou indefinitní, poslední pak pozitivně defi-nitní, bod [1/3,1 /3] je tedy lokálním minimem. □ 8.26. Určete bod v rovině x + y + 3z = 5 ležící v K3, který má nejmenší vzdálenost od počátku souřadnic. A to jak metodami lineární algebry, tak metodami diferenciálního počtu. Řešení. Jde o patu kolmice spuštěné z bodu [0, 0, 0] na rovinu. Normála k rovině je (/, /, 3/), t e K. Dosazením do rovnice roviny dostaneme patu kolmice [5/11, 5/11, 15/11]. Alternativně minimalizujeme vzdálenost (resp. její kvadrát) bodů v rovině od počátku, tj. funkci dvou proměnných, (5-r 3z)2 + y2 + z2 Položením parciálních derivací rovných nule dostaneme soustavu 3y + lOz - 15 2y + 3z - 5 která má řešení jako výše. Protože víme, že minimum existuje a jedná se o jediný stacionární bod, nemusíme už ani počítat Hessián. □ dem (xo, yo) vlastnost, že v ní leží derivace a tedy i tečny všech křivek c(ť) = (x(ť),y(ť),f(x(ť),y(ť)))-Říkáme jí tečná rovina ke grafu funkce /. Na obrázku jsou zobrazeny dvě tečné roviny ke grafu funkce f(x, y) = sin(x)cos(y). Pro funkce n proměnných definujeme tečnou rovinu jako analogii k tečné rovině k ploše v trojrozměrném prostoru. Místo zaplétání se do spousty indexů bude snad užitečná vzpomínka na afinní geometrii, kde jsme s tzv. nadrovinami již pracovali, viz odstavec 4.3. Tečná (nad)rovina grafu funkce v bodě [_, Tečná nadrovina ke grafu funkce /:i"^lv bodě x e R™ je nadrovina procházející bodem {x, fix)) se zaměřením, které je grafem lineárního zobrazení df(x) : R™ -» M, tj. diferenciálu v bodě x e En. Definice vychází ze skutečnosti, že směrová derivace dvf je dána přírůstkem na tečné (nad)rovině odpovídajícím přírůstku argumentu v. Z těchto úvah vyplývá řada analogií s funkcemi jedné proměnné. Zejména má diferencovatelná funkce / na En v bodě x e En nulový diferenciál tehdy a jen tehdy, když její složení s libovolnou křivkou procházející tímto bodem zde má stacionární bod, tj. ani neroste ani neklesá v lineárním přiblížení. Jinak řečeno, tečná rovina je v takovém bodě rovnoběžná s nadrovinou proměnných (tj. její zaměření je En c En+\ s přidanou nulovou poslední souřadnicí). To samozřejmě neznamená, že v takovém bodě musí mít / aspoň lokálně buď maximum nebo minimum. Stejně jako u funkcí jedné proměnné můžeme rozhodovat teprve podle derivací vyšších řádů. 8.9. Derivace vyšších řádů. Stejně jako v případě jedné proměnné, operaci derivování je možné iterovat. Tentokrát si můžeme pro každou iteraci vybrat jiný smer. _ Jestliže vybereme pevný přírůstek v e W, za- dává vyčíslení diferenciálů na tomto přírůstku (diferenciální) operaci na diferencovatelných funkcích / : En —> R / t-> dvf = d f (v) a výsledkem je opět funkce df(v) : En —> R. Jestliže je tato funkce opět diferencovatelná, může opakovat totéž s jiným přírůstkem atd. Zejména tedy můžeme pracovat s iteracemi parciálních derivací. Pro parciální derivace druhého řádu píšeme (J-0±)f = -Ž-f = .£L. \dxj dxi ) dxi'dxj dxi'dxj 444 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.27. Určete všechny lokální extrémy funkce f(x, y) = x2 + arctg2 x + | y3 + y |, x,y eR. Řešení. Funkci / si vyjádříme jako součet f\ + f2, kde fx{x) = x2 + arctg2*, xeR, f2{y) = | y3 + y |, y e K. Má-li mít funkce / v nějakém bodě lokální extrém, pak jej musí mít také vzhledem k libovolné podmnožině svého definičního oboru. Jinak řečeno, pokud má např. v bodě [a, b] maximum a my položíme y = b, potom funkce fix, b) jedné proměnné x musí mít maximum v bodě x = a. Zvolme libovolně y e R. Pro toto pevné y dostáváme funkci jedné proměnné, která je posunutím funkce f\, což znamená, že má maxima a minima ve stejných bodech. Nalézt extrémy f\ je ovšem snadné. Stačí si uvědomit, že tato funkce je sudá (je součtem dvou sudých funkcí, přičemž funkce y = arctg2 x je součinem dvou lichých funkcí) a rostoucí pro x > 0 (kompozice i součet rostoucích funkcí je rostoucí funkce). Má proto jediný extrém, a to minimum v bodě x = 0. Podobně platí, že pro pevně zvolené x je / posunutím f2 a že také funkce f2 má minimum v bodě y = 0 jako svůj jediný extrém. Dokázali jsme tak, že / může mít lokální extrém pouze v počátku. Protože zjevně /(0,0) = 0, f{x,y)>0, [x, y] e K2 \ {[0, 0]}, funkce / má v bodě [0, 0] ostré lokální (dokonce globální) minimum. □ 8.28. Vyšetřete lokální extrémy funkce f{x,y) = (x + y2) eí, x,yeR. Řešení. Daná funkce má parciální derivace všech řádů na celém svém definičním oboru. Lokální extrém může proto nastat pouze ve stacionárních bodech, ve kterých jsou obě parciální derivace fx, fy nulové. O tom, zda v těchto bodech extrém skutečně je, lze pak rozhodnout pomocí druhých derivací. Snadno určíme fx(x, y) = eí + \ (x + y2)eí, fy{x, y) = 2y eí, x,yeR. Stacionární bod [x, y] musí splňovat fy(x,y) = 0, tj. y = 0, a dále fx(x,y) = fx(x,0)=eí(l + \x) = 0, tj. x = -2. Vidíme, že existuje jediný stacionární bod [—2, 0]. Nyní spočítáme Hessián H f v tomto bodě. Bude-li tato matice (příslušná kvadratická forma) pozitivně definitní, jedná se o ostré lokální minimum; a při negativní definitnosti jde o ostré lokální maximum. Pokud bude indefinitní, nepůjde o extrém. Platí V případě opakované volby i — j píšeme také \dxi dxi J _ 92 _ 32/ Úplně stejně postupujeme při dalších iteracích a hovoříme o parciálních derivacích k-tého řádu 3kf dxii ... dxit Obecněji můžeme iterovat (u dostatečně diferencovatelných funkcí) také libovolné směrové derivace, např. dv o dw f pro dva pevné přírůstky v,w eW. __j /c—KRÁT DIFERENCOVATELNÉ FUNKCE |___ Řekneme, že je funkce f : En -» R třídy Ck na množině A, jestliže má ve všech bodech A spojité všechny parciální derivace až do řádu k včetně, píšeme / e d1 (A). Abychom si vše ukázali v co nejjednodušší formě, budeme opět pracovat chvíli v rovině E2 za předpokladu spojitosti parciálních derivací druhého řádu. V rovině a prostoru se často stručně značí iterované derivace pouhými odkazy jmen proměnných v pozici indexů u funkce, např. _ 9/ fx ~ T. ' fxx ~ dx a2/ dx2 ' fxy — 32f dxdy fyx — 32f dydx Ukážeme, že ve skutečnosti spolu za rozumných podmínek parciální derivace komutují, tzn. není potřeba dbát 1, na pořadí, ve kterém je provádíme. Dle předpokladu existence a spojitosti parciálních derivací existují limity fxy O. y) = lim - (fx (x, y + t) - fx (x, y)) = = lim - lim - (f (x + s, y + t) - f (x, y + t)- - f(x + s,y) + f(.x,y)Ýj. Protože ale limity můžeme vyjádřit pomocí libovolného výběru hodnot tn —> 0 a sn —> 0 a limit příslušných posloupností, bude jistě také platit fxy(x, y) = lim j +t,y + ť)- f(x, y + t))- -(f(x + t,y)- f(x,y)Ýj a tato limitní hodnota je spojitá v (x, y). Označme si výraz, ze kterého bereme poslední limitu, jako funkci °)J V 0 2/e) Připomeňme, že vlastními čísly diagonální matice jsou právě hodnoty na diagonále a že pozitivní definitnost matice znamená, že všechna její vlastní čísla jsou kladná. Odtud již plyne, že v bodě [—2, 0] je ostré lokální minimum. □ 8.29. Nalezněte lokální extrémy funkce fix, y, z) = x3 + y2 + £ - 3xz -2y + 2z, x, y, z e K. Řešení. Funkce / je polynomem (mnohočlenem), a tudíž o ní víme, že má parciální derivace všech řádů. Hledejme proto stacionární body (jinde extrém být nemůže) tak, že zderivujeme / postupně podle x, y, z a tyto derivace položíme rovny nule. Takto dostaneme 3r -3z = 0, tj. z =x2, 2y -2 = 0, tj. y = l, a (s využitím první rovnice) z - 3x + 2 = 0, tj. x e {1,2}. Existují tedy dva stacionární body [1,1,1], [2, 1, 4]. Vypočtěme nyní všechny parciální derivace druhého řádu fx: 1. ^X, fxy fyx 0, fXZ fzj fyy — 2, fyZ — fZy — 0, fzz — S jejich pomocí ve stacionárních bodech snadno určíme Hessián ; / 6 0 -3\ /12 0 -3> Hf (1,1, 1) = 0 2 0 , Hfi2, 1,4)= 0 2 0 -3 0 1 -3 0 1 Potřebujeme zjistit, zda jsou tyto matice pozitivně definitní, negativně definitní, příp. indefinitní, abychom mohli rozhodnout, jestli a jaké jsou v nich extrémy. V případě první z matic (pro bod [1,1,1]) ihned vidíme vlastní číslo X = 2. Neboť je její determinant roven —6 a jedná se o symetrickou matici (všechna vlastní čísla jsou reálná), matice musí mít také záporné vlastní číslo (determinant je součinem vlastních čísel). Matice H f (1, 1, 1) je tedy indefinitní - v bodě [1,1,1] extrém není. Pro matici Hf i2, 1,4) použijeme tzv. Sylvestrovo kritérium. Podle tohoto kritéria je reálná symetrická matice an 1213 • • a\r^ a22 1223 • ■ Uln A = «13 «23 «33 • O-ln «3n • Nyní gy ix, y) — fy ix +t, y)—fy(x,y),a proto můžeme psát

0 zaručit požadovanou rovnost fxyix, y) = fyxix,y) ve všech bodech (x, y). Stejný postup pro funkce n proměnných dokazuje následující základní výsledek: _______J záměnnost parciálních derivací _. 8.10. Věta (Schwarzova). Nechť f : En -> R je funkce třídy (ý v okolí bodu i 6 1". Pak jsou všechny parciální derivace funkce f v bodu x až do řádu k včetně nezávislé na pořadí derivování. Důkaz. Důkaz pro druhý řád byl proveden výše ve speciál-ním případě n — 2 a postup v obecném případě se "/ nijak neliší. Formálně můžeme celý důkaz vést tak, že pro každou pevnou volbu dvou souřadnic x j a xj se vždy celá diskuse jejich záměnnosti odehraje ve dvourozměrném afinním pod-prostoru, tj. všechny ostatní proměnné považujeme za konstantní a v argumentaci nijak aktivně nevystoupí. U derivací vyššího řádu důkaz dokončíme indukcí podle řádu. Skutečně, každé pořadí indexů i\, ... ,ii lze vytvořit z pevně zvoleného záměnami sousedících dvojic. □ 8.11. Hessián. Takjako jsme u derivací prvního řádu zavedli diferenciál coby lineární formu d fix) přibližující nejlépe v daném bodu x funkci /, budeme nyní chtít porozumět kvadratickému přiblížení funkcí / : En —> R. | Hessián [__, Je-li / : R™ —> R libovolná dvakrát diferencovatelná funkce, nazýváme symetrickou matici funkcí í 92/ V dxi dxj ix) H f(x) Hessián funkce f v bodě x. a2/ , s ix)\ a2/ dx\ dxn dx„dx„ W/ 446 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI pozitivně definitní, právě když všechny vedoucí hlavní minory A, tj. determinanty a\\ a\2 fli3 d\ = \a\\\,a\- a\\ au Cl\2 Cl22 íl\2 ÍI22 «23 fll3 fl23 «33 jsou kladné, a je negativně deřinitní tehdy a jenom tehdy, když je |A|, di < 0, d2> 0, d3 < 0, Z nerovností 12 12 > 0, 12 0 0 2 24 > 0, (-l)ndn >0. 3 12 0 0 2 0 -3 0 1 : 6 > 0, vyplývá, že matice H f (2,1, 4) je pozitivně definitní - v bodě [2,1,4] je ostré lokální minimum. □ 8.30. Stanovte lokální extrémy funkce z =(*2-l)(l ■V2), x,ye Řešení. Opět spočítáme parciální derivace zx &zy a položíme je rovny nule. Takto obdržíme rovnice -6x5 +4r +2x- 2xy2 = 0, (x2 - l) (-2y) = 0 s řešeními [x, y] = [0, 0], [x, y] = [1, 0], [x, y] = [—1, 0]. Doplňme, že k nalezení řešení stačilo určit reálné kořeny 1, —1 polynomu — 6x4 + Ax2 + 2 pomocí substituce u -derivace zxx = -30*4 + 12x2 + 2 - 2y2, zx . Nyní vypočítáme druhé parciální Z předchozích úvah jsme již viděli, že vynulování diferenciálu v bodě (x, y) e E2 zaručuje stacionární chování podél všech křivek v tomto bodu. Hessián H fix, y) ''fxxix,y) fxyix,y) \fxyiX,y) fyy(x,y) hraje roli druhé derivace. Pro každou parametrizovanou přímku ciť) = ixit), yit)) = ix0 + f ř, y0 + r)ť) budou totiž mít funkce jedné proměnné ait) = fixit),yit)) 3/ 3/ Pit) = fi*o, yo) + — (xo, yo)Št + — (*o, yoW dx dy + '^(^fxxixo, yo)r + 2fxyix0, y0)^r] + fyy(xo, yoW^ stejné derivace do druhého řádu včetně v bodě t — 0 (přepočtěte si!). Funkci p přitom můžeme zapsat vektorově jako Pii) = fix0, y0)+dfix0, y0) ^ t + i (f rf)Hf{x0, y0) t2 neboli Pit) = f(x0, yo) + dfix0, yo)(v)t + jHfix0, y0)iv, v)t2, kde v — (f, rf) je přírůstek zadaný derivací křivky c(ř) a Hessián je použit jako symetrická 2-forma. To je vyjádření, které již určitě připomíná Taylorovu větu funkcí jedné proměnné, přesněji řečeno kvadratické přiblížení funkce Taylorovým polynomem druhého řádu. Na následujícím obrázku je vynesena jak tečná rovina tak toto kvadratické přiblížení v jednom bodu pro funkci fix, y) — sin (x) cos (y). -4xy, zyy = -2 (x2 - 1) a ve stacionárních bodech vyčíslíme Hessián: Hz (0, 0) = °) . H^ (L °) = H^ (-L °) = ("J6 °qj Vidíme, že první z matic je pozitivně definitivní, a tudíž je v počátku ostré lokální minimum. Zbývající dvě matice jsou ale negativně semidefinitní. Nelze tedy na základě druhých parciálních derivací s určitostí říci, zdaje v bodech [1,0], [—1,0] extrém. Zkoumejme proto funkční hodnoty v okolích těchto bodů. Platí z (1,0) = z (-1,0) = 0, zix,0)<0 prox€ (-1,1). Uvažujme dále y v závislosti na x e (—1,1) dané předpisem y = ^2 (l — x4) splňujícím, že y —► 0 pro x —► ±1. Pro tuto volbu je však z (x, ^2(1 -x4)) = (x2 - 1) {xA - 1) > 0, x € (-1, 1). Ukázali jsme, že v libovolně malých okolích bodů [1, 0], [—1, 0] nabývá z hodnot větších i menších, než je funkční hodnota v těchto bodech. Nejedná se tak o extrémy. □ 8.12. Taylorova věta. Vícerozměrná verze Taylorovy věty j e také W. Budou to vždy ^-lineární výrazy v přírůstcích a nás bude zajímat jen jejich vyčíslení na k stejných hodnotách. Již jsme diskutovali diferenciál D1 f — df v prvním řádu a Hessián D2f — H f v řádu druhém. Obecně pro funkce / : En —> 447 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.31. Rozhodněte, zda má polynom p(x, y) = x6 + y8 + yAxA -x6ý ve stacionárním bodě [0, 0] lokální extrém. Řešení. Snadno lze ověřit, že parciální derivace px a py jsou v počátku skutečně nulové. Také všechny parciální derivace pxx ,pxy, pyy jsou ale v bodě [0, 0] rovny nule. Hessián Hp (0, 0) je tudíž současně pozitivně i negativně semiderinitní. Jednoduchá úvaha však ihned dává výsledek. Všimněme si např., že je p(0, 0) = 0 a současně p(x, y) = x6 (1 - y5) + y8 + yAxA > 0 pro [x, y] € K x (—1,1) \ {[0,0]}. Zadaný polynom má proto v počátku lokální minimum. □ 8.32. Určete lokální extrémy funkce / y2z + x — z na K3. l,f(x, y,z)=x2y + O 8.33. Určete lokální extrémy funkce / : K3 —► K, f(x, y,z) = x2 y — y2z + 4x + znaK3. O 8.34. Určete lokální extrémy funkce / y2z — x + y na K3. ,f(x, y, z) = xz2 + O 8.35. Určete lokální extrémy funkce / : K3 —► K, f(x, y,z) = Ýz — xz2 + x + 4y svého minima na K3. O 8.36. Určete lokální extrémy funkce / : K2 —► K, f (x, y) = x2y + x2 +2y2 +y na K2 O 8.37. Určete lokální extrémy funkce / : K2 —► K, f (x, y) = x2y + 2y2+2ynnR2. O 8.38. Určete lokální extrémy funkce / xy + ly2 + y na K2. 8.39. Určete lokální extrémy funkce / xy — 2-y2 + y na K2. í, /(*, y) = x2 + O i, f(x, y) = x2 + O F. Funkce a zobrazení dané implicitně 8.40. Buď dána funkce F : K2 K, F (x, y) = xy sin (f xy2). Ukažte, že rovnost F (x, y) = 1 zadává v nějakém okolí U bodu [1,1] implicitně funkci / : U —► K tak, že platí F(x, f (x)) = 1 pro x € U. Určete /'(l). Řešení. Funkce je diferencovatelná na celém K2, tím spíše na nějakém okolí bodu [1, 1]. Vyčísleme Fy v bodě [1,1]: Fy (x, y) — x sin ^—xy2^ + n x2 y2 cos ^—xy2^j , tedy Fy(l, 1) = 1 ^ 0, tudíž podle věty 8.18 předpis F(x, y) = 1 zadává implicitně na okolí bodu (1, 1) funkci / : U —► K, definovanou R, body x = (jci.....Jt2) 6 En a přírůstky ľ = (fi,...,f„) klademe rŕfíxHv) = J2 3kf l<í'l ,...,í'í:<řl 9*;, ... 9xiit Všimněme si, že skutečně jde v tomto výrazu o vyčíslení ^-lineární formy na k kopiích stejného argumentu v. Názorným příkladem (s využitím symetrií parciálních derivací) je pro Ei výraz třetího řádu % a3/ , a3/ , D3f(x, = -f £3 + 2V + ox3 dxz dy 33/ , 2 , 33/ 3 a obecně DVfeyXf, TJ): 4 / 3x3y2 ^ ' 3y3 _( Taylorův rozvoj se zbytkem (_ Věta. Nechť f : En Rje funkce třídy Ck v okolí Os (x) bodu x e E„. Pro každý přírůstek v e R™ s velikostí \\v\\ < S pak existuje číslo 0 < 9 < 1 takové, že f(x + v) = f(x) + Dlf(x)(v) + LD2f(x)(v)+ 1 Dk-lf(x)(v) + l-Dkf(x+9-v)(v). (k - 1)! k\ Důkaz. Pro přírůstek v e R™ uvažujme parametrizovanou ,.í1 ., přímku c(t) = x+tv v E„ a zkoumejme funkci

definovanou složením f (xq). Pokud nastává v předchozích nerovnostech ostrá nerovnost pro všechny x ^ xq, hovoříme o ostrém extrému. Pro jednoduchost budeme nadále předpokládat, že naše funkce / má spojité parciální derivace prvního i druhého řádu na svém definičním oboru. Nutnou podmínkou pro existenci maxima nebo minima v bodě xq je vymizení diferenciálu v tomto bodě, tj. df(xo) = 0. Skutečně, pokud je df (xq) ^ 0, pak existuje směr v, ve kterémje dvf(xo) 7^ 0. Pak ovšem nutně podél přímky xq + tv na jednu stranu od bodu xq hodnota funkce roste a na druhou klesá, viz odstavec 5.32 na straně 263. Vnitřní bod x e En definičního oboru funkce /, ve kterémje diferenciál df (x) nulový nazýváme stacionární bod funkce f. □ 449 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.43. Ukažte, že zobrazení f : K3 K2, f(x,y,z) = (f(x,y, z), g(x, y, z)) = (eJcsmy,xyz) zadává v okolí bodu [1, jí, 1] předpisem f(x, ci{x), c2(x)) = (0, 0) křivku c : K K2. Určete tečný vektor této křivky v bodě 1. Řešení. Určeme čtvercovou matici parciálních derivací zobrazení f podle proměnných vaz: ''fy fz\ _ (xcosyexúríy 0 ' H(x, y, z) : tedy H(l, ji, 1) 8 y 8 Z -1 0 1 jí xz xy a det/ř(l,7r, 1) -jr ^ 0, tudíž podle věty o implicitním zobrazení (viz 8.18) zadává předpis f(x,c\(x),c2(x)) = (0,0) na okolí bodu [í,ji, 1] křivku (c\(x), c2(x)) definovanou na nějakém okolí bodu [1, ji]. Abychom vyčíslili její tečný vektor v tomto bodě, musíme ještě určit v tomto bodě (sloupcový) vektor (fx, gx). (fA = (smye*s™y\ (fx(l,jr,l)\ /0N hledaný tečný vektor je tak (Cl)x(l) (C2)x(l)) fy{l,Jt,l) fz{l,Jt,l)\ fx(l,Jt,l gy(l,Jt,l) gz(l,K,l)) \gx(l,Jt,l) i -1 0 1 jí -1 0 1 1 7t 7t □ G. Vázané extrémy Začněme s tak trochu netypickým optimalizačním problémem 8.44. Sázková kancelář vypisuje kurzy na výhru jednoho, či druhého hráče v tenisovém zápase. Hráč A má kurz a : 1, hráč B má kurz b : 1, tj. v případě sázky x Kč na hráče A obdrží v případě jeho výhry sázející ax Kč, obdobně pro hráče B (poplatky zanedbáváme). Jaká je nutná podmínka pro (kladná reálná) čísla a a b, aby si sázející vhodným rozdělením vsazených peněz mezi sázky na výhru A a na výhru B nemohl zaručit zisk, ať vyhraje kdokoliv (např. při kurzu 1,4: 1 na výhru hráče A a 5 : 1 na výhru B by si sázející při sázce 3 Kč na výhru S a 7 Kč na výhru A zajistil vždy zisk). Řešení. Nechť má sázející k dispozici P Kč. Svoji sázku může rozdělit nafeP a (1 — k)P korun, kdefe e (0,1). Jeho výhra pak bude baďakP korun v případě výhry hráče A, nebo b(l — k)P korun v případě výhry hráče B. Při daném rozdělení si sázející vždy zaručí výhru odpovídající menší z těchto částek, celkový zisk (ztráta) pak bude dána ještě odečtením částky P. Protože a, b i P jsou kladná reálná čísla, je funkce akP rostoucí a funkce b(l — k)P klesající vzhledem ke k. Pro k = 0 je větší b(l—k)P, pro k = 1 je pak větší (1— fe)P. Maximum z minim Budeme opět chvíli pracovat s jednoduchou funkcí v E2 abychom závěry přímo mohli ilustrovat. Uvažme funkci f(x, y) = sin(x) cos(y), která už byla předmětem diskuse a obrázků v odstavcích 8.9 a 8.8. Svým tvarem tato funkce připomíná známá kartónová plata na vajíčka, je tedy předem zřejmé, že najdeme řadu extrémů, ale ještě více stacionárních bodů, které ve skutečnosti extrémy nebudou (ta „sedýlka" viditelná na obrázku). Spočtěme si tedy první a poté potřebné druhé derivace: fx{x, y) = cos(x) cos(y), fy(x, y) = - sin(x) sin(y) a obě derivace budou zároveň nulové pro dvě sady bodů H fix, y) í fxx \fxy 0, to je (x, y) 0, to je (x, y) (x,y) i^n,tn), pro (len, ^p-jt), pro (1) cos(x) — 0, sin(y) libovolné k, t e Z (2) cos(y) — 0, sin(x) libovolné k,t e Z. Druhé parciální derivace jsou fxy Jxy fyy) (— sin(x) cos(y) — cos(x) sin(y) cos(x) sin(y) — sin(jc) cos(y) V našich dvou sadách stacionárních bodů tedy dostáváme následující Hessiány: (1) Hf(kjz + j, In) — ± ^ ^, přičemž znaménko — nastává, když parity kat jsou stejné a naopak pro +; (2) Hf(kn, tn + j) — ^j, přičemž znaménko — nastává, když parity kat jsou stejné a naopak pro +. Když se nyní podíváme na tvrzení Taylorovy věty pro řád k — 2, dostáváme v okolí jednoho ze stacionárních bodů (xq , yo) pro body se souřadnicemi x — xq +u,y — yo + v 1 f(x, y) = f(x0, yo) + -Hf(x0 + 9u, yo + 9v)(u, v), kde H f nyní vnímáme jako kvadratickou formu vyčíslenou na přírůstku (u, v). Protože naše funkce má spojitý Hessián (tj. spojité parciální derivace do druhého řádu včetně), a matice Hessiánu jsou nedegenerované, nastane lokální maximum tehdy a jen tehdy, když náš bod (xq, yo) patří do první skupiny se stejnými paritami kat. Když budou parity opačné, pak bod z první skupiny bude naopak bodem lokálního minima. Naopak, Hessián u druhé skupiny bodů se vždy vyčíslí kladně na některých přírůstcích a záporně na jiných. Proto se tak bude chovat i celá funkce / v malém okolí daného bodu. Abychom mohli zformulovat obecné tvrzení o Hessiánu a lokálních extrémech ve stacionárních bodech, musíme připomenout diskusi o kvadratických formách v odstavcích 4.31^1.32 v kapitole o afinní geometrii. Zavedli jsme tam pro kvadratickou formu h : M„ —> R následující přívlastky • positivně definitní, je-li h(u) > 0 pro všechny • positivněsemidefinitní, je-li h(u) > 0 pro všechny u e V • negativně definitní, je-li h(u) < 0 pro všechny • negativně semidefinitní, je-U h(u) < 0 pro všechny u e V • indefinitní, je-li h(u) > 0 a f (v) < 0 pro vhodné u, v e R™. ZavedU jsme také nějaké metody, které umožňují přímo zjistit, zda daná forma má některý z těchto přívlastků. 450 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI z čísel akP a b{\ — k)P tedy nastane pro k e (0, 1) a to pro to ko, pro které akoP = bil — ko)P, odkud ko a+b . Sázková kancelář, aby nezkrachovala, pak musí volit a, b tak, aby ako P = bil —ko)P < P, neboli ako < 1, čili ab < a + b. □ Při této vázané optimalizaci jsme se obešli bez diferenciálního počtu. V dalších příkladech už tomu tak nebude. 8.45. Najděte extrémní hodnoty funkce h(x,y,z) = x3 +y3 +z\ jednak na jednotkové sféře 5vB3 dané rovnicí F{x, y,z) = x2 -fy2 +z2-l, a také na kružnici dané průnikem této sféry s rovinou Gix, y, z) = x + y + z- Řešení. Začněme hledáním stacionárních bodů pro funkci h na sféře S. Výpočtem příslušných gradientů (např. gradh{x, y, z) = {3x2, 3y2, 3z2)) dostaneme systém rovnic 0 = 3x2 — Tkx, 0 = 3y2 - 2Xy, 0 = 3z2 - 2Xz, 0 = x2 + y2 + z 1, což je systém čtyř rovnic o čtyřech proměnných. Před řešením tohoto systému si zkusme odhadnout, kolik lokálních vázaných extrémů bychom měli čekat. Určitě bude h{P) v absolutní hodnotě rovno na jednotkové sféře nejvýše jedné a to nastane ve všech průnicích souřadných os s S. Máme tedy pravděpodobně 6 lokálních extrémů. Dále uvnitř každé osminy sféry vytčené souřadnými rovinami může, ale nemusí, být další extrém. Jednotlivé kvadranty lze snadno oparametrizo-vat a průběh funkce h coby funkce dvou parametrů ověřit standardním způsobem (nebo si nechat vykreslit třeba programu v Maple). Řešením systému (ať už algebraicky nebo opět v programu Maple) obdržíme ve skutečnosti spoustu stacionárních bodů. Kromě šesti, o kterých už víme (dvě souřadnice nulové a jedna ±1) a u kterých je X = ± |, jsou to např. ještě body P = ± I __! __! __! ve kterých skutečně nastává lokální extrém. Jestliže omezíme náš zájem na body kružnice K, musíme přidat další funkci G jeden další volný parametr r\ coby koeficient u jejího Taylorův rozvoj se zbytkem okamžitě dává platnost následující věty: Věta. Necht f : En -» R je funkce třídy C2 v okolí svého stacionárního bodu x e En.2 Potom (1) f má v x ostré lokální minimum, je-li Hf(x) positivně defi-nitní, (2) fmávx ostré lokální maximum, je-li Hf(x) negativně defi-nitní, (3) f nemá v bodě x lokální extrém je-li Hf(x) indefinitní. Důkaz. Taylorův rozvoj druhého řádu se zbytkem aplikovaný na naši funkci f (x\, ... ,xn), libovolný bod x — (x\, ..., xn) a libovolný přírůstek v — (v\, ... ,vn), takové že jak x tak x + v jsou v definičním oboru funkce /, říká f(x + v) = f(x) + df(x)(v) + Uif(x + 9 ■ v)(v), pro vhodné reálné 0 < 9 < 1. Dle předpokladu o nulové hodnotě diferenciálu je tedy fix + v) = f(x) + jHf(x + 6 ■ v)(v). Podle našeho předpokladu je kvadratická forma Hf(x) spojitě závislá na bodu x a definitnost, resp. indefinitnost, kvadratických forem je rozhodnutelná podle znaménka vedoucích hlavních subde-terminantů matice Hf, viz Sylvestrovo kritérium v odstavci 4.32. Samotný determinant je ale coby polynomiální výraz v koeficientech matice spojitou funkcí, proto nenulovost a znaménka zkoumaných determinantů v dostatečně malém okolí bodu x budou stejná jako v bodě x samotném. Zejména tedy pro pozitivně definitní Hf(x) máme ve stacionárním bodu x zajištěno, že f(x + v) > f(x) pro dostatečně malá v, jde tedy o ostré minimum funkce / v bodě x Analogicky pro negativní definitnost. V případě indefinitní formy Hf(x) budou existovat směry v, w ve kterých f (x + v) > f (x) a f (x + w) < f(x), a tedy v diskutovaném stacionárním bodu extrém žádný nenastává. □ Všimněme si, že věta nedává žádný výsledek, pokud je Hes-sián funkce ve zkoumaném bodě degenerovaný a přitom není indefinitní. Důvod je opět stejný jako u funkcí jedné proměnné. V takových případech totiž existují směry, ve kterých první i druhá derivace zmizí a my proto v tomto řádu přiblížení neumíme poznat, zda se funkce bude chovat jako t3 nebo jako ±ř4, dokud nespočteme alespoň v potřebných směrech derivace vyšší. Zároveň si povšimněme, že i v bodech, kde je diferenciál nenulový, má definitnost Hessiánu Hf(x) podobné důsledky jako nenulovost druhé derivace u funkce jedné proměnné. Skutečně, pro funkci / : R" -» R výraz z(x + v) = f(x) + df(x)(v) zadává tečnou nadrovinu ke grafu funkce / v prostoru R™+1, a proto Taylorova věta druhého řádu se zbytkem, tak jak byla využita v důkazu, ukazuje, že při pozitivní definitnosti Hessiánu jsou všechny hodnoty funkce / v dostatečně malém okolí bodu x nad hodnotami na tečné nadrovině, tj. celý graf je v dostatečně malém okolí nad tečnou nadrovinou. V případě negativní definitnosti je Ve skutečnosti důkaz této věty vyžaduje jen dvakrát diferencovatelnou funkci /, bez předpokladu spojitosti derivací na okolí bodu x. 451 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI gradientu. Dostaneme tak větší systém rovnic 0 = 3x2 — 2Xx — 1, 0 = 3y2 - 2Xy - 1, 0 = 3z2 - 2Xz - 1, 0 = x2+y2+z2 - 0 = x + y + z. Protože je i kružnice kompaktní množinou, nutně na ní musí mít h globálni maximum a globálni minimum. Další rozbor ponecháme na čtenáři. □ 8.46. Rozhodněte, zda funkce / : K3 K, f (x, y, z) = x2 y nabývá extrémů na ploše 2x2 +2y2 +z2 = 1. Pokud ano, tak tyto extrémy nalezněte a určete, o jaké extrémy se jedná. Řešení. Protože vyšetřujeme extrémy spojité funkce na kompaktní množině (elipsoidu) - je to uzavřená a omezená množina v K3 - musí na něm daná funkce nabývat jak minima, tak maxima. Navíc, protože vazební podmínka je dána spojitě diferencovatelnou funkcí a zkoumaná funkce je diferencovatelná, extrémy musí nastat ve stacionárních bodech vyšetřované funkce na dané množině. Pro stacionární body sestavíme soustavu: 2xy x2 0 Akx, 4ky, 2kz. Z druhé rovnice dostáváme, že buď y = 0, nebo x . První tomu naopak. U indefinitních hodnot Hessiánu opět graf funkce přechází z jedné strany tečné nadroviny na druhou, to se ale obecně děje podél objektů nižší dimenze v tečné nadrovině, nemáme tedy k dispozici přímočaré zobecnění inflexních bodů. 8.14. Diferenciál zobrazení. Koncept derivace a diferenciálu lze snadno rozšířit na zobrazení F : En -» Em. Při zvolených kartézských souřadnicích na obou stranách je ^l^jw; takové zobrazení obyčejná m-tice ,xn), ■ (f\(x\, ...,*„), fm(x\, Řekneme, že zobrazení F je diferencovatelné nebo třídy (ý, jestliže tuto vlastnost mají všechny funkce /l, ■ ■ ■ ■ fm- _______] Diferenciál a Jacobiho matice__ Diferenciály df (x) jednotlivých funkcí fi zobrazení F(x\,. ..,*„) = (f\(x\, .. .,xn), fm(x\, .. .,xn)) poskytují lineární přiblížení přírůstků jejich hodnot. Lze proto očekávat, že budou společně dávat také souřadné vyjádření lineárního zobrazení DlF{x) : W -» Rm mezi zaměřeními, které bude lineárně aproximovat přírůstky našeho zobrazení. Výsledná matice (dfi(x)\ df2(x) DlF{x) = — \dfm(x)) Ml 9x1 Ml 9xi Mul Ml MÍ 3x2 Mul 3x2 Ml\ dx„ Ml Mul, dx„ / se nazývá Jacobiho matice zobrazení F v bodě x. Lineární zobrazení DlF(x) definované na přírůstcích v — (vi, vn) pomocí stejně značené Jacobiho matice nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže platí Jejím řešením jsou body [±-^j, 0] a —75' Funkce na- bývá pouze dvou funkčních hodnot v těchto čtyřech stacionárních bodech. Z výše uvedeného vyplývá, že první dva uvedené stacionární body jsou maxima dané funkce na uvedeném elipsoidu a druhé dva potom minima. □ 8.47. Určete, zda existují maxima a minima funkce / : K3 —► K, f (x, y,z) = z — xy2 na sféře x2 +z2 = l. Pokud extrémy existují, určete je. Řešení. Řešíme soustavu x = —ky2, y = —2kxy, z = k. lim u->0 lil) — (F(x + d) - F(x) - D1F(x)(v)) = 0. možnost vede k bodům [0, 0, 1], [0, 0, —1]. Druhá pak nemůže být Již jsme několikrát použili skutečnost, že definice euklidovské vzdálenosti má za důsledek, že limity hodnot v En existují tehdy a jen tehdy, když existují limity jednotlivých souřadných komponent. Přímé použití věty 8.5 o existenci diferenciálu pro funkce n proměnných na jednotlivé souřadné funkce zobrazení F proto vede k následujícímu tvrzení (dokažte si případně podrobněji samostatně!): Důsledek. Nechť F : En -> Em je zobrazení třídy C1 v okolí bodu x e E„. Pak existuje v tomto bodě diferenciál Dl Fix) a je zadaný Jacobiho maticí DlFix). 8.15. Transformace souřadnic. Zobrazení F : E„ -> E„, která mají inverzní zobrazení G : En —> En definované na «( celém svém obrazu, se nazývají transformace. Každé takové zobrazení je možné vnímat jako změnu souřadnic. Zpravidla požadujeme, aby F i G bylo (spojitě) diferencovatelné zobrazení. Stejně jako u vektorových prostorů, volba našeho „pohledu na věc", tj. volba souřadnic, může zdánlivě zjednodušit nebo zhoršit naše porozumění studovanému objektu. Změnu souřadnic nyní 452 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI splněna (dosazením do rovnice koule dostaneme rovnici 1, 1 1 2 4k2 + 2k2+" která nemá řešení. Ve dvou vypočtených bodech na dané sféře má funkce maximum, resp. minimum. □ 8.48. Rozhodněte, zda existují extrémy funkce / : K3 —► K, f (x, y, z) = xyz, na elipsoidu určeném rovnicí g(x,y,z) = kx2 +ly2 +z2 = í, k,leR+. Pokud extrémy existují, určete je. Řešení. Nejprve sestavíme rovnice, které musí splňovat stacionární body dané funkce na elipsoidu: dx dy : X : X 9/ dx 9/ dy 9/ yz xz xy 2Xkx, 2Xly, 2Xz. dz dz Snadno nahlédneme, že řešením dané rovnice musí být trojice nenulových čísel. Po vydělení dvojic rovnic a dosazení do rovnice elipsy dostaneme osm řešení. Dostaneme osm stacionárních bodů x = ±^=, y = ±7^|, z = ±-^j,v nichž ovšem funkce / nabývá pouze dvou různých hodnot. Protože / je spojitá a daný elipsoid je kompaktní, tak na něm / nabývá jak svého minima, tak maxima. Neboť navíc jak / tak g jsou spojitě diferencovatelné, tak tyto extrémy musí nastat v stacionárních bodech. Není tedy jiné možnosti, než že čtyři z daných stacionárních bodů jsou lokálními maximy dané funkce s maximem i zbývající čtyři pak minima s hodnotou — ^=. □ 8.49. Stanovte globální extrémy funkce f(x, y) = x2 - 2y2 + 4xy - 6x - 1 na množině bodů [x, y] vyhovujících nerovnostem (8.1) x>0, y>0, y<-x + 3. Řešení. Máme zadán polynom se spojitými parciálními derivacemi na kompaktní (tj. uzavřené a ohraničené) množině. Taková funkce nutně nabývá své nejmenší a nej větší hodnoty na této množině, a to ve stacionárních bodech nebo na hranici. Stačí tedy najít stacionární body uvnitř množiny a stacionární body na konečném počtu otevřených (příp. jednobodových) částí hranice, vyčíslit v těchto bodech / a vybrat největší a nejmenší hodnotu. Dodejme, že množina bodů určená nerovnostmi (||8.11|) je zřejmě trojúhelníkem s vrcholy [0, 0], [3, 0], [0, 3]. Určeme stacionární body uvnitř tohoto trojúhelníku jako řešení rovnic fx =0, fy = 0. Neboť diskutujeme v daleko obecnější formě než jen u afinních zobrazení v kapitole čtvrté. Někdy se v tomto obecném smyslu užívá označení „křivočaré souřadnice". Velice názorný příklad je změna nej obvyklejších souřadnic v rovině na tzv. polární, tj. polohu bodu P zadáváme pomocí jeho vzdálenosti od počátku souřadnic r = s/x2 + y2 a úhlu

>-» 0 C0S(P' r ún(P) = kartézské Je přitom zjevné, že je nutné polární souřadnice vhodně omezit na podmnožinu bodů (r, Em a G : Em —> Er jsou dvě diferencovatelná zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak také složené zobrazení G o F je diferencovatelné a jeho diferenciál je v každém bodě z definičního oboru F kompozicí diferenciálů Dl(GoF)(x) = DlG(F(x))oDlF(x). Příslušná Jacobiho matice zobrazení G o F je dána součinem příslušných Jacobiho matic zobrazení G a F v tomto pořadí. 453 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI fx(x, y) = 2x + 4y - 6, fy(x, y) = 4x - 4y, těmto rovnicím vyhovuje pouze bod [1, 1]. Hranici můžeme (nabízejícím se způsobem) vyjádřit jako sjednocení tří úseček výběrem dvojic vrcholů. Nejprve uvažujme x = 0, y e [0, 3], kdy je f (x, y) = —2y2 —1. Graftéto funkce (jedné proměnné) na intervalu [0, 3] ovšem známe. Není tudíž obtížné stanovit body, ve kterých nastávají globální extrémy. Jde o krajní body [0, 0], [0, 3]. Podobně můžeme uvažovat y = 0, x € [0, 3], přičemž také obdržíme jenom krajní body [0, 0], [3, 0]. Zbývá úsečka y = — x + 3, x e [0, 3], pro niž po úpravě dostáváme f(x, y) = f(x, -x + 3) = -5x2 + ISx - 19, x € [0, 3]. Potřebuje tedy najít stacionární body polynomu p(x) = —5x2+lSx — 19 z intervalu [0, 3]. Rovnici p'(x) = 0, tj. -lOx + 18 = 0, pak vyhovuje x = 9/5. To znamená, že v posledním případě jsme (kromě již zahrnutých krajních bodů) získali ještě jeden bod [9/5, 6/5], ve kterém může být globální extrém. Celkem máme tyto „podezřelé" body [1,1], [0,0], [0,3], [3,0], [f,f] po řadě s funkčními hodnotami -4, -1, -19, -10, Důkaz. V odstavci 8.5 a při důkazu Taylorovy věty jsme ■J: .i odvodili, jak se chová diferencování složených zobrazení 14 " 5 ' Vidíme, že největší hodnoty —1 nabývá funkce / v bodě [0,0] a nejmenší hodnoty —19 pak v bodě [0, 3]. □ 8.50. Rozhodněte, zda funkce / : K3 K, f(x, y, z) = y2 z nabývá extrémů na úsečce dané rovnicemi 2x + y + z = í, x — y + 2z = 0a omezením x e [—1,2]. Pokud ano, tak tyto extrémy nalezněte a určete, o jaké extrémy se jedná. Všechna svoje rozhodnutí zdůvodněte. Řešení. Hledáme extrémy spojité funkce na kompaktní množině, funkce tedy bude nabývat na dané množině jak svého minima tak maxima a to buď v bodech, kde je gradient zkoumané funkce lineární kombinací gradientů funkcí zadávající vazební podmínky, nebo v krajních bodech úsečky. Najděme body splňující podmínku s gradienty: 0 2yz y2 2x + y + z x - y + 2z 2k + l, k-l, k+ 21, 1, 0, vzniklých z funkcí a křivek. Tím jsme dokázali speciální r^jř$ případy této věty s n — r — 1. Obecný případ se od-• '■P ' vodí prakticky stejným postupem, jen budeme pracovat více s vektory. Zvolme libovolný pevný přírůstek v a počítejme směrovou derivaci pro kompozici G o F v bodě x e En. Ve skutečnosti to znamená spočíst postupně diferenciály pro jednotlivé souřadné funkce zobrazení G složené s F. Pišme tedy rovnou jednodušeji goF pro kteroukoliv z nich. dv(g o F)(x) = lim-{g(F(x + ři;)) - g(F(x))). Výraz v závorce můžeme ovšem z definice diferenciálu g vyjádřit jako g(F(x + ři;)) - g(F(x) = dg(F(x))(F(x + tv) - F(x)) + a(F(x+tv) - F(x)), kde a je funkce definovaná na okolí bodu F(x), která je spojitá a splňuje lim„^o jjf"^) — 0. Dosazením do rovnosti pro směrovou derivaci dostáváme dv(g o F)(x) = lim -{dg(F(x))(F(x + tv) - F(x)) t = dg(F(x))(lim-( \t-^o t \ + lim i f a(F(x+tv) - F(x))) F(x +tv) - F(x) tv) - F(x)) a(F(x dg(F(x))oDlF(x)(v) + 0, kde jsme využili vlastnosti funkce a a skutečnosti, že lineární zobrazení mezi konečněrozměrnými prostory jsou vždy spojitá. Dokázali jsme tedy tvrzení pro jednotlivé funkce gi, gr zobrazení G. Celá věta nyní vyplývá z toho, jak se násobí matice. □ Ilustrujme teď využití konceptu transformace a věty o derivaci složených zobrazení na jednoduchém příkladě. Viděli jsme, že polární souřadnice vzniknou z kartézských transformací F : R2 -> R2, kterou v souřadnicích (x, y) a (r, R, která má v polárních souřadnicích vyjádření g (r, (p, t) = sin(r — t). Taková funkce nám snad dobře přibližuje vlnění povrchu hladiny po bodovém vzruchu v počátku v čase t, viz obrázek s hodnotou t — —ti 12. Zatímco v polárních souřadnicích bylo snadné ji zadat, v kartézských bychom asi tápali. 454 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI nás). Krajní body dané úsečky jsou [—1, |, |] a [2, — |, — |]. Z těchto čtyř bodů nabývá funkce největší hodnoty v prvním z krajních bodů (f(x, y, z) = 37), tam tedy nabývá maxima na dané úsečce a nejmenší hodnoty v druhém z krajních bodů (f(x, y, z) = —57), tam tedy nabývá svého minima na dané úsečce. □ 8.51. Najděte maximální a minimální hodnotu polynomu p(x, y) = 4x3 - 3x - 4y3 + 9y na množině M = {[x, y] e K2; x2 + y2 < 1} . Řešení. Také v tomto přikladu máme zadán polynom na kompaktní množině, a proto se omezíme na hledání stacionárních bodů uvnitř či na hranici M a „krajních" bodů na hranici M. Jako řešení rovnic px(x, y) = Í2x2 -3 = 0, py(x, y) = -12v2 +9 = 0 však dostáváme pouze body ľi vil ri r_i vil r_i -Vil |_2'2_|' [2' 2_|' L 2' 2 J ' L 2' 2_|' které se nacházejí na hranici M. To znamená, že p nemá uvnitř M žádný extrém. Stačí tak najít maximum a minimum p na jednotkové kružnici k : x2 + y2 = 1. Kružnici k vyjádříme parametricky jako x = cost, y = sin/, / e [—jr, jr]. Od hledání extrémů p na M tak přecházíme k hledání extrémů funkce /(/) := p(cos t, sin i) =4 cos3 / — 3 cos / — 4 sin3 / + 9 sin / na intervalu [—jt, jt]. Pro / e [—jí, jí] platí /'(/) = —12 cos2 / sin / + 3 sin / — 12 sin2 / cos / + 9 cos /, Abychom mohli určit stacionární body, musíme funkci /' vyjádřit ve tvaru, ze kterého bude možné vypočítat, kde její graf protíná osu x. Použijeme k tomu identitu -\- = 1 + tg2 /, cosz t 1 & > která platí všude, kde mají obě strany smysl. S její pomocí dostáváme /'(/) = cos3 / [-12tg/ + 3 (tg / + tg3 /) - 12tg2 / + 9 (1 + tg2/)] pro / e [—ji, jí] taková, že je cos/ 7^ 0. Toto omezení ovšem nevyloučí žádné stacionární body, protože sin / ^ 0, je-li cos / = 0. Stacionárními body / jsou tak body / e [—Jt, jí], pro které je -4tg/ + tg/ + tg3/ -4tg2 / + 3 + 3tg2 / = 0. Substitucí s = tg / obdržíme i3 - s2 - 3s + 3 = 0, tj. (s - 1) (í - Vš) (s + Vš) = 0. Hodnotám s = 1, s = i/3, -V3 odpovídá postupně Spočtěme nyní derivaci této funkce v kartézských souřadnicích. Použitím naší věty dostaneme dg dg dr dg tkp — (x, y, t) = — (r, E\ a lineárních zobrazení R —> R coby jejich diferenciálů, jenenu-lovost nutnou a dostatečnou podmínkou k invertibilitě příslušného diferenciálu. Takto obdržíme tvrzení platné pro konečněrozměrné prostory obecně: ___I věta o inverzním zobrazení j_--- Věta. Nechť F : En —> En je diferencovatelné zobrazení na nějakém okolí bodu xo e E„ a nechť je Jacobiho matice Dl f(xo) in-vertibilní. Pak na nějakém okolí bodu xq existuje inverzní zobrazení F~l a jeho diferenciál v bodě F(xq) je inverzním zobrazením k diferenciálu Dl F(xq), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě xq. t e {-f Jt, j Jt], t e [-In,\jt), t e {-\jí, l jí). Důkaz. Nejdříve si zkusme ověřit, že tvrzení je rozumné a očekávatelné. Pokud bychom předpokládali, že inverzní zobrazení existuje a je diferencovatelné v bodě F(xq), věta o derivování složených funkcí si vynucuje vztah idK» = Dl(F-1 o F)(x0) = D\F-V) o DlF(x0), což ověřuje vztah v závěru věty. Víme proto od začátku, jaký diferenciál pro hledat. V dalším kroku předpokládejme, že inverzní zobrazení na okolí bodu F(xq) existuje a je spojité. Budeme v této situaci ověřovat existenci diferenciálu. Z dife-rencovatelnosti F na okolí xq vyplývá, že F(x) - F(xq) - D1F(xq)(x - xo) = a(x - xq) 455 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Nyní vyčíslíme funkci / ve všech těchto bodech a také v krajních bodech / = — ti, t = ji. Při seřazení podle velikosti j e / (-i jí) = -1 - 3V3 < / (-f jí) = -3V2 < / (-f jí) = 1-3^3 < -1, f (-jí) = f (jí) =-l <0, / (| jí) = 1 + 3V3 > / (i ji) = 3V2 > / (| ti) = -1 + 3V3 > 0. Globální minimum má funkce / tedy v bodě / = —ji/3 a maximum v bodě / = 2jí/3. Nyní se vraťme k původní funkci p. Ze znalosti hodnot cos(-ijr) = \, sin(-ijr) = --f, cos(fjr) = -\, sin (| jt) = nabývá polynom p minimální hodnoty —1 — 3\/3 (pochopitelně stejné jako /) v bodě [1/2, — V3/2] a maximální hodnoty 1 + 3^3 v bodě [-1/2, VŠ/2]. □ 8.52. V jakých bodech nabývá funkce /(*, y) = x2 - 4x + y2 globálních extrémů na množině M : | * | + | J I < 1? Řešení. Pokud vyjádříme / ve tvaru f(x,y) = (x-2)2-4 + y2, je vidět, že tato funkce má globální maximum a minimum ve stejných bodech jako funkce g(x, y) := j(x-2)2 + y2, [x, y] e M. Posunutí funkce ani aplikace rostoucí funkce v = ^Ju pro u > 0 totiž nemění body, kde nastávají extrémy (pouze změní hodnotu extrémů). O funkci g však víme, že udává vzdálenost bodu [x, y] od bodu [2, 0]. Neboť množina M je zřejmě čtvercem s vrcholy [1, 0], [0,1], [—1, 0], [0, —1], nejblíže z bodů M k bodu [2, 0] je vrchol [1, 0] a nejvzdá-lenější je vrchol [—1, 0]. Máme výsledek - minimální hodnotu má / v bodě [1,0] a maximální v bodě [—1,0]. □ 8.53. Spočítejte lokální extrémy funkce y = f (x) určené implicitně rovnicí 3X2 +2xy+x = y2 + 3y + §, [x, y] e K2 \ {[x, x - f] ; x e K} . Řešení. V souladu s teoretickou částí (viz 8.18) označme F (x, y) = 3x2 + 2xy + x - y2 - 3y - f, [x, y] e K2 \ {[x, x - |] ; x e K} a vypočtěme derivaci y = f(x) = —= -|i±2z±i. Vidíme, že tato derivace existuje spojitě na celé zadané množině. Zvláště je na této množině implicitně určena funkce / (jmenovatel je nenulový). se zobrazením a : M" —> M" splňující lim^o j^a (v) — 0. Pro ověření aproximační vlastnosti lineárního zobrazení (Dl F(xo))~l je třeba pouze spočíst následující limitu pro y = F (x) jdoucí kyo = F(x0) 1 -{F-\y) - F-\y0) - (Dl F(x0)yl (y - y0)). lim \\y - yo\\ Dosazením z předchozí rovnosti dostáváme x - xo- lim ■ y^yo ||y — -ya\\\ (DlF(x0))-l(DlF(x0)(x-x0)+a(x-x0))^ -1 = lim y^yo \\y - yo\\ = (D1F(xo))-'1 lim -(DlF(x0)Tl(a(x -xo)) -1 -(a(x - xo)), \\y-yo\\ kde poslední rovnost vyplývá ze skutečnosti, že lineární zobrazení mezi konečněrozměrnými prostory jsou vždy spojitá a díky inverti-bilitě diferenciálu jeho předřazení limitnímu procesu neovlivní ani existenci limity. Chceme dokázat, že tato limita bude nulová. Všimněme si, že jsme zdánlivě s důkazem skoro hotoví. Limita na konci našeho výrazu je v důsledku vlastností funkce a nulová, pokud jsou velikosti \\F(x) — F(xo)\\ větší než C\\x — xo\\ pro nějakou konstantu C. To je o trochu silnější vlastnost, než že je spojité, v literatuře se této vlastnosti říká, že je funkce tipschi-tzovsky spojitá3. Zbývá nám tedy už ,jenom" dokázat existenci Lipschitzovsky spojitého inverzního zobrazení k zobrazení F. Pro další úvahy si zjednodušíme práci převedením obecného případu na o něco jednodušší tvrzení. Zejména bez \ újmy na obecnosti lze vhodnou volbou kartézských souřadnic dosáhnout =0 e R", yo = F(xo) = 0 e W. Složením zobrazení F s jakýmkoliv lineárním zobrazením G dostaneme opět diferencovatelné zobrazení a víme také, jak se změní diferenciál. Volbou G(x) — (Dl F(0))~\x) dostáváme Dl(G o F)(0) = idK». Můžeme tedy zrovna předpokládat DlF(Q) = idK» . Uvažme za těchto předpokladů zobrazení K(x) — F(x) — x. Toto zobrazení je opět diferencovatelné a jeho diferenciál v bodě 0 je zjevně nulový. Pro libovolné spojitě diferencovatelné zobrazení K v okolí počátku M" platí díky Taylorovu rozvoji prvního řádu se zbytkem jednotlivých souřadných funkcí íf, a díky definici euklidovské vzdálenosti odhad \\K(x) -K(ý)\\ < C*Jn\\x - y\\, kde C je ohraničeno maximem všech absolutních hodnot parciálních derivací v Jacobiho matici zobrazení K na sledovaném okolí.4 Protože v našem případě je diferenciál zobrazení K v bodě xo = 0 nulový, můžeme volbou dostatečně malého okolí U Tento mimořádně užitečný technický pojem budeme potkávat často. Není přitom složité najít spojité funkce, které lipschityovsky spojité nebudou, např. f(x) — yixjje spojitá funkce, která ale má v nule nevlastní derivaci a tedy nemůže být lipschitzovská 4Z této úvahy okamžitě plyne, že funkce, která má spojité parciální derivace na kompaktní množině, je na ní i Lipschitzovsky spojitá. 456 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Lokální extrém může nastat pouze pro x, y, pro která je / = 0, tj. 6x +2y +1 = 0. Dosadíme-li y = —3* —1/2 do rovnice Fix, y) = 0, obdržíme po úpravě — 12r + 6x = 0 a následně [x,y] = [0,-±], [x,y] = [\,-2\. Snadno také spočítáme S V ) (2x-2y-3f Dosazením x = 0, y = —1/2, / = 0 a i = 1/2, y = —2, y' = 0 dostaneme y Ji _ 6(-2)-0 >0 pro[*,y] = [0,-i] y, = _6í±p<0 pro [*, y] = [i, -2]. Dokázali jsme tak, že implicitně zadaná funkce má v bodě x = 0 ostré lokální minimum a v bodě x = 1/2 ostré lokální maximum. □ 8.54. Najděte lokální extrémy funkce z = fix, y) zadané na maximální množině implicitně rovnicí (8.2) x2 + y2 + z2 - xz - yz + 2x + 2y + 2z - 2 = 0. Řešení. Derivování (||8.2||) podle x a y dává 2x + 2zzx — z — xzj — yzx + 2 + 2zx = 0, 2y + 2zzy — xzy — z — yzy + 2 + 2zy = 0. Odtud vyplývají rovnosti zx = fxix,y) (8.3) z — 2x — 2 fy(x,y) 2z — x — y + 2 z —2y — 2 2z — x — y + 2 Všimněme si, že parciální derivace jsou spojité všude, kde je definována funkce /. To implikuje, že lokální extrémy mohou být pouze ve stacionárních bodech. Ve těchto bodech pak platí zx = 0, tj. z - 2x - 2 = 0, zy = 0, tj. z -2y -2 = 0. Máme dvě rovnice, které umožňují vyjádřit x a y v závislosti na z. Dosazením do (||8.2||) potom již získáme body [x, y, z] = [-3 + V6, -3 + V6, -4 + 2Vě] , [x, y, z] = [-3 - V6, -3 - V6, -4 - 2Vó] . Nyní potřebujeme druhé derivace k tomu, abychom mohli říci, zda jde v příslušných bodech o lokální extrémy. Derivováním zx v (||8.31|) dostáváme (zx -2) (2z-j-y+2) - (z-2j -2) (2zx -1) Zxx = fxx (x, y) derivuj eme-li podle x, a Z: (2z-X-y+2y f ír ,,\ _ Zy(2z-X-y+2)-(z-2x-2)(2zy-Í) Jxy(X, y> - (2z-X-y+2f počátku dosáhnout platnosti ohraničení \\K(x) - K(y)\\ < i||* - y||. Dále dosazením za definici Kix) = F (x) — x a použitím trojúhelníkové nerovnosti ||(m — v) + d|| < ||m — d|| + ||d||, tj. také ||u|| — ||ií|| < ||m — ií||, dostáváme llv - Odtud konečně \F(x)-F(y)\\ <\\Fix)-Fiy) + y-x\\ < — \\y — x\\ x-y\\< \\Fix)-Fiy)\\ Tímto odhadem jsme dosáhli opravdu pěkného pokroku: jsou-li na našem malém okolí U počátku x ^ y, pak nutně musí být také Fix) 7^ F(y). Je tedy naše zobrazení vzájemně jednoznačné. Pišme F 1 pro jeho inverzi definovanou na obrazu U. Pro ni náš odhad říká \\F-\x) - F-\y)\\ < 2H* ■ ■VII je tedy toto zobrazení určitě nejen spojité ale dokonce Lipschitzov-sky spojité, tak jak jsme v předchozí části důkazu potřebovali. Zdánlivě jsme tedy již úplně hotoví (s důkazem), to ale není \ \ pravda. Abychom skutečně dokončili důkaz, musíme ukázat, že je zobrazení F zúžené na dostatečně malé okolí nejen vzájemně jednoznačné, ale že také zobra-W zuje otevřené okolí nuly na otevřené okolí nuly.5 Zvolme si S tak malé, aby okolí V — Os (0) leželo v U včetně své hranice a zároveň aby Jacobiho matice zobrazení F byla na celém V invertibilní. To je jistě možné, protože determinant je spojité zobrazení. Označme B hranici množiny V (tj. příslušnou sféru). Protože je B kompaktní a F spojité, má funkce p(x) = \\F(x)\\ na B maximum i minimum. Označme a — j minxeb p(x) a uvažujme libovolné y e OaiO). Samozřejmě je a > 0. Chceme ukázat, že existuje alespoň jedno x e V takové, že y — Fix), čímž bude celá věta o inverzní funkci dokázána. Za tímto účelem uvažme funkci (y je náš pevně zvolený bod) h(x) = \\Fix)-y\\2. Opět obraz h(V) U hiB) musí mít minimum. Ukážeme nejprve, že toto minimum nemůže nastat pro x e B. Platí totiž F (0) = 0, a proto /i(0) = ||y|| < a. Zároveň podle naší definice a je pro y e OaiO) vzdálenost y od F(x) pro x e B alespoň a (protože a jsme volili jako polovinu minima z velikosti F(x) na hranici). Minimum tedy nastává uvnitř V a musí být ve stacionárním bodě z funkce h. To ale znamená že pro všechna j — 1, ... ,n platí 3h 3xT dx. iz) = 0. -(z) = ^2(/;-(z)-yi)7 i=\ Na tento systém rovnic se můžeme dívat jako na systém lineárních rovnic s proměnnými f= f iz) — y i a koeficienty zadanými dvojnásobkem Jacobiho matice DlFiz). Pro každé z e V má takový systém ovšem pouze jedno řešení a to je nulové, protože Jacobiho matice je podle našeho předpokladu invertibilní. V literatuře lze snadno dohledat příklady zobrazení, která třeba spojitě í bijektivně zobrazí úsečku na čtverec apod. 457 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI když derivujeme podle y. Důvodem, proč jsme neurčili také zyy, je záměnné postavení x a y v (||8.2||) (pokud zaměníme x za y, rovnice se nezmění). Navíc také x-owé a y-ové souřadnice uvažovaných bodů jsou stejné, a proto je v těchto bodech zXx = zyy. Snadno již ve stacionárních bodech vyčíslíme /xx (-3 + Vě, -3 + Vě) = fyy (-3 + Vě, -3 + Vě) fxy (-3 + Vě, -3 + Vě) = fyx (-3 + Vě, -3 + Vě) = 0, /xx (-3 - Vě, -3 - Vě) = fyy (-3 - Vě, -3 - Vě) = j=6. fxy (-3 - Vě, -3 - Vě) = fyx (-3 - Vě, -3 - Vě) = 0. Při zápisu do Hessiánu je ///(-3 + Vě,-3 + Vě) = j_ "Vě' _j_ ~Vě o o __1_ Vě H f (-3 - Vě, -3 - Vě) j_ Vě 0 Očividně první Hessián je negativně a druhý pozitivně deřinitní, což znamená, že v bodě [-3 + Vě, -3 + Vě] je ostré lokální maximum, zatímco v bodě [-3 - Vě, -3 - Vě] je ostré lokální minimum funkce /. □ 8.55. Stanovte ostré lokální extrémy funkce /(*,y) = I + I, x^O, y^O na množině bodů, které vyhovují rovnici + p = 4. Řešení. Neboť funkce / i funkce zadaná implicitně rovnicí + jz — 4 = 0 mají zřejmě spojité parciální derivace všech řádů na množině K2 \ {[0, 0]}, hledejme stacionární body, tj. hledejme řešení rovnic Lx = 0, Ly = 0 pro L(*,y,A) = i + I-A(i + i-4), x^0, y^0. Takto dostáváme rovnice -L + 2£=0> _J, + 4 = 0, xz x-* y y které vedou na x = 2X,y = 2X. Vzhledem k uvažované množině bodů podmínka x = y dává stacionární body (8.4) Zkoumejme dále druhý diferenciál funkce L. Snadno lze určit V2 V2 V2 V2 ~2~' ~Y 2~' 2~ LxX - ^3 x4 ■> LXy - 0, Lyy - ^3 ^4 , x ^ 0, ^ ^ 0, odkud plyne d2L(x, y) = {$- % dx2 + - ft) dý ■ Diferencováním vazebné podmínky + \ = 4 pak dostáváme Tím jsme našh hledaný bod x — z e V splňující pro všechna i — 1, ..., n rovnost fi (z) — Vi, tj. F (z) — y. □ 8.18. Věta o implicitní funkci. Naším dalším cílem j e využít větu jfj o inverzním zobrazení pro práci s implicitně deflno--I <\ vánými funkcemi. Pro začátek uvažujme diferenco- S^SIjeJ- jř vatelnou funkci F(x, y) definovanou v rovině E2 a hledejme body (x, y), ve kterých platí F(x, y) = 0. Příkladem může být třeba obvyklá (impUcitní) definice přímek a kružnic: F(x, y) — ax +by + c — 0, F(x, y) =(x- s)2 + (y - t)2 - ? = 0, r > 0. Zatímco v prvém případě je (při b ^ 0) předpisem zadaná funkce a c y = f (x) = --x - - b b pro všechna x, ve druhém případě můžeme pro libovolný bod (xo, yo) splňující rovnici kružnice a takový, žeyo 7^ * (to jsou totiž krajní body kružnice ve směru souřadnice x), najít okolí bodu xq, na kterém bude buď y = f (x) = t + 4(^)2 nebo f (x) ■ y = f (x) = t - V\x -s)2 -r, podle toho na kterou půlkružnici patří bod (xq, yo)- Při načrtnutí obrázku je důvod zřejmý - nemůžeme chtít pomocí funkce y = f (x) postihnout horní i dolní půlkružnici zároveň. Zajímavější jsou krajní body intervalu [s — r, s + r]. Ty také vyhovují rovnici kružnice, platí v nich ale Fy (s±r, i) — 0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžnou s osou y. V těchto bodech skutečně neumíme najít okolí, na němž by kružnice byla popsána jako funkce y = f (x). Navíc umíme i derivaci naší funkce y = f (x) — t + sj(x — s)2 — r2 , tam kde je definována, vyjádřit pomocí parciálních derivací funkce F: 1 2(x — s) x — s Fx 2 J(x - s)2 - r2 ~ y~t~ Fy' Když prohodíme roh proměnných x a y a budeme chtít najít závislost x = f(y) takovou, aby F(f(y), y) = 0, pak v okolí bodů (s ± r, i) bez problémů uspějeme. Všimněme si, že v těchto bodech j e parciální derivace Fx nenulová. Naše pozorování tedy (pro pouhé dva příklady) říká: pro funkci F(x, y) a bod (a, b) e E2 takový, že F(a,b) = 0, umíme jednoznačně najít funkci y = f (x) splňující F(x, f (x)) = 0, pokud je Fy (a, b) ^ 0. V takovém případě umíme i vypočíst f'(a) = —Fx(a, b)/Fy(a, b). Dokážeme, že ve skutečnosti toto tvrzení platí vždy. Poslední tvrzení o derivaci přitom je dobře zapamatovatelné (a při pečlivém vnímání věcí i pochopitelné) z výrazu pro diferenciál funkce g(x) — F(x, y(x)) a diferenciál dy = f'(x)dx, neboť 0 = dg = Fxdx + Fydy = (Fx + Fyf\x))dx. Obdobně bychom mohli pracovat s imphcitními výrazy F(x, y z) = 0, přičemž můžeme hledat funkci g(x, y) takovou, že F(x, y, g(x, y)) = 0. Jako příklad uvažme třeba funkci f(x, y) — x2 +y2, jejímž grafem je rotační paraboloid s počátkem v bodě (0,0). Ten můžeme implicitně zadat také rovnicí ■ dx ■dy = 0, tj. dy2 ■dx2 0 = Fix, y, z) y2- 458 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Proto je d2L(x,y)=[±-% + (±-^)£]dx2. Uvažujeme vlastně jednorozměrnou kvadratickou formu, jejíž pozitivní (negativní) deŕinitnost ve stacionárním bodě znamená, že v tomto bodě je minimum (maximum). Uvědomíme-li si, že pro stacionární body bylo x = 2X, y = 2X, pouhým dosazením získáváme = -4^/2dx2, d2L(-£,-^=4yf2dx2, což znamená, že v bodě [v2/2, v2/2] má funkce / ostré lokální maximum a v bodě [-v2/2, -v2/2] potom ostré lokální minimum. Ještě doplňme hodnoty (8.5) f í-f.-f -2V2. Nyní si ukážeme rychlejší způsob, jak jsme mohli dospět k výsledku. Známe (příp. snadno určíme) druhé parciální derivace funkce L, tj. její Hessián vzhledem k proměnným x a 3: 0 x* o Vyčíslením H L (x, 3) _2_ _ 6X 3,3 / 2 2 -2v2 0 0 -2v2 142 v2\ = /2v2 0\ \ 2 2 j \ 0 2v2/ pak zjistíme, že tato kvadratická forma je pro první stacionární bod negativně definitní (jedná se o ostré lokální maximum) a pozitivně de-finitní pro druhý stacionární bod (ostré lokální minimum). Upozorněme na nebezpečí tohoto „rychlejšího" přístupu, kdybychom obdrželi indefinitní formu (matici). V takovém případě bychom nemohli tvrdit, že v daném bodě extrém nenastává. Při nezačlenění vazebné podmínky (což jsme během výpočtu d2 L provedli) totiž uvažujeme obecnější situaci. Grafem funkce / na zadané množině je křivka, kterou lze zadat jako funkci jedné proměnné. Tomu musí odpovídat jednodimenzionální kvadratická forma. □ Než zformulujeme výsledek rovnou pro obecnou situaci, všimněme si ještě, jaké dimenze se mohou/mají v problému vyskytovat. Pokud bychom pro tuto funkci F chtěli najít křivku c(x) = (ej (x), C2CO) v rovině takovou, že F(x, c(x)) = F(x, C1(i), c2(x)) = 0, pak to jistě budeme umět (dokonce pro všechny počáteční podmínky x — a) také, ale výsledek nebude jednoznačný pro danou počáteční podmínku. Stačí totiž uvážit libovolnou křivku na rotačním paraboloidu, jejíž průmět do první souřadnice má nenulovou derivaci. Pak považujeme x za parametr křivky a za c(x) zvolíme její průmět do roviny yz. Očekáváme tedy, že jedna funkce m + 1 proměnných zadává implicitně nadplochu v Rm+1, kterou chceme vyjádřit alespoň lokálně jako graf jedné funkce v m proměnných. Lze očekávat, že n funkcí v m + n proměnných bude zadávat průnik n nadploch v Rm+™, což je ve „většině" případů m-rozměrný objekt. Uvažujme proto diferencovatelné zobrazení F = (fu ,fn):'- Jacobiho matice tohoto zobrazení bude mít n řádků a m +n sloupců a můžeme šiji symbolicky zapsat jako DlF = (DlxF, DlF) (Ml dx\ , Ml \ 3x, a/l a/i CDCm 3/„ CDCm a/i \ -Ml- i kde (xi, ..., xm+n) e Rm+" zapisujeme jako (x, y) e Rm x R", D\ F je matice s n řádky a prvními m sloupci v Jacobiho matici, zatímco Dy F je čtvercová matice řádu n se zbylými sloupci. Vícerozměrnou analogií k předchozí úvaze s nenulovou parciální derivací podle y je požadavek, aby matice Dly F byla invertibilní. __j VĚTA o implicitním zobrazení J_--- Věta. Nechť F : Rm+™ -> R™ je zobrazení třídy C1 na otevřeném okolí bodu (a, b) e Rm x R" = Rm+", ve kterém je F (a, b) = 0 a det DyF 7^ 0. Potom existuje diferencovatelné zobrazení G : Rm —> R™ definované na nějakém okolí U bodu a e Rm s obrazem G(U), který obsahuje bod b, a takové, že F(x, G(x)) = 0 pro všechny x e U. Navíc je Jacobiho matice DlG zobrazení G na okolí bodu a zadána součinem matic DlG(x) = -(DlF)-\x, G(x)) ■ DlxF(x, G(x)). 8.56. Nalezněte globální extrémy funkce /(*,3) = I + I, 17^0,^0 na množině bodů, které vyhovují rovnici ^2 + = 4. Řešení. Na tomto příkladu si ukážeme, že hledání globálních extrémů může být výrazně snazší než hledání extrémů lokálních (viz předešlý příklad) také tehdy, když jsou uvažovány hodnoty funkce na neohraničené množině. Stejným způsobem jako v minulém příkladu Důkaz. Pro zvýšení srozumitelnosti uvedeme napřed kompletní důkaz pro nejjednodušší případ rovnice F(x,ý) — Os funkcí F dvou proměnných. Bude ■Ěh^, zdánlivě složitý, protože jej schválně vedeme tak, jak ?•«>■' ' ■ jej bude možné použít i pro obecné dimenze z věty. Rozšíříme funkci F na F : R2 -» R2, (x, y) t-> (x, F(x, y)). 459 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI bychom ovšem nejprve stanovili stacionární body (||8.4||) a hodnoty (||8.51|). Raději zdůrazněme, že v tomto příkladu hledáme extrémy funkce na nekompaktní množině, a tak se nemůžeme spokojit s pouhým vyčíslením funkčních hodnot ve stacionárních bodech. Důvodem je, že funkce / na uvažované množině vůbec nemusí maximální ani minimální hodnoty nabývat - její obor hodnot zde může být otevřeným intervalem. Ukažme si, že tomu tak ale není. Uvažujme proto | jc | > 10 a uvědomme si, že rovnici \ + \ = 4 x y mohou splňovat pouze hodnoty y, pro které je \ y\ > 1/2. Máme tak odhady -2V2 < -i -2 < f{x, y) < i + 2 < 2V2, je-li | x | > 10. Současně je (záměnou x za y dostaneme stejnou úlohu) -2V2<-i-2 10. Odtud vidíme, že globálních extrémů na uvedené množině musí funkce / nabývat, a to uvnitř čtverce ABC D s vrcholy v bodech A = [-10, -10], B = [10, -10], C = [10,10], D = [-10,10]. Jako průnik „stokrát zmenšeného" čtverce s vrcholy A = [—1/10, —1/10], B = [1/10, -1/10], Č = [1/10,1/10], Ď = [-1/10,1/10] azadané množiny potom očividně dostaneme prázdnou množinu. Globální extrémy jsou tedy v bodech ve vnitřku kompaktní množiny ohraničené těmito dvěma čtverci. Neboť je na této množině / spojitě diferencovatelná, globální extrémy mohou být jedině ve stacionárních bodech. Nutně je /max=/(#,#)=2V2, /mln=/(-f ) = -2V2. □ 8.57. Určete maximální a minimální hodnotu, kterých nabývá funkce fix, y, z) = xyz na množině M vymezené podmínkami x2 + y2 + z2 = 1, x + y+z=0. Řešení. Není obtížné si uvědomit, že M je kružnice. V rámci řešení úlohy však postačuje vědět, že je M kompaktní, tj. ohraničená (první podmínka je rovnice jednotkové sféry - kulové plochy) a uzavřená (množina, která je řešením uvedených rovnic, je uzavřená, neboť z platnosti těchto rovnic pro všechny členy jisté konvergentní posloupnosti vyplývá jejich platnost pro limitu této posloupnosti). Funkce / i vazebné funkce Fix, y, z) = x2 +y2 + z2 — 1, Gix, y,z) = x + y + z mají spojité parciální derivace všech řádů (jsou to polynomy). Jaco-biho matice vazeb pak je /Fx{x, y, z) Fy{x, y, z) Fz{x, y,z)\ = Í2x 2y 2z^ \Gx{x,y,z) Gy{x,y,z) Gz{x,y,z)J ll 1 1 Jacobiho matice zobrazení F je ^•^Uiy) Fyíy) Z předpokladu Fyia,b) 0 vyplývá, že totéž platí i na nějakém okolí bodu {a, b) a tedy je na tomto okolí funkce F invertibilní podle věty o inverzním zobrazení. Uvažme tedy jednoznačně definované a diferencovatelné inverzní zobrazení F-1 na nějakém okolí bodu (a, 0). Nyní označme 71 : R2 -» R projekci na druhou souřadnici a uvažujme funkci fix) — 71 o F~\x, 0). To je dobře definovaná a diferencovatelná funkce. Máme ověřit, že následující výraz F(x,f(x)) = F(x, 7i{F-\x,Q))) bude na okolí bodu x — a nulový. Přitom z definice Fix,y) — ix, Fix,y)) vyplývá, že i její inverze musí mít tvar F~\x, y) — {x, 7iF~\x, y)). Můžeme proto pokračovat v předchozím výpočtu: Fix, fix)) = 7t(F(x, 7iiF-\x, 0)))) = = n(F(F-\x, 0))) = n{x, 0) = 0. Tím máme dokázánu první část věty a zbývá spočíst derivaci funkce fix). Tuto derivaci můžeme odečíst opět z věty o inverzním zobrazení pomocí matice iDlF)~l. Následující výsledek je snadné ověřit roznásobením matic. (Spočíst lze také přímo explicitní formulí pro inverzní matici s pomocí determinantu a algebraicky adjungované matice, viz odstavec 2.23) {fx(x 0 x,y) Fyix,y) Dle definice fix) — 71 F~\x, 0) nás z této matice zajímá první položka na druhém řádku, která je právě Jacobiho maticí D1 f. V našem jednoduchém případě je to právě požadovaný skalár -FAx,fix))/Fyix,fix)). Obecný důkaz je bezezbytku stejný, není v něm potřeba %\ změnit žádný z uvedených vztahů (všechny položky v nich jen dostanou vektorový smysl), kromě posled-'$y*f^''IÍf| ního výpočtu derivace funkce /, kde místo jednotli-W vých parciálních derivací budou vystupovat příslušné části Jacobiho matice D^Fa DyF. Samozřejmě je přitom třeba místo se skaláry pracovat s vektory a maticemi. Pro výpočet Jacobiho matice zobrazení G opět použijeme výpočtu inverzní matice, není ale až tak vhodné přímo využít postupu z odstavce 2.23. Snadnější je nechat se přímo inspirovat případem v dimenzi m + n — 2, označit si matici {DlF~l) ■ Em lFix,y) o D\F{x,y) )"'-(Ž *) s bloky danými dělením na m a n řádků i sloupců (tj. např. A má rozměr m x m, zatímco C j e rozměru n x m) a přímo spočíst matice A, B, C, D z definiční rovnosti pro inverzi: Em Fix, y) 0 DlyFix,y)i )-(í í) = (EČ 0 En 460 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Její hodnost je snížena (menší než 2), právě když je vektor (2x, 2y, 2z) násobkem vektoru (1,1,1), což dává x = y = z a podle druhé ze zadaných podmínek dále x = y = z =0. Ovšem množina M počátek neobsahuje. Nic nám tedy nebrání hledat stacionární body použitím metody Lagrangeových multiplikátorů. Pro L(x, y, z, A.1, X2) = xyz — X\ (x2 + y2 + z2 — l) - X2 (x + y + z) rovnice Lx = 0, Ly = 0, Lz = 0 po řadě dávají yz — 2X\x — X2 = 0, xz — 2X\y — X2 = 0, xy — 2X\z — X2 = 0. Odečtením první rovnice od druhé a od třetí dostaneme xz — yz — 2X\y + 2X\x = 0, xy — yz — 2X\z + 2X\x = 0, tj. po úpravě (x -y)(z + 2A0 = 0, (x -z)(y + 2X0 = 0. Poslední rovnice jsou splněny v těchto čtyřech případech x = y, x = z; x = y, y = — 2X\\ z = —2X\,x=z\ z = —2X\,y = —2X\, tedy (zahrnutím podmínky G = 0) x = y = z =0; x = y = —2X\,z = 4Xi; x = z = —2X-[, y = 4Xj; x = AX\, y = z = —2X\. S výjimkou prvního případu (který zřejmě nemůže být splněn) začleněním podmínky F = 0 obdržíme Zjevně odtud plyne A = Em, B = 0, D (,d\f)-1 a konečně 1, 1 ±ll/6- (4Ai)2 + (-2A02 + (-2A02 : Celkem tak získáváme body L v'e' v^í' Věj ' L Vě' V6' Věj ' LVš' Vš' Věj' r_i_ j___2_] r_i_ _j_ j_] ľ_j_ _l j_1 [Ve' Vě' Věj' [Vě' Vě' Věj ' L Vě'Vě'VěJ' Nebudeme ověřovat, zda se jedná o stacionární body. Důležité je, že v této šestici jsou zahrnuty všechny stacionární body. Hledáme globální maximum a minimum spojité funkce / na kompaktní množině M. Globální extrémy (o kterých víme, že existují) však mohou být pouze v bodech lokálních extrémů vzhledem k M. Tyto lokální extrémy pak musí být v některém z uvedených bodů. Proto pouze DXF + DyF ■ C = 0.Z poslední rovnosti pak dostáváme požadovaný vztah D1G ■- Tím je věta dokázána. : C = -(dIf)-1 ■ dlxf. □ 8.19. Gradient funkce. Jak jsme viděli v minulém odstavci, je-li F spojitě diferencovatelná funkce n proměnných, *ÍŽTy^ zadává předpis F(x\, ..., x„) = b s nějakou pev-'r^^V~ nou hodnotou b e M podmnožinu M c M", která — mívá vlastnosti (n—l)-rozměrné nadplochy. Přesněji řečeno, pokud je vektor parciálních derivací DlF ■ {3F 3F\ \ tix\ ' " " dx„ ) nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné funkce v n — 1 proměnných. Hovoříme v této souvislosti také o úrovňových množinách Ař&. Vektor D1 F e M." se nazývá gradient funkce F. V technické a fyzikální literatuře se často zapisuje také jako grad F, případně také VF. Protože je zadáno pomocí konstantní hodnoty funkce F, budou derivace křivek ležících v M mít jistě tu vlastnost, že na nich bude diferenciál dF vždy vyčíslen nulově - skutečně, pro každou takovou křivku bude F(c(t)) = b a tedy i ^-F(c(t)) = dF(c'(t)) = 0. dt Naopak uvažme obecný vektor v = (v\, ... ,vn) e W a velikost příslušné směrové derivace \dvF\ = dxi vi tixn = cosip HD^FII ||d|| kde

0 a středu (a, b, c) zadanou rovnicí F(x, y, z) = (x- a)2 + (y - b)2 + (z - c)2 = r2 dostáváme normálové vektory v bodě P = (xo, yo, zo) jako nenulový násobek gradientu, tj. násobek průvodiče DlF = (2(*0 - a), 2(y0 - b), 2(zo - c)), a tečné vektory budou právě všechny vektory kolmé na gradient. Implicitně proto jde vždy tečnou rovinu ke sféře v bodě P popsat s pomocí gradientu rovnicí 0 = (x0 - a)(x - xo) + (yo - b)(y - yo) + (zo - c)(z - zo)- To je speciální případ obecné formule: 461 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI vyčíslíme funkci / v těchto bodech. Tím zjistíme, že hledané maximum je 1 •s/6' 1 2 •s/6' V6 1 2 •s/6' Vó' 2 1 •s/6' Vó' 1 1 3^6 a minimum potom f (-.-.-- Vó Vó Vó 1 3V6' □ 8.58. Určete, ve kterých bodech nastávají extrémy funkce / : K3 —► K, /(x, y,z) = x2 +y2 + z2, na rovině x + y — z = í a určete, o jaké extrémy se jedná. Řešení. Snadno sestavíme rovnice rovnice popisující lineární závislost normály k vazební ploše a gradientu zkoumané funkce: c, tel, 4]. Navíc si všimneme, že x = k, y = k z = jejichž jediným řešením je bod [|. funkce roste ve směru (1,-1,0) a tento směr náleží do vazební roviny. V získaném bodě tedy musí nastávat minimum zkoumané funkce. Jiné řešení. Úlohu převedeme na vyšetření extrému funkce dvou reálných proměnných na K2. Vazební podmínka je totiž lineární a snadno z ní vyjádříme z = x + y — 1. Dosazením do zadané funkce pak získáme reálnou funkci dvou proměnných: f(x,y) = x2 + y2 + (x + y — l)2 = Ix2 + 2xy + y2 — 2x — 2y + 1. Položením obou parciálních derivací rovno nule, dostáváme lineární soustavu Tečná nadrovina implicitně zadané nadplochy Věta. Pro reálnou funkci F(x\, ... ,xn) v n proměnných a bod P — (a\, ..., a„) v úrovňovémnožině Mi, = {x e R"; F(x) — b] funkce F, v jehož okolí je Mi, grafem funkce (n — 1) proměnných, je implicitní rovnice pro tečnou nadrovinu k Mi, dána vztahem 9F ■ (x\ — a\) H-----h -—(P) ■ (xn - an). 9F 0 = -—(P) ■ óx\ dx„ Důkaz. Tvrzení je zřejmé z předchozího výkladu. Tečná nadrovina totiž musí být (n — l)-rozměrná, její zaměření je proto zadané jako jádro lineární formy dané gradientem (nulové hodnoty příslušného lineárního zobrazení R™ -» R zadaného násobení sloupce souřadnic řádkovým vektorem grad F). Zvolený bod P přitom naší rovnici zjevně vyhovuje. □ 8.20. Model osvětlení 3D objektů. Uvažujme osvětlení 3D objektu, kde známe směr v dopadu světla na 2D povrch tohoto objektu, tj. množinu M zadanou implicitně nějakou rovnicí F(x, y, z) = 0. Intenzitu osvětlení bodu P e M definujme jako / cos R™, se souřad-Síľ? nými funkcemi f, můžeme opět uvažovat n rovnic pro n + m proměnných Ax + 2y - 2 = 0, 4y + 2x - 2 = 0, jejímž jediným řešením je bod [|, |]. Protože se jedná o kvadratickou funkci s kladnými koeficienty u neznámých, je tato na K2 neomezená a tudíž v získaném bodě nastává (globální) minimum. Z úvodního lineárního vyjádření proměnné z pak získáme odpovídající bod ve vazební rovině: N -U □ 8.59. Určete body, ve kterých nastávají extrémy funkce x+y : K3 K na kružnici dané rovnicemi x + y + z = íax2+y2+z2 = 4. Řešení. ,Podezřelé" body jsou body, pro které platí (1, 1, 0) = k ■ (1, 1,1) + /- (x, y, z), k,leR. fiixi, fn) = bi. 1, vyjadřujících rovnost F(x) — b pro vektor b e R™. Pak, za podmínek věty o implicitní funkci, je množina všech řešení (x\, ..., xm+n) e Rm+™ alespoň lokálně grafem zobrazení G : Rm -» R". Pro pevnou volbu b = (b\, ..., b„) je samozřejmě množinou všech řešení průnik nadp loch M(bj, f) příslušejících jednotlivým funkcím f. Totéž musí platit pro tečné směry, zatímco normálové směry jsou generovány jednotlivými gradienty. Proto je-li Dl F Ja-cobiho matice zobrazení implicitně zadávajícího množinu M s bodem P — (a\, ..., am+„) e M, v jehož okolí je M grafem zobrazení, a/i \ /Ml 1 ar. 8/„ 462 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Zřejmě x = yi= l/l). Dosazením do rovnic kružnice pak získáme dvojici řešení 1 V22 1 V22 1 V22 - ± -—, - ± -—, - T -— 3 6 3 6 3 3 Vzhledem ke kompaktnosti kružnice stačí prověřit funkční hodnoty v těchto dvou bodech. Zjišťujeme, že v prvním bodě nastává maximum a v druhém minimum dané funkce na kružnici. □ 8.60. Určete, ve kterých bodech nastávají extrémy funkce / : K3 —► K, f{x, y, z) = x2 +y2 +z2, narovině 2x + y — z = 1 a určete, ojaké extrémy se jedná. O 8.61. Určete maximum funkce / : K2 —► K, fix, y) = xy na kružnici o poloměru 1 se středem v bodě [xo, yo] = [0, 1]. O 8.62. Určete, ve kterých bodech nastává minimum funkce / : K2 —► K, / = xy na kružnici o poloměru 1 se středem v bodě [x0, yo] = [2,0]. O 8.63. Určete, ve kterých bodech nastává minimum funkce / : K2 —► K, / = xy na kružnici o poloměru 1 se středem v bodě [xo, yo] = [2,0]. O 8.64. Určete, ve kterých bodech nastává minimum funkce / : K2 —► K, / = xy na elipse x2 + 3y2 = 1. O 8.65. Určete, ve kterých bodech nastává minimum funkce / : K2 —► K, / = x2 y na kružnici o poloměru jedna se středem v bodě [x0 ,yo] = [0,0]. O 8.66. Určete maximum funkce / nici x2 + y2 = 1. 8.67. Určete maximum funkce / 2X2 +3/ = 1. 8.68. Určete maximum funkce / x2 +2y2 = 1. I, fix, y) = x3 y na kruž- O l, fix, y) = xy na elipse O l, fix, y) = xy na elipse O H. Objemy, povrchy, těžiště těles 8.69. Určete objem tělesa ležícího v polorovině z > 0, ve válci x2 + y2 < 1 a v polorovině a) z S x, b) x + y + z S 0. potom bude afinní podprostor v Rm+™ obsahující právě všechny tečny procházející bodem P dán implicitně rovnicemi: 0 = -—(P) ■ Ol — a\) H-----h -—(P) ■ (xm+n - am+n) 3*1 oxn 0='^-(P)-(xl-al) + -ox\ 3fn +--(P) ' (Xm+n — &m+n)- OX„ Tento podprostor se nazývá tečný prostor k (implicitně zadané) Třírozměrné ploše M v bodě P. Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty všech funkcí f\ ,...,/„ v bodě P, tj. řádky Jacobiho matice DlF. Jako jednoduchý příklad si spočtěme tečnu a normálový prostor ke kuželosečce v R3. Uvažujme rovnici kuželu s vrcholem v počátku 0 = fix, y,z) = z - ^x2+y2 a rovinu zadanou 0 = gix, y, z) — z —2x + y + l. Bod P = (1,0,1) patří jak kuželu tak rovině a průnik M těchto dvou ploch je křivka (namalujte si obrázek). Její tečnou v bodě P bude přímka zadaná rovnicemi 0 = - 1 1 2x ■ ix - 1) =2y -y + l-iz-í) x=l,y=0 IsTx^Ty2 = -x+z 0 = -2ix -l) + y + iz-l) = -2x+y + z +1, zatímco rovina kolmá k naší křivce bodem P bude parametricky dána výrazem (1, 0, 1) + r(-l, 0, 1) + ilx\ ■ ■ ■ xn n pro jakýchkoliv n kladných reálných čísel x\, ...,*„, přičemž rovnost nastane, právě když jsou si všechna *, rovna. Uvažme tedy součet x\ + • • • + x„ — c jako vazebnou podmínku pro nějakou blíže neurčenou nezápornou konstantu c. Budeme hledat maxima a minima funkce f (xi, , Xji) — \jx\ • • • xn za naší vazební podmínky a předpokladu x\ > 0.....*„ > 0. Normálový vektor k nadrovině definované podmínkou je (1, ..., 1). Extrém funkce / tedy může nastat pouze v bodech, kdy je její gradient násobkem tohoto normálového vektoru. Pro hledané body tedy dostáváme soustavu rovnic 1 1 -i/x\- 8.70. Určete objem tělesa v K3, které je dáno nerovnostmi x2 + y2 + z2 S 1, 3*2 + 3y2 >z2,x> 0. Řešení. pro i — 1, ..., n a A. e R. Tato soustava má zjevně na zkoumané množině jediné řešení x\ — ■ ■ ■ — xn. Pokud bychom uvažovali i nulové hodnoty *,, byla by naše množina M zadaná omezením kompaktní, a proto by na ní musela mít funkce / jak maximum, tak minimum. Minimum však zjevně dosahuje, právě když je některá z hodnot *, nulová, v našem bodě s *, = |, i — nabývá tedy nutně ostrého maxima. 464 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Nejprve si uvědomme, o jaké těleso se jedná. Jde o část zadané koule, která leží vně daného kužele (viz obr.). Objem spočítáme asi nejlépe jako rozdíl objemu poloviny koule a poloviny kulové výseče dané zadaným kuželem (všimněme si, že objem tělesa se nezmění, nahradíme-li podmínku x > 0 podmínkou z > 0 - výseč řežeme buď „vodorovně" nebo „svisle", ale vždy napůl) Budeme počítat ve sférických souřadnicích. x = r cos(tp) sin(i/f), y = r sin(ip) sin(i/f), z = rcos(i/f), e [0,2ic), f e [0, ji), r e (0, oo). Tato transformace K3 —► K3 má jakobián r2 sin(i/f). Určeme nejprve objem koule. Integrační meze: je vhodné si vyjádřit podmínky, kterými je těleso omezeno v souřadnicích, ve kterých budeme počítat. Ve sférických souřadnicích je koule dána nerovnicí x2 +y2 +z2 = r2 < 1. Hledejme integrační meze nejprve například pro proměnnou yX*i+i - *;) - E f&' ^fe+i ~ *<') i=0 i=0 k-l i=0 < s(b — a). Odtud však plyne, že i limitní hodnoty F(y) a F(y) se nemohou lišit o více než s(b — a), a jde proto o spojitou funkci. □ 465 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI nijak omezena (ani nerovnicí r2 < 1, ani rovnicí

z2. Opět vyjádřeme podmínky ve sférických souřadnicích: r2 < l,3sin2(i/f) > cos2(i/f),neboli tan(i/f) > ^.Opět jako v případě koule vidíme, že v podmínkách se vyskytují proměnné nezávisle, integrační meze jednotlivých proměnných tedy budou na sobě nezávislé. Z podmínky r2 < 1 máme r e (0, 1], z podmínky tan(i/f) > -Aj vyplývá ý e [0, |-]. Na proměnnou

i. V = Vi + V2 í 77 Jo Jo Jo r dz dr d(p + r f 1 Jo Jl Jo r dz dr dip VŠ' □ Další alternativou by byl výpočet objemu jako objemu rotačního tělesa, opět bychom těleso rozdělili na stejné dvě části jako v předchozím případě a to na část „pod kuželem" a část „pod sférou". Tyto části však nejsou přímo rotačními tělesy, které dostaneme rotací podle některé z os. Objem první z nich spočítáme jako rozdíl objemu válce x2 +ý <\, 0) d<9 dr d

M, i = 1, ..., k, na intervalu I je vždy opět riemannovsky integrovatelná a spočte se takto: j(^a\f\(x\, ..., xn) H-----Vakfk(x\, ..., xn) ) dx\ .. .dxn = ai J fi(xi, ...,x„)dxi ...dx„ +... ----\-ak J fk(x\, ... ,xn)dx\ .. .dxn. 467 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Musíme ještě odečíst objem kužele. Ten je roven jirR2V (kde R je poloměr podstavy kužele a V jeho výška, v našem případě jsou obě hodnoty rovny jedné) tedy celkový objem je V, vysec ^kužel = ~ 1) " \" = ~ 5)- Stejným způsobem bychom mohli obecně spočítat objem kulové úseče o výšce v v kouli o poloměru R: V V, vysec - ^kužel 2tt /•arccos^-^^-^ plit /-arccosí I pR / / / r2 sin(6») dr dO d(p Jo Jo Jo 1 -ir(2Rv - v2)(R - v) 1 7 -irv2(3R - v). □ 8.72. Určete objem části válce x2 + z2 = 16, který leží uvnitř válce x2 +y2 = 16. Řešení. Integrál vypočteme v kartézských souřadnicích. Vzhledem k symetrii tělesa stačí integrovat přes první oktant (zaměníme-li x za —x, či y za —y, či z za —z tak se rovnice tělesa nezmění). Část tělesa ležící v prvním oktantu je dána částí prostoru ležícího pod grafem funkce z(x, y) = Vl6 - x2 a nad čtvrtkruhem x2 + y2 < 16, x > 0, y > 0. Objem celého tělesa je tak roven V ■■ ! Jo Jo : dy dx = 128. □ Druhá část pak říká že pro disjunktní riemannovsky měřitelné množiny M\ a M2 a pro funkci / : M" -» M riemannovsky in-tegrovatelnou na obou těchto množinách platí / m1um2 fixu ,xn)dx\ ...dxn f f(x\, ...,xn)dx\ ...dxn + j ■ fixu ,xn)dx\ ...dxn. 8.27. Násobné integrály. Vzápětí uvidíme, že riemannovsky •' 0, můžeme vždy najít pro normu dělení ohraničení S > 0 tak, že odchylka hodnot funkce / pro obecné volby xy od výše použitých voleb nebude převyšovat £. Proto dopadnou limitní procesy i pro obecné Riemannovy sumy 5a,^ stejně jako jsme viděli výše. Obecný případ nyní můžeme dokázat snadno indukcí. ^ V případě n = 1 je výsledek triviální a výše uvedená argumentace může být snadno převedena v obecný indukční krok, jestliže místo y píšeme (x2, ..., xn), místo x máme x\ a jednotlivé krychličky v dělení vnímáme jako (n — 1)-rozměrné krychličky kartézský vynásobené posledním intervalem. V předposledním kroku argumentace pak místo prosté jednorozměrné integrace použijeme indukční předpoklad. Závěrečný argument o stejnoměrné spojitosti zůstává stejný. Doporučujeme projít podrobně jako cvičení. □ V právě dokázané větě je v případě vícerozměrného intervalu / kterékoliv pořadí integrace vyjádřením oblasti / v požadovaném tvaru. Na výsledku integrálu tak pořadí integrace nemůže mít vliv. Platí proto následující slavná věta: _J fubiniho věta j___ , -r* t/ 8.28. Důsledek. Pro vícerozměrný interval M — [a\,b\\ x [a2, b2] x ... x [an, bn] a spojitou funkci f (x\, ..., xn) na M je násobný Riemannův integrál 469 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI L Řešení. Vzhledem k symetrii tělesa spočítáme pouze objem části tělesa ležící v prvním oktantu. Integrujeme ve válcových souřadnicích daných rovnicemi x = r cos(^), y = r sm{ cích jedné proměnné v kapitole šesté. Proto byli vyvi-r\iJ^ riuty sofistikovanější přístupy k integraci, které jsou odvo-'V' ! zeny od zavedení míry množin. Podívejme se aspoň velice přibližně na tento problém. Říkáme, že je omezená množina M c K™ riemannovsky měřitelná, jestliže je její charakteristická funkce xm riemannovsky integrovatelná na M". Můžeme také uvažovat striktní analogii dolních a horních Riemannových integrálů z funkcí jedné proměnné. To znamená, že budeme v Riemannových součtech místo hodnot funkce v reprezentantech vždy brát infimum, resp. supremum, 470 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.76. Určete objem tělesa v K3, které je ohraničeno eliptickým válcem Ax2 + y2 = 1, rovinami z = 2y a z = 0, ležící nad rovinou z = 0. 16.0wna Řešení. Vzhledem k symetrii úlohy bude výhodné zavést souřadnice x = ircos(^), y = r sm()drd(9d

3 /*iyCos2((p) Jo Jo Jo 27 r dx dr dw = —ti. 16 □ 8.82. Určete objem tělesa v K3, které je ohraničeno částí kužele 2X2 + y2 = (z — 2)2, z > 2 a paraboloidem 2X2 + y2 = 8 — z. Řešení. Zjistíme nejprve průnik zadaných ploch: (z - 2)2 = -z + 8, z > 2, tedy z = 4 a dostáváme rovnici průniku daných ploch 2x2 + y = 4. Substitucí x = -^r cos(w), y = r sin(w), z = z převedeme dané plochy na tvar r2 = (z — 2)2, z > 2 a r2 = 8 — z, tedy z = r + 2 pro první plochu a z = 8 — r2 pro druhou plochu. Celkem je průmět daného tělesa do souřadnice w roven intervalu [0, 2it], pro dané wo e [0, 2it] je potom průmět průniku tělesa s rovinou w = wo do souřadnice r roven (pro libovolné wô) intervalu [0, 2]. Pro dané ro a Oakonečně ohraničeného plochou y2 +z2+2x = 16. vyjádření, ale musíme také vést v patrnosti změnu plochy nebo objemu příslušného malého vícerozměrného intervalu. Opět tu půjde o lineární přiblížení změny a tu máme dobře zvládnutou — jde přeci o působení lineárního přiblížení použité transformace, tj. akci Jacobiho matice, viz 8.14. Změna objemu je přitom dána (v absolutní hodnotě) pomocí determinantu z této matice (viz naše úvahy na toto téma v lineární algebře, zejména 4.22). .___| Transformace souřadnic j___ Věta. Nechť G(tu ...,t„) : W -» M", (xi,...,xn) = G(t\, ..., t„), je spojitě diferencovatelné invertibilní zobrazení, N = G (M) a M jsou riemannovsky měřitelné množiny a f : M —> M. je spojitá funkce. Potom platí f fixu ,xn)dx\ ...dxn = í f (Gitu Jn , ř„))|det(£)1G(ři, ..., tn))\dt\ ...dtn Důkaz. Protože pracujeme se spojitou funkcí / a diferencovatelnou změnou souřadnic, zjevně existují inte-% grály na obou stranách dokazované rovnosti. Potřebujeme tedy pouze dokázat, že se jejich hodnoty budou skutečně rovnat. Označme si naši složenou funkci g(ti, ...,t„) = /(G(ři, ...,*„)), zvolme si dostatečně velký n-rozměrný interval I obsahující N a jeho dělení H. Celý důkaz je jen přesnějším zápisem výše uvedené úvahy. Nejprve si všimněme dvou věcí: jednak jsou obrazem hranic našich intervalů /,,...,„ diferencovatelné objekty (stěny, hrany apod.), proto budou obrazy /,,...,„ = G(/;,...,„) těchto intervalů opět riemannovsky měřitelné množiny. Pro každý jednotlivý dílek ...,„ našeho dělení H proto existuje integrál jakékoliv spojité funkce přes množiny ...,„. Dále nás bude zajímat „linearizovaný" obraz intervalu /;,...;„ v zobrazení G. Ten dostaneme tak, že si zvolíme pevně střed ŕ,, intervalu Iíu.j„, tento střed zobrazíme na střed GO^...,-„) uvažovaného obrazu a k samotnému zobrazení použijeme linearizaci DlG (tj. Jacobiho matici) zobrazení G ve středu ŕ,, . Jde tedy o obraz Riu..i„ intervalu /,,...,„ zadaný afinním zobrazením takto: ■■ G(í;,...;„) + D1G(řil...i„)(/il...i„ - *,-,...;„). Všimněme si, že odečtením středu *;,...;„ od intervalu /;,...,„ dostáváme interval se středem v počátku souřadnic, jeho obrazem v lineárním zobrazení bude n-rozměrný rovnoběžnostěn opět se středem v počátku a ten konečně posouváme do vybraného středu, viz obrázek. Objem tohoto rovnoběžnostěnu nezávisí na volbě jeho středu a je roven volÄ;,...;, = | det G(řrl...i„)| vol/,-,...,„, viz odstavec 4.22 na straně 206 Jestliže bude naše dělení hodně jemné, bude se tento objem hodně málo lišit od objemu obrazu /,,,...,„. Přesněji řečeno, díky stejnoměrné spojitosti zobrazení G, můžeme pro každé malé £ > 0 473 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Řešení. Ve válcových souřadnicích v Jo Jo Jo r dx dr d(p = 28jt. □ 8.84. Těžiště tělesa. Souřadnice (xt,yt,zt) těžiště (homogenního) tělesa T o objemu V v K3 je dáno po souřadnicích následujícími integrály: //// ■=!!L dx dy dz, y dx dy dz, z dx dy dz. Analogicky spočteme těžiště tělesa v K2 či v jiných dimenzích. 8.85. Určete těžiště části elipsy 3x2 + 2y2 = 1 ležící v prvním kvadrantu roviny K2. Řešení. Spočítejme nejprve obsah dané elipsy. Transformací souřadnic x = -j=x', y = -4=/ s jakobiánem -4= dostaneme V2 l-3x: s = P dydx = -L ľ f lx dy dx' = " J o Jo v 6 Jo Jo 4y6 Další potřebné integrály můžeme spočítat přímo v kartézských souřadnicích x a y: ľ4- ľJ-Jo Jo ŕí Jo Jo i x dy dx 75 1 - 3x2 ■ dx -3í V2 -dr = —, 2 18 y dy dx 1 f 7í 1 - 3x2 1 f 75 (1 - 3x^)dx 2 VŠ 18 í - dx Souřadnice těžiště jsou potom [4j^, ]• □ 8.86. Určete objem a souřadnice těžiště homogenního rotačního kužele o kruhové podstavě s poloměrem r a výšce h. Řešení. Otočíme-li kužel vrcholem dolů a ten umístíme do počátku souřadnic, pak ve válcových souřadnicích: /■ir/2 it i-h j V =4/ / / pdzdpdíp =-ichr2. Jo Jo 3h-o 3 najít normu S dělení takovou, že pro všechna jemnější dělení již bude platit Gft,...;„) + (1 +e)D1G(ři...(„)(/;1...i„) D Jh...ik. Pak ovšem jistě bude také pro n-rozměrné objemy platit (připomeňme, že vynásobením všech stran rovnoběžnostěnu stejným koeficientem 1 + £ vynásobíme jeho objem n-tou mocninou téhož koeficientu) vol(/;, ...;„) < (1+£)"vo1(ä;i...í„) = (l+£)"|detG(řil...,i)|vol„(/il...,„). Nyní již umíme celý integrál odhadnout shora / f(x\, ...,xn)dx\---dxn = f(xu ,xn)dx\... dxn < E( SUP S) vol„ (/;,...;„) ;,...;„ Ci.■...'»)€/,,...,„ <(l+e)"E( SUP «)|detG(ř;1...it)|vol„(/;1...;„). h Jn ((,,...,(„)€/,-,...,■„ Při limitním procesu pro zmenšující se normy dělení zůstává hodnota nalevo stále stejná, zatímco napravo jistě dostaneme Rie-mannůvintegrál funkce g(t\, ..., tn) \ det(DlG(tu..., tn))\. Místo dokazované rovnosti ve větě tak dostáváme nerovnost: / J M /Cti,. ..,xn)dx\. ..dxn < í f (Gitu Jn ,t„))\det(D1Giti,...,t„))\dti...dt„. Nyní však můžeme zopakovat stejnou argumentaci tak, že zaměníme G s G-1, obory integrace M a N a funkce / a g(ři,...,ř„)|det(£>1G(ři, nerovnost opačnou: / Jn t„))\. Okamžitě tak dostaneme t„))\dt\ ...dt„ g(ř1,...,ř„)|det(D1G(ři. < f f(xu-..,xn)\det(D1G(G-\xu...,xn))) J m \det(DlG~l (x\, ..., xn)) I dx\ ... dxn = í fixu--. J m a tím je důkaz ukončen. ,x„)dx\ ...dx„ □ 8.32. Příklad v dimenzi dvě. Docela přehledné jsou transfor-í _ mace proměnných pro integrál spojité funkce f(x,y) -ír^vř' ve dvou proměnných. Uvažme diferencovatelnou •v/ví- transformaci G(s, ř) = (x(s, t), y(s, ř)). Označíme si g(s, i) — f(x(s, f), y(s, f)) a dostáváme dx dy dx dy / f(x, y)dxdy = \ g(s, i) Jg(N) Jn ds dt dt ds dsdt. Jako úplně jednoduchý příklad spočteme integrál z charakteristické funkce kružnice o poloměru R (tj. plochu této kružnice) a integrál z funkce/(ř, 9) — cos (ř) zadané v polárních souřadnicích uvnitř kružnice o poloměru \n (tj. objem schovaný pod takovou „čepičkou jarmulkou posazenou nad počátek", viz obrázek). 474 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Těžiště zjevně leží na ose z. Pro z-tovou souřadnici pak máme 1 [ 4 /"r/2 [r ŕ 3 z = 77 / zdV = 77 / / / zpdzdpdcp =-h. ^Jkužel V Jo Jo Jh-P 4 Těžiště tedy leží ve výšce \h nad středem podstavy kužele. □ 8.87. Určete těžiště tělesa ohraničeného paraboloidem Ix2 + 2y2 = z, válcem (x + l)2 + y2 = 0 a rovinou z = 0. Řešení. Nejprve určeme objem daného tělesa. Zkusme použít válcových souřadnic (x = r -cos cp,y = r -sin cp, z = z): v nich je rovnice paraboloidu z = 2i2, rovnice válce pak zní r = —2cos(^). Všimneme-li si navíc, že rovina x = 0 je tečná k danému válci, snadno již určíme meze příslušného integrálu udávajícího objem zadaného tělesa: -2 cos

R™ a v euklidovském vektorovém prostoru R™ jsme vyjádřili velikost ||c'(ř)|| tečného vektoru. Tento postup přitom byl dán univerzálním vztahem pro libovolný tečný vektor, tj. našli jsme ve skutečnosti zobrazení p : R™ —> R, které vyčíslením na c'(t) dalo skutečnou velikost. Toto zobrazení splňovalo p(a v) = \a\p(v), protože jsme ignorovali orientaci křivky danou naší parametrizací. Pokud bychom chtěli délku se znaménkem respektujícím orientaci, pak by naše 475 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.88. Určete těžiště homogenního tělesa v K , které leží nad rovinou z = 0, pod rovinou z = 2 a je dále ohraničeno kužely x2 + y2 = z2 a x2 +y2 2z2. Řešení. Úlohu lze řešit standardně, jak jsme činili v předchozích příkladech. Výpočet by bylo například výhodné provádět ve válcových souřadnicích. My si však všimneme toho, že těleso je jakési „mezikuželř': vznikne vyříznutím rotačního kužele K\ s podstavou o poloměru 4 z rotačního kužele K2 o poloměru podstavy 8 a společné výšce délky 2. Těžiště zkoumaného tělesa pak určíme „pravidlem páky": souřadnice těžiště soustavy dvou těles je dáno váženým průměrem souřadnic těžišť jednotlivých těles, kde váhy jsou dány hmotnostmi těles, (v příkladu ||8.86|| jsme vypočítali, že těžiště homogenního rotačního kužele leží ve čtvrtině výšky). Větší a menší kužel tak mají společné těžiště a tudíž tento bod bude těžištěm i zkoumaného tělesa vzniklého vyříznutím menšího kužele z většího. Souřadnice daného tělesa jsou tedy [0, 0, §]. □ 8.89. UrčeteobjemtělesavK3,kteréjeohraničenočástíkuželeji;2 + y2 = (z — 2)2 a paraboloidem x2 + y2 = 4 — z. Řešení. Ve válcových souřadnicích sestavíme integrál, který i snadno vypočítáme: V 177 JO JO Jr+2 1 rA-? r dz dr d

0. O 8.94. Určete těžiště kruhové výseče z kruhu o poloměru 1 příslušné úhlu 120°. O 8.95. Určete objem tělesa v K3 daného nerovnostmi z > 0, z — x < 0 a (x - l)2 + y2 < 1. O zobrazení p bylo lineární na každém jednorozměrném podprostoru L c R™. Budeme teď postupovat velice podobně. Uvažme nějakou diferencovatelnou křivku c (i) v R™, t e [a, b], a předpokládejme, že je na nějakém okolí jejích hodnot definovaná diferencovatelná funkce /. Diferenciál této funkce nám pro každý tečný vektor dává přírůstek této funkce v daném směru. Děje se tak pomocí diferenciálu složeného zobrazení f o c vztahem d(focXť) = -?Ĺ(c(ť))c'1(ť)- 3f_ (c(t))c'n(t). Můžeme tedy zkusit zadefinovat hodnotu integrálu JM f d vol M funkce / přes neparametrizovanou křivku Mel* (píšeme zatím symbolicky vol M pro zdáraznění, že se opíráme o pojem objemu, podobně jako jsme u integrálů v jedné proměnné psali dx) pomocí nějaké její parametrizace: j f volM = j*(^L{c(t))c'Xt) + ■■■ + ^-{C(t))c'n(t^jdt. Okamžitě ověříme, že změna parametrizace křivky nemá žádný vliv na hodnotu. Skutečně, pokud napíšeme c(t) = c(ý(s)), a = ý(d), b = ý(b), dostaneme naším postupem I , í^(c(#)))c;(#)) + ... ä V 9*1 ^(c(Ý(S)))c'n(Ý(S)))^-ds ox„ ) as a věta o transformaci souřadnic pro integrál jedné proměnné dává právě stejnou hodnotu, pokud je ^ > 0, tj. pokud zachováváme orientaci křivky, a totéž až na znaménko, pokud je derivace transformace záporná. Přesněji řešeno, naučili jsme se integrovat diferenciál funkce d f přes křivky. Není teď ovšem asi přímo vidět souvislost s integrací funkcí. Evidentně nedostaneme délku křivky, když za / zvolíme konstantní funkci s hodnotou jedna. Ke zdůvodnění potřebujeme geometrický pohled na věc. Velikost vektoru je totiž dána pomocí kvadratické formy, nikoliv lineární. Jestliže ale vezmeme odmocninu z hodnot (pozitivně definitní) kvadratické formy, dostaneme formu lineární, až na znaménka, viz výše. Ještě se k těmto souvislostem vrátíme. 8.34. Vektorová pole a lineární formy. Parametrizaci křivky jsme využili v předchozím odstavci k tomu, že jsme ke každému bodu v obrazu M křivky dostali tečný vektor c' (i) e W. Máme tak dáno zobrazení X : M —> M xW, c(t) h-> (c(ř), c'(ř)). Hovoříme o vektorovém poli X podél křivky M. Obecně definujeme vektorové pole X na otevřené množině U C R™ jako přiřazení vektoru X(x) e R™ v zaměření euklidovského prostoru R™ ke každému jeho bodu x v uvažovaném definičním oboru. Jestliže máme dáno vektorové pole X na otevřené množině U c R™, pak můžeme pro každou diferencovatelnou funkci / na U definovat její derivaci ve směru vektorového pole X pomocí směrové derivace předpisem X(f) : U -> R, Je-li tedy v souřadnicích X(x) X(fXx) = XXx)^-(x) -óx\ X{fXx) = dx(x)f. :(Xi (*),...*»(*)), pak 3/ ■ + Xn(x)-^(x). ox„ 476 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.96. Určete objem K3 daného nerovnostmi z > 0, z — y 5 0 O 8.97. Určete objem tělesa ohraničeného plochou 3X2 + 2y2 + 3z2 + 2xy - 2yz - 4xz = 1. O 8.98. Určete objem části prostoru K3 uvnitř elipsoidu 2x2+ y2 +z2 = 6 a v poloprostoru x > 1. O 8.99. Povrch grafu reálne funkce f (x, y) dvou proměnných x a y. Povrch grafu funkce dvou proměnných nad plochou S v rovině xy je dán integrálem P = jjl + f2 + f2áxáy. Určete obsah části pláště kužele x2 + y2 = z2, která leží nad rovinnou z = 0 a uvnitř válce x2 + y2 = y. Řešení. Hledaný povrch vypočítáme jako povrch grafu funkce z = y]x2 + y2 nad kruhem K: x2 — (y — j)2. Snadno nahlédneme, že y x2+f'fy x2+f a povrch můžeme vyjádřit integrálem JfK^íTf27f2dxdy = jj Jláxáy. V2 / / rdrd^ = ^- / ^"2 Ja Ja z Ja sin

x. O Ukažme si příklad, kde také využijeme získaných znalostí z teorie Fourierových transformací z minulé kapitoly. 8.102. Fourierova transformace a difrakce. Intenzita světlaje fyzikálni veličina kvantitativně vyjadřující přenos energie vlněním. Intenzita obecné světelné vlny je definována jako časová střední hodnota velikosti Poyntingova vektoru, který je vektorovým součinem navzájem kolmých vektorů elektrického a magnetického pole. Pro monochromatickou rovinnou vlnu šířící se ve směru osy y platí I = CE0 kde c je rychlost světla a e0 je permitivita vakua. Monochromatická vlna je popsána harmonickou funkcí Ey = \j/(x, t) = A cos(wt — Nejjednodušší vektorová pole budou mít v souřadnicích všechny souřadné funkce rovny nule, kromě jedné funkce X;, která bude konstantně jednička. Takové pole pak odpovídá příslušné parciální derivaci podle proměnné x\. Tomu odpovídá také obvyklý zápis X(x) = Xi (*)---- + • • • + Xn(x)^-. 9*1 oxn Množina všech možných tečných vektorů v bodech otevřené podmnožiny U e R™ se nazývá tečný prostor TU. Vektorový prostor všech vektorů v bodě x zapisujeme jako Tx U. Pro množinu všech hladkých vektorových polí na U používáme značení X(U). Vektorová pole g^- můžeme chápat jako generátory X(U), jako koeficienty v lineárních kombinacích ovšem připouštíme hladké funkce. Při studiu vektorových prostorů jsme již ve druhé kapitole narazili na potřebnost tzv. lineárních forem. Definovali jsme je v odstavci 2.39 na straně 95. Lineární forma na zaměření R™ našeho euklidovského prostoru R™ přiřazená k bodu x e R™ je lineárním zobrazením definovaným na tečném prostoru Tx U. Jestliže máme dáno zobrazení i] : U C R™ —> R™* na otevřené podmnožině U, hovoříme o lineární formě i] na U. Každá diferencovatelná funkce / na otevřené podmnožině U C R™ definuje lineární formu df na U. Pro množinu všech hladkých lineárních forem na U používáme značení Í21 (Í7). Je zřejmé, že v souřadnicích (x\, ... ,xn) můžeme využít diferenciálů jednotlivých souřadných funkcí a každou lineární formu i] vyjádřit t](x) = rn(x)dx\ H-----h r]„(x)dxn, kde i]i(x) jsou jednoznačně určené funkce. Taková forma i] se vyčíslí na vektorovém poli X(x) — X\(x)-^ + • • • + Xn(x)-^-jako r,(X(x)) = m(x)Xi(x) + ■■■ + r,n(x)Xn(x). V případě, že je forma i] diferenciálem funkce /, dostáváme právě výše použité vyjádření X(f)(x) — df (X(x)). Všimněme si, že jsme v předchozím odstavci vlastně zavedli integrál libovolné lineární formy přes (neparametrizované) křivky M pomocí jakékoliv parametrizace c(ř) í n = ( n(c(i))(c'(t))dt, JM Ja protože jsme tehdy sice pracovali s diferenciálem funkce, ale ve skutečnosti jsme ověřili nezávislost hodnoty integrálu na volbě parametrizace pro jakoukoliv lineární formu. Všimněme si také, že není třeba psát nějaký symbol, označující vzhledem k jakému konceptu objemu integrujeme, je to dáno definicí lineární formy. 8.35. ^-rozměrné plochy a &-formy. Místo parametrizovaných křivek teď budeme pracovat s diferencovatelnými zobrazeními

R™, k < n, s injektivním diferenciálem d(p(u) v každém bodě svého otevřeného definičního oboru V. Takovým zobrazením říkáme imerze. Podmnožinu M c R™ nazýváme varietou dimenze r, jestliže má každý bod x e M okolí U, které je obrazem takové imerze

M c R™, že ji lze rozšířit na zobrazení

/ — k x)) ,r dt -ce0A2-[t + 2co -ľ Jo 2 1 ,1 , sin(2(t<;T — k x)) — sin(2(—k x)) , = -ce0Ai-(T +---) = 2 T 2a; 1 ,, sin(2(t<;T — x)) — sin(2(—k x)) , 1 , = -C£0A(1 +-—-) = -cs0A Druhý člen v závorce můžeme zanedbat, protože je vždy menší ne^ 2^7 = 2^7 < ^ 6 Pro reálné detektory světla, je tedy nepatrný oproti 1. Intenzita světlaje přímo úměrná druhé mocnině amplitudy. Difrakcí rozumíme takovou odchylku od přímočarého šíření světla, která nemůže být vysvětlena jako důsledek odrazu či lomu (či změnou směru paprsku v prostředí se spojitě se měnícím indexem lomu). S difrakcí se setkáváme při šíření prostorově ohraničeného svazku světla. Difrakční jevy jsou nejvýrazněji a snadno pozorovatelné tehdy, když světlo prochází otvory či překážkami, jejichž velikost je řádově srovnatelná s vlnovou délkou světla. Při Fraunhoferově difrakci v následujícím příkladu prochází rovinná monochromatická vlna velmi úzkou obdélníkovou štěrbinou a promítá se na vzdálenou plochu, například posvítíme-li laserovým ukazovátkem drobnou štěrbinou na stěnu. Obraz, který dostaneme je Fourierovou transformací funkce propustnosti stínítka - štěrbiny. Zvolme rovinu difrakčního stínítka za souřadnicovou rovinu z = 0. Nechť kolmo na tuto rovinu dopadá rovinná vlna A exp(ifcz) (nezávisí na místě dopadu (x, y) na stínítku). Označme s(x, y) funkci propustnosti stínítka, pak lze výsledné vlnění dopadající na projekční plochu v místě (£, rj) popsat jako integrální součet všech vln (Huygensův-Fresnelův princip), které prošly stínítkem a šíří se dále prostředím ze všech bodů (x, y, 0) (jako kulová vlna) do bodu (£, r\, z): ,r1) = A f f s(x, yje-'^+irt dx dy JJk2 n) = A /p72 ŕ g/2 / e-ik&+iy) dy dx -p/2 J-p/2 /p/2 pq/2 M variety M, nějaké rj( = /«K", tj. ve standardních souřadnicích bude mít a> tvar (8.3). Definujeme / a> = / f(x)dx\ a ■ Ju Ju ■ a dx„ = / /(x) dx\ ... dx„ Ju kde na pravé straně stojí Riemannův integrál funkce. Všimněme si, že nalevo stojí n-forma zcela nezávisle na volbě souřadnic. Jestliže budeme chtít formu a> vyjádřit v jiných souřadnicích prostřednictvím difeomorfismu

U, znamená to, že budeme vyčíslovat a> v bodě , a snadno spočteme (podívejte se na vztah (8.1) v odstavci 8.35) ,tkp\ tkp\ , (

) = J f(u)det(Dl(p(u))dui---dun, což je podle věty o transformaci proměnných z odstavce 8.31 tatáž hodnota, pokud je determinant Jacobiho matice stále kladný, a stejná hodnota až na znaménko, pokud je záporný. Naše nová interpretace tedy dává geometrický smysl pro integrál n-formy na M", pokud příslušný Riemannův integrál v nějakých (a pak už jakýchkoliv) souřadnicích existuje. Tato integrace přitom bere v úvahu orientaci oblasti, přes kterou integrujeme. 8.38. Integrace vnějších forem na varietách. Teď už máme skoro všechno připravené pro definici integrálu reformy na ^-rozměrné orientované varietě. Budeme se pro jednoduchost zabývat hladkými formami a> s kompaktním nosičem. 480 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.105. Vyčíslete j (xy + x + y) dx + (xy + x — y) dy, c kde c je kružnice o poloměru 1 se středem v počátku. Řešení. Opět jsou splněny předpoklady pro užití Greenovy věty a postupně dostáváme j (xy + x + y) dx + (xy + x — y) dy c = jj y + l- x- ldxdy D 1 2tí = j j r2 (sin

U C M c K™. Volbou parametrizace

= / ftH-----h / JM JU, JU„ kde c je kladně orientovaná kružnice (x — 2) + (y — 2) = 1. jm Ju, Jum a snadno ověříme, že tato hodnota nezávisí na volbě množin U i a parametrizací (zejména nás netrápí množina B, protože na ní bude výsledek jakékoliv integrace nulový). Představte si třeba rozložení sféry na horní a dolní hemisféru, přičemž rovník B nám zůstane nepokrytý. Při praktickém počítání si pak zpravidla rozdělíme celou varietu na několik disjunktních oblastí a integrujeme na každém zvlášť. Uvedeme si ale globální definici, která je technicky výhodnější. 481 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Řešení. /ex 1 (e*lny - y2x)dx + (---x2y)dy y 2 c -I! D 1 2ir e e --xy---h 2xy äx dy y y o o 1 2ir j j r3 sin (p cos (p + 2Ý1 (sin ^ + cos (p) + 4r dr dip o o 2ir 1 ľ 2 ľ — J sm

r(ř) takovou, že /E>r(ř) = 1 pro |ř| < r - e, zatímco fs,r(t) — 0 pro |ř| > r + e, a 0 < /E,r(ř) < 1 všude. Přitom zároveň platilo f (i) ^ 0, právě když \t\ < r + £ (na obrázku v 6.6 připomíná graf této funkce charakteristickou funkci). Jestliže nyní definujeme Xr.B.x0(x) = fe,r(\x - X0\), dostáváme hladkou funkci identicky jedničkovou uvnitř koule £r_E (xo) s nosičem právě Br+e (xo) a s hodnotami mezi nulou a jedničkou všude. Lemma (Whitneyho věta). Každá uzavřená množina K c K™ je množinou všech nulových bodů nějaké hladké reálné nezáporné funkce. Důkaz. Idea důkazu je prostá. Je-li K = W, vyhovuje identicky nulová funkce, předpokládejme K ^ W. Otevřenou množinu U = W \ K vyjádříme jako sjednocení nejvýše spočetně mnoha otevřenými koulemi Bn (xi) a pro každou z nich zvolíme hladkou nezápornou funkci f na M", j ejíž nosič j e právě Bn (xj), viz funkce Xr,B,x0 výše. Nyní sečteme všechny tyto funkce do nekonečné řady /(*) = £~2akfk(x), přičemž koeficienty ak zvolíme tak malé, aby tato řada konvergovala k hladké funkci f (x). K tomu stačí např. zvolit ak tak, aby všechny parciální derivace všech funkcí ak fi (x) až do řádu k včetně byly shora odhadnuty číslem 2~k. Pak totiž nejen samotná řada i\Zk akfk je shora odhadnuta součtem řady i\Zk ^' a tetty podle Weierstrassova kriteria konverguje stejnoměrně na celém W, ale totéž dostaneme pro všechny řady parciálních derivací, protože je můžeme vždy napsat jako r-1 J2ak k=0 3r ji 3xh ■ ■ ■ 3xir E ak % fk 3xh ■ ■ ■ 3xir přičemž první část je hladká funkce, protože jde o konečný součet hladkých funkcí, a druhou část máme opět odhadnutou shora absolutně konvergující řadou čísel a bude tedy opět tento výraz stejnoměrně konvergovat k 8ľ y ^ . . Z definice je zřejmé, že funkce f(x) splňuje požadavky v lemmatu. □ 482 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 2 2 8.112. Vypočtěte obsah plochy dané elipsou ^ + h = !• Rozklad jednotky na varietě Řešení. Použitím vztahu ||8.111|| a pomocí transformace souřadnic x = a cos t,y = b sin /, pro / e [0, 2it] dostáváme 1 ľ m(D) = — J —y dx + x dy 2it 2it 1 í 1 í — J a cos t ■ b cos tdt — — J b sin t ■ {—a sin ť)dt o o ___ , cos2 tdt-\—ab I sin2 tdt 2 I 2 —ab f cos2 tdt H—ab f 2 J 2 J o 2n —ab I 2 J cos21 + sin2 tdt = —ab2n = nab, což je vskutku známý vzorec pro výpočet elipsy s poloosami a ab. □ 8.113. Vypočtěte obsah plochy ohraničené cykloidou danou parametricky \jr(i) = [a(t — sinr); a(l — cos/)], pro a > 0, r e (0, 2jt) a OSOU X. Řešení. Plocha je dána křivkami c\ a c-i. Takže pro obsah dostáváme m(D) = ± fCí -y dx + x dy + ± -y dx + x dy. Každý z uvedených integrálů spočítáme zvlášť: parametrické vyjádření křivky c\ (úseku osy x) je (/; 0); / e [0; 2air] a pro první integrál můžeme psát - / - y dx + x dy = - / 0 • 1 dr + / / • Odt = 0. 2 J 2 Jo Jo Cl Parametrické vyjádření křivky c2 je \j/(t) e (a(t — sinr), a(l — cos/)); / e [2jt; 0]. Vzorec pro obsah předpokládá kladně orientovanou křivku, což pro uvažované parametrické vyjádření cykloidy znamená, že se pohybujeme proti směru parametrizace, tedy od větší meze k menší. Věta. Uvažme varietu M c K™ a její lokálně konečné pokrytí otevřenými obrazy U i parametrizací z definice pojmu variety a jejích lokálních parametrizací. Jistě tak můžeme učinit tak, aby i nadále byly množiny Í7, lokálně konečným pokrytím otevřeného okolí Ú = U; f/; c K™ variety M. Pro každou otevřenou množinu U i nyní zvolme funkci g, (x) na celém M", tak aby g; (x) ^ 0 právě pro x e U i. To umíme podle právě dokázané Whitneyho věty. Nyní je funkce g(x) = g; (x) dobře definovaná pro všechna x e W a hladká, díky lokální konečnosti pokrytí (pro každý pevný bod x jde o konečnou sumu nenulových funkcí na nějakém jeho okolí). Funkce g(x) je přitom nenulová pro všechna x e M, můžeme proto na místo funkcí g, (x) zúžených na M uvažovat funkce f(x) = gi(x)/g(x), které již splňují obě požadované vlastnosti ve větě. □ 8.40. Integrace &-forem na varietách. Teď již máme vše připraveno k definici integrálu &-forem na ^-rozměrných varietách. Uvažme tedy nějakou takovou varietu ; M c K™ a nějakou formu w e Qk(M) s kompaktním nosičem. Zvolme si nějaké lokálně konečné pokrytí variety M parametrizacemi (pi : Vj —> U i takovými, že uzávěry všech obrazů U kousku variety U C M a podívejme se, čím integrál přes U přispěje k naší integraci. Dostáváme í 63 = H í (fi°v>K)= í Ju . Jv,nv Jv

Qk+lM,pro všechny variety M c K™ a k = 0, ..., n, takové že • d je lineární vzhledem k násobení reálnymi čísly, • pro k — 0 jde o diferenciál funkcí, • d(a A P) = (dá) Afi + (-i)ra A (d P), kde a e Qr(M), • pro každou funkci f na M platí d(df) — 0. Zobrazení d říkáme vnější diferenciál. Důkaz. Pišme lokálně &-formu ve tvaru a = aií...itdxií A • • • A dxit. h <—-''' ' Nejjednodušší je situace se souvislými křivkami. Buď jde o uzavřenou křivku, jako je např. kružnice v rovině, a pak je její hranice prázdná, nebo je hranice tvořena dvěma hraničními body. Tyto body budeme brát včetně orientace zděděné z křivky, tj. počáteční bod budeme brát se znaménkem mínus, koncový se znaménkem plus. Všimněme si, že jestliže integrujeme po křivce M, která je obrazem parametrizace

s kompaktním nosičem na orientované varietě M s hranicí 3M se zděděnou orientací. Pak platí do) - I da> — I J M JdM □ Důkaz. S využitím vhodného lokálně konečného pokrytí variety M a jemu podřízeného rozkladu jednotky vyjádříme integrály na obou stranách jako součet (dokonce konečný, protože je nosič uvažované formy a> kompaktní) integrálů forem na R* nebo poloprostoru Rozklad jednotky se nám tu hodí jako topologický nástroj umoňující lokalizovat řešený problém a dokazovat větu zvlášť pro dva případy, M — Rk a M — R_ x Ri_1. Začneme s obtížnějším případem poloprostoru M. Uvažme tedy formu a> je forma s kompaktním nosičem na uzávěru M. Pak bude a> jistě součtem forem 485 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.117. Vypočtěte tok vektorového pole daného funkcí F = (y, x, z2), přes kouli x2 + y2 + z2 = 4. tvaru Řešení. Divergence daného vektorového poleje: div F = V • F Hledaný tok je pak roven 3y ^ dx ^ dz2 dx dy dz 2z. /// 2z dx dy dz L 7t Zit III p sin

cos (p dtp ■■ P o i„ sin w „ 2i^-i20 ■ ml* ■ [-f-r0 16 2---2jt • 0 = 0. 4 K. Diferenciální rovníce l.řádu 8.118. Určete všechna řešení diferenciální rovnice □ y n-y- f (l+cos2*) Řešení. Máme zadánu obyčejnou diferenciální rovnici prvního řádu ve tvaru y' = f(x, y), čemuž říkáme, že je rozřešená vzhledem k derivaci. Navíc ji můžeme uvést do tvaru y' = f\(x) ■ f2Íy) pro spojité funkce f\ a f2 jedné proměnné (na jistých otevřených intervalech), tj. jedná se o diferenciální rovnici se separovanými proměnnými. Při výpočtu nejprve nahradíme y' = dy/dx a upravíme diferenciální rovnici do tvaru n-ř ■■ dy l+COS X COS2 X dx. Neboť r lW* dx= r 1 + 1 dx j cosz x j COSz X můžeme integrováním podle základních vzorců získat (8.6) arcsin y = tg x + x + C, C e K. Uvědomme si však, že při dělení výrazem ^1 — y2 jsme mlčky předpokládali jeho nenulovost, tj. výpočet je platný pro y 7^ ±1. Dosadíme-li konstantní funkce y = 1, y = — Ido dané diferenciální rovnice, ihned vidíme, že diferenciální rovnici vyhovují. Máme tedy další dvě řešení, o kterých mluvíme jako o singulárních. Situaci, kdy je cos* = 0, neřešíme. V tomto případě totiž pouze ztrácíme body definičních oborů (nikoli samotná řešení). co — r\j(x)dx\ a • • • /\dxj A • • • A dxi, kde stříška značí vynechání příslušné lineární formy a a>j(x) je hladká funkce s kompaktním nosičem. Její vnější diferenciál je i ^Vi do) = (—1) -dx\ a • • • a dxk- 'dx j Pokud je j > 1, je vyčíslení formy co podél hranice 3M = {x e M.k; x\ — 0} identicky nulové. Zároveň s využitím základní věty o primitivní funkci pro funkce jedné proměnné dostáváme ľ i ľ l f°° dVj \ I do) = (—1) / I / -dxj \dx\ ■ ■ ■ dxj ■ ■ ■ dxk J M ÍR*-1 VJ-co dXj ) = (-iy / [ij]-,xdxi ■ ■ -dxj ■ ■ -dxk = o, protože má funkce co j kompaktní nosič. Věta tedy v tomto případě platí. Pokud je ale j = l, pak dostáváme í dcú = í (í -co 3*1 dx\ \dx2 ■ ■ dxk ■- i »)i(0, X2, ..., Xk)dx2 ■ ■ -dxk — 1 a>. ÍK*-' JdM Tím je důkaz Stokesovy věty ukončen. □ 8.44. Poznámky o využití Stokesovy věty. Dokázali jsme mimořádně důležitý výsledek, který pokrývá »T několik klasických integrálních vztahů z klasické vektorové analýzy. Např. si všimněme, že podle Stokesovy věty je integrace vnějšího diferenciálu dm jakékoliv (k — l)-formy přes kompaktní varietu bez hranice vždy nulová (např. když integrujeme 2-formu dm přes sféru 52 C K3). Podívejme se postupně na případy Stokesovy věty v nízkých dimenzích. Případ n — 2, k — ohraničenou křivkou C - 1. Zkoumáme tedy plochu M v rovině 3M. Je-li forma a>(x, y) — f(x, y)dx+ g(x,y)dy,]e,dcú — (—^- + ^)dxAdy. Stokesova věta tedy dává vztah j f (x, y)dx ľ í 3/ 3g\ - g(x, y)dy = / -— + — \dx a dy, J M V 3y 3* / což je jeden z klasických tvarů tzv. Greenovy věty. Jestliže využijeme standardní skalární součin na R2, můžeme vektorové pole X ztotožnit s lineární formou a>x takovou, že <&x(Y) = (Y, X). Ve standardních souřadnicích (*, y) to prostě znamená, že pole X — f (x, y) +g(x, y)j^ zadá právě formu a> zadanou výše. Integrál z a>x podél křivky C má ve fyzice význam práce vykonané pohybem po této křivce v silovém poli X. Gree-nova věta pak mimo jiné říká, že pokud je a>x — dF pro nějakou funkci F, pak je vykonaná práce po uzavřené křivce vždy nulová. Takovým polím se říká potenciálové a funkce F je potenciál pole X. Také jsme Greenovou větou znovu ověřili, že integrace diferenciálu funkce po křivce závisí jen na počátečním a koncovém bodu křivky. Případ n — 3, k — 2. Zkoumáme oblast v R3 ohraničenou plochou 5. Je-li a> — f(x, y, z)dy a dz + g(x, y, z)dz a dx + 486 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Nyní si několik částí výpočtu okomentujme. Vyjádření / dy/dx umožňuje mnoho symbolických úprav. Kupříkladu je dz dy _ dz dy dx dx ' j_ dy dx dy ' Platnost těchto dvou „samozřejmých" vztahů je ve skutečnosti zaručena po řadě větou o derivaci složené funkce a větou o derivaci inverzní funkce. Právě výhodnost jasných úprav byla motivací pro G. W. Leibnize při zavádění dodnes používaného značení. Dále si všimněme, že jsme obecné řešení (||8.6||) neupravili do nabízejícího se tvaru (8.7) y = sin (tg x + x + C) , C e K. Přestože, jak je koneckonců obvyklé, nebudeme při počítání diferenciálních rovnic uvádět definiční obory (pro která x mají výrazy smysl), nebudeme je ani měnit „nadbytečnými" úpravami. Je totiž zřejmé, že funkce y uvedená v (||8.7||) je definována pro všechna x e (0, ji) \ {jr/2}, avšak pro hodnoty x blízké it/2 (při daném C) neexistuje y takové, aby bylo splněno (||8.6||). Řešeními diferenciálních rovnic jsou obecně křivky, které není vždy možné vyjádřit jako grafy elementárních funkcí (na celých intervalech, kde je uvažujeme). Proto se o to občas nebudeme ani pokoušet. □ 8.119. Uvedte obecné řešení rovnice / = (2 — ý) tgx. Řešení. Opět máme diferenciální rovnici se separovanými proměnnými. Postupně dostáváme dy i = i2-y)tgx, dy ~y~2 ■\n\y-2\ -dx, cos x — In | cos x\ — ln | C \, Posunutí dané integrováním jsme zde vyjádřili pomocí ln | C |, což je vhodné (vzhledem k následujícím úpravám) zvláště tehdy, když na obou stranách rovnice obdržíme logaritmus. Dále je ln | y - 2| = ln | C cos* |, C^O, \y-2\ = ICcosxl, CjéO, y — 2 = C cos x, C 0, kde bychom měli psát ±C (po odstranění absolutní hodnoty). Tím, že však uvažujeme všechna nenulová C, nezáleží na tom, zda píšeme +C, nebo —C. Všimněme si, že jsme dělili výrazem y — 2. Proto je třeba případ y = 2 vyšetřovat zvlášť. Derivace konstantní funkce je nulová, a tudíž jsme nalezli ještě jedno řešení y = 2. To však není singulární: volbou C = Ojej můžeme zahrnout do dříve určeného obecného řešení. hix, y, z)dx a dy, dostaneme do> = (|£ + |^ + ^)dx a dy a dz a Stokesova věta říká Jf (x, y, z)dy/\dz+g(x, y, z)dz/\dx+h(x, y, z)dx/\dy f ídf dg dh\ = jM\žx- + Ty+^)dXAdyAdZ- dy dz To je tvrzení tzv. Gaussovy-Ostrogradského věty. 1 tato věta má velmi názornou fyzikální interpretaci. Každé vektorové pole X = f (x, y, z)£ + g(x, y,z)-^ + h(x, y, z)£ zadá dosazením za první argument ve standardní formě objemu vnější 2-formu a>x(x, y, z) = f (x, y, z)dy Adz + g(x, y, z)dz a dx + h(x, y, z)dx a dy. Integrál této formy přes plochu můžeme vnímat tak, že integrovaná 2-forma v každém bodě infinitesimálně přidá k integrálu přírůstek rovný objemu rovnoběžnostěnu zadaného polem X a malým kouskem plochy. Vnímáme-li vektorové pole jako rychlost pohybu jednotlivých bodů prostoru, půjde o „průtok' danou plochou. Na pravé straně integrálu pak je výraz, který můžeme definovat jako d(a>x) = (div X)dx a dy a dz. Gaussova-Ostrogradského věta říká, že když je div X identicky nulové, pak celkový průtok hraniční plochou oblasti je nulový. Proto se polím s div X = 0 říká bezzřídlová pole. Případ n = 3, k = 1. V tomto případě máme v R3 plochu M ohraničenou křivkou C. V případě, že lineární forma a> je diferenciálem nějaké funkce, zjišťujeme, že integrál po ploše závisí jen na hraniční křivce. Jde o klasickou Stokesovu větu. Pokud stejně jako v rovině použijeme standardní skalární součin k identifikaci vekto-rovéhopoleX = /l^+gřJ^+^řF sformoufc) = fdx+gdx+hdz, dostaneme fdx + gdx + hdz - / J M duj, kde,fo = (*-§£)dyAífe + (3£-^)dZAdx+(^-s/y)dxAdy. Tuto 2-formu můžeme opět identifikovat s jediným vektorovým polem rotX, které dá da> dosazením do standardní formy objemu. Tomu poli se říká rotace vektorového pole X. Vidíme, že v třírozměrném prostoru jsou vektorová pole X s vlastností a>x = dF pro nějakou funkci F zadána podmínkou rot X = 0. Opět jim říkáme potenciálová pole. 3. Diferenciální rovnice V této části se vrátíme k (vektorovým) funkcím jedné proměnné, které ale budeme zadávat a zkoumat pomocí jejich okamžitých změn. V závěru se pak také zastavíme u případu rovnic obsahujících parciální derivace. 8.45. Lineární a nelineární diferenční modely. Pojem derivace jsme zavedli, abychom mohli pracovat s okamžitými změnami studovaných veličin. Ze stejných důvodů fc^_ jsme kdysi v úvodní kapitole zaváděli diference a právě vztahy mezi hodnotami veličin a změnami těch samých nebo jiných veličin vedly k tzv. diferenčním rovnicím. Jako motivační úvod k rovnicím obsahujícím derivace neznámých funkcí se k diferenčním rovnicím na chvilku vraťme. Nejjednodušším modelem bylo úročení vkladů nebo půjček (a totéž pro tzv. Malthusiánský model populace). Přírůstek byl úměrný hodnotě, viz 1.10. V rámci spojitého modelování stejný požadavek povede na rovnici vztahující derivaci funkce / (ř) s její 487 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Správny výsledek tak je y = 2 + Ccosx, C e K. □ 8.120. Nalezněte řešení diferenciální rovnice (1 + e1) yi = e* splňující počáteční podmínku y (Q) = 1. Řešení. Jsou-li funkce / : (a, b) —► K a g : (c, d) —► K spojité a je-li g(y) 7^ 0, y € (c, d), má počáteční úloha / = f (x) g (ý), y(x0) = y0 právě jedno řešení pro libovolné x0 e (a, b), y0 e (c, d). Toto řešení je implicitně určeno jako y i*) x yo xa V konkrétních příkladech si počínáme tak, že najdeme všechna řešení a pak vybereme to, které vyhovuje počáteční podmínce. Počítejme (1 +ď)ydy/dx = ď, ydy 1 +e* - dx, y2 :ln(l + e*)+ln|C|, C^O, y2 ■■ ln (C [1 + ex]), C > 0. Dosazení y = 1, x = 0 poté dává 1 _ 2 Nalezli jsme tak řešení tj- i=ln(C-2), tj. C - 2 í = ln(f [1+e*]). y = j2]n(ý [1+e*]) v okolí bodu [0, 1], kde je v > 0. 8.121. Určete řešení diferenciální rovnice pro které je y(0) = 1. Řešení. Podobně jako v předchozím příkladu dostáváme dy dx y2 + 1 ~ x + ť arctg v = ln | x + 11 + C, Cel. Počáteční podmínka (tedy dosazení x = 0 ay = 1) dává arctg 1 = ln | 1| + C, tj. C = f. Proto řešením zadaného počátečního problému je funkce y(*) = tg (ln |x + 11 + f) □ hodnotou (tradičně se u takových rovnic explicitně nevypisuje argument neznámé funkce, který je buď znám z kontextu nebo na jeho označení nezáleží) (8.4) y = r ■ y s konstantou úměrnosti r. Je snadné uhodnout řešení této rovnosti, tj. funkci y(f) po jejímž dosazení bude rovnost identicky splněna, yC0 = Cert s libovolnou konstantou C. Tuto konstantu určíme jednoznačně volbou tzv. počáteční hodnoty yo = y(to) v nějakém bodě to. Pokud by část růstu v našem modelu byla dána konstantním působením nezávislým na hodnotě y nebo t (jako jsou např. paušální poplatky za vedení účtu nebo přirozený úbytek populace třeba v důsledku porážek na jatkách), mohli bychom použít rovnici s konstantou s na pravé straně (8.5) y = r • y + í. Zjevně bude řešením této rovnice funkce y(ř) = Cert--. r K tomuto závěru je velice lehké dojít, pokud si uvědomíme, že množinou všech řešení rovnice (8.4) je jednorozměrný vektorový prostor, zatímco řešení rovnice (8.5) se obdrží přičtením kteréhokoliv jednoho jejího řešení ke všem řešením předchozí rovnice. Lze pak snadno najít konstantní řešení y(ř) = k pro k — — ^. Podobně se nám v odstavci 1.13 podařilo vytvořit tzv. logistický model populačního růstu založený na předpokladu, že poměr změny velikosti populace p(n + 1) — p(n) a její velikosti p(ri) je v afinní závislosti na samotné velikosti populace. Přitom jsme chtěli, aby se model choval podobně jako Malthusiánský při malých hodnotách populace a vůbec nerostl při dosažení limitní hodnoty K. Nyní můžeme tentýž vztah pro spojitý model formulovat pro populaci p(i) závislou na čase t pomocí rovnosti (8.6) P =py--p + r}, tj. při hodnotě p (i) — K pro velkou konstantu K je skutečně okamžitý přírůstek funkce p nulový, zatímco pro p(f) blízké nule je poměr rychlosti růstu populace k její velikosti blízký r, což bývá malé číslo v řádu setin vyjadřující rychlost růstu populace za dobrých podmínek. Není jistě snadné vyřešit bez znalostí teorie takovou rovnici (i když právě tento typ rovnic zanedlouho zvládneme), nicméně jako cvičení na derivování lze snadno ověřit, že následující funkce je řešením pro každou konstantu C: P(t) = l + CKe-«- 488 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI v okolí bodu [0, 1]. 8.122. Vyřešte (8.8) □ y x + y + í 2x + 2y - 1 Řešení. Nechť má funkce / : (a, b) x (c, d) —► K spojité parciálni derivace druhého řádu a f (x, y) ^ 0, x e (a, b), y e (c, d). Pak lze diferenciální rovnici y' = f (x, y) převést na rovnici se separovanými proměnnými právě tehdy, když f (x, y) /;(*, y) fix, y) f'y(x,y) S trochou námahy tak lze dokázat, že diferenciální rovnici ve tvaru y' = f (ax + by + c) můžeme převést na rovnici se separovanými proměnnými, a to pomocí substituce z = ax + by + c. Podotkněme, že proměnná z zde nahrazuje y. Položíme tedy z = x + y, což dává z' = 1 + /. Dosazením do : 0, x e (a, b), y e (c, d). 118.811) získáváme 1 z + 1 dz___ dx 2z dz_ _ dx 2z z +1 - 1 + 1, 3z 2z-l 3*1*1 1 ~ 3~z x + C dz = 1 dx, C e K, resp. f z - \ ln | Cz | = x, C^O. Ještě se musíme vrátit k původní proměnné y v jednom z těchto tvarů. Obecné řešení lze proto zapsat např. jako \ x + é\y - \ \n \ x + y \ = x + C, C e tj. x - 2y + ln | x + y \ Zároveň existuje singulární řešení y C, C € K. —x, které vyplývá z omezení z 0 výše provedených úprav (kdy jsme dělili hodnotou 3z). □ 8.123. Vyřešte diferenciální rovnici xý + ylnx = y lny. Řešení. Pomocí substituce u = y/x lze každou homogenní diferenciální rovnici y = f (y j x) převést na rovnici (se separovanými proměnnými) u' = i (f (u) — u), tj. u'x + u = f (u). Srovnáním grafu této funkce s volbou K — 100, r — 0, 05 a C = 1 na levém obrázku (první dvě jsme takto použili v 1.13, poslední odpovídá přibližně počáteční hodnotě p (O) = 1) s pravým obrázkem (řešení diferenční rovnice z 1.13 s týmiž hodnotami parametrů) vidíme, že skutečně oba přístupy k modelování populací dávají docela podobné výsledky. Pro srovnání výstupu je také do levého obrázku vkreslen graf řešení rovnice (8.4) s touž konstantou r a počáteční podmínkou. 8.46. Diferenciální rovnice prvního řádu. Obecně rozumíme (obyčejnou) diferenciální rovnicí prvního řádu vztah mezi derivací funkce / (ř) v proměnné t, její hodno-JKJ^Nfc tou y(f) a samotnou proměnnou, který lze zapsat s po--Wiír^m^— mocí nějaké reálné funkce F : R3 -> R jako rovnost F(y?,y,ť) = 0. Zápis připomíná implicitně zadané funkce y(f), nicméně navíc je tu závislost na derivaci hledané funkce y(f). Znovu si povšimněme konvence, že při výskytu t považujeme tuto proměnnou za nezávislou proměnnou hledané funkce y(f) a nikoliv volný parametr problému. Pokud je rovnice alespoň explicitně vyřešena vzhledem k derivaci, tj. y = fit, y) pro nějakou funkci / : R2 -> R, můžeme si dobře graficky představit, co taková rovnice zadává. Pro každou hodnotu (t, y) v rovině si totiž můžeme představit šipku udávající vektor (1, fit, y)), tj. rychlost se kterou se nám bod grafu řešení bude pohybovat rovinou v závislosti na volném parametru t. Např. pro rovnici (8.6) dostaneme takovýto obrázek (i s vyneseným řešením pro počáteční hodnotu jako výše). 10O y(x) 80; v 7 - 60J 40J 2Cb '/// /// w, ni \\\ //// ///// ///// ///// ///// ///// A/PS/ ///// m ///// ///// ////// ////// ////// mu ////// ////// ///// "1 I I I "m—t—r- 50 100 150 200 Intuitivně lze na základě takových obrázků očekávat, že pro každou počáteční podmínku bude existovat právě jedno řešení naší rovnice. Jak ale uvidíme, takové tvrzení platí jen pro dostatečně hladké funkce /. 489 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Název této diferenciální rovnice je založen na následující definici. Funkce dvou proměnných / se nazývá homogenní fc-tého stupně, jestliže je fitx, ty) = tk f{x, y). Diferenciální rovnice ve tvaru P(x, y) dx + Qix, y)dy = 0 je totiž homogenní diferenciální rovnicí, právě když jsou funkce P a <2 homogenní stejného stupně k. Např. takto můžeme odhalit, že zadaná rovnice x dy + iy ln x — y ln y) dx = 0 je homogenní. Samozřejmě není obtížné ji hned rozřešit vzhledem k derivaci a zapsat ve tvaru ý = y-\ny-. y xx Substitucí u = y/x počítáme u'x + u = u lnu, du — x = u (ln u dx du -1), dx x u (ln u — 1) přičemž w (ln w — 1) ^ 0. Pomůžeme-li si další substitucí / lnu — 1, snadno integrujeme du /du u (ln u 1) ÍT ln|/|=ln|x|+ln|C|, ln | lnu — 1 | = ln | Cx \, 1 = Cx, ln V ln u y x y Cx + 1, ■.xeCx+\ /dx x ' /dx x ' C ŕ 0, C t^O, C t^O, C t^O, C £ 0. Vyloučené případy w = 0 a ln w =1 nevedou na dvě řešení, neboť u = 0 implikuje y = 0, což nelze do původní rovnice vůbec dosadit. Zato ln w = 1 dává y/x = e a funkce y = ex zřejmě řešením je. Proto obecným řešením je y=xeCx+\ CeK. 8.47. Integrace diferenciálních rovnic. Ještě než se pustíme ,ýp^ do zkoumání existence řešení diferenciálních rovnic, ukážeme si aspoň jednu úplně elementární metodu řešení. Převádí řešení na obyčejné integrování a zpravidla pak pro řešení obdržíme implicitní popis. ROVNICE SE SEPAROVANÝMI PROMĚNNÝMI Uvažujme diferenciální rovnici ve tvaru (8.7) / = f(t) ■ g(y) pro dvě spojité funkce jedné reálné proměnné / a g, g(y) ^ 0. Řešení této rovnice lze získat integrací, tj. nalezením primitivních funkcí G(y) = f dy F(r) = / fit) dl. Postup spolehlivě najde řešení splňující giyit)) ^ 0. Pak totiž spočtením funkce y(x) z implicitně zadaného vztahu Fit) + C = G (y) s libovolnou konstantou C vede k řešení, protože derivováním této rovnosti s použitím pravidla pro derivování složené funkce Giyit)) dostaneme skutečně g(y) Jako příklad najděme řešení rovnice / = * • y. Přímým výpočtem dostaneme ln \ yix)\ — padá (alespoň pro kladná y) na \x2 + C. Odtud to vy- yix) = e ;xl+C kde D je nyní libovolná kladná konstanta. Zastavme se ale pozorněji u výsledné formule a znamének. Konstantní řešení y(x) — 0 vyhovuje naší rovnici také a pro záporná y můžeme použít stejné řešení s zápornými konstantami D. Ve skutečnosti může být konstanta D jakákoliv a našli jsme řešení vyhovující jakékoliv počáteční hodnotě. ) li//"-*-. t / / 111/SS-- mm liti -~^N\>\\\.\\ lil mm mni - ■ -/// UXJJJJJJA" ' " " -~^NSÍ,\\,\\ --^\\\\\ \ \ \ fiilil 8.124. Vypočtěte y 4*+3y+l Řešení. Obecně platí, že jsme schopni vyřešit každou rovnici typu ax + by + c (8.9) y' = f Ax + By + C D Na obrázku jsou vynesena dvě řešení, která ukazují na nestabi- litu rovnice vůči počátečním podmínkám: Jestliže pro libovolné xq změníme malinké yo z negativní na pozitivní hodnotu, pak se nám dramaticky mění chování výsledného řešení. Navíc si povšimněme konstantního řešení yix) — 0, které odpovídá počáteční podmínce yixo) = 0. Pomocí separací proměnných umíme snadno vyřešit nelineární rovnici z předchozího odstavce, která popisovala logistický model populace. Zkuste si jako cvičení. 490 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Pokud má soustava lineárních rovnic (8.10) ax + by + c = 0, Ax + By + C = 0 práve jedno řešení xo» yo, pak pomocí substitucí u = x—x0,v = y—yo převedeme rovnici (||8.9||) na homogenní rovnici dv _ r I au+bv \ du — J \Au+Bv I ' Pokud soustava (118.1011) nemá řešení, příp. jich má nekonečně mnoho, lze rovnici (||8.9||) převést substitucí z = ax + by na rovnici se separovanými proměnnými (často se v těchto případech již jedná o rovnici se separovanými proměnnými). V tomto příkladu má příslušná soustava rovnic 4x + 3y + 1 = 0, 3x + 2y + 1 = 0 právě jedno řešení x0 = —1, yo = 1. Substitucí u=x + l,v = y — 1 obdržíme homogenní rovnici dv du 4m+3ii kterou řešíme další substitucí z = v/u. Získáváme 4 + 3z z'u + z 3 + 2z dz 2z2 + 6z + 4 du 3 + 2z 2z + 3 . du 2z2 + 6z + 4 dz za předpokladu, že z + 3z + 2 ^ 0. Integrováním přecházíme ke 1. : ln | zz + 3z + 2 | 1 ln | w | + ln | C |, CjÉO, ln | (z2 + 3z + 2) w2 | = ln | C |, C ^ 0, ln | (z2 + 3z + 2) w2 | =lnC2, C ^ 0, (z2 + 3z + 2) «2 = ±C2, C^0. Při přeznačení tak máme (z2 + 3z + 2) u2 = D, D^0 a přechodem k původním proměnným dále v2 v \ -r + 3-+2 )u2 = D, D ^ 0, u1 u ) v2+ 3vu+ 2u2 = D, D^0, (y - l)2 + 3{y - l)(x + 1) + 2(x + l)2 = D, 0. Jednoduchými úpravami vyjádříme obecné řešení jako (x + y) (2x + y + 1) = D, D ^ 0. Vraťme se k podmínce z2 + 3z + 2 ^ 0. Z z2 + 3z + 2 = 0 plyne z = —1 nebo z = —2, tj. u = — u nebo u = — 2u. Pro u = — u je x = w — lay = u+ l = — u + 1, což znamená, že y = —x. Podobně pro v = —2u je y = —2u + 1, a tedy y = —2x — 1. Obě funkce V první kapitole jsme se obzvlášť pečlivě věnovali tzv. lineární1 ., ním diferenčním rovnicím a jejich docela ošklivě vypada-j/íj^ jící obecné řešení jsme spočetli v odstavci l.lOnastraně 15. Přestože tedy bylo předem jasné, že půjde o jednorozměrný 1 afinní prostor vyhovujících posloupností, šlo zdánlivě o velmi nepřehlednou sumu, protože bylo třeba zohlednit všechny měnící se koeficienty. Lze snad tedy odtud čerpat inspiraci k následující konstrukci řešení obecné lineární rovnice prvního řádu (8.8) y = a(t)y + b(t) se spojitými koeficienty a(t) a b(t). Nejprve najděme řešení homogenizované rovnice / (ŕ) = a(t)y(t). To snadno spočteme pomocí separace proměnných a dostáváme y(t) = y0F(t,to), F(r,s) = eJ>*>& . V případě diferenčních rovnic jsme „uhádli" řešení a pak jsme indukcí dokázali, že je správně. Tady to je ještě jednodušší, stačí správné řešení zderivovat a tvrzení bude ověřeno. .__| Řešení lineární rovnice prvního řádu )--- Řešení rovnice (8.8) s počátečními podmínkami y(to) = yo je na intervalech spojitosti koeficientů a(t), b(t) dáno vztahem y(t) = y0F(t, t0) + í F(t, s)b(s) ds, J to kde F(t,s) = eí Ověřte si správnost řešení sami (pozor na derivaci integrálu, kde je t jak v horní mezi, tak jako volný parametr v integrandu). Například tedy nyní umíme přímo řešit rovnici y = 1 - x ■ y a narazíme tentokrát na stabilní chování viditelné na následujícím obrázku. 11... fí/ III////s/ss"^— ilii mi. /--- /^—w s \ \ í U ( III!/'/////sss^--/././/.//././. /./ J. 11/ /./ /./ /. 8.48. Transformace souřadnic. Sledování našich obrázků snad naznačuje, že diferenciální rovnici je možné vnímat jako geometrický objekt (zobrazené „směrové pole *ii==5sSS.-M šipek") a řešení bychom měli umět hledat pomocí vhodně zvolených souřadnic. Vrátíme se k tomuto pohledu později, teď si jen ukážeme tři jednoduché typické triky, jak se jeví z pohledu explicitního zápisu rovnic v souřadnicích. Začněme tzv. homogenními rovnicemi tvaru /-/. 491 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI y = —x, y = —2x — 1 však vyhovují původní diferenciální rovnici a lze je navíc zahrnout do obecného řešení volbou D = 0. Všechna řešení proto známe z implicitního tvaru (x + y) (2x + y + 1) = D, De K. □ 8.125. Stanovte obecné řešení diferenciální rovnice (x2 + y2) dx — 2xy dy = 0. Řešení. Pro y ^ 0 jednoduchými úpravami dostáváme i 2xy i+(í a tak použitím substituce u = y j x přejdeme k rovnici u'x + u = i^2-. Pro u ^ ±1 a D = —l/C máme du dx l + u2 ■ 2u2 2u ■ ln 1 1 — u ^ : ln| jc | + ln I C I, ln. 1 1 1 — u Cx (1 - ln | Cx |, Cx, D x -Dx -. 1 2u dx ■ du = —, x C £ o, C ^0, c ^ o, D 7^0. ■y2, Podmínka w = ±1 odpovídá y = ±x. Zatímco y = 0 řešením není, obě funkce y = x, y = — x řešeními jsou a získáváme je volbou D = 0. Obecné řešení tedy je y2 = x2 + Dx, D e K. □ 8.126. Vyřešte i 2y Řešení. Rovnice v zadání má tvar / = a(x)y + b(x), tj. jedná se o lineární diferenciální rovnici, která je nehomogenní (funkce b není identicky nulová). Obecné řešení takové rovnice lze získat metodou integračního faktoru (kdy nehomogenní rovnici vynásobíme výrazem e- f a(x) dx -j neb0 metodou separace proměnných (kdy integrační konstantu získanou při řešení přidružené homogenní rovnice považujeme za funkci v proměnné x). Obě tyto metody si objasníme na uvedeném příkladu. Jestliže uvážíme transformaci z = j za předpokladu í ^ 0, pak s využitím pravidla pro derivování složené funkce dostáváme = jM-y) = 7(/(0-z), což je rovnice se separovanými proměnnými. Druhým příkladem budou rovnice tzv. Bernoulliho typu, které jsou tvaru y = f(t)y + g(t)ý, kde r e I, r ^ 0, 1. Volba transformace z = y1_r vede na rovnici z' = (l-r)y-r(/(ř)y + g«/) = (l-r)/(ŕ)z + (l-r)g(ŕ), což je lineární rovnice, kterou už také umíme integrovat. Nakonec se podívejme na mimořádně významnou nelineární rovnici tzv Riccatiho typu. Jde o rozšíření Bernoulliho rovnice s n — 2 o absolutní člen y =f(t)y + g{t)y2+h{i). Tuto rovnici umíme také převést na lineární rovnici za předpokladu, že umíme uhodnout jedno partikulární řešení x(t). Pak totiž můžeme použít transformaci 1 y - x Pověřte se samostatně, že tato transformace vede na rovnici z' = -(f(t)+2xg(t))z-g(t). Stejně jako jsme viděli u integrace funkcí (což je vlastně nej-jednodušší typ rovnic se separovanými proměnnými), zpravidla pro rovnice neexistuje řešení vyjádřitelné explicitně pomocí elementárních funkcí. Podobně jako u klasických inženýrských tabulek hodnot speciálních funkcí byly také sestaveny knihy přehledů řešených základních rovnic. Dnes je v podstatě všechna v nich ukrytá moudrost převedena do softwarových systémů jako Maple či Mathe-matica. Tam tedy sice můžeme zadat jakoukoliv úlohu na řešení obyčejných diferenciálních rovnic, v překvapivě velkém množství případů dostaneme výsledky, pro většinu zadání to ale nakonec nebude možné. Východiskem jsou numerické metody hledající řešení pouze přibližně. Zejména pro ně potřebujeme ale dobrá teoretická východiska ohledně existence, jednoznačnosti a stability řešení. Začneme tzv. Picardovou-Lindelôfovou větou: Existence a jednoznačnost řešení ODR j_, 8.49. Věta. Nechť má funkce f(t,ý) : R2 —> R spojité parciální derivace na nějaké otevřené množině U. Pak pro každý bod (to, yo) e U D R2 existuje maximální interval I — [to — a, to + b~\ s kladnými a, b e M., a právě jedna funkce y (t) intervalu I vyhovuje rovnici y =/(»,y). , která na 492 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI V rámci metody integračního faktoru násobíme původní rovnici výrazem J: x-1 x+ľ kde příslušným integrálem rozumíme libovolně zvolenou primitivní funkci a kde lze uvažovat libovolný nenulový násobek získané funkce (a proto jsme také mohli odstranit absolutní hodnotu). Uvažujeme tedy 1y x(x-l) x+1 ■ y x+i ^ (i+i)2 Podstatou metody integračního faktoru je, že na levé straně je derivace výrazu y^4. Integrováním snadno obdržíme y^i = fz-^dx = ^-2x + 2ln\x + l\ + C, Cel. Řešeními jsou tak funkce y = j^(j--2x+ 2ln\x+ 1\ + CJ , Cel. Při metodě variace konstant nejprve vyřešíme přidruženou homogenní rovnici y což je rovnice se separovanými proměnnými. Platí 2y 1y ~ x2-V dy dx dy y i ľ - dx, ln|y| ■ln|x-l| + ln|x + l|+ln|C|, C ^ 0, x + 1 ln | y | = ln C y = C x - 1 x + 1 1 C ŕ 0, C ŕ 0, kde jsme museli vyloučit případ y = 0. Funkce y = 0 je však rešením homogenní lineární diferenciální rovnici vždy a můžeme ji zahrnout do obecného řešení. Obecným řešením přidružené homogenní rovnice tudíž je Cel. y C (x+1) x-1 ' Na konstantu C nahlížejme dále jako na funkci C(x). Derivujme y I _ C (x) (x+l)(x-l)+C(x) (i-l)-C(i) (x + 1) (x-D2 a následně dosadme do původní rovnice C'(x) (x+l)(x-l)+C(x) (x-l)-C(x) (x + 1) (x-1)2 2 C(x) (x + 1) (x-l)(x2-l)- Po úpravě dostáváme C(x) = Důkaz. Všimněme si, že jestliže je funkce y(t) řešením naší rovnice splňující počáteční podmínku y(to) = to, pak také splňuje rovnost y(t) = yo + / y'(s)ds = yo+ f(s, y(s)) ds. J to J to Pravá strana tohoto výrazu je ovšem, až na konstantu, integrální operátor £(y)« = yo+ í f(s,y(s))ds. J to Při řešení naší diferenciální rovnice prvního řádu tedy vlastně hledáme pevný bod pro tento operátor L, tj. chceme najít funkci y = y(t) s L(y) = y. Naopak, jestliže je riemannovsky integrovatelná funkce y (i) pevným bodem operátoru L(y), pak z věty o primitivní funkci okamžitě vidíme, že skutečně y(ř) vyhovuje zadané diferenciální rovnici, včetně počátečních podmínek. Pro operátor L můžeme docela lehce odhadnout, jak se liší ., jeho hodnoty L(y) a L (z) pro různé argumenty y(ř) a §z(i). Skutečně, díky spojitosti parciálních derivací funkce / víme, že je / lokálně lipschitzovská. To znamená, že i máme k dispozici odhad |/(ř,y)-/(ř, z)\ 0 a omezíme se na t v nějakém intervalu / = [řo — ao, to + bo] tak, aby J x [yo — £■ yo + £] C U, a omezíme se na funkce y(ř) a z (ŕ), které budou pro t e J splňovat max |y(ř) - y0| < £, max\z(t) - y0\ < e. teJ teJ Nyní dostáváme odhad \(L(y) - L(z))(t)\ < J to f J to f(S,y(S))- f(S,z(s))dS \f(S,y(S))- f(S,z(s))\dS 0 dostatečně malé proto bude platit max \L(y)(t) - L(z)(t)\ < max c\y(ť)-z(t)\ |í-í0|<á |(- s v jejich definičním oboru: |L(y)(ř) - L(y)(S)\ < / |/(r, y(r)\dr x j / . — f a(s) ds , \ y = ej*0 w lyQ +j^b(t)e. Jx<> K> dt) . Ještě dodejme, že lineární rovnice nemá žádná singulární řešení a v obecném řešení vystupuje C e K. □ 8.127. Vypočtěte lineární rovnici (/ + 2xy) eŕ = cos x. Řešení. Kdybychom postupovali podle metody integračního faktoru, pouze bychom triviálně přepisovali zadání. Uvedený tvar diferenciální rovnice má totiž požadovanou vlastnost - na levé straně je derivace 2 výrazu y e1 . Můžeme proto ihned spočítat ^y e* ^ = cos x, yex=j cos x dx, ye*2 = smx + C, CeR, y = eTx2 (smx + C) , Cel. □ 8.128. Stanovte všechna nenulová řešení Bernoulliho rovnice y-i = 3xf. Řešení. Bernoulliho rovnice y = a(x)y + b(x)y, r^O, r^l,rel se řeší po vydělení členem yr substitucí u = yx~T, která vede na lineární diferenciální rovnici «' = (1 — r) [a(x)u + b(x)] . s univerzální konstantou D > 0. Můžeme se tedy kromě výše uvedených podmínek ještě omezit na podmnožinu všech stejnoměrně spojitých funkcí. Taje ale již kompaktní a tedy úplnou množinou spojitých funkcí na našem intervalu, viz Arzelova-Ascoliho věta 7.23, a proto existuje jednoznačně daný pevný bod y (i) této kontrakce L, který je řešením naší rovnice. Zbývá ukázat existenci maximálního intervalu I — [íq — a,to + b]. Předpokládejme, že máme nalezeno řešení y(t) na intervalu (řo, ři) a zároveň existuje konečná limita yi = lim y(t). Pak ale podle výše dokázaného musí existovat řešení s počáteční podmínkou (ři, y\), na nějakém okolí bodu t\ a přitom nalevo od něj musí splývat s řešením y(t). Jistě tedy jde řešení y (i) prodloužit napravo od t\. Existují tedy pouze dvě možnosti, kdy řešení napravo od t\ neexistuje: buďneexistuje konečná limita y(t) v bodě t\ zleva nebo sice limita y\ existuje, ale bod (*i, yi) je na hranici definičního oboru U funkce /. V obou případech jde skutečně o maximální prodloužení řešení napravo od řo. Obdobně argumentujeme pro maximální řešení nalevo od to. □ 8.50. Iterativní aproximace řešení. Postup v důkazu předchozí věty lze přeformulovat do iterativní procedury, která poskytuje přibližná řešení pomocí postupné integrace. Pomocí konkrétního odhadu pro konstantu c z důkazu můžeme dostat i přímé odhady chyb. Zkuste si sami promyslet jako cvičení (viz postup v důkazu Banachovy věty o pevném bodu v odstavci 7.19). Lze pak i vcelku snadno přímo ukázat, že jde o stejnoměrně konvergentní posloupnost spojitých funkcí a tedy bude i limitou spojitá funkce (aniž bychom se dovolávali na složité věty ze sedmé kapitoly). | PlCARDOVY APROXIMACE |_, Jednoznačné řešení rovnice / = /(»,y), jejíž pravá strana / má spojité parciální derivace, můžeme na dostatečně malém intervalu vyjádřit jako limitu postupných iterací začínajících konstantní funkcí (tzv. Picardova aproximace): yo(t) = yo, yn+i(t) = L(y„), nel. Jde o stejnoměrně konvergující posloupnost spojitých funkcí se spojitou limitou y(t). Všimněme si, že jsme ve skutečnosti potřebovali jen lipschi-tzovskost parciálních derivací funkce /, věta tedy platí i s tímto slabším předpokladem. Ukážeme v dalším odstavci, že pouhá spojitost funkce / již zajišťuje existenci řešení také, na jednoznačnost však nestačí. 8.51. Nejednoznačnost řešení. Začněme úplně jednoduchým příkladem. Uvažme rovnici y = Vlyl- Snadno lze najít řešení pomocí separace proměnných y(i)=l-(t + C)2, pro kladná y, s libovolnou konstantou C a t +C > 0. Pro počáteční hodnoty (řo, yo) s yo 7^ 0 jde přitom o zadání vyhovující předchozí 494 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI V tomto konkrétním příkladu substituce u = y = l/y dává u' + a- = -3x. x Stejně jako v minulém příkladu počítáme u =e-inl*l [/-3xeln 111 ŕfa] , kde ln | x | jsme obdrželi jako (libovolně zvolenou) primitivní funkci k l/x. Dále je 1 j -3x eln 1 x j —3x|x dx | dx Absolutní hodnotu lze nahradit za znaménko, které lze vytknout a pokrátit, tj. stačí uvažovat u = i [/ -3x2 dx] = i [-x3 + C] , C e K. Návratem k původní proměnné dostaneme y = í = -^, Cel. Úpravami vyloučený případ y = 0 je singulárním řešením (což samozřejmě platí pro každou Bernoulliho rovnici s kladným r). □ 8.129. Záměnou proměnných řešte rovnici y dx — (x + y2 sin y) dy = 0. Řešení. Je-li proměnná x ve vyjádření diferenciální rovnice prvního řádu pouze v první mocnině a y se vyskytuje v argumentu elementárních funkcí, je možné aplikovat tzv. metodu záměny proměnných, kdy hledáme řešení jako funkci x nezávislé proměnné y. Nejprve rozřešíme diferenciální rovnici vzhledem k derivaci, tj. vyjádříme i = —r—• ^ x-\-vA sin v Tato rovnice není žádného z předchozích typů, a proto využijeme úpravy dy dx x + y2 sin y' , -i y \ x dx dy \x + y2 sin y) y 1 + y sin y, x = — x + y sin y. y Tím jsme přešli k lineární diferenciální rovnici. Snadno pak dopočítáme její obecné řešení x = —y cos y + Cy, Cel. □ větě, a proto bude lokálně existovat řešení právě jedno. Zjevně musí být řešení stále neklesající, proto pro záporné hodnoty yo dostaneme stejné řešení, jen s opačným znaménkem a t + C < 0. Pro počáteční podmínku (to, yo) = (to, O) ovšem máme kromě na sebe navazující řešení nalevo a napravo od to, které jsme už našli, ještě identicky nulové řešení y(f) — 0. Můžeme tedy tyto dvě větve nalevo a napravo navazovat libovolně, viz obrázek. Nicméně existenci nějakého řešení garantuje následující věta, které se říkává Peanova věta o existenci řešení: Věta. Uvažme funkci f : R2 -» R spojitou na nějaké otevřené množině U. Pak pro každý bod (to, yo) 6 U C R2 existuje spojité řešení rovnice y = f d, y) lokálně na nějakém okolí bodu to. Důkaz. Důkaz uvedeme jen stručně a necháváme na čtenáři doplnění řady detailů. Místo Picardových aproximací budeme postupovat zdánlivě zcela naivně. Budeme konstruovat řešení napravo od počátečního bodu to. Zvolíme si za tím účelem malý krok h > 0 a označíme si body kh, 1,2, t k — to - V počátečním bodě (řo, yo) máme definovánu hodnotu derivace f (to, yo) příslušné křivky řešení (t, y(f)), můžeme tedy přibližně nahradit parametrizovanou přímkou s touže derivací: /» O) = yo + f(to,yo)(t-to) a označíme si y\ — y^ (t\). Induktivně takto sestrojíme funkce a body yw O) = yk + f(xk, yk)(t - tk), yk+i = yw (tk+1). Nyní si definujeme y h (t) pomocí slepení jednotlivých lineárních částí, tj. y h (i) — (t) pro všechna t e [kh, (k + ľ) h]. To je evidentně spojitá funkce, které říkáme Eulerova aproximace řešení. Nyní zbývá již , jen" dokázat, že existuje limita funkcí yh pro \ \ h j doučí k nule a že j e řešením. K tomu je třeba si povšimnout (jak jsme již učinili v důkazu věty o jednoznačnosti a existenci W řešení), že díky stejnoměrné spojitosti f(t, y) na okolí U, na kterém hledáme řešení, máme k dispozici pro každé předem zvolené £ > 0 takové 8, že \f(t,y)-f(s,z)\ <£, kdykoliv bude | (t — s, y — z) | < S. Zejména tedy budou všechny naše funkce yh v množině stejnoměrně spojitých funkcí na našem dotčeném intervalu. Proto podle Arzelovy-Ascoliho věty (viz odstavec 7.23 na straně 419) bude existovat posloupnost hodnot h„ —> 0 taková, že příslušná posloupnost funkcí yi,„ bude stejnoměrně konvergovat ke spojité funkci y. Pišme dále jednodušeji y„(t) = yi,„ (i) —> y(i). Pro každou ze spojitých funkcí y h ovšem máme jen konečně mnoho bodů v intervalu [řo,ř], kde není diferencovatelná a 495 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Další příklady na diferenciálních rovnic 1. řádu najdete na straně můžeme tedy psát 513. L. Slovní úlohy vedoucí na diferenciální rovnice 8.130. Rychlost, kterou se rozpadá daný izotop daného prvku, je přímo úměrná množství daného izotopu. Poločas rozpadu izotopu Plutonia, 239Pu, je 24 100 let. Za jak dlouho ubude setina z nukleární pumy, jejíž aktivní složkou je zmiňovaný izotop? Řešení. Označíme-li množství Plutonia jako m, tak pro rychlost rozkladu můžeme napsat diferenciální rovnici dm -= —k ■ m, dt kde k je nějaká neznámá konstanta. Řešením je tedy funkce m(t) = m0e kt. Dosazením do rovnice pro poločas rozpadu (e b zís- káme konstantu k = —2, 88 • 105. Hledaný čas je přibližně 349 let. □ 8.131. Čistička vody o objemu 2000 m3 byla znečištěna olovem, které se nachází ve vodě v ní v množství 10 g/m3. Do čističky přitéká čistá voda rychlostí 2 m3/s a stejnou rychlostí i vytéká. Za jak dlouho poklesne obsah olova ve vodě v čističce pod 10 Mg/m3 (což je hygienická norma pro obsah olova v pitné vodě podle směrnice Evropského společenství), předpokládáme-li, že voda je neustále rovnoměrně promíchávána? Řešení. Označme objem vody v nádrži jako V (m3), rychlost vytékání vody jako v (m3/s), konečně nechť m je hmotnost vody v nádrži v gramech. Za infinitesimální (nekonečně malou) časovou jednotku dt vyteče z nádrže ^ • v dt gramů olova, pro změnu hmotnosti množství olova v čističce tedy můžeme sestavit diferenciální rovnici dm V vdt. Separací proměnných dostáváme rovnici dm v m V integrací obou stran rovnice a odlogaritmováním dostaneme řešení ve tvaru m(t) = moe~v', kde mo je množství olova v nádrži v čase / = 0. Po dosazení číselných hodnot zjistíme, že / = 6 h 35 min. □ 8.132. Rychlost šíření zprávy v populaci o P lidech je přímo úměrná počtu lidí, kteří zprávu ještě neslyšeli. Určete funkci / popisující počet lidí v čase, kteří již zprávu slyšeli. Je vhodné tento model šíření zprávy používat pro malá nebo velká Pí yn(t) = yo + Jtn (s) ds. Ale derivace na jednotlivých intervalech jsou konstantní takže můžeme psát (zde k je největší splňující to + kh„ < t, zatímco y'j a tj jsou body z definice funkce yi,„) yn(t) = yo + ■Ef j=0 J'i f(tj,yj)ds f J tí f(tk,yú- Rádi bychom místo toho viděli yn (t) = yo+ f(s, yn (*)) ds, J to ale rozdíl tohoto integrálu a posledních dvou členů v předchozím výrazu je odhadnut možnými rozdíly hodnot funkce f(t, y) a délkami intervalů. Díky našemu univerzálnímu odhadu pro f(t, y) výše můžeme tedy v lirmtním procesu lim^co y„(f) místo skutečných hodnot použít právě poslední integrál a dostáváme y(t) = lim(yo+ f f (s, yn(s)) ds) J to = yo + / (lim f(s,y„(j))) ds J to = yo+ y(s))ds, Jto kde jsme pro limitní přechod u integrace využili stejnoměrné konvergence yn (í) -> y(í). Tím j e věta dokázána. □ 8.52. Systémy rovnic prvního řádu. Na řešení rovnice ý = f (x, y) lze také pohlížet jako na hledání (parametrizované) křivky (x(t), y(t)) v rovině, kde jsme . již předem pevně zvolili parametrizaci proměnné x(t) = t. Pokud ale akceptujeme tento pohled, pak můžeme jednak zapomenout na tuto pevnou volbu pro jednu proměnnou a hlavně přibrat libovolný počet proměnných. Například v rovině můžeme psát takový systém ve tvaru x = f(t,x,y), y se dvěma funkcemi f, g : R3 : 8 (t, x, y) * R. Obdobně pro více proměnných. Jednoduchým příkladem v rovině může sloužit systém rovnic x = —y, y = x. Snadno lze uhádnout (nebo aspoň ověřit), že řešením takového systému je např. x(t) = R cos t, y(t) = R sin t s libovolnou nezápornou konstantou R a křivky řešení budou právě parametrizované kružnice o poloměru R. V obecném případě budeme pracovat s vektorovým zápisem systému ve tvaru x =f(f,x) pro vektorovou funkci x : R -> R™ a zobrazení / : R™+1 -> R™. Na takové systémy umíme přímo rozšířit platnost věty o jednoznačnosti a řešení: 496 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Řešení. Sestavíme diferenciální rovnici pro /. Rychlost šíření zprávy __J Existence a jednoznačnost pro systémy ODR = /'(/) má být přímo úměrná počtu lidí, kteří o ní ještě neslyšeli, k{P - /(/)). tedy hodnotě P - f {t). Celkem d£ dt Separací proměnných a zavedením konstanty K (počet lidí, kteří znají zprávu v čase / = 0 musí být P — K) dostáváme řešení „-kt fit) Ke~ kde k je kladná reálná konstanta. Tento model má zřejmě smysl jen pro velká P. □ 8.133. Rychlost, kterou se šíří epidemie v dané uzavřené populaci o P lidech, je přímo úměrná součinu počtu lidí, kteří jsou nakaženi, a počtu lidí, kteří jsou ještě nenakaženi. Určete funkci /(/) popisující počet nakažených v čase. Řešení. Jako v předchozím příkladě sestavíme diferenciální rovnici ^f=k- fit) (P - fit)) . dt Separací proměnných dostáváme fit) K 1 + Le~Kkt ' kde K a L jsou integrační konstanty. □ 8.134. Změna rychlosti předmětu padajícího v konstantním gravitačním poli v prostředí s jistým odporem je dána vztahem: dv ď = 8-kV' kde k je konstanta udávající odpor prostředí. Byl vypuštěn předmět pohybující se počáteční rychlostí 5ms_1 v gravitačním poli g = 10ms~2, konstanta odporu prostředí je k = 0.5 s_1. Jaká bude rychlost předmětu za 3 vteřiny? Řešení. •'=§-(!-»)-"• po dosazení v{3) = 20 — 15e~? ms_1. □ 8.135. Rychlost nárůstu populace odmocninového brouka je nepřímo úměrná její velikosti. V čase / = 0 čítala populace 100 brouků. Za měsíc se populace zdvojnásobila. Jak bude populace velká za dva měsíce? Řešení. Uvažujme spojitou aproximaci počtu brouků a označme jejich počet P. Pak můžeme sestavit následující rovnici: dP _ k ~ď7 ~~P' 1, , n, se spoji- A) e Věta. Uvažme funkce /; tými parciálními derivacemi. Pak pro každý bod (řo, , R™+1 existuje maximální interval [řo — a, řo + b], s a, b e R kladnými, a právě jedna funkce x(ť) = (x\(ť), ..., xn{t)) : R -» R™, která je řešením systému rovnic x\ = f\it,x\, ...,x„) ■ f„(t,x\, ...,x„) s počáteční podmínkou xi(to) ■- ,x„{t0) ■ Důkaz. Důkaz je skoro identický s důkazem existence a jed-^ ., noznačnosti pro jednu rovnici s jednou neznámou funkcí, prj^) jak jsme ukázali ve větě 8.49. Neznámá funkce x(ť) = C^i i1)' ■ ■ ■' xn (*)) je křivkou v R™ vyhovující zadané rov-'íť ! nici, a proto jsou její komponenty x,(ř) opět vyjádřitelné pomocí integrálů Xiit) =Xi(t0) + / x'iis)ds = Xi+ I f i J to 'to (ř, x(s)) ds. Opět tedy pracujeme s integrálním operátorem y i-> L{y), tentokrát zobrazujícím křivky v R™ na křivky R™ a hledáme jeho pevný bod. Protože je euklidovská vzdálenost dvou bodů v R™ vždy shora odhadnuta součtem velikostí rozdílů jednotlivých komponent, postupuje se zcela stejně jako v případě 8.49. Je pouze zapotřebí si povšimnout, že velikost vektoru ||/(ř,zu ...,zn) - fit,yu-..,yn)\\ je odhadnuta shora součtem ||/(ř,Zl, . . . , Zn) - fit, yi, Z2 ■ ■ ■ , Zn)\\ +■■■ + Wfiuyi,-..,yn-uzn) - fit,yi, , yn)\\- Doporučujeme podrobně projít a promyslet důkaz Věty 8.49 z tohoto pohledu samostatně. □ Při zavádění a studiu modelů nějakého reálného systému je podstatné tzv. kvalitativní chování řešení v závislosti na počátečních podmínkách a na volných parametrech systému (tj. ať už konstant nebo funkcí). Jako takový docela jednoduchý příklad systému rovnic prvního řádu zrniňme klasický populační model „dravec - kořist", který zavedli ve dvacátých létech minulého století Lotka a Volterra. Označme x(ť) vývoj počtu jedinců v populaci kořisti a y{i) totéž pro dravce. Předpokládáme, že přírůstek kořisti by se řídil Mal-thusiánským modelem (tj. exponenciální růst s koeficientem a), kdyby nebyli loveni. U dravce naopak očekáváme, že by bez kořisti pouze přirozeně vymíral (tj. exponenciální pokles stavů s koeficientem y). Přitom dále uvazujeme interakci dravce s kořistí, kterou očekáváme přímo úměrnou počtu obou s jistým koeficientem jS, u dravce navíc ještě opatřený multiplikativním koeficientem vyjadřujícím jeho efektivitu při lovu kořisti. Dostáváme systém dvou 497 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI P = s/Kt + c. Dopočtením ze zadaných hodnot P(2) = *Jl ■ 100, což je odhad skutečného množství brouků. □ 8.136. Najděte rovnici křivky ležící v 1. kvadrantu a procházející bodem [l, 3/4], jejíž tečna v libovolném bodě vytíná na kladné poloose y úsek velikostí odpovídající průvodiči bodu dotyku (tj. vzdálenosti bodu dotyku od počátku). O 8.137. Zkoumejte množství chemické sloučeniny S (izolované od okolí) v kontejneru, která je nestálá a postupem času se rozpadá, přičemž střední doba života jedné její molekuly je q (jednotek času). Pokud bylo na počátku (tj. v čase / = 0) v kontejneru M molů sloučeniny S, kolik molů této sloučeniny by mělo být v kontejneru v čase / > 0? O 8.138. Těleso o hmotnosti 100 g při zavěšení protáhne pružinu o 5 cm. Má-li toto těleso při průchodu rovnovážným bodem rychlost 10 cm/s, vyjádřete jeho polohu v závislosti na čase /. O Další slovní úlohy vedoucí na diferenciální rovnice naleznete na straně 513. M. Diferenciální rovnice vyšších řádů 8.139. Tlumený oscilátor. Zkusme si popsat jednoduchý model pro pohyb nějakého tělesa upnutého k jednomu bodu silnou pružinou. Je-li y(t) výchylka našeho tělesa od bodu yo = y(0) = 0, pak lze uvažovat, že zrychlení y" (t) v čase / bude úměrné velikosti výchylky, avšak s opačným znaménkem. Konstanta úměrnosti k je nazývána pružinovou konstantou. Uvažujeme-li k = 1, dostáváme tedy tzv. rovnici oscilátoru y"(t) = -y(t). Tato rovnice odpovídá systému rovnic x'(t) = -y(t), y'(t) = x(t) z 8.7. Řešením takového systému je x(t) = R cosO* - t), y(t) = R sinO* - t) s libovolnou nezápornou konstantou R, která určuje maximální amplitudu, a konstantou t, která určuje fázový posun. Pro určení jednoznačného řešení potřebujeme proto znát nejen počáteční polohu yo, nýbrž také rychlost pohybu v tomto okamžiku. Těmito dvěma údaji bude určena jak amplituda tak fázový posun jednoznačně. Představme si navíc, že vlivem vlastností materiálu pružiny bude ještě dodatečně působit síla, která bude úměrná okamžité rychlosti pohybu našeho objektu, opět se znaménkem opačným než je amplituda. To vyjádříme dodatečným členem s první derivací a naše rovnice je Model Lotky a Volterry x = ax — fiyx y — —yy + Sfixy. Zajímavé je, že stejný model docela dobře vystihuje i vývoj nezaměstnanosti v systému omezeném na zaměstnavatele a jejich zaměstnance a to tak, že zaměstnanci hrají roli dravců, zatímco zaměstnavatelé jsou lovenou kořistí. O tomto a podobných modelech lze nalézt nepřeberné množství literatury. 8.53. Stabilita systémů rovnic. My se nyní omezíme jen na jednu základní větu o stabilitě systémů. Všimněme si, že nám za předpokladu spojitosti parciálních deri-vací funkcí zadávajících systémy (ve skutečnosti jejich ríí lipschitzovskosti) zajišťuje spojitost chování řešení a to jak v závislosti na počátečních podmínkách tak na samotných rovnicích. S rostoucí vzdáleností t od počáteční hodnoty řo ovšem odhady rostou exponenciálně! Tento výsledek tedy má pouze lokální charakter a není v rozporu s příkladem nestabilně se chovající rovnice y — ty ilustrované v odstavci 8.47. Uvažujme dva systémy rovnic zapsané ve vektorovém tvaru x = f(t,x), y = g(t,y), a předpokládejme, že zobrazení /, g : U C R™+1 -» R™ mají spojité parciální derivace na otevřené množině U s kompaktním uzávěrem. Takové funkce budou jistě stejnoměrné spojité a stejnoměrně lipschitzovské na U, můžeme si tedy označit konečné hodnoty \f(t,x)-f(t,y)\ C ■- B ■- ■ sup x=ty; (t,x), (t,y)eU ■- sup |/(r,*)- (í,l)€í/ \x-y\ g(t,x)\ S tímto značením nyní můžeme zformulovat naši základní větu: Věta. Nechť x(t) a y(i) jsou dvě pevně zvolená řešení systémů x = f(t,x), y = g(t,y), zadaná počátečními podmínkami x(to) = xq a y(řo) = yo- Potom \x(t) - y(t)\ < |*o - yol eC"-ío1 +§(ec"-'<>' -l). Důkaz. Bez újmy na obecnosti můžeme předpokládat to = 0. Z vyjádření řešení x(t) a y(t) jako pevných bodů JSfo příslušných integrálních operátorů okamžitě vyplývá odhad Hi) - y(t)\ < l*o - yol + í I/O *0)) - g(s, y(s))\ds. Jo Integrand přitom můžeme dále odhadnout \f(S,x(S))-g(S,y(S))\ < |/(í, *0) - /O, yO)| + I/O yO) - gO yOOl | + B. 498 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI y"(t) = -y(t)-ay'(t), kde a je konstanta, která vyjadřuje velikost tlumení. Na následujícím obrázku jsou vyneseny tzv. fázové diagramy pro řešení s dvěma různými počátečními podmínkami a to nalevo při nulovém tlumení, zatímco napravo je použit koeficient a = 0.3 Tlumené oscilace Tlumené oscilace Jestliže si označíme F (ŕ) — \x(t) — y(t)\, a — \xo — yo\, přepíšeme náš odhad jako (8.9) F(i) < a + f (C F (s) + B)ds. Jo f (t) Samotné oscilace jsou vyjádřeny hodnotami na ose y, hodnoty x zobrazují rychlost pohybu. 8.140. Netlumené kmitaní. Nalezněte funkci y(t) vyhovující diferenciální rovnici a počátečním podmínkám: y" (t) +4y(t) = f (t), y(0) = 0, /(O) = -1, kde funkce /(/) je po částech spojitá: cos(2r) pro 0 < t < jí, 0 pro t > jí. Řešení. Úloha je modelem netlumeného kmitání pružiny (bez zahrnutí tření a jiných vlivů, například nelinearit v tuhosti pružiny apod.), které je buzené vnější silou jen během počáteční doby a poté ustane. Funkci /(/) lze zapsat jako lineární kombinaci Heavisideovy funkce u(t) a jejího posunutí, tj. /(/) = cos(2r)(w(r) - Un(ij) Protože Ciy")is) = ČC(y) - sy(0) - /(O) = s1 £{y) + 1, dostáváme s využitím předchozích příkladů 7. a 8. k výpočtu Lapla-ceovy transformace pravé strany s2 C(y) + 1 + 4C(y) = £(cos(2r)(«(0 - M0)) = = £(cos(2r) • w(0) - £(cos(2r) • u„(t)) = = £(cos(2r)) - e-™£(cos(2(t + jí)) = s Takový odhad můžeme docela snadno využít díky následujícímu obecnému výsledku, kterému se říkává Gronwallova nerovnost. Všimněte si podobnosti s obecným řešením lineárních rovnic. Lemma. Nechť reálná funkce F (i) splňuje na intervalu t e [0, tmax\ nerovnost ■a(t)+ f fi(s)F(s)ds Jo F (i) < pro nějaké reálné funkce a (i), fi(i), kde fi(i) > 0. Potom také F it) (™-Í' = f}(ť)G(ť)\F(ť) - I f}(s)F(s)ds\ < ct(t)P(í)G(t) Nyní integrací podle t a vydělením nenulovou funkcí G (i) f Jo ľ G (s) P(s)F(s)ds < / a(s)P(s) —- ds, Jo ^ JO G(i) což po přičtení a (i) k oběma stranám již dává první tvrzení lemmatu. Za dodatečného předpokladu neklesající a(i) můžeme pokračovat F(ř) < a(t)(l + f /3(s)e£ Är)* ds). Jo Nyní si stačí povšimnout, že integrand je vlastně derivací a proto konečně dostáváme F(t) dr ds) = a(ŕ)(l+e-/ľ«r)* -1) a druhé tvrzení lemmatu je dokázáno také. □ A teď už můžeme důkaz věty o spojité závislosti na parametrech rychle dokončit. Již jsme získali odhad (8.9) a použitím trochu modifikované funkce F (ŕ) — F (t) + ^ z něj dostaneme s2 +4 Fit) < £ + a + j CFis)ds. 499 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Odtud 1 s s2 + 4 v (s2 + A)2' Inverzní transformací dostávávme řešení ve tvaru y(t) = _ i Sin(2r) + \t sin(2í) + £^ {e~m ^ j4)2). Podle vztahu (||7.35||), ale s L-l[e 1 I „ — tcs í2 , .,2 , =\£-1(e-™£(tsm(2t))) (s1 +4) / = (/ - ji) sin(2(r - jt)) • H„(t). Protože je Heavisideova funkce pro t < ji nulová a pro / > ji rovna 1, dostáváme řešení ve tvaru -| sin (2/) + \t sin (2/) pro 0 £ / < ji ^ sin(2r) pro t > jt □ 8.141. Určete obecné řešení rovnice f - 5y" - 8/ + 48y = 0. Řešení. Jde o lineární diferenciální rovnici (3. řádu) s konstantními koeficienty, neboť má tvar yin) + aiýn-l) + + . . . + + ^ = f {x) pro jisté konstanty a i,an e K. Navíc je f (x) = 0, tj. rovnice je homogenní. Nejprve nalezneme kořeny tzv. charakteristického polynomu X" + aiX"-1 + a2X"-2 H-----h a„^X + a„. Každému fe-násobnému reálnému kořenu X totiž odpovídá k řešení a každé -násobné dvojici komplexních kořenů X = a ± i/S odpovídá k dvojic řešení eax cos (fix) , x ďx cos (fix) , ..., Z"1 eM cos (fix) , eM sin (fix) , x eM sin (fix) ,..., x*'1 eM sin (/Sx) . Obecné řešení potom odpovídá všem lineárním kombinacím výše uvedených řešení. Uvažujme proto polynom X3 - 5X2 - 8A. + 48 s kořeny = X2 = 4, A3 = — 3. Znalost kořenů však znamená, že známe také obecné řešení y = Ci e4* + C2x éx + C3e-3*, CUC2,C3€R. □ To už je předpoklad Gronwallovy nerovnosti s dokonce konstantními parametry, dostáváme tedy podle druhého tvrzení lemmatu F(í) + § < (a + f)eJo'cd\ neboli právě námi dokazované tvrzení F (i) (0, x) = E, kde F(t,x) — D1 f(y(t, x)) a počáteční podmínka vychází z identity y(0, x) — x. Jednoznačnou existenci řešení tohoto (maticového) systému a jeho spojitou závislost na parametrech jsme již dokázali. Následující věta říká, že ve skutečnosti pro systémy se spojitě diferencovatelnými pravými stranami / skutečně takto derivace podle parametrů vždy dostaneme. ___I DlFERENCOVATELNOST ŘEŠENÍ J_--- Věta. Uvažme otevřenou podmnožinu U C W+k a zobrazení f : U —> R™ se spojitými prvními derivacemi. Pak systém diferenciálních rovnic závislý na parametru A 6 l's počáteční podmínkou v bodě x e U y'(t) = f(y(t),X), y(Q)=x má jednoznačně určené řešení y(t, x, A.), které je zobrazením se spojitými prvními parciálními derivacemi ve všech proměnných. Důkaz. Nejprve si všimněme, že můžeme uvažovat systém závisející na parametrech jako obyčejný autonomní systém bez parametrů, když i parametry považujeme za prostorové proměnné a dodáme (vektorové) podmínky X'(f) — 0 a A.(0) = A.. Bez újmy na obecnosti proto stačí dokazovat větu pro autonomní systémy bez dodatečných parametrů a soustředit se na závislost na počátečních podmínkách. Stejně jako v základní větě o existenci vyjdeme z Picardových aproximací řešení pomocí integrálního operátoru yo(t, x) = x, yk+\(t, x)=x + / f(yt(s, x)) ds. Jo Drobným upřesněním důkazu této věty 8.49 ověříme stejnoměrnou konvergenci aproximací yi(t, x) k řešení y(t, x) a to včetně proměnné x. Zvolme si nyní pro počáteční podmínku pevně bod xo, zvolme jeho malé okolí V, které budeme případně zmenšovat během následujících odhadů, a pišme C pro konstantu, která díky Lipschitzov-skosti funkce / dává na tomto okolí odhad \f(y)-f(z)\ (t,x) = Dly(t,x) 501 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Připomeňme, že číslo X = 3i jsme obdrželi jako kořen charakteristického polynomu. Snadno spočítáme derivace ýp2(x) = [B cos (3x) + C sin (3x)] +x[-3Bsin(3x) + 3C cos (3x) ], y'n(x) = 2 [-3B sin (3x) + 3C cos (3x)] +x[-9B cos (3x) - 9C sin (3x) ], y"n(x) = 3 [-9B cos (3x) - 9C sin (3x)] +x [27 B sin (3x) - 27C cos (3x) ], jejichž dosazením do rovnice s pravou stranou tvořenou funkcí y = 10cos(3x) po úpravě dostaneme -18B cos (3x) - 18C sin (3x) - 6B sin (3x) + 6C cos (3x) = 10 cos (3x) . Porovnání koeficientů vede na systém lineárních rovnic -18S + 6C=10, -18C-6S = 0 s jediným řešením B = —1/2 a C = 1/6, tj. yP2(x) = x [— i cos (3x) + i sin (3x)]. Celkem je tudíž obecným řešením y = Cie~* + C2 cos (3x) + C3 sin (3x) + ^ex 1 1 —x cos (3x) H—x sin (3x) , Ci, C2, C3 e K. 2 6 □ 8.143. Určete obecné řešení rovnice y" + 3y' +2y =e-2x. Řešení. Daná rovnice je lineární (všechny derivace se v rovnici vyskytují v první mocnině) diferenciální rovnice s konstantními koeficienty druhého řádu (nejvyšší derivace hledané funkce, která se v rovnici vyskytuje je druhá). Nejprve vyřešíme zhomogenizovanou rovnici y" + 3y + 2y = 0. Její charakteristický polynom je x2 + 3x + 2 = (x + l)(x + 2), s kořeny x\ = — 1 a x2 = —2. Obecné řešení zhomogenizované rovnice je tedy c\e~x + c2e~2x, kde ci, c2 jsou libovolné reálné konstanty. Nyní metodou neurčitých koeficientů nalezneme (nějaké) partikulární řešení původní nehomogenní rovnice. Podle tvaru nehomogenity řešení y(t, x) existovat, bude dána rovnicí (8.11) s počáteční podmínkou. Definujme tedy (ř, x) touto rovnicí a zkoumejme výraz G(t, h) = \y(t, x0 + h) - y(t, x0) - h(t, x0)\ s malými přírůstky h eW. Abychom dokázali, že spojitá derivace existuje, musíme dokázat, že 1 lim - G(ř, h) = 0. h^O h Budeme k tomu potřebovat několik odhadů. Předně z poslední věty o spojité závislosti na počátečních podmínkách přímo vidíme odhad: \y(t,x0 + h)-y(t,x0)\ < \h\ ec"l . V dalším kroku použijeme Taylorův rozvoj se zbytkem pro zobrazení / f(y) - f (z) = Dlf(z) • (y - z) + R(y z), kde R(y, z) splňuje \R(y, z)\/\y - z\ -> 0 při |y - z\ -> 0. Dostáváme první odhad, při kterém využíváme definice zobrazení í>(ř, xq) pomocí jeho derivace. Píšeme opět F(t,x) = Dlf(y(t,x))) G(ř, h) < f \f(y(s, x0 + h)) - f(y(s, x0)) Jo — h F(s, xo)®(s, xo)\ ds < / \\F(s, xo)\\ \y(s, xo+h) - y(s, xo) - h <í>(s, xo)\ds Jo + / \R(y(s,xo + h),y(s,xo))\ds, Jo kde pracujeme s normou na maticích danou jako maximum absolutních hodnot jejich komponent. Podle předpokladu je F(t, x) spojité, proto na našem okolí V a pro \t\ < T s dostatečně malým T, abychom zůstávali v okolí V, můžeme ohraničit normu ||F(r,*0)ll < B a zároveň pro libovolně zvolenou konstantu £ > 0 umíme najít ohraničení \h\ < S, při kterém bude zbytek R splňovat \R(y(t, xo + h), y(t, x0))\ < s\y(t, x0 + h) - y(t, x0)\ < \h\geCT . Můžeme proto náš odhad dále vylepšit takto G(t,h)R, X(f)(x) = dx{x)f. Je-li tedy v souřadnicích X(x) = (X\(x), ... Xn(x)), pak X(/)(*) = Xi(*)|^(*)-óx\ 3/ ■ + Xn(x)-^(x). ox„ Nejjednodušší vektorová pole budou mít v souřadnicích všechny souřadné funkce rovny nule, kromě jedné funkce X;, která bude konstantně jednička. Takové pole pak odpovídá příslušné parciální derivaci podle proměnné x j. Tomu odpovídá také obvyklý zápis X(x)-- 9 óx\ 9 Xn(x) — . ox„ Nyní můžeme řešení našeho systému rovnic ekvivalentně popsat jako hledání křivky x(t), která pro každé t ze svého definičního oboru splňuje x'(t) = X(x(t)), tečný vektor hledané křivky je v každém jejím bodě zadán vektorovým polem X. Každou takovou křivku nazýváme integrální křivkou vektorového pole X a zobrazení Flf : M" -» M", definované v bodě xq jako hodnota integrální křivky x(t), splňující x(0) = xo nazýváme tokem vektorového pole X. Věta o jednoznačnosti a existenci řešení systémů rovnic říká, že pro každé spojitě diferencovatelné vektorové pole X existuje jeho tok v každém bodě xq definičního oboru pro dostatečně malá t. Jednoznačnost řešení navíc přímo zajišťuje, že >Flf(x), 1(+s(*)=Flf kdykoliv obě strany existují. Navíc je zobrazení Fl^ (x) s pevným parametrem t diferencovatelné ve všech bodech x, kde je definované. Pokud je vektorové pole X definované na celém M" a má kompaktní nosič, pak zjevně existuje jeho tok ve všech bodech a pro všechna t. Takovým vektorovým polím říkáme úplná. Tok úplného vektorového pole je tedy složen z difeomorfismů Flf M" —> M" s mverzními difeomorfismy Flí(. Jednoduchým příkladem úplného vektorového pole je pole X(x) — -i-. Jeho tok je dán Flf(*!, ,xn) ■ (x\ +t, x2,...,x„). Naopak, vektorové pole X(f) — t2 na jednorozměrném prostoru R není úplné, protože jeho řešení jsou tvaru 1 C — t pro počáteční podmínky s to 7^ 0 a „utečou" tedy do nekonečných hodnot v konečném čase. 503 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.147. Vyřešte rovnici f-2y + y = £-v Řešení. Řešení této nehomogenní rovnice určíme metodou variace konstant, kdy řešení obdržíme ve tvaru y = C\(x) y\{x) + C2(x) y2(x) H-----h C„(x) y„(x), přičemž y\,..., y„ zadávají obecné řešení přidružené homogenní rovnice a funkce C\(x),..., C„(x) získáme ze soustavy Cl (*) y\(x) H-----\-C'n (x) yn (x) = 0, Cl(x)y'l(x) + --- + C'Jx)y'Jx) = 0, C\(x) y(r2) (x) + --- + Cn(x) y{r2) (x) = 0, C\{x) /r1' (*) + ■■■ + C'Jx) v*"-1' (x) = f{x). Charakteristický polynom X2 — 2X + 1 má kořeny Xi = X2 = 1. Řešení rovnice tak hledáme ve tvaru a uvažujeme soustavu Ci(x)é + c2(x)xe >C\(x)ex + C2(x)xď =0, C\(x)ex + C2(x)[ex + xex] x2 + 1 Neznámé Cx(x) a C'2(x) vypočítáme pomocí Cramerova pravidla. e x e ex ď + x ď 0 x ď ex + x é x2+\ ď 0 x2 + 1 x2 + 1 plyne Ci(x) = - í -^-dx = -^Iníx2 + 1) +Ci, Ciel, i r + 1 2 C2(x) = f -p— = arctgx + C2, C2 e K. i Jf +1 Obecné řešení proto je y = C\ď + C2x ex — ŕ) ex ln (x2 + l) + x e*arctg x, C\,C2€' Popis vektorového pole jakožto přiřazení tečného vektoru v zaměření ke každému bodu euklidovského prostoru je nezávislé na souřadnicích. Následující věta nám tedy dává geometrický lokální kvalitativní popis všech řešení systémů obyčejných diferenciálních rovnic v okolí každého bodu x ve kterém je dané vektorové pole X nenulové. Věta. Je-li X vektorové pole definované na okolí bodu xq e W a platí X(xo) 0, pak existuje transformace souřadnic F taková, Že v nových souřadnicích y — F(x) je vektorové pole X dáno jako P°le šfr- Důkaz. Budeme konstruovat difeomorflsmus F — kli" (fl' fn) postupně. Geometricky lze podstatu důkazu 'Lfjp shrnout tak, že si vybereme nadplochu komplementární k směrům X(x), procházející bodem xq, na ní zvolíme souřadnice a ty pak rozneseme na nějaké okolí bodu xq pomocí toku pole X. Nejdříve použijeme posunutí xq do počátku souřadnic a lineární transformaci na M" tak, abychom dosáhli X(0) — gfj-(0). Nyní si zapišme v těchto souřadnicích (x\, ... ,xn) tok pole X procházející v čase t — 0 bodem (jci.....xn) jako xi(t) = i(0, 0, x2, ..., xn)) = (0, x2, ..., xn), neboť jde o tok v čase nula, dostáváme 9F 3xí (0) = (0, 1, ...,0), i = 2, ...,n, □ a stejný vztah platí i pro i — 1, protože je X — Je tedy Jaco-biho matice zobrazení F v počátku jednotkovou maticí E, a proto jde skutečně o transformaci souřadnic na nějakém okolí (viz věta o inverzním zobrazení v odstavci 8.17). Nyní přímo z definice zobrazení F pomocí toku vektorového pole X bude v nových souřadnicích (y\, ..., y„) tok pole vyjádřen jako Flf (yi, ..., yn) = (yi + t, y2, ..., yn), ověřte si samostatně podrobně! □ 8.56. Rovnice vyšších řádů. Obyčejnou diferenciální rovnicí řádu k (vyřešenou vzhledem k nej vyšší derivaci) rozumíme rovnici y(k\t) = f(t, y k, ma spojité parciální derivace na otevřené množině U. Pak pro každý bod (to, zo, ■ ■ ■, Zk-i) 6 U existuje maximální interval Imax — [xo — a, xo + b], s kladnými a, b e R, a právě jedna funkce y(f) : Imax R která je řešením rovnice k-tého řádu y(k) (ť) = f(t,y(t),y'(t),...,y(k-ľ)(t)) s počáteční podmínkou y(to) = zo, ý (to) = zi, ,y*-l)(to)- ■ Zk-\- Toto řešení navíc závisí diferencovatelně na počáteční podmínce a případných dalších parametrech vstupujících diferencovatelně do funkce f. □ Vidíme tedy, že pro jednoznačné zadání řešení obyčejné diferenciální rovnice &-tého řádu musíme zadat v jednom bodě hodnotu a prvních k — 1 derivací výsledné funkce. Pokud bychom pracovali se systémem í rovnic řádu k, pak stejný postup převede tento systém také na systém kí rovnic prvního řádu. Opět tedy bude plati obdobná věta o existenci jednoznačnosti, spojitosti a diferencovatelnosti. Na všechny takové systémy se samozřejmě také přenáší silnější vlastnosti v případech, kdy je pravá strana rovnice / diferencovatelná do řádu k včetně nebo analytická, včetně parametrů, kteréžto vlastnosti se přenáší i na řešení. 8.57. Lineární diferenciální rovnice. Již jsme přemýšleli o operaci derivování jako o lineárním zobrazení z (dostatečně) hladkých funkcí do funkcí. Pokud derivace (jj-V jednotlivých řádů j vynásobíme pevnými funkcemi a j (i) a výrazy sečteme, dostaneme tzv. lineární diferenciální operátor: y(t) D(y)(t) = ak(t)y(k) (t) + ■ ■ ■ + ax(t)y'(t) + a0y(t). Řešit příslušnou homogenní lineární diferenciální rovnici pak znamená najít funkci y splňující D(y) = 0, tj. obrazem je identicky nulová funkce. Ze samotné definice je zřejmé, že součet dvou řešení bude opět řešením, protože pro libovolné funkce y\ a y2 platí D(yi + y2)(t) = D(yi)(i) + D(y2)(t). Obdobně je také konstantní násobek řešení opět řešením. Celá množina všech řešení lineární diferenciální rovnice &-tého řáduje tedy vektorovým prostorem. Přímou aplikací předchozí věty o jednoznačnosti a existenci řešení rovnic dostáváme: 505 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.151. Najděte funkci y(t) vyhovující diferenciální rovnici Prostor řešení lineárních rovnic y" (/) + 6/ (/) + 9y(t) = 50 sin t a počátečním podmínkám y(0) = 1 a / (0) = 4. Řešení. Laplaceovou transformací dostáváme s2C(y)(s) - s - 4 + 6(sC(y)(s) - 1) + 9£(y)(s) = 50£ (sin/)(■*), tj. (s2 + 6s + 9)£(y)(s) 50 s2 + 1 C(y)(s) 50 + s +10, s +10 (í2+1)(í + 3)2 (í + 3)2' Rozkladem na parciální zlomky prvního členu dostaneme 50 As + B C D +-r + ■ (s2 + í)(s + 3)2 s2 + 1 í + 3 (í + 3)2 tedy 50 = (As + B)(s + 3)2 + Cd + l)(í + 3) + Z) (í2 + 1). Dosazením í = — 3 dostáváme 50 = 10 D tedy D = 5 a porovnáním koeficientu u í3 0 = A + C, tedy A = —C. Porovnáním koeficientu u s pak 4 0 = 9A + 6B + C = 8A + 6S, tedy B = -C. Porovnáním absolutních členů dostaneme 50 = 9B + 3C + D = 12C + 3C + 5 Protože tedy C = 3, B = 4, A = -3. í+ 10 s + 3 + 7 1 7 + ■ platí (s + 3)2 (s + 3)2 s+ 3 (s + 3)2 £(y)(s) - s2^i4 + s+3 + (s+3)2 + s+3 + (s+3)2 _ -3s , _4__i _4_ i 12 ,2 íl ~r »2 i 1 ~r T ■ s2+l ' s2+l ' s+3 ' (s+3)2' Odtud inverzní Laplaceovou transformací dostáváme řešení ve tvaru y(t) = -3 cos / + 4 sin / + 4, x! (t)+2x(t) = -y(t)+y (t)+e-> při počátečních podmínkách x(0) = 0, y(0) = 0, xf (0) = 1, /(0) = 0. Řešení. Opět aplikujeme Laplaceovu transformaci. Tím s využitím £(e±')W = ^T převedeme první rovnici na s2 C (x) (s) — s lim x(t) — lim x1 (t) + (x) (s) — lim x(/) = = Ľ (y) (s) -(s2 C (y) (s) - s lim y(t) - lim y (t)) + ^ a druhou potom na s£ (x) (s) - lim x(t) + 2Ĺ (x) (s) = = -Ľ (y) (s) + sC (y) (s) - lim y(t) + ^. Vyčíslíme-li limity (dle počátečních podmínek), obdržíme lineární rovnice s2 L (x) (s) - 1 + sC (x) (s) = C (y) (s) - s2 C (y) (s) + ^ a sC (x) (s) + 2C (x) (s) = -C (y) (s) + sC (y) (s) + ^ (8.12) Y'(ť) = A ■ Y (ť) s konstantní maticí A e Mat„ (R). Kombinací našich znalostí z lineárni algebry a z analýzy funkcí jedné proměnné můžeme přímo uhádnout řešení, jestliže definujeme tzv. exponentu matice předpisem B(i) = e,A = J2 Na výraz napravo přitom můžeme formálně nahlížet jako na matici, jejímiž komponentami bij jsou nekonečné řady vzniklé z uvedených součinů. Jestliže odhadneme všechny komponenty v A maximem jejich absolutních hodnot ||A|| = C, pak pro k-tý sčítanec v bij (i) dostaneme v absolutní hodnotě odhad ^nkCk. Nutně tedy je každá řada bij (i) absolutně a stejnoměrně konvergentní a je shora ohraničena hodnotou e<7lC. Když zkusíme derivovat členy naší řady člen po členu, dostaneme stejnoměrně konvergentní řadu s limitou A etA. Bude proto, podle obecných vlastností stejnoměrně konvergentních řad, tomuto výrazu rovna i derivace dt Tím jsme získali obecné řešení našeho systému (8.12) ve tvaru Y (i) = e'A Z , kde Z e Mat„ (R) je libovolná konstantní matice. Skutečně, exponenta etA je invertibilní maticí pro všechna t, a proto jsme tak dostali vektorový prostor správné dimenze a tudíž všechna obecná řešení. Pozoruhodné je, že pokud řešíme jen vektorovou rovnici s konstantní maticí A e Mat„(R),y (ř) = A -y(t), pro neznámou funkci y : R -» R™, pak exponenta etA zadá n lineárně nezávislých řešení pomocí svýchn sloupců. Obecné řešení pak opět obdržíme jako jejich libovolnou lineární kombinaci. Závěrem si připomeňme, že jsme maticový systém prvního -i> ., řádu potkali v odstavci 8.54, když jsme přemýšleli o deri- tvací řešení vektorové rovnice podle počátečních podmínek. Uvažme nyní diferencovatelné vektorové pole X(x) defino-l vané na okolí bodu xo e R™ takové, že X(xo) — 0. Potom je bod xo pevným bodem jeho toku Flx(x). Pro diferenciál *(ř) = DxFlx(x0) platí (viz (e8.42b) na straně 501) *'(ř) = DlX(xo) ■ *(ř), <ř(0) = £. Známe tedy explicitně evoluci diferenciálu toku vektorového pole v jeho singulárním bodě xo, která je dána exponentou (t) = e'A, A = D1X(x0). To je užitečný krok k úvahám o kvalitativním chování v okolí sta-cionáního bodu xq. 8.60. Poznámka o Markovových řetězcích. Ve třetí kapitole jsme se zabývali iterativními procesy a významnou roli tam hrály tzv. stochastické matice a jimi zadané Markovovy procesy. Připomeňme, že matice A je •7 stochastická, jestliže součet každého jejího sloupce dá jedničku. Jinými slovy, platí (1 ...I)-A =(1 ... 1). 507 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI s právě jedním řešením C (x) (s) C (y) (s)-. Opět si pomůžeme rozkladem na parciální zlomky se ziskem C (x) (s) — - —__I- - —±__I _L — 2 i +Í_L Neboť již dříve jsme vypočítali £ (/ e-') (s) = -L- £ (sinh/) (í) = (i+i)-1 £ (/ sinh r) (í) : dostáváme x(f) = |1 e~' + i sinh r, v(/) = 11 sinh r. Čtenář může sám ověřit, že tyto funkce x a y jsou skutečně hledaným řešením. Ověření však důrazně doporučujeme provést (např. z toho důvodu, že Laplaceovy transformace funkcí y = e', y = sinh/ a y = t sinh /jsme získali pouze pro s > 1). □ 8.154. Najděte řešení soustavy diferenciálních rovnic: x (/) = -2x(t) + 3y(t) + 3í2, y (t) = -4x(t) + 5y(t) + é, x(0) = 1, yiO) = -1 Řešení. C(x')(s) = C(-2x + 3y + 3t2)(s), C(y')(s) = Li-4x + 5y + e')(s). Přitom levé strany lze zapsat pomocí (||8.11||) a pravé lze rozepsat vzhledem k linearitě operátoru £. Protože £{3t2){s) = ^ a £{e*){s) = dostáváme systém lineárních rovnic í£(*)(í)-1 = -2£(*)(í) + 3£O0(í) + £, sC(y)(s) + l = -4C(x)(s) + 5C(y)(s) + ^. Po úpravě dostaneme maticově A(í)x(í) = bis), kde jsme označili ^-cr .^-(íss)-"*-^)- Cramerovo pravidlo říká, že C(x)(s) = C(y)(s) |a2| kde |A| |Ai| s+ 2 -3 4 s-5 6 1 + - -1 + 1 |A2| = Odtud C(x)(s) s-i s + 2 1 + -3 s-5 6 -1 + s2 - 3s + 2, (í-5)(1 + ^) + 3(-1 + ^í) (í + 2)(-l + ^t)-4-^. (í _ i)(í _ 2) í3 í-l/' Jestliže vezmeme exponentu e , dostaneme (1 ...l)-eM = £77(1 ..A)-Ak = é(l ...1). Je tedy pro každé t invertibilní matice B(t) — e~' etA stochastická. Dostaneme tak spojitou verzi Markovova procesu (infinitesimálně) generovaného stochastickou maticí A. Skutečně, derivací podle t dostaneme d dt B (i) = -e~'e'A + e_í Ae'A = (-£ + A)B(ř), je tedy matice B (i) řešením maticového systému rovnic s konstantními koeficienty r (ŕ) = (A - E) ■ y (ŕ) se stochastickou matici A. To má vcelku zřejmé intuitivní vysvětlení. Když je A stochastická, pak okamžitý přírůstek vektoru y (i) ve vektorovém systému s maticí A, y (i) — A ■ y(f), je opět stochastický vektor. My ale pro Markovův proces chceme, aby vektor y(f) zůstával stochastický pro všechna t. Součet přírůstků jednotlivých komponent vektoru y(f) tedy musí být nulový a to zajišťuje odečtení jednotkové matice. Jak jsme již viděli výše, maticové řešení Y'(t) má ve svých sloupcích bázi všech řešení y (t) vektorového sytému. Předpokládejme nyní navíc, že je matice A primitivní, tj. nějaká její mocnina má samé positivní komponenty, viz 3.19 na straně 139. Pak víme, že její mocniny konvergují k matici A^, která má ve všech svých sloupcích vlastní vektor k vlastnímu číslu 1. Jistě proto existuje univerzální konstantní odhad pro všechny mocniny \\Ak — Aoo|| < C a pro každé malé kladné £ existuje N e N tak, že pro všechna k > N máme již \\Ak — Aoo|| < £. Můžeme nyní odhadnou rozdíl mezi řešením Y'(i) pro velká t a konstantní maticí A™ ^ k\ ' J2 ^jCIIAcll +e-'£||A0 Limitu výrazu fit) — e~' "ž2k T již menší než £. Celý výraz jsme tedy odhadli (pro n > N at > T > 0) číslem £(C+l)||Aoo||. Dokázali jsem tak velmi zajímavé tvrzení, které hodně připomíná diskrétní variantu Markovových procesů: _ Spojité procesy se stochastickou maticí _. Věta. Každá primitivní stochastická matice A zadává vektorový systém rovnic y (ť) = (A - E) ■ y(ť) s následujícími vlastnostmi (1) báze vektorového prostoru všech řešení je dána sloupci ve stochastické matici Y (i) = e"' etA , 508 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI £(y)(S) (s _ i)(í _ 2) (s + 2)(2-s) 4í3+24 7^1 ŕ Rozkladem na parciálni zlomky vyjádříme Laplaceovy obrazy řešení C(x)(s) = £(*)(í) : 2s2 (s-1)2 28 _ 21 _ 15 _ 87 s-1 4(s-2) s3 4i' 27 7 12 21 : (í-1)2 s-1 s-2 s3 s a zpětnou transformací dostáváme řešení Cauchyovy úlohy: x(t) = - f / - 3té + 2Se> - ^e2' - f t2 - f, y(t) = -18/ - 3/e' + 27e< - 7e2í - 6/2 - 21 . □ O. Rovnice vedení tepla 8.155. Nalezněte řešení tzv. rovnice vedení tepla (rovnice difúze) ut(x, t) = a2 /), x € R, / > 0 splňující počáteční podmínku lim u (x, t) = fix). Poznámky: Symbolem ut = |*- zde rozumíme parciální derivaci funkce u podle / (tj. derivujeme podle /, přičemž x považujeme za konstantní) a podobně uxx = jgf označuje druhou parciální derivaci podle x (kdy dvakrát derivujeme podle x a na / nahlížíme při derivování jako na konstantu). Fyzikální interpretací úlohy je, že se snažíme určit teplotu u (x, t) v tepelně izolované a homogenní tyči nekonečné délky (rozsah proměnné x), je-li dána počáteční teplota tyče funkcí /. Tyč má konstantní průřez a teplo se v ní může šířit pouze vedením. Koeficient a2 je pak roven podílu ^, kde a je koeficient tepelné vodivosti, c je specifické teplo a q je hustota. Zvláště se tedy předpokládá, že a2 > 0. Řešení. Na rovnici vedení tepla aplikujeme Fourierovu transformaci vzhledem k proměnné x. Platí ovšem co T(ut) (co, t) = -j— f u,(x, t) e~itOT dx = —co oo \ ' -1= f u (x, t) z-iax dx J , kde je derivováno podle ř, tj. je Tiut) (co,t) = (J7 (u) (co, t)) ' = (T (u))t (co,t). Současně víme, že T (a2 uxx) (co, t) = a2 T (uxx) (co, t) = —a2co2 T (u) (co, t). Při označení y(co, t) = T (u) (co, t) tak přecházíme k rovnici yt = -a2co2 y. Podobnou diferenciální rovnici jsme již při počítání Fourierových transformací řešili, a tudíž pro nás není obtížné stanovit všechna její řešení y(co, t) = K (co) e-"2"2', K (co) e R. Zbývá určit K(co). Transformace počáteční podmínky dává (2) je-li počáteční podmínka yo — y(to) stochastický vektor, pak i řešení y(i) je stochastický vektor pro všechna t, (3) každé stochastické řešení konverguje pro t —> oo k vlastnímu vektoru yca matice A příslušnému vlastnímu číslu 1 matice A. 8.61. Poznámky o parciálních diferenciálních rovnicích. V praktických úlohách se velice často potkáváme s rovnicemi, které dávají do vztahů neznámé funkce více proměnných a jejich derivací. Jestliže jme tedy u obyčejných rovnic pracovali v nejobecnější poloze ou rovnicí F(x, x, x, x ,...) — 0, kde tečky nad vektorem proměnných x e R™ označují (násobné) derivace podle dodatečné proměnné t, a cílem bylo najít křivku x(t) vyhovující po dosazení rovnici. Proměnná t v F nevystupuje pouze proto, že ji vždy umíme schovat do vektorové proměnné x jako souřadnici xq = t (s přidanou rovnicí xo = 1). Nyní místo jedné proměnné t bychom tedy chtěli umět pracovat podobně s rovnicemi F((U, UX, Uy, UXX, UXy, Uyy, . . .) = 0, kde u je neznámá funkce dvou proměnných x a y a indexy naznačují parciální derivace. Už v tomto nejjednodušším případě ale nejsou k dispozici obecné věty o jednoznačnosti a existenci řešení v obdobě k obyčejným diferenciálním rovnicím. Stejně jako u obyčejných rovnic přitom můžeme také uvažovat vektorové formulace (jak pro F tak pro u). Hovoříme pak také o systémech parciálních diferenciálních rovnic. V praktickém užití se nejvíce objevují rovnice prvního a druhého řádu, tj. případy, kdy v definiční rovnici nevystupují parciální derivace řádů vyšších. Jde o velice složitou tématiku, která vyžaduje silné matematické nástroje a my se zde omezíme jen na několik jednoduchých poznámek a pozorování. Začněme s tou nejjednodušší zajímavou možností jedinou rovnicí pro skalární funkci f (x, y) ve tvaru a(u, x, y)ux + b(u, x, y) = 0, kde a a b jsou známé funkce tří proměnných, u je hledané řešení. Zpravidla takový problém řešíme na nějaké oblasti D c R2 s hranicí 3D (která bude v tomto případě křivkou). Vcelku přirozený nápad je snažit se najít nějaké řešení podél jednotlivých křivek z vhodné soustavy, které nám vyplní celou oblast D. Díky nulovosti pravé strany se přímo podbízí hledat křivky, na nichž bude řešení u konstantní. Pokud zároveň nebudou tyto křivky tečné k hranici 3D, budeme umět minimálně na nějakém okolí rozšířit hraniční hodnotu m o konstantně podél takové křivky. Derivací u(c(t)) podle t dostaneme d 0 = —u(c(i)) = ux(c(t))x(t) + Uy(c(t))ý(i), dt což nám dává systém rovnic pro hledané křivky x — a(u,x(t), y(t)), ý — b(u, x(f), y(t)). Ten má pro dostatečně diferencovatelné funkce a, b a každou počáteční podmínku x(0), y(0) právě jedno řešení. Zkonstruovaným křivkám se říká charakteristiky parciální diferenciální rovnice prvního řádu, příslušné soustavě obyčejných diferenciálních rovnic pak charakteristické rovnice. 509 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI T (f) (co) = lim T (u) (co, t) = lim y(co, t) = K (co) e° = K (co), (=•0+ í=-0+ a proto je y(co, t) = T (f) (co) e-aW>, K (co) e K. Nyní se pomocí inverzní Fourierovy transformace vraťme k původní diferenciální rovnici s řešením oo u (x, t) = -j== J y(co, t) éwx dco = —oo oo = 7fc / T(j)(co)za^té^dco = —co co / co -aa" <-,íox dco = = -vhf f^i-vhl ^^-*dco\ds. —co \ —co / Vypočítáním Fourierovy transformace F{f) funkce f(t) = e" pro a > 0 jsme při přeznačení proměnných obdrželi CO 2 75 f *-c**-lTPdP = zk*-*> c>0- —co Dle tohoto vztahu (uvažte c = a2t > 0, p = w, r = s — x) platí ■ar1 —co ° " co, r = s 1 7 e-a2co2t e-ico(s -x) dw = 1 e-k^2T- ./?7T J . "lilii — OO a tedy □ P. Numerické řešení diferenciálních rovnic Nyní uvádíme dva jednoduché příklady na využití Eulerovy metody při řešení diferenciálních rovnic. 8.156. Pomocí Eulerovy metody řešte rovnici / = — y2 s počáteční podmínkou y(l) = 1. Přibližné řešení určete na intervalu [1, 3]. Pokuste se odhadnout, s pro jakou hodnotu kroku h bude chyba menší než 0,1. Řešení. Eulerova metoda pro uvedenou rovnici je dána vztahem yt+i = yk-h-y\ pro x0 = l, yo = í, xk = x0 + k-h, yk = y(xk). Začneme výpočet s krokem h = 1 a v každé iteraci tuto hodnotu vydělíme dvěma. Odhad „dostatečnosti" h uděláme poněkud nepřesně tak, že porovnáme dvě po sobě jdoucí přibližné hodnoty funkce y ve společných bodech a výpočet zakončíme, pokud maximum absolutní hodnoty rozdílu těchto hodnot nebude větší než požadovaná přesnost 0,1. Tím jsme v tomto případě problém vyřešili, protože když už jednou máme řešení charakteristických rovnic, nutně musí být řešení podél nich konstantní a řešení tak skutečně (lokálně) obdržíme. V okamžiku, kdy přidáme pravou stranu rovnice funkci f(x, y) a píšeme z — u(x,y), dává stejný postup dodatečnou podmínku x=a(u,x(t),y(t)), ý = b(u,x(t),y(t)), i = f (x(t), y(t)) opět řešení z(i) — u(x(f),y(f)) podél každé charakteristiky c (i) — (x(f), y(f)). Skutečně, z naší konstrukce je zaručeno jak i — f, tak i — uxx + ityý, a proto je naše rovnice podél charakteristik splněna. To ale obecně neznamená, že takto zkonstruované u je skutečně řešením původního problému. To musíme ověřit zkouškou. Zkusme si úplně jednoduchý příklad s rovnicí yux — xuy — 0 a s počáteční podmínkou u (x, 0) = x. Příslušné charakteristické rovnice jsme už viděli: x = y, y = -x. Řešení s počáteční podmínkou x(0) — R, y(0) — 0 je tvaru x(t) = R sinŕ, y(t) = R cos ř, u(t) = R. Takto je dobře definovaná funkce u (x, y) (v polárních souřadnicích) jen lokálně. Jednak to zjevně není diferencovatelná funkce v počátku souřadnic, také ale podél charakteristiky dojdeme z (R, 0) do bodu (—R, 0) a naše u již nebude splňovat počáteční podmínky. Stejné postupy můžeme (se stejnými potížemi) použít při vyšším počtu proměnných a také s vektorovými hodnotami. Jestliže budeme psát Vm pro gradient vektorové funkce u : R™ —> M.k a zvolíme libovolnou matici A funkcí (u,x)sn sloupci a í řádky, pak můžeme uvažovat homogenní rovnici A(u,x)-Vu —F(u,x). Pro případ matice A s jediným řádkem dostáváme obecnou obdobu předchozího příkladu. Nejblíže chování obyčejných diferenciálních rovnic budeme v případě, kdy je matice A invertibilní. Pak ji můžeme převést na pravou stranu a dostaneme systém rovnic tvaru Vm = G(u,x). V souřadnicích můžeme totéž psát jako p dup p w; = —(u,x) = F; (u,x). S počtením počtu podmínek a neznámých zjistíme, že pokud řešení existuje, bude lokálně zadáno počáteční podmínkou v jednom bodě (tj. velmi podobné chování jako v případě obyčejných diferenciálních rovnic). Vcelku přímočará geometrická analýza tohoto problému (tzv. Frobeniova věta) ukazuj e, že evidentní nutná podmínka kompatibility 32uP 3F;P 3Ff dxi dxj dxj je zároveň podmínkou dostatečnou. 3xí 510 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Výsledky ho = 1 y(°> =(10 0) /íi = 0,5 y(1) = (1 0, 5 0, 375 0, 3047 0, 2583) Maximální rozdíl: 0, 375. h2 = 0, 25 y<21 = (1.0000 0.7500 0.6094 0.5165 0.4498 0.3992 0.3594 0.3271 0.3004) Maximální rozdíl: 0,1094. h3 = 0, 125 y3' = (1,0000 0,8750 0, 5466 0, 5092 0, 3808 0, 3627 Maximální rozdíl: 0.0322. 0,7793 0,7034 0,6415 0,5901 0,4768 0,4484 0,4233 0,4009 0,3462 0,3312 0,3175) Za použití vhodného programového vybavení lze získat následující grafickou prezentaci výsledku, kde čárkovaně je přesné řešení, jímž je funkce y = 1/x. □ 8.62. Poznámky o numerických metodách. Kromě tak jednoduchých rovnic, jako jsou ty lineární s konstantními koeficienty se v praxi málo setkáváme s analyticky řešitelnými rovnicemi. Většinou proto potřebujeme postupy, jak přibližně spočíst řešení těch rovnic, se kterými pracujeme. Už jsme podobné úvahy dělali všude tam, kde jsme se zabývali aproximacemi (tj. zejména lze doporučit porovnání s dřívějšími odstavci o splajnech, Taylorových polynomech a Fourierových řadách). S trochou odvahy můžeme také považovat diferenční a diferenciální rovnice za vzájemné aproximace. V jednom směru nahrazujeme diference diferenciály (např. u ekonomických nebo populačních modelů), ve druhém pak naopak. Zastavíme se na chvilku u nahrazování derivací diferencemi. Nejdříve si však zavedeme obvyklé značení pro zápis odhadů chyb. Připomeňme, že pro funkci f(x) v proměnné x říkáme, že je v okolí hromadného bodu xq svého definičního oboru řádu velikostí 0( — i-3y-5' 8.187. Jako explicitně dané funkce vyjádřete řešení rovnice O o o o o x— 3 O '.188. Metodou variace konstant vypočtěte y' + 2y = x. O '.189. Určete obecné řešení rovnice y' = 6x + 2y + 3. O !.i90. Vyřešte lineární rovnici / = 4xy + (2x + l)e2j2. O 1191. Řešte rovnici y x + y = x In x. O 1192. Vypočtěte lineární diferenciální rovnici y'x = y + x2 Inx. 515 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI O í. 193. Stanovte všechna řešení rovnice ý cos x = (y + 2 cos x) sin x O í. 194. Najděte řešení rovnice / = 6x — 2y, které vyhovuje počáteční podmínce y(0) = 0. O '.195. Vypočtěte počáteční problém / + y sin x = sin x, y (|-) = 2. O '.196. Uvedie řešení rovnice y = 4y + cos x, které prochází bodem [0,1]. O '.197. Pro libovolné a,b eR řešte xý + y = é, y (a) = b. 8.198. Stanovte obecné řešení rovnice 3x2y'+xy = ±. '.199. Řešte Bernoulliho rovnici y = xy — Ý e" 8.200. Vypočtěte Bernoulliho rovnici fy 2 • y — j = y smx. 8.201. Najděte všechna řešení rovnice y' = 4-ř+x^y. 8.202. Řešte rovnici xy +2y +x5yex = 0. 8.203. Pro a, b > 0 stanovte obecné řešení O o o o o o 516 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 'dy = (a^+b^j dx. 1204. Záměnou proměnných řešte 2y + (y2 - 6x) y' = 0. 8.205. Vyřešte rovnici v -_ľ_ 2y ln y+y—x ' '.206. Spočítejte obecné řešení následující rovnice x dx = (y ~ y3^) ^y- '.207. Záměnou proměnných vypočtěte (x + y) dy = y dx + y ln y dy. 8.208. Reste y (e-y -x) = i. 8.209. Spočítejte 2x-y2' '.210. Vyřešte rovnici 2y dx + x dy = 2y3 dy. 8.211. Spočtěte 8.212. Uvedie libovolné řešení nehomogenní lineární rovnice y" + y' + f y = 25 cos (2x) O o o o o o o o y" +3y' +2y = (20x + 29) eJI. O 517 KAPITOLA 8. SPOJÍTE MODELY S VÍCE PROMĚNNÝMI O 8.213. Určete řešení rovnice y" + 2y' +2y = 3e~* cos x. O 8.214. Nalezněte obecné řešení rovnice y" = 2y'+y + l, splňující y(0) = 0 a / (0) = 1. O 8.215. Nalezněte obecné řešení rovnice y" = 4y-3y' + l, splňující y(0) = 0 a / (0) = 2. O 8.216. Stanovte obecné řešení lineární rovnice y" -2i +5y = 5e2lsinx 8.217. Využitím speciálního tvaru pravé strany určete všechna řešení rovnice f + y =x2 - x+ 6^. 1.218. Vyřešte y(4) _ 2y" + y = 8 (e1 + e~*) + 4 (sin x + cos x) '.219. Metodou variace konstant vypočtěte / - 2y' + y : 8.220. Reste y" +4y' +4y = e"2* ln x. O O O O 8.221. Pomocí metody variace konstant najděte obecné řešení pro rovnici O KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI O 8.222. Vyřešte rovnici y" + y = tg2 x. O 8.223. Nalezněte řešení diferenciální rovnice y3' = -2y" -2y' - y + sin (x), splňující y(0) = - i, i (0) = ^ a y" (0) = -1 - f. O 8.224. Vypočtěte rovnici y"' - 2y" - / + 2y = 0. O 8.225. Uvedie obecné řešení pro rovnici y<4> + 2y" + y = 0. 8.226. Vyřešte y(6) + 2-y(5) + 4-y(4) + 4y" + 5 y/ + 2/ + 2y = 0. Í.227. Najděte obecné řešení lineární rovnice -y(5) _ 3-y(4) + 2yl„ =$x_ 12, O O O 519 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI Řešení cvičení 8.21. Jak čtenář snadno nahlédne, Taylorův polynom daného stupně funkce dané mnohočlenem více neznámých, j e mnohočlen sám, případně ořezaný o vyšší mocniny. Tedy v tomto případě T(x, y, z) = xz2 + xy + 1. 8.22. T (x, y) — y2. Rovnice tečná roviny je dána lineární částí Taylorova polynomu, tj. z — 0, zadaný bod v ní neleží. 8.23. T2(xy+l){l, 1) = ln(2) + ±{x2 + y2 + xy - x - y - 1). 8.24. y+xy. 8.32. Stacionární body (±j, =fL ±g)- Hessiányjsou v obou indefinitní, extrém nenastává. 8.33. Stac. body [=1=2, ±1, ±2], Hessián je v obou indefinitní, extrémy v těchto bodech nejsou. 8.34. Stac. body [± j, ±1, ŤjL Hessiányjsou v těchto bodech indefinitní, extrémy nenastávají. 8.35. Stac. body [±2, =1=2, ±1], extrémy v nich nenastávají. 8.36. Stacionární body: (0, -1/4), (±V3, -1), minimum v bodě (0, -1/4). 8.37. Stacionární body: (0, — 1 /2), Hessián v tomto bodě indefinitní, nemá extrém. 8.38. Globálni minimum je v bodě (1 /7, —2/7). 8.39. Stacionárni bod (—1 /9, 2/9), Hessián v něm indefinitní, extrém nenastává. 8.60. V bodě [5,5, —5], niinimum. 8.61. V bodě [-^ ŽI 2 ' 2J 8.62. [ S. 63. [ 3 1 VŠ _V3n 2 + 2 • V2J- 3 , ^3 _VL 2 + 2 • V2J- 8.64. V bodech [±4;, Ť4?]- V2 Vo 8.65. V bodech [±^, -^]. 8.66. 3 VŠ/16. S. 67. 1/(2 Vš). 8.68. (1/V2, 1/2), (-1/V2,-1/2). 8.91. [0, f]. 8.92. [g, 1]. 8.95. [0, 8.95. V = 7i. 8.96. 8it. 8.97. 8.98. 4V3n - fn. 8.100. f (17VŤ7- 1). 8.101. 76(^/4-1/2). 8.108. 4tz. 8.109. 36it. 8.110. 65ir 24 ' 8.136. y = 1 - e (0,2). 8.737. Me-í/9. 8.758. ^sin(2ŕ). 520 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.158. 2 (100 + 2i) — 7j§£^t- 8.159. 800 K. 8.160. -87,5Í?S# = 13,3 dne ln(2) 8.161. 5ln(5) 4 ln(2)' 8.162. SJ63. 5,27^|. 8.164. y — 1^qx ■ (použijte součtového vzorce pro tangens). 8.165. y = 0, y = (1 - Cx) _1, Cel. 8.Í66. y = - ln (1 - Ce1), Cel. 8.167. y = Ce-1^2, Cel. 8.168. y = 2, y = -2, (x - C)2 + y2 = 22, Cel. 5.169. y^l,y^l-ln|sln1l|+c,CeR. 8.Í70. x2 + 2ln | x | + ln | y2 - 1 | = C, C 6 R. 8.171. y = C (x + 1) e"*, Cel. 8.Í72. V2 cosy = cosx. Ai7J.y = V^ + 1. 8.174. y = éz(x/2\ 8.175. y = ±Vln(e* + 1) -ln2. 8.176. x = Cesin*,C el. 8.177. y2 = x2 + C^y2, C e R. 8.178. y = x, y = -x, y = x sin (ln | Cx |), C e R \ {0}. 8.179. cotg (± ln f) = ln | C* |, C e R \ {0). 8.180. arctg f = ln (x2 + y2) + C, C e R. S.iSi. y = tg (x + C) - x, C e R. 8.Í82. C = (x - l)2 - 2(y - 4) (x - 1) - (y - 4)2, Cel \ {0). 8.Í8J. (x - y)2 + 2* + C = 0, C e R. 8.184. y = x, C = 5x - 2y + ln | y - x |, C e R. 8.Í8J. (x + l)2 - 2(x + l)(y + 2) - (y + 2)2 = C, C e R \ {0). 8.186. 3(y + l)2 - 2(y + l)(x - 2) + 2(x - 2)2 = C, C e R \ {0). 8.187. y = 5 - x + C(x - 3)2, C e R. 8.188. y = Ce-3x + \x - 5, C e R. 8.189. y = Ce2x - 3(x - h 1), C e R. 8.190. y = (x2 + x + C) e2*2, C e R. 8.191. y C j_ x ln x — x "T" 2 f, C e M. 8.192. y = Cx + a2 lnx — x2, C e R. 8.193. y sin2 x-\-C s-> r cos x ' R. 8.194. y = 3x + f e~21 - |, C e R. 8.195. y = eC0SI + 1. 8.196. y 1 ■ 4 = T7sm*-T7 cos x + Y7 e41 521 KAPITOLA 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI 8.197. y = **+ab-t° _ 8.198. y3 = ln|j[J+c, Cel. 8.199. y = 0, y2 = jf+č- c e R- 5.200. y = 0, i = £ + cos* - Cel. 8.20Z. y = 0, y = x4 (± ln | * | + CJ \ C 6 M. 8.202. y = 0, y-2 = *4 (2e* +C),C e M. 8.20J. y2 + | = Ce"^, Cel. 8.204. x = l\ + Cy3, C e M. 8.205. * = ylny + ^,C el. 8.206. x2 + y2 (y2 - c) = 0, C e M. 8.207. * = y lny - + Cy, C 6 M. 8.208. i=(C+y)e-',Cel. 8.209. * = ^- + f + ± + Ce2y, Cel. 8.2Z0. * = +-^.CeM. 8.2ZZ. y = Cie~21 + C2e~* + (x + l)e3*, Ci, C2 e M. 8.2Z2. Např. y = 8 sin (2*) - 6 cos (2*). 8.213. y = e-* (Ci cos* + C2 sin*) + ^ e-* sin*, Ci, C2 e M. 8.2Z4. .r 2 2 8.2ÍJ. y = \ a relativní kumulativní četnost Statistika je, v širším slova smyslu, jakékoliv zpracování číselných nebo jiných dat o nějakém souboru objektů a jejich více či méně přehledná prezentace. V tomto smyslu hovoříme o popisné statistice. Jejím předmětem je tedy zpracování a zpřehledňování dat o objektech daného souboru, např. roční příjmy všech občanů zpracovávané z kompletních dat finančních úřadů. Matematická statistika spočívá ve využití matematických metod pro odvozování závěrů platných pro celý (potenciálně nekonečný) soubor objektů na základě nějakého „malého" vzorku. Např. zjišťujeme zatížení populace chorobami pomocí dat získaných u několika nahodile vybraných osob, chceme ale interpretovat výsledky ve vztahu k celé populaci. Podstatou popisné statistiky je odvození jednoduchých (zpravidla) číselných charakteristik o velkých souborech dat, resp. jejich vhodná vizualizace. Podstatou matematické statistiky je pro prezentovaná data zjišťovat, jaké vlastnosti skutečně mají objekty, které jsou daty popisovány, a zároveň, jak věrohodné jsou odvozené výsledky. Zpravidla přitom jde o sběr a zpracování dat o nějakém souboru objektů, jejich následnou analýzu a, konečně, o vyslovení důsledků pozorování pro rozsáhlejší soubor objektů než jsou ty, jejichž data jsme zpracovávali. Ještě jinak řečeno, výsledkem použití matematické statistiky je sdělení o velkém souboru objektů na základě studia malé (zpravidla náhodně vybrané) části z nich, společně s kvalitativním odhadem věrohodnosti výsledného sdělení. Matematická statistika je opřena hlavně o nástroje teorie pravděpodobnosti, které jsou velice užitečné (a zajímavé) i samy o sobě. Nejvíce úsilí budeme v dalším textu věnovat právě jim. Celá tato kapitola poskytuje elementární úvod do metod pravděpodobnosti a statistiky, který by měl být dostatečný pro správné chápání běžných statistických informací všude kolem nás. Pro seriozní porozumění práci matematického statistika bude třeba sáhnout po dalších zdrojích. 1. Popisná statistika Popisná statistika není sama o sobě matematická disciplína, byť používá četné manipulace s čísly a občas i velmi sofistikované metody. Je přitom ale dobrou příležitostí k ilustraci matematického přístupu k budování obecně užitečných nástrojů. Zároveň by nám měla posloužit jako motivace pro řadu úvah v pravděpodobnosti, protože už budeme tušit, k čemu je později v matematické statice budeme potřebovat. KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY F(= N/20 = Jýj=i Pí)- *i ni Pí Ni Fi 1 5 1/4 5 1/4 2 5 1/4 10 1/2 3 1 1/20 11 11/20 4 6 3/10 17 17/20 5 2 1/10 19 19/20 6 1 1/20 20 1 Snadno již také sestavíme požadované (sloupcové) grafy (relativních, kumulativních) četností: Snadno spočítáme průměr počtu osob v domácnosti: 5-1+5-2 + 3-1+6-4 + 2-5 + 1' 20 2,9. Medián je pak průměr desáté a jedenácté hodnoty (seřazených podle velikosti), tedy průměr z čísla 2 a 3, í = 2, 5. Modus je nejčastěji se vyskytující hodnota, tedy i = 4. Uvedená data také můžeme zobrazit pomocí krabicového diagramu: Horní a dolní strana „krabice" odpovídá prvnímu (též dolnímu), resp. třetímu (též hornímu) kvartilu, její výška je tedy rovna kvarti-lovému rozpětí. Tlustá vodorovná čára mediánu je vedena ve výšce mediánu, dolní a horní vodorovná čára v diagramu odpovídá minimálnímu a maximálnímu prvku výběru, případně hodnotě, která je o 1,5 násobku kvartilového rozpětí nižší (resp. vyšší) než dolní (resp. horní) strana krabice. Případná data mimo toto rozpětí značíme v diagramu kolečky. Není též problém sestavit histogram daných dat: 9.1. Pravděpodobnost nebo statistika? Ne náhodou se vracíme i'V _ k části našich motivačních náznaků z první kapitoly, jak jen se nám podařilo shromáždit dostatek matematických nástrojů jak diskrétní, tak spojité povahy. Statistikami je totiž dnes zaplaveno kdejaké sdělení, ať už v médiích, politické nebo odborné. Nicméně porozumět obsahu takového sdělení a pochopit možnosti či oprávněnost využití jednotlivých statistických metod a pojmů si vyžaduje mnoho znalostí z různých oblastí matematiky, kterými jsme dosud procházeli. V tomto odstavci ještě nezačneme s matematickou teorií — ve volném sledu poznámek se jen zamyslíme nad dalšími kroky a cíli. Vezměme si jako příklad souboru objektů všechny studenty konkrétního základního kurzu. Jako číselné údaje pak můžeme např. zkoumat • „průměrný počet bodů" dosažený při hodnocení tohoto předmětu v minulém semestru a „rozptyl" dosažených hodnot, • „průměrné známky" dosažené u zkoušky z tohoto a z jiných pevně vybraných předmětů a „korelace" (tj. vzájemnou souvislost) mezi výsledky, • „korelace" dat vypovídajících o historii dřívějšího studia u konkrétních studentů, • „korelace" neúspěchů ve studiu a počtu pracovních hodin týdně odpracovaných studentem či studentkou mimo fakultu, • ... Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne ani o kvalitě přednášky ani o kvalitě přednášejícího ani o samotném hodnocení konkrétních studentů. Možná nás bude více zajímat hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní (nebo obdobně první a poslední čtvrtina, desetina apod.). Všem takovým údajům říkáme statistiky posuzované veličiny. Takové statistiky budou jistě zajímavé pro samotné studenty a je docela jednoduché je zavést, spočíst i sdělit. Z obecné zkušenosti nebo jako výsledek teoretických úvah mimo samotnou matematiku víme, že rozumné hodnocení by mělo mít tzv. „normální" rozdělení. Tento pojem patří do teorie pravděpodobnosti a k jeho zavedení potřebujeme poměrně dost matematiky. Porovnáním výsledku třeba i docela malého náhodného výběru studentů s teoretickým předpokladem můžeme zjistit odhad parametrů takového rozdělení, ale také činit závěry, zdaje celé hodnocení postaveno rozumně. Zároveň lze z číselných hodnot našich statistik pro konkrétní výběr kvalitativně popsat věrohodnost našich závěrů. Stejně tak budeme umět spočíst statistiky, které nebudou odrážet polohy hodnot uvnitř daného statistického souboru ale variabilitu sledovaných hodnot. Tak například když výsledky hodnocení nebudou vykazovat dostatečnou variabilitu, přičemž studenti jistě různé výkony prokazují, jde opět o náznak, že je s předmětem něco v nepořádku. Když působí zjištěná data zcela chaotickým dojmem, pak asi také. V předchozím odstavci jsme mlčky předpokládali, že považujeme zpracovávaná data za věrohodná. To však v praktickém využití tak nebývá. Naopak samotná data jsou zatížena chybami, zpravidla vznikajícími v důsledku konstrukce experimentu a samotného sběru dat. V mnoha případech také není známo mnoho o charakteru rozdělení dat. V takových případech je obvyklé používat metody 524 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Všimněme si, že četnosti výskytů jedno a dvoučlenných domácností byly sloučeny do jednoho obdélníčku. Tento postup se používá pro „zpřehlednění dat" - existují (různá a nejednoznačná) pravidla, jak při slučování postupovat. Proto pouze na tento fakt upozorňujeme, aniž bychom uvedli přesný postup (v podstatě je to, jak se to komu líbí). □ 9.2. Pro soubor znaků x = (x\, x2,..., xn) vypočtěte průměr a rozptyl centrovaných hodnot x,— x a standardizovaných hodnot Řešení. Průměr centrovaných hodnot zjistíme přímým výpočtem za použití definice aritmetického průměru ^ n \ n - n — y (xí — x) = — y Xi — y i = x — x = o. í=l í=l í=l Rozptyl centrovaných hodnot je zřejmě shodný s rozptylem původních hodnot sx. Pro standardizované hodnoty je průměr zjevně opět roven nule a rozptyl je roven ,2 i = l i. □ 9.3. Dokažte, že pro rozptyl platí vztah s2x = i Yľi=\ A ~ ^ • Řešení. Z definice rozptylu a aritmetického průměru 1 " 1 " 2x " 4 = - V (*? - 2*;i +i2) = - W--ľí+i2 í=1 í=1 í=1 i □ 9.4. Byly naměřeny následující hodnoty nějakého znaku 10; 7; 7; 8; 8; 9; 10; 9; 4; 9; 10; 9; 11; 9; 7; 8; 3; 9; 8; 7. Určete aritmetický průměr, medián, kvartily, rozptyl a příslušný krabicový diagram. neparametrické statistiky (kterých se jen letmo dotkneme na konci kapitoly). Velmi zajímavé vývody můžeme formulovat, když porovnáním statistik pro různé veličiny uvedené výše budeme moci dovozovat informace o souvislostech. Pokud např. neexistuje žádná doloži-telná souvislost mezi historií předchozího studia a výsledky v dané přednášce, je jedním z možných vysvětlení závěr, že je přednáška prostě špatně vedená. Shrňme si tedy tyto úvahy takto: • V popisné statistice máme k dispozici nástroje, které umožňují dobře porozumět struktuře a povaze i velmi rozsáhlých dat; • v matematice pracujeme s abstraktním matematickým popisem pravděpodobnosti, který je použitelný pro analýzu daných dat, zejména když máme k dispozici teoretický model, kterému mají odpovídat; • závěry statických šetření na vzorcích konkrétních souborů dat může dát matematická statistika; • i to, do jaké míry je takový popis adekvátní pro konkrétní výběr dat, je možné vyjádřit pomocí metod matematické statistiky. Než se do takového složitého programu pustíme, zastavme se u prvního bodu. 9.2. Terminologie. Statistikové zavedli veliké množství názvů a budeme šije muset osvojit. Základním východiskem je statistický soubor, což je přesně definovaná množina základních statistických jednotek. Ty mohou být dány buď výčtem nebo nějakými pravidly v rámci většího souboru. Na každé statistické jednotce měříme jeden nebo více statistických znaků, přitom ovšem chápeme „měření" velice široce. Např. souborem mohou být všichni studenti dané univerzity, každý zvlášť je pak statistickou jednotkou. O těchto jednotkách pak můžeme schraňovat mnoho znaků - např. všechny číselné hodnoty zjistitelné z informačního systému, jakou mají jednotliví studenti nejraději barvu, co snědli večer před poslední písemkou, atd. Základním objektem pro zkoumání jednotlivých znaků je pak soubor hodnot. Zpravidla jej máme ve formě uspořádaných hodnot. Uspořádání je buď dáno přirozeně (když jsou hodnotami např. reálná čísla) nebo je můžeme zavést pro určitost (třeba když budeme sledovat barvy, tak je můžeme vyjadřovat v RGB standardu a řadit podle tohoto příznaku). Můžeme pracovat i s hodnotami neuspořádanými. Protože smyslem statistického popisu je srozumitelně a přehledně sdělit něco o celém souboru, budeme jistě chtít umět jednotlivé hodnoty nějak porovnávat a poměřovat. Je tedy podstatné mít k tomu dispozici nějaké měřítko. Nejčastěji máme znaky vyjádřeny číselnou hodnotou. Ovšem věcný význam dat může být kvantifikován v různé míře a podle toho rozeznáváme různé typy měřítek znaků. ___J Typy měřítek znaků J___.- Podle toho jakého charakteru jsou hodnoty, hovoříme o typu: • nominálním, kdy mezi hodnotami není žádný vztah, jde pouze o označení jednotlivých kvalitativních jmen, tj. možných hodnot (např. politické strany v ČR nebo přednášející na univerzitě při zkoumání jejich obliby); 525 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení. Označíme-li různé hodnoty znaku a, a jejich četnosti n,, pak můžeme soubor dat ze zadání uspořádat do následující tabulky. 3 4 7 8 9 10 11 «; 1 1 4 4 6 3 1 Z definice aritmetického průměru pak máme _ 3+4 + 4-7 + 4-8 + 6-9 + 3- 10+11 162 ~2Ô~ 3,1. 1+1+4+4+6+3+1 Protože desátý člen v posloupnosti uspořádaných hodnot znaku je X(\o) = 8 a jedenáctý = 9, je medián roven í = ^ = g;5. Dolní kvartil je xo,25 = ^LpĚL = 7 a horní x0,75 = I(15)+J:(16) = 9. Z definice rozptylu spočítáme , 5,l2+4,l2+4- l,l2+4-0,l2 + 6-0,92 + 3- l,92 + 2,92 1+1+4+4+6+3+1 3,59. Na následujících obrázcích je zobrazen příslušný histogram a krabicový diagram. ordinálním, kdy platí totéž jako předchozí, ale s přidaným uspořádáním (např. počet hvězdiček u hotelů v turistických průvodcích); intervalovém, kdy jde o číselné hodnoty, ale jde o porovnání velikostí, nikoliv absolutní hodnotu (např. u měření teplot je poloha nuly zpravidla dohodnuta, ale není podstatná); poměrovém, kdy máme pevně stanovené měřítko a nulu (např. většina fyzikálních nebo ekonomických veličin). U nominálních typů znaků jsme schopni věcně interpretovat pouze rovnost x\ — x2, u ordinálních i nerovnost x\ < x2, případně x\ > x2, u intervalových navíc umíme posoudit rozdíl x\ — x2. U poměrových typů měřítek máme k dispozici rovnost, nerovnost, rozdíl i podíl x\/x2. 9.3. Třídění hodnot. V dalším budeme pracovat se souborem hodnot x\,x2, ... ,xn, které lze uspořádat (nejedná se tedy o hodnoty typy znaků nominálních) a které vznikly měřením na n statistických jednotkách, a uspořádáme je do uspořádaného souboru hodnot (9.1) *0).*(2). - nranra kategorie Medián = 6,5 = E*, 11J Číslo n nazýváme rozsah souboru. Pokud pracujeme s rozsáhlými soubory znaků, které ale připouští jen málo hodnot, je nejjednodušší uvádět pouze četnosti výskytu. Např. při průzkumu preferencí politických stran nebo u prezentace kvality hotelové sítě uvádíme u každé možné hodnoty počet jejích výskytů. Pokud je možných hodnot mnoho (nebo dokonce připouštíme spojitě rozprostřené reálné hodnoty), dělíme často možný rozsah hodnot na vhodný počet intervalů a o statistickém znaku uvádíme četnost hodnot v daných intervalech. Intervalům se často říká třídy a počtu znaků ve třídě pak třídní četnosti. Používáme také kumulativní četnosti a kumulativní třídní četnosti, které pro danou třídu vznikají prostým součtem třídních četností s hodnotami nejvýše jako má ta daná. Nejčastěji pak uvažujeme střed a, dané třídy za hodnotu, která ji reprezentuje a hodnota a,n,, kde n, je četnost výskytu této třídy představuje celkový příspěvek této třídy. Velmi často také místo četností zobrazujeme relativní četnosti a,/n, resp. relativní kumulativní četnosti. Graf, který na jedné ose vynáší intervaly jednotlivých tříd a nad nimi obdélníky s výškou rovnou četnosti se nazývá histogram. Obdobně se znázorňuje kumulativní četnost. Na obrázku jsou histogramy souborů o rozsahu n — 500, které vznikly náhodným generováním dat s různými standardními rozděleními (časem jim budeme říkat normální, x 2 a studentovo) □ 526 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.5. V daném rybníku se vylovilo 425 kaprů a u všech byly zjištěny jejich hmotnosti. Pak se vhodně zvolily hmotnostní intervaly a sestavila se následující tabulka četností: Hmotnost (kg) 0-1 1-2 2-3 3-4 4-5 5-6 6-7 Střed třídy 0,5 1,5 2,5 3,5 4,5 5,5 6,5 Četnost 75 90 97 63 48 42 10 Načrtněte histogram, určete aritmetický, geometrický a harmonický průměr hmotnosti kaprů, dále určete medián, horní a dolní kvartil, modus, rozptyl, směrodatnou odchylku, variační koeficient a načrtněte příslušný krabicový diagram. Řešení. Histogram má tvar K-S d=.16447. p<01 | LllliflforB pJ2xi Aritmetický průměr je proto obzvlášť vhodný pro intervalové typy měřítek. Logaritmus geometrického průměru je aritmetický průměr logaritmů znaků. Je obzvlášť vhodný pro znaky, které se kumulují multiplikativně, např. úrokové míry. Je-li totiž úroková míra v jednotlivých časových jednotkách *, %, bude za celé období výsledek takový, jakoby byla po celou dobu konstantní úroková míra xG %. Jako ilustraci tehdy rozvíjených metod jsme dokázali v odstavci 8.23 na straně 464, že je geometrický průměr vždy nejvýše tak velký jako aritmetický. Obdobně je tomu pro harmonický průměr a platí x" < xG < X. 9.5. Medián, kvartil, decil, percentil,... Jiný způsob vyjádření míry, jakou hodnotu nabývají znaky, je najít pro číslo a mezi nulou a jedničkou takovou hodnotu xa, aby 100 a % hodnot znaku bylo nejvýše xa a zbylé byly větší než xa. Pokud takový znak není určen jednoznačně, volíme zpravidla průměr mezi dvěma extrémními možnými hodnotami. Číslu xa říkáme a-kvantil. Dosáhl-li tedy nějaký účastník soutěže výsledku, který jej řadí do *i,oo, neznamená to, že byl jistě lepší než všichni ostatní. Jen nebyl nikdo jiný ještě lepší než on. Nejobvyklejší hodnoty xa jsou: • medián (často také výběrový medián) definovaný vztahem X = X0,50 = *((n+l)/2) pro liché n \ ix(n/2) + *(„/2+i)) pro sudé n 527 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Pro její parciální derivace platí f^- = — ln p,— 1 + X, a proto je její stacionární bod určen rovnicemi pí = e'^1 pro všechna i = 1,..., n. Navíc víme, že součet relativních četností pí je roven jedné. To zna- 1 a odtud X = 1 — ln n. Dosazením zřejmě pí □ 9.7. Následující grafy udávají četnosti možných bodových zisků studentů předmětu MB 104 na Fakultě informatický Masarykovy univerzity v roce 2012. Kumulativní graf je uváděn s „prohozenými" osami oproti předchozímu příkladu. Četnosti jednotlivých bodových zisků jsou uvedeny v následující tabulce: Body Počet studentů 20.5 1 20 1 19 2 18.5 1 18 2 17.5 3 17 2 16.5 4 16 3 15.5 5 15 7 14.5 6 14 14 13.5 21 13 21 12.5 19 12 17 11.5 18 11 31 10.5 22 10 53 Body Počet studentů 9.5 9 9 9 8.5 13 8 8 7.5 13 7 4 6.5 7 6 4 5.5 8 5 7 4.5 9 4 5 3.5 7 3 8 2.5 8 2 14 1.5 8 1 2 0.5 6 0 9 kde x(k) představuje hodnotu v uspořádaném souboru hodnot (9.1) • dolní a horníkvartil Q\ = xq,25 a q3 = xqjs; • p-tý kvantil {též výběrový kvantil nebo percentil) xp, kde 0 < p < 1 (zpravidla zadaný na dvě desetinná místa). Lze se setkat také s hodnotou modus, která udává hodnotu x znaku s největší četností v souboru x. Aritmetický průměr, medián a modus představují jakési očeká-vatelné hodnoty znaků. Průměr u znaku podílového typu, medián u poměrového a modus u ordinálniho nebo noimnálního. Všimněme si, že všechny a-kvantity hodnot v intervalových měřítcích jsou invariantní vzhledem k afinním transformacím hodnot (promyslete si podrobně!). 9.6. Míry variability statistických znaků. Rozumným požadavkem na jakoukoliv míru variability souboru hodnot znaků x e W je její invariance vůči konstantním posunutím. V euklidovském prostoru M" má tuto vlastnost standardní vzdálenost bodů a nezávislý na posunutí o konstantní hodnotu je i výběrový průměr. Proto volíme následující _______J Rozptyl a směrodatná odchylka _. Definice. Rozptyl souboru znaků x je definován vztahem 1 " 4 = - Y2(xi - xí)2-n i=\ Směrodatná odchylka sx je dána jako odmocnina z výběrového rozptylu. Často se v literatuře také pro rozptyl používá název střední kvadratická odchylka. Variabilita statistických znaků by neměla záviset na konstantním posunutí všech hodnot. Při naší definici jsme proto vyšli z toho, že jak standardní vzdálenost bodů v M" tak výběrový průměr jsou vůči posunutím o konstantní hodnotu invariantní, bude proto skutečně i pro neuspořádaný soubor znaků y = (x\ + c, X2 + c,...,x„+ c) vždy platit také sy = sx. Někdy se místo naší hodnoty sx používá tzv. výběrový rozptyl, který se odlišuje jen tím, že se ve jmenovateli zlomku používá (n — 1), důvod uvidíme později. V případě třídních četností n j hodnot a j pro m tříd dává stejný výraz hodnotu rozptylu ^ m 4 ^-J2ni<-aj -*)2- Tomu potom odpovídá následující histogram: 7=1 ale v praxi se doporučuje používat tzv. Shepardovu korekci, která Sx zmenší o h2/12, kde h je šířka stejných intervalů definujících třídy hodnot. Dále se ještě můžeme potkat s tzv. rozpětím výběru R = x{n) - x{\) a kvartilovým rozpětím výběru Q = q3- Q\- 528 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Používá se také tzv. průměrná odchylka, která je dána průměrnou vzdáleností hodnot od mediánu Histogram jsme obdrželi z informačního systému Masarykovy univerzity. Vidíme, že je zvolen poněkud netradiční způsob zobrazování, kdy danému bodovému zisku odpovídá „dvojitý obdélníček". Je na vkusu každého čtenáře, jaký způsob výpisu dat zvolí (je možno některé hodnoty počítat do jedné, čímž snížíme počet obdélníčků, nebo používat tenčí obdélníčky). 25 20 15 10 -i-1- 50 100 150 200 250 300 350 400 450 500 pořadí studentů Snadno si všimneme, že modusem bodových hodnot je číslo 10, což byla shodou okolností bodová hranice zaručující absolvování předmětu. Průměr získaných bodů je 9,48. 9.8. Uvedme ještě sloupcové diagramy bodových zisků studentů předmětu MB 101 v podzimním semestru 2010 (první semestr studia) a to jednak všech účastníků předmětu a poté studentů, kteří úspěšně ukončili bakalářské studium. 1 " n *-' Následující věta podává zdůvodnění, proč tyto míry variability volíme: Věta. Funkce S(t) — (1/n) JIÍLiC*; — ř)2 nabývá svého minima pro t — x, tj. pro výběrový průměr. Funkce D(t) = (1/n) 13=1 I*; — řl nabývá svého minima pro t — x, tj. pro medián. Důkaz. Protože je součet vzdáleností všech hodnot od výběrového průměru nulový, dostáváme přímým výpočtem řl = n(x - t)2+ JZ{xí -x)2, ;=1 což ověřuje první tvrzení. U druhého si musíme dát pozor na definici mediánu. Součet si za tím účelem přeskládáme tak, abychom vždy postupně sčítali první s posledním sčítancem, pak druhý s předposledním atd. V prvním případě tedy jde o výraz \x^ — t\ + \x^ — t\, a ten bude roven vzdálenosti x(„) — X(\), pokud bude t uvnitř rozsahu hodnost, a bude ještě vetší jinak. Další dvojice v součtu nám stejně dá x(„-\) — x (2), pokud bude X(2) < t < x(„-\) a bude větší jinak. Postupně tedy požadavek na minimalizaci součtu povede právě na t=x. □ V praxi potřebujeme poměřovat variabilitu různých souborů hodnot znaků různých statistických jednotek. Pro tento účel je vhodné relativizovat měřítko a používáme proto tzv. variační koeficient daného souboru x Vx- \x\ Tuto relativní míru variability lze také chápat v procentech směrodatné odchylky ve vztahu k výběrovému průměru x. 9.7. Šikmost rozložení hodnot znaků. Pokud jsou rozloženy znaky našeho souboru naprosto symetricky kolem výběrového průměru, bude zejména platit Často ale potkáváme rozložení hodnot splňujících např. to je běžné u rozložení mezd v populaci. Docela užitečnou charakteristikou v tomto směru je tzv. Pearsonův koeficient, který je dán vztahem x — x fi = 3- a můžeme si z něho udělat představu o relativní míře (absolutní hodnota f$) i charakteru zešikmení (znaménko). Zejména si všimněme, že směrodatná odchylka je vždy kladná, takže již znaménko nám ukazuje, kterým směrem k zešikmení dochází. 529 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY o (ľ kvantilové koeficienty šikmosti Výsledky opět můžeme zachytit i alternativně: 200 300 400 pořadí studentů A nyní grafy bodových zisků účastníků, kteří dále úspěšně pokračovali ve studiu. Podrobnější informaci v tomto směru dávají tzv. kvantilové koeficienty šikmosti X\-p + xp X\—p Xp pro každé 0 < p < 1. Jejich význam je zřejmý, když čitatel zlomku vyjádříme jako (x\-p — x) — (x — xp). Speciálně dostáváme tzv. kvartilový koeficient šikmosti při volbě p — 0,25. 9.8. Diagramy. Pro rychlé vstřebávání složitěji strukturovaných informací je člověk skvěle vybaven zrakově. Proto se pro zobrazení statistiky jednotlivých znaků nebo jejich korelací používá mnoho standardizovaných nástrojů. Jedním z nich jsou tzv. krabicové diagramy. ^_^_____^_J Krabicový diagram__. Na obrázku je zobrazen histogram a krabicový diagram stejného souboru hodnot (normální rozdělení s průměrem 10 a rozptylem 3, n = 500). Střední linkaje medián, kraje boxu jsou kvartily, „packy" ukazují 1,5 kvartilového rozsahu, ne však víc než kraje rozsahu výběru, případné hodnoty mimo jsou přímo naznačeny body. Běžné zobrazovací nástroje nám umožňují dobře vidět případné závislosti dvou výběrů zjištěných znaků. Např. na levém obrázku níže jsou za souřadnice voleny hodnoty ze dvou nezávislých normálních rozdělení s průměrem 10 a rozptylem 3. Na pravém obrázku je první souřadnice ze stejných dat, druhá je z první dána vztahem y — 3x + 4, ale je navíc zatížená malou náhodnou chybou. 530 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY — 8 10 12 14 16 18 body 9.9. Entropie. Variabilitu potřebujeme vyjadřovat i u nominální1 ., nich typů znaků, např. ve statistické fyzice nebo teorii infor-mace. K dispozici máme jen třídní četnosti a můžeme tedy r\t^ použít princip klasické pravděpodobnosti (viz čtvrtá část 1 první kapitoly), kdy relativní četnost i-té třídy, pí — ^, vnímáme jako pravděpodobnost, že náhodně vybraný prvek bude v této třídě. Rozptyl poměrových hodnot znaku, u kterého máme vyjádřeny třídní četnosti n j, byl v odstavci 9.6 vyjádřen vztahem 7=1 kde p j označuje (klasickou) pravděpodobnost, že hodnota znaku bude v y'-té třídě. Jde tedy o vážený průměr přepočtených hodnot znaků, kde je hodnota F(aj) — (a j — x)2 vstupuje s vahou p j. Variabilitu hodnot znaků nominálního typu budeme vyjadřovat podobným výrazem, označíme ho Hx- Nemáme sice k dispozici žádné číselné hodnoty a j pro pořadové indexy j, můžeme se ale zajímat o funkce F závisející na relativních četnostech p j, tj. zkusíme pro datový soubor x definovat >. io 0 20 40 60 80 100 120 140 160 pořadí studentů Vidíme, že modus zisku bodů v prvním případě je 0, ve druhém případě je to opět deset. Rozložení bodových zisků se blíží rozložení bodových zisků z předmětu MB 104, který je zařazen ve čtvrtém semestru studia. 9.9. Auto jelo z Brna do Prahy rychlostí 160 km/h, z Prahy do Brna rychlostí 120 km/h. Jaké průměrné rychlosti na trase dosáhlo? Řešení. Toto je základní příklad, kde je použití aritmetického průměru nevhodné. Na průměrnou rychlost totiž klademe požadavek, aby auto jedoucí touto rychlostí strávilo na trase stejnou dobu. Označíme-li d vzdálenost obou měst v kilometrech, vp průměrnou rychlost tak 2d odkud d d 160 + 120 -L + -L 137,14. Hx = J2píF(Pí)> ;=l kde F je zatím neznámá funkce. Pokud znak nabývá právě jedné hodnoty, tj. pokud pí — 1 pro nějaké k a všechna ostatní p j — 0, pak budeme jistě říkat, že variabilita je nulová. Je tedy v každém případě F(l) = 0. Dále budeme požadovat, aby Hx měla následující vlastnost. Pokud je zkoumaný soubor znaků Z tvořen dvojicemi znaků ze souborů X a Y (např. můžeme na statistických jednotkách-osobách sledovat barvu očí a barvu vlasů), je rozumné, aby variabilita znaků z byla součtem variabilit jednotlivých znaků, tj. požadujeme v takovém případě Hz ~ Hx + Hy. Známe relativní třídní četnosti pí pro znaky v souboru X a q j pro znaky souboru Y. Relativní třídní četnosti pro Z jsou nj = - = Piqj nm a požadujeme tedy rovnost (rozsahy součtů jsou zřejmé z kontextu) YpiljFipiqj) = YpiFip^ + ^qjFiqj). i, j i j Díky tomu, že pí aqj jsou relativní četnosti a tedy dávají v součtu 1, můžeme pravou stranu rovnosti přepsat jako (E ii) (E PiFipii) + (E pi) (E ii F(^: a dostáváme vztah ^PiljFiPiqj) = Y2piqj(F(pi) + F(qj)). Je zřejmé, že tomuto požadavku vyhovuje j akýkoli v konstantní násobek logaritmu při kterémkoliv pevně zvoleném základu a > 1 (a lze ukázat, že jiná spojitá řešení F neexistují). Poněvadž je pí < 1, je jistě ln p, < 0. My však chceme variabilitu nezápornou, zvolíme proto za funkci F logaritmickou funkci s násobkem —1. Taková volba také automaticky splňuje náš požadavek F(l) = 0. 531 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Průměrná rychlost je tedy dána harmonickým průměrem (viz 9.3 průměrovaných rychlostí □ B. Vizualizace vícerozměrných dat _j Entropie [_ V předchozích příkladech jsme se věnovali zobrazování jednoho znaku měřeného u více objektů (získané body studentů). Grafická vizualizace dat pomáhá k lepší představě o datech. Jak ale postupovat, pokud u některých, řekněme n objektů, měříme nějakých p znaků, p > 3. Tato měření není možné znázornit způsoby, které jsme se již naučili. Jednou z možných metod, je tzv. metoda hlavních komponent. V této metodě využijeme pojmu vlastního vektoru a vlastních čísel (viz 2.46) výběrové varianční matice (viz 9.38). Zavedme následující označení: Míru variability znaků v nominálním měřítku vyjadřujeme pomocí entropie. Je dána vztahem • náhodné vektory měření x,- = (xn, xi2,.. ■, xin) , i = 1,..., n, • průměr 7-tého znaku m j = i 2~2"=i xij< J = !>■■■>/>> • rozptyl /-tého znaku ss = ^IXiC^y ~ mj)2> j = 1.....P, • vektor průměrů m = (m\,..., mp), • výběrová varianční matice zľľ=i(x' ~~ m)(x; — m)r (všimněme si, že každý sčítanec v předchozí sumě je maticí rozměrů p x p). Varianční matice je symetrická, tudíž má všechna vlastní čísla reálná a její vlastní vektory jsou navzájem kolmé. Volíme-li navíc vlastní vektory jednotkové, pak z toho vyplývá, že vlastní hodnota příslušná nějakému vlastnímu vektoru varianční matice dává rozptyl (velikosti) průmětu daných dat do tohoto směru (promítáme v p-rozměrném prostoru). Cílem této metody je nalézt směr (v p-rozměrném prostoru znaků), pro který je rozptyl průmětů daných dat do něj největší. Tento směr tedy odpovídá tomu vlastnímu vektoru varianční matice, který odpovídá největší vlastní hodnotě. Lineární kombinace daná složkami tohoto vektoru se nazývá 1. hlavní komponenta. Velikost průmětu daných dat do tohoto směru relativně dobře odhaduje data (hlavní komponentu lze chápat jako jeden znak, který nahrazuje p znaků, jde tedy o náhodný vektor o n položkách). Pokud od dat odečteme tento průmět a opět uvážíme směr největší variability takto pozměněných dat, dostáváme 2. hlavní komponentu a opakováním tohoto postupu dostáváme další hlavní komponenty. Směr největší variability je ovšem vlastní vektor varianční matice odpovídající nej většímu vlastnímu číslu (čtenář si laskavě rozmyslí). Směry dalších hlavních y^ln(^) t—1 n yn' kde k je počet tříd ve výběru. Kromě přirozeného logaritmu se často také setkáváme (např. teorii informace) se stejným vztahem j ale s logaritmem při základu 2. Často se také místo Hx pracuje s veličinou í případně totéž s jiným zvoleným základem pro logaritmus. V tomto tvaru se pěkně spočítá, že pro výběr X sk stejně vel-kými třídními četnostmi je sH" = ((i)*)* — nezávisle na velikosti výběru. Na obrázku jsou vyneseny entropie y při základu 2 pro výskyt písmen a a b v desetipísmenných slovech s písmeny a ab, kde x je počet výskytů písmene b. Všimněme si, že pro shodný výskyt, tj. pro pět písmen b, vyjde maximální entropie 1 a skutečně je 21 — 2. 2. Pravděpodobnost Před dalším čtením lze čtenářům vřele doporučit zopakování obsahu čtvrté části první kapitoly (tj. odstavce začínající na straně 17). Tehdy jsme pracovali převážně s tzv. klasickou konečnou pravděpodobností a zavedli jsme základy formalismu, který nyní rozšíříme. Hlavní změnou bude, že náš základní prostor Q už nebude obecně obsahovat jen konečně mnoho prvků (ve skutečnosti nemusí být ani spočetný). Připomeňme, že v našich úvahách o tzv. geometrické pravděpodobnosti na konci čtvrté části první kapitoly jsme potřebovali jako základní prostor pro popis jevu vhodnou část euklidovského prostoru a jevy pak byly vhodně vybrané podmnožiny. Tedy samozřejmě samé nespočetné množiny. Začneme jednoduchým, stále ještě diskrétním, ale nekonečným příkladem, ke kterému se ve výkladu budeme občas vracet. 9.10. Proč nekonečné množiny jevů? Představme si experiment, ve kterém opakovaně házíme mincí dokud nepadne líc. Ptáme se, jaká je pravděpodobnost, že budeme házet alespoň 3-krát nebo právě 35-krát nebo nejvýš 10-krát apod. 532 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY komponent pak odpovídají dalším vlastním vektorům varianční matice (seřazenými podle velikosti vlastních hodnot, které jim přísluší). 9.10. Určete 1. hlavní komponentu následujících jednoduchých dat a vektor, který jejím použitím nahrazuje naměřená data. U pěti osob byla změřena výška, délka malíčku a délka ukazováčku s výsledky zaznamenanými v tabulce (výsledky jsou v centimetrech). Řešení. Martin Michal Matěj Honza Markéta ukazováček 9 11 8 8 8 malíček 7,5 8 6,3, 6 6,5 výška 186 187 173 174 167 Vektory pozorovaných hodnot jsou: xi = (9; 7,5; 186), x2 = (11; 8; 187), x3 = (8; 6; 173), x4 = (8; 6; 174), X5 = (8; 6,5,167). Varianční matice těchto vektorů jsou postupně (0,04 0,14 1,72^ 0,14 0,49 6,02 U,72 6,02 73,96 i (0,641 0,640 3,521^ 0,640 0,640 3,52 13,521 3,52 19,36; f4,840 2,64 21,12> 2,64 1,44 11,52 121,12 11,52 92,16) (0,641 0,640 2,721\ 0,640 0,640 2,72 (2,721 2,72 11,56 J /0,641 0,240 8,321 \ 0,240 0,09 3,12 . \8,32 3,12 108,16/ Výběrovou varianční matice je pak čtvrtina ze součtu těchto matic, tedy / 1,70 1,075 9,35 \ S = 1,075 0,825 6,725 \9,35 6,725 76,30/ Vlastní hodnoty matice S jsou přibližně 2,7, 312,2 a 0,38. Jednotkový vlastní vektor odpovídající největší z nich pak cirka (0,122; 0,09; 0,989). První hlavní komponenta je tedy (185 5; 186,8; 172,4; 173,4; 166,5), tedy se příliš neliší od výšky zkoumaných osob. □ 9.11. Žáci jedné třídy dosáhli následujících známek v různých předmětech: Elementární jevy bychom tedy mohli uvažovat ve tvaru a>k e N>i U joo), které slovně vyjadřujeme „líc padne poprvé právě v ft-tém hodu". Všimněme si, že jsme přidali k — oo, protože formálně nemůžeme vyloučit, že budou vždycky padat pouze ruby mince. Zjevně můžeme takový problém dobře zvládat, když vyjdeme z klasické pravděpodobnosti 0,5 pro obě možné strany mince při jednom hodu, nemůžeme ale v abstraktním modelu omezit celkový počet hodů nějakým pevným přirozeným číslem N. Na druhé straně, očekávaná pravděpodobnost, že padne ve všech prvních (k — 1) pokusech vždy rub v n > k pokusech celkem, je dána zlomkem Ofi—k — = 2-\ 2" kde v čitateli je počet možností příznivých z n nezávislých hodů (tj. možností jak rozestavit libovolně dvě hodnoty do n — k zbývajících pozic) a ve jmenovateli je počet všech možností výsledků. Podle očekávání tato pravděpodobnost nezávisí na zvoleném n a platí IľfcLi 2-i = 1. Musí být proto pravděpodobnost neustálého opakování rubu nulová. Můžeme tedy nyní zavést skutečně pravděpodobnost na základní prostoru Q s elementárními jevy a>k, kterým přiřazujeme pravděpodobnost 2~k. Dostaneme tak pravděpodobnostní prostor ve smyslu následujících definic. K tomuto jednoduchému ilustračnímu příkladu se ještě budeme vracet. 9.11. Jevová pole. Budeme pracovat s neprázdnou pevně zvolenou množinou Q ve které se budou odehrávat všechny výsledky a kterou nazýváme základní -|P^T. prostor. Prvky o> e Q představují jednotlivé možné t%í^^»-J— výsledky. V pravděpodobnostních modelech ale nemusíme připouštět všechny možné podmnožiny coby uvažované jevy. Zejména jednotlivé prvky a> nemusí být mezi jevy. Požadujeme ale, aby uvažované podmnožiny splňovaly axiomy tzv. a-algeber. Níže uvedené axiomy jsou vybrány z větší sady přirozených požadavků v minimální podobě. První vychází z představy, že určitě budeme chtít připustit jev jistý. Druhý je vynucen požadavkem, že chceme vždy mít možnost negovat výskyt jevu, třetí potřebou zkoumat výskyt alespoň jednoho z dané spočetné množiny jevů (např. v případech podobných tomu v předcházejícím odstavci, kdy sice víme, že nikdo nehodí mincí nekonečně krát, nicméně nemůžeme předem omezit počet hodů). ___\ a-ALGEBRY PODMNOŽIN J___ Systém podmnožin A základního prostoru se nazývá jevové pole a jeho prvky se nazývají jevy, jestliže platí • Q e A, tj. základní prostor, je jevem, • je-li A, B e A,pak A\B e A,tj. pro každé dva jevy je jevem i jejich množinový rozdíl, • je-li A; e A, i e /, nejvýše spočetný systém jevů, pak také jejich sjednocení je jevem, tj. U,€/A, e A. Jako obvykle, ze základních axiomů hned vyplývají jednoduché důsledky, které popisují další (intuitivně požadované) vlastnosti ve formě matematických vět. Čtenář by si měl promyslet, že obě vlastnosti skutečně platí. 533 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Zák číslo Matika Fyzika Dějepis a Tělocvik 1 1 1 2 2 1 2 1 3 1 1 1 3 2 1 1 1 1 4 2 2 2 2 1 5 1 1 3 2 1 6 2 1 2 1 2 7 3 3 2 2 1 8 3 2 1 1 1 9 4 3 2 3 1 10 2 3 1 2 1 Určete první hlavní komponentu těchto dat a vektor dat, který jejím použitím nahrazuje původní data. Řešení. Vektory pozorování jsou xi = (1,1,2,2,1),..., xio = (2, 3,1, 2, 1), jim odpovídající varianční matice pak / 1,21 1,10 -0,330 -0,330 0,110 \ 1,10 1, -0,300 -0,300 0,100 -0,330 -0,300 0,0900 0,0900 -0,0300 -0,330 -0,300 0,0900 0,0900 -0,0300 v 0,110 0,100 -0,0300 -0,0300 0,0100 ) / 0,0100 -0,100 0,0701 -0,0300 0,0100 \ -0,100 1, -0,700 0,300 -0,100 0,0701 -0,700 0,490 -0,210 0,0701 -0,0300 0,300 -0,210 0,0900 -0,0300 0,0100 -0,100 0,0701 -0,0300 0,0100 j Výběrová varianční matice je pak 0,99 0,44 -0,078 0,26 -0,01 0,44 0,89 -0,22 0,22 -0,11 -0,078 -0,22 0,45 0,23 0,033 _| komplementy a průniky 0,26 -0,01 \ 0,22 -0,11 0,23 0,03 0,45 -0,078 -0,0778 0,100 / hodnota je pak cca 13,68 vlastní vektor je přibližně Hlavní komponenta je tedy její dominantní vlastní a jí příslušný jednotkový (0,70; 0,65; -0,13; 0,28; -0,07). (1,58; 2,73; 2,13; 2,93; 1,45; 1,93; 4,28; 3,48; 5,26; 3,71) □ Další možnou metodou vizualizace vícerozměrných dat je tzv. shluková analýza, tou se ale zabývat nebudeme. C. Klasická a podmíněná pravděpodobnost V první kapitole jsme se již seznámili s klasickou pravděpodobností, viz 1.13. Pro připomenutí si uvedme některé komplikovanější příklady. 9.12. Alešovi zbylo 2500 Kč z pořádání tábora. Aleš není žádný ňou-ma: 50 Kč přidal z kasičky a rozhodl se jít hrát ruletu na automaty. Aleš sází pouze na barvu. Pravděpodobnost výhry při sázce na barvu Budeme využívat následující důsledky a terminologii: Komplement Ac — Q\ A jevu A je jevem, který nazýváme opačný jev k jevu A. Průnik dvou jevů opět jevem, protože pro každé dvě podmnožiny A, B c £2 platí A \ (Q \ B) = A n B. Hovoříme přitom o současném nastoupení jevů A a B Jevové pole je tedy systém podmnožin základního prostoru uzavřený na konečné průniky, spočetná sjednocení a množinové rozdíly. Jednotlivé množiny A e A nazýváme náhodné jevy (vzhledem k A). 9.12. Pravděpodobnostní prostor. Teď popíšeme, co bude v našem matematickém modelu pravděpodobnost. Nejdříve ale ještě připomeneme názvosloví užívané už v první kapitole. [ Terminologie |___ Používáme následující názvy týkající se jevů: celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 e A se nazývá nemožný jev; jednoprvkové podmnožiny {co} e Q se nazývají elementární jevy; průnikjevů n,-€/A; odpovídá společnému nastoupení jevů A,-, i e I; sjednocení jevů U,€/A, o&poví&ánastoupení alespoň jednoho z jevů Ai,i e I; je-li A n B = 0, pak se jevy A, B e A nazývají neslučitelné, je-li A c B, pak říkáme, že jev A má za důsledek jev B; je-li A e A, pak se jev B = Q \ A nazývá opačný jev k jevu A, píšeme B = Ac. Hned v prvním odstavci této části jsme viděli příklad pravděpodobnosti definované na nekonečné množině elementárních jevů. Obecně budeme pravděpodobnost chápat takto: [ Pravděpodobnost |__, Definice. Pravděpodobnostníprostor je jevové pole A podmnožin základního prostoru Q, na kterém je definována skalární funkce P : A -» M s následujícími vlastnosti: • P je nezáporná, tj. P (A) > 0 pro všechny jevy A, • P je spočetně aditivní, tj. P(U,€/A,) = JZie/ F(A,), pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P říkáme pravděpodobnost na jevovém poli (Q, A). Z definice okamžitě vidíme, že pro opačné jevy platí P(AC) = 1 - P(A). Podobně zůstávají v platnosti důkazy, které jsme o sčítání pravděpodobností odvodili pro konečné systémy (protože vztahy stejně vždy obsahovaly pouze konečně mnoho množin - promyslete si podrobněji!) Zejména tedy platí pro libovolnou množinu lc 534 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY je 18/37. Začíná sázet na 10 Kč a pokud prohraje, v další sázce vsadí dvojnásobek toho, co v předchozí (pokud na to ještě má, pokud ne, tak končí s hrou - byť by měl ještě peníze na nějakou menší sázku). Pokud nějakou sázku vyhraje, v následující sázce hraje opět o 10 Kč. Jaká je pravděpodobnost, že při tomto postupu vyhraje dalších 2550 Kč? (jakmile bude 2550 Kč v plusu, tak končí) Řešení. Nejprve spočítejme, kolikrát po sobě může Aleš prohrát. Za-číná-li s 10 Kč, tak na n vsazení potřebuje 10+20+- • -+10-2"-1 = 10- ( £ 2'' 10- 2" - 1 2-1 10-(2"-l). Jak snadno nahlédneme, číslo 2550 je tvaru 10(2™ — 1) a to pro n = 8. Aleš tedy může sázet osmkrát po sobě bez ohledu na výsledek sázky, na devět sázek by potřeboval již 10(29 — 1) = 5110 Kč a to v průběhu hry nikdy mít nebude (jakmile bude mít 5100 Kč, tak končí). Aby tedy jeho hra skončila neúspěchem, musel by prohrát osmkrát v řadě. Pravděpodobnost prohry při jedné sázce je 19/37, pravděpodobnost prohry v osmi po sobě následujících (nezávislých) sázkách je tedy (19/37)8. Pravděpodobnost, že v těchto osmi hrách vyhraje 10 Kč (při daném postupu) je tedy 1 — (19/37)8. Na to, aby vyhrál 2550 Kč, potřebuje 255 krát vyhrát po desetikoruně. Tedy opět podle pravidla součinu je pravděpodobnost výhry a\ 255 >-m) — Tedy pravděpodobnost výhry je nižší, než kdyby vsadil rovnou vše na jednu barvu. □ 9.13. Samostatně si můžete vyzkoušet spočítat předchozí příklad za předpokladu, že Aleš sází stejnou metodou jako v předchozím příkladě, končí však až v okamžiku, kdy nemá žádné peníze (pokud nemá na vsazení dvojnásobku částky prohrané v předchozí sázce, ale má ještě nějaké peníze, začíná sázet znovu od 10 Kč). S podmíněnou pravděpodobností jsme se setkali již v první kapitole, viz 1.20. 9.14. Z definičního vztahu podmíněné pravděpodobnosti (viz 9.14) odvodte projev A a jev B, který je disjunktním sjednocením jevů B\, B2,..., Bn vztah (9.1) P(A\B) = YJP(MBi)P(Bi\B) jevů A, vztah k k-1 k í = l í = l j=i + \ k-2 k-\ k + J2 PiAinAjnAt)- i=l j=i+l l=j+l -----h + (-i)k-lP(Ai n A2n---n Ak). Stejně zůstává beze změny definice stochasticky nezávislých jevů, která vystihuje představu, že u nezávisle probíhajících jevů se jejich pravděpodobnosti mají násobit. .__\ Stochastická nezávislost j___ Jevy A a B jsou stochasticky nezávislé, jestliže platí P(ACi B) = P(A)P(B). Je samozřejmé, že jev jistý a jev nemožný jsou stochasticky nezávislé na jakémkoliv jiném jevu. Připomeňme, že výměnou jednoho z jevů A, v systému po dvou stochasticky nezávislých jevů A\, A2.....zajev opačný A? dostaneme opět systém stochasticky nezávislých jevů, a platí vztah (1.12) ze strany 23 P(Ai U • • • U Ak) = 1 - P(A\ n • • • n ALk) = = l-(l-P(Ai))...(l-P(Aít)). Základním příkladem pro nás i nadále zůstává tzv. klasická konečná pravděpodobnost, kterou jsme se při tvorbě matematického modelu inspirovali. Připomeňme, že v tomto případě je Q konečná množina, jevovým polem A je systém všech podmnožin v Q a klasická pravděpodobnost je pravděpodobnostní prostor (Q, A, P) s pravděpodobnostní funkcí P : A -» M, |A| P(A) = —. mi To odpovídá představě o relativní četnosti p a jevu A při náhodném výběru prvků z množinu Q. Naše definice pravděpodobnosti zajišťuje rozumné chování na rostoucích či klesajících spočetných řetězcích jevů: 9.13. Věta. Uvažme pravděpodobnostní prostor (Q, A, P) a neklesající řetězec jevů A\ c A2 c____Pak platí .lim P(Ai). '•(l>) ' Pokud je naopak A\ D A2 D A3 D ..., potom platí P(C]A') = lim p(A')- Důkaz. Přepíšeme uvažované sjednocení jevů A = U?^jA; pomocí neslučitelných jevů Ä; = A; \ A;_i, definovaných pro všechna i = 2, 3, ..., a klademe A\ — A\. Potom , 00 n 00 k p(A) = p( y äí j = J2 p(äí) = um p(A|B;)P(B;|B) 536 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY PÍAjIA) = i = \, P(A2\A) = \ = \, P(A3\A) = f.Použi- :ím vztahu (9.2) pak dostáváme tím P(B\A) = = P(B|Ai)P(Ai|A) + P(B\A2)P(A2\A) + P(B\A3)P(A3\A) ■. P(Ai) P(A2) P(A3) = P(B\A1)--^^ + P(B\A2)--±-±f + P(B\A3)- P(A) 4 2 3 12 _ 20 ' 9 + 3 ' 9 + 39 ~ 27' P (A) P(P(A) □ 9.16. Mirek má čtyři sáčky, v každém jsou bílé a černé kuličky a to v těchto počtech: čtyři bílé; tři bílé a jedna černá; dvě bílé a dvě černé; jedna bílá a tři černé. Mirek náhodně jeden sáček vybral a náhodně z něj vytáhl jednu kouli. Byla černá. Mirek tento sáček zahodil a náhodně vybral jeden ze zbylých tří sáčků a z něj náhodně jednu kouli. Jaká je pravděpodobnost, že bude bílá? Řešení. Podobně jako v předchozím příkladě, označíme jako A jev, že Mirek náhodně vybral sáček a z něj náhodně černou kouli. Tento jev disjunktním sjednocením jevů A,, i = 2, 3,4, kde A, je jev, že Mirek vybral i-tý sáček a z něj potom černou kouli. Opět je pravděpodobnost vytažení libovolné (černé) koule stejná a tedy P(A2\ A) = |, P(A3|A) = | = | aP(A4|A) = | = j. Nechť B je jev, že Mirek po zahození jednoho ze sáčků vybral ze zbylých bílou kouli. Pokud vyhodil druhý sáček, tak ve zbylých sáčcích je dohromady 7 bílých koulí a pravděpodobnost, že vytáhne jednu z nich je P(B|A2) = (opět můžeme použít klasickou pravděpodobnost, protože v každém sáčku je stejný počet koulí a tedy má každá stejnou pravděpodobnost, že bude vytažena). Obdobně P(B\A3) = ^ a P(B\A4) = f2 podle (5) je hledaná pravděpodobnost P(B\A) = = P(B\A2)P(A2\A) + P(B\A3)P(A3\A) + P(B\A4)P(A4\A) _ 1_ l_i__8_ 1 i _9_ 1 — 25 12 ' 6 Ť 12 ' 3 + 12 ' 2 36- □ 9.17. Mirek má čtyři sáčky, v každém jsou bílé a černé kuličky a to v těchto počtech: jedna bílá a jedna černá; tři bílé a jedna černá; jedna bílá a dvě černé; jedna bílá a tři černé. Mirek náhodně jeden sáček vybral a náhodně z něj vytáhl jednu kouli. Byla bílá. Mirek tento sáček zahodil a náhodně vybral jeden ze zbylých tří sáčků a z něj náhodně jednu kouli. Jaká je pravděpodobnost, že bude bílá? Řešení. Podobně jako v předchozím příkladě uvážíme jev A, totiž že Mirek vybral náhodně sáček a z něj náhodně bílou kouli jako sjednocení čtyř disjunktních jevů A\, A2, A3 a A4: Mirek vytáhl bílou kouli a před tím zahodil první, resp. druhý, resp. třetí, resp. čtvrtý sáček. Důkaz. Všimněme si nejprve, že jevy A n B\, A n B2, A n Bn jsou rovněž disjunktní. Můžeme tedy psát P(A\B\ U • • • U Bn) ■ P (A n (Bi U • • • U B„)) P(Bi U • • • U B„) _ P ((A D B\) U (A n B2) U • • • U (A n Bn)) ~ P(B) _ Eľ=l P(A n Bi) P(Bj) _ P(Bi) ' P(B) n i=\ □ Uvažujme zvláštní případ B — Q. Pak jevy 5, můžeme interpretovat jako „možné stavy světa", P(A|5,) vyjadřuje pravděpodobnost jevu A, pokud je svět v i-tém stavu, P(5,|Í2) = P(Bi) je pravděpodobnost toho, že svět se v i-tém stavu nachází. Podle předchozího lemmatu platí n P (A) = P(A\Q) = ^P(A|B,)/>(Si). i=\ Tento vztah se nazývá vzorec pro celkovou pravděpodobnost (nebo věta o úplné pravděpodobnosti). 9.15. Bayesova věta. Jednoduchým přepsáním vzorce pro podmíněnou pravděpodobnost dostáváme P(A n B) = P(B n A) = P(A)P(B\A) = P(B)P(A\B). Odtud okamžitě plyne velice důležitý důsledek: .___J Bayesův vzorec j___ Věta. Pro pravděpodobnost jevů A a B platí P(A)P(B\A) (9.3) P(A\B) = P(B) . Pak (9.4) P(A\B) P(A)P(B\A) P(A)P(B\A) + P(AC)P(B\AC) Prvnímu tvrzení se také říká vzorec pro inverzní pravděpodobnosti, zatímco druhé tvrzení je označováno jako 1. Bayesův vzorec. Důkaz. První tvrzení je jen přepsáním výpočtu před větou. Abychom dostali druhé tvrzení všimněme si, že P(B) = P(B n A) + P(B n Ac), proto můžeme podle vzorce pro celkovou pravděpodobnost dosadit P(B) = P(A)P(B\A) + P(AC)P(B\AC) do vzorce pro inverzní pravděpodobnost a dostáváme právě druhé tvrzení věty. □ Bayesův vzorec bývá často formulován v lehce obecnějším tvaru, který se dokáže stejným způsobem jako (9.4): Nechť je základní prostor Q sjednocením disjunktních jevů Ai,... A„. Pak pro libovolné i e {1, ..., n) platí (9.5) P(Ai\B) = P(B\Aí)P(Aí) E"=l P{B\Ai)P(Ai) ■ 537 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Pravděpodobnost vytažení bílé koule z prvního sáčku je P (A i) = i • i (jev A\ je dán tím, že současně nastaly dva nezávislé jevy a to, že vytáhl první sáček a že z prvního sáčku vytáhl bílou kouli), podobně P (A2) = P(A3) = 1.1, P(A4) = i-i. P(A) = />(Ai) + P(A2) + P(A3)+ +P(A4) = Všimněme si, že pravděpodobnost P (A) nemůžeme počítat klasickou pravděpodobností, tedy prostým podělením počtu bílých koulí ku počtu všech koulí, protože například pravděpodobnost vytažení dané koule v prvním sáčku je dvojnásobná oproti vytažení dané koule ze čtvrtého sáčku. Pro podmíněné pravděpodobnosti pak platí P(Ar\A) = P(AO/P(A) = P(A2|A) = |, P(A3|A) = 2f, P(A4|A) = Jj. Označíme ještě písmenem B jev, že Mirek po zahození jednoho ze sáčků vytáhne bílou kouli a znovu budeme chtít použít vztah (5). Zbývá ještě dopočítat P(B|A;), i = 1,... 4. Jev P(B\ Ai) rozdělíme na tři disjunktní jevy B2, B3, B4, totiž že druhá vytažená koule byla z druhého, resp. třetího, resp. čtvrtého sáčku. Celkem P(B\AO = P(B2\Al) + P(B3\AO + P(B4\A0 = 4 9' Obdobně 13 13 11 11 Š'4 + 3'3 + 3'4 11 11 11 P(B|A2) =----h----h---= —, 3 2 3 3 3 4 36 11 13 11 1 P(B|A3) =---+---+---= -, 3 2 3 4 3 4 2 11 13 11 19 P(B|A4) =----h----h---= —. v 1 ' 3 2 3 4 3 3 36 Celkem pak P(B\A) = P(B|Ai)P(Ai|A) + P(B|A2)P(A2|A)+ + P(B|A3)P(A3|A) + P(B|A4)P(A4|A) = — —.LI TI + 36 ' 22 + 2 2 19 3 _ 19 TI + 36 ' 22 ~ 44' □ 9.18. Dva střelci vystřelí každý dvě rány na terč. První má pravděpodobnost zásahu 80%, druhý 60%. V terči se našly dvě rány. Jaká je pravděpodobnost, že obě patří prvnímu střelci? Řešení. Pravděpodobnost zásahu prvního střelce jsou tedy 4/5, druhého 3/5. Uvažme dva jevy: A ... v terči se našly dva zásahy patřící prvnímu střelci, B ... v terči se našly dva zásahy. Dle zadání úlohy máme zjistit P(A\B). Rozdělme jev B na šest disjunktních jevů podle toho, který střelec a který svůj výstřel do terče umístil. Jevy uvedeme v tabulce a u každého navíc spočítáme pravděpodobnost toho, že nastane. Uvědomíme si při tom, že každá 9.16. Poznámky. Nyní se můžeme snadno vypořádat s úvodní otázkou z minulého odstavce. Dotaz si nejprve malinko upřesníme. Uvažujeme jev A představující „student u zkoušky uspěl" a jev B, který říká „student byl zkoušen z předmětu X". Předpokládáme přitom, že pravděpodobnosti zkoušení z obou předmětů jsou stejné, tj. P(B) — P(Bř) — 0,5. Zatímco hledaná pravděpodobnost P(B\A) je zatím spíše nejasná, pravděpodobnost P(A\B) — 0,4 je dána přímo v zadání. To je typický případ použití Bayesových vzorců. Když přitom použijeme druhý z nich, vůbec nemusíme počítat P (A): P(B)P(A\B) P(B\A) P(B)P(A\B) -i 0,5-0,4 P(BC)P(A\BC) _ 1 ~~ 3' 0,5-0,4 + 0,5-0,8 Abychom si přiblížili roli apriorní pravděpodobnosti hypotézy, podívejme se ještě na jeden příklad. Řekněme, že testy připravenosti a znalostí, na základě kterých jsou studenti přijímáni na univerzitu, mají následující spolehlivost v testování inteligence osob: 99% inteligentních osob má pozitivní výsledek testu, zatímco u neinteligentních uchazečů má 0,5% z nich pozitivní výsledek testu. Chceme zjistit, s jakou pravděpodobností je náhodně vybraný student na univerzitě inteligentní. Máme tedy jev A „náhodně zvolená osoba je inteligentní" a jev B „osoba prošla testem s pozitivním výsledkem". Dle Baye-sova vzorce můžeme opět rovnou spočíst pravděpodobnost, že nastal jev A za předpokladu, že nastal jev B. Musíme jen dodat všeobecnou pravděpodobnost p = p(A), že náhodně zvolený uchazeč o studium je inteligentní. p ■ 0,99 P(A\B) =--—:-. p ■ 0,99 + (1 - p) ■ 0,005 V následující tabulce je spočten pro různé hodnoty p vyjádřené v jednotkách promile. V prvním sloupci tedy je výsledek za předpokladu, že je mezi uchazeči o studium každý druhý inteligentní atd. p | 500 100 50 10 1 0,1 P(A\B) I 0,99 0,96 0,91 0,67 0,17 0,02 Pokud tedy je každý druhý uchazeč inteligentní, máme na univerzitě používající náš test 99% inteligentních studentů. Pokud ale naší představě o inteligenci odpovídá jen 1% populace a uchazeči jsou dobrým náhodným vzorkem, pak už máme na univerzitě jen zhruba dvě třetiny inteligentních studentů ... Představme si ale, že obdobné testování provedeme při plošném testování výskytu nějaké nemoci, třeba HIV Dejme tomu, že máme stejně citlivý test jako výše a prověříme jím o přestávce mezi přednáškami všechny přítomné studenty. V tomto případě bychom měli předpokládat, že parametr p bude obdobný jako u celé populace, tj. řekněme jeden nakažený z 10000 obyvatel, což odpovídá poslednímu sloupci v tabulce. Pak ovšem je výsledek testu katastroficky nespolehlivý. Jen asi u 2 procent pozitivně otestovaných se jedná o skutečně nemocné studenty! Všimněme si, že problém je zapříčiněn jakýmkoliv malým výskytem pozitivních výsledků u zdravých osob. 1 kdybychom zlepšili test tak, že bude na 100% účinný při testu pozitivní osoby, neovlivníme skoro vůbec výsledné pravděpodobnosti v tabulce. Při lékařské diagnostice vzácných chorob je při pozitivním výsledku testu nutné provést další test. Přitom výsledek prvního testu 538 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY uvažovaná střelba se skládá ze čtyř nezávislých jevů: výsledek střelby hráče A či S v prvním či druhém výstřelu. V tabulce značíme zásah jedničkou, minutí terče nulou. 1. střelec 2.střelec pst nastoupení jevu Si 0 1 0 1 14 2 3 5 5 5 5 B2 0 1 1 0 24 252 B3 1 0 1 0 24 252 BA 1 0 0 1 24 252 B5 1 1 0 0 64 252 B6 0 0 1 1 9 252 Sečtením pravděpodobnosti těchto disjunktních jevů dostáváme: P(B) = J2p(Bi) = 169/625. Nyní můžeme přistoupit k výpočtu podmíněné pravděpodobnosti podle vztahu z odstavce 9.14: P(AnB) = PiBj) = j| = _W P(B) P(B) I 169 ' □ P(A\B) 9.19. Hodíme mincí. Pokud padne líc, dáme do krabice bílou kulečníkovou kouli, pokud padne rub, dáme tam kouli černou. To opakujeme n -krát. Potom poslepu vybereme z krabice jednu kouli a nevrátíme ji zpět. Tato vybraná kouleje bílá. Určete pravděpodobnost, že další poslepu vybraná koule je černá. Řešení. V zadání není řečeno, o jakou minci jde. Aby úloha vůbec měla nějaký rozumný smysl.budeme předpokládat, že výsledky hodů touto mincí jsou nezávislé a že existuje pravděpodobnost padnutí lícové strany. Tuto pravděpodobnost označíme p. Ze zadaného faktu, že první vytažená koule je bílá, usoudíme, že p > 0. Poznámku o tom, že koule jsou kulečníkové, budeme chápat tak, že jednotlivé koule jsou hmatem nerozlišitelné a tedy vyjádření „vybereme poslepu" označuje totéž, co „vybereme náhodně". Jev „koule v krabici je bílá" odpovídá jevu „v příslušném hodu mincí padl líc". To znamená, že pravděpodobnostní prostor „náhodné vytažení koule z krabice" je izomorfní pravděpodobnostnímu prostoru „hod mincí". Z předpokládané nezávislosti výsledků jednotlivých hodů mincí plyne nezávislost barev tažených koulí. Touto úvahou dostáváme, že hledaná pravděpodobnost je rovna 1 — p. Je provedená úvaha přesvědčivá? Očekáváme přece, že v plné krabici je np bílých an(l — p) černých koulí (přesněji řečeno, celé části těchto hodnot). Jednu bílou kouli jsme odstranili, takže relativní P (A | B) má roli apriorní pravděpodobnosti P (A) při druhém testu. Tento postup umožňuje „kumulovat zkušenost". V obou případech tedy musíme při přípravě testu dbát na to, abychom si zajistili přiměřeně vysoké p. U procesu přijímání studentů na univerzitu to asi bude dobrý marketing univerzity, který zajistí, aby se neinteligentní osoby hlásily v daleko menší míře, než je jejich výskyt v populaci. U testování chorob nejspíš půjde o souběh dalších skutečností a činností (např. testování HIV pozitivitu pouze u rizikových skupin obyvatelstva a podobně). 9.17. Borelovské množiny. Vraťme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu. Ten je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou. Na jedné straně máme pouze konečný počet studentů a připustili jsme pouze konečný počet možných bodových hodnocení práce studenta za semestr (např. celá čísla od 0 do 20). Zároveň ale není patrně vhodné představovat si výsledky jednotlivých studentů jako analogii nezávislého házení pravidelnou kostkou. Jednak neexistuje pravidelný 21-stěn, ale hlavně by to byla skutečně divně vedená přednáška. Na základním (konečném) prostoru Q všech studentů máme prostě definovánu funkci bodového ohodnocení X : Q -» R, která má tu vlastnost, že můžeme modelovat pravděpodobnosti příslušnosti její hodnoty do předem zvoleného intervalu při náhodném výběru studenta. Např. můžeme chtít modelovat pravděpodobnost, že student uspěl s hodnocením A nebo B. Pokud známe výsledky všech studentů, snadno dostaneme statistiky celého souboru, např. výběrový průměr X a směrodatnou odchylku 5^. Patrně bychom od rozumně vedené přednášky a dobrých studentů očekávali, že nej vyšší pravděpodobnost výsledku bude ležet někde uprostřed škály v „úspěšném intervalu", zatímco ideální výsledek plného bodového zisku příliš pravděpodobný nebude. Stejně tak bude příliš mnoho hodnot X v intervalu neúspěšných hodnot na většině univerzit bráno jako výrazný neúspěch přednášejícího. Často ale v podobných situacích máme k dispozici jen náhodně vybraných několik studentů a známe příslušné statistiky jen pro tento vybraný vzorek. Pak se můžeme dívat na příslušné hodnoty jako na vektor (X\, ..., Xk) a bude nás opět zajímat jakákoliv funkce na tomto vektoru (např. některá z výše zmíněných statistik). Je to typický příklad tzv. náhodných veličin a náhodných vektorů, jak je budeme definovat v dalším odstavci. Budeme chtít umět diskutovat pravděpodobnost, že hodnota X padne do kteréhokoliv intervalu (a,b) c R s reálnými čísly a, b a uzavřenými nebo otevřenými konci intervalu. Případně budeme potřebovat totéž pro vícerozměrné intervaly vl'a vektory (X\, ..., Xk). Zkusme tedy uvažovat číselné veličiny X na nějakém základina-- ním prostoru, tj. obyčejné funkce X : Q -» R. Chceme pracovat s pravděpodobnostmi příslušnosti 5|fp^V hodnoty X do předem zadaného intervalu. Musíme -MV^m^— proto uvést do souladu požadavky na pravděpodobnostní prostor všech jevových polí s vlastnostmi takových funkcí: _--1 Borelovské množiny v R* {---- Na prostoru R* uvažujme nejmenší jevové pole B obsahující všechny ^-rozměrné intervaly. Množinám v B říkáme Borelovské množiny na R*. Speciálně pro k — 1 půjde o všechny množiny, 539 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY četnost černých koulí o něco vzroste a proto i pravděpodobnost vytažení černé koule bude větší než 1 — p. Než budete číst dále, pokuste se uhodnout, zda pravděpodobnost vytažení černé koule bude 1 — p nebo větší, případně jak tuto pravděpodobnost ovlivní hodnota n (počet koulí v krabici před vytahováním). Úlohu budeme nyní řešit poněkud sofistikovaněji. Označme S, jev „v plné krabici je i bílých koulí" (zřejmě i e {0,1, 2,..., n}), A jev „první vytažená kouleje bílá" a C jev „druhá vytažená kouleje černá". Jev S, je vlastně jevem, že v sérii n hodů mincí padl líc i-krát, tedy P (Bi) p'h-pT Podmíněná pravděpodobnost vytažení bílé koule za podmínky, že v krabici je právě i bílých koulí, je rovna P(A\Bt) = -. n Zajímá nás pravděpodobnost jevu C když víme, že nastal jev a, tedy P(c\a). Poněvadž jevy S, jsou neslučitelné, jsou neslučitelné i jevy C n Bi. Současně platí C = [J"=0(c n S,) a toto sjednocení je disjunktní. Proto můžeme psát P(c\a) = p í y (c n Bí)\a\ = y pj}-1 = ^í>(cn(Anso) P (A) P (A) j2p(AnBi)p(c\AnBi) i — J2 P(Bí)P(A\Bí)P(.C\A n Bi). P (A) Za pravděpodobnost P (A) můžeme ještě dosadit ze vzorce pro celkovou pravděpodobnost a dostaneme P(C\A) = - j:P(Bi)P(A\Bi)P(C\AnBi) =o P(A) (9.2) 2ZP(Bi)P(A\Bi)P(C\AnBi) i=0 £p(Bi)P(A\Bi) i=0 Tato formulka bývá někdy nazývána 2. Bayesův vzorec; obecně platí za předpokladu, že prostor Q je disjunktním sjednocením jevů S,. které ze všech intervalů obdržíme konečnými průniky a nejvýše spočetnými sjednoceními.1 9.18. Náhodné veličiny. Nyní už máme všechno připraveno pro definici náhodných veličin a náhodných vektorů. Poznamenejme již předem, že pro klasickou konečnou pravděpodobnost je náhodnou veličinou každá reálná funkce X : Q -» R. Skutečně, na konečné množině Q nabývá X jen konečně mnoho hodnot a každá podmnožina v Q je jevem. _ náhodné veličiny a vektory__ L Definice. Náhodná veličina X na pravděpodobnostním prostoru (Q, A, P) je taková funkce X : Q -» R, že vzor X~1 (E) patří do A pro každou Borelovskou množinu B e B na R. Reálná funkce Px (B) — P(X~l (£)) definovaná na všech intervalech B c R se nazývá rozdělení (pravděpodobnosti) náhodné veličiny X. Náhodný vektor X = (X\, ..., Xk) na (Q, A, P)je k-tice náhodných veličin X,■ : Q —> R definovaných na stejném základním pravděpodobnostním prostoru (Q, A, P). Jestliže vybereme intervaly I\,..., Ik v R a definujeme množinu B = I\ x • • • x Ik, pak jistě existuje pravděpodobnost současného výskytu všech k jevů X, e 7,. Díky aditivitě funkce P tedy bude, obdobně jako ve skalárním případě, existovat reálná funkce Px(B) — P(X~l(B)) definovaná na všech ^-rozměrných intervalech B c R*. Nazýváme ji rozdělení (pravděpodobnosti) náhodného vektoru X. 9.19. Distribuční funkce. Rozdělení náhodných veličin zadáváme nejčastěji pomocí pravidla, jak roste pravděpodobnost s přírůstkem intervalu B. Definice náhodné veličiny zajišťuje, že pro všechny intervaly I s krajními body a, b, — oo < a < b < oo, existuje pravděpodobnost jevu P(I). Budeme ji zapisovat stručně P(a < X < b), resp. P(X < b) pokud je a = — oo, pro otevřený interval I a obdobně pro intervaly uzavřené nebo z jedné strany uzavřené. Ve speciálním případě jediné hodnoty píšeme P(X = a). Podobně u náhodného vektoru X = (X\, ..., Xk) píšeme stručně P (a i < X\ < b\,...,ak < Xk < bk), pro současné nastoupení jevů, kdy hodnoty X, padnou do uvedených intervalů (které mohou být také uzavřené neohraničené apod.). [ Distribuční funkce |_^ Definice. Distribuční funkcí náhodné veličiny X je funkce Fx R -> [0, 1] definovaná pro všechny x e R vztahem2 Fx(x) = P(X < x). Distribuční funkcí náhodného vektoru (Xi, ..., Xk) je funkce Fx : Rř -» R definovaná pro všechny x = (jci.....xk) e R vztahem Fx{x) = P(Xx 1. Nyní můžeme vypočítat j^PiBOPiAm = J2 (") p''(i - p)"~' er (;:1)!,,p-d-Pr n-1 ^ i'!(ři -P'+1(1-P)" i=0 ■E i-l)!' ""^p-a-p)"-1-" ■■ p{p + v - p))"~l = p, J2P(Bi)P(A\Bi)P(C\AnBi) = i=0 i=0 n-1 P'(l-P)"~' i=l n-2 i-l)! Pi+1(l - p) (1 - p)» = ^ř!(n_2-0! =p(i-p)E(B7V p(l-p), n>l 0, n = 1, takže po dosazení do druhého Bayesova vzorce dostaneme hledanou pravděpodobnost ^ (C| A) 0, n = 1, 1 — p, n > 1. Jednoduchá úvaha o izomorfii pravděpodobnostních prostorů tedy dala správný výsledek; výpočet pouze upozornil na triviální případ n = 1. □ 9.20. V jedné vědomostní soutěži bylo hlavní výhrou Ferrari 599 GTB Fiorano. Soutěžící, který se dostal do posledního kola, byl přiveden před tři stejná vrata. Podmínkou získání výhry bylo správně uhodnout, za kterými vraty se automobil nachází. Soutěžící jedna vrata označil a poté asistent otevřel ta z neoznačených vrat, za nimiž byla koza. Poslední soutěžní otázkou bylo, zda soutěžící chce svůj tip měnit. Je-li z kontextu zřejmé, které veličiny se distribuční funkce týká, její označení vypouštíme, tj. píšeme F(x). Další věta nás ujistí, že pro každou náhodnou veličinu umíme výhradně z distribuční funkce počítat pravděpodobnosti, že hodnoty X padnou do jakéhokoliv intervalu, tj. ve skutečnosti do jakékoliv Borelovské množiny B. 9.20. Věta. Pro každou náhodnou veličinu X má její distribuční funkce F : R -» [0, 1] následující vlastnosti (1) F je neklesající funkce; (2) F má v každém bodě x e R limitu deva i limitu zprava; (3) F je zleva spojitá; (4) v nevlastních bodech má F limity (9.6) lim F(x) = 1, lim F(x) = 0; (5) pravděpodobnost, že X nabývá právě hodnotu x je dána (9.7) P(X = x) = lim F(y) - F(x). y^x+ (6) Distribuční funkce náhodné veličiny má vždy nejvýše spočetně mnoho bodů nespojitosti. Důkaz. Důkaz spočívá ve vcelku jednoduchým přímých výpočtech. Zejména si uvědomme, že jevy a 0 konvergující k 0 a uvažujme jevy A„ zadané požadavkem X < x — r„. Sjednocení všech těchto jevů je právě jev A zadaný nerovností X < x. Jev A přitom pochopitelně nezávisí na volbě posloupnosti r„. Podle prvního tvrzení věty 9.13 tedy bude P (A) - : lim P(An). To však podle testu konvergence funkcí pomocí posloupností (viz str. 256) znamená, že limita zleva funkce Fx v bode x existuje a je rovna P (A). To dokazuje polovinu tvrzení (2) a zároveň tvrzení (3). Zcela obdobně můžeme pomocí zvolené posloupnosti čísel r„ definovat jevy A„ odpovídající hodnotám X„ < x + r„. tentokrát máme nerostoucí řetězec A\ D A2 D ... a jejich průnikem bude jev X < x. Pro pravděpodobnost jevu A platí, podle druhé vlastnosti z věty 9.13, P(A) = lim P(An) = P(X < x), což ověřuje že limita zprava funkce F v bodě x existuje. Zároveň jsme přitom ověřili i vlastnost (5). Limitní hodnoty z vlastnosti (4) věty se odvodí zcela obdobně s použitím věty 9.13, jak jsme výše spočetli limity zleva a zprava výše. V prvém případě půjde o jevy A„ zadané pomocí X < r„, pro jakoukoliv rostoucí posloupnost r„ —> oo. Jejich sjednocením bude jev jistý Q. Ve druhém případě půjde o jevy A„ zadané pomocí X < rn pro jakoukoliv klesající posloupnost r„ —> — oo a jejich průnikem bude jev nemožný. 541 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení. Nevyslovený předpoklad úlohy je ten, že soutěžící zmíněný automobil chce získat. Nejdříve zkuste ověřit, jak spolehlivou intuici pro náhodné jevy již máte. Můžete uvažovat například takto: „Za jedněmi ze zbývajících dvou vrat je Ferrari, za každými z nich se stejnou pravděpodobností. Proto je jedno, která vrata jsou označená a nemá smysl svůj tip měnit." Nebo: „Pravděpodobnost, že jsem si hned na začátku tipnul správně je |. Na této pravděpodobnosti ta ukázaná koza nic nezmění, takže pravděpodobnost, že jsem tipoval špatně je |. Proto když tip změním, tak s pravděpodobností | vyhraji." Změnit tip je rozumné pouze v případě, že pravděpodobnost automobilu za neoznačenými a neotevřenými vraty je větší, než jeho pravděpodobnost za vraty označenými. Pro výpočet si označíme jevy H „původní tip je správný", A „tip byl změněn" a C „soutěžící vyhrál". Zajímají nás tedy pravděpodobnosti P(C\ A) a P(C\AC). Soutěžící nejprve označil jedna vrata ze tří, Ferrari je jen za jedněmi z nich. Tedy P(H) = \, P(W) = l-\ = \. Změnu tipu považujeme zajev nezávislý na tipu původním, tedy P(A\H) = P(A\HC) = P (A), P(AC\H) = P(AC\HC) = P(AC). Pokud původní tip byl správný a soutěžící rozhodnutí změnil, pak nemohl vyhrát; naopak, pokud původní tip byl špatný a soutěžící rozhodnutí změnil, vyhrál jistě, tedy P(C\A n H) = 0 = P(C\AC n Hc), P(C\AC n H) = 1 = P(C\A n Hc). Ze druhého Bayesova vzorce (||9.2||) nyní dostaneme P (C| A) = P(H)P(A\H)P(C\A HH) + P(HC)P(A\HC)P(C\A n Hc) P (A) =P(HC) = -a analogicky P(C\AC) = P(H)P(AC\H)P(C\AC D H) + P(HC)P(AC\HC)P(C\AC D Hc) P(AC) --P(H) ■ 1 Dostali jsme, že P(C\ A) > P(C\ Ac), a proto je výhodné změnit tip. □ 9.21. Máme dva sáčky. V jednom jsou dvě bílé a dvě černé v druhém jedna bílá a dvě černé. Náhodně vybereme sáček a z něj postupně (bez Zbývá dokázat poslední tvrzení. Podle již dokázaných vlastností jsou body nespojitosti distribuční funkce právě ty hodnoty x, ve kterých má náhodná veličina tuto hodnotu s nenulovou pravděpodobností, tj. P(X — x) 0. Označme nyní M„ množinu těch bodů x, pro které je P(X — x) > i. Evidentně je množina M všech bodů nespojitosti dána jako sjednocení M — U^i2. Protože je ale součet pravděpodobností disjunktních jevů vždy nejvýše jedna, nemůže obsahovat Mn více než n — 1 prvků. Je tedy M spočetným sjednocením konečných množin a je tedy sama spočetná. □ Nyní je zřejmé, že můžeme z distribuční funkce snadno spočíst pravděpodobnost, že hodnota náhodné veličiny padne do jakéhokoliv daného intervalu. Zadává tedy skutečně distribuční funkce F x celé rozložení pravděpodobnostní náhodné veličiny X. 9.21. Diskrétní a spojité náhodné veličiny. Náhodné veličiny se chovají zásadně odlišně podle toho, jestli je veškerá sfíř nenulová pravděpodobnost „soustředěna do něko-''" • lika konečných hodnot" nebo je naopak „spojitě rozprostřena" po (části) reálné osy. | Diskrétní náhodné veličiny |_, Jestliže náhodná veličina X na pravděpodobnostním prostoru (Q, A, P) nabývá jen konečně mnoha různých hodnot x\,X2,...,xn e R nebo případně spočetně mnoha reálných hodnot x\, X2, ..., říkáme, že jde o diskrétní náhodnou veličinu. Definujeme pak pravděpodobnostní funkci f (x) vztahem fix)-- PiX = xí) 0 x — xt jinak. Protože je pravděpodobnost spočetně aditivní a jednotlivé jevy X = xí jsou disjunktní, je součet všech hodnot /(x,) dán buď konečným součtem nebo absolutně konvergentní řadou i. Pro rozdělení pravděpodobnosti veličiny X platí PiX-\B)) = J2 fixi) xi ě B a tedy zejména je distribuční funkce tvaru Xf d. Oblast možných jevů, možných dvojic (a, d), je obdélník jt/2 x 1/2. Příznivé jevy, tedy ty dvojice (a, d), pro které 1/2 sin a > d, odpovídají bodům v obdélníku ležícím pod křivkou //2sina (přičemž za proměnnou považujeme a, kterou vynášíme na osu x). Obsah útvaru je podle 6.35 _J Spojité náhodné veličiny J_ '2 / / - sin a da Jo 2 2 Hledanou pravděpodobnost tak určíme (viz 1.21) jako 2- • í- 7t' 2 2 □ Následující (známý) příklad, ve kterém rovněž využijeme geometrickou pravděpodobnost, ilustruje, že si musíme dávat velký pozor na to, co považujeme za „zřejmé" 9.23. Bertrandův paradox. Určete pravděpodobnost toho, že náhodně vybraná tětiva v dané kružnici bude mít délku větší, než je strana rovnostranného trojúhelníka vepsaného do této kružnice. Řešení. Ukážeme tři různé způsoby, jak „tuto" pravděpodobnost odvodit. 1) Každá tětiva je jednoznačně dána svým středem. Její náhodný výběr je tedy dán náhodným výběrem jejího středu. Tětiva je delší než strana vepsaného rovnostranného trojúhelníka, leží-li její střed uvnitř soustředné kružnice o polovičním poloměru. Střed vybíráme „náhodně" z celé kružnice, je tedy pravděpodobnost, že padne do vnitřního kruhu dána poměrem obsahů těchto kruhů, tedy je to \. 2) Oproti předcházejícímu odvození provedeme úvahu, že hledaná pravděpodobnost by měla být stejná, omezíme-li se pouze na tětivy Náhodná veličina X, pro kterou existuje její hustota pravděpodobnosti f splňující Fx(b) = f f(x)dx, J — CO se nazývá spojitá náhodná veličina. F(r) = Všimněme si, že distribuční funkce F(x) spojité náhodné veličiny X je vždy diferencovatelná a její derivace se rovná hustotě pravděpodobnosti X, tj. platí F'(x) = f(x). Samozřejmě se také můžeme setkat se smíšeným chováním ^1° , u veličin, které mají část pravděpodobnosti rozprostřenu "d^> spojitě, některých hodnot ale nabývají s nenulovou r\äK/ pravděpodobností. Představme si třeba chaotického T'1 ' přednášejícího, který s pravděpodobností p zůstává stát na místě za řečnickým pultíkem, jakmile se však odtud pohne, je jeho pozice v kterémkoliv jiném místě na stupínku stejně pravděpodobná. Bude tedy příslušná náhodná veličina udávající jeho polohu mít distribuční funkci (zavádíme si souřadnice tak, že pultík je v pozici 0 a posluchárna je ohraničena hodnotami ±1) 0 je-li ř < — 1 i^(ř + l) je-li t e (-1,0) p + ^-(t + l) je-li t e [0,1) 1 je-li t > 1. Distribuční funkce takovýchto veličin můžeme často přímo vyjadřovat pomocí Riemannova-Stieltjesova integrálu F(t) — p_ f(x)d(g(x)), který jsme zavedli v odstavci 6.48 na straně 369. V předchozím příkladu bychom zvolili třeba f (x) — l a — 1 pro x < — 1 ^~Y~x pro — 1 < x < 0 ij^jt + p pro 0 < x < 1 . ±±£ pro x > 1. Připomeňme, že distribuční funkce nemůže mít více než spočetně mnoho bodů nespojitosti. 9.22. Několik diskrétních rozdělení. Požadavky na vlastnosti fépt rozdělení náhodných veličin zpravidla vychází z mo-**yS^_. delovaných situací a ve skutečnosti pak ani nemáme ' "ätíŕgsT moc možností, j ak rozdělení pravděpodobnosti může C2Ž2— vypadat. Uvedeme přehled nejjednodušších diskrétních rozdělení. .___| Degenerované rozdělení {___ g{x) = ■- ji se Rozdělení odpovídající konstantní náhodné veličině X -nazývá degenerované rozdělení Dg(n). Jeho distribuční funkce Fx a pravděpodobnostní funkce f x jsou dány Fx(t) = t < /j, t > /i fx(ň = 1 t — ji 0 jinak Nyní popišme pokus s pouze dvěma možnými výsledky, kterým budeme říkat zdar a nezdar. Pokud má zdar pravděpodobnost p, pak nezdar musí mít pravděpodobnost 1 — p. 543 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY daného směru. Středy tětiv jednoho směru leží v dané kružnici na jediném jejím průměru daného směru. Středy vyhovujících tětiv pak jsou ty z tohoto průměru, které leží uvnitř vnitřní kružnice (viz předchozí bod), tedy na jejím průměru daného směru. Poměry průměrů kružnic jsou 1 : 2, hledaná pravděpodobnost je tedy \. 3) Tětiva kružnice je též určena svými krajními body (ležícími na kružnici). Pokud jeden z krajních bodů tětivy, řekněme A, fixujeme (opět vzhledem k symetrii by to nemělo ovlivnit výslednou pravděpodobnost), tak druhý, aby tětiva vyhověla požadavku, musí ležet na kratším oblouku BC, kde ABC je rovnostranný trojúhelník vepsaný do dané kružnice. Délka tohoto oblouku činí jednu třetinu z obvodu kružnice. Hledaná pravděpodobnost je tedy |. Jak je možné, že nám vyšla pokaždé jiná pravděpodobnost? Zadání úlohy je totiž nejednoznačné. Je nutné specifikovat, co to znamená „náhodný" výběr tětivy. Každý ze tří pravděpodobností popisuje hledanou pravděpodobnost při vybírání tětivy popsaným způsobem. Tyto způsoby nejsou ekvivalentní, což kromě spočtené pravděpodobnosti potvrzuje i rozložení středů takto vybíraných tětiv: v prvním případě jsou středy rovnoměrně rozmístěny uvnitř celé kružnice. Ve druhém a ve třetím případě je větší koncentrace středů u středu dané kružnice. □ 9.24. Dvě obálky. V každé ze dvou obálek je umístěna určitá suma peněz. Víme, že v jedné obálce je dvojnásobek toho, co v druhé. Můžeme si zvolit jednu z obálek (a vzít si obnos v ní). Po volbě jsme dotázáni, jestli nechceme výběr změnit (a vzít si sumu z druhé obálky). Je výhodné svoje rozhodnutí změnit? Řešení. Na první pohled musí být úplně jedno, kterou obálku zvolíme. Pravděpodobnost, že si vybereme tu s větším obnosem je 1 /2, nemá tedy smysl rozhodnutí měnit. Provedme však následující úvahu: v prvně zvolené obálce je suma a. Ve druhé je tedy obnos a/2, či 2a, a to každý s poloviční pravděpodobností. Pokud tedy změníme své rozhodnutí, tak s pravděpodobností 1/2 získáme obnos a/2, s pravděpodobností 1/2 obnos 2a, tedy průměrně 1 a 1 5 ---1—2a = -a. 22 2 4 Bylo by tedy výhodné volbu změnit. Co je špatného na této úvaze? Je to několik věcí. Je to průměrování fiktivních výher a/2 a 2a. Situace je totiž dána dvěma obálkami s výhrami a a 2a. Při změně obálky budou naše výhry opět buď a (pokud jsme si na počátku vybrali obálku se sumou 2a), nebo 2a (pokud jsme si na poprvé vybrali Alternativní rozdělení Rozdělení náhodné veličiny X s dvěma hodnotami 0 pro nezdar a 1 pro zdar, přičemž zdar nastává s pravděpodobností p, říkáme alternativní rozdělení A(p). Jeho distribuční a pravděpodobnostní funkce jsou tvaru: Fx(t) = t < 0 0 < t < 1 t > 1 f x (t) = t = 1 t = 0 jinak. Uvažme dále rozdělení veličiny X odpovídající n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy zjevné, že pravděpodobnostní funkce bude mít nenulové hodnoty právě v celých číslech 0, ..., n odpovídajícím celkovému počtu úspěchů v pokusech (a nezáleží nám na pořadí). ____| Binomické rozdělení [__, Binomické rozdělení Bi(n, p) má pravděpodobnostní funkci fx(f) ■ (")/(! ~P)"~' t e {0, 1,...,«} 0 jinak Na obrázku jsou pravděpodobnostní funkce pro Bi(50, 0,2), a Bi(50, 0,9). Rozdělení pravděpodobnosti odpovídá intuici, že nejvíce výsledků bude blízko u hodnoty np: Uvažujme nezávisle prováděné pokusy s alternativním rozdělením pravděpodobnosti A(p) jako u binomického rozdělení a zvolme si kladné přirozené číslo r. Budeme pokračovat v pokusech tak dlouho, dokud nenastane právě r zdarů. Náhodná veličina X bude dána počtem nezdarů předcházejících r-tému zdaru. V případě r — 1 tedy jsme zpět u našeho příkladu z 9.10. Náhodný jev X — k nastane, právě když v prvních k + r — 1 pokusech nastane právě r — 1 zdarů a přitom zároveň v (k + r)-tém pokusu nastane zdar. [ Geometrické rozdělení [__, Náhodná veličina X, která je dána počtem nezdarů před dosažením právě r-tého zdaru, má rozdělení pravděpodobnosti P(X = k) ■- ík + r-l \ r-l Pr(i-pf 0, 1,2, Tomuto rozdělení že také říká negativně binomické rozdělení, v případě r — l pak geometrické rozdělení. 544 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY obálku se sumou a). Tedy celková průměrná vyhraje (jako na začátku) 1 1 3 —a H—2a = -a. □ 2 2 2 E. Náhodné veličina, hustota, distribuční funkce 9.25. Při jednom hodu kostkou je zřejmě množina elementárních jevů Q = [coi,..., oi^}, kde oit znamená, že na kostce padne číslo i. Jevovým polem nechť je A-- [oi\, co2], {rt>3, oi4, oi5, (!)(,}, Í2}. Zjistěte, jestli zobrazení X : Q —► K dané předpisem i) X(coí) = i pro každé i e {1, 2, 3, 4, 5, 6}, ii) X(coi) = X(oj2) = -2,X(oj3) = X(co4) = X(co5) = = X(oi6) = 3 je náhodnou veličinou vzhledem k A. Řešení. Nejprve je dobré se přesvědčit, že množina A opravdu splňuje všechny axiomy v 9.11 a je tedy dobře definovaným jevovým polem. Pak podle definice 9.18 je náhodná veličina taková funkce X : Q —► K, že vzor každé Borelovské množiny S c K leží v A. Pokud v případě i) uvážíme například uzavřený interval [2, 3], je jasné, že X~l([2, 3]) = [oi2, (1)3} e' A. Funkce X tedy v tomto případě není náhodná veličina. V případě ii) se naopak lze lehce přesvědčit, že X je náhodná veličina. Vezmeme-li totiž libovolný interval v K, tak mohou nastat právě čtyři možnosti. Buď neobsahuje číslo -2 ani 3, pak je vzorem X prázdná množina, pokud obsahuje jen -2, je vzorem [oi\, oi2}, pokud obsahuje jen 3, je vzorem [oi3, 014, oi5, oi6] a pokud interval obsahuje obě čísla, pak je vzorem celá množina Q. Ve všech případech vzor leží v jevovém poli A. □ 9.26. Je dáno jevové pole (Q, A), kde Q = [oi\, oi2, oi3, 014, oi5] a A = {0, [oi\, C02}, {«3}, {ííM, ft>5j, {u>\, cl>2, cúí}, [co\, (1)2, 0)4, 0)$}, [coj,, (1)4, £1)5}, £2}. Najděte co nejobecnější zobrazení X : Q —► K, které bude náhodnou veličinou vzhledem k A. Řešení. Protože se jevy 011,012 nevyskytují samostatně v A, je zřejmé, že náhodná veličina X je musí zobrazit na stejné číslo, tj. X(oi\) = X(oi2) = a, pro nějaké a e K. Ze stejného důvodu musí být X(oi4) = X(oi5) = b, pro nějaké kl. Obsahuje-li interval obě číslo a i b, pak je jeho vzorem [oi\, oi2, 014, oi5] e A, což je v pořádku. Zbývá jev oi3, který se může zobrazit na libovolné cel. Jednoduše se potom přesvědčíme o tom, že vzory všech intervalů Geometrické rozdělení se ve fyzice objevuje u tzv. Einsteinovy-Boseovy statistiky. 9.23. Poissonovo rozdělení. V praktických úlohách často úvaha o binomickém rozdělení vede k dalším modelovým případům. KkV Uvažme situaci, kdy do n přihrádek rozdělujeme ■l^ír*ig«»-j-- r vzájemně nerozlišitelných předmětů. Umístění kteréhokoliv předmětu do pevně zvolené přihrádky má pravděpodobnost 1/n (každá z nich je stejně pravděpodobná). Náhodnou veličinu, která popisuje počet X předmětů v jedné pevně zvolené přihrádce můžeme popsat následovně. Máme možnosti hodnot X — k, kde k — 0, ..., r a pravděpodobnost jednotlivých hodnot je P(X = k) = G) (n) i1 n) G) nr Jde proto o rozložení X typu Bi(r, 1/n). S takovouto veličinou se můžeme potkat např. u popisu fyzikální soustavy s velikým počtem molekul plynu. Přihrádky představují malé objemy prostoru a sledujeme rozložení molekul. Zajímá nás pak, co se bude dít s veličinami X„, když bude vzrůstat počet přihrádek n společně s počtem předmětů r„ tak, že v průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků k. Zajímá nás tedy chování našeho rozdělení veličin X„ při limitním přechodu n —> 00. Standardní úpravy (můžeme je brát i jako výzvu k opakování postupů z analýzy funkcí jedné proměnné!) vedou při lim^oo r„/n = A. k výsledku: lim P(Xn = k) ■ lim (n - iy = lim ,(r„-l)...(r„-* + l) 1 (n - l)k lí / _ rjl \ r" — lim 1 + —2-) -. k\ n^cx \ rn ) k\ protože obecně funkce (l+x/n)" konvergují stejnoměrně k funkci ex na každém omezeném intervalu v M. __| POISSONOVO ROZDĚLENÍ j___.- Poissonovo rozdělení Po(k) popisuje náhodné veličiny s pravděpodobnostní funkcí fx(t) = t e N jinak. Samozřejmě platí k=0 k k .k" ,-k+k = 1. Jak jsme odvodili výše, toto diskrétní rozdělení Po(A.) s libovolným k > 0 (rozložené do nekonečně mnoha bodů) dobře aproximuje binomická rozložení Bi(n, pn), kde npn — k, pro veliká 545 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY pro takto definované X jsou množiny v A, tj. X je náhodná veličina vzhledem k A □ 9.27. Náhodná veličina X nabývá hodnoty i s pravděpodobností P(X = i) = i pro i = 1,..., 6. Zapište distribuční funkci Fx(x) a načrtněte její graf. Řešení. Z definice 9.19 je distribuční funkce rovna Fx(x) = P(X < x). To znamená, že Fx(x) = 0 pro x < 1, Fx(x) = pro 1 < x < 6, kde [x] značí celou část čísla x, a FX(X) = 1 pro x > 6. Graficky znázorněno □ 9.28. Střelec střílí do terče, dokud ho netrefí. Má v zásobě 4 náboje. Pravděpodobnost zásahu je přitom při každém výstřelu rovna 0,6. Nechť náhodná veličina X udává počet nespotřebovaných nábojů. Určete pravděpodobnostní a distribuční funkci X a nakreslete jejich grafy. Řešení. Pravděpodobnost, že střelec fe-krát terč netrefí a pak ho trefí je zřejmě rovna 0,4* • 0,6. Proto fx(x) = P(X = x) = 0,43-* • 0,6 pro x € {1, 2, 3}. Pokud střelec netrefí terč na tři pokusy, už mu každopádně nezbude žádný náboj, ať už ho v posledním pokusu trefí nebo ne. Proto /x(0) = P(X = 0) = 0,43. Z definice distribuční funkce 9.19 je Fx(x) = P(X 3. 9.24. Dva příklady Poissonova rozdělení. Kromě výše íiV zmíněného fyzikálního modelu lze takové chování při sledování výskytu jevů v prostoru s konstantní yj7j«£:/ očekávanou hustotou na jednotku objemu (např. při ýi-f^±- sledování výskytu bakterií na sklíčku pod mikroskopem, které se stejně pravděpodobně vyskytují v kterékoliv jeho části). Je-li „průměrná hustota výskytu" v jednotkové ploše 7, pak při rozdělení celé oblasti na n stejných částí bude výskyt k jevů v jedné vybrané části modelován náhodnou veličinou X s Poissonovým rozdělením. Takovéto pozorování při praktické diagnostice v biochemické laboratoři umožní výpočet docela přesného celkového počtu bakterií ve vzorku ze skutečného počtu odečteného jen v několika náhodně vybraných malých částech vzorku. Zkusme nyní popsat události, které se vyskytují náhodně v čase t > 0 a přitom pravděpodobnost výskytu v následujícím malinkém časovém intervalu o délce h nezávisí na předchozí historii a je rovna stále stejné hodnotě hX pro pevné 7 > 0. Přitom pravděpodobnost, že nastane jev v danémmalinkém intervalu více než jedenkrát bude velmi malá. Označme si náhodnou veličinu Xt vyčíslující počet výskytu sledovaného jevu v intervalu [0, f) a zkusme vyjádřit naše požadavky infinitesimálně. Chceme, aby • pravděpodobnost právě jedné události v každém časovém úseku o délce h byla rovna hX+a (h), kde funkce a (h) splňuje lim^0+ ^ = 0; • pravděpodobnost fí(h), že nastane více než jedna událost v časovém úseku délky h, splňuje lim/,^o+ ^jp- — 0; • jevy Xt — j a Xt+h — Xt — k jsou nezávislé pro všechny j, k e N a t, h > 0. Grafy pravděpodobnostní a distribuční funkce vypadají následovně. bol o(h) pro výrazy, které podělené h dávají limitu pro h Označíme si funkce pk(t) = P(Xt = k), k e N, a položíme samozřejmé okrajové podmínky po (0) = 1 a pk (0) = 0 pro k > 0. Nyní přímo spočteme p0(t +h) = po(ť)P(Xt+h - X, = 0) = = po{t){l - h\ - ct{h) - PQi)) a podobně pk(t + h) = P{Xt = k, Xt+h -Xt= 0)+ + P {X, = k - 1, Xt+h -Xt = 1)+ + P(Xt 0aieN,s počáteční podmínkou. Nemusíme se ale děsit, protože první z nich má jediné řešení po« = e-Aí, které okamžitě můžeme dosadit a vyřešit druhou rovnici. Obdržíme pi (ř) = Xt e~u . Matematickou indukcí teď už snadno dovodíme, že ve skutečnosti má celý systém jediné řešení a to O*) i, k< t > 0, k e N. Ověřili jsme tedy, že pro každý proces splňující tři výše uvedené vlastnosti má náhodná veličina Xt udávají počet výskytů v časovém intervalu [0, i) rozdělení Po(Ař). V praxi jsou takové procesy spojeny např. s poruchovostí strojů a zařízení. 9.25. Spojitá rozdělení. Nejjednodušším příkladem spojitého rozdělení je rovnoměrné rozprostření veškeré pravděpodobnosti na nějakém intervalu. Na něm lze dobře ilustrovat, že při jednoduše formulovaném požadavku na chování rozdělení nám nezbude moc prostoru pro jeho definici. Nyní chceme, aby pravděpodobnost hodnoty veličiny X v každém intervalu stejné délky obsaženém v daném intervalu (a, b) c K byla stejná, tj. hustota f x našeho rozdělení náhodné veličiny X má být konstantní. ___j Rovnoměrné rozdělení J_—-- Pro libovolná reálná čísla — oo hustotu a distribuční funkci takto: oo definujeme fx(t) = b—a o ř > ř < a t e (a, b) Říkáme, že veličina X má rovnoměrné rozdělení. Další rozdělení budeme podobné diskrétnímu Poissonovu. Předpokládejme, že sledujeme výskyt náhodného jevu takového, že jeho výskyty v nepřekrývajících se intervalech jsou nezávislé. Je-li tedy p (i) pravděpodobnost, že jev nenastane během intervalu délky ř, pak nutně p(t + s) = p(f)p(s) pro všechna ř, s > 0. Předpokládejme navíc diferencovatelnost funkce p a p(0) = 1. Pak jistě ln p(t+s) = ln p(ř)+ln p (s), takže limitním přechodem (s využitím LHospitalova pravidla) (ln(p))'(ř) = sUm lnp(r +s) -lnp(ŕ) _ p/(0) s ~ p(0) = />'(0). 547 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.30. Hustota pravděpodobnosti náhodné veličiny X má tvar f{x) = pro iéI. Určete i) koeficient a, ii) distribuční funkci, 111) Pi-1 < X < 1). Řešení, a) Aby funkce / (x) byla hustotou pravděpodobnosti, musí být její integrál přes celé K roven jedné. Dostáváme tedy podmínku f°° a 1 = / --dx = a[arctgx]_° = ait. J-oo 1 + x1 Odtud a = -. b) Distribuční funkce je podle 9.21 dána integrálem r i r dt i i Fxix) = / f(t)dt = - / —— = - arctgx + -. c) Z definice distribuční funkce a podle b) je 1 Tt 1 7t 4 7t Pi-1 < X < 1) = Fxil) - Fx(-1) : (-í)4 □ Y 2 5 6 X 1 i 5 i 10 i 20 2 1 i 0 10 20 3 3 1 3 10 20 20 X 1 2 3 fx 7 20 3 20 1 2 Y 2 5 6 fy 3 5 i 5 i 5 Označme si proto spočtenou derivaci //(0) = — A. e R, přičemž volíme záporné znaménko, protože víme, že //(0) nemůže být kladné, když je p(0) = 1. Pak tedy pro p(t) platí lnpit) = —Xt + C a počáteční podmínka dává jediné řešení p(i) = e-Aí. Všimněme si, že z definice našich objektů vyplývá, že X > 0. Nyní uvažme náhodnou veličinu X udávající (náhodný) okamžik, kdy náš jev poprvé nastane. Zřejmě tedy je distribuční funkce rozdělení pro X dána 9.31. Diskrétní náhodný vektor má sdruženou pravděpodobnostní funkci danou tabulkou Určete i) marginální distribuční a pravděpodobnostní funkce; ii) sdruženou distribuční funkci a vhodným způsobem ji znázorněte; 111) P(Y > 3X). Řešení, a) Marginální rozdělení náhodné veličiny X resp. Y dostaneme podle 9.27 sečtením sdružené pravděpodobnostní funkce přes všechny možné hodnoty veličiny Y (odpovídá sečtení hodnot v každém řádku) resp. X (odpovídá sečtení hodnot v každém sloupci). Pomocí tabulky proto dostáváme b) Sdružená distribuční funkce v bodě (a, b) je podle definice rovna součtu všech hodnot sdružené pravděpodobnostní funkce f(x,y) takových, že X < a a Y < b. To v tabulce zhruba řečeno odpovídá součtu všech hodnot ležících v podtabulce, jejíž pravý spodní roh je (a, b). Přesněji máme pro sdruženou distribuční funkci F(x,y) následující tabulku Fx(t) = 1 - p(t) = 1 -e" 0 t > 0 t < 0. Je vidět, že skutečně jde o rostoucí funkci s hodnotami mezi nulou a jedničkou a správnými limitami v ±oo. Hustotu tohoto rozdělení dostaneme derivováním distribuční funkce. _ Exponenciální rozdělení__. Spojité rozdělení náhodné veličiny X s hustotou a-xt t > g fxO) = X e 0 t < 0. se nazývá exponenciální rozdělení ex (A.) . Budeme také potkávat rozdělení, které je podobné jako exponenciální, ale s hustotou tvaru pro x > 0, s danými konstantami a > 0, b > 0, zatímco konstantu c je třeba dopočítat. Potřebujeme 1 = ľ Jo dx = -dt = —T(a). Gama rozdělení Rozdělení, jehož hustota je nulová pro x < 0, zatímco pro x > 0 je dána předpisem fix)- Tia) -x°- se nazývá gama rozdělení Tia,b) s parametry a > 0, b > 0. Exponenciální rozdělení je tedy speciálním případem tohoto rozdělení s parametrem a — 1. 9.26. Normální rozdělení. Jestliže v binomiálním rozdělení zachováme konstantní úspěšnost p, ale budeme přidávat počet pokusů n, bude pravděpodobnostní funkce kupodivu pořád mít podobný tvar (i když jiné rozměry). Na obrázku při rostoucím n se budou vynesené bodové hodnoty slévat do křivky, která by nám měla dát hustotu spojitého rozdělení aproximujícího dobře Bi(n, p) pro veliká n. Naznačíme dopředu, kde hledat. Vzpomeňme na hladkou funkci y — fix) — e~* /2, kterou jsme v odstavci 6.6 na straně 329 zmiňovali jako vhodný nástroj pro konstrukce funkcí hladkých, ale nikoliv analytických. Na obrázku je srovnání této křivky (vpravo) s vynesenými hodnotami Bi(5000, 0,5). 548 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY F(X,Y) [2,5) [5,6) [6,oo) [1,2) i 5 i 10 / 20 [2,3) í 10 9 20 1 2 [3,oo) i 5 4 5 1 a na intervalech (-oo, l)xRalx (—oo, 2) je F(x,y) zřejmě nulová, c) Očividně P(Y > 3X) = P(X =1,Y = 5) + P(X = 1, Y = 6) = = i + i = -i □ 10 T 20 20 LJ 9.32. Určete pravděpodobnost P(2X > F), je-li hustota náhodného vektoru (X, Y) f(x,Y)(x,y) \{Ax - y) pro 1 < x < 2, 2 < y < 4, 0 Řešení. Z definice P(2Z > F) jinak. /oo />2:r / f(x,Y)(x, y)dydx -co J —oo ŕ ŕx i / / — (4x — y)dydx = Ji h 6 2i 3Xy 12y dx í (x1 —-x + -\dx h V 3 3, 1 2 2 1 -x H—x 3 3 □ 9.33. Určete marginální distribuční funkce, sdruženou a marginální hustotu náhodného vektoru (X, Y), je-li 0 pro x < 0, y < 0 F(X,y)(x, v) = ■ \ry2 pro 0 < x < 1, 0 < y < 2 1 pro x > 1, y > 2 Řešení. Hustotu náhodného vektoru (X, Y) dostaneme derivováním distribuční funkce podle x a y. Tedy pro 0 0 takto: ^(*)=e-(^)2/(2 v, z) 0 jinak. Určete konstantu c, distribuční funkci a vypočtěte P(P < X < i, 0 < Y < i, 0 < Z < i). náhodných veličin. Příslušná rozdělení budeme značit N(/í, a). K asymptotické blízkosti normálního a binomického rozdělení pro n -» oo se ještě vrátíme, jenom co si k tomu vytvoříme patřičné nástroje. 9.27. Rozdělení náhodných vektorů. Obdobně jako u skalárních ;ft veličin definujeme distribuční funkce a hustotu nebo n \ pravděpodobnostní funkci pro spojité a diskrétní ná-" " ■" -~ hodné vektory. Hovoříme také o simultánních (sdružených) pravděpodobnostních funkcích a hustotách. Pro dvě diskrétní náhodné veličiny, tj. diskrétní vektor (X, Y) náhodných veličin, definujeme (sdruženou) pravděpodobnostní funkci /(*. y) = P(X ■- o AY = yj) y = yj jinak. Pro spojité veličiny pak definujeme pro všechny a, F(a,b) = P(X OG m = i r J —c Bude potřeba spočítat J ln(x) dx: j ln(x) dx = x ln(x) — j 1 dx = x ln(x) — x = x(hi(x :) - 1). Celkem /CO m = / -CO J1 aln(x) = a[x(ln(x) - l)]f = a(21n(2) - 1), tedy a - □ 21n(2)-l 9.37. V lese, jehož hranice tvoří na mapě pravidelný šestiúhelník se ztratilo dítě. Předpokládejme, že pravděpodobnost toho, že dítě je v určité části lesa, je úměrná pouze velikosti této části, nikoliv jejímu umístění. • Jaké je rozdělení pravděpodobnosti vzdálenosti dítěte od zvolené strany (přímky) lesa • Jaké je rozdělení pravděpodobnosti vzdálenosti dítěte od nej-bližší strany lesa. Řešení. • Nechť a je strana šestiúhelníka. Pak rozdělení pravděpodobnosti je 0 pro x < 0 9^X + TJTa " - - - 2 -^-x + -2- pro \\ľia < x < 0 pro x > V3< a Pro diskrétní nezávislé veličiny z definice okamžitě vyplývá, že sdružená pravděpodobnostní funkce nezávislých veličin je dána součiny jednotlivých hodnot fx,y(x,y) = X!5ľ*;y/- *f y i Derivací sdružené distribuční funkce spojitých proměnných dostáváme obdobný vztah mezi jejich hustotami: a2 fx,r(x, y) = ——Fx,y(x, y) = dxdy d2 = ■7-7—Fx(x)FY(y) = dxdy = fx(x)fY(y). Jde tedy o prostý součin hustot jednotlivých veličin. Hustoty náhodných vektorů vyšších dimenzí s nezávislými spojitými komponentami se chovají zcela obdobně a jejich sdružené hustoty jsou součinem hustot jednotlivých veličin, tj. fx,,-,x„(xi, ...,x„) = fx,(x\) ■ ■ ■ fx„(xn). Podívejme se na jednoduchý příklad, který ukazuje, že není dobré zjednodušeně vidět náhodný vektor, coby stochastický objekt, jen jako dvojici náhodných veličin. Uvažme náhodný vektor (X, Y), který má rovnoměrné spojité rozdělení na jednotkovém kruhu v rovině R2 se středem v počátku. Bude tedy jeho (sdružená) hustota I x2+y2), dostáváme /(*. y) = rro [) je tedy f(r, jsou tedy nezávislé. 9.29. Funkce náhodných veličin. Náhodné vektory potkáváme v praktických modelech ve dvou velmi odlišných rolích. Můžeme sledovat skutečně několik různých JEjOfc náhodných veličin popisujících více či méně souvise-jící jevy. Jako příklad nám mohou sloužit různorodé číselné parametry svázané s jednotlivými studenty (prospěch v různých předmětech, váha, výška, stáří, roční příjem, atd.). V tomto případě budeme potřebovat nástroje, které nám umožní sledovat rozdíly či závislosti mezi takovými veličinami. Můžeme ale také sledovat jen jeden parametr na velkém souboru objektů a vybíráme přitom jen menší počet n z nich. Takový 551 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY • Spočtěme nejprve distribuční funkci F hledaného rozložení náhodné veličiny X udávající vzdálenost dítěte od nejbližší strany lesa. Vzdálenost se může pohybovat v intervalu (0, ^a). Pro y € I potom máme F(y) = P[X Ar Pro hustotu pravděpodobnosti, která je derivací distribuční funkce dostáváme: 0 pro x < 0 /(*) pro y € (0, 2 □ 9.38. Nechť veličina náhodná veličina X má rovnoměrné rozdělení na intervalu (0, r). Určete distribuční funkci a hustotu pravděpodobnosti rozdělení objemu koule o poloměru X. Řešení. Určeme nejprve distribuční funkci F (pro 0 < d < jicr3) r i—ti s/šď 4 „ 1 J3d dJZ F {d) = P celkem F{x) Derivováním pak obdržíme hustotu pravděpodobnosti: "4 J3d _ jr X3 < d = P X < ,7 — 3 ~ V Ati 0 pro x < 0 i j pro 0 < x < f 1 pro x > litr3 /(*) o 1 36m3 X 3 pro x < 0 pro 0 < x < |j pro x > jitr3 □ 9.39. Stanovte hodnotu parametru a e K tak, aby funkce 10 pro x < 0 ax2 pro 0 < x < 3 0 pro x > 3 zadávala hustotu pravděpodobnosti náhodné veličiny X. Určete distribuční funkci, hustotu pravděpodobnosti a střední hodnotu rozdělení objemu krychle, jejíž délka hrany je náhodná veličina s hustotou pravděpodobnosti danou funkcí /. postup popisujeme pomocí n-rozměrného vektoru (Xi, ..., Xn), kde všechny náhodné veličiny Xk mají stejné rozdělení pravděpodobnosti. Tady nás budou velice zajímat veličiny, které budou odpovídat statistickým číselným charakteristikám, které jsme již potkali v předchozí části této kapitoly. Budeme umět oba případy zvládat jedním jednoduchým konceptem. Místo dané náhodné veličiny nebo náhodného vektoru budeme uvažovat funkci z těchto veličin. 1 u jediné veličiny jde o velice užitečný nástroj. Místo náhodné veličiny X, např. „roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ýiX), např. „roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému s tzv. sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto budou značně odlišovat. [ Funkce náhodných veličin a vektorů |_, a náhodnou veličinu Ý(X). Nazýváme ji Pro danou spojitou funkci i/> : IR —> X máme dánu také náhodnou veličinu Y funkcí náhodné veličiny X. V případě náhodného vektoru (Xi, ... Ý : W -» R hovoříme o funkci Y = náhodného vektoru. Xn) a funkce ÝiXU-..,Xn) Všimněme si, že požadavek spojitosti Ý zaručuje, že je Y opět náhodnou veličinou podle naší definice, protože vzor bore-lovské množiny ve spojitém zobrazení je opět borelovská množina. Obecněji můžeme právě tento požadavek na Ý vztáhnout pro každý speciální případ veličiny či vektoru a definovat tak pojem funkce z náhodné veličiny či vektoru obecněji. Nejjednodušší funkcí po konstantách je afinní závislost Ý(X) =a + bX s konstantami a, b e R, b ^ 0. Je-li f x (x) pravděpodobnostní funkce náhodné veličiny s diskrétním rozdělením, snadno se vypočte Umiy) = PiÝ(X) = y)= J2 /(*<•)• Ý(xi)=y V případě afinní závislosti Y = a+bX jepvoto pravděpodobnostní funkce nenulová právě v bodech y i — axi + b. Jako příklad na funkci náhodného vektoru si rozmyslete součet n nezávislých náhodných veličin s alternativním rozdělením A(p). Samozřejmě dostáváme právě binomiální rozdělení Bi(n, p). Podobně můžeme přepočíst distribuční funkci rozdělení funkce ze spojité náhodné veličiny, či vektoru. Ukážeme na příkladu. V předposledním odstavci jsme zavedli veličinu Z s normálním rozdělením N(0, 1). Snadno spočteme, že veličiny Y — ß + aZ budou mít normální rozdělení N(,ti, a) diskutované tamtéž. Skutečně, Fyij) = PiY 3 zadávala hustotu pravděpodobnosti náhodné veličiny X. Určete distribuční funkci, hustotu pravděpodobnosti a střední hodnotu rozdělení obsahu čtverce, jehož délka hrany je náhodná veličina s hustotou pravděpodobnosti danou funkcí /. Řešení. Budeme postupovat jako v předchozím příkladě. Opět snadno zjistíme a = |. Distribuční funkce náhodné veličiny X je tedy Fx(t) = i/2 pro / e (0, 3), pro menší / je tato funkce nulová, pro větší rovna 1. Označme Z = X2 náhodnou veličinu označující obsah čtverce. Ten je v intervalu (0, 9), pro / e (0, 9) a distribuční funkci F z náhodné veličiny Z tedy můžeme psát Fz(t) = P [Z < t] = = P[X2 < t] = P[X < V?] = Fx(Vt) = Ií, hustota pravděpodobnosti je pak fz(t) = | na intervalu (0, 9),jinaknula,jednásetedy o rovnoměrné rozdělení pravděpodobnosti na daném intervalu, střední hodnota je tudíž 4, 5. □ 9.41. Stanovte hodnotu parametru a e K tak, aby funkce /(*) = 0 pro x < 0 ax2 pro 0 < x < 2 0 pro x > 2 zadávala hustotu pravděpodobnosti náhodné veličiny X. Určete distribuční funkci, hustotu pravděpodobnosti a střední hodnotu rozdělení objemu krychle, jejíž délka hrany je náhodná veličina s hustotou pravděpodobnosti danou funkcí /. O 9.42. Náhodně rozřízneme úsečku délky / na dvě části. Určete distribuční funkci a hustotu pravděpodobnosti rozdělení obsahu obdélníka, jehož délky stran jsou rovny délkám takto vzniklých úseček. Řešení. Spočítejme hledanou distr. funkci. Označme ještě X náhodnou veličinu s rovnoměrným rozložením na intervalu (0, /) udávající délku jedné ze stran (délka druhé je pak / — X). Obsah obdélníka Se součty nezávislých náhodných veličin je to malinko i!.' » složitější. Uvažme dvě takové spojité veličiny X a Y s hustotami fx a fy. Přímým výpočtem spočteme distribuční funkci náhodné proměnné V — X + Y. u) = / fx(x)fY(ý)dxdy = Jx-\-y 1. Určete pravděpodobnost, že Y je menší než X2. AT- Podobně vyjádříme střední hodnotu funkce ze spojité náhodné veličiny: /oo Ý(x)fx(x)dx, -oo pokud tento integrál absolutně konverguje. Všimněme si náhodná veličina Y = ^(X) nemusí být pro funkci spojité náhodné veličiny opět spojitá. Nicméně v případě spojité monotónní funkce Ý a spojité veličiny X tomu tak bude a mělo by být vcelku jednoduchým cvičením ověřit, že námi definovaná E skutečně splývá sEľ. Střední hodnotu náhodné veličiny můžeme nahlížet jako „očekávanou hodnotu". Ve statistice zanedlouho uvidíme, že má skutečně přímý vztah k aritmetickému průměru vektoru hodnot. 9.31. Petrohradský paradox. Vraťme se k příkladu, kterým w\: jsme motivovali potřebu diskrétních náhodných veličin v odstavci 9.10. Přeformulujeme tentýž model jako potenciální pravidla herny a dostaneme pěkný příklad situace, ve které střední hodnota zkoumané veličiny nebude podle naší definice vůbec existovat. Návštěvník zaplatí vklad C a poté hází mincí. Je-li T počet hodů potřebných k první hlavě, pak obdrží výhru 2T. Ptáme sej aká je „rozumná hodnota" pro vklad C? Je-li X náhodná veličina popisující výhru, jistě se nám zdá, že správnou odpovědí je „cokoliv menší než střední hodnota E X". Jak jsme odvodili v 9.10, je (za předpokladu férové mince) P(T = k) = 2~k. Sečteme-li všechny pravděpodobnosti výsledků vynásobené výhrami 2k, dostaneme 2^,T 1 — 00■ Střední hodnota tedy neexistuje. Zdá se proto, že se hráči vyplatí vložit i velký vklad... Ve skutečnosti simulací hry zjistíme, že nezávisle na počtu pokusů se prakticky všechny výhry budou pohybovat v rozmezí cca do 24. Důvodem je, že nikdo nemůže hrát neomezeně dlouho a vysoké výhry jsou proto velice nepravděpodobné a proto je při reálných úvahách nelze brát vážně. V teorii rozhodování se takovým případům, kdy očekávaná hodnota nemá přímý vztah k vyčíslenému užitku říká Petrohradský paradox a k této tématice lze najít rozsáhlou literaturu.3 9.32. Vlastnosti střední hodnoty. U jednoduchých rozdělení můžeme snadno spočíst jejich střední hodnotu přímo z definice. Např. pro náhodnou veličinu s alternativním rozdělením A(p) spočteme okamžitě EX = (l-p)-0 + p-l = p. Stejně tak bychom mohli spočíst střední hodnotu np binomického rozdělení Bi(n, p), to už ale dá trochu přemýšlení. Nicméně výsledek je okamžitým důsledkem následující obecné věty, protože Bi(n, p) je součtem n náhodných veličin s alternativním rozděleními A(p). Uvažme nějaké náhodné veličiny X, Y, reálné konstanty a, b a podívejme se na střední hodnoty funkcí veličin X + Y aa + bX, za předpokladu, že střední hodnoty E X a E Y existují. Přímo z definice je samozřejmé, že konstantní náhodná veličina a má za střední hodnotu opět a. Dále, E(bX) =i)EX, protože konstanta b se vytkne jak ze sum, tak z integrálů. Bernoulli, 1738, viz Wiki - hodnota není dána cenou ale užitkem 554 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení. Protože XaY jsou nezávislé náhodné veličiny, je sdružená hustota pravděpodobnosti f(x,Y) '■ R2 —► R2 veličiny (X, Y) dána součinem hustot pravděpodobnosti f x veličiny X a fy veličiny Y, tedy f(X,Y)(u, V) = _ í fx(u) ■ fy (v) = \ ■ 2v = v pro (u,v)€ (0, 2) x (0, 1), 10 jinak. Hledaná pravděpodobnost P je pak dána integrálem hustoty pravděpodobnosti f(x,y) přes tu část roviny O, kde je Y < X2: P = j j f(x,y) áxáy = l-jj f(x,y) dx dy = o iť\o 3 5' □ í f ydydx jo Jx2 9.45. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X je dána následující hustotou pravděpodobnosti: 10 pro x < 0 2x pro 0 < x < 1 0 pro i> 1, veličina Y pak touto hustotou pravděpodobnosti: 10 pro x < 0 f pro 0 < x < 2 0 pro x > 2. Určete pravděpodobnost, že Y je větší než X2. O Řešení. f(x,y)(u,v) = ««, pro (u, v) e (0,1) x (0,2), f(x,y)(u,v) = 0 jinak. Pro hledanou pravděpodobnost P pak máme p =fo Jlixydydx 11 12' □ 9.46. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X je dána následující hustotou pravděpodobnosti: 10 pro x < 0 f pro 0<*<3 0 pro x > 1, veličina Y pak touto hustotou pravděpodobnosti: 10 pro x < 0 f pro 0 < x < 2 0 pro x > 2. Určete pravděpodobnost, že Y je větší než X3. Řešení. Jo 2 f^xydydx = §. O □ Obecněji, střední hodnotu součinu dvou nezávislých náhodných veličin X a Y spočteme následovně. Předpokládejme, že vektor (X, Y) má diskrétní nezávislé komponenty s pravděpodobnostními funkcemi /xfc), fyiyj). Potom = (E*<ä(*<))(EwMx/)) =exef. Podobně se spočte rovnost E(XY) = e X e Y pro nezávislé spojité veličiny. Zkusme nyní spočíst E(X+Y) pro jakékoliv náhodné veličiny. Pro diskrétní rozdělení X a Y dostaneme e(x + Y) = J2 J2(xi + yj)P(X =xí,Y = yj) = = Y,{[XiI2p(x' = Xi>Y' = yji)+ + J2(yjI2p(-x = x>'Y = yj'>) = = J2xiP(X=xi) + Y2yjP(Y = yj), ' j přičemž absolutní konvergence první dvojité sumy vyplývá z trojúhelníkové nerovnosti a absolutní konvergence sum pro střední hodnotu jednotUvých proměnných, při výpočtu jsme pak absolutní konvergence sum využili k záměně pořadí sčítání. Podobně budeme postupovat u spojitých náhodných veličin X a f se střední hodnotou. Připomeňme, že hustota součtu náhodných veličin je dána konvolucí jejich hustot. /oo zífx * fy)(z)dz = -oo /oo /"oo / zfx (x) fy (z - x) dxdz = -oo j—c -oo ť—oo /■oo /"oo / / (z - x)fx{x)fy{z - x) dxdz + j—co j—co /oo /"oo ufy(u)du + / xfx(x)dz -oo j—oo /oo /"oo / xfx(x)fy(z- X) dxdz = -oo j —oo kde jsme využili absolutní konvergenci integrálů středních hodnot e X a e Y k záměně integrálů dle Fubiniho věty. Celkem tedy dostáváme očekávaný vztah: e(x + Y) = e X + e Y, kdykoliv střední hodnoty e X a e Y existují. Nyní již přímým použitím tohoto vztahu dostáváme: __\ Afinní povaha střední hodnoty |___ Pro jakékoliv konstanty a,b\, ... ,bt a náhodné veličiny X\,...,Xk platí E(a + biXi + --- + bkXk) =a + biEXi + --- + bkEXk. 555 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY F. Střední hodnota, korelace Spočtěte střední hodnotu a rozptyl binomického rozdělení Řešení. Přímý výpočet z definic je pěkné kombinatorické cvičení. My tvrzení dokážeme s využitím vlastnosti středních hodnot a rozptylu. Podle definice binomického rozdělení v 9.22 můžeme náhodnou veličinu X ~ Bi(n, p) vidět jako součet X = Yľk=\ ^> kde Y\,...,Y„ ~ A(p) jsou nezávislé náhodné veličiny vyjadřující úspěch v fe-tém pokusu. Alternativní rozdělení má zřejmě střední hodnotu E Yi = p,a proto podle věty 9.32 platí E X = Yľk=\ E it = np. Podobně snadno vypočteme E(Yt2) = l2 • p + O2 • (1 — p) = p, a p2. Podle věty 9.36 pak platí □ proto var Yk = E(Y2) - (E Yk)2 = varX = Yľk=i vaľYk = np(\ - p). Následující věta rozšiřuje toto chování vůči afinním transformacím na náhodné vektory a ukazuje, že je střední hodnota invariantní vůči afinním transformacím, stejně jako aritmetický průměr: Věta. Nechť X — (X i, ..., X„) je náhodný vektor se střední hodnotou E X, a e Rm, B e Matm„(R) matice. Pak platí E(a + B ■ X) = a + B -EX. Důkaz. Ve skutečnosti už skoro nemáme co dokazovat. Protože je střední hodnota vektoru definována jako vektor středních hodnot, stačí se nám omezit na jedinou položku v E(a + B ■ X). Můžeme proto rovnou předpokládat, že a je skalár a B matice s jediným řádkem. Pak jde ovšem o střední hodnotu konečného součtu náhodných veličin a ta podle předchozí úvahy jednak existuje a zároveň je dána jako součet středních hodnot jednotlivých položek. To je právě dokazovaný vztah. □ 9.47. Pravděpodobnost zásahu cíle jedním výstřelem je 0, 6. Náhodná veličina X udává počet zásahů při pěti nezávislých výstřelech. Určete její rozdělení pravděpodobnosti, střední hodnotu a rozptyl. Řešení. Výstřely jsou zřejmě nezávislé pokusy s alternativním rozdělením A(|), a proto je podle definice binomického rozdělení X ~ Bi(5, |). Podle ||F|| je střední hodnota a rozptyl Bi(n, p) rovna np respektive np(l — p), což v našem případě dává EX = 3 a varZ = f. □ 9.48. Diskrétní náhodná veličina X nabývá hodnot k = 0,1, 2, 3,... s pravděpodobností P(X = k) = p(l — p)k (geometrické rozdělení). Určete E X (střední doba čekání na úspěch) a var Z. Řešení. Z definice střední hodnoty a s využitím formule pro součet derivace geometrické řady spočítáme E X = J2 kpd ~ PŤ = p(l - P) J2 k(1 ~ k=0 1 l-p k=0 P(l-P)- V P Obdobně s využitím formule pro součet druhé derivace geometrické řady spočítáme e(x2) = jz^p^-py k _ (1 - p)(2 - p) a proto je rozptyl roven var X = E(X ) — (E X) PA 2 _ 1-p □ 9.49. Náhodná veličina X má hustotu fxix) = pro ie(l, oo) a jinde nulovou. Určete její distribuční funkci, střední hodnotu a rozptyl. 9.33. Kvantity a kritické hodnoty. Pokračujeme v našem programu zavádění číselných charakteristik v obdobě k těm z popisné statistiky. Dalšími užitečnými cha-íj^Nfc rakteristikami tam byly tzv. kvantity. Mv^msg*--'— Uvažme nejprve náhodnou veličinu s ryze monotónní distribuční funkci Fx- Podmínce vyhovuje každá spojitá náhodná veličina X se všude nenulovou hustotou, jako je tomu např. u normálního rozdělení. V tomto případě definujeme tzv. kvanti-lovou funkci F^1 prostě jako inverzní funkci (Fx)-1 : (0, 1) -» R. To znamená, že hodnota y — F-1 (a) je právě takové y, že P(X < y) = a. To přesně odpovídá kvantilům z popisné statistiky, když budeme za pravděpodobnosti brát relativní četnosti výskytu hodnot. __^^___^__J KVANTILOVÁ FUNKCE__. Obecně, pro libovolnou náhodnou veličinu X s distribuční funkcí Fx(x) definujeme její kvantilovou funkci F_1(a) = iní{x e R; F (x) > a), a e (0, 1). Zřejmě jde o zobecnění předchozí definice v případě ryze monotónní distribuční funkce. Jak jsme viděli v popisné statistice, nejčastěji jsou používané kvantily s a = 0,5, tzv. medián, s a = 0,25, tzv. první kvartil, a — 0,75, tzv. třetí kvartil, a podobně pro decily a percentily (kdy je a rovno násobkům desetin a setin). Jak vyplývá přímo z definice, kvantilová funkce nám pro danou náhodnou veličinu X umožňuje přímo určovat intervaly, do kterých nám padnou hodnoty X s předem zadanou pravděpodobností. Velice často se budeme potkávat např. s hodnotou í>_1 (0,975), která je přibližně rovna 1,96 a zadává percentil 97,5 pro normální rozdělení N(0, 1). Tato hodnota říká, že s 2,5-procentní pravděpodobností bude hodnota takové náhodné veličiny Z alespoň 1,96. Protože je přitom hustota pravděpodobnosti veličiny Z symetrická kolem počátku, můžeme toto pozorování interpretovat tak, že pouze s 5-procentní pravděpodobností bude hodnota |Z| větší než 1,96. Podobné intervaly a hodnoty budeme hledat při diskusi spolehlivosti odhadů hodnot charakteristik náhodných veličin. 556 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení. Z definice distribuční funkce je pro ie(l, oo) r 3 Střední hodnota X je rovna f°° 3 a střední hodnota X1 je E(X2) Proto var Z = 3 - (f)2 /■°° 3 k č dx 3 ' 3' 3 4- □ 9.50. Náhodná veličina X má hustotu rovnu fxix) = cos x pro x e (0, j) a jinde nulovou. Určete střední hodnotu, rozptyl a medián této veličiny. Řešení. Z definice a integrací per partes spočítáme EX= \ x Jo Dvojitou integrací per partes dostaneme cos xdx = cosxdx = [x sinx + cosx]02 = — — 1. E(Z2) : ľ* Jo = [x2 sin x + 2x cos x — 2 sin x\ J = ^—— 2, a proto je rozptyl roven varZ = (|)2 — 2 — (j — l)2 = ji — 3. Distribuční funkce je podle definice rovna Fx (x) = f* cos tdt = sin x a medián F-1 (0,5) = |. □ 9.51. Náhodná veličina X má hustotu rovnu fxix) = \e~Xx pro x > 0, kde A > 0 je daný parametr rozdělení, a jinde nulovou (tzv. exponenciální rozdělení). Určete střední hodnotu, rozptyl, modus (reálné číslo s maximální hustotou, resp. pravděpodobnostní funkcí) a medián této veličiny. Řešení. Z definice a integrací per partes El : E(X2) í p CO ■■x Jo xXe dx 2x—e 2 Ä2' a proto var X = E(X2) - (E X)2 = i. Protože F'x (x) = -\2e-Xx < < 0, je hustota stále klesající funkce. Své maximum tedy nabývá v nule. Z definice je F{x) = í Xe-X,dt = 1 - e~kx Jo a proto je medián roven F_1(0,5) = —^ln(i) = ^2. □ _J Kritické hodnoty {_ Pro náhodnou veličinu X a reálné číslo 0 < a < 1 definujeme I její kritickou hodnotu x{a) na úrovni a předpisem P(X >x(á)) =a. To znamená, že x(a) — F^\l— a), kde Fxl je kvantilová funkce veličiny X. | 9.34. Rozptyl a směrodatná odchylka. Nejjednodušší číselné S. * charakteristiky udávající variabilitu hodnot vzorku •^TjV v popisné statistice byly rozptyl a směrodatná od-■jCSgStg. chylka. Pro náhodné veličiny si budeme počínat obdobně. ___| Rozptyl náhodné veličiny j_—--i Pro náhodnou veličinu X s konečnou střední hodnotou definujeme její rozptyl vztahem varX = E^(X-EXrJ, pokud i střední hodnota na pravé straně výrazu existuje. V opačném případě říkáme, že veličina X nemá rozptyl. Odmocnina VvarX z rozptylu se nazývá směrodatná odchylka náhodné veličiny X. S využitím vlastností střední hodnoty snadno spočteme jednodušší vztah pro rozptyl náhodné veličiny X se střední hodnotou: var I=E(X-EX)2 = E(X2 — 2X(E X) + (EX)2) — — EX2 — 2(E X)2 + (E X)2 = = EI2- (EX)2. Podívejme se také, jak se chová rozptyl náhodné veličiny při afinních transformacích. Pro náhodnou veličinu X se střední hodnotou a rozptylem a pro reálná čísla a, b uvažujme náhodnou veličinu Y — a + bX. Spočteme var F — E((a + bX) - E (a + bX)f == E(b(X - E X)f = b2 varX. Odvodili jsem tedy následující užitečné vztahy: ___J Vlastnosti rozptylu J___ (9.8) varX = EiX2) - iEX)2 (9.9) var(a + bX) = b2 var X (9.10) y varia + bX) = WvarX Ke každé náhodné veličině X se střední hodnotou a rozptylem můžeme zadat tzv. normovanou veličinu (často také říkáme standardizovanou veličinu) jako funkci Z = X — EX VvarX Je to tedy taková afinní transformace původní veličiny, která má střední hodnotu nulovou a rozptyl jednotkový. 557 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.52. Diskrétní náhodný vektor (X\, X2) má simultánní pravděpodobnostní funkci jr(0, — 1) = c, jt(1,0) = it(l, 1) = n(2,1) = = 2c, ji(2, 0) = 3c a rovnou nule jinde. Určete konstantu c a vypočtěte kovarianci cov(Zi, X2). Řešení. Součet pravděpodobnostních funkcí přes všechny možné stavy musí být roven 1, tj. ji (i, j) = c + 3.2c + 3c : 10c = 1, 9.35. Čebyševova nerovnost. Hezkou ilustrací, k čemu je užitečný rozptyl, je skoro samozřejmá nerovnost, která dává přímo do souvislosti pravděpodobnost vzdálenosti hodnot náhodné veličiny od její střední hodnoty. Čebyševova nerovnost Věta. Předpokládejme, že náhodná veličina X má konečný rozptyl, a uvažujme libovolné £ > 0. Potom platí varX P(\X-EX\ > e) < a odtud c = pj. Pravděpodobnostní funkce it\ pro X\ je dána součtem simultánní funkce přes všechny možné hodnoty X2 , tj. tí\(i) = = Ylj ^o' ])■ Je tedy rovna jti(0) = c, tí\(1) = 4c, tí\(2) = 5c a nule jinde. Podobně pro pravděpodobnostní funkci it2 náhodné veličiny X2 dostaneme it2(— 1) = c, it2(0) = 5c, it2(l) = 4c a nula jinde. Odtud E Zi = £; ř7ri(0 = 14c = 1,4 aEX2 = Ej }Tt2(j) = = 3c = 0,3. Z definice kovariance pak máme cow(XuX2) = £(i - 1,4)0 - 0, 3)it(i, j) = 0,18. □ j 9.53. V mnoha vědních oborech se chování náhodné proměnné omezené na nějaký interval modeluje pomocí tzv. beta rozdělení. Toto spojité rozdělení je dáno pravděpodobnostní funkcí na intervalu [0,1] 1 B(a,ß) ŕ'1 (1 - x) kde a, fi jsou vhodně zvolené parametry pro popis dané náhodné veličiny a B (a, P) je normalizační konstanta, která zajišťuje, že integrál fx(x) přes celý interval [0,1] je roven jedné. Spočítejte jeho a) modus, b) střední hodnotu a c) rozptyl. Řešení, a) Modus je z definice hodnota, ve které nabývá funkce fx(x) své maximum. Hledejme tedy její stacionární body. Jednoduše spočítáme, že rovnice f'x (x) = 0 je ekvivalentní rovnici (a - l)(l-x)-x(B - 1) = 0, která je splněna pro x = ^-f^-Protože fx (0) = fx(l) = Oafunkce je kladná, jedná se evidentně o hledané maximum, b) Z definice je El : ľxa(\-xý-1 Bia, ß) Jo dx. Integrací per partes pak dostáváme EX =--i-[xa (1 - x)ß]\ +--- í xa-l{l-xfdx. B(a,ß)ßL 10 B(a,ß)ß J0 Důkaz. Uvedeme jednoduchý důkaz pro spojitou náhodnou veličinu X. Analogický postup pro diskrétní veličiny ponecháme na čtenáři. Označme si /j, = E X a počítejme podle definice varX — i: (x — ß) f (x) dx = (x — /t) f (x) dx+ í (x — /t) f (x) dx s2 f (x) dx=e2 PQX - /x| > e). /i|>E □ Když si uvědomíme, že rozptyl je kvadrát směrodatné odchylky a, tak okamžitě vidíme, že volba £ = ka dává pravděpodobnost P(|X-EX| >ko) < ^. Čebyševova nerovnost je mimořádně užitečná pro asymptotické odhady u limitních procesů. Uvažme např. posloupnost náhodných veličin X\,X2, ... s rozložením pravděpodobnosti X„ ~ Bi(n, p) se stejným 0 < p < 1. Asi bychom intuitivně očekávali, že relativní četnost zdaru by se měla s rostoucím n blížit pravděpodobnosti p, tj. že náhodné veličiny Y„ = \xn by se měl stále více svými hodnotami blížit p. Evidentně máme np EYn = — = p, n vatY„ = np(l-p) p(\ - p) Přímé použití Čebyševovy nerovnosti dává pro libovolné pevné P(\Yn-p\>e) 0 platí : 0. lim P(\^ p > £) Tento výsledek je známý jako Bernoulliova věta (jedna z mnoha). Tomuto typu limitního chování říkáme konvergence podle pravděpodobnosti. Dokázali jsme tedy, že v důsledku Čebyševovy nerovnosti konvergují naše veličiny Y„ podle pravděpodobnosti ke konstantní veličině p. 9.36. Kovariance. Vraťme se nyní k náhodným vektorům. 4iV U střední hodnoty jsme to měli snadné - uvažovali '■SÍ~y>S* ' jsme prostě vektor středních hodnot. Pro charakteri- zaci variability nás však také moc zajímají závislosti mezi jednotlivými komponentami. 558 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY První člen je očividně nulový. Úpravou druhého pak dostáváme E X = _ a „ _ / xa-l(l - xf-ldx- ldx. KOVARIANCE —— rxa-Hi-xý-\ 0, h) Y = VŽ, x > 0, iii) Y = ln X, x > 0, iv) Y = \,x > 0. Řešení. Přímým aplikováním formule pro hustotu transformované náhodné veličiny dostaneme a) friy) = /(lny)-, b) friy) = 2fiy2)y, c)f¥iy) = fiey)ey,d)f¥iy) = fil/y)j-2. ' □ 9.60. Náhodná veličina X má rovnoměrné rozdělení pravděpodobnosti na intervalu (— f, f) • Určete jeho hustotu a hustotu transformovaných veličin Y = sin X, Z = tg X. Řešení. Protože délka intervalu, na kterém je náhodná veličina X nenulová je ji, je její hustota rovna fx(x) = ^ pro i 6 (-|, |) a nula jinde. Ze vztahu pro hustotu transformované náhodné veličiny a podle vzorce pro derivaci elementárních funkcí pak máme 1 friy) = /x(arcsin(y))arcsin (y) -yz fziy) = /x(arctg(z))arctg'(y) 1 7tií + yz) □ 9.61. Náhodná veličina X má hustotu rovnu cos x pro x e (0, f) a nulovou jinde. Určete hustotu náhodné veličiny Y = X1 a vypočtěte E F, var Y. 9.38. Varianční matice. Dostáváme se konečně k variabilitě hodnot náhodného vektoru. Nabízí se uvažovat kovariance všech dvojic komponent. Následující definice a věta ukazují, že skutečně dostaneme analogii rozptylu pro vektory, včetně chování rozptylu při afinních transformacích náhodných veličin. ,__\ Varianční matice {___ M ■fl'i komponenty mají konečný rozptyl. Varianční matici náhodného vektoru X definujeme pomocí střední hodnoty předpisem (vektor X je sloupec náhodných veličin) varX = E(X-EX)(X-EX)T. Použitím definice střední hodnoty vektoru a přímým rozepsáním násobení matic po složkách ověříme, že varianční matice je symetrická matice / varXi cov(Xi,X2) ••• cov(Xi,X„)\ cov(X2, X\) varX2 ••• cov(X2, X„) varX - \cov(X„,Xi) cov(X„,X2) rX„ / Věta. Uvažujme náhodný vektor X — (X\, ..., X„)T, jehož všechny komponenty mají konečný rozptyl, Uvažme dále jeho transformovanou vektorovou náhodnou veličinu Y = BX + c, kde B je matice reálných konstant typu m x n a c je vektor konstant v W". Potom var(F) = var(BX + c) = B(varX)Br . Důkaz. Stačí provést přímý výpočet a využít přitom vlastnosti střední hodnoty var(F) = E((BX + c) - E(BX + c)) ((BX + c)- - E(BX + c))T = = E(B(X - E X))(B(X — EX))T — = BEiX -EX)(X -EX)TBT = = B(varX)Br. □ Stejně jako u rozptylu skalární náhodné veličiny tedy vidíme, že konstantní část transformace nemá vliv, zatímco vůči lineární části transformace se varianční matice chová jako matice kvadratické formy. 9.39. Momenty a momentová funkce. Střední hodnota a rozptyl odráží chování střední hodnoty samotné veličiny X a jejího kvadrátu. V popisné statistice jsme také zkoumali tzv. šikmost rozložení dat a je přirozené zkoumat variabilitu náhodných veličin pomocí vyšších mocnin dané náhodné veličiny X. Charakteristiku EiXk) nazýváme k-tým momentem, charakteristiku fit — E ((X — EX)k^j pak k-tým centrálním momentem náhodné veličiny X. Užitečný bývá také tzv. k-tý absolutní moment zadaný předpisem E IXI*. Přímo z definice je tedy pro spojitou veličinu X E X = r x f x (x) dx 561 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení. Podle vzorce pro hustotu transformované náhodné veličiny je fr(y) = fx(*/y)(*/y) = ^yCOSX- Střední hodnotu a rozptyl Y je jednodušší počítat přímo z hustoty náhodné veličiny Z. Platí E Y = x2 fx(x)dx a proto Eľ = í x2 cos xdx = [x2 sin x + 2x cos x — 2 sin x\ J =-. Jo 4 Integrál jsme spočítali metodou per partes. Stejnou metodou spočítáme E(Y2) : / xA cos xdx = Jo [(x4 - 12X2 + 24) sin* + 4(x3 - 6x) cosx] | . Odtud máme E(Y2) (I)4 var F 2, 12(f)2 + 24, a proto 3jr2 + 24 - "4-1^+64 = 20 - 2jc2. □ a obdobně víme, že pro diskrétní veličiny X s pravděpodobností soustředěnou do hodnot xj bude 9.62. Nechť X je náhodná veličina, která nabývá hodnoty 0 s pravděpodobností \ a hodnoty 1 též s pravděpodobností \. Podobně nechť F je náhodná veličina, která nabývá hodnoty -1 a 1 s pravděpodobnostmi \. Ukažte, že náhodné veličiny X a Z = XY jsou nekorelované, ale závislé. Udejte příklad dvou spojitých náhodných veličin, které mají tuto vlastnost. Řešení. Nejprve spočítáme střední hodnoty našich náhodných veličin EX = 0-i + l.í = i,EZ = E(XY) = 0 • i + (-1) • i + 1 • i = = 0. Pro střední hodnotu jejich součinu máme E(ZZ) = E(X2Y) = = l-j + (—1) •-j = 0. Podle věty 9.36 je pak kovariance rovna cov(Z, Z) = 0—^0 = 0. Veličiny Z a F jsou tedy nekorelované. Zároveň je podmíněná pravděpodobnost P (Z = 1|Z = 0) zřejmě nulová, tj. i P(Z = 1, X = 0) = 0, a přitom P(Z = 1) = \ a P(X = 0) = i, tedy P(Z = 1) • P(X = 0) = A ^ 0. Vidíme, že P(Z = 1) • P(X = 0)r P(Z = 1, X = 0), což znamená, že Z a Z jsou závislé. Z příslušných definic lze lehce ověřit, že příkladem spojitých nekorelovaných závislých náhodných veličin jsou Z a Y = X2, kde Zje libovolně rozložená náhodná veličina, která má nulovou střední hodnotu, konečný druhý moment a nulový třetí moment. □ H. Nerovnosti a limitní věty Markovova nerovnost dává hrubý odhad nezáporné náhodné veličiny v případě, že neznáme nic jiného, než její střední hodnotu. Konkrétně říká, že pro každou nezápornou náhodnou veličinu Z a pro libovolné a > 0 platí P(X > a) < EXk = J2xi Uvidíme, že bude pro výpočty velice výhodné umět pracovat s mocninnou řadou, ve které momenty budou vystupovat coby koeficienty. Protože víme, že koeficienty Taylorovy řady funkce M(i) v bodě t — 0 dostaneme pomocí diferencování, můžeme vcelku snadno uhádnout správnou volbu takové funkce: _| Momentová vytvořující funkce |_, Pro náhodnou veličinu X uvažme funkci Mx(i) definovanou předpisem Mx(t) =EéA = Ei^' fx(xi) pro diskrétní X pro spojitou X. Pokud tato střední hodnota existuje, hovoříme o momentové vytvořující funkci náhodné veličiny X. Je zjevné, že tato funkce Mx(t) je vždy analytickou funkcí v případě diskrétních náhodných veličin s konečně mnoha hodnotami Xl. Věta. Nechť X je náhodná veličina pro kterou na intervalu (—a, a) existuje její analytická momentová vytvořující funkce. Pak na tomto intervalu je Mx (i) dána absolutně konvergující řadou Důkaz. Ověření tvrzení věty je jednoduchým cvičením na techniky diferenciálního a integrálního počtu. V případě diskrétní veličiny, jde buď o konečné součty nebo o počítání s absolutně a stejnoměrně konvergentními řadami, resp. v případě spojitých veličin jde o absolutně konvergující integrály. Můžeme proto prohodit limitní proces s derivováním a protože 5- ett — xsa , dostáváme okamžitě vztah dtk ■Mx(t) = EXK a odtud je tvrzení věty zřejmé. □ Ve skutečnosti lze ukázat, že předpoklady věty jsou splněny, kdykoliv platí současně Mx (—a) < 00 a Mx (a) < 00 a navíc lze dokázat, že platí-li v takovém případě rovnost momentových funkcí Mx (ř) = My (i) na nějakém netriviálním intervalu, pak mají tyto náhodné veličiny X a Y také stejné distribuční funkce. Momentová funkce tedy poskytuje za těchto podmínek úplnou charakterizaci náhodné veličiny. 9.40. Vlastnosti momentové funkce. Díky vlastnostem exponenciální funkce lze očekávat, že snadno spočteme, jak se chová momentová vytvořující funkce při afinních transformacích náhodných veličin a při součtech nezávislých náhodných veličin. Lemma. Nechť a, b e R a X, Y jsou nezávislé náhodné veličiny s momentovými vytvořujícími funkcemi Mx(f) a My (f). Potom 562 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.63. Mějme nezápornou náhodnou veličinu X se střední hodnotou [i. Bez dalších informací o rozdělení X odhadněte P(X > 3fi). Vypočtěte P(X > 3fi) víte-li, že X ~ Ex(^). Řešení. Pokud nezáporná náhodná veličina X nenabývá pouze nulovou hodnotu, pak je její střední hodnota [i kladná. Proto můžeme danou pravděpodobnost zhruba odhadnout pomocí Markovovy nerovnosti 11 1 P(X > 3fi) S f- = -• 3fi 3 Pokud víme, že Z ~ Ex(^), pak P(X >3fi) = l- P(X <3fi) = l- F(3fi), kde F je distribuční funkce exponenciálního rozdělení. Ta je podle definice F(x) = [ —e-pdt = \—e^l = 1 — e^'1 Jo fi L Jo a proto P(X > 3fi) = -j. □ 9.64. Průměrná rychlost větru je na určitém místě 20 km/hod. • Bez ohledu na rozdělení rychlosti větru jako náhodné veličiny odhadněte pravděpodobnost, že při jednom pozorování rychlost větru nepřesáhne 60 km/h. • Určete interval, v němž se bude rychlost větru nacházet s pravděpodobností alespoň 0,9, víte-li navíc, že směrodatná odchylka a = 1 km/hod. Řešení. Označme náhodnou veličinu udávající rychlost větru X. V prvním případě můžeme použít pouze hrubý odhad pomocí Markovovy nerovnosti P(X < 60) = 1 - P(X > 60) > 1 - |j = 2-. V druhém případě známe rozptyl (resp. směrodatnou odchylku) rychlosti větru, a proto k určení daného intervalu můžeme použít Čebyševovu nerovnost 9.35 1 0, 9 < PQX - 201 < x) = 1 - PQX - 201 > x) < 1 - -r. xl Odtud x > \/Í0 & 3,2. Hledaný interval je tedy (16,8 km/hod, 23,2 km/hod). □ 9.65. Ke každému jogurtu běžné značky je náhodně (rovnoměrně) přibalen obrázek některého z 26 hokejových mistrů světa. Kolik jogurtů si fanynka Věrka musí koupit, aby s pravděpodobností 0,95 získala alespoň 5 kartiček Jaromíra Jágra? Řešení. Označíme-li náhodnou veličinu udávající počet získaných kartiček Jágra X, je zřejmě X ~ Bi(n, ^g), kde n je celkový počet koupených jogurtů. Hledáme takovou hodnotu tohoto čísla, aby mají náhodné veličiny V vytvořující funkce 'X aW Y momentové Ma+bx(t) =ea'Mx(bt) Mx+Y(t) = Mx(t)MY(t) Důkaz. První vztah spočteme přímo z definice My (ŕ) = Es(a+bX)t = Eeaí s(bt)X = sat Mx(bt). U druhého využijeme skutečnost, že střední hodnota součinu nezávislých veličin je součinem jejich středních hodnot. Mw(t) =Ee'(í+ř) = Ee'1 e,r = Ee'1 Ee,r = Mx(t)My(t). □ Pro ilustraci si spočtěme přímo z definice momentovou funkci náhodné veličiny X s normálním rozložením N (ti, a) a náhodné veličiny X s binomiálním rozložením Bi(n, p). Začneme s veličinou Z ~ N(0, 1) Mz(ř) = a 1 J—co V2tt J—co V2tt t dx = (l2-2£l+í2-í2) dx ■ 2 dx — = eT, kde jsme využili při výpočtu skutečnost, že v předposledním výrazu integrujeme pro každé pevné t hustotu rozdělení spojité náhodné veličiny, proto je tento integrál roven jedné. Jde tedy o případ všude analytické funkce a zejména existují momenty všech řádů. Přímým dosazením jt2 do mocninné řady pro exponenciálu je všechny okamžitě spočteme: Mz(ř) = = l + Oř + iř2 +0*3 +|-ř4 +... 2 4! Zejména tedy znovu vidíme, že střední hodnota Z je skutečně EZ — 0 a její rozptyl je var Z = E Z2 — (EZ)2 = 1. Dosazením do vztahu pro momentovou vytvořující funkci M^+az dostaneme pro X ~ N (ti, a) Mx(t) = e^'e^ŕ- a odtud také okamžitě vidíme, že součet nezávislých normálních rozdělení X ~ N(/x, a) a Y ~ N(/x', cr') má opět normální rozdělení X + F ~ N(/x + /x', cr + cr'). Podobně pro veličinu X ~ Bi(n, p) spočteme snadno (1 - pf = (pe' +(1 - />))" = (p(e' -1) + 1)" = = l+npt + ((^p2 + n^)t2 + .... 563 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY P(X > 5) = 0,95, tj. Fx(4) = P(X < 4) = 0,05. Abychom ji mohli určit, aproximujeme binomické rozdělení podle Moivreovy-Laplaceovy věty normálním rozdělením (předpokládáme hodnota n bude velké, a proto chyba aproximace bude malá). Podle ||F|| má X střední hodnotu EX = | a rozptyl var Z = IJa. Označíme-li tedy Z standardizovanou veličinu, pak danou podmínku můžeme ekvivalentně přepsat 0,05 = P(X < 4) = P Z < 5^ 26 104 -n 5-Jň kde F z ^ $ je podle aproximačního předpokladu distribuční funkce normálního rozdělení N(0, 1). Protože určitě n > 104, tak využitím <ř(-x) = 1 - <ř(x) předchozí rovnice dává n — 104 = <ř_1(0,95) • 5^- Kvantil vystupující v této rovnici má podle tabulek hodnotu z(0,95) = 1,65. Vyřešením této kvadratické rovnice pak obdržíme n = 228,8. Věrka tedy musí koupit aspoň 229 jogurtů. □ 9.66. Určete pravděpodobnost, že při 1200 hodech kostkou padne šestka alespoň 150 krát a nejvýše 250 krát pomocí Čebyševovy nerovnosti a pak pomocí Moivreovy-Laplaceovy věty. Řešení. Označíme-li náhodnou veličinu udávající počet šestek X, pak je zjevně X ~ Bi(1200, ±). Podle ||F|| je tedy E Z = 1200- \ = 200 a varX = 200(1 — \) = 222. Podmínka na počet šestek má ze zadání tvar 150 51) > 1 - = 0,94. 3-512 (2) Přesná hodnota hledané pravděpodobnosti je zřejmě dána výrazem P(150 < X < 250) = Fx(250) - Fx(150), kde Fx je distribuční funkce binomického rozdělení. Z definice tedy P (150 < X < 250) = i=150 Tento výraz je obtížně vyčíslitelný, a proto k jeho odhadu využijeme Moivreovu-Laplaceovu větu. Nahradíme-li X standardizovanou náhodnou veličinou _ V3(Z - 200) íoVš pak podle 9.42 je Z ~ N(0,1), tj. Fz ^ , a tedy P(150 < X < 250) = P( y^(150-200) 10V5 < 2 < V^(250-200) ^ <&(Ví5) - (-^/l5) = 2<ř(Vl5) - 1. Z tabulek <ř(v 15) ^ 0,99994, a proto je hledaná pravděpodobnost asi 99,988%. □ Samozřejmě jsme mohli totéž spočíst ještě snadněji s využitím posledního lemmatu, protože je X součtem n nezávislých veličin Y ~ A(p) s alternativním rozdělením. Je tedy nutně E e :(Eeíy)" = Q, e'+(1-/>))". Opět odtud hned vidíme, že všechny momenty veličiny Y jsou rovny p. Proto E Y = p, zatímco var F = p(l — p). Z momentové funkce Mx(i) odečteme snadno EX = np a varX — = E X2 - (E X)2 = np(l - p). Všimněme si, že náhodná veličina vzniklá jako součet n nezávislých náhodných veličin F, se stejným rozložením se samozřejmě stochasticky chová zásadně odlišně od násobku nY. 9.41. Šikmost a špičatost. Protože je třetí centrální moment dán pomocí třetích mocnin odchylek od střední hodnoty, -W-y^ bude do jisté míry vyjadřovat, jak moc nejsou hod-^ Y n°ty náhodné veličiny rozprostřeny symetricky ko-m/1^^- - lem střední hodnoty. To jsme v popisné statistice sledovali pomocí koeficientu šikmosti. U náhodných veličin se používá se v podobě charakteristiky E(X-EXy (VvarX)3 a říkáme jí koeficient šikmosti náhodné veličiny X. Další běžně užívanou charakteristikou je koeficient špičatosti náhodné veličiny X, který definujeme předpisem 72 = E(X - E xy -3. (varX)2 Viděli jsme, že u normovaného normálního rozdělení je třetí centrální moment nulový a čtvrtý je roven 3. Zvolené normování koeficientu špičatosti je voleno tak, aby jeho hodnota pro normované normální rozdělení byla nulová. Pro obecné rozložení pak špičatost dává srovnání s normálním rozdělením. V praxi se však můžeme setkat i s jinými normováními koeficientů šikmosti a špičatosti. 9.42. Centrální limitní věta. Nyní se konečně dostáváme ke klíčovému nástroji, který propojuje pravděpodobnost a statistiku. Technicky se bude zdát, že jde o vcelku jednoduchou manipulaci s momentovými vytvořujícími funkcemi. Historicky však byly daleko dříve a jinak dokázány mnohé speciální případy, které samy o sobě mají velkou hodnotu, protože často podávají navíc odhady rychlosti konvergence, a ty jsou pochopitelně pro praktické využití třeba. Před formulací výsledku se nejprve zastavme u zobecnění Ber-noulliovy věty o binomickém rozdělení na konci odstavce 9.35. Náhodné veličiny i X„, kde X„ ~ Bi(n, p) můžeme považovat za aritmetický průměr součtu n nezávislých veličin s rozdělením A(p) a samotné Bernoulliho tvrzení pak říká, že tyto průměry konvergují k hodnotě p s pravděpodobností 1. Toto tvrzení platí zcela obecně takto: Lemma. Uvažme posloupnost po dvou nekorelovaných náhodných veličin X\, X2, ..., které mají všechny společnou konečnou střední hodnotu e X; = /j,. Předpokládejme navíc, že tyto veličiny mají konečné rozptyly omezené konstantou var X; < C. Potom pro libovolné £ > 0 platí 1 " lim P(\- y^X; - /x| < e) = 1. 564 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.67. Na fakultě informatiky je 10% studentů s prospěchem do 1,2. Jak velkou skupinu je třeba vybrat, aby s pravděpodobností 0,95 v ní bylo 8-12% studentů s prospěchem do 1,2? Úlohu řešte napřed pomocí Čebyševovy a potom pomocí Moivre-Laplaceovy věty. Řešení. Označme jako Z náhodnou veličinu udávající počet studentů s prospěchem do 1,2 z n vybraných studentů. Při výběru jednotlivého studenta vyberu takového s pravděpodobností 10%, a proto při nezávislém výběru n studentů je Z ~ Bi(rc, 4j). Podle ||F|| je E Z = 0,lrc a var X = 0,09rc. Pro hledanou pravděpodobnost pak podle Čebyševovy nerovnosti 9.35 platí PQX - 0,ln\ S 0,02ři) = 1 - PQX - 0,ln\ > 0,02n) > 0,1 -0,9n _ i 225 n 225 > 1 (0,02rc)2 Nerovnost 1 - ^ > 0, 95 a tedy i P(\X -Q,ln\ < 0,02n) > 0,95 je splněna pro n > 4500. Přesná hodnota pravděpodobnosti je dána pomocí distribuční funkce Fx binomického rozdělení P(0,08rc < X < 0,12rc) = Fx(0,12n) - Fx(0,0Sn). Podle Moivreovy-Laplaceovy věty z 9.42 můžeme standardizovanou náhodnou veličinu Z = w3Xy^n aproximovat normovaným normálním rozložením, Fz ^ <ř, a proto 0,95 = P(0,08n < Z < 0,12n) = P(-^ < Z < ^) ^ Jn Jn x <ť(—) - *(-—) = v 15 15 2<ř(—) V 15 ; 1. Odtud Jň = 15z(0,975) a z tabulek dopočítáme n ^ 864,4. Vidíme tedy, že stačí vybrat 865 studentů. □ 9.68. Pravděpodobnost, že zasazený strom se ujme, je 0,8. Jaká je pravděpodobnost, že z 500 zasazených stromů se jich ujme aspoň 380? Řešení. Náhodná veličina X udávající počet stromů, které se ujaly, má binomické rozdělení X ~ Bi(500, f). Podle ||F|| je EX = 400 a var Z = 80. Standardizovaná náhodná veličina je tedy Z = Podle Moivreovy-Laplaceovy věty je Fz ^ <ř, a proto 380 - 400 JŤÔ P(Z> 380) = P(Z>-=—) « 1 - *(-^—) = v 80 V20 $(-—) R* 0,987. 2 Důkaz. Tvrzení ověříme pomocí Čebyševovy nerovnosti stejně, jako jsme postupovali v závěru odstavce 9.35. Spočteme p(\-Jlxi-^\ >£) < 1 sr^n £?=1varXř c = -2- ^ — ■ Je tedy pravděpodobnost zkoumaná v našem tvrzení odhadnuta zdola výrazem C a lemma je dokázáno. □ Vidíme tedy, že k tomu, aby posloupnosti průměrů po dvou nekorelovaných veličin Xj s nulovou střední hodnotou konvergovaly (ve smyslu pravděpodobnosti) k nule, potřebujeme jen existenci a stejnoměrnou omezenost jejich rozptylů. Náš další cíl bude ambicióznější. Budeme asymptotické chování posloupnosti náhodných veličin X; porovnávat s normálním rozdělením. Chceme přitom uvažovat posloupnost nezávislých normovaných náhodných veličin se stejným rozdělením pravděpodobnosti, které však nemusí být ani normální ani binomické. Předpokládáme tedy EX, = 0 a varX, = 1. Z technických důvodů dále předpokládejme, že existuje momentová vytvořující funkce M x (i) všech veličin X; a že je také stejnoměrně omezený třetí absolutní moment E |X,|3 < C. Aritmetický průměr i Yj=\ ^< Je samozřejmě náhodná veličina se střední hodnotou 0, její rozptyl je ale ^ — K Uvažujme proto místo aritmetických průměrů raději náhodné veličiny 1 " které budou opět normované. Jejich momentové vytvořující funkce jsou (viz lemma 9.40) MSn(t) =Ee* Ei Xi = (Vx(-7=) V V" Vzhledem k předpokladu o normovanosti veličin X, platí Mx(—) = 1 •Jn -0 •Jn 1 2n + o(-), n □ kde opět píšeme o(G(n)) pro výraz, který jde po podělení výrazem G(n) v limitě pro n -» oo k nule, viz odstavec 6.17. V limitě tedy můžeme psát (připomeňme, že třetí absolutní moment je ohraničený konstantou C) lim Ms„ (ŕ) = lim (1 + ^- + o(~Ý ři^oo n^ooy 2n n / To je ale právě momentová vytvořující funkce normálního rozdělení Z ~ N(0, 1), viz konec odstavce 9.38. Naše normované veličiny 5„ tedy asymptoticky mají normované normální rozdělení. Tím jsme odvodili následující základní větu: Věta (Centrální limitní věta). Uvažme posloupnost nezávislých náhodných veličin Xi, které mají společné střední hodnotu EX; = /x 565 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.69. Pomocí distribuční funkce standardního normálního rozdělení určete pravděpodobnost, že při 1600 hodech mincí bude rozdíl mezi počtem padlých hlav a orlů alespoň 82. Řešení. Označíme-li jako X náhodnou veličinu udávající počet padlých hlav, tak X má binomické rozložení pravděpodobnosti Si(1600,1/2) (se střední hodnotou 800 a směrodatnou odchylkou 20) a tudíž lze distribuční funkci veličiny X20°0 Pro dané velké n = 1600 podle Moivreovy-Laplaceovy věty velmi dobře odhadnout jako distribuční funkci <ř standardního normálního rozdělení. Hledaná pravděpodobnost je tedy P [759 < X < 841] -2,05 < X — 800 2<ř(-2, 05) : 20 0,0404. < 2, 05 □ 9.70. Pomocí distribuční funkce standardního normálního rozdělení určete pravděpodobnost, že při 3600 hodech mincí bude rozdíl mezi počtem padlých hlav a orlů nejvýše 66. Řešení. Označíme-li jako X náhodnou veličinu udávající počet padlých hlav, tak X má binomické rozložení pravděpodobnosti Si(3600,1/2) (se střední hodnotou 1800 a směrodatnou odchylkou 30) a tudíž lze distribuční funkci veličiny x^0mo lze pro dané velké n = 3600 podle Moivreovy-Laplaceovy věty velmi dobře odhadnout jako distribuční funkci <ř standardního normálního rozdělení. Hledaná pravděpodobnost je tedy P[1767 < X < 1833] -1,1 S X - 1800 30 *(-l,l) S 1, 1 : 0, 7498 □ 9.71. Pravděpodobnost, že semeno vyklíčí, je 0,9. Kolik semen je třeba zasadit, aby s pravděpodobností aspoň 0,995 vyklíčilo cca 90% semen (což přesněji formulujeme se zpřesňujícím požadavkem, aby odchylka podílu vyklíčených semen od 0,9 nepřevýšila 0,034). Řešení. Náhodná veličina X, udávající počet vyklíčených semen z n zasazených, má binomické rozdělení X ~ Bi(rc, ^). Podle ||F|| je EX = 0, 9n a varX = 0,09rc, a proto je standardizovaná veličina Z = x,» »»". Podmínku ze zadání lze psát ve tvaru P(\X-0,9n\ < 0,034n) 0,034n vU09ři 0,34 ~3 P[\Z\ < P (\Z\ < ^Vň) > 0,995. a rozptyl varX; — a > 0 a stejnoměrně omezený třetí absolutní moment E |X; |3 < C. Pro rozdělení náhodné veličiny -11 platí v limitě vztah lim P(S„ < x) = (x), kde je distribuční funkce normovaného normálního rozdělení. Všimněme si, že v případě centrální limitní věty dostáváme jako výsledek asymptotické chování, které říká, že distribuční funkce jistých veličin se blíží k distribuční funkci normovaného normálního rozdělení. Takovému chování říkáme konvergence podle distribuční funkce. Je zřejmé, že tato konvergence je slabší než je konvergence podle pravděpodobnosti. 9.43. Moivreova-Laplaceova věta. Historicky asi první formulací centrální limitní věty byl případ veličin Yn s binomickým rozdělením Bi(n, p). Ty můžeme chápat jako součet n nezávislých veličin Xi s alternativním rozdělením A(p), 0 < p < 1. Přitom jsme viděli, že tyto veličiny mají momentovou vytvořující funkci aE|X;|3 =p 9. Zkusme si výsledek ilustrovat na konkrétním příkladu. Řekněme, že chceme s chybou nejvýše 5% zjistit, kolik procent studentů má v oblibě danou přednášku. Počet osob majících přednášku v oblibě mezi n náhodně vybranými bude nejspíš mít charakter náhodné veličiny X ~ Bi(n, p). Dejme tomu, že přitom chceme, abychom dosáhli správného výsledku se spolehlivostí (tj. opět pravděpodobností) alespoň 90%. Chceme tedy zajistit '(li X - p\< 0,05 :0,9 tím, že zvolíme dostatečně veliký počet dotázaných studentů n. Nyní můžeme přibližně počítat 0,9: py\-x-p\ < o,05j = 0,05n X = P ~ = 2 y/np(l - p) y/np(l - p) y/np(l - p) ,05n ( ( °'°5" )-J__°- \-Jnp(l - p)J \ yfňp / 0,05« \ \y/np(\-p)) 0,05n y/np(l - p) 566 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Podle Moivreovy-Laplaceovy věty lze pro velké n distribuční funkci aproximovat distribuční funkcí <ř normálního rozdělení. Proto , 0,34 _\ ^/0,34 _\ / 0,34 _ P{\Z\<— ^)-*(—— V~n /0,34 _\ = 2*(— Celkem tedy dostáváme podmínku /0,34 2* ( -t^—s/ň ) - 1 > 0,995. Odtud vypočítáme n > (3z(g-^75)^ ^ 615. □ 9.72. Životnost (v hodinách) určité elektrické součástky má exponenciální rozdělení s parametrem A = ^. Pomocí centrální limitní věty odhadněte pravděpodobnost, že celková životnost 100 takových součástek bude mezi 900 a 1050 hodinami. Řešení. V přikladu ||9.51|| jsem spočítali, že střední hodnota a rozptyl náhodné veličiny Z; s exponenciálním rozdělením jsou rovny El; = j a var Z, = ^. Střední životnost každé z našich součástek je tedy E Z,= [i = 10 hodin s rozptylem var Z; = cr2 = 100. Podle centrální limitní věty se rozdělení transformované náhodné veličiny \7ž IXi (^77^) = T5Ô X)i=°i -^í _ 10 pro rostoucí n blíží normovanému normálnímu rozdělení. Proto hledanou pravděpodobnost pro životnost 100 součástek / 100 \ P(900 (1 - p), Protože p(l — p) nabývá nej větší hodnoty \, můžeme odtud odhadnout potřebný počet n > 270 nezávisle na p. 9.44. Přehled charakteristik některých rozdělení. V dalším se <íjj vrátíme ke statistice a jistě nás nepřekvapí, že bu-•i 0, zatímco fx(x) = 0 pro nekladná x, tj. naše rozdělení X2 odpovídá volbě a — b — 1/2. Tento případ jsme již podrobně diskutovali jako příklad v odstavci 9.25 a proto již víme, že taková funkce bude hustotou pro konstantu c = • Jde tedy o rozdělení T (a, b) s hustotou pro kladná x -L= e-z2'2 dz = f -Lrl'2 e-"2 dt. J-Jx V2tt Jo V2tt fx(x) = T(a) Obecně lze snadno spočíst k-tý moment takové veličiny X: E X = r Jo T(a) i + r) r aW Jo ro T(a + r) T(a + r) -ŕ -1+r B-bx dx = T(a)br ' protože integrál z hustoty rozdělení T (a vovaném vyřazuje nutně roven jedné. 1 v posledním upra- Zejména tedy vidíme, že E X - r(a+l) _ a bT(a) t , zatímco varX — T(a + 2) a2 (a + l)a - a2 b2T(a) ~ b2 ~ ti2 a ti2' 567 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY aproximovat normovaným normálním rozdělením, a proto 44 1000 3Jh: 1000 3Jh: p£> s looo) = piSn s ^-^) * *- Z tabulek najdeme z(0,99) ^ 2,326, takže pro hledané n dostáváme kvadratickou rovnici 1000 3v^ 2,326, □ 0,8V7í 0,8 ze které vypočítáme n m 322. I. Testování výběrů z normálního rozdělení V 9.50 jsme se seznámili s tak zvaným oboustranným intervalovým odhadem neznámého parametru [i normálního rozložení N(/i., a2). V některých případech nás zajímá pouze horní nebo dolní odhad, tj. statistika U respektive L, pro niž P(pt < U) respektive P(L < /x). Mluvíme pak o jednostranném intervalu spolehlivosti (—oo, U) respektive (L, od). Vztah pro výpočet těchto intervalů se odvodí obdobně jako u oboustranného intervalu. Pro náhodnou veličinu Z = *fň^ ~ N(0, 1) tentokrát máme 1 - a = <ř(z(l - a)) = P(Z < z(l - a)). Odtud okamžitě 1 - a = P(X - -4=z(l - a) < ii), tedy L = X - -^z(l - a). Obdobně zjistíme U = X + -^z(l - a) a pro rozdělení s neznámým rozptylem [i > X — 4^r„_i(l— a) a M S X+ -^ín-i(l -a). Pokud potřebujeme odhadnout rozptyl a2 náhodného rozložení, pak stejně jako u odvození odhadu střední hodnoty využijeme větu 9.49. Tentokrát ovšem využijeme její druhou část, podle které má náhodná veličina ^S2 rozložení x2- Okamžitě je pak vidět, že platí 1 " <* = P [xl-M/2) < n-^-S2 < x2_41 - a/2) Oboustranný 100(1 — a)% interval spolehlivosti pro rozptyl je tedy (n - 1)S2 (n - 1)S2 ^2_1(l-a/2)'X2_1(a/2)/ a podobně pro jednostranný horní a dolní odhad dostaneme 2 (n - 1)S2 (n - 1)S2 - , resp. t X2-i(«) xn2-id-«) < a Úplně obdobně spočteme momentovou vytvořující funkci pro všechny hodnoty —b 0 je libovolná konstanta. Při výpočtu použijeme Fubiniho větu o záměnnosti integrování podle jednotlivých proměnných. rOO ruy/c Fu(u) = P(X < (u/c)Y) = / / fx(x)fy(y) dx dy = JO J-co = ío (/ ^fx(-ty/c)fy(y)dt)dy = r n f°° \ = J i-J yfx(ty/c)fy(y)dy\dt. Z tohoto výrazu pro F u (u) okamžitě plyne, že hustota f u náhodné proměnné U je rovna 1 f°° fu(u) = - / yfx c Jo (uy/c)fy(y)dy. Když teď dosadíme hustoty příslušných speciálních gamma rozdělení za X ~ Xt a ľ ~ Xm a za konstantu c zvolíme 568 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.74. Při 600 hodech kostkou padla šestka celkem 45 krát. Je možné tvrdit, že jde o ideální kostku na hladině a = 0,01? Řešení. Pro ideální kostku je pravděpodobnost hodu šestky při každém hodu rovna p = \. Počet šestek v 600 hodech je pak dán náhodnou veličinou X, která má binomické rozdělení X ~ B i (600, g). Toto rozdělení můžeme podle 9.42 aproximovat rozdělením N(100, 2|^). Naměřenou hodnotu X = 45 můžeme považovat za náhodný výběr o jednom členu. Pokládáme-li rozptyl za známý, pak podle 9.50 je pak 99% (oboustranný) interval spolehlivosti pro střední hodnotu [i roven (45 - ^^(0,995), 45 + ^^.(0,995)). Z tabulek zjistíme, že kvan-til přibližně z(0,995) ^ 2,58, což dává interval (21, 69). Na ideální kostce je ale zřejmě [i = 100, a proto nejde v tomto smyslu o ideální kostku na hladině a = 0,01. □ 9.75. Předpokládejme, že výška desetiletých chlapců má normální rozdělení N(/a, a2) s neznámou střední hodnotou [i a rozptylem a2 = 39,112. Změřením výšky 15 chlapců jsme určili výběrový průměr X = 139,13. Určete i) 99% oboustranný interval spolehlivosti pro parametr [i, ii) dolní odhad [i na hladině významnosti 95%. Řešení, a) Podle 9.50 je 100(1 — a)% oboustranný interval spolehlivosti pro neznámou střední hodnotu [i normálního rozložení dán výrazem m/k, dostaneme pro náhodnou veličinu U — jj^ hustotu (9.3) 4=z(l - a/2), X + -^=Z(1 - a/2) ) , Jn Jn kde X je výběrový průměr z n hodnot, a2 je známý rozptyl a z(l — a/2) je příslušný kvantil. Přímým dosazením ze zadání n = 15, a m 6,254 a z tabulek z(0,995) ^ 2, 576 dostaneme ^z(a/2) ^ 4,16, tj. [i € (134,97, 143,29). b) Dolní odhad L parametru [i na hladině významnosti 95% je určen výrazem L = X - -^z(0,95). Z tabulek z(0,95) ^ 1,645, a proto přímým dosazením dostáváme [i e (136,474, oo). □ 9.76. Odběratel provádí kontrolu jakosti námi dodaných výrobků namátkovou kontrolou testovaného rozměru u 21 náhodně vybraných výrobků. Dodávka bude přijata, pokud nebude výběrová směrodatná odchylka překračovat hodnotu 0,2 mm. Víme přitom, že naše stroje produkují výrobky, u nichž má sledovaný rozměr normální rozdělení tvaru N(10mm; 0,0734 mm2). S využitím statistických tabulek určete pravděpodobnost, s níž bude dodávka přijata. Jak se změní odpověď, pokud odběratel kvůli nákladům na testy začne testovat pouze 4 výrobky? fu(u) (k/m} k/2 2(i+m)/2«t/2 lY(k/2)T(m/2) ľ Jo ík+m)/2-\ -y(\+ku/m)/2 dy. (Ověřte si sami!) Poslední integrál obsahuje, až na konstantní násobek hustotu rozdělení T((k + m)/2, (1 +ku/m)/2), takže hledaná hustota bude mít tvar fu(u) ■ T((k + m)/2) fk^t/2 kjl_x k N_ l(l + -u (k+m)/2 T(k/2)T(m/2) Km> Takovému rozdělení se říká Fisherovo-Snedecorovo rozdělení s k a m stupni volnosti, zkráceně také F-rozdělení. Další potřebné rozdělení se objevuje při zkoumání podílu veličin Z ~ N(0, 1) a -JX/n, kde X ~ x2 (tj. zajímá nás poměr Z a směrodatné odchylky nějakého výběru). Spočteme nejdříve opět snadno distribuční funkci pro Y — \fx (všimněme si, že X a tedy i Y nabývají s nenulovou pravděpodobností pouze kladných hodnot) FY(y) = P(VX < ý) = P(X < y2) = ry l io 2™/2r(n/2) y i ^12- -x/2 dy ■- í -r-lS-ř'2dt Jo 2"/2-1r(n/2) Odtud již vidíme, že hustota náhodné veličiny F je 1 fr(y) ■■ -y'/2 2n/2-lr(„/2)J Nyní můžeme použít stejný postup jako v předchozím odstavci u náhodné veličiny U — cZ/Y a volíme c — «Jň, Y — \fx. Dostaneme tedy pro náhodnou veličinu Z T = ,_ ■JX/ň po krátkém výpočtu, podobném jako výše, hustotu fj (i) ve tvaru r((n + l)/2)/ r2\-("+1V2 St (i) = ■ ('4)" Y(n/2)^Jnn Tomuto rozdělení říkáme Studentovo t-rozdělení s n stupni volnosti. 9.46. Vícerozměrné normální rozdělení. Jestliže má ná-' 'l' " hodný vektor Z = (Z\, ..., Z„) nezávislé komponenty tZ, ~ N(0, 1), je jeho varianční matice jednotkovou maticí, tj. var Z = I„. 1 Často ale potkáváme v praktických problémech ná- hodné vektory, které z takového vektoru Z vznikají obecnou afinní transformací U — a + BZ, kde a je libovolný konstantní vektor v W a B je konstantní matice typu (m,n). Jak jsme odvodili ve větách 9.32 a 9.38, takové náhodné vektory mají střední hodnotu E U — a a varianční matici var U — V — BBT (protože varianční matice Z je identická). Je tedy tato varianční matice vždy pozitivně semidefinitní. Říkáme, že náhodný vektor U má mnohoměrné normální rozdělení Nm (a, V). Pro libovolné mnohoměrné normální rozdělení Nm(a, V) můžeme znovu uvážit afinní transformaci W = c + DU 569 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení. Podle zadání hledáme pravděpodobnost P(S < 0,2). Využijeme větu 9.49, podle které má při náhodném výběru n výrobků náhodná veličina ^r-S2 rozdělení Xn-v V našem případě n = 21 a cr2 = 0,0734, a proto P(S < 0,2) = P 20 20 -0,2' X20 20 • 0,22 v0,0734 ~ 0,0734 ) 'l/u \ 0,0734 Výraz v argumentu distribuční funkce je roven přibližně 10,9 a z tabulek pro x2 rozložení zjistíme xf0(10,9) ^ 0,05. Pravděpodobnost, že odběratel dodávku přijme je tedy pouze 5%. To, že tato pravděpodobnost bude malá lze odvodit i bez počítání, platí totiž E S2 = = a2 = 0,0734 > 0,22. Pokud bude odběratel testovat pouze 4 výrobky, pak je zřejmě pravděpodobnost přijetí dodávky dána výrazem X-3 (o 0734) ^ X3 (1>63). Hodnotu distribuční funkce x2 v tomto argumentu nelze ve většině statistických tabulek nalézt. Proto ji odhadneme lineární interpolací. Jsou-li například nejbližší body xf(0,58) = 0,1 a x|(6,25) = 0,9, pak , 0,9-0,1 xf (1,63) « (1,63 - 0,58) ' ' + 0,1 « 0,24. 6,25 — U,J5 Tento výsledek je sice jen odhad, ale určitě bude pravděpodobnost přijetí dodávky v případě testování 4 výrobků výrazně vyšší než v předchozím případě. □ 9.77. Ze základního souboru, z rozdělení N(/x,a2), kde a2 = 0,06 jsme pořídili náhodný výběr s realizacemi 1,3; 1,8; 1,4; 1,2; 0,9; 1,5; 1,7. Určete oboustranný 95% interval spolehlivosti pro neznámou střední hodnotu. Řešení. Ze zadání se jedná o náhodný výběr rozsahu n = 1 z normálního rozložení se známým rozptylem a2 = 0,06. Výběrový průměr je X = ^(1,3 + 1,8 + 1,4+ 1,2 + 0,9+ 1,5 + 1,7) = 1,4 a z tabulek pro danou hladinu spolehlivosti a = 0,05 zjistíme z(l - a/2) = z(0,975) ^ 1,96. Dosazením do (||9.3||) pak ihned dostaneme hledaný interval (1,22, 1,58). □ 9.78. Nechť X\,..., Xn je náhodný výběr z rozdělení N(fi, 0,04). Určete nejmenší počet měření, který je třeba provést, aby šířka 95% intervalu spolehlivosti pro [i nepřesáhla 0,16. Řešení. Protože se jedná o normální rozložení se známým rozptylem, je šířka (1 — a)% intervalu spolehlivosti je podle (||9.3||) rovna ^5=z(l — a/2). Dosazením hodnot ze zadání tedy dostaneme pro počet měření n nerovnici 2-0,2 -z(0,975) < 0,16. s vektorem konstant c e M a libovolnou konstantní maticí typu (k,m). Přímým výpočtem vidíme, že W = c + D(a + BZ) = (c + Do) + (DB)Z, což je samozřejmě náhodný vektor W ~ Nj(c + Da, DBT BDT). Chová se tedy kovarianční matice mnohoměrného normálního rozdělení při afinních transformacích jako kvadratická forma. Tato přímočará úvaha ukazuje, že jakákoliv lineární kombinace komponent složek náhodného vektoru s mnohoměrným normálním rozdělením je náhodná veličina s normálním rozdělením. Stejně je každý vektor vzniklý výběrem jen některých komponent vektoru U opět náhodným vektorem s mnohoměrným normálním rozdělením. Poznamenejme závěrem, že když pro transformaci náhodného vektoru Z ~ N„(0, I„) použijeme ortogonální transformaci s maticí QT, pak můžeme přímo spočíst sdruženou distribuční funkci náhodného vektoru U — QTZ. Skutečně, jestliže transformaci budeme v souřadnicích psát jako t — QT z, pak její inverze je z — Qt a Jakobián této transformace je roven jedné. Proto (všimněme si že také jistě platí J2i z2 = £;«?) Fu(u) = P(Ui < m,-, i = 1, ,n)-. = [■■■[ (lny112 e~ £ z?/2 dz\---dzn = J Jz;QTz 24,01. Je tedy třeba provést aspoň 25 pokusů. □ 9.79. Náhodná veličina X má normální rozdělení N(fi,a2), kde fi, a1 nejsou známy. V následující tabulce jsou uvedeny četnosti jednotlivých realizací této náhodné veličiny. Xi 8 11 12 14 15 16 17 18 20 21 ni 1 2 3 4 7 5 4 3 2 1 Vypočtěte výběrový průměr, výběrový rozptyl, výběrovou směrodatnou odchylku a určete 99% interval spolehlivosti pro střední hodnotu fi. Řešení. Výběrový průměr je dán výrazem X = n;. Dosa- zením hodnot ze zadání máme X = 490/32 m 15,3. Výběrový rozptyl jezdefiniceS = yjn,(X,— Ž)2/(YJ n,— 1). Podosazení danýchhod-not dostaneme S2 = 1943/256 ^ 7,6, a proto výběrová směrodatná odchylka splňuje S ^ 2,8. Vzorec pro oboustranný (1 — a)% interval spolehlivosti pro střední hodnotu fi při neznámém rozptylu jsme odvodili na konci části 9.50 fl € \ X ín-i(l - a/2), X+—1^(1 V" ■a/2) Přímým dosazením X = 15,3, n = 32, S ^ 2,8, a = 0,01 a z tabulek /31 (0,995) 2,75 pak zjistíme, že 99% interval spolehlivosti je fi € (14,0,16,7). □ 9.80. Pomocí přiložené tabulky distribuční funkce standardního normálního rozdělení určete pravděpodobnost, že při 3600 hodech mincí bude rozdíl mezi počtem padlých hlav a orlů větší než 90. Uvažme jednoduchý příklad, kdy si sami zhotovíme dřevěnou minci s rubem a lícem. Hodíme jí n-krát a víme, že přitom padlo k < n líců. Chceme z tohoto ex--i»_^eľziperimentu vyvodit závěr, s jakou pravděpodobností v dalších dvou hodech padne vždy líc. K této úloze můžeme mít dva základní přístupy. Jedním je tzv. klasická statistika (neboli frekvenční statistika). Vyjdeme z předpokladu, že jednotlivé hody jsou nezávislé a ve všech je stejná pravděpodobnost líce dána objektivně existujícím parametrem 9 — p (který jen dosud neznáme). Jednotlivé hody tedy považujeme za realizaci náhodné veličiny X s alternativním rozdělením pravděpodobnosti. Pravděpodobnost, že padlo k líců z n pokusů je dána binomiálním rozdělením a lze očekávat že „nejlepší možný" odhad parametru p bude dán poměrem 9 — k/n. Obvyklým cílem je pak opatřit takový odhad vyjádřením o jeho spolehlivosti, který můžeme odvinout od znalosti celkového počtu pokusů n a znalosti asymptotického chování modelu při rostoucím n. Jestliže tedy např. padne 8 líců z 10 pokusů, budeme s jistou (matematicky odhadnutou) spolehlivostí tvrdit, že pravděpodobnost dvou následujících líců bude 0,82 = 0,64, tj. výrazně více než polovina. Druhou možností je postupovat víceméně naopak. Můžeme totiž považovat parametr 9 za náhodnou proměnnou, data získaná experimentem za konstanty a pokoušet se z nich vydedukovat informace o rozložení pravděpodobnosti této náhodné veličiny 9. Vycházíme přitom z nějakých vstupních informací o tomto rozložení. Jestliže tedy např. budeme předpokládat, že mince vznikla z homogenního materiálu vcelku přesným soustružením a následným rozlišením lícu a rubu barevným nátěrem, můžeme jako vstupní předpoklad o 9 použít rovnoměrné rozdělení pravděpodobnosti rozložené na malinkém intervalu odpovídajím přesnosti soustruhu. Pak ovšem lze očekávat, že stejný experiment také povede k vychýlení odhadu pravděpodobnosti dvou následujících líců od hodnoty 0,52 = 0,25 pro dokonalou minci, půjde ale patrně o poněkud menší pravděpodobnost než v předchozím postupu. Hovoříme tu o tzv. bayesovské statistice. První přístup vychází z ryze matematické abstrakce, že pravděpodobnosti jsou dány četnostmi výskytů jevů v tak velkých vzorcích dat, že je můžeme dobře aproximovat nekonečnými modely a využít pro odhady spolehlivosti centrální limitní věty. Statistik zde na pravděpodobnost pohlíží jako na idealizaci relativní četnosti případů, v nichž se vyskytne určitý výsledek při opakovaných pokusech. Tato zdánlivá výhoda/rigoróznost se může ale rychle stát nevýhodou, jakmile se začneme zabývat spolehlivostí samotných dat a vhodností zvoleného experimentu. Stejně tak je obtížné frekvenční statistiku dobře použít pro odhad pravděpodobnosti výskytu jednorázového děje. Bayesovská statistika je naopak příkladem matematizace „selského rozumu", když chceme naše původní přesvědčení postupně pozměňovat ve světle nových dat. Je zajímavé, že historicky byl zjevně první bayesovský přístup (např. Lapiace a další již v 18. století), který byl prakticky zcela vystřídán frekvenční statistikou ve 20. století. V posledních desetiletích se však ale bayesovská statistika vrátila, společně s dalšími novými přístupy, do popředí zájmu. 571 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Standard Normal Distribution Table V Řešení. Označíme-li jako X náhodnou veličinu udávající počet padlých hlav, tak X má binomické rozložení pravděpodobnosti Bi(3600,1/2) (se střední hodnotou 1800 a směrodatnou odchylkou lze pro dané velké 30) a tudíž lze distribuční funkci veličiny x~3q8( n = 3600 podle Moivreovy-Laplaceovy věty velmi dobře odhadnout jako distribuční funkci <ř standardního normálního rozdělení. Hledaná pravděpodobnost je tedy P = 1 - P[1755 < X < 1845] = 1 - P X - 1800 1,5 < -—- < 1,5 30 2<ř(-l,5) = 0,1336, kde poslední hodnotu jsme zjistili z přiložené tabulky. □ 9.81. Pravděpodobnost narození chlapce jeO, 515. Jaká je pravděpodobnost, že mezi deseti tisíci novorozenci bude stejně nebo více děvčat než chlapců. Řešení. X — 5150 -150 P[X < 5000] = P[ V5150-0,485 V5150-0,485 ~A<(0,1) -3,001... 0,00135 □ 9.48. Náhodný výběr z populace. Budeme se nejprve zabývat prvním přístupem z předchozího odstavce. Předpokládejme tedy, že máme k dispozici (velký) základní statistický soubor s N jednotkami, který nazýváme populace, a zároveň nějaký číselný znak pro každou z jednotek, tj. soubor hodnot (x\, ..., x^). Z něj ovšem máme k dispozici pouze výběrový soubor s hodnotami (X\,... ,X„). Abychom se vyhnuli diskusi skutečné velikosti základního statistického souboru s N jednotkami, budeme předpokládat, že vybíráme položky výběrového souboru jednu po druhé a každou vybranou jednotku poté do populace vracíme. Zároveň předpokládáme, že každá položka má stejnou pravděpodobnost výběru l/N. Hovoříme pak o náhodném výběru. Způsob realizace náhodného výběru nyní interpretujeme tak, že pracujeme s vektorem (Xi, ..., X„) nezávislých náhodných veličin a že všechny tyto veličiny mají stejné rozdělení pravděpodobnosti. Zejména tedy budou sdílet distribuční funkci Fx(x) a momenty EX; = ji, varX; = a2. Dalším naším krokem musí být odvození charakteristik výběrového průměru X a výběrového rozptylu 1 " n — 1 xy přičemž následující věta dává hned zdůvodnění, proč volíme koeficient -^-y místo i, jak tomu bylo u s2 v odstavci 9.6. Věta. Pro výběrový průměr X spočítaný z náhodného výběru rozsahu n z rozdělení s konečnou střední hodnotou /j, a konečným rozptylem a2 platí EX — ß, varX =- X; = í=1 Přímým roznásobením se ověří vztah ;=l ;=l 572 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.82. Pomocí distribuční funkce standardního normálního rozdělení určete pravděpodobnost, že při 18000 hodech šestibokou kostkou padne alespoň 3100 šestek. Řešení. Obdobně, jako v předchozích příkladech. X má binomické rozdělení pravděpodobnosti Si(18000, 1/6). Určíme střední hodnotu ((1/6)(18000) = 3000), směrodatnou odchylku V((l/6)(1 - 1/6)18000) = 50, tedy veličinu lze odhadnout jako distribuční funkci <ř standardního normálního rozložení: P[X > 3100] = P = P X — 3000 3100- 3000 > 50 X - 3000 50 > 2 50 1 - <ř(2) = 0,0228. □ 9.83. Agentura pro výzkum veřejného mínění pořádá průzkum volebních preferencí pěti vybraných politických stran. Kolik náhodně vybraných respondentů se musí výzkumu zúčastnit, aby byly s pravděpodobností 0,95 výsledky průzkumu byly u všech zkoumaných stran v rozmezí ±2% od skutečných preferencí? Řešení. Nechť piyi = 1... 5 je skutečná relativní četnost příznivců i-té politické strany v populaci a nechť náhodná veličina Z, udává počet příznivců této strany mezi náhodně zvolenými n voliči. Budeme považovat za nezávislé jevy, že do daného intervalu padne Xi/n. Pokud zvolíme n takové, že pro všechna i padne Xt/n do daného intervalu s pravděpodobností alespoň ^0,95 = 0,99, bude požadavek zadání splněn. Hledejme tedy n takové, že P[|f — p\ < 0,02] > 0,99. Nejprve upravme vyjádření hledané pravděpodobnosti: X — p < 0,02 n X -0,02 <--p < 0,02 n P [-0,02 -n < X- pn < 0,02 • n] P 0,02 -n X - pn 0,02 • n < — — < 2* Jnp(l - p) Jnp(l - p) Jnp(l - p) 0,02 -n \ ( 0,02 -n -JnpiX - p) 0,02 • n s/np{\ - p) -JnpiX - p) Můžeme tedy spočíst: Es2 =-Ey(Xi-/i)2--(X-/i)2 = var X : = (i--v2. n Proto upravujeme rozptyl s2 vynásobením koeficientem -^r\ a dostáváme právě výběrový rozptyl 52 a jeho střední hodnotu a. Tato poslední úprava samozřejmě nemá smysl pro n — 1. □ 9.49. Náhodný výběr z normálního rozdělení. V praktických úlohách je třeba znát nejen číselné charakteristiky výběrového průměru a rozptylu, ale jejich úplné rozdělení pravděpodobnosti. To můžeme samozřejmě odvodit, 'í-'-7' pouze známe-li konkrétní rozdělení pravděpodobnosti X,. Jako užitečnou ilustraci si spočtěme výsledek pro náhodný výběr z normálního rozdělení. Již jsme ověřili jako příklad na vlastnosti momentových vytvořujících funkcí v 9.40, že součet náhodných veličin s normálními rozděleními je opět normální rozdělení. Odtud je zřejmé, že i výběrový průměr musí mít normální rozdělení a protože již známe jeho střední hodnotu a rozptyl, bude X ~ N(/x, \o2)- O něco složitější je to s odvozením rozdělení pravděpodobnosti výběrového rozptylu. Tady si pomůžeme úvahami o mno-homěrných normálních rozděleních z odstavce 9.40. Uvažme vektor Z normovaných normálních veličin _ X; - fl — a Stejnou vlastnost má i vektor U — QT Z s jakoukoliv ortogonální maticí Q. Vždy přitom také platí Uf — JZ; X?. Zvolíme si takovou matici Q, aby první komponenta U\ byla, až na násobek, rovna výběrovému průměru Z. Tzn. zvolíme si první sloupec matice Q ve tvaru (1, • • •, 1). Pak tedy U2 — nZ2 a můžeme počítat: £u2 = ±Z2 = ±(Zi-Z)2 + nZ2 í = l í = l í = l n n . n j^u^^-zý^-Ĺ^-x)2. í=2 í=1 í=1 Je tedy násobek výběrového rozptylu s+rS2 součtem n — 1 kvadrátů normalizovaných normálních veličin a dokázali jsme následující tvrzení: Věta. Je-li(X\, X„) náhodný výběr z rozdělení'N'(/x, a2),pak jsou X a S2 nezávislé veličiny a platí 1 o X ~N(/x, -a2), n - 1 S2 ~ xl-i ■ Okamžitým důsledkem je, že normalizovaný výběrový průměr T — J n- 5 má studentovo t-rozdělení pravděpodobnosti s n — 1 stupni volnosti. 573 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY kde je distribuční funkce normálního rozdělení. Řešme tedy nerovnici: 2<ť 0,02 • n yjnpil - p) 0,02 • n y/np{\ - p) 1 > 0,99 > 0,995 Protože distribuční funkce je rostoucí je poslední podmínka ekvivalentní 0,02 • n yjnpil - p) 0,02 • n y/np(l - p) > í"1 (0,995) > 2,576 > 50 • 2,576 • x/pil - p) =^ n > (25 • 2,276)2 • 4147 Při tom jsme použili faktu, že funkce p(l — p) nabývá svého maxima pro P = \ a tímto maximem je \. Vidíme, že pokud např. p = 0,1,pak je *Jp(l ~~ P) = 0,3 a hodnota minimálního n je menší. To odpovídá očekávání: k odhadu méně populárních stran, stačí méně respondentů (pokud agentura odhadne zisk takové strany jako 2% bez toho, aniž by se někoho ptala, tak má požadovanou přesnost téměř jistě zaručenu). □ 9.84. Dvou výběrový test Uvažme dva náhodné vektory Y\ a ^.jejichž všechny složky jsou po dvou nezávislé náhodné veličiny s normálním rozdělením, a předpokládejme, že složky vektoru F, mají stejnou střední hodnotu pí, zatímco rozptyl a je stejný pro všechny komponenty. Použijte obecný lineární model pro testování hypotézy, zda P\ = M2- Řešení. Budeme postupovat velmi podobně jako v odstavci 9.57 vedlejšího sloupce. Tentokrát můžeme zapsat oba vektory F, do jednoho sloupce pod sebe a budeme uvažovat model Y\m Yn \Y2nJ 1 0 1 1 Vi i/ + aZ. 9.50. Bodové a intervalové odhady. Nyní máme vše připravené v- pro odhady hodnot parametrů v kontextu frekvenční statistiky. Budeme si postup ilustrovat na konkrétním l> V- • jednoduchém příkladu. Řekněme, že máme v kurzu -4- s 500 studenty výsledky jejich spokojenosti z ankety z minulého semestru ve formě bodů 1-10. Předpokládejme, že spokojenost jednotlivých studentů X, je aproximována náhodnou veličinou s rozdělením N(p, a2), přičemž zjištěné hodnoty z celé populace minulého semestru jsou p = 6, a =2. V běžícím semestru je provedeno namátkové šetření u 15 studentů, protože panuje obava, že nový vyučující má ještě výrazně horší ohlasy. Výsledkem je hodnocení, kde se vyskytují dvě 3, tři 4, tři 5, pět 6 a dvě 7. Výběrový průměr je tedy X = 5,133, výběrový rozptyl 52 = 1,695. Díky našim předpokladům víme, že X ~ N(/x, a2/n) a tedy Z = y/ň^p^ ~ N(0, 1). Pro vyjádření spolehlivosti našeho odhadu tedy můžeme počítat interval, který bude odhadovaný parametr obsahovat s předem zvolenou pravděpodobností 100(1— a) %. Hovoříme přitom o hladině spolehlivosti 0 < a < 1. Nejprve považujme za neznámý nový parametr /í, zatímco o rozptylu budeme (ať už oprávněně nebo ne) předpokládat, že zůstal stejný. Dostaneme okamžitě l-a = P(\Z\ t„1+„2_2(Q!). □ 9.85. V JZD1 Tempo sledovali v pěti různých dnech dojivost krav a naměřili postupně tyto výsledky: 15,14,13,16 a 17 hektolitrů. V JZD Boj, ve kterém mají stejný počet krav, měřili přibližně ve stejnou dobu, nicméně v sedmi různých dnech: 12, 16, 13, 15, 13, 11, 18 hektolitrů. a) Určete 95% interval spolehlivosti pro dojivost krav v JZD Boj, a 95% interval spolehlivosti pro dojivost krav v JZD Tempo. b) Na pětiprocentní hladině otestujte hypotézu, že v obou družstvech mají stejně kvalitní krávy. Předpokládejte, že dojivost krav v jednotlivých dnech se řídí normálním rozdělením. Oba výpočty provedte jak za předpokladu, že v družstvech mají k dispozici údaje z předchozích dlouhodobých měření, ve kterých byla směrodatná odchylka a = 2 hl mléka, tak v případě, že údaje z předchozích měření nejsou k dispozici. Řešení. Nejprve spočítejme výsledky za předpokladu známého rozptylu. K určení intervalu spolehlivosti použijeme statistiku X- /x U = 1 'JZD —jednotné zemědělské družstvo — zemědělské družstvo vzniklé násilnou kolektivizací v padestátých letech dvacátého století. takže už na úrovni 3% spolehlivosti máme za to, že je názor na učitele skutečně horší. To odpovídá intuici, že nejspíš by výrazně menší výběrová směrodatná odchylka 5 = 1, 302 než odchylka a — 2 z minulého šetření také měla být podstatná pro naše úvahy. 9.51. Věrohodnost odhadů. Matematicky jsou intervalové a bodové odhady jednoduché a patrně dobře pochopitelné. Daleko horší je to s interpretací praktickou. Jednak je problematické ověřit všechny předpoklady o náhodnosti výběru, ale hlavně ve složitějších případech budeme mít problém s „věrohodností odhadů". Jako matematici se praktickému problému nejlépe vyhneme tak, že podáme definici chybějícího pojmu. Obecně chceme pracovat s náhodným výběrem o rozsahu n. Implicitně stále předpokládáme, že jde o nezávislé náhodné veličiny X; se shodným rozdělením pravděpodobnosti, které ale závisí na neznámém, obecně vektorovém, parametru 9. Snažíme se najít nějakou výběrovou statistiku T, tj. funkci náhodných veličin X\, X2, ..., která v nějakém (matematickém) smyslu bude dobře odhadovat skutečnou hodnotu parametru 9. Říkáme, že je T nestranným odhadem parametru 9, jestliže je E T — 9. Střední hodnota E(7" — 9) se nazývá vychýlení odhadu T. Často nás zajímá také asymptotické chování odhadu, tj. jak se chová při limitním přechodu n —> 00. Říkáme, že je 7" = T(ri) konzistentním odhadem parametru 9, jestliže konverguje T(n) v pravděpodobnosti k 9, tj. pro každé £ > 0 lim P(\T(n) -e\ < s) = 1. Čebyševova nerovnost nám okamžitě dává P(\T(n)-ETn\ <£)>!- var T (ji) Pokud předpokládáme, že lim^co E T(n) = 9, pak zároveň pro dostatečně velká n platí P(\T(n)-9\ < 2e) > P(\T(n)-ET(n)\ < e) > 1 - Dokázali jsme užitečné tvrzení: varT(n) Věta. Předpokládejme, že platí liain^^ E T (n) —9a zároveň předpokládejme lim^co var T(n) = 0. Pak je T(n) konzistentním odhadem pro 9. Jednoduchým příkladem pro použití této věty je rozptyl Protože nestranným odhadem je podle věty z odstavce 9.48 52, ím a1 a lze přímo spočíst také víme, že a1 nestranný odhad není. Zřejmě však platí linin^oo a1 2a * 00 n — 1 : 0. Je tedy statistika s konzistentním odhadem rozptylu. 575 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY která má standardizované normální rozdělení pravděpodobnosti (viz 9.26). Interval spolehlivosti pak je (viz 9.50) X - 4=z(a/2), X + 4=z(a/2) V" v" kde a = 0, 05. Nyní pouze dosadíme číselné hodnoty. Pro údaje z JZD Tempo tak dostáváme výběrový průměr - 15 + 14+13 + 16+17 Xl =-5-= 15' z tabulek či matematického softwaru zjistíme, že z(0,025) = 1,96 a dostáváme interval 15 - -^=1,96,15 + "7=1,96) = (13,25; 16,75). V5 V5 / Pro JZD Boj pak dostáváme - 12+16+13 + 15 + 13 + 11 + 18 Xi =---= 14, a 95% interval spolehlivosti pro hodnotu dojivosti krav v JZD Boj tak je (12,52; 15,48). Pokud je rozptyl měření neznámý, použijeme k jeho odhadu tzv. výběrový rozptyl a k určení intervalu spolehlivosti pak statistiku X-ii T =- n která má Studentovo rozložení pravděpodobnosti s n — 1 stupni volnosti (viz též 9.50). Potom analogicky obdržíme 95% interval spolehlivosti S -S X - — ř„_1(a/2), X + —ř„_1(a/2) V" v" Pro konkrétní hodnoty pak dostáváme pro JZD Tempo výběrový rozptyl ,2 _ O2 + (-1)2 + (-2)2 + l2 + 22) 2,5, tedy S = 1,58. Dále je /4(0, 025) = 2, 78. 95% interval spolehlivosti hodnot dojivosti krav v JZD Tempo tedy je (13,03; 16,97). Pro JZD Boj pak dostáváme výběrový rozptyl S\ = 6 a hledaný interval spolehlivosti je pak (11,73; 16,27). b) Jestliže srovnáváme střední hodnoty dojivosti v obou družstvech, jedná se o porovnání středních hodnot dvou nezávislých výběrů z normálních rozložení. V případě neznámých rozptylů měření navíc předpokládejme, že rozptyl měření je v obou družstvech stejný. Je vcelku zřejmé, že pro stejný parametr můžeme mít k dis-í ., pozici spoustu nestranných odhadů. Např. jsme viděli, že taritmetický průměr X je nestranným odhadem střední hodnoty 9 rozdělení veličin X,-. Samozřejmě je ale třeba hod-l nota X\ také nestranným odhadem 9. Chceme proto najít nej lepší odhad T ve třídě uvažovaných statistik, které jsou nestrannými nebo konsistentními odhady. Zpravidla máme za to, že nej-lepším odhadem je ten, který má ze všech uvažovaných nejmenší možný rozptyl. Připomeňme, že rozptyl vektorové statistiky T je dán kovarianční maticí, která bude, v případě nezávislých komponent, diagonální maticí s jednotlivými rozptyly komponent na diagonále. Nerovnostem mezi pozitivně deflnitními maticemi jsme již dříve dali jednoznačný smysl. 9.52. Maximální věrohodnost. Předpokládejme tedy, že náš výběr má komponenty s rozdělením, jehož hustota je dána funkcí f(x,9) závislou na neznámém (obecně vektorovém) parametru 9. Sdružená hustota vektoru {X\, ..., X„) je díky předpokládané nezávislosti dána součinem funkcí ,xn,9) = f(xu9)---f(x„,9), které říkáme věrohodnostní funkce. Zajímáme se o takovou hodnotu 9, která maximalizuje na množině všech dostupných hodnot parametru věrohodnostní funkci. V diskrétním případě to znamená, že vybíráme takový parametr, při kterém vychází nej větší pravděpodobnost zjištěného výběru. Zpravidla ale pracujeme s tzv. logaritmickou věrohodnostní funkcí í(xx, ,x„,9) =ln/(*i, xn,9) = £ln/(*,-, 0), protože díky monotónnímu chování funkce ln je maximalizace věrohodnostní funkce ekvivalentní požadavku maximalizace logaritmické věrohodnostní funkce. Pokud je pro nějaké hodnoty f {x\, ..., x„) — 0, klademe t(x\, ..., xn, 9) — — oo. V případě diskrétních náhodných veličin použijeme stejnou definici s pravděpodobnostní funkcí místo hustoty, tj. í(xu Princip je dobře vidět na náhodném výběru z normálního rozdělení N(/x, a2) o rozsahu n. Neznámé parametry jsou [i nebo a, nebo oba. Uvažovaná hustota je fix, ji, a) ■- 1 27ia2 a tedy logaritmováním okamžitě vidíme i(x, fi, a) 1 1 " = -"^ ln(27r-hodnota testu (viz 9.55) je 39, 4%, tudíž jsme se k zamítnutí hypotézy moc nepřiblížili (pravděpodobnost, že hodnota zkoumané statistiky bude menší než 0,854 je při platnosti nulové hypotézy 60, 6%). Pokud neznáme rozptyly měření, ale víme, že v obou družstvech musí být stejné, použijeme statistiku K (Xi - X2) - (Mi - [I2) S*Jni + n2 X\ — X2 S*J n, + n 2 kde (ni - 1)S\ + (n2 - 1)S22 n\ + n2 — 2 Po dosazení číselných hodnot dostáváme K = 0,796, \K\ < tw(0, 025) = 2,2281, nulovou hypotézu tedy opět nezamítáme. Dosažená p-hodnota testu je 44,6%, tedy ještě větší než v testu předešlém. □ 9.86. Analýza rozptylu jednoduchého třídění. Pro k > 2 nezávislých výběrů F, o rozsahu rc, z normálních rozdělení se stejným rozptylem použijte lineární model na testování hypotézy, že všechny střední hodnoty jednotlivých výběrů jsou shodné. Maximum najdeme pomocí derivací (všimněme si, že a chápeme při derivování jako symbol pro proměnnou): dt 1 A 1 , A , TjTT = -^2 2J.-V(xi - = r-2 (-"v + l^x>) ;=i i=l dí n 1 ^tj—~\ j ^2 - -2^ + -^^-^ 2\ otáčíme náš přístup a zjištěná data X\, ..., X15, tj. "^"ňř^JTf1 body vyjadřující spokojenost dotázaných studentů na škále 1, ..., 10 bodů, budeme chápat jako konstanty. Naopak, odhadovaný parametr /x, tj. střední hodnota bodů vyjadřujících spokojenost, bude náhodnou veličinou, jejíž rozložení chceme odhadnout. Za tímto účelem zkusme interpretovat Bayesův vzorec pro podmíněnou pravděpodobnost na úrovni pravděpodobnostních funkcí, resp. hustot pravděpodobností, následujícím způsobem. Má-li vektor (X, @) sdruženou hustotu f(x, 9), pak podmíněná pravděpodobnost komponenty & za podmínky X = x je dána hustotou g(.8\x) ■ f(x\0)g(0) f(x) ' kde fix) a g (6) jsou marginální hustoty pravděpodobností. Jestliže tedy máme dánu apriorní hustotu rozložení pravděpodobnosti g(9) odhadovaného parametru 9 a známe také hustotu pravděpodobnosti f (x\9), můžeme ze vztahu spočíst aposteriorní hustotu pravděpodobnosti g(9\x) vycházející právě ze zjištěných dat. Protože data X jsou přitom konstantní, nepotřebujeme ve skutečnosti vůbec počítat s hodnotou f(x) a při úvahách budeme pracovat jen „až na konstantní násobek'. Ten je totiž stejně určen na konci úvah jednoznačně požadavkem, aby vyšla dobře definovaná hustota rozdělení pravděpodobnosti g(9\x). Budeme pro tento účel používat zápis Q cc R, jestliže existuje konstanta C taková, že pro výrazy Q a R platí Q = CR. Abychom byli technicky co nejblíže k úvahám v odstavci 9.50, budeme pracovat s normálními rozděleními N(/x, a2). Předpokládejme, že na univerzitě je spokojenost studentů v jednotlivých předmětech náhodná veličina X ~ N(9, a2), zatímco parametr 9 dosahovaný jednotlivými učiteli je náhodná veličina 9 ~ N(a, b). 577 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení. Postup je zde velice podobný minulému přikladu, platnost testované hypotézy je ale ekvivalentní tvrzení, že platí podmodel, ve kterém mají všechny složky náhodného vektoru Y vzniklého sloučením daných k vektorů F, stejnou střední hodnotu. Použitý model tedy bude mít tvar /Yn\ Í21 Vbit/ /l o 1 o 0 1 o o \o o o o 1/ + crZ. Snadno spočteme odhady středních hodnot \m pomocí aritmetických průměrů n, Odtud dostaneme odhad = Yt a proto dostaneme reziduálni součet čtverců ve tvaru k ni Odhadem společné střední hodnoty v uvažovaném podmodelu je . k ni 1 k í=1 7=1 í=1 kde n = n i + • • • + «i, a reziduálni součet čtverců v tomto podmodelu je i=l j=\ V původním modelu máme k nezávislých parametrů /i.,-, zatímco v podmodelu zůstal jediný parametr fi, testovaná statistika má proto tvar ^ (n-k) (RSď - RSS) (k-1) RSS □ J. Lineární regrese S lineární regresí jsme se už setkali ve třetí kapitole, v odstavci ||3.46||. Nyní se stejný princip budeme snažit využít k vyřešení problémů, které bývají studovány statistiky. Standardním příkladem užití lineární regrese je „proložení přímky" danými daty. Máme tedy posloupnost měření, ve kterých zaznamenáváme hodnoty dvou veličin u nichž předpokládáme lineární závislost. Klasickým příkladem je závislost výšky syna na výšce otce. Můžeme tedy počítat (pořád až na konstantní násobky, tj. ignorujeme součinitele, ve kterých nevystupuje ani x ani 9) g(9\x) Oje váha jednoho názoru stále rostoucí a v našem výsledku tomu odpovídá 100% váha u x v případě a — 0. Je to plně v souladu s interpretací, že Bayesovská statistika je pravděpodobnostní rozšíření standardní diskrétní matematické logiky. Jestliže máme rozptyl a prakticky nulový, pak je tedy v tomto smyslu skoro jisté, že názor kteréhokoliv studenta je naprosto vypovídající o celé populaci. Ve skutečnosti jsme v odstavci 9.50 pracovali s výběrovým průměrem X výsledku šetření. Ten můžeme použít i v předchozím výpočtu, protože jde opět o normální rozdělení, jen budeme místo a2 dosazovat a2In. Pro zjednodušení zápisu si definujme konstantu nb2 " nb2 + a2 a aposteriorní odhad pro 9 na základě zjištěni výběrového průměru X má rozložení s parametry 9 ~N(c„X + (l -cn)a,c ,a2/n). Jak se dalo očekávat, pro rostoucí n se bude střední hodnota našeho rozdělení pro 9 stále více blížit výběrovému průměru a jeho rozptyl půjde k nule. Čím je tedy n větší, tím více se blížíme bodovému odhadu z frekventistického přístupu. Přínosem Bayesovského přístupu je, že s použitím odhadnutého rozdělení můžeme odpovídat na dotazy typu „s jakou pravděpodobností je nový vyučující horší než předchozí?" Použijeme stejná data jako v 9.50 a přidáme potřebné apriorní údaje. Předpokládejme, že máme docela dobře hodnocené učitele (protože by asi jinak na škole nevydrželi), takže uvažujme pro určitost a = 7,5, b = 2,5 a a ponecháváme směrodatnou odchylku a —2. 578 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.87. Určete lineární regresní model pro závislost veličiny Y na veličině X na základě naměřených seznamů dat: X = [1,4, 5, 7, 10], Y = [3,7, 8, 12, 18]. Řešení. K určení parametrů regresní přímky použije vztahů odvozených v 9.57. Podle metody nejmenších čtverců se snažíme se minimalizovat vzdálenost vektoru b{X + bo od vektoru Y v závislosti na parametrech b\ a bo. Tato vzdálenost, jak víme například ze druhé kapitoly, je minimální pro kolmý průmět vektoru Y do vektorového podprostoru generovaného vektory (1,..., 1) a (x\,..., xn). Pro parametry bo,bi regresní přímky Y = b{X + bo tak dostáváme bi _(1 - 5,4)(3 - 9,6) + ■ ■ ■ + (10 - 5,4)(18 - 9,6)_ "((1 - 5,4)2 + (4 - 5,4)2 + (5 - 5,4)2 + (7 - 5,4)2 + (10 - 5,4)2 =1,677. Teď již snadno dopočteme i koeficient b0: b0 = Ý - bxx = 0,5442. Hledaná lineární závislost je tedy Y = 1,677 ■ X + 0, 5442. Poznamenejme, že v tomto modelu hrají veličiny X a Y naprosto rovnocennou úlohu. Stejnou metodou jsme mohli získat závislost X naY: X = 0,5867 • Y - 0,2322. □ Poznámka. Rozmyslete si, proč lineární regresní model závislosti X na Y nelze získat pouhým vyjádřením X z lineárního regresního modelu závislosti Y na X. Poznámka. V řadě reálných situací je závislost veličin jasně dána, například je-li jednou z veličin čas. 9.88. Orbitální stanice naměřila v pěti po sobě jdoucích dnech, ve stejnou hodinu následující rychlosti neznámého vesmírného tělesa (v km/s): 10, 11,4, 13,1, 15,8 a 18,7. Odhadněte rychlost tělesa desátého dne. Řešení. Zde je vhodné si všimnout, že rychlost se v čase „od pohledu" nemění lineárně (nárůsty rychlosti se neustále zvyšují). Lze tedy vyslovit domněnku, že je těleso přitahováno gravitační silou k nějakému jinému tělesu. Potom by jeho rychlost byla kvadratickou funkcí času. Zkusme tedy metodou nejmenších čtverců proložit co nejpřesněji kvadratickou funkci danými daty. Postup je stejný, jako Měli jsme n = 15 a výběrový průměr 5,133. Dosazením dostaneme aposteriorní odhad pro rozdělení 9 ~N(5,230, 0,256). Zajímá nás teď P (9 < 6). Odpověď získáme dotazem na hodnotu distribuční funkce příslušného normálního rozdělení pro argument 6 (umí to i excel). Dostaneme odpověď přibližně 93, 6%. Je tedy podobná, jako jsme viděli v odstavci 9.50 v případě předpokladu o konstantním známém rozptylu. Všimněme si, jak se tady projevuje apriorní předpoklad o rozložení parametru 9 u všech učitelů, tj. jistá míra naší důvěry, že by měli být učitelé spíše lepší. Kdyby měl statistik důvod předpokládat, že pro konkrétně poptávaného učitele je skutečná střední hodnota a posunutá, řekněme na a = 6 stejně jako u ankety minulého učitele (např. protože jde o těžký a neoblíbený předmět), pak bychom dostali pravděpodobnost, že je jeho skutečný parametr menší než 6, přibližně 95,0% (pokud bychom ale za viditelně horší považovali až střední hodnotu menší než 5,5, pak už to bude jen přibližně 75%). V případě dosazení a = 5 to již bude 96,8%. Stejně tak hraje roh i rozptyl b1. Např. apriorní odhad a — 6, b = 3,5 vede na pravděpodobnost 95,2%. Právě jsme se mimoděk dotkli jiného velice podstatného bodu a to analýzy citlivosti. Jistě bychom rádi pracovali ve výše uvedeném příkladu s modelem, kde malá změna apriorního předpokladu bude mít jen malý vliv na aposteriorní výsledek. Zdá se, že v našem případě to tak skutečně je, nepůjdeme tu do detailních úvah. Úplně stejný model s exponenciálními rozděleními se prakticky používá při posouzení relevance výstupu z IQ testu u jedné osoby (nebo jiné obdobné zkoušky, kde lze očekávat dobré přiblížení rozdělení pravděpodobnosti výsledků v populaci pomocí normálního rozdělení), o které máme apriorní předpoklad, do jaké skupiny by měla patřit. Jiným dobrým příkladem (ovšem s jinými rozloženími) mohou být praktické úlohy z pojišťovnictví, kde je účelné odhadovat parametry tak, aby byly zahrnuty jak vlivy experimentu na konkrétní položce, tak celková očekávání přes populaci. 9.55. Poznámky o testování hypotéz. Vrátíme se zpět k možnostem rozhodování, zda nějaký jev nastal či nenastal v kontextu frekvenční statistiky. Opřeme se o postup v intervalových odhadech výše. Uvažujme tedy nějaký náhodný vektor X = (X\, ... ,Xn) (vzniklý z náhodného výběru) se sdruženou distribuční funkcí Fx(x). Za hypotézu budeme považovat nějaké tvrzení o rozdělení určeném touto distribuční funkcí. Zpravidla přitom formulujeme dvě hypotézy Ho a Ha , kde první se tradičně říká nulová hypotéza a druhé alternativní hypotéza. Výsledkem testu je rozhodnutí založené na konkrétní realizaci náhodného vektoru X (hovoříme také o testu), zda hypotézu Ho zamítnout nebo nezamítnout ve prospěch hypotézy Ha- Vznikají nám přitom možné chyby dvou typů. Chyba prvního druhu nastává, když zamítneme Ho, přestože je platná. Chyba druhého druhu nastane, když naopak nezamítneme Ho, ačkoliv platná není. Rozhodování frekventistického statistika probíhá tak, že si vybere tzv. kritický obor W, tj. množinu výsledků realizace testu, při kterých hypotézu zamítá. Velikost kritického oboru přitom volí tak, aby platnou hypotézu zamítal s pravděpodobností nejvýše a. To znamená, že požadujeme předem dané ohraničení pravděpodobnosti chyby prvního druhu tzv. hladinou testu a. Často se volí 579 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY kdybychom prováděli lineární regresi vektoru v = (v\, v2,..., vn) závislého na vektoru x = ix\,..., xn) a vektoru x1 = (x\,..., x2n). Této metodě se říká kvadratická regrese. Hledáme tedy vektor parametrů b = (bo, b\, bi) tak aby veličina b2x1 + b\x + bo odhadovala y. Sestavme tedy matici X hodnot nezávislých proměnných: /ll 1 \ 1 2 4 1 3 9 1 4 16 v1 4 25y (bo, b\, b2) dopočítáme podle (9.18): X : X\ x\^ V x" -v a vektor parametrů b - b = (XTXylXTv = (9,26; 0,47; 0,29). Hledaný kvadratický odhad je potom v = 0,29x2 + 0,47x + 9,26, Odhadovaná rychlost desátého dne je tedy přibližně 42,96 km/s. V modelu klasické lineární regrese bychom dostali přiblížení u = 2,18*+ 7,26, což by pro rychlost desátého dne dávalo 29,06 km/s. Rozdíl v odhadech je značný. Ukazuje to, že analýza situace je velmi významnou součástí statistiky. □ K. Bayesovská analýza dat 9.89. Mějme Bernoulliův proces definovaný náhodnou veličinou X ~ Bi(rc, 9) s binomickým rozdělením pravděpodobnosti a předpokládejme, že parametr 9 je přitom náhodnou veličinou s rovnoměrným rozdělením pravděpodobnosti na intervalu (0, 1). Definujme šanci na úspěch v našem procesu jako veličinu y = j^. Jakou hustotu rozdělení má veličina yl Řešení. Intuitivně asi cítíme, že nepůjde o rovnoměrné rozdělení. Označíme hledanou hustotu pravděpodobnosti fis) a ze vztahu mezi 9 a y spočteme 9 = Také okamžitě vidíme, že hustota pravděpodobnosti veličiny y bude nenulová pouze pro kladné hodnoty proměnné. Zadání můžeme nyní zformulovat tak, že požadujeme (9.4) ® = P(e<®) = P(y 0 uvažovat kritický obor Wc = {xr, f(x,ei)>cf(x, c I fix, 90) - c f lwc\w Jw\wc fix, 9o) — cl fix, 9o) — ca — ca — 0. twc Jw Tím jsme odvodili důležité tvrzení, tzv. Neymanovo-Pearsonovo lemma, že za výše uvedených předpokladů je Wc optimální kritický obor, který na předepsané úrovni minimalizuje chybu druhého druhu. Intervalový odhad, jak jsme jej ilustrovali na příkladu v odstavci 9.50, je speciálním případem testování hypo-l"/ téz, kdy Ho má formu „střední hodnota spokojenosti studentů zůstala no", zatímco Ha říká, že bude rovna nějaké jiné hodnotě /j,i . Uvidíme za chvilku, že předchozí obecný 580 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY V odstavci 9.53 jsme viděli, že jestliže pracujeme v bayesov-ském přístupu s binomickým modelem rozdělení pravděpodobnosti náhodné veličiny X ~ Bi(n, 9), bude nás zajímat její pravděpodobnostní funkce fx(k) = (^(l-60"^. Natuto funkci se ale muzeme také dívat jako na podmíněnou pravděpodobnost P(6\X = k) při apriorním rovnoměrném rozdělení pravděpodobnosti veličiny 9 na intervalu (0, 1). Je to tedy právě aposteriorní rozdělení pravděpodobnosti veličiny 9 odpovídající výsledku pokusu X = k. Následující příklad se týká obecné třídy takovýchto rozdělení pravděpodobnosti. 9.90. Najděte základní charakteristiky tzv. Beta rozdělení B(a,b) s hustotou pravděpodobnosti tvaru \cf-l(l -ý)b~l y € (0,1) 0 jinak. fy Řešení. Konstantu C je třeba volit jako reciprokou hodnotu integrálu Jo y"1 (1 ~~ i)h~xdy, což je funkce Bia, b), v matematické analýze (ale také technických vědách či fyzice) známá pod názvem Beta funkce. Když už známe funkci Gama, která zobecňuje diskrétní hodnoty fak-toriálů, vyskočí na nás např. při následujícím výpočtu: />CO />CO T(x)T(ý) = / e-'ŕ^dt- e~s s"-1 ds ■■ Jo Jo /•co />co = / / e~'-s ŕ'1 s"'1 dt ds = Jo Jo (substituce t = r q, s — r(l — q)) f CO c 1 r=0 Jq=0 = r(x + y)B(x,y) dostáváme tedy obecný vztah B(a, b) : p CO p 1 / / e-r(rqy-l{r(l-q))y~lrdqdr Jr=0 Jq=0 /•co /> 1 / e-rŕ+y-ldr- / cf-x Jr=0 Jt=0 l(l-q)y-ldq T(a + b) T(a)T(b) a z vlastností Gamma funkce již snadno plyne, že pro přirozená kladná a, b bude platit Bin - k + l,k+ 1) k\(n -k)\ 1 In (n + 1)! n + l\kj Přímým výpočtem vidíme, že střední hodnota veličiny X ~ B(a,b) s beta rozdělením je (využíváme vztah T(z + 1) = zT(z)) EX= B(a + l,ž>) = a B(a,b) a + b' Je-li a = b vyjde střední hodnota i medián \. postup povede v tomto případě na kritický obor zadaný požadavkem \Z\ - M0 fň > z(a/2). Všimněme si, že v definici kritického oboru není skutečná hodnota /xi podstatná a zformalizovali jsme proto v kontextu klasické pravděpodobnosti úlohu rozhodnout na předepsané hladině a, zda se střední hodnota /j, změnila. Jestliže ale chceme testovat z nějakého důvodu pouze, zda spokojenost poklesla, pak musíme předem předpokládat, že /xi < /xo. Rozeberme si tento případ podrobněji. Kritický obor z Neymanova-Pearsonova lemmatu je určen nerovností f(x, /xi, a2) 2o-2 £ľ=,((*i-Ki)2-(*i-«>)2) > f(x, /xo, a)2 Logaritmováním dostaneme, po drobné úpravě, 2* (/xi - /xo) - (/t2 - /Xo) > 2a2 ■ln<; a protože předpokládáme /xi < /xo, dostáváme konečně „i /xi +/xq ■ ln c — y. 2 n(/xi-/xo)" Konstantu c, tj. také rozhodující parametr y, přitom pro zvolenou hladinu a máme určenu tak, aby za předpokladu platnosti hypotézy Ho platilo a = P(X < y) = P(-Í^V^ < ^^). cr a Díky předpokladu o platnosti hypotézy Ho je veličina z = £^o^_N(0j 1} cr a proto znamená náš požadavek volbu Z < —z(a), která jednoznačně určuje optimální Wc. Všimněme si, že tento kritický obor skutečně nezávisí na volbě hodnoty /xi a skutečnou hodnotu pro y jsem vůbec nepotřebovali vyjádřit. Podstatný byl pouze předpoklad /xi < /xo. V našem ilustračním příkladu v odstavci 9.50 tedy máme Ho : (i = 6a alternativní hypotéza je Ha : /x < 6. Roz- Dosazením dostaneme hodnotu z = -= -1,678 zatímco -z(0,05) = -1,645.' Hypotézu tedy na hladině 5% zamítáme a usuzujeme, že skutečně došlo ke zhoršení názoru studentů. Když si za kritický obor zvolíme sjednocení oborů pro případy /xi < /xo a /xi > /xo, dostaneme právě výsledek shodný s intervalovým odhadem, jak bylo zmíněno výše. Poznamenejme závěrem, že v bayesovském přístupu je také možné přijímat nebo zamítat hypotézy víceméně v přímé vazbě na aposteriorní pravděpodobnosti jevů, jak jsme do jisté míry naznačili v odstavci 9.54 při interpretaci našeho konkrétního příkladu. 9.56. Lineární modely. Jako obvykle v analýze matematických yi.' » problémů buď vystačíme s afinními závislostmi nebo skutečné vztahy jejich pomocí aproximujeme. Stejně tak ve statistice patří mnoho metod do tzv. lineárních modelů. Probereme si stručně jeden případ z frekvenční statistiky. 581 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Přímo se také spočte rozptyl varZ = E(X-EX)2 : ab (a + b)2(a + b + 1)' Pro a = b tedy dostáváme var Z = což ukazuje, že pro rostoucí a = b klesá rozptyl. V případě a = b = 1 dostáváme obyčejné rovnoměrné rozdělení na intervalu (0, 1). □ 9.91. V situaci stejné jako v předposledním přikladu předpokládejme, že v Bernoulliho procesu je šance zdaru 6 náhodná veličina s rozdělením pravděpodobnosti f3(a,b). Jak bude vypadat rozdělení pravděpodobnosti veličiny y = V čem bude zvláštní při a = b = pl Řešení. V již řešeném příkladě jsme měli speciální případ s rovnoměrným rozdělením /3(1, 1). Můžeme tedy pokračovat v řešení v rovnosti || ||9.4|| ||, kdy jsme tvar tohoto rozdělení použili. Dostáváme nyní na levé straně místo 0 výraz 1 ľ& B(a,b)J0 ■ tý-xdt a při derivování musíme použít pravidlo pro derivování integrálu s proměnnou horní mezí. Dostáváme proto pro hledanou hustotu B(fl,fc)/(í) s + 1 s + 1 1 (S + l)2 ŕ-1 s + l Na obrázku jsou vyneseny hustoty pro hodnoty a = 2, 5, 15. Vidíme, že se naplňuje představa, že stejné a nepříliš malé hodnoty a = b = p odpovídají nejvíce pravděpodobné hodnotě 0 = \, proto je hustota šance největší v okolí jedničky. Čím větší p, tím menší je rozptyl této veličiny. □ Budeme uvažovat náhodný vektor Y deme předpokládat, že platí Y = X ■ fJ + aZ, (Xi, ,Y„Y abu- kdeX = (xij) je konstantní matice reálných čísel s n řádky a k < n sloupci a hodností k, fi je neznámý konstantní vektor k parametrů modelu, Z je náhodný vektor, jehož n komponent má rozdělení N(0, 1), a <7 > Oje neznámý kladný parametr modelu. Hovoříme o lineárním modelu s úplnou hodností. V praktických problémech jde často o to, že známe veličiny xij a snažíme se odhadnout nebo predikovat hodnotu Y. Například xíj může vyjadřovat hodnocení í-tého studenta v 7-tém semestru (J = 1, 2, 3) z matematiky a chceme vědět, jak tento student asi dopadne ve čtvrtém semestru. K tomu potřebujeme znát vektor fi. Ten odhadneme na základě úplných pozorování, tj. ze znalosti Y (např. z výsledků v předchozích letech). K odhadu vektoru fi se často používá metoda nejmenších čtverců. To znamená, že chceme najít odhad l : tak, aby vektor Y — Xb minimalizoval druhou mocninu délky vektoru Y — Xfi. To je ale jednoduchá úloha lineární algebry a víme, že jde o nalezení kolmého průmětu vektoru Y do podprostoru (X) c K™ generovaném sloupci matice X. Minimalizujeme přitom funkci k 7=1 iPl) Zvolme libovolnou ortonormální bázi vektorového podprostoru (X) a napišme ji do sloupců matice P. Pro jakoukoliv takovou volbu báze bude kolmý průmět realizován pomocí násobení maticí PPT. Zobrazení dané touto maticí je přitom na podprostoru (X) identické, tj. dostáváme Ý = PPTY = PPT(XfJ + crZ) = XfJ + aPPTZ. Matice PPT je pozitivně semideflnitní. Nyní doplníme bázi ze sloupců v P na ortonormální bázi celého M", tj. vytvoříme matici Q — (P R) vepsáním nově přidaných vektorů báze do matice R s n — k sloupci a n řádky. Označme si dále V — PT Z a U — RT Z náhodné vektory s k a n — k komponentami. Budou na sebe vzájemně kolmé a jejich součtem v R™ dostaneme vektor (VTUTf QTZ. Evidentně tedy (viz odstavec 9.46) mají oba vektory V a U mnohoměrné normální rozdělení s nulovou střední hodnotou a jednotkovou kovarianční matici. Náhodný vektor Y jsme rozložili na součet konstantního vektoru Xfi a dvou kolmých projekcí Y = XfJ +oPV + oRU a hledaný kolmý průmět je součet prvních dvou sčítanců. V odstavci 9.46 jsme také pro takové náhodné vektory odvodili jejich rozdělení. Velikost H ľ- — FII2 nazýváme reziduálni součet čtverců, zpravidla se značí RSS. Definujeme také reziduálni rozptyl jako t \\Y-Xb\\2 Připomeňme, že Y — Xb a že, díky našemu předpokladu o maximální hodnosti X, je matice XTX invertibilní. Můžeme proto rovnou spočíst b — (XTX)~lXTY. Zároveň ale víme, že 582 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 9.92. Ukažte, že v případě Bernoulliho procesu popsaného náhodnou veličinou X ~ Bi(n,9) a apriorní pravděpodobnosti náhodné veličiny 9 s beta rozdělením, má i aposteriorní pravděpodobnost opět beta rozdělení s vhodnými parametry závislými na výsledku pokusu. Jaká bude aposteriorní střední hodnota veličiny 9 (tj. bayesovský bodový odhad této náhodné veličiny)? Řešení. Jak je zdůvodněno v odstavci 9.53 teoretického sloupce, bude aposteriorní hustota pravděpodobnosti, až na násobek vhodnou konstantou, dána jako součin apriorní hustoty pravděpodobnosti 1 XT(Y -Ý) = aXT(RU) = 0, protože jsou sloupce víaRpo dvou ortogonální. Platí proto ve skutečnosti také g(0)- °a-\l-0)b-1 B(a,b) a pravděpodobnosti sledované veličiny X za podmínky, že nastala hodnota 9. Dostáváme tedy za předpokladu, že v Bemoulliho procesu nastalo k zdarů, aposteriorní hustotu (použitý znak místo rovnosti značí „proporcionální") g(9\X = k) Sj- =--=0,145. ' N n 2010 7=1 Když ale uvážíme homogennost rozdělení veličin X j, těžko je lze považovat za shodné, proto bude takovýto odhad jistě zavádějící. Opačný extrém, tj. zcela nezávislý a individuální odhad pj = -\Sj je samozřejmě také nevhodný, protože jistě nechceme předepisovat nulové pojistné, dokud nedojde k první nehodě. Jako realistický se jeví postup, ve kterém využijeme stejný předpoklad apriorního rozdělení pravděpodobnosti p j nehodovosti u jednotlivých řidičů. V praxi se zpravidla používá model s Poissonovým rozdělením Po(Aj) u 7-tého řidiče s dalšími předpoklady o rozdělení parametru X mezi řidiči. Docela dobře (a hlavně jednoduše) můžeme také předpokládat, že v našem případě půjde o rozdělení p j ~ f3(a, b) s vhodnými parametry a, b, které by měly odrážet kumulované výsledky všech řidičů. Pojdme tedy touto cestou. Z předchozího příkladu pak víme, že aposteriorní rozdělení pravděpodobností bude (pj\Sj = k) = f3(a + k, b + n — k), takže příslušná střední hodnota bude ,6 _ a + k ^' a + b + n Srovnejme si tento odhad s výše uvedeným společným odhadem p a individuálním pj. Zavedme si k tomu hodnoty po = tj. střední hodnotu apriorního společného rozdělení pro všechny řidiče, a no = a + b. Dostáváme Pj (a + b)a nk no n :Po+ .. , . Pj- (a + b + n)(a + b) (a + b + n)n no + n no + n' což je lineární kombinace střední hodnoty po a individuálního odhadu Pj- Zbývá nám tedy už jen smysluplně odhadnout neznámé parametry a, b. Víme přitom EX jí = EE(Xji\p) = Ep = po EvariXn\p) _ E(p(l - p)) w2 n — 1 '—' n - 1 í=i což jsou právě výběrový průměr a rozptyl, se kterými jsme již počítali. Zajímavá jev tomto kontextu hlavně statistika Ý-Po r T —-Jn 584 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY a přitom veličiny na levých stranách můžeme přímo odhadnout. ,PJ 1 N EXiJ=EE(XJi\p)~-J2i 7=1 1 N Evar^lp)--^^;?^!-^)) 7=1 1 N varE(Z,\p) ~ s% - — e^^l - Pjj), 7=1 kde s2~ označuje výběrový rozptyl mezi individuálními odhady (čtenář si může promyslet, že odečtením posledního výrazu vpravo zajišťujeme, aby i poslední odhad byl nestranný). Protože pro uvedená data takto dostáváme n0 — 3,8643 a po — 0,1450, vyjde nám bayesovský odhad individuální pravděpodobnosti nehod = 0,154 - 0,145 + 0,846-p;. Jde tedy o kombinaci spolehlivého odhadu p = 0,145 kolektivní pravděpodobnosti po s individuálním (frekvenčním) odhadem pj, který je pořízen z malého počtu pozorování n = 10 u jediného řidiče. □ L. Zpracování vícerozměrných dat Někdy potřebujeme zpracovat vícerozměrná data: u každého z n objektů určujeme p znaků. Například můžeme zkoumat známky různých žáků z různých předmětů. 9.94. Ve svých pokusech pozoroval J.G.Mendel 10 rostlin hrachu a na každé z nich počet žlutých a zelených semen. Výsledky pokusu jsou shrnuty v následující tabulce: číslo rostliny 1 2 3 4 5 6 7 8 9 10 počet žlutých 25 32 14 70 24 20 32 44 50 44 počet zelených 11 7 5 27 13 6 13 9 14 18 celkem 36 39 19 97 37 26 45 53 64 62 Z genetických modelů vyplývá, že pravděpodobnost výskytu žlutého semene by měla být 0,75 a zeleného 0,25. Na asymptotické hladině významnosti 0,05 testujte hypotézu, že se výsledky Mendelových pokusů shodují s modelem. Řešení. Hypotézu budeme testovat testem dobré shody. Použijeme statistiku (rij-npj) K e- 7=1 Testování hypotézy fí — fío se nazývá jednovýběrový t-test. Na hladině a hypotézu zamítáme, když je \ T\ > t„-\(a). Obdobné jednoduché využití obecného modelu se nazývá párový t-test. Je vhodný na případy, kdy testujeme dvojice náhodných vektorů W\ — (Wn) a W2 = (Wn), o rozdílech jejichž komponent Yi — Wn — Wi2 víme, že mají rozdělení N(/5, a2). Potřebujeme navíc, aby byly veličiny F, nezávislé (což neříká, že musí být nezávislé jednotlivé dvojice Wn a Wi2\). Můžeme si v kontextu našeho ilustračního příkladu z 9.50 představit třeba hodnocení dvou různých vyučujících týmž studentem. Testujeme hypotézu, že pro všechna i je E Wn ~ E Wn- Je zjevné, že Y = W\ — W2 bude splňovat Používáme tedy statistiku T = W\ - W2 Zmíníme ještě jeden jednoduchý příklad s více parametry. Půjde o klasický případ regresní přímky. Předpokládáme, že veličiny ľj•, i = 1, ..., n mají rozdělení N(8o + fi\Xi ,a2), kde x, jsou dané konstanty. Zkoumáme tedy co nej lepší aproximaci Yi = bo + b\Xi a matice X příslušného lineárního modelu je 1 ... 1 X2 ... Dosazením do obecných vztahů snadno spočteme odhad fb0\ ^ín \b\) \nx x / nY Odtud už po drobné úpravě vychází VJ=1fc-*)(}-; a konečně spočteme l —x 1 Y) í nY Y — b\x. Z výpočtu je přitom vidět, že var/Ji = a2/^2(xi -x)2. ;=l Pro testování hypotézy, zda střední hodnota veličiny Y nezávisí na x, tj. Ho je tvaru fi\ — 0, můžeme tedy použít statistiku E<* 1/2 ' t„_2 ■ Úplně obdobně vypadá statistická analýza vícenásobné regrese, kde máme několik sad hodnot xy a vyhodnocujeme statistickou relevanci aproximace Yi = bo + bixu H-----Vbkxki. Jednotlivé statistiky 7) zde umožňují t-test závislosti regrese na jednotlivých parametrech. Softwarové balíčky zpravidla uvádí také parametr vyjadřující, jak dobře jsou celkově hodnoty F, aproximovány. Říkává se mu koeficient determinace RSS npj RA = 1 - ■ 2' 585 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY kde r je počet třídících intervalů (měření; v našem případě r = 10), n j je skutečně naměřená četnost znaku ve zvoleném třídícím intervalu (budeme počítat množství žlutých semen), p j očekávaná četnost (podle předpokládaného rozložení), v našem případě pj = 0,75, j = 1,..., 10. Pokud by se výsledky pokusu skutečně řídily naším modelem, pak by K m x2(r — 1 — p), kde p je počet odhadovaných parametrů v předpokládaném rozložení pravděpodobnosti. V našem případě je to obzvláště jednoduché, neboť náš model žádné neznámé parametry neobsahuje, je tedy p = 0 (parametry se mohou vyskytnout, pokud například předpokládáme, že rozložení pravděpodobnosti v našem pokusu bude normální, ovšem s neznámým rozptylem a střední hodnotou; potom by p = 2). Bude tedy K m x2(9). Statistika se doporučuje používat, pokud je očekávaná četnost znaku v každém z třídících intervalů alespoň pět. Zapišme data do tabulky: j 1 2 nj 25 32 Pj 0,75 0,75 npj 27 29,25 (nj-npj)2 npj 0,148148 0,258547 10 44 0,75 46,5 0,134409 Hodnota statistiky K pro daná data je K = 0,148148 + 0,258547 +----h 0,134409 = 1,797495. Tato hodnota je menší než Xog5(9) = 16,9, nulovou hypotézu na hladině významnosti 0,05 tedy nezamítáme (nevylučujeme tedy, že známý model dědičnosti skutečně platí). 9.58. V praktických situacích se velmi často setkáváme s pro-■0 blémy, kdy jsou buď rozdělení základních statis-• íJV tických souborů úplně neznámá nebo jsou v mo--^»23521^, delu předpokládané chyby a odchylky s nenulovou střední hodnotou a jiným než normálním rozdělením. V těchto situacích je využití klasické frekvenční statistiky buď velmi obtížné nebo zcela nemožné. Existují ale přístupy, jak pracovat přímo nad výběrovým souborem a odvozovat statistiky bodových či intervalových odhadů nebo pravděpodobnostní úsudky v obdobě k předchozím bodům, včetně vyčíslování standardních chyb. Jedním ze zásadních průkopnických článků v tomto směru byla již v roce 1981 publikovaná stručná práce Bradleyho Efrona ze Stanfordu Nonparametric estimates of standard error: The jackk-nife, the bootstrap and other methods.4. Klíčová slova v tomto článku jsou: Balanced repeated replications; Bootstrap; Delta me-thod; Half-sampling; Jackknife; m&nitesimal jackknife; Influence function. Nemáme tu prostor pro podrobnější rozbor těchto technik, které jsou základem neparametrických metod v současných softwarových statistických nástrojích. Pro ilustraci jen stručně zmiňme postup v metodě bootstrap. Softwarovými prostředky v tomto případě z daného výběrového souboru vytváříme nové a nové výběrové soubory stejného rozsahu (přičemž skutečně provádíme výběr s vrácením vybrané jednotky do základního souboru) a pro každý z nich sledujeme potřebné statistiky (výběrový průměr, rozptyl apod.). Po velkém počtu opakování tohoto postupu tak získáme soubor, který považujeme za relevantní přiblíženi pravděpodobnostního rozložení zkoumané statistiky. Charakteristiky tohoto souboru považujeme za dobré přiblížení charakteristik zkoumané statistiky při bodových či intervalových odhadech, analýze rozptylu apod. □ %ometrika (1981), 68,3, pp. 589-99 586 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY 587 KAPITOLA 9. STATISTICKÉ A PRAVDĚPODOBNOSTNÍ METODY Řešení cvičení 921 2. 2,2. ,4 9.41. Jednoduše a = |. Distribuční funkce náhodné veličiny X je tedy Fx(t) — %P pro t e (0, 2), pro menší t je tato funkce nulová, pro větší rovna 1. Označme Z — X3 náhodnou veličinu označující objem krychle. Ten je v intervalu (0, 8), pro t e (0, 8) a distribuční funkci Fz náhodné veličiny Z tedy můžeme psátFz(ř) = P[Z < ŕ] = P[X3 < ŕ] = P[X < = Fxii/t) = 51, hustota pravděpodobnosti je pak fz(t) — j na intervalu (0, 8), jinak nula, jedná se tedy o rovnoměrné rozdělení pravděpodobnosti na daném intervalu, střední hodnota je tudíž 4. 9.55. EU = 1-0,6 + 2-0,4 = 1,4, EU2 = 0,4 + 4 • 0,4 = 2,2 EV = 0,3 + 0,6 + 1,2 = 2,1, EV2 = 0,3 + + L 2+3,6 = 5,1, E(UV) = 2,8,var(f/) = 2,2-1 A2 = 2,2-1,96 = 0,24,var(7) = 5,1 -4,41 = 0,69, covfW) = 2,8 - 1,4 • 2,1 = -0,14, pUiV = -^=5 = 0, 39. 9.56. EX = 1/3, var2 X = 4/45. 9.57. PX.Y — -1. 9.5S. 0 a I c, a \ b + c A a I — c, (a I b <í=> ač I be), a < b. Již se znalostí těchto základních pravidel jsme schopni řešit mnohé úlohy. 10.1. Zjistěte, pro která přirozená čísla n je číslo n3 + 1 dělitelné číslem n — 1. V této kapitole se budeme zabývat úlohami o celých číslech. Převážně v nich půjde o dělitelnost celých čísel, popřípadě o řešení rovnic v oboru celých nebo přirozených čísel (zde vzhledem k obvyklé oborové konvenci na rozdíl od zbytku knihy nebudeme nulu počítat mezi přirozená čísla). Ačkoli jsou přirozená a celá čísla v jistém smyslu nejjednodušší matematickou strukturou, zkoumání jejich vlastností postavilo před generace matematiků celou řadu velice obtížných problémů. Často jsou to problémy, které je možno snadno formulovat, přesto však dodnes neznáme řešení některých z nich. Uvedhie některé z nejznámějších: • problém prvočíselných dvojčat - rozhodnout, zda existuje nekonečně mnoho prvočísel p takových, že i p + 2 je prvočíslo,1 • prvočísla Sophie Germainové - rozhodnout, zda existuje nekonečně mnoho prvočísel p takových, že i 2p + 1 je prvočíslo, • problém existence lichého dokonalého čísla - tj. čísla, jehož součet dělitelů je roven dvojnásobku tohoto čísla, • Goldbachova hypotéza - jde o to rozhodnout, zda každé sudé číslo větší než 2 je možno psát jako součet dvou prvočísel, • klenot mezi problémy teorie čísel velkou Fermatovu větu (Fer-maťs Last Theorem) - jde o otázku, zda existují přirozená čísla n, x, y, z tak, že n > 2 a platí xn + y" — z"; Pierre de Fermat ji formuloval kolem roku 1637, vyřešil ji po značném úsilí celých generací (a s pomocí výsledků z mnoha oblastí matematiky) Andrew Wiles až v roce 1995. 1. Základní pojmy 10.1. Dělitelnost. Připomeňme, že říkáme, že celé číslo a dělí celé číslo b (neboli číslo b je dělitelné číslem a, též b je násobek a), pokud existuje celé číslo c tak, že platí a-c — b. Píšeme pak a \ b. Pojem dělitelnosti lze de-'fá/v*SS0r°-*~ flnovat a jeho vlastnosti zkoumat i mnohem obecněji - více v části 11.18. Jednou z nejdůležitějších vlastností celých čísel, kterou budeme často využívat, je možnost jednoznačného dělení se zbytkem. Věta. Pro libovolně zvolená čísla a e Z, m e N existují jednoznačně určená čísla q e Z, r e {0, 1, ..., m — 1) tak, že a — qm + r. Důkaz. Dokážeme nejprve existenci čísel q, r. Předpokládejme, že přirozené číslo m je dáno pevně a dokažme tvrzení pro ^Tato otázka stále patří mezi otevřené problémy - v roce 2013 ale Zhang Yitang publikoval důkaz slibného tvrzení, že pro některé n < 7 ■ 107 existuje nekonečně mnoho dvojic prvočísel lišících se právě o n. Viz Z. Yitang, Bounded gaps between primes. Annals of Mathematics, 2013. KAPITOLA 10. TEORIE ČÍSEL Řešení. Platí n3 — 1 = (n — l)(n2 + n + 1), a tedy pro libovolné n je číslo n3 — 1 dělitelné číslem n — 1. Má-lirc — 1 dělit i číslo n3 + l.musí dělit i rozdíl (n3 + 1) - (n3 - 1) = 2. Protože n e N, platí n - 1 > 0, a tedy z n — 1 | 2 plyne n — 1 = 1 nebo n — 1 = 2, a proto n = 2 nebo n = 3. Uvedenou vlastnost mají tedy pouze přirozená čísla 2 a 3. □ 10.2. Dokažte, že pro libovolné a e Z platí: i) a2 dává po dělení čtyřmi zbytek 0 nebo 1, ii) a2 dává po dělení osmi zbytek 0,1 nebo 4, iii) a4 dává po dělení šestnácti zbytek 0 nebo 1. Řešení. Z věty o dělení se zbytkem plyne, že každé celé číslo a lze zapsatjednoznačněvjednomztvarůa = 2feneboa = 2k+l. Po umocnění dostaneme a2 = 4k2 nebo a2 = 4(k2 + k) + 1, což jsme měli dokázat. S využitím předchozího výsledku ihned dostaneme tvrzení pro (sudá) čísla tvaru a = 2k. Pro lichá čísla jsme dostali a2 = 4k(k+l) + l, odkud dostaneme tvrzení, uvědomíme-li si, že k(k + 1) je jistě sudé. Použijeme výsledek předchozích částí, tedy a2 = 41 nebo a2 = Sí + 1. Po opětovném umocnění dostaneme požadované tvrzení, neboť a4 = (a2)2 = 16í2 pro a sudé a a4 = (a2)2 = (U + l)2 = 64£2 + 161 + 1 = 16(4Í2 + í) + l pro a liché. □ 10.3. Dokažte, že dávají-li čísla a, b e Z po dělení číslem m € N zbytek jedna, je 1 i zbytek po dělení čísla ab číslem m. Řešení. Podle věty o dělení se zbytkem existují s, t e Z tak, že a = sm + 1, b = tm + 1. Vynásobením dostaneme vyjádření ab = (sm + í)(tm + 1) = (stm + s + i)m + 1, kde stm + s +1 je neúplný podíl a zbytek po dělení čísla ab číslem m je roven 1. □ Z věty o dělení se zbytkem plyne existence a jednoznačnost největšího společného dělitele libovolných dvou celých čísel a, b a rovněž to, že jej lze efektivně vypočítat pomocí Euklidova algoritmu. Zároveň jsme schopni současně s největším společným dělitelem určit i koeficienty do Bezoutovy rovnosti - totiž taková celá čísla k, l, že platí ak + bl = (a,b). Rovněž lze snadno dokázat přímo z vlastností dělitelnosti, že jako celočíselnou lineární kombinaci čísel a, b lze vyjádřit právě násobky největšího společného dělitele. libovolné a e Z. Nejprve budeme předpokládat, že a e No a existenci čísel q, r dokážeme indukcí vzhledem k a: Je-li 0 < a < m, stačí volit q — 0, r — a a rovnost a = qm+r platí. Předpokládejme nyní, že a > m a že jsme existenci čísel q, r dokázali pro všechna a' e {0, 1, 2, ..., a — 1). Speciálně pro a' = a — m > 0 tedy existují q', / tak, že a' — q' m + r' a přitom/ e {0, 1, ..., m — 1). Zvolíme-li q — q' + 1, r — ť, platí a — a' + m — (q' + l)m + / — qm+r, což jsme chtěli dokázat. Je-li nyní a záporné, pak ke kladnému číslu —a podle výše dokázaného existují q' e TL, r' e {0, 1, ..., m — 1) tak, že —a — q'm + /. Je-li / = 0, položíme r — 0, q — —q'; je-li ŕ > 0, položíme r = m — ť ,q — —q' — 1. V obou případech a — q ■ m + r, a tedy čísla q, r s požadovanými vlastnostmi existují pro každé a e Z, m e N. Nyní dokážeme jednoznačnost. Předpokládejme, že pro některá čísla qi,qi 6 Z a r\,r2 e {0, 1, ..., m — 1) platí a — q\m + r\ — q2m + r2. Úpravou dostaneme r\ — T2 — (qi — q\)m, a tedy m \ r\ — yt_. Ovšem z toho, že 0 < r\ < m, 0 < r2 < m plyne —m < r\ — r2 < m, odkud r\ — r2 — 0, a tedy i (q2 — q\)m — 0, a proto q\ — q2, r\ — r2. □ Číslo q, resp. r, z věty se nazývá (neúplný) podíl, resp. zbytek, při dělení čísla a číslem m se zbytkem. Volba těchto názvů je srozumitelnější, upravíme-li rovnost a — mq + r do tvaru ar r — — q -\--, přitom 0 < — < 1. 10.2. Největší společný dělitel. Jedním z nejpotřebnějších nástrojů výpočetní teorie čísel je algoritmus pro výpočet největšího společného dělitele. Protože jde, jak si ukážeme, o relativně rychlou proceduru, je i v moderních algoritmech velmi často využívána. __^_____^_J Největší společný dělitel__ Mějme celá čísla a, b. Libovolné celé číslo m takové, že m | a, m | b se nazývá společný dělitel čísel a, b. Společný dělitel m > 0 čísel a, b, který je dělitelný libovolným společným dělitelem čísel a, b, se nazývá největší společný dělitel čísel a, b a značí se (a, b) (někdy též gcd(a, b) nebo nsd(a, b)). Duálně definujeme pojem nejmenší společný násobek a značíme [a, b] (případně lcm(a, b) nebo nsn(a, b)). Přímo z definice plyne, že pro libovolné a, b e TL platí (a,b) = (b,a),[a,b] = [b,a],(a,l) = 1, [a, 1] = \a\, (a,0) = \a\, [a,0] = 0. Dosud jsme nijak nezdůvodnili, že pro každou dvojici celých čísel a, b jejich největší společný dělitel a nejmenší společný násobek vůbec existují. Pokud ale dokážeme, že existují, jsou již určena jednoznačně, protože pro každá dvě nezáporná celá čísla k, l podle definice platí, že pokud k \ l a zároveň / | k, pak nutně k — Z. V obecném případě dělitelnosti v oboru integrity je ale situace složitější - viz 11.21.1 v případě tzv. euklidovských okruhů,2 Wiklpedia, Euclidean domain, http://en.wikipedia.org/wiki/ Euclidean_domain (as of July 18, 2013, 18:19 GMT). 590 KAPITOLA 10. TEORIE ČÍSEL 10.4. Určete největší společný dělitel čísel a = 10175, b = 2277 a určete příslušné koeficienty v Bezoutově rovnosti. Řešení. Postupujme Euklidovým algoritmem: 10175 = 4 2277 + 1067, 2277 = 2 1067 + 143, 1067 = 7 143 + 66, 143 = 2 66+11, 66 = 6 11+0. Nej větším společným dělitelem je tedy číslo 11, které postupně vyjádříme z jednotlivých rovností jako lineární kombinaci čísel a, b: 11 = 143 -2-66 = = 143 - 2 • (1067 - 7 • 143) = = -2 • 1067 + 15 • 143 = = -2 • 1067 + 15 • (2277 - 2 • 1067) = = 15 • 2277 - 32 • 1067 = = 15 • 2277 - 32 • (10175 - 4 • 2277) = = -32 • 10175 + 143 • 2277. Hledané vyjádření je tedy 11 = (-32) • 10175 + 143 • 2277. □ 10.5. Určete největšflio společného dělitele čísel 249 - 1 a 235 — 1 a určete koeficienty do příslušné Bezoutovy rovnosti. Řešení. Užijeme Euklidův algoritmus. Platí 249 -l = 214(235 -l) + 214-l, 235 - 1 = (221 + 27)(214 - 1) + 27 - 1, 214 - 1 = (27 + 1)(27 - 1). Hledaný největší společný dělitel je tedy 27 — 1 = 127. Všimněme si, že 7 = (63, 91) - viz též následující příklad ||10.6||. Obrácením postupu dostaneme hledané koeficienty k, t do Bezoutovy rovnosti 27 - 1 = (249 - l)k + (235 - 1)1: 1 = (235 - 1) - (221 + 27)(214 - 1) = = (235 - 1) - (221 + 27)((249 - 1) - 214(235 1)): = (235 + 221 + 1)(235 - 1) - (221 + 27)(249 - 1). Jetedyfc = -(221 + 27),£ = 235 + 221 + l. Pro jistotu poznamenejme, že tyto koeficienty nejsou určeny jednoznačně. □ které garantují existenci největšflio společného dělitele, je výsledek určen jednoznačně až na asociovanost, tedy na násobek jednotky - v našem případě celých čísel se asociovaná čísla liší znaménkem. Jednoznačnost jsme tak zajistili požadavkem na nezápornost největšflio společného dělitele. Věta (Euklidův algoritmus). Nechť a\,a2 jsou přirozená čísla. Pro každé n > 3, pro které a„-\ ^ 0, označme an zbytek po dělení čísla an-2 číslem a„-\. Pak po konečném počtu kroků dostaneme ai — 0 a platí ak-l = {a\,a2). Důkaz. Podle věty o dělení se zbytkem platí a2 > a3 > au > ____Protože jde o nezáporná celá čísla, nemůže být tato klesající posloupnost nekonečná, a po konečném počtu kroků tak dostaneme ak = 0, přičemž a^-\ ^ 0. Z definice čísel a„ přitom plyne, že existují celá čísla q\,q2, ..., qk-2 tak, že a\ =q\-a2 +a3, a2 — q2 ■ «3 + «4, = 1k-3 ■ &k-2 + ak-i, ak-2 = qk-2 ■ ak-\. Z poslední rovnosti plyne, že ak-i | ak-2, dále ak-i | at-3..... ak-l I a2, ak-i | a\. Je tedy ak-i společný dělitel čísel a\, a2. Naopak libovolný společný dělitel čísel a\,a2 dělí i číslo a3 — a\ — q\a2, a proto dělí i čísla au, — a2 — q2a3, a$, ..., a zejména i ak-i = at-3 — qk-3ak-2- Dokázali jsme tak, že ak-i je největší společný dělitel čísela\,a2. □ Z předchozího tvrzení a z toho, že pro libovolná a, b e Z, platí (a, b) = (a, —b) = (—a, b) = (—a, —b), plyne existence největšflio společného dělitele libovolných dvou celých čísel. Navíc dostáváme z Euklidova algoritmu i následující zajímavé a často využívané tvrzení. 10.3. Věta (Bezoutova). Pro libovolná celá čísla a, b existují celá čísla k, l tak, že (a,b) — ka + Ib. Důkaz. Jistě stačí větu dokázat pro a, b e N. Všimněme si, že jestliže je možné nějaká čísla r, s e Z vyjádřit ve tvaru r = r\a + r2b, s — s\a + s2b, kde r\,r2, s\, s2 e Z, můžeme tak vyjádřit i r + s — (n + s\)a + (r2 + s2)b a také c • r — (c ■ r\)a + (c • r2)b pro libovolné c e Z. Z Euklidova algoritmu (pro a\ — a,a2 — b) plyne, že takto můžeme vyjádřit i a3 — a\ — q\a2, au = = a2 - q2a3, ..., a tedy i číslo ak-\ = ak-3 - qk-3ak-2, což je ovšem (a\, a2). Zdůrazněme přitom, že hledaná čísla k, l zdaleka nejsou určenajednoznačně. □ Poznámka. Výpočet největšflio společného dělitele pomocí Euklidova algoritmu je s využitím výpočetní techniky i pro relativně velká čísla poměrně rychlý. V našem příkladu to vyzkoušíme na 2 číslech A, B, z nichž každé je součinem dvou 101-ciferných prvočísel. Všimněme si, že výpočet největšflio společného dělitele 591 KAPITOLA 10. TEORIE ČÍSEL 10.6. Zobecněme nyní výsledek předchozího příkladu a dokažme, že pro a,m,n €N,a ^ 1, platí: (am - 1, a" - 1) = a(m-n) - 1. Řešení. Požadované tvrzení snadno vyplyne z toho, že pro libovolná přirozená čísla k, l platí ak — 1 | a1 — 1, právě když k \ l. A to dokážeme tak, že vydělíme číslo t číslem k se zbytkem, tj. položíme t = kq + r, kde q, r € No, r < k, a uvážíme, že 2ki+r -1 = (a*-1)(, k(q-\)+r _|_ fli(9-2)+r + ---+ai+r + ar)+ar-i je dělením čísla ai,?+r — 1 číslem (ak — 1) se zbytkem (zřejmě totiž ď — 1 < ak — 1). Odtud je již snadno vidět, že zbytek r je nulový, právě když je zbytek ď — 1 nulový, což jsme potřebovali dokázat. □ 10.7. Dokažte, že pro všechna n e N : 25 | 42n+1 - lOn - 4. Řešení. Toto tvrzení lze dokázat několika způsoby (nejsnadněji pomocí vlastností kongruencí, které zavedeme o něco později), my jej zde dokážeme nejprve indukcí a potom jako důsledek binomické věty. Tvrzení zřejmě platí pro n = 0 (byť se v zadání o platnosti pro n = 0 nemluvilo, jistě můžeme dokázat požadovanou vlastnost pro rozšířenou množinu n e No a tím si usnadnit první krok indukce). V druhém kroku, předpokládáme-li, že 25 | 42™-1 — \0(n — 1) — 4, pak rovněž 25 | 16(42"-1 -10(rc-l)-4) = 42n+1 -10ři-4-150ři+100, odkud snadno plyne, že platí potřebný vztah 25 | 42n+1 — 1 On — 4. Druhý důkaz využívá binomickou větu - podle ní totiž (5 - 1)2"+1 = £ í2" + %2n+1-k(-l)k, k=o ^ ' přičemž jsou zřejmě všechny sčítance násobky 25, s výjimkou posledních dvou, tj. s výjimkou součtu (^^(-l)2" + 5°(-l)2n+1 . Jinak řečeno, 42n+1 dává po dělení 25 stejný zbytek jako \0n + 4, což je ekvivalentní dokazovanému tvrzení. □ Prvočísla. V teoretické části uvádíme Euklidův důkaz nekonečnosti prvočísel a podrobně se zabýváme tím, jak jsou prvočísla v množině přirozených čísel rozložena (v některých případech jsme ale byli nuceni ponechat uváděná tvrzení bez důkazu). Uvedme nyní několik souvisejících příkladů. 10.8. Pro libovolné přirozené číslo n > 2 existuje mezi čísly n a n! s\^Lv alespoň jedno prvočíslo. "iJl^ ^ešení- Označme p libovolné prvočíslo dělící číslo n! — 1 ^ (takové existuje podle Základní věty aritmetiky 10.7, protože n \ — 1 > 1). Kdyby p < n, muselo by p dělit číslo n \ a nedělilo by n \ — 1. Je tedy n < p. Protože p | (n \ — 1), platí p < n \ — 1, tedy p < n\. Prvočíslo p splňuje podmínky úlohy. □ i takto velkých čísel trval zanedbatelný čas. Pozorovatelem zazna-menatelný čas zabere tento výpočet až ve druhé ukázce, v níž jsou vstupem dvě čísla mající více než milion cifer. Příklad v systému SAGE : sage: p=next_prime (5 * 10M00) sage: q=next_prime (3 * 10M00) sage: r = next_prime (10A100) sage: A=p*q;B=q*r; sage: time G=gcd(A,B); print G Time : CPU 0.00 s, Wall : 0.00 s 300000000000000000000000000000000000\ 000000000000000000000000000000000000\ 00000000000000000000000000223 time G=gcd (AA10000+1 ,BA10000+1); Time : CPU 2.47 s, Wall : 2.48 s Euklidův algoritmus a Bezoutova věta jsou základními výsledky elementární teorie čísel a tvoří jeden z pilířů algoritmů algebry a teorie čísel. 10.4. Nejmenší společný násobek. Zatím jsme vlastnosti ■ nejmenšflio společného násobku trochu ignorovali, ale vzhledem k následujícímu tvrzení vše podstatné odvodíme z vlastností největšflio společného dělitele. Lemma. Pro libovolná celá čísla a, b existuje jejich nejmenší společný násobek [a,b] a platí (a, b) ■ [a, b] = \a ■ b\. Důkaz. Tvrzení jistě platí, je-li některé z čísel a, b rovno nule. Můžeme navíc předpokládat, že obě nenulová čísla a, b jsou kladná, neboťjejich znaménka se v dokazovaném vzorci neprojeví. Budeme hotovi, ukážeme-li, že q — a ■ b/(a, b) je nejmenším společným násobkem čísel a, b. Protože (a, b) je společný dělitel čísel a,b, jsou a/(a,b) ib/(a,b) celá čísla, a proto ab a b q — - = -• b —-• a (a, b) (a, b) (a, b) společný násobek čísel a, b. Podle Bezoutovy věty existují k, l e Z tak, že (a, b) — ka + Ib. Předpokládejme, že n e Z je libovolný společný násobek čísel a, b a ukážeme, že je dělitelný číslem q. Je tedy n/a,n/b e TL,a proto je celé i číslo n(ka + Ib) n(a, b) n ab ab q To ovšem znamená, že q \ n, což jsme chtěli dokázat. □ ■k-\---l- 10.5. Nesoudělnost. Analogicky jako v případě dvou čísel se de-jg^ flnuje i největší společný dělitel a nejmenší společný fíS" násobek více než dvou celých čísel a snadno se ná-/ | /J sledně dokáže, že platí (a\, ...,an) = ((au ..., a„-i), a„), [a\, ...,an~\ = [[a\, ..., a„-\\, an]. 592 KAPITOLA 10. TEORIE ČÍSEL Z tohoto příkladu rovněž vyplývá nekonečnost prvočísel (stačí uvážit posloupnost ao = 3, an+\ = a„!prorc e N). Toto tvrzení je ale (oproti skutečnosti) velice slabé, protože konstruovaná posloupnost obsahuje jen „velmi malou" podmnožinu prvočísel. Na druhou stranu, jak ukazuje následující příklad, jsme schopni zkonstruovat libovolně dlouhou posloupnost po sobě jdoucích čísel, z nichž žádné není prvočíslem. 10.9. Dokažte, že pro libovolné přirozené číslo n existuje n po sobě jdoucích přirozených čísel, z nichž žádné není prvočíslo. Řešení. Zkoumejme čísla (n + 1)! + 2, (n + 1)! + 3, • • • , (n + 1)! + (n + 1). Mezi těmito n po sobě jdoucími čísly není žádné prvočíslo, protože pro libovolné k e {2, 3,..., n+i] platí k | (n+l)\, a tedy k | (n + 1)! + k, a proto (n + 1)! + k nemůže být prvočíslo. □ 10.10. i) Dokažte, že jsou-li přirozená čísla m, n nesoudělná, jsou nesoudělná rovněž čísla ii) Dokažte, že jsou-li lichá přirozená čísla m,n nesoudělná, jsou nesoudělná rovněž čísla m +2n a m2 + 4n2. Řešení. i) Předpokládejme pro spor, že nějaké prvočíslo p dělí obě čísla m2 + mn + n2 i m2 — mn + n2. Pak také dělí jejich rozdíl 2mn, odkud buď p = 2 nebo p dělí některé z čísel m, n. Jeli p = 2, pak je číslo m2 + mn + n2 sudé, a proto musí být obě čísla min sudá, což je spor s předpokladem jejich ne-soudělnosti. Pokudp dělím spolu s m2 + mři+ři2,paknutně dělí rovněž n2 a podle Euklidovy věty 10.6 tak dělí i n. To je ale opět spor s nesoudělností m, n. Analogicky postupujeme i v případě p | n. ii) Podobně jako v předchozím příkladu předpokládejme, že nějaké prvočíslo p dělí m + 2n i m2 + 4n2. Pak musí dělit i číslo (m2 + 4n2) — (m + 2n)(m — 2n) = Sn2, a protože p ^ 2 (kdyby bylo m + 2n sudé, bylo by sudé i m), nutně p | n. Protože ale p dělí i m + 2n, dostáváme p \ m, což je spor. □ Čísla ai, ci2, ... ,an e Z se nazývají nesoudělná, jestliže platí (a\, ci2, ..., an) — 1. Čísla ŕzi, ai, ...,an e Z se nazývají po dvou nesoudělná, jestliže pro každé i, j takové, že 1 < i < j < n, platí (cii, aj) = 1. Poznámka. Uvědomme si ještě, že je rozdíl mezi pojmy po dvou nesoudělná čísla a nesoudělná čísla. Máme totiž například (6, 10, 15) = 1, přitom jsou ale libovolná dvě z čísel 6, 10, 15 soudělná. Lemma. Pro libovolná přirozená čísla a,b, c platí (1) (ac, bč) — {a, b) ■ c, (2) jestliže a | bc, (a,b) = 1, pak a | c, (3) d — (a,b) právě tehdy, když existují k, l e N tak, že a — dk, b = dla{k,l) = 1. Důkaz. (1) Protože {a, b) je společný dělitel čísel a, b, je {a, b) ■ c společný dělitel čísel ac, bc, proto {a, b) ■ c \ (ac, bč). Podle Bezoutovy věty existují k,l e Z tak, že (a, b ) = ka + + Ib. Protože (ac, bč) je společný dělitel čísel ac, bc, dělí i číslo kac + lbe = (a,b) ■ c. Dokázali jsme, že (a, b) ■ c a (ac, bč) jsou dvě přirozená čísla, která dělí jedno druhé, proto se rovnají. (2) Předpokládejme, že (a,b) = 1 a a | bc. Podle Bezoutovy věty existují k,l e Z tak, že ka + Ib = 1, odkud plyne, že c = c(ka + Ib) = kca + lbe. Protože a | bc, plyne odsud, že i c je násobkem čísla a. (3) Nechť d = (a, b), pak existují q\, q2 e N tak, že a — dq\, b — dq2. Pak podle 1. části platí d = (a, b) = (dq\, dq2) — — d ■ (q\, q2), a tedy (q\, q-i) — 1. Naopak, je-li a — dq\, b — dq2 a (q\, qi) — 1, pak (a, b) = (dq\, dq2) — d(q\, q-i) — — d ■ l — d (opět užitím 1. části tohoto tvrzení). □ 2. Prvočísla Prvočíslo je jeden znejdůležitějších pojmů elementární teorie čísel. Jeho důležitost je dána především větou o jednoznačném rozkladu libovolného přirozeného čísla na součin prvočísel, která je silným a účinným nástrojem při řešení celé řady úloh z teorie čísel. ___J Prvočíslo J___.- Každé přirozené číslo n > 2 má aspoň dva kladné dělitele: a n. Pokud kromě těchto dvou jiné kladné dělitele nemá, nazývá se prvočíslo. V opačném případě hovoříme o složeném čísle. j V dalším textu budeme zpravidla prvočíslo značit písmenem p. Nejmenší prvočísla jsou 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, ... (zejména číslo 1 za prvočíslo ani za číslo složené nepovažujeme, je totiž invertibilní, neboli jednotkou okruhu celých čísel). Prvočísel je, jak brzy dokážeme, nekonečně mnoho, máme ovšem poměrně limitované výpočetní prostředky na zjištění, zda je dané číslo prvočíslem; číslo 257 885 161 — 1, které bylo v roce 2013 nej větším známým prvočíslem, má pouze 17 425 170 cifer a jeho dekadické vyjádření by se tak vešlo na kdejaký prehistorický datový nosič, při tisku knihy o 60 řádcích na stránku a 80 znacích na řádek by nicméně i tak zabralo 3 631 stran. Uvedhie nyní větu, která udává ekvivalentní podmínku prvočíselnosti aje základní ingrediencí při důkazu jednoznačnosti rozkladu na prvočísla. 593 KAPITOLA 10. TEORIE ČÍSEL B. Kongruence V tomto odstavci si procvičíme, jak může zvládnutí základních jv-y operací s kongruencemi přispět k elegantnímu vyj ádření ' v/Ä^Ä lešení příkladů, které bychom sice byli schopni vyřešit 11 pouze s pomocí základních vlastností dělitelnosti, s využitím kongruencí bude ale zápis řešení obvykle podstatně stručnější. 10.11. i) Nalezněte zbytek po dělení čísla 730 číslem 50. ii) Určete dvě poslední cifry dekadického zápisu čísla 730. Řešení. i) Protože 72 = 49 = — 1 (mod 50), s využitím vlastností kongruencí uvedených v teoretické části dostáváme (-D1 -1 (mod 50), a tedy zbytek po dělení čísla 7 číslem 50 je 49. ii) Máme vlastně určit zbytek po dělení 730 číslem 100. Z předchozího víme, že zbytek po dělení 50 je 49, proto poslední dvě cifry jsou buď 49 nebo 99. Víme již tedy zejména, že 730 = — 1 (mod 25) a snadno spočítáme, Že 730 = (-1)30 = 1 (mod 4). Protože (4,25) = 1, dostáváme odtud, že hledaným dvojčíslím je 49 (dává totiž požadovaný zbytek modulo 25 i modulo 4). □ 10.12. Dokažte, že pro libovolné n e N je 37"+2 + 16"+1 + 23" dělitelné sedmi. Řešení. Platí 37 = 16 = 23 = 2 (mod 7), a tedy podle základních vlastností kongruencí platí 37"+2+16"+1+23" = 2"+2+2"+1+2" = 2" (4+2+1) = 0 (mod 7). □ 10.13. Dokažte, že číslo n = (8355 + 6)18 — 1 je dělitelné číslem 112. Řešení. Rozložíme 112 = 7-16. Protože (7, 16) = 1, stačí ukázat, že 7 | n a 16 | n. Platí 835 = 2 (mod 7), a tedy n = (25 + 6)18 - 1 = 3818 - 1 = 318 - 1 = = 276 - 1 = (-1)6 - 1 = 0 (mod 7), 10.6. Věta (Euklidova o prvočíslech). Přirozené číslo p > 2 je prvočíslo, právě když platí: pro každá celá čísla a, b z toho, že p | ab, plyne p \ a nebo p \ b. Důkaz. „=>" Předpokládejme, že p je prvočíslo a p \ ab, kde a, b e Z. Protože (p, a) je kladný dělitel p, platí (p,a) — p nebo (p, a) — 1. V prvním případě p \ a, ve druhém p \ b podle části 2. předchozí věty. „<=" Jestliže p není prvočíslo, musí existovat jeho kladný dělitel různý od 1 a p. Označíme jej a. Pak ovšem b = £ e N a platí p = ab, odkud l < a < p, l < b < p. Našli jsme tedy celá čísla a, b tak, že p \ ab a přitom p nedělí ani a, ani b. □ 10.7. Základní věta aritmetiky. Věta. Libovolné přirozené číslo n je možné vyjádřit jako ''■&0 součin prvočísel, přičemž je toto vyjádření jediné, nebereme-li v úvahu pořadí činitelů. (Je-li n ? prvočíslo, pak jde o „součin" jednoho prvočísla, n — 1 je součinem prázdné množiny1 prvočísel) Poznámka. Jak je uvedeno v části 11.18, dělitelnost je možné obdobným způsobem definovat v libovolném oboru integrity. V některých oborech integrity přitom žádné prvky s vlastností prvočísla Qikáme jim ireducibilní) neexistují (např. Q), v jiných sice ireducibilní prvky existují, ale zase tam neplatí věta o jednoznačném rozkladu. Podobné je to se zobecněním výše uvedené Euklidovy věty - prvky splňující p \ ab => p \ a nebo p | b jsou vždy ireducibilní, ale obrácení obecně neplatí. Uvedřne alespoň příklad nejednoznačného rozkladu - v Z(V—5) platí:4 6 = 2-3= (1 + «J—5) • (1 — V—5). To, že všichni uvedení činitelé jsou skutečně v Z(V—5) ireducibilní, je ovšem třeba zdůvodnit. Důkaz Základní věty aritmetiky. Nejprve dokážeme úplnou matematickou indukcí, že každé přirozené číslo n je možné vyjádřit součinem prvočísel. Tvrzení je zřejmé pro n — 1. Předpokládejme nyní, že n > 2 a že jsme již dokázali, že libovolné menší přirozené číslo je možné rozložit na součin prvočísel. Jestliže je n prvočíslo, je tvrzení zřejmé. Pokud n prvočíslo není, pak existuje jeho dělitel d, 1 < d < n. Označíme-li e — n/d, platí také 1 < e < n. Z indukčního předpokladu dostáváme, že d i e je možné vyjádřit jako součin prvočísel, a proto je takto možné vyjádřit i jejich součin d ■ e = n. Předpokládejme nyní, že platí rovnost součinů P\ ■ P2 ■ ■ ■ Ps ~ 11 ■ 12 ■ ■ ■ qt, kde pí, qj jsou prvočísla pro všechna i e {1, ..., s), j e {1, ..., t), a nechť navíc platí Pl < P2 < ■ ■ ■ < Ps, Q\ < 12 < ■ ■ ■ < Qt a 1 < s < t. Indukcí vzhledem k s dokážeme, že s — t a že p\ — q\, ..., ps = qs. Je-lis = ljepi = q\ ■ ■ ■ qt prvočíslo. Pokud by platilo t > 1, mělo by číslo p\ dělitele q\ takového, že 1 < q\ < p\ (neboť 121i ■ ■ ■ Qt > 1), což není možné. Je tedy t — 1 a platí p\ — q\. Předpokládejme dále, že s > 2 a že tvrzení platí pro s — 1. Z rovnosti p\-p2 - ■ ■ Ps ~ 11 -12 ■ ■ ■ 1t, dělí ps součin i\ ■ ■ ■ it, což je podle Euklidovy věty možné jen tehdy, jestliže ps dělí nějaké i j V řeči teorie okruhů jde o jedničku okruhu celých čísel, která je dle obvyklé konvence součinem prázdné množiny prvků okruhu. 4Symbol Z(\/^5) zde značí rozšíření celých čísel o kořen rovnice x1 — —5, které se definuje obdobně, jako jsem získali komplexní čísla z reálných přidáním čísla v°T. 594 KAPITOLA 10. TEORIE ČÍSEL proto 1 \ n. Podobně 835 = 3 (mod 16), a tedy n = (35 + 6)18 - 1 = (3 • 81 + 6)18 - 1 = (3 • 1 + 6)18 - 1 = = 918 - 1 = 819 - 1 = ŕ - 1 = 0 (mod 16), proto 16 | n. Celkem tedy 112 | n, což jsme měli dokázat. □ 10.14. Dokažte, že pro libovolné prvočíslo p platí: i) Je-li e {1, ...,p- V,, pak p | (£). ii) Jsou-li a, b e Z, pak a" + b" = (a + by (mod p). Řešení. i) Protože binomický koeficient splňuje + ■■■ + (^ab"-1 + bp. Díky předchozímu bodu platí (£) = 0 (mod p) pro libovolné k € [1,..., p — 1}, odkud již plyne tvrzení. □ 10.15. Dokažte, že pro libovolná přirozená čísla m,n a libovolná a, b € Z taková, že a = b (mod m"), platí am = bm (mod m"+1). Řešení. Protože zřejmě platí m \ m", dostáváme s využitím vlastnosti (5) z 10.14 rovněž platnost kongruence a = b (mod m). V algebraické identitě am -bm = (a - b)(am-1 + am-2b +■■■ + abm-2 + Z/""1) jsou proto všechny sčítance ve druhé závorce modulo m kongruentní s flm_1, a tedy am-\ + am-2b + . . . + aVn-2 + yn-l = ffl . flm-l = Q (mod my ■+abm-2+bm-'i pro vhodné j e {1,2, t}. Protože q j je prvočíslo, plyne odtud Ps — Q j (neboť ps > 1). Analogicky se dokáže, že qt = pi pro vhodné i e {1, 2, ..., s). Odtud % = Pi < Ps=qj < qt, takže p s = qt. Vydělením obou stran původní rovnosti dostaneme P\ ■ p2 ■ ■ ■ Ps-l = 11 • 12 ■ ■ ■ qt-l, a z indukčního předpokladu pak obdržíme s — 1 = ŕ — l, pi = qi, ps-\ = qs-\. Celkem tedy platíí = t a p\ = qi, ps-\ = qs-\, Ps = q$- Jednoznačnost, a tedy i celá věta, je dokázána. □ 10.8. Praktické poznámky. Jak si ukážeme, je velmi složité wi: o velkých číslech s jistotou rozhodnout, jde-li ^r;-~?p- o prvočíslo (na druhou stranu je o naprosté většině wL_ složených čísel snadné prokázat, že jsou skutečně - složená - viz dále v části 10.38). Přesto se v roce 2002 indickým matematikům 5 podařilo dokázat, že problém prvočíselnosti je možné rozhodnout algoritmem s časovou složitostí polynomiálně závislou na počtu cifer vstupního čísla. Nic podobného se zatím neumí v otázce rozkladu čísla na prvočísla (třebaže se obecně nevěří, že je to možné, exaktní důkaz zatím nebyl podán). Nejrychlejší obecně použitelný faktorizační algoritmus, tzv. síto v číselném tělese, je sub-exponenciální časové složitosti O (V-90ogJvy/3(loglogjv)2/3 ý Peter Shor v roce 1994 vymyslel algoritmus, který číslo N faktorizuje v kubickém čase (tento algoritmus je tedy časové složitosti O (log3 N)) na kvantovém počítači. Je k tomu nicméně třeba sestrojit počítače s dostatečným počtem kvantových bitů (tzv. qubits) -jak je to obtížné, lze vysledovat z toho, ze v roce 2001 se IBM podařilo pomocí kvantového počítače rozložit číslo 15 a v roce 2012 byl dosažen další faktorizační rekord rozkladem čísla 21. Ze je problém rozkladu přirozeného čísla na prvočísla výpočetně složitý, o tom svědčí i (již neplatná) výzva učiněná v roce 1991 firmou RSA Security.6 Pokud se komukoliv podařilo rozložit čísla označená podle počtu cifer jako RSA-100..... RSA-704, RSA-768.....RSA-2048, mohl obdržet 1000..... 30000, 50 000.....resp. 200000 dolarů (číslo RSA-100 rozložil v temže roce Arjen Lenstra, číslo RSA-704 bylo rozloženo v roce 2012, některá další ale dosud rozložena nebyla). Díky jednoznačnosti rozkladu na prvočísla jsme schopni (se znalostí tohoto rozkladu) snadno odpovědět i na otázky ohledně počtu či součtu dělitelů konkrétního čísla. Stejně snadno dostaneme i (z dřívějška intuitivně známý) postup na výpočet největšího společného dělitele dvou čísel ze znalosti jejich rozkladu na prvočísla. Tvrzení. Každý kladný dělitel čísla a — p"1 ■ pk je tvaru P'l kde P\,..., fík e No a f}\ < a\, ft < «2, ■ Číslo a má tedy právě T (a) = (ai + l)(a2 + !)•••• ■ {<*k + 1) je dělitelná m, nutně mn+ dělí jejich součin, což znamená, že a" (mod m"+1). □ M. Agrawal, N. Kayal, N. Saxena. PRIMES is in P. Annals of Mathematics 160 (2): 781-793. 2004. ^Viz http://www.rsasecurity.com/rsalabs/node.asp?id-2093. 595 KAPITOLA 10. TEORIE ČÍSEL 10.16. S využitím předchozího příkladu (viz též příklad || 10.2||) dokažte, že: i) lichá čísla a splňují a4 = 1 (mod 16), ii) pro čísla a nedělitelná třemi platí a3 = ±1 (mod 9). Řešení. i) Toto tvrzení jsme již dokázali v třetí části příkladu || 10.2||. Zde si ukážeme ještě jeden důkaz. Díky části (ii) zmiňovaného příkladu víme, že pro liché číslo a platí a2 = 1 (mod 23), odkud umocněním na druhou (s využitím výsledku předchozího příkladu) dostaneme a4 = l2 (mod 24). ii) Umocníme na třetí (se zvýšením exponentu modulu) kongru-enci a = ±1 (mod 3) a dostaneme a3 = ±1 (mod 32) . □ 10.17. Pravidla dělitelnosti. Všichni si jistě pamatujeme ze školní docházky základní pravidla dělitelnosti (alespoň čísly 2, 3, kladných dělitelů, jejichž součet je 4,5,6,9 a 10) na základě dekadického zápisu daného čísla. Jak ale tato pravidla dokázat a dají se nějak rozšířit i na jiná čísla? Už víme, že se stačí omezit na pravidla dělitelnosti mocninami prvočísel (tedy například dělitelnost šesti testujeme pomocí dělitelnosti 2 a 3). Pravidlo pro dělitelnost devíti uvádí, že dané číslo je dělitelné devíti, právě když je dělitelný devíti jeho ciferný součet. Dokážeme jej jako důsledek silnějšího tvrzení. Platí totiž, že každé číslo je kongruentní se svým ciferným součtem modulo 9 (speciálně je tedy kongruentní s nulou, právě když je kongruentní s nulou jeho ciferný součet). Dokázat to je ale triviální. Ciferný součet čísla n = flj-lO* + ak-\lír~l + ••• + ailO + ao je roven S(n) = ak + ak-\ + • • • + a0, a protože 10ť = lť = 1 (mod 9) pro libovolné £ e No, dostáváme n = aklOk + ■ ■ ■ + flo = ak + • • • + ao = S(n) (mod 9). Stejné odvození funguje i tehdy, nahradíme-li devítku číslem 3. Velmi podobně pak funguje dosud nezmiňované pravidlo pro dělitelnost 11. Zde totiž platí 10ť = (— l)ť (mod 11), a tak dostaneme n = ak!0k H-----h a0 = ak(-l)k H-----h fli(-l) + a0 = = (flo + a2 + • • •) — + fl3 + • • •) (mod 11). Číslo je tedy dělitelné jedenácti, právě když je dělitelný jedenácti rozdíl součtu dekadických cifer na sudých a součtu dekadických cifer na lichých místech. Pro dělitelnost 7 a 13 lze použít hezký trik. Platí totiž 1001 = 7-11-13, proto pro číslo n = 1000a + b platí, a(a) ■- pT+1 1 Pľ+l 1 P\ - 1 Pk-Í Nechť p i, ..., pk jsou navzájem různá prvočísla aa\,ak, P\, fik nezáporná celá čísla. Označíme-li y i — min{a;,/5;}, Si = maxjo!;, Pí] pro každé i — 1, 2, ..., k, pak platí (pT ■Pk - Pí <*k fi\ ■Pk 'PV ■Ák) = p\X p\ ■pí- Důkaz. Důkazy všech ziníněných tvrzení jsou jednoduchým důsledkem prvního tvrzení o tom, jak vypadají kladní dělitelé čísla a. Pro počet kladných dělitelů pak jednoduchou kombinatorickou úvahou (pravidlo součinu) dostaneme r (a) — (a\ + l)(a2 + 1) • —(ak +1). Tvrzení o součtu těchto dělitelů uvidíme, zapíšeme-li si tento součet ve tvaru a uvědomíme-li si, že každá závorka v tomto součinu je součtem konečné geometrické řady. Další tvrzení jsou již zřejmá z definice. □ 10.9. Dokonalá čísla a jejich vztah k prvočíslům. Se součtem všech kladných dělitelů daného čísla souvisí pojem tzv. dokonalého čísla. Řekneme, že a je dokonalé, pokud splňuje podmínku a (a) = 2a, resp. slovně, pokud součet všech kladných dělitelů čísla a menších než a samotné je roven číslu a. Takovými číslyjsounapř. 6 = 1+2+3,28 = 1+2+4+7+14, 496 a 8128 (jde o všechna dokonalá čísla menší než 10 000). Lze ukázat, že sudá dokonalá čísla jsou v úzkém vztahu s tzv. Mersenneho prvočísly. Platí totiž následující fakt. Tvrzení. Přirozené číslo a je sudé dokonalé číslo, právě když je tvaru a — 2q~l (2q — 1), kde 2q — 1 je prvočíslo. Důkaz. Je-lia = 29_1 (2q — 1), kde p — 2q — 1 jeprvočíslo, pak z předchozího tvrzení plyne a(a) = ^—L ■ (p + 1) = (2* - 1) • 2q = 2a. Takové číslo a je tedy dokonalé. Pro důkaz opačného směru uvažme libovolné sudé dokonalé číslo a a pišme a = 2k ■ m, kdem, k e N a 2 \ m. Protože je funkce a multiplikativní (viz 10.15), je a (a) — a (2k) ■ a (ní) — (2k+l — 1) • a (ní). Přitom ale z dokonalosti čísla a plyne a (a) — 2a — 2k+l ■ m, odkud 2k+l -m = (2k+l - l)-a(m). Protože je 2k+l — 1 liché, nutně 2k+l — 1 | m a můžeme položit m — (2k+l — 1) • n pro vhodné nel. Úpravou dostáváme 2k+l ■ n — a (ni). Mezi dělitele čísla m přitom patří čísla min (a protože ^ = 2k+l — 1 > 1, jsou tato čísla nutně různá), proto 2k+l -n = o(m) >m + n = 2k+l ■ n, a tedy a (ní) — m + n. To znamená, že m je prvočíslo s jedinými děliteli m a n = 1, odkud a = 2k ■ (2k+l - 1), kde 2k+l - 1 = m je prvočíslo. □ 596 KAPITOLA 10. TEORIE ČÍSEL žen = — a + b (mod m), kde m je kterékoliv z čísel 7,11,13. Je tedy 2015 dělitelné 13, neboť 015 - 2 = 13. Podobně 2016 je dělitelné 7, neboť 016 — 2 = 14 je násobek čísla 7. Stejně bychom mohli zdůvodnit i to, že 2013 je násobek 11, ale dříve uvedené kritérium 11 | (3 + 0) — (1 + 2) je přece jen elegantnější. Využití dělitelnosti při detekci chyb. Poznamenejme, že dělitelnost v\^±v jedenácti je často využívána pro tvorbu dekadických kódů, "AtJo ^de Jsme schopni detekovat chybu v jedné číslici. Když totiž 9 uděláme takovou chybu při přepisu čísla dělitelného jedenácti, výsledek jistě dělitelný jedenácti nebude (viz výše zmíněné kritérium dělitelnosti jedenácti). Podrobněji v kapitole 11.59 o kódování. Každý si to může vyzkoušet na svém rodném čísle, které by mělo být vždy dělitelné jedenácti. Podobně čísla bankovních účtů vedených u českých bank musí dle směrnice České národní banky podléhat podobné (jen o málo složitější) proceduře. Jak (transformované) šestimístné předčíslí a5a4a3a2a-iao, tak desetimístné číslo účtu bgbgbTb6b5b4b3b2b\bo musí splňovat podmínku dělitelnosti jedenácti (zde uvedeme pouze pro číslo bez předčíslí): 0 = b929 + bg2& + b-,21 +----h b323 + b222 + b{2x + b02° = = -5b9 + 3h ~ 4b7 - 2b6 - b5+ + 5b4 - 3b3 + 4b2 + 2bi + b0 (mod 11). Tuto podmínku lze stručně popsat tak, že dělitelné jedenácti má být číslo chápané jako zápis ve dvojkové soustavě (ovšem s využitím dekadických cifer). 10.18. Ověřte, že číslo bankovního účtu Masarykovy univerzity 85636621/0100 je korektně sestaveno. Řešení. Otestujeme podmínku dělitelnosti jedenácti: - 5b9 + 3h ~ 4b7 - 2b6 - b5 + 5b4 - 3b3 + 4b2 + 2bx + b0 = = -4-8-2-5-l-6 + 5- 3- 3- 6 + 4- 6 + 2- 2+ l- l = = 0 (mod 11) . □ Eulerova funkce. Eulerova funkce

P prime numbers. The first is that, [they are] the I most arbitrary and ornery objects studied by ' <"' mathematicians: they grow like weeds among the natural numbers, seeming to obey no other law than that of chance, and nobody can predict where the next one will sprout. The second fact is even more astonishing, for it states just the opposite: that the prime numbers exhibit stunning regularity, that there are laws governing their behavior, and that they obey these laws with almost military precision. Don Zagier Nyní se budeme snažit zodpovědět následující otázky: Je prvočísel nekonečně mnoho? Je prvočísel nekonečně mnoho v každé (nebo aspoň některé) aritmetické posloupnosti? Jak jsou prvočísla rozložena mezi přirozenými čísly? Základní větou, kterou je potřeba v této souvislosti zmínit, je fakt známý již kolem roku 300 př. n.l. Euklidovi. 10.11. Věta (Eukleidés). Mezi přirozenými čísly existuje nekonečně mnoho prvočísel. Důkaz. Předpokládejme, že prvočísel je konečně mnoho a označme je p\, p2, ..., p„. Položme N — p\ ■ p2 ... pn + 1. Toto číslo je buď samo prvočíslem nebo je dělitelné nějakým prvočíslem různým od p\, ..., p„ (čísla p\, ..., p„ totiž dělí číslo N — 1), což je spor. □ Uvedme nyní docela silné tvrzení, jehož důkaz je sice poměrně pracný (a proto jej zde neuvádíme), ale lze jej provést elementárními prostředky7. (p(m) = {pi - l)p"< ■ (Pk Dpr1- 7Viz Wikipedia, Proof of Bertrand's postulate, http: / /en . wikipedia. org/wiki/Proof_of_Bertrand's_postulate (as of July 15, 2013, 12:05 GMT) nebo viz M. Aigner, G. Hegler, Proofs from THE BOOK, Springer, 2009. 597 KAPITOLA 10. TEORIE ČÍSEL Víme tedy zejména, že (p(pa) platí (p{m ■ n) = 3 je buď dělitelné lichým prvočíslem p (v takovém případě je 1 existuje alespoň jedno prvočíslo p splňující n < p <2n. Prvočísla jsou relativně rovnoměrně rozložena v tom smyslu, že v libovolné „rozumné" aritmetické posloupnosti (tj. takové, jejíž členy jsou nesoudělné s diferencí) je jich nekonečně mnoho. Například zbytek 1 po dělení čtyřmi, stejně jako zbytek 3 po dělení čtyřmi dá vždy nekonečně mnoho prvočísel (zbytek 0 nedá samozřejmě žádné prvočíslo a zbytek 2 pouze jediné). Obdobná situace je pak při uvažování zbytků po dělení libovolným jiným přirozeným číslem, jak uvádí následující věta, jejíž důkaz je ovšem velmi obtížný. 10.12. Věta (Dirichletova o prvočíslech). Jsou-li a, m nesoudělná přirozená čísla, existuje nekonečně mnoho přirozených čísel k tak, Že mk + a je prvočíslo. Jinými slovy, mezi čísly 1 • m + a, 2 ■ m + a, 3 • m + a, ... existuje nekonečně mnoho prvočísel. Uvedme alespoň důkaz tohoto tvrzení ve speciálním případě, který je modifikací Euklidova důkazu nekonečnosti prvočísel. Tvrzení. Existuje nekonečně mnoho prvočísel tvaru 4k + 3, kde k e N0. Důkaz. Předpokládejme naopak, že existuje pouze konečně mnoho prvočísel tohoto tvaru a označme je p\ = 3, p2 = 7, P3 = 11.....p„. Položme N = 4p2- P3.....p„ +3. Rozložíme-ti N na součin prvočísel, musí v tomto rozkladu (v souladu s výsledkem příkladu ||10.3||) vystupovat aspoň jedno prvočíslo p tvaru 4k + 3. V opačném případě by bylo N součinem prvočísel tvaru 4k + 1, proto by i V bylo tvaru 4k + 1, což není pravda. Prvočíslem p ovšem nemůže být žádné z prvočísel p\, P2, ■ ■ ■, pn, protože pokud by pro nějaké i e [2, ..., n) platilo pi | N, dostali bychom Pi | 3. Rovněž 3 f V a dostáváme tak spor s předpokládanou konečností počtu prvočísel daného tvaru. □ Analogický elementární důkaz lze použít pro prvočísla tvaru 3k + 2 nebo 6k + 5, neprojde ale stejně snadno pro prvočísla tvaru 3k + 1 nebo 4k + 1 (rozmyslete si proč; ve druhém případě to budeme schopni napravit v části 10.32 o kvadratických kongruen-cích). Z tvrzení uvedených v této kapitole je možné si udělat hrubou představu o tom, jak ,Jiustě" se mezi přirozenými čísly prvočísla vyskytují. Přesněji (i když „pouze" asymptoticky) to popisuje následující velmi důležitá věta, dokázaná nezávisle J. Hadamardem a Ch. J. de la Vallée-Poussinem v roce 1896. 10.13. Věta (Prime Number Theorem, věta o hustotě prvočísel). Nechť 7i(x) udává počet prvočísel menších nebo rovných číslu x e R. Pak x 7t(x) ~--, Inx tj. podíl funkcí jt(x) a x/lnx se pro x —> oo limitně blíži k 1. To, jak dobře odpovídá asymptotický odhad tt(x) ~ x/ ln(x) realitě v některých konkrétních případech, ukazuje následující tabulka: x n(x) x/la(x) 1 relativní chyba 100 25 21,71 0,13 1000 168 144,76 0,13 10000 1229 1085,73 0,11 100000 9592 8685,88 0,09 500000 41538 38102,89 0,08 598 KAPITOLA 10. TEORIE ČÍSEL taková, že dělíme-li jimi číslo 30, dostaneme liché číslo větší než 1. Kdyby tedy např. bylo m = 7 • m\, kde 7 \ m\, pak by muselo platit (p(tn\) = 5, což, jak víme z předchozího příkladu, nemá řešení. Dostáváme tedy /3 = }/ = 5 = 0 a m = 2" • 31E, odkud již snadno získáme řešení m e {31, 62}. ii) Podobně jako výše mohou být v rozkladu m pouze prvočísla p € {2, 3}, přičemž prvočíslo 3 nejvýše v první mocnině. Protože ale ^ = 17, prvočíslo 3 v rozkladu m nebude vůbec. Zbývá tedy možnost m = 2a, pak ale 34 = 2a~1, což rovněž není možné. Takové m tedy neexistuje. iii) Pro každé prvočíslo p z rozkladu m na prvočinitele musí platit p - 1 | 20, tedy p - 1 e {1, 2, 4, 5,10, 20}, což splňují prvočísla p € {2, 3, 5, 11}, z nichž pouze 2 a 5 mohou v rozkladu vystupovat ve vyšší než první mocnině. Je tedy m=2a3f,5yUs, kde a e {0, 1, 2, 3}, y e {0,1, 2}, /3, 5 e {0,1}. Nejprve uvažme 5 = 1. Pak ^(2<*3ŕ)51/) = 2, odkud snadno y = 0 a (a, P) e {(2, 0), (1, 1), (0,1)}, což nám dá trojici řešení m e {44, 66, 33}. Dále tedy 5 = 0. Je-li y = 2, pak 1. Pak (p(m) = 2-3"-1 - 1 . □ 10.22. Určete všechna dvojciferná čísla n, pro něž 91 =n e4t)=iz7ép^> kde sčítáme přes všechny 7r(n)-tice nezáporných celých čísel (a\, ..., dyn)). Protože každé číslo nepřevyšující n se rozkládá pouze na prvočísla z množiny {p\, ..., p%{n)), je určitě každé takové číslo v tomto součtu zahrnuto. Tedy A.(n) > l+^H-----v\, a protože harmonická řada diverguje (viz příklad ||5.108||), je i lim„. 3 A.(n) = 00. S využitím rozvoje funkce ln(l + x) do mocninné řady (viz příklad ||6.141|) dále dostáváme jr(ři) jr(fi) co mm = - j: ln (l i) - E E ('»prr1 = í = 1 í = 1 m=l jr(fi) co = /T1 + ---+^(I,+EEKrr1. í = 1 m=2 Protože vnitřní součet lze shora odhadnout jako co co EW) proto musí nutně divergovat první součet Pj^ > coz jsme chtěli dokázat. □ 3. Kongruence Pojem kongruence zavedl C. F. Gauss v roce 1801 ve své knize Disquisitiones Arithmeticae. Je to pojem velice jednoduchý, jeho důležitost a užitečnost v teorii čísel S^J*"' Ž^-— se ale proj evuj e zejména ve stručných a přehledných zápisech některých i velmi komplikovaných úvah. 599 KAPITOLA 10. TEORIE ČÍSEL i) pro některé i e {1,..., k] je pi = 1 (mod 9), ii) pro některé i e {1,..., k) je pi = 3 a a,- > 3, iii) pro některá různá i, j e {1,..., k) je pi = 3 a a,- = 2 a p j = 1 (mod 3), iv) pro některá různá i, j e {1,..., k] je pi = 1 (mod 3) a p j = 1 (mod 3). Pokud se (dle zadání) omezíme na čísla n < 100, pak podmínce i) odpovídají prvočísla 19, 37 a 73 (spolu s násobky 38, 57, 76, 95 a 74), ii) odpovídají čísla 33 = 27, 34 = 81 (spolu s násobkem 54), iii) odpovídá číslo 32 • 7 = 63, iv) odpovídá číslo 7 13 = 91. □ 10.23. (Malá) Fermatova věta. Dokážeme ještě dvěma jinými rJ^y- způsoby (matematickou indukcí a kombinatorickou úvahou) Fermatovu větu, která udává, že pro a e Z a prvočíslo p *lX nedělící a platí ap~l = 1 (mod p). Řešení. Dokážeme nejprve (indukcí vzhledem k a), že ekvivalentní tvrzení ap = a (mod p) platí pro libovolné a e N a prvočíslo p. Pro a = 1 není co dokazovat, dále tedy z platnosti tvrzení pro a dokážeme jeho platnost i pro a+1. Z indukčního předpokladu a příkladu ||10.14|| dostáváme (a + I)" = a" + l" = a + 1 (mod p), což jsme potřebovali dokázat. Tvrzení dále triviálně platí pro a = 0 a v případě a < 0, p = 2. Pro a < 0 a p liché dostaneme z předchozího, protože —a je přirozené číslo, že — ap = (—a)p = —a (mod p), odkud již snadno ap = a (mod p). Kombinatorický důkaz jde na věc poněkud „od lesa": podobně jako v úlohách využívajících Burnsideovo lemma (viz příklad || 11.571|) máme za úkol určit počet náhrdelníků dané délky (ty vzniknou navlečením několika šperků na šňůrku a jejím svázáním) vytvořených z několika typů šperků s tím, že nerozlišujeme náhrdelníky, které je možné na sebe převést otočením (a liší se tedy jen tím, kde je zavázaný „uzlík"). Vcelku snadno si lze rozmyslet, že navlékáme-li n šperků, lze v některých konstelacích převést náhrdelník sám na sebe při otočení o určitý počet šperků (vždy ale pouze o počet dělící n - např. navlečeme-li 8 šperků dvou druhů, které pravidelně střídáme, pak při otočení o 2,4 nebo 6 obdržíme původní náhrdelník). Předpokládejme nyní, že máme a typů šperků a požadovaný počet použitých šperků najeden náhrdelník je dán prvočíslem p. Zřejmě pro každý náhrdelník využívající alespoň dvou typů šperků dostáváme | kongruence |__, Jestliže dvě celá čísla a, b mají při dělení přirozeným číslem m týž zbytek r, kde 0 < r < m, nazývají se a, b kongruentní modulo m (též kongruentní podle modulu m), což zapisujeme a = b (mod m). V opačném případě řekneme, že a, b nejsou kongruentní modulo m, a píšeme a ^ b (mod ní). V případech, kdy je zřejmé, že pracujeme s kongruencemi, často symbol mod vynecháváme a píšeme jen a = b (m). Lemma. Pro libovolná a, b e Z, m e N jsou následující podmínky ekvivalentní: (1) a = b (mod m), (2) a — b + mt pro vhodné t e Z, (3) m I a — b. Důkaz. (1)=>(3) Jestliže a — q\m + r,b — q2m + r, pak a — b — (q\ — q2)m. (3)=>(2) Jestliže m \ a — b, pak existuje t e Z tak, že m - t — a — b, tj. a — b + mt. (2)=>(1) Jestliže a — b + mt, pak z vyjádření b — mq + r plyne a — m(q + i) + r, tedy a i b mají při dělení číslem m týž zbytek r, tj. a = b (mod m). □ 10.14. Základní vlastnosti kongruencí. Přímo z definice plyne, že kongruence podle modulu m je relací ekvivalence. Dokážeme nyní další vlastnosti kongruencí. | Vlastnosti kongruencí |__, (1) Kongruence podle téhož modulu můžeme sčítat. K některé straně kongruence můžeme přičíst libovolný násobek modulu. (2) Kongruence podle téhož modulu můžeme násobit. (3) Obě strany kongruence je možné umocnit na totéž přirozené číslo. (4) Obě strany kongruence můžeme vydělit jejich společným dělitelem, jestliže je tento dělitel nesoudělný s modulem. Obě strany kongruence i její modul můžeme vydělit jejich společným kladným dělitelem. (5) Jestliže kongruence platí podle modulu m, platí podle libovolného modulu d, který je dělitelem čísla m. (6) Jestliže je jedna strana kongruence a modul dělitelný nějakým celým číslem, musí být tímto číslem dělitelná i druhá strana kongruence. (7) Jestliže kongruence platí podle modulů m\, ..., mj, platí i podle modulu, kterým je nejmenší společný násobek [m\, ..., mk\ těchto čísel. Důkaz. (1) Je-li a = b (mod m) ac = d (mod m), existují podle předchozího lemmatu čísla s,teZ tak, že a = b + ms, c — d + mt. Pak ovšem a + c — b + d + m(s + i) a opět podle lemmatu a + c = b + d (mod m). Sečteme-li kongruenci a = b (mod m) s kongruencí mk = 0 (mod m), jejíž platnost je zřejmá, dostaneme a + mk = b (mod m). 600 KAPITOLA 10. TEORIE ČÍSEL různým umístěním uzlíku p různých p-tic šperků na šňůrce (což ale není případ náhrdelníků sestavených pouze z jednoho typu šperku). Vidíme tedy, že počet různých náhrdelníků je roven ap — a --h a, což zejména znamená, že musí platit p \ ap — a. Například pro hodnoty a = 2, p = 5 tak určujeme počet náhrdelníků dvou typů šperků (A, B) délky pět. Dáme-li ze všech 25 různě navlečených šňůrek stranou 2 náhrdelníky tvořené pouze jedním typem (AAAAA, BBBBB), pak dále máme 2-^ = 6 náhrdelníků, které na sebe nelze převést otáčením (ABBBB, AABBB, AAABB, AAAAB, ABABB, AABAB). □ Eulerova věta a řády čísel modulo m. Díky Eulerově větě máme pro každé a e Z nesoudělné s modulem m zajištěnu existenci jeho řádu, tj. nejmenšího přirozeného čísla n splňujícího a" = 1 (mod rvi). Významná jsou zejména ta čísla a, která mají řád roven w{m), tzv. primitivní kořeny modulo m. 10.24. Určete poslední dvojčíslí čísla 72013. Řešení. Snadno se uvidí, že řád 7 modulo 100 je roven čtyřem - např. proto, že 72 = 49 a 492 = (50 — l)2 = = 502 - 2 • 50 + 1 = 1 (mod 100). Stačí tedy určit zbytek r čísla 2013 po dělení čtyřmi, pak totiž 72013 = 7r (mod 100). Ale zřejmě r = 1, proto je hledané poslední dvojčíslí rovno 07. □ 10.25. Určete poslední cifru čísel i) 3*\ ii) 37 iii) 121 3737 O 10.26. i) Určete zbytek po dělení čísla 250 + 350 + 450 číslem 17. ii) Určete zbytek po dělení čísla 2181 + 3181 + 5181 číslem 37. Řešení. i) Podle Fermatovy věty je 216 = 316 = 416 = 1 (mod 17). Protože 50 = 2 (mod 16), dostáváme 250 + 350 + 450 = 22 + 32 + 42 = 12 (mod 17) . ii) Podobně 236 = 336 = 536 = 1 (mod 37), proto 2i8i + 3i»i + 5i8i = 2 + 3 + 5 = 10 (mod 37) . □ (2) Je-li a = b (mod m) a c = d (mod m), existují s.leZ tak, že a — b + ms, c = d + mí. Pak ac — (b + ms)(d + mi) — bd + m(bt + ds + msi), odkud dostáváme ac = bd (mod m). (3) Nechť a = b (mod m), pak pro přirozené číslo n ze vztahu : (a -b)(a"-1 +a"-2b 10.27. Dokažte, že pro všechna lichá n e N platí n | 2™! — 1. Q plyne rovněž a" = b" (mod m). (4) Předpokládejme, že a = b (mod m), a — a\ ■ d,b — b\ ■ d a (m, d) = 1. Podle lemmatu je rozdíl a — b = (a\ — b\) ■ d dělitelný číslem m, a protože (m,d) = 1, je podle lemmatu 10.5 číslo a\—b\ také dělitelné číslem m. Odtud plyne ai = b\ (mod m). Dále pokud ad = bd (mod md), tj. md | ad — bd, dostáváme přímo z definice dělitelnosti, že m | a — b. (5) Jestliže a = b (mod m), je a — b násobkem m, a proto také násobkem dělitele d čísla m, odkud a = b (mod d). (6) Předpokládejme, že a = b (mod m), Ŕ = b\d, m — m\d. Pak existuje t e Z tak, že a — b + mt — b\d + m\dt — — (b\ + m\i)d, a tedy | a. (7) Je-li a = b (mod mi),a = b (mod »12), ■ ■ ■, a = b (mod mj), pak je rozdíl a — b společným násobkem čísel m\, mi, ..., mj, a je tedy dělitelný jejich nejmenším společným násobkem [m\, mi, ..., mk], odkud plyne a = b (mod [mi, ..., mt]). □ Poznámka. Některé vlastnosti kongruencí jsme dosud používali, aniž bychom to explicitně zmínili - výsledek příkladu || 10.31 lze nyní přeformulovat do tvaru ,jestliže a = 1 (mod m), b = 1 (mod m), pak také a£> = 1 (mod m)", což je speciální případ bodu (2) z předchozího tvrzení. Nejde o náhodu, protože libovolné tvrzení používající kongru-ence můžeme přepsat pomocí dělitelnosti. Užitečnost kongruencí netkví v tom, že bychom pomocí nich mohli řešit více úloh, než bez nich, ale v tom, že jde o velmi vhodný způsob zápisu, který výrazným způsobem zjednodušuje jak vyjadřování, tak některé prováděné úvahy. 10.15. Aritmetické funkce. ''Si 4íí Aritmetickou funkcí zde rozumíme jakoukoliv funkci, jejímž definičním oborem je množina přirozených čísel. Definice. Rozložme přirozené číslo n na prvočísla: n — p"1 ■■■p"k. Hodnotu Môbiovy funkce p,(ri) definujeme rovnu 0, pokud pro některé i platí a, > la rovnu (—1)* v opačném případě. Dále definujeme /í(1) = 1 (což je v souladu s dřívější konvencí, že 1 se rozkládá na „součin" nulového počtu prvočísel). Příklad. /x(4) = p,(22) = 0,/x(6) = p(2 ■ 3) = (-1)2 = 1, /x(2) = /x(3) = -l. Dokážeme nyní několik důležitých vlastností Môbiovy funkce, zejména tzv. Mobiovu inverzní formuli. Lemma. Pro n e N \ {1} platíJ2d\n — 0. Důkaz. Zapíšeme-li n ve tvaru n — p"1 ■ ■ ■ p"k, pak všichni dělitelé d čísla n jsou tvaru d — p^1 ■ ■ ■ p^k, kde 0 < Pí < a,- pro 601 KAPITOLA 10. TEORIE ČÍSEL 10.28. i) Určete poslední číslici čísla 79 . ii) Určete zbytek po dělení jedenácti čísla 1514'\ Řešení. i) Řád 7 modulo 100 je podle příkladu ||10.24|| roven čtyřem, proto stačí zjistit zbytek (nehorázně velkého) exponentu po dělení čtyřmi. Protože platí 9 = 1 (mod 4), dává i celý exponent zbytek 1 po dělení čtyřmi, a proto je hledaná poslední číslice rovna 71 = 7. ii) Řád čísla 15 = 4 (mod 11) je roven 5 (což zjistíme buď přímým výpočtem, nebo protože 2 je primitivní kořen modulo 11 (viz též příklad ||10.32||), pak z věty 10.18 dostaneme, že řád 4 = 22 je roven = 5). Stačí tedy určit zbytek exponentu modulo 5, tedy 141 (-D1 -1=4 (mod 5), proto j e hledaný zbytek roven 44 = 28 = 256 = 6 — 5 + 2 = = 3 (mod 11). (Mohli jsme též postupovat tak, že 44 = = 4_1 = 3 (mod 11).) □ 10.29. Určete poslední dvě cifry v dekadickém rozvoji čísla 1414'4. :y-~í: Řešení. Zajímá nás zbytek čísla a = 1414'4 po dělení 100. "mV Protože je ale (14,100) > 1, nelze hovořit o řádu čísla 14 ^ modulo 100 a raději proto rozložíme modul na nesoudělné faktory 100 = 4 • 25. Zřejmě 4 | a, stačí tedy zjistit, s čím je a kongru-entní modulo 25. Podle Eulerovy věty je 14¥>(25) _ 2421 1 (mod 25), proto nás bude zajímat zbytek čísla 1414 po dělení 20 = 4 • 5. Opět triviálně 4 | 1414 a dále 1414 = (-1)14 = 1 (mod 5), proto je 141' 16 (mod 20). Celkem tedy 1414'4 = 1416 = 216 • 716 (mod 25). Další výpočty si značně usnadníme, uvědomíme-li si, že 72 = -1 (mod 25) a25 = 7 (mod 25). Pak totiž 1414'4 = 216 • 716 = (25)3 • 2 • 716 = = 73 . 2 • 716 = 2 • 719 = 2 • (-1)9 -7 = 11 (mod 25). Hledáme tedy číslo menší než 100, které je násobkem čtyř a po dělení 25 dává zbytek 11 - takovým je zřejmě pouze číslo 36. □ všechna i e {1, ..., k). Proto dl" (/3,,...,ft)€(NU{0))i (/3,,...,ft)€{0,l)i = (ě)+© • (-d+© • (-d2+• • -+© - = = (l + (-l))i = 0. přičemž jsme ve třetí rovnosti využili kombinatorickou úvahu -sčítanec (*) (— l)ť udává příspěvek dělitelů d — p^1 • • • p^k s vlastností, že právě í z exponentů fi\, ..., jerovnojedné;těchjetotiž (*) a pro každý z nich platí, že /x(pf1 • • • pf*) = (-l)ť. □ S Môbiovou funkcí úzce souvisí pojem Dirichletův součin (též Dirichletova konvoluce). Definice. Budte /, g aritmetické funkce. Jejich Dirichletův součin je definován předpisem (/° gx«) = EE f( 1, resp. I(n) — 1 pro všechna nel. Pak pro každou aritmetickou funkci / platí: /oI = Io/ = / a (/ o /)(«) = (/ o /)(«) = £/(rf). d\n Dále platí Iofi — fiol — l, neboť (/ o /x)(«) = J21 w)^ (ž) = E7 (3) m* = r/|ři r/|ři pro všechna n > 1 r/|ři podle lemmatu za definicí Môbiovy funkce (pro n = 1 je tvrzení zřejmé). Věta (Môbiova inverzní formule). Nechť je aritmetická funkce F definovaná pomocí aritmetické funkce f předpisem F(n) = ~}Zd\n í(d). Pak lze funkci f vyjádřit ve tvaru f(n) = "->">(§)• F(,i). d\n Důkaz. Vztah F (n) = ~}Zd\n f (d) lze jiným způsobem zapsat jako F — f o I. Proto F o /j, = (/ o /) o /i = / o (/ o pS) — — f o I = /, což je tvrzení věty. □ Definice. Multiplikativní funkcí přirozených čísel rozumíme takovou aritmetickou funkci, která pro všechny dvojice nesoudělných čísel a, b e N splňuje f (a ■ b) = f (a) ■ f (b). 602 KAPITOLA 10. TEORIE ČÍSEL 10.30. Určete poslední tři cifry čísla 1210". Řešení. Podobně jako v předchozím příkladu budeme zkoumat zbytky po dělení nesoudělnými čísly 125 a 8. Víme, že (12,125) = 1 a 2. Ověříme, že 2 je primitivním kořenem modulo 11. Řád čísla 2 dělí (pil 1) = 10, proto stačí ověřit, že 22 fá 1 (mod 11) a 25 = 32 = — 1 fá 1 (mod 11). Je tedy skutečně 10 řádem čísla 2 modulo 11. □ 10.33. Postupně určíme (s využitím tvrzení z teoretické části) primitivní kořeny modulo 41,412 a 2 • 412. Řešení. Protože ^(41) = 40 = 23 • 5, je libovolné celé číslo g, které je s 41 nesoudělné, primitivním kořenem modulo 41 právě tehdy, když g20 =á 1 (mod 41) A / =á 1 (mod 41). Příklad. Multiplikativními funkcemi jsou (jak se lze snadno přesvědčitpřímo zjejich definice) např. funkce a(n), r(n), či /x(«) nebo, jak brzy dokážeme, tzv. Eulerova funkce j_ Pro přirozené číslo n definujme Eulerovu funkci

g = 6 : 68 = 28 • 38 = 10 • 1 = 10 (mod 41), 620 = 220 . 320 = 220 . (38)2 • 34 = = 1-1. (_!) = _! (mod 41). Dokázali jsme tak, že 6 je (nejmenší kladný) primitivní kořen mo-dulo 41 (pokud by nás zajímaly i ostatní primitivní kořeny modulo 41, tak bychom je dostali umocněním 6 na všechna čísla od 1 do 40, která jsou se40nesoudělná-jejichprávě<^(40) = <^(23-5) = lóajsoujimi tyto zbytky modulo 41: ±6, ±7, ±11, ±12, ±13, ±15, ±17, ±19). Dokážeme-li nyní, že 640 == 1 (mod 412), budeme vědět, že 6 je i primitivním kořenem modulo libovolná mocnina 41 (pokud bychom „měli smůlu" a vyšlo by, že 640 = 1 (mod 412), pak by primitivním kořenem modulo 412 bylo číslo 47 = 6 + 41). Při ověření podmínky si vypomůžeme několika triky (tzv. modulární reprezentace čísel), abychom se obešli bez manipulace s velkými čísly. Nejprve vypočtěme zbytek po dělení 68 číslem 412; k tomu se nám bude hodit vypočítat zbytek po dělení čísel 28 a 38: 28 = 256 = 6 • 41 + 10 (mod 412), 38 = (34)2 = (2 • 41 - l)2 = -4 • 41 + 1 (mod 412). Pak 68 = 28 • 38 = (6 • 41 + 10)(-4 -41 + 1) = = -34 • 41 + 10 = 1 ■ 41 + 10 (mod 412) a g40 = (g8)5 = (7 . 41 + 1Q)5 = (1Q5 + 5 . 7 . 41 . 1Q4) = = 104(10 + 35 • 41) = (-2 • 41 - 4)(-6 • 41 + 10) = = (4 • 41 - 40) = 124 =É 1 (mod 412). Přitomjsme využili toho, že 104 = 6-412 - 86,tj. 104 = -2-41-4 (mod 412). 10.16. Malá Fermatova věta, Eulerova věta. Tato tvrzení patří ir»j, mezi nejdůležitější výsledky elementární teorie čísel >ÍÍ a budeme Je velmi často využívat v dalších nejen teo- ! _">9Cjr' retických, ale zejména i praktických, úlohách. Věta (Fermatova, Malá Fermatova). Nechť a e Z,, p prvočíslo, p \ a. Pak a"-1 ee 1 (mod p). Důkaz. Tvrzení vyplyne jako snadný důsledek Eulerovy věty (a spolu s ní je tak důsledkem obecnějšího tvrzení Lagrangeovy věty 11.10). Dá se ale dokázat i přímo (např. matematickou indukcí nebo kombinatoricky, jak je uvedeno v příkladu ||10.23||). □ Někdy se Fermatova věta uvádí v následující podobě, která je zřejmě ekvivalentní původnímu tvrzení. Důsledek. Nechť a e Z, p prvočíslo. Pak ap = a (mod p). Předtím než zformulujeme a dokážeme Eulerovu větu, zavedme ještě potřebné pojmy. [ Soustava zbytků |__ Úplná soustava zbytků modulo m je libovolná m-tice čísel po dvou nekongruentních modulo m (nejčastěji je používána m-tice 0,1, ... ,m — 1 nebo pro lichá m její „symetrická" varianta -2^i, -1,0, 1, 2^i). Redukovaná soustava zbytků modulo m je libovolná biovy inverzní formule. Tato formule ve svém standardním tvaru dává do souvislosti vyjádření aritmetické funkce přirozených čísel F pomocí funkce / ve tvaru F{n) = YJf(d) d\n s inverzním vyjádřením funkce / pomocí funkce F ve tvaru /(*) = £>(2) ■ FW). d\n Hodnota funkce fi(n) je určena rozkladem jejího argumentu na prvočinitele takto: • je-li v rozkladu některé prvočíslo ve vyšší než první mocnině, pak je fi(n) = 0, • jinak je fi(n) = (—1)*, kde k je počet prvočísel v rozkladu. Tuto formuli lze přitom zobecnit mnoha způsoby - zejména platí v situaci, kdy jsou Fa/ funkcemi z N do libovolné abelovské grupy (G, •). V takovém případě má (při chápání operace v G jako multiplikativní) formule tvar f(n) = Y,F(df^). d\n Ukažme si použití Mobiovy inverzní formule na komplexnějším příkladu z teorie konečných těles. Uvažme p-prvkové těleso Fp (tedy okruh zbytkových tříd modulo libovolné prvočíslo p) a zkoumejme počet Nd normovaných ireducibilních polynomů daného stupně d nad tímto tělesem. Označme Sd(x) součin všech takových polynomů. Z teorie konečných těles si vypůjčíme (nepříliš těžké) tvrzení, které říká, že pro libovolné n e N platí x"" -x = Y\Sd(x). d\n Porovnáním stupňů polynomů na obou stranách dostaneme vztah p" = J2dNd, d\n odkud ihned aplikací standardní Môbiovy inverzní formule dostaneme "-jĽ-Gy- d\n S Eulerovou funkcí a Eulerovou větou úzce souvisí důležitý pojem rád čísla modulo m - i v tomto případě jde jen o jinak nazvaný řád prvku v grupě invertibilních zbytkových tříd modulo m: _--1 Řád čísla ]---- Nechť aeZ,meN(íz,m) = l. Řádem čísla a modulo m rozumíme nejmenší přirozené číslo n splňující a" = 1 (mod m). To, že je řád vůbec definován, plyne z Eulerovy věty - pro každé číslo nesoudělné s modulem je totiž jistě jeho řád nejvýše roven s. Vydělíme-li číslo t — s číslem r se zbytkem, dostaneme t — s = = q ■ r + z, kde q, z € No, 0 < z < r. „<=" Protože t = s (mod r), máme z = 0, atedya'~s = a^ = = (ar)q = l9 (mod m). Vynásobením obou stran kongruence číslem as dostaneme tvrzení. 605 KAPITOLA 10. TEORIE ČÍSEL Zejména pak odtud plyne, že pro libovolné n e N je 7V„ = i (pn — ■ ■ ■ + p(n)p) ^ 0, neboť výraz v závorce je součtem různých mocnin p vynásobených koeficienty ±1, a nemůže tak být roven 0. Proto existují ireducibilní polynomy nad Fp libovolného stupně n, a existují tedy i konečná tělesa Fpn, která mají p" prvků pro libovolné prvočíslo p a přirozené číslo n (v kapitole 11 si ukážeme, že takové těleso se konstruuje jako faktorokruh ¥p[x]/(f) okruhu polynomů nad Fp podle ideálu generovaného ireducibilním polynomem / e ¥p[x] stupně n, jehož existenci jsme právě dokázali). 10.34. Určete počet ireducibilních polynomů nad Z2 stupně 5 a počet normovaných ireducibilních polynomů nad Z3 stupně 4. Řešení. Podle dokázaného vztahu je počet (normovaných) ireducibilních polynomů nad Z2 stupně 5 roven Ns = 1 & (i)2" = \ ■25 + ^ •2) = 6- Nad Z3 je počet normovaných ireducibilních polynomů stupně čtyři roven ^4 = \ I2d\4 I1 (3) 3d = \ (Ml) • 34 + p(2) ■ 32 + m(4)3!) = 1(81-9) = 18. □ C. Řešení kongruencí Lineární kongruence. Následující příklad ukáže, že postup uvedený v důkazu věty 10.24 o řešitelnosti lineárních kongruencí (který využívá Eulerovu větu) obvykle není tím nejefektivnějším - s výhodou lze použít jak Bezoutovu větu, tak ekvivalentní úpravy řešené kongruence. 10.35. Řešte kongruenci 39* = 41 (mod 47). Řešení. i) Nejprve využijeme Eulerovu větu. Protože (39, 47) = 1, platí 39 ¥■(47) :394' 1 (mod 47), tj- 3945■■ 39x = 3945 • 41 (mod 47), 3946=1 z čehož už dostáváme x = 3945 • 41 (mod 47). „=>" Ze vztahu a* = as (mod m) plyne ď ■ aqr+z = ď (mod ni). Protože je ar = 1 (mod ni), je rovněž a^7- = az (mod ni). Celkem po vydělení obou stran první kongruence číslem as (které je nesoudělné s modulem), dostáváme az = 1 (mod ni). Protože z < r, plyne z definice řádu, že z — 0, a tedy r \ t — s. □ Zřejmým důsledkem předchozí věty a Eulerovy věty je následující tvrzení (jehož druhá část je přeformulováním Lagrangeovy věty 11.10 pro naši situaci): Důsledek. Nechťm e N, a e Z, (a, ni) — 1. Označme r rád čísla a modulo m. (1) Pro libovolné n e N U {0} platí a" = 1 (mod ni) r | n. (2) r | =aír-n] = 1 (modm) (poslední vztah plyne z předchozího důsledku, neboť r \ [r,n]). Na druhou stranu je-li k e N libovolné takové, že (a")k — a"'k = 1 (mod ni), dostáváme (protože r je řád a), že r \ n ■ k. Dále víme, (n,r) I (n,r) k, odkud díky nesoudělnosti čísel u ^ rj dostáváme tttt I k. Proto je řádem čísla a" modulo m. □ Poslední z této řady tvrzení dává do souvislosti řády dvou čísel a řád jejich součinu: Lemma. Nechť m e N, a, b e Z, (a, m) = (b, m) = 1. Jestliže a je řádu r a b je řádu s modulo m, kde (r, s) — 1, pak číslo a ■ b je řádu r ■ s modulo m. Důkaz. Označme S řád čísla a ■ b. Pak (ab)s = 1 (mod m), z čehož umocněním obou stran kongruence na r-tou dostaneme arS pí ^ j (mod ni). Protože je r řádem čísla a, je ar = 1 (mod ni), tj. brS = 1 (mod ni), a proto s \ rS. Z nesoudělnosti ras plyne s \ 8. Analogicky dostaneme i r | S, a tedy (opět s využitím nesoudělnosti r, s) r ■ s \ 8. Obráceně zřejmě platí (ab)rs = 1 (mod ni), proto 8 \ rs. Celkem tedy 8 — rs. □ 10.19. Primitivní kořeny. Mezi čísly nesoudělnými s modulem m (tedy mezi prvky redukované soustavy zbytků modulo ni) jsou nejdůležitější ta z nich, která mají řád roven 1. Primitivní kořeny modulo m existují právě tehdy, když m splňuje některou z následujících podmínek: • m = 2 nebo m = 4, • m je mocnina lichého prvočísla, • m je dvojnásobek mocniny lichého prvočísla. Důkaz věty provedeme v několika krocích. Snadno j e vidět, že ■ ■i1 » primitivní kořen modulo 2 je 1 a že modulo 4 je primitiv- tním kořenem číslo 3. Dále ukážeme, že primitivní kořeny existují modulo libovolné liché prvočíslo (v algebraické ter-l minologii tak vlastně jiným způsobem dokážeme, že grupa (Z^j, •) invertibilních zbytkových tříd modulo prvočíselné m je cyklická, viz též 11.8). Tvrzení. Nechť p je liché prvočíslo. Pak existují primitivní kořeny modulo p. Důkaz. Označme r\,ri, rv-\ řády čísel 1, 2, ..., p — 1 modulo p. BuďS = [r\, ri, ..., rp_i] nejmenší společný násobek těchto řádů. Ukážeme, že mezi čísly 1, 2, ..., p — 1 existuje číslo řádu S a že S = p — 1. Nechť S = q"1 ■ ■ ■ q"k je rozklad S na prvočísla. Pro libovolné se|l,...,i| existuje c e {1,..., p — 1) tak, žeq"s | rc (jinak by existoval menší společný násobek čísel r\,ri, rv-\ než je 8), proto existuje b e Z, tak, že rc = b ■ q"s. Protože c má řád rc, má číslo g s := cb podle věty 10.18 o řádech mocnin řád roven qas'. Provedením předchozí úvahy pro libovolné se|l,...,i| dostaneme čísla g\, ..., g k a můžeme položit g := gi ■ ■ ■ gk- Z vlastností řádu součinu dostáváme, že řád g je roven součinu řádů čísel g\, ..., gk, tj. číslu qf ■■■ qf = 8. Nyní dokážeme, že 8 = p — 1. Protože řády čísel 1,2,..., p — 1 dělí 8, dostáváme pro libovolné x e {1, 2, ..., p — 1) vztah xs = 1 (mod p). Kongruence stupně 8 modulo prvočíslo p má podle věty 10.29 nejvýše 8 řešení (v algebraické terminologii jde vlastně o hledání kořenů polynomů nad tělesem, kterých, jak uvidíme v části 11.19, je nejvýše tolik, kolik je stupeň polynomu). Ukázali jsme ale, že tato kongruence má p — 1 řešení, proto nutně 607 KAPITOLA 10. TEORIE ČÍSEL 10.36. Čínská zbytková věta. Jsou-li m\, m2,...,mr po dvou nesoudělná přirozená čísla a a\, a-i,... ,ar libovolná celá čísla, pak má soustava kongruencí x = a\ (mod m\), x = ci2 (mod 1112), x = ar (mod mr) o neznáme x {1,2,..., 17111712 ■ vyjádřete. právě jedno řešení patřící do množiny ■mr). Toto tvrzení dokažte a řešení explicitně Řešení. Označme M := mim2- • • mr a n; = M/nii pro každé 1 £ 1 S r. Potom pro libovolné i je m, nesoudělné s niy existuje proto nějaké bt e {1, ..., m; — 1} tak, že = 1 (mod m,). Všimněme si, že je dělitelné všemi rtij, 1 < j < r, i ^ j. Proto je hledaným řešením soustavy číslo x = a\b\n\ + (22^2^2 + • • • + arbrnr . □ 10.37. Řešte soustavu kongruencí 1 (mod 10), 5 (mod 18), -4 (mod 25). Řešení. Množinu čísel x vyhovujících první kongruenci můžeme popsat tak, že jde o všechna celá čísla x = 1+10/, kde / e Zje libovolné. Tento výraz dosadíme do druhé kongruence a vyřešíme ji vzhledem k neznámé /: 1 + 10/ = 5 (mod 18), 10/ = 4 (mod 18), 5t= 2 (mod 9), 5/ = 20 (mod 9), / = 4 (mod 9), neboli / = 4+9s, kde s e Z je libovolné. Prvním dvěma kongruencím tedy vyhovují ta x, která splňují x = 1 + 10/ = 1 + 10(4 + 9s) = = 41 + 90s. S > p — 1. Přitom <5 je (jakožto řádčíslag) zároveň dělitelem/? —1, odkud konečně dostáváme požadovanou rovnost S = p — 1. □ Nyní ukážeme, že primitivní kořeny existují dokonce modulo mocniny Uchých prvočísel. K tomu budeme potřebovat dvě pomocná tvrzení. Lemma. Buď p liché prvočíslo, í > 2 libovolné. Pak pro libovolné a e Z platí (1 /—2 -apY =1- ap (mod p ). Důkaz. Plyne snadno z binomické věty s využitím matematické indukce vzhledem t. I. Pro t = 2 tvrzení zřejmě platí. II. Nechť tvrzení platí pro í, dokážeme jej i pro í + 1. S využitím příkladu II 10.15II, kdy tvrzení pro í umocníme na p-tou, dostaneme (l + apf ^(l + ap Z binomické věty přitom plyne l-\y (mod pl+1). (l+ap a vzhledem k tomu, že podle příkladu ||10.14|| pro 1 < k < p platí p I (£), stačí ukázat pl+l \ pl+(-l~l^k, což je ekvivalentní s 1 < (k — ľ)(é — ľ). Rovněž pro k = p dostáváme díky předpokladu í > 2 vztah pl+l | p(ť"1)p. □ Lemma. Buď p liché prvočíslo, í > 2 libovolné. Pak pro libovolné a e Z splňující p\a platí, že řád čísla l+ap modulo pl je roven pl-\ Důkaz. Podle předchozího lemmatu je (1 + apY"'1 =l+apl (mod pl+l), a uvážíme-li tuto kongruenci modulo pl, dostaneme (1 + ap)p = 1 (mod pl). Přitom přímo z předchozího lemmatu a faktu p \ a plyne (1 dává požadované. ap)v 5É 1 (mod p ), což □ Tvrzení. Buď p liché prvočíslo. Pak pro každé t e N existuje primitivní kořen modulo pl. Důkaz. Nechť g je primitivní kořen modulo p. Ukážeme, že pokud gp_1 7^ 1 (mod p1), je g dokonce primitivním kořenem modulo pl pro libovolné í e N. (Pokud by přitom platilo gp_1 = 1 (mod p2), pak (g + p)"^1 = l + (j>- l)gp~2p # 1 (mod p2), a mohh bychom tedy místo g volit za původní primitivní kořen s ním kongruentní číslo g + p.) Nechť tedy g splňuje gp_1 # 1 (mod p2). Pak existuje a e Z, p \ a tak, že gp_1 — 1 + p ■ a. Ukážeme, že g je modulo //řádu— (p—l)pl~l.Bud'n e Nnejmenšíčíslo,splňující g" = 1 (mod pl). Podle předchozího lemmatu je gp_1 = 1+p-a řádu pl~l modulo pl. Pak ale podle důsledku za větou 10.17 (g"-1)" = te")""1 = 1 (mod pť) Zároveň z kongruence g™ = 1 (mod p) plyne p — 1 | n. Z ne-soudělnosti čísel p — 1 a pť_1 dostáváme (p — l)pť_1 | n. Proto n = ip(pť) a g je tedy primitivní kořen modulo pl. □ 608 KAPITOLA 10. TEORIE ČÍSEL Dosadíme do třetí kongruence a soustavu dořešíme: 41 + 90í = -4 (mod 25), 90í = 5 (mod 25), 18í = 1 (mod 5), 3í = 6 (mod 5), s = 2 (mod 5), neboli s = 2 + 5r, kde r e Z. Celkem x = 41 + 90í = 41 + + 90(2 + 5r) = 221 + 450r. Řešením jsou všechna celá x splňující x = 221 (mod 450). □ 10.38. Vyřešte soustavu x = 1 (mod 27), x = — 3 (mod 11). Řešení, (a) Euklidovým algoritmem najdeme koeficienty v Bezoutově rovnosti 1 = 5 • 11 - 2 • 27. Odtud [ll]^ = [5]27 a [27] 7/ = [-2]„. Řešení je tedy x = 1 ■ 11 • 5 - 3 • 27 • (-2) = 547 = 250 (mod 297). (b) Postupným dosazením: z druhé kongruence je x = 11/ — 3, dosazením do první máme 11/ = 10 (mod 27). Vynásobením číslem 5 získáme 55/ = 50, tj. / = —4 (mod 27). Dohromady x = 11 • 27 • í-4-11 - 3 = 297í-47 pro í e Z, neboli* = -47 (mod 297). □ 10.39. Skupině třinácti pirátů se podařilo uloupit bednu zlatých mincí (kterých bylo přibližně dva tisíce). Zkusili je rozdělit rovným dílem na třináct hromádek, ale deset mincí jim zbylo. O zbylé mince se strhla rvačka, při níž jednoho piráta propíchli. Přestali tedy bojovat a zkusili mezi sebe znovu rozdělit mince rovným dílem. Tentokrát zbyly tři mince, o které opět začali bojovat. V boji zahynul další pirát a tak si ostatní opět zkusili mince spravedlivě rozdělit, tentokrát úspěšně. Kolik bylo mincí, které piráti ukradli? Řešení. Úloha vede na soustavu kongruencí x = 10 (mod 13), x = 3 (mod 12), x = 0 (mod 11), jejímž řešením je x =231 (mod 11 • 12-13). Protože počet mincí x je přibližně 2000 ax= 231 (mod 1716), snadno dopočítáme, že mincí bylo 231 + 1716 = 1947. □ 10.40. Když na Sokolském sletu vytvořili cvičenci osmistupy, zbývali 3 navíc, při cvičení v kruzích o 17 lidech jich přebývalo 7 a při tvorbě pyramid (na každou je potřeba 21 = 42 + 22 + 1 lidí), byly dvě pyramidy neúplné - bez člověka „na vrcholu". Kolik cvičenců se Tvrzení. Buď p liché prvočíslo a g primitivní kořen modulo pl pro řeN. Pak liché z čísel g, g + pl je primitivním kořenem modulo 2/. Důkaz. Nechť c je liché přirozené číslo. Pak pro libovolné n e N platí c" = 1 (mod pl), právě když c" = 1 (mod 2pl). Protože (p(2pl) — 3. Pak 52" = 1 + 2*"1 (mod 2l). Důkaz. Obdobně jako výše pro 2 \ p. □ Lemma. Budí e N, t > 3. Pak řád čísla 5 modulo 2l je 2l~2. Důkaz. Snadný z předchozího lemmatu. □ Tvrzení. Nechť í e N. Primitivní kořeny existují modulo 2l právě tehdy, když í < 2. Důkaz. Buďť > 3. Pak množina i e Z) 5 = {(-1)" • 5°; a e {0, 1), 0 < b < 2l tvoří redukovanou soustavu zbytků modulo 2l (má totiž

2 nebo k > 1 a a > 2. Označíme-li S — [(p(2a), (pip"1), ■ ■ ■, vQ?"1)], pak se snadno vidí, že S < (p(2a) ■ (pip"1) • • • (pip"1) = 1, nutně existuje i e {1, ..., k) tak, že qi \ u. Pak ale g q< — gd q< = 1 (mod m). □ 4. Řešení kongruencí a jejich soustav V této části se budeme věnovat analogii k řešení rovnic v něja-kém číselném oboru. Ve skutečnosti opravdu bu-fV^Xá^ deme řešit rovnice (a jejich soustavy) v okruhu zbyt-™"^^Srr kových tříd (Zm ,+,•)» budeme ale hovořit o řešení kongruencí modulo m a zapisovat to přehlednějším způsobem pomocí kongruencí. | Kongruence o jedné neznámé |__ Nechť m e N, f (x), g(x) e Z[x]. Zápis f (x) = g (x) (mod m) nazýváme kongruencí o jedné neznámé x a rozumíme jím úkol nalézt množinu řešení, tj. množinu všech takových čísel c e Z, pro která f (c) = g (c) (mod m). Dvě kongruence o jedné neznámé nazveme ekvivalentní, mají-li stejnou množinu řešení. Uvedená kongruence je ekvivalentní s kongruencí f(x)-g(x)=0 (mod m). Jedinou metodou, kterou vždy umíme nalézt řešení, je vyzkoušení všech možností (jde ale samozřejmě z časových důvodů často o neproveditelný způsob). Tuto metodu formalizuje následující tvrzení. 10.22. Tvrzení. Nechť m e N, f (x) e Z[x]. Pro libovolná a, b e Z,platí a = b (mod m) => f (a) = f (b) (mod m). Důkaz. Nechť je f (x) = cnx" + Cn-i*"-1 H-----h c\x + + co, kde l'o,ci, ..., cn e Z. Protože a =b (mod m), pro každé i — 0, 1, ..., nplatíc;ŕz' = Lib' (mod m), odkud sečtením těchto kongruencí pro i —0,1,2, ... ,n dostaneme cna" + • • • + c\a + co = cnb" + • • • + c\b + co (mod m), tj. f (a) ee f (b) (mod m). □ Důsledek. Množina řešení libovolné kongruence modulo m je sjednocením některých zbytkových tříd modulo m. Definice. Počtem řešení kongruence o jedné neznámé modulo m rozumíme počet zbytkových tříd modulo m obsahujících řešení této kongruence. Příklad. Právě definovaný pojem počet řešení kongruence je možná trochu neintuitivní v tom, že závisí na modulu kongruence a že tak dvě ekvivalentní kongruence (jejichž řešeními jsou táž celá čísla) mohou mít jiný počet řešení. (1) Kongruence 2x = 3 (mod 3) má právě jedno řešení (modulo 3). (2) Kongruence lOx = 15 (mod 15) má pět řešení (modulo 15). (3) Kongruence z příkladu (1) a (2) jsou ekvivalentní. 610 KAPITOLA 10. TEORIE ČÍSEL odkud snadno postupem pro řešení soustav kongruencí dostaneme x = —1137 (mod 3564), což je také řešení zadané kongruence. □ 10.43. Vyřešte lineární kongruenci 3446* = 8642 (mod 208). Řešení. 208 = 24 • 13 a (3446, 208) = 2 | 8642. Kongruence má tedy právě 2 řešení modulo 208 a je ekvivalentní soustavě 3x = 1 (mod 8), x = 10 (mod 13). Ta má řešení x = 75 a x = 179 (mod 208). □ 10.44. Dokažte, že v posloupnosti (2™ — 3)^\ je nekonečně mnoho násobků 5 a nekonečně mnoho násobků 13, ale žádný násobek 65. O Modulární reprezentace čísel. Při počítání s velkými čísly je někdy N\\)iv výhodnější než s dekadickým či binárním zápisem čísel pra-^Střo covat s *zv- modulární reprezentací (též residue number sys-9 tem), která umožňuje snadnou paralelizaci výpočtů s velkými čísly. Takový systém je určen fe-ticí modulů (obvykle po dvou nesoudělných) a každé číslo menší než jejich součin je pak jednoznačně reprezentováno fe-ticí zbytků (jejichž hodnoty nepřevyšují příslušné moduly). 10.45. Pětice modulů 3, 5, 7,11,13 umožňuje jednoznačně reprezentovat čísla menší než jejich součin (tedy menší než 15015) a efektivně provádět (v případě potřeby distribuovane) běžné aritmetické operace. Určete reprezentaci čísel 1234 a 5678 v této modulární soustavě a pomocí této reprezentace vypočtěte jejich součet a součin. Řešení. Vypočítáme zbytky po dělení zadaných čísel jednotlivými moduly a získáme jejich modulární reprezentaci, kterou zapíšeme jako pětice (1, 4, 2, 2,12) a (2, 3,1, 2, 10). Součet provedeme po složkách (včetně výpočtu zbytku po dělení příslušným modulem) a obdržíme pětici (3, 2, 3,4, 9), kterou lze pomocí Čínské zbytkové věty převést na číslo 6912. Součin vypočteme analogicky a dostaneme příslušnou pětici zbytků (2, 2, 2,4, 3), což pomocí Čínské zbytkové věty převedeme zpět na číslo 9662, které je skutečně modulo 15015 totéž jako 1234 • 5678. □ 10.46. Často je uvažována modulární reprezentace pomocí trojice modulů 2™ — 1, 2™, 2™ + 1 (uvědomte si, že tato čísla jsou skutečně po dvou nesoudělná), jednoznačně pokrývající čísla mající až 3n bitů. Uvažte n = 3 a zapište modulární reprezentaci čísla 118 v této soustavě. 10.23. Lineární kongruence o jedné neznámé. Podobně jako , je tomu v případě rovnic, i u kongruencí je situace nejsnazší v případě kongruencí lineárních, kdy jsme j&Á r::^ nejen schopni snadno rozhodnout o jejich řešitelnosti, ale rovněž umíme řešení efektivně nalézt. Konkrétní postup naznačuje následující věta a její důkaz. 10.24. Věta. Nechť m e N, a, b e Z. Označme d = (a, m). Pak kongruence (o jedné neznámé x) ax = b (mod m) má řešení právě tehdy, když d \ b. Pokud platí d \ b, má tato kongruence právě d řešení (modulo m). Důkaz. Dokážeme nejprve, že uvedená podmínka je nutná. Je-li celé číslo c řešením této kongruence, pak nutně m \ a • c — b. Protože d — (a, ni), pak nutně d \ m i d \ a ■ c — b, a tedy d | a ■ c — (a ■ c — b) = b. Obráceně dokážeme, že pokud d | b, pak má daná kongruence právě d řešení modulo m. Označme ai,í)i e Zami 6 N tak, že a — d ■ a\, b — d ■ b\ a m — d ■ m\. Řešená kongruence je tedy ekvivalentní s kongruencí a\ ■ x = b\ (mod m\), kde (a\,m\) — 1. Tuto kongruenci můžeme vynásobit číslem av(mi) l a jjj^y rjmerovg větě obdržíme x =b\ ■ a^m^ 1 (mod m\). Tato kongruence má jediné řešení modulo m\ a tedy d — m/m\ řešení modulo m. □ Pomocí věty o řešitelnosti lineárních kongruencí lze dokázat mj. důležitou Wilsonovu větu udávající nutnou (i postačující) podmínku prvočíselnosti. Takové podmínky jsou velmi významné ve výpočetní teorii čísel, kdy jetřeba efektivně poznat, je-li dané velké číslo prvočíslem. Bohužel dosud není známo, jak rychle vypočítat modulární faktoriál velkého čísla, proto není v praxi Wilsonova věta k tomuto účelu používána. Věta (Wilsonova). Přirozené číslo n > 1 je prvočíslo, právě když (n — 1)! = — 1 (mod n). Důkaz. Dokážeme nejprve, že pro libovolné složené číslo n > 4 platí n \ (n - 1)!, tj. (n - 1)! = 0 (mod n). Nechť 1 < d < n je netriviální dělitel n. Je-li d ^ n/d, pak z nerovností 1 < d,n/d4,jeirf>2an| (d -2d) \ (n — 1)!. Pro n — A snadno dostáváme (4 — 1)! = = 2 == — 1 (mod 4). Nechť je nyní p prvočíslo. Čísla z množiny {2, 3, ..., p — 2} seskupíme do dvojic vzájemně inverzních čísel modulo p, resp. dvojic čísel, jejichž součin dává zbytek 1 po dělení p. Pro libovolné číslo a z této množiny dostaneme podle předchozí věty jediné řešení kongruence a oc = 1 (mod p). Protožea ^ 0, 1, p—l, je zřejmé, že rovněž pro řešení c této kongruence platí c == 0, 1, — 1 (mod p). Číslo a rovněž nemůže být ve dvojici samo se sebou; kdyby totiž platil vztah a • a = \ (mod p), pak by (díky tomu, že p | a1 — 1 = (a + l)(a — 1)) nutně platila i kongruence a = ±1 (mod p). Součin všech čísel uvedené množiny je tedy 611 KAPITOLA 10. TEORIE ČÍSEL Řešení. Vypočtěme nejprve přímo, že 118 = 6 (mod 7), 118 = 6 (mod 8) a 118 = 1 (mod 9), proto je hledaná reprezentace dána trojicí (6, 6, 1). Při praktickém použití je ale zejména důležité, že tuto modulární reprezentaci čísla jsme schopni efektivně převádět na binární reprezentaci a zpět. V našem případě zjistíme snadno zbytek po dělení čísla 118 = (1110110)2 číslem 23 - ten je dán posledním binárním trojčíslím (110)2, tedy je roven 6. Ani zjištění zbytku modulo 2™ + 1 = 9 a 2™ — 1 = 7 ale není nikterak obtížné. Zde je totiž poměrně rychle vidět (pomůže přitom rozdělení daného čísla do bloků po n bitech), že (001110110)2 = (001)2 + (110)2 + (110)2 = 6 (mod 23 - 1), (001110110)2 = (001)2 - (110)2 + (110)2 = 1 (mod 23 + 1). Věříme, že pozornému čtenáři jistě neunikla úzká souvislost s kritérii dělitelnosti 9 a 11 diskutovanými v odstavci || 10.17||. □ 10.47. Kongruence vyššího stupně. Postupem z věty 10.27 řešte r/^> kongruenci x4 + Ix + 4 = 0 (mod 27). Řešení. Řešme nejprve tuto kongruenci modulo 3 (např. dosazením) -snadno zjistíme, že řešení je x = 1 (mod 3). Zapišme řešení ve tvaru x = 1 + 3/, kde / e Z a řešme kongruenci modulo 9: x4+lx + 4 = 0 (mod 9), (1 + 3t)4 + 7(1 + 3/) + 4 = 0 (mod 9), 1+4- 3t +7 + 7- 3t + 4 = 0 (mod 9), 33/ = -12 (mod 9), 11/ = - 4 (mod 3), / = 1 (mod 3). Zapsáním / = 1 + 3s, kde s € Z dostaneme x = 4 + 9s a po dosazení IA I fl„\4 , -7//i , n„a , A 44 + 4 • 43 • 9s + 28 + 63s + 4 : tvořen součinem (p — 3)/2 dvojic (jejichž součin je vždy kongru-entní s 1 modulo p). Proto máme 0 (mod 27), 0 (mod 27), 288 (mod 27), ■ 32 (mod 3), 1 (mod 3), 2 (mod 3). (p - 1)! ee 1/2 • (p - 1) ee -1 (mod p). □ 10.25. Soustavy lineárních kongruenci. Máme-li soustavu li-jgj neárních kongruenci o téže neznámé, můžeme podle fty 1, můžeme kongruenci nahradit soustavou kongruenci /(*)ee0 (modpf), /(*) ee 0 (mod pakk), která má stejnou množinu řešení, a řešit každou kongruenci této soustavy zvlášť. Tím získáme obecně několik soustav lineárních kongruenci, které už řešit umíme. Výhoda této metody spočívá v tom, že moduly kongruenci soustavy jsou menší než modul původní kongruence. Příklad. Řešme kongruenci x3 - 2x + 11 ee 0 (mod 105). Kdybychom chtěli vyzkoušet všechny možnosti, museli bychom spočítat pro f(x) — x3 — 2x + 11 sto pět hodnot /(0), /(l), ..., /(104). Proto raději rozložíme 105 = 3 • 5 • 7 a budeme řešit kongruence f(x) ee 0 postupně pro moduly 3, 5, 7. Vypočteme hodnoty polynomu f(x) ve vhodných číslech: jc 1—3—2 —1 0 1 2 3 -10 7 12 11 10 15 32 Kongruence f(x) ee 0 (mod 3) má tedy řešení x ee — 1 (mod 3) (pouze první z čísel 12, 11, 10 je násobkem 3); kongruence f(x) ee 0 (mod 5) má řešení x ee 1 a x ee 2 (mod 5); řešením kongruence f(x) ee 0 (mod 7) je x ee —2 (mod 7). Zbývá tedy vyřešit dvě soustavy kongruenci: x ee — 1 (mod 3), x ee — 1 (mod 3), x ee 1 (mod 5), a x ee 2 (mod 5), x ee —2 (mod 7) x ee —2 (mod 7). Vyřešením těchto soustav zjistíme, že řešeními dané kongruence f(x) ee 0 (mod 105) jsou všechna celá čísla x splňující x ee 26 (mod 105) nebo x ee 47 (mod 105). Ne vždy je (tak jako v předchozím příkladu) možné kongruenci nahradit soustavou kongruenci modulo prvočísla - jeli původní modul násobkem vyšší mocniny prvočísla, tak 1 se této mocniny výše uvedeným postupem „nezbavíme". Ani takovou kongruenci modulo mocnina prvočísla ale nemusíme řešit zkoušením všech možností. Efektivnější nástroj nám dává následující věta. 10.27. Věta (Henselovo lemma). Nechť p je prvočíslo, f(x) e Z[x], a e Z je takové, že p | f (a), p \ f (a). Pak pro každé n e N má soustava x ee a (mod p), f(x) ee 0 (mod p") právě jedno řešení modulo pn. Důkaz. Budeme postupovat indukcí vzhledem k n. V případě n = 1 jde v případě kongruence f(x) ee 0 (mod pl) pouze o jinak zapsaný předpoklad, že číslo a splňuje p | f (a). Nechť dále n > 1 a věta platí pro n — 1. Je-li x řešením dané soustavy pro n, je řešením této soustavy i pro n — 1. Označíme-li jedno z řešení soustavy pro n — 1 jako c„-i, pak můžeme hledat řešení soustavy pro n ve tvaru ■- c„-i + k- p" kde k e Z. 614 KAPITOLA 10. TEORIE ČÍSEL která je ekvivalentní kongruenci 22'" =22' (mod 127). Protože 27 = 128 = 1 (mod 127), je řád čísla 2 modulo 127 roven sedmi a dokazovaná kongruence je tak podle 10.17 ekvivalentní s kongruenci 222"-' = 22 (mod 7). Podobně protože řádem dvojky modulo 7 je číslo 3, dostaneme ekvivalentní kongruenci 22"-1 = 2 (mod 3), <_l)2»-i = _i (mo(J 3); která je zřejmě splněna (mohli jsme rovněž mechanicky postupovat dále - řád 2 modulo 3 je roven 2, atd.). Tvrzení je tak dokázáno. □ 10.54. Rozhodněte, pro která přirozená čísla n je číslo n ■ 2" + 1 dělitelné sedmi. Řešení. Hledáme řešení kongruence n-2" -1 (mod 7). Možná je vhodné upozornit, že zde není možné využít tvrzení 10.22, protože n ■ 2" není polynom v n a nemáme zaručeno (a ani tomu tak není), že čísla kongruentní modulo sedm budou dávat stejné zbytky modulo 7 i pod dosazení do tohoto výrazu. Všimněme si ale, že číslo 2 modulo 7 má řád 3 a rozlišme proto přirozená čísla n podle toho, jaký dávají zbytek po dělení třemi. Pro n = 0 (mod 3) dostaneme 2™ = 1 (mod 7) a řešená kongruence je tak ekvivalentní s kongruenci n = — 1 (mod 7). Spojením podmínek n = 0 (mod 3) a n = —1 (mod 7) pomocí Čínské zbytkové věty dostaneme řešení n = 6 (mod 21). Pro n = 1 (mod 3) nyní máme 2™ = 2 (mod 7) a řešená kongruence je tak tvaru 2n = — 1 (mod 7), což je ekvivalentní s kongruenci n = 3 (mod 7). Z podmínek n = 1 (mod 3) a n = 3 (mod 7) dostaneme řešení n = 10 (mod 21). Konečně pro n = 2 (mod 3) je 2™ =4 (mod 7) a řešením kongruence An = — 1 (mod 7) je n = 5 (mod 7) a celkově = 5 (mod 21). Hledanými řešeními jsou všechna přirozená čísla n splňující n = 5,6, 10 (mod 21). □ Je třeba zjistit, pro která k platí / (c„_i + k ■ p" l) = 0 (mod p"). Víme, že p"~l \ f (c„_i + /c • p"~l) a užijme binomickou větu pro f (x) — amxm + • • • + a\x + ao, kde ízo , ..., am e Z. Máme (c„_! + i • p"-1)' ee 4_j + i ■ c'-_\ ■ kp"-1 (mod p"), a proto / (cn-l + * • P"'1) = /fe-l) + i • P^Vfe-l)- Odtud 0 ee ee 0 (mod pn) f(Cn-l) + k-f'(cn-\) (mod p). Protože c„-\ ee a (mod p), dostaneme f'(cn-i) = /'(«) # 0 (mod p), tedy (/'(c„_i), p) = 1. Podle věty o řešitelnosti lineárních kongruenci odtud vidíme, že (modulo p) existuje právě jedno řešení k této kongruence, a protože c„_i bylo podle indukčního předpokladu jediné řešení modulo p™-1, je číslo c„_i + /c • p™-1 jediným řešením dané soustavy modulo p™. □ Příklad. Řešme kongruenci 3^+4ee0 (mod 49). Ekvivalentními úpravami (např. tak, že vyřešíme lineární kongruenci 3y ee 1 (mod 49) a vynásobíme číslem y ee 33 obě strany kongruence) upravíme kongruenci na tvar x2 ee 15 (mod 72). Dále postupujeme podle konstruktivního důkazu Henselova lemmatu. Nejprve řešíme kongruenci x2 ee 15 ee 1 (mod 7), která má nejvýše 2 řešení a těmi zřejmě jsou x ee ±1 (mod 7). Tato řešení vyjádříme ve tvaru x = ±1 + 7ř, kde t e Z, a dosadíme do kongruence modulo 49, odkud dostaneme řešení x ee ±8 (mod 49) (pokud by nás zajímal pouze počet řešení, tak bychom ani nemuseli výpočet dokončit, protože přímo z Henselova lemmatu plyne, že každé řešení modulo 7 dá jediné řešení modulo 49, neboť pro f(x) = x2 - 15 máme 7 \ /'(±1)). 10.28. Kongruence s prvočíselným modulem. Řešení obec-Qi ných kongruenci vyššího stupně jsme tedy převedli na rSy" řešení kongruenci modulo prvočíslo. Ukazuje se, že / I i zde je největší„kámen úrazu", protože pro tyto kon-•ä§-*~«-sjí gruence žádný o mnoho efektivnější obecný postup než je vyzkoušení všech možností není znám. Uvedeme alespoň několik obecných tvrzení ohledně řešitelnosti a počtu řešení takových kongruenci. V dalších odstavcích poté dokážeme podrobnější výsledky v některých speciálních případech. Věta. Buď p prvočíslo, f(x) e Z[x]. Libovolná kongruence f(x) ee 0 (mod p) je ekvivalentní s kongruenci stupně nejvýše p-1. Důkaz. Protože pro libovolné a e Z platí p | ap — a (důsledek Malé Fermatovy věty), jsou řešením kongruence xp — x ee 0 (mod p) všechna celá čísla. Vydělíme-li polynom f(x) se zbytkem polynomem xp — x, dostaneme f(x) = q(x)-(xp -x)+r(x) pro vhodné f (x), r(x) e TL, kde stupeň r(x) je menší než stupeň dělitele tedy než p. Dostáváme tak, že kongruence r(x) ee 0 615 KAPITOLA 10. TEORIE ČÍSEL 10.55. Dokažte, že pro libovolné přirozené číslo n je číslo 2n +n + r/^j£> +50 dělitelné šesti, právě když je číslo 2-4"+3" +50 dělitelné /*7»jR, třinácti. Řešení. Výraz f(n) = 2nA + n3 + 50 je polynomem v n, a je proto možné využít tvrzení 10.22, tj. stačí prověřit všechny možné zbytky modulo 6. Vzhledem k tomu, že řád čísla 4 modulo 13 je roven 6 a řád 3 modulo 13 je roven 3, stačí i ve druhém případě podle 10.17 prověřit všechny možné zbytky n po dělení šesti. V prvním případě vypočteme 0 1 2 3 4 5 f(n) mod 6 2 5 0 5 2 3 a kongruenci f in) = 0 (mod 6) tak vyhovují ta přirozená čísla n, pro něž platí n =2 (mod 6). Ve druhém případě postupně vypočítáme n 0 1 2 3 4 5 mod 13 1 4 3 -1 -4 -3 3" mod 13 1 3 9 1 3 9 2 . 4" + 3" - 2 mod 13 1 9 0 -3 -7 1 a stejně jako v prvním případě kongruenci 2 • 4™ + 3™ + 50 (mod 13) vyhovují právě ta n, pro něž n =2 (mod 6). 0 □ (mod p) je ekvivalentní kongruenci fix) = 0 (mod p) a je přitom stupně nejvýše p — 1. □ 10.29. Věta. Buď p prvočíslo, f (x) e Z[x]. Má-li kongruence fix) = 0 (mod p) více než deg(/) řešení, pak jsou všechny koeficienty polynomu f násobkem p. Důkaz. V jazyce algebry jde vlastně o počet kořenů nenulového polynomu nad konečným tělesem Zp, kterých je podle 11.17 nejvýše deg(/). □ 10.30. Binomické kongruence. V této části se zaměříme na řešení speciálních typů polynomiálních kongruenci vyššího stupně, tzv. binomických kongru- ' bu * ~T*>' • enc*- Jde 0 analogii binomických rovnic, kdy polynomem fix) je dvojčlen xn —a. Snadno se ukáže, že se můžeme omezit na případ, kdy je a nesoudělné s modulem kongruence - v opačném případě totiž vždy můžeme pomocí ekvivalentních úprav kongruenci na tento případ buď převést nebo rozhodnout, že kongruence není řešitelná. _ Kvadratický a mocninný zbytek _. 10.56. Jiný důkaz Wilsonovy věty. Dokažte, že pro každé prvočíslo p platí 0>-l)! = -l (mod p). Řešení. Pro p = 2 je tvrzení zřejmé, dále uvažujme jen lichá prvočísla p. Řešením kongruence ix - l)ix - 2) •••(*- ip - 1)) - ix"-1 - 1) = 0 (mod p) je podle Fermatovy věty libovolné a € Z, které není násobkem p, tj. kongruence má p—1 řešení. Přitom je ale její stupeň roven p — 2 (tedy menší než počet řešení), proto jsou podle 10.28 všechny koeficienty polynomu na levé straně kongruence násobkem p, speciálně absolutní člen, který je roven ip — 1)! + 1. Tím je Wilsonova věta dokázána. □ 10.57. Řešte kongruenci x2 = 18 (mod 63). Řešení. Protože je (18,63) = 9, musí platit 9 | x2, tj. 3 | x. Položíme-li x = 3x\, x\ e Z, dostáváme ekvivalentní kongruenci x\ = 2 (mod 7), která již splňuje omezení na nesoudělnost modulu a pravé strany kongruence. Podle věty 10.29 víme, že má nejvýše 2 řešení a snadno se vidí, že jimi jsou x\ = ±3 (mod 7), tj. xx = ±3, ±10, ±17, ±24, ±31, ±38, ±45, ±52, ±59 (mod 63). Nechť m e N, a e Z, ia, ni) — 1. Číslo a nazveme n-tým mocninným zbytkem modulo m, pokud je kongruence x™ = a (mod m) řešitelná. V opačném případě a nazveme n-tým mocninným nezbyt-kem modulo m. Pro n — 2,3,4 používáme termíny kvadratický, kubický a bikvadratický zbytek, resp. nezbytek modulo m. Ukážeme, jakým způsobem řešit binomické kongruence modulo m, pokud modulo m existují primitivní kořeny (tedy zejména je-li modul liché prvočíslo nebo jeho mocnina). 10.31. Věta. Buď m e N takové, že modulo m existují primitivní kořeny. Dále nechť a e TL, ia, m) — 1. Pak kongruence xn = a (mod m) je řešitelná (tj. a je n-tý mocninný zbytek modulo m), právě když av(m^d = 1 (mod ni), kde d — in, ; což je právě když d\b. □ Důsledek. Za předpokladů předchozí věty, je-li navíc in, 7=1 4j i=l n 7=1 nc-D^nft) i=l j=l V/V k í ~ n n (-i) (-i)- i=l 7=1 (5) Proa = b (mod p)p/aíi (|) = (£). Důkaz. (1) Pro p I a je tvrzení zřejmé; pokud je a kvadratický zbytek modulo p, pak tvrzení plyne z věty o řešitelnosti binomických kongruencí, které udává (v tomto případě je (. V roce 2000 uváděl F. Lemmermeyer 233 důkazů - viz F. Lemmermeyer, Reciprocity laws. From Euler to Eisenstein, Springer. 2000 619 KAPITOLA 10. TEORIE ČÍSEL jedno řešení) a jednak kvadratické zbytky modulo 43, které nejsnáze určíme tak, že spočítáme druhé mocniny všech prvků některé redukované soustavy zbytků modulo 43. Kvadratickými zbytky jsou čísla kongruentní s čísly (±1)2, (±2)2, (±3)2,..., (±21)2 modulo 43 a řešením úlohy je tedy množina všech celých čísel kongruentních s některým z čísel 1, 4,6,9,10,11,13,14,15,16,17,21,23,24,25,31,35,36,38,40,41. □ 10.66. Odvodte přímým výpočtem z Gaussova lemmatu, že p2-i a (2/p) = (-l) « . Důkaz. Pro každé číslo Řešení. Pro výpočet i—l/p) v prvním případě uvažme, že [i udává počet záporných nejmenších zbytků (v absolutní hodnotě) čísel z množiny (-1,-2,...,-V)-Ta jsou ale zřejmě přímo požadovanými zbytky a jsou všechna záporná, proto jev tomto případě fi = a (— í/p) = {— 1) 2 Ve druhém případě potřebujeme vyjádřit počet záporných nejmenších zbytků (v absolutní hodnotě) čísel z množiny |l-2,2-2, 3-2...,^i-2j. Pro libovolné k e (1, 2,..., J dá číslo 2k záporný zbytek, právě když je 2k > tj. pro k > E^-. Zbývá pouze určit počet vyhovujících k. Je-li p = 1 (mod 4), pak je tento počet roven ^ _ £__! = £zl> proto -1\ £-i £-i p+l Ž=l = (-!)"■ = (-1) 4 = (-1) 4 • 2 = (-1) 8 , p-1 neboť je v tomto případě liché. Podobně pro p = 3 (mod 4) je počet takových k roven číslu ¥ " P~T = £T1. Proto -1\ £±1 £±1 £~I p2-l = (-1) 4 =(-1) 4 ' 2 =(-1) 8 , neboť je v tomto případě liché. □ 10.67. Rozhodněte, zdaje řešitelná kongruence x2 =38 (mod 165). Řešení. Jacobiho symbol je roven (1) = (ě) ■ (li) = (I) • (1) • (á) • (?) • (?) • ({?) = = (-D3 G)-(^)-(tt) =i- 1,2, ... 2 I m; e 1,2. tak, že i ■ a = ±m,- (mod p). Snadno p-1 2 se vidí, že pokud / e J1, 2, ..., j jsou ruznä, jsou rUzně i hodnoty mj, m; (rovnost mj = m; by znamenala, že & • a = ±Z • a (mod p), a tedy k = ±Z (mod p), což nelze splnit jinak, než že k = l). Proto splývají obě množiny {1,2, ..., ^j^) a {mi, m2, ..., rrip-i), což ilustruje též předchozí příklad. Vy- 2 násobením kongruencí 1 • a ee ±m j (mod p), 2 • a ee ±m2 (mod p), • a ee ±m p-^ (mod p) dostáváme £=l!.flv=(-i) k p^l, 2 ■ -5— - = v—±, • —j-■ (mod p), neboť mezi pravými stranami kongruencí je právě [i záporných hodnot. Po vydělení obou stran číslem ^y^! dostáváme požadované tvrzení s využitím toho, že podle lemmatu 10.33 platí {flip) ee a2^ (mod p), □ S využitím Gaussova lemmatu nyní zákon kvadratické reciprocity dokážeme. důkaz zákona kvadratické reciprocity. První Část jiŽ máme dokázánu, v dalším nejprve odvodíme mezivýsledek, který využijeme v důkazu obou zbylých částí. Nechťjedálea e Z, p \a, k e N a nechť [x] (resp. (x)) značí celou (resp. necelou) část reálného čísla x. Pak lak ak lakY ak " lakY — 2 + 2 — = 2 + 2 — _ P . . P . \P L . P . . \ p L Tento výraz je lichý právě tehdy, když je > 5, tj. právě tehdy, je-li nejmenší zbytek (v absolutní hodnotě) čísla ak modulo p záporný (zde by měl pozorný čtenář zaznamenat návrat od výpočtů zdánlivě nesouvisejících výrazů k podmínkám blízkým Legendre-ovu symbolu). Číslo (ip(a) má tedy stejnou paritu jako f2^], odkud s využitím Gaussova lemmatu dostáváme Je-li navíc a liché, je a + p sudé číslo a dostáváme , 2 2 [°p ]. (-i)E Protože součtem aritmetické řady 2~2k=l ^ Je \^~T~^~T~ ^-g—, dostáváme (pro liché a) vztah 620 KAPITOLA 10. TEORIE ČÍSEL Odtud nelze vyloučit existenci řešení. Ovšem rozdělením na soustavu kongruencí podle faktorů modulu máme x2 = -1 (mod 3), x2 = 3 (mod 5), x2 = 5 (mod 11) a lehce se vidí, že první dvě z těchto kongruencí nemají řešení, a proto nemá řešení ani zadaná kongruence. Konkrétně (^) = "1 a (§) = (§) = (!) = -!. □ 10.68. Řešte kongruenci x2 — 23 = 0 (mod 77). Řešení. Rozdělením modulu na faktory dostaneme x2-l = 0 (modli), x2 -2 = 0 (mod 7). Je ihned vidět, že 1 je kvadratický zbytek modulo 11 a že první kongruence soustavy má (jediná dvě) řešení x = ±1 (mod 11). Dále (2/7) = (9/7) = 1 a rovněž zde je ihned vidět řešení x = ±3 (mod 7). Dostáváme čtyři jednoduché soustavy (vždy dvou) lineárních kongruencí, jejichž vyřešením obdržíme řešení původní kongruence x = 10, 32, 45 nebo 67 (mod 77). □ 10.69. Určete modulo která prvočísla je uvedené číslo kvadratickým v\^Jv zbytkem: Řešení. i) Hledáme prvočísla p ^ 3 taková, že x2 = 3 (mod p) má řešení. Protože p = 2 zjevně vyhovuje, uvažujme dále pouze lichá p ^ 3. Pro p = 1 (mod 4) dostáváme ze zákona kvadratické reciprocity 1 = (3/p) = (p/3), což nastane právě pro p = 1 (mod 3). Je-li naopak p = — 1 (mod 4), pak 1 = (3/p) = —(p/3), což platí pro p = — 1 (mod 3). Zkombinováním podmínek v těchto dvou případech dostaneme p = ±1 (mod 12), což dá spolu s p = 12 množinu všech prvočísel, vyhovujících zadání. ii) Podmínka 1 = (—3/p) = (—í/p)(3/p) bude splněna buď v případě, že (— 1 /p) = (3/p) = 1, nebo pokud (—í/p) = = (3/p) = — 1. V prvním případě (i s využitím řešení předchozí úlohy) to znamená, že p = 1 (mod 4) a p = ±1 (mod 12), ve druhém případě musí zároveň platit p = — 1 (mod 4) a p = ±5 (mod 12) - redukovaná soustava zbytků modulo 12 je totiž tvořena např. množinou {—5, —1, 1, 5} a protože (3/p) = 1 pro p = ±1 (mod 12), nutně pro což pro a — 1 dává požadované tvrzení z bodu 2. Podle již dokázané části 2 a z předchozí rovnosti nyní dostáváme pro lichá čísla a (10.1) (-i) Uvažme nyní pro daná prvočísla p ^ q množinu T = {q - x; x e Z, 1 < x < (p - l)/2}x x {p ■ y, y e Z, 1 < y < (q - l)/2). Zřejmě je |7"| = 2—1 ■ Ukážeme, že rovněž 2-1 p-l čímž budeme vzhledem k předchozímu hotovi. 21 24 15 Protože pro žádná x, y z přípustného rozsahu nemůže nastat rovnost ípc = py, můžeme množinu T rozložit na dvě disjunktní podmnožiny T\ a T2 tak, že T\ — T D {(m, ľ); m, ľ e Z, m < ľ), T2 — T \ T\. Zřejmě je T\ počet dvojic (qx, py), kde x < 2y. Protože f y - f • ^t" < f' Je [f >"] - t^- P1"0 Pevné y tedy v ri leží právě ty dvojice (qx, py), pro které 1 < x < [^y] » a tedy mi = E*t/)/2 [f y]. Analogicky |r2| = ££i1)/2 Podle 10.1 je tedy (|) = (-l)|Tl a (£) = (-l)™ a zákon kvadratické reciprocity j e dokázán. □ Důsledek. Buďte p, q lichá prvočísla. (1) — 1 je kvadratický zbytek pro prvočísla p splňující p = 1 (mod 4) a nezbytek pro prvočísla splňující p = 3 (mod 4). (2) 2 /e kvadratický zbytek pro prvočísla p splňující p = ±1 (mod 8) a nezbytek pro prvočísla splňující p = ±3 (mod 8). (5) Je-li p = 1 (mod 4) nebo q = 1 (mod 4),/e (p/í?) = 0?//?), pro ostatní lichá p, q je (p/q) = —(q/p). Důkaz. (1) Číslo je sudé, právě když 4 | p — 1. (2) Potřebujeme zjistit, pro které lichá prvočísla p je exponent í-g— sudý. Lichá prvočísla mohou dávat modulo 8 zbytek ± 1 nebo ±3, odkud podle ||10.15|| buďp2 = 1 (mod 16), nebo p2 = 9 (mod 16). (3) Zřejmé ze zákona kvadratické reciprocity. □ Příklad. Vypočtěme s využitím vlastnosti Legendreova symbolu hodnotu (79/101). 621 KAPITOLA 10. TEORIE ČÍSEL p = ±5 (mod 12) platí (3 j p) = —1 Dostali jsme tak čtyři soustavy dvou kongruencí, z nichž dvě soustavy řešení nemají a řešením zbylých dvou jsou p = 1 (mod 12), resp. p = —5 (mod 12). iii) V tomto případě (6/p) = (2/p)(3/p) a opět dostáváme dvě možnosti: baď(2/p) = (3/p) = 1, nebo (2/p) = (3/p) = = —1. První případ nastává, pokud p splňuje p = ±1 (mod 8) a současně p = ±1 (mod 12). Vyřešením příslušných soustav lineárních kongruencí získáme podmínku p = ±1 (mod 24). Ve druhém případě pak p = ±3 (mod 8) a zároveň p = ±5 (mod 12), což celkem dá p = ±5 (mod 24). Poznamenejme ještě, že díky Dirichletově větě 10.12 je ve všech třech případech počet vyhovujících prvočísel nekonečný. □ 10.70. Následující příklad ukazuje, že pokud je modul kvádrami'/, tické kongruence prvočíslo p splňující p = 3 (mod 4), ff pak umíme nejen rozhodnout o řešitelnosti kongruenci, ale umíme rovněž snadno popsat všechna řešení této kongruence. Uvažme prvočíslo p = 3 (mod 4) a číslo a e Z splňující (a/p) = 1. Dokažte, že pak má kongruence x2 = a (mod p) řešení (mod p). Řešení. Ověříme snadno zkouškou (s využitím lemmatu 10.33), že platí (§)s=a (modp). / p±l\2 e+l (fl4j EE a 2 EEfl- □ 10.71. Rozhodněte, je-li kongruence x2 ee 3 (mod 59) řešitelná a v kladném případě nalezněte její řešení. Řešení. Výpočtem Legendreova symbolu -(-!) = ! zjistíme, že kongruence má dvě řešení. Z předchozího příkladu navíc ihned vidíme (59 ee 3 (mod 4)), že řešením jsou čísla x ee ±3^ = ±315 ee (35)3 ee ±Ť = ±343 ee TH (mod 59), Í19\ /101\ I -jyjY I = ( "yg") ~ neboť 101 dává po dělení4 zbytek 1 _ í22 ~ 1.79 (79) ' (79 \79 neboť19 dává po dělení 8 zbytek — 1 = (-1) = neboť 11 ee 79 ee 3 (mod 4) = (-^(jj) = 1 neboí 11 = 3 (mod 8> Vyčíslení Legendreova symbolu (jak jsme viděli i v předcho-ig^ zim příkladu) umožňuje používat zákon kvadratické WsiJ^ reciprocity jen na prvočísla a nutí nás tak provádět f* f)j v průběhu výpočtu faktorizaci čísel na prvočísla, což ■ * je výpočetně velmi náročná operace. Toto lze obejít rozšířením definice Legendreova symbolu na tzv. Jacobiho symbol s podobnými vlastnostmi. Definice. Nechť a e Z, b e N, 2 \ b. Nechť b = p\pi---pk je rozklad b na (lichá) prvočísla (výjimečně neseskupujeme stejná prvočísla do mocniny, ale vypisujeme každé zvlášť, např. 135 = 3 • 3 • 3 • 5). Symbol se nazývá Jacobiho symbol. Níže ukážeme, že Jacobiho symbol má podobné vlastnosti jako symbol Legendreův. S jednou podstatnou odchylkou - neplatí totiž obecně, že z (a/b) — 1 plyne řešitelnost kongruence x2 = a (mod b). Příklad. = (-1) - (-1) = 1 neboť35 = 243 EE7 (mod 59). □ (é)-GH a přitom kongruence x2 ee 2 (mod 15) není řešitelná (kongruence x2 = 2 totiž není řešitelná modulo 3 ani modulo 5). Věta (zákon kvadratické reciprocity pro Jacobiho symbol). Nechť a, b e N jsou lichá. Pak (D (^) = (-D2¥. (2) © = (-D2^. (3) (§) = (!)'(-D"- Důkaz. Důkaz je snadný s využitím zákona kvadratické reciprocity pro Legendreův symbol. Vizpříklad ||10.62||. □ 622 KAPITOLA 10. TEORIE ČÍSEL D. Diofantické rovnice Už ve tretím století našeho letopočtu se Diofantos z Alexandrie zabýval řešením rovnic, ve kterých za řešení připouštěl jen celá čísla. Není se čemu divit, vždyť v mnoha praktických úlohách, vedoucích k rovnicím, nemusí mít neceločíselná řešení rozumnou interpretaci. Jde například o úlohu, jak pomocí existujících (korunových či euro-vých) mincí přesně zaplatit konkrétní částku. Takové rovnice, u nichž nás zajímají jen celočíselná řešení, se na Diofantovu počest se nazývají diofantické rovnice. Hezkým příkladem diofantické rovnice je i Eulerův vztah s — h + v = 2 z teorie grafů dávající do souvislosti počet stěn, hran a vrcholů rovinného grafu. Hledáme-li navíc pouze pravidelné grafy, dostáváme se k otázce existence tzv. Platónských těles, která je možné elegantně popsat právě jako řešení této diofantické rovnice - více viz 12.28. Pro řešení těchto rovnic bohužel neexistuje žádná univerzální metoda. Dokonce neexistuje ani metoda (jinými slovy algoritmus), která by určila, jestli má obecná polynomiální diofantická rovnice řešení. Tato otázka je známá pod názvem 10. Hilbertův problém a důkaz neexistence algoritmu podal K)pnií MaTiinceBHra (Yuri Matiyasevich) v roce 1970.1 V některých případech je ale možné řešení diofantických rovnic zcela nebo alespoň zčásti převést na řešení kongruencí, což je kromě již zmiňovaných aplikací další motivací pro studium kongruencí. Uvedme si alespoň některé z nich. Další aplikací zákona kvadratické reciprocity je v jistém ■j: » smyslu opačná otázka: Pro která prvočísla je dané číslo i a kvadratickým zbytkem'/ Tuto otázku již umíme odli" povědět např. pro a — 2. Prvním krokem je zodpovězení této otázky pro prvočísla, odpověď pro složená a pak závisí na tom, jak se a rozkládá na prvočísla. m Iff Věta. Nechť q je liché prvočíslo. • Je-li q ee 1 (mod 4), pak je q kvadratický zbytek modulo ta prvočísla p, která splňujíp ee r (mod q), kde r je kvadratický zbytek modulo q. • Je-li q ee 3 (mod 4), pak je q kvadratický zbytek modulo ta prvočísla p, která splňují p = ±b a nesoudělné s q. (mod 4q), kde b je liché Důkaz. První tvrzení plyne triviálně ze zákona kvadratické reciprocity. Uvažujme tedy q ee 3 (mod 4), tj. p—i ~ (lip) — (— 1) 2 (Pil)- Nechť nejprve p ee +b (mod 4q), kde b je liché, a tedy b2 = 1 (mod 4). Pak p ee b2 ee 1 (mod 4) a p = b2 (mod q). Tedy (-1)^ = 1 a (p/q) = 1, odkud (q/p) — 1. Je-li nyní p ee —b2 (mod 4q), pak obdobně p ee —b2 ee 3 (mod 4) a p = —b2 (mod g). Tedy p-i (-1) 2 — -1 a (p/q) — -1, odkud opět (q/p) — 1. Obráceně, mějme (q/p) = 1. Máme dvě možnosti - buď (-1)^ = 1 a (p/q) = 1, anebo (-1)^ = -1 a (p/q) = -1. V prvním případě je p ee 1 (mod 4) a existuje b tak, že p ee b2 (mod q). Přitom lze bez újmy na obecnosti předpokládat, že b liché (kdyby totiž bylo b sudé, mohli bychom místo něj vzít b + q). Pak ale b2 = 1 ee p (mod 4) a celkem p = b2 (mod 4q). V druhém případě je p ee 3 (mod 4) a (—p/q) — — (—l/q)(p/q) — (—1)(—1) = 1, proto existuje b (které lze opět vybrat liché) tak, že — p ee b2 (mod q). Tedy — b2 ee 3 ee p (mod 4) a celkem p ee —b2 (mod 4q). □ 5. Aplikace - počítání s velkými čísly, kryptografie 10.35. Výpočetní aspekty teorie čísel. V mnoha praktických úlohách využívajících výsledky teorie čísel je za-potřebí umět rychle provést jeden či více z následu- W jících výpočtů: Lineární diofantické rovnice. Lineární diofantické rovnice jsou rov--51 nice tvaru a\x\ + a2X2 + • • • + a„x„ = b, kde x\,. , jsou neznáme a a\, ,an,b daná nenulová celá čísla. 'Viz elementárně psaný text M. Davis, Hubert's Tenth Problem is Unsolvable, The American Mathematical Monthly 80(3): 233-269.1973. • běžné aritmetické operace (součet, součin, dělení se zbytkem) na celých číslech, • určit zbytek mocniny celého čísla a (na přirozené číslo n) po dělení daným m. • určit inverzi celého čísla a modulo m e N, • určit nej větší společný dělitel dvou celých čísel (a případně koeficienty do Bezoutovy rovnosti), • rozhodnout o daném čísle, je-li prvočíslo nebo složené, • v případě složenosti rozložit dané číslo na součin prvočísel. Základní aritmetické operace se i na velkých číslech obvykle provádějí obdobně jako jsme se to učili na základní a střední škole, kdy umíme sčítat v lineárním a násobit a dělit se zbytkem v kvadratickém čase. Pro násobení, které je základem mnoha dalších operací, existují asymptoticky rychlejší algoritmy (typu rozděl a panuj) - např. první takový Karatsubův (1960) časové náročnosti ® (nlog23) nebo algoritmus Schonhage-Strassenův (1971) časové náročnosti & (n log n log log n), který využívá rychlou Fourierovu 623 KAPITOLA 10. TEORIE ČÍSEL transformaci (FFT) - viz též 7.30. Ten je ale přes svou asymptotickou převahu výhodný až pro násobení čísel majících alespoň desítky tisíc cifer (a používá se tak např. pro hledání největších známých prvočísel v projektu G1MPS). 10.36. Největší společný dělitel a modulární inverze. Jak už jsme ukazovali dříve, výpočet řešení kongruence a ■ x = 1 (mod ni) s neznámou x lze snadno (díky Bezoutově větě) převést na výpočet největšího společného dělitele čísel a a m a na hledání koeficientů k, l do Bezoutovy rovnosti k ■ a + l ■ m — 1 (nalezené k je pak onou hledanou inverzí a modulo ni). To, že řešení diofantických rovnic je občas užitečné i „ v praktickém životě", dokazuje Bruče Willis a Samuel Jackson ve filmu Smrtonosná past 3 (Die Hard: With a Vengeance), kde mají za úkol zlikvidovat bombu pomocí 4 galonů vody, přičemž k dispozici mají pouze nádoby na 3, resp. 5 galonů. Matematik by řekl, že pánové měli za úkol nalézt alespoň jedno řešenídiofantické rovnice 3x + 5y = 4. K řešení těchto rovnic je možné užít kongruencí. Zřejmě je nutnou podmínkou řešitelnosti této rovnice to, že číslo d = (a\,... ,an) dělí b. Pokud je tato podmínka splněna, vydělením obou stran rovnice číslem d dostaneme ekvivalentní rovnici function extended_gcd (a ,m) if m == 0 return (1 ,0) else (q,r) := divide (a .m) (k,l) := extended_ä ;cd(m, r) return (1,k — q*1) Podrobná analýza ukazuje, že problém výpočtu největšího společného dělitele je kvadratické časové složitosti. 10.37. Modulární umocňování. Algoritmus modulárního umocňování je založen na myšlence, že např. při počítání 264 (mod 1000) není třeba nejprve počítat 264 a poté jej vydělit se zbytkem číslem 1000, ale lépe je postupně násobit „dvojky" a kdykoliv je výsledek větší než 1000, provést redukci modulo 1000. Zejména ale není třeba provádět takové množství násobení (v tomto případě 63 naivních násobení je možné nahradit pouze šesti umocněními na druhou, neboť 264 = (((((22)2)2)2)2)2. a[x\ + a'2X2 + • • • + a'nxn = b', function modular_pow (base , exp , mod) result := 1 kde a- = at/d pro i = l.....nať = b/d. Přitom platí while exp > 0 da'n) = (a\, ..., an) = d, if (exp % 2 = = D: d ■ (flj, ..., a'n) = (da\, ..., result := ( result * base) % mod a tedy (a[,..., a'n) = 1. exp := exp >> 1 base := (base * base) % mod Dále ukážeme, že rovnice return result a\x\ + a2X2 + • • • + anxn = b, kde a\,a2,..., an, b jsou celá čísla taková, že (a\,... ,an) = 1, má vždy celočíselné řešení a že všechna celočíselná řešení této rovnice je možné popsat pomocí n — 1 celočíselných parametrů. Důkaz povedeme matematickou indukcí vzhledem k počtu neznámých n. Pro n = 1 je tvrzení triviální, rovnice má zřejmě jediné řešení (tedy řešení nezávisí na žádném parametru). Je-li dále n > 2 a předpokládáme-li, že tvrzení platí pro rovnice o n — 1 neznámých, pak označíme d = (a\,..., a„_i) a libovolná rc-tice x\,..., xn, která je hledaným řešením rovnice musí splnit kongruenci a\x\ + a2x2 + • • • + anxn = b (mod d). V průběhu algoritmu se pro každou binární číslici exponentu provede umocnění základu na druhou modulo n (což je operace proveditelná v nejhůře kvadratickém čase) a pro každou , jedničku" v binárním zápisu se navíc provede jedno násobení. Celkově jsme tedy schopni provést modulární umocňování nejhůře v kubickém čase. Je přitom vidět, že složitost významně závisí na zápisu exponentu ve dvojkové soustavě Příklad. Vypočtěme 2560 (mod 561). Protože 560 = (1000110000)2, dostaneme uvedeným algoritmem Viz napf. D. Knuth, Art of Computer Programming, Volume 2: Semi-numerical Algorithms, Addison-Wesley 1997 nebo Wikipedia, Euclidean algorithm, http://en.wikipedia.org/wiki/Euclidean_algorithm(as of July 16, 2013, 11:32 GMT). 624 KAPITOLA 10. TEORIE ČÍSEL Vzhledem k tomu, že d je společný dělitel čísel a\,..., a„_i, je tato kongruence tvaru anxn = b (mod d), která má díky tomu, že (d, an) = (a\,..., an) = 1, jediné řešení xn = c (mod d), kdecje vhodné celé číslo, neboli xn = c + d-r, kde/ e Zje libovolné. Dosazením do původní rovnice a úpravou obdržíme rovnici a\x\ + • • • + fln-A-i = b — a„c — a„dt on — l neznámých s jedním parametrem /. Přitom je číslo (b — anc) j d celé, proto lze tuto rovnici vydělit číslem d. Dostaneme tak rovnici dxx\ H-----h a'n_xxn_x = b', kde a[ = cii/d pro i = 1,..., n — 1 a b' = ((b — anc)/d) — ant, splňující (a[,.. .,a'n_x) = (da[, ddn_x) ■ \ = (au a„_i) 1, která má podle indukčního předpokladu pro libovolné r e Z řešení popsatelné pomocí n — 2 celočíselných parametrů (jiných než /), což spolu s podmínkou xn = c + dt dává požadované tvrzení. 10.72. Rozhodněte, zda je možné na dvouramenných vahách, mají-cích ramena stejné délky, odvážit 50g nějakého zboží, 'l ^ggTÄ máme-li k dispozici pouze (libovolný počet) závaží 1 tří hmotností (770g, 630g a 330g). Pokud ano, jak to udělat? Řešení. Naším úkolem je vyřešit rovnici 770* + 630y + 330z = 50, kde x, y, z e Z (záporná hodnota ve výsledku přitom bude znamenat, že závaží klademe na druhou mlsku). Po vydělení obou stran rovnice číslem (770, 630, 330) = 10 dostaneme ekvivalentní rovnici 77* + 63 v + 33z = 5. Nyní tuto rovnici uvážíme modulo (77, 63) kongruenci, kterou vyřešíme: 7 a získáme lineární 33z 5z : 5 (mod 7), : 5 (mod 7), : 1 (mod 7). exp base result poslední cifra exp 560 2 1 0 280 4 1 0 140 16 1 0 70 256 1 0 35 460 1 1 17 103 460 1 8 511 256 0 4 256 256 0 2 460 256 0 1 103 256 1 0 511 1 0 A tedy 2560 = 1 (mod 561). 10.38. Testování prvočíselnosti a složenosti. Přestože platí základní věta aritmetiky, která nám garantuje, že každé •T^__ přirozené číslo se dá jednoznačným způsobem rozložit na součin prvočísel, praktické nalezení tohoto rozkladu je obvykle velmi výpočetně náročná operace, obvykle prováděná v několika krocích: (1) nalezení všech dělitelů nepřevyšujících určitou hranici (metodou pokusného dělení všemi prvočísly až do této hranice, typicky je touto hranicí cca 106), (2) otestování zbylého faktoru na složenost (tzv. test na složenost, testující některou nutnou podmínku prvočíselnosti), (a) pokud test složenosti dopadl s výsledkem, že zkoumané číslo je asi prvočíslo, pak testem na prvočíselnost ověřit, že je to opravdu prvočíslo, (b) pokud test složenosti dopadl s výsledkem, že zkoumané číslo je složené, pak nalézt netriviálního dělitele. Takto je posloupnost kroků prováděna z toho důvodu, že jednotlivé algoritmy mají postupně (výrazně) rostoucí časovou složitost. V roce 2002 sice Agrawal, Kayal a Saxena publikovali algoritmus, který testuje prvočíselnost v polynomiálním čase, prakticky je ale zatím stále efektivnější používat výše uvedený postup. 10.39. Testy na složenost - jak s jistotou poznat složená čísla? Takzvané testy na složenost testují některou nutnou podmínku prvočíselnosti. Nejjednodušší takovou podmínkou je Malá Ferma-tova věta. Tvrzení (Fermatův test). Existuje-li pro dané N nějaké a ^ 0 (mod N) takové, ze a"-1 ^ 1 (mod N), pak N není prvočíslo. Bohužel nemusí být pro dané složené TV snadné najít takové a, že Fermatův test odhalí složenost TV. Pro některá výjimečná TV dokonce jedinými takovými čísly a jsou ta čísla, jež jsou soudělná s TV. Jejich nalezení je tedy ekvivalentní s nalezením dělitele, a tedy i s rozkladem TV na prvočísla. Skutečně existují taková nehezká (nebo extrémně hezká?) složená čísla TV, která splňují, že pro libovolné a nesoudělné s TV platí aN~l = 1 (mod N). Taková čísla se nazývají Carmi-chaelova, nejmenší10 z nich je 561 = 3 • 11 • 17 a teprve v roce 1992 se podařilo dokázat11, že jich je dokonce nekonečně mnoho. Řešeními jsou tedy všechna celá čísla z tvaru z je celočíselný parametr. 1 + It, kde r e Z 1()Za objevitele nejmenších sedmi Carmichaelových čísel se považuje český kněz a matematik Václav Šimerka (1819-1887), který se jimi zabýval podstatně dříve než americký matematik R. D. Carmichael (1879-1967), po němž nesou své jméno. ^W. R. Alford, A. Granville and C. Pomeranče, There are Infinitely Many Carmichael Numbers, Annals of Mathematics, Vol. 139, No. 3 (1994), pp. 703-722. 625 KAPITOLA 10. TEORIE ČÍSEL Po dosazení do rovnice za z a úpravě dostaneme 77* + 63y = 5 -33(1+7/), llx + 9y = -4-33/. Tuto (parametrizovanou) rovnici uvážime modulo 11: 9y = -4 -33/ (modli), -2y = -4 (mod 11), y = 2 (mod 11). Řešeními kongruence jsou tedy celá čísla y = 2 + 11í pro libovolné í e Z. Nyní již zbývá jen dopočítat x: llx = -4- 33/ -9(2+ 11í), ILy = -22- 33/ - 9 • 11í, x = -2 - 3/ - 9í. Zjistili jsme, že řešení tvoří všechny trojice celých čísel (x, y, z) z množiny {(-2 - 3/ - 9í, 2 + llí, 1 + 7/); í, / e Z}. Konkrétní řešení dostaneme dosazením hodnot za /, í. Například pro / = í = Oje řešením trojice (—2, 2,1) nebo pro / = —4, í = 1 trojice (1, 13, -27). Poznamenejme, že neznámé lze samozřejmě eliminovat v jiném pořadí - v takovém případě výsledek může vypadat „syntakticky" jinak, ale bude samozřejmě popisovat stejnou množinu řešení (taje dána konkrétní třídou rozkladu komutativní grupy Z™ podle vhodné pod-grupy - v našem případě (2, 2,1) + (3, 0, 7)Z + (-9, 11, 0)Z c Z3 - což je zřejmou analogií toho, že řešením takové rovnice nad tělesem je afinní podprostor příslušného vektorového prostoru). □ 10.73. Další typy diofantických rovnic řešitelných s využitím kon-gruencí. Při řešení některých diofantických rovnic je možné jednu z neznámých explicitně vyjádřit jako funkci ostatních - v takovém případě budeme zkoumat, pro které celočíselné hodnoty neznámých je i hodnota této funkce celočíselná. Například pro rovnici tvaru , X„-l), kde m je přirozené číslo a f (x\,... ,xn_\) e Z[x\,...,x„_i] mnohočlen s celočíselnými koeficienty, je nutnou a dostatečnou podmínkou toho, že rc-tice celých čísel x\,..., xn je jejím řešením, podmínka f(xi,...,x„-i) = 0 (mod m). Příklad. Dokážeme, že 561 je Carmichaelovo, tj. že pro každé a e N, které je nesoudělné s 3 • 11 • 17, platia560 = 1 (mod 561). Z vlastností kongruencí víme, že stačí dokázat tuto kongru-enci modulo 3, 11 i 17. To ale dostaneme přímo z Malé Ferma-tovy věty, protože takové a splňuje a1 = 1 (mod 3),aw = 1 (mod 11), a 1 (mod 17), přičemž 2, 10 i 16 dělí 560, proto a ee 1 modulo 3, 11 i 17 pro všechna a nesoudělná s 561 (viz též Korseltovo kritérium uvedené níže). 10.40. Tvrzení (Korseltovo kritérium). Složené číslo n je Carmi-chaelovým číslem, právě když • je nedělitelné čtvercem (square-free), • pro všechna prvočísla p dělící n platí p — 1 | n — 1. Důkaz. „<=" Ukážeme, že pokud n splňuje uvedené dvě podmínky a je složené, pak pro libovolné a e Z, nesoudělné s n platí a™-1 ee 1 (mod n). Rozložme tedy n na součin různých Uchých prvočísel ve tvaru n = pi ■ ■ ■ Pk, kde navíc pi — 1 | n — 1 pro všechna i e [l, , ...,1c). Protože (a, p i) = 1 dostáváme z Malé Fermatovy věty aPi~l ee 1 (mod pi), odkud díky podmínce pi — 1 | n — 1 rovněž a™-1 ee 1 (mod p{). Toto platí pro všechna i, proto a™-1 ee 1 (mod n) a číslo n je Carmichaelovo. „=>" Carmichaelovo číslo n nemůže být sudé, protože pak pro a = — 1 dostaneme a"_1 ee — 1 (mod n), což ale vzhledem k podmínce a™-1 ee 1 (mod n) znamená, že n musí být rovno dvěma (a tedy není složené). Mějme tedy rozklad n — p"1 ■ ■ ■ p"k, kde Pi jsou různá lichá prvočísla a a; e N. Pro každé i můžeme díky větě 10.20 zvolit primitivní kořen g, modulo p"' a z Čínské zbytkové věty pak dostaneme celé číslo a splňující a ee g, (mod p"') pro všechna i, které je zřejmě nesoudělné s n. Z předpokladu víme, že a™-1 ee 1 (mod n), tedy i modulo pf', a proto rovněž g™-1 ee 1 (mod p"'). Protože je g; primitivním kořenem modulo p"', musí být číslo n — 1 násobkem jeho řádu, tedy násobkem 0, a proto 2X = 1 + 3y > 2, odkud x > 1. Ukážeme, že také platí x < 2. Kdyby totiž bylo x > 3, platilo by 1 + 3y = 2X = 0 (mod 8), odkud plyne 3y = -1 (mod 8). To ale není možné, protože řád čísla 3 modulo 8 je roven dvěma a mocniny trojky jsou tedy kongruentní pouze s čísly 3 a 1. Zbývá tedy prověřit pouze možnosti x = 1 a x = 2. Pro x = 1 dostáváme 3y = 21 — 1 = 1, a tedy y = 0. Z x = 2 plyne 1 = 3, takže y = 1. Rovnice má tedy dvě řešení: x = 1, y = 0 a x = 2, y = l. □ 10.77. Pythagorova rovnice. V tomto odstavci se zabýváme otáz-'rfÉjfy- kou hledání všech pravoúhlých trojúhelníků s celočíselnými w^Mi délkami stran. Jde o diofantickou rovnici, při níž se metody *tfc. uvedené výše objeví pouze okrajově, vzhledem k jejímu významu ji ale přesto uvedeme. Úkolem je v množině přirozených čísel řešit rovnici x2+y2=z2. Řešení. Zřejmě se můžeme omezit na situaci, kdy (x, y, z) = 1 (v opačném případě obě strany rovnice vydělíme číslem d = (x, y, z). Různé typy pseudoprvočísel Ukazuje se, že tento snadný test výrazně zesiluje schopnost rozpoznávat složená čísla. Nejmenší silné pseudoprvočíslo o základu 2 je 2047 (přitom nejmenší Fermatovo o základu 2 bylo již 341) a při otestování základů 2, 3 a 5 dostaneme nejmenší silné pseudoprvočíslo 25326001. Jinými slovy, pokud nám stačí testovat pouze čísla do 2 • 107, pak stačí tento test na složenost provést pouze pro základy 2, 3 a 5. Pokud číslo není odhaleno jako složené, pak je určitě prvočíslem.Na druhou stranu bylo dokázáno, že žádná konečná báze není dostatečná pro otestování všech přirozených čísel. Test Millera a Rabina je praktickou aplikací předchozího tvrzení, kdy jsme navíc díky následující větě uvedené bez důkazu schopni omezit pravděpodobnost neúspěchu. 10.42. Věta. Nechť N > 10 je liché složené číslo. Pišme N — 1 = = 2* ■ q, kde t je přirozené číslo a q je liché. Pak nejvýše čtvrtina z čísel množiny {a e Z; 1 < a < N, (a, N) = 1) splňuje následující podmínku: a" = 1 nebo existuje e e {0,1, ... ,t r,2'« = - (mod N) - 1} splňující -1 (mod N). V praktických implementacích se obvykle testuje cca 20 náhodných základů (příp. nejmenších prvočíselných základů). V takovém případě dostáváme díky předchozí větě, že pravděpodobnost neodhalení složeného čísla je menší než 2~40. Časová náročnost algoritmu je asymptoticky stejná jako složitost modulárního umocňování, tedy nejhůře kubická. Je ale třeba si uvědomit, že test je nedeterministický a spolehlivost jeho deterministické verze závisí na tzv. zobecněné Riemannově hypotéze (GRH13). 10.43. Testy na prvočíselnost. Testy na prvočíselnost přicházejí na řadu obvykle ve chvíli, kdy některý test na složenost prohlásí, že jde pravděpodobně o prvočíslo, případně se provádějí rovnou u speciálních typů čísel. Uvedme nejprve přehled nejznámějších testů, mezi nimiž jsou jak historické testy, tak i některé testy velmi moderní. (1) AKS - obecný polynomiální test na prvočísla objevený indickými matematiky Agrawalem, Kayalem a Saxenou v roce 2002. (2) Pocklington-Lehmerův test - test na prvočíselnost subexpo-nenciální složitosti 13 Wiklpedia, Riemann hypothesis, http://en.wikipedia.org/ wiki/Riemann_hypothesis (as of July 25, 2013, 21:23 GMT). 628 KAPITOLA 10. TEORIE ČÍSEL Ukážeme navíc, že čísla x, y, z jsou dokonce po dvou nesoudělná: kdyby nějaké prvočíslo p dělilo dvě z nich, nutně by dělilo i třetí, což vzhledem k podmínce nesoudělnosti není možné. Z čísel x, y je tedy nejvýše jedno sudé. Kdyby byla obě lichá, nutně by platilo z2 = x2 + y2 = 1 + 1 (mod 8), což není možné (viz přiklad || 10.2||). Z čísel x, y je tedy právě jedno sudé. Protože ale v Pythagorově rovnici vystupují x a y symetricky, můžeme předpokládat, že sudé je x a položit x = 2r, r e N. Odtud pak plyne Ar2 = z2 - y2 a tedy r2 z + y ■ y Označme nyní u = i (z + y), v = i (z — y), s inverzní substitucí z = u + v,y = u — v. Protože vaz jsou nesoudělná, jsou nesoudělná i u, v (případné prvočíslo p dělící y a z by totiž bylo rovněž společným dělitelem jejich součtu i rozdílu, tedy y a z). Ze vztahu r2 = u ■ v pak plyne, že existují nesoudělná přirozená čísla a, b tak, že u = a2, v = b2. Navíc vzhledem k tomu, že platí u > v, nutně a > b. Celkem tedy dostáváme x = 2dr = 2ab, „2 b2h y = u — v = (a z = u + v = (a2 + b2), což skutečně vyhovuje dané rovnici pro libovolná nesoudělná a, b eN taková, že a > b. Další řešení dostaneme záměnou x ay. Další trojice řešení obdržíme, pokud vynásobíme všechny složky řešení libovolným přirozeným číslem d. □ 10.78. Velká Fermatova věta pro n = 4. Z právě odvozené parametrizace pythagorejských čísel budeme schopni poměrně snadno dokázat neexistenci řešení (v oboru přirozených čísel) slavné Fermatovy rovnice x" +f = z" pro n = 4. Dokažte, že rovnice x4 + y4 = z2 nemá řešení v N. Řešení. Budeme postupovat tzv. metodou nekonečného sestupu (infi-nite descent), se kterou poprvé přišel Pierre de Fermat a která využívá toho, že libovolná neprázdná množina přirozených čísel má nejmenší prvek (jinými slovy, že N je dobře uspořádaná množina). (3) Lucas-Lehmerův test - test prvočíselnosti pro Mersenneho čísla (4) Pépinův test - test prvočíselnosti pro Fermatova čísla z roku 1877 (5) ECPP - test prvočíselnosti založený na tzv. eliptických křivkách Uvedřne nyní klasický test prvočíselnosti pro Mersenneho čísla. Tvrzení (Lucas-Lehmerův test). Buď q ^ 2 prvočíslo a definujme posloupnost fe)^o rekurzivně předpisem s0 = 4, s„+i =sj;-2. Pak je číslo Mq — 2q — 1 prvočíslo, právě když Mg dělí sq-2 ■ Důkaz. Budeme pracovat v okruhu R — Z[V3] = — {a + b«fi; a, b e Z), kde dělení se zbytkem funguje analogicky jako v celých číslech (viz též 11.18). Položme a — 2 + V3, ,8 = 2 — V3 a zmiňme, žea + fi — 4, a ■ fi — l. Nejprve indukcí dokážeme, že pro všechna n e No platí (10.2) sn = a2" + f = f (l + a2"+l) . Pro n = 0 tvrzení platí, neboť so = 4 = a + fi. Předpokládejme, že tvrzení platí pro n — 1, pak je s„ — 4_i — 2 podle a + fr I —2 = a +fr . Dále protože Mq = -1 (mod 8), je (2/Mg) = 1 a kromě toho ze zákona kvadratické reciprocity plyne neboť pro liché q je 2q — 1 = 1 (mod 3). Obě vyjádření platí i pokud Mq není prvočíslo (v takovém případě jde o Jacobiho symbol). Poznamenejme, že ve zbytku důkazu využijeme rozšíření relace kongruence na prvky z oboru Z[V3] = {a+b^fi; a,b e Z); stejně jako v případě celých čísel i pro a, fi e Z[V3] píšeme a = fi (mod p), pokud p | a — fi. Dále i zde platí analogie tvrzení (ii) z přikladu ||10.14|| - pro prvočíslo p je (a + fl)p = ap + flp (mod p) (důkaz je identický s důkazem tvrzení pro celá čísla). „=>" Předpokládáme, že Mq je prvočíslo a dokážeme, že a2q = —1 (mod Mq), z čehož vzhledem k (10.2) vyplyne Mq | Sg-2-Protože2{Mi-l~>l2 = (2/Mg) = 1 (mod Mg), existuje y e Z tak, že 2y2 ee 1 (mod Mg). Platí (y(l + V3))2 = y2 (4 + 2^3) ee a (modM,), odkud s využitím Fermatovy věty a vztahu 2q 1 = —^— dostáváme ^•y^-1 (l + V^).(l + V3)m?ee ee y2 (l + VÍ) ■ (l - \/3) = -2y2 ee ee -1 (mOd Mg). 629 KAPITOLA 10. TEORIE ČÍSEL Předpokládejme tedy, že množina řešení rovnice x + y = z je neprázdná a uvažme takové řešení, které má mezi všemi řešeními nejmenší hodnotu z. Tato x, y, z jsou nutně po dvou nesoudělná. Protože lze tuto rovnici psát ve tvaru z předchozího příkladu dostáváme existenci r, s e N, splňujících x2 =2rs, y2=r2-s2, z = r2 + s2. Odtud y2 + s2 = r2, kde (y, s) = 1 (kdyby nějaké prvočíslo p dělilo y i s, pak by díky předchozím vztahům dělilo i x a z, což nelze kvůli předpokladu nesoudělnosti x, y, z). Opětovným využitím řešení pythagorejské rovnice dostáváme existenci přirozených čísel a, b s vlastnostmi (y je liché) y = a2 - b2, s = 2ab, r = a2 + b2. Zpětnou substitucí dostaneme x2 = 2rs = 2 ■ 2ab(a2 + b2), a protože x je sudé, plyne odtud ,2 (I) = ab(a2 + b2). Čísla a,b,a2 + b2 jsou přitom po dvou nesoudělná (což se odvodí snadno z nesoudělnosti y a s), proto je každé z nich druhou mocninou přirozeného čísla: a = c2, b = d2, a2 + b2 = e2, odkud c4 + cŕ = e2 a protože platí e < a2 + b2 = r < z, dostáváme spor s minimalitou z. □ E. Testy prvočíselnosti 10.79. Mersenneho prvočísla. Následujících několik úloh má úzký _JP5> vztah k testování Mersenneho čísel na prvočíselnost. Pro libovolné q eN uvažte číslo Mq = 2q — 1 a dokažte: 1) Je-li q složené, je složené i Mq. Při odvození jsme dále využili toho, že 3 je kvadratický nezbytek modulo Mq, a tedy že platí (l + VŠ)M? ee 1 + (V3)M? = 1 + 3<^-V'2 ■ V3 ee = 1 - \/3 (mod Mq). „<=" Nechť nyní naopak Mq \ sq-2 ■ Pak ale Mg | sq-2 - a = 1 + a ■ Je-li p 2, 3 libovolný prvočíselný dělitel Mq, pak rovněž a2q = — 1 (mod p) a a2q = 1 (mod p). Odtud vyplývá, že 29 je řád a v multiplikativní grupě Tp — {a+bVŠ; 0 < a, b < p}\ {Oj. Kdyby platilo (3/p) = 1, pak bychom obdrželi = p ■ (2 + V3 • 3(p-1)/2) = ^ • (2 + V5) = 1, odkud plyne, že p— 1 je násobkem řádu a, tedy 2q. To ale znamená, že p > p — l > 2q > 2q — l = Mq a to je spor s tím, že p je dělitel Mq. Proto je (3/» = -1 a F VŠ) (2 + VŠ)" ee 2 + VŠ) (2 - ee vP + 1 = ee 1 (mod p). Řádem a modulo p je 2q, proto 2? | p+1 a zejména p > 2q — 1 = — Mq. Zároveň je ale p prvočíselný dělitel Mq, proto je Mq — p prvočíslo. □ Na rozdíl od důkazu je naprogramování tohoto algoritmu 1 tak M9 není prvočíslem. ii) Nechť n = 2q + 1 je dělitel M9. S využitím Luca-sovy věty 10.44 ukážeme, že n je prvočíslo. Protože n — 1 = 2q má pouze dva prvočíselné dělitele, stačí najít svědky složenosti pro čísla 2 a q. Platí 2< = 2/ =é 1 (mod n), (-2)^ = -2« ee - 1 je 1 (modři), díky předpokladu n \ Mq = 2q — 1. Protože dále (-2)"-1 = 2"-1 = 2lq - 1 = (2« + 1)M„ ee 0 (mod n), dostáváme z Lucasovy věty, že n je prvočíslo. Nechť je nyní p = 2q + l = —l (mod 8) prvočíslo. Protože (2/p) = 1, existuje m tak, že 2 = m2 (mod p). Odtud 2« = M0. 1 (mod p),atedyp | 2«-l iii) Pokud p | M9 = 2q — 1, pak řád 2 modulo p musí dělit prvočíslo q, a proto je roven q. Odtud q \ p — 1 a existuje e Z tak, že 2#£ = p — 1. Celkem dostáváme (2/p) = 2"*" tj. p = ±1 (mod 8). : 29i ee 1 (mod p), □ 10.80. Rozhodněte, zda jsou Mersenneho čísla 2n — 1, 215 — 1, /) X2<^5%^ 223 — 1, 229 — 1 a 283 — 1 prvočísla nebo čísla / XŽŠ.v NT \ složená. Řešení. V případě čísla 215 — 1 je exponent složený, proto je toto číslo rovněž složené (víme dokonce, že je dělitelné čísly 23 — 1 a 25 — 1), ve všech ostatních případech je exponentem prvočíslo. Můžeme si všimnout, že tato prvočísla q = 11,23,29 a 83 jsou dokonce prvočísly Sophie Germainové (tedy 2q + 1 je rovněž prvočíslo), proto z části (ii) předchozího přikladu plyne, že 23 | 2n - 1, 47 | 223 - 1 a 167 | 283 - 1. Ve zbylém případě nemůžeme toto tvrzení použít, protože 29 ^ 3 (mod 4) a skutečně 59 \ 229 — 1. Zde ale z části (iii) předchozího příkladu dostáváme, že případné prvočíslo p dělící 289 — 1 musí Tvrzení (Pépinův test). Nutnou a postačující podmínkou toho, aby n-té Fermatovo číslo Fn bylo prvočíslem, je Fn-l ee -1 (mod Fn). Vidíme, žejde o velmi jednoduchý test, který je vlastně pouze malou částí Eulerova testu na složenost. Důkaz korektnosti PÉPiNOVA testu. Předpokládejme nejprve, že 3(F"-1)/2 ee -1 (mod F„).Pak3F"-1 ee 1 (mod F„), a protože je Fn — 1 mocninou dvojky, je nutně Fn — 1 řádem čísla 3 modulo Fn. Rád každého čísla modulo Fn je ale nejvýše roven 1. Nechť p je prvočíslo dělící N — 1. Předpokládejme dále, Že existuje ap e Z tak, že 1 ee 1 (mod N) t — a [app - 1, AT = 1. Nechťp"" je nejvyšší mocnina p dělící N — 1. Pak pro každý kladný dělitel d čísla N platí d ee 1 (mod pa»). Důkaz věty Pocklingtona a Lehmera. Každý kladný dělitel d čísla N je součinem prvočíselných dělitelů čísla N, větu proto stačí dokázat pouze pro prvočíselné hodnoty d. Z podmínky ap~l ee 1 (mod N) plyne nesoudělnost čísel ap,N (jejich společný dělitel musí dělit i pravou stranu kongruence). Pak rovněž (ap,d) — la podle Fermatovy věty platí a^-1 ee 1 Viz Wikipedia, Sophie Germain prime, http://en.wikipedia.org/ (mod d). Protože (ap (N-l)/p - 1, N) = 1, platí apN-1)/p # 1 wiki/Sophie_Germain_prime (as of July 28, 2013, 14:43 GMT). (mod d). 631 KAPITOLA 10. TEORIE ČÍSEL splňovat p = ±1 (mod 8) p = 1 (mod 29), neboli p = 1 (mod 232) nebo p = 175 (mod 232). HJedáme-li prvočíselného dělitele čísla n = 229 — 1 = 536870911, pak stačí prověřit prvočísla tohoto tvaru do y/ň m 23 170. Těch je celkem 50, proto otestování toho, zda je n prvočíslo, je jednoduše zvládnutelné (s trochou píle dokonce i na papíře). V tomto případě je navíc hledaným dělitelem hned nejmenší z těchto prvočísel, číslo 233. □ 10.81. Ukažte, že číslo 341 je Fermatovo pseudoprvočíslo o základu 2, ale že není Euler-Jacobiho pseudoprvočíslo o základu 2. Dále dokažte, že číslo 561 je Euler-Jacobiho pseudoprvočíslo o základu 2, ale ne o základu 3 a že naopak číslo 121 je Euler-Jacobiho pseudoprvočíslo o základu 3, ale nikoliv o základu 2. Řešení. Číslo 341 je Fermatovo pseudoprvočíslo o základu 2, protože 210 = 1 => 2340 = 1 (mod 341). Není Euler-Jacobiho, protože sice 2™ = 1 (mod 341), ale = —1, což plyne z toho, že 341 = -3 (mod 8). Pro číslo 561 platí 2280 = 1 (mod 561) a = 1, protože 561 = 1 (mod 8). Je tedy Euler-Jacobiho pseudoprvočíslo o základu 2. O základu 3 nikoli, protože 3 | 561. Naopak, číslo 121 splňuje 35 = 1 (mod 121) => 360 = 1 (mod 121) a (jfj) = 1, ale 260 = 89 =é 1 (mod 121). □ 10.82. Dokažte, že čísla 2465, 2821 a 6601 jsou Carmichaelova, tj. že označíme-li n kterékoliv z nich, pak pro každé a e Z, (a, n) = 1 platí a"-1 = 1 (mod n). Řešení. Platí 2465 = 5-17-29, 2821 = 7-13-31, 6601 = 7-23-41 a tvrzení plyne z Korseltova kritéria 10.40, neboť čísla 4, 16 i 28 dělí 2464 = 25 • 7 • 11, čísla 6, 12 i 30 dělí 2820 = 22 • 3 • 5 • 47 a čísla 6,22,40dělí6600 = 23-3-52-ll. □ 10.83. Dokažte, že 2047 je silné pseudoprvočíslo o základu 2, ale ne o základu 3. Dále dokažte, že 1905 je Euler-Jacobiho pseudoprvočíslo o základu 2, které ale není silným ^ pseudoprvočíslem o stejném základu. Řešení. To, zda 2047 je silné pseudoprvočíslo o základu 2, ověříme pomocí rozkladu Označme e řád ap modulo d. Pak platí e \ d — \, e \ N — 1 a e f (AT - l)/p. Kdyby pa" \ e, pak by z e \ N — 1 plynulo e \ což je spor. Platí tedy pa" \ e, a tedy rovněž pa" \ d — 1. □ 10.46. Věta. Nechť N e N, N > 1. Předpokládejme, že můžeme psát N — 1 = F ■ U, kde (F, U) — 1 a F > ^/Ň, přičemž známe rozklad čísla F na prvočinitele. Pak platí: • jestliže pro každé prvočíslo p \ F můžeme najít ap e Z z předchozí věty, pak je N prvočíslo; • je-li N prvočíslo, pak pro libovolné prvočíslo p \ N — 1 existuje ap e Z s požadovanými vlastnostmi. Důkaz. Podle věty 10.45 pro potenciálního dělitele d > 1 čísla N platí d = 1 (mod pap) pro všechny prvočíselné faktory F, proto je d = 1 (mod F),atedyrf > ~/Ň. Pokud N nemá netriviálního dělitele nepřevyšujícího Vw, je nutně prvočíslem. Obráceně stačí za ap zvolit primitivní kořen modulo prvočíslo N (nezávisle na p). Pak z Fermatovy věty plyne a 1 (mod N) a z toho, 7= 1 (mod N) pro že ap je primitivní kořen, dostáváme ap libovolné p | N — 1. Čísla ap opět nazýváme svědky prvočíselnosti čísla N. □ (221 1) = (211 1)(21023 + 1). Poznámka. Předchozí test v sobě zahrnuje Pépinův test (zde totiž pro N — Fn máme p — 2, kterému vyhovuje svědek prvočíselnosti ap = 3). 10.47. Hledám dělitele. Máme-li testem na složenost provede-.g ným na nějakém konkrétním čísle potvrzeno, že jde •jíV o číslo složené, obvykle chceme najít netriviálního S^«B;-L2g dělitele. Jde ale o výrazně obtížnější úkol než pouhé odhalení jeho složitosti - připomeňme, že testy na složenost nám sice poskytnou garanci, ale nikoliv dělitele (což je na druhou stranu výhodné pro RSA a podobné kryptografické protokoly), proto si k tématu uvedeme jen stručný přehled používaných metod a krátkou ukázku pro inspiraci. (1) Pokusné dělení (2) Pollardova p-metoda (3) Pollardova p — 1 metoda (4) Faktorizace pomocí eliptických křivek (ECM) (5) Metoda kvadratického síta (QS) (6) Metoda síta v číselném tělesa (NFS) Zde si pro ilustraci ukážeme konkrétní případ použití jednoho z těchto algoritmů - Pollardovy p-metody. Tento algoritmus je speciálně vhodný pro hledání relativně malých dělitelů (jeho očekávaná složitost totiž závisí na velikosti těchto dělitelů) a je založený na myšlence, že pro náhodnou funkci / : 5 —> S, kde 5 je konečná n-prvková množina, se musí posloupnost OO^q, kde xn+\ ~ f (xn), zacyklit. Přitom předperioda i perioda má očekávanou délku ^Jtí ■ n/8. 632 KAPITOLA 10. TEORIE ČÍSEL Protožeje 2 1 (mod 2047), je tvrzení pravdivé. Přitom ale není silným prvočíslem o základu 3, protože 31023 = 15 65 # ±1 (mod 2047). Všimněme si, že v případě čísla 2047 je test na silné pseudoprvočíslo shodný s Eulerovým testem (je to dáno tím, že číslo 2046 není dělitelné čtyřmi). Číslo 1905 je Euler-Jacobiho pseudoprvočíslo o základu 2, protože 219M'2 = 1 (mod 1905) a rovněž Jacobiho symbol (2/1905) je roven 1. Protože 1904 = 24-7- 17,jektomu, aby bylo 1905 silné pseudoprvočíslo o základu 2, třeba, aby byla splněna některá z kongruencí 2952 2476 2238 2u9 ■ -1 : -1 : -1 : ±1 (mod 1905), (mod 1905), (mod 1905), (mod 1905). Platí ale 2952 = 2476 = 1 (mod 1905), 2238 = 1144 (mod 1905) a 2119 = 128 (mod 1905), proto číslo 1905 silným pseudoprvočíslem o základu 2 není. □ Níže uvedený algoritmus je opět přímočarou implementací popsaných úvah. Algoritmus (Pollardova p-metoda): Vstup: n, rozkládané číslo vhodná funkce f(x) a:=2;b := 2; d := 1 While d = 1 do = /(*) /(/(&)) d ■— gcd(a — b, n) If d = n, return FAILURE. Else return d. 10.84. Pomocí Pocklington-Lehmerova testu ukažte, že 1321 je prvočíslo. Řešení. Položme N = 1321, pak N - 1 = 1320 = : 23 • 3 • 5 • 11. Budeme-li pro ilustraci předpokládat, že pokusné dělení provádíme jen prvočísly menšími než 10, pak F = 23 - 3- 5 = 120, U = 11, kde (F, U) = (120, 11) = 1. Abychom Pocklington-Lehmerovým testem prokázali prvočísel-nost 1321, potřebujeme pro každé p e {2, 3, 5} najít svědka prvočísel-nosti ap. Protože je (2^ - 1, 132l) = 1 a (2^ - 1, I32l) = 1, lze klást a3 = a5 = 2. Pro p = 2 je ale ^2^ - 1,132l) = 1321, proto musíme hledat jiného svědka prvočíselnosti. Vyhoví například a2 = 7, protože ^7 ^r2 — 1, 1321^ = 1. V obou případech platí, že 2i320 = 7i320 = 1 (mod i32l). Svědkové prvočíselnosti čísla 1321 jsou tedy a2 = 7, a3 = a5 = 2. Případně bylo možné (ale nikoliv nutné) zvolit pro všechna prvočísla p totéž číslo (např. 13), které je primitivním kořenem modulo 1321. □ 10.85. Pomocí Pollardovy p-metody rozložte číslo 221 na prvočísla. Využijte přitom funkci f(x) = x2 + 1 s iniciální hodnotou x0 = 2. 10.48. Kryptografie s veřejným klíčem. V současné praxi je nejdůležitější aplikací teorie čísel tzv. kryptografie s veřejným klíčem. Jejími hlavními úkoly je zajistit • šifrování, kdy zprávu zašifrovanou veřejným klíčem příjemce není schopen rozšifrovat nikdo kromě něj (resp. držitele jeho soukromého klíče); • podepisování, kdy integrita zprávy podepsané soukromým klíčem odesílatele může být ověřena kýmkoliv s přístupem k veřejnému klíči odesílatele. Mezi základní a nejčastěji používané protokoly v kryptografii s veřejným klíčem patří: • RSA (šifrování) a odvozený systém pro podepisování zpráv, • algoritmus digitálního podpisu (Digital Signature Algorithm - DSA) a jeho varianta založená na eliptických křivkách (ECDSA), • Rabinův kryptosystém (a podepisování), • kryptosystém ElGamal (a podepisování), • kryptografie eliptických křivek (ECC), • Difiíe-Hellmanův protokol na výměnu klíčů (DH). 10.49. Šifrování - RSA. Popišme nejprve nejznámější šifru s veřejným klíčem -je následující: RSA. Princip protokolu RSA1 14Ron Rivest, Adi Shamir, Leonard Adleman (1977); C. Cocks, tajná služba GCHQ (neveřejně) již 1973 633 KAPITOLA 10. TEORIE ČÍSEL Řešení. Položme x = y = 2 a postupem z 10.47 počítejme: ■■f (.x) y:=f(f(y)) (\x - y\,221) mod 221 5 26 14 197 26 197 104 145 1 1 1 13 Nalezli jsme tedy netriviálního dělitele a snadno dopočteme 221 = 13 • 17. □ 10.86. Nalezněte netriviálního dělitele čísla 455459. Řešení. Uvažujme funkci f(x) = x2 + 1 (mlčky předpokládáme, že se tato funkce modulo neznámý prvočíselný dělitel p čísla n chová náhodně a má tak požadované vlastnosti) a v jednotlivých iteracích počítáme a <— f(a) (mod n), b <— f (f (b)) (mod n) spolu s vyčíslením d = (a — b, n). a b d 5 26 1 26 2871 1 677 179685 1 2871 155260 1 44380 416250 1 179685 43670 1 121634 164403 1 155260 247944 1 44567 68343 743 Hledaným dělitelem je tedy číslo 743 a snadno dopočítáme, že 455459 = 613 • 743. □ F. Šifrování 10.87. RSA. Šifrou RSAs veřejným klíčem (7, 33) byla poslánačísla 29, 7, 21. Pokuste se šifru prolomit a zjistit zasílané zprávy (čísla). Řešení. Pro zjištění soukromého klíče d potřebujeme řešit kongruenci Id = 1 (mod 1 neplatí n \ 2" — 1. O 10.98. Dokažte, že pro každé liché prvočíslo p existuje nekonečně mnoho přirozených čísel n, splňujících p\n-2" + l. O 10.99. Nechť pro funkci / : N N platí (f (a), f (b)) = (f (a), f(\a - b\)). Dokažte, že pak (f (a), f (b)) = f ((a, b)). Ukažte, že odtud vyplývá tvrzení příkladu ||10.6|| i fakt (Fa, Fb) = F(a,b), kde Fa značí a-tý člen Fibonacciho posloupnosti. O 638 KAPITOLA 10. TEORIE ČÍSEL Řešení cvičení 10.25. i) Číslo 3 je řádu 4 modulo 10, proto stačí zjistit zbytek exponentu po dělení čtyřmi. Ten je roven jedné, proto je poslední číslice rovna 31 — 3. ii) 37 ee —3 (mod 10) je řádu 4. Opět stačí spočítat, jaký zbytek dává exponent po dělení čtyřmi. Zřejmě ale 37 ee 1 (mod 4), proto je hledaný zbytek po dělení desíti roven (-3)1 ee 7, a tedy poslední cifrou je 7. iii) Protože (12, 10) > 1, nelze mluvit o řádu čísla 12 modulo 10. Zřejmě je ale zkoumané číslo sudé, proto stačí zjistit, j aký zbytek dává po dělení 5. Rád čísla 12 ee 2 (mod 5) je čtyři a exponent splňuje 1314 ee l14 — 1 (mod 4), proto je 1213 ee 21 (mod 5) a protože je 2 číslo sudé, je i hledanou poslední číslicí. 10.27. Protože je 3, která jsou násobkem 3 a tedy jistě složená. 10.95. Uvažme pevné k e TL \ {1) a libovolné a e N. Ukážeme, že pro a libovolně velké dokážeme najít n takové, že číslo 22" + k bude složené a větší než a. Tím bude důkaz hotov. Budte dále s e No, h e Ti taková, že /c — 1 = 2S • 2 { a m e N splňující 22™ > a — k. Nechť nyní pro í platí í > s,l > m. Je-li číslo 22 + k složené, pak jsme hotovi, protože 22 + k > 22™ + k > a. Nechť je tedy dále 22 + k rovno prvočíslu p. S pomocí Eulerovy věty najdeme číslo požadovaného tvaru, které je jeho násobkem. Máme p-l = 22'+2s-/i = 2s-/ii, kde/íi G N je liché. Platí tedy 2^^^ ee 1 (mod hi), odkud 2s+f^ ee 2s (mod p - 1) a protože je / > s, rovněž 2l+ 2l, jei 22t+T(h>> +k > 22' +k — p > a a dostali jsme tak složené číslo požadovaného tvaru, které je větší než (libovolně velká) předepsaná hodnota a. Poznamenejme na závěr, že pro k = 1 jde o otevřený problém zkoumající existenci nekonečně mnoha Fermatových prvočísel. 639 KAPITOLA 10. TEORIE ČÍSEL 10.96. Snadno vidíme, že 2 | a\ = 10 a 3 | a2 = 48. Ukážeme dále, že pro libovolné prvočíslo p > 3 platí p | flp-2- Podle Fermatovy věty je 2P_1 = 3P_1 = 6P_1 = 1 (mod p). Proto platí 6ap_2 = 3 • 2P~! + 2 • 3P~! + ó^1 - 6 = 3 + 2 + 1- 6 = 0 (mod p). Poznamenejme, že se znalostí algebry budeme schopni postupovat ještě přímočařeji: pro p > 3 uvážíme p-prvkové těleso Fp, v němž existují inverzní prvky čísel 2, 3, 5 a pro součet těchto prvků platí 5 + 5 + 5 = L 10.97. Úvahy vycházející z rozkladu n na prvočísla jsou poměrně komplikované, zde ukážeme řešení využívající menšího triku. Předpokládejme, že n splňující podmínky n | 2™ — 1, n > 1, existuje a uvažme nejmenší takové. Určitě bude n Uché, proto n | — 1. S využitím tvrzení příkladu || 10.6|| dostaneme, že n | 2d — 1 , kde d — (n, 1 a d > 1). Přitom je d < ip(n) < n a d \ n, odkud konečně d | 2d — 1 a to je spor s předpokladem, že n bylo nejmenší přirozené číslo větší než 1, které vyhovuje zadání. 10.98. Protože je 2P_1 = 1 (mod p), stačí např. za n volit vhodné násobky p — 1, tedy nalézt k tak, aby n = &(p — 1) splnilo podmínku n ■ 2" = —1 (mod p). Taje ale díky p — 1 | n ekvivalentní s podmínkou k ee 1 (mod p) a takových & zřejmě vyhovuje nekonečně mnoho. 10.99. Rozborem Eukleidova algoritmu na hledání největšího společného děUtele. 640 KAPITOLA 11 Algebraické struktury čím větší abstrakce, tím větší zmatek? - ne, často to bývá naopak... A. Algebraické struktury Nejprve si procvičme obecné vlastnosti operací a zkusíme zjistit, co vlastně známé množiny se známými operacemi tvoří za struktury. 11.1. Rozhodněte o následujících množinách a operacích, jaké tvoří algebraické struktury (grupoid, pologrupa, zda existují levé (pravé) neutrální prvky, grupa): i) podmnožiny množiny přirozených čísel spolu s operací sjednocení, V této kapitole se budeme věnovat zdánlivě velice formálnímu studiu pojmů, které ale ve skutečnosti odráží spoustu skutečných vlastností věcí kolem nás. Abstrahujeme z nich přitom jen ty nejjednodušší operace a „algebru" tak lze vnímat jako algoritmické manipulace s písmeny, které zpravidla mají nějaké souvislosti s výpočty nebo popisem procesů. Zároveň si budeme trochu všímat, kde všude jsme takové objekty potkávali v předchozích kapitolách (aniž by ale bylo nutné mít tyto kapitoly předem pročtené). Přímo navážeme víceméně jen na první a šestou část první kapitoly, kde jsme podobně abstraktně pohlíželi na čísla, se kterými počítáme, a obecněji na vztahy mezi objekty, když jsme je abstrahovali do tzv. relací. V první části této kapitoly se zastavíme u té nejjednodušší situace - budeme se zamýšlet nad případem, kdy máme jen jednu jedinou operaci, která se chová podobně jako násobení čísel. Pak si přidáme druhou operaci, podobně jako jsou u čísel k dispozici společně sčítání a násobení. To nám umožní vysvětlit elementární základy tzv. počítačové algebry, tj. algoritmických postupů, díky kterým počítače umí manipulovat s formálními výrazy a počítat s nimi, včetně řešení systémů polynomiálních rovnic. V další části se vrátíme k jiné abstrakci situací s jedinou operací a budeme přitom vycházet z uspořádání čísel podle velikosti nebo množinové inkluze. V poslední části kapitoly se pak zastavíme u několika poznámek ohledně využití algebraických nástrojů pro návrhy (samoopravných) kódů využívaných hojně při přenosech dat. 1. Grupy Naše první úvahy se budou týkat objektů a situací, ve kterých je možné rovnice tvaru a ■ x — b vždy jednoznačně řešit (tak jako u lineárních rovnic jsou ob-. jekty a a b dány, zatímco x hledáme). Půjde o tzv. teorii grup. Všimněme si, že zatím nic nevíme o povaze objektů, ani co znamená ta tečka. Jen předpokládáme, že dvěma objektům a a x umíme přiřadit objekt a ■ x. Nejprve si oprášíme a rozšíříme náš slovník pojmů ohledně operací, jak jsme jej zavedli již v kapitole první a projdeme přitom příklady čísel a transformací roviny a prostoru, ve kterých se s takovými „grupovými" objekty potkáváme. Teprve pak se budeme chvíli věnovat základům obecné teorie. 11.1. Příklady a pojmy. Pro libovolnou množinu A jsmejiž dříve definovali binární operaci na A j ako libovolné zobrazení A x A -» A. Výsledek takové operace budeme často značit (a, b) h-» a ■ b. Množina s binární operací se nazývá grupoid. KAPITOLA 11. ALGEBRAICKÉ STRUKTURY ii) přirozená čísla spolu s binární operací největší společný dělitel, iii) kladná celá čísla spolu s binární operací nejmenší společný násobek, iv) množina všech invertibilních matic 2x2 nad K spolu se sčítáním, v) množina všech matic 2x2 nad K spolu s násobením matic, vi) množina všech matic 2x2 spolu s odčítáním matic, vii) množina všech invertibilních matic 2x2 nad Z2 s násobením matic, viii) množina Z6 spolu s násobením (modulo 6), ix) množina Z7 spolu s násobením (modulo 7). U třetího příkladu od konce sestavte tabulku dané operace. Řešení. i) monoid (prázdná množina je neutrálním prvkem), ii) pologrupa (bez neutrálního prvku), iii) monoid (číslo 1 je neutrálním prvkem), iv) není ani grupoid (uvážíme A+(—A) pro nějakou invertibilní matici A), v) monoid, vi) grupoid (není asociativní), vii) grupa, viii) monoid (třída [1] je neutrálním prvkem), ix) monoid (třída [1] je neutrálním prvkem), V případě vii) má grupa následující prvky: A = l)' » = CO-^ (i i>° = G i>£ = (° :> F = Potom tabulka operace násobení matic vypadá následovně: A B C D E F A A B C D E F B B A E F C D C C D A B F E D D C F E A B E E F B A D C F F E D C B A Všimněme si, že v tabulce se v každém řádku i sloupci (bez prvního řádku a sloupce) vyskytuje každý prvek právě jednou (proč tomu tak je?). Nemusíme tedy všechny součiny počítat a můžeme si v jisté fázi doplňování tabulky zahrát „Sudoku". □ Abychom mohli něco podstatného říci, potřebujeme nějaké další vlastnosti operací. Binární operace je asociativní, jestliže pro všechny prvky v A platí a ■ (b ■ č) = (a ■ b) ■ c. ._| Binární operace a pologrupy |__, | Grupoid s asociativní binární operací se nazývá pologrupa. Binární operace je komutativní, jestliže pro všechny prvky v A platí j a ■ b = b ■ a. Přirozená čísla N = {0, 1, 2, ...) spolu s kteroukoliv z operací sčítání a násobení jsou asociativní a komutativní pologrupou. Celá čísla Z = {..., —2, —1, 0, 1, 2, ...) jsou grupoidem vůči kterékoliv z operací sčítání, odčítání, násobení. Operace odčítání ale není asociativní, např. (5 - 3) - 2 = 0 j£ 5 - (3 - 2) = 4, ani komutativní, protože a — b = —(b — a). | Jednotky, inverze a grupy J__i | Levá jednotka v grupoidu (A, •) je takový prvek e e A, že pro všechny prvky v A platí e ■ a = a; obdobně pro pravou jednotku musí platit pro všechny prvky a ■ e = a. Jednotka binární operace je prvek e, který je pravou i levou jednotkou zároveň. Prvek a-1 je levou inverzí k prvku a vpologrupě (A, •) s jednotkou e, jestliže platí a-1 • a = e; obdobně je pravou inverzí aTl takový prvek, pro který je a ■ a~l — e. Prvek a-1 je inverzní k a v pologrupě s jednotkou, jestliže je levou i pravou inverzí zároveň. Monoid (M, •) je pologrupa s jednotkou. Grupa (G, •) je pologrupa s jednotkou, ve které má každý prvek inverzi. Komutativní grupa, resp. komutativní pologrupa, je taková, | kde je operace ■ komutativní. Komutativní grupy se také často nazývají abelovské. počest mladého matematika Ábela ... V angličtině se používá přídavné jméno Podívejme se na přímé jednoduché důsledky definic. V mono-idu nemohou být pravé a levé inverze různé. Je-li totiž a ■ x = = x ■ b = e, pak také a = a ■ (x ■ b) = (a ■ x) ■ b = b. Podstatná je zde pouze asociativita operace. Všimněme si, že pro odečítání na celých číslech (tady operace není asociativní) je nula pravou jednotkou, tj. a — 0 = a pro všechna celá čísla a, není však levou jednotkou. Dokonce v tomto případě levý neutrální prvek neexistuje. Celá čísla jsou zjevně pologrupou vůči sčítání i násobní. Grupou jsou přitom jen vůči sčítání, protože pro násobení neexistují inverzní prvky, kromě čísel ±1. Je-li (A, •) grupa, pak její podmnožinu B c A, která je uzavřená vůči zúžení operace • a zároveň je spolu s touto operací grupou, nazýváme podgrupa. Jestliže zadáme v grupě G nějakou množinu prvků M c G, pak podgrupa generovaná množinou M je nejmenší podgrupou, která věechny prvky M obsahuje. Zjevně půjde o průnik všech pod-grup, které M obsahují. 642 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.2. NechťZjelibovolnámnožina.NechťPCZ) značí systém všech podmnožin množiny X. Určete, zda množina V(X) tvoří s danou operací grupoid, pologrupu, pologrupu s neutrálním prvkem (monoid), grupu a zdaje zadaná operace komutativní. i) průnik množin, ii) sjednocení množin, iii) symetrický rozdíl množin. Řešení. Je-li množina X prázdná, potom tvoří V(X) se všemi operacemi komutativní grupu. V ostatních případech i) s operací průnik tvoří daná množina komutativní pologrupu s neutrálním prvkem, ii) s operací sjednocení tvoří daná množina komutativní pologrupu s neutrálním prvkem, iii) s operací symetrický rozdíl tvoří daná množina komutativní grupu, neutrálním prvkem je prázdná množina a každý prvek je samoinverzní A-1 = A. □ 11.3. Rozhodněte o následujících množinách a operacích, jaké tvoří struktury (grupoid, pologrupa, grupa). Určete zda existují levé (pravé) neutrální prvky a zda ja daná operace komutativní. i) množina všech invertibilních matic 3x3 nad K spolu se sčítáním, ii) množina všech matic 3x3 nad K spolu s násobením matic, iii) množina všech matic 3x3 spolu se sčítáním matic, iv) množina všech invertibilních matic 3x3 nad Z2 s násobením matic, v) množina (Z9,+), vi) množina (Z9, •)• O 11.4. Rozhodněte, zda podmnožina G komplexních čísel tvoří spolu s operací násobení komplexních čísel grupoid, pologrupu, pologrupu s neutrálním prvkem (monoid), grupu a zdaje zadaná operace komutativní. i) G = {a + bi\a,be Z}, ii) G = {a + bi\a,be K, a2 + b2 = 1}, iii) G = {a + b ■ V5 | a, b e Q, a2 + b2 ^ 0}. O 11.5. Rozhodněte, zda daná množina Z tvoří spolu s operací C (komutativní) grupoid, (komutativní) pologrupu, (komutativní) monoid, (komutativní) grupu: Racionální čísla Q jsou komutativní grupou vzhledem ke sčítání a nenulová racionální čísla jsou také komutativní grupou vůči násobení. Celá čísla spolu se sčítá--i»_^eľzi nún jsou jejich podgrupou. Pro každé kladné přirozené číslo k je množina všech k-tých odmocnin z jedničky, tj. množina {z e C; zk — 1), konečnou grupou vůči násobení komplexních čísel. Např. pro k — 2 dostaneme grupu { — 1, 1} se dvěma prvky, které jsou oba samy sobě inverzí, zatímco pro k — 4 dostáváme grupu G = {1, i, — 1, —i). Množina Mat„, n > 1, všech čtvercových matic je (nekomutativní) pologrupa vzhledem k násobení matic a komutativní grupa vzhledem ke sčítání matic (viz odstavce 2.2-2.5). Množina všech lineárních zobrazení Hom(V, V) na vektorovém prostoru je pologrupa vzhledem ke skládání zobrazení a komutativní grupa vzhledem ke sčítání zobrazení (viz odstavec 2.34). V obou předchozích příkladech tvoří podmnožina invertibilních objektů uvažované pologrupy grupu. V prvním případě jde o tzv. grupu invertibilních matic, ve druhém o grupu lineárních transformací vektorového prostoru. V dřívějších kapitolách jsme již potkali mnoho (polo)gru-pových struktur, občas asi i docela nečekaně. Vzpomeňme např. různé podgrupy grupy matic nebo grupovou strukturu na eliptických křivkách. 11.2. Grupy permutací. Velmi často grupy a pologrupy potkáváme jako množiny zobrazení na pevně dané množině M, které jsou uzavřeny vůči skládání zobrazení. Ne vždy si ale tuto skutečnost přímo uvědomujeme, protože vidíme jen některá zobrazení a na všechna ostatní vznikající složeními nemyslíme. Nejsnáze je tato souvislost vidět na konečných množinách M, kde nám každá podmnožina invertibilních zobrazení vygeneruje pomocí skládání jistou grupu. Na každé takové množině o m — \ M\ e N prvcích (prázdná množina má 0 prvků) totiž máme k dispozici mm možných definic zobrazení (každý z m prvků můžeme zobrazit na kterýkoliv v M) a všechna taková zobrazení umíme skládat. Protože skládání zobrazení je samozřejmě asociativní operace, dostáváme grupoid. Pokud chceme, aby existovala k zobrazenia : M -» M jeho inverze a-1, musí být a bijekcí. Složením dvou bijekcí vznikne opět bijekce, a proto podmnožina Sm všech bijekcí na množině M o m prvcích je grupa. Říkáme jí grupa permutací (na m prvcích) a je příkladem konečné grupy.1 Sám název grupy Sm přitom uvádí jinou souvislost, kdy místo bijekcí na konečné množině vnímáme permutace jako přerovnání rozlišitelných prvků. Potkávali jsme se s permutacemi v tomto smyslu např. při studiu determinantů, viz odstavec 2.14 na straně 76. Promysleme si podrobněji, jak vlastně násobení v takové grupě vypadá. U (malé) konečné grupy si můžeme snadno sestavit úplnou tabulku všech operací. Jestliže v grupě permutací S3 na číslech {1, 2, 3) označíme jednotlivá pořadí a = (1, d = (1, 2,3), b = (2,3, 3,2), e = (3,2, c = (3, / = (2, 1.2) , 1.3) , li Lze dokázat, že každá konečná grupa je podgrupou ve vhodné konečné grupě permutací. To si můžeme interpretovat tak, že grupy Sm jsou tak nekomutativní a složité, jak to jen jde. 643 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY i) cŕOb = (a, b), ii) aSOb = iii) afOb = 2a + b, iv) afOb = \a\, v) éOb = a + b + a ■ b, vi) afOb = a + b — a ■ b, vii) afOb = a + (-l)ab. pak skládání našich permutací je zadáno tabulkou O 11.6. Určete, kolika způsoby lze doplnit tabulka tak, aby ({a, b, c}, *) byl i) grupoid ii) komutativní grupoid iii) grupoid s neutrálním prvkem iv) pologrupa s neutrálním prvkem v) grupa * a b c a c b a b b c Řešení. i) 35 ii) 9 iii) 9 iv) 1 v) 0 □ 11.7. Určete počet všech grupoidů na dané trojprvkové množině. Řešení. Grupoid je určen tím, jak na něm působí daná operace. V grupoidu může být výsledkem aplikace operace na libovolné dva prvky libovolný prvek grupoidu. Pro každou uspořádanou dvojici tedy máme nezávisle na výběr ze tří možností výsledku operace na ní. Podle pravidla součinu tak dostáváme 33'3 = 19683 různých grupoidů. □ 11.8. Rozhodněte, zda množina G = (I\(0]xl)s operací A tvoří grupoid, pologrupu, pologrupu s neutrálním prvkem (monoid), grupu a zdaje zadaná operace komutativní, jestliže je operace A definována takto: (x, y)A(u, v) = (xu, xv + y), pro libovolná (x, y), (u,v) e G. O a b c d e f a a b c d e f b b c a f d e c c a b e f d d d e f a b c e e f d c a b f f d e b c a Všimněme si podstatného rozdílu mezi permutacemi a, b a c a dalšími třemi. Ty první tři tvoří tzv. cyklus generovaný prvkem b nebo prvkem c: Samy o sobě jsou tyto tři prvky komutativní podgrupou. V této podgrupě je a jednotka a prvky bac jsou vzájemně inverzní. Je tedy tato podgrupa stejná jako je grupa Z3 zbytkových tříd celých čísel modulo 3, resp. jako grupa třetích odmocnin z jedničky. Další tři prvky jsou samy sobě inverzí a každý z nich je tedy společně s jednotkou a podgrupou stejnou jako je Z2. Říkáme, že b a c jsou prvky řádu 3, zatímco prvky d, e a / jsou řádu 2. Tabulka ale není symetrická podle diagonály, naše operace • tedy není komutativní. Obdobně se chovají všechny grupy permutací Sm konečných množin o m prvcích. Každá permutace a rozkládá množinu M na disjunktní sjednocení maximálních invariantních podmnožin, které dostaneme tak, že postupně vybíráme dosud nezpracované prvky 1 e M a do třídy rozkladu Mx přidáváme všechny akce iterací ak(x),k = 1,2,..., dokud není ak(x) = x. Každou permutaci tak dostáváme jako složení jednodušších permutací, tzv. cyklů, které se chovají jako identická permutace vně Mx a tak jako a na Mx. Pokud přitom očíslujeme prvky v Mx jako pořadí (1,2,..., I Ařjc |) tak, aby i odpovídalo o'(x), pak je naše permutace prostým posunutím o jednu pozici v cyklu (tj. poslední prvek je zobrazen zpátky na první). Odtud název cyklus. Zjevně přitom tyto cykly komutují, takže je jedno, v jakém pořadí z nich permutaci a složíme. Nejjednodušší cykly jsou jednoprvkové pevné body permutace a a dvouprvkové (x, a(x)), kde a(a(x)) = x. Těm se říká transpozice. Protože každý cyklus zjevně můžeme poskládat z permutací sousedních prvků (necháme „probublat" první prvek na konec), lze každou permutaci napsat jako složení transpozic sousedních prvků. Vraťme se k případu E3. Tam máme jednak možnost cyklu, který zahrne všechny tři prvky a v něm dostaneme permutace a, b, c. Kromě toho ještě můžeme mít jeden cyklus o délce 2 a zbývající prvek bude pevným bodem - tak dostaneme zbývající 3 permutace. Více možností není. Z postupu je zřejmé, že u větších počtů prvků bude možností velmi mnoho. Jednotlivé permutace můžeme obecně vyjádřit pomocí transpozic mnoha způsoby. Přitom ale skutečnost, jestli potřebujeme sudý nebo lichý počet transpozic, je na volbách nezávislá (můžeme tuto skutečnost vyjádřit pomocí počtu tzv. inverzí a poslední tvrzení pak plyne z toho, že každá transpozice mění počet inverzí o lichý počet, viz úvahy v odstavci 2.15 na straně 77). Máme tedy dobře definováno zobrazení sgn : ■ Z2 {±1), 644 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY B. Grupy Začneme připomenutím permutací a některých jejich vlastností. S permutacemi jsme se již setkali ve druhé kapitole, viz 2.14, kde jsme je potřebovali k definici determinantu matice. 11.9. Určete všechny permutace ji e §7 tak, aby i) jr4 = (1,2,3,4,5,6,7) ii) ji2 = (1,2, 3) o (4, 5, 6) iii) ji2 = (1,2,3,4) O 11.10. Určete znaménka daných permutací i) ii) 1 2 3 4 5 6... 3n-2 3n-l 3n 2 3 1 5 6 4 ... 3fi-l 3n 3n - 2 1 2 3 ... n n + 1 n + 2 ... 2n 2 4 6 ... 2n 1 3 ... 2n-\ Řešení. Znaménko permutace je dáno paritou počtu traspozic v rozkladu permutace, ekvivalentně také paritou počtu inverzí permutace, viz 2.15. Počet inverzí snadno spočítáme z dvojřádkového zápisu permutace. Procházíme postupně čísla ve druhém řádku a za každé připočteme počet čísel menších než právě vybrané ležících v řádku dále než právě vybrané. Dostáváme tak, že v prvním případě je permutace sudá (znaménko je 1), ve druhém případě závisí znaménko permutace na n aje rovno (—1) ?~. U 11.11. Určete všechny permutace p e §9 takové, že [p o (1, 2, 3)]2 o [p o (2, 3, 4)]2 = (1, 2, 3, 4). Řešení. Žádná taková neexistuje, na levé straně je totiž vždy sudá per- mutace, na pravé straně je permutace lichá. 11.12. Určete všechny permutace p e §9 takové, že p2 o (1, 2) o p2 = (1, 2) o p2 o (1, 2). □ tzv. paritu. Dokázali jsme si znovu tvrzení, kterájsmejiž využívali při studiu determinantů (viz 2.14 a dále): Věta. Každá permutace konečné množiny je složením cyklů. Cyklus délky í lze vyjádřit jako složení í — 1 transpozic. Parita cyklu délky í je (-lf-1. Parita složení permutací a o r je součinem parit a ar. Poslední tvrzení věty říká, že zobrazení sgn převádí složení permutací crorna součin sgn a ■ sgn r v komutativní grupě Z2. __J HOMOMORFISMY (POLO)GRUP j___ Obecně říkáme, že zobrazení / : G\ -» G2 je homomorfis-mus (polo)grup, jestliže respektuje grupové operace, tzn. f(a-b) = f(a)- f(b). Zejména tedy vidíme, že je naše právě zavedená signatura permutací homomorflsmem sgn : Sm -» Z2. 11.3. Symetrie rovinných útvarů. V páté části první kapitoly jsme podrobně a elementárně rozebrali souvislosti invertibilních matic se dvěma řádky a dvěma sloupci a lmeárními transformacemi v rovině. Viděli jsme přitom, že matice v Mat2 (M) zadávají lineární zob-^ ., razení R2 -» R2, která zachovávají standardní vzdálenosti, "p*~$! právě když jsou jejich sloupce ortonormální bází R2 (což rtóPl^ je jednoduchá podmínka na souřadnice matice, viz odsta-1 ífa 1 vec 1.29 na straně 31). Ve skutečnosti je snadné dokázat, že každé zobrazení roviny do sebe, které zachovává velikosti, je afinní euklidovské, tj. je složením lineárního a vhodné translace.2 Jak jsme již připomněli, lineární část takového zobrazení přitom musí navíc být ortogonální. Všechna taková zobrazení tedy tvoří grupu všech ortogonálních transformací (nebo také euklidovských transformací) v rovině. Navíc jsme ukazovali, že kromě translací Ta o vektor a jde pouze o rotace Rv o jakýkoliv úhel ^kolem počátku a zrcadlení Zi vůči jakékoliv přímce t procházející počátkem (povšimněme si, že středová souměrnost je totéž jako rotace o ti). Zastavíme se teď u ilustrace obecných grupových pojmů na problému symetrií rovinných obrazců. Budeme přitom uvažovat objekty typu dlaždiček. Nejprve jednotlivě, tj. ve formě ohraničeného obrázku v rovině, později ještě s požadavkem dláždění v rovinném pásu nebo v celé rovině. 11.13. Mějme permutaci a O '1 2 3 4 5 6 7\ K3 6 5 7 1 2 4}Urceterad a v grupě (§7, o), inverzi k a a určete a2013. Ukažte, že a nekomutuje s transpozicí t = (2, 3). Řešení, a = (1, 3, 5)o(2, 6)o(4, 7). Řád a je tedy 6, nejmeší společný násobek čísel 3, 2, 2. Dále a"1 = (1, 5, 3) o (2, 6) o (4, 7) a (ff335)6 off3 a3 = (2, 6) o (4, 7). Jestliže totiž má zobrazení F : R1 R1 zachovávat velikosti, totéž musí být pravda pro přenášené vektory rychlostí, tj. Jacobiho matice DF(x, y) musí být v každém bodě ortogonální. Rozepsání této podmínky pro dané zobrazení F — (f (x, y), g(x, y)) : R2 R2 vedena systém diferenciálních rovnic, který má pouze afinní řešení, protože snadno uvidíme, že všechny druhé derivace F musí být nulové (a pak už je naše tvrzení okamžitým důsledkem Taylorovy věty se zbytkem). Zkuste si promyslet detaily! Ve skutečnosti vede stejný postup k výsledku pro euklidovské prostory libovolné dimenze. Všimněte si přitom, že dokazovaná podmínka je nezávislá na volbě afinních souřadnic, proto se složením F s lineárním zobrazením výsledek nemění. Můžeme proto pro pevný bod (x, y) složit (DF)~} o F a bez újmy na obecnosti rovnou předpokládat, že DF(x, y) je matice identického zobrazení. Derivováním rovnic pak dostáváme důsledky, které přímo říkají požadované tvrzení. 645 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY DálecroT = (1,3,6, 2,5)o(4,7)aTocr = (1, 2, 6, 3, 5) o (4, 7). □ 11.14. Určete cr"1 a cr2013, kde . (I 2 3 4 5 6 7\ • (a) a = K 5 ? 6 1 2 3 1 v grupě permutaci (S7, o). • (b)cr = [4]„vgrupě(Z1x1,-). Řešení, (a) a = (1,4, 6, 2, 5) o (3, 7), cr-1 = (1,5, 2, 6,4) o (3, 7), řád cyklu (1, 4, 6, 2, 5) je pět, řád transpozice (3, 7), a protože jsou čísla 2 a 5 nesoudělná je řád a roven deseti, tedy cr10 = 1. Pak cr2013 = (cr1!))201 o cr3 = cr3 = (1, 2, 4, 5, 6) o (3, 7) (b) Místo třídy [k] n, k e Z, budeme psát pro zjednodušení zápisu pouze reprezentanta této třídy, tj. číslo k. Potom 45 = 1 (mod 1)1 => cr"1 = 44 = 3 (mod 1)1 „2013 _ /12013 _ 9 (mod 1)1. □ 11.15. Dokažte, že v každé grupě o sudém počtu prvků existuje prvek, který je sám sobě inverzním a přesto to není neutrální prvek. Řešení. Seřadme prvky dané grupy do dvojic, přičemž ve dvojici bude vždy prvek a jeho inverze. Sám potom zůstane neutrální prvek. To je však celkem lichý počet prvků. □ 11.16. Dokažte, že neexistuje čtyřprvková nekomutativní grupa. Řešení. Podle Lagrangeovy věty (viz 11.10) mohou být řády prvků, které nejsou neutrální, ve čtyřprvkové grupě pouze dva nebo čtyři. Pokud je v grupě prvek řádu čtyři, je tato grupa cyklická, tedy komutativní. Pokud grupa obsahuje kromě neutrálního prvku ještě tři prvky řádu dva, které jsou inverzní samy k sobě (říkejme samoinverzní), musí být součin libovolných dvou z nich roven třetímu (nemůže to být žádný z těch dvou, protože ani jeden není neutrálním prvkem, a nemůže to být neutrální prvek, protože inverze je určena jednoznačně a prvky jsou samoinverzní) a to bez ohledu na pořadí. Ukázali jsme dokonce, že existuje až na isomorfismus jediná čtyřprvková grupa taková, že řády jejích prvků jsou kromě neutrálního rovny dvěma. Této grupě se říká Kleinova grupa a je tedy izomorfní Z2 x Z2. □ 11.17. Ukažte, že neexistuje pětiprvková nekomutativní grupa. Řešení. Řád prvku, který není neutrální, může být podle Lagrangeovy věty (11.10) pouze pět, taková grupa je tudíž cyklická. □ Pro začátek uvažme třeba úsečku a rovnostranný trojúhelník. Ptáme se, jak moc jsou symetrické, tzn. vůči kterým transformacím (zachovávajícím velikost) jsou invariantní. Jinak řečeno chceme, aby obraz našeho obrazce byl od původního k nerozeznání, dokud si nepopíšeme nějaké význačné body, třeba vrcholy trojúhelníka A, B a C a konce úseček. Zároveň je předem jasné, že všechny symetrie pevně zvoleného útvaru budou vždy tvořit grupu (většinou pouze s jediným prvkem, identickým zobrazením). 1 ,P U úsečky je situace obzvlášť jednoduchá - na první pohled je zřejmé, že jedinými jejími netriviálními symetriemi jsou rotace o ti kolem středu úsečky, zrcadlení vůči ose této úsečky a zrcadlení vůči úsečce samotné. Všechny tyto symetrie jsou samy sobě inverzí. Celá grupa symetrií úsečky má tedy čtyři prvky. Její tabulka násobení vypadá takto: Ro Rit ZH Zy Ro Rn ZH Zv Ro Rn ZH Zv Rn Ro Zv ZH Zh Zv Ro Rn Zv ZH Rn Ro Je tedy celá tato grupa komutativní. Pro rovnostranný trojúhelník už symetrií nacházíme víc: můžeme rotovat o 2jt/3 nebo můžeme zrcadlit vůči osám stran. Abychom dostali grupu celou, musíme přidat všechna složení takovýchto transformací. Už v 1.29 jsme viděli, že složení dvou zrcadlení je vždy otočením. Zároveň je zřejmé, že složení takových zrcadlení v opačném pořadí dá otočení o stejný úhel, ale s opačnou orientací. V našem případě tedy zrcadlení kolem dvou různých os vygenerují postupnou opakovanou aplikací všechny symetrie, kterých bude dohromady šest. Jestliže si umístíme trojúhelník v souřadnicích jako na obrázku, bude našich šest transformací zadáno maticemi d = (i? _ l 2 VI 2 1 lä 2 VI 2 _ 1 2 _VI 2 _ 1 2 _ 1 2 2 1 k -h VI 2 _ 1 2 Sestavením tabulky pro násobení, tak jak jsme ji udělali pro grupu permutací S3 obdržíme právě stejný výsledek. Pro větší názornost jsou vrcholy označeny čísly, takže jsou příslušné permutace přímo čitelné. Obdobně umíme nacházet grupy symetrií s k různými rotacemi a k zrcadleními. Stačí si k tomu vzít pravidelný k -úhelník. Takové grupy symetrií se často označují jako grupy Di a říká se jim dihedrální grupy řádu k. Tyto grupy jsou nekomutativní pro všechna k > 3, zatímco £>2 je komutativní. Název je patrně odvozen od skutečnosti, že £>2 je grupa symetrií molekuly vodíku H2, ve které jsou dva atomy vodíku a geometricky si ji lze představit jako úsečku. 646 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Poznámka. Stejný argument ukazuje, že cyklické, tedy komutativní grupy, jsou i grupy o libovolném prvočíselném počtu prvků, zejména dvou a třípr vkové grupy. Jak j sme ukázali v 1111.1611, tak neexistuje ani čtyřprvková nekomutativní grupa. Nejmenší řád, který by nekomutativní grupa mohla mít je tedy řád šest. Jak jsme viděli v || 11.1 ||(vii) je tomu skutečně tak. 11.18. Dokažte, že každá grupa sestávající výhradně ze samoinverz-ních prvků je komutativní. Řešení. Nechť a, b e G. Potom ba, b, a jsou samoinverzní, tudíž ab = ab((ba)(ba)) = a(bb)aba = (aa)ba = ba. □ 11.19. Dokažte, že každá grupa řádu 6 je izomorfní buď grupě Z6 nebo §3. Řešení. Podle Lagrangeovy věty 11.10 je řád každého prvku takové grupy (různého od neutrálního) 2, 3 nebo 6. Pokud existuje prvek řádu 6, pak je grupa cyklická, tedy izomorfní grupě Z6. Nyní si uvědomme, že žádný prvek řádu tři není samoinverzní (pro a řádu tři je totiž a~l = a1, neboť a ■ a1 = a3 = 1). Pokud by grupa obsahovala pouze prvky řádu tři, tak bychom měli spor s tvrzením příkladu || 11.151| (v grupě o sudém počtu prvků bychom neměli kromě neutrálního prvku žádný jiný samoinverzní). Víme tedy, že grupa musí obsahovat aspoň jeden samoinverzní prvek (=řádu 2). Ukažme, že v grupě musí být též prvek řádu 3. Pro spor předpokládejme, že všechny prvky G jsou samoinverzní. Pak by G byla podle || 11.18|| komutativní. Uvažme dva různé prvky a, b různé odjednotkye. Stejně jako v ||11.16|| vidíme, že {e, a, b, ab] je čtyřprvková podmnožina G, ale protože G by byla komutativní, tato množina by byla uzavřená (na danou operaci). Byla by to tedy čtyřprvková pod-grupa G. To je však ve sporu Lagrangeovou větou (11.10). Nechť tedy a je prvek řádu 2 a b prvek řádu 3. Grupa tedy obsahuje různé prvky 1, a, b, b2 (a je řádu dva, b i b2 řádu tři, takže musí být různé. V grupě dále musí být prvky ab, ba, ab2, b2a, vzhledem k jednoznačnosti inverze opět žádný z nich nemůže být roven neutrálnímu prvku, dále pak ani žádnému z prvků a, b, b2. Protože grupa má šest prvků, tak množina [ab, ba, ab2, b2a] má pouze dva prvky. Pokud by se rovnaly prvky začínající stejným písmenkem, tak dospějeme ke sporu. Je tedy buď ab = ba, pak ale (ab)2 = a2b2 = b2 ý= 1 a (ab)3 = a3b3 = a ý= 1 a prvek ab má nutně řád vyšší než tři, což je spor s naším předpokladem. V tomto případě je tedy grupa cyklická a tudíž izomorfní Z6. Pokud ab = b2a, pak ba = a2b, jedná se o grupu symetrií rovnostranného trojúhelníka (a odpovídá některé z osových Stejně tak lze snadno najít obrazce, které mají pouze rotační symetrie a jde tedy o komutativní grupy, které se v chemii značí jako Čt. Říkáme jim cyklické grupy řádu k. K tomu postačí např. uvažovat pravidelný mnohoúhelník, u kterého nesymetricky, ale pořád stejně, pozměníme chování hran, viz čerchované rozšíření trojúhelníka na obrázku. Všimněme si, že grupu C2 lze realizovat dvěma způsoby - buďjedinou netriviální rotací o ti nebo jediným zrcadlením. Jako první ukázku síly našich abstraktních úvah dokážeme následující větu. Řekneme, že obrazec má diskrétní grupu symetrií, jestliže množina obrazů libovolného bodu při působení všemi prvky grupy je diskrétní podmnožinou v rovině (tj. všechny její body mají okolí, ve kterém už žádný další bod množiny není). Všimněme si, že každá diskrétní grupa symetrií ohraničeného obrazce je nutně konečná. Věta. Nechť je M ohraničená množina v rovině M.2 s diskrétní grupou symetrií G. Pak je grupa G buď triviální nebo jedna z grup Ck, Dk s k > 1. Důkaz. Kdyby nějaká množina M připouštěla jako svoji symetrii translaci, nemůže být ohraničená. Pokud by M připouštěla rotaci o úhel, jehož žádný celočíselný násobek není 2rt (tj. rotaci o iracionální násobek 2jt), pak bychom iteracemi této rotace obdrželi hustou podmnožinu obrazů na příslušné kružnici. Grupa symetrií by tedy nemohla být diskrétní. Pokud by M připouštěla netriviální rotace s různými středy, opět nemůže být ohraničená. Napíšeme-li totiž příslušné rotace v komplexní rovině jako R : z^ (z-a)ľ +a, ,2xi/k : m ZV — e2mll a libovolné pro komplexní jednotky f — e a 0 e C, pak okamžitě vidíme QoRoQ-loR-1 :zb+ z+ar](l-r), což je translace o netriviální vektor, pokud není úhel rotace Q nulový. Množina M by tedy nemohla být ohraničená. Totéž platí pro případ, že by existovala rotační symetrie a zrcadlení podél přímky, která neprochází středem rotace. Máme tedy k dispozici pouze rotace se společným středem a zrcadlení podél přímek tímto středem procházejících. Zbývá tedy dokázat, že je celá grupa složena vždy buď pouze z rotací nebo vždy ze stejného počtu rotací a zrcadlení. Připomeňme, že vždy složením dvou různých zrcadlení dostáváme rotaci o úhel rovný polovině úhlu svíraného osami zrcadlení (viz I. 29). Proto je i naopak složením zrcadlení podle přímky p srotací o úhel

H mezi dvěma grupami G a H se nazývá homomorfismus grup, jestliže respektuje iÉSríjB násobení, tj. pro všechny prvky a, b e G platí f(a ■ b) — f (a) ■ f (b). Povšimněme si, že násobení vlevo je uvnitř grupy G předtím, než zobrazujeme, zatímco vpravo jde o násobení v H poté, co zobrazujeme. Přímo z definice se snadno ověří následující vlastnosti homo-morfismů: Tvrzení. Pro každý homomorfismus f : G (1) obraz jednotky e e G je jednotka v H, H grup platí 648 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.22. Označme ftC„(K) množinu všech regulárních čtvercových matic s reálnými koeficienty. Dokažte, že G = ftC2(K) tvoří grupu a rozhodněte, zda množina H tvoří podgrupu grupy G: i) H = SC2(Q), ii) H = OC2(Z), iii) H = {A e OC2(Z) | \A\ = 1}, iv) H = í f ľ u I I a' b e v) Í7 = vi) H -- vii) Í7 = viň) H -- 0 a fl b 0 a 1 a b b a 0 a c a b c | a e Z I a, ž> e Q I a, b, c e \ a,b,c € 11.23. i) Rozhodněte, zda množina // podgrupu grupy (K*, •) ii) Rozhodněte, zda množina H podgrupu grupy (K, +) O [a e K* | a2 e Q} tvoří [a e K | a2 e Q} tvoří O ii.24. Najděte přirozené číslo m různé od pěti tak, aby byla grupa Z* izomorfní s Z? O 11.25. Kolik existuje v §„ cyklů délky p (1 < p < n)? Řešení. Prvky, které se v cyklu „motajř', můžeme vybrat (™) možnostmi. Z vybraných p prvků potom jeden pevně vybereme (pokud permutujeme čísla, řekněme, že vybereme nejmenší číslo) a to se může v cyklu zobrazit na libovolný z p — l zbývajících prvků. Tento obraz se pak může zobrazit lna p — 2 prvků atd. Podle pravidla součinu tak celkem máme (p — 1)! různých cyklů. Výběrem úvodního čísla nezatěžujeme naše úvahy žádným dodatečným omezením, neboť pevně vybraný prvek se musí v každém cyklu někam zobrazit. □ 11.26. Nechť G je množina reálných matic majících nuly nad diagonálou a jedničky na diagonále. Dokažte, že G spolu s maticovým násobením tvoří grupu, tj. podgrupu v GC(3, K) a určete centrum G. Centrum grupy G je podgrupa Z(G) = [z e G | Vg e G : zg = gz}. Řešení. Buď můžeme ověřit všechny definiční vlastnosti grupy, nebo využijeme známého faktu, že GC(3, K) je grupa a ověříme pouze (2) obraz inverze k prvku je inverzí obrazu, tj. f(a-h) = f(a)-\ (3) obraz podgrupy K c G je podgrupa f (K) c H, (4) vzorem f~l (K) c G podgrupy K c H je podgrupa, (5) je-li f zároveň bijekcí, pak i inverzní zobrazení f~l je homo-morfismus, (6) f je injektivní zobrazení, právě když f~l(e) — {e}. Důkaz. Je-li K c G podgrupa, pak pro každé dva prvky y = f (a), z = f (b) v H nutné také y ■ z — f (a ■ b) patří do obrazu. Je proto vždy obrazem podgrupy opět podpologrupa (tj. bude to podgrupa, pokud obraz nutně obsahuje i inverze a jednotku). Speciálně triviálni podgrupa {e} má za obraz opět podpolo-grupu. Protože z rovnosti z ■ z — z v grupě H vynásobením prvkem z~l dostáváme z — e, ověřili jsme, že jedinou jednoprvkovou podpologrupou v grupě je triviálni podgrupa {e}. Zejména tedy f(e) = e. Přímo z definice homomorfismu nyní vidíme, že f (a-1) ■ f (a) = f (e) = e, tj. /(a)-1 — f (a Dokázali jsme tedy první tři tvrzení. Stejně postupujeme u vzorů: jestliže a, b e G splňují f (a), f(b)eKCH, potom také f (a ■ b) e K. Předpokládejme, že existuje inverzní zobrazení g — f~l a zvolme libovolné y = f (a), z = f(b) e H. Pak f (a ■ b) = — y - z — f (a) ■ f (b), což je ekvivalentní výrazu g (y) ■ g(z) = — a ■ b — g(y ■ z). Je tedy inverze skutečně homomorfismem. Pokud platí f (a) = f (b), pak f (a ■ b~l) — e e H. Pokud je tedy jediným vzorem jednotky v H jednotka v G, pak a ■ b~l — e, tj. a = b. Opačná implikace je zřejmá. □ Podgrupa /_1 (e) jednotkového prvku e e H se nazývá jádro homomorfismu / a značíme ji ker /. Bijektivní homomorfismus grup nazýváme izomorfismus. Z předchozích tvrzení okamžitě vyplývá, že homomorfismus / : G —> H striviálnímjádremjeizomorfismemnaobraz f (G). 11.6. Příklady. Grupy zbytkových tříd TLi jsou izomorfní grupám „ komplexních &-tých odmocnin z jedničky, což jsou zároveň izomorfní obrazy konečných grup otočení i:Z- v rovině o celé násobky úhlu 2n/k. Nakreslete si obrázek, počítání s tzv. komplexními jednotkami e2m^k je velmi efektivní. Zobrazení exp : R —> R+ je izomorfismus aditivní grupy reálných čísel na multiplikativní grupu kladných reálných čísel. Tento izomorfismus se přirozeně rozšiřuje na morfismus exp : C —> C \ 0 aditivní grupy komplexních čísel na multiplikativní grupu všech nenulových komplexních čísel. Pro komplexní čísla přitom ale dostáváme netriviální jádro. Viděli jsme totiž, že zúžení exp na ryze imaginární čísla (což je podgrupa izomorfní R) je homomorfismem it \-> e — cosř - ! sinř, tzn. že čísla Ikiii, k e Z, jsou v jádru. Snadno se dopočítá, že je to celé jádro. Je-li totiž es+" = es • e" = 1 pro reálná s a t, musí být es — 1, tj. s — 0, a pak zbývá pouze t — Ikn pro libovolné celé k. Determinant matice je zobrazením, které každé matici skalárů z K přiřazuje nějaký skalár v K (pracovali jsme s K = Z, Q, R, C). 649 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY uzavřenost množiny G vzhledem k násobení a braní inverze. Neutrální prvek, tedy jednotková matice, totiž do G z definice patří. /I 0 0\ /l 0 0\ / 1 0 0\ a 1 0 ai 10= a + fli 1 0 ] e G, \b c l) \bi ci l) \b + ca\ + b\ c + cx l) -i / Z tvaru součinu prvků v G plyne, že centrum je tvořeno prvky /l 0 0\ Z(G) =0 1 0 . \b 0 1/ Cauchyova věta o determinantu součinu čtvercových matic det(A • B) = (det A) • (det B) je tedy tvrzením, že pro grupu G = GL(n,K) invertibilních matic je det : G -» K \ 0 homomorflsmem grup. 11.7. Součin grup. Jestliže máme k dispozici dvě grupy, můžeme snadno vytvořit složitější grupu následující konstrukcí: [ Součin grup |_„ □ 11.27. Pro libovolnou podmnožinu Z c G definujeme její centrali- zér C g (X) = [y € G \ xy = yx, pro všechna x e X}. Dokažte, že pokud Z c y,pakCG(Y) c Cg(X). Dále dokažte, že X c CG(CG(X)) ažeCG(X) = CG(CG(CG(X))). Řešení. První tvrzení je zřejmé - prvky G, které komutují se všemi prvky Y komutují zejména se všemi prvky z X. Z definice je Cg(Cg(X)) = {y € G \ xy = yx,Vx € CG(Z)} a to splňují zejména prvky y e Z. Poslední tvrzení dostaneme jednoduše aplikací předchozích dvou. Dosazením X := CG(Z) do druhého máme Cg(X) c Cg(Cg(Cg(X))) a aplikováním prvního tvrzení na druhé máme CG(X) d CG(CG(CG(Z))). □ 11.28. Předpokládejme, že grupa G má netriviální podgrupu H, která je obsažena v každé jiné netriviální podgrupě G. Dokažte, že H je obsažena v centru G. Řešení. Pro každé g e G je centralizér Cc(g) = {x € G \ xg = gx) netriviální podgrupa, protože g e CG(g) a CG(e) = G. Grupa H je tedy obsažena v každém CG(g). Tím pádem je obsažena i v jejich průniku, kterým je podle definice právě centrum. □ 11.29. Nechť je G konečná grupa. Třída konjugace pro a e G je množina tvaru Cl{a) = [xax~l | x € G}. Dokažte, že i) množina všech tříd konjugace prvků v G tvoří rozklad G, ii) počet prvků v třídě konjugace dělí řád grupy G, iii) pokud má G pouze dvě třídy konjugace, pak je její řád 2. Řešení, (i) Stačí ukázat, že pro dva prvky a, b e G je buď Cl(a) = Cl(b), nebo Cl(a) n Cl(b) = 0. Mají-li však Cl(a) a Cl(b) neprázdný průnik, pak z definice existují x, y e G tak, že xax~l = yby^1, tedy vynásobením rovnosti prvkem y^1 zleva a prvkem y zprava obdržíme y~lxax~l y = b, ovšem (y~lx)~l = x~l y, Pro každé dvě grupy G, H definujeme součin grup G x H takto: Jako množina je G x H skutečně součin a násobení definujeme po složkách, tj. (a, x) ■ (b, y) = (a ■ b,x ■ y), kde nalevo vystupuje součin, který definujeme, zatímco napravo používáme tečku k naznačení součinů v jednotlivých grupách G a H. Projekce na jednotlivé komponenty G a H v součinu: pg : G x H 3 (a, b) t-> a e G, pn : G x H 3 (a, b) t-> b jsou surjektivní homomorfismy grup s jádry kerpG = {(eG, b); b e H] ~ H, kerph = {(a, en); a e G) — G. Grupa TL(, je izomorfní součinu TL2 x Z3. Docela snadno můžeme toto tvrzení vidět při multiplikativní realizaci grup zbytkových tříd Zi jakožto komplexních &-tých odmocnin z jedničky. Skutečně tak vidíme, že Zô je tvořeno body na jednotkové kružnici v komplexní rovině ve vrcholech pravidelného šestiúhelníka. Z2 pak odpovídá ±1, Z3 pravidelnému trojúhelníku s jedním vrcholem v jedničce. Jestliže budeme ztotožňovat příslušné body s otočeními v rovině, které jedničku převede právě do nich, pak skládání dvou takových otočení bude vždy komutativní a kombinacemi jednoho otočení ze Z2 a jednoho ze Z3 dostaneme právě všechna otočení ze 1$,. Nakreslete si obrázek! Takto tedy dostaneme (při obvyklejší aditivní notaci pro zbytkové třídy) izomorfis-mus: [0]6 h> «0]2, [0]3), [1]6 h> «1]2, [2]3), [2]6 h> «0]2, [1]3), [3]6 h> «1]2, [0]3), [4]6 h> ([0]2, [2]3), [5]6 h> ([1]2,[1]3). Vzápětí uvidíme, že jsou podobné konstrukce k dispozici pro konečné komutativní grupy úplně obecně. 11.8. Komutativní grupy. Libovolný prvek a v grupě G je obsažen v minimální podgrupě ., a"2, aTl, e, a, a1, a3, ...), která jej obsahuje. Je zjevné, že je tato podgrupa komutativní, a pokud je celá grupa G konečná, nutně musí jednou nastat případ ak = e. Nejmenší k s touto vlastností nazýváme řád prvku a v G. Grupa G je cyklická grupa, je-li celé G generované nějakým svým prvkem a výše uvedeným způsobem. Pokud je řád k generátoru grupy konečný, jde právě o grupy Ci z naší diskuse symetrií obrazců v rovině. 650 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY tedy b je tvaru zaz^1 pro z = y~l x, tudíž je prvkem Cl(a). Ze symetrie je i a e Cl(b), a tak se obě třídy konjugace rovnají. (ii) Všiměme si, že prvky v Cl(a) jsou v jednoznačné korespondenci s třídami rozkladu určeného centralizérem Cg (a) = [x e G I xax~l = a). Skutečně, pro prvky bac ležící ve stejné třídě rozkladu (tj. splňující b = cz pro nějaké z e Cc(a)) platí „-i bab 1 — cza(cz) 1 = czaz lc 1 = czz lac 1 Podle věty 9.10 je \G\ = \CG(a)\ ■ \G/CG(a)\ a tedy \Cl(a)\ = = |G/CG(a)I dělí |G|. (iii) Neutrální prvek tvoří vždy samostatnou třídu konjugace Cl(e) = {e}. Mají-li tedy existovat pouze dvě třídy, pak nutně musí být všechny ostatní prvky a ^ e v jedné třídě. Ta má zjevně | G\ — 1 prvků a podle předchozího musí | G \ — 1 dělit | G \, tj. | G | = 2. □ 11.30. Nechť prvky a, b komutativní grupy G mají nesoudělné řády r, s. Ukažte, že řád prvku ab jers. Řešení. Víme, že (ab)" = a"brs = (ďfiby = éé = e, takže řád ab je nejvýše rs. Kdyby (aby = e pro nějaké q < rs, pak vzhledem k nesoudělnosti ras nedělí jedno z těchto čísel číslo q. Bez újmy na obecnosti předpokládejme, že je to r. Pak e = é = ((aby Y = (ab)qs = aqsbqs = aqs. Řád prvku a musí tedy dělit qs. Ale r je nesoudělné s q, musí tedy dělit q. Spor. □ 11.31. Dokažte, že každá konečná grupa G řádu většího jak 2 má netriviální automorfismus. Řešení. Pokud G není komutativní a prvek a není z centra, pak konjugace x i-> axa^1 zadává netriviální automorfismus. Pro cyklickou grupu řádu m máme pro n nesoudělné s m automorfismus x h-» x". Jeli G komutativní, pak podle věty v 9.8 je součinem cyklických grup. V případě, že řád aspoň jednoho z faktorů je větší než 2, můžeme použít předchozí automorfismus pro cyklické grupy. Pokud je řád všech faktorů 2, pak je automorfismem permutace libovolných dvou faktorů. □ 11.32. Nechť (Q, +) je grupa racionálních čísel se sčítáním a nechť (Q+> ) je grupa kladných racionálních čísel s násobením. Určete všechny homomorfismy (Q, +) —► (Q+, •). Řešení. Jediný takový je triviální homomorfismus. Předpokládejme, že by existoval netriviální homomorfismus Cp x Cq vztahem f(ak) = (bk,ck). Protože platí ak ■ a1 = ak+l a podobně pro b a c, dostáváme f(ak ■ a1) = (bk+l, ck+l) = (bk, ck) ■ (bl, cl), a jde tedy o homomorfismus. Jestliže je obrazem jednotka, pak k musí být zároveň násobkem p iq. Protože jsou p aq nesoudělné, znamená to, že je k i násobkem n a je proto / injektivní. Přitom zřejmě mají grupy C„ i Cp x Cq stejně prvků, takže jde o izomor-fismus. Odtud již vyplývá tvrzení věty o rozkladu cyklických grup řádu k na součiny menších cyklických grup. □ Všimněme si, že naopak Cpi nikdy není izomorfní součinu CpxCp. Zatímco Cpi je totiž generované prvkem řádu p1, nej větší dostupný řád prvku v Cp x Cp je jenom p. Vzhledem k tomu, že všechny konečné komutativní grupy jsou izomorfní součinu cyklických grup, můžeme pro malé počty prvků najít všechny takové grupy až na izomorfismus. Např. máme jen dvě grupy s 12 prvky Cn = C4 x C3, C2xC2xC3 = C2x C6. Podobně si můžeme povšimnout, že mají-li všechny prvky v grupě G kromě jednotky řád 2, pak jde o grupu (C2)n pro nějaké n, zejména tedy má 2™ prvků. Skutečně kdybychom totiž v rozkladu G na součin cyklických grup povolili Cp s p > 2, pak by tam nutně musely vzniknout prvky vyššího řádu. 11.9. Rozklady podle podgrup. Volbou libovolné podgrupy bí' H v grupě G dostáváme další informace o struktuře celé grupy. Na množině prvků grupy G nyní definujeme relaci i a ~n b, jestliže b~l ■ a e H. Tato relace vystihuje, kdy jsou prvky v G „stejné", až na násobení něčím z H zprava. Snadno ověříme, že je takto definovaná relace ekvivalence: Platí úT e H, je tedy relace reflexivní. Je-li b ■ a = h e H, potom a ■ b = (b je proto relace symetrická. Konečně je-li ay1 = h~l e H, b e H a zároveň je ■ a e H, ověřili jsme b~ ■ a e H, potom č~ • a = č~ -b tedy i tranzitivitu. Celá grupa G se proto jako množina rozpadá na tzv. levé třídy rozkladu podle podgrupy H vzájemně ekvivalentních prvků. Třídu 651 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY b = (p(a) = íp(n^) = 0 a Ař je množina matic tvaru ^ ^, kde b e M.. Ukažte, že N je normální podgrupa G a dokažte, že G/N je izomorfní K. Řešení. Klíčem k důkazu je formule pro násobení v G: (a 0\/fli 0 \ _ / aa\ 0 b a Z této formule je vidět, že zobrazení a 0 b a~ a je homomorŕis- mus, jehož jádro je N. N je tedy normální podgrupa G. Navíc G/N je izomorfní K+, což je izomorfní aditivní grupě K. □ 11.34. Nechť G je grupa řádu 14, která má normální podgrupu řádu 2. Dokažte, že G je komutativní. Řešení. Označme danou normálni podgrupu N. Pak G/N je grupa a její řád je \ G/N\ = j^l = 7. Podle Lagrangeovy věty 11.10 je řád každého jejího prvku buď 1 nebo 7. To ovšem znamená, že řád aspoň jednoho prvku je 7 a tedy že G/N je cyklická. Nechť N = {e, n], kde e je neutrální prvek G a generátor grupy G/N je [a]. Protože N je normální, je ana~l e N, ale protože ana~l = e => n = e, musí být ana~l = n, tedy na = an. Protože [a] generuje G/N, je každý prvek G/N tvaru [a]k, k = 0,... ,6, tedy [ak]. Každý prvek G je tak tvaru ak, nebo akn, a protože prvky a an spolu komutují, komutují spolu libovolné prvky G. □ 11.35. Rozhodněte, o platnosti tvrzení: Je-li faktorgrupa G/N komutativní a N normální, pak je G je rovněž komutativní. O 11.36. Dokažte, že libovolná podgrupa G grupy permutací §„ obsahuje buď pouze sudé permutace, nebo stejný počet sudých a lichých permutací. Řešení. Uvažme homomorŕismus p : G —► Z2 přiřazující každé permutaci její paritu. Potom p_1(0) = Kei(p) je normálni podgrupa G: nechť A e Ker(/?),pak Pighg'1) = P(g)p(h)p(g^) = p(g)p(g^) = pigg'1) = = P(e) = 0, což znamená, že ghg~l e Kei(p), tedy Kei(p) je normálni. Z2 má pouze dva prvky, takže G/ Kei(p) je buď jednoprvková (im(p) = 0), nebo má dvě a to stejně početné třídy rozkladu, tedy G je tvořena buď samými sudými pertmutacemi, nebo lichých (p-1 (1)) a sudých permutací musí být v G stejně. □ příslušející prvku a značíme a ■ H a skutečně platí, že a-H = {a-h; h e H}, neboť prvek b jeve stejné třídě s a, právě když jde takovýmto způsobem vyjádřit. Množinu všech levých tříd rozkladu podle podgrupy H označujeme G/H. Obdobně definujeme pravé třídy rozkladu H-a. Příslušná ekvivalence je: a ~ b, jestliže a ■ b~l e H. Proto H \ G — {H ■ a; a e G}. Tvrzení. Pro třídy rozkladu grupy G podle podgrupy H platí: (1) Levé a pravé třídy rozkladu podle podgrupy H c G splývají, právě když pro každé a e G, h e H platí a - h- a~l e H. (2) Všechny třídy (levé i pravé) mají shodnou mohutnost s pod-grupou H. Důkaz. Obě vlastnosti vyplývají bezprostředně z definičních vlastností. V prvém případě chceme, aby pro jakékoliv a e G, h e H platilo h ■ a — a ■ h! pro vhodné h! e H. To ale nastane právě tehdy, když a-1 ■ h ■ a — h' e H. Ve druhém případě si stačí uvědomit, že pokud a ■ h — a ■ h', pak také vynásobením a-1 zleva obdržíme h — h'. □ Jako okamžitý důsledek předchozího jednoduchého tvrzení dostáváme: 11.10. Věta. Nechť G je konečná grupa s n prvky, H její podgrupa. Potom (1) mohutnost n — \G\je součinem mohutnosti H a mohutnosti G/H, tj. \G\ = \G/H\-\H\, (2) přirozené číslo \H\je dělitelem čísla n, (3) je-li a e G prvek řádu k, pak k dělí n, (4) pro každé a e G je a" = e, (5) je-li mohutnost grupy G prvočíslo, pak je G izomorfní cyklické grupě Z„. Druhému tvrzení se říkává Lagrangeova věta, předposlednímu malá Fermatova věta. Důkaz. Viděli jsme, že každá třída levého rozkladu má právě | H | prvků. Přitom dvě různé třídy rozkladu musí mít nutně prázdný průnik. Odtud vyplývá první tvrzení. Druhé tvrzení je okamžitým důsledkem prvního. Každý prvek a e G generuje cyklickou podgrupu {a, a1, ... ,ak — e} a právě počet prvků této podgrupy je řádem prvku a. Proto musí řád dělit počet prvků v G. Jelikož je řád k prvku a dělitelem čísla n a ak — e, je také a" — (ak)s — e pro nějaké s. Jestliže je n > 1, pak existuje prvek a e G různý od jednotky e. Jeho řád je přirozené číslo k různé od jedničky a nutně dělí n. Proto musí být k rovno n. Pak ovšem jsou všechny prvky G tvaru ak pro k — 1, ... ,n. □ S Lagrangeovou i malou Fermatovou větou se čtenář již mohl potkat v desáté kapitole, kde byly speciální případy dokázány pro speciální případy v jiném kontextu. 652 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.37. Popište grupu symetrií tetraedru (pravidelného čtyřstěnu) a nalezněte všechny její podgrupy. Řešení. Označme vrcholy tetraedru a, b, c, d. Každou symetrii lze popsat permutací vrcholu (který vrchol přejde na který). Je tedy grupa symetrií tetraedru izomorfní jisté podgrupě grupy §4. Pro libovolnou dvojici vrcholu tetraedru existuje vhodná symetrie, která vymění právě tuto dvojici (je to zrcadlení podle roviny kolmé na hranu určenou těmito vrcholy, která prochází středem této hrany). Hledaná podgrupa je tedy generovaná všemi transpozicemi v grupě §4. To je však grupa §4 samotná. Popišme tedy všechny podgrupy grupy §4. Tato grupa má 24 prvků, do úvahy tedy přicházejí podgrupy o počtu prvků 1, 2, 3, 4, 6, 8, 12, 24. (viz 11.10). Rozebereme postupně všechny netriviální možnosti počtu prvků podgrupy H c §4. (i) \H\ = 2. H musí sestávat z neutrálního prvku a nějakého samoinverzního prvku (a2 = id). Samoinverzní prvky jsou trans-pozice nebo složení dvou disjunktních transpozic (geometricky toto zobrazení odpovídá otáčení o 180° okolo osy procházející středy protilehlých hran tetraedru). Dostáváme tak devět pod-grup: {id, (a, b)}, {id, (a, c)}, {id, (a, d)}, {id, (b, c)}, {id, (b, ď)}, {id, (c, ď}}, {id, (a, b) o(c, ď}}, {id, (a, c) o (b, ď}}, {id, (a, d)o (b, c)}. (ii) \H\ = 3. Taková podgrupa musí být podle Lagrange-ovy věty nutně cyklická, musí tedy jít o grupu tvaru {id, p, p2}, p3 = id. Rozklad p na nazávislé cykly tedy nutně obsahuje pouze cyklus délky tři, je tedy p právě tento cyklus. Cyklů délky tři je podle ||11.25|| 4 • 2 a ty vytvoří společně s identitou čtyři podgrupy: {id, (a, b, c), (a, c, b)}, {id, (a, c, ď), (a, d, c)}, {id, (a, b, ď), (a, d, b)}, {id, (b, c, ď), (b, d, c)}. Dodejme, že cyklus délky tři geometricky odpovídá rotaci o 120° okolo osy procházející jedním z vrcholů a středem (těžištěm) protější stěny. (iii) IHI = 4. V úvahu připadá pouze cyklická grupa izomorfní Z4 nebo grupa izomorfní Z2 x Z2. Uvážíme-li rozklad permutace na nezávislé cykly, tak zjišťujeme, že jedinou permutací na čtyřech prvcích, která má řád 4, je cyklus na čtyřech prvcích. Cyklické grupy musí tedy obsahovat cyklus délky čtyři. A to právě dva, neboť je-li p prvek řádu 4, pak i p~x = p3 je prvek řádu 4, tedy cyklus délky 4. Permutace p2 je pak prvek řádu 2, a musí to být složení dvou nezávislých transpozic (p2 nemá pevných bodů). Cyklů délky 4 je šest (viz ||11.25||). Vždy dva spadnou do jedné podgrupy, dostáváme tedy tři čtyřprvkové podgrupy tohoto typu: {id, (a, b, c, d), (a, c) o (b, d), (a, d, c, b)}, 11.11. Normální podgrupy a faktorgrupy. Podgrupy H, pro f"' v které platí, že a ■ h- a-1 e H pro všechny a e G, S? 6 77, se nazývají normální podgrupy. "\/ff^ Pro normální podgrupy je dobře definováno ná- _jáal— sobení na G/77 vztahem (a-H)-(b-H) = (a-b)- H. Skutečně volbou jiných reprezentantů a ■ h,b ■ h' dostaneme opět stejný výsledek (a -h-b -h') ■ H = ((a -b) ■ (b~l ■ h ■ b) ■ h') ■ H = (a ■ b) ■ H. Totéž si můžeme odůvodnit tak, že nezáleží na tom, jestli pracujeme s pravými nebo levými třídami. Můžeme proto rovnou naše třídy psát jako H a-H a potom snadno definujeme (H-a)-(b-H) = = H -(a-b)-H. Zřejmě jsou splněny pro nové násobení na G / 77 všechny vlastnosti grupy: jednotkou je sama grupa H jakožto třída e H jednotky, inverzí k a ■ H je zřejmě a-1 Ha asociativita násobení je zřejmá z definice. Hovoříme o faktorové grupě G/H grupy G podle normální podgrupy H. V komutativních grupách jsou samozřejmě všechny podgrupy normální. Podmnožina nTL — {na; a e Z) c Z zadává v celých číslech podgrupu a její faktorgrupou je právě (aditivní) grupa zbytkových tříd Z„. Z definice je zřejmé, že všechna jádra homomorfismů jsou normální podgrupy. Naopak jestliže je podgrupa H c G normální, pak zobrazení p:G-> G/H, a t-> a ■ H je surjektivní homomorfismus grup s jádrem H. Skutečně p je dobře definované. Přímo z definice násobení na G/H je vidět, že p je homomorfismus a p je zjevně surjektivní. Je tedy vidět, že normální podgrupy jsou právě všechna jádra homomorfismů. Dále pro libovolný homomorfismus grup / : G —> K s jádrem H = ker / je dobře definován také homomorfismus / : G/ker / -> K, f (a ■ H) = f (a), který je injektivní. Zdánlivě paradoxní j e příklad homomorfismů grup C* —> C*, který je definovaný na nenulových komplexních číslech vztahem z <-> zk s přirozeným k. Zjevně jde o surjektivní homomorfismus a jeho jádro je množina &-tých odmocnin z jedničky, tj. cyklická podgrupa Zj. Předchozí úvaha tedy dává pro všechna přirozená k izomorfismus / : C*/Zt -> C*. Tento příklad ukazuje, že u nekonečných grup nejsou počty s mohutnostmi tak přehledné, jako tomu bylo u konečných grup ve Větě 11.10. 11.12. Exaktní posloupnosti. Kdykoliv zvolíme normální podgrupu H v grupě G, dostáváme tzv. krátkou exaktní posloupnost grup e -» H -» G -» G/H -» e, kde šipky postupně znázorňují jediný homomorfismus triviální grupy {e} do grupy H, vložení 1 podgrupy H c G, projekci v na faktorgrupu G/Ha konečně jediný homomorfismus grupy G/H 653 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY {id, (a, c, b, d), (a, b) o (b, d), (a, d, b, c)}, {id, (a, b, d, c), (a, d) o (bc), (a, c, d, b)}. Co se týče podgrup izomorfních Z2 x Z2, tak prvky řádu dva jsou v §4 dvojího typu: buďtranspozice, nebo složení dvou nezávislých (disjunktních) transpozic. V podgrupě nemohou být dvě závislé transpo-zice: složením dvou závislých transpozic dostaneme cyklus délky tři, tedy prvek řádu tři. Pouze jedna transpozice nemůže být v podgrupě taktéž (diskusi přenecháváme čtenáři). Tudíž transpozice mohou být v podgrupě buď dvě nezávislé nebo žádná. Dostáváme tak tři pod-grupy složené mimo indentity ze dvou disjunktních transpozic a permutace dané jejich složením. Snadno ověříme, že též tři permutace, které jsou složením nezávislých transpozic, také tvoří společně s identitou grupu. Celkem dostáváme: {id, (a, b), (a, b) o (c,d),(c,d)}, {id, (a, c), (a, c) o (b, d), (b, d)}, {id, (a, d), (a, d) o (b, c), (b, c)} a {id, (a, b) o (c, d), (a, c) o (b, d), (a, d) o (b, c)}. (iv) \H\ = 6. Podle příkladu ||11.19||) a tomu, že řád libovolné permutace na čtyřech prvcích je maximálně 4, se jedná o podrupu izomorfní grupě §3 permutací tří prvků. Dostáváme tak čtyři podgrupy. (v) \ H\ = 8. Grupa nemůže být podgrupu grupy sudých permutací (těch je 12aosm nedělí 12. Tedy podle ||11.36||, musí obsahovat čtyři sudé a čtyři liché permutace. Sudé permutace musí tvořit podgrupu grupy sudých permutací, tedy i podgrupu §12 a v bodě (111) jsme viděli, že jedinou čtyřprvkovou podgrupou pouze sudých permutací je podgrupa {id, (a, b)o(c, d), (a, c)o(b, d), (a, d)o(b, c)}, kterájenor-mální. Pokud pro libovolnou lichou permutaci uvážíme třídu rozkladu odpovídající této permutaci v rozkladu podle zmíněné normální podgrupě, tak tato třída má čtyři prvky a společně s uvedenou normální podgrupou tvoří podgrupu §4. Dostáváme tak tři podgrupy §4. Není těžké si rozmyslet, že každá z nich je izomorfní grupě symetrií čtverce (tzv. dihedrální grupě D4). Geometricky si ji popíšeme následovně. Uvážíme kolmý průmět čtyřstěnu do rovniny kolmé na přímku procházející středy protějších hran. Hranice průmětu je čtverec. Ze symetrií čtyřstěnu vezmeme pouze ty, které indukují skutečnou symetrii tohoto čtverce (například symetrie zaměňující pouze dva v průmětu sousední vrcholy čtyřstěnu, tedy transpozice, to nebude). Dvojice protějších hran jsou v tetraedru tři, dostáváme tedy tři různé osmiprvkové podgrupy isomorfní dihedrální grupě D4. (vi) \H\ = 12. Taková podgrupa musí obsahovat podle ||11.36|| buďpouze sudé permutace, nebo šest lichých a šest sudých permutací (ty pak musí tvořit podgrupu §4. V bodě (iv) jsme ovšem viděli, že šestiprvková podgrupa §4 složená pouze ze sudých permutací neexistuje. Jedinou podgrupou o tomto počtu prvků je tak alternující grupa A4 všech sudých permutací v §4. Geometricky na triviální grupu { S, které splňuje (p(a ■ b, x) = (p(a, (p(b, x)), odtud název „levá akce". Často budeme k vyjádření akce prvku grupy na prvku 5 používat pouze zápis a ■ x (byť jde o jinou tečku než u násobení uvnitř grup). Definiční vlastnost pak vypadá takto: (a ■ b) ■ x = a ■ (b ■ x). 654 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY se jedná o přímé symetrie, tedy ty, které můžeme dosáhnout pouze rotacemi čtyřstěnu (tedy nikoliv zrcadleními). □ Poznámka. Obecně je grupa symetrií nějakého tělesa o n vrcholech podgrupou grupy §„ permutací n prvků. 11.38. Které z podgrup grupy §4 jsou normální? Řešení. Aby byla podgrupa H c §4 normální, musí být gHg~l c H pro libovolné g e §4. Vzhledem k tomu, že každou permutaci lze napsat jako složení transpozic a inverzi pak můžeme získat pouze zapsáním permutací z rozkladu v opačném pořadí, stačí danou vlastnost ověřit pouze pro transpozice g. Toto ověření necháváme na čtenáři. Zjišťujeme tak, že jedinými normálními podgrupami jsou: triviální grupa, celá grupa §4, alternující grupa, tj. grupa všech sudých permutací v §4 a čtyřprvková podgrupa s prvky řádu dva, tzv. Kleinova grupa, se kterou jsme se setkali již v ||11.16||. □ 11.41. Rozhodněte, zda jsou podgrupy generované • cyklem (1, 2, 3) v §3, • cyklem (1,2, 3,4) v §4, • cyklem (1, 2, 3) v A4 normální. V posledním případě určete pravé třídy rozkladu A4 podle uvažované podgrupy. Určete, kdy je podmnožina všech cyklů délky n podgrupou grupy §„ (pro n > 3. Ukažte, že se pak jedná o normální podgrupu. Řešení. • Jde o normální podgrupu A3. Obraz prvku x e S v akci celé grupy G nazýváme orbita Sx prvku x, tj. Sx = {y = (pia,x); a e G). Pro každý bod x e S definujeme izotropní podgrupu Gx c G akce Gy. Snadno se vidí, že u tranzitivních akcí je celý prostor jedinou orbitou a všechny izotropní podgrupy mají stejnou mohutnost. Jako příklad tranzitivní akce konečné grupy můžeme uvést např. zjevnou akci grupy permutací pevně zvolené množiny X na samotné množině X. Přirozená akce všech invertibilních lineárních transformací na nenulových prvcích vektorového prostoru V je také tranzitivní. Pokud vezmeme ale prostor V celýjenulový vektor zvláštní orbitou. Výše uváděný příklad akce aditivní grupy reálných čísel prostřednictvím rotací kolem pevného středu O v rovině není tranzitivní. Orbity jednotlivých bodů jsou právě kružnice se středem O procházející těmito body. Typický příklad tranzitivní akce grupy G je přirozená akce na množině levých tříd G/H pro jakoukoliv podgrupu H. Definujeme ji vztahem g ■ (aH) = (ga)H. Snadno ukážeme, že takto v podstatě vypadají všechny tranzitivní akce grup. Pro libovolnou tranzitivní akci G x 5 -» 5 a pevně zvolený bod x e G můžeme totiž ztotožnit 5 s množinou levých tříd G/Gx pomocí vztahu gGx h» g ■ x. Toto zobrazení je zjevně surjektivní a obrazy g ■ x — h ■ x splývají, právě když h~lg e Gx a to je ekvivalentní s gGx = hGx. Konečně si všimněme, že toto ztotožnění převádí původní akci G na 5 právě na výše uvedenou akci G na G/Gx. 11.14. Věta. Pro každou akci konečné grupy G na konečné množině S platí: (1) pro každý prvek x e S je \G\ = \GX\■ \SX\, (2) (Burnsideovo lemma) je-li N počet orbit akce G na S, pak kde Sg = {x e S; g - x — x] označuje množinu pevných bodů akce prvku g. Důkaz. Uvažme libovolný bod x e S a izotropní podgrupu Gx c G tohoto bodu. Stejný argument jako na konci minulého odstavce u tranzitivních grup můžeme uplatnit na každou akci grupy G. Dostáváme zobrazení G/Gx —> Sx, g ■ Gx i-> g ■ x. Pokud (g ■ Sx) ■ x — (h ■ S x) ■ x, pak zjevně g~lh e Sx, je tedy naše zobrazeni injektivní. Zároveň je zjevně surjektivní, proto pro mohutnosti našich konečných množin platí \G/GX \ = \SX\. Odtud již vyplývá první vlastnost z věty, protože |G| = \G/GX \ ■ \GX\. 11.39. Určete grupu symetrií krychle (popište všechny symetrie). Je tato grupa komutativní? Řešení. Grupa má 48 prvků, z nichž 24 je generováno pouze rotacemi, tzv. přímými symetriemi, zbytek tvoří nepřímé symetrie, které vzniknou složením přímých s nějakým zrcadlením. Grupa není komutativní (uvažte například v různém pořadí složení zrcadlení podle roviny dané středy čtyř rovnoběžných hran a rotace o 90° kolem osy ležící v uvedené rovině a procházející středy nějakých dvou protějších stěn. Grupa je izomorfní grupě §4 x Z2. □ 11.40. V grupě symetrií krychle určete podgrupu (popište symetrie v podgrupě a uvedie tabulku operace skládání na této podgrupě) generovanou zrcadlením podle roviny procházející středy čtyř rovnoběžných hran a rotací o 180° kolem osy ležící ve zmíněné rovině procházející středy dvou protějších stěn. Je tato podgrupa normální? O 655 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY • Není to normální podgrupa ( (1, 2) o (1, 3) o (2, 4) o (1, 2) = = (4, 1) o (2, 3)). • Podgrupa není normální. Pravé třídy rozkladu jsou pak {(1,2,4), (2,4, 3), (1,3) o (2, 4)}, {(1,4, 2), (1,4, 3), (1,4) o (2, 3)}, {(2, 3,4), (1,2) o (3,4), (1,3, 4)}, {Id, (1,2, 3), (1,3, 2)}. Podmnožina je podgrupou pouze pro n = 3. Potom jde o podgrupu A 3 sudých permutací v §3, jedná se tedy o normálni podgrupu. (Pro jiná n snadno najdeme dva cykly délky n, jejichž složením není cyklus délky ri). □ 11.42. Určete podgrupu v §6 generovanou permutacemi (1, 2) o (3,4) o (5, 6), (1, 2, 3, 4) a (5, 6). Je tato podgrupa normální? Pokud ano, popište třídy rozkladu Ss/H. Řešení. Nejprve si všimněme, že všechny zadané permutace leží v podgrupě §4 x 4 Q (uvažujeme přirozenou inkluzi §4 x §2 tedy pro s e §4 x §2je zúžení s na množinu {1, 2, 3, 4} permutací na této množině a zúžení na množinu {5, 6} rovněž permutací na této množině). Proto i jimi generovaná podgrupa bude ležet v této podgrupě. Dále je zřejmě (protože mezi generátory je transpozice (5, 6)) hledaná podgrupa tvaru ff x S2, kde H c §4. Stačí tedy popsat H. Tato grupa je generována prvky (1, 2) o (3,4) a (1, 2, 3, 4) (projekce generátorů na §4). Máme (1,2,3,4)2 = (1,3) o (2,4), (1,2, 3,4)3 = (4,3,2, 1), (1,2, 3,4)4 = id, [(l,2)o(3,4)]2 = id, [(1,2) o (3,4)] o (1,2, 3, 4) = (2,4), (1,2, 3,4) o [(1,2) o (3,4)] = (1,3), [(1,2) o (3,4)] o (4, 3, 2, 1) = (1,3), (4, 3, 2,1) o [(1,2) o (3,4)] = (2,4), [(1, 2) o (3, 4)] o [(1, 3) o (2,4)] = (1,4) o (2, 3), [(1, 3) o (2, 4)] o [(1, 2) o (3,4)] = (1,4) o (2, 3), [(1,2) o (3, 4)] o (4, 2) = (1,2, 3, 4), (1,3) o (4, 2) = (1,3) o (2,4). V tomto okamžiku si všimněme, že generující permutace (1, 2, 3, 4) i (1, 2)o(3, 4) jsou obě symetriemi čtverce o vrholech 1, 2, 3,4, tedy nemohou vygenerovat více, než grupu symetrií čtverce, totiž dihedrální Druhé tvrzení dokážeme tak, že dvěma způsoby spočteme mohutnost množiny pevných bodů akce: F = {(x, g) e 5 x G; g (x) = x] c 5 x G. Protože jde o konečné množiny, můžeme si představit prvky součinu S x G jako prvky v matici (sloupce označujeme prvky v 5, řádky pak podle prvků v G). Sčítáním po řádcích i sloupcích obdržíme g€G xeS Nyní si pro přehlednost vyberme po jednom reprezentantu xi,..., x n z každé orbity v 5 a připomeňme, že mohutnosti izotropních grup pro body ve stejné orbitě jsou stejné. Využitím již dokázaného tvrzení (1) nyní vcelku snadno dostáváme n n \F\ = J2\Sg\ = z2 JI IGxl^zZlSxMG^l^N-lGl g€G í = l x€SX. í = l a důkaz je ukončen. □ Doporučujeme si pečlivě promyslet, jak užitečná jsou tvrzení věty pro řešení kombinatorických úloh, viz příklady v části B vedlejšího sloupce. 2. Okruhy polynomů Grupové operace byly podstatné u skalárů i vektorů. Vystupovalo nám tam ovšem několik obdobných struktur zároveň. Zaměříme se teď právě na takové případy. Bu-Wfcr. deme přitom mít na mysli zejména obvyklé skaláry, tj. celá čísla Z, racionální čísla Q, komplexní čísla C a množiny polynomů nad takovými skaláry K. Budeme přitom ale pečlivě budovat abstraktní algebraickou teorii. 11.15. Okruhy a tělesa. Celá čísla mají následující vlastnosti tzv. okruhu: ____( Okruhy a obory integrity [__i Definice. Komutativní grupa (M, +) s neutrálním prvkem 0 e M spolu s další operací • splňující • (a ■ b) ■ c = a ■ (b ■ c) pro všechna a, b, c e M; • a ■ b = b ■ a pro všechna a, b e M; • existuje prvek 1 takový, že pro všechna a e M platí 1-a — a; • a ■ (b + c) = a ■ b + a ■ c pro všechna a, b, c e M se nazývá komutativní okruh. Jestliže v okruhu K platí c • d = 0, práv, když alespoň jeden z prvků c a d je nulový, pak nazývame okruh K oborem integrity. Poslední vlastnosti v našem výčtu axiomů okruhu se říká dis-tributivita sčítání vůči násobení. Pokud neplatí vlastnost komuta-tivity operace •, hovoříme o nekomutativním okruhu. V dalším se ovšem omezíme zpravidla na okruhy komutativní. Operaci + budeme říkat sčítání a operaci • násobení, aniž by to znamenalo, že jde skutečně o tyto operace na některém z našich číselných oborů. Navíc budeme vždy předpokládat existenci jedničky 1 pro operaci násobení. Neutrálnímu prvku pro sčítání říkáme nula. 656 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY grupu D4, o osmi prvcích, což už se stalo. Dalším skládáním tedy již nemůžeme dostat žádné další permutace. Podgrupa ffcS4 má tedy osm prvků (osm je dělitel čísla 24, tedy podle Lagrangeovy věty je to skutečně možný počet prvků podgrupy). H = {id, (1, 2, 3,4), (1, 3) o (2,4), (4, 3, 2, 1), (1, 2) o (3,4), (1,3), (2,4), (1,4) o (2, 3)}. Všech prvků hledané podgrupy v §6 je tedy 16: pro každý prvek h € H jsou v ní prvky (h, id) a (h, (56)). □ 11.43. Určete podgrupu v §4 generovanou permutacemi (1, 2) o (3,4), (1,2, 3). Řešení. Oba zadané generátory jsou sudé permutace, jejich libovolným složením tedy vznikne opět pouze sudá permutace. Hledaná podgrupa tedy bude i podgrupou grupy A4 všech sudých permutací. Máme [(l,2)o(3,4)]2 = id, (1,2, 3)2 = (3,2,1), [(l,2)o (3, 4)] 0 (1,2, 3) = (2,4, 3), (1,2, 3) 0 [(l,2)o(3,4)] = (1,3,4), [(l,2)o (3, 4)] 0 (3, 2,1) = (3,1,4), (3, 2, 1) 0 [(l,2)o(3,4)] = (2,3,4) a v tomto okamžiku máme již sedm prvků hledané podgrupy A4, protože A4 má dvanáct prvků a počet prvků podgrupy musí být dělitelem čísla dvanáct, musí být hledanou podgrupou celá grupa A4. □ 11.44. Najděte všechny podgrupy grupy invertibilních čtvercových matic 2x2 nad Z2 (operací je násobení matic). Je některá z nich normální? Řešení. V příkladě ||11.1|| jsme sestavili tabulku operace ve zkoumané grupě. Dle Lagrangeovy věty (11.10) je možný počet prvků v podgrupě dělitelem čísla šest. Kromě triviálních podgrup (podgrupa složená pouze z jednotkového prvku a celá grupa) přicházejí tedy do úvahy podgrupy o dvou či třech prvcích. Dvouprvkové grupy musejí mít tu vlastnost, že prvek, který není jednotka musí být inverzní sám sobě. Tato vlastnost je i postačující. Dostáváme tak podgrupy {A, B], {A, C], {A, F], které nejsou normální, jak lehce ověříme. Jednotkovým prvkem těchto grup je matice A. Dále díky jejich samoinverznosti je součinem libovolné z matic B, C, F s nějakou další (nejednotkovou) maticí nejednotková matice třetí. Tedy žádná z těcho matic nemůže být prvkem trojprvkové podgrupy. Zbývá možnost P = {A, D, E], což vskutku podgrupa je. Navíc výpočtem konjugací BDB = E, ____J tělesa }___ Netriviální (komutativní) okruh, ve kterém jsou všechny nenulové prvky invertibilní, se nazývá (komutativní) těleso. Komutativní těleso se také nazývá pole. Typickým příkladem komutativních těles, tj. polí, jsou číselné obory Q, M, C. Dále pak všechny okruhy zbytkových tříd Zp s prvočíselným p. Dobrým příkladem nekomutativního okruhu s jedničkou je množina Matj (K) všech čtvercových matic nad okruhem Isi řádky a sloupci. Jak jsme viděli dávno, není to ani obor integrity. Jako příklad nekomutativního tělesa uvedhie těleso kvaternionů H, které vznikne opětovným rozšířením komplexních čísel o druhou imaginární jednotku j, tj. H = Cffi/C ~ R4, stejně jako jsme dostali komplexní čísla z reálných. Navíc označíme další „nový" prvek k = ij, který je součinem imaginárních jednotek i a j. Z konstrukce už vyplyne, že ij = — ji. Přitom ale ostatní vlastnosti tělesa zůstávají zachovány. Zkuste si promyslet nebo dohledat podrobnosti jako ne úplně triviální cvičení! Lemma. V každém komutativním okruhu K s jedničkou platí následující vztahy (které nám jistě připadají samozřejmé u skalárů): (1) O • c = c • O = O pro všechna c e K, (2) —c = (—1) • c = c ■ (—1) pro všechna c e K, (3) —(c • d) = (—c) ■ d — c ■ (—d) pro všechna c, d e K, (4) a ■ (b — c) = a ■ b — a ■ c, (5) celý okruh K je triviálni množinou {0} = {1}, právě když 0 = 1. Důkaz. Všechna tvrzení vyplývají z jednoduché úvahy a definičních axiomů. V prvém případě počítáme pro jakákoliv c, a: c • a = c • (a + 0) = c • a + c • 0, a protože jediným neutrálním prvkem vůči sčítání je nula, dostáváme a ■ 0 = 0. Stejně se dokáže i 0 • a = 0. Ve druhém případě teď stačí spočíst 0 = c • 0 = c • (1 + (-1)) = c + c • (-1), proto je c ■ (—1) opačný prvek k prvku c, což jsme chtěli dokázat. Další dvě tvrzení jsou už přímým důsledkem druhého vztahu a základních axiomů. Jestliže je celý okruh tvořen jediným prvkem, je pochopitelně 0 = 1. Naopak jestliže platí 1 = 0, pak pro jakékoliv c e K je c = 1 • c = 0 • c = 0. □ 11.16. Polynomy nad okruhy. Definice komutativního okruhu o s jedničkou abstrahuje právě vlastnosti potřebné k ná-f^y sobení a sčítání. Můžeme je hned využít pro práci í JS|fJvfc s tzv. polynomy. Rozumíme jimi jakýkoliv konečný -mtrŤi^-^— výraz, který lze poskládat ze známých konstantních prvků K a jedné neznámé proměnné pomocí operací sčítání a násobení. Formálně můžeme definovat polynomy takto:3 ___J Polynomy J___- Definice. Nechť K je jakýkoliv komutativní okruh skalárů s jedničkou. Polynomem nad K rozumíme konečný výraz k f(x)^J2a'^' i=0 Ne náhodou je pro okruh použit symbol k - nadále si pod ním představujte třeba kterýkoliv okruh našich číselných oborů. 657 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY CDC = E, FDF = E (z čehož vyplývá BEB = D, CEC = D, FEF = D) zjišťujeme, že daná podgrupa je normálni. □ 11.45. Popište všechny podgrupy grupy (Zw, +). Řešení. Podgrupy jsou izomorfní (Zd, +), kde a] 10, tj. {0} — Zj, {0,5} = Z2, {0,2,4,6,8} = Z5, a Zio. □ 11.46. Určete řády prvků 2,4, 5 v grupě (Zj5, •) a v grupě (Z35, +). Řešení. Řád prvku x v grupě (Zj5, •) je nejmenší k takové, že xk = 1 mod 35. Z Eulerovy věty je pro x = 2 a x = 4 řád k < (p(35) = 24. Výpočtem příslušných modulárních mocnin zjistíme, že řád x = 2 je 12. Odtud přímo plyne, že řád x = 4je6. Číslo x = 5 do grupy (Zj5, •) nepatří. Konkrétně modulo 35 máme j j2 j3 jí xí x6 xl ^8 x9 XW XU x\2 ~2 4 8 16 32 29 23 11 22 9 18 T~ 4 16 29 11 9 1 V grupě (Z35, +) je řád nejmenší k takové, že k ■ x = 0 mod 35. To znamená, že řád prvků □ Toto lze jednoduše spočítat jako k 2 a 4 je 35 a řád 5 je 7. (35,*) i)

K, jehož hodnota vznikne dosazením hodnoty c za nezávislou proměnnou x, tj. f(c) = ao + a\c H-----h atck. Všimněme si, že konstantní polynomy odpovídají právě konstantním zobrazením. Kořen polynomu f (x) je takový prvek c e K, pro který je f(č) = 0 e K. Obecně mohou různé polynomy definovat stejná zobrazení. Např. polynom x2 +x e Z2 [x] zadává identicky nulové zobrazení. Obecněji, pro každý konečný okruh K = {ao, a\, ..., aj) zadává polynom f(x) = (x — oq)(x — a\) ...(x— a^) identicky nulové zobrazení. Dva polynomy f(x) = 2^iai^ aj(i) = Jľ; hx1 umíme přirozeně také sčítat i násobit: (/ + g)(x) = (a0 + b0) + (ai + bi)x + • • • + (ak + b^x1, (/ • g)(x) = (a0b0) + (a0h + aibo)x + ... ----h (a0br + a\br-\ + arb0)xr H-----h atbí^1, kde k > t jsou stupně polynomů /aga uvažujeme nulové koeficienty všude tam, kde v původním výrazu pro polynomy nenulové koeficienty nejsou.4. Tato definice vskutku odpovídá příslušným operacím sčítání a násobení hodnot zobrazení f, g : K —> K díky vlastnostem „skalárů" v původním okruhu K. Přímo z definice vyplývá, že množina polynomů K[x] nad komutativním okruhem s jedničkou je opět komutativním okruhem s jedničkou, přičemž jedničkou v K[x] je opět jednička 1 v okruhu K vnímaná jako polynom stupně nula. Nulou pro sčítání je nulový polynom. Lemma. Okruh polynomů nad oborem integrity je opět obor integrity. Důkaz. Máme ukázat, že v K[x] mohou být netriviální dělitelé nuly pouze, jestliže jsou už v K. To je ale zřejmé z výrazu pro násobení polynomů. Jsou-li f (x) a g(x) polynomy stupně k a t jako výše, pak koeficient u xk+l v součinu f(x) ■ g(x) je součin ak ■ bi a ten musí být nenulový, pokud nejsou dělitelé nuly vK. □ 11.17. Polynomy více proměnných. Často se setkáváme s ob-iS. * Jekty popsanými pomocí polynomiálních výrazů ale s více proměnnými. Např. kružnici v rovině ' se středem 5 = (xq, yo) a poloměrem r zapíšeme pomocí rovnice (x - xo)2 + (y - yo)2 - r2 ■- 0. formálně bychom mohli naopak za polynom považovat nekonečný výraz pro / — 0,..., 00 s podmínkou, že jen konečně mnoho koeficientů je nenulových. 658 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY □ 11.49. Rozhodněte, zda předpis

(a + bi) ' + b2, *, ^ apx13 e K[xu ,xr]. Říkáme, že / má celkový stupeň n, je-li alespoň jeden z koeficientů s multiindexem a velikosti n nenulový. Okamžitě se také nabízejí analogické vzorce pro sčítání a násobení polynomů f + g= zľ (-a<* + b^x" |of| Z, ^(a) = 2a ii) ^ : Z —> Z, ^(a) = a + 1 iii)

Z, í»(a) = 3|a| iv) ^ : Z —> Z, (p(a) = 1 O ii.55. Rozhodněte, zda předpis

)) = fca Z2 x Z Z, )) = ž> O 11.56. Dokažte, že neexistuje izomorfismus multiplikativní grupy komplexních čísel do multiplikativní grupy reálných čísel. Řešení. Při homomorfismu se musí zobrazovat neutrální prvek grupy na neutrální prvek (viz 11.5). Číslo 1 se tedy musí zobrazovat samo na sebe. Kam se může zobrazovat číslo —1? Víme, že /(—l)2 = Y2aktaxa 1; a / g = bi(x\,... ,*r_i)j4 H-----h&o(*i, - - ■, xr-i) = f + g = (ao(xi, .. .,xr-i) +bo(xi, ..., Arr_i))+ + {a\(x\, .. .,xr-\) + b\(x\, .. .,xr-i))xr H----= = J2(ak,y +bk.y)(xu-..,xr--l)y 4 +■■■ ----h ^y^(ao.y +bo,y)(.xi, ...,xr-i)Yj = = ^2(aJ,y +bj,y)(xu...,xr-i)yx1r. (y,j) Podobně lze vést důkaz pro součin (udělejte samostatně!). □ Jako důsledek naší definice a předchozích výsledků pro polynomy nad obecnými komutativními okruhy dostaneme: Důsledek. Jesdiže v okruhu v okruhu polynomů K[x\ nejsou dělitelé nuly, pak také ] nejsou dělitelé nuly. Důkaz. Budeme postupovat indukcí přes počet proměnných r.5 Polynomy v jediné proměnné mají tvar / — anx\ + • • • + ao a g = bmxm + • • • + bo, přičemž bm / Oaa„ ^ 0. Vedoucí člen součinu f g je anbmx"+m, protože anbm ^ 0, zejména tedy je součin nenulových polynomů opět nenulový. Pokud tvrzení platí pro r — 1 proměnných, pak použijeme předchozí úvahu pro okruh polynomů v jedné proměnné xr s koeficienty v K[*i, xr_i ]. □ 11.18. Dělitelnost a nerozložitelnost. Naším dalším cílem bude pochopit, jak je to v obecném případě polynomů nad oborem integrity s jejich rozkladem na součin polynomů jednodušších, tj. ve speciálním případě polynomů s jedinou proměnnou budeme diskutovat kořeny polynomů. U polynomů s více proměnnými půjde o rozklad na jednodušší faktory nižších stupňů. Protože již víme, že polynomy ve více proměnných můžeme definovat induktivně, stačí nám nyní uvažovat jen polynomy v jedné proměnné, ovšem nad obecným oborem integrity, a směřujeme ke zobecnění úvah o dělitelnosti, které byly základem našeho počínání v teorii čísel v desáté kapitole. Uvažujme nějaký pevně zvolený obor integrity K. Příkladem nám stále mohou sloužit celá čísla Z nebo okruh Zp s prvočíselným p. Důkaz lze vést také přímo s použitím multiindexových formulí pro součin, když si zavedeme vhodné uspořádání monomů tak, jak to budeme za chvíli stejně dělat. 660 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY /((—l)2) = /(l) = 1. Obraz čísla —1 je tedy nějaká druhá odmocnina z čísla 1. Hledáme-li tedy pouze bijektivní homomorfismy, musí být/(-l) = -1. Pak ovšem f (í)2 = f (í2) = /(-l) = -1, je tedy f (i) druhou odmocninou čísla —1 v K*, ale víme, že taková odmocnina neexistuje. Ani bijektivní homomorfismus tedy nemůže existovat. □ Poznámka. Zobrazení, které komplexnímu číslu přiřadí jeho velikost, je homomorfismem C* do multiplikativní grupy kladných reálných čísel. C. Burnsidovo lemma 11.57. Kolika způsoby můžeme vytvořit náhrdelník z 3 černých a 6 bílých korálků stejného tvaru? Kusy stejné barvy nerozlišujeme a za stejné náhrdelníky považujeme všechny, které lze na sebe převést symetrií v rovině. Řešení. Pro řešení úlohy si náhrdelník představíme jako obarvení pevně označených vrcholů pravidelného devítiúhelnika. Za množinu S volíme všechna možná taková obarvení. Každé takové obarvení je jednoznačně určeno pozicí tří černých korálků. Velikost množiny S je tedy (') = 84. Víme, že grupou všech symetrií je grupa Dg složená z 9 rotací (včetně identity) a stejného počtu reflexí. Stejné náhrdelníky jsou ty, které leží ve stejné orbitě akce grupy Dg na množině všech konfigurací S. Zajímá nás tedy počet orbit N. Pro výpočet N stačí probrat prvky grupy Dg a všímat si velikostí Sg: Identita je jediný prvek řádu 1, | Sa | = 84. Příspěvek do sumy je 84. Zrcadlení g jsou všechna řádu 2 a je jich 9. Přitom je zjevně I Sg I = 4, celkový příspěvek je proto 4-9 = 36. Dvě rotace g o úhel 2jr/3 nebo 4jr/3 mají řád 3 a | Sg | =3. Jejich příspěvek je tedy 6. Konečně zbývajících rotací (řádu 9 v Dg) je 6 a nenechávají na místě žádný prvek, do celkové sumy tedy ničím nepřispívají. Celkem dostáváme podle formule z Burnsidova lemmatu: 1 ^ 126 N =- > |5„| =-= 7. \D9\ ^ 1 gl 18 dělitelnost v okruzích □ Najděte si příslušných sedm různých náhrdelníků! 11.58. Určete počet obarvení políček tabulky 3x3 třemi barvami, považujeme-li za stejná obarvení, která na sebe přejdou při nějaké symetrii tabulky (tedy rotací nebo zrcadlením). Řešení. Grupa symetrií tabulky je grupou symetrií čtverce, tedy di-hedrální grupa D4. Všech obarvení tabulky, pokud považujeme každé Obecně říkáme, že a e K dělí c e K, jestliže existuje b tak, že a ■ b = c. Skutečnost, že c e K je dělitelné a e K, zapisujeme a\c. Dělitelé jedničky, tj. invertibiiní prvky v K, se nazývají jednotky. Jednotky v komutativním okruhu vždy tvoří komutativní grupu. V oboru integrity jsou dělitelé určeni jednoznačně. Skutečně je-li b = a ■ c a b 7^ 0, pak c je jednoznačně dáno volbou a, b, protože při b — ac — ad totiž platí 0 = a ■ (c — d) a a 7^ 0. Z neexistence dělitelů nuly proto vyplývá c = d. Přímo z definic vyplývají následující tvrzení: Lemma. Nechť a, b, c e K. Potom (1) je-li a\b a zároveň b\c, pak také a\c, (2) je-li a\b a zároveň a\c, pak také a\(ab + /3c) pro všechny a, f3 e K, (3) a\0pro všechna a e K (je totiia -0 = 0), (4) každý prvek a e K je dělitelný všemi jednotkami e e K a jejich násobky a ■ e (jakpřímo plyne z existence e~l). Jednoznačný rozklad v oboru integrity Řekneme, že prvek a e K je nerozložitelný, jestliže je dělitelný pouze jednotkami e e K a jejich násobky a ■ e. Řekneme, že okruh K je obor integrity s jednoznačným rozkladem, jestliže platí: • pro každý nenulový prvek a e K existují nerozložitelné a\, ... ,ar e K takové, že a — a\ ■ a2 ... ar, • jsou-li prvky a\, ... ,ar a b\, ..., bs nerozložitelné, nejsou mezi nimi žádné jednotky a a — a\a2 ... ar — b\b2.. .bs, pak je r — s a ve vhodném přeuspořádání platí a j — ejbj pro vhodnéjednotky ej. Již jsme viděli, že Z je obor integrity s jednoznačným rozkladem a každé pole (komutativní těleso) je obor integrity s jednoznačným rozkladem (protože každý nenulový prvek v poli je jednotka). Pro ilustraci si uvedřne příklad oboru integrity, který jedno-\\ značný rozklad nemá. Konstrukce je podobná polynomům, jen místo mocnin uvážíme vhodně se skládající odmocniny: Naše K bude mít prvky tvaru ao - /xT" kde ao, ... ,ak e Z, mi, n e Z>o. Pak jednotky jsou v K pouze prvky ±1, všechny prvky s ao = 0 jsou rozložitelné, ale např. výraz x nelze vyjádřit jako součin nerozložitelných. Nerozložitelných prvků je v K prostě příliš málo. 11.19. Dělení se zbytkem a kořeny polynomu. Základním ná-j^jf.' 1 strojem pro diskusi dělitelnosti, společných dělitelů apod. •Sg^ v okruhu celých čísel Z byla procedura dělení se zbytkem ŕ&fä a Euklidův algoritmus pro hledání největších společných 11 í' 1 dělitelů. Tyto postupy nyní zobecníme. Lemma (Algoritmus pro dělení se zbytkem). Nechť K je komutativní okruh bez dělitelů nuly a f, g e K[x] polynomy, g 7^ 0. Pak 661 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY políčko za jedinečné, je 39. Na těchto obarveních nám tedy působí grupa G = D4. Postupně projdeme všechny symetrie g z G a určíme, kolik takových obarvení zachovávají: • g = Id: \Sg\ = 39. • g je rotace o 90° či o 270°(= -90°): Při takové rotaci přejde libovolné rohové pole na sousední rohové pole. Aby se obarvení nezměnilo, musí mít všechna rohová pole stejnou barvu. Obdobně musí mít stejnou barvu středová políčka stran. Středové políčko celé tabulky pak může být libovolné. Celkem existuje 33 různých obarvení, která se nezmění, provedeme-li s tabulkou jednu z uvažovaných rotací. • g je rotace o 180°: Čtyři dvojice políček středově symetrických podle středu tabulky musí mít stejnou barvu, středové políčko pak může opět být obarveno libovolně. Celkem \S„\ =35. • g je jednou ze čtyř osových symetrií: Políčka, která se při osové symetrii zachovávají (jsou tři), mohou být obarvena libovolně, zbylých šest polí tvoří tři dvojice políček, které se na sebe při osové symetrii zobrazí. Políčka ve dvojici musí tedy mít stejnou barvu. Celkem \ Sg\ = 36. Podle Burnsidova lemmatu je počet hledaných obarvení roven i (39 + 2 • 33 + 35 + 4 • 36) = 2862. □ 11.59. a) Určete všechny rotační symetrie pravidelného osmistěnu. b) Určete počet obarvení stěn pravidelného osmistěnu třemi barvami, považujeme-li za stejná ta obarvení, která na sebe přejdou při nějaké rotaci osmistěnu. Řešení. a) Umístíme-li osmistěn do kartézské souřadné soustavy tak, že dvojice protějších vrcholů bude na osách a střed v počátku souřadnic, pak je každá rotační symetrie dána tím, který ze šesti vrcholů bude po jejím provedení na ose z „dole" a která ze čtyř z něj vedoucích hran z něj půjde „dopředu nahoru". Grupa má tedy celkem 24 prvků. Jde o rotace o ±90° a o 180° okolo os procházejících protějšími vrcholy, o rotace o 180° podle os procházejících středy protějších hran a konečně o rotace o ±120° okolo os procházejích středy protějších stěn. b) Obarvení osmistěnu, považujeme-li každou stěnu za jedinečnou, je celkem 38. Pro každou rotační symetrii g spočtěme, kolik zachovává různých obarvení: existuje a e K, a 7^ 0 a polynomy q a r splňující a f — qg + r, kde r — 0 nebo deg r < deg g. Je-li navíc K pole, nebo je aspoň vedoucí koeficient polynomu g roven jedné, potom lze volit a — 1 a polynomy q ar jsou v tomto případě určeny jednoznačně. Důkaz. Tvrzení dokážeme indukcí vzhledem ke stupni /. Jeli deg / < deg g nebo / = 0, pak volíme a — l, q — 0, r — f, což vyhovuje všem našim podmínkám. Pro konstantní polynom g klademe a — g, q — f ,r — 0. Předpokládejme tedy, že deg / > deg g > 0 a pišme / = a0 H-----h a„x" , g = b0 H-----h bmx™ . BuďplatíŔm/-a„x"~mg = 0anebojedeg(Ŕm/-a„yl~mg) < < deg /. V prvém případě jsme hotovi, ve druhém pak, podle indukčního předpokladu, existují a', q', r' splňující a'(bmf -anxn-mg)=4g + r' a budV = 0 nebo deg ŕ < deg g. Tzn. a'bmf = (q' +a'anxn-m)g + r'. Přitom je-li bm — 1 nebo K je pole, pak podle indukčního předpokladu lze volit a' = l aq',/ jsou tak určeny jednoznačně. V takovém případě ovšem získáme bmf = (q' +a„x"-m)g + r', a je-li K pole, můžeme rovnost vynásobit ft"1. Předpokládejme, že / = q\g + r\ je jiné řešení. Pak 0 — f — f — (q— q\)g + (r — r i) a buďje r — r\, nebo deg(r — r i) < degg. V prvém případě odtud ovšem plyne i q — q\, protože K[x] neobsahuje dělitele nuly. Nechťaxs je člen nejvyššího stupně v q — q\ 7^ 0 (určitě existuje). Potom jeho součin se členem nejvyššího stupně v g musí být nulový (protože nejvyšší stupeň dostaneme tak, že vynásobíme nejvyšší stupně). To ovšem znamená, že a — 0. Protože axs byl největší nenulový stupeň, nutně dostáváme, že q — q\ žádné nenulové monomy neobsahuje, je tedy určitě nulové. Pak ovšem ir — r\. □ Proceduru dělení se zbytkem můžeme okamžitě využít k diskusi kořenů polynomů. Uvažme tedy polynom / e K[at], deg / > 0 a zkusme jej vydělit polynomem x — b, b e K. Protože je vedoucí koeficient jednička, algoritmus pro dělení dává jednoznačný výsledek. Dostáváme tedy jednoznačně zadané polynomy q a r splňující / = q(x — b) + r, kde r — 0 nebo deg r = 0, tj. r e K. Tzn., že hodnota polynomu f v b e K je rovna právě f(b) = r. Z toho plyne, že prvek b e K je kořen polynomu / právě, když (x — b)\f. Protože po vydělení polynomem stupně jedna vždy klesne stupeň výsledku alespoň o jedničku, dokázali jsme následující tvrzení: Důsledek. Každý polynom f e K[x] má nejvýše deg / kořenů. Zejména tedy zadávají polynomy nad nekonečným oborem integrity stejná zobrazení K —> K, právě když jde o stejné polynomy. Skutečně dva polynomy nad oborem integrity, které zadávají stejné zobrazení K —> K, mají rozdíl, jehož kořenem je každý prvek v K. To však znamená, že pokud by jejich rozdíl nebyl nulový polynom, pak K má nejvýše tolik prvků, kolik je maximum ze stupňů uvažovaných polynomů. Zatímco reálné polynomy mohou být i úplně bez kořenů, každý komplexní polynom naopak takovýto rozklad připouští. To je obsahem tzv. základní věty algebry, kterou pro úplnost uvádíme 662 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY - g je rotace o ±90° podle osy procházející protějšími vrcholy. Potom g zachovává 3 2 obarvení. Takových rotací je celkem 6. - g je rotace o 180° podle osy procházející protějšími vrcholy nebo podle osy procházející středy protějších hran. Potom g zachovává 34 různých obarvení. Takových rotací je celkem 3 + 6 = 9. - g je rotace o ±120°. Potom g zachovává opět 34 různých obarvení. Takových rotací je osm. Celkem je hledaný počet obarvení roven i (38 + 6 • 32 + 17 • 34) = 333. □ 11.60. Kolik různých náramků lze sestavit právě z devíti bílých, šesti červených a tří černých korálků? (dva náramky považujeme za stejné, pokud se liší pouze nějakou rotací v prostoru) Řešení. Grupa symetrií náramku je dihedrální grupa o 36 prvcích. Ta operuje na množině náramků, kde máme pevně očíslovaná místa na náramku (od jedné do osmnácti), těch je 18!/(9!6!3!) = 4084080. Symetrie, které zachovávají nenulový počet takovýchto náramků, jsou zjevně pouze rotace o 120° a 240° a zrcadlení podle osy procházející protějšími vrcholy (takových je devět) a samozřejmě identita. Podle Burnsidova lematu je hledaný počet náramků roven — (4084080 + 2 • 36 V + 9- 4/\3 113590. □ 11.61. Určete, kolik existuje náramků sestavených z právě šesti stejných bílých, šesti stejných červených a šesti stejných černých korálků, přičemž dva náramky považujeme za stejné, pokud se liší nějakou rotací (v prostoru). O s (v podstatě) kompletním důkazem. Díky tomuto výsledku víme, že každý polynom v C[x] má tolik kořenů, včetně násobnosti, jako je jeho stupeň deg f — k. Proto připouští vždy rozklad tvaru f(x) = b(x - a\) ■ (x - a2)... (x - ak) s vhodnými komplexními kořeny a, a vedoucím koeficientem b. 11.20. Věta (Základní věta algebry). Pole C je algebraicky uzavřené, tj. každý polynom stupně alespoň 1 má kořen. Důkaz. Předpokládejme, že / e C[z] je nenulový polynom, který nemá kořen, tj. f (z) ^ 0 pro všechna z e C. Definujme zobrazení v 1/(01 tj.

0: Ýr t i-» Ý(t) = re Pro každé r e (0, oo) máme definováno spojité zobrazení kt — (p o t//r '■ R -K"i.Ze spojité závislosti k na parametru r navíc vyplývá existence zobrazení ar : R —> R jednoznačně zadaného podmínkami 0 < ar(0) <2ira Kr(ŕ) — e'ar^ . Získané zobrazení ar opět spojitě závisí na r. Celkem tedy máme spojité zobrazení a:Rx(0,oo) (t, r) ar (t) a z jeho konstrukce plyne, že pro všechna r je ^(ar(2n) — ar(0)) — nr e Z. Protože je a spojité, znamená to, že nr je celočíselná konstanta nezávislá na r. Podívejte se na obrázek, odkud kam jdou jednotlivá zobrazení v naši konstrukci! Pro dokončení důkazu si stačí uvědomit, že pokud f — ao + • • • + adzd a ad ^ 0, pak pro malá r se bude ar chovat podobně jako konstantní zobrazení, zatímco pro velká r to vyjde stejně, jako kdyby / — zá ■ Nejprve si spočtěme, jak tedy nr dopadne při / , pak toto tvrzení upřesníme a důkaz tím bude ukončen. 663 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.62. Určete, kolik existuje náramků sestavených z právě osmi stejných bílých, osmi stejných červených a osmi stejných černých korálků, přičemž dva náramky považujeme za stejné, pokud se liší nějakou rotací (v prostoru). O 11.63. Kolik existuje náramků složených ze tří stejných bílých a šesti stejných černých korálků, považujeme-li dva náramky za stejné, lze-li jeden na druhý převést rotací (v prostoru)? O D. Okruhy 11.64. Rozhodněte, zda množina R s operacemi ©, O tvoří okruh, ko- mutativní okruh, obor integrity či těleso: i) R = Z, a Q )b = a + b + 3, aQb = -3, ii) R = Z, a Q )b = a + b-3,aOb = a ■ b — 1, ill) R = Z, a Q 3b = a + b-l,aOb = a + b — a b, iv) R = Q a ( Bb = a + b,aQb = b, v) R = Q a ( Bb = a + b+l,aOb = a + b + a b, vi) R = Q a ( Bb = a + b-l,aOb = a + b + a b. O Řešení. i) je okruh, ii) není okruh, iii) je obor integrity, iv) není okruh, v) je těleso, vi) není okruh. Funkce C —> C, z >-> z , z >-> y^jj se snadno vyjádří pomocí goniometrického tvaru komplexních čísel z = r(cosa + i siná): z l?l d = / (cos da + i sin da) = / eida , ida di — l(cosífa + i suiífa) = e' Zobrazení

0. Proto pro libovolná x, y e K, x < y platí ;, a nějaké j tak, že a nedělí cj. Zvolme taková i, j nejmenší možná. Koeficient u x!+] v polynomu f g je boCi+j +b\Ci+j-\ H-----\-bj-\-jco. Podle naší volby a dělí všechny boci+j, bi-\Cj+\, bi+\Cj-\, bi+jCo. Zároveň ale nedělí bjcj. Proto nemůže dělit celý koeficient. □ 11.25. Lemma. Uvažme podílové těleso L oboru integrity K s jednoznačným rozkladem. Je-li polynom f nerozložitelný v K[x], je nerozložitelný také v ~L[x\. Důkaz. Každý koeficient a e K můžeme považovat za prvek y e L. Proto každý nenulový polynom / e K[x] můžeme uvažovat jako polynom v ~L[x\ . Předpokládejme, že f — g'h' pro vhodné g', h! e ~L[x\, kde polynomy g', h! nejsou jednotky vL[x] (tzn. nejsou to konstantní polynomy, neboť L je pole). Nechť a je společný násobek jmenovatelů koeficientů v g' a b je společný násobek jmenovatelů koeficientů vh'.Pakbh'.ag' e KM aplatíabf = (bh')(ag').Nechťcje nerozložitelný faktor v rozkladu ab. Pak c dělí (bh')(agr), a proto c dělí polynom bh! nebo polynom ag' (podle předchozího lemmatu). To ale znamená, že c můžeme vykrátit. Po konečném počtu takových krácení zjistíme, že / = gh pro polynomy g,h e K[x]. Přitom stupeň polynomů se neměnil, proto i g a h nejsou konstantní. Tím jsme dokázali, že když je / rozložitelné v ~L[x\, je rozložitelné i v K[x] a odtud negací vyplývá i požadovaná implikace. □ 11.26. Lemma. Nechť K je obor integrity s jednoznačným rozkladem a f, g,h e K[x]. Předpokládejme, že f je nerozložitelné a f\gh. Pak buď f \g nebo f\h. Důkaz. Je-li / konstantní polynom (tj. prvek v K), pak jsme tvrzení již dokázali, viz jedno z předchozích lemmat. Předpokládejme, že deg / > 0. Již víme, že / je nerozložitelný také v L[x], kde L je podílové těleso okruhu K. Předpokládejme tedy nejdříve, že K je pole (a je tedy rovno svému podílovému tělesu). Předpokládejme dále, že f\gh a zároveň / nedělí g. Ukážeme, že pak jistě f\h. Největší společný dělitel polynomů g a f musí být konstantní polynom v L, proto existují A, B e Hx] takové, že 1 = Af + Bg. Odtud h = Afh + Bgh, a protože f\gh, musí platit i f\h. Vraťme se nyní k obecnému případu. Podle předchozího vyplývá z našich předpokladů, že f\g nebo f\hv okruhu polynomů ~L[x\ nad podílovým tělesem L okruhu K. Nechť např. h — kf v ~L[x\ a zvolme a e K tak, aby ak e K[x]. Pak ah = akf a pro každý nerozložitelný faktor e e a musí platit e\ak, protože / je nerozložitelný a nekonstantní. Můžeme proto e krátit. Po konečném počtu takových krácení je z a jednotka, tzn. h — k' f pro vhodné k' e KM. □ Důkaz tohoto lemmatu ukončil celý důkaz věty 11.23. 667 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY polynomy se záporným diskriminantem. Toto tvrzení vyplývá i z úvah v předchozím příkladě. 11.76. Rozložte polynom x5 + 3x3 + 3 na ireducibilní složky nad i) Q, ii) Z7. Řešení. i) Podle Eisensteinova kriteria je daný polynom ireducibilní nad Z i Q (použijeme prvočíslo 3). ii) (x-í)2(x3 +2X2 -x+3).Netpr. pomocí Hornerova schématu zjistíme dvojnásobný kořen 1. Po vydělení polynomem (x — l)2 dostáváme polynom (x3 + 2x2 — x + 3), který již nemá nad Z7 kořeny. Proto je ireducibilní (kdyby byl rozložitelný, musel by mít jeden faktor stupeň jedna, tedy (x3 +2r — x+3) by musel mít kořen). □ 11.77. Rozložte polynom x4 + 1 nad • Z3, • C, Řešení. • (x2 + x + 2)(x2 +2x + 2) • Kořeny jsou všechy čtvrté odmocniny z —1, ty leží v komplexní rovině na jednotkové kružnici a mají argumenty postupně it/4, it/4 + it/2, ti/4 + jt a jt/4 + 3jt/2, jsou to tedy čísla ±\Í2/2 ± iV2/2. Rozklad tedy je V2 V2 • Vynásobením kořenových činitelů komplexně sdružených kořenů v rozkladu nad C dostáváme rozklad nad K: (x2 - y/2x + ŕj (x2 + y/2x + l) .. □ 11.78. Nalezněte polynom s racionálními koeficienty a s co nejmenším stupněm, jehož kořenem je číslo 20l\/2. Řešení. P(x) = x2001 — 2. Ukažme, že neexistuje polynom menšího stupně s kořenem 2aeZ/2. Buď totiž Q(x) nenulový polynom nejmenšflio stupně s kořenem 2°°*!/2. Pak st Q(x) < 2007. Vydělme P(x) polynomem Q(x) se zbytkem: P(x) = Q(x) ■ D(x) + R(x), kde D(x) je neúplný podíl po dělení a R(x) zbytek po dělení, stR(x) < stQ(x), nebo R(x) = 0. Dosazením čísla 2<*\/2 do poslední rovnice vidíme, že ™i/2 je kořenem i polynomu R(x), z definice polynomu Q(x) musí být tedy R(x) nulový polynom, tedy Q(x) dělí P(x). Polynom P(x) je však ireducibilní (podle Eisensteinova kriteria), jeho jediným netriviálním dělitelem je on sám 3. Systémy polynomiálních rovnic V praktických úlohách se často setkáváme s objekty nebo ději .íSk popsanými polynomy, resp. systémy polynomiálních ••^f, * rovnic. \*Mpc/ Může jít o hledání příslušnosti bodu k nějakému 3>f!s-fe. tělesu, hledání extrémů na algebraicky popsaných podmnožinách mnohorozměrných prostorů, analýzu pohybů součástí nějakého stroje atd. 11.27. Afinní variety. Pro jednoduchost (existence kořenů polynomů) budeme pracovat zejména nad polem komplexních čísel, nicméně některé úvahy rozvineme pro obecné pole K. Afinním n-rozměrným prostorem nad polem K rozumíme K" = K x • • • x K se standardní afinní strukturou, viz začátek n čtvrté kapitoly. Jak jsme již viděli, polynom / = aají" e K[x\, ... ,xn] lze přirozeným způsobem chápat jako zobrazení /: K" —> K definované /(«!,...,!/„) := ^aaMa, kde «" = «"'••• u"". a V dimenzi n — 1 popisuje rovnost f (x) — 0 jen nejvýše konečně mnoho bodů v K. Ve vyšší dimenzi bude rovnost f (x\, ..., xn) popisovat podmnožiny podobné, jako jsou křivky v rovině nebo plochy v trojrozměrném prostoru, mohou ale mít docela složité a samoprotmající se tvary. Např. množina zadaná rovnicí (x2 + y2 )3 — 4x2 y2 — 0 vypadá jako čtyřlístek. Pěkný obrázek dvourozměrné plochy dává tzv. Whitneyho deštník x2 — y2 z = 0, který kromě znázorněné části na obrázku obsahuje také celou přímku {x = 0, y = 0). Obrázek byl vykreslen s pomocí parametrického popisu x — uv, y — v, z — u2, ze kterého nejspíš snadno uhádneme i implicitní popis x2 — y2 z — 0. Další obrázek ukazuje tzv. Enneperovu plochu s parametrizací x — 3u + 3uv2 — u3, y — 3v + 3u2v — v3, z, — 3u2 — 3v2. 668 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY (až na násobení jednotkou okruhu polynomů nad Q, tedy racionální konstantou), je tedy Q (x) = P (x) (opět až na pronásobení jednotkou). Napríklad polynom i*2007 — | také splňuje podmínky zadání. Normovaný polynom splňující tyto podmínky je však již jediný a je to polynom P (x). □ 11.79. Najděte všechny ireducibilní polynomy stupně nejvýše 2 nad Z3. Řešení. Nerozložitelné jsou z definice všechny lineární mnohočleny. Nerozložitelné polynomy stupně dva dostaneme tak, že z množiny všech polynomů stupně 2 nad Z3 „vyškrtáme" rozložitelné polynomy, tedy násobky dvojic lineáních polynomů. Reducibilní polynomy stupně dva jsou tedy: (x + l)2 = x2 + 2x + 1, (x + 2)2 = x2 + x + 1, (x + í)(x + 2) = x2 + 2, x2, x(x + 1) = x2 + x, x(x + 2) = x2 + 2x. Stačí uvažovat pouze normované polynomy, ostatní z nich dostaneme násobením dvojkou (rozmysli). Celkem normované ireducibilní polynomy stupně 2 nad Z3 jsou x2 + 2x+ 2, x2 + x+ 2, x2 + 1. □ 11.80. Rozhodněte, zdaje následující polynom nad Z3 ireducibilní, případně nalezněte jeho rozklad: x4 + x3 + x + 2. Řešení. Dosazením čísel 0, 1, 2 zjistíme, že daný polynom nemá v Z3 kořen. Je tedy buďireducibilní nebo je součinem dvou polynomů stupně 2. Vzhledem k tomu, že daný polynom je normovaný, tak je-li součinem nějakých dvou polynomů stupně dva, je součinem i normovaných polynomů stupně dva (po případném pronásobení obou polynomů dvojkou). Hledejme tedy konstanty a, b,c,d e Z3 tak, aby x4 + x3 + x + 2 = (x2 + ax + b)(x2 + cx + d) = = x4 + (a + c)x3 + (ac + b + d)x2 + + (ad + bc)x + bd. Porovnáním koeficientů u jednotlivých mocnin x dostáváme soustavu čtyř rovnic o čtyřech neznámých: 1 = a + c, 0 = ac + b + d, 1 = ad + bc, 2 = bd. Z poslední rovnice je jedno z čísel b, d rovno jedné, druhé pak dvěma, vzhledem k symetrii soustavy vůči dvojicím (a, b) a (c, d) můžeme zvolit například b = 1, d = 2. Z druhé rovnice potom ac = 0, tedy jedno z čísel a, c je nula, z první rovnice je pak druhé z nich jednička. Ze třetí rovnice 2a + c = 1, je tedy a = 0, c = 1. Celkem so 100 Těžko si představit, jak z této parametrizace dopočítat "ÉL ručně implicitní popis, přesto to budeme umět tJj^^ít_ algoritmicky zvládnout eliminací proměnných ' --5^/ .'' m a ľ z těchto tří rovnic. Budeme k tomu ale muset vybudovat docela složitou teorii. Začneme jako obvykle formalizací objektů. ____J Afinní variety j___ Nechť f\, ..., fs e K[x\, ... ,x„]. Afinní varietou v K" určenou polynomy f\, .. = {(a\, ...,an) e , f„ nazveme množinu ; fi(a\ , a„) = 0, i = 1, Afinní variety jsou například všechny kuželosečky, kvadriky a nadkvadriky singulární i regulární. Mnoho pěkných křivek či ploch můžeme snadno popsat jako afinní variety. Varieta určená více polynomy je pak průnik variet zadaných jednotlivými polynomy. Tedy například ^(x2 + y2 — 1, z) je kružnice se středem (0, 0, 0) a poloměrem jedna ležící v rovině xy. Podobně V3(xz, yz) je sjednocení přímky x = 0, y = 0 a roviny z = 0, protože právě pro body těchto dvou útvarů jsou oba polynomy xz, yz nulové. Vidíme na těchto příkladech, že není lehké se vypořádat s pojmem dimenze. Stačí zmíněná přímka navíc k rovině, aby naše varieta byla třírozměrná, nebo ji ještě budeme považovat za dvojrozměrnou s jistou anomálií? Následující přímočaré tvrzení si ověřte samostatně: Věta. Nechť V = 2J(/i ,...,/*), W = 2%i,..., g,) c K" jsou afinní variety. Potom i V U W a V HW jsou afinní variety a platí vnw = »(/!,...,/;,£!,...,&), V U W = V(figj) prol)(x + VŠ") dokonce v R[x]. V okruhu C[x] je tedy p(x) = (x + i)2(x - i)2 (x - VŠ) (x + VŠ) a v R[x] je p(x) = (x2 + l)2 (x - VŠ) (x + VŠ) . V Z5 [x] má polynom x2 + 1 kořeny ±2 a polynom x2 — 3 nemá žádné, a proto p(x) = (x -2)2{x + 2)2(x2 -3). V Z-i[x] nemá kořen ani jeden z těchto polynomů, a proto rozklad na ireducibilní faktory je totožný s rozkladem v Q[x] a Z[x]. p(x) = (x2 + Ifix2 - 3). □ C. Jak lze chápat pojem dimenze v případě variet? Všechny tyto problémy lze ,jozumně" řešit pro variety v oboru komplexních čísel (resp. pro všechna algebraicky uzavřená pole), pro čísla reálná je to komplikovanější a prakticky nemožné je to pro obecná pole. Například pro racionální čísla je ověření tvrzení Q3(y + y — z") — 0 známo jako tzv. velká Fermatova věta, mnohokrát zmiňovaná v kapitole desáté. 11.28. Parametrizace. Pro některé ryze praktické operace s varietami je vhodné používat implicitní reprezentaci (tedy až dosud používané vyjádření). Např. zjištění, zda daný bod patří do variety, resp. do určité části prostoru jí vymezené, je při implicitním popisu docela snadné. Jindy je naopak daleko užitečnější vyjádření parametrické (např. jsme jej již použili při kreslení obrázků). Varieta V3(x + y + z — 1, * + 2y — z — 3) je přímka (průnik dvou rovin). Rešíme-li systém x + y + z - 1 = 0, * + 2y-z-3 = 0, dostaneme přímo parametrické vyjádření této přímky x = -1 - 3ř, y = 2 - 2r, z = t. . | Racionální parametrizace |_„ Definice. Racionální parametrickou reprezentací variety 2J(/i, ■ ■ ■, fr) c K" rozumíme racionální funkce r\, ..., r„ e K(řj, ..., ts) splňující následující podmínky • je-li xi — r,-(ři, ..., řj) pro i — 1,2,...,«, pak (x\, ..., xn) e 2J(/i, ..., fr) pro libovolná t\,..., ts; • 2J(/i, ■ ■ ■, fr) je minimální afinní varieta obsahující takto dané body (x\, ..., xn). i_ Všimněme si, že při parametrizaci nepožadujeme popis všech bodů variety. To je podstatné, jak je vidět i na jednoduchém příkladu parametrizace kružnice v rovině, 2ř -1+ř2 kterou obdržíme tzv. stereografickou projekcí. (Ověřte si detailně!) Všimněme si, že skutečně dostaneme parametrizací všechny body, kromě bodu (0, 1), ze kterého promítáme. Ten totiž není dosažitelný pro žádnou hodnotu parametru t. To není způsobeno naší nešikovností, z rozdílných topologických vlastností přímky a kružnice totiž vyplývá, že globální bijektivní racionální parametrizace existovat nemůže. V této souvislosti se nabízí další otázky. D. Existuje parametrizace dané variety, resp. lze ji nalézt? E. Naopak umíme k parametricky zadané varietě najít její implicitní popis? Obecná odpovědna otázku D je obecně záporná. V podstatě lze tvrdit, že většinu afinních variet parametrizovat nelze, respektive neexistuje algoritmus parametrizace implicitního popisu. 670 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.84. O polynomu p ■ + x5 + Ax4 + 2X3 + 5X2 + x + 2 vite, že má vícenásobný kořen x = i. Rozložte jej na ireducibilní polynomy v CM, R[x], Z2[x], Z5[x] a Z7[x]. Polynom q = x2y2 + y2 + xy + x2 y + 2y + 1 vydělte se zbytkem ireducibilními faktory polynomu p v R[x] a výsledek využijte k vyřešení soustavy polynomiálních rovnic p = q = 0 nad C. Řešení, p = (x2 + í)2(x2 + x + 2), v Z2: p = x(x + l)5, v Z5: p = (x - 2)2(x + 2)2(x2 + x + 2),vZ7:p = (x2 + l)2(x + A)2. Pro druhý polynom dostáváme q = (y2 + y)(x2 +x + 2) — y2 (x + 1) + 1 a í = (y2 + XK*2 + 1) + y(x + !) + !. Je-li tedy x = a kořenem + x + 2, tj. a = — \ ± \i*Jl, pak je y J=. Pokud x __1_ kořenem faktoru x2 + 1, tj. fi = ±i, pak je y 11.85. Rozložte na ireducibilní faktory R[x] a poté v C[x] polynom /S je □ Ax5 - Sx4 + 9x3 - Ix2 + 3x - 1. O 11.86. Rozložte na ireducibilní faktory v M[x] a poté v C[x] polynom x5 + 3x4 + lx3 + 9X2 + 8x + A. O 11.87. Rozložte polynom x4 - Ax3 + l(k2 - 12* + 9 nad K a nad C. O 11.88. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte jeho rozklad na ireducibilní faktory: x5 + x2 + 2x + 1. O 11.89. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte jeho rozklad: x4 +2X3 + 2. O 11.90. Určete všechny normované ireducibilní polynomy stupně 2 nad Z5. Řešení. Polynomy určíme vylučovací metodou. Ze všech polynomů stupně dva nad Z5 vyloučíme všechny, které nejsou ireducibilní, tedy mají kořen. x2 ± 2, x2 ± x + 2, x2 ± 2x - 2, x2 - x ± 1, x2 ± 2x - 1. □ Na první pohled je zřejmé, že pro jednu a tutéž varietu existuje více implicitních, případně i parametrických popisů. Nejednoznačnosti implicitního jsou způsobeny reprezentací pomocí několika „generujících" polynomů a zjevně máme velikou volnost v jejich volbě. 11.29. Ideály. Abychom se vyhnuli závislosti na jednotlivých zvolených rovnicích zadávajících varietu, budeme chtít uvažovat i všechny důsledky zadaných rovnic. To vede na následující algebraický pojem: _J Ideály j___ Definice. Množinu ícl, kde K je komutativní okruh, nazveme ideálem, platí-li 0 e I a zároveň f e I, h e K f-hel. Ideály můžeme generovat podmnožinami, budeme používat značení I — {a\, ... ,an). Tím máme na mysli {^íZ;Ŕi, b i Množina generátorů může být také nekonečná. Je-li generátorů jen konečný počet, říkáme, že ideál je konečně generovaný. ___J Ideál variety j___.- Pro varietu V = 2J(/i, ■ ■ ■, fs) klademe 3(V) := j/6Í[n,...,i„]; f (au ... ,an) = 0, V (au ,an) e V}. Lemma. Nechť fu ■ ■ ■, fs, gu ■ ■ ■, gt 6 K[x\, ..., xn]jsoupolynomy. Pak platí (1) jestliže (/i, ..., fs) = {gu-..,g,}, pak K(fu ■■■,&) = (2) 3(V) je ideál a platí (f\,...,fs) c 3(V), kde V- = 2J(/i,...,/s). Důkaz. Jestliže nějaký bod (a\,...,an) patří varietě 23(/l, ..., fs), v tomto bodě se jistě nuluje i jakýkoliv polynom f = h1f1 + --- + hsfs, tj. libovolný prvek ideálu I = (fu ..., fs). Proto se v něm dle předpokladu nulují i všechny polynomy g,. Ověřili jsme tedy 2J(/i,..., fs) c 2J(gl,...,g(). Opačná inkluze se dokáže stejně. Abychom ověřili druhé tvrzení, zvolme g, g' e 3(V), h e K[xi, x„]. Pak zjevně pro každý bod a e V (gh)(a) = 0^ghe 3(V), (g + g')(a) = 0^ g + g' e3(V). Je tedy 3(V) ideál v K[x\,...,x„]. Pro libovolný f = h\ f\ + • • • + hs fs e (f\, ..., fs) a bod a e V je samozřejmě také f (a) = 0, což ověřuje i dokazovanou inkluzi. □ 671 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY y i Obrázek i. VOix3 + x2 — y2) F. Okruh polynomů více proměnných 11.91. Určete zbytek polynomu x3 y + x + yz + yzA vůči bázi (x2 y + z, y + z) a uspořádaní 3(V) 2 3(W). Neboli polynomy, které se nulovaly na nějaké varietě, se nutně musí nulovat i na její podmnožině. Můžeme hned formulovat další přirozené problémy: F. Je každý ideál / e K[x\, ..., x„] konečně generovaný? G. Lze algoritmicky zjistit, zda / e (/i, ..., fs)1 H. Jaký je přesný vztah mezi (f\, ..., fs) a J(2J(/i, ..., /s))? 11.30. Dimenze 1. Podívejme se na polynomy v jedné proměnné x f = aox" + a\x"~l + • • • + a„, kde ao 7^0. Vedoucí člen polynomu definujeme jako LT(f) ■— a^x" (označení pochází z anglického „leading term"). Zřejmě platí deg/ . Důkaz. Uvažme jakýkoliv ideál / c K[x]. Je-li / = {0),pak je generován nulovým polynomem. Jestliže / obsahuje nenulový polynom /, pak jistě obsahuje i polynom / minimálního stupně. Jistě je pak (/> c /. Pro jakýkoliv jiný polynom gel spočteme výsledek dělení se zbytkem, tj. g = q f + r. Zjevně je tedy q f e I, a proto i r e I. Stupeň / byl ale minimálni, takže nutně r = 0. Je tedy i g e I al = (f). □ Ideály generované jediným prvkem se nazývají hlavní ideály. Okruhům, které mají vlastnost z posledního lemmatu, říkáme okruh hlavních ideálů. Největší společný dělitel h = GCD(f, g) polynomů f a g lze opět spočítat algoritmicky (největší společný dělitel bude v proměnné h v okamžiku zastavení algoritmu): (1) h:=f,s:=g (2) while s/0 (a) r ■— zbytek po děleni h /s 672 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY \ 1.8 - \ \l.4- \ ^" \ y 10) \ °/~ \ r6" \ I04" \. lo.2 - Obrázek 2. %3(2x4 - 3x2 y + y2 - 2y3 + y4) (b) h--s (c) s :— r Nechť f — q ■ g + r ah — GCD(f, g). Potomh\r, g a zároveň Vp e K[x]: p\r, g, tedy p\f a p\h. Odtud h je GCD(r, g). Triviálně GCD(h, 0) = h, proto algoritmus počítá správně GCD(f, g). Protože stupně r postupně klesají, algoritmus se nutně zastaví. Největší společný dělitel dvou polynomů tedy existuje. Je určen jednoznačně až na násobek skalárem. Dva různé GCD se totiž musí dělit navzájem a to je u polynomů možné právě v tomto případě. Nej většího společného dělitele více než dvou polynomů definujeme takto: Je-li s > 2, potom GCD(fu ...,/,):= GCD{fuGCD(f2, ..., fs))- Lemma. Pro polynomy f\, ..., fs platí (GCD(f\, ..., fs)) — = . Důkaz. GCD(f\, ..., fs) dělí všechny polynomy f. Je tedy hlavní ideál {GCD(f\, ..., fs)) obsažen v ideálu (/i, ..., fs). Naopak z Bezoutovy rovnosti okamžitě plyne inkluze opačná. □ Položili jsme několik otázek. Tady jsou odpovědi pro dimenzi 11.95. Parametrizujte křivku (varietu) QJ(x3 + x2 — y2). Řešení. Parametrizaci odvodíme výpočtem průniků přímek y = tx s danou křivkou, tj parametrizujeme směrnicí těchto přímek. Technicky to znamená, že za y dosazujeme íiaz rovnice vyjádříme x pomocí ť. x3 +X2 -řx2 = x2(x + l- t) x = t - 1 V x = 0. Potom y = t2 (t — 1), nebo pro x = 0 je jediným vyhovujícím bodem na křivce y = 0. Bod [0, 0] lze získat volbou / = 1 z uvedené parametrizace, stačí tedy uvažovat pouze tuto parametrizaci. □ O něco více křivek obdržíme, když budeme v parametrizaci uvažovat podíly polynomů / = ^, g = Hovoříme pak o racionální parametrizaci. 11.96. Odvodte parametrizaci kružnice pomocí stereograrické projekce (viz obrázek) • Protože 2J(/i, ..., f„) = *XJ(GCO(/i, ..., f„)), problém prázdnosti variety se redukuje na problém existence kořene polynomu. • Ze stejného důvodu je varieta vždy konečnou množinou izolovaných bodů - kořenů GCD(f\, ..., fs) s jedinou výjimkou, kdy GCD(f\, ..., fs) — 0; to nastane pouze v případě, že f\ — fi — ■ ■ ■ — f s — 0. Pak je varietou celá množina K. • Pojem dimenze v tomto případě postrádá smysl, všechny variety mají coby diskrétní množiny bodů dimenzi nulovou. • Každý ideál je generovatelný jediným polynomem. . / e (/j,..., fs) GCD(fu ■ ■ ■, fs)\f- • Označíme-li (/> := 3f(2J(/i,..., fs)), pak / a GCD(f\,..., fs) se mohou lišit pouze násobností kořenů. 11.31. Monomiální uspořádám. Abychom mohli zobecnit dělení polynomů se zbytkem pro polynomy více proměnných, najdeme nejprve dobrý ekvivalent pojmů stupeň polynomu a vedoucí člen polynomu. Dělením se zbytkem polynomu / e K[x\, ..., x„] polynomy gl, ..., g s chceme rozumět vyjádření / =a\g\ H-----ha*,?* +r, kde žádný člen zbytku r nebude dělitelný některým z vedoucích členů LT gi. Zkusme to s / — x2y+xy2 + y2,gi — xy — \ag2 — ý2 — 1. Prvním dělením získáme f = (x+y)- gi + ix+y2 +y). LT (y2 — 1) nedělí x (vedoucí člen zbytku), a tak bychom teoreticky nemohli pokračovat dál. Přesuneme-li však toto x do zbytku, dostáváme teprve výsledek f = (x + y)-gi+g2 + (x+y + l). 673 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Řešení. Dosazením rovnice přímky y = f + 1 do rovnice kružnice, dostáváme rovnici s x2 2x J ~ ~~ s řešením x = 0 nebo parametrickým vyjádřením 2t t2 - 1 1, y ■ i + t2 i + f které však nepostihuje bod [0, 1]. □ Poznámka. Všimněme si, že tentokrát vložení reálné přímky dá pouze „skoro všechny body" parametrizované variety, jeden z nich (tj. bod, z kterého promítáme) totiž není dosažitelný pro žádnou hodnotu parametru /. To není způsobeno naší nešikovností, z rozdílných topologických vlastností přímky a kružnice totiž vyplývá, že globální parametrizace existovat nemůže. Poznámka. Protože K není algebraicky uzavřené pole, máme problémy s existencí kořenů polynomů. V důsledku toho se při malé změně koeficientů zadávající rovnice může drasticky změnit výsledná varieta. Nabízí se pracovat s komplexními polynomy v C[x, y] a jimi zadanými podmnožinami v C2. To nás nemusí nijak děsit, naopak naše původně reálné křivky jsou obsaženy ve svých „komplexifikacích" (reálné polynomy prostě chápeme jako komplexní, které mají náhodou reálné koeficienty) a pouze získáváme bohatější nástroje pro popis jejich vlastností (imaginární tečny apod.). Dále nám chybí „nevlastní body". Např. při parametrizaci kružnice můžeme chybějící bod popsat jako obraz jediného nevlastního bodu reálné přímky, tj. bodu v „nekonečnu". Těchto problémů se nejlépe zbavíme tím, že budeme pracovat v tzv. projektivním rozšíření (reálné nebo komplexní) roviny. Projektivní rozšíření je výhodné používat v celé řadě problémů, jeho využití také uvidíme při definici grupové operace na bodech eliptické křivky, viz ||H||. Zde již žádný člen zbytku není dělitelný žádným z LT(g\), LT(g2). Jak jsme ale vlastně určovali vedoucí členy? [ Uspořádání monomů |__ Úplné (lineární) dobré (tj. každá neprázdná podmnožina má nejmenší prvek) uspořádání < na W splňující Va, /3, y e Z": a < p => a + y < fJ + y nazveme monomiálním uspořádáním na K[x\, ...,x„]. Uspořádání na N" indukuje uspořádání na monomech, jakmile zvolíme pořadí proměnných x\ < x2 < ... xn. Každý polynom lze však přeskládat jako klesající posloupnost monomů (na koeficienty teď nehledíme). Následující tři definice zavádějí nejběžněji užívaná monomi-ální uspořádání. Všechna se opírají o předem dané uspořádání jednotlivých proměnných, standardně x\ > x-i > • • • > x„. Definice. Lexikografické uspořádání je takové iex P <í=^ nejlevější nenulový člen v a — fi je kladný. Gradované lexikografické uspořádání je takové grlex P \a\ > | M = I nebo a zároveň a >iex fi. Gradované opačné lexikografické uspořádání je takové greviexí8 M > nebo \a\ = \fi\ a zároveň nejpravější nenulový člen(a — fi) < 0. Tedy X\ >grevlex *2 >grevlex • • • >grevlex *n, ale pokud x > y > z, pak x2yz2 >griex xý z, ale x2yz2 iex, >griex. >greviex jsou skutečně mo-nomiální uspořádání. 11.32. Dělení se zbytkem. Nechť / = IľaeN" Je nenulový polynom v K[x\, ..., x„] a < monomiální uspořádání. Pak definujeme: • Stupeň multideg/ := maxjo: e N™, aa ^ 0), • Vedoucí koeficient LC f ■— amultideg /, • Vedoucí monom LM f := xmultides /, • Vedoucí člen LT f := LC f ■ LM f. Tyto pojmy jsou tedy pro polynomy více proměnných vesměs silně závislé na volbě konkrétního uspořádání. Lemma. Nechť f, g e K[xi, ... ,x„] a uvažme monomiální uspořádání <. Pak (1) multideg(/- g) = multideg / + multideg g, (2) f + g ŕ 0 => multideg(/ + g) < < maxjmultideg /, multideg g}. Důkaz. Plyne okamžitě přímo z definic. □ Věta. Nechť < je monomiální a F = (f\ v K[x\,..., xn\ Pak každý f e K[x\,. ., fs) s-ticepolynomů xn] lze vyjádřit jako + asfs +r, 674 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.97. (Komplexní kružnice). Uvažme množiny bodů X8 = V(z2 + z\ — e) c C2 pro libovolné e e K \ {0}. Příslušné reálné křivky jsou XI = XE n ] {kružnice s poloměrem ^/ě s > 0, 0 e < 0. Budeme psát zj = xj + iyj = xj + V^-Ty/. Je tedy X8 zadáno jako podmnožina v K4 systémem dvou reálných rovnic Re(z2 + z\ - e) = x\ + x\ - y\ - y\ - e = 0, Im(z2 + z\ - e) = 2{xiyi + x2y2) = 0. Lze proto očekávat, že X8 bude „dvourozměrná plocha" v K4. Zkusíme šiji představit jako plochu v K3 ve vhodném průmětu K4 —► K3. Zvolme si za tím účelem zobrazení íp+ : {xi,x2,yi,y2) i X\, x2, x\y2 -x2y\ \ Označme ještě V podmnožinu v K4 zadanou druhou naší rovnicí, tj. V = {(xux2, yu y2); xxyx + x2y2 = 0, (xux2) ^ (0, 0)}. Zúžení zobrazení tp+ » K3 \ {(0, 0, 0)} 2 H8 a pro každé e > 0 získáme bijekci multideg a,- /; pro každé i. Polynom r nazýváme zbytkem po dělení // F. Důkaz. Věta neříká nic o jednoznačnosti výsledku. Následující algoritmus dává jedno možné řešení a je tedy důkazem platnosti věty. Nadále budeme výsledkem dělení se zbytkem chápat právě tento výstup pevně zvoleného algoritmu. (1) a\--Q,...,as := 0, r := 0, p := / (2) while p ť^O (a) i := 1 (b) d :—false (c) while i. Obrácení obecně pro naše dělení se zbytkem neplatí. Uvažujme / — xy2 —x,f\ — xy + 1, f2 — y2 — 1. Potom algoritmus dělení dá / = y(xy + 1) + Oiy2 - 1) + (-* - y), ale přitom evidentně / — x(y2 — 1), a tedy / e (f\, fi). 11.33. Monomiální ideály. Ideál / c K[ati, ... ,x„] nazýváme monomiální, jestliže existuje množina multiindexů a c N™ taková, že / je generován právě všemi monomy x" s a e A. To znamená, že všechny polynomy v / jsou tvaru Y,aeA ha**. kde ha e K[ati , ..., xn\ Zřejmě pro monomiální ideál / platí, že x13 e I, právě když existuje a e A takové, že x" dělí x13. Lemma. Nechť I c K[x\, ..., xn] je monomiální ideál, f e K[xi, ... ,x„] polynom. Pak následující tvrzení jsou ekvivalentní (D f€l, (2) každý člen polynomu f je prvkem I; (3) polynom f je lineární kombinací monomů z I s koeficienty zK. 675 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Pro e < 0 můžeme zopakovat předchozí úvahy, pouze v definici což přivodí změnu inverze : (u, v, w) \- \ -yu -yi, -y\x2 + y2x\ yí+yí ) Vw2 + v2' V«2 + v2' Nyní je opět He jednodílý rotační hyperboloid, ovšem jeho reálná část jeX| = 0. V komplexním případě můžeme pozorovat, že při spojité změně koeficientů se výsledná varieta většinou v podstatě nemění, až na jisté „kastastrofické" body, kdy může dojít ke kvalitativnímu skoku. Říká se tomu princip permanence. V reálném případě tento princip vůbec neplatí. 11.98. Projektivní rozšíření přímky a roviny. Reálný prostor Pi (K) je definován jako množina všech směrů v K2, tj. jeho body jsou jednorozměrné podprostory vektorového prostoru K2. Důkaz. Implikace (3) Zbývá ukázat (1) ==> (3). Zapišme si polynom / (2) (1) jsou zřejmé. Y^a aax", kde aa eI.Z předpo- kladu f e I vyplývá, že lze také vyjádřit / — Z^peA hpx13, kde x$ e I ahp e K[x\,...,xn\ Každý člen aa x" se musí rovnat některému členu z druhé rovnosti. Jistě tedy každý člen aajc" polynomu / můžeme vyjádřit jako součet výrazů d xl3+s ,kded eK,i^ e /. Pak ale také x* e I, a tedy platí (3). □ Důsledek. Dva monomiální ideály splývají právě tehdy, když obsahují stejné monomy. 11.34. Věta (Dicksonovo lemma). Každý monomiální ideál I — (xa, a e A) c KW, ..., x„] lze psát ve tvaru I — (xř1 , ..., x"'), kde aj.....a, 6 A. Důkaz. Důkaz provedeme indukcí podle počtu proměnných. V případě n = 1 je / c KW, I = (x* , a e A c % c N). Množina všech exponentů v A má jistě minimum a definujeme fi :— min A. Potom zřejmě x13 dělí všechny monomy xa s a e A a tedy také / = (*">. Uvažujme nyní n > 1 a předpokládejme, že pro menší počty proměnných tvrzení platí. Pro přehlednost si označíme proměnné jako xi, ..., xn-\, y a monomy budeme psát ve tvaru x"ý" , kde a e N™-1, m e N. Předpokládejme, že / c KW, ..., xn-\, y] je monomiální a definujme / c KW, ... ,x„-\ \ následovně / ■- (xa, 3m e N, xa f e I). Zřejmě je / monomiální ideál v n — 1 proměnných a tedy podle indukčního předpokladu lze psát J = (xai , ..., x"'}. Dále z definice / vyplývá, že existují taková minimální m,- e N, že x"' ý"' e Ia-Označme tedy m := maxjm,) a definujme analogicky systém ideálů Jk c KW, ..., x„-\\ pro 0 < k < m — 1 /t:=(A x? y1 eIA). Opět všechny Jk splňují indukční předpoklad a tedy je lze vyjádřit Jk = (xat'[,...,xat'Sk). Zbývá ukázat, že I je generovaný právě zkonstruovanou konečnou množinou monomů ŕ'y™, -'■'y-1, xao-'°y°, -i f-1. e I. Nastane jeden ze Uvažujme tedy libovolný monom x" yp dvou případů • p > m. Potom jistě x" e J„ k — p, a tedy některý zx"1 f , ....x"'f dělily. • p < m. Potom analogicky x" e Jk a některý z x"^x"k''t / dělí x* yP. Podle předchozího lemmatu lze každé f e I vyjádřit jako lineární kombinaci monomů z /, ty jsou již dělitelné některým z našich generátorů, proto / patří do ideálu jimi generovaného. Proto / je jeho podmnožinou. Opačná inkluze je zcela triviální a důkaz Dickso-nova lemmatu je hotov. □ 676 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Komplexní projektivní prostor Pi(C) je definován jako množina všech směrů v C2, jeho body jsou tedy jednorozměrné podprostory komplexního vektorového prostoru C2. Analogicky body reálných, resp. komplexních, dvourozměrných projektivních prostorů jsou definovány jako směry v K3, resp. C3. G. Rozšíření stereografické projekce Zkusme si nyní rozšířit definici stereografické projekce tak, aby kružnice byla parametrizována body Pi(K). Podívejme se tedy, jak bude vypadat odpovídající zobrazení Pi(K) —► P2(K2). Body vprojek-tivních rozšířeních budeme zadávat tzv. homogenními souřadnicemi, které jsou dány až na společný násobek. Např. body v P2(K) budou (x:y: z). Kružnice v rovině z = 1 je dána jako průnik kužele směrů zadaných rovnicí x2 + y2 — z2 = 0 s touto rovinou. Inverzi k stereografické projekci (tj. naši parametrizaci kružnice) můžeme nyní zapsat takto: 2t t2 - 1 (t : 1) (2t: 1 : t2 + 1). 1 + r2 r2 + l Přitom pro r 7^ 0 je (r : 1) = (2t2 : 2t) a původní stereografickou projekci (tj. inverzi předchozího zobrazení) můžeme také zapsat pomocí lineárního předpisu (x : y : z) 1-» (y + z : x), který rozšiřuje naši parametrizaci i na nevlastní bod (0 : 1) 1—> (0:1: 1). Zobrazení celého Pi(K) na kružnici má pak „lineární*' zápis Pi(K) 3 (x : y) \-+ (2x : x - y : x + y) e P2(K). Podívejme se ještě, jak jednoduché je spočíst přímo vzorec pro stereografickou projekci v projektivních rozšířeních (viz 4.33): Vložíme si Pi(K) jako body s homogenními souřadnicemi (/ : 0 : 1) a mezi lineárními kombinacemi bodů (0 : 1 : — 1) (tj. pól, ze kterého promítáme) a (x : y : z) (obecný bod kružnice) musíme najít ten, který má souřadnice (u : 0 : v). Jediná možnost je bod (x : 0 : z + y), což je náš předchozí vztah. H. Eliptické křivky Singulárním bodem nadplochy vP", zadané homogenním polynomem F(x0,xu ...,xn) = 0, rozumíme bod, pro který je |£- = 0 pro i = 1,..., n. Geometricky se pak v singulárním bodě děje „něco divného". Podmínka na nulovost všech parciálních derivací znamená v případě 11.35. Hilbertova věta. Nyní již máme nachystáno vše potřebné pro diskusi pěkných bází ideálů v okruzích polynomů. Hlavní myšlenkou je maximální využití infor-S2==᧣í3 mací o vedoucích členech prvků v bázi a v celém ideálu. Je-li I c K[xi, ... ,xn] nenulový, označíme LTI := {axa; 3/ e /: LT f =ax*}. Zřejmě {LT I) je monomiální ideál, proto podle Dicksonova lemmatu lze psát {LT I) — (LT gi, ..., LTgs) pro nějaká vhodná gi,...,gsel. Věta. Každý ideál I e K[xi, ..., x„] je konečně generovaný. Důkaz. Pokud jel = {0}, je tvrzení triviální. Uvažujme tedy I 7^ {0}. Podle Dicksonova lemmatu a předchozí poznámky existují taková gi,. ..,gsel,že (LTI) = (LT gu ..., LT gs). Zřejmě (g\, ..., gs) c /. Vezměme libovolné f e I a provedine dělení se zbytkem s-ticí gi, ..., gs. Dostáváme / =a\g\ H-----Vasgs +r, kde žádný člen r není dělitelný LT g\, ..., LT gs. Protože r — f — a\g\ — ... — asgs, platí r e I, a tedy také LT r e LT I. Zřejmě tedy LT r e (LT I). Připusťme, že r 7^ 0. Protože (LT I) je monomiální, musí být LT r dělitelný některým z jeho generátorů, tj.Lrgi, ... ,Lrgs.Toje ovšem spor s výsledkem algoritmu dělení. Proto r — 0 a I je generovaný Grôbnerovy báze ideálů 11.36. Definice. Konečná množina generátorů gi, gs ideálu I c k[xi,...,x„] se nazývá Grobnerova báze, jestliže platí (LTI) = (LTgi,...,LTgs). Báze použitá v důkazu Hilbertovy věty byla Grobnerova. Důsledek. Každý ideál I c K[x\, ..., xn] má Grobnerovu bázi. Přitom každá množina polynomů gi, gs 6 I splňující (LT I) = (LT gi, LT gs) je Grobnerovou bází ideálu I. Ukažme smysl předchozích obecných výsledků na nejjed-nodušším případě polynomů stupně jedna s lexikogra-flckým uspořádáním. Označme generátory fi = J2j ai.jxj + ai.o- Uvažujme matici A = (a,j), kde i = 1.....s aj — 0, ... ,n a aplikujme na ni Gaussovu eliminaci. Získáme B — (bij) ve schodovitém tvaru, z ní navíc vypustíme nulové řádky. Máme novou bázi g\, ... ,gt, kde t < s. Vzhledem k provedeným úpravám je každé f j vyjádřitelné jako lineární kombinace g\, ..., gt,a tedy (/l, fs) = (gl, . . .,gt). Ověříme si, že takto získané polynomy g\, ..., gt jsou Grobnerovou bází. Bez újmy na obecnosti předpokládejme, že proměnné jsou značeny tak, že LM g; = x; pro i — l,... ,t. Libovolný f e I lze psát / = hifi H-----Vhsfs = h\gi H-----h h'tgt. Chceme, aby LT f e (LTgi, ..., LTgt), tj. LT f má být dělitelný některým z x\, ..., xt. Předpokládejme, že / je pouze 677 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY křivky v projektivním prostoru P2(R), že v daném bodě není definována tečna k uvažované křivce. To znamená, že na křivce je tzv. bod zvratu (anlicky cusp), nebo se křivka sama protíná. „Pěkná" singularita je třeba u „čtyřlístku", tj. varietě dané nulovými body polynomu Bod zvratu je můžeme pak najít na křivce dané v K2 rovnicí x3 y2 = 0. y o Eliptickou křivkou C rozumíme množinu bodů v K2, kde K je nějaké těleso, splňující rovnici y2 = x3 + ax + b, v proměnných xt+\, ..., xn. Pak ale h\ — 0, protože x\ je vzhledem ke schodovitosti B pouze v gi. Analogickým postupem získáme h'2 = ■ ■ ■ = h't — 0, a tedy / = 0. Dokázali jsme sice existenci nadějných zvláštních bází, zatím je ale neumíme algoritmicky konstruovat. K tomu se dostaneme v následujících odstavcích. 11.37. Věta. Nechť G — {g\, ..., gt] je Grobnerova báze ideálu I c K[xi, ..., x„] a f je polynom v K[x\,..., x„]. Pak existuje právě jedno r = aaxa e K[xi, ..., x„] s těmito vlastnostmi: (1) žádný člen r není dělitelný žádným z LT g\, ... ,LT gt, tj. VaVi: ĽTgilaay?; (2) Igel: f = g + r. Důkaz. Algoritmus pro dělení se zbytkem dá / =a\gi H-----Vatgt +r, kde r splňuj e podmínku (1). Zag si zvolme a\g\ H-----Vatgt, které samozřejmě patří do /. Zbývá dokázat jednoznačnost. Předpokládejme f = g + r = g' + r, kde r^/. Zřejmě platí r — ť — g' — g e I. Protože G je Grobnerova báze, je ĽT(r — r') dělitelný některým z ĽTg\, ..., ĽT gt. Máme přitom jen dvě možnosti • LMr ^ LMr'. Pak ten s vyšším stupněm musí být dělitelný některým z vedoucích členů ĽT g\, ..., LT gt, což je spor s podmínkou (1). • LMr — LMr1 a zároveň LCr ^ LCr'. Potom ale oba monomy LMr a LMr' musí být dělitelné některým z LT gi, ..., LT gt, což je opět spor. Proto tedy LT r = LT r1 a induktivní úvahou odtud plyne r — r1. □ Předchozí věta zobecňuje dělení se zbytkem, kde na místě dělitele vystupuje ideál. V případě jedné proměnné nebylo co zobecňovat, protože každý ideál byl generovaný jedním polynomem. Zajímá-li nás pouze zbytek, věta navíc říká, že nezáleží na pořadí polynomů v Grobnerově bázi. Proto má smysl zavést značení / pro zbytek po dělení f IG, pokud G = (gi, ..., gs) je Grobnerova báze. Důsledek. Nechť G = {gl, ■ ■ ■, gt) je Grobnerova báze ideálu I c K[x\, ..., x„] a f je polynom v K[x\, ... ,x„]. Pak je libovolný polynom f prvkem ideálu I, právě když je zbytek po dělení fl G nulový. 11.38. Syzygy. Dalším krokem bude nalezení dostatečné „testovací množiny" polynomů z daného ideálu, které je třeba prověřit dělením se zbytkem, abychom mohli usoudit, že je uvažovaný systém generátorů již Gröbnerovou bazí. Pro a — multideg faß — multideg g uvažme y ■— (yi, ..., y„), kde y; = max{a;, /?,). Monom xy nazýváme nejmenším společným násobkem (least common multiple) monomů LM f a LM g a zavádíme označení LCM(LM f, LM g) := xy . Výraz xy xy LT f LT g nazýváme ^polynomem (nebo také syzygy, neboli spřežení) polynomů /, g. M 678 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY kde a, b e K. Přidává se též podmínka nesingularity, což nad tělesem reálných čísel znamená, že A = -16(4a3 +27b2) ŕ 0. Výraz A nazýváme diskriminantem dané rovnice. Upozorněme, že v definici křivky se na pravé straně definující rovnice objevuje kubický polynom bez kvadratického člene. Tomuto zápisu se říká Weierstrasův tvar rovnice eliptické křivky. 11.99. Dokažte, že křivka y2 = x3 + ax + b v K2 má singularitu, právě když 4a3 — 27b2 = 0. Řešení. Rovnice křivky v homogenních souřadnicích (viz 4.33) zní F(x, y, z) = 0, kde (11.1) F(x,y,z) = y2z-x3 -axz2-bz3. Máme dF , , — = -3x - az , ox dF dF 9Ž" 2yz, y2 — 2axz — 3bz2. Nechť [x,y,z]je singulárním bodem dané křivky. Pokud by z = 0, tak z nulovosti parciálních derivací polynomu F podle x, resp. podle z, vyplývá x = 0, resp. y = 0. To je však „aut", neboť bod [0, 0, 0] není bodem uvažovaného projektivního prostoru P2 (K). Pro singulární bod tedy z^Oa proto z |j = 0 dostáváme y = 0. Označíme-li y = pak z — 3x2 ■ az 0 vyplývá 3 y -a a z rovnice y2 — 2axz 3bz2 = 0 plyne 2ay = —3b. Vidíme, že rovnost a = 0 vynucuje i b = 0, tedy rovnost 4a3 = 27b2 je triviálně splněna. Pokud a ^ 0 pak vyjádříme y ze dvou získaných rovnic. Z jedné je y = —ze druhé pak y2 -§. Celkem 4a3 + 27b2 = 0. a _ 9b2 ~3~4~ď Jeden směr implikace je tak dokázán. Obráceně, pokud 4a3 + 27b2 = 0, pak pokud definujeme y vuje rovnici eliptické křivky: , tak bod [y, 0, 1] vyho- V 3b 0. 2 2 Vzhledem k volbě y jsou pak i všechny tři parciální derivace v bodě [y, 0, 1] polynomu F nulové. □ Jedná se o nástroj k eliminaci vedoucích členů, Gaussova eliminace je speciálním případem tohoto postupu pro polynomy stupně jedna. Na rozdíl od ní ale může dojít ke zvýšení stupně, i když původní vedoucí členy odstraní. Vezměme například / = x3 y2 —x2 y3 +x, g = 3x4 y+y2, tedy polynomy stupně 5 v M.[x, y] a uspořádání y? Pokud ne, najděte ji. Řešení. Vedoucí monomy jsou zřejmě LT(g\) = x2, LT(g2) = xy, a proto je jejich S-polynom roven Sigugi) = ygi -xgi = -xy2. Podle věty 11.38 je g\, g2 Grôbnerova báze právě tehdy, když je zbytek po dělení tohoto S-polynomu bázovými polynomy nulový. Dělením se zbytkem, viz 11.32, ovšem dostáváme S(gu gi) = ygi - xg2 + yg2 - Ý ■ Zbytek y3 ukazuje, že daná báze není Grôbnerova. Abychom ji vytvořili, musíme podle 11.39 právě tento polynom, g3 = y3, přidat k polynomům g\, g2- Nyní spočítáme S{g\,gi) = ýg\ -x2g3 = o S(g2,g3) = y2g2-xg3 = y4 ^3- Odtud vyplývá podle věty 11.38, že g\,g2,g3 už je Grôbnerova báze. □ 11.103. Je báze g\= xy — 2y, g2 = y2 — x2 Grôbnerova pro lexikografické uspořádání y > xl Pokud ne, najděte ji. Řešení. Protože LT(g\) = xy a LT(g2) = y2, má příslušný S-polynom má tvar S(gu g2) = yg\ - xg2 = x3 - 2y2 = -2g2 + x3 — 2x2. Vedoucí člen x3 není násobkem vedoucího členu xy ani y2, a proto nejde o Grôbnerovu bázi. Tu dostaneme přidáním polynomu g3 = x3 — 2x2. Potom totiž S(gugi) =x2gi -yg3 = Q a S(g2, gi) = x3g2 - y2g3 = 2y2x2 - x5 = = (4y + 2xy)gx - (x2 +2x + 4)g3 + Sg2. □ Dělením získáme xz + y2 = z(x +ý) + y(y — z), a tedy daná báze je Grôbnerova. Následující algoritmus využívá přesně tento postup pro nalezení nějaké Grôbnerovy báze ideálu generovaného s-ticí polynomů F = (/i,...,/s). (1) G ■- F, G' ■- 0 (2) while G ŕ G' (a) G' := G (b) y p, q e G': p ^ q do (i) s := S(p, q) (ii) if s ^0 G ■- G U {s} Když se algoritmus zastaví, jistě to bude v G Grôbnerova báze. Musíme tedy už jen ověřit, že se skutečně zastaví. V jeho průběhu ovšem při každém běhu vnitřním cyklem (2), tj. když se přidává nějaký netriviální zbytek po dělení, buďmonomiální ideál generovaný ĽT G vzroste nebo zůstane stejný. Dostáváme tedy neklesající řetězec (monomiálních) ideálů I\ = LT(F) c I2 c ... c c li c .... Označíme-U nyní I = U^j/j, pak jde jistě o ideál a podle Hilbertovy věty musí být konečně generovaný. To ale znamená, že všechny generátory I jsou již v některém z h a proto od tohoto k počínaje bude platit It = h+\ = ■ ■ ■ -6 Stabilizace tohoto řetězce monomiálních ideálů hlavních členů je ale ekvivalentní zastavení algoritmu. Tento algoritmus ovšem není zdaleka ideální. Lze vymyslet velmi jednoduše vypadající vstupy, pro něž vrací divoké výsledky. Dále výstupní báze se přímo odvíjí od vstupní, a tedy pro tentýž ideál zadaný různými bázemi dá také různé výsledky. 11.40. Redukce bází. Viděli jsme, že k rozpoznání, které gene-,.jf' i rátory jsou potřebné pro Grôbnerovu bázi, stačí sledovat tjejich vedoucí členy. Prvním krokem v naší diskusi bude prosté vyházení všech prvků, které v tomto smyslu nejsou i třeba. Lemma. Nechť G je Grôbnerova báze ideálu I a p e G takový, Že LT p e (ĽT(G \ {p})}. Pak G — {p} je také Grôbnerova báze L Důkaz. Z definice Grôbnerovy báze platí (ĽT I) = (ĽTG). Protože ĽT p e (LT(G \ {p})), platí (LT(G \ {p})) = (ĽTG). Odsud již plyne tvrzení. □ Definice. Minimální Grobnerovou bází ideálu I je taková Grôbnerova báze G, že pro všechna p e G platí LC p = 1 a zároveň LTpi (LT(G-{p})). Například mějme M,[x, y] a h - 2y2 x). Zmíněný algoritmus dá pět polynomů F = (/j,...,/5): F = (x3 - 2xy, x2y - 2y2 + x, -x2, -2xy, -2y2 + x). Přitom platí ĽT f\ = x3 = —xĽTf3aĽTf2 = — \xĽT fn atedy f\ a f2 jsou zbytečné. Tato redukce nám ale jistě ještě nestačí, protože k redundanci může docházet i na úrovni jednotlivých členů bázových prvků. Např. si můžeme všimnout, že pro každé a je angličtině se podmínce stabilizace každého neklesajícího řetězce ideálů říká ACC, „ascending chain condition". Okruhy, které splňují ACC, se nazývají Noetherovské (na počest Emy Noether). Hilbertovu větu proto také lze formulovat jako tvrzení „okruh polynomů nad noetherovským okruhem je opětnoetherovský". 681 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.104. Eliminujte proměnné v ideálu / = (x2 + y2 + z2 - 1, x2 + y2 + z2 - 2x, 2x - y - z) Řešení. Eliminace proměnných dosáhneme nalezením Grôbnerovy báze vzhledem k lexikografickému monomiálnímu uspořádání. Označme polynomy v ideálu / po řadě gi,gi,g3- Redukcí gi = gi + 1 — 2x dostáváme redukovaný polynom f\ = 2x — 1. Tímto polynomem redukujeme g3 = fi + 1 — y — z na f2 = y + z — 1. Nyní zredukujeme i g\ vydělením f\, f2 a dostaneme £i = (^ + ^)/i + y2+z2-i l/2x} minimální Grôbnerovou bází y2 + z2 - 1 = (y - z + l)/2 + 2Z2 - 2Z + 1 Odtud fy = 8z2 — 8z + 1 • Vidíme, že v tomto případě jsme si vystačili s redukováním polynomů a že žádný jiný polynom přidávat nemusíme. Báze ideálu / s eliminovanými proměnnými je / = (2x — 1, y + z — I, 8z2-8z+l>. □ II. 105. Najděte řešení soustavy polynomiálních rovnic x2y-z3 2xy — 4z z-Ý--x3 -Ayz- :0, : 1, : 0. Řešení. Nejlépe pomocí nějakého výpočetního programu zjistíme, že pro příslušný ideál {x2y - z3,2xy - 4z - l,z - y2, x3 - 4yz) je Grôbnerova báze vzhledem k lexikografickému monomiálnímu uspořádání rovna (1), a proto soustava nemá žádné řešení. □ 11.106. Nalezněte Grôbnerovu bázi variety v K3 danou parametricky pomoo 3u + 3uv — u , 3v + 3u2v — v3, 3u2 - 3v2. {x2 + axy, xy, y2 uvedeného ideálu. Proto zavádíme následující pojem: ________J Redukovaná Grôbnerova báze Polynom g e G nazveme redukovaný pro bázi G, pokud žádný z jeho monomů neleží v (ĽT(G \ {g})}. Redukovanou Grôbnerovou bází ideálu I potom nazveme takovou Grôbnerovu bázi G, že pro všechna p e G platí LC p = 1 a zároveň p je redukovaný pro G. Jedná se o Enneperovu plochu, jejíž obrázek můžete najít na straně 668. Zjevně je každá redukovaná Grôbnerova báze minimální a navíc platí: Tvrzení. Je-li polynom g redukovaný pro nějakou minimální Grôbnerovu bázi G ideálu I, pak je také redukovaný pro každou minimální Grôbnerovu bázi G' téhož ideálu, která jej obsahuje. Důkaz. Tvrzení dokážeme sporem. Uvažme G = {gi, ..., gs}, G' = {g[, g't} a zvolme člen m polynomu g, kde m e (ĽT(Gr — {g})} (tj. g není redukovaný pro G'). Potom m = a\ ĽT g[ + • • • + atLT g't pro nějaké vhodné polynomy a\, ..., at. Protože G i G' jsou Grôbnerovy báze téhož ideálu, platí (ĽT G) = (ĽT G'}, a tedy každé ĽT g'i lze vyjádřit jako kombinaci ĽTg\, ... ,ĽTgs. Odtud už plyne m e (ĽTG), a protože je G' minimálni, je m e (ĽT(G \ {g})), což je spor s předpokládanou redukovaností g pro G. □ Nyní již máme vše připraveno pro důkaz hlavního výsledku o existenci a jednoznačnosti redukované Grôbnerovy báze. 11.41. Věta. Nechť I c K[xi, ..., xn] je nenulový. Pak pro každé monomiální uspořádání existuje právě jedna redukovaná Grôbnerova báze ideálu I. Navíc každou Grôbnerovu bázi lze algoritmicky redukovat. Důkaz. Předpokládejme, že G je Grôbnerova báze ideálu I. S ohledem na lemma z předchozího odstavce lze předpokládat, že G je i minimální. (Algoritmus minimalizace je zřejmý, stačí testovat pouze dělitelnost vedoucích monomů v jakémkoliv pořadí a vypouštět nadbytečné členy báze.) Předpokládejme, že polynom g e G není redukovaný. Při dělení g/(G \ {g}) se tedy ĽT g nutně dostane do zbytku, protože nemá čím být dělitelný (báze je minimální). Tedy ĽT(gG^'lSh = ĽT g, protože nic jiného už nemůže být vedoucím členem zbytku. Označme í':=?G^, G':=(G\{g})U{g'}. Tento nový systém generátorů G' je opět minimální Grôbnerovou bází ideálu I, protože (ĽTG') = (LTG), tj. také platí (ĽT G') = (ĽT I). Polynom g' je zřejmě redukovaný pro G' díky vlastnostem algoritmu pro dělení. Byl-li nějaký h ^ g redukovaný pro G, zůstává podle předchozího tvrzení z předchozího odstavce redukovaný i pro G'. Při každé provedené redukci některého z prvků dojde ke znížení celkového počtu členů ve všech polynomech v redukované Grobnerově bázi. Proto se algoritmus zastaví v okamžiku, kdy už jsou všechny prvky redukované a máme tedy algoritmus konstrukce redukované Grôbnerovy báze. Zbývá dokázat její jednoznačnost. Předpokládejme dvě redukované Grôbnerovy báze G, G nenulového ideálu I. Platí tedy (LTG) = (ĽT I) = (ĽTG}. Protože tento ideál je monomiální, 682 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Řešení. Aplikace elirninační procedury (např. v systému MAPLE za použití gbasis s uspořádáním plex) dá odpovídající implicitní popis, tj. rovnici s jediným polynomem devátého stupně: - 59049z - 104976z2 - 6561 v2 - 72900z3 - 18954y2z- - 23328z4 + 32805zV + 14580zV + 3645zV - 1296/z- - 16767y2z2 - 6156y2z3 - 783y2z4 + 3936ÓZ*2 + 19683*2- - 1296y4 - 2430z5 + 432z6 + 108z7 + 486zV - 432y4z2+ + 54y2z5 + 27zV - 48y4z3 + 15y2z6 - 64y6 - z9. □ Jak si ukážeme na následujícím jednoduchém příkladu, Grôbnerovu bázi lze využít i při počítání některých celočíselných optimalizačních úloh. 11.107. Jaký je minimální počet bankovek potřebný k zaplacení 77700 Kč? Uvažujte nejprve, že k dispozici máte bankovky v hodnotě 100 Kč, 200 Kč, 500 Kč, 1000 Kč. Potom předpokládejte, že máte i bankovku 2000 Kč a na konec předpokládejte, že nemáte bankovky 2000 Kč, ale máte bankovky v hodnotě 5000 Kč. Řešení. Označme si bankovky po řadě proměnnými s, d, p,t, D, P. Platbu bude reprezentovat polynom v těchto proměnných tak, že exponent každé proměnné bude určovat počet použitých příslušných bankovek. Naříklad, pokud zaplatíme pouze ve stokorunách, bude příslušný polynom q . Pokud zaplatíme deseti tisícikoruny, deseti pětise- tkorunami a stokorunami, pak bude q = tw pws621. V prvním případě bude počet bankovek 777, ve druhém 10 + 10 + 627 = 647. Pokud máme pouze bankovky s,d, p,t, pak má ideál popisující vztah jednotlivých bankovek tvar lx = (s2 -d,r p,sW-t). Abychom minimalizovali počet použitých bankovek, spočítáme Grôbnerovu bázi vzhledem ke gradovanému opačnému lexikografickému uspořádání (chceme eliminovat malé bankovky) 1 , s2 — d, <ř — sp, sd2 — p). Nyní vezmeme libovolný polynom reprezentující danou platbu. Redukcí tohoto polynomu vzhledem k bázi G\ dostaneme polynom, jehož stupeň je pro naše monomiálního uspořádání minimální a je jednoduché si rozmyslet, že to je právě polynom reprezentující optimální platbu. Vezměme tedy např. q = s111. Redukce vzhledem ke Gi je pak t11 pd. To znamená, že optimální platba v prvním případě je 77 tisícikorun, jedna pětisetkoruna a jedna dvousetkoruna. Dohromady tedy 79 bankovek. lze pro něj aplikovat Dicksonovo lemma. S odvoláním na konstrukci báze v jeho důkazu lze tvrdit, že existuje právě jedna mono-miální báze monomiálního ideálu tak, že koeficienty jejích členů jsou rovny jedné a žádný z členů této báze nedělí jiný. Podle definice minimaUty musí být LT G i LT G právě takovou bází. Tedy LT G = LT G. Ke každému g e G tedy existuje právě jedno g e G takové, že LT g = LT g. --g Platí g — g e I. Protože G je Grôbnerova, platí g — g = 0. Členy LT g,LT g se odečtou už v g — g. Protože obě báze jsou redukované, nemůže být žádný ze zbývajících členů g — g dělitelný kterýmkoli z LT G = LT G. Musí se tedy dostat do zbytku. Platí tedy --g g-g=g~g ' ■- 0. Tím je jednoznačnost dokázána. □ 11.42. Poznámky. Máme již k dispozici několik odpovědí na dříve položené otázky. Umíme totiž účinně rozhodnout o příslušnosti polynomu do daného ideálu pomocí dělení se zbytkem prostřednictvím Grôbnerovy báze. A umíme také pomocí redukovaných Grôbnerových bází rozhodnout, zda jsou dva ideály stejné. Pro náš problém řešení systémů polynomiálních rovnic to znamená, že pro daný systém polynomiálních rovnic umíme rozhodnout, zda nějaká jiná polynomiální rovnice patří do jimi generovaného ideálu. Umíme také o dvou různých systémech algoritmicky rozhodnout, zda generují stejný ideál svých důsledků. Při těchto algoritmických konstrukcích bude záležet na zvoleném uspořádání monomů, samotné odpovědi na výše uvedené otázky ale na uspořádání nezávisí. Jak jsme zmiňovali v úvodu kapitoly, technika Grôbnerových bází je jedním ze základů počítačové algebry. Samozřejmě jsou při implementacích v programových systémech využita různá zlepšení výše uvedeného algoritmu. Např. je možné využít techniky redukcí již během vytváření Grôbnerovy báze v základním algoritmu z odstavce 11.39 apod. V literatuře lze dohledat také různé varianty pro nekomu--i• » tativní algebraické objekty (např. při formálních manipu- tlacích s diferenciálními operátory). Algoritmus pro nalezení Grôbnerovy báze lze také interpretovat jako speciální i případ Knuth-Bendixova algoritmu pro přepisovací pravidla řešící problém ekvivalentnosti slov v monoidech zadaných generátory a sadou rovností. Konečně v samotné komutativní algebře je technika Grôbnerových bází použitelná daleko sofistikovaněji. Při průchodu naším algoritmem totiž dostáváme syzygy všech dvojic generátorů konečné báze. Tyto syzygy jsou vlastně bází tzv. podmodulu všech relací mezi k prvky g\,..., g t báze, tj. podmnožiny 5 v prostoru (K[x\, ..., xn])k. Na takové podmnožiny opět můžeme rozšířit samotný algoritmus a najít význačné generátory všech relací mezi generátory. Takto můžeme pokračovat, dokud existují nějaké netriviální relace. Lze dokázat, že nejpozději po n takových krocích už žádné netriviální relace nebudou existovat a počty generátorů relací v jednotlivých krocích nám dávají velmi podrobnou informaci o topologických vlastnostech příslušné afinní variety 2J(gi,...,gt). 683 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY V druhém prípade, kdy máme i bankovku D, je ideál h = (s2 —d, s5 p, sw — t, s20 — D) ajeho Grôbnerova báze je G2 = (t2 — D, p2 — t, s2 — d, d3 - sp, sd2 - p). Redukce q vzhledem ke G2 dá D3itpd, takže tentokrát zapl- P, p2 -t,s2- d, d3 - sp, sd2 - p), tíme 41 bankovkami. Ve třetím případě je I3 = (s2 —d,s5 — p, su t, s50 - P) a G3 = a redukce je proto rovna P1512 pd. V tomto případě tedy potřebujeme pouze 19 bankovek. Tuto jednoduchou úlohu lze samozřejmě vyřešit rychle prostou úvahou. Uvedený postup používající Grôbnerovu bázi ovšem dává univerzální algoritmus, který lze automaticky použít pro vyšší částky a jiné, složitější případy. □ Grôbnerovy báze najdou využití i v robotice. Konkrétně v inverzní kinematice, kde se zjišťuje, jak nastavit jednotlivé klouby robota, aby dosáhl určité pozice. Taková úloha často vede na soustavu nelineárních rovnic, kterou lze vyřešit právě pomocí nalezení Grôbnerovy báze, viz následující příklad. 11.108. Uvažujme jednoduchého robota znázorněného na obrázku, který se sestává ze tří rovných částí délky 1, které jsou spojeny nezávislými klouby, které umožňují libovolné úhly a, fi, y. Tímto robotem chceme shora uchopit předmět ležící na zemi ve vzdálenosti x. Jak je potřeba nastavit úhly a, fi, y 7 Načrtněte konfiguraci robota pro x = 1, l,5a\/3. Řešení. Uvažujeme přirozeně souřadný systém, ve kterém počátek ro-botické ruky leží v počátku a zem odpovídá ose x. Z elementární trigonometrie plyne, že celkový x-owý dosah robota při úhlech a, fi, y bude roven x = siná + sin(a + B) + sin(a + B + y). Podobně dosah robota ve svislém směru bude y = cos a + cos(a + B) + cos(a + B + y). Podmínka uchopení předmětu shora je zřejmě ekvivalentní podmínce a + B + y=jt,a proto zadání úlohy vede na soustavu sin a + sin(a + B) = x, cos a + cos(a + B) — 1 = 0. Abychom z této soustavy udělali soustavu polynomiálních rovnic, zavedeme nové proměnné s\ = sin a, c\ = cos a, s2 = sin fi, c2 = cos B, které samozřejmě splňují s\ +c\ = 1 a s\ +c\ = 1. S využitím základních trigonometrických rovnic pro součty v argumentu pak předchozí 11.43. Eliminace proměnných. Na závěr této části si uvedeme alespoň jednu aplikaci předchozích algoritmů. Budeme považovat okruh K[xp+\, ..., xn] *í5*ř Za Podo'íru'1 ^t*!' ■ ■ ■ ■ xn\- Jedná se o polynomy, y@t=t- - v nichž se nevyskytují proměnné x\.....xp. Je to skutečně podokruh, ale už ne ideál. I Eliminační ideály j__, Nechť / = ..., fs) c K[xi, x„]. Pro p = 1, ..., n definujeme Ip ■-ir\K[xp+1,...,xn]. Tuto množinu nazveme p-tým eliminačním ideálem. Všimněme si, že Ip je ideálem pouze v K[jcp+i , ...,x„]. Na úrovni polynomiálních rovnic Ip obsahuje všechny rovnice, které jsou důsledky systému f\ — 0, ..., fs — 0 a ve kterých vystupují pouze proměnné xp+ \, ... ,x„. Věta (Eliminační věta). Nechť I c K[xi, ..., x„] je ideál, G = {gi, gm] jeho Grôbnerova báze vzhledem k iex X2 >iex ■■■.Potom pro každé p = 0, ..., n je Gp := G n K[xp+\, ..., x„] Grobnerovou bází ideálu Ip. Jestliže je G minimální, resp. redukovaná, Grôbnerova báze, pak Gp je opět báze minimální, resp. redukovaná. Důkaz. Bez újmy na obecnosti můžeme uvažovat Gp = {gi, gr}- Protože G c 7, je i Gp c Ip. In- kluze (Gp) c Ip platí triviálně. Dokážeme tedy inkluzi opačnou. Pro libovolný polynom / e Ip bychom rádi ověřili, že / = h\g\ H-----Vhrgr. Provedeme za tím účelem dělení se zbytkem původní Grobnerovou bází G. Protože je také f e I, platí / = 0, a tedy / = h\g\ H-----Yhygr + hr+lgr+l----Yhmgm. Každý z polynomů gr+i, ..., gm musí obsahovat nějakou z proměnných x\, ..., xp, jinak by byl prvkem Gp. Vzhledem k vlastnostem lexikografického uspořádání takovou proměnnou obsahují i LT gr+1, ..., ĽT gm. Uvědomíme-li si postup algoritmu pro dělení se zbytkem a skutečnost, že v f není žádný monom obsahující některou z x\, ..., xp, musí být hr+\ — ■ ■ ■ — hm — 0. Ověřili jsem proto / e (Gp). Dokázali jsme nejen požadovanou inkluzi, ale i fakt, že dělení f/G dopadne na Ip stejně jako f/Gp. Pro 1 < i < j < r uvažujme 5-polynomy S(gi, gj). Platí S(gi, gj) " = S(gi, gj) ■- 0 a tedy Gp je Grôbnerova báze ideálu Ip. Tvrzení o minimalitě nebo redukovanosti báze je zřejmé z definic těchto pojmů. □ Jediná vlastnost lexikografického uspořádání, kterou jsme použili v důkazu, je tvrzení, že pokud se některé proměnné objevují v polynomu /, pak se objevují v jeho vedoucím členu. To je ovšem podstatně slabší požadavek, než definice lexikografického uspořádání. Proto lze při skutečných implementacích používat jakékoliv uspořádání, které bude zajišťovat tuto vlastnost. Dosáhne se tak většinou efektivnějších výpočtů, protože čisté lexikografické 684 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY soustavu převedeme na ekvivalentní polynomiální soustavu S-l + S\C2 + C\S2 — X = 0, Cl + C\C2 — S\S2 —1=0, - X ■ - 1 : - 1 : - 1 Každý výpočetní program pak v okamžiku najde Grôbnerovu bázi příslušného ideálu. Pro gradované opačné lexikografické uspořádání s\ > c\ > s2 > C2 dostaneme bázi (2c2 + 1 ■ ■x2,2c1(l+x2) ■ ■ 2í2X — 1 ■ ■x2,2si(l +x2)+ +2s2 - x - x3, 4s\ - 3 - 2X2 + x4), a odtud už je snadné dopočítat hodnoty proměnných v závislosti na parametru x. Ihned například vidíme c2 = tj. f3 = arccos(£^-'-). Především je tedy jasné, že úloha nemá řešení pro \x\ > */3. Konkrétně, pro \x\ < -v/3 má 2 různá řešení a pro \x\ = -fi jedno řešení (a = f, B = 0, y = 2f pro kladné x, a = -f, B = 0, y = 4f pro záporné). Pro x = 1 dopočítáme řešení a = 0, = \,y = \ a degenerované řešení a = |,/S = — \,y = Jt. Podobně dopadne případ x = — 1. Je dobré si uvědomit, že pro |x\ < 1 bude vždy jedno řešení odpovídat konfiguraci robota, při které dojde k překřížení některých částí. Pro tyto hodnoty parametru x tedy bude existovat jediná uskutečnitelná konfigurace. x--l (P A. uspořádání zpravidla vede k nepříjemnému nárůstu stupňů polynomů. 11.44. Implicitní popis parametrizovaných variet. Z předchozí věty lze docela snadno odvodit algoritmus pro nalezení implicitního popisu variet zadaných pomocí polynomiální parametrizace. Nebudeme se věnovat detailní diskusi, protože nemáme k dispozici všechny nástroje pro práci s nejmenšími varietami obsahujícími body zadané parametrizací. Zůstaneme proto na úrovni poznámek. Jestliže je naše parametrizace variety dána polynomiálními vztahy x\ = f\(u\, , Uk), ,x„ = /„(mi, , Mi), spočteme redukovanou Grôbnerovu bázi ideálu (x\ -/!,...,*„- /„> v lexikograflckém uspořádání, kde m, > xj pro všechna i, j. Z této báze dostaneme redukovanou Grôbnerovu bázi ehminačního ideálu Ik a to je přesně hledaný ideál a jeho implicitní popis. Ve skutečnosti nám pro výpočet stačí takové uspořádání, které zaručí převahu všech m, nad x j, aby se algoritmem pro výpočet Grôbnerovy báze eliminovala m, , jinak může být uspořádání libovolné. Máme tak naději dosáhnout efektivnějšího výpočtu než s čistým lexikografickým uspořádáním. Když je naše parametrizace racionální, tj. fi(t\, ..., tm) xi —-, gi(t\, ...,tm) asi nás hned napadne dosadit do předchozí věty ideál (xigi - fi, xngn - /„>. To ale většinou nefunguje dobře. Například uvažujme 2 2 m V x = —, y — —, z— u. v u Dostali bychom I — (vx — u2, uy — v2, z — u) a po eliminaci h — (z(x2y — z3)}. Správný výsledek je ale jenom K". Pro implicitizaci pak použijeme ideál I = (g\x\ - fj,.. c K[y, tu ...,tm , gnx, xi, ■ - fn, 1 - gl ■■■gnýl — kde si navíc pomáháme dodatečnou proměnnou y. Potom lze ukázat, že V(Ik+\) je minimální afinní varieta obsahující F(Km — W). 4. Uspořádané množiny a Booleovská algebra Z vlastností čísel nebo symetrií objektů abstrahovali podstatné axiomy a dostali jsme daleko siřeji použitelné ná- ____stroje pro úvahy v lineární algebře, při diskusi grup symetrií a jejich akcí, studium okruhů polynomů atd. Nyní budeme postupovat obdobně a okamžitě uvidíme, že jen docela drobnou změnou základních vlastností dostaneme na první pohled úplně jiné objekty. To, co zůstane podobné, je algebraická práce se symboly zastupujícími velice rozmanité objekty a tím pádem i docela univerzální použitelnost výsledků. Za východisko si vezmeme základní operace s množinami, tj. jejich sjednocení, průnik a vztahy inkluze. Naším prvním cílem 685 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY □ Grobnerovy báze lze využít i v softwarovém inženýrství při hledání invariantů cyklů, které jsou potřeba k ověřování správnosti algoritmů, viz následující příklad. 11.109. Ověřte správnost následujícího algoritmu pro výpočet součinu dvou celých čísel a, b. (x, y, z) := (a, b, 0) ; while not (y = 0) do if y mod 2 = 0 (2*x, y/2, z) (2*x, (y-D/2, x+z) then (x, y, z) eise (x, y, z) end if end while return z Řešení. Označíme-li si jako X, Y, Z počáteční hodnoty proměnných x, y, z, pak z definice je polynom p invariantem cyklu právě tehdy, když v každém kroku platí p(x, y, z, X, Y, Z) = 0. Takový polynom můžeme najít pomocí Grobnerovy báze následujícím způsobem. Označme f\, f2 přiřazení ve dvou větvích algoritmu, tj. 1 1 y fiix, y, z) = (2x, -jy,z)& ftix, y, z) = (2x, —-- ,x+z). Pro n iterací prvního okamžitě spočítáme explicitní vztah f"(x,y,z) = (2"x, ^y, z). Abychom převedli tuto iterovanou funkci na polynomiální zobrazení, zavedeme nové proměnné u := 2™, v := ^. Potom j e /" dána polynomiální funkcí F\ : x 1—> ux kde nové proměnné splňují u v musí ležet v ideálu y \-+ vy zkz, 1. Invariantní polynom pak zřejmě li = [ux — X, vy — Y, z — Z, uv — 1). Abychom takový polynom našli, stačí odtud eliminovat proměnné u a v, což můžeme dobře udělat právě pomocí Grobnerovy báze vzhledem ke gradovanému opačnému lexikografickému uspořádání s u > v > x > y > z. Ta je rovna (xy-XY,z-Z,x-vX,y-uY). Odtud Fi(xy - XY) = xy - XY a Fi(z - Z) = z - Z a všechny další polynomy invariantní výhledem k libovolnému počtu n aplikací fi jsou dány polynomem v (polynomech) xy — XY a z — Z. Podobnou úvahu teď provedeme pro /2. Pro n iterací odvodíme vztah (2"x, -^(y + 1) ■ 2" bude uvést tyto operace do souvislosti s výrokovou logikou (tj. for-malizovanými postupy pro vyjadřování výroků a vyhodnocování jejich pravdivosti). 11.45. Množinová algebra. S každou množinou M máme k dispozici také množinu K = 2M všech jejích podmnožin a na ní operace v : K x K —> K sjednocení množin a a : K x K —> K průniku množin. To jsou dvě binární operace, které jsme dosud značili U a n. Dále máme ke každé množině A e K také její množinu doplňkovou A' = K \ A, což je další unární operace. Konečně máme „největší objekt", tj. celou množinu M, který je neutrální vůči operaci a a který proto budeme v této souvislosti označovat jako 1. Obdobně se chová prázdná množina 0 e K vůči operaci v. Tu budeme v této souvislosti značit jako 0. Na množině K všech podmnožin v M můžeme velmi snadno ověřit pro všechny prvky A, B,C následující vlastnosti (již jsme definovali význačné prvky O = 0al = Ma unární operaci vzetí doplňku A' k podmnožině A): (1) A a (B a C) = (A a B) a C, (2) A v (B v Q = (A v B)v C, (3) A /\B = B A A, A v 5 = 5 v A, (4) A a (B v Q = (A a B) v (A a Q, (5) A v (B a Q = (A v B) a (A v Q, (6) existuje 0 e K tak, že A v 0 = A, (7) existuje 1 6ř tak, že A a 1 = A, (8) AaA' = 0, AvA' = 1. Porovnejme si tyto vlastnosti s vlastnostmi okruhů: První dvě z nich, tj. (1) a (2) říkají, že obě operace a a v jsou asociativní. Vlastnost (3) konstatuje komutativitu obou operací. -fí;íř"ís«~-s~ Až potud je tedy vše jako u číselných oborů a operací sčítání a násobení. Zásadní změnou jsou ale další dvě vlastnosti (4) a (5), protože ty vyžadují jak distributivitu operace v vůči průniku a, tak naopak. To pochopitelně u sčítání a násobení čísel nejde — máme tam pouze distributivitu sčítání vůči násobení, ale ne naopak. Poslední tři vlastnosti (6) - (8) konstatují existenci neutrálních prvků vůči oběma operacím, ale také existenci obdoby k ,j.nverzím" ke všem prvkům (ale všimněme si, že průnikem s komplementem chceme dostat neutrální prvek ke sjednocení a naopak, tedy odlišně od vzetí inverzí v okruzích). Jistě nás nepřekvapí, když za chvíli uvidíme, že takto silně provázané vlastnosti dvou různých operací nemůže mít příliš mnoho objektů. [ Booleovské algebry |__, Definice. Množině K spolu s dvěma binárními operacemi a a v a jednou unární operací ' splňující vlastnosti (l)-(8) říkáme Booleovská algebra. Operaci a budeme říkat infimum (případně průnik, anglicky často také meet), operaci v budeme říkat supremum (případně sjednocení, anglicky také join). Prvku A' se říká doplněk k prvku A. 1,(2" - l)x + z), 686 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY a po zavedení proměnných u nv dostaneme ekvivalentní polynomiální funkci ih-bi y i—^ v(y + 1) — 1 (u - l)x + z. Invariantní polynom pro F2 pak získáme stejně jako v předchozím případě pomocí Grôbnerovy báze příslušného ideálu. Nás ale zajímají polynomy, které jsou invariantní jak pro F\, tak i pro F2. Ty zřejmě musí ležet v ideálu I2 = (F2(xy - XY), F2(z - Z), uv-l). Dosazením za F2 dostaneme I2 = {uxv(y + 1) — ux — XY, (u — í)x + z — Z, uv — 1) a pomocí Grôbnerovy báze tohoto ideálu eliminujeme proměnné u a. v a najdeme polynom xy — XY + z — Z, který je invariantní jak pro F\, tak pro F2 a je to tedy invariant daného cyklu. Vzhledem k počátečním podmínkám Z = a, Y = b, Z = 0 vidíme, že během celého programu platí xy — ab + z = 0. Na konci cyklu bude platit y = 0, a proto bude výsledek opravdu z = ab. □ Nyní ukážeme několik příkladů, ve kterých využijeme Grôbnerovy báze k řešení různých polynomiálních soustav. V těchto příkladech nebude primárním cílem najít Grôbnerovu bázi, ale vyřešit danou soustavu. 11.110. Pomocí Grôbnerovy báze vyřešte polynomiální soustavu x3 - 2xy = 0, x2y + x - 2y2 = 0. Řešení. Označme f\ := x3 — 2xy, f2 := x2y + x — 2y2. Báze fi) není Grôbnerova, protože například LM(yf\ — xf2) = x2 £ (x3 ,x2y) = (LM(fi), LM(f2)). Musíme tedy k bázi přidat právě polynom y ň ~ xf2 = -x2. Vzniklou bázi pak můžeme redukovat tím, že polynomy f\, f2 vydělíme x2. Tak dostaneme bázi (xy,x - 2y2,x2) . První polynom ovšem můžeme vydělit druhým se zbytkem 2y3 a třetí druhým se zbytkem 4y4. Dostáváme tak bázi (x-2y2,y3) a ta už je Grôbnerova: podle naivního algoritmu (viz 11.39) stačí pouze ověřit, že polynom S(x-2y2,y3) = y3 (x - 2y2) - xy3 =-2y5 Všimněme si, že axiomy Booleovské algebry jsou zcela symetrické vůči záměně operací a a v, společně se záměnou prvků 0 a 1. Důsledkem tohoto faktu je, že jakékoliv tvrzení, které odvodíme z axiomů, má také platné duální tvrzení, které vznikne z prvého právě záměnou všech výskytů a za v a naopak a stejně tak všech výskytů 0 a 1. Hovoříme o principu duality. 11.46. Vlastnosti Booleovských algeber. Jako obvykle si hned odvodíme několik elementárních důsledků axiomů. Zejména si povšimněme, že tak dokážeme u speciálního případu Booleovské algebry všech podmnožin v dané množině M elementární vlastnosti známé z množinové algebry. Např. je doplněk k A e K určen svými vlastnostmi jednoznačně. V obecném pohledu však toto pozorování říká, že máme-li dáno (K, a, v), může existovat nejvýše jedna unární operace ', se kterou dostaneme Booleovskou algebru (K, a, v, '). Skutečně pokud B, C e K splňují vlastnosti A' (tj. poslední axiom (8) v definici výše), platí B = Bv0 = Bv(AaC) = = CBvA)a(BvC) = 1a(BvC) = BvC a stejně také spočteme C — C v B. Je tedy nutně B — C. Všimněme si, že použitím tohoto výsledku na prvky 1 a 0, společně s jejich definicí, okamžitě dostáváme jednoznačnost pro tyto výjimečné prvky v libovolné Booleovské algebře (promyslete si podrobně!). Vlastnosti v následujícím tvrzení mají svá zavedená jména v množinové algebře: vlastnosti (2) se říká absorpční zákony, vlastnosti (3) popisují idempotentnost operací f f'il a a v a rovnosti (4) jsou známy jako De Morganova -žé*-.—-** pravidla. Tvrzení. V každé Booleovské algebře (K, a, v,') platí pro všechny prvky v K: (1) A a0 = 0, A v 1 = 1, (2) A a (A v B) = A, Av(AaB) = A, (3) AaA = A, AvA = A, (4) (A a B)' — A' v B', (A v B)' = A' a B1, (5) (A')' = A. Důkaz. Podle principu duality potřebujeme z každého z duálních tvrzení na jednotlivých řádcích dokázat pouze jedno. Počítejme s využitím axiomů: Začneme s vlastností (3) A = A a 1 = A a (A v A') = (A a A) v 0 = A a A. Nyní už umíme snadno (1) A a 0 = A a (A a A') = (A a A) a A' = A a A' = 0 a pak je snadné i (2) A a (A v B) = (A v 0) a (A v B) = = Av(0aB) = Av0 = A. K důkazu De Morganových pravidel stačí ověřit, že A' v B1 má vlastnosti doplňku k A a B, pak to totiž bude doplněk dle úvahy výše. S využitím (1) spočteme (A a B) a (A' v tí) = ((A a B) a A') v ((A a B) a tí) = = (0 a B) v (A a 0) = 0. 687 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY dává zbytek nula vůči bázi (x — ly2,^3), dokonce v libovolném uspořádání na polynomech. Řešením soustavy je zřejmě bod (0, 0). □ 11.111. Je dána soustava polynomiálních rovnic x2 yz2 + x2 y2 + yz - xyz2 - z2 = 0, x2y +z = 0, xyz + z + 1 =0. Seřadte monomy polynomů podle lexikografického uspořádání si > y > z, pak vydělte první polynom druhým a třetím a výsledek využijte k vyřešení soustavy v oboru reálných čísel. Řešení. x2 y2 + x2yz2 - xyz2 + yz - z2 = (y + z2) (x2 y + z) - - y(xyz + z + 1) - z3 + z. Odtud z = 0, ±1. Potom např. 0 = z (x2 y + z) - x(xyz + z + 1) = Z — ZX — X. Odtud x = a z třetí rovnice y bod (\, -4,1). . Vyhovuje jediný reálný □ 11.112. Pomocí Grôbnerovy báze vyřešte polynomiální soustavu x2 + y + z = 1, x + y2 +z=l, x + y + z2 = l. Řešení. Označme f\ := x + y + z2 — 1. Zbytek po dělení polynomu x + y2 + z — 1 polynomem f\ je /2 = y2 - y - z2 + z. Zbytek po dělení polynomu x2 + y + z — 1 polynomem f\ je y2 + 2yz2 — y + z4 — 2z2 + z a dalším dělením polynomem /2 dostaneme zbytek h = 2yz2 + z4 - z2. Báze (/i, /2, fá) ještě není Grôbnerova. Tu zkonstruujeme volbou gi := f\, g2 := f2 a místo f3 vezmeme 5-polynom 2z2f2 - yh = -yz4 - yz2 - 2z4 + 2z3. Potom dělením polynomem f3 dostaneme zbytek g4 = z6 - 4z4 + 4z3 - z2 = = z2(z- l)2 (z2 + 2z- 1). Obdobně, s použitím (2) dostáváme (A a B) v (A' a tí) = (A v (A' v B1)) v(8v (A' v tí )) = = (1 vr) a (1 v A') = 1. Konečně přímo z definice je A' a A = 0 a A' v A = 1, má proto A požadované vlastnosti doplňku k A' a je tedy A = (A')'. □ 11.47. Příklady Booleovských algeber. Nejmenší zajímavá al- gebra je množina všech podmnožin jednoprvkové -^-y-* množiny M. Ta má právě dva prvky 0 = 0 a 1 = M. '(Lj-, Operace a a v v tomto případě splývají s násobením a M sčítáním v okruhu zbytkových tříd Z2, proto budeme nadále hovořil o Booleovské algebře Z2. Podobně jako u vektorových prostorů a okruhů můžeme algebraickou strukturu Booleovské algebry přenášet na prostory funkcí, jejichž obor hodnot Booleovskou algebrou je. Skutečně pro množinu všech funkcí 5 = {/ : M —> K) z množiny M do Booleovské algebry (K, a, v,') definujeme potřebné operace a vybrané prvky 0 a 1 na 5 jako funkce v argumentu x e M takto: (/1 a/2)W =(/iW)A(/2(r))eř, (/1V/2K1) =(/iW)v(/2(r))eř, (1)0) = 1 e íT, (0)W =0eř, (/)'« = (/W)' 6 K. Ověření, že tyto nové operace skutečně zadávají Booleovskou algebru je zcela přímočaré a jednoduché. Připomeňme, že všechny podmnožiny dané množiny M lze interpretovat jako zobrazení M —> Z2, když na jedničku zobrazíme právě body vybrané podmnožiny. Pak skutečně můžeme sjednocení a průnik definovat výše uvedeným způsobem — např. o každém bodu x e M rozhodujeme u (A a B)(x), zda patří do A a zda patří do B a vezmeme sjednocení výsledků v Z2, tj. výsledek bude 1, právě když x padne do sjednocení. 11.48. Výroková logika. V předchozích odstavcích jsme použili symboliku, kterou je často rozumné interpretovat tak, že z prvků A, B, ... e K tvoříme „slova" pomocí operací v, a,' a závorek vyjasňujících v jakém pořadí a na jaké argumenty jsou operace aplikovány. Samotné axiomy Booleovských algeber a jejich důsledky pak říkají, že velice často různá slova dávají stejnou hodnotu výsledku v K. V případě množiny všech podmnožin K — 2M je to zřejmé -prostě jde o rovnost podmnožin. Nyní uvedeme stručně jinou podobnou souvislost. Budeme pracovat opět se slovy jako výše, interpretujeme je ale jako tvrzení složené z elementárních výroků A, B, ... a logických operací AND (binární operace a), OR (binární operace v) a negace NOT (unární operace ')• Taková slova nazýváme výroky a přiřazujeme jim pravdivostní hodnotu v závislosti na pravdivostní hodnotě jednotlivých elementárních argumentů. Pravdivostní hodnotu přitom bereme jako prvek z triviální Booleovy algebry Z2, tedy buď 0 nebo 1. Pravdivostní hodnota výroku je plně určena přiřazením hodnot pro nejjednodušší výroky A a B, A v B a A', tj. A a B je pravdivé, pouze když jsou oba výroky A a B pravdivé, A v B je nepravdivé, pouze když jsou oba výroky nepravdivé, a A' má opačnou hodnotu než A. Výrok obsahující n elementárních výroků tedy představuje funkci (Z2)™ —> Z2 a dva výroky nazýváme logicky ekvivalentní, 688 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Báze (gi, g2, gí) už je Grôbnerova a proto můžeme úlohu vyřešit zpětnou eliminací. Z gn = 0 máme z = 0, 1, — 1 ± V2. Dosazením do g2 = 0 a gi =0 dostaneme řešení (1, 0, 0),(0,1, 0),(0, 0, 1),(-1 + V2,-1 + V2,-1 +V2),(-l- V2,-1 - V2,-1 - V2). □ 11.113. Vyřešte v K soustavu polynomiálních rovnic x2 - 2xz - 4, x2y2z + yz3, 2xý - 3z3. Řešení. Báze vhodná pro eliminaci proměnných je Grôbnerova báze pro lexikografické monomlální uspořádání s x > y > z. Použitím programu Maple tak najdeme bázi 144z5 + 35z7 + 12z9, 23z6 + 12z8 + 44yz\ + 3z5-r-4zy2,9z4+4y3, yz~ -Sy2 - 6z4 + 3xz3, 2xy2 - 3z3, x2 - 2xz - 4. Protože pro diskriminant prvního polynomu báze (vyděleného z5) platí 352 — 4.144.7 < 0, musí být z = 0. Dosazením do dalších polynomů pak hned dostáváme y = 0, x = ±2. □ 11.114. Vyřešte v K soustavu polynomiálních rovnic xy + yz - 1, yz + zw - 1, ZUJ + wx — 1, wx + xy — 1. Řešení. V tomto případě se hodí uvažovat gradované lexikografické uspořádání w > x > y > z. Algoritmem 11.39 nebo opět pomocí výpočetních programů najdeme příslušnou Grôbnerovu bázi (x - z, w - y, 2yz - 1). Řešením je pak množina bodů (^, /, ^, /) pro libovolné 0 ^ í e 1. □ 11.115. Vyřešte v K soustavu polynomiálních rovnic x2 +yz+x, z2 +xy +z, y2 +xz + y. Řešení. Podle algoritmu 11.39 nebo raději s pomocí programu Maple nalezneme Grôbnerovu bázi pro lexikografické monomlální jestliže zadávají stejnou funkci. V předchozím příkladu jsme již ověřili, že na množině tříd logicky ekvivalentních výroků je dána struktura Booleovy algebry. Nutně tedy pro výrokovou logiku bude v tomto smyslu platné vše, co dokážeme pro obecné Booleovy algebry. Stručně si proberme, jak vypadají obvyklé další jednoduché výroky ve výrokové logice jakožto prvky Booleovy algebry (tj. reprezentujeme vždy naším výrazem třídu výroků ekvivalentních): Implikaci A => B dostaneme jako A' v B, ekvivalenci A -o- B odpovídá (A A B) v (A' A É). Dále vylučovací OR, neboli XOR, je dáno jako (A A É) v (A' A B), negace NOR operace OR je vyjádřena jako A' A B1 a negace NAND operace AND je dána jako A! y S. Konečně tautologie je dána pomocí libovolného elementárního výroku jako A v A'. Všimněme si také, že XOR odpovídá v množinové algebře symetrickému rozdílu množin. 11.49. Přepínače jako Booleova algebra. Přepínač je pro nás černá skříňka, která má jen dva stavy, buď j e zapnut (a signál prochází) nebo naopak vypnut (a signál neprochází). A- B- Jeden nebo více přepínačů zapojujeme do sítě sériově nebo paralelně. Sériové zapojení je popsáno pomocí binární operace A, paralelní je naopak v. Unární operace A' zadává přepínač, který je vždy v opačné poloze než A. Každé konečné slovo vytvořené pomocí přepínačů A, B, ... a operací A, v a' umíme převést na obrázek, který bude představovat systém přepínačů propojených dráty a zcela obdobně jako v minulém odstavci nám každá volba poloh jednotlivých přepínačů zadá hodnotu „zapnuto/vypnuto" pro celý systém. Opět se snadno krok po kroku ověří platnost základních axiomů Booleových algeber pro náš systém. Na následujícím obrázku je ilustrován jeden z axiomů distributivity. B- B- -' 1-'A-'C- Propojení bez přepínače odpovídá prvku 1, koncové body bez propojení (nebo sériové zapojení A a A') dává prvek 0. Nakreslete si obrázky pro všechny axiomy Booleovské algebry a ověřte šije! 11.50. Dělitelé. Dalším přirozeným příkladem Booleovské algebry může být systém dělitelů přirozeného čísla nebo polynomu. Začněme trochu obecněji a zvolme pevně takové přirozené číslo p e N nebo polynom p e K[xi, ...,xs] nad oborem integrity K s jednoznačným rozkladem. Za nosnou množinu Dp bereme množinu všech dělitelů q našeho p. Pro dva takové dělitele definujeme q a r jako největší společný dělitel prvků q a r, q v r je nejmenší společný násobek. Dále definujeme význačný prvek 1 e Dp jako naše číslo nebo polynom p a neutrálním prvkem 0 vůči supremu na Dp je jednička v N, resp. 1 e K c K[x\,..., xs]. Unární operaci ' definujeme pomocí dělení: q' = p/q. Lemma. Množina Dp spolu s výše uvedenými operacemi a, v a ' je Booleovská algebra, právě když rozklad p na nerozložitelné faktory neobsahuje žádné kvadráty (tj. v jednoznačném 689 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY uspořádání s x > y > z složenou ze šesti polynomů: z2 + 3z3 + 2z\ z2 + z3 +2yz2 + 2yz3, ■ 2yz2 + y2 y-yz- yz + z + z2 + 2yz2 + xz, z2 + xy + z, x2 +yz + x. První polynom v této bázi má kořeny z = 0, — 1, — \. Rozborem jednotlivých případů zjistíme, že řešením soustavy jsou právě body (0, 0, 0), (-1, 0, 0), (0, -1, 0), (0, 0, -1) a (-±, -\,-\). □ J. Booleovy algebry a svazy 11.116. Nalezněte (úplnou) disjunktivní normální formu výrazu (B' => C) a [(A v C) a B]'. Řešení. Obsahuje-li formule relativně málo proměnných (v našem případě tři), je nejvýhodnější sestavit pravdivostní tabulku daného výrazu a z ní úplnou disjunktivní normální 1 formu odečíst. Tabulka bude obsahovat 23 = 8 řádků. Označme ještě zkoumanou formuli písmenem C [(A v C) a B]'

i2 = {1, 2, 3, 4, 6, 12) nelze 6 A 6' = 1 dosáhnout, protože má 6 netriviálního společného dělitele se všemi ostatními prvky v D\i mimo jedničku, ta ovšem nesplňuje 6 v 1 = 12. Pokud ovšem nejsou v rozkladu čísla nebo polynomu p kvadráty, definujeme doplněk pomocí dělení jako q' — p/q a snadno ověříme potřebné vlastnosti z axiomů (6)-(8). □ 11.51. Částečná uspořádání. K Booleovským algebrám teď jtsx půjdeme z jiné strany. Základní strukturou pro nás ÍĽ£ bude pojem uspořádání. Vzpomeňme na definici /' <£iv\ uspořádání jakožto reflexivní, antisymetrické a tran-%Ř»**m* zitivní relace < na množině K. Taková relace obecně neříká o každé dvojici a, b e íf, jestli jea < bnebob < a (takové uspořádání se nazývá úplné uspořádání nebo dobré uspořádání). Často v našem případě obecného uspořádání proto hovoříme také o částečném uspořádání a množina (K, <) vybavená částečným uspořádáním se nazývá uspořádaná množina1. Takové uspořádání je zejména vždy na množině K — 2M všech podmnožin množiny M prostřednictvím inkluze podmnožin. Pomocí naší relace infima na K je můžeme definovat jako A c B, právě když A A B = A. Ekvivalentně A c B, právě když A v B = B. Lemma. Je-li (K, A, v,') Booleova algebra, pak relace < definovaná vztahem A < B, právě když A A B = A, je částečné uspořádání. Navíc pro všechny prvky A, B, C e K platí: (1) A A B < A, (2) A < A VB, (3) jestliže A < C a zároveň B < C, pak také A v B < C, (4) A < B, právě když A A É = 0, (5) 0 < A a A < 1. Důkaz. Všechny dokazované vlastnosti a vztahy jsou výsledkem jednoduchého výpočtu v Booleovské algebře K. Začněme s vlastnostmi uspořádání pro <. Reflexivita je přímým důsledkem I v české literatuře se také používá název poset z anglického „partially ordered set", který zdůrazňuje, že jde o částečné uspořádání, tj. ne každá dvojice prvků je srovnatelná 690 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY {tí C) a [(A v C) a B]' <=>(B v C) a [(A v Q' v B'] <=>(B v C) a [(A' a C") v tí] [(5 v C) a (A' a ď)] v [(5 v C) a ň'] [(B a A' a C') v (C a A' a C)] v [(B Aŕ)v(CA tí)] (B a A' a C') v (C a tí) , což již je (neúplná) disjunktivní normální forma dané formule. Tato formule je zjevně ekvivalentní úplné disjunktivní normální formě dané formule, kterou jsme odvodili z tabulky (slovo „úplná" znamená, že se ve formuli objevují pouze konjunkce všech tři proměnných či jejich negací). □ 11.117. Nalezněte disjuktivní normální formu výrazu ((A a B) v C) ' a (A' v (B a C a D)) o V logice známe několik logických spojek: a, v, ==>, =. A také operátor '. Libovolnou výrokovou formuli užívajících těchto spojek lze pravdivostně ekvivalentně zapsat použitím pouze některých z nich, například spojkou v a operátorem '. Existují i spojky NAND a NOR (A NAND B = (A a B)', A NOR B = (A v B)'). Tyto spojky mají tu vlastnost, že pomocí pouze jedné znich lze pravdivostně ekvivalentně zapsat libovolnou výrokovou formuli (čtenář si rozmyslí, že uvedené základní spojky i operátor ' lze pomocí jak spojky NAND, tak pouze pomocí spojky NOR ekvivalentně vyjádřit). Tyto spojky lze implementovat v elektrických obvodech pomocí tzv. „brán". 11.118. Vyjádřete výrokovou formuli (A hujícflio pouze hradlo NAND. B) pomocí obvodu obsa- O 11.119. Zjednodušte výraz ((A a B) v (A => B)) a ((# =>C) v (B a C)). Řešení. Přepsáním do Booleovy algebry dostáváme (a ■ b + a' + b) ■ (b + c + b ■ c') = ■ ■ ■ = a ■ c + b. To znamená, že výše uvedená formule je ekvivalentní výroku (A' a C) v S. □ idempotence: A a A = A, tj. A < A. Podobně komutativita pro a zaručuje antisymetrii <, protože z A a B = A a zároveň B a A = B vyplývá A = A/\B = B /\A = B. Konečně z platnosti A/\B = AaB/\C = B vyvodíme AaC = (AaB)aC = Aa(BaC) = Aa.B = A, což ověřuje tranzitivitu relace <. Dále počítame (A a B) a A = (A a A) a B = A a B, takže A a B < A. Ze vztahu A a (A v B) = A, viz 11.46(2), plyne A < A v B, což dokazuje tvrzení (2). Distributivita společně s předpokladem (3) dává (A v B) a C = (A a Q v (B a Q = A v B, takže skutečně platí (3). Tvrzení (5) plyne přímo z axiomů pro význačné prvky 1 a 0. Zbývá nám tvrzení (4). Jestliže A < B, pak AaB' = AaBa tí = 0. Naopak je-li A/\tí — 0, pak A = AaI = Aa(BvB') = = (A a B) v (A a tí) = (A a B) v 0 = A a B. Odtud A < B a důkaz j e ukončen. □ Všimněme si, že stejně jako v případě algebry podmnožin je v Booleovských algebrách A a B = A, právě když je A v B = B. Skutečně je-li AaB = A, pak z absorpčních zákonů plyne A v B = (AaB)vB = Ba naopak. Můžeme proto pro definici částečného uspořádání stejně dobře používat také operaci 11.52. Svazy. Viděli jsme, že každá Booleova algebra za-iř|' ., dává uspořádanou množinu (K, <). Zdaleka ne každá tuspořádaná množina ovšem vzniká takovýmto způsobem. Např. triviální částečné uspořádání, kdy A < A pro l všechny A a všechny dvojice různých prvků jsou nesrovnatelné, samozřejmě z Booleovy algebry vzniknout nemůže, pokud je v K více než jeden prvek (viděli jsme, že největší a nejmenší prvek v Booleově algebře je totiž srovnatelný s každým prvkem). Zkusme se zamyslet, do jaké míry lze z uspořádání budovat operace a a v. Pracujme s pevně zvolenou uspořádanou množinou (K, <). O prvku C e K řekneme, že je dolní závorou pro nějakou množinu prvků L c K, je-li C < A pro všechny A e L. Prvek C e K je infimem množiny L c K, jestliže je dolní závorou a pro každou jinou dolní závoru D téže množiny platí D < C. Jde tedy o největší dolní závoru dané množiny. Obdobně definujeme horní závoru a supremum podmnožiny L záměnou < za > v posledním odstavci. Konečné uspořádané množiny se přehledně zobrazují pomocí orientovaných grafů. Prvky K jsou představovány uzly a hranou jsou spojeny právě prvky v relaci s orientací od většího k menšímu. Hasseho diagram uspořádané množiny je zakreslení takového grafu v rovině tak, že větší prvky j sou zobrazeny vždy výš než menší (a orientace hran je tedy dána takto implicitně). Zvláště u malého počtu prvků množiny K je to velmi přehledný způsob, jak diskutovat různé příklady, viz příklady ve vedlejším sloupci. 691 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.120. Anna, Bára, Kateřina a Dana chtějí jet na výlet. Rozhodněte, která z děvčat pojedou, mají-li být dodrženy tyto zásady: Pojede aspoň jedna z dvojice Bára/Dana, nejvýše jedna z dvojice Anna/Kateřina, aspoň jedna z dvojice Anna/Dana a nejvýše jedna z dvojice Bára/ Kateřina. Dále je jisté, že Bára nepojede bez Anny a že Kateřina pojede, pojede-li Dana. Řešení. Přepsáním do Booleovy algebry, úpravou a přepsáním zpět dostaneme, že na výlet pojede buď právě Anna s Bárou nebo právě Kateřina s Danou. □ 11.121. Pomocí přepisu do Booleovy algebry vyřešte následující v\^±v úlohu: Při vyšetřování vraždy bylo zajištěno pět podezřelých "Aíř\ Kalina, Nováček, Obrátil, Pražák a Ry vola. V době činu byl ip na místě Obrátil nebo Pražák, ale nejvýše jeden z dvojice Kalina, Nováček a aspoň jeden z dvojice Kalina, Obrátil. Podezřelý Ry-vola tam mohl být jen v přítomnosti Pražáka, ale pokud tam Ryvola byl, nechyběl ani Obrátil. Lze vyloučit spolupráci Nováčka s Pražákem, zato Nováček a Obrátil tvoří nerozlučnou dvojici. Kdo z podezřelých vraždu spáchal? Řešení. Přepisem do Booleovské algebry, podle prvních písmen jména, dostáváme (o + p)(k' + n')(k + o)(p + r')(r + o)(rí + p')(no + no) a s využitím x2 = x, xx' = 0, x + x! = 1 dostaneme úpravou předchozího výrazu ŕ p'nok'+tJ pn'o'k. Vinni jsou teda bud'Nováček a Obrátil nebo Kalina s Pražákem. □ 11.122. Volební skříňka pro tři voliče je skříňka, která zpracuje hlasy tří voličů a jejím výstupem je výsledek „ano", pokud byla pro většina z voličů. Navrhnete takovou skříňku složenou z přepínačových obvodů. Řešení. Svazy Definice. Svaz je uspořádaná množina (K, <), ve kterém každá dvouprvková množina {A, B] má supremum A v B a inflmum A a B. Hovoříme přitom o úplném svazu, jestliže existuje supremum a inflmum každé podmnožiny v K. Na svazu (K, <) tedy máme definovány binární operace a a v a přímo z definice je zjevná asociativita a komutativita těchto operací (dokažte si podrobně!). Všimněme si také, že jakýkoliv prvek v K je horní závorou pro prázdnou množinu, proto supremum prázdné množiny musí být menší než všechny prvky v K. Obdobně inflmum prázdné množiny musí být větší než jakýkoliv prvek v K. Zejména tedy úplný svaz má vždy největší a nejmenší prvek. Protože jsou binární operace a a v asociativní a komutativní, jistě existují v každém svazu suprema a inflma všech konečných neprázdných množin. V případě konečných uspořádaných množinu (K, <) jde proto o úplný svaz tehdy a jen tehdy, když v něm existuje jediný největší prvek 1 e K a jediný nejmenší prvek 0 e K. O svazu říkáme, že je distributivní, jestliže operace a a v splňují axiomy distributivity (4) a (5) z odstavce 11.46 na straně 687. Snadno lze ale nakreslit Hasseho diagram svazu, který není distributivní, viz obrázek níže. Nyní už můžeme snadno definovat Booleovskou algebru v jazyce svazů: Booleovská algebra je distributivní svaz s největším prvkem 1 a nejmenším prvkem 0 takový, že v něm existují ke všem prvkům komplementy (tj. prvky splňující vlastnost 11.45(8)). Ověřili jsme již, že v takovém případě jsou komplementy definovány jednoznačně (viz úvahy na začátku odstavce 11.46), takže je naše alternativní definice Booleovské algebry korektní. Všimněme si také, že při diskusi dělitelů daného čísla nebo polynomu p j sme narazili na distributivní svazy Dp, které j sou Booleovskou algebrou právě tehdy, když rozklad p neobsahuje kvadráty, viz Lemma 11.50. 11.53. Homomoríismy. Jak jsme již viděli u mnoha matematických struktur, o objektech se dozvídáme informace pomocí tzv. homomorfismů, tj. zobrazení, které zachovávají příslušné operace. Obzvlášť jednoduché je to u uspořádaných množin: [ izotonní zobrazení |_„ Homomorfismem uspořádaných množin (K, R. Podle výše dokázaného tedy bude mít f\R nejmenší pevný bod ý. Samozřejmě je y e Za snadno nahlédneme, že ve skutečnosti je y supremem námi zvolené množiny Q vůči zděděnému uspořádání na Z. Přitom je možné, že y > y. Obdobným postupem se zaměněnými relacemi a volbou infima najdeme i infimum libovolné neprázdné podmnožiny v Z. Největší a nejmenší prvek jsme již našli dříve a důkaz je ukončen. □ 693 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 1 □ 11.127. Nakreslete Hasseho diagram svazu dělitelů čísla 30. Je tento svaz distributivní? Jedná se o Booleovu algebru? Řešení. Tento svaz je Booleovou algebrou o osmi prvcích. Všechny Booleovy algebry o 2™ prvcích, pro pevné n, jsou si izomorfní (viz 11.58). V tomto případě se jedná o „krychli". Graf Booleovy algebry o osmi prvcích lze totiž nakreslit jako průmět krychle do roviny. ôo □ 11.128. Rozhodněte, zda každý svaz na tříprvkové množině je řetězec (řetězec je uspořádaná množina, ve které je každý prvek srovnatelný s každým). Řešení. Jak již jsme si všimli v příkladu || 11.1241|, neprázdný konečný svaz musí mít svůj největší a nejmenší prvek. Tedy jeden ze tří prvků je největší (tj. srovnatelný s oběma dalšími), druhý nejmenší (tedy opět srovnatelný s oběma dalšími) a třetí je tudíž srovnatelný také s oběma ostatními (největším i nejmenším). □ Poznámka. V literatuře lze najít mnoho variant vět o pevných bodech v různých souvislostech. Jednou z velmi užitečných je tzv. Kleeneho věta, jejíž tvrzení můžeme vyčíst z právě dokázané věty následujícím způsobem. Jestliže (ve značení Tarského věty) uvážíme spočetnou podmnožinu v K tvořenou tzv. Kleeneho řetězcem 0 < /(O) < /(/(O)) < ..., pak supremum z této podmnožiny zjevně nemůže být větší než kterýkoliv pevný bod zobrazení /. Skutečně pokud je y pevný bod zobrazení /, pak ze vztahu 0 < y dostaneme /(O) < f(y) = y atd. Pokud má / navíc vlastnost spojitosti, tzn. že „dostatečně" zachovává suprema, můžeme dovodit že f (z) bude opět supremem téhož řetězce a tedy pevný bod. Musí to proto být nejmenší pevný bod. Toto tvrzení se nazývá Kleeneho věta o pevném bodě a má četná použití v teorii rekurzí, při diskusi zastavení algoritmů atd. Nebudeme zde zacházet do podrobností kolem spojitosti zobrazení mezi uspořádanými množinami. 11.55. Normální tvary výrazů. Vrátíme se závěrem zpět k diskusi Booleovských algeber s konečným počtem prvků a ukážeme si jejich úplnou klasifikaci. Při diskusi výrokové logiky jsme se potýkali s problémem, co vlastně jsou prvky příslušné Booleovy algebry. Formálně vzato jsme je definovali jako třídy ekvivalentních výroků. Jinak řečeno, pracovali jsme s hodnotovými funkcemi pro výroky s daným počtem argumentů. Vůbec jsme přitom neřešili obtížný problém, jak rozpoznat stejné výroky v tomto smyslu. Také jsme neřešili, jestli všechny formálně možné hodnotové funkce (Z2)™ -» TLi lze zadat pomocí základních logických operací. Zcela obdobně se můžeme tázat, jak poznat, zda dva systémy přepínačů mají stejnou funkci. Obdobně jako u výroků zde pro systém s n přepínači pracujeme s funkcemi (Z2)™ -» Z2 a zjevně existuje právě 22 různých takových přepínacích funkcí. Na těchto funkcích umíme přirozeným způsobem zadat strukturu Booleovy algebry (využíváme, že hodnoty, tj. Z2, jsou Booleovou algebrou). Odpovíme nyní na výše uvedené otázky tak, že pro libovolný prvek obecné Booleovy algebry sestrojíme jeho tzv. normální tvar, tj. napíšeme jej pomocí dobře vybrané skupiny nejjednodušších prvků a operace v. Porovnáním normálních tvarů dvou prvků pak už snadno poznáme, zda jsou stejné či nikoliv. Nejprve si tedy vybereme obzvlášť jednoduché prvky Booleovských algeber: _______^_] Atomy v Booleovské algebře _. Prvek A e K nazveme atom v Booleově algebře K, jestliže pro všechny B e K platí A A B = A nebo A A B = 0. Jinak řečeno, A je atom, když pro všechny ostatní prvky B < A implikuje 5 = 0 nebo B = A. Velmi jednoduché je to v Booleovské algebře všech podmnožin dané konečné množiny M. Zjevně budou atomy právě všechny jednoprvkové podmnožiny A = {x} v množině M. Skutečně pro každou podmnožinu B budeme mít buď A A B = A, pokud x e B, nebo A A B = 0, pokud x £ B. Podívejme se ještě, jak vypadají atomy v Booleově algebře funkcí přepínačového systému s n přepínači A\,..., A„. Snadno ověříme, že zde je 2™ atomů, které jsou tvaru A"1 A • • • A AZ", kde buďAf = A,neboAf = A\. 694 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.129. Udejte příklad izotonního zobrazení dvou svazů, které není svazovým homomorfismem. Řešení. Opět se vrátíme k příkladu ||11.124|| a uvážíme zobrazení dle obrázku: □ 11.130. Rozhohněte, zda libovolný svazový homomorfismus mezi konečnými svazy zobrazí nejmenší prvek jednoho svazu na nejmenší prvek druhého svazu. Řešení. Ne. Libovolné konstantní zobrazení mezi dvěma svazy je svazovým homomorfismem. Pokud konstantní hodnotou nebude zrovna nejmenší prvek druhého svazu, pak se jedná o homomorfismus, který vyvrací tvrzení ze zadání příkladu. □ 11.131. Rozhodněte, zda každý řetězec, který má nej větší a nejmenší prvek je úplným svazem. Řešení. Ne. Uvážme například množinu celých čísel bez nuly, kterou uspořádáme následovně: libovolné kladné číslo bude větší než záporné, pořadí kladných čísel mezi sebou však „obrátíme" a totéž uděláme se zápornými čísly. Potom bude číslo 1 největším číslem daného řetězce a číslo — 1 nejmenším. Množina kladných celých čísel však nebude mít v této uspořádané množině infimum. Formálně definujeme na Z \ {0} uspořádání -< následovně: a < b [(sgn(fl) • sgn(fc) = 1 a b > a) v (sgn(a) > sgn(fc))]. Skutečně pro dvě funkce

2M vztahem f(X) = /(Aj) U • • • U f(Ak) = {Au Ak), 696 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Svaz není distributivní (stačí uvážit tři různoběžky). □ K. Kódy 11.135. Uvažujme (5, 3) kód nad Z2 generovaný polynomem x2 + x +1. Vypište všechna kódová slova, najděte generující matici a matici kontroly parity. Řešení. p(x) = x2 + x + 1. Kódová slova jsou právě násobky generujícího polynomu: 0-p, 1-p, x-p, (x+l)-p, x2 -p, (x2 +l)-p, (x2 +x)-p, (x2 +x+l)-p neboli 0, x2 + x + 1, x3 + x2 + x, x3 + 1, x4 + x3 + x2, / + x3 + X + 1, x4 + x, x4 + x2 + 1 neboli 00000,11100,01110,10010, 00111, 11011,01001,10101. Bázové vektory vynásobené x5^3 = x2 dávají mod (p): x2 = x + 1, x3 = x.x2 = x(x + 1) = x2 + X = 1, x4 = X. To znamená, že bázové vektory se zakódují následovně 1 i-» x2 + X + 1, x h-» x3 +1, X2 h-» X4 + X, a proto je generující matice tj- /I 1 0\ 1 0 1 1 0 o 0 1 o V° o i/ 100 i-» 11100, 010 i-» 10010, 001 i-» 01001, a matice kontroly parity H 1 0 1 1 0\ 0 110 1/' □ tj. jako sjednocení jednoprvkových podmnožin A, c M obsažených ve výrazu. Z jednoznačnosti normálního tvaru vyplývá, že / je nutně bi-jekcí. Zbývá dokázat, že jde o homomorflsmus Booleovských algeber. Jsou-li X a Y dva prvky v K, pak v normální formě jejich suprema jsou právě atomy, které vystupují v X nebo v Y, zatímco v inflmu jsou to atomy vystupující v obou výrazech současně. To ale právě ověřuje, že / zachovává operace A a v. Pro doplňky si všimněme, že atom A vystupuje v normální formě X', právě když X A A = 0. Odtud již vidíme, že i komplementy / zachovává a důkaz j e ukončen. □ Pro nekonečné Booleovské algebry obecně neplatí, že by byly izomorfní Booleovské algebře všech podmnožin nějaké vhodné množiny M. Platí však, že je izomorfní Booleově podalgebře vhodné podmnožiny všech množin nějaké množiny M. Tomuto výsledku se říká Stoneova věta o reprezentaci. 5. Kódování Často potřebujeme přenášet informace a přitom zajišťovat jejich správnost. Někdy stačí zajistit, abychom poznali, zda je informace nezměněná, a při chybě si vyžádáme informaci znovu, jindy potřebujeme zajistit, aby chyby byly i opraveny bez nového přenášení zprávy. To vše je úkol kódování a v dalších odstavcích se tomuto úkolu budeme věnovat. Pokud navíc chceme, aby zprávu mohl číst pouze adresát, potřebujeme i tzv. šifrování. Tomu jsme se krátce věnovali na konci minulé kapitoly. 11.59. Kódy. Při přenosu informace zpravidla dochází k její de-formaci. Budeme pro jednoduchost pracovat s mo-*££Yf" dělem, kdy jednotlivé částečky informace jsou buď 'j^CL nuly nebo jedničky (tj. prvky v Z2), říkáme jim bity, w a přenášíme konečná slova o k bitech pro nějaké pevně zvolené k e N. Obdobné postupy jsou možné nad libovolnými konečnými poli, my ale zůstaneme u nejjednoduššflio případu Z2. Přenosové chyby chceme rozpoznávat, případně i opravovat, a za tím účelem přidáváme ke ^-bitovému slovu dodatečných n — k bitů informace pro pevně zvolené n > k. Hovoříme o (n, k)-kódech. Všech slov o k bitech je 2k a každé z nich má jednoznačně určovat jedno kódové slovo z 2™ možných. Máme tedy u (n, &)-kódů ještě 2^(2ří~ k 1) 11.136. Určete generující matici a matici kontroly parity (7,4) kódu nad Z2 generovaným polynomem x3 + x + 1. Q slov, které jsou chybové. Lze tedy tušit, že pro veliké k nám i malý počet přidaných bitů dává hodně redundantní informace. Úplně jednoduchým příkladem je kód kontrolující paritu. Kódové slovo o k + 1 bitech je určené tak, aby přidáním prvního bitu ke ^-bitovému slovu byl zaručen sudý počet jedniček ve slově. Jde tedy o (k + l, k)-kód. Pokud při přenosu dojde k lichému počtu chyb, s použitím tohoto jednoduchého kódu na to přijdeme. Dvě různá kódová slova se při tomto kódu vždy Uší alespoň ve dvou pozicích, chybové slovo se ale od alespoň dvou různých kódových slov Uší pouze v pozici jedné. Nemůžeme proto umět chyby opravovat, ani kdybychom věděli, že při přenosu došlo k právě jedné chybě. 697 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.137. Sedmibitovou zprávu aoa\... a^, chápanou jako ao + a\x + ■ ■ ■ + a^r, kódujeme polynomiálním kódem generovaným polynomem xA + x + 1. i) Zakódujte zprávu 1100011. ii) Obdrželi jste kód 10111010001. Jaká byla posílaná zpráva, když budete předpokládat, že došlo k chybě na maximálně jednom bitu? iii) Jaká byla zpráva v ii), pokud předpokládáme, že došlo k chybě právě na dvou bitech? Řešení, i) x „10 X + 1, x2 + X, x3 + X, x2 + X + 1, odkud 1 + X + ŕ + X6 H» X4 + X5 + X9 + XW + X + 1 + X2 + X+ x3+x+x2+x + l = Přehledně jsou všechna možná slova o dvou bitech s jedním přidaným paritním bitem vidět na obrázku níže. Kódová slova jsou zvýrazněna tučným puntíkem. 011. 010 ^^001 110 000 klOl 100 Navíc kódem kontrolujícím pouze paritu neumíme detekovat tak obvyklé chyby, jako je záměna dvou sousedních hodnot ve slově. 11.60. Vzdálenost slov. Na obrázku ilustrujícím (3, 2)-kód kon-^gs ;.;v trolující paritu je vidět, že ve skutečnosti každé , chybné slovo je „stejně" daleko od tří kódových slov *S?=311s£7(i*-jsou to ta, která se liší v právě jednom bitu. Ostatní jsou dál. Abstraktně můžeme takové pozorování zachytit definicí vzdálenosti: _____[ Vzdálenost slov (__ Kód je tedy 00011100011. ii) 1 + x2 + x3 + xA + x6 + xw dává po dělení xA + x + 1 zbytek x2 + 1 = xH. Došlo tedy k chybě na devátém bitu a původní zpráva byla 1010101. iii) Chyba mohla nastat na prvním a třetím bitu (x2 +1), na pátém a šestém (ŕ +x5 = x2 + 1), nebo na druhém a jedenáctém (xw +x = x2 + 1). V prvním případě byla zpráva 1010001 ve druhém 0110001 a ve třetím 1010000. □ 11.138. Sedmibitovou zprávu a0ai... a6, chápanou jako ao + o-\x + • • • + ci^x6, kódujeme polynomiálním kódem generovaným polynomem xA + x3 + 1. i) Zakódujte zprávu 1101011. ii) Obdrželi jste kód 01001011101. Jaká byla posílaná zpráva, když budete předpokládat, že došlo k chybě na maximálně jednom bitu? iii) Jaká byla zpráva v ii), pokud předpokládáme, že došlo k chybě právě na dvou bitech? Hammingova vzdálenost dvou slov je rovna počtu bitů, ve kte-j rých se liší. Pokud uvažujeme slova x, y, z a první dvě se liší v r bitech, zatímco y a z se liší v s bitech, pak se nutně x a z liší v nejvýše r +s bitech, je tedy splněna trojúhelníková nerovnost pro vzdálenosti. Aby kód mohl odhalovat chyby v r bitech, musí být minimální vzdálenost mezi kódovými slovy alespoň r+1. Pokud budeme chtít i opravit nepřesně přenesené slovo s r chybami, pak nutně musí existovat jen jediné kódové slovo, které má od přijatého chybného slova vzdálenost nejvýše r. Ověřili jsme tedy jednoduchá tvrzení: Věta. (1) Kód spolehlivě odhaluje nejvýše r chyb ve slově, právě když je minimální Hammingova vzdálenost kódových slov r + 1. (2) Kód spolehlivě odhaluje i opravuje nejvýše r chyb, právě když je minimální Hammingova vzdálenost kódových slov 2r + 1. 11.61. Konstrukce polynomiálních kódů. K praktickému použití potřebujeme efektivně konstruovat kódová slova tak, abychom je mezi všemi slovy snadno rozpoznali. Kontrolu parity jsme už viděli, další triviální možnost je prosté opakování bitů. Např. (3, l)-kód bere jednotlivé bity a posílaje třikrát po sobě. Docela systematickou cestou ke konstrukci kódů je využití dělitelnosti polynomů. Zpráva bobi ... bk-\j e reprezentována j ako polynom nad polem Z2 m(x) =bo + b\x H-----h bk--ixk 4 -i Polynomiální kód (___ Nechť p(x) — ao + ■ ■ ■ + an-icx"~k e 1a\x\ je polynom s koeficienty ao = 1, a„-/t = 1. Polynomiální kód generovaný polynomem p(x) je (n, k)-kód, jehož slova jsou polynomy stupně menšího než n dělitelné p(x). 698 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Řešení, i) x4 = x3 + 1, ŕ = x3 + X + 1, x1 = x2 + X + 1, x9 = x2 + 1, xw = x3 + x, dostáváme tak 1 + x + x3 + x5 + x6 = x3+l+x3+x + l+ x2+x + l+ x2+l+x3+x ■ xi+x*+X1+J° ■x + x ■ x4 + x5 + x1 + x9 + xw + x3 + x. Kód je tedy 0101 1101011. kontrola zpráva ii) x + x4 + x6 + x1 + ŕ + xw dává po dělení x4 + x3 + 1 zbytek x2 + x + 1 = x1. Došlo tedy k chybě na osmém bitu a původní zpráva byla 1010101. iii) Buď nastala chyba na druhém a desátém bitu (x + x9 = x2 + x + 1), nebo na čtvrtém a sedmém (x3 + x6 = x2 + x + 1), nebo pátém a devátém (x4 + xg = x2 + x + 1). V prvním případě byla zpráva 00001011111, ve druhém 01011001101, ve třetím 01000011001. □ 11.139. Uvažme (15, 11) kód generovaný polynomem 1 + x3 + x4. Přijali jsme kód 011101110111001. Určete původní 11-bitovou zprávu, předpokládáme-li, že při přenosu došlo k chybě na jednom bitu. Řešení. Řetězec je kódové slovo právě tehdy, když je dělitelný generujícím polynomem, tj. v našem případě 1+x3 +x4. Přijatý řetězec odpovídá polynomu x+X2 +x3 +X5 +x6 +x7 +x9 +xw +xn +x14. Tento polynom dává po dělení 1+x3 +x4 zbytek x + 1. To znamená, že při přenosu došlo k chybě. Předpokládáme-li, že chyba je jen na jednom bitu, musí existovat mocnina x, která je rovna tomuto zbytku modulo 1+x3 + x4. Proto počítáme x4 = x3 + 1, = x3 + x + 1,... ,x12 = x + 1. Chyba tedy nastala na třináctém bitu a originální zpráva byla 01110111101. Můžeme si příklad i víc rozebrat. Když si spočítáme všechny mocniny x, dostaneme x3 +1, x3 +x + l, x3 + x2 + x + 1, x1 = x2 + x + 1, x8 = x3 + x2 + X, X x5 6 Zpráva m(x) je zakódována jako v(x) — r(x) + x" km(x), kde r(x) je zbytek po dělení polynomu xn^km(x) polynomem />(*)• _ Z definice kódového slova v(x) pro přenášené slovo m(x) čteme: v(x) — r(x) + xn~km(x) — = r(x) + q(x)p(x) + r(x) = q(x)p(x), protože nad Z2 je součet dvou stejných polynomů vždy nulový. Budou tedy skutečně všechna kódová slova dělitelná p(x). Naopak je-li v(x) dělitelné p(x), můžeme číst poslední výpočet z opačné strany a vidíme, že jde skutečně o kódové slovo vzniklé uvedeným postupem. Z definice je také vidět, že kódové slovo vznikne přidáním n — k bitů na začátek slova. Původní zpráva je tedy obsažena přímo v polynomu v(x), takže dekódování správného slova je velmi snadné. Uvedhie si dva jednoduché příklady, které už známe. Všimněme si nejprve, že 1 + x dělí polynom v(x) tehdy a jen tehdy, když v(l) = 0. To nastane právě tehdy, když je ve v(x) sudý počet nenulových koeficientů. Polynom p(x) = 1+x proto generuje (n, n — l)-kód kontroly parity pro všechna n > 3. Obdobně se snadno ověří, že polynom p(x) — 1 + x + + ... + x"~l generuje (n, l)-kód n-násobného opakování bitů. Skutečně dělením polynomu £>o*™ 1 polynomem p dostaneme zbytek bo(l + ■ ■ ■ + x"~2) a tedy příslušné kódové slovo je bop(x). 11.62. Detekce chyb. Označme si e(x) vektor chyb, které vznik-k<.'» nou při přenosu. Místo posílaného slova v e (Z2)™ tedy "Kjjfc dopadne přenos příjmem polynomu 'ľJ ' u(x) — v(x) +e(x). Chyba je rozpoznatelná, pouze když generátor kódu p(x) nedělí e(x). Máme proto zájem o polynomy p(x) v TLi\x\, které nevystupují jako dělitelé zbytečně často. Definice. Ireducibilní polynom p(x) e TLi\x\ stupněm se nazývá primitivní, jestliže p(x) dělí polynom (1 + xk) pro k — 2m — 1, ale nedělí jej pro žádná menší k. Věta. Je-li p(x) primitivní polynom stupně m, pak pro všechna n < 2m — 1 odhaluje příslušný (n, n—m)-kód všechny jednoduché a dvojité chyby. Důkaz. Jestliže nastane právě jedna chyba, pak e(x) = x' pro vhodné 0 < i < n. Protože je p(x) ireducibilní polynom, nemůže mít kořen v Z2. Zejména tedy nemůže dělit beze zbytku x', protože rozklad x' je jednoznačný. Tedy je každá jednotlivá chyba rozpoznatelná. Jestliže nastanou chyby právě dvě, pak e(x) =xl +x> l+x]- pro jistá 0 < i < j < n. Již víme, že p(x) nedělí beze zbytku žádné x1, a protože je primitivní, nedělí beze zbytku ani 1 + x1^1 , pokudje j—i < 2m —1. Zároveň je p(x) ireducibilní, nedělí proto ani součin e(x) — x' (1 + xJ~' ), a důkaz je ukončen. □ 11.63. Důsledek. Je-li q(x) primitivní polynom stupně m, pak pro všechna n < 2m — 1 rozpoznává (n,n — m — l)-kód generovaný 699 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY x9 =■ x2 +1, xw = x3 + x, xn = x3 + x2 + 1, xn = x + l, x13 = x2 + x, x14 = x3+x2 a generující matice je tedy /1 1 1 1 0 1 0 1 1 0 0 "\ 0 1 1 1 1 0 1 0 1 1 0 0 0 1 1 1 1 0 1 0 1 1 1 1 1 0 1 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 V o 0 0 0 0 0 0 0 0 0 1) Můžeme si ověřit, že vynásobením 01110111101 dostaneme kódové slovo 011101110111101, které se liší od přijatého řetězce 011101110111001 právě na tom třináctém bitu. □ A nyní začneme efektivně využívat kontrolní matici. 11.140. Určete generující matici a matici kontroly parity (7, 2) kódu (tj. dva bity jsou informační a pět kontrolních) generovaného polynomem x5 + x4 + x2 +1. Dekódujte přijaté slovo 0010111 (tj. udejte dvoubitovou zprávu, která byla poslána), za předpokladu, že při přenosu došlo k nejmenšímu možnému počtu chyb. Řešení. Generující matice kódu je fl 1\ 0 1 1 1 0 1 1 1 1 0 \° V polynomem p(x) = q(x)(l + x) všechny dvojité chyby a všechna slova s lichým počtem chyb. Důkaz. Kódová slova generovaná zvoleným polynomem p(x) jsou dělitelná jak x + 1, tak primitivním polynomem p\(x). Jak jsme již ověřili, faktor x + 1 má za důsledek kontrolu parity, tj. všechna kódová slova mají sudý počet nenulových komponent. Tím umíme odhalit výskyt lichého počtu chyb. Jak jsme již také viděli v předchozí větě, druhý faktor umí odhalit dvojnásobné chyby. □ Následující tabulka ilustruje sílu výsledků předchozích dvou tvrzení pro několik primitivních polynomů v nízkých stupních. Např. poslední řádek nám říká, že přidáním pouhých 10 kontrolních bitů ke slovu o délce 1013 bitů budeme umět pomocí polynomu (x + í)p(x) odhalit jednotlivé, dvojité, trojité a všechny liché počty výskytů chyb v přenosu. Jde přitom o přenášení dosti velkých čísel, v desítkové soustavě by měly přes tři sta cifer. primitivní polynom p (x) kontrolní bity délka slova 1 + x i 1 1 + x - Vx2 2 3 1 + x- Vx3 3 7 1 + x- Y x4 4 15 H -x2 - h*5 5 31 1 + x- V ŕ 6 63 H -x3 - V x1 7 127 1 + x2 +x3 H -x4 - v ŕ 8 255 H -x4 - V x9 9 511 1 + x3 + xw 10 1023 Nástroje pro konstrukci primitivních polynomů dává teorie konečných polí. Souvisí s tzv. primitivními prvky v Galoisových polích G(2m). Ze stejné teorie lze také dovodit příjemnou realizaci dělení se zbytkem, tj. ověřování, zdaje přijaté slovo kódové, pomocí zpožďovacích registrů. Jde o jednoduchý obvod s tolika prvky, kolik je stupeň polynomu.8 11.64. Lineární kódy. Polynomiální kódy lze efektivně popisovat také pomocí elementárního maticového počtu. Budeme přitom pracovat s vektorovými prostory nad ^2, takže musíme být opatrní při využívání výsledků %forf*%*~J— elementární lineární algebry, protože jsme v ní často využívali vlastnost, že ľ = —v zaručuje v = 0. To nyní samozřejmě neplatí. Základní definice vektorových prostorů, existence bází a popis lineárních zobrazení pomocí matic ale zůstávají v platnosti. Bude užitečné připomenout si při čtení následujících odstavců obecnou teorii a ujistit se o její použitelnosti. Vyjdeme z obecnější definice kódů, která požaduje lineární závislost kódového slova na původní informaci: [ Lineární kódy [__, Injektivní lineární zobrazení g : (IqÝ -» (Z2)" je lineární kód. Matice G typu Ic/n reprezentující toto zobrazení ve standardních bázích se nazývá generující matice kódu. 8Více o této krásné teorii a jejích souvislostech s kódy se lze dočíst např. v knize Gilbert, W.( Nicholson, K., Modern Algebra and its applications, John Wiley & Sons, 2nd edition, 2003, 330+xvii pp., ISBN 0-471-41451-4. 700 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Generující matice je tvaru G = yjj > kde P = kontroly je tvaru (I„-k P), tedy v našem případě je /l 1\ 0 1 1 1 0 1 v1 1/ . Matice /l 0 0 0 0 1 l\ 0 1 0 0 0 0 1 H = 0 0 1 0 0 1 1 0 0 0 1 0 0 1 \0 0 0 0 1 1 1/ Přijaté slovo vynásobíme kontrolní maticí a dostáváme tak syndrom (chybu) slova: /0\ /l 0 0 0 0 1 1\ 0 0 1 0 0 0 0 1 1 H = 0 0 1 0 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 1 1 v 1 w = (0 1 1 1 !)• Syndrom příslušný přijatému slovu je tedy 01111. Nyní určíme všechna slova příslušná tomuto syndromu. Dostaneme je tak, že k přijatému slovu přičteme postupně všechna platná kódová slova. Platná kódová slova jsou čtyři, odpovídající čtyřem možným zprávám, které můžeme poslat. Získáme je vynásobením možných zpráv (00, 01, 10, 11) generující maticí. Dostáváme tak slova 0000000, 1111101, 1010110, 0101011. Prostor slov odpovídajích danému syndromu je afinní prostor se zaměřením daným vektorovým prostorem všech platných kódových slov (viz 11.66). Dostáváme tak slova 0010111, 1101010, 1000001, 0111100. Nejmenší možný počet chyb při přenosu je roven minimálnímu počtu jedniček v kódových slovech s daným syndromem. V našem případě ze čtyř kódových slov má nejméně jedniček slovo 1000001, které je tedy takzvaným vedoucím reprezentantem třídy slov se syndromem 01111. Nejmenší možný počet chyb ve slově se syndromem Olllljsou dvě. Původně přenášené slovo pak získáme odečtením (což je v Z2 ekvivalentní přičtení) přijatého slova a vedoucího reprezentanta třídy s daným syndromem. V našem případě 0010111 - 1000001 = 1010110. Pro každé slovo ľ je příslušným kódovým slovem delší vektor u = G ■ v. Věta. Každý polynomiální (n, k)-kód je lineární kód. Důkaz. Použijeme elementární vlastnosti dělení polynomů se zbytkem. Použijme naše přiřazení polynomu 11 (jí) — r(x) + x"~km(x) původní polynomiální zprávě m(x) na součet dvou různých zpráv m(x) = m\(x) + m2(jí). Zbytek po dělení x"~k (m\(x) + m2 (jí)) je díky jednoznačnosti dělení dán jako součet zbytků r\ (x) + Dostaneme tedy v(x) = n(x) + r2(x) + x"-k rlix) pro jednotlivé zprávy. (mi(jí) + m2(x)), což je požadovaná aditivita. Protože jediným nenulovým skalárem je v Z2 jednička, dokázali jsme požadovanou linearitu zobrazení slova m (jí) na delší slovo 11 (jí). Toto zobrazení je navíc injektivní, protože původní slovo m (jí) je prostě zkopírováno za přidané bity. □ Např. uvažujme polynomiální (6, 3)-kód využívající polynomu p(x) = 1 + x + x3 pro kódování slov se třemi bity. Vyčísle- ním na jednotUvých bázových prvcích m,-(jí) = x1 dostáváme v0 = (1 +jí) +X3 , vi = (x +X2) +xA, V2 = (1 +jí + x2) +X5 a tedy matice odpovídající tomuto (6, 3)-kódu je íl 0 1\ 1,2,3 G = 1 0 1 0 1 1 1 1 0 o 1 o 0 l) Protože je u polynomiálních kódů vždy původní slovo zkopírováno za přidané kontrolní bity, musí mít každý lineární kód vzniklý z polynomiálního matici s jednotkovým blokem řádu k zabírajícím posledních k řádků matice, doplněným maticí P s n — k řádky a k sloupci. 11.65. Věta. Je-li g zapsanou) maticí (TLif (Z2)" lineární kód s {blokově potom zobrazení h : (JLif • (Z2)" k s maticí H = {ln-k P) má následující vlastnosti (1) Ker h — Im g, (2) přijaté slovo u je kódové slovo, právě když je H ■ u = 0. Důkaz. Složení h o g : (Z2)k -» (Z2)n-k je dáno součinem matic (počítáme nad Iq) H G = (I, = P + P = 0. 701 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Za predpokladu nejmenšího možného počtu chyb při přenosu bylo tedy odesláno slovo 1010110, informační bity jsou pouze poslední dva, tedy slovo 10. □ 11.141. Uvažujme (7, 3) lineární kód generovaný polynomem xA + x3 + x + 1. Napište jeho generující a kontrolní matice. Metodou vedoucích reprezentantů dekódujte přijatou zprávu 1110010, za předpokladu, že při přenosu došlo k nejmenšímu možnému počtu chyb. O 11.142. V lineárním (7,4)-kódu (tj. délka vlastní zprávy jsou 4) nad Z2 zadaném maticí /O 1 1 0\ 1 1 0 1 1 0 1 1 1 0 0 0 0 1 0 0 0 0 1 0 1° 0 0 v byla přijata zpráva 1010001. Dekódujte ji (tj. nalezněte odesílanou zprávu) za předpokladu, že při přenosu došlo k nejmenšímu možnému počtu chyb. Řešení. Je možných 24, tedy 16 posílaných zpráv. Všechna platná kódová slova pak dostaneme pronásobením možných zpráv (0000, 0001, ...,1111) generující maticí kódu. Dostáváme tak slova: 0110001, 1010010, 1100100, 0111000 1100011, 1010101, 0001001, 1011100 1101010, 0110110, 0001110, 1101101 1011011, 0000111, 0111111, 0000000. Nyní sestavíme matici kontroly parity daného kódu: /l 0 0 0 1 1 0\ #=0101101. \0 o 1 1 o 1 1/ (z generující matice jsme vzali blok, který netvoří jednotkovou matici, a před něj napíšeme čtvercový blok tvořený jednotkovou maticí tak aby „pasoval"). Pokud vynásobíme vektor obdržené zprávy zT = (1010001) maticí H dostáváme syndrom zprávy s = Hz = (110)r. Jedno ze slov s tímto syndromem je slovo 1100000 (syndrom doplníme nulami do správné délky). Všechna slova se syndromem 110 dostaneme přičtením tohoto slova ke všem kódovým slovům. Získáváme tak slova 1010001, 0110010, 0000100, 1011000, 0000011, 0110101, 1101001, 0111100, 0001010, 1010110, 1101110, 0001101, 0111011, 1100111, 1011111, 1100000 Z těchto slov se syndromem 110 obsahuje pouze slovo 0000100 pouze jednu jedničku, jedná se tedy o vedoucího reprezentanta třídy Dokázali j sme tedy Im g c Ker h. Protože je prvních n—k sloupců v H tvořeno bázovými vektory v (lif~k, má obraz \mh maximálni dimenzi n — k a tedy má tento obraz 2"~k různých vektorů. Vektorové prostory nad Z2 jsou konečné komutativní grupy, proto můžeme použít vztah mezi mohutnostmi podgrup a faktor-grup z odstavce 11.10 a dostáváme \Kerh\ ■ \ Imh\ = |(Z2)"| = 2". Proto je počet vektorů v Ker h roven 2™ • 2k~" = 2k. K dokončení důkazu prvního tvrzení si nyní stačí povšimnout, že obraz Im / má také 2k prvků. Druhé tvrzení je samozřejmým důsledkem prvního tvrzení. □ Matici H z věty se říká matice kontroly parity příslušného (n, &)-kódu. Např. matice H = (1 1 1) je zjevně takovou maticí pro (3, 2) kód přidávající jeden paritní bit k slovu o dvou bitech. Skutečněji snadno dostaneme z matice zadávající tento kód. Pro výše uvedený (6, 3)-kód to bude matice /l 0 0 1 0 1 H = 0 1 0 1 1 1 \0 0 1 0 1 1 11.66. Samoopravné kódy. Jak jsme viděli, přenos zprávy u dává výsledek To je ale nad Z2 ekvivalentní e = u + v. Pokud tedy známe vektorový podprostor V c (Z2)™ správ-I-i • . ných kódových slov, víme u každého výsledku, že správné rfjj^) slovo (s opravenými případnými chybami) je ve třídě roz-rvý^f kladu v + V ve faktorovém vektorovém prostoru (Z2)™/F. • í'' ! Zobrazení h : (Z2)™ —> (Z2)"_í: zadané maticí kontroly parity má V za jádro, proto indukuje injektivní lineární zobrazení h : (Z2)™/F -> (Z2)"_í:. Jeho hodnoty jsou jednoznačně určeny hodnotami H ■ u. [ Syndromy slov |___ Hodnota H ■ u, kde H je matice kontroly parity pro lineární kód, se nazývá syndrom slova u v tomto kódu. Samozřejmým důsledkem konstrukce je následující: Věta. Dvě slova jsou ve stejné třídě rozkladu u + V, právě když sdílí syndrom. Samoopravné kódy nyní můžeme konstruovat tak, že pro každý syndrom určíme prvek v příslušné třídě, který je nej-vhodnějším slovem. Budeme patrně vybírat tak, abychom s co nej větší pravděpodobností opravili jednu, případně více chyb. Zkusme si to na příkladu (6, 3), pro který už máme spočteny matice G a H. Sestavíme tabulku všech syndromů a jim odpovídajících kódových slov. 702 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY slov se syndromem 110. Odečtením vedoucího reprezentanta od obdržené zprávy dostáváme zprávu, která byla odeslána, došlo-li k nejmenšímu možnému počtu chyb (v tomto případě k jedné), tedy zprávu (101)0101, z níž jsou poslední čtyři bity informační. Poslaná informace byla 0101. □ 11.143. V lineárním (7,4)-kódu (tj. délka vlastní zprávy je 4) nad Z2 zadaném maticí fl 1 0 1\ 0 0 1 1 1 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0 1° 0 0 v byla přijata zpráva 1101001. Dekódujte ji (tj. nalezněte odesílanou zprávu) za předpokladu, že při přenosu došlo k nejmenšímu možnému počtu chyb. Řešení. Syndrom 101, vedoucí reprezentant 0001000, poslaná zpráva (110)0001 □ 11.144. V lineárním (7,4)-kódu (tj. délka vlastní zprávy jsou 4) nad Z2 zadaném maticí fl 0 1 1\ 0 1 0 1 0 1 1 0 1 0 0 0 0 1 0 0 0 0 1 0 1° 0 0 v byla přijata zpráva 0000011. Dekódujte ji (tj. nalezněte odesílanou zprávu) za předpokladu, že při přenosu došlo k nejmenšímu možnému počtu chyb. Řešení. Syndrom 011, vedoucí reprezentant 0000100, poslaná zpráva (000)0111. □ 11.145. V lineárním (7,4)-kódu (tj. délka vlastní zprávy jsou 4) nad Z2 zadaném maticí (0 1 1 1\ 1 0 1 0 1 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 1° 0 0 v byla přijata zpráva 0001100. Dekódujte ji (tj. nalezněte odesílanou zprávu) za předpokladu, že při přenosu došlo k nejmenšímu možnému počtu chyb. Syndrom 000 mají právě všechna kódová slova. Všechna možná slova s daným syndromem pak dostaneme přičtením syndromu (doplněného nulami na délku kódového slova) ke všem kódovým slovům. V následujících dvou tabulkách jsou v prvním řádku příslušné syndromy, na dalším řádku pak uvádíme ten z vektorů v příslušné třídě, který má nejméně jedniček. Skoro ve všech případech jde o jedinou jedničku, jen v posledním sloupci máme jedničky dvě a zvolili jsme si jako význačný prvek ten, který má jedničky vedle sebe (třeba protože věříme, že násobné chyby s větší pravděpodobností nastávají těsně po sobě) 000 100 010 001 000000 100000 010000 001000 110100 010100 100100 111100 011010 111010 001010 010010 111001 011001 101001 110001 101110 001110 111110 100110 001101 101101 011101 000101 100011 000011 110011 101011 010111 110111 000111 011111 110 011 111 101 000100 000010 000001 000110 110000 110110 110101 110010 011110 011000 011011 011100 111101 111011 111000 111111 101010 101100 101111 101000 001001 001111 001100 001011 100111 100001 100010 100101 010011 010101 010110 010001 Počínaje druhým sloupcem první tabulky, je každý sloupec tabulky afinním prostorem, jehož zaměřením je vektorový prostor daný prvním sloupcem první tabulky. Je tomu tak, protože daný kód je lineární, všechna kódová slova tedy tvoří vektorový prostor a jednotlivé třídy ve faktorovém prostoru jsou afinní podprostory. Zejména je tedy rozdíl každých dvou slov ve stejném sloupci nějakým kódovým slovem. Tučně vyznačená slova představují tzv. vedoucí reprezentanty třídy (afinního prostoru) odpovídajícího danému syndromu. Jsou to slova s nejmenším počtem jedniček v sloupci. Udávají tak nejmenší počet bitových změn, které musíme v libovolném slovu na sloupci provést, abychom dostali kódové slovo. Např. pokud dostaneme kódové slovo 111101, má syndrom 110. Vedoucím reprezentantem ve třídě tohoto syndromu je slovo 000100 a jeho odečtením od obdrženého kódového slova dostaneme platné kódové slovo 111001. Je to platné kódové slovo s nejmenší Hammingovou vzdáleností od obdrženého slova. Odeslaná zpráva tedy patrně byla 001. 703 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY Řešení. Syndrom 110, vedoucí reprezentant 0000010, poslaná zpráva (000)1110. □ 11.146. Máme množinu čtyř slov, která chceme přenášet binárním N\\)iv kódem, který by uměl opravovat jednoduché chyby. Jakou neJmenší délku kódového slova můžeme použít, požadujeme-li, aby všechna kódová slova měla stejnou délku? Proč? Řešení. Označme hledanou délku jako n. Minimální Hammingova vzdálenost dvou kódových slov musí být alespoň tři. To znamená, že pokud ve dvou kódových slovech změníme jeden bit, nemůžeme dostat stejná slova. Množina slov, které dostaneme z jednoho kódového slova změnou nej výše jednoho bitu, čítá (včetně původního slova) n+1 slov. Pro různá kódová slova musíme dostat disjunktní množiny. Celkem tedy takto dostáváme 4(n + 1) různých slov délky n. Slov délky n je ovšem 2™, požadujeme tedy 4(n + 1) < 2™. Tato nerovnost je splněna až pro n > 5. Kódová slova musí tedy mít délku minimálně 5. Hledaná kódová slova délky 5 s minimální Hammingovou vzdáleností 3 jsou například: 00111, 01001, 10100, 11010. □ 11.147. Kolik minimálně bitů musí mít kódové slovo kódu (uvažu-jeme pouze kódy se stejnou délkou kódových slov), který má ^MJ/d čtyři informační bity a opravuje až dvojnásobné chyby? Řešení. Provedeme analogickou úvahu jako v předchozím příkladě. Má-li kód opravovat dvojnásobné chyby, tak Hammingova vzdálenost libovolných dvou slov musí být alespoň pět. To znamená, že pokud v libovolných dvou kódových slovech změníme libovolný bit, či dva bity, tak nikdy nedostaneme ta stejná slova nebo slovo kódové. Označíme-li n délku kódového slova tak dostáváme nerovnost Nejmenší n, které nerovnost splňuje je n = 10, kódové slovo tedy musí mít alespoň osm bitů. Není složité takový kód vymyslet, necháváme na čtenáři. □ 704 _KAPITOLA 11. ALGEBRAICKÉ STRUKTURY_ Řešení cvičení 11.3. i) Není ani grupoid (operace není na dané množině uzavřená), ii) nekomutativní monoid, iii) komutativní grupa, iv) nekomutativní grupa, v) grupa, vi) pologrupa (1 není neutrální prvek kvůli prvku 0). 11.4. i) G tvoří komutativní monoid, ii) G tvoří komutativní grupu, iii) G tvoří komutativní grupu. 11.5. i) Daná množina s operací tvoří komutativní pologrupu, která není monoidem. ii) Daná množina s operací tvoří nekomutativní grupoid, který není pologrupou. iii) Daná množina tvoří nekomutativní grupoid, který není pologrupou. iv) Daná množina tvoří nekomutativní pologrupu, která nemá neutrální prvek. v) Daná množina tvoří komutativní monoid, který není grupou. vi) Daná množina tvoří komutativní monoid, který není grupou. vii) Daná množina tvoří nekomutativní grupu. 11.8. Jedná se o nekomutativní grupu. 11.9. i) (1,3,5,7,2,4,6) ii) (1, 3, 2) o (4, 6, 5), (1, 4, 2, 5, 3, 6), (1, 5, 2, 6, 3, 4), (1, 6, 2, 4, 3, 5) iii) Neexistuje 11.12. Žádná taková neexistuje, díky paritě. 11.22. i) Ano ii) Ne iii) Ano iv) Ne 11.23. i) Ano ii) Ne 11.24. m = 10. 11.35. Tvrzení není pravdivé. Uvažte například S„/A„ ~ Z2, n > 3. 11.40. Čtyřprvková podgrupa, přibude pouze zrcadlení podle roviny kolmé k uvažované rovině obsahující osu rotace (je izomorfní Kleinově grupě Z2 x Z2). Není normální. 11.50. i) Je izomorflsmus ii) Je homomorflsmus, který není surjektivní ani injektivní. iii) Není homomorflsmus 11.51. V řešení uvádíme právě vlastnosti, které daný předpis má. Výjimku tvoří fakt, že všechny předpisy zadávají zobrazení, což neuvádíme. i) je surjektivní homomorflsmus, ii) je surjektivní homomorflsmus, iii) je homomorflsmus, i v) není ani homomorflsmus, v) Je homomorflsmus, vi) Je homomorflsmus. v) Ano vi) Ano vii) Ne viii) Ne 705 KAPITOLA 11. ALGEBRAICKÉ STRUKTURY 11.52. i) Je surjektivní homomorflsmus, který není injektivní. ii) Není homomorflsmus. iii) Není homomorflsmus. 11.53. i) Je to injektivní, nesurjektivní homomorflsmus. ii) Není ani zobrazení („obraz" neleží v A4). 11.54. i) Je injektivní homomorflsmus. ii) Není homomorflsmus. iii) Není homomorflsmus. i v) Není homomorflsmus. 11.55. i) Je homomorflsmus. ii) Předpis nezadává zobrazení. iii) Je surjekivní homomorflsmus. 1L6L é( 5 budou jistě buď aspoň tři plné nebo aspoň tři čárkované. Situace je znázorněna na pravém obrázku. V zobrazeném kousku celé situace se sledovaný host se třemi jinými zná, zbylé puntíky jsou spojeny čárkovaně - to by znamenalo, že máme trojúhelník hostů, kteří se neznají. Pokud by se ale jedna dvojice z nich znala, vznikl by naopak trojúhelník hostů, kteří se znají.) V druhém příkladu předpokládejme, že máme krabičku, která požírá jeden bit za druhým, a má svítit buď modře nebo červeně podle toho, zda byl poslední bit nula nebo jednička. Opět si schéma můžeme pěkně znázornit: KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY studenti se pořád ještě neznají. Ukažte, že nebudou seznámeni na následující párty. Řešení. Ukážeme graf známostí mezi studenty na počátku (vrcholy odpovídají studentům, hrany odpovídají známostem). Ukážeme, že pokud nějací dva studenti leží ve stejné komponentě souvislosti tohoto grafu (existuje řetězec známých počínající jedním studentem a končících druhým), viz 12.12, pak už budou nutně seznámeni poté, co každý uspořádá alespoň jednu párty. Uvažme totiž nejkratší cestu (řetězec známostí) mezi studenty, kteří leží ve stejné komponentě souvislosti grafu. Vždy, když uspořádá párty někdo ležící na této cestě, tak zkrátí délku nejkratší cesty o jedna (pořadatel z cesty vypadne). Protože párty uspořádá každý ze studentů na cestě (známostí), tak budou seznámeni i dva studenti na konci. Pokud tedy nějací dva studenti nebyli seznámeni ani poté, co již každý uspořádal aspoň jednu párty, znamená to, že leží v jiných komponentách souvislosti grafu známostí a tímto způsobem nebudou seznámeni nikdy, zejména ne na příští párty. □ Základní pojmy z teorie grafů si procvičíme zejména na jednoduchých kombinatorických úlohách. 12.2. Určete, kolik hran mají grafy K$, K5t6, C&. Řešení. Úplný graf na 6 vrcholech K6 má q = 15 hran, úplný bipar-titní graf K56 (viz 12.3) má 5-6 = 30 hran a konečně kružnice Cg má 8 hran. □ 12.3. Skóre grafu. Ověřte, zda daná posloupnost je skóre (viz 12.7) nějakého grafu. Pokud ano, nějaký graf s tímto skóre nakreslete. i) (1,2,3,4,5,6,7,8,9), ii) (1, 1, 1,2,2,3,4,5,5). Řešení. Nejprve bývá vhodné ověřit nutnou podmínku z (12.1). V prvním případě je 1 + • • • + 9 = | • 9 • 10 = 45, a podmínka tedy není splněna. Proto první posloupnost neodpovídá žádnému grafu. Ve druhém případě je součet požadovaných stupňů roven 24 a nutná podmínka je splněna. Dále budeme postupovat podle věty Havla a HaMmlho z odstavce 12.7. (1, 1,1,2,2,3,4,5,5) <-(1,1, 1,0,0,1,2) (0,0, 1, 1,0,0) <-(0,0, 0, 0,0). > (1, 1, 1,1,1,2,3, 4) (0,0, 1,1,1, 1,2) < (0, 0, 0, 0,1,1) Třetí vrchol, ze kterého pouze vychází dvě šipky, naznačuje start před prvním zaslaným bitem. V obou příkladech máme společné schéma. Máme nějakou konečnou množinu objektů, kterou si znázorňujeme jako vrcholy, a jejich vlastnosti, které znázorňujeme spojnicemi mezi nimi. Už dávno víme, že takové situace umíme popisovat pomocí tzv. relací, viz text začínající odstavcem 1.36 v šesté části první kapitoly. Třeba čtenáře neodstraší ukázka, jak se jednoduchým věcem dá složitě říkat: V našem prvním příkladu pracujeme na stejné množině hostů se dvěma komplementárními symetrickými a antireflexními relacemi, ve druhém pak jde o příklad dvou antisymetrických relací na třech prvcích. 12.2. Základní pojmy grafů. My teď ale můžeme na relace po-zapomenout a budeme pracovat s terminologií odpovídající našim obrázkům. Nenechte se zmást novým významem slova graf, pro který jsme již měli význam u funkcí. Ve skutečnosti není věcná podobnost až tak Grafy a orientované grafy Definice. Grafem (též neorientovaným grafem) G = (V, E) rozumíme množinu V jeho vrcholů spolu s podmnožinou E množiny (2) všech dvouprvkových podmnožin ve V. Prvkům E říkáme hrany grafu. Vrcholům hrany e = {v, w), v 7^ w, říkáme hraniční (krajní) vrcholy hrany e. O hranách, které mají daný vrchol v za hraniční, říkáme, že z vrcholu v vycházejí. Orientovaným grafem G = (V, E) rozumíme množinu V jeho vrcholů spolu s podmnožinou E c V x V. Prvnímu z vrcholů definujících hranu e = (v,w) říkáme počáteční vrchol hrany, druhému pak koncový vrchol. Hrana e vychází ze svého počátečního vrcholu a vchází do koncového. U orientovaných hran mohou být koncový a počáteční vrchol totožný, hovoříme pak o smyčce. Sousední hrany grafu jsou ty, které sdílí hraniční vrchol, u sousedních hran orientovaného grafu musí být tento vrchol pro jednu hranu koncový a pro druhou počáteční. Naopak sousední vrcholy jsou ty, které jsou hraničními pro tutéž hranu. Ke každému orientovanému grafu G = (V, E) přiřazujeme jeho symetrizaci. Je to (neorientovaný) graf se stejnými vrcholy jako má G, přičemž e = {v, w) je hranou, právě když alespoň jedna z hran e' = (v, w) nebo e" = (w, v) patří do E. Grafy jsou mimořádně dobrým jazykem pro přemýšlení o postupech a odvozování vztahů týkajících se konečných množin objektů. Jsou také pěkným příkladem kompromisu mezi přirozeným sklonem k „přemýšlení v obrázcích" a přesným matematickým vyjadřováním. Obecný jazyk teorie grafů nám v konkrétních úlohách umožňuje přidávat informace o vrcholech nebo hranách. Můžeme tak např. „obarvit" vrcholy podle příslušnosti objektů k několika 709 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Nebylo samozřejmě nezbytné provádět postup až do konce, mohli jsme skončit již ve chvíli, kdy máme posloupnost, které je zřejmě skórem nějakého grafu. Daná posloupnost je tedy skóre grafu, který zkonstruujeme postupem od konce (vždy je ale třeba dávat pozor, abychom přidávali hrany k vrcholům těch stupňů, které mají být spojeny s nově přidávaným vrcholem - v tomto místě je taky obecně možnost získat neizomorfní grafy se stejným skóre). Příkladem jednoho z možných výsledků je graf (čísla ve vrcholech udávají, v kterém kroku byl vrchol přidán) ' 2 □ 12.4. Určete, kolik existuje navzájem neizomorfních úplných bipar-titních grafů majících 1001 hran. Řešení. Úplný bipartitní graf Km „ má m ■ n hran, úlohu lze tedy přeformulovat do tvaru: kolika způsoby je možné rozložit číslo 1001 na součin dvou čísel? Protože 1001 = 7 • 11 • 13, dostáváme 1001 = = 1 • 1001 = 7 • (11 • 13) = 11 • (7 • 13) = 13 • (7 • 11). Máme tedy čtyři neizomorfní úplné bipartitní grafy: £l,1001> £7,143> ^11,91 & Xl3,77. D 12.5. Určete, kolik existuje homomorfismů grafů (viz 12.4) a) z P2 do K5, b) z K3 do Ks. Řešení. Jediné omezení plynoucí z požadavku na homomorfismus je, že se vrcholy, mezi kterými vede hrana, nesmí zobrazit na tentýž vrchol. a) 5 • 4 • 4 : b) 5 • 4 • 3 : : 80. 60. □ disjunktním skupinám nebo můžeme označit hrany několika různými hodnotami apod. Existence hrany mezi vrcholy různých barev může naznačit „konflikt". Např. když modré a červené vrcholy představují příslušnost k dvěma zájmovým skupinám osob, zatímco hrany označují plánované sousedství u obědové tabule, pak hrana mezi vrcholy různých barev může znamenat skutečný potenciální konflikt. Náš první příklad v předchozím odstavci můžeme tedy chápat jako graf s obarvenými hranami. Dokázané tvrzení v této řeči zní: V grafu Kn — (V, (2)) s n > 6 vrcholy a se všemi možnými hranami, které jsou obarveny dvěma barvami, je vždy alespoň jeden trojúhelník z hran o stejné barvě. Orientovaný graf ve druhém příkladu výše, s označenými hranami hodnotami nula nebo jedna, představuje jednoduchý konečný automat. Tento název odráží představu, že graf popisuje proces, který se vždy nachází ve stavu popsaném některým z vrcholů, a další stav nastane po kroku odpovídajícím jedné z hran, které z vrcholu vychází. Teorií konečných automatů se zde ale nebudeme podrobněji zabývat. 12.3. Příklady užitečných grafů. Nejjednodušším grafem je , graf bez hran, pro ten si ale ani nebudeme zavádět zvláštní označení. Opačný extrém je naopak užitečný a grafu se všemi možnými hranami říkáme úplný graf. Značíme jej symbolem Kn, kde n je počet vrcholů grafu. Graf k4 a jsme již viděli v úvodním odstavci, K3 je trojúhelník, K2 je úsečka. Dalším důležitým grafem je cesta, tj. graf, kde existuje uspořádání vrcholů (do, ■ ■ ■, v„) takové, že E — {e\, ..., en], kde Ci ~ {vi-i, u;} pro všechna i = 1, ..., n. Hovoříme o cestě délky n a značíme ji P„. Pokud cestu upravíme tak, že poslední a první vrchol splývají (pro n > 3), dostaneme kružnici délky n a značíme C„. Na dalším obrázku vidíme K3 — C3, C5 a P5. A ônj Dalším příkladem je tzv. úplný bipartitní graf, který vznikne tak, že vrcholy obarvíme dvěma barvami a pak přidáme všechny hrany, které spojí vrcholy různých barev. Značíme jej Km,„, kde man jsou počty vrcholů s jednotlivými barvami. Na obrázku je vidět -K"i_3, K2t3 a -£"33. V 12.6. Počet sledů. Pomocí matice sousednosti (viz 12.8) určete počet sledů délky 4 z vrcholu 1 do vrcholu 2 v následujícím grafu: Dobrým příkladem grafu je také tzv. hyperkostka Hn v dimenzi n, která vznikne tak, že vrcholy jsou všechna čísla 0, ..., 2™ — 1. Hrany spojí právě ta čísla, která se v zápisu ve dvojkové soustavě liší v právě jednom bitu. Na obrázku níže je H4 a popis vrcholů je naznačen. Všimněme si, že přímo z definice vyplývá, že hyperkostku v dané dimenzi vždy dostaneme tak, že vhodně spojíme hranami 710 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řešení. Matice sousednostl zadaného grafu je /O 1 1 0 0\ 1 1 1 0/ Počet sledů délky 4 z vrcholu 1 do 2 dostaneme jako prvek na pozici [1,2] v matici At i4G . Protože (2 1 1 2 2\ 1 4 3 2 2 1 3 4 2 2 2 2 2 3 2 \2 2 2 2 je (A4 )u = (2, 1, 1, 2, 2) • (1,4, 3, 2, 2)T sledů délky 4 mezi vrcholy 1 a 2. 17. Dostali jsme tak 17 □ 12.7. Mostem v grafu rozumíme hranu, po jejímž odebrání se zvýší počet souvislých komponent grafu. Artikulací je vrchol se stejnou vlastností, tj. odebereme-li jej (samozřejmě spolu s incidenmími hranami), dojde ke zvýšení počtu souvislých komponent. V grafu na obrázku najděte všechny mosty a artikulace. O 12.8. Dokažte, že hamiltonovský graf (viz 12.18) musí být vrcholově 2-souvislý. Udejte příklad grafu, který je vrcholově 2-souvislý a přesto v něm neexistuje hamiltonovská kružnice. Řešení. V hamiltonovském grafu vedou mezi libovolnými dvěma vrcholy dvě neprotínající se cesty („oblouky" hamiltonovské kružnice). Odstraněním jednoho vrcholu se tedy zjevně neporuší souvislost grafu (odstraněný vrchol může ležet pouze na jedné ze dvou cest). Příkladem dvě hyperkostky o jednu dimenzi menší. Na obrázku je to naznačeno tak, že příslušné hrany mezi dvěma disjunktními kopiemi H3 jsou čárkované. Samozřejmě ale můžeme takto rozložit H4 mnoha různými způsoby. 1110 nu 1011 0100 0000 0001 Poslední dva příklady jsou tzv. cyklický žebřík CLn s 2n vrcholy, který je vytvořen propojením dvou kopií kružnice C„ tak, že hrany spojí odpovídající vrcholy dle pořadí, a tzv. Petersenův graf, který je sice docela podobný CL5, ale ve skutečnosti je to nejjednodušší „vyvraceč nesprávných úvah" - graf, na němž se vyplatí testovat tvrzení, než je začneme dokazovat. 12.4. Morfismy grafů a podgrafy. Jako vždy u matematických "R pojmů, klíčovou roh hrají i u grafů zobrazení mezi množinami vrcholů a hran, která zachovávají uva-žovanou strukturu. Ve skutečnosti stačí sledovat jen zobrazení mezi vrcholy. .___j Morfismy grafů ]___ Definice. Pro grafy G — (V, E) a G' — (V, E') nazveme mor-fismem (též homomorfismem) f : G -» G' takové zobrazení fv : V -» V mezi množinami vrcholů, že je-li e = {v, w) hrana v E, pak e' — {fy (v), fy (u>)} musí být hranou v E'. V dalším textu nebudeme ve značení odlišovat morflsmus / a zobrazení fy. Zároveň pak takové zobrazení fy určuje i zobrazení j'e '■ E -» E?, f 'e (e) = e', kde e a e'jsou jako výše. Pro orientované grafy je definice shodná, jen pracujeme s uspořádanými dvojicemi e = (v, w) v roh hran. Všimněme si, že u grafů tato definice znamená, že pokud f (v) = f (w) pro dva různé vrcholy ve V, pak mezi nimi nesměla být hrana. U orientovaných grafů je taková hrana přípustná, pokud je na společném obrazu smyčka. Speciálním případem je morfismus libovolného grafu G do úplného grafu Km. Takový morfismus je ekvivalentní vybranému obarvení vrcholů grafu G pomocí m různých jmen vrcholů Km tak, že stejně obarvené vrcholy nejsou spojeny hranou. Hovoříme v tomto případě o barvení grafu pomocí m barev. 711 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY grafu, který je vrcholově 2-souvislý a přesto v něm neexistuje hamilto-novská kružnice, je například Petersenův graf (viz úvodní obrázek ke kapitole). □ 12.9. Určete, kolik existuje v grafu K5 různých kružnic (viz 12.3). Řešení. Spočítáme postupně délky kružnic délek tři, čtyři a pět. Kružnice délky tři je jednoznačně dána třemi vrcholy na ní. Tři vrcholy můžeme vybrat (3) způsoby. Kružnice délky 4 je dána svými vrcholy (ty můžeme vybrat q způsoby) a dvojicí sousedů jednoho pevně zvoleného vrcholu na kružnici (tu je možné vybrat (32) způsoby ze zbývajících tří vrcholů). Konečně kružnice délky pět je dána opět dvojicí sousedů jednoho pevně zvoleného vrcholu a navíc ještě dalším vrcholem (ze dvou zbylých), sousedícím s jedním vybraným vrcholem ze dvou sousedů. Celkem tak máme [ti q možností. □ Ml : 37 V případě, že je morflsmus / : G -» G' bijekcí na vrcholech takovou, že i /_1 je morflsmem, hovoříme o izomorfismu grafů. Izomorfní grafy se Uší pouze různým pojmenováním vrcholů. Každý morflsmus orientovaných grafů je také morflsmem jejich symetrizací. Naopak to samozřejmě obecně neplatí. Jednoduchými a mimořádně užitečnými příklady morflsmů grafů jsou pojmy cesta, sled a kružnice v grafu: _ Cesty, sledy a kružnice v grafech _„ Sled délky n v grafu G je jakýkoUv morflsmus s : Pn -» G (tj. v obrazu se mohou opakovat vrcholy i hrany). Tah je speciální případ sledu, v němž se mohou opakovat vrcholy, ale nikoUv hrany. Cestou délky n v grafu G rozumíme morflsmus p : P„ -» G takový, že p je injektivní zobrazení (tj. všechny obrazy vrcholů vo, ..., v„ z P„ jsou různé). Kružnice délky n v grafu G je morflsmus c : C„ -» G takový, že c je injektivní zobrazení vrcholů. Budeme přitom často pro zjednodušení zápisu našich úvah ztotožňovat morflsmus a jeho obraz. Obvykle budeme sledy konkrétně zapisovat ve tvaru (do, e\, v\, ..., en, vn), kde e; = {ť;-i, i>;) pro i = 1,..., n. 12.10. Určete počet podgrafů (viz 12.4) grafu K5. Řešení. Počet podgrafů spočítáme postupně podle počtu v jejich vrcholů: • v = 0. Jde o prázdný graf. Ten je pouze jediný. • v = 1. Jeden vrchol můžeme vybrat pěti způsoby, celkem tedy máme 5 grafů. • v = 2. Dva vrcholy můžeme vybrat q způsoby, mezi vybranými vrcholy pak buď vede nebo nevede hrana. Celkem je tedy q • 2 takových grafů. • v = 3. Tři vrcholy můžeme vybrat (3) způsoby, mezi každými dvěma vybranými vrcholy buď vede, nebo nevede hrana, celkem (3) • 2(2) grafů. • v = 4. Zde napočítáme q • 2O grafů. • v = 5. V tomto případě máme q • 2(2) grafů. Celkem jsme našli 1550 podgrafů grafu K5. □ 12.11. Určete počet cest mezi dvěma různými pevně vybranými vrcholy v grafu K-/. Řešení. Spočítáme cesty postupně podle jejich délky. Cesta délky jedna je jedna (hrana spojující dva vybrané vrcholy). Cest délek dva je pět (vybíráme jeden z pěti zbylých vrcholů, přes který cesta půjde). Cest délek tři je 5 • 4 (vybíráme dva vrcholy, přes které cesta půjde, včetně jejich pořadí), obdobně cest délky čtyři je 5-4-3, cest délky pět je 5 • 4 • 3 • 2 a konečně cest délky šest je taktéž 5!. Delší cesty v K7 nejsou. Celkem máme l+5+5-4 + 5- 4-3 + 5!+5! = 326 cest. □ A na závěr tohoto oddílu ještě jedna zábavná úloha. Sled si můžeme představit jako dráhu „přičinUvého ale tápajícího" poutníka z vrcholu / (do) do vrcholu f(v„). Poutník se totiž v žádném vrcholu (neorientovaného) grafu nezastaví. Skutečně v P„ existuje vždy mezi následujícími vrcholy d,_i a d, hrana, zatímco smyčky v neorientovaných grafech nepřipouštíme. KUdně se ale po cestě grafem vrací do vrcholů nebo i dokonce po hranách, kterými dříve šel. Poutník „na tahu" je již o něco moudřejší a cesta je naopak průchod grafem z počátečního vrcholu /(do) do koncového f(v„) bez zbytečných okUk. 12.5. Podgrafy. Obrazy cest, sledů i kružnic jsou příklady tzv. podgrafů, ne však stejným způsobem. Definujme nejprve obecně, co je to podgraf. K souvislosti s mor-fismy se vrátíme vzápětí. _i Podgrafy |___ Definice. Graf G' = (V, E) je podgrafem v grafu G = (V, E), jestUže V c V, E c E. JestUže si v grafu G = (V, E) vybereme nějakou podmnožinu vrcholů V' c V, pak nej větším podgrafem s těmito vrcholy je tzv. indukovaný podgraf. Je to graf G' = (V', E), kde e e E patří i do E, právě když oba krajní vrcholy hrany e patří do V. Jde tedy o případ, kdy množina hran E je dána jako průnik E n (v2). Dalším zvláštním případem je tzv. faktor grafu - je to podgraf G' = (V, E), který má stejnou množinu vrcholů jako G, ale jeho množina hran E je libovolnou podmnožinou. Klika je pak takový podgraf grafu G, který je izomorfní nějakému úplnému grafu. Každý podgraf tedy můžeme sestrojit postupným použitím těchto dvou případů - napřed zvoUme V' c V* a pak v indukovaném podgrafů na V vybereme cílovou množinu hran E. Snadno j e vidět, že každý obraz homomorfismu (tj. obraz j ak vrcholů, tak hran) tvoří podgraf. 712 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 12.12. V jisté zemi jsou města spojená cestami. Každé město je přímo spojeno právě se třemi jinými. Dokažte, že existuje město, ze kterého lze podniknout okružní cestu, při které použijeme počet cest, který není dělitelný třemi. Řešení. Formulujme tuto úlohu v řeči teorie grafů: v grafu, ve kterém je stupeň každého vrcholu roven třem, existuje kružnice, jejíž délka není dělitelná třemi. Dokážeme indukcí dokonce silnější tvrzení: v grafu, ve kterém je stupeň každého vrcholu roven alespoň třem, existuje kružnice, jejíž délka není dělitelná třemi. Toto tvrzení lze na rozdíl od původního dokázat, neboť v indukčním kroku máme k dispozici silnější předpoklady, než by tomu bylo u tvrzení původního. Indukci povedeme vzhledem k počtu k vrcholů grafu. Pro k = 4 je tvrzení jednoduché. Mějme tedy graf, ve kterém jsou stupně všech vrcholů rovny třem. Indukční předpoklad zní, že libovolném grafu, ve kterém jsou stupně všech vrcholů rovny třem a má menší počet vrcholů menší než daný graf tvrzení platí. V grafu zřejmě existuje kružnice (čtenář jistě nebude mít problémy si toto tvrzení dokázat). Pokud její délka není dělitelná třemi, jsme hotovi. Předpokládejme tedy pro spor, že C = v\v2.. .v3n. Každý z vrcholů této cesty musí být v daném grafu spojen ještě s minimálně jedním dalším vrcholem, než jsou jeho sousedé na kružnici. Pokud by v uvedené cestě byl nějaký vrchol Ví spojen s nějakým vrcholem vj (j > i + 1), pak by cesty v\ v2 ... Vj v j Vj+\ ... u3„ a Ví vi+i... v j měly součet délek roven 3n+2, tedy délka alespoň jedné z nich by nebyla dělitelná třemi. Podobně, pokud by nějaké vrcholy v,a v j, 1 < i < j < 3n byly spojeny se stejným vrcholem mimo kružnici. V tomto novém grafu vedou opět minimálně tři hrany z každého vrcholu (včetně V) a můžeme na něj tedy použít indukční předpoklad. V novém grafu tedy máme kružnici w\ w2 ... wk, kde 3 \ k. Pokud v ní není obsažen vrchol V, tak jde o kružnici v původním grafu. Pokud je, tak analogicky jako v předchozích případech uvážíme dvě kružnice, součet jejichž délek je 3n + 2k a tudíž délka minimálně jedné z nich není dělitelná třemi. V každém případě dostáváme spor, čímž je indukční krok a tím i celý důkaz ukončen. □ 12.6. Kolik je vlastně neizomorf nich grafů? Snadno si budeme ^ i umět načrtnout až na izomorflsmus všechny grafy na málo vrcholech (třeba třech nebo čtyřech). Obecně jde ale o nesmírně složitý kombinatorický problém a i rozhodnutí o konkrétních dvou daných grafech, zda jsou izomorfní, je obecně mimořádně obtížné. Poznámka. Rozhodnout, zda jsou dva dané grafy izomorfní (tzv. Graph isomorphism problém), je úkol, který je poměrně zvláštním příslušníkem třídy NP-problémů1 - není o něm známo ani, je-li NP-úplný, ani je-li polynomiální složitosti. Naproti tomu, o tzv. Subgraph isomorphism problém je známo, že je NP-úplný. Odpovědět přesně i jen na otázku v záhlaví odstavce je děsně těžké. Odhadnout, že je neizomorfních grafů „moc", je ale poměrně snadné. Všech možných grafů na n vrcholech je totiž tolik, kolik je všech podmnožin v množině hran. Všech podmnožin v množině o mohutnosti k je 2k. Izomorfních grafů s danými n vrcholy nemůže být víc, než kolik je bijekcí na n vrcholech, a těch je n\. Neizomorfních grafů tedy nemůže být méně než 2© k(n) = —. n\ Jestliže si tuto funkci zlogaritmujeme při základu 2, dostaneme (používámezjevný vztáhni < nn) ín\ n2 ( 1 2 log, n log2 *(„)=- log2 n! > — 1----^- \2 J 2 \ n n Pro velká n tedy zjevně dostáváme 1 , log2 k(n) = -n — 0(n log2 n), viz terminologii pro asymptotické odhady z odstavce 6.17 na straně 340. 12.7. Stupně vrcholů a skóre grafu. Relativně snadné může být ověření, že dva dané grafy izomorfní nejsou. Izo- >T morfní grafy se totiž od sebe liší pouze přejmenováním vrcholů. Proto musí mít stejné všechny číselné nebo jiné charakteristiky, které se přečíslováním vrcholů nemění. Jednoduché údaje tohoto typu můžeme dostat např. sledováním počtů hran vycházejících z jednotlivých vrcholů. ___| Stupně vrcholů a skóre grafu J___ Pro vrchol v e V v grafu G = (V, E) říkáme, že jeho stupeň je k, jestliže v E existuje k hran, jejichž hraničním vrcholem v je. Píšeme v takovém případě deg v = k. Skóre grafu G s vrcholy V = (i>i, ..., v„) je posloupnost (degľi, degľ2, ... ,degi>„). U orientovaných grafů rozlišujeme vstupní stupeň deg+ v vrcholu v a výstupní stupeň deg_ v. Říkáme, že orientovaný graf je vyvážený, když pro všechny vrcholy platí deg_ v = deg+ v. Wikipedia, NP (complexity), http://en.wikipedia.org/wiki/ NP_ (complexity) (as of Aug. 7, 2013,13:44 GMT). 713 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Předpokládejme tak, že každý z vrcholů kružnice je spojen s nějakými vrcholy mimo C, přičemž žádné dva nejsou spojeny se stejným vrcholem. Za tohoto předpokladu je korektní uvážit graf, který vznikne z původního grafu nahrazením všech vrcholů ui, «2,..., v3n jediným vrcholem V. B. Základní algoritmy Začněme s algoritmy prohledávání do šířky a do hloubky, které slouží jako základ pro složitější algoritmy. Jejich konkrétní implementace může být různá, proto odpovědi na následující příklady nejsou jednoznačné. 12.13. Uvažme graf o šesti vrcholech 1, 2,..., 6. Vrcholy jsou spojeny hranou, právě když je součet jejich čísel lichý. Popište práci algoritmu prohledávání do šířky na tomto grafu. Kterou hranu tohoto grafu projde algoritmus jako poslední, bude-li počátečním vrcholem vrchol 5 a hrany ze zpracovávaného vrcholu uvažujeme postupně podle hodnoty druhého koncového vrcholu hrany (od nejmenšflio)? Řešení. Z vrcholu 5 algoritmus postupně projde hrany (5, 2), (5,4), (5,6) a detekuje tím postupně vrcholy 2, 4, 6 (fronta detekovaných vrcholů je 2, 4, 6). Prvním detekovaným vrcholem je vrchol 2, algoritmus tedy pokračuje s ním, vrchol 5 se stává zpracovaným a vrchol 2 se stává aktivním. Z něj vedou hrany (2, 5) (již prošlá) a nové hrany (2,1), (2, 3) a s nimi se detekují postupně vrcholy 1 a 3. Algoritmus prošel všechny hrany z vrcholu 2, ten se tedy stává zpracovaným (fronta detekovaných nezpracovaných vrcholů je tedy 4, 6, 1, 3) a první z detekovaných vrcholů, který ještě není zpracovaný, se stává aktivním. Tím je vrchol 4. Objevíme nové hrany (4,1) a (4, 3), nedetekujeme přitom žádné nové vrcholy. Vrchol 4 se stává zpracovaným a na řadě je ve frontě vrchol 6. Tak objevíme hrany (6, 1) a (6, 3). Pokud zná algoritmus počet hran v grafu, končí. Jinak projde ještě vrcholy 1 a 3 a zjistí, že z nich už žádné nové hrany nevedou, a skončí. Poslední objevenou hranou je hrana (3, 6). □ 12.14. Uvažme graf o šesti vrcholech 1, 2,..., 6. Vrcholy jsou spojeny hranou, právě když je jejich součet lichý. Popište práci algoritmu prohledávání do hloubky na tomto grafu. Kterou hranu tohoto grafu projde tento algoritmus jako poslední, bude-li počátečním vrcholem Je zřejmé, že pro izomorfní grafy se jejich skóre může lišit pouze permutací hodnot. Pokud tedy porovnáme skóre grafů setříděné podle velikosti hodnot, pak různá skóre zaručují neizomorfnost grafu. Naopak ale snadno najdeme příklad grafů se stejným skóre, které izomorfní být nemohou, např. G = c3 U c3 má skóre (2, 2, 2, 2, 2, 2) stejně jako Zjevně ale izomorfní nejsou, protože v C(, existuje cesta délky 5, která v druhém grafu být nemůže. Podíváme se na kritéria, jaká skóre mohou vůbec grafy mít. Protože každá hrana vychází ze dvou vrcholů, musí být v celkovém součtu skóre započtena každá hrana dvakrát (v angličtině bývá tato podmínka z pochopitelných důvodů zmiňována jako handshake lemma). Proto platí (12.1) z^degi; = 2|£|. Zejména tedy musí být součet všech hodnot skóre sudý. Následující věta2 Havla a Hakimiho je naší první úvahou £) o operacích nad grafy. Protože je důkaz konstruk-tivní, jde vlastně o návod, jak pro dané skóre buď fi najít příklad takového grafu, nebo zjistit, že takový graf neexistuje. Věta (Algoritmus na sestrojení grafu s daným skóre). Pro libovolná přirozená čísla 0 < d\ < ■ ■ ■ < dn existuje graf G na n vrcholech s těmito hodnotami skóre tehdy a jen tehdy, když existuje graf se skóre (di, d2, dn-dn - 1, d„-d„+i - 1, ..., d„-\ - 1) na n — 1 vrcholech. Důkaz. Na jednu stranu je implikace jednoduchá: Pokud existuje graf G' o n — 1 vrcholech se skóre uvedeným ve větě, pak můžeme přidat ke grafu G' nový vrchol v„ a spojit jej hranou s posledními dn vrcholy grafu G'. Tím dostaneme požadovaný graf G s předepsaným skóre. Naopak je to oněco těžší. Postup nám zároveň ukáže, jak málo skóre určuje graf, z něhož vzniklo. Ukážeme, že při pevně zadaném skóre (d\, ..., d„) s 0 < d\ < ■ ■ ■ < dn vždy existuje graf, jehož vrchol v„ je spojen hranou právě s posledními dn vrcholy V„-d„, ■ ■ ■ ■ V„-l. Idea je jednoduchá-pokud některý z posledních d„ vrcholů není hranou spojen s vn, musí být v„ spojen s některým z vrcholů dřívějších. Pak bychom měli umět prohodit koncové vrcholy dvou hran tak, aby v„ a vi spojeny byly a skóre se nezměnilo. Technicky to lze provést takto: Uvažme všechny grafy G s da-» ným skóre a označme si pro každý takový graf číslo v(G), i které je nej větším indexem vrcholu, který není spojen hra-I nou s vrcholem v„. Nechť G je nyní pevně zvolený graf 'T^ 1 s v(G) nejmenšímmožným. Pakbuďje v(G) — n—dn —1, a získali jsme tak požadovaný graf, neboje v(G) > n — dn. Pokud by platil druhý případ, musel by být v„ spojen hranou s některým u,-, i < v(G). Protože je deg vv(G) > degi;,-, nutně existuje nějaký vrchol vi, do kterého vede hrana z vv(G), ale nikoliv z vrcholu ví. Nyní záměnou hrany {vi, vv(G)j za {vi, v,} a zároveň hrany {ľ;, v„) zahranú {vv(G), v„) dostáváme graf G' s týmž skóre, ale menším v(G'), což je spor s naší volbou. Namalujte si obrázek! 1l> ^Dokázaná nezávisle Václavem Havlem vrocel955v Časopise pro pěstování matematiky a S.L. Hakimim v roce 1962. 714 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY vrchol 5 a hrany ze zpracovávaného vrcholu procházíme podle hodnoty druhého koncového vrcholu hrany (od nejmenšího)? Řešení. Algoritmus nejprve objeví hrany vedoucí z vrcholu 5 a to dle zadání v posloupnosti (5,2), (5,4), (5,6). Vrcholy jsou tedy aktivovány v pořadí 2, 4, 6. Vrchol 5 se stává zpracovaným a zásobník detekovaných vrcholů je 6, 4, 2. Pokračujeme s naposledy detekovaným vrcholem, tj. vrcholem 6. Objevíme hrany (6, 1), (6, 3), vrchol 6 je zpracovaný, zásobník detekovaných vrcholů je tedy 3, 1, 4, 2. Pokračujeme s vrcholem 3. Objevíme hrany (3, 2), (3, 4), zásobník vrcholů bude 4, 2,1,4, 2. s vrcholem 4, objevíme hranu (4, 1), zásobník vrcholů bude 1,2, 1,2, pokračujeme s vrcholem 1, objevíme poslední hranu (1, 2). (Pozn.: do zásobníku zapisujeme vždy pouze ještě nezpracované vrcholy.) □ Poznámka. Pokud bychom volili opačnou prioritu hran tak bychom dostali následující posloupnost postupně prohledávaných hran: (5, 2), (2,1), (1, 4), (4, 3), (3, 2), (3, 6), (6, 1), (6, 5), (4, 5). Intuitivně si prohledávání do hloubky můžeme představit také tak, že algoritmus zpracovává v každém vrcholu pouze první dosud neprozkoumanou hranu. 12.15. Označme vrcholy v grafu postupně čísly 1,2,..., 6. Napište posloupnost hran grafu tak, jak je bude procházet algoritmus „prohledávání do hloubky", bude-li počátečním vrcholem vrchol 3 a hrany ze zpracovávaného vrcholu budeme procházet postupně podle velikosti druhého koncového vrcholu hrany (od nejmenšího). O 12.16. Označme vrcholy v grafu K6 postupně čísly 1, 2,... 6. Napište posloupnost hran grafu K6 tak, jak je bude procházet algoritmus „prohledávání do šířky", bude-li počátečním vrcholem vrchol 3 a hrany ze zpracovávaného vrcholu budeme procházet postupně podle velikosti druhého koncového vrcholu hrany (od nejmenšího). O 12.17. Užijte Dijkstrův algoritmus k nalezení nejkratších cest z vrcholu číslo 9 do všech ostatních vrcholů. 18 1 2 1 7 1 3 1 <^-2-<^ ^-6^(9^1-(W) ^U) 1 1 8 15 2 7 5 éy- 2 Ad- 7 -^š>- 3 -^)- 4 -<í) (nj7 o 12.18. Udejte příklad Nutně tedy platí první z možností, tj. náš graf vznikl přidáním posledního vrcholu a jeho spojením s posledními d„ vrcholy hranou. □ Všimněme si, že skutečně věta dává přesný postup, jak zkonstruovat graf se zadaným skóre. Pokud by takový graf neexistoval, algoritmus to po cestě pozná. Postup je takový, že od zadaného vzestupně uspořádaného skóre postupně odprava od hodnot stupňů vrcholů odečítáme tolikrát jedničku, kolik je největší hodnota dn. Uspořádáme znovu podle získaného skóre a postupujeme stejně, dokud buď neumíme přímo graf se zadaným skóre napsat, nebo naopak nevidíme, že takový neexistuje. Jestliže graf v některém z kroků sestrojíme, zpětným postupem přidáváme vždy jeden nový vrchol a hrany podle toho, jak jsme odečítali jedničky. Zkuste si několik jednoduchých příkladů sami. Uvědomme si ale, že algoritmus sestrojuje pouze jeden z mnoha grafů, které mohou k danému skóre existovat! 12.8. Algoritmy a reprezentace grafů. Jak jsme již naznačovali, grafy jsou jazykem, ve kterém často formulujeme ^ algoritmy. Samotný pojem (grafového) algoritmu můžeme (pro naše potřeby) formalizovat jako postup, kdy v nějakém orientovaném grafu přecházíme z vrcholu do vrcholu podél orientovaných hran a přitom zpracováváme informace, které jsou určeny a ovlivněny výsledkem předchozích operací, vrcholem, ve kterém se zrovna nacházíme, a hranou, kterou jsme do vrcholu vstoupili. Při zpracování informace se zároveň rozhodujeme, kterými výstupními hranami budeme pokračovat a v jakém pořadí. Pokud je graf neorientovaný, můžeme všechny hrany považovat za dvojice hran orientované opačnými směry. Případně také můžeme při chodu algoritmu samotný graf upravovat, tj. přidávat či odebírat vrcholy a hrany. Abychom mohli dobře takové algoritmy realizovat (většinou s pomocí počítače), je třeba umět uvažovaný graf efektivně zadat. Jednou z možností je tzv. hranový seznam (Edge List). Orientovaný nebo neorientovaný graf G — (V, E) si v něm reprezentujeme jako dva seznamy V a E propojené ukazateli tak, že každý vrchol ukazuje na všechny z něj vycházející a do něj vcházející hrany a každá hrana ukazuje na svůj počáteční a koncový vrchol. Je vidět, že paměť potřebná na uchování grafu jev tomto případě 0( \ V \+\ E \), protože na každou hranu ukazujeme právě dvakrát a na každý vrchol ukazujeme tolikrát, kolik je jeho stupeň a součet stupňů je také roven dvojnásobku počtu hran. Až na konstantní násobek jde tedy stále o optimální způsob uchovávání grafu v paměti. Zcela jiný způsob je zadání tzv. matice sousednosti grafu. Uvažme (neorientovaný) graf G — (V, E), zvolme uspořádání jeho vrcholů V — (v\, ..., vn) a definujme matici Ag — (aij) nad TLi (tj. zaplněnou jen nulami a jedničkami) takto: 1 jestliže je hrana = {v;, vj) v E, 0 j estliže není hrana = {u;, v j) v E. Popřemýšlejte samostatně, jak vypadají matice grafů z příkladů na začátku této kapitoly. Při nejjednodušším způsobu uchovávání matic v poli je zadání grafu pomocí matice sousednosti velice neefektivní metoda. Potřebuje totiž vždy 0(n2) místa v paměti. Pokud je ale v grafu 715 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY i) grafu s alespoň 4 vrcholy, který neobsahuje cyklus záporné délky a na němž dá Dijkstrův algoritmus chybný výsledek, ii) grafu s alespoň 4 vrcholy, který obsahuje (alespoň jednu) zápornou hranu a přesto na něm dá Dijkstrův algoritmus správný výsledek. Řešení. V obou případech je třeba si rozmyslet fungování Dijkstrova algoritmu. Pak už je snadné uvést požadované příklady (přitom je zřejmě mnoho dalších možností). V prvním případě je takovým grafem (s počátečním vrcholem 5) například Dijkstrův algoritmus začínající v S jako první navštíví vrchol A a za nejkratší označí cestu délky 1, přitom zřejmě existuje cesta (S, B, C, A) délky 0. Podobně v druhém případě vyhovuje například graf □ Bellmanův-Fordův algoritmus. Tento algoritmus pracuje na stejném principu jako Dijkstrův; místo postupu po jednotlivých vrcholech je ale zpracovává „naráz" - cyklus relaxace (tedy porovnání zda současná ohodnocení vrcholů není možné zlepšit využitím dané hrany) probíhá (| V | — l)-krátpřes všechny hrany. Jeho výhodou je, že připouští záporně ohodnocené hrany a detekuje záporné cykly (pokud provedeme relaxační cyklus navíc ještě jednou a dojde ke změně, musí být v grafu záporný cyklus). Cenou za to aleje (obvykle) vyšší časová náročnost. 12.19. Užijte Bellmanův-Fordův algoritmus k nalezení nejkratších cest z vrcholu S do všech ostatních vrcholů. Hrany procházejte v pořadí dle čísla počátečního (příp. koncového) vrcholu (počáteční vrchol má nejmenší číslo). Změňte ohodnocení hrany (8, 6) z 18 na —18, algoritmus provedte s tímto novým grafem a ukažte, jak se detekují záporné cykly. málo hran, dostáváme tzv. řídkou matici se skoro všemi prvky nulovými. Existuje řada postupů, jak takové řídké matice uchovávat v paměti efektivněji. Mělo by nás zajímat, jak se v obou způsobech zadání grafu zpracují základní operace nad grafem, kterými rozumíme: • odebrání hrany, • přidání hrany, • přidání vrcholu, • odebrání vrcholu, • dělení hrany nově přidaným vrcholem. Na první pohled je patrné, že při realizaci matice jako pole nul a jedniček umíme první dvě operace v konstantním čase O(l), zatímco ostatní v lineárním čase 0(n). U hranového seznamu bude hodně záležet na implementaci datových struktur. V principu by ale operace měly být všechny v čase úměrném počtu měněných údajů v okamžiku, kdy již najdeme položku, kterou máme v seznamech měnit. Např. při odebrání vrcholu musíme také odebrat i všechny s ním sousedící hrany. Maticová reprezentace je užitečná minimálně v teoretických úvahách s využitím maticového počtu: 12.9. Věta. Nechť G — (V,E) je graf s uspořádanými vrcholy V — (v\, ..., vn) a maticísousednosti Aq. Označme AkG — («•*') prvky lc-té mocniny matice Ag = (aij). Pak afj je počet sledů délky k mezi vrcholy d; a v j. Důkaz. Celý důkaz povedeme indukcí přes délku sledů. Tvrzení pro případ lc = 1 je pouze jiným vyjádřením definice matice sousednosti. Předpokládejme tedy dále, že věta platí pro nějaké lc a zkoumejme, kolik je sledů délky lc + 1 mezi vrcholy v,- a vj pro nějaké pevné indexy i a /. Jistě každý takový sled obdržíme pomocí jedné hrany z v, do nějakého vrcholu vi a nějakého sledu délky k mezi vi a v j. Různé volby přitom dávají vždy různé výsledky. Proto označíme-li af) počet různých sledů délky kzviáo v j, pak námi hledaný počet sledů délky k + 1 bude To je ale právě vztah pro násobení matice Ag s mocninou AG. Dokázali jsme, že naše čísla a Ak+\ (i+l) jsou právě prvky matice □ Důsledek. Jsou-li G — (V, E) a Ag jako v předchozí větě, pak lze všechny dvojice vrcholů G spojit cestou, právě když má matice (A + E„)™_1 samé nenulové členy (zde E„ označuje jednotkovou matici s n řádky a sloupci). Důkaz. Díky distributivitě násobení matic a skutečnosti, že jednotková matice E„ komutuje s každou jinou maticí stejného rozměru, dostaneme roznásobením (A + E„)™~1 = A"-1 + (" ~ ^A"-2 + • • • + g ~ l^A + E„. Výsledná matice má za členy čísla (ve značení jako v minulé větě) aij ' + ■■■ +y t y\j ' + --- + (n-l)aij+Sij, kde Sa = 1 pro všechna i a 8jj = 0 pro i ^ j. 716 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řešení. Hrany podle pokynů procházíme v pořadí: (S,4), (S,7), (1,2), (1.5) ,(2,1),(2,3),(2,6),(3,7),(4,7),(4,8),(5,1),(5,6),(6,2),(6,5),(7,8), (8.6) . Ohodnocení vrcholů (v závorce jsou uvedeny případné vyšší hodnoty dosažené dříve během téhož průchodu): S 1 23456 78 oo oo 25(30) 25 oo 23 23 23 oo oo 26 26 oo 24 24 24 22 22 22 22 3(6) 4 3 4 3 3 3 3 Protože při čtvrtém průchodu již nedošlo ke změně, můžeme běh algoritmu v tuto chvíli ukončit. V pozměněném grafu vypadá průchod takto (pro názornost nebudeme vypisovat hodnoty u vrcholů, které mezi průchody nedoznaly změn): 1 oo oo oo 1 oo —14 3(6) 4 -13 -12 -ll(-6) -10 -19 -2 -1 -18 -17 -16 -15 -24 -7 -6 -23 -22 -21 -20 -29 -12 -11 -28 -27 9 -26 -25 -34 -17 -16 Graf má 9 vrcholů a protože při devátém průchodu ještě došlo ke změně, algoritmus detekoval záporný cyklus. Běh algoritmu jsme samozřejmě mohli ukončit již dříve, pokud bychom si všimli charakteru změn mezi jednotlivými kroky, z něhož je patrné, že u vrcholů 1, 2, 3, 5, 6, 7, 8 dochází k neohraničenému (a opakovanému) zmenšování ohodnocení. Algoritmus je samozřejmě možné naprogramovat tak, že produkuje strom nejkratších cest a v případě detekce záporného cyklu i vrcholy na tomto cyklu ležící. □ Cesty mezi všemi dvojicemi vrcholů. Často potřebujeme znát nejkratší cesty mezi všemi dvojicemi vrcholů - i k tomu lze sice Toto číslo evidentně zadává součet počtů sledů délek 0, ..., n — 1 mezi vrcholy d; a v j vynásobených kladnými konstantami. Bude proto nenulové právě tehdy, jestliže mezi těmito vrcholy existuje nějaká cesta. □ 12.10. Poznámka. Ještě si všimněme vlivu permutace našeho uspořádání vrcholů V na matici sousednosti grafu. Není obtížné si uvědomit, že permutace vrcholů grafu G má za následek jednu a tutéž permutaci řádků i sloupců matice A g . Každou takovou permutaci můžeme zadat právě jednou tzv. permutační maticí, tj. maticí z nul a jedniček, která má v každém řádku a každém sloupci právě jednu jedničku a jinak nuly. Je-li P taková permutační matice, pak nová matice sousednosti izomorfního grafu G' bude AG, = P-AG-PT, kde transponovaná matice PT je zároveň maticí inverzní (zjevně jsou permutační matice ortogonální) a tečkou označujeme násobení matic. Každou permutaci umíme napsat jako složení transpo-zic a proto příslušnou permutační matici dostaneme jako součin příslušných matic pro transpozice. Tyto úvahy lze v případě potřeby dále rozvíjet a přemýšlet o souvislostech matic sousednosti a matic lineárních zobrazení mezi vektorovými prostory. 12.11. Prohledávám v grafu. Mnoho užitečných algoritmů je ; založeno na postupném prohledávání všech vrcholů .^•-s-rjpi y grafu Zpravidla máme zadaný počáteční vrchol .tt- nebo si jej na začátku procesu zvolíme. " V průběhu procesu vyhledávání pak v každém okamžiku máme vrcholy • již zpracované - ty, které jsme již při běhu algoritmu procházeli a definitivně zpracovali; • aktivní - ty vrcholy, které jsou detekovány a připraveny pro zpracovávání; • spící - ty vrcholy, na které teprve dojde. Zároveň si udržujeme přehled o již zpracovaných hranách. V každém okamžiku musí být množiny vrcholů a/nebo hran v těchto skupinách disjunktním rozdělením množin V a E vrcholů a hran grafu G a některý z aktivních vrcholů je aktuálně zpracováván. Sledujme nejprve princip obecně na příkladě prohledávání vrcholů. V dalších odstavcích pak budeme postup používat pro algoritmy řešící konkrétní úlohy. Na počátku průběhu takového algoritmu tedy máme jeden aktivní vrchol a všechny ostatní vrcholy jsou spící. V prvním kroku projdeme všechny hrany vycházející z aktivního vrcholu a jejich příslušným koncovým vrcholům, které jsou spící, změníme statut na aktivní. V dalších krocích vždy u zpracovávaného vrcholu probíráme ty z něho vycházející hrany, které dosud nebyly probrány a jejich koncové vrcholy přidáváme mezi aktivní. Tento postup aplikujeme stejně u orientovaných i neorientovaných grafů, jen se drobně mění význam adjektiv koncový a počáteční u vrcholů. V konkrétních úlohách se také můžeme omezovat na některé z hran, které vychází z aktuálního vrcholu. Na principu to ale nic podstatného nemění. Pro realizaci algoritmů je nutné se rozhodnout, v jakém pořadí zpracováváme aktivní vrcholy a v jakém pořadí zpracováváme hrany z nich vycházející. V zásadě přichází v úvahu dvě možnosti zpracovávání vrcholů: 717 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY použít předchozí algoritmy, aplikované postupně na všechny vrcholy v roli počátečního vrcholu, ale lze to provést ještě efektivněji. Jednou z možností je využít podobnosti s násobením matic, z čehož vychází Floydův-Warshallův algoritmus (nejznámější algoritmus typu all pairs shortest paths), který: • v čase 0(n3) vypočte vzdálenosti mezi všemi vrcholy; • vychází z matice Uo = A = (a,^) délek hran (přičemž klade uu = 0 pro všechny vrcholy i) a postupně počítá matice Uo, Ui,..., U\v\, kde ut(i, j) je délka nejkratší cesty z i do j, kde cesta prochází pouze vrcholy z{l,2,...,£}; • při výpočtu matic vychází ze vztahu ut(i, j) = min{íít_i(í, j), řít_i(í, k) + uk^(k, j)}. Jinými slovy: u nejkratší cesty z i do j, během níž máme povoleno navštívit pouze vrcholy očíslované 1,... ,k, se můžeme ptát, jestli využívá vrchol k. Pokud ano, pak je tato cesta složením nejkratší cesty z i do k s nejkratší cestou z k do j (které využívají jen vrcholy 1, 1). V opačném případě je tato hledaná cesta stejná jako nej- kratší cesta z i do j, která využívá jen vrcholy l,... ,k—l. Zřejmě pro k = | V | dostaneme nejkratší cesty mezi všemi dvojicemi vrcholů (bez dalšího omezení). Budeme si navíc udržovat pro každý vrchol jeho nej-bližšflio předchůdce na cestě z vrcholu i (tedy tzv. matici předchůdců) a aktualizovat podle následujícího předpisu: • Inicializace: (Po)ij = i pro i ^ j a dij < oo, • V k-tém kroku aktualizujeme (Půi, (Pk-i)kj, pokud vrchol k přinesl vylepšení, (Pk-i)ij> Jinak- Pak můžeme po ukončení výpočtu snadno zkonstruovat nejkratší cestu mezi libovolnými dvěma vrcholy tak, že při určování cesty z u do v z matice P = P„ = (pij) odvozujeme tuto cestu (v obráceném pořadí) podle předpisu v, w = puv, pum,.... 12.20. Floydův a Warshallův algoritmus použijte na orientovaný graf na obrázku. Jednotlivé mezivýpočty zapisujte do matic. Uvedte, jak se v průběhu výpočtu detekují cykly záporné délky. Udržujte si všechny informace potřebné pro konstrukci minimálních cest. (1) vrcholy vybíráme pro další zpracování ve stejném pořadí, jako se stávaly aktivními (fronta), (2) dalším vrcholem vybraným pro zpracování je poslední zak-tivněný vrchol (zásobník). V prvním případě hovoříme o prohledávání do šířky, ve druhém o prohledávání do hloubky. Na první pohled je zřejmá role volby vhodných datových struktur pro uchovávání údajů o grafu. Hranový seznam umožňuje projít všechny hrany vycházející z právě zpracovávaného vrcholu v čase lineárně úměrném jejich počtu. Každou hranu přitom diskutujeme nejvýše dvakrát, protože má právě dva konce. Zjevně tedy platí: Věta. Celkový čas realizace vyhledávání do šířky i do hloubky je 0((n + m)K), kde n je počet vrcholů v grafu, m je počet hran v grafu a K je čas potřebný na zpracování jedné hrany, resp. jednoho vrcholu. Následující obrázky slouží pro ilustraci prohledávání do šířky: Je na nich zachyceno prvních osm kroků prohledávání do šířky Petersenova grafu. Jemně zakroužkovaný vrchol je ten právě zpracovávaný, velké šedé puntíky jsou již zpracované vrcholy, čárkované šedé hrany jsou již zpracované a drobné šedé vrcholy jsou ty aktivní (poznají se také podle toho, že do nich již vede některá zpracovaná hrana). Hrany na obrázku zpracováváme v pořadí orientace proti směru hodinových ručiček, přičemž za „první" bereme směr „kolmo dolů". Totéž je na dalších obrázcích postupem „do hloubky". Všimněte si, že první krok je stejný jako v předchozím případě. ¥-.......<š 'é-.......• ¥........• ........• 12.12. Souvislé komponenty grafu. Každý graf G — (V, E) se přirozeně rozpadá na disjunktní podgrafy G, takové, že vrcholy v e G, a w e G j jsou spojeny nějakou JRji V, cestou, právě když i = j. Tento postup si můžeme formalizovat takto: Nechť je G = (V, E) neorientovaný graf. Na množině vrcholů grafu G zavedeme relaci ~ tak, že ľ ~ w, právě když existuje cesta z v do w. Promyslete si, že tato relace je dobře definovaná a že se jedná o ekvivalenci. Každá třída [v] této ekvivalence definuje indukovaný podgraf G[„] c G a disjunktní sjednocení těchto podgrafů je ve skutečnosti původní graf G. Skutečně podle 718 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řešení. Postupujeme podle algoritmu a dostáváme matice délek nej-kratších cest spolu s maticemi předchůdců: U o /O 4 -3 oo^ (- 1 1 -3 0 -7 oo 2 _ 2 _ oo 10 0 3 , Po = — 3 — 3 \5 6 6 V 4 4 -/ /O 4 -3 oo^ (- 1 1 -\ -3 0 -7 oo 2 _ 2 _ oo 10 0 3 , A = — 3 — 3 \5 6 2 °) 4 1 -/ /O 4 -3 oo^ (- 1 1 -\ -3 0 -7 oo 2 _ 2 _ 7 10 0 3 , Pi = 2 3 — 3 \3 6 -1 °/ V 4 2 -/ (0 4 -3 0 N (- 1 1 3\ -3 0 -7 -4 2 _ 2 3 7 10 0 3 , ^3 = 2 3 — 3 l3 6 -1 °y \2 4 2 -) /O 4 -3 o\ (- 1 1 3\ -3 0 -7 -4 2 _ 2 3 6 9 0 3 , Pa = 2 4 — 3 v3 6 -1 0/ V2 4 2 -/ I/l u2 u3 u4 Protože se v matici U4 na diagonále neobjevilo záporné číslo, graf neobsahuje záporný cyklus. Hledáme-li např. nejkratší cestu z 3 do 1, pak předchůdcem 1 na této cestě je PnYí, 1] = 2 a předchůdcem 2 pak PnYí, 2] = 4, proto je tato cesta 3, 4, 2,1 a její délka je f/43, 1] = 6. □ Hamiltonovské grafy. Rozhodnutí, zda je zadaný graf hamiitonov-ský, je tzv. NP-úplný problém, je tedy dobré mít k dispozici nějaké jednodušší nutné nebo postačující podmínky pro tuto vlastnost. Mezi známé postačující podmínky patří Diracova, Oreho a Bondy-Chvátalova věta. Dirac: Má-li v grafu G s n > 3 vrcholy každý vrchol stupeň alespoň n/2, je G hamlltonovský. definice naší ekvivalence, žádná hrana původního grafu nemůže propojovat vrcholy z různých komponent. Podgrafům G[„] říkáme souvislé komponenty grafu G. Říkáme, že je graf G — (V, E) souvislý, jestliže má jedinou souvislou komponentu. Je-li graf G orientovaný, pak většinou definujeme souvislost obdobně jako pro neorientované grafy, pouze u definice relace výslovně požadujeme, aby cesta existovala jak z vrcholu v do vrcholu w, tak z vrcholu w do vrcholu v. Nicméně je užitečný také pojem slabé souvislosti, kdy pouze požadujeme, aby symetrizace daného grafu byla souvislá. Jako skutečně jednoduchý příklad prohledávání v grafu si můžeme uvést algoritmus na vyhledání všech souvislých komponent v grafu. Jedinou informací, kterou musíme zpracovávat při prohledávání do šířky nebo hloubky, je, kterou komponentu aktuálně procházíme. Samotné prohledávání, tak jak jsme jej prezentovali, projde právě všechny vrcholy jedné komponenty. Začneme tedy se všemi vrcholy spícími a vezmeme kterýkoliv z nich. Kdykoliv při běhu algoritmu skončíme s prázdnou množinou aktivních vrcholů ke zpracování, máme nachystánu jednu celou komponentu na výstup. Stačí pak vzít jakýkoliv další dosud spící vrchol a pokračovat dále. Teprve až nebudou ani žádné spící vrcholy, ukončíme algoritmus. 12.13. Vícenásobně souvislé grafy. Pojem souvislosti potřebujeme i v silnějších podobách, kdy máme zaručenu určitou redundanci v množství cest mezi vrcholy. Definice. Řekneme, že (neorientovaný) graf G = (V, E) je • vrcholově k-souvislý, jestliže má alespoň k + l vrcholů a bude souvislý i po odebrání libovolné podmnožiny k — 1 vrcholů; • hranově k-souvislý, jestliže bude souvislý po odebrání libovolné podmnožiny k — 1 hran. V případě k — 1 definice jen opakuje souvislost grafu G (neboť dodatečná podmínka je prázdná). Silnější souvislost grafu je žádoucí např. u síťových aplikací, kdy klient požaduje značnou redundanci poskytovaných služeb v případě výpadku některých linek (tj. hran) nebo uzlů (tj. vrcholů). Obecně platí tvrzení tzv. Mengerovy věty3. Říká, že pro každé dva vrcholy v a w je v grafu G = (V, E) počet hranově různých cest zudom roven minimálnímu počtu hran, které je třeba odstranit, aby scuaie ocitly v různých komponentách vzniklého grafu. Stejně tak je počet vrcholově různých cest z v do w roven počtu vrcholů, které je třeba odstranit, aby byly vrcholy v aw v různých komponentách. K této tématice se ještě vrátíme v odstavci 12.36. Podrobněji se ale hned podíváme aspoň na nejjednodušší zajímavý případ. To jsou takové souvislé grafy o alespoň třech vrcholech, kdy vynecháním libovolného vrcholu nenarušíme jejich souvislost. Věta. Pro graf G = (V, E) s alespoň třemi vrcholy jsou následující podmínky ekvivalentní: • Gje(vrcholově) 2-souvislý; • každé dva vrcholy v aw v grafu G leží na společné kružnici; • graf G je možné vytvořit z trojúhelníka K3 pomocí postupného přidávání hran a dělení hran. grafů. Karl Menger je dokázal již v roce 1927, tedy dříve než vznikl obor teorie 719 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Oře: Má-li v grafu Gsn >4 vrcholy každá dvojice nesousedních vrcholů součet stupňů alespoň n, je G hamiltonovský. Uzávěrem grafu G budeme pro naše současné účely rozumět graf cl(G), který dostaneme z G přidáním všech hran w, v takových, že u, v nejsou sousední a pro něž platí deg(w) + deg(u) > n. Bondy, Chvátal: Graf G je hamiltonovský, právě když je c/(G) hamiltonovský. 12.21. Dokažte tvrzení Bondyho a Chvátala. Řešení. Zřejmě stačí dokázat, že pokud je G hamiltonovský po přidání hrany {u, v] takové, že u, v nejsou sousední a deg(w) + deg(u) > n, pak je hamiltonovský i bez této hrany. Předpokládejme, že G + {u, v] je hamiltonovský a G nikoliv. Pak existuje hamiltonovská cesta v G z u do v. Pro každý vrchol sousedící s u platí, že jeho předchůdce na této cestě nemůže sousedit s v (jinak bychom měli hamiltonovskou kružnici v G). Tedy deg(w) + deg(u) < n — 1. □ 12.22. i) Dokažte, že z Bondy-Chvátalovy věty plyne Oreho a z ní Di-racova. ii) Udejte přiklad hamiltonovského grafu, který splňuje podmínku Oreho věty, ale ne věty Diracovy. iii) Udejte příklad hamiltonovského grafu, jehož uzávěr není úplný graf. Řešení. i) Pokud graf G splňuje předpoklady Oreho věty, pak jeho uzávěrem je úplný graf, který je zřejmě hamiltonovský a podle Bondyho a Chvátala je i původní graf hamiltonovský. Dále, pokud graf G splňuje předpoklady Diracovy věty, pak zřejmě splňuje i předpoklady Oreho věty a je tedy hamiltonovský. ii) Takovým příkladem j e například Vrchol 5 má totiž stupeň 2, což je méně než |. Součet stupňů libovolné dvojice (dokonce všech, nejen nesousedních) vrcholů je přitom alespoň 5. iii) Takovým příkladem hamiltonovského grafu jsou kružnice C„,n > 4, pro něž je cl(Cn) = C„. Důkaz. Dokážeme nejprve ekvivalenci prvních dvou tvrzení. Na jednu stranu je implikace zřejmá: Jestliže každé dva vrcholy sdílejí kružnici, pak jsou mezi nimi vždy alespoň dvě různé cesty a tedy odebráním vrcholu nemůžeme pokazit souvislost. Opačná implikace je o něco složitější. Budeme postupovat in-dukcí podle minimální délky cesty spojující vrcholy v a tw. Předpokládejme nejprve, že vrcholy sdílí hranu e, tj. N minimální cesta má délku 1. Kdyby odebráním této hrany i e vznikly dvě komponenty, pak by nutně muselo dojít k rozpadu G na alespoň dvě komponenty i po odebrání buď vrcholu v nebo vrcholu w. Je proto i graf bez této hrany e souvislý a je v něm proto cesta mezi v aw. Spolu s hranou e tato cesta vytváří kružnici. Nechť nyní v rámci indukčního předpokladu umíme takovou sdílenou kružnici sestrojit pro všechny vrcholy spojitelné cestou délky nejvýše k a uvažujme vrcholy v a w a je spojující nejkratší cestu (V = do, e\, Dl, . . . , Dfc+l = w) délky k + 1. Pak v\ a w umíme spojit cestou o délce nejvýše k, a proto leží na společné kružnici. Označme si P\ a P2 příslušné dvě různé cesty mezi di a w. Graf G \ {di} je ale také souvislý, existuje tedy cesta P z v do w, která neprochází vrcholem di a tato nutně musí někdy poprvé narazit na jednu z cest P\ a P2. Předpokládejme, že se tak stane ve vrcholu z na cestě P\. Pak je (uzavřená) cesta, která vznikne složením části cesty P z d do z, části cesty P\ ze z do w a opačnou cestou k P2 z w do v hledanou kružnicí (nakreslete si obrázek!). Máme tedy dokázánu ekvivalenci prvních dvou podmínek. Nyní se budeme věnovat ekvivalenci první a třetí podmínky. Je zřejmé, že dělením hrany nebo přidáním hrany ve vrcholově 2-souvislém grafu G = (V, E) vlastnost 2-souvislosti nepokazíme. Jedna implikace tedy je ověřená. Zbývá tedy dokázat, že pokud je graf 2-souvislý, pak je ho možné vytvořit z K3 přidáváním a dělením hran. V G jistě díky 2-souvislosti existuje kružnice, a tuje možné z K3 získat dělením hran. Uvažme nyní podgraf G' — (V', E') určený touto kružnicí a uvažme hranu e — {v, w), která nepatří do E', ale alespoň jeden z vrcholů do V' patří. Pokud by tam patřily oba, můžeme prostě přidat ke grafu G' novou hranu e, čímž získáme podgraf (V", E' U {e}) v grafu G obsahující více vrcholů a hran než graf G'. Uvažme tedy zbývající možnost, že v e V a w £ V'. Díky 2-souvislosti grafu G bude tento graf souvislý i po odebrání vrcholu d a bude v něm tedy existovat nejkratší cesta P spojující vrchol w s některým vrcholem (označme jej d') v G' (mimo odebraný vrchol d) a neobsahující tedy žádný jiný vrchol z V'. Přidáním celé této cesty ke grafu G' společně s hranou e (což uděláme tak, že přidáme hranu {d, d'} a nadělíme ji na potřebný počet „nových" vrcholů a hran) dostaneme nový podgraf splňující naše předpoklady a obsahující více vrcholů a hran než právě uvažovaný graf G'. Po konečném počtu těchto kroků tedy z trojúhelníka K3 zkonstruujeme celý graf G, jak je požadováno. □ 12.14. Metrika na grafech. V posledním důkazu jsme využili pojem „délka cesty". Ukážeme si nyní, že takto skutečně lze matematicky vybudovat pojem vzdálenosti na grafu. 720 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY □ Rovinné grafy. 12.23. Rozhodněte, zdaje graf na obrázku rovinný. Řešení. Daný graf rovinný není díky Kuratowského větě (viz strana 731), protože má podgraf, který je dělením K3 3. □ 12.24. Rozhodněte, zda existuje graf mající skóre (6,6,6, 7, 7,7,7,8,8, 8). Pokud ano, existuje i rovinný graf daného skóre? O 12.25. Kolik minimálně hran může mít šestistěn? Řešení. V libovolném mnohostěnu je každá stěna ohraničena minimálně třemi hranami. Každá hrana přitom leží ve dvou stěnách. Označíme-li s počet stěn a h počet hran mnohostěnu dostáváme tak odhad 3s < 2h (viz také 12.26). Pro šestistěn dává tento odhad 18 < 2h, neboli h > 9. Šestistěn s devíti hranami skutečně existuje, dostaneme jej například „slepením" dvou stejně velikých pravidelných čtyřstěnů stěnou k sobě. Minimální možný počet hran šestistěnu je tedy devět. □ 12.26. Rozhodněte, zdaje daný rovinný graf maximální. Doplňte co nejvíce hran při zachování rovinnosti. Řešení. Graf má 14 vrcholů a 20 hran, proto 3| V |— 6— \E\ = 16. Graf tedy není maximální a přidat lze při zachování rovinnosti 16 hran. (Í2V--------ÍÍ3l Přidali jsme 10 (čárkovaných) hran, dalších 6 hran spojující vrcholy „vnějšího" devítiúhelníku jsme z důvodu přehlednosti nezobrazovali. □ Na každém (neorientovaném) grafu definujeme vzdálenost vrcholů v a w jako číslo do(v, w), které je rovno počtu hran v nej-kratší možné cestě z v do w. Pokud cesta neexistuje, píšeme da(v, w) = oo. Budeme v dalším uvažovat pouze souvislé grafy G. Pak pro takto zadanou funkci dg : V x V -» N platí obvyklé tři vlastnosti vzdálenosti (doporučujeme srovnat s úvahami v druhé části sedmé kapitoly, od odstavce 7.12 na straně 408): • dg (v, w) > 0 a přitom dg (v,w) = 0, právě když v — w; • vzdálenost je symetrická, tj. do(v, w) — dc(w,v); • platí trojúhelníková nerovnost, tj. pro každou trojici vrcholů v, w, z platí dc(v, z) < dG(v, w) + dG(w, z). Říkáme, že dg je metrika na grafu G. Kromě těchto tří standardních vlastností splňuje metrika na grafu evidentně ještě • do(v, w) má vždy nezáporné celočíselné hodnoty; • je-li do(v, w) > 1, pak existuje nějaký vrchol z různý od v aw takový, že do(v, w) = do(v, z) + do(z, w). Lze dokázat, že pro každou funkci do s výše uvedenými pěti \\ vlastnostmi na V x V (pro konečnou množinu V) je možné nadefinovat hrany E tak, aby G — (V, E) byl graf s metrikou do - Zkuste si ukázat jako cvičení! (Je vcelku jasné, jak zkonstruovat příslušný graf. Je třeba , jen" dokázat, že pak skutečně bude zadaná funkce do výše zavedenou metrikou na tomto grafu.) 12.15. Dijkstrův algoritmus nejkratších cest. Dá se tušit, že nejkratší cestu v grafu, která vychází z daného vrcholu v a končí v jiném vrcholu w budeme umět hledat pomocí prohledávání grafu do šířky. Při tomto typu prohledávání totiž postupně diskutujeme vrcholy, do kterých se umíme dostat z výchozího vrcholu po jediné hraně, poté projdeme všechny, které mají vzdálenost nejvýše 2 atd. Na této jednoduché úvaze je založen jeden z nejpoužívanějších grafových algoritmů - tzv. Dijkstrův algoritmus. Tento algoritmus hledá nejkratší cesty i v praktické podobě, kdy jednotlivé hrany e jsou ohodnoceny velikostmi, tj. kladnými reálnými čísly w(e). Kromě aplikace na hledání vzdáleností v silničních nebo jiných sítích to mohou být také výnosy či náklady, toky v sítích atd. Vstupem algoritmu je graf G = (V, E) s ohodnocením hran a počáteční vrchol do. Výstupem je ohodnocení vrcholů čísly dw(v), která udávají nejmenší možný součet ohodnocení hran podél cest z vrcholu do do vrcholu v. Postup dobře funguje v orientovaných i neorientovaných grafech. Pro konečný chod algoritmu a jeho výsledek je skutečně podstatné, že všechna naše ohodnocení jsou kladná - viz příklad || 12.181|. Dijkstrův algoritmus vyžaduje jen drobnou modifikaci obecného prohledávání do šířky: U každého vrcholu v budeme po celý chod algoritmu udržovat číselnou hodnotu d(v), která bude horním odhadem skutečné vzdálenosti vrcholu v od vrcholu do. Množina již zpracovaných vrcholů bude v každém okamžiku obsahovat ty vrcholy, u kterých již nejkratší cestu známe, tj. d(v) = dw(v). 721 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 12.27. Každé z následujících tvrzení dokažte nebo ukažte vhodný protipříklad. i) Každý graf s méně než 9 hranami je rovinný. ii) Graf, který není rovinný, není hamiltonovský. iii) Graf, který není rovinný, je hamiltonovský. iv) Graf, který není rovinný, není eulerovský (viz 12.17). v) Graf, který není rovinný, je eulerovský. vi) Každý hamiltonovský graf je rovinný. vii) Žádný hamiltonovský graf není rovinný. viii) Každý eulerovský graf je rovinný, ix) Žádný eulerovský graf není rovinný. • Do množiny aktivních (právě zpracovávaných) vrcholů W zařadíme vždy právě ty vrcholy y z množiny spících vrcholů Z, pro které je d(y) = min{d(z); z e Z). Předpokládáme, že graf G má alespoň dva vrcholy. Formálněji lze Dijkstrův algoritmus popsat takto: (1) Iniciační krok: Nastavíme hodnoty u všech v e V: d(v) = 0 pro v — do, oo pro d 7^ dq. Nastavíme Z = V, W = 0. (2) Test cyklu: Jestliže ohodnocení všech vrcholů y e Z je rovno oo, algoritmus končí, v opačném případě pokračujeme dalším krokem. (Algoritmus tedy zejména končí, pokud je Z = 0.) (3) Aktualizace stavu vrcholů: • Najdeme množinu N všech vrcholů d e Z, pro které d(v) nabývá nejmenší možné hodnoty S — min{íí(y); y e Z); • posledně zpracované aktivní vrcholy W přesuneme do množiny zpracovaných a za nové aktivní vrcholy zvolíme W = N a odebereme je ze spících, tj. množina spících bude nadále Z\N. (4) Tělo hlavního cyklu: Pro všechny hrany v množině Ewz všech hran vycházejících z některého aktivního vrcholu d a končících ve spícím vrcholu y opakujeme: • vybereme dosud nezpracovanou hranu e e Ewz; • pokud je d(v) + w(e) < d(y), nahradíme d(y) touto menší hodnotou. Pokračujeme testem v kroku 2. 12.16. Věta. Pro všechny vrcholy v v souvislé komponentě vrcholu do v grafu G najde Dijkstrův algoritmus vzdálenosti dw(v). Vrcholy ostatních souvislých komponent zůstanou ohodnoceny d(v) = oo. Algoritmus lze implementovat tak, že ukončí svoji práci v čase 0(n log n + m), kde n je počet vrcholů a m je počet hran v G. Důkaz. Napřed ukážeme správnost algoritmu, tj. budeme muset ověřit, že • algoritmus po konečném počtu kroků skončí; • výstup v okamžiku ukončení bude mít požadované vlastnosti. Formulace testu cyklu zaručuje, že při každém jeho průchodu se zmenší počet spících vrcholů alespoň o jeden, protože N bude vždy neprázdná. Nutně tedy algoritmus po konečném počtu kroků skončí. Po průchodu iniciačním cyklem zjevně platí (12.2) d(v) > dw (v) O pro všechny vrcholy grafu. Předpokládejme tedy, že tato nerovnost platí při vstupu do hlavního cyklu algoritmu a ověříme, že platí i po výstupu z cyklu. Skutečně pokud v kroku 4 měníme d(ý), pak je to proto, že jsme našli vrchol v s vlastností dw(y) < dw(v) + w({v, y}) < d(v) + w({v, y)) = d(y), kde napravo již máme nově změněnou hodnotu. Rovnost (12.2) bude proto jistě platit i v okamžiku ukončení algoritmu a zbývá nám ověřit, že na konci algoritmu bude platit i nerovnost opačná. Za tímto účelem si promysleme, co se vlastně děje v krocích 3 a 4 v algoritmu. 722 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Stromy. 12.28. Určete kód grafu na obrázku jako i) pěstěného stromu, ii) stromu. Řešení. i) Postupem popsaným v 12.22 dostaneme kód pěstěného stromu 000001100100101111 100101000010101111 1 1. V grafu naznačený kořen je skutečně vhodným kandidátem, protože jde o jediný prvek centra tohoto stromu. ii) Při jednoznačné konstrukci pěstěného stromu řadíme potomky lexikograficky vzestupně, proto je hledaným kódem stromu 00000010101111010110000010110110011111. □ 12.29. Rozhodněte, zda existují stromy s následujícími kódy. V případě, že ano, potom daný strom nakreslete. • 00011001111001, • 00000110010010111110010100001010111111. O Huffmanovo kódování. Pracujeme s pěstěnými binárními stromy, kde máme navíc každou hranu obarvenou některým symbolem z dané výstupní abecedy A (často A = {0,1}). Kódovými slovy C jsou slova nad abecedou A, na která převádíme symboly vstupní abecedy. Našim úkolem je reprezentovat daný text pomocí vhodných kódových slov nad výstupní abecedou. Je snadno vidět, že je užitečné chtít, aby seznam kódových slov byl bezprefixový (v opačném případě může nastat problém s dekódováním). Ke konstrukci binárních prefixových kódů (tj. nad abecedou A = {0, 1}) využijeme binárních stromů. Označíme-li hrany Označme si 0 — do < ■ ■ ■ < <4 všechny existující různé konečné vzdálenosti dw(v) vrcholů grafu JSty G od počátečního vrcholu do. Tím máme zároveň rozdělenu množinu vrcholů grafu G na disjunktní podmnožiny Ví vrcholů se vzdáleností právě rf,. Při prvním průchodu hlavním cyklem máme N = Vo = {vo), číslo S bude právě d\ a množinu spících vrcholů změníme na V \ V*o. Předpokládejme, že by tomu takto bylo až do y-tého průchodu včetně, tj. při vstupu do cyklu by platilo N = V), S = dj a(J;=o ^ ~ V \ A7. Uvažme nějaký vrcholy e Vj+\,tj. dw(y) — = dj+\ < oo a existuje cesta (do, e\,v\,..., vi, et+\, y) celkové délky dj+\. Pak ovšem jistě (12.3) dw(vt) < dj+i - w({vt, y)) < dj+i. Podle našeho předpokladu tedy již dříve (v některém z předchozích průchodů hlavním cyklem) byl vrchol v t aktivní a tedy již v tom průchodu bylo jeho ohodnocení rovno dw (vi) = d(vi) = di pro některé i < j. Proto po stávajícím průchodu hlavním cyklem bude výsledkem nastavení d(y) = dw(vt) + w({vt, y}) = dí+\ a toto v dalších průchodech již nikdy nebude měněno. V nerovnosti (12.2) tedy ve skutečnosti nastává po ukončení chodu algoritmu rovnost. Naše analýza průchodu hlavním cyklem nám zároveň umožňuje odhadnout čas potřebný na chod algoritmu (tj. počet elementárních operací s grafem a dalšími objekty s ním spojenými). Je totiž vidět, že hlavním cyklem projdeme tolikrát, kolik v grafu existuje různých vzdáleností di. Každý vrchol při jeho zpracování v kroku 3 budeme uvažovat právě jednou a budeme muset přitom umět setřídit dosud spící vrcholy. To dává odhad 0(n log n) na tuto část algoritmu, pokud budeme používat pro uchovávání grafu seznam hran a vrcholů obohacený o ohodnocení hran a spící vrcholy budeme uchovávat ve vhodné datové struktuře umožňující vyhledání množiny N aktivních vrcholů v čase 0(logn + \N\). To lze dosáhnout datovou strukturou, které se říká halda (heap). Každá hrana bude právě jednou zpracovávána v kroku 4, protože vrcholy jsou aktivní pouze při jednom průchodu cyklem. □ Všimněme si, že pro nerovnost (12.3), která byla podstatná pro analýzu algoritmu, je nutný předpoklad o nezáporných vahách všech hran. V praktickém použití bývají přidávána různá heuristická vy-lepšení. Např. není nutné dopočítávat celý algoritmus, pokud nás zajímá pouze nejkratší cesta mezi dvěma vrcholy. V okamžiku, kdy totiž je vrchol vyřazován z aktivních, víme, že jeho vzdálenost je již spočtena správně. Také není nutné na začátku algoritmus iniciovat s nekonečnou hodnotou. Samozřejmě by to při programování ani nešlo, můžeme však postupovat ještě daleko lépe než jen přiřadit dostatečně velikou konstantu. Například při počítání nejkratší cesty po silniční síti můžeme jako iniciaci volit předem známe vzdušné vzdálenosti bodů. Pak totiž známe předem odhady vzdáleností Sw (v) vrcholů v a do takové, že pro všechny hrany e = {d, y) platí \ďw(v)-\ďw(y)\ < °f > 0/100 I Ľ100 Ľ100 I 1/100 2/100 1/100 2/100 2/100 < ^ > < °f > 1/100 I 2/100 2/100 I 2/100 .../100 .../100 100/10C 100/100 < -f > < 7 > .../íoo I .../íoo íoo/iool 100/100 Vidíme, že k nalezení maximálního toku jsme potřebovali 200 průchodů hledáním nenasycené cesty. □ 12.38. Určete hodnotu maximálního toku a najděte minimální řez v síti dané maticí kapacit A, kde vrchol 1 je zdroj a vrchol 8 stok. /- 16 24 12 - - - -\ ■ - - - 30 - - - ■ - - - 9 6 12 ------- 21 - ----- 9 - 15 ------ 9 ■ ------ 18 Řešení. Postupně nacházíme zlepšující polocesty: 1-2-5-8 s rezervou 15. 1-2-5-6-8 s rezervou 1. 1-3-5-6-8 s rezervou 8. 1^1—7-8 s rezervou 12. 1-3-7-8 s rezervou 6. Celkový nalezený tok má hodnotu 42. Že je opravdu maximální, vidíme z toho, že máme řez tvořený hranami (5, 8), (6, 8) a (7, 8) velikosti rovněž 42 (jedná se tedy o minimální řez). □ 12.39. Na obrázku je uveden tok v dané síti (čísla f/c udávají současný tok a kapacitu dané hrany). Zjistěte, je-li uvedený tok maximální, pokud ano, své tvrzení zdůvodněte. Pokud maximálním tokem není, maximální tok najděte a svůj postup podrobně popište. Uvedie některý minimální řez v dané síti. Pro důkazy opačných implikací opět nemusíme dělat mnoho. V případě vlastností 2 a 3 pracujeme se souvislým grafem a přímo jejich formulace vylučují existenci kružnice. V případě čtvrté vlastnosti naopak stačí ověřit souvislost G. Libovolné dva vrcholy vawv G jsou ovšem buďspojeny hranou nebo přidáním této hrany vznikne kružnice, tj. i bez ní existuje mezi nimi cesta. Poslední implikaci zvládneme indukcí vzhledem k počtu vrcholů. Předpokládejme, že souvislé grafy o n vrcholech a n — 1 hranách jsou stromy. Graf o n + 1 vrcholech a n hranách má celkový součet stupňů vrcholů 2n a tedy musí obsahovat alespoň jeden list. Pak ovšem díky indukčnímu předpokladu tento graf vznikl přidáním listu ke stromu, a je tedy také stromem. □ 12.21. Kořenové stromy, binární stromy a haldy. Stromy využíváme pro organizaci dat tak, abychom v datech uměli buď rychle vyhledávat nebo v nich udržovat pořádek, ífiOť nejčastěji obojí. Protože ve stromu není žádná kružnice, volba jednoho vrcholu vr zadává orientaci všech hran. Skutečně do každého vrcholu vede z vr právě jedna cesta a orientaci hran bereme podél ní. Přitomnení možné, že by pro různé cílové vrcholy probíhaly příslušné cesty jednu hranu v různých směrech - to by opět vedlo na kružnici. Situace se tedy po výběru jednoho vrcholu začíná více podobat skutečnému stromu v přírodě - jeden jeho vrchol je výjimečný tím, že roste ze země. Stromy s jedním vybraným „počátečním" vrcholem nazýváme kořenové stromy, význačný vrchol vr pak kořen stromu. V kořenovém stromu je dobře definován pojem následník a předchůdce vrcholu takto: vrchol w je následník v a naopak ľ je předchůdce w právě tehdy, když existuje cesta z kořene stromu do w, která prochází v av ^ w. Přímý následník a přímý předchůdce vrcholu jsou pak následníci a předchůdci přímo spojení hranou. Často o nich mluvíme také jako o synech a otcích (patrně v narážce na genealogické stromy). K vyhledávání se nejčastěji používají tzv. binární stromy, které jsou speciálním případem kořenového stromu, kdy každý otec má nejvýše dva následníky (někdy se ale pod stejným označením binární strom předpokládá, že všechny vrcholy kromě listů mají právě dva následníky). Pokud máme s vrcholy spojeny klíče v nějaké úplně uspořádané množině (např. reálná čísla), hledání vrcholu s daným klíčem je realizováno jako hledání cesty od kořene stromu a v každém vrcholu se podle velikosti rozhodujeme, do kterého ze synů budeme pokračovat (resp. zastavíme hledání, pokud jsme již v hledaném vrcholu). Abychom mohli tuto cestu jednoznačně krok po kroku určovat, požadujeme, aby jeden syn společně se všemi jeho následníky měli menší klíče než druhý syn a všichni jeho následníci. Pro efektivní vyhledávání se snažíme o tzv. vyvážené binární stromy, ve kterých se délky cest z kořene do listů liší maximálně o jedničku. Nejdále od vyváženého stromu na n vrcholech je tedy cesta P„ (která formálně může být považována za binární strom), zatímco dokonale vyvážený strom, kde kromě listů má každý otec právě dva syny, je možné sestrojit pouze pro hodnoty n — 2k — 1, k = 1,2,____Ve vyvážených stromech dohledání vrcholu podle klíče bude vždy vyžadovat pouze 0(log2 n) kroků. Hovoříme v této souvislosti také často o binárních vyhledávacích stromech. Jako cvičení si rozvažte, jak lze účinně vykonávat základní operace 727 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 0/18 8/14 8/8 4/14 10/10 (ľj^2/10 —<6)-8/8 --^^4)-12/20^^(8) 1S/1S R/R R IR 18/18 6/6 12/16 ■ Řešení. V síti existuje zlepšující (polo)cesta 1—2—3^1—8 s rezervou 4, po jejím nasycení dostaneme tok velikosti 32. Protože máme řez téže velikosti (3, 8), (5, 8), (2, 4), (6, 4), našli jsme maximální tok. □ 12.40. Nalezněte maximální tok a minimální řez v síti na obrázku (zdroj=l,stok=14). ^P)-4/6-K 9 . Řešení. Cesty sytíme v pořadí li^ii 7^10^5^ 84 11 4 13^ 14 r.2 li^2ÍÍ7^10^5^ 13 14 r.8 Našli jsme tedy tok velikosti 50, který je maximální, protože neexistuje další rezervní cesta, a prostřednictvím dosažitelných vrcholů najdeme rovněž řez kapacity 50, ten tvoří hrany [2, 4] : 4, [7, 9] : 2, [7, 12] : 4, [10, 12] : 2, [10, 14] : 6, [13, 14] : 32. □ s grafy (přidávání a odebírání vrcholů se zadanými klíči včetně vyvážení) nad binárními vyhledávacími stromy. Mimořádně užitečným příkladem využití struktury binárních stromů je datová struktura halda. Jde opět o vyvážené binární stromy s vrcholy opatřenými klíči a požadujeme, aby podél všech cest od kořene k listům ve stromu klíče klesaly (tzv. maximální halda) nebo naopak stoupaly (tzv. minimální halda). Díky tomuto uspořádání umíme v konstantním čase odebírat z haldy podmnožiny buď maximálních nebo minimálních prvků a skutečné náklady na takovou operaci spočívají v obnovení struktury haldy po odebrání kořene. Jako cvičení si ukažte, že je to možné zvládnout v logaritmickém čase. Na obrázku nalevo je binární vyhledávací strom, napravo je příklad maximální haldy. 12.22. Izomorfismy stromů. Stromům, jejich různým variantám a použití je věnována obsáhlá literatura. My se zde už tpouze na chvíli zamyslíme nad (v obecnosti obtížným) problémem hledání izomorflsmu grafů pro speciální třídu l stromů. Budeme postupovat tak, že napřed zesílíme strukturu, kterou mají naše izomorfismy zachovávat a nakonec ukážeme, že postup je použitelný i pro úplně obecné stromy. Pro přehled nad strukturou kořenových stromů je kromě vztahů otec-syn ještě užitečné mít syny uspořádány v pořadí (třeba v představě odleva doprava nebo podle postupného růstu atd.). Hovoříme o pěstěných stromech T — (V, E, vr, v), kde v je částečné uspořádání na hranách takové, že srovnatelné jsou vždy právě hrany směřující od jednoho otce k synům. Homomorfismem kořenových stromů T = (V, E, vr) a T' = (V", E', v'r) rozumíme takový morfismus grafů

W2, jestliže buď ve W\ narazíme při čtení zleva dříve na jedničku než ve W2 neboje W2 počátečním úsekem slova W\. Kořenový strom budeme tedy popisovat zřetězováním částí slov tak, že má-li otec v syny již označeny kódy W\, ..., Wi, pak pro otce použijeme slovo OWi ... W£l, kde pořadí W\, ..., Wi je zvoleno tak, aby W\ < W2 < • • • < Wi. Pokud není určen kořen ve stromě, můžeme se jej pokusit určit tak, aby byl „přibližně uprostřed stromu". To lze realizovat tak, že všechny jednotlivé vrcholy stromu označíme hodnotou tzv. výstřednosti (též excentricity). Definujeme výstřednost exx(v) vrcholu v v grafu T jako největší možnou vzdálenost z ľ do nějakého vrcholu w v T, kterou lze dosáhnout. Tento pojem má smysl pro všechny grafy, u stromu ale díky nepřítomnosti kružnic platí, že minimální hodnoty excentricity vždy dosahuje buď právě jeden vrchol nebo právě dva vrcholy. Lemma. Bud'C(T) množina vrcholů stromu T, jejichžvýstřednost nabývá minimální hodnoty (C(T) se nazývá střed/centrum grafu, minimální hodnota pak poloměr grafu). Pak C(T) má jeden vrchol, nebo dva vrcholy spojené hranou v T. 729 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Další příklady na hledání maximálních toků a minimálních řezů naleznete na straně 757. E. Klasická pravděpodobnost a kombinatorika V této části si zopakujeme postupy, které jsme se naučili již v první kapitole. 12.44. Hodíme n kostkami. Jaká je pravděpodobnost, že mezi čísly, která padnou, nebudou hodnoty 1, 3 a 6? Řešení. Úlohu můžeme přeformulovat tak, že n -krát po sobě hodíme 1 kostkou. Pravděpodobnost, že při prvním hodu nepadne 1, 3 nebo 6, je 1 /2. Pravděpodobnost, že při prvním a druhém hodu nepadne 1, 3 ani 6, je zjevně 1 /4 (výsledek prvního hodu neovlivňuje výsledek druhého). Vzhledem k tomu, že jev určený výsledkem nějakého hodu a jakýkoli jev určený výsledkem jiného hodu jsou vždy (stochasticky) nezávislé, hledaná pravděpodobnost je 1/2™. □ 12.45. Z deseti karet, z nichž právě jedna je eso, namátkou vybereme kartu a vrátíme ji zpět. Kolikrát takový výběr musíme provést, aby pravděpodobnost, že aspoň jednou vybereme eso, byla větší než 0,9? Řešení. Označme A, jev „při i-tém výběru bylo vytaženo eso". Jednotlivé jevy A, jsou (stochasticky) nezávislé, proto víme, že P (Q A,) = 1 - (1 - P(Ai)) • (1 - P(A2)) ■■■(!- P(An)) pro každé n eN. Připomeňme, že hledáme n e N takové, aby platilo P (ů ař) = 1 - (1 - PiA,)) ■ (1 - P(A2)) ■■■(!- P(An)) > 0,9. Zřejmě je P (A,) = 1/10 pro libovolné i e N. Proto stačí vyřešit nerovnici 1 " (&)" > 0,9, ze které lze vyjádřit " > i^Tsi' kdea>l. Vyčíslením potom zjistíme, že daný pokus musíme provést alespoň dvaadvacetkrát. □ 12.46. Z balíčku 32 karet náhodně vybereme šestkrát po sobě po jedné kartě, a to bez vracení. Spočtěte pravděpodobnost, že první král bude vybrán až při šestém výběru. Důkaz. Snadno indukcí s využitím triviálního faktu, že nej-vzdálenějším vrcholem od každého vrcholu v je nutně list. Centrum T tedy splývá s centrem stromu T', který vznikne z T vypuštěním listů a příslušných hran. □ Nyní tedy můžeme přiřadit jednoznačný kód, až na izomorfis-mus, i každému stromu. Pokud je v centru T jediný vrchol, použijeme jej jako kořen, v opačném případě vytvoříme stejným způsobem kód pro dva stromy vzniklé z T odebráním hrany (bez vrcholů) spojující vrcholy centra, tyto kódy lexikograficky porovnáme a za kód stromu T prohlásíme kód kořenového stromu (T, x), kde x je ten z vrcholů, jehož komponenta měla lexikograficky menší kód. Důsledek. Dva stromy T a T' jsou izomorfní, právě když mají společný kód. Z uvedených úvah lze snadno nahlédnout, že algoritmus na testování izomorfismu stromů lze implementovat v lineárním čase vzhledem k počtu vrcholů. Stromy jsou velice speciální třída grafů a většinou je používáme v různých podobách s dodatečnými požadavky. Vrátíme se k nim později v souvislosti s praktickými aplikacemi. Předtím se ještě zastavíme u jiné třídy mimořádně užitečných grafů. 12.23. Rovinné grafy. Velice často se setkáváme s grafy, které jsou nakresleny v rovině tak, že se jejich hrany „neprotínajr". To znamená, že každý vrchol grafu je ztotožněn s nějakým bodem v rovině a hrany mezi vrcholy v a w odpovídají spojitým křivkám c : [0, 1] -» R2 spojujícím vrcholy c(0) — v a c(l) — w. Navíc ještě předpokládáme, že se jednotlivé dvojice hran protínají nejvýše v koncových vrcholech. Hovoříme o rovinném grafu G. Otázka, jestli daný graf připouští realizaci jako rovinný graf, vyvstává velice často v aplikacích. Jednoduchý příklad je následující: Tři dodavatelé vody, elektřiny a plynu mají každý své jedno přípojné místo v blízkosti tří v řadě stojících rodinných domků. Všichni dodavatelé je chtějí všechny napojit tak, aby se jejich sítě nekřížily (třeba se jim nechce kopat příliš hluboko...). Je to možné zvládnout? Odpověď zní: „není". V tomto případě se to zdá být jasné. Jde o úplný bipartitní graf kde tři vrcholy představují přípojná místa, další tři pak domky. Hrany jsou linie sítí. Všechny hrany umíme zvládnout, jedna poslední ale už nejde, viz obrázek, na kterém neumíme čárkovanou hranu nakreslit bez křížení: Řešení. Podle věty o násobení pravděpodobností je výsledek 28 32 i • 57 = 0,0723. □ Pro skutečný důkaz ovšem potřebujeme skutečné matematické nástroje. V tomto případě nebudeme úplnou diskusi provádět, alespoň ji ale naznačíme. 730 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 12.47. Mějme balíček 32 karet. Vytáhneme-li dvakrát po jedné kartě, určete pravděpodobnost, že druhá tažená karta bude eso, když první kartu vrátíme, a také tehdy, když ji do balíčku nevrátíme (druhou kartu potom vybíráme z balíčku 31 karet). Řešení. Pokud kartu do balíčku vrátíme, zjevně opakujeme pokus, který má 32 možných (stejně pravděpodobných) výsledků, přičemž právě 4 z nich vyhovují námi uvažovanému jevu. Vidíme, že v tomto případě je hledaná pravděpodobnost 1/8. Ve druhém případě, kdy první kartu do balíčku nevrátíme, je ovšem hledaná pravděpodobnost stejná. Postačuje např. uvážit, že při vytažení postupně všech karet je pravděpodobnost vytažení esa jako první karty totožná s pravděpodobností, že druhá vytažená karta bude eso. Pochopitelně bylo možné využít toho, že máme zavedenu podmíněnou pravděpodobnost. Tak bychom mohli obdržet 4 3 28 4 _ 1 32 ' 31 + 32 ' 31 ~ 8' 12.48. Kombinatorické identity. Kombinatorickou úvahou (zejména nikoliv indukcí) si odvodte následující důležité kombinatorické vztahy: Aritmetická řada Geometrická řada Binomická věta n(n + 1) (n + 1 2 - 1 x - 1 Horní binomická řada Vandermondova konvoluce n e e k=0 k\_ín + l m I \m + 1 m + n tn\l n k)\r-k O 12.49. Poker varianty Texas holďem. Nyní spočítejme několik jednoduchých úloh týkajících se populární karetní hry Texas holďem, jejíž pravidla zde nebudeme uvádět (pokud je čtenář nezná, snadno je dohledá na internetu). Jaká je pravděpodobnost, že: i) Jako startovní kombinaci dostanu dvojici stejných symbolů? ii) Ve své startovní dvojici karet budu mít eso? iii) Na konci budu mít jednu z šesti nejlepších kombinací karet? iv) Vyhraji, pokud držím v ruce eso a trojku (libovolné barvy), na flopu je eso a dvě dvojky a na turnu je třetí dvojka a m lij 'Též hokejková identita. Můžeme se opřít o docela pracně dokazatelný topologický ■J: » výsledek (tzv. Jordánova věta), že každá spojitá uzavřená křivka v rovině, která sama sebe neprotíná (tj. „pokřivená I kružnice"), rozděluje rovinu na dvě části. Jinými slovy, každá jiná spojitá křivka, spojující jeden bod uvnitř takové křivky a jeden vně, musí nutně naši křivku protínat. Poznamenejme, že pokud hrany realizujeme po částech lineárními křivkami (tj. každá hrana je dána složením na sebe navazujících konečně mnoha úseček), pak je důkaz Jordánovy věty vcelku snadný. Protože jsou v grafu Kit 3 jednotlivé vrcholy v každé z trojic vrcholů nespojených hranami (tj. v každé paritě) stejné až na volbu pořadí, můžeme naši tlustší šedou kružnici považovat za obecný případ kružnice se čtyřmi body a diskutovat umístění zbylých dvou vrcholů. Aby byl graf rovinný, musely by být oba buď uvnitř naší kružnice nebo vně. Obě možnosti jsou opět rovnocenné, nechťjsou tedy uvnitř. Nyní diskutujme jejich polohu vůči vhodné kružnici se dvěma šedými silnějšími a dvěma černými tenkými hranami (tj. přes tři šedé a jeden černý vrchol) a vůči ní diskutujme pozici zbývajícího černého vrcholu. Dojdeme k nemožnosti umístit poslední hranu bez křížení. Zcela obdobně lze ukázat, že úplný graf ^"5 také není rovinný (viz též odstavec 12.26). Obecně se dá dokázat silná Kuratowského věta: 12.24. Věta. Graf G je rovinný právě tehdy, když žádný jeho pod-graf není izomorfní dělení grafu -£"33 nebo grafu K$. Jedna implikace této věty je zřejmá - dělením rovinného grafu vzniká vždy opět rovinný graf a jestliže podgraf nelze v rovině nakreslit bez křížení, totéž musí platit i pro celý graf G. Opačný směr důkazu je naopak velice složitý a nebudeme se jím zde zabývat. Problematice rovinných grafů je věnováno ve výzkumu i v aplikacích hodně pozornosti, my se zde omezíme pouze na vybrané ilustrace. Zmiňme alespoň na okraj, že existují algoritmy, které testují ro-vinatost grafu na n vrcholech v čase 0(n), což určitě nejde přímou aplikací Kuratowského věty. 12.25. Stěny v rovinných grafech. Uvažme rovinný graf G, včetně jeho realizace v M? a nechť 5 je množina všech bodů x e M?, které nepatří žádné hraně, ani nejsou vrcholem. Množina R2 \ G se rozpadne na disjunktní souvislé podmnožiny 5,, kterým říkáme stěny rovinného grafu G. Jedna stěna je výjimečná - ta, jejíž doplněk obsahuje všechny vrcholy grafu. Budeme jí říkat neohraničená stěna 5o. Množinu všech stěn budeme označovat 5 = {5o, Si, ..., Sk) a rovinný graf G = (V, E, S). Jako nejjednodušší příklad si můžeme rozebrat stromy. Každý strom je zjevně rovinný graf, jak je vidět například z možnosti realizovat jej postupným přidáváním listů k jedinému vrcholu. Samozřejmě také můžeme použít Kuratowského větu - když není v G žádná kružnice, nemůže obsahovat jakékoliv dělení grafů 3 nebo K$. Protože strom G neobsahuje žádnou kružnici, dostáváme pouze jedinou stěnu 5o a to tu neohraničenou. Protože víme, jaký je poměr mezi počty vrcholů a hran pro všechny stromy, dostáváme vztah \V\-\E\ + \S\=2. 12.26. Eulerův vztah. Vztah mezi počty hran, stěn a vrcholů lze odvodit pro všechny rovinné grafy. Jde o tzv. Eulerův vztah. 731 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY všechny tyto čtyři karty mají různou barvu (poslední karta river ještě není otočena)? Řešení. i) Počet různých symbolů je 13 a jsou vždy čtyři (pro každou barvu jeden). Proto je počet dvojic se stejnými symboly 13(2) = 78. Počet všech možných dvojic je (1324) = 1326. Pravděpodobnost stejných symbolů je tedy -jý = 0,06. ii) Jedna karta je eso, to jsou čtyři možnosti a druhá je libovolná, to je 51 možností. Dvojice s oběma esy, kterých je (2) = ^ Jsme ale takto započítali dvakrát. Dostáváme tedy 4 • 51 — 6 = 198 dvojic a pravděpodobnost je = 0,15. iii) Spočítáme pravděpodobnosti jednotlivých nej lepších kombinací: ROYAL FLUSH: Takové kombinace jsou zřejmě jen čtyři - pro každou barvu jedna. Všech kombinací pěti karet je (552) = 2598960. Pravděpodobnost je tak rovna přibližně 1,5 • 10~6, tedy je hodně malá. STRAIGHT FLUSH: Postupka, která končí nejvyšší kartou v rozmezí 5 až K, tj. 9 možností pro každou barvu. Dostále 2šlkô- = 1.4- ÍO-5. POKER: Čtyři stejné symboly - 13 možností (pro každý symbol jedna). Pátá karta může být libovolná, to znamená 48 možností. Odtud: 2598960 : 2,4 • 10~ FULL HOUSE: Tři stejné symboly 13 (3) = 52 možností a k tomu dva stejné symboly je 12(4) = 72 možností. Pravděpodobnost j e 2537849460 = 1,4 • 10~3. FLUSH: Všech pětkaretstejnébarvy znamená4(153) = 5148 možností a pravděpodobnost je pak 2598960 = ^ • 10~3. STRAIGHT: Nejvyšší karta postupky je v rozmezí 5 až A, tj. 10 možností. Barva každé karty je pak libovolná, tj. dohromady 10 • 45 = 10240 možností. Zde jsme ale započítali jak straight flush, tak i royal flush. Ty je potřeba odečíst a výsledná pravděpodobnost pak je : :3,9- IQ"3. 2598960 Celkově pro zjištění pravděpodobnosti nějaké z šesti nejlepších kombinací tedy dostáváme pravděpodobnost přibližně 3,9 • 10~3 + 2 • 10~3 + 1,4 • 10~3 + 0,24 • 10~3 = = 7,54- 10-3,tj. asi 0,75%. V Texas holďem hraji vždy s pěti nejlepšími kartami ze sedmi. Počet příznivých kombinací z pěti karet jsme spočítali a k tomu dvě zbylé mohou být libovolné - to je (52^5) kombinací. Dělit budeme počtem všech kombinací ze sedmi karet, tj. (572). Pravděpodobnost dané kombinace pro Texas holďem Všimněme si, že z něho zejména vyplývá, že počet stěn v rovinném grafu nezávisí na způsobu, jak jeho rovinnou realizaci vybereme: Věta. Nechť G = (V, E, S) je souvislý rovinný graf. Pak platí \V\-\E\ + \S\=2. Důkaz. Budeme postupovat indukcí přes počet hran. Graf s jedinou hranou vztah splňuje. Mějme dále graf G, pro nějž platí \E\ > 1. Pokud G neobsahuje kružnici, tj. jde o strom, tvrzení jsme již dokázali v 12.20(5), neboť každý strom má pouze jedinou stěnu 5o. Předpokládejme dále, že nějaká hrana e v grafu G je obsažena v kružnici. Pak je i graf G' — G \e souvislý a podle indukčního předpokladu splňuje G' Eulerův vztah, což znamená, že |V|-(|£|-1) + (|S|-1)=2, protože s odebráním jedné hrany dojde nutně i k propojení právě dvou stěn grafu G do jedné stěny v G'. Odtud ihned dostáváme platnost Eulerova vztahu i pro graf G. □ Důsledek. • Je-li G — (V, E, S) rovinný graf s n a e hranami, pak platí e < 3n — 6, 3 vrcholy přičemž rovnost nastává, právě když jde o maximální rovinný graf(tj. nemůžeme už přidat žádnou hranu, aniž by G přestal být rovinným grafem). • Pokud navíc uvažovaný graf neobsahuje trojúhelník (tj. K3 jako podgraf), platí dokonce e < 2n — 4. Důkaz. Jistě můžeme do daného grafu přidávat hrany tak dlouho, dokud se nestane maximálním. Pokud pro tento maximální graf G bude platit rovnost z našeho tvrzení, pak samozřejmě bude platit i dokazovaná nerovnost pro graf původní. Stejně tak, pokud by G nebyl souvislý, jistě bychom mohli spojit hranou jeho komponenty, a nebyl by tedy maximální. 1 kdyby byl souvislý, ale ne 2-souvislý, pak by jistě existoval vrchol v e V takový, že po jeho odejmutí by se graf G rozpadl do několika komponent G\, ..., Gk, k > 2. Pak ovšem jistě bude možné přidat nějakou hranu mezi těmito komponentami, aniž bychom v původním grafu G narušili jeho rovinnost (nakreslete si obrázek!). Můžeme tedy rovnou předpokládat, že je náš původní graf G maximální rovinný 2-souvislý graf. Jak jsme ukázali ve větě 12.13, každý 2-souvislý graf vzniká postupně z trojúhelníka K3 dělením hran a přidáváním hran. Induktivně tak snadno ukážeme, že každá stěna rovinného grafu je nutně ohraničená kružnicí (což se jeví intuitivně jako zřejmé). Pokud by ale nějaká stěna v našem maximálním rovinném grafu G nebyla ohraničená trojúhelníkem, mohli bychom rozdělit tuto stěnu hranou (v geometrii bychom řekli úhlopříčkou), a jistě by tedy nemohl být G maximální. Víme tedy, že hranice všech stěn v G jsou trojúhelníky K3. Odtud tedy vyplývá, že 3|5| = 2\E\. Nyní už stačí dosadit do Eulerova vzorce za počet stěn \S\ = 1\E\. Druhé tvrzení je analogické, pouze s tím rozdílem, že stěny v maximálním rovinném grafu nyní budou ohraničeny čtyřúhel-níky, odkud vyplyne 415| = 21E|. □ 732 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY tedy dostaneme z pravděpodobnosti pro klasický poker vyná- (?)(4^ sobením koeficientem (7) 21. Uvědomme si, že takto nedostaneme přesnou hodnotu pravděpodobnosti, protože jsme některé příznivé kombinace započítali vícekrát. Například v pětici karet máme full house a mezi těmi dvěma libovolnými kartami máme čtvrtý symbol k těm třem stejným. Máme tedy vlastně poker a tuto kombinaci počítáme dvakrát. Nicméně se výsledek nebude lišit o moc a pravděpodobnost vynikající kombinace u Texas holďem bude zhruba dvacetkrát vyšší než u klasického pokeru. To je asi i jeden z důvodů, proč se prosadila tato herní varianta pokeru, iv) Evidentně je situace hodně dobrá, proto bude lepší spočítat nepříznivé situace, kdy bude mít lepší kombinaci soupeř. Já mám v tuto chvíli full house ze dvou es a tří dvojek. Jediná kombinace, která by mě mohla porazit v tuto chvíli, je buď full house ze tří es a dvou dvojek nebo dvojkový poker. To znamená, že soupeř by určitě musel držet eso nebo poslední dvojku. Pokud drží dvojku a libovolnou jinou kartu, pak určitě vyhraje bez ohledu na kartu na riveru. Kolik je možností pro tuto kartu ke dvojce? 3 + 4+ -- - + 4 + 2 = 45 (jednu trojku a dvě esa už mít v ruce nemůže). Všech zbylých kombinací je (426) = 1035 a pravděpodobnost takové prohry je tak 0,043. Pokud drží v ruce eso, pak se může stát následující. Pokud drží (zbylá) dvě esa, tak opět vyhraje, pokud na riveru nepřijde dvojka - pak nastane remíza. Pravděpodob- nost (podmíněná) mé prohry je tedy ■ 10~3. Pokud drží soupeř v ruce eso a nějakou jinou kartu, než 2 a A, tak následuje remíza bez ohledu na river. Celková pravděpodobnost výhry nebo remízy je tak skoro 96 %. □ 12.50. Osm karet, čtyři esa a čtyři krále rozdělíme po dvou mezi čtyři hráče. Jaká je pravděpodobnost, že někdo dostane alespoň dvě esa? Výsledek vyjádřete ve tvaru podílu dvou dvojciferných čísel. O 12.51. Aleš má dvě speciální hrací kostky, na jedné padá vždy šestka, na druhé padá pouze čtyřka, pětka, či šestka, každé číslo se třetinovou pravděpodobností. Jaká je pravděpodobnost, že mu při hodu těmito dvěma kostkami padne vyšší součet než Martinovi, který hází se dvěma poctivými kostkami. Výsledek vyjádřete ve tvaru podílu dvou dvouciferných čísel. O 12.52. Kolika způsoby lze rozestavit n shodných věží na šachovnici n x n tak, aby bylo každé neobsazené pole ohrožováno některou z věží? Z důsledku snadno dostaneme (bez Kuratowského věty), že K$ a ít33 nejsou rovinné: v prvním případě je totiž |V| = 5 a \E\ = 10 > 3| V| — 6, ve druhém pak, protože ^"33 neobsahuje trojúhelník, máme | V| = 6, \E\ = 9 > 2\V\ - 4. 12.27. Konvexní mnohostěny v prostoru. Rovinné grafy si «|SU můžeme dobře představit jako namalované na po- vrchu koule místo v rovině. Sféra vznikne z roviny w* tti. tak, že přidáme jeden bod „v nekonečnu". Opět 54s§£> - můžeme stejným způsobem hovořit o stěnách a pro takovýto graf pak jsou všechny jeho stěny rovnocenné (i stěna So je ohraničená). Naopak každý konvexní mnohostěn P c R3 si můžeme představit jako graf nakreslený na povrchu koule (můžeme si představit, že hrany a vrcholy daného mnohostěnu promítneme na dostatečně velkou sféru z libovolného bodu uvnitř P). Vypuštěním jednoho bodu uvnitř jedné ze stěn (ta se stane neohraničenou stěnou So) pak obdržíme rovinný graf jako výše tak, že „proděravělou sféru natáhneme do roviny". Rovinné grafy, které vzniknou z konvexních mnohostěnů, jsou zjevně 2-souvislé, protože každé dva vrcholy v konvexním mnohostěnu leží na společné kružnici. Navíc v nich platí, že každá stěna kromě So j e vnitřkem nějaké kružnice a So j e vnějškem něj aké kružnice (při kreslení na sféře jsou všechny stěny vnitřek nějaké kružnice). Názorné se zdá i to, že ve skutečnosti budou grafy vznikající z konvexních mnohostěnů dokonce 3-souvislé. To není náhoda, platí totiž (dosti náročná) tzv. Steinitzova věta (kterou nebudeme dokazovat): Věta. Libovolný vrcholově 3-souvislý rovinný graf G vzniká z konvexního mnohostěnu v R3. 12.28. Platónská tělesa. Jako ilustraci kombinatorické práce s grafy odvodíme klasifikaci tzv. pravidelných mnohostěnů, tj. mnohostěnů poskládaných ze stej- ^.rz, ných pravidelných mnohoúhelníků tak, že se jich v každém vrcholu dotýká stejný počet. Již v dobách antického myslitele Platóna se vědělo, že jich je pouze pět: 4 Přeložíme si požadavek pravidelnosti do vlastností příslušného grafu: chceme, aby každý vrchol měl stejný stupeň d > 3 a zároveň aby na hranici každé stěny byl stejný počet k > 3 vrcholů. Označme n počet vrcholů, e počet hran a s počet stěn. Máme k dispozici jednak vztah provazující stupně vrcholů s počtem hran: dn — 2e. Podobně počítáme počet hran, které ohraničují jednotlivé stěny, a bereme v úvahu, že každá je hranicí dvou stěn, tj. 2e = ks. 733 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řešení. Daná rozestavení jsou sjednocením dvou množin: množiny rozestavení, kdy je v každém řádku alespoň jedna věž (tedy v každém řádku právě jedna; tato množina má n" prvků - v každém řádku vybereme nezávisle jedno pole pro věž) a množiny rozestavení, kdy je v každém sloupci alespoň (tedy právě) jedna věž (stejnou úvahou jako u první množiny má tato množina rovněž n" prvků). Průnik těchto množin pak má n! prvků (místa pro věže vybíráme postupně od prvního řádku - tam máme n možností, ve druhém pak již pouze n — 1 možností - jeden sloupec je již obsazen,...). Podle principu inkluze a exkluze je počet hledaných rozestavení: 2nn-n\. □ 12.53. Pětkrát jsme hodili mincí. Pokud padl líc, dali jsme do klobouku bílou kuličku. Když padl rub, dali jsme do téhož klobouku kuličku černou. Vyjádřete pravděpodobnost, že v klobouku je více černých kuliček než bílých, je-li v klobouku alespoň jedna černá kulička. Řešení. Zavedmejevy A - v klobouku je víc černých kuliček než bílých, H - v klobouku je aspoň jedna černá kulička. Chceme stanovit P(A\H). Uvědomme si, že pravděpodobnost P (Hc) opačného jevu k jevu H je 2~5 a že pravděpodobnost jevu A je stejná jako pravděpodobnost P (Ac) jevu opačného (v klobouku je víc bílých kuliček). Nutně tedy P(H) = 1 — 2~5, P (A) = 1/2. Dále je P (A n H) = P (A), neboť jev H obsahuje jev A (jev A má za důsledek jev H). Celkem jsme obdrželi P(A n H) _ 5 _ 16 ~ " ~ 31' P(A\H). P(H) 1 " (iľ □ F. Pokročilejší kombinatorické úlohy V první kapitole jsme se seznámili se základními kombinatorickými postupy. I když využijeme pouze těchto postupů, jsme schopni vyřešit relativně komplikované úlohy. 12.54. Na kružnici stojí n pevností (n > 3), očíslovaných po řadě čísly 1,..., n. V jeden okamžik každá vystřelí na jednu ze dvou sousedních (pevnosti lan rovněž považujeme za sousední). Označme P(n) počet možných výsledků střelby (za výsledek střelby považujeme množinu čísel právě těch pevností, které byly při střelbě zasaženy, nerozlišujeme přitom mezi jedním a dvěma zásahy). Dokažte, že čísla P(n) a P(n + 1) jsou nesoudělná. Eulerův vztah pak říká 2e 2e 2 — n — e + s —--e -\--. d k Úpravou odtud dostáváme pro naše konstanty d a k vztah 1 1 1 _ 1 d 2 k e Protože nejen d a k, ale také ean musí být kladná přirozená čísla (tj. zejména je \ > 0), dostáváme z této rovnosti velice silné omezení možností. Zejména levá strana nabývá maximální hodnotu pro d — 3. Dosadíme-li tuto hodnotu d — 3, obdržíme drobnou úpravou nerovnost 1 1 1 ---h - = - > 0. 6 k e Odtud vyplývá k e {3, 4, 5) pro obecné d. V původní rovnosti jsou ale role k a d symetrické, musí tedy i d e {3, 4, 5). Prověřením několika zbývajících možností dostáváme následující výčet všech řešení: d k n e s 3 3 4 6 4 3 4 8 12 6 4 3 6 12 8 3 5 20 30 12 5 3 12 30 20 Zbývá ukázat, že všechny odpovídající pravidelné mnohostěny skutečně existují. Již jsme je viděli na obrázcích výše, to ale není matematický důkaz. U prvních tří jistě nejsou pochybnosti. Uveďme si pěknou geometrickou konstrukci dvanáctistěnu (malujte si přitom obrázek!). Začneme s krychlí a na všech jejích stěnách budeme současně ^ , a stejným způsobem stavět „stany áčka". Horní vodorovné tyčky přitom nachystáme na úrovni ploch stěn krychle tak, aby byly pro sousední stěny vždy na sebe kolmé, a jejich délku zvolíme tak, aby lichoběžníky bočních stěn stanu měly tři stejně dlouhé strany. Nyní budeme zdvihat současně a stejně všechny stany při zachovávání poměrů tří stran lichoběžníků. Jistě nastane právě jednou okamžik, ve kterém budou sousední lichoběžníkové a trojúhelníkové stěny koplanární (tj. budou v jedné rovině). Tak vznikne pravidelný dvanáctistěn. Jako cvičení si zkuste sestrojit dvacetistěn! 2. Příklady využití grafových technik V této části se zaměříme na několik příkladů využití nástrojů grafů a na nich založených algoritmů. 12.29. Kostra grafu. V praktických aplikacích často zadává graf všechny možnosti propojení mezi objekty, příkladem může být třeba silniční nebo vodovodní nebo elektrická síť. Pokud nám stačí zajistit propojitelnost každých dvou vrcholů při minimálním počtu hran, hledáme vlastně v grafu G podgraf T na všech vrcholech grafu G, který je stromem. Definice. Libovolný strom T — (V, E) v grafu G — (V, E), E c E se nazývá kostra grafu G. Evidentně může kostra v grafu existovat, pouze pokud je graf G souvislý. Jako formální důkaz, že platí i opak, uvedeme přímo algoritmus, jak kostru grafu sestrojit. 734 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řešení. Označíme-li zasažené pevnosti černým kolečkem a nezasažené bílým, úloha určit P(n) je ekvivalentní úloze určit počet všech možných obarvení n koleček, umístěných na kružnici, černou a bílou barvou tak, aby nebyla žádná dvě bílá kolečka „ob jedno". Pro lichá n je tento počet roven počtu K(n) obarvení černou a bílou barvou tak, aby žádná dvě bílá kolečka nestála vedle sebe (přečíslujeme pevnosti tak, že začneme u kolečka 1 a číslujeme popořadě vzestupně po lichých číslech a poté vzestupně po sudých). V případě sudého n je tento počet roven K(n /2)2, kvadrátu počtu obarvení n/2 koleček na obvodu kruhu tak, aby žádná dvě bílá nestála vedle sebe (barvíme nezávisle kolečka na lichých a na sudých pozicích). Pro K(n) poměrně snadno odvodíme rekurentní formuli K(n) = K(n — 1) + K(n — 2). (Zas tak úplně jednoduché to není, ponecháváme čtenáři jako cvičení.) Navíc snadno spočteme, že K(2) = 3, K(3) = 4, K(4) = 7, tedy K(2) = F(4) - F(Q), K(3) = F(5) - F(1),K(4) = F(6) - F(2) a indukcí snadno dokážeme K(n) = F(n + 2) — F(n — 2), kde F(n) značí n-tý člen Fibonacciho posloupnosti (kde F(0) = 0, F(l) = F(2) = 1). Navíc protože (K(2), K(3)) = 1, máme pro n > 3 obdobně jako u Fibonacciho posloupnosti (K(n), K(n - 1)) = (K(n) - K(n - 1), K(n - 1)) = = (K(n - 2), K(n-!)) = ■■■ = 1. Ukážeme nyní, že pro každé sudé n = 2a je P(n) = K(a)2 nesoudělné jak s P(n + 1) = K(2a + 1), tak s P(n - 1) = K(2a - 1). K tomu stačí následující: pro a > 2 je totiž (K(a), K(2a + 1)) = (K(a), F(2)K(2a) + F(l)K(2a - 1)) = = (K(a), F(3)K(2a - 1) + F(2)K(2a - 2) = • • • = = (K(a), F(a + l)K(a + 1) + F(a)K(a)) = = (K(a), F (a + 1)) = (F(a + 2) - F (a - 2), F (a + 1)) = Algoritmus 1. Seřadíme zcela libovolně všechny hrany e\, ..., em v E do pořadí a postupně budujeme množiny hran £*• tak, že v (i + l)-ním kroku přidáme hranu e; k £*•, jestliže tím nevznikne v grafu G, = (V, U {e,}) kružnice, aponecháme Ei beze změny v případě opačném. Algoritmus skončí, buďpokud má již graf G, pro nějaké i právě n — 1 hran nebo pokud již platí i — m. Pokud zastavujeme z druhého důvodu, byl původní graf nesouvislý a kostra neexistuje. Lemma. Výsledkem předchozího algoritmu je vždy les T. Jestliže algoritmus skončí s k < n — 1 hranami, má původní graf n — k komponent. Zejména je tedy T kostrou, právě když algoritmus skončí po vložení n — 1 hran. Důkaz. Podle pravidla v algoritmu, výsledný podgraf T v G nikdy neobsahuje kružnice. Je tedy lesem. Jestliže je výsledný počet hran n — 1, jde o strom, viz Věta 12.20. Zbývá pouze ukázat, že souvislé komponenty grafu T mají stejné množiny vrcholů jako souvislé komponenty původního grafu G. Každá cesta v ľ je i cestou v G, musí tedy všechny vrcholy z jednoho stromu v T ležet všechny v jedné komponentě G. Pokud by ale existovala v G cesta z v áo w taková, že její koncové vrcholy leží v různých stromech v T, pak na ní existuje poslední vrchol i>, v komponentě určené vrcholem v (zejména tedy vi+\ v této komponentě neleží). Příslušná hrana {i>;, i>,+i} musela někdy při chodu algoritmu ale vytvářet kružnici, protože jinak by se bývala ocitla mezi hranami v T. Protože se během algoritmu hrany neodebírají, musí tedy existovat cesta mezi i>, a iíí+1 v T. To je ovšem spor s našimi předpoklady, a proto v a w nemohou ležet v různých stromech v T. Počet komponent v T je tedy dán tím, že počet vrcholů a hran ve stromech se liší o 1, proto s každou komponentou se tento rozdíl o 1 zvětší. Máme-li tedy v našem lese n vrcholů a k hran, nutně má n — k komponent. □ Poznámka. Jako vždy bychom se měli zabývat otázkou, jak ., složitý je uvedený algoritmus. Kružnice přidáním nové hrany vznikne tehdy a jen tehdy, jestli její koncové vrcholy leží ve stejné souvislé komponentě budovaného lesu T. ''(S 1 Stačí nám proto průběžně udržovat znalost souvislých komponent. K realizaci algoritmu proto potřebujeme (v abstraktní podobě) umět pro již zadané třídy ekvivalence na dané množině (v našem případě jsou to vrcholy) slučovat dvě třídy ekvivalence do jedné a nalézat pro daný prvek, do které třídy patří. Pro sjednocení jistě potřebujeme 0(k) času, kde k je počet prvků slučovaných tříd a jistě můžeme použít ohraničení počtu k celkovým počtem vrcholů n. Můžeme si ale pamatovat spolu se třídami i počty jejich prvků a průběžně pro každý vrchol uchovávat informaci, do které třídy patří. Sjednocení dvou tříd tedy představuje přeznačení jména u všech prvků jedné z nich. Jestliže při přeznačování příslušnosti vrcholů k třídám budeme vždy přeznačovat tu menší z nich, pak celkový počet operací potřebných v našem algoritmu bude 0(n log n + m). Algoritmus 2. Kostru můžeme ale hledat také jinak a rychleji: Budeme v grafu G = (V, E) s n vrcholy a m hra-nami postupně budovat strom T. Začneme v libovolně zvoleném vrcholu ľ a s prázdnou množinou _ hran, tj. To = ({v}, 0). V í-tém kroku hledáme mezi hranami, které dosud nejsou v 7}_i, ty, které mají v 7",_i jeden 735 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY = (F(a + 2)-F(a + l)-F(a-2),F(a + l)) = = (F(a) - F(a - 2), F(a + 1)) = = (F(a - 1), F(a + 1)) = (F(a - 1), F(a)) = 1. (K(a), K(2a - 1)) = = (K(a), F(2)K(2a - 2) + F(l)K(2a - 3)) = = (K(a), F(3)K(2a - 3) + F(2)K(2a - 4)) = = • • • = (K(a), F(a)K(a) + F(a - l)K(a - 1)) = = (K(a), F (a - 1)) = (F(a + 2) - F (a - 2), F (a - 1)) = = (F(a + 2) - F(a), F (a - 1)) = = (F(a + 2) - F(a + 1), F(a - 1)) = (F(a), F(a - 1)) = 1. Tím je tvrzení dokázáno. □ G. Pravděpodobnost v kombinatorice Klasická pravděpodobnost velice úzce souvisí s kombinatorikou, jak jsme již viděli v první kapitole. Uvedme další, trochu zamotanější příklad. Kombinatorika je schována i v následující „pravděpodobnostní" úloze. 12.55. Ve vězení je 100 vězňů, očíslovaných 1 až 100. Nej vyšší x\\^iv žalářník do uzavřené místnosti umístil 100 truhel (také očíslo-"Atřo vanýcn 1 až 100) a do truhel náhodně vložil 100 papírků 9 s čísly 1 až 100, přičemž do každé truhly vložil papírek s jiným číslem. Rozhodl se s vězni hrát následující hru: Do místnosti vstoupí vždy jeden vězeň a má za úkol otevřít 50 truhel. Poté odchází jinými dveřmi a nemá možnost se domlouvat s ostatními vězni. Místností takto projdou postupně všichni vězni. Žalářník všem slíbil svobodu, jestliže každý z nich při otevírání truhel najde svoje číslo. Jestliže jen jediný z nich svoje číslo nenajde, budou všichni popraveni. Než vězni začnou hru hrát, mohou se domluvit na nějaké strategii. Existuje strategie, která vězňům zajistí „rozumnou" šanci na výhru? Řešení. Je zřejmé, že v případě náhodného otevírání truhel, kde jsou volby jednotlivých vězňů nezávislé, je šance každého vězně na nalezení jeho čísla 1/2, tedy celková šance na vyhnije 1/2100. Proto je nutné najít strategii, u které jsou šance na úspěch jednotlivých vězňů co nejvíce závislé. Abychom našli vhodnou strategii, musíme si nejdříve uvědomit, že každý vězeň otevírá truhly po jedné. Přitom nemá žádné informace od ostatních vězňů, stejně tak neví nic o rozmístění čísel v truhlách. Jakmile však otevře nějakou truhlu, zná číslo, které v ní je uložené. Tato skutečnost společně s myšlenkou, že by měl vězeň koncový vrchol, ale druhý koncový vrchol do 7}_i nepatří. První takovou hranu přidáme i s druhým koncovým vrcholem a získáme tak Ti. Algoritmus skončí, až taková hrana neexistuje. Evidentně je výsledný graf T souvislý a podle počtu vrcholů a hran je to strom. Ukážeme, že vrcholy T splývají s vrcholy souvislé komponenty grafu G. Předpokládejme proto, že do nějakého vrcholu w vede z v cesta. Pokud by w nebyl vrchol v T, pak zcela stejně jako v důkazu předchozího lemmatu na ní najdeme poslední vrchol ví, který ještě do T patří. Další hrana cesty by ale v okamžiku ukončení algoritmu připadala v úvahu pro přidání do T, což je spor. Tento algoritmus tedy v čase 0(n+m) nalezne kostru souvislé komponenty zvoleného počátečního vrcholu v. 12.30. Minimální kostra. Každá kostra daného grafu G má stejný počet hran, protože je to obecnou vlastností stromů. Tak, jak jsme ale již dříve hledali nejkratší cesty v grafech s ohodnocenými hranami, budeme v případě koster jistě chtít umět najít kostry s minimálním součtem ohodnocení použitých hran. Definice. Nechť G — (V, E,w) je souvislý graf s hranami ohodnocenými nezápornými vahami w(e). Jeho minimální kostra T je taková kostra grafu G, která má mezi všemi jeho kostrami minimální součet ohodnocení hran kostry. O praktičnosti takové úlohy můžete přemýšlet třeba v souvislosti s rozvodnými sítěmi elektřiny, plynu, vody apod. Kupodivu je docela jednoduché minimální kostru najít (za uvedeného předpokladu, že jsou všechna ohodnocení w(e) hran v grafu G nezáporná). Následujícímu postupu se říká Kruskalův algoritmus: • setřídíme všech m hran v E tak, aby w(e\) < w(e2) < • • • < w(em); • v tomto pořadí aplikujeme na hrany postup z Algoritmu 1 pro kostru v předchozím odstavci. Jde o typický příklad takzvaného ,Jiladového přístupu", kdy se k maximalizaci zisku (nebo minimalizaci nákladů) snažíme dostat výběrem momentálně nejvýhodnějšího kroku. Často tento přístup zklame, protože nízké náklady na začátku procesu mohou zavinit vysoké na jeho konci. Hladové algoritmy jsou proto často základem velmi užitečných heuristických přístupů, jen málokdy dávají optimální řešení. V našem případě ale skutečně dostaneme vždy minimální kostru: Věta. Kruskalův algoritmus správně řeší problém minimální kostry pro každý souvislý graf G s nezáporným ohodnocením hran. Algoritmus pracuje v čase 0(m log ni), kde m je počet hran vG. Důkaz. Označme T = (V, E(T)) kostru vygenerovanou Kruskalovým algoritmem a nechť T (V, E(T)) Je jakákoliv minimální kostra. Z minimality zřejmě r&^: 2ZeeE(Ť) - ZZe(=E(T) «'(«). naším cílem bude 1 ŕ ' 1 ukázat, že rovněž platí w(e) < Y^ w(e). eaE(T) e€£(f) Pokud E(T) = E(T), pak není co dokazovat. Předpokládejme tedy, že existuje hrana e e E(T) taková, že e £ E(Ť). Zvolme si takovou hranu e s minimálním ohodnocením w(e). 736 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY otevření další truhly podmínit číslem v truhle předchozí, nabízí jednoduchou strategii. Každý vězeň nejprve otevře truhlu se svým číslem. Je-li v ní papírek s jeho číslem, uspěl, a může otevřít další truhly náhodně. Jestliže je v ní jiné číslo, jako další truhlu si zvolí truhlu s právě tímto číslem. Takto pokračuje dokud buď nenajde svoje číslo nebo neotevře 50 truhel. Každá truhla tedy jednoznačně odkazuje na nějakou další truhlu, nazvěme tedy tuto strategii odkazovači strategie. Pravděpodobnost úspěchu. Žalářníkovo umístění papírků s čísly do truhel je permutace. Abychom našli pravděpodobnost úspěchu odkazovači strategie, musíme zjistit, pro které permutace bude fungovat. Připomeňme si, že každá permutace se dá zapsat jako spojení uzavřených disjunktních cyklů. Kdyby vězeň dodržující odkazovači strategii mohl otevřít libovolné množství truhel, pak by na své číslo narazil vždy až jako na poslední v cyklu, neboť začíná truhlou se svým číslem, na kterou odkazuje právě papírek s jeho číslem. Z toho plyne, že máme-li n vězňů, pak permutace, pro něž tato strategie nezafun-guje, jsou ty permutace, které obsahují nějaký cyklus délky větší než n/2, protože žádný vězeň, jehož číslo je obsaženo v tomto cyklu, jej nenajde včas. Musíme tedy spočítat, kolik takových permutací existuje. Obecně pravděpodobnost, že v permutaci délky n bude cyklus délky r > n/2 (kratší cykly by se mohly opakovat vícekrát, delší může být vždy maximálně jeden, což nám zjednodušuje výpočet), je následující: Musíme vybrat, kterých r prvků v cyklu bude, uspořádat je v cyklickém pořadí a pak zvolit libovolnou permutaci pro zbylých n — r prvků. Získáváme tedy číslo: (r - 1)! (n-r)\ = — r I r Pravděpodobnost, že se tato permutace vyskytne mezi jednou z celkových možných n \ permutací je 1/r. Pro naši hru se 100 vězni je tedy pravděpodobnost výhry: Přidáním e do T vznikne v T kružnice ee\e2 ■ ■ ■ ek a alespoň jedna její hrana e, není v E(T). Vzhledem ke způsobu výběru hrany e by za předpokladu iw(e;) < w(e) byla hrana e; mezi diskutovanými hranami v Kruskalově algoritmu po vytvoření jistého podstromu 7" c T n T a zjevně by její případné přidání k postupně budovanému stromu T nezpůsobilo kružnici. Kdyby tedy platilo w(ej) < w(e), musela by být v Kruskalově algoritmu hrana e; vybrána. Proto platí iw(e;) > w(e). Nyní ovšem můžeme v minimální kostře T vyměnit hranu e; a hranu e (zřejmě půjde díky volbě e; opět o kostru), aniž bychom zvýšili součet ohodnocení, tj. opět získáme minimální kostru T. Ta se ale liší od T již v méně hranách než předtím. Po konečném počtu kroků takto změníme T na T, aniž bychom navýšili celkové ocenění hran. □ 12.31. Další algoritmy pro minimální kostru. 1 druhý z našich algoritmů pro kostru grafu v předchozím odstavci vede na minimální kostru, pokud v každém okamžiku volíme ze všech možných hran e; = {u,-, u;+i), u; e Ví, e V \ Ví tu, která má minimální ohodnocení. Výsledný postup se zpravidla nazývá Primův algoritmus podle jeho práce z r. 1957. Ve skutečnosti byl ale popsán českým matematikem Jarníkem již v roce 1930. Raději mu proto říkejme Jarníkův algoritmus. Jarník přitom reagoval na ještě dřívější algoritmus brněnského matematika O. Borůvky z r. 1926. Věta. Jarníkův algoritmus najde minimální kostru pro každý souvislý graf s libovolným ohodnocením hran. Poznámka. Borůvkův algoritmus je docela podobný, konstruuje ale postupně stále co nejvíce souvislých komponent zaráz. Začneme tedy s jednoprvkovými komponentami v grafu To = (V, 0) a pak postupně vždy každou komponentu propojíme nej-kratší možnou hranou s komponentou jinou. Opět lze dokázat, že (za předpokladu, že váhy jsou po dvou různé) takto obdržíme minimální kostru. V pseudokódu by šel tento algoritmus zapsat následovně: (1) Inicializace. Vytvoř graf 5 složený z vrcholů grafu G s prázdnou množinou hran; (2) Hlavní cyklus. Dokud má 5 více než jednu komponentu, opakuj: • pro každý strom T v S najdi nejmenší hranu spojující T s G \ T, tuto hranu přidej do E, • všechny hrany z E přidej do 5. Všimněme si, že Borůvkův algoritmus umožňuje realizaci pomocí paralelizovaných výpočtů, ajeproto skutečně v různých praktických modifikacích využíván. Důkazy správnosti obou algoritmů lze snadno dohledat v literatuře. 12.32. Problém obchodního cestujícího. Z naší krátké exkurze do grafových problémů a algoritmů by mohl vzniknout dojem, že je v zásadě možné nalézat hezké a jednoduché algoritmy řešící uvažované problémy. To bylo ale způsobeno tím, že jsme si dosud vybírali pouze problémy jednoduché. V drtivé většině případů je tomu naopak, když teoretické výsledky ukazují, že algoritmus fungující alespoň v polynomiálním čase zřejmě neexistuje a používají se takové, které dávají výsledky rozumně dobré, nikoliv však nutně optimální. Jedním z nejsledovanějších takových kombinatorických problémů je úloha, kdy máme najít v grafu s ohodnocenými hranami 737 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 1 = 0,311828 Jak vidíme, získali jsme velice dobrou šanci na úspěch (ve srovnání s 1 /2100). Pro zajímavost se nyní podívejme, jak se tato pravděpodobnost chová obecně pro rostoucí počet vězňů. Obecně máme pravděpodobnost, že bude při n vězních permutace obsahovat cyklus délky r > n/2 rovnu: " 1 Připomeneme, že YTk=i \ konstanta. Máme tedy: ln (n)+y pron —► oo.kde y jeEulerova ™ 1 2 1 n\ p = -— -—> ln (n) + y — ln ( - 1 — y = ln2, pro n —► oo. Odtud tedy máme, že pravděpodobnost úspěchu vězňů je pro velká n rovna 1 — p ~ 1 — ln 2 = 0,30685 .... V další části si ukážeme, že odkazovači strategie je nejlepší možnou strategií. Optimalita strategie. Pro důkaz optimality odkazovači strategie budeme nejprve muset zavést úpravu pravidel první hry, označme ji hra A a srovnat ji se druhou hrou, označme ji hra B. Upravíme pravidla hry A následujícím způsobem: Každý vězeň bude otevírat truhly tak dlouho, dokud nenalezne papírek se svým číslem. Vězni vyhrají, pokud žádný z nich neotevře více než 50 truhel. Tato úprava očividně nezmění šance vězňů na výhru, pomůže nám však při důkazu optimality. Nyní uvažme druhou hru (hru B) s následujícími pravidly: Do místnosti s truhlami jde nejdříve vězeň číslo 1 a otevírá truhly (podle jakékoli strategie), dokud nenalezne papírek se svým číslem, všechny truhly ale zanechá otevřené. Jako další je do místnosti pozván vězeň s nejmenším číslem, které ještě nebylo otevřeno a opět otevírá truhly, dokud nenajde své číslo. Takto hra pokračuje, dokud nejsou otevřeny všechny truhly. Ve hře B vězni vyhrávají, jestliže žádný z nich neotevřel více než 50 (obecně n/2) truhel. Předpokládejme, že žalářník si zapisuje čísla z papírků v tom pořadí, v jakém jsou objevována v truhlách v průběhu hry B podle zvolené strategie vězňů. Dostane tak permutaci čísel 1 až 100, ze které vidí, zda vězni uspěli či ne (podle počtu čísel mezi následujícími čísly). Ať v této hře zvolí vězni jakoukoli strategii, je šance na nalezení nějakého dalšího čísla vždy stejná. Existuje 100! permutací, které odpovídají minimální hamiltonovskou kružnici, tzn. kružnici s minimálním součtem vah použitých hran mezi všemi možnými hamiltonov-skými kružnicemi. Praktické vyjádření ne vždy na první pohled prozradí, že jde právě o tento problém. Setkáváme se s ním například při • plánování dodávek zboží nebo služeb, • organizaci poštovní služby (rozvoz pošty, výběr pošty ze schránek), • plánování údržby sítí (např. bankomatů), • obsluha požadavků z fronty (např. při paralelních požadavcích na čtení z hard disku), • plánování postupného měření jednotlivých částí celku (např. při studiu struktury krystalu proteinu pomocí rentgenu, kdy náklady jsou soustředěny zejména na posuvy a zaostření pro jednotlivá měření), • plánování dělení materiálů (např. dělení tapet při jejich lepení na použité pásy tak, aby navazoval vzorek, a došlo přitom k co nejmenším ztrátám). 1 v případě hledání minimální hamiltonovské kružnice můžeme uplatnit hladový (anglicky „greedy") přístup. Algoritmus začne v libovolném vrcholu v\, který se stane aktivním, a všechny ostatní si označí za spící. Postupuje pak v krocích tak, že vždy najde ten dosud neumístěný vrchol ze spících, do kterého vede z aktivního vrcholu nejméně ohodnocená hrana. Aktivní vrchol označí jako zpracovaný a tento nový vrchol se stane aktivním. Algoritmus skončí buď neúspěchem, když nenajde žádnou hranu z aktivního vrcholu do spícího vrcholu, ale hamiltonovská kružnice ještě nebyla nalezena, nebo využitím všech vrcholů. Pokud ve druhém případě existuje hrana z posledního přidaného vrcholu v„ do v\, získáme hamiltonovskou kružnici. Je zjevné, že tento algoritmus jen velice zřídka vyprodukuje skutečně minimální hamiltonovskou kružnici. Na úplném grafu zato vždy alespoň nějakou najde. 12.33. Toky v sítích. Další skupina aplikací j azyka teorie grafů se týká přesunu nějakého měřitelného materiálu v pevně zadané síti. Vrcholy v orientovaném grafu představují body, mezi kterými lze podél hran přenášet předem známá množství, která jsou zadána formou ohodnocení hran. Některé vybrané vrcholy představují zdroj sítě, jiné výstup ze sítě. Podle analogie potrubní sítě pro přenos kapaliny říkáme výstupním vrcholům stok sítě. Síť je tedy pro nás orientovaný graf s ohodnocenými hranami a vybranými vrcholy, kterým říkáme zdroje a stoky. Je zřejmé, že se můžeme bez újmy na obecnosti omezit na orientované grafy s jedním zdrojem a jedním stokem. V obecném případě totiž vždy můžeme přidat jeden stok a jeden zdroj navíc a spojit je vhodně orientovanými hranami s všemi zadanými zdroji a stoky tak, že ohodnocení přidaných hran bude zároveň zadávat maximální kapacity jednotlivých zdrojů a stoků. Situace je naznačena na obrázku, kde černými vrcholy nalevo jsou zobrazeny všechny zadané zdroje, zatímco černé vrcholy napravo jsou všechny zadané stoky. Nalevo je jeden přidaný (virtuální) zdroj jako bílý vrchol a napravo jeden stok. Označení hran není v obrázku uvedeno. 738 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY nějakým zvoleným strategiím, ať už náhodným nebo jakkoli sofistikovaným, neboť jsou to jen zápisy pořadí, v jakém byla jednotlivá čísla odhalena. Pro výpočet pravděpodobnosti výhry vězňů ve hře B si nejprve všimněme, že libovolné pořadí může být zapsáno seskupením cyklů, kde každý cyklus odpovídá otevřeným truhlám jednoho vězně. Pro představu, mějme hru s 8 vězni. Žalářník si zapsal permutaci (2,5,7, 1,6,8,3,4), odtud vidíme, že vězni vyhráli, protože vězeň číslo 1 otevřel truhly s čísly (2, 5, 7, 1), následoval vězeň 3 a otevřel truhly s čísly (6, 8, 3) a nakonec vězeň číslo 4 otevřel pouze truhlu s číslem (4). V tomto případě tedy můžeme psát: (2, 5, 7, 1, 6, 8, 3, 4) (2, 5, 7, 1)(6, 8, 3)(4). Navíc ukážeme, že každá takováto permutace vychází z unikátního seřazení čísel 1 až 8. Máme-li libovolnou permutaci zapsanou v cyklické notaci, nejprve jednotlivé cykly přepíšeme tak, aby jejich nejmenší prvek byl poslední a poté celé cykly seřadíme tak, aby byly seřazeny vzestupně podle posledních prvků. Máme například: (7, 5, 8)(2, 4)(1, 6, 3) (6, 3,1)(4, 2)(8, 7, 5) (6,3, 1,4,2,8,7, 5). Sestrojili jsme tedy bijekci mezi pořadími otevřených čísel, pro která vězni vyhrají a mezi permutacemi čísel 1 až 8, které neobsahují cyklus větší než 4. Z toho plyne, že pravděpodobnost výhry vězňů ve hře B je stejná, jako pravděpodobnost, že permutace neobsahuje žádný cyklus délky větší než 4 (obecně n/2). To přesně odpovídá pravděpodobnosti výhry vězňů v původní hře za využití odkazovači strategie. Z tohoto vyplývá nejdůležitější závěr pro hru A. Vězni mohou totiž jakoukoli strategii ze hry A aplikovat na hru B následujícím způsobem: i-tý hráč postupuje stejně, jako ve hře A s tím rozdílem, že je-li nějaká truhla již otevřená, zachová se, jakoby byla zavřená, nevyužije tedy všechny své tahy, ale další krok založí na čísle napsaném na papírku otevřené truhly. Odtud tedy jakákoli strategie, která je úspěšná pro nějaké seřazení papírků ve hře A, musí být nutně úspěšná pro stejné seřazení i ve hře B. Kdyby existovala lepší strategie ve hře A, mohli bychom ji aplikovat na hru B a získat větší šanci na úspěch i v ní, to je však nemožné, protože všechny strategie ve hře B vedou ke stejné pravděpodobnosti úspěchu. Větší šanci na úspěch, než použitím odkazovači strategie, tedy získat nemůžeme. □ 12.56. V soutěži je m soutěžících a n rozhodčích, kde n > 3 je liché celé číslo. Každý soutěžící je od každého rozhodčího hodnocen jako úspěšný nebo neúspěšný. Předpokládejme, že libovolní dva rozhodčí ____j SÍTĚ A TOKY |___I Síťje orientovaný graf G — (V, E) s vybraným jedním vrcho- I lem z, nazvaným zdroj, a jiným vybraným vrcholem s, nazvaným stok, spolu s nezáporným ohodnocením hran w : E -» R, které představuje kapacitní omezení. Tokem v síti 5 = (V, E, z, s, w) rozumíme ohodnocení hran / : E -» R takové, že součet hodnot u vstupních hran u každého vrcholu v, kromě zdroje a stoku, je stejný jako součet u výstupních hran z téhož vrcholu, tj. E E /(«)■ eeIN(v) eeOUT(v) Toto pravidlo se často (s odkazem na fyzikální terminologii) nazývá Kirchhorruv zákon. Velikost toku / je dána celkovou balancí hodnot u zdroje 1/1= E E f^- eeOUT(z) eelN(z) _l Z definice je zřejmé, že velikost toku můžeme stejně dobře vypočíst jako hodnotu 1/1= E E eelN(s) eeOUT(s) Na obrázku máme nakreslenu jednoduchou síť se zvýrazněným bílým zdrojem a černým stokem. Součtem maximálních kapacit hran vstupujících do stoku vidíme, že maximální možný tok v této síti je 5. 3 12.34. Problém maximálního toku v síti. Naší úlohou bude pro zadanou síť na grafu G určit maximální možný tok. Na konci minulého odstavce jsme pohledem na obrázek zjistili, že maximální tok v této síti nemůže přesáhnout číslo 5. Podstatné na naší úvaze bylo, že jsme sečetli hodnoty maximálních kapacit u množiny hran, přes které musí jít každá cesta ze z do s. Zároveň umíme snadno najít tok, který toto maximum skutečně realizuje (protože je naše síť tak jednoduchá). Tuto rozvahu můžeme zformalizovat takto: .__-J Řez v síti )--- Řezem v síti S = (V, E, z, s, w) rozumíme takovou množinu hran C c E, že po jejím odebrání nebude v grafu G = (V, E\C) 739 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY se shodnou v ohodnocení nejvýše k soutěžících. Dokažte, že: k n — 1 — > -. m In Podívejme se na dva možné přístupy k řešení této úlohy. Řešení. Spočítejme počet N trojic (rozhodčí, rozhodčí, soutěžící), ve kterých jsou rozhodčí různí a hodnotí soutěžícího stejně. Existuje celkem (j) dvojic rozhodčích a každá dvojice hodnotí nejvýše k soutěžících stejným hodnocením, tedy platí N < fcQ. Nyní uvažme pevně zvoleného soutěžícího X a spočtěme počet rozhodčích, kteří soutěžícího X hodnotili stejně. Řekněme, že x rozhodčích hodnotilo X jako úspěšného. Potom existuje Q dvojic, které hodnotily X úspěšně a ("2*). které hodnotily X neúspěšně. Celkově tedy íx\ (n — x\ x(x — 1) (n — x)(n — x — 1) U) + ( 2 ) = —+-2- dvojic hodnotí soutěžícího X stejně. Máme: x(x — 1) (n — x)(n — x — 1) 2x2 — 2nx + n2 — n 2 h 2 ~ 2 ~ / n\2 n2 n n2 n (n — l)2 1 ~\~2~) +T~2-T~2~ 4 4' Jelikož je n liché, je výraz (n — l)2/4 celé číslo, tedy počet dvojic hodnotících soutěžícího X stejně je nejméně (n — l)2/4. Odtud tedy N > m(n — l)2/4. Spojením těchto dvou nerovností tedy získáváme k n — I — > -. m 2n Alternativní řešení - pravděpodobnostní metoda. Zvolme náhodně dva rozhodčí. Nechť X je náhodná veličina, která udává počet případů, kdy se tento pár rozhodčích shoduje v hodnocení. Budeme dokazovat obměnu původního tvrzení, tedy je-li ^ < pak je X větší než k s pravděpodobností větší než nula, což budeme psát P(X > k) > 0. Mějme náhodné veličiny Z, pro i = 1,2,...,m nabývající hodnot 0,1 podle toho, zda i-tý soutěžící dostal od obou rozhodčích stejné hodnocení. Nechť Z, = 1, když se rozhodčí shodnou a Z, = 0 naopak. Odtud pak máme: X = X-[ + x2 + ■ ■ ■ + xm S použitím linearity střední hodnoty získáváme: E[X] = E[X{\ + E[X2] + ■■■ + E[Xm]. Nyní spočteme = ^Ii€{0 i( xt ■ P(X, = *,). Jelikož Xt nabývá pouze hodnot 0 a 1, máme přímo = P(Z, = 1). Podívejme se na pravděpodobnost P(Z, = 1), tedy pravděpodobnost, že soutěžící i dostane od obou rozhodčích shodné hodnocení. Existuje Q možných dvojic rozhodčích. Označme /, počet rozhodčích, kteří ohodnotí i-tého žádná cesta ze zdroje z do stoku s. Číslo |C| = £>( 0 (někdy též z pochopitelných důvodů - tok budeme nasycovat v „protisměru" hovoříme o polo-cestě, příp. o tzv. zlepšující polocestě). Za rezervu kapacity hrany e pak označujeme číslo w(e) — f(e) pro případ hrany orientované ve směru zudoioa číslo f(e) při orientaci opačné. Pro zvolenou cestu bereme za její rezervu kapacity minimální rezervu kapacity jejích hran. [ FORDŮV-FULKERSONŮV ALGORITMUS |__, Vstupem algoritmu je síť 5 = (V, E, z, s, w) a výstupem maximální možný tok / : E —> R. Pro zjednodušení úvah budeme předpokládat, že všechny kapacity hran jsou dány racionálními čísly. • Iniciace: Zadáme f (e) — 0 pro všechny hrany e e E a prohledáváním do hloubky z vrcholu z najdeme množinu vrcholů U c V, do kterých existuje nenasycená cesta. • Hlavní cyklus: Dokud s e U, opakujeme - zvolíme nenasycenou cestu P ze zdroje z do s a zvětšíme tok / u všech hran této cesty o její minimální rezervu; - obnovíme U. • Výstupem je (maximální) tok / a minimální řez C tvořený všemi hranami vycházejícími zU a končícími ve V \ U. ^ord, L. R.; Fulkerson, D. R. (1956). "Maximal flow through a network". Canadian Journal of Mathematics 8: 399-404. 740 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY soutěžícího kladně an-t počet rozhodčích, kteří ohodnotí i-tého soutěžícího záporně. Počet dvojic úspěšných hodnocení je pak (,) a počet dvojic neúspěšných hodnocení je ("2'')» z tono Ptyne> že počet shodných hodnocení soutěžícího i je (!;) + ("2'')- A tedy: (2) + ("ľ') E[Xi] = P(Xi = 1) =■ y2> y 2 ' Odtud získáváme: (2) Ukážeme, že pro lichá n platí nerovnost (!;) + (™ 2'') > (" 41} ■ Upravením nerovnosti získáme 9 n — 1 - 2/,-) > 1 —— nebo U > (" "'7 ----- 2 ----- " - 2 což zřejmě platí, neboť ^ a ^ jsou dvě po sobě jdoucí čísla. S použitím nerovnosti (íj) + (™~''') > ("~1)2 získáváme: í2^)2 m(« - 1) L J — ři(ři—i) 2 2n k nyní máme > k, tedy P(Z fe) > 0 a jsme s důkazem hotovi. Díky předpokladu □ Dále ukážeme využití pravděpodobnostní metody při řešení zajímavého problému. 12.57. Buď S konečná množina bodů v rovině taková, že žádné tři z nich neleží v přímce. Nechť pro libovolný konvexní mnohoúhelník P, jehož vrcholy jsou v S, značí a(P) počet vrcholů P a b(P) počet bodů z S, které neleží v P. Dokažte, že pro libovolné reálné číslo x platí £y

(i ■ xy b(P) 1, kde sčítáme přes všechny konvexní mnohoúhelníky s vrcholy v S. (Úsečku, resp. bod, resp. prázdnou množinu považujeme za konvexní mnohoúhelníky se dvěma, resp. jedním, resp. žádným vrcholem.) Řešení. Nejprve dokážeme uvedenou rovnost pro x e [0,1]. Obarvěme vrchol z množiny S s pravděpodobností x na bílo a s pravděpodobností 1 — x na černo (neboli uvažme náhodný výběr velikosti |5| s binomickým rozdělením pravděpodobnosti Bi(n,x)) a řekněme, že zdar odpovídá bílé barvě, nezdar černé). Všimněme si, že při libovolném obarvení bude vždy existovat mnohoúhelník takový, že všechny jeho vrcholy jsou bílé a všechny body mimo něj jsou černé (jde o hranici konvexního obalu bíle obarvených bodů). Z předchozí úvahy víme, že pravděpodobnost, že v tomto náhodném výběru bude Důkaz správnosti algoritmu. Jak jsme viděli, velikost každého toku je nejvýše rovna kapacitě kteréhokoliv řezu. Stačí nám tedy ukázat, že v okamžiku zastavení algoritmu jsme vygenerovali řez i tok se stejnou hodnotou. Algoritmus se zastaví při prvním případu, kdy neexistuje nenasycená cesta ze zdroje z do stoku s. To znamená, že U neobsahuje s a pro všechny hrany e z U do zbytku je / (e) = w(e), jinak bychom museli koncový vrchol e přidat k U. Zároveň ze stejného důvodu všechny hrany e, které začínají v komplementu V \ U a končí v U, musí mít tok f(e) = 0. Pro velikost toku celé sítě jistě platí 1/1= - E Za- hraný zUáoV\U hrany zV\UáoU Tento výraz je ovšem v okamžiku zastavení roven E m hrany zUdoV\U což jsme chtěli dokázat. Zbývá ovšem ukázat, že algoritmus skutečně zastaví. Protože předpokládáme, že ocenění hran je dáno racionálními čísly, můžeme (celočíselnou změnou měřítka) rovnou předpokládat, že jsou všechna ocenění maximálních kapacit celočíselná. Je zřejmé, že pro celočíselné hodnoty ohodnocení hran dostáváme během chodu algoritmu stále celočíselné toky. Při každém průchodu hlavním cyklem ovšem tok zvyšujeme. Protože ale každý řez dává omezení možného toku shora, musí se algoritmus po konečném počtu kroků zastavit. hrany zUdoV\U |C|, 2/3 2/3 Chod algoritmu je ilustrován na obrázku. Vlevo jsou vyseděny dvě nejkratší nenasycené cesty ze zdroje do stoku (horní má dvě hrany, spodní tři). Napravo je pak nasycena další cesta v pořadí (v nejhornější jdeme první možnou odbočkou) a je také šedá. Je nyní zjevné, že nemůže existovat další nenasycená cesta ze zdroje do stoku. Proto algoritmus v tomto okamžiku skončí. 12.35. Poznámky k algoritmu. Naše úloha připouští i další podmínky. Můžeme např. požadovat dodržení _ maximální kapacity průtoku přes jednotlivé vrcholy. Nebo můžeme chtít dodržet nejen maximální, ale také minimální toky přes jednotlivé hrany či vrcholy. Přidání kapacit vrcholů je jednoduché - prostě vrcholy zdvojíme a dvojčata označující vstup do vrcholu a výstup z vrcholu spojíme právě jednou hranou s příslušnou kapacitou. Omezení minimálními průtoky lze zahrnout do iniciace našeho algoritmu. Je ovšem zapotřebí otestovat, jestli takový tok vůbec existuje. V literatuře lze najít řadu dalších nuancí, nebudeme se jim zde věnovat. Všimněme si však, že se náš algoritmus nemusí nutně zastavit, pokud připustíme iracionální maximální kapacity hran. Dokonce 741 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY realizován konvexní mnohoúhelník, jehož všechny vrcholy budou bílé a všechny vrcholy vně něj černé, je rovna jedné. Spočítejme však tuto pravděpodobnost i jiným způsobem. Jev, že nějaký mnohoúhelník bude mít požadovanou vlastnost, je totiž sjednocením k disjunktních jevů, kde k je počet konvexních mnohoúhelníků, totiž že daný konkrétní mnohoúhelník bude mít uvažovanou vlastnost (rozmyslete si, že zkoumanou vlastnost nemohou mít dva různé konvexní mnohoúhelníky). Pro každý konkrétní mnohoúhelník P je pravděpodobnost toho, že jeho vrcholy budou obarveny na bílo a všechny body ležící vně něj rovna xa(p'1 (1 — x)b(p\ kde a(P) je počet vrcholů P a b(P) je počet bodů ležících vně něj. Pravděpodobnost sjednocení disjunktních jevů je pak rovna součtu pravděpodobností jednotlivých jevů, tedy a - x)KP) = i. p Tím je rovnost dokázána pro čísla z intervalu [0, 1]. Toto však můžeme interpretovat tak, že libovolné číslo z intervalu [0,1] je kořenem polynomu xa(-p) (1 — x)b(P) — 1. Jak ale víme, nenulový polynom nad (nekonečným) tělesem reálných čísel může mít pouze konečně mnoho kořenů (viz 11.19). Polynom ^p xa(p'1 (1 — x)b(p'1 — 1 je tedy nulový polynom a rovnost xa(p'1 (1 — x)b(p'1 = 1 platí pro libovolné reálné číslo x. □ Poznámka. Daná rovnost platí, i pokud čísla a(P) a b(P) definujeme jinak: definice a(P) zůstává, b(P) však bude značit počet bodů z S, které nejsou vrcholy P. Bylo by tedy a(P)+b(P) = \S\. Daná rovnost by potom byla důsledkem binomické věty pro dvojčlen (x+(1 — x))1 s 1. 12.58. Soutěž n hráčů nazýváme (n, k) turnajem, jestliže se hraje v k kolech a navíc splňuje následující podmínky: i) každý hráč hraje v každém kole a libovolní dva hráči se střetnou nejvýše jednou, ii) jestliže se hráč A utká s hráčem B v i'-tém kole, hráč C se v i-tém kole utká s hráčem D a hráč A se utká s hráčem C v 7-tém kole, pak se hráč B v 7-tém kole utká s hráčem D. Určete všechny dvojice (n, k), pro které existuje (n, k) turnaj. Řešení. Vyhovují všechny dvojice (n, k), kde 2rl°82(i+1'l dělí číslo n. Nejprve ukažme, že všechny takové dvojice vyhovují: sestrojíme turnaj (2', k), kde k < 2' — 1 (obecný případ 2' | n z tohoto následně snadno odvodíme). Tohoto turnaje se tedy účastní 2' hráčů. Každému hráči přiřadme (jedinečnou) posloupnost délky / složenou z nul a jedniček (těchto posloupností je 2', toto přiřazení je tedy možné). V i-tém kole necháme hrát hráče a s hráčem a © w(i), kde co(i) je binární rozvoj čísla i, případně doplněný do délky / nulami na začátku (uvedená dvě nemusí dosahované toky ani konvergovat k optimálnímu řešení. V každém případě je ale stále v pořádku ta část důkazu z předchozího odstavce, která ověřila, že v případě zastavení algoritmu je dosažen maximální možný tok. V případě celočíselných ohodnocení lze dobu chodu algoritmu odhadnout výrazem 0(/|£|), kde / je maximální tok v síti a \E\ je počet hran (uvědomme si, že v nejhorším budeme v každém kroku zvětšovat dosažený tok o jedničku). V důkazu správnosti algoritmu jsme explicitně nevyužili zvolený způsob prohledávání grafu při hledání nenasycené cesty. Jinou variantou k Fordově-Fulkersonově algoritmu je tedy volba prohledávání do šířky. Tuto variantu využívá tzv. Edmondsův-Karpův algoritmus, který má zaručené zastavení v čase 0( |F 11 £|2) .7 Moderními, výrazně efektivnějšími algoritmy, jsou pak Diničův algoritmus, který zjednodušuje hledání nenasycené cesty konstrukcí tzv. úrovňového grafu, kdy zlepšující hrany uvažujeme pouze tehdy, pokud vedou mezi vrcholy různých vzdáleností od zdroje. Složitost tohoto algoritmu je 0(| V|2|£|), cožjeu hustých grafů významné vylepšení oproti složitosti algoritmu Edmondse-Karpa. 12.36. Další úlohy na toky v sítích. Hezkým využitím toků v sítích je řešení úlohy bipartitního párování. Úlohou je v bipartitním grafu najít maximální párování, tedy maximální podmnožinu hran takovou, aby žádné dvě hrany nesdílely vrchol. Jde o abstraktní variantu docela obvyklé úlohy - třeba spárování kluků a holek k tanci v tanečních, kdybychom měli předem známé možnosti, ze kterých vybíráme. Tento problém snadno převedeme na hledání maximálního toku. Přidáme si uměle navíc ke grafu zdroj, který propojíme hranami jdoucími do všech vrcholů v jedné skupině v bipartitním grafu, zatímco ze všech vrcholů ve druhé skupině vedeme hranu do přidaného stoku. Všechny hrany opatříme maximální kapacitou 1 a hledáme maximální tok. Za páry pak bereme hrany s nenulovým tokem. Jiným významným využitím toků je důkaz tzv. Mengerovy , jf' ., věty (uvedli jsme ji jako tvrzení v 12.12). Můžeme se na tně dívat takto: V orientovaném grafu ohodnotíme všechny N hrany e maximální kapacitou 1 a totéž pro všechny vrcholy. 1 Dále si zvolíme libovolnou dvojici vrcholů v aw, které považujeme za zdroj a stok. Jestliže nás pak zajímá tok tímto grafem, dostaneme právě počet zcela různých cest z v áo w (hrany i vrcholy jsou různé kromě začátku a konce). Každý řez přitom odděluje v a w do různých souvislých komponent zbylého grafu. Ze skutečnosti, že kapacita minimálního řezu je rovna hodnotě toku v síti, nyní vyplývá požadované tvrzení. 12.37. Stromy her. Obrátíme teď naši pozornost k velice rozšířeným užitím stromových struktur při analýzách možných strategií nebo postupů. Zcela jistě se s nimi setkáme v teorii umělé ví//' • inteligence a v části teorie her. Své místo ale mají také v ekonomii a mnoha dalších oblastech lidských činností. Edmonds, Jack; Karp, Richard M. (1972). "Theoretical improvements in algorithmic efficiency for network flow problems". Journal of the ACM (Association for Computing Machinery) 19 (2): 248-264. doi:10.1145/321694.321699. 742 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY binární čísla a a co{í) sčítáme pomocí operace ©, což je tzv. binární XOR, neboli sčítání číslic modulo 2).Tento rozvrh zápasů je korektní, neboť potom každý hráč hraje v každém kole, různí hráči mají různé oponenty (pro a ^ f3 je a + w(i) ^ B + a>(i)) a oponent hráče a hraje skutečně podle tohoto rozpisu s hráčem a (neboť (a + co(i)) + = a). Navíc je také splněna podmínka ze zadání: pokud v i-tém kole hraje hráč a s hráčem f3 a hráč y s hráčem S, tedy pokud f3 = a + w(i) a S = y + co(i), tak je-li v 7-tém kole soupeřem hráče a hráč y, tedy y = a + co(j), pak také B + co(j) = (a + co(i)) + co(j) = (a + co(j)) + ú)(i) = y + co(i) = S, tedy hráči B a S se střetnou v 7-tém kole. Libovolný (2' ■ s, k), kde s je liché, pak dostaneme jako s paralelně hraných (2', k) turnajů. Nyní ukážeme, že podmínka 2rl°82(i+1'l | n je i nutná. Uvažme graf Gi, jehož vrcholy jednoznačně odpovídají hráčům v turnaji a hrany odehraným zápasům do i-tého kola včetně. Nejprve uvažme hráče A a B, kteří spolu hrají v (i + 1). kole. Ukážeme, že pak |r| = |A|, kde T je komponenta hráče A v grafu G, a A komponenta hráče B v G, a to tak, že dokážeme, že libovolný hráč z T se utká s některým hráčem z A v (i +1). kole. Nechť tedy C e T, tj. v G, existuje cesta A = X\, X2,..., Xm = C taková, že Xj hrál s Xj+\, j = 1,... ,m — 1, v některém z prvních i kol. Uvažme posloupnost Y\, Y2,... Ym, kde ľj je soupeř Xt v (i+1). kole, k = 1,..., m (tedy Y\ = B). Potom pro libovolné 1 < m — 1 se v (i + 1). kole utkal hráč Xj s hráčem ľ), hráč Xj+i s hráčem ľ)+i (podle definice posloupnosti Y\,..., ľí) a v jistém r-tém kole (1 < r < 1) se utkali hráči Xj a Xj+\ (podle definice posloupnosti X\,..., Xi) Podle druhé podmínky ze zadání to však znamená, že hráč ľ) se utkal s hráčem Yj+\ rovněž v r-tém kole, tedy ľ) Yj+\ je hrana v G, pro libovolné 1 < j < m — 1, tudíž Y\, Y2,... Ym je cestou v G,, takže B = Y\ a Ym leží ve stejné komponentě, tedy v A. Ze symetrie předcházející úvahy vyplývá, že také libovolný hráč z A hrál v (i + 1). kole s nějakým hráčem z T, a protože každý hráč hrál v daném kole právě jednou, je | T | = | A |. Z definice komponent je komponenta hráče A v grafu Gi+\ rovna T U A. Potom opět z definice komponent buď T = A (v tom případě bude komponenta hráče A v grafu Gi+\ rovna T), nebo T n A = 0 (v tomto případě bude komponenta hráče A v grafu Gi+\ rovna T U A). Celkem zůstane velikost komponenty hráče A stejná, nebo se zvětší na dvojnásobek. Uvažme nyní posloupnost komponent T\,T2, ■ ■ ■ ,Tk hráče A v grafech Gi, G2,.. ■ Gt. Máme | Ti | = 2 (v prvním kole měl hráč A jednoho protivníka) a pro 1 < i < k — 1 máme z předchozího, že buď|r,| = |ri+i|, nebo 2|r,| = |r,-+i|. Je tedy počet vrcholů (hráčů) v každé z uvedených komponent mocninou čísla 2, tedy | | = 2', pro nějaké / a Tt > k + 1 (hráč A hrál v k kolech s různými hráči), tedy Budeme v této souvislosti hovořit o hrách. V matematickém smyslu se teorie her zabývá modely, ve kterých jeden nebo více partnerů činí kroky podle předem známých pravidel a většinou také ve předem známém pořadí. Většinou se možné kroky nebo úkony ohodnocují nějakými výnosy nebo ztrátami pro daného partnera. Smyslem je pak nalezení strategie hráče, tj. algoritmického postupu, podle kterého může hráč maximalizovat výnos, případně minimalizovat ztrátu. Budeme se zabývat tzv. extenzivním popisem her. To je takový popis, kdy máme k dispozici úplnou a konečnou analýzu všech možných stavů hry a výsledná analýza zadává skutečně přesnou rozvahu o výnosech či ztrátách za předpokladu nejlepšího možného chování zúčastněných partnerů. Strom hry je kořenový strom, který má za vrcholy všechny možné stavy hry, a tyto vrcholy budou označeny podle toho, který z hráčů je zrovna na tahu. Hrany budou všechny možné tahy daného hráče v daném stavu. Takový úplný popis pomocí stromu můžeme konstruovat pro běžné hry jako jsou piškvorky, šachy, apod. Jako jednoduchý příklad uvedřne jednoduchou variantu hry Mra.8 Nastoleležínajednéhromádce&sirek,kde& > ljepřirozené číslo, a hráči postupně odebírají každý jednu nebo dvě sirky. V normální variantě hry vyhraje ten, kdo jako poslední má co vzít. Ve variantě hry „na žebráka" naopak prohrává ten, kdo vzal všechny zbývající sirky. Strom takové hry, včetně všech potřebných informací můžeme sestrojit následovně: • Stavu s í sirkami na stole a s prvním hráčem na tahu odpovídá podstrom s kořenem označeným F t, stavu s týmž počtem sirek a druhým hráčem na tahu odpovídá podstrom s kořenem St. • Vrchol Fi má levého syna 1 a pravého syna S1-2, u vrcholu St jsou to obdobně synové F^_i a F^_2- • Listy jsou vždy bud'Fo nebo 5o (při normálním režimu hry; při hře na žebráka by to byly stavy F\ a S\, ve kterých příslušný hráč prohrál). Každý průběh hrou začínající v kořenu Fi odpovídá právě jednomu listu výsledného stromu. Je tedy vidět, že celkový počet p(k) možných her pro Fi je roven p{k) = p{k-V>+ p(k- 2) pro k > 3 a snadno vidíme, že p(l) — la p (2) = 2. Takovou diferenční rovnici jsme už řešili. Jejím řešením jsou tzv. Fibonacciova čísla a umíme pro ně najít explicitní formuli, viz odstavec o vytvořujících funkcích nebo část o diferenčních rovnicích ve čtvrté kapitole. Známe proto i formuli pro počet možných průběhů her. Počet možných stavů hry je přitom roven počtu všech vrcholů ve stromu. Hra přitom vždy skončí výhrou buďprvního nebo druhého hráče. U podobných her může kromě toho hra končit také remízou. 12.38. Analýza hry. Připravená stromová struktura nám teď snadno umožní analyzovat hru tak, abychom mohli ir&íľ sestavit skutečně algoritmickou strategii pro každého I jj hráče. Je k tomu jednoduchý rekurzivní postup pro riÉ ohodnocení kořene podstromu. Budeme označovat jako W vrcholy, ve kterých (při optimální strategii obou) vítězí první hráč, a L v případě opačném, případně ještě můžeme značit jako T vrcholy stromu odpovídající remíze (z anglického „win" Název zavedl patrně Charles Bouton ve své analýze těchto her z roku 1901. Prý pochází z německého „Nimm!", což česky znamená ,3er!". 743 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 2' > k + 1, neboli 21 je alespoň 2rlo82(i+1'1, takže počet hráčů v každé komponentě je dělitelný 2rlo82(i+1'1, tudíž je tímto číslem dělitelné i číslo n. 1-1 je tímto číslem dělitelné i □ H. Kombinatorické hry 12.59. Uvažme hru dvou hráčů. Na stole jsou čtyři hromádky sirek, o 9, 10, 11 a 14 sirkách. V tahu je nutné provést následující akcí: z jedné libovolně zvolené hromádky odebrat libovolný nenulový počet sirek. Hráči se střídají na tazích a kdo nemůže táhnout prohrál. Existuje výherní strategie za některého z hráčů? (prvního či druhého) Řešení. Uvědomme si, že se jedná o součet čtyř her: každá z nich odpovídá hře s jednou hromádkou, ze které můžeme odebírat libovolný počet sirek (operace součtu her je asociativní, takže můžeme mluvit o součtu libovolného počtu her - aniž bychom určili pořadí sčítání). Zcela jednoduše zjistíme, že hodnota Spragueovy-Grundyovy funkce (dále jen SG-hodnota) počáteční pozice těchto her je rovna počtu sirek v hromádce (Indukcí: nechť mám na hromádce n sirek a SG hodnota hry s k sirkami pro k < n je k. Z počáteční pozice se lze vhodným tahem dostat do libovolné jiné pozice, podle indukčního předpokladu jsou SG hodnoty ostatních stavů ve hře rovny počtu sirek, tedy SG-hodnoty ostatních stavů prochází podle indukčního předpokladu všechna čísla od nuly do n — 1 a z definice SG funkce je tak SG -hodnota počáteční pozice právě n. Podle věty z odstavce 12.39 je hodnota počáteční pozice v naší hře rovna součtu počátečních pozic v jednotlivých sčítaných hrách, tedy 9 e 10 e 11 e 14 = 6, protože je hodnota nenulová, existuje výherní strategie za prvního hráče: táhne vždy do stavu s hodnotou nula — podle definice SG taková pozice vždy existuje. Například první tah by byl z hromádky o čtrnácti sirkách vzít šest sirek (vybíráme z hromádky, která má SG hodnotu takovou, že na prvním místě zleva v jejím binárním zápisu, kde se vyskytuje jednička v SG hodnotě aktuální pozice, má rovněž jedničku — změníme tuto jedničku na nulu a ostatní pozice upravíme do sudé parity). □ 12.60. Uvažme následující hru dvou hráčů: na stole je jedna hromádka sirek. V tahu hráč buď odebere libovolný počet sirek z jedné libovolně vybrané hromádky, nebo nějakou hromádku rozdělí na dvě neprázdné hromádky. Hráči se střídají na tazích a kdo nemůže táhnout, prohrál. Určete SG-hodnotu počáteční pozice této hry začínající s hromádkou o n sirkách. a „lose" z pohledu prvého hráče, znak T odpovídá anglickému „tie"). Postup je tento: (1) Listy označíme buď W nebo L, případně T, podle pravidel hry (u normálního průběhu naší varianty Nim to tedy bude W pro So a L pro Fo). (2) Vrchol Fi označíme W, jestliže existuje syn, který je W. Pokud takový syn neexistuje, ale mezi syny existuje vrchol s označením T, bude i označovaný vrchol T. Ve zbývajícím případě, kdy jsou všichni synové L, bude i tento vrchol L. (3) Vrchol St označíme L, jestliže existuje syn označený L. Pokud takový syn neexistuje, ale mezi syny existuje vrchol s označením T, bude i označovaný vrchol T. Ve zbývajícím případě, kdy jsou všichni synové W, bude i tento vrchol W. Voláním této procedury na kořen stromu obdržíme ohodnocení všech vrcholů a tím také i strategii pro každého z hráčů: • První hráč se snaží v každém svém kroku přesunout do vrcholu označeném W, pokud to ale nejde, hledá alespoň T. • Druhý hráč se snaží v každém svém kroku dostat hru do vrcholu označeného L, pokud to nejde, hledá alespoň T. Hloubka rekurze je dána hloubkou stromu. Např. u našeho Nim s k sirkami je to právě k. Získaná analýza ještě není příliš užitečná. Pro její užití v uvedené formě totiž potřebujeme mít k dispozici celý strom hry a to je obecně skutečně velice mnoho dat (u minipiškvorek na hřišti 3x3 má příslušný strom jednotlivé desítky tisíc vrcholů). Zpravidla se v takovéto podobě používá analýza pomocí stromové struktury tehdy, když zkoumáme pouze malý úsek celého stromu pomocí vhodných heuristických metod a tento kousek si naopak dynamicky utváříme během hry. To je fascinující oblast moderní teorie umělé inteligence, my sejí zde ale nebudeme věnovat. Pro naše potřeby úplné formální analýzy ale umíme najít kom-bí • paktnější vyjádření stromové struktury grafu. Pokud si nakreslíme náš strom pro hru Nim, okamžitě vidíme, že se nám mnohokráte opakují pořád ty stejné situace hry v různých listech, a to podle toho, jaká byla historie hry. Ve skutečnosti jsou ale strategie určeny pouze počtem zbývajících sirek a tím, kdo je na tahu. Můžeme proto stejnou hru popsat pomocí grafu, který bude mít za vrcholy počty zbývajících sirek a celá strategie bude zadána určením, jestli v dané situaci vyhrává ten, kdo je na tahu nebo naopak ten, kdo táhl předtím. K popisu možných tahů budeme používat orientované hrany. Příklad pro naši hru Nim je na obrázku. Nalevo je úplný strom pro hru se třemi sirkami, napravo je orientovaný graf zobrazující hru se sedmi sirkami. Úplný strom pro hru se sedmi sirkami by měl již 21 listů a počet listů roste exponenciálně s počtem sirek. 744 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řešení. Indukcí dokážeme pro kladná celá k následující předpis: g(4k + 1) g(4k + 2) g(4k + 3) g(4k + 4) g(4k + 1) g(4k + 2) g(4k + 4) g(4k + 3) Zjevně g(0) = 0 (na obrázku jsme odvodili hodnotu SG funkce pro pozice s jednou hromádkou o jedné, dvou a třech sirkách; je zřejmé, že obecně bychom tuto hodnotu těžko odvozovali). Dále budeme postupovat tak, že nejprve budeme předpokládat, že uvedený předpis platí pro všechna čísla menší než 4k + 1, dokážeme, že platí i pro 4k+l. SG -hodnota dané pozice ve hře je dána podle definice jako nejmenší přirozené číslo takové, že neexistuje tah do pozice s touto SG-hodnotou. Navíc je Spragueova-Grundyho funkce touto vlastností a tím, že koncové pozice mají hodnotu nula, určena jednoznačně. Stačí tedy dokázat, že pro každé číslo / < 4k + 1 vede z dané pozice tah do pozice s SG-hodnotou / a že neexistuje tah do pozice s SG -hodnotou 4k + 1. Je zřejmé, že vedou tahy do pozic s hodnotami nižšími než 4k + 1. Všechny tyto hodnoty (i když ne popořadě) mají totiž pozice s jednou hromádkou s menším počtem sirek a do těchto pozic vede tah. Nyní ukážeme, že nelze udělat tah do pozice s SG-hodnotou 4k + 1: tahy vedoucí mimo pozice s jednou hromádkou (tam SG -hodnotu 4k + 1 nenajdeme) jsou tahy do pozic se dvěma neprázdnými hromádkami, jejichž součet sirek je 4k + l. Podíváme se na zbytky možných počtů sirek v jednotlivých hromádkách po dělení čtyřmi. Jsou dvě možnosti: v jedné hromádce je počet sirek dělitelný čtyřmi, v druhé dává zbytek jedna, nebo v jedné hromádce dává zbytek dva, ve druhé tři. V prvním případě je SG hodnota jednotlivých Orientovaný acyklický graf na pravé straně obrázku má pro každý počet sirek právě jeden vrchol a ten zároveň nese označení, zda při jeho průchodu celkově vyhraje ten, kdo je zrovna na řadě (písmeno N od „next"), nebo ten druhý (písmeno P od slova „previous"). Celkově je vněm vždy jen k+l vrcholů pro hru s k sirkami. Zároveň v sobě graf uschovává kompletní strategii: pokud z vrcholu, ve kterém se hráč nachází, vychází hrana končící ve vrcholu s označením P, hráč použije tento tah. Naopak každý acyklický orientovaný graf můžeme považovat za popis hry. Výchozími situacemi jsou v ní ty vrcholy, do kterých nevedou žádné hrany (jeden nebo více), hra končí v listech (opět jeden nebo více). Strategii hry obdržíme opět jednoduchou rekurzivně volanou procedurou (pro zjednodušení nyní uvádíme pouze případy her bez remíz): • Listy označíme písmenem P (skutečně prohrává ten, kdo je na tahu a nachází se v listu). • Vrchol grafu označíme jako N, pokud z něj vede hrana do vrcholu označeného jako P. V opačném případě označíme vrchol jako P. V našem speciálním případě hry Nim je tedy situace obzvláště jednoduchá. Z uvedené strategie vyplývá, že hráč, který je na tahu, prohrává, pokud je počet sirek dělitelný třemi, a vyhrává ve zbylých dvou případech zbytků 1 a 2. Hry, které umíme reprezentovat výše uvedeným způsobem pomocí acyklického orientovaného grafu, nazýváme nestranné. Jde právě o takové hry, ve kterých • v každé herní situaci mají oba hráči stejné možnosti tahů; • hra má konečný celkový počet herních situací; • hra má tzv. nulový součet, tj. lze její výsledek formulovat pomocí výhry jednoho (a tím prohry druhého) hráče, resp. remízy. Příkladem nestranné hry jsou např. piškvorky na předem známém rozměru použité čtverečkové sítě. Zde sice hráči používají různé symboly, podstatné aleje, že je mohou umístit do kteréhokoliv dosud neobsazeného pole. Naopak šachy nestrannou hrou v tomto smyslu nejsou, protože možné tahy jednotlivých hráčů jsou v každé situaci silně závislé od množství figurek, které ještě mají k dispozici. 12.39. Součet kombinatorických her. Klasická hra Nim se hrává poněkud složitěji. Hráči mají před sebou tři hro-mádky sirek (nebo jiných objektů), každou o daném počtu k. Ten, kdo je na řadě, může brát libovolný počet sirek, ale pouze z jedné hromádky. Při normální hře vyhrává ten, kdo bere naposled (při hře na žebráka takový hráč naopak prohrává). Pokud bychom takto hráli s jednou hromádkou, je to jednoduché. První hráč shrábne vše a druhý prohrál. Se třemi to ovšem tak snadno nepůjde. Zároveň nejspíš budeme zvědaví, zda bude znalost analýzy možností pro jednu hromádku nějak užitečná pro kombinovanou složitější hru. Zavedeme si k tomu účelu nový koncept, tzv. součet nestranných her. Věcně to bude tak, že situace ve hře kombinované ze dvou současných her budou uspořádané dvojice jednotlivých možných situací. Tahem pak rozumíme využití možného tahu v jedné z her (a druhá zůstane nezměněna). Půjde tedy o operaci, která dvěma našim acyklickým grafům přiřadí nový acyklický graf. Pro dva acyklické grafy G\ — (V\, E\) a G2 = (V2, £2) je jejich 745 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY hromádek dle indukčního předpokladu 4a — 1 a 4b (počty sirek v hromádkách jsou nenulové a menší než 4k+l, takže indukční předpoklad můžeme použít) a pokud si uvědomíme že hra se dvěma hromádkami je součtem her s jednou hromádkou, pak víme, že SG hodnota pozice se dvěma hromádkami je rovna nim-součtu SG hodnot jednotlivých hromádek v této hře. V prvním případě dostaneme nim-součtem čísel dávajících zbytek tři a nula číslo dávající zbytek tři po dělení čtyřmi (uvažte poslední dva bity čísel), obdobně pro hromádky o 4a + 2 a 4b + 3 sirkách je nim-součet jejich SG hodnot (4a + 2 a 4b + 4) dokonce sudý. V žádném případě není tvaru 4k + 1. Tím je dokázán indukční krok pro přirozená čísla tvaru 4k + 1. Pro přirozená čísla tvaru 4k + 2 je důkaz indukčního kroku naprosto analogický. Pro čísla tvaru 4k + 3 je trošičku zajímavější: SG -hodnoty pozic s jednou hromádkou, do kterých vede tah, tedy těch s menším počtem sirek, vyčerpávají podle indukčního předpokladu pouze čísla do 4k + 2. SG -hodnotu 4k + 3 má však pozice se dvěma hromádkami, jedna s jednou sirkou, druhá s 4k + 2 sirkami. Podle indukčního předpokladu jsou SG hodnoty hromádky s jednou sirkou jedna a hromádky s 4k + 2 sirkami rovny jedné a 4k + 2 a nim-součet těchto čísel je 4k + 3. Do pozice s SG -hodnotou 4k + 4 pak žádný tah nevede: v úvahu připadají pouze pozice se dvěma hromádkami o celkovém počtu 4k + 3 sirek. Možné zbytky po dělení čtyřmi počtů sirek v jednotlivých hromádkách jsou bud'0 a 3, nebo 1 a 2. Podle indukčního předpokladu jsou pak zbytky SG hodnot buď 3 a 0, nebo 1 a 2, takže SG -hodnota pozice o dvou hromádkách bude dávat vždy zbytek 3 po dělení čtyřmi, tedy nebude tvaru 4k + 4. Indukční krok je tedy dokázán i pro přirozená čísla tvaru 4k + 3. Analogicky se dokáže i pro čísla tvaru 4k + 4. □ I. Vytvořující funkce 12.61. Kolika způsoby je možné koupit 12 balíčků kávy, mají-li v prodejně kávu pěti druhů? Dále tuto úlohu řešte s následujícími modifikacemi: i) od každé kávy je třeba koupit aspoň 2 balíčky; ii) od každé kávy má být koupen sudý počet balíčků; iii) jedné z káv (např. arabské) jsou k dispozici pouze 3 balíčky. Řešení. Základní úloha je klasickým příkladem kombinatorické úlohy na kombinace pěti druhů s opakováním - odpovědí je (12^f]71) = (!46). Stejně tak i modifikace úlohy je možné s trochou invence vyřešit kombinatorickou úvahou - my zde ale ukážeme, jak tyto úlohy (takřka bez přemýšlení) vyřešit s pomocí vytvořujících funkcí. součtem Gi + G2 graf G = (V, E), kde V = V\ x V2 a E = {(v\V2, W\V2)\ (lil, W\) e E\] U {(l>ll>2, V\W2)\ (V2, W2) 6 i?2J. V případě jedné hry jsme si vystačili s postupným označováním vrcholů grafu od listů písmeny N a P podle toho, jestli je nebo není (pomocí orientovaných hran) „vidět" nějaké P. V součtu her se ovšem pohybujeme po jednotlivých hranách složitěji, budeme proto potřebovat jemnější nástroj, jak si vyjadřovat dosažitelnost vrcholů značených jako P z dalších vrcholů. Dobře k tomu poslouží tzv. Spragueova-Grundyova funkce g : V -» N, kterou definujeme na acyklickém orientovaném grafu G — (V, E) rekurzivně takto:9 (1) všechny listy v označíme g (v) = 0; (2) pro vrchol v e V definujeme g (v) = minja e N; neexistuje hrana (v, w) s g(w) = a). Při definici jsme použili funkci, které se říkává minimální vyloučená hodnota. Definujeme ji pro podmnožiny 5 přirozených čísel N = {0, 1, ...} vztahem mex 5 — min N \ 5. Naše funkce g (v) je právě mex 5 pro množinu 5 všech hodnot g(w), které jsou podél hran vidět z vrcholu v. Poznamenejme, že uvedená definice je korektní, neboť výše definovaný předpis zřejmě definuje jednoznačně funkci přiřazující každé pozici kombinatorické přirozené číslo. Na přirozených číslech budeme potřebovat ještě jednu operaci. Je to binární operace (a, b) H» a © b, kterou dostaneme tak, že vyjádříme čísla a a b ve dvojkové soustavě a vzniklé vektory a a b ve vektorovém prostoru (TLiÝ nad Z2 sečteme (k je dostatečně velké). Výsledkem je vyjádření pro a © b a to opět ve dvojkové soustavě. Sčítání vektorů ve (Z^)* je známá operace XOR na jednotlivých bitech. Nyní již můžeme zformulovat hlavní výsledek, tzv. Spragueovu-Grundyovu větu: 12.40. Věta. V orientovaném acyklickém grafu G — (V, E) je vrcholy e V pozicí P, právě když je hodnota Spragueovy-Grundyho funkce g (v) = 0. Uvažme orientované acyklické grafy Gi = (V\, E\), G2 = (V2, E2) a jejich Spragueovy-Grundyovy funkce g\, gi. Potom jejich součet G — (V, E) — G\ + G2 má Spragueovu-Grundyovu funkci g dánu vztahem g(v\V2) = gl(vi) ® g2(V2)- Důkaz. První tvrzení věty je zřejmé přímo z definice ^ rfes\\\ Spragueovy-Grundyovy funkce g. Ájl'^9f Důkaz druhé části je složitější. Nechť (v\vi) je íjLj^-jfc-, pozice hry Gi + G2 a uvažme libovolné a e No, 'li' které splňuje a < gi(i>i) © g2(v2). Ukážeme, že existuje stav x\X2 hry Gi + G2 takový, že g(x\) © g(x~i) — a a (v\V2, x\X2) e E a že zároveň pro žádnou hranu (111112, vi V2) 6 E neplatí gl(vi) ®g2(yi) = gl(ľl) ®g2(v2). Naznačujeme nyní teorii, kterou rozvinuli v tzv. kombinatorické teorii her nezávisle na sobě R. P. Sprague v roce 1935 a P. M. Grundy v roce 1939. 746 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Hledaný počet odpovídá koeficientu u x v rozvoji funkce (i + x + x2 +... ý = = (l + x + ...)(! + x + ...)■■■ (I + x + ...) do mocninné řady. Počet kávy prvního druhu udává to, který člen z první závorky použijeme do součinu, druhého druhu pak člen z druhé závorky, atd. (Všimněte si, že jsme přitom nijak zvlášť nepřemýšleli nad tím, že káv žádného druhu nemůže být více než 12 - ukazuje se, že s nekonečnými řadami se zde pracuje obvykle snáz než s konečnými polynomy.) Protože 1 l-x 1 + x + x1 + . (viz 12.42), je naší uvažovanou funkcí funkce (1 — x)~5. Úkolem je tedy rozvinout (1 — x)~5 do mocninné řady - podle zobecněné binomické věty z 12.42 je koeficientem u xk číslo í*^1)'v našem případě tedy (!46). Všimněte si, že jsme s využitím vytvořujících funkcí zodpověděli otázku nejen pro 12 káv, ale pro libovolný zadaný počet. Modifikace řešíme analogicky: i) Vytvořující funkcí je proto je koeficientu x12 roven (^j1)- ii) Sudému počtu káv všech druhů odpovídá vytvořující funkce (1 + x2 +x4 + ... )5 - 1 (l-x2)5' Koeficient u x12 lze získat různými způsoby, nejsnáze asi pomocí substituce y = x2 a hledání koeficientu u y6 (což vlastně odpovídá tomu, že v obchodě slepí balíčky po dvou k sobě), odkud dostaneme odpověď (6^~!). iii) V tomto případě je vytvořující funkce rovna (l+x + x2 +x3)(l+x+x2 + ...)4, a hledaný výsledek je tedy roven (Tr1) + (Tr1) + (Tr1) + CTr1)- □ 12.62. Kolika způsoby můžeme pomocí mincí (1, 2, 5, 10, 20 a 50 Kč) zaplatit platbu 100 Kč? Řešení. Hledáme přirozená čísla taková, že a,- je násobkem i pro všechna i e {1,2,5, 10, 20, 50} azároveňai +a2 + a5 + aw + a20 + a50 = 100. Je vidět, že požadovaný počet lze získat Tím ověříme právě rekurzivní definici Spragueovy-Grundyovy funkce a věta bude dokázána. Nejprve budeme hledat vrchol x\x2 s danou hodnotou a < gl(vl) © gl(vl) Spragueovy-Grundyovy funkce. Uvažme číslo b := a © gi(i>i) © g2(v2). Nechť binární zápis tohoto čísla má k cifer. Potom na k-tém místě (od konce) v binárním rozvoji čísla gi(i>i) © g2(v2) musí být cifra 1. Skutečně pokud mají aagi(ui)0 gl(v2) různý počet cifer, je tvrzení zřejmé, a pokud mají g\(v\) a a stejný počet cifer, tak právě jedno z čísel a a g\(v\) © g2(v2) musí mít na k-tém místě od konce cifru 1. Nemůže to být přitom číslo a, protože ve vyšších řádech si obě čísla musejí být rovna a číslo a je menší. Tedy právě jedno z čísel g\(v\) a g2(v2) má na k-tém místě cifru 1. Bez újmy na obecnosti předpokládejme, že to je g\(v\). Uvažme dále číslo c := g\(v\) © b. Toto číslo je v binárním zápisu nejvýše k — 1 ciferné, protože obě sčítaná čísla mají v k-tém řádu cifru 1. Je tedy jistě menší než g\(v\). Potom ale dle definice hodnoty funkce g\(v\) existuje stav w\ hry G\ takový, že (ni, w\) e Ei a gi(uii) = c. Nyní však (v\v2, w\v2) e E a gúm) © glM = c © g2(v2) = gi(i-i) © b © g2(v2) = = gi (yi) © a © gi (i-i) © g2(v2) ®g2(v2)=a. Tím jsme naplnili první část našeho záměru. Dále uvažme v G libovolnou hranu (111112, yiyi) 6 E, kde (i>i,yi) e Ei, a proto i>2 = y2, a předpokládejme gi(yi) © gliyi) = gi(ľi)ffig2(ľ2).Pakovšemgi(yi)ffig2(ľ2) = gi(i>i)ffi g2(ľ2) (jde o operaci ve vektorovém prostoru, můžeme tedy krátit). Pak ale také gi(yi) = gi(ľi), což je ve sporu s vlastnostmi Spragueovy-Grundyovy funkce gi hry G\. Dokázali jsme tedy i druhou část a věta j e dokázána. □ Z věty okamžitě dostáváme srozumitelný a prakticky užitečný výsledek: Důsledek. Vrchol v\v2 v součtu grafů je P-pozice, právě když gl(ľl) = g2(v2). Poznámka. V tomto textu nemůžeme jít do podrobností, obecně lze ale dokázat, že každý konečný acyklický orientovaný graf je izomorfní s konečným součtem vhodně zobecněných her Nim. Naší analýzou jednoduché hry a konstrukcí funkce g jsme tedy v podstatě (alespoň implicitně) zvládli analýzu všech nestranných her. 3. Kombinatorické výpočty 12.41. Vytvořující funkce. Docela často jsou v kombinatorických úvahách užitečné výsledky dosahované ve „spojitých metodách", tj. zejména klasické matematické analýze. Tomu můžeme rozumět i naopak - v podstatě byly všechny výsledky v analýze dosaženy vhodným přeložením problému na kombinatorickou úlohu (za příklad může sloužit třeba převedení problému integrace racionálních funkcí lomených na rozklad těchto funkcí na tzv. parciální zlomky). Není proto divu, že tyto již zvládnuté postupy můžeme dobře využívat přímo. V závěru naší procházky po aplikacích kombinatorických postupů se proto podíváme alespoň na jednu oblast, kde se nám hodí znalosti ze spojitých metod. Začněme jednoduchým příkladem: Máme v peněžence 4 korunové mince, 5 dvoukorunových a 3 pětikorunové. Z automatu, který nevrací, chceme Colu za 22 Kč. Kolika 141 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY jako koeficient ui v součinu (1 + x + x2 + . .. )(1 + x2 + x4 + . .. )(1 + x5 + xw + . . (1+^10 +Jt20+...)(1+Jt20+Jt40 .(l+^o +xm 1 1 + ...): 1 1 1 1 1 1 1 1 1 1 Konkrétní výsledek můžeme získat například s pomocí softwaru SAGE (názvy použitých příkazů jsou jistě dostatečně výmluvné): sage sage sage 4562 f=1/(1- x)*l/(l-xA2)*l/(l-xA5)\ *1/(1- xA10)*l/(l -xA20)*l/(l -xA50) r=taylor(f,x,0,100) r.coeff(x,100) □ 12.63. Rozviňte do mocninné řady funkci i) -4ô. / x+2' jj-j x2+x + l Řešení. x/2 x + 2 2 - (-x) 1 - (-x/2) _._2_ + _!_...+ = y(_i)»-i_l. 2 4 8 2" ii) Provedeme rozklad na parciálni zlomky x2 + x + 1 x2 + X + 1 C 2x3 - 3x2 + 1 (x- l)2(2x + 1) A B ~ 2x + 1 + x - 1 + (x - l)2' kdy zjistíme, žeA = S = |aC=l, proto x2 + x + 1 _ 1/3 1/3 1 2x3 + 3x2 + 1 ~ 1 +2x ~ l-x + (1 - x)2 ~ = Eľ=o l (C"2)" " !)) + (" + !) x". □ 12.64. Určete vytvořující funkci posloupností i) (1,2,3,4,5,...), ii) (1,4,9,16,...), iii) (1, 1,2,2,4,4,8,8,...), iv) (9, 0, 0, 2 • 16, 0, 0,4 • 25, 0, 0, 8 • 36,...), způsoby to umíme, aniž bychom ztratili přeplatek? Hledáme zjevně čísla i, jak taková, že i + j + k = 22 a zároveň i e {0, 1, 2, 3,4), j e {0, 2,4, 6, 8, 10), k e {0,5, 10,15). Uvažme součin polynomů (třeba nad reálnými čísly) (x° +xl +X2 +x3 +x4)(x° +x2+x4 +x6 +xH +xw)- ■(x° +x5 +xw +*15). Mělo by být zřejmé, že hledaný počet řešení je právě koeficient u x22 ve výsledném polynomu. Skutečně tak dostáváme čtyři možnosti 3-5 + 3- 2+1-1, 3-5 + 2- 2 + 3-1, 2-5 + 5- 2 + 2-1 a2-5+4-2 + 4-l. Tento prostinký příklad zasluhuje větší pozornost, než by se mohlo na první pohled zdát. Jednotlivé polynomy svými koeficienty vyjadřovaly posloupnost hodnot, kterých jsme uměli dosahovat: Jestliže budeme (pro jistotu, abychom nemuseli předem dělat odhady velikostí) pracovat s nekonečnými posloupnostmi, pak pomocí jednotlivých korun umíme dosáhnout hodnot 0, 1, 2, ... s četnostmi (1, 1, 1, 1, 1,0,0, ...) (pokračují samé nuly), u dvoukorun a pětikorun to budou posloupnosti četností (1,0, 1,0, 1,0, 1,0, 1,0, 1,0, 0, ...), (1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, ...). Ke každé takové posloupnosti s konečně mnoha nenulovými členy můžeme přiřadit polynom a shodou okolností řešení naší úlohy bylo možné odečíst ze součinu těchto polynomů. Takový postup můžeme používat obecně pro práci s posloupnostmi, když nahradíme polynomy mocninnými řadami. Definice. Vytvořující funkce (v.f.p.) pro nekonečnou posloupnost a = (ao, a\, a^, ...) je (formální) mocninná řada a(x) = ao + a\x + ajx + • i=0 Vytvořující funkce v praxi využíváme: • k nalezení explicitní formule pro n-tý člen posloupnosti; • často vytvořující funkce vycházejí z rekurentních vztahů, občas ale díky nim odvodíme rekurentní vztahy nové; • výpočet průměrů či jiných statistických závislostí (např. průměrná složitost algoritmu); • důkaz různých identit; • často je nalezení přesného vztahu příliš obtížné, ale mnohdy stačí vztah přibližný nebo alespoň asymptotické chování. Některým jednoduchým operacím s posloupnostmi odpovídají jednoduché operace nad mocninnými řadami (jak se snadno přesvědčíme provedením příslušné operace s mocninnými řadami): • Sčítání (a, + £>,) posloupností člen po členu odpovídá součet a(x) + b(x) příslušných vytvořujících funkcí. • Vynásobení (a ■ a,-) všech členů posloupnosti stejným skalárem a odpovídá vynásobení a ■ a (x) příslušné vytvořující funkce. • Vynásobení vytvořující funkce a(x) monomem xk odpovídá posunutí posloupnosti doprava o k míst a její doplnění nulami zleva. 748 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY v) (9, 1, -9, 32,1, -32,100, 1, -100, O 12.65. Určete kolika způsoby je možné naplnit tašku n kusy uvedených druhů ovoce, přičemž jednotlivé kusy téhož druhu nerozlišujeme, nemusí být využity všechny druhy a navíc: • jablek může být libovolný počet, • banánů musí být sudý počet, • hrušek musí být násobek 4, • pomeranče mohou být nejvýše 3 a • pomelo může být pouze jedno (nebo žádné). Řešení. Vytvořující funkcí pro posloupnost (an), kde an je hledaný počet způsobů, jak naplnit tašku n kusy ovoce, je (1 + x + x2 + • • • )(1 + x2 + x4 ■ ■ ■ )(1 + / + xg + ■ ■ ■ )■ • (1 +x + X2 + x3)(l+x) = 1 1 1 1 - X4 ■(l+x) = l-x l-x2 l-ŕ 1 1 (l-x)3 ibecněné pro hledaný počet způsobů platí an = ("^2) Podle zobecněné binomické věty je (1 — x) 3 = J2^=0 i"^2)*", proto □ • Pro posunutí posloupnosti doleva o k míst (tj. vynechání prvních k míst posloupnosti) nejprve od a (x) odečteme polynom bk(x) odpovídající posloupnosti (ao, ..., au, 0,...) a poté podělíme vytvořující funkci výrazem xk. • Dosazením polynomu f(x) za x vytvoříme specifické kombinace členů původní posloupnosti. Jednoduše je vyjádříme pro f(x) = ax, což odpovídá vynásobení k-tého členu posloupnosti skalárem ak. Dosazení f(x) — x" nám do posloupnosti mezi každé dva členy vloží n — 1 nul. První dvě pravidla říkají, že přiřazení vytvořující funkce posloupnosti je homomorfismus vektorových prostorů nad zvoleným tělesem. Dalšími důležitými operacemi, které se při práci s vytvořujícími funkcemi často objevují, jsou: • Derivování podle x: funkce a'(x) vytvořuje posloupnost (a\, 2a2, 3íZ3, ...), člen s indexem k je (k + l)a/t+i (tj. mocninnou řadu derivujeme člen po členu). • Integrování: funkce fQx a (i) dt vytvořuje posloupnost (0, ao, \a\, \ai, \a^, ...), pro k > 1 je člen s indexem k roven jízu (zřejmě je derivací příslušné mocninné řady člen po členu původní funkce a (x)). • Násobení řad: součin a(x)b(x) je vytvořující funkcí posloupnosti (co, cj, t'2, ...), kde Ck = aibj, i+j=k tj. členy v součinu až po jsou stejné jako v součinu (ao + a\x + a2X2 + • • • + atx1)^ + b\x + b2X2 + • • -bkxk). Posloupnost (c„) bývá také nazývána konvolucí posloupností (an), (bn). 12.42. Příklady vytvořujících funkcí. Uvedeme několik jednoduchých příkladů vytvořujících funkcí. Radu z nich jsme viděli při práci s mocninnými řadami ve třetí části šesté kapitoly. Snad si všichni vzpomenou na vytvořující funkci zadanou geometrickou řadou: a(x) = 1 1 -x = l+x+xl 12.66. S využitím binomické věty znovu odvodte níže uvedené kombinatorické vztahy. • ELo© = 2", • ELo(-DiC) = o, • ELoM3 = "2-1. Řešení. Dosadíme-li do binomické věty která tedy odpovídá konstantní posloupnosti (1, 1, 1, ...). Ze šesté kapitoly víme, že stejně zapsaná mocninná řada konverguje pro x e (—1, 1) a její součet je roven funkci 1/(1 — x). Stejně tak obráceně, rozvineme-li tuto funkci do Taylorovy řady v bodě 0, dostaneme zřejmě původní řadu. Takovéto „zakódování" posloupnosti čísel do funkce a zpět je klíčovým obratem v teorii vytvořujících funkcí. Obecně pro každou posloupnost a, s členy velikosti \a„\ = 0(nk) s konstantním exponentem k konverguje její vytvořující funkce na nějakém okolí nuly (viz 5.51 a 6.45). Můžeme s nimi pak opravdu na konvergenčním intervalu zacházet jako s funkcemi, zejména je umíme sčítat, násobit, skládat, derivovat a integrovat. 749 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY čísla x = 1, resp. x = — 1, dostaneme první dvě identity. Třetí pak získáme, když se na obě strany v binomické větě podíváme „spojitýma očima" a využijeme vlastnosti derivací. □ 12.67. V krabici je 30 červených, 40 modrých a 50 bílých míčků, míčky stejné barvy přitom nelze rozeznat. Kolika způsoby je možné vybrat soubor 70 míčků? Řešení. Hledaný počet je roven koeficientu u x10 v součinu (1+x+x2 +■■ ■+x30)(l+x+x2 +■■ ■+x40)(l+x+x2 +■■ -+X50). Tento součin upravíme na tvar (1 — x)~3(l — x31 )(1 — xAl )(1 — x51), odkud pomocí zobecněné binomické věty dostaneme D+(2>+(2y+--->i-^-/i-^i^72+---) □ a tedy koeficientem u x10 je zřejmě (70+2) - (70+2T31) - (70+2T41) - (™+2-51) = 1061. 12.68. Dokažte, že n Y^Hk = {n + l)(Hn+l-l). Řešení. Potřebnou konvoluci získáme součinem řad -r— a -r— ln -r—. i—x i—x i—x Odtud n [^](IJ^lnrL = ^i(n + l-fc), k=\ odkud již snadnou úpravou dostaneme požadované. □ 12.69. Vyřešte rekurenci ao = a\ = \, a„ = fl„-i + 2a„_2 + (-!)"• Řešení. Jako vždy neuškodí vypsání prvních několika členů posloupnosti (teď ale ani moc nepomůže, snad jen pro kontrolu správnosti výsledku).1 Krok 1: Krok 2: Krok 3: an = a„_i + 2fl„_2 + (-l)"[n > 0] + [n = 1]. A(x) = xA(x) + 2x2A(x) + j^+x. 1+x + x2 A(x). (l-2x)(l+x)2 Krok 4: an = \2n + {\n + f) (-1)". □ 'Na rozdíl od tvrzení v Concrete mathematics je již možné tuto posloupnost nalézt v The On-Line Encyclopedia oj Integer Sequences. Uvedme nyní několik základních mocninných řad a jejich součtů, s nimiž budeme velmi často pracovat: 1 -x ^ m-^ = £-. 1 -x sin* = ^(-1)" (2n + l)! ^ (2n)!' řl>U a+*>r=e(*K- Poslední vzorec (1 + x)r = 2~2k>0 O^Je tzv- zobecněná bino- mická věta, kde pro r e R je binomický koeficient definován vztahem (r\ _ r(r -X)(r-2)---(r -k+X) \k) ~ k\ Speciálně klademe (q) = 1. Pro n e N z uvedeného vztahu snadno dostaneme, že funkci (iJjyi lze rozvinout do řady xk /0 + n-l\ /l+n-l\ //fc + «-l\ ( „-1 ) + ( „-1 > + - + ( „_! J Tento vztah bude dále rovněž užitečný, protože často vyvstane potřeba rozvíjet do mocninných řad právě racionální funkce tohoto tvaru (např. při rozkladu na parciální zlomky v případě, kdy má jmenovatel násobné kořeny). Příklad. Ukažme si důležitý příklad využívající konvoluci posloupností: 1 --a(x) jev.f.p. (ao,ao+ai,ao+ai+a2, ...). 1 — x Odtud např. dostáváme, že 1 1 -ln- je v.f.p. harmonických čísel Hn. 1 — x 1 — x Protože yrj = lľn>0 ' dostáváme konvoluci posloupnosti (1, 1, ...) se sebou vztahy * =£(řl + iK, i (i-xY (1-xÝ *-<\ 2 ři>U ____n v n+ 2 x", což je vztah, který sice máme dokázán již z dřívějška (dokonce dvakrát - jednou díky zobecněné binomické větě a podruhé díky derivaci řady), ale další odvození jistě neuškodilo. 12.43. Diferenční rovnice s konstantními koeficienty. Hezkým a poučným příkladem na užití vytvořujících funkcí je úplná diskuse řešení lineárních diferenčních rovnic s konstantními koeficienty. Zabývali jsme se jimi již v třetí části první kapitoly, viz např. 1.12. Tam jsme ale přímo odvodili vzorec pro rovnice prvního řádu, odůvodnili jednoznačnost a existenci řešení, ale řešení 750 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 12.70. Quicksort - analýza průměrného případu. Naším cílem bude nyní určit očekávaný počet porovnání během algoritmu Quicksort pro seřazení nějaké (konečné) posloupnosti prvků. Ukázka jednoduché implementace typu divide and conquer. if L == []: return [] return qsort([x for X in L[l:] if x=L[0]]) Sestavit rekurentní vztah pro počet porovnání není příliš náročné (budeme předpokládat rovnoměrné rozdělení pravděpodobnosti všech možných pořadí dané posloupnosti), algoritmus má následující parametry: i) Počet porovnání při rozdělení (divide): n — 1. ii) Předpoklad náhodnosti: pravděpodobnost toho, že prvek L[0] je k-tý největší, je K iii) Velikost tříděných polí ve fázi conquer. k — 1 a n — k. Pro střední hodnotu počtu porovnání tak dostáváme rekurentní vztah: C„ = n - 1 + y - (Ck-\ + C„-k). Tuto rekurenci je možné vyřešit (s použitím jistých triků, které se však lze do jisté míry naučit) i bez využití vytvořujících funkcí. 2 " C„ = n — 1 -\— > Cfc_i symetrie obou sum n nCn = n(n — 1) + 2 Ck-\ vynásob n k=\ n-\ (n — l)C„_i = (n — l)(n — 2) + 2 ^ Ck-\ tentýž výraz pro C„-\ k=\ nCn = (n + l)C„_i + 2(n — 1) odečteno a upraveno Tím jsme již dostali podstatně jednodušší rekurenci nCn = (n + í)Cn^+2(n-í), která ovšem na rozdíl od většiny předchozích příkladů není rovnicí s konstantními koeficienty. Rovněž si lze všimnout, že jsme již rekurenci zjednodušili natolik, že je možné iterativně hodnoty C„ dopočítat. Přesto je často žádoucí tyto hodnoty konkrétně (nebo alespoň přibližně) vyjádřit explicitně jako funkci n. Nejprve si pomůžeme drobným trikem, kdy vydělíme obě strany výrazem n(n + 1) : C„ C„_i 2(n - 1) samo jsme pak v podstatě „uhádli". Nyní můžeme řešení skutečně odvodit. Zkusme nejprve dobře známý příklad Fibonacciovy posloupnosti zadané rekurenci Fn+2 = Fn + Fn+U F0 = 0, Fi = l a pišme F(x) pro vytvořující funkci této posloupnosti. Definiční rovnost můžeme vyjádřit pomocí F(x), když použijeme naše operace pro posuv členů posloupnosti. Víme totiž, že xF(x) odpovídá posloupnosti (0, Fo, F\, F2, ■ ■ ■ ) a x2F(x) posloupnosti (0, 0, Fo, F\, ...). Proto vytvořující funkce xF(x) + x2 F(x) — F(x) odpovídá posloupnosti (-F0,F0-Fi,0,0, ...,0, ...). Obdrželi jsme tedy rovnici pro vytvořující funkci F (x): (1 - x-x2)F(x) =x. Abychom lépe viděli odpovídající posloupnost, můžeme ještě výsledný výraz upravit na součet jednodušších. Víme totiž, že lineární kombinace vytvořujících funkcí odpovídá stejným kombinacím posloupností. Racionální funkce lomené jsme se naučili rozkládat na tzv. parciální zlomky, viz 6.23. Tímto postupem vyjádříme x A B F(x) = 1 X — X\ X — X2 1 — k\x 1 — k2X kde A, B jsou vhodné (obecně) komplexní konstanty a x\, x2 jsou kořeny polynomu ve jmenovateli. Konstanty a, b, X\ a X2 získáme jednoduchou úpravou jednotlivých zlomků. Výsledkem je obecné řešení pro naši vytvořující funkci F(x) = Y^(a^i + btyx" a tím i obecné řešení naší rekurence. Srovnejte tento postup s výsledkem v 3.10. Pro obecné lineární diferenční rovnice řádu k je účinný stejný postup. Je-li F„+k = a0Fn H-----\-ak-iF„+k-i, pak vytvořující funkce pro výslednou posloupnost je F« = T- i-l 1 — aoxK 1 — ••• — cik-\x Rozkladem na parciální zlomky dostaneme obecný výsledek, který jsme zmiňovali již v odstavci 3.12. Mocninné řady jsou velmi silným nástrojem pro řešení rekurenci. Tím je míněno vyjádření členu an jako funkci n. Často se s pomocí řad podaří vyřešit na první pohled velmi složité rekurence. ___| Postup pro řešení rekurenci j_—-- n + 1 n n(n + 1) Obvyklý (takřka mechanický) postup pro řešení rekurenci se skládá ze 4 kroků: (1) Zapíšeme jedinou rovnicí závislost an na ostatních členech posloupnosti. Tato univerzální formule musí platit pro všechna n e No (předpokládajíce a-1 = a_2 = • • • = 0). 751 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Nyní tento vztah „rozbalíme" (telescope, příp. si pomůžeme substitucí Bn = Cn/(n + 1)): Cn 2(n - 1) 2(n - 2) 2-1 C\ —— = —-- + —-- +----h--h —. n + 1 n(n + l) (n - l)n 2-3 2 Odtud i?i _ 2 _ n + l~ £~!(k + l)(k + 2) Výraz sečteme např. pomocí rozkladu na parciální zlomky -rh — 7TT a dostaneme (k+i)(k+2) — k+2 k+l C n + 1 2[Hn+l-2 + n + 1 odkud Cn = 2(n + l)Hn+1 - 4(n + 1) + 2 (H„ = Yľk=\ \ Je součet prvních n členů harmonické řady). Přitom je možné odhadnout H„ ~ /" ^ + )/, odkud C„ ~ 2(« + l)(ln(« + 1) + y - 2) + 2. Vyřešme nyní rekurenci pro očekávaný počet porovnání v průběhu algoritmu Quicksort n nCn = n (n — 1) + 2^Cn, Co = Ci = 0 k=\ pomocí uvedeného postupu. • E„>o"c>.*" = E„>o"(" - !K +2E„>oELict-iJC" •*C'« = ^ + 2fM • Vyřešením této lineární diferenciální rovnice prvního řádu (vynásobíme integračním faktorem J l~x ^ = (1 — x)2, odkud [(1 - x)2C(x)]' = j^) dostaneme C(x) ln- 1 (2) Obě strany rovnice vynásobíme x" a sečteme přes všechna n e No- Na jedné straně tak dostaneme JZ„ anx", což je vytvořující funkce A(x). Pravou stranu vztahuje pak třeba upravit na výraz rovněž obsahující A(x). (3) Zjištěná rovnice se vyřeší vzhledem k A(x). (4) Výsledné A(x) se rozvine do mocninné řady, přičemž koeficient u x" udává a„, tj. an = [xn ]A(x) . (1 - x)2 \ l-x odkud konečně C„ = 2(n + l)(Hn+\ — 1) — 2n. 12.71. S využitím vytvořující funkce pro Fibonacciho posloupnost F(x) = x/(l — x — x2) určete vytvořující funkci „poloviční" Fibonacciho posloupnosti (F0, F2, F4,...). O Příklad. Vyřešme uvedeným postupem rekurenci ao = 0, a\ = 1, an — 5a„_i - 6a„_2- Řešení. V jednotlivých krocích postupu dostáváme: Krok 1: Krok 2: Krok 3: an — 5a„_i - 6a„_2 + [n — 1]-A(x) = 5xA(x) - 6x2 A(x) + x. A(x): Krok 4: an ■ 1 1 1 - 5x + 6x2 l-3x l-2x ■-3" - 2". □ 12.44. Pěstované binární stromy a Catalanova čísla. S vyu-.áľ ., žitím vytvořujících funkcí určíme formuli pro počet bn neizomorfních pěstovaných binárních stromů na n vrcholech, které je pro naše účely možné definovat jako kořen s uspořádanou dvojicí [levý binární podstrom, pravý binární podstrom] . Prozkoumáním případů pro malá n vidíme, že b0 = l,bi = l,b2 = 2,b3 =5. Snadno nahlédneme, že pro n > 1 vyhovuje bn rekurentní formuli K = bob„-i + bib„-2 H-----h b„-ibo a vidíme, že jde vlastně o konvoluci posloupností. Vztah upravíme, aby platil pro všechna n e No: = E 1 0sk 1 platí rekurence2 vn = v„-i +^vk + 1, v0=0. k=0 Pro nějakou kostru vějíře řádu n označme k e {1,n — ljnejvětší takové, že v kostře leží všechny hrany cesty (0,1, 2, 3,..., k). V takové kostře určitě nemohou být hrany {0, 2},..., {0, k], {k, k+1], proto je všech takových koster s daným k stejně jako koster na vějíři řádu n — k s vrcholy 0, k+1, k+2,..., n, tedy v„-t. Dále ještě musíme započítat jednu kostru pro k = n a ty kostry, v nichž neleží hrana {0, 1} (a tedy nutně obsahují hranu {1,2}) - ty dostaneme z vějířů řádu n — 1 na vrcholech 0,2,... ,n. Dostali jsme tedy skutečně požadovanou reku- renci v„ = u„_i + u„_i + u„_2 H-----h "o + 1- Nyní tedy máme obecný vztah n-l vn = v„-i + ^2 vk + 1 - [« = 0], k=0 odkud pro vytvořující funkci V(x) této posloupnosti dostáváme obvyklým postupem oo ^ V(x) =x-V(x) + J2J2 Vkjŕ + Y^~x ~ 1 = ři=0 kk \i=0 / n>k 1 X / °° \ I x—\ / Y X X X X Řešením rovnice V(x) = xV(x) + -^V(x) + je x V(x) l-3x+x2' odkud buď standardním postupem (přes rozklad této racionální funkce na parciální zlomky) nebo s využitím předchozí úlohy přímo dostaneme, že v„ = F2„. □ Rekurzivně propojené posloupnosti. Někdy dokážeme rozumně vyjádřit hledaný počet způsobů či jevů jen pomocí více vzájemně provázaných posloupností. 2Pokud bychom z tohoto rekurentního vztahu počítali dále numerické hodnoty vn, zjistili bychom, že 1)3 = 8,1)4 = 21 a mohli bychom vyslovit hypotézu o provázanosti této posloupnosti s Fibonacciovou posloupností ve tvaru vn = F2„, kterou je možné snadno dokázat indukcí. V kroku 3 řešíme kvadratickou rovnici B(x) = xB(x)1 + 1 pro B(x) : B{x) = 1 ± VI - 4x 2x ' Znaménko + ale nepřichází v úvahu, protože pak by pro x -» 0+ měla B(x) limitu 00, zatímco vytvořující funkce pro naši posloupnost musí mít v 0 hodnotu bo = 1. Zbývá už pouze krok 4, tedy rozvinout B(x) do mocninné řady. Rozvoj získáme pomocí zobecněné binomické věty (l-4*)1/2 = 1/2 k (-4x)k = 1 - a po vydělení 1 — ~J\—4x výrazem 2x dostaneme B(x) ■ (-4xf _y^/-l/2\(-4*)" YÍ2") X" -M n ) n + 1 £-An)n + l řl>U řl>U Dokázali jsme, že počet binárních pěstovaných stromů na n vrcholech je roven b„ = (2™) - tato významná posloupnost se nazývá posloupnost Catalanových čísel. Kromě toho, že Catala-nova čísla vyjadřují počet binárních pěstovaných stromů, vystupují rovněž jako: • počet slov délky 2n obsahujících n znaků X a Y takových, že žádný prefix slova neobsahuje více Y než X • podobně takové fronty u pokladny (5koruny a lOkoruny), že nezásobená pokladna může vždy vrátit (zároveň odtud ihned dostaneme pravděpodobnost, že náhodná fronta celá „projde") • počet korektně ozávorkovaných výrazů složených z levých a pravých závorek • počet monotónních cestz [0, 0] do [n, n] podél stran jednotkových čtverců, které nepřekročí diagonálu • počet různých triangulací konvexního (n + 2)-úhelníku. 12.45. Exponenciální vytvořující funkce. Někdy mívá vytvořující funkce posloupnosti (a„) komplikované vlastnosti, přičemž posloupnost (a„/nl) má vytvořující funkci daleko jednodušší. V takových případech raději pracujeme s tzv. exponenciálními vytvořujícími funkcemi (e.v.f.) A(X): X" n>0 Jméno vychází z toho, že vytvořující funkcí základní posloupnosti (1, 1, 1,1,...) je e*. Základními rozvoji používanými v souvislosti s exponenciálními vytvořujícími funkcemi jsou ex (1,1,1,...), In 1 -x 1 e.vf. 1 -x (1, 1,2, 6,24, ...) (0, 1, 1,2, 6,24, ...) 753 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 12.73. Určete, kolika způsoby lze pokrýt (nerozlíšenými) kostkami domina obdélník 3 x n (a vyčíslete tuto hodnotu pro obdélník 3 x 20)? Řešení. Snadno zjistíme, že c\ = 0, c2 = 3, c3 = 0, dále klademe co = 1 (nejde jen o konvenci, má to svou logiku). Najdeme rekurzivní vztah - diskusí chování „na kraji" zjistíme, že c„ = 2r„_! + c„_2, rn = cn_x + r„_2, r0 = 0, n = 1, kde rn je počet pokrytí obdélníku 3 x n, ze kterého jsme odstranili levý horní roh. Hodnoty c„ a rn pro několik malých n jsou: n 0 1 2 3 4 5 6 7 Cn 1 0 3 0 11 0 41 0 rn 0 1 0 4 0 15 0 56 • Krok 1: c„ = 2r„_ 1 +C„- -2 + In = 0], rn Cn-l + r„-2- • Krok 2: C(x) = 2xR (x) + x2 C(x) + 1, R(x) = xC(x) + x2R(x). • Krok 3: 1 — X2 r C(x) = -z-j, R(x) 1 - 4x2 + x4 ' 1 - 4x2 + x4 ' • Krok 4: Vidíme, že obě funkce jsou funkcemi x2, ušetříme si práci tím, že uvážíme funkci D(z) = 1/(1 — 4z + z2), pak totiž C(x) = (1 - x2)D(x2),t). [x2n]C(x) = [x2"^ -— x2)D(x2) = [x"](l — x)D(x), atedy c2n = dn — dn_\. Kořeny 1 — 4x + x2 jsou 2 + a 2 — a již standardním způsobem obdržíme _ (2 + V3)" | (2 - V3)" C2" ~ 3 - VŠ 3 + VŠ Podobně jako u Fibonacciho posloupnosti je druhý sčítanec pro velká n zanedbatelný a pro všechna n leží mezi 0 a 1, proto "(2 +V3)"" V3 Např. c20 = 413403. □ 12.74. Pomocí vytvořující funkce určete počet jedniček v náhodném binárním řetězci. Řešení. Označme B množinu řetězců, pro řetězec b e B \b\ počet jeho bitů a j(b) počet jedniček. Vytvořující funkce má tvar •'€s n>0 >očet jedniček je C(x) = J2j(bWbl- beB n>0 Vytvořující funkce pro počet jedniček je 2x 12.46. Operace s exponenciálními vytvořujícími funkcemi. Zdůrazněme, že exponenciální vytvořující funkce se od obyčejných Uší i standardními operacemi. • Vynásobením x získáme funkci posloupnosti (na„-i). • Derivací získáme funkci odpovídající posunutí doleva. • Integrací získáme funkci odpovídající posunutí doprava. • Součinem dvou funkcí F(x) a G(x) získáme funkci H(x), která odpovídá posloupnosti hn — ^k (nk)fkgn-k, tzv. binomické konvoluci f„ ag„. Příklad. Řešme rekurenci danou vztahy go = 0, g\ — 1 a předpisem gn = -2ng„_l +y~]("\gkgn-k- kToKkJ Řešení. Vzhledem k rekurentnímu vztahu, který obsahuje binomickou konvoluci posloupností, se zdá vhodné využít exponenciálních vytvořujících funkcí. Označme G (x) příslušnou exponenciální mocninnou řadu. Budeme postupovat v obvyklých čtyřech krocích. Krok 1: g„ = -2ngn_\ + J2k>0 il)gkgn-k + [n = l]. Krok 2: G(x) = -2xG (x) + G(x)2 + x. Krok 3: Řešením kvadratické rovnice dostaneme G(x) = 1/2(1 +2x ±-v/l +4x2). Dosazením x — 0 vidíme, že odpovídá znaménko —, proto je řešením funkce 1 + 2x - Vl +4x2 G(x) =---. Krok 4: Pomocí zobecněné binomické věty rozvineme G(x) do mocninné řady. S využitím dříve dokázaného vztahu a protože (TM4)'(ľ) \ k ) 2k'\k-l postupně dostaneme Odtud, protože platí l+2x- Vl +4x2 máme g2i+l = 0a glk = (-1)* 1 Í2k - 2\ k\k- 1)' (2k)\ = (-l)k ■ (2k)\■ Ck-i, kde C„ je n-té Catalanovo číslo. □ 12.47. Cayleyho formule. Cayleyho formule j e vztah z kombinatorické teorie grafů, který udává, že počet stromů (tj. grafů, v nichž jsou libovolné dva vrcholy spojené právě jednou cestou) na n vrcholech je ic(K„) — n"~2. Dokážeme tento výsledek pomocí exponenciálních vytvořujících funkcí. Označme pro jednoduchost t„ — k(K„). Lze snadno spočítat, že t\ — *2 — 1, *3 — 3, *4 — 16. (Např. víme, že v případě stromů na 4 vrcholech musíme z (3) — 20 potenciálních grafů s právě 754 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řetězec b dostaneme z o jeden bit kratšího b' přidáním jedné nuly nebo jedničky, tj. j (b) je součtem j (b') jedniček a j(b')+l jedniček. Takže b'aB b'aB b'aB = X B (x) + 2xC(x). Odtud C(x). x(l - 2x)- (1 - 2xf a n-tý koeficient je cn = 2™~1(n~2) = n2n^. Toto číslo udává počet jedniček v bitech délky n. Těch je b„ = 2". V jednom řetězci je tedy Y = \ jedniček. To je samozřejmě očekávaný výsledek. □ 12.75. Najděte vytvořující funkci a explicitní vyjádření pro n-tý člen posloupnosti {a„} definované rekurentním vztahem flo = 1, fli = 2 a„ = 4a„_i — 3a„_2 + 1 pro n > 2. třemi hranami odebrat ty možnosti, kde tyto hrany tvoři trojúhelník. Těch je ale (3) — 4). Rekurentní vztah získáme tak, že zafixujeme jeden vrchol v a možné případy rozdělíme podle počtu komponent v grafu, který dostaneme z koster Kn tak, že odstraníme vrchol v a hrany s ním incidentní. Pak pro n > 1 platí řn=E0^+ ? 1Gi,"~!Jfci""*,B"íii""ft"- m>U k\-\-----Ykm=n — 1 Například pro n — 4 tak máme r4 = 3*3 + 6ři *2 + žj. Ošklivě vypadající rekurenci zjednodušíme substitucí u„ — nt„ (uvědomte si přitom, že u„ udává počet tzv. kořenových stromů). Pro n > 1 jsme tak dostali Un ^ 1 -ST^ Ukt Ukm m>U k\-\-----Ykm=n — 1 a je vidět, že vnitřní suma je koeficient u jť1 ~~1 v m-té mocnině řady í/(jí) = Proto je n i *—' m i Řešení. Univerzální formule platná pro všechna n e Z je a„ = 4fl„_! - 3a„_2 + 1 - 3[n = 1]. Vynásobením x" a sečtením přes všechna n dostaneme rovnici pro vy- oo tvořující funkci A(x) = Y . ze které vyjádříme A(x) 3x2 - 3x +1 3 1 1 1 3 1 (1 - x)2(l - 3x) 4 1-x 2 (1-x)2 4 l-3x Takže člen u x" je fl- = i(-1)t("B1)-5(-1)"("B2) + i(-3)"(»1 3 1 3 - - -(n + 1) + -3" = rf1'2"^3" 4 2 4 4 □ 12.76. Pomocí vytvořující funkce vyřešte následující rekurenci: flo = 1, fli = 2 a„ = 5a„_i - 4fl„_2 n > 2 Řešení. Univerzální formule má tvar an = 5a„_i - 4fl„_2 - 3[n = 1] + [n = 0] Vynásobením obou stran x™ a sečtením přes všechna n dostaneme A(x) = 5xA(x) - 4x2A(x) - 3x + 1 Odtud A(x) 1 - 3x 2 111 (1-4x)(l-x) 3 1-x 3 1-4* 2/ n 2. 4"+2 «» = i(;) + i(;)(-4)" = ^- □ a tedy f7(x) = x e0(x) . Pro dokončení výpočtu budeme potřebovat silnější tvrzení, které uvedeme bez důkazu. Tzv. zobecněnou exponenciální mocninnou řadou £t (x) nazýváme řadu £<(*) = zJ^ + i)^1 k\' Snadno je vidět, že £o = e*, dále označujeme £(x) — £\ (x). Tvrzení. Pro zobecněnou exponenciální řadu platí ln £t (x) — x ■ £t(x), tj. speciálně £(x) = el£(l) . Srovnáním tohoto vztahu s výše uvedeným U(x) — x eu^ vidíme, že U (x) = x£(x). Proto t n — ~— — -[x"]U(x) = (h - l)!^"1]^) = n"-2. n n 12.48. Alternativní závěr výpočtu. Pokud vám přišel předchozí závěr výpočtu příliš umělý, zkusme to ještě jednou s využitím tzv. Lagrangeovy inverzní formule. Věta. Pokud vytvořující funkce g(x) — VJ„>i gnX™ splňuje vztah x = f(g(x)), kde f (0) = 0, f'(0)^0, pak gn = 1 „ 1 / u n \f(u) Řešíme rovnici U(x) — x eu^J\ tj. U(x) splňuje vztah x — f(U(x)), kde f(u) = pr. Odtud z Lagrangeovy formule [x"]U(.x) =-[u"-1] — =---7-7 = — n \u/e") n (n — 1)! n\ Protože — [x™ ]U(x), dostáváme odtud tn = ,Jř = n"-2. 755 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 12.77. Bankomat vydává bankovky v hodnotě 200, 500 a 1 000 korun. Kolika způsoby mohu vybrat 7 000 korun? Ukažte řešení pomocí vytvořující funkce. Řešení. Úlohu můžeme přeformulovat jako hledání počtu celočíselných řešení 2a + 5b + 10c = 70; a,b,c>0. To je také rovno koeficientu u x10 v funkce G(x) = (1 +x2 + /+••• )(1 +X5 +xw +■■ ■ )(1 +xw +x20 + ■■■) Tato funkce je rovna 1 1 1 G(x) 1 - x2 1 - x5 1 - xm a protože 1 ~ * = 1 + x5 a 1 ~ * = 1 + x2 + x4 + x6 + x&, 1 — x* 1 — X1 můžeme ji upravit do tvaru ^ N (l+X2 +X4 +X6 +ŕ)(l+ŕ) G« = -7J-^p-• Podle binomické věty máme proto je G(x) rovna (1 +x2 +x4 +x5 +x6 +xl +r +x9 +XU +x13} T(-l)k(~3)xm k=o V fe ' Mocninu x10 dostaneme jediným způsobem a to jako 7-10 + 0, tj. koeficient u x10 je roven [*™]G(*) = -(-3) = (3+^) = ^ = 36. □ 756 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY J. Doplňující příklady k celé kapitole 12.78. Určete, kolik hran musíme přidat do i) kružnice C„on vrcholech, ii) úplného bipartitního grafu Km * (1 X )(1 X ) Řešení. (l+x)(l+x+- ■ -+xw)(x6+x7+.. . )(xg+x9+. . . ) (1 - x)A Zajímá nás tedy koeficient ui11 ve (1 — x2 — xu ...) • tj^ji, tím je (j4) — (12) — (33). □ 12.96. Vyjádřete obecný člen posloupností určených následujícími rekurencemi: i) a\ = 3, fl2 = 5, an+2 = Aan+\ — 3an pro n = 1, 2, 3 .... ii) flo = 0,fli = 1, an+2 = 2an+i — 4an pro n = 0, 1, 2, 3 .... O Řešení. i) an=2 + 3"-\ ii) an = \V-3~ ■ ((1 + V-3T - (1 - V^)"). 2^ □ 12.97. Řešte rekurenci, kde v posloupnosti (a0, a\, a2,...) je následující člen aritmetickým průměrem předchozích dvou. O Řešení. a„ = k (—5)" + l. □ 12.98. Řešte rekurenci an+2 = Jan+\an s počátečními podmínkami ao = 2, a\ = 8. Nápověda: Utvořte novou posloupnost bn = log2 a„. Q 12.99. Vyřešíme rekurenci danou vztahem [k ¥'a° = L Nápověda: Vynásobte obě strany ^7 a sečtěte. Přitom A(X) je exponenciální vytvořující funkce posloupnosti (a„). O 12.100. Spočtěte počet triangulací konvexního ri-úhelníku. Nápověda: Vyberme libovolnou úhlopříčku jdoucí pevným vrcholem. Ta nám mnohoúhelnk rozdělí na dva. O Řešení. /„ = C„_2, kde C„ značí Catalanovo číslo. □ 12.101. Určete počet procházek ve čtvercové síti o rozměrech n x n z levého dolního rohu A do pravého horního rohu B, které vedou pouze doprava a nahoru takových, že mají právě jeden bod na diagonále A B (nepočítaje A a B). Nápověda: Catalanova čísla. O 12.102. Dokažte, že pro Fibonacciho čísla platí: 1) F2 + F4 + ■ ■ ■ + F2n = F2n+i - 1 ii) Fi + F3 H-----h F2n-i = F2n 760 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY O 12.103. Označme Hn minimální počet kroků potřebných k přemístění věže o n kotoučích z jednoho kolíku na druhý u hlavolamu Hanojská věž. Odvodte rekurentní formuli pro výpočet Hn a určete její obecné řešení. O Řešení. Hn+l = 2Hn + l,Hn=2n- 1. □ 761 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY A na závěr knihy jeden příklad z praxe. 12.104. Volejbalový tým (s liberem, tj. celkem sedm osob) sedí po zápase v hospodě a popíjí zasloužené pivo. Hospodský má k dispozici pouze sedm kríglů.4 Jaká je pravděpodobnost, že příště i) právě jeden volejbalista nebude pít ze stejného kríglu, ii) nikdo nebude pít ze stejného kríglu, iii) právě tři budou pít ze stejného kríglu. Řešení. i) Pokud šest lidí dostane ten svůj, tak zákonitě i ten sedmý, pravděpodobnost je tedy nulová. ii) Nechť M je množina všech pořadí sedmi hráčů a jev A, je pořadí, kdy i-tý hráč dostane svůj krígl. Chceme spočítat \ M — U;A;|. Dostáváme 7! 2^1=o ^lä~ = 1854. A pravděpodobnost ie im - M - n 37 Jc 5040 — 280 —">-"• iii) Pro výběr těch tří, kteří dostanou svůj krígl, je q = 35 možností. Zbylí čtyři musí dostat jiné než svoje. To je opět vzorec z minulého bodu, konkrétně jde o 4! Ylt=o (-~kj- = 9 možností. Máme tedy dohromady 9 • 35 = 315 možností a pravděpodobnost je = ^. □ Krígl je specifická nádoba, ze které se pije pivo v hospodě. 762 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY Řešení cvičení 12.7. Artikulací jsou vrcholy 0, 1, 9, 10. Mosty tvoří hrany (0, 1), (0, 12), (9, 10). 12.15. (3, 1), (3, 2), (3, 4), (3, 5), (3, 6), (6, 1), (6, 2), (6, 4), (6, 5), (5, 1), (5, 2), (5, 4), (4, 1), (4, 2), (2, 1). 12.16. (3, 1), (3, 2), (3, 4), (3, 5), (3, 6), (1, 2), (1, 4), (1, 5), (1, 6), (2, 4), (2, 5),... (5, 6). 12.24. Postupem podle Havla a Hakimiho se snadno ukáže, že takový graf existuje. Rovinný ale nikoliv: | V | = 10, \E\ = 35 a aby byl rovinný, muselo by platit 3| V\ - 6 > \E\, tj. 24 > 35. 12.27. i) Ano. Plyne ihned z Kuratowského věty (K$ má 10 hran, K3 3 9 hran). ii) Ne. Protipříkladem j e K$ i iii) Ne. Mnoho protipříkladů (např. ^33 s přidaným vrcholem a do něj vedoucí hranou), i v) Ne. Protipříkladem je ^"5. v) Ne. Protipříkladem je ÍT33. vi) Totéž jako (ii). vii) Ne. Protipříkladem je C„. viii) Ne. Protipříkladem je ^"5. ix) Ne. Protipříkladem je C„. 12.29. V prvním případě ne (existuje vlastní prefix kódu se stejným počtem nul a jedniček), v druhém případě strom existuje. 12.34. Postup není správný. Stačí uvážit například kružnici s hranami ohodnocenými až na jednu jedničkami, zbývající hrana ohodnocená dvojkou. 12.35. Aplikací libovolného algoritmu na hledání minimální kostry zjistíme, že hledaná délka je 12154. (v kostře jsou hrany LPe, LP, LNY, PeT, MCNY). 12.41. Najdeme maximální tok velikosti 15 a rovněž řez [1,6], [1,3], [2, 4], [2, 3] téže kapacity. 12.43. Z teorie a předchozího příkladu víme, že kapacita imnimálního řezu je 9. Maximální tok / není zadán jednoznačně. Můžeme volit například f (a) = 2, f(b) = 4, f(c) = 1, f(h) = 1, f(j) = 4, /(/) = 2, f (i) — l,f(v) — 0 pro všechny ostatní hrany v daného grafu. 12.50. 4! -4! _ 27 12.51. f4. 12.64. i) Z příkladu v části 12.42 víme, že vytvořující funkcí posloupnosti (1, 2, 3,4,...) je funkce * z. ii) Protože je (i podle předchozí úlohy) ^j-i^j-Ä (0.1.2.3....). máme pro derivaci této funkce / X V 1 + X vi.p. -T = —^-3- ^ (1 • 1, 2 • 2, 3 • 3, ...). Podotkněme, že tuto úlohu bylo možné řešit i se znalostí toho, že * 3 <—^> (™^2)- 763 KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY iii) Máme 1 vi.p. 1 -x 1 vi.p. 1 -2x 1 vi.p. 1 -2x2 X vi.p. 1 -2x2 ^ (1,1,1,1...), (1,2,4,8,...), (1,0, 2,0,4, 0, ...), (0, 1,0, 2,0,4, ...), odkud dostáváme výsledek 1 + X vi.p. 1 -2x2 (1, 1,2,2,4,4, I /(*)-(!+4*) vi.p. iv) Z předchozího víme, že f(x) = (l2, 22, 32, ...), proto (1 X) (3/,4/,5/, ...). x- Substitucí 2x3 za x dostaneme f(2x3) - (l + 8x3) vi.p. —--—i-- ^> (9, 0, 0, 2 • 16, 0, 0, 4 • 25, ...). 4x6 v) Pokud označíme F(x) výsledek předchozí úlohy, pak je výsledkem F(x)-x2F(x) + T^. 12.7LX/0---ÍX + X2) 12.78. i) Úplný graf na n vrcholech má hran, kružnice na n vrcholech má n hran. Musíme tedy ke kružnici přidat — n hran. ii) Podobně jako výše dostaneme výsledek (m+")(^'+"~1) — m.nm 12.79. Hrany s ohodnocením tři tvoří kružnici 23562 délky čtyři a hranu 14. Jde tedy o nesouvislý podgraf daného grafu. Není tedy možné vybrat kostru daného grafu pouze z hran s ohodnocením tři. Maximální kostra bude mít tedy součet ohodnocení hran v ní nejvýše 4-3 + 2=14. Kostru s touto hodnotou skutečně můžeme vybrat. Z hran s ohodnocením 3 můžeme vypustit libovolnou hranu ze zmiňované kružnice a nezávisle přidáme nějakou hranu s ohodnocením dvě, která spojuje v podgrafu hran s ohodnocením tři komponentu 2356 s komponentou 14. Takové hrany jsou celkem čtyři. Celkem má daný graf 4 • 4 = 16 různých maximálních koster. 12.80. Nejlevnější hrany s ohodnocením jedna tvoří podgraf obshahující všechny vrcholy a mající dvě komponenty, které mohou být propojeny nějakou hranou s druhým nejmenším ohodnocením. Minimální kostra má tedy součet ohodnocení jej ch hran minimálně 6-1+2 = 8. Kostry s touto hodnotou skutečně existují, je totiž šest hran hodnoty 2, které propojují zmiňované dvě komponenty. Konkrétně jde o komponentu {1, 2, 4, 5, 7) a {3, 6). V první komponentě existují právě tři kružnice a to délky 4, přičemž každá ze šesti hran této komponenty leží právě ve dvou kružnicích. Abychom z dané komponenty získali strom, musíme dvě hrany vypustit, to můžeme udělat 6-4/2 způsoby. Celkem dostáváme 12 • 6 = 72 různých minimálních koster. 12.81. 18. 12.82. 12. 12.83. 16. 12.84. 16. 12.88. Min. řez je dán množinou {Z, A, E). Hodnota je 32. 12.89. Min. řez odpovídá množině (B, D, S). Hodnota je 40. 764 _KAPITOLA 12. KOMBINATORICKÉ METODY, GRAFY A ALGORITMY 12.90. Rez je dán množinou {F, S, D], hodnota je 29. 12.91. Min. řez je dán množinou {F, 5), jeho hodnota je 39. 765 Rejstřík abelovská grupa, 642 k-tý absolutní moment, 561 absolutní hodnota, 248 absorpčmproces, 146 absorpční zákony, 687 adjungovaná matice, 153 adjungované zobrazení, 152 afinní kombinace bodů, 198 obal, 195 podprostor, 195 repér, 195 souřadnice v rovině, 28 soustava souřadnic, 195 varieta, 669 zobrazení, 32, 201 poměr bodů, 202 akce grupy G na množině, 654 ct-algebra, 533 algebraický doplněk, 83 algebraická násobnost, 110,157 algoritmus Borůvkův, 736 Dijkstrův, 720 ElGamal, 636 Euklidův, 591 Floydův-Warshallův, 716 Fordův-Fulkersonův, 739 Jarníkův, 736 Kruskalův, 735 Lagrangeův, 217 Primův, 736 alternativní hypotéza, 579 analýza citlivosti, 579 analytický tvar, 213 aposteriorní, 577 apriorní, 577 aritmetické reprezentanty, 221 aritmetický průměr, 275, 527 artikulace, 710 asociativita, 8 asociativní operace, 642 asymptota bez směrnice, 336 asymptota se směrnicí, 335 asymptotický odhad, 343 asymptoty, 335 atom, 694 axiomy čísel, 8 báze, 28 standardní, 92 báze vektorového prostoru, 89 barvení grafu, 710 Bayesův vzorec, 537 bayesovská statistika, 571 Bellovo číslo, 43 Bernoulliova nerovnost, 276 Beta funkce, 581 Bezoutova věta, 591 binární operace, 641 relace, 39 strom, 726 vyhledávací strom, 726 binomická čísla, 12 binomický rozvoj, 12 binomické kongruence, 616 binormála křivky, 341 bipartitní graf, 709 bipartitní párování, 741 bit, 697 bod nespojitosti, 355 bod zvratu, 677 bodový euklidovský prostor, 203 bodový odhad, 574 body v obecné poloze, 198, 223 Booleovská algebra, 686 bootstrap, 586 Borelovské množiny, 539 Carmichaelova čísla, 625 Casoratián, 132 částečné uspořádám, 690 částečný součet, 279 766 REJSTŘÍK cauchyovská posloupnost, 249, 410 k-tý centrální moment, 561 cesta, 709,711 charakteristická funkce množiny, 358 charakteristická rovnice, 132, 511 charakteristický polynom, 134 charakteristický polynom matice, 104 charakteristický polynom zobrazeni, 104 charakteristika, 511 chyba druhého druhu, 579 chyba prvního druhu, 579 člen determinantu, 78 čtvercová matice, 70 cyklická grupa, 647, 650 cyklické zobrazení, 157 cyklický žebřík, 710 cyklus, 80, 644 délka křivky, 359 důsledekjevu, 20, 534 dělitelnost, 661 Darbouxův integrál, 352 De Morganova pravidla, 687 decily, 556 definiční obor funkce, 10 definiční obor relace, 39 dekonvoluce, 430 derivace, 242, 264 jednostranná, 265 nevlastní, 265 parciální druhého řádu, 446 parciální fc-tého řádu, 447 vlastní, 265 ve směru vektoru, 442 determinant, 31 determinant matice, 78 diferenční rovnice lineární, 15 prvního řádu, 15 diference dopředná, 343 druhého řádu, 343 středová, 343 zpětná, 343 diferenciál funkce, 337,443 diferenciál zobrazení, 454 diferenciální rovnice Bernoulliho typu, 494 homogenní, 493 Riccatiho typu, 494 diferenční rovnice homogenní lineární řádu k, 131 dihedrální grupa, 646 dimenze, 67, 89,194 dimenze matice, 70 diofantické rovnice, 623 Diracova funkce S, 430 Dirichletův součin, 602 Dirichletova podmínka, 421 Dirichletovo jádro, 424 discrete logarithm problém, 636 diskrétní grupa symetrií, 647 diskrétní logaritmus, 607 diskrétní náhodná veličina, 542 distribuční funkce, 540 distributivita, 8, 656 distributivní svaz, 692 divergentní posloupnost, 256 dokonalé číslo, 596 dolní a horní kvartil, 528 dolní Riemannův integrál, 355 dolní Riemannův součet, 352 dolní závora, 247, 691 doplněk, 686 doplněk minoru, 83 dosažená hladina testu, 580 druhá derivace, 327 duální báze, 97 duální projektivní prostor, 224 duální prostor, 97 duální tvrzení, 687 duální zobrazení, 152 dvojpoměr čtveřice bodů , 224 dělení se zbytkem, 589 dělitelnost, 589 ekvivalence, 600 elementární řádkové transformace, 73 elementární sloupcové transformace, 73 elementární jevy, 534 eliptická křivka, 677 entropie, 532 Euklidův algoritmus, 591 euklidovská rovina, 33 euklidovská transformace, 216 euklidovské podprostory, 203 Eulerova aproximace, 497 Eulerovo číslo e, 277 eulerovské grafy, 723 eulerovský sled, 723 eulerovský tah, 723 exaktnost, 654 excentricita, 728 exponenciální vytvořující funkce, 752 exponenta matice, 509 767 REJSTŘÍK faktor, 711 faktoriál, 10 faktorová grupa, 653 faktorový vektorový prostor, 159 Fermatova čísla, 630 forma k -lineárních, 101 antisymetrická bilineární, 101 bilineární, 101 symetrická bilineární, 101 Fourierův ortogonální systém, 403 Fourierova řada, 405 Fourierova kosinusová transformace, 431 Fourierova sinusová transformace, 431 Fourierova transformace, 427 Fourierovy koeficienty, 403 Fourierovy koeficienty funkce, 405 frekvenční statistika, 571 Frenetův repér, 341 Frenetovy-Serretovy vzorce, 341 Fresnelovy sinové a kosinové integrály, 357 fundamentální systém řešení, 126, 132 funkce analytická, 332 cyklometrická, 287 diferencovatelná, 265 diferencovatelná v bodě, 443 (k + l)-krát diferencovatelná, 327 dvakrát diferencovatelná, 327 exponenciální, 263 Heavisideova, 246 hladká, 327 hyperbolická, 288 klesající na intervalu, 267 klesající v bodu, 267 komplexní funkce reálné proměnné, 237 konkávni, 334 konvexní, 334 lipschitzovsky spojitá, 458 logaritmická se základem a, 264 mocninná, 263, periodická, 287,404 po částech spojitá, 355 racionální, 262 reálné proměnné, 237 rostoucí na intervalu, 266 rostoucí v bodě, 266 ryze racionální lomená, 348 skalární, 10 spojitá v bodě, 259 spojitá zprava, resp. zleva, 260 stejnoměrně spojitá, 355 třídy ď, 447 třídy ď (A), 327 funkce náhodné veličiny, 552 gaussián, 332 Gaussova eliminace, 73 Gaussova křivka, 549 generátory, 88 generování afinního podprostoru, 195 geometrická řada, 284 geometrická násobnost, 110,157 geometrické body, 221 geometrický průměr, 276, 527 geometrická báze, 223 Gibbsův jev, 407 goniometrické funkce, 285 gradient funkce, 463 graf, 708 graf zobrazení, 40 Gramův-Schmidtův ortogonalizační proces, 99 Gramův determinant, 209 grupa, 642 komutativní, 8 grupa permutací, 643 grupoid, 641 hamiltonovská kružnice, 724 Hammingova vzdálenost, 698 harmonický průměr, 275 Hasseho diagram, 691 hermiteovské matice, 153 Hermiteův interpolační polynom, 244 Hessián funkce, 448 negativně definitm, 452 negativně semidefinitní, 452 positivně definitní, 452 positivně semidefinitní, 452 histogram, 526 hladina testu, 579 hlavní ideál, 672 hlavní normála, 341 hlavních minorech, 83 hodnost kvadratické formy, 213 hodnost matice, 77 /j-hodnota testu, 580 homogenní úloha, 125 homogenní lineární diferenční rovnice, 131 homogenní lineární rekurence, 131 homogenní souřadnice, 220, 221 homomorfismus Booleovských algeber, 692 homotetie, 102 horní Riemannův integrál, 355 horní Riemannův součet, 352 horní závora, 247, 691 768 REJSTŘÍK hra, 742 hrana grafu, 708 hraniční bod, 253,419 hraniční vrcholy, 708 hranice simplexu, 198 hranový seznam, 714 hranově fc-souvislý graf, 718 hromadné body podmnožiny, 411 hromadný bod množiny, 251 hustota pravděpodobnosti, 543 hyperkostka, 709 hypotéza, 579 idempotentnost, 687 identita Besselova, 403 imaginární složka, 8 imerze, 479 implicitní popis, 196 indefinitní Hessián, 452 index, 607 indukovaný podgraf, 711 infimum, 247, 686 infimum množiny, 691 inflexníbod, 335 integrál formy, 483 integrální křivka, 505 integrální věta o střední hodnotě, 355, 359 integrál Newtonův, 345 Riemannův, 350 interpolační polynom, 239 intervalový odhad, 574 invariantní podprostor, 105 inverze v permutaci a, 79 inverzní Fourierova transformace, 428 inverzní funkce, 269 inverzní pravděpodobnosti, 537 inverzní prvek 8, 642 izolovaný bod, 419, 253 izometrie, 415 izomorfismus, 93, 649, 711 izotonní zobrazení, 692 izotropní podgrupa, 655 jádro, 93, 649 jádro integrálního operátoru L, 427 Jacobiho matice zobrazení, 454 Jacobiho symbol, 622 jednotka, 642 jednotková matice, 34 jednotkový prvek,8 jednotky, 661 jednovýběrový t-test, 585 jevové pole, 19, 533 jevy, 19, 533 elementární, 20 jisté, 20, 534 náhodné, 19 nastoupení alespoň jednoho, 20 nemožné, 20 neslučitelné, 20 opačné, 20 společné nastoupení, 20 stochasticky nezávislé, 23 join, 686 Jordánova míra, 359,473 Jordánův blok 157 Jordánův rozklad, 157 kalibr, 373 kanonický analytický tvar, 214 kapacita řezu, 739 kapacitní omezení, 738 kartézská souřadná soustava, 203 kartézský součin, 39 kladný směr rotace, 34 kladná matice, 141 klasická pravděpodobnost, 535 Kleeneho řetězec, 694 klika, 711 koeficient šikmosti náhodné veličiny, 564 koeficient špičatosti, 564 koeficienty polynomu, 238, 658 kód kontrolující paritu, 697 kód pěstěného stromu, 727 kódové slovo, 697 kolineace, 222 kolmé, 98 kolmý, 154 kolmou projekci, 99 kombinační čísla, 12 kombinace, 12 s opakováním, 14 komplexně sdružené číslo, 8 komplexní čísla, 8 komplexní Fourierovy koeficienty, 405 komutativita, 8 komutativní grupa, 642 komutativní okruh, 8, 656 komutativní pologrupa, 642 komutativním těleso, 8 koncové vrcholy, 725 koncový vrchol hrany, 708 konečný automat, 709 konečně rozměrný prostor, 89 769 REJSTŘÍK kongruence modlilo m, 600 kongruence o jedné neznámé, 610 konjugace, 248 kontrahující zobrazení, 418 kontrakce, 495 konvergence, 249 konvergence podle distribuční funkce, 566 konvergence podle pravděpodobnosti, 558 konvergence posloupnosti, 256 konverguje, 411 konvexní, 199 konvexní mnohostěny, 199 konvexní obal, 199 konvoluce, 748 konvoluce funkcí, 426 konzistentní odhad, 575 korelační koeficient, 560 korelace veličin, 560 kořen polynomu, 239, 658 kořen stromu, 726 kořenové stromy, 726 kořenový prostor, 159 kořenový vektore, 158 kostra, 733 krátká exaktní posloupnost gmp, 653 krabicový diagram, 524, 530 kritické body, 329 kritický bod řádu k, 334 kritický obor, 579 kritická hodnota na úrovni a, 557 kritérium Leibnizovo, 283 Sylvestrovo kritérium, 219 Weierstrassovo, 367 křivost, 338 křivost křivky, 341 Kroneckerovo delta, 70 kružnice, 709,711 kubický interpolační splajn, 245 kumulativní četnosti, 526 kumulativní třídní četnosti, 526 kvadratická regrese, 580 kvadratická forma, 213 indefinitní, 218 negativně definitní, 218 negativně semidefinitní, 218 pozitivně definitní, 218 pozitivně semidefinitní, 218 kvadrika, 212 a-kvantil, 527 kvantilové koeficienty šikmosti, 530 kvantilová funkce, 556 kvartilové rozpětí výběru, 528 kód (n, fc)-kódy, 697 lineární, 700 polynomiální, 698 křivka parametrizovaná délkou, 341 L'Hospitalovo pravidlo, 273 Lagrangeův interpolační polynom, 240 Laplaceova transformace, 432 Laplaceův rozvoj, 84 Legendreův symbol, 617 Legendreovy polynomy, 400 Leibnizovo pravidlo, 268 les, 725 Leslieho model růstu, 139 levá jednotka, 642 levé třídy rozkladu, 651 levá inverze, 642 limes superior, 282 limita, 249, 255,411 nevlastní, 255 vlastní, 255 zleva, 256 zprava, 256 lineární algebra, 27 lineární forma, 97,479 lineární funkcionár, 425 lineární kombinace, 76, 87 lineární kombinace vektorů, 28 lineární model, 582 lineární omezení, 127 lineární zobrazení, 30, 93 lmeárním přiblížení, 243 lineární nezávislost, 87 list, 725 logaritmický řád velikosti, 513 logaritmická věrohodnostní funkce, 576 lokálně konečné pokrytí, 484 lokální parametrizace variety, 480 Lucasův test, 631 Ludolfovo číslo, 286 Mobiova funkce, 601 Mobiova inverzní formule, 601 měřítko, 38 marginální rozložení, 550 Markovův řetězec, 144 Markovův proces, 144 matematická indukce, 13 matice, 30 algebraicky adjungovaná, 85 antisymetrická, 80 invertibilní, 72 770 REJSTŘÍK inverzní, 72 jednotková, 70 kladná, 141 nulová, 69 opačná, 69 přechodu, 96 primitivní, 141 regulární čtvercová, 72 schodovitý tvar, 73 symetrická, 80 zobrazení, 95 matice kódu, 700 matice kontroly parity, 702 matice sousedností, 714 matice transponovaná, 80 maximum funkce, 451 medián, 527, 556 meet, 686 Mersenneho prvočíslo, 596 metoda hlavních komponent, 532 Lagrangeových multiplikátorů, 466 nejmenších čtverců, 582 Monte Carlo, 27 metrický prostor, 410 metrika, 410 metrika na grafu, 720 mezní sklon ke spotřebě, 132 minimální kostra, 735 minimální vyloučená hodnota, 745 minimum funkce, 451 minor, 83 doplňkový minor, 83 vedoucí hlavní, 83 množina řešení kongruence, 610 množina řídká, 415 hustá, 415 kompaktní, 252,420 neohraničená, 252,420 neomezená, 420 ohraničená, 420 omezená, 418, 420 otevřená, 252, 411 uzavřená, 251,411 možné výsledky, 533 mocninná řada, 283 mocninná řada se středem v aq, 288 mocninný zbytek, 616 mocninný průměr stupně r, 275 modul nad okruhem, 68 modus, 528 k-íý moment, 561 momentová vytvořující funkce, 562 monoid, 642 monomiální uspořádám, 675 monom, 659 morfismus, 710 most, 710 multiindex, 659 multiplikativní funkce, 602 měřítko, 525 intervalové, 526 nominální, 525 ordinální, 526 poměrové, 526 náhodné jevy, 534 náhodný vektor, 540 náhodný výběr, 572 následník, 726 násobek, 589 nadrovina, 198 náhodná veličina, 540 nastoupení alespoň jednoho z jevů, 534 nehomogenní lineární diferenční rovnice, 136 nej menší prvek, 692 nejmenší společný násobek, 590 největšf prvek, 692 největšf společný dělitel, 590, 664 nekomutativní okruh, 656 nekonečná řada čísel, 279 nekonečné body, 221 nekonečně rozměrný prostor, 89 nemožný jev, 534 nenasycená hrana, 739 neorientovaný graf, 708 nerovnost Bernoulliova, 276 Besselova, 149,402 Cauchyova, 149 Gronwallova, 501 Holderova pro integrály, 414 Holderova, 412 Minkowského, 413 Parsevalova, 402 trojúhelníková, 149 nerozložitelný prvek, 661 neslučitelné jevy, 534 nesoudělnost, 593 nestranné hry, 744 nestranný odhad, 575 neurčitý integrál, 344 neutrální prvek, 8 nevlastní body, 221 nevlastní hromadné body, 255 771 REJSTŘÍK nevlastní integrál 1. druhu, 356 nevlastní integrál 2. druhu, 356 Newtonův integrál, 345 Neymanovo-Pearsonovo lemma, 580 nilpotentní, 157 Nim, 742 normální disjunktivní tvar, 695 normální matice, 156 normální podgrupa, 653 normální zobrazení, 155 normálový prostor, 465 normálový vektor, 463 norma, 141,149,410 norma dělení, 350 normovaný, 98 normovaný vektor, 146 normovaný vektorový prostor, 410 normovaná veličina, 557 nulová hypotéza, 579 nulová křivost, 337 nulová míra, 372 obecná Fourierova řada, 408 obor hodnot funkce, 10 obor hodnot relace, 40 obor integrity, 8, 656 obor integrity s jednoznačným rozkladem, 661 obraz, 93 obsah, 37 odchylka vektorů, 205 odchylka podprostorů, 205 ohodnoceny graf, 720 ohraničená množina, 252 ohraničený problém, 129 Ä-okolí, 252 okolí bodu, 252 okruh hlavních ideálů, 672 omezený prostor, 420 opačný jev kjevu, 534 orbita akce, 655 orientace, 38, 208 orientace variety, 483 orientovaná varieta s hranicí, 487 Orientovaný (bodový) euklidovský prostor, 208 orientovaný grafem, 708 orientovaný vektorový prostor, 208 orientovaná varieta, 483 ortogonálně diagonalizovatelná, 155 ortogonální, 98,146 ortogonální báze, 98 ortogonální doplněk, 99,147 ortogonální grupa, 151 ortogonální matice, 108, 151 ortogonální systém funkcí, 401 ortogonální zobrazení, 107 ortonormální báze, 98, 147,400 ortonormálním systému funkcí, 401 osa kolineace, 225 oskulační kružnice, 338 ostrý extrém, 451 otec, 726 otevřené f-okolf, 411 otevřené pokrytí, 253,419 otevřený interval, 252 párový t-test, 585 pěstěný strom, 727 předchůdce, 726 přirozený logaritmus, 264 přímý předchůdce, 726 přímka, 29 parametrický popis, 196 parciální derivace funkce, 442 parita, 645 parita permutace, 79 partikulární řešení, 126 Pascalův trojúhelník, 13 percentil, 528, 556 permutace, 11 lichá, 79 sudá, 79 s opakováním, 14 permutace množiny X, 78 Perronova-Frobeniova teorie, 141 Petersenův graf, 710 Petrohradský paradox, 554 Picardova aproximace, 496 po dvou nesoudělná, 593 počáteční hodnoty, 490 počáteční vrchol hrany, 708 počátek afinní souřadné soustavy, 195 počátek souřadnic, 28 počet řešení kongruence, 610 Pocklington-Lehmerův test, 631 podgraf, 711 podgrupa, 642 podgrupa generovaná množinou, 642 podmodel, 583 podmíněná pravděpodobnost, 536 podprostor generovaný, 88 podílové těleso, 665 polární báze, 217 pole, 8, 657 polocesta, 739 pologrupa, 642 poloměr konvergence, 283 772 REJSTŘÍK poloosa kuželosečky, 215 polopřímky, 199 poloprostory, 199 polynomiální řád velikosti, 513 popisná statistika, 523 populace, 572 poset, 690 posunutí, 28, 194 povrch, objem rotačního tělesa, 361 pozitivně definitní, 156 pozitivně semidefinitní, 156 průměr, 527 průměr množiny, 252,418 průměrná odchylka, 529 průnik, 686 přímý následník, 726 pravděpodobnost, 534 klasická, 21 podmíněná, 25 pravděpodobnostní funkce, 542 pravděpodobnostní prostor, 20, 534 pravidlo lichoběžníkové, 370 Simpsonovo, 370 pravá inverze, 642 pravá jednotka, 642 příčka, 200 primitivní funkce, 344 primitivní kořen, 606 primitivní matice, 141 primitivní polynom, 699 přímý součet, 89 princip duality, 687 princip inkluze a exkluze, 21, 23 přípustný vektor x, 129 přirozený splajn, 245 problém lineárního programování, 127 prohledávání do šířky, 717 prohledávání do hloubky, 717 projekce, 99 projektivizace vektorového prostoru, 221 projektivní kvadrika, 226 projektivní rovina Ví, 220 projektivní transformace, 222 projektivní zobrazení, 222 prvky řádu k, 644 první kvartil, 556 prvočíslo, 593 pseudoinverzní matice, 169 pseudoprvočíslo, 627 Rabínův kryptosystém, 634 racionální parametrická reprezentace, 670 řád čísla modulo m, 605 řád prvku, 650 řád velikosti, 513 řada alternující, 283 diverguje, 280 Fourierova, 403 funkcí, 283 geometrická, 284 konverguje absolutně, 280 Laurentova se středem v xq, 368 mocninná, 283 osciluje, 280 řádky matice, 69 reálná složka, 8 reálné funkce reálné proměnné, 237 reciproká rovnici, 135 redukovaná soustava zbytků, 604 regresní přímka, 585 regulární kolineace, 222 rekurence homogenní lineární, 131 relace antisymetrická, 41 ekvivalence, 41 inverzní, 41 reflexivní, 41 symetrická, 41 tranzitivní, 41 uspořádám, 41 reprezentant třídy ekvivalence, 42 řešení diferenciální rovnice, 490 řešitelný problém, 129 řetězec, 693 řez v síti, 738 rezerva kapacity, 739 reziduálni rozptyl, 582 reziduálni součet čtverců, 582 Riemannův integrál, 350 Riemannův součet, 350 Riemannův-Stieltjesův integrální součet, 371 riemannovská míra, 358 riemannovsky měřitelná množina, 358, 469,472 rotace vektorového pole, 489 rovinný graf, 729 rovnoběžnostěn, 200 rovnomocně spojitá množina funkcí, 421 rovnost Bezoutova, 664 Parsevalova, 149 rozdělení (pravděpodobnosti) náhodného vektoru, 540 rozdělení pravděpodobnosti náhodné veličiny, 540 773 REJSTŘÍK rozdělení X" sn stupni volnosti, 568 X~ s jedním stupněm volnosti, 567 alternativní, 544 Beta, 581 binomické, 544 degenerované, 543 exponenciální, 548 F-rozdělení, 569 Fisherovo-Snedecorovo skám stupni volnosti, 569 gama, 548 geometrické, 544 mnohoměrné normální, 569 normální, 549 Poissonovo, 545 rovnoměrné, 547 Studentovo t-rozdělení s n smpni volnosti, 569 rozklad LC/-rozklad, 165 QR rozklad, 168 rozklad jednotky podřízený lokálně konečnému pokrytí, 485 rozklad na parciální zlomky, 348 rozklad na třídy, 42 rozpětí výběru, 528 rozptyl, 528 rozsah souboru, 526 rozvoj determinantu, 83 RSA, 633 RSS, 582 ryzí okolí, 255 samoadjungovaná matice, 153 samodružný bod, 225 samodružná nadrovina kolineace, 225 Sarnisovo pravidlo, 79 schodovitý tvar matice, 73 sdružená hustotou, 550 sdružená pravděpodobnostní funkce, 550 o —algebře Borelovsky měřitelných množin na E*, 540 signatura kvadratické formy, 218 simplex, 198,199 singulární bod, 676 singulární hodnoty matice, 167 sinusintegrál, 357 sjednocení, 686 skóre grafu, 712 skalární součin, 69, 98,146 skaláry, 9 skládám relací, 40 slabě souvislý graf, 724 slabá souvislosti, 718 sled, 711 sled délky n, 711 složené číslo, 593 složení, 40 sloupce matice, 69 směrodatná odchylka, 528 směrodatná odchylka náhodné veličiny, 557 směrová derivace, 442 smyčka, 708 současné nastoupení jevů, 534 součet nestranných her, 744 součet podprostorů, 89 součin grup, 650 souřadnice vektoru, 92 soubor hodnot, 525, 526 soukromý klíč, 634, 636 sousední hrany grafu, 708 sousední hrany orientovaného grafu, 708 souvislé komponenty grafu, 718 souvislý graf, 718 spektrální poloměr, 110 spektrální poloměr matice, 141 spektrum lineárního zobrazení, 110,157 spojitá náhodná veličina, 543 spojitá zobrazení, 412 spojitost, 694 společné nastoupení jevů, 534 společný dělitel, 590 Spragueova-Grundyova funkce, 745 srovnatelné prvky, 42 stěna simplexu, 198 stěny rovinného grafu, 730 střed kolineace, 225 střed kuželosečky, 215 střední hodnota, 359 Střední hodnota náhodného vektoru, 553 střední hodnota veličiny, 553 střední kvadratická odchylka, 528 stažení formy, 480 stacionární bod, 466 stacionární bod funkce, 451 stacionární body, 329 standardizovaná veličina, 557 standardní afinní prostor, 193 standardní maximalizační problém, 127 standardní rninimalizační problém, 127 standardní unitární prostor, 147 statistické jednotky, 525 soubory, 525 znaky, 525 statistika, 524 stejnoměrná spojitost, 353 stejnoměrně Cauchyovská, 365 774 REJSTŘÍK stejnoměrná konvergence, 364 štěpem posloupnosti, 654 stochastická matice, 145 stochasticky nezávislé, 550, 535 stok, 738 stok sítě, 737 stopa matice, 104 stopa zobrazení, 104 strategie hráče, 742 strom, 725 strom hry, 742 snipeň polynomu, 658, 674 stupeň vrcholu, 712 stupeň nilpotentnosti, 157 stupeň polynomu, 238 subdeterminant, 83 submatíce, 83 doplňková, 83 hlavní, 83 vedoucí hlavní, 83 supremum, 247, 686 supremum množiny, 691 svědek prvočíselnosti, 631 svaz, 692 symetrická zobrazení, 153 symetrické matice, 153 symetrizace, 708 syn, 726 syndrom, 702 systém diferenciálních rovnic autonomní, 502 těleso, 657 těleso racionálních funkcí, 665 třetí kvartil, 556 třídní četností, 526 třídy ekvivalence, 42 tah, 711 Taylorův polynom fc-tého shipně, 330 Taylorův rozvoj se zbytkem, 329 tečná nadrovina, 446 tečná rovina, 446 tečný prostor, 465,479 tečný vektor, 441,478 tečna, 243 tečna ke křivce c, 442 test, 579 test dobré shody, 585 tok, 738 tok vektorového pole, 505 topologie, 252,412 komplexní roviny, 252 metrických prostorů, 412 reálné přímky, 252 torze křivky, 341 totálně omezený prostor, 420 transformace, 454 transpozice, 78, 644 tranzitivní akce, 655 trojúhelník, 198, 709 trs nadrovin procházejí bodem, 225 typy měřítek, 525 účelová funkce, 127 úhly, 199 unitární grupa, 151 unitární isomorfismus, 147 unitární matice, 151 unitární prostor, 146 unitární zobrazení, 147 univerzální formule, 750 úplná soustava rovnic, 505 úplné metrické prostory, 411 úplný graf, 709 úplný ortogonální systém, 403 úplném svazu, 692 úplná soustava zbytků, 604 úplné uspořádám, 690 úplný splajn, 245 určitý integrál, 345 úrovňová množina, 463 úsečka, 198, 709 uspořádám, 41, 690 uspořádaná množina, 690 uspořádané pole, 246 uspořádaný soubor hodnot, 526 uzávěr, 251 uzavřený interval, 251 výběrový kvantíl, 528 výběrový rozptyl, 528 výběrový soubor, 572 výběrová statistika, 575 výběrový rozptyl, 572 výrok, 688 výstřednost stromu, 728 výstupní stupeň ,712 věrohodnostní funkce, 576 Vandermondův determinant, 240 variační koeficient, 529 variace, 12, 372 s opakováním, 14 variančnf matice, 561 vcházející hrany, 708 veřejný klíč, 634, 636 vedoucí člen, 674 775 REJSTŘÍK vedoucí koeficient, 674 vedoucí monom, 674 vektor chyb, 699 vektor omezení, 127 vektorová funkce jedné reálné proměnné, 339 vektorové pole, 478, 505 vektorové pole podél křivky, 478 vektorový podprostor, 88 vektorový prostor, 86 vektorový součin, 210 vektory, 27, 67 nulové, 27 lineárně závislé, 76 velikost multiindexu, 659 velikost toku, 738 velikost vektoru, 146 veličiny stochasticky nezávislé, 24 vlastní čísla matice, 104 vlastní čísla zobrazení, 103 vlastní vektory zobrazení, 103 vnější diferenciál, 486 vnější diferenciální fc-forma, 480 vnější součin vektorů, 210 vnitřek množiny, 411 vnitřním bod, 419 vnitřním bodem množiny, 253 vrchol grafu, 708 vrcholově fc-souvislý graf, 718 vstupní stupeň ,712 vycházející hrany, 708 vychýlení odhadu T, 575 vytvořující funkce, 747 vyvážený vrchol, 712 vyvážený binární strom, 726 vzájemně kolmé, 154 vzdálenost, 420 vzdálenost bodu od množiny, 251 vzdálenost bodů, 203 vzdálenost vrcholů, 720 vzor množiny v zobrazení, 40 vzorkovací interval, 432 vícerozměrný interval, 468 věta Ábelova, 368 Arzelova-Ascoliho, 420 Bernoulliova, 558 Bezoutova, 591 Cauchyova, 82 Cauchyova o střední hodnotě, 273 Frobeniova, 126 Gaussova-Ostrogradského, 489 Greenova, 488 Jacobiho, 219 Jordánova, 730 klasická Stokesova, 489 Kleeneho, 694 kosinová, 205 Kuratowského, 730 Lagrangeova, 652 Lagrangeova o střední hodnotě, 272 malá Fermatova, 652 Mengerova, 718 o setrvačnosti, 217 Rolleova, 272 Spragueova-Grundyova, 745 Steinitzova, 732 Steinitzova o výměně, 91 Stoneova o reprezentaci, 697 Tarského o pevném bodě, 694 základní věta algebry, 328 základní věta aritmetiky, 594 zobecněná binomická věta, 749 wavelety, 409 základní prostor, 19, 533 zákon kvadratické reciprocity, 619 zúplnění metrického prostoru, 415 záměrem, 194 zdroj, 738 zdroj sítě, 737 zobecněná exponenciální mocninná řada, 754 zobrazení identické, 41 injektivní, 40 surjektivní, 40 z množiny a do množiny b, 40 zobrazení diferencovatelné, 454 do, 40 na, 40 třídy ^,454 zrcadlem vzhledem k přímce, 35 776 Matematika drsně a svižně Jan Slovák, Martin Panák, Michal Bulant a kolektiv Vydala Masarykova univerzita v roce 2013 1. vydání, 2013 Náklad 500 výtisků Sazba nejen systémem L^TjiX Tomáš Janoušek Tisk: Tiskárna Knopp, Cernčice 24, 549 01 Nové Město nad Metují ISBN 978-80-210-6307-5 ISBN 978-80-210-6308-2 (online : pdf) DOl: 10.5817/CZ.MUN1.O210-6308-2013