Drsná matematika
Martin Panák, Jan Slovák
Pokus o učební text pro začínající studenty informatiky přibližující podstatnou část
matematiky v rozsahu čtyř semestrálních přednášek. Prozatím jsou zaznamenány
první tři semestry přibližně v odpředneseném rozsahu. Poslední semestr je zapisován
průběžně.
i
Obsah
Kapitola 1. Úvod a motivace 1
1. Čísla a funkce 1
2. Kombinatorické formule 3
3. Diferenční rovnice 9
4. Pravděpodobnost 17
5. Geometrie v rovině 28
6. Relace a zobrazení 38
Kapitola 2. Elementární lineární algebra 45
1. Vektory a matice 45
2. Determinanty 53
3. Vektorové prostory a lineární zobrazení 60
4. Vlastnosti lineárních zobrazení 72
Kapitola 3. Linární modely 83
1. Lineární rovnice a procesy 83
2. Lineární diferenční rovnice a filtry 86
3. Markovovy procesy 91
4. Více maticového počtu 93
5. Rozklady matic a pseudoinverze 98
Kapitola 4. Analytická geometrie 105
1. Afinní geometrie 105
2. Euklidovská geometrie 115
3. Projektivní geometrie 130
Kapitola 5. Zřízení ZOO 135
1. Interpolace polynomy 135
2. Spojité funkce 144
3. Derivace 157
4. Mocninné řady 166
Kapitola 6. Diferenciální a integrální počet 179
1. Derivování 179
2. Integrování 193
3. Nekonečné řady 210
Kapitola 7. Spojité modely 217
1. Aproximace pomocí Fourierových řad 217
2. Integrální operátory 223
iii
iv OBSAH
Kapitola 8. Spojité modely s více proměnnými 229
1. Funkce a zobrazení na Rn
229
2. Integrování podruhé 260
3. Diferenciální operátory 275
4. Poznámky o numerických metodách 287
Kapitola 9. Kombinatorické metody 289
1. Grafy a algoritmy 289
2. Aplikace kombinatorických postupů 311
Kapitola 10. Algebraické struktury a techniky 335
1. Grupy 335
2. Okruhy polynomů a tělesa 352
3. Uspořádané množiny a Booleovská algebra 367
4. Kódy a šifry 374
Kapitola 11. Statistické metody 383
1. Pravděpodobnost 384
2. Popisná statistika 407
3. Matematická statistika 408
4. Poznámky o některých aplikacích 409
Literatura 411
OBSAH v
Předmluva
Tento učební text vzniká průběžně při přípravě přednášek pro předměty Matematika
I­IV na Fakultě informatiky MU. Text se snaží prezentovat standardní
výklad matematiky s akcentem na smysl a obsah prezentovaných matematických
metod. Řešené úlohy pak procvičují základní pojmy, ale zároveň se snažíme dávat co
nejlepší příklady užití matematických modelů. Studenti navíc mají řešit a odevzdávat
každý týden zadávané příklady. Seminární skupiny pak obdobně standardním
,,cvičením vytváří podporu pro řešení domácích úloh. V tomto textu podáváme
formální výklad proložený řešenými příklady.
Ne vše se daří průběžně naplňovat tak, jak bychom si představovali. Samotný teoretický
text by měl být podrobnější a lépe formulovaný, řešených příkladů bychom
chtěli mít podstatně více a měly by pokrývat celou škálu složitosti, od banálních
až po perličky ke skutečnému přemýšlení.
Posluchače bychom rádi naučili:
* přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická
tvrzení,
* vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití,
* vstřebat návody na užívání matematických modelů a osvojit si jejich využití.
K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená
hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu
či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy
několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že
tento postup se může jevit jako chaotický, domníváme se ale, že dává mnohem lepší
šanci na pochopení u těch, kteří vytrvají.
Vstup do matematiky je skoro pro každého obtížný ­ pokud už ,,víme , nechce
se nám přemýšlet, pokud ,,nevíme , je to ještě horší. Jediný spolehlivý postup pro
orientaci v matematice je hledat porozumnění v mnoha pokusech a hledat je při
četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj
pro každého.
Pro ulehčení vícekolového přístupu ke čtení je text strukturován také pomocí
barev, resp. sazby, takto
* normální text je sázen černě
* řešené příklady jsou sázeny barvou
* složitější text, který by měl být čten pozorněji, ale určitě ne přeskakován, je
sázen barvou
* náročné pasáže, které mohou (nebo by raději měly být) být při studiu přinejmenším
napoprvé přeskakovány jsou sázeny v barvě .
První tři semestry výuky už jednou proběhly a výsledných 9 kapitol máte v
rukou. Popišme tedy nyní stručně obsah a také výhled na semestr následující.
vi OBSAH
1. semestr: Úvodní motivační kapitola se snaží v rozsahu přibližně 4­5 týdnů
přednášek ilustrovat několik přístupů k matematickému popisu problémů. Začínáme
nejjednoduššími funkcemi (základní kombinatorické formule), naznačujeme
jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční
rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím
konečné klasické pravděpodobnosti, předvádíme maticový počet pro jednoduché
úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše
trochu zformalizujeme (relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout
do chaotického zmatku příliš rychlým střídáním témat ­ cílem je nashromáždit něco
málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě
než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této
úvodní kapitoly se časem vrátíme.
Dalších přibližně 5 týdnů přednášek je věnováno základům počtu, který umožňuje
práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry,
které jsou základem a konečným výpočetním nástrojem pro většinu matematických
modelů. Jednoduché postupy pro práci s vektory a maticemi jsou obsahem kapitoly
druhé, další kapitola je pak věnována aplikacím maticového počtu v různých lineárních
modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční
rovnice, Markovovy procesy, lineární regrese).
Poslední 2­3 přednášky prvního semestru jsou věnovány použitím maticového
počtu v geometrických úlohách a lze se z nich dozvědět něco málo o afinní, euklidovské
a projektivní geometrii.
2. semestr: Další semestr je věnován tzv. spojitým modelům. Chceme co nejnázorněji
ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché.
Stručně řečeno, hledáme cesty, jak složitější věci nelineární povahy řešit pomocí
jednoduchých lineárních triků a postupů lineární algebry. Složitosti se pojí skoro
výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy
být použitelné.
Prvně proto přišla na řadu kapitola pátá, kde diskutujeme jaké funkce potřebujeme
pro nelineární modely. Začínáme s polynomy a spliny, pak postupně diskutujeme
pojmy spojitosti, limity posloupoností a funkcí a derivace funkcí a seznámíme
se se všemi základními elementárními funkcemi a s mocninnými řadami.
Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme
v kaptole šesté s důrazem na co nejjednodušší pochopení aproximací,
integračních procesů a limitních procesů.
Poslední sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat
analogie k postupům jednoduché lineární algebry z minulého semestru. Místo
lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme
s lineárními operacemi mezi nekonečně rozměrnými vektorovými prostory funkcí,
definovaných buď integrálními nebo diferenciálními operátory. Zatímco studium
diferenciální rovnic ponecháváme do semestru dalšího, zde studujeme nejprve aproximace
funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady)
abychom vzápětí mohli ukázat souvislost s některými integrálními transformacemi
(Fourirerova transformace).
3. semestr: Zde nejprve pokračujeme v našem stručném nastínění analytických
metod pro modely s mnoha proměnnými. Nejprve v osmé kapitole rozšíme základní
postupy a výsledky týkající se derivací na funkce více proměnných, včetně funkcí
OBSAH vii
zadaných implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování
o tzv. násobné integrály. Poté se věnujeme stručně modelům zachycujím známou
zněnu našich obejktů, tj. diferenciálním rovnicím. Závěrem této kapitoly pak uvádíme
několik poznámek o odhadech a numerických příblíženích.
Devátá kapitola směřuje zpět do světa diskrétních metod. Zabýváme se v ní
základními pojmy poznatky teorie grafů a jejich využitím v praktických problémech
(např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích,
hry popisované stromy). Závěrem uvádíme pár poznámek o vytvořujících funkcích.
4. semestr: V posledním semestru celého cyklu přednášek se hodláme zabývat
nejprve obecné algebraickými strukturami s důrazem na teorii grup a náznaky jejích
aplikací. Tomuto tématu budeme věnovat 5­6 přednášek.
Konečně, závěrečná jedenáctá kapitola je věnována matematické pravděpododobnosti
a statistice v rozsahu 6-7 přednášek. Seznámíme se s pojmy pravděpodobnostní
prostor, hustota pravděpodobnosti, normální rozdělení, střední hodnota,
medián, kvantil, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem
věnovat statistickému zpracování dat.
Únor 2007, Martin Panák, Jan Slovák
KAPITOLA 1
Úvod a motivace
,,hodnota, změna, poloha
­ co to je a jak to uchopit?
1. Čísla a funkce
Lidé trpí chorobnou snahou mít jasno ,,kolik něco je , případně ,,za kolik ,
,,jak dlouho apod. Výsledkem takových úvah je většinou nějaké ,,číslo , říkejme
učeněji ,,hodnota . Za číslo se přitom považuje něco, co umíme sčítat a násobit
a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Nejjednodušším
příkladem jsou tzv. čísla přirozená, budeme je značit N = {1, 2, 3, . . . }, často zvláště
v informatice brána včetně nuly, a čísla celá Z = {. . . , -2, -1, 0, 1, 2, . . . }. Kdo si
libuje ve formálním přístupu v rámci některé z korektních teorií množin a ví, co to
je prázdná množina , může definovat
e1.1 (1.1) 0 := , 1 := {}, 2 := {, 1}, . . . , n + 1 := {0, 1, . . . , n}.
Pak lze snadno formálně definovat sčítání a násobení celých čísel, uspořádání, ukázat,
že každá podmnožina v N má nejmenší prvek a spoustu dalších vlastností o
kterých zpravidla už dávno nepřemýšlíme a máme je za samozřejmé. Např. o číslu
a řekneme, že je menší než b tehdy a jen tehdy, když a = b a a  b. Nebudeme se
tu tím podrobně zabývat a předpokládáme, že čtenář i čísla racionální (Q), reálná
(R) a komplexní (C) důvěrně zná.1
Prakticky budeme připomínat teoretické i praktické
souvislosti při dalším výkladu, viz příklad 1.4(1). Podobně bude konstrukce
racionálních čísel z přirozených diskutována v 1.47, konstrukci reálných čísel bude
vhodné zmínit při studiu limitních procesů později a již dříve budeme z různých
algebraických pohledů zkoumat čísla komplexní.
Pro náš další rozlet ale bude teď užitečné vyjmenovat obvyklé vlastnosti, které
sčítání a násobení čísel má. Navíc, jak je v matematice obvyklé, budeme místo s
čísly manipulovat s písmeny abecedy, případně jinými znaky, ať už jejich hodnota
je nebo není předem známá.
1.1
1.1. Vlastnosti sčítání.
(a + b) + c = a + (b + c), pro všechny a, b, c(KG1)
a + b = b + a, pro všechny a, b(KG2)
existuje prvek 0 takový, že pro všechny a platí a + 0 = a(KG3)
pro všechny a existuje prvek (-a) takový, že platí a + (-a) = 0.(KG4)
1Podrobně lze formální základy matematiky nalézt např. ve skriptech Pavla Horáka [10].
1
2 1. ÚVOD A MOTIVACE
Vlastnostem (KG1) ­ (KG4) říkáme vlastnosti komutativní grupy. Celá čísla Z
jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují
KG4 (a případně neobsahují nulu pokud ji do N nezahrnujeme).
1.2
1.2. Vlastnosti násobení.
(a  b)  c = a  (b  c), pro všechny a, b, c(O1)
a  b = b  a, pro všechny a, b(O2)
existuje prvek 1 takový, že pro všechny a platí 1  a = a(O3)
a  (b + c) = a  b + a  c, pro všechny a, b, c.(O4)
Poslední vlastnosti O4 se říká distributivita.
Množiny s operacemi +,  a vlastnostmi (KG1)­(KG4), (O1)­(O4) se nazývají
komutativní okruhy. Potřebujeme však zpravidla ještě další běžnou vlastnost čísel:
(P) pro každý a = 0 existuje prvek a-1
takový, že platí, a  a-1
= 1.
Když naše objekty splňují navíc i (P), hovoříme o poli (často také o komutativním
tělese). Někdy se ale setkáme se slabší dodatečnou vlastností. Např. okruh
celých čísel Z nesplňuje (P), ale splňuje
(OI) a  b = 0  buď a = 0 nebo b = 0.
Hovoříme o oboru integrity.
Prvky nějaké množiny s operacemi + a  splňujícími (ne nutně všechny) výše
uvedené vlastnosti (tj. komutativní okruh, obor integrity, pole) budeme nazývat
skaláry. Budeme pro ně vesměs užívat latinská písmena ze začátku abecedy.
Kdo chce postupovat co nejpřesněji a formálně, měl by předchozí vlastnosti
brát jako axiomatickou definici příslušných matematických pojmů. Pro naše potřeby
bude stačit si průběžně uvědomovat, že při dalších diskusích budeme důsledně
používat pouze tyto vlastnosti skalárů a že tady i naše výsledky budou platné pro
všechny objekty s těmito vlastnostmi. V tomto je pravá síla matematických teorií
­ nejsou platné jen pro konkrétní řešený příklad. Naopak, při rozumné výstavbě
mají vždy univerzální použití. Budeme se snažit tento aspekt vždy zdůrazňovat,
přestože naše ambice mohou být v rámci daného časového prostoru pro přednášky
jen velice skromné.
1.3
1.3. Skalární funkce. Často pracujeme s hodnotou, která není dána jako konkrétní
číslo. Místo toho něco víme o závislosti naší hodnoty na hodnotách jiných.
Formálně píšeme, že hodnota y = f(x) naší ,,závislé proměnné veličiny y je dána
,,nezávislou veličinou x. Přitom můžeme znalost f brát formálně (prostě je to
nějaká, blíže nespecifikovaná, závislost) nebo operačně, tj. f(x) je dáno formulí
poskládanou z (prozatím si představme konečně mnoha) známých operací. Pokud
je hodnotou skalár, hovoříme o skalární funkci. Také může být ale hodnota dána
pouze přibližně nebo s jistou pravděpodobností.
Smyslem matematických úvah pak bývá z neformálního popisu závislostí najít
explicitní formule pro funkce, které je popisují. Podle typu úlohy a cíle se pak
pracuje:
* s přesným a konečným výrazem
* s nekonečným výrazem
* s přiblížením neznámé funkce známým odhadem (většinou s vyčíslenou možnou
chybou)
2. KOMBINATORICKÉ FORMULE 3
* s odhadem hodnot s vyčíslením jejich pravděpodobnosti apod.
Skalární funkcí je např. roční mzda pracovníka (hodnoty nezávislé veličiny jsou
jednotliví pracovníci x z nějaké množiny, f(x) je jejich roční mzda za dané období),
nebo měsíční mzda konkrétního pracovníka v čase (nezávislou hodnotou je čas v
měsících, závislou příjem). Jiným příkladem je třeba plocha obrazce v rovině, objem
tělesa v prostoru, rychlost konkrétního auta v čase atd. Dovedeme si jistě představit,
že ve všech uvedených případech může být hodnota dána nějakou volně popsanou
souvislostí nebo naměřena přibližně nebo odhadnuta atd.
1.4 1.4. Příklady. (1) Podívejme se na obyčejné sčítání přirozených čísel jako na operačně
definovanou skalární funkci. Definujeme a + b jako výsledek procedury, ve
které k a přičítáme 1. Tak jsme vlastně obecně a + 1 definovali v rovnicích (1.1).
Zároveň odebereme z b nejmenší prvek, dokud není b prázdná. Je evidentní, že takto
definované sčítání sice je dáno formulí, tato ale není vhodná pro praktické počítání.
Tak tomu bude v našem výkladu často ­ teoreticky korektní definice pojmu neznamená,
že úkony s ním spojené jsou efektivně vykonavatelné. Právě k tomu budeme
postupně rozvíjet celé teorie, abychom praktické nástroje získávali. Co se týče přirozených
čísel, od školky je umíme sčítat zpaměti a rychle (pokud jsou malá) a s
většími si poradí počítače (pokud nejsou příliš velká).
(2) Důležitou operačně definovou skalární funkcí na přirozených číslech je faktoriál,
který definujeme vztahy
f(0) = 1, f(n + 1) = (n + 1)  f(n).
Píšeme f(n) = n! a definice zjevně znamená n! = n(n-1)    1. To také není příliš
efektivní formule pro velká n, lepší ale těžko hledat.
2. Kombinatorické formule
1.5
1.5. Permutace, kombinace a variace. Jestliže z množiny n předmětů vytváříme
nějaké pořadí jejich prvků, máme pro volbu prvního prvku n možností, další
je volen z n-1 možností atd., až nám nakonec zbude jediný poslední prvek. Zjevně
tedy je na dané konečné množině S s n prvky právě n! různých pořadí. Hovoříme o
permutacích prvků množiny S. Jestliže si předem prvky v S očíslujeme, tj. ztotožníme
si S s množinou S = {1, . . . , n} n přirozených čísel, pak permutace odpovídají
možným pořadím čísel od jedné do n. Máme tedy příklad jednoduché matematické
věty a naši předchozí diskusi je možné považovat za její důkaz:
Tvrzení. Počet různých pořadí na konečné množině s n prvky je dán známou
funkcí faktoriál:
e1.1a (1.2) f(n) = n!
Dalším jednoduchým příkladem hodnoty určené formulí jsou tzv. binomická
čísla, která vyjadřují, kolika způsoby lze vybrat k různých rozlišitelných předmětů
z množiny n předmětů. Zjevně máme n(n - 1)    (n - k + 1) možných výsledků
postupného výběru našich k prvků, přitom ale stejnou výslednou k-tici dostaneme
v k! různých pořadích. Proto pro počet kombinací k-tého stupně z n prvků platí
(samozřejmě je k  n)
e1.2 (1.3) c(n, k) =
n
k
=
n(n - 1) . . . (n - k + 1)
k(k - 1) . . . 1
=
n!
(n - k)!k!
.
4 1. ÚVOD A MOTIVACE
Ani toto není pro výpočet moc uspokojivá formule při velikých k i n, protože
obsahuje výrazy pro faktoriály.
Pokud nám ale záleží i na pořadí vybrané k-tice prvků, hovoříme o variaci
k-tého stupně. Jak jsme si již ověřili, pro počet variací platí
v(n, k) = n(n - 1)    (n - k + 1)
pro všechny 0  k  n (a nula jinak).
Binomická čísla dostala svůj název od tzv. binomického rozvoje, tj. roznásobení
n-té mocniny dvojčlenu. Počítáme-li totiž (a+b)n
, bude koeficient u mocniny ak
bn-k
pro každé 0  k  n roven právě počtu možností, jak vybrat k-tici z n závorek v
součinu (ty, kde bereme do výsledku a). Platí proto
e1.3 (1.4) (a + b)n
=
n
k=0
n
k
ak
bn-k
a všimněme si, že pro odvození jsme potřebovali pouze distributivitu, komutativnost
a asociativitu násobení a sčítání. Formule (1.4) proto platí v každém komutativním
okruhu.
Jako další jednoduchou ukázku, jak vypadá matematický důkaz si odvoďme
několik jednoduchých tvrzení o kombinačních číslech. Pro zjednodušení formulací
definujme n
k = 0, kdykoliv je buď k < 0 nebo k > n.
1.6 1.6. Tvrzení. Pro všechna přirozená čísla k a n platí
(1) n
k = n
n-k
(2) n+1
k+1 = n
k + n
k+1
(3)
n
k=0
n
k = 2n
(4)
n
k=0 k n
k = n2n-1
.
Důkaz. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou
stranu z tvrzení (2), dostáváme
n
k
+
n
k + 1
=
n!
k!(n - k)!
+
n!
(k + 1)!(n - k - 1)!
=
(k + 1)n! + (n - k)n!
(k + 1)!(n - k)!
=
(n + 1)!
(k + 1)!(n - k)!
což je ale levá strana tohoto tvrzení.
Tvrzení (3) zjevně platí pro n = 0, protože 0
0 = 1 = 20
. (Stejně tak je přímo
vidět i pro n = 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou
sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme
n+1
k=0
n + 1
k
=
n
k=-1
n
k
+
n+1
k=0
n
k
= 2n
+ 2n
= 2n+1
.
Prakticky stejně dokážeme i (4). Zjevně platí pro n = 0, předpokládejme, že
platí pro nějaké n, a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2).
2. KOMBINATORICKÉ FORMULE 5
Dostaneme
n+1
k=0
k
n + 1
k
=
n
k=-1
(k + 1)
n
k
+
n+1
k=0
k
n
k
=
n
k=0
n
k
+
n
k=0
k
n
k
+
n
k=0
k
n
k
= 2n
+ n2n-1
+ n2n-1
= (n + 1)2n
.
Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla
do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně
nad ním ležících sousedů:
n = 0 : 0 1 0
n = 1 : 0 1 1 0
n = 2 : 0 1 2 1 0
n = 3 : 0 1 3 3 1 0
n = 4 : 0 1 4 6 4 1 0
n = 5 : 1 5 10 10 5 1
Všimněme si, že v jednotlivých řádcích máme právě koeficienty u jednotlivých mocnin
z výrazu (1.4), např. poslední uvedený řádek říká
(a + b)5
= a5
+ 5a4
b + 10a3
b2
+ 10a2
b3
+ 5ab4
+ b5
.
Uveďme si příklad demonstrující kombinatorické úvahy (berte to jako zahřívací
rozcvičku!):
1.7. Příklady.
1.7.1. Maminka chce Jeníkovy a Mařence rozdělit pět hrušek a šest jablek. Kolika
způsoby to může udělat? (hrušky mezi sebou považujeme za nerozlišitelné, stejně
tak jablka)
Řešení. Pět hrušek samostatně může maminka rozdělit šesti způsoby, šest jablek
pak samostatně sedmi způsoby. Podle pravidla součinu pak obě ovoce současně
může rozdělit 42 způsoby.
1.7.2. Určete počet čtyřciferných čísel sestavených z právě dvou různých cifer.
Řešení. Dvě různé cifry použité na zápis můžeme vybrat 10
2 způsoby, ze dvou
vybraných cifer můžeme sestavit 24
- 2 různých dvojciferných čísel (dvojku odečítáme
za dvě čísla složená pouze z jedné cifry). Celkem máme 10
2 (24
- 2) = 630
čísel. Nyní jsme ale započítali i čísla začínající nulou. Těch je 9
1 (23
- 1) = 63.
Celkově dostáváme 630 - 63 = 567 čísel.
1.7.3. Určete počet sudých čtyřciferných čísel sestavených z právě dvou různých
cifer.
Řešení. Obdobně jako v předchozím příkladu se nejprve nebudeme ohlížet na cifru
nula. Dostaneme tak 5
2 (24
-2)+55(23
-1) čísel (nejprve počítáme čísla pouze ze
sudých cifer, druhý sčítanec udává počet sudých čtyřciferných čísel složených ze sudé
6 1. ÚVOD A MOTIVACE
a liché cifry). Opět musíme odečíst čísla začínající nulou, těch je (23
-1)4+(22
-1)5.
Hledaný počet cifer tak je
5
2
(24
- 2) + 5  5(23
- 1) - (23
- 1)4 - (22
- 1)5 = 272.
1.7.4. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní pouze,
že alespoň jeden z týmů z dvojice Ostrava, Olomouc je v tabulce za týmem Brna.
(ligu hraje 16 mužstev)
Řešení. Nejprve určíme tři místa, na kterých se umístily celky Brna, Olomouce
a Ostravy. Ty lze vybrat c(3, 16) = 16
3 způsoby. Z šesti možných pořadí zmíněných
tří týmů na vybraných třech místech vyhovují podmínce ze zadání čtyři. Pro
libovolné pořadí těchto týmů na libovolně vybraných třech místech pak můžeme nezávisle
volit pořadí zbylých 13 týmů na ostatních místech tabulky. Podle pravidla
součinu je tedy hledaný počet tabulek roven
16
3
 4  13!
1.7.5. V jisté zemi mají parlament, ve kterém zasedá 200 poslanců. Dvě hlavní
politické strany, které v zemi existují si při ,,volbách házejí o každý poslanecký
mandát zvlášť mincí. Každá z těchto stran má přidělenu jednu stranu mince. Té
straně, jejíž strana mince padne, náleží mandát, o který se právě losovalo. Jaká je
pravděpodobnost, že každá ze stran získá 100 mandátů? (mince je ,,poctivá )
Řešení. Všech možných výsledků losování (uvažovaných jako dvousetčlenné posloupnosti
rubů a líců) je 2200
. Pokud každá strana získá právě sto mandátů, je ve
vylosované posloupnosti právě sto líců a sto rubů. Takových posloupností je 200
100
(taková posloupnost je jednoznačně určená výběrem sto členů z dvě sta možných,
na kterých budou např. líce). Celkem je hledaná pravděpodobnost
200
100
2200
=
200!
100!100!
2200
1.8. Poznámka. Všimněme si, že v předchozím příkladu jsme mimochodem kombinatoricky
dokázali nerovnost
200
100
< 2200
,
resp. malým zobecněním dokonce pro libovolná k, n  N, k  n
n
k
< 2n
.
2. KOMBINATORICKÉ FORMULE 7
1.8a
1.9. Permutace, kombinace a variace s opakováním. Pořadí n prvků, z nichž
mezi některými nerozlišujeme, nazýváme permutace s opakovaním. Nechť je mezi
n danými prvky p1 prvků prvního druhu, p2 prvků druhého druhu, . . . , pk prvků
k-tého druhu, p1 +p2 +  +pk = n, potom počet pořadí těchto prvků s opakováním
budeme značit P(p1, . . . , pk). Zřejmě platí
P(p1, . . . , pk) =
n!
p1!    pk!
.
Volný výběr prvků z n možností, včetně pořadí, nazýváme variace k-tého stupně
s opakováním, jejich počet budeme značit V (n, k). Předpokládáme, že stále máme
pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem
vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí
V (n, k) = nk
.
Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním
a pro jejich počet píšeme C(n, k).
Věta. Počet kombinací s opakováním k-té třídy z n prvků je pro všechny 0  k a
0 < n
C(n, k) =
n + k - 1
k
.
Důkaz. Důkaz je opřen o trik (jednoduchý, když ho někdo už zná). Nechť
x1, . . . , xk je kombinace libovolných prvků z dané množiny
S = {a1, . . . , an},
na které si zafixujeme uvedené pořadí prvků. Jednotlivé volby xi přidáme do pořadí
a1, . . . tam, kde je shodný prvek. Např. pro S = {a, b, c, d} a volbu x1 = b, x2 = c,
x3 = b dostaneme S = [a, b, b, b, c, c, d]. Nyní si uvědomme, že pro rozpoznání
původní kombinace nám stačí vědět, kolik je prvků v jednotlivých skupinách (je
tam vždy právě o jeden prvek více než kolik patří do kombinace). Můžeme si to
znázornit
a | bbb | cc | d  |    |  | ,
protože příslušnost jednotlivých přihrádek k prvkům S je námi pevně zvolena.
Počet C(n, k) je proto roven počtu možných umístění přihrádek |, tj. výběr
n - 1 pozic z n + k - 1 možných.
Příklady na procvičení:
4.
1.10. Příklady.
1.10.1. Určení počtu řešení rovnice. Pro libovolné pevné n  N určete počet
všech řešení rovnice
x1 + x2 +    + xk = n
v množině přirozených čísel.
Řešení. Řešení je samozřejmě velice silně závislé na tom, jestli považujeme nulu
za přirozené číslo. Rozhodněme se, že ne, ale určeme nejprve počet řešení rovnice v
množině celých nezáporných čísel. Každé řešení (r1, . . . , rk),
k
i=1 ri = n můžeme
jednoznačně zašifrovat jako posloupnost jedniček a nul, ve které napíšeme nejprve
r1 jedniček, pak nulu, pak r2 jedniček, nulu a tak dále. Posloupnost bude celkem
8 1. ÚVOD A MOTIVACE
obsahovat n jedniček a k - 1 nul. Každá taková posloupnost navíc zřejmě určuje
nějaké řešení dané rovnice. Je tedy řešení tolik, kolik je posloupností, tedy n+k-1
n .
Hledáme-li řešení v oboru přirozených čísel, tak si všimněme, že přirozená čísla
x1, . . . xk jsou řešením dané rovnice, právě když jsou celá nezáporná čísla yi = xi-1,
i = 1, . . . , k, řešením rovnice
y1 + y2 +    + yk = n - k.
Těch je podle první části řešení n-1
k-1 .
1.10.2. Kolika způsoby lze do tří různých obálek rozmístit pět shodných stokorun
a pět shodných tisícikorun tak, aby žádná nezůstala prázdná?
Řešení. Nejdříve zjistíme všechna rozmístění bez podmínky neprázdnosti. Těch je
podle pravidla součinu (rozmísťujeme nezávisle stokoruny a tisícikoruny) C(3, 5)2
=
7
2
2
. Odečteme postupně rozmístění, kdy je právě jedna obálka prázdná, a poté kdy
jsou dvě obálky prázdné. Celkem C(3, 5)2
-3(C(2, 5)2
-2)-3 = 7
2
2
-3(62
-2)-3 =
336.
1.10.3. Určete počet různých vět, které vzniknou přesmyčkami v jednotlivých slovech
věty ,,Skokan na koks (vzniklé věty ani slova nemusejí dávat smysl).
Řešení. Určíme nejprve počty přesmyček jednotlivých slov. Ze slova ,,skokan dostaneme
6!/2 různých přesmyček (permutace s opakováním P(1, 1, 1, 1, 2)), obdobně
ze slova ,,na dvě a ze slova ,,koks 4!/2. Celkem podle pravidla součinu 6!4!/2.
1.10.4. Kolik existuje různých přesmyček slova ,,krakatit takových, že mezi písmeny
,,k je právě jedno jiné písmeno.
Řešení. V uvažovaných přesmyčkách je šest možností, jak umístit skupinu dvou
,,k . Fixujeme-li pevně místa pro dvě písmena ,,k , pak ostatní písmena můžeme
rozmístit na zbylých šest míst libovolně, tedy P(1, 1, 2, 2) způsoby. Celkem podle
pravidla součinu je hledaný počet
6  P(1, 1, 2, 2) =
6  6!
2  2
.
1.10.5. Kolika způsoby můžeme do pěti různých důlků vybrat po jedné kouli, vybírámeli
ze čtyř bílých, čtyř modrých a tří červených koulí?
Řešení. Nejprve řešme úlohu v případě, že bychom měli k dispozici alespoň pět
koulí od každé barvy. V tomto případě se jedná o volný výběr pěti prvků ze tří
možností, tedy o variace s opakováním třetí třídy z pěti prvků (viz odstavec 2.4.
učebních textů). Máme
V (3, 5) = 35
.
Nyní odečteme ty výběry, ve kterých se vyskytují buď pouze koule stejné barvy
(takové výběry jsou tři), nebo právě čtyři koule červené (takových výběrů je 10 =
2  5; nejprve vybereme barvu koule, která nebude červená ­ dvě možnosti ­ a poté
důlek, ve kterém bude ­ pět možností). Celkem tedy máme
35
- 3 - 10 = 230
možných výběrů.
3. DIFERENČNÍ ROVNICE 9
3. Diferenční rovnice
V předchozích odstavcích jsme viděli formule, které zadávaly hodnotu skalární
funkce definované na přirozených číslech (faktoriál) nebo dvojicích čísel (binomická
čísla) pomocí předcházejících hodnot. Tomu lze rozumět také tak, že místo hodnoty
naší funkce zadáváme její změnu při odpovídající změně nezávislé proměnné.
Porovnejte si formule v 1.4 a v 1.6. Takto se skutečně velice často postupuje při
matematické formulaci modelů, které popisují reálné systémy v ekonomice, biologii
apod. My si tu povšimneme jen několika jednoduchých případů a budeme se k této
tématice postupně vracet.
1.8
1.11. Lineární rovnice prvního řádu. Obecnou diferenční rovnicí prvního řádu
rozumíme výraz
f(n + 1) = F(n, f(n)),
kde F je známá skalární funkce závislá na dvojicích přirozených čísel. Je zřejmé,
že takový vztah, spolu s volbou pro f(0), zadává jednoznačně celou nekonečnou
posloupnost hodnot f(0), f(1), . . . , f(n), . . . . Jako příklad může sloužit definiční
formule pro faktoriál, tj. n! = n  (n - 1)!. Vidíme, že skutečně vztah pro f(n + 1)
závisí na n i hodnotě f(n).
Po konstantní závislosti je nejjednodušší tzv. lineární diferenční rovnice
e1.4 (1.5) f(n + 1) = a  f(n) + b,
kde a, b  N. Takovou rovnici umíme snadno řešit. Je-li b = 0, pak zjevně
f(n) = an
f(0).
To je např. vztah pro tzv. Malthusiánský model populačního růstu, který vychází
z představy, že za zvolený časový interval vzroste populace s konstantní úměrou a
vůči předchozímu stavu. Dokážeme si obecný výsledek pro rovnice prvního řádu,
které se podobají lineárním, ale připouští proměnné koeficienty a a b, tj.
e1.5 (1.6) f(n + 1) = an  f(n) + bn
1.9 1.12. Věta. Obecné řešení diferenční rovnice (1.6) prvního řádu s počáteční podmínkou
f(0) = y0 je dáno vztahem
e1.6 (1.7) f(n) =
n-1Y
i=0
ai
!
y0 +
n-1X
r=0
n-1Y
i=r+1
ai
!
br.
Důkaz. Tvrzení dokážeme matematickou indukcí. Pro zjednodušení zápisu užíváme
konvenci, že konečný součin s prázdnou množinou součinitelů je roven jedné (podobně jako
součet s prázdnou množinou sčítanců je roven nule). To je zapotřebí v samotné formuli v
pravém sčítanci pro hodnotu r = n - 1, kde není žádné vyhovující i.
Zjevně pak tvrzení platí pro n = 1, kdy se jedná právě o definiční vztah f(1) =
a0y0 +b0. Předpokádáme-li, že tvrzení platí pro libovolné pevně zvolené n, můžeme snadno
spočíst:
f(n + 1) = an
n-1Y
i=0
ai
!
y0 +
n-1X
r=0
n-1Y
i=r+1
ai
!
br
!
+ bn
=
nY
i=0
ai
!
y0 +
nX
r=0
nY
i=r+1
ai
!
br,
jak se přímo vidí roznásobením výrazů.
10 1. ÚVOD A MOTIVACE
1.10 1.13. Důsledek. Obecné řešení lineární diferenční rovnice (1.5) s a = 1 a počáteční
podmínkou f(0) = y0 je
e1.7 (1.8) f(n) = an
y0 +
1 - an
1 - a
b.
Důkaz. Dosazením konstantních hodnot za ai a bi do obecné formule dostáváme
zjevně první sčítanec okamžitě. Pro vyčíslení součtu součinů v druhém si je
třeba všimnout, že se jedná o výrazy (1 + a +    + an-1
)b. Sečtením této geometrické
řady (připomeňme, že 1 - an
= (1 - a)(1 + a +    + an-1
)) dostaneme právě
požadovaný výsledek.
Uveďme si praktické příklady na řešení diferenčních rovnic prvního řádu:
1.14. Příklady.
1.14.1. Splácení půjčky Mirek si chce koupit nové auto. Auto stojí 300 000 Kč.
Mirek by chtěl auto koupit na měsíční splátky. Prodávající společnost mu nabízí
půjčku na koupi auta s ročním úrokem 6%. Mirek bych chtěl auto splatit za tři
roky. Jak vysoká bude měsíční splátka?
Řešení. Označme Mirkovu měsíční splátku S. Po prvním měsíci splatí Mirek S
korun, z nichž část půjde na vlastní splátku, část na splacení úroku. Částku, kterou
bude Mirek dlužit po uplynutí k měsíců označme dk. Po prvním měsíci bude Mirek
dlužit
(1.9) d1 = 300000 - S +
0, 06
12
300000.
Obecně po uplynutí k-tého měsíce
lr (1.10) dk = dk-1 - S +
0, 06
12
dk-1.
Podle vztahu (1.8) je dk dáno následovně
(1.11) dk = 1 +
0, 06
12
k
300000 - 1 +
0, 06
12
k
- 1
12S
0, 06
.
Splacení po třech letech se rovná podmínce d36 = 0, odkud dostáváme
(1.12) S = 300000
0,06
12
1 - (1 + 0,06
12 )-36
.
= 9127.
Všimněme si, že rekurentní vztah (1.10) můžeme použít na náš příklad pouze
tak dlouho, dokud budou všechna y(n) kladná, tj. dokud bude Mirek skutečně něco
dlužit.
Otázka. Jak dlouho by Mirek auto splácel, kdyby chtěl měsíčně splácet 5000 Kč?
Řešení. Při označení q = 1, 005, c = 300000 nám podmínka dk = 0 dává vztah
qk
=
200S
200S - c
,
jehož logaritmováním obdržíme
k =
ln 200S - ln(200S - c)
ln g
,
3. DIFERENČNÍ ROVNICE 11
což pro S = 5000 dává přibližně k = 71, 5, tedy splácení půjčky by trvalo šest let
(poslední splátka by nebyla plných 5 000 Kč).
1.14.2. Stavební spoření. Kolik peněz naspořím na stavebním spoření za pět let,
vkládám-li 3000 Kč měsíčně (vždy k 1. v měsíci), vklad je úročen roční úrokovou
mírou 3% (úročení probíhá jednou za rok) a od státu obdržím ročně příspěvek 1500
Kč? (státní příspěvek se připisuje vždy až 1.května následujícího roku)
Řešení. Označme množství naspořených peněz po n-tém roce jako xn. Potom
dostáváme (pro n > 2) následující rekurentní formuli (navíc předpokládáme, že
každý měsíc je přesně dvanáctina roku)
xn+1 = 1, 03(xn) + 36000 + 1500 + 0, 03  3000 1 +
11
12
+    +
1
12
úroky z vkladů za aktuální rok
+
+ 0, 03 
2
3
 1500
úrok ze státního příspěvku připsaného v aktuálním roce
=
= 1, 03(xn) + 38115
Tedy
xn = 38115
n-2
i=0
(1, 03)i
+ (1, 03)n-1
x1 + 1500,
přičemž x1 = 36000 + 3000 1 + 11
12 +    + 1
12 = 36585, celkem
x5 = 38115
(1, 03)4
- 1
0, 03
+ (1, 03)4
 36585 + 1500
.
= 202136.
1.15. Poznámka. Ve skutečnosti úročení probíhá podle počtu dní, které jsou peníze
na účtu. Obstarejte si skutečný výpis ze stavebního spoření, zjistěte si jeho
úročení a zkuste si spočítat připsané úroky za rok. Porovnejte je se skutečně připsanou
sumou. Počítejte tak dlouho, dokud sumy nebudou souhlasit . . .
1.15.1. Určete posloupnost {yn}
n=1, která vyhovuje následuje následujícímu rekurentnímu
vztahu
yn+1 =
3
2
yn + 1, n  1, y1 = 1.
Řešení. yn = 2(3
2 )n
- 2.
1.11
1.16. Rovnice druhého řádu. Obecně nazýváme diferenční rovnicí řádu k vztah
f(n + k) = F(n, f(n), . . . , f(n + k - 1)) = 0,
kde F je známá skalární funkce v k + 1 proměnných skalárních veličinách. Celá
poslounost hodnot je jednoznačně určena volbou k-tice čísel f(0), . . . , f(k - 1).
Lineární diferenční rovnicí druhého řádu rozumíme
e1.8 (1.13) f(n + 2) = a  f(n + 1) + b  f(n) + c,
kde a, b, c jsou známé skalární koeficienty. Dobře známým příkladem s c = 0 je
např. Fibonacciho posloupnost čísel y0, y1, . . . , viz příklad 1.17.1. Zkusme dosadit
12 1. ÚVOD A MOTIVACE
do rovnice (1.13) podobné řešení jako u lineárních, tj. f(n) = n
pro nějaké skalární
. Dosazením dostáváme
n+2
- an+1
- bn
= n
(2
- a - b) = 0
a odtud vidíme, že buď je  = 0 nebo
1 =
1
2
(a + a2 + 4b), 2 =
1
2
(a - a2 + 4b).
Protože součet dvou řešení rovnice f(n + 2) - a  f(n + 1) - b  f(n) = 0 je opět
řešením téže rovnice a totéž platí pro konstatní násobky řešení, odvodili jsme obecné
řešení f(n) = C1n
1 +C2n
2 a pro jednoznačné vyřešení konkrétní úlohy se zadanými
počátečními hodnotami f(0) a f(1) nám zbývá jen najít příslušné konstanty C1 a
C2. Ukažme alespon na jednom příkladě.
e1.9 (1.14)
yn+2 = yn+1 +
1
2
yn
y0 = 2, y1 = 0.
V našem případě je tedy 1,2 = 1
2 (1 

3) a zjevně y0 = C1 + C2 = 2 a y1 =
1
2 C1(1 +

3) + 1
2 C2(1 -

3) je splněno pro právě jednu volbu těchto konstant.
Přímým výpočtem C1 = 1 - 1
3

3, C2 = 1 + 1
3

3.
Tento příklad je velice poučný z mnoha důvodů. Na první pohled je vidět, že použitá
metoda funguje pro obecné lineární diferenční rovnice bez absolutních členů.
Řešení tu lze hledat pomocí kořenů tzv. charakteristického polynomu rovnice. Dále
si všimněme, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají
složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o
samotném řešení dopředu víme, že je celočíselné též. Bez tohoto ,,úkroku do většího
oboru skalárů bychom ovšem obecné řešení napsat neuměli. S podobnými jevy
se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého
vyčíslování konstant diskutovat kvalitativní chování posloupnosti čísel f(n), tj. zda
se budou s rostoucím n blížit k nějaké pevné hodnotě nebo utečou do neomezených
kladných nebo záporných hodnot.
Ukážeme ,,populační model , který je příkladem na rekurentní rovnici druhého
řádu:
1.17. Příklady.
1.17.1. Fibonacciho posloupnost. Na začátku jara přinesl čáp na louku dva1.
čerstvě narozené zajíčky, samečka a samičku. Samička je schopná od dvou měsíců
stáří povít každý měsíc dva malé zajíčky (samečka a samičku). Nově narození zajíci
splodí potomky po jednom měsíci a pak každý další měsíc. Každá samička je březí
jeden měsíc a pak opět porodí samečka a samičku. Kolik párů zajíců bude na louce
po devíti měsících (pokud žádný neumře a žádný se tam ,,nepřistěhuje )?
Řešení. Po uplynutí prvního měsíce je na louce pořád jeden pár, nicméně samička
otěhotní. Po dvou měsích se narodí první potomci, takze na louce budou dva páry.
Po uplynutí každého dalšího měsíce se narodí (tedy přibude) tolik zajíců, kolik otěhotnělo
zaječic před měsícem, což je přesně tolik, kolik bylo před měsícem párů
schopných splodit potomka, což je přesně tolik, kolik bylo párů před dvěma měsíci.
Celkový počet pn zajíců po uplynutí n-tého měsíce tak je tak součtem počtů
3. DIFERENČNÍ ROVNICE 13
párů v předchozích dvou měsících. Pro počet párů zajíců na louce tedy dostáváme
homogenní lineární rekuretní formuli
fib (1.15) pn+2 = pn+1 + pn, n = 1, . . . ,
která spolu s počátečními podmínkami p1 = 1 a p2 = 1 jednoznačně určuje počty
párů zajíců na louce v jednotlivých měsících. Linearita formule znamená, že všechny
členy posloupnosti (pn) jsou ve vztahu v první mocnině, rekurence je snad jasná
a homogenita značí, že v předpisu chybí absolutní člen (viz dále pro nehomogenní
formule). Pro hodnotu n-tého členu můžeme odvodit explicitní formuli. V hledaní
formule nám pomůže pozorování, že pro jistá r je funkce rn
řešením rekurentní
formule bez počátečních podmínek. Tato r získáme prostě tak, že dosadíme do
rekurentního vztahu:
rn+2
= rn+1
+ rn
a po vydělení rn
dostanemefib (1.16)
r2
= r + 1,(1.17)
což je tzv. charakteristická rovnice daného rekurentního vztahu. Naše rovnice má
kořeny 1-

5
2 a 1+

5
2 a tedy posloupnosti an = (1-

5
2 )n
a bn = (1+

5
2 )n
, n  1
vyhovují danému vztahu. Zřejmě také jejich libovolná lineární kombinace cn =
san +tbn, s, t  R. Čísla s a t můžeme zvolit tak, aby výsledná kombinace splňovala
dané počáteční podmínky, v našem případě c1 = 1, c2 = 1. Pro jednoduchost je
vhodné navíc ještě dodefinovat nultý člen posloupnosti jako c0 = 0 a spočítat s a t
z rovnic pro c0 a c1. Zjistíme, že s = - 1
5
, t = 1
5
a tedy
(1.18) pn =
(1 +

5)n
- (1 -

5)n
2n(

5)
.
Takto zadaná posloupnost splňuje danou rekurentní formuli a navíc počáteční podmínky
c0 = 0, c1 = 1, jedná se tedy o tu jedinou posloupnost, která je těmito
požadavky jednoznačně zadána.
Posloupnost zadaná rekurentní formulí (1.15) se nazývá Fibonacciho posloupnost.
Tato formule je příkladem homogenní lineární diferenční rovnice. Další příklad
ukáže na ekonomickém modelu případ tzv. nehomogenní diferenční rovnice
1.17.2. Zjednodušený model chování národního produktu3.
(1.19) yk+2 - a(1 + b)yk+1 + abyk = 1,
kde yk je národní produkt v roce k, konstanta a je takzvaný mezní sklon ke spotřebě,
což je makroekonomický ukazatel, který udává jaký zlomek peněz, které mají obyvatelé
k dispozici, utratí a konstanta b popisuje jak závisí míra investic soukromého
sektoru na mezním sklonu ke spotřebě.
Předpokládáme dále, že velikost národního produktu je normována tak, aby na
pravé straně rovnice vyšlo číslo 1.
Spočítejte konkrétní hodnoty pro a = 3
4 , b = 1
3 , y0 = 1, y1 = 1.
Řešení.
Nejprve budeme hledat řešení homogenní rovnice (pravá strana nulová) ve tvaru
rk
. Číslo r musí být řešením charakteristické rovnice
x2
- a(1 + b)x + ab = 0, tj. x2
- x +
1
4
= 0,
14 1. ÚVOD A MOTIVACE
která má dvojnásobný kořen 1
2 . Všechna řešení homogenní rovnice jsou potom tvaru
a(1
2 )n
+ bn(1
2
n
).
Dále si všimněme, že najdeme-li nějaké řešení nehomogenní rovnice (tzv. partikulární
řešení), tak pokud k němu přičteme libovolné řešení homogenní rovnice,
obdržíme jiné řešení nehomogenní rovnice. Lze ukázat, že takto získáme všechna
řešení nehomogenní rovnice.
V našem případě (tj. pokud jsou všechny koeficienty i nehommogenní člen konstantami)
je partikulárním řešením konstanta yn = c, dosazením do rovnice máme
c - c + 1
4 c = 1, tedy c = 4. Všechna řešení diferenční rovnice
yk+2 - yk+1 +
1
4
yk = 1
jsou tedy tvaru 4 + a(1
2 )n
+ bn(1
2 )n
. Požadujeme y0 = y1 = 1 a tyto dvě rovnice
dávají a = b = -3, tedy řešení naší nehomogenní rovnice je
yn = 4 - 3
1
2
n
- 3n
1
2
n
.
Opět, protože víme, že posloupnost zadaná touto formulí splňuje danou diferenční
rovnici a zároveň dané počáteční podmínky, jedná se vskutku o tu jedinou posloupnost,
která je těmito vlastnostmi charakterizována.
V předchozím příkladu jsme použili tzv. metodu neurčitých koeficientů. Ta spočívá
v tom, že na základě nehomogenního členu danéneho diferenční rovnice ,,uhodneme
tvar partikulárního řešení. Tvary partikulárních řešení jsou známy pro celou
řadu nehomogenních členů. Např. rovnice
(1.20) yn+k + a1yn+k-1 +    + akyn = Pm(n),
s reálnými kořeny charakteristické rovnice má partikulární řešení tvaru Qm(n), kde
Pm(n) a Qm(n) jsou polynomy stupně m.
Další možnou metodou řešení je tzv. variace konstant, kdy nejprve najdeme
řešení
y(n) =
k
i=1
cifi(n)
zhomogenizované rovnice a po té uvažujeme konstanty ci jako funkce ci(n) proměnné
n a hledáme partikulární řešení dané rovnice ve tvaru
y(n) =
k
i=1
ci(n)fi(n).
Ukažme si na obrázku hodnoty fi pro i  35 a rovnicí
f(n) =
9
8
f(n - 1) -
3
4
f(n - 2) +
1
2
, f(0) = f(1) = 1
3. DIFERENČNÍ ROVNICE 15
x
1
35
0,95
30
0,9
0,85
25
0,8
0,75
20
0,7
151050
1.17.3. Nalezněte explicitní vzorec pro posloupnost vyhovující následující lineární
diferenční rovnici s počátečními podmínkami:
xn+2 = 2xn + n, x1 = 2, x2 = 2.
Řešení. Zhomogenizovaná rovnice je
xn+2 = 2xn.
Její charakteristický polynom je x2
- 2, jeho kořeny jsou 

2. Řešení zhomogenizované
rovnice je tedy tvaru
a(

2)n
+ b(-

2)n
, pro libovolné a, b  R
Partikulární řešení budeme hledat metodou neurčitých koeficientů. Nehomogenní
část dané rovnice je lineární polynom n, partikulární řešení proto budeme
nejprve hledat ve tvaru lineárního polynomu v proměnné n, tedy kn+l, kde k, l  R.
Dosazením do původní rovnice dostáváme
k(n + 2) + l = 2(kn + l) + n.
Porovnáním koeficientů u proměnné n na obou stranách rovnice dostáváme vztah
k = 2k +1, tedy k = -1, porovnáním absolutních členů pak vztah 2k +l = 2l, tedy
l = -2. Celkem partikulárním řešením je posloupnost -n - 2.
Řešení dané nehomogenní diferenční rovnice druhého řádu bez počátečních podmínek
jsou tedy tvaru a(

2)n
+ b(-

2)n
- n - 2, a, b  R.
Nyní dosazením do počátečních podmínek určíme neznámé a, b  R. Pro početní
jednoduchost použijeme malého triku: z počátečních podmínek a daného rekurentního
vztahu vypočteme člen x0 : x0 = 1
2 (x2 - 0) = 1. Daný rekurentní vztah
spolu s podmínkami x0 = 1 a x1 = 1 pak zřejmě splňuje tatáž posloupnost, která
splňuje původní počáteční podmínky. Máme tedy následující vztahy pro a, b:
x0 : a(

2)0
+ b(-

2)0
- 2 = 1, tedy a + b = 3
x1 :

2a -

2b = 4,
jejichž řešením dostáváme a = 6+5

2
4 , b = 6-5

2
4 . Řešením je posloupnost
xn =
6 + 5

2
4
(

2)n
+
6 - 5

2
4
(-

2)n
- n - 2.
16 1. ÚVOD A MOTIVACE
1.17.4. Určete reálnou bázi prostoru řešení homogenní diferenční rovnice
xn+4 = xn+3 + xn+1 - xn,
Řešení. Charakteristický polynom dané rovnice je x4
-x3
-x+1. Hledáme-li jeho
kořeny, řešíme reciprokou rovnici
x4
- x3
- x + 1 = 0
Standardním postupem nejprve vydělíme rovnici výrazem x2
a poté zavedeme substituci
t = x + 1
x , tedy t2
= x2
+ 1
x2 + 2. Obdržíme rovnici
t2
- t - 2 = 0,
s kořeny t1 = -1, t2 = 2. Pro obě tyto hodnoty neznámé t pak řešíme zvlášť rovnici
danou substitučním vztahem:
x +
1
x
= -1.
Ta má dva komplexní kořeny x1 = -1
2 + i

3 = cos(120
) + i sin(120
) a x2 =
-1
2 - i

3 = cos(120
) - i sin(120
).
Pro druhou hodnotu neznámé t dostáváme rovnici
x +
1
x
= 2
s dvojnásobným kořenem 1. Celkem je tedy bazí hledaného vektorového prostoru posloupností,
které jsou řešením dané diferenční rovnice následující čtveřice posloupností:
{-1
2 + i

3}
n=1, {-1
2 - i

3}
n=1,{1}
n=1 (konstantní posloupnost) a {n}
n=1.
Hledáme-li však reálnou bazi, musíme nahradit dva generátory (posloupnosti) z
této báze s komplexními hodnotami generátory reálnými. Protože tyto generátory
odpovídají geometrickým řadám, jejichž libovolné členy jsou komplexně združená
čísla, můžeme vzít jako vhodné generátory posloupnosti dané polovinou součtu,
resp. polovinou i-násobku rozdílu, daných komplexních generátorů. Takto dostaneme
následující reálnou bázi řešení: {1}
n=1 (konstantní posloupnost), {n}
n=1,
{cos(n  120
)}
n=1, {sin(n  120
)}
n=1.
1.17.5. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}
n=1 vyhovující
následujícím podmínkám:
xn+2 = xn+1 - xn, , x1 = 1, x2 = 5.
Řešení. xn = 2

3 sin(n  60
) - 4 cos(n  60
).
1.17.6. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}
n=1 vyhovující
následujícím podmínkám:
-xn+3 = 2xn+2 + 2xn+1 + xn, , x1 = 1, x2 = 1 x3 = 1.
Řešení. xn = -3(-1)n
- 2 cos(n  120
) - 2

3 sin(n  120
).
1.17.7. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}
n=1 vyhovující
následujícím podmínkám:
-xn+3 = 3xn+2 + 3xn+1 + xn, , x1 = 1, x2 = 1, x3 = 1.
Řešení. xn = (-1)n
(-2n2
+ 8n - 7).
4. PRAVDĚPODOBNOST 17
1.12
1.18. Nelineární příklad. Vraťme se na chvíli k rovnici prvního řádu, kterou
jsme velice primitivně modelovali populační růst závisející přímo úměrně na okamžité
velikosti populace p. Realističtější model bude mít takto úměrnou změnu
populace p(n) = p(n + 1) - p(n) jen při malých hodnotách p, tj. p/p  r > 0.
Při určité limitní hodnotě p = K > 0 ale naopak už populace neroste a při ještě
větších už klesá. Předpokládejme, že právě hodnoty yn = p(n)/p(n) závisí na p(n)
lineárně. Chceme tedy popsat přímku v rovině proměnných p a y, která prochází
body [0, r] a [K, 0]. Položíme proto
y = -
r
K
p + r.
Dosazením za y dostáváme p(n+1)-p(n) = p(n)(- r
K p(n)+r), tj. diferenční rovnici
prvního řádu
(1.21) p(n + 1) = p(n)(1 -
r
K
p(n) + r).
Zkuste si promyslet nebo vyzkoušet chování tohoto modelu pro různé hodnoty r a
K. Na obrázku je průběh hodnot pro parametry r = 0, 05 (tj. pětiprocentní nárůst
v ideálním stavu), K = 100 (tj. zdroje limitují hodnotu na 100 jedinců) a počáteční
stav jsou právě dva jedinci.
100
80
60
40
20
x
200150100500
4. Pravděpodobnost
Předchozí sekce naznačila, že hodnoty skalárních funkcí umíme definovat pomocí
popisu jejich změn v závislosti na změnách závislé proměnné. Teď se podíváme
na další obvyklý případ ­ sledované hodnoty často nejsou známy ani explicitně formulí,
ani implicitně nějakým popisem. Jsou výsledkem nějaké nahodilosti a my se
snažíme popsat s jakou pravděpodobností nastane ta či ona možnost.
1.19. Co je pravděpodobnost? Nejbanálnějším příkladem může sloužit obvyklé
házení kostkou s šesti stranami s označeními 1, 2, 3, 4, 5, 6. Pokud popisujeme matematický
model takového házení ,,poctivou kostkou, budeme očekávat a tudíž i
předepisovat, že každá ze stran padá stejně často. Slovy to vyjadřujeme ,,každá předem
vybraná strana padne s pravděpodobností 1
6 . Pokud ale si třeba sami nožíkem
vyrobíme takovou kostku, je jisté, že skutečné relativní četnosti výsledků nebudou
18 1. ÚVOD A MOTIVACE
stejné. Pak můžeme z velikého počtu pokusů usoudit na relativní četnosti jednotlivých
výsledků hodů a tyto ustanovit jako pravděpodobnosti v našem matematickém
popisu. Nicméně při sebevětším počtu pokusů nemůžeme vyloučit možnost, že se
náhodou povedla velice nepravděpodobná kombinace výsledků a že se tím náš matematický
model skutečnosti stal (pro tento konkrétní případ) nedobrým.
V dalším budeme pracovat s abstraktním matematickým popisem pravděpodobnosti
v nejjednoduším přiblížení. To, do jaké míry je takový popis adekvátní pro
konkrétní pokusy či jiný problém, je záležitostí mimo samotnou matematiku. To
ale neznamená, že by se takovým přemýšlením neměli zabývat matematikové také
(nejspíše ve spolupráci s jinými experty). Později se vrátíme k pravděpodobnosti
(jakožto teorii popisující chování nahodilých procesů nebo i plně determinovaných
dějů, kde ovšem neznáme přesně všechny určující parametry) a matematické statistice
(jakožto teorii umožňující posoudit, do jaké míry lze očekávat, že vybraný
model je ve shodě s realitou). K tomu ovšem bude již potřebný dosti rozsáhlý
matematický aparát, který budeme mezitím několik semestrů budovat.
1.20. Náhodné jevy. Budeme pracovat s neprázdnou pevně zvolenou množinou
 všech možných výsledků, kterou nazýváme základní prostor. Pro jednoduchost
bude pro nás  konečná množina s prvky 1, . . . , n, představujícími jednotlivé
možné výsledky. Každá podmnožina A   představuje možný jev. Systém podmnožin
A základního prostoru se nazývá jevové pole, jestliže
*   A, tj. základní prostor, je jevem,
* je-li A, B  A, pak A\B  A, tj. pro každé dva jevy je jevem i jejich množinový
rozdíl,
* jsou-li A, B  A, pak A  B  A, tj. pro každé dva jevy je jevem i jejich
sjednocení.
Slovy se tak dá jevové pole charakterizovat jako systém podmnožin (konečného)
základního prostoru uzavřený na průniky, sjednocení a rozdíly. Jednotlivé množiny
A  A nazýváme náhodné jevy (vzhledem k A).
Zjevně je i komplement Ac
=  \ A jevu A je jevem, který nazýváme opačný
jev k jevu A. Průnik dvou jevů opět jevem, protože pro každé dvě podmnožiny A,
B   platí
A \ ( \ B) = A  B.
Pro naše házení kostkou je  = {1, 2, 3, 4, 5, 6} a jevové pole je tvořeno všemi
podmnožinami. Např. náhodný jev {1, 3, 5} pak interpretujeme jako ,,padne liché
číslo .
Něco málo terminologie, která by měla dále připomínat souvislosti s popisem
skutečných modelů:
* celý základní prostor  se nazývá jistý jev, prázdná podmnožina   A se
nazývá nemožný jev,
* jednoprvkové podmnožiny {}   se nazývají elementární jevy,
* společné nastoupení jevů Ai, i  I, odpovídá jevu iIAi, nastoupení alespoň
jednoho z jevů Ai, i  I, odpovídá jevu iIAi,
* A, B  A jsou neslučitelné jevy, je-li A  B = ,
* jev A má za důsledek jev B, když A  B,
* je-li A  A, pak se jev B =  \ A nazývá opačný jev k jevu A, píšeme B = Ac
.
Přestavte si příklady všech uvedených pojmů pro jevový prostor popisující házení
kostkou nebo obdobně pro házení mincí!
4. PRAVDĚPODOBNOST 19
1.21. Definice. Pravděpodobnostní prostor je jevové pole A podmnožin (konečného)
základního prostoru , na kterém je definována skalární funkce P : A  R s
následujícími vlastnosti:
* je nezáporná, tj. P(A)  0 pro všechny jevy A,
* je aditivní, tj. P(A  B) = P(A) + P(B), kdykoliv je A  B =  a A, B  A,
* pravděpodobnost jistého jevu je 1.
Funkci P nazýváme pravděpodobností na jevovém poli (, A).
Zjevně je okamžitým důsledkem našich definic řada prostých ale užitečných
tvrzení. Např. je pro všechny jevy
P(Ac
) = 1 - P(A).
Dále můžeme matematickou indukcí snadno rozšířit aditivnost na jakýkoliv konečný
počet neslučitelných jevů Ai  , i  I, tj.
P(iIAi) =
iI
P(Ai), kdykoliv je Ai  Aj = , i = j, i, j  I.
1.22. Definice. Nechť  je konečný základní prostor a nechť jevové pole A je právě
systém všech podmnožin v . Klasická pravděpodobnost je takový pravděpodobnostní
prostor (, A, P) s pravděpodobnostní funkcí P : A  R,
P(A) =
|A|
||
.
Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, ověřte si samostatně
všechny požadované axiomy.
1.23. Příklady.
1.23.1. Smrt na silnici. Ročně zahyne na silnicích v ČR přibližně 1200 českých
občanů. Určete pravděpodobnost, že někdo z vybrané skupiny pěti set Čechů zemře
v následujících deseti letech při dopravní nehodě. Předpokládejte pro zjednodušení,
že každý občan má v jednom roce stejnou ,,šanci zemřít při dopravní nehodě a to
1200/107
.
Řešení. Spočítejme nejprve pravděpodobnost, že jeden vybraný člověk v následujících
deseti letech nezahyne na při dopravní nehodě. Pravděpodobnost, že nezahyne
v jednom roce, je (1 - 12
105 ). Pravděpodobnost, že nezahyne v následujících
deseti letech, je pak (1 - 12
105 )10
. Pravděpodobnost, že v následujících deseti letech
nezahyne nikdo z daných pěti set lidí, je opět podle pravidla součinu (jedná se o
nezávislé jevy) (1 - 12
105 )5000
. Pravděpodobnost jevu opačného, tedy toho, že někdo
z vybraných pěti set lidí zahyne, je tedy
1 - (1 -
12
105
)5000 .
= 0, 45.
1.23.2. Ruleta. Alešovi zbylo 2500 Kč z pořádání tábora. Aleš není žádný ňouma:
50 Kč přidal z kasičky a rozhodl se jít hrát ruletu na automaty. Aleš sází pouze na
barvu. Pravděpodobnost výhry při sázce na barvu je 18/37. Začíná sázet na 10 Kč
a pokud prohraje, v další sázce vsadí dvojnásobek toho, co v předchozí (pokud na
to ještě má, pokud ne, tak končí s hrou ­ byť by měl ještě peníze na nějakou menší
sázku). Pokud nějakou sázku vyhraje, v následující sázce hraje opět o 10 Kč. Jaká
20 1. ÚVOD A MOTIVACE
je pravděpodobnost, že při tomto postupu vyhraje dalších 2550 Kč? (jakmile bude
2500 Kč v plusu, tak končí)
Řešení. Nejprve spočítejme, kolikrát po sobě může Aleš prohrát. Začíná-li s 10
Kč, tak na n vsazení potřebuje
10 + 20 +    + 10  2n-1
= 10(
n-1
i=0
2i
) = 10(
2n
- 1
2 - 1
) = 10  (2n
- 1).
Jak snadno nahlédneme, číslo 2550 je tvaru 10(2n
- 1) a to pro n = 8. Aleš tedy
může sázet osmkrát po sobě bez ohledu na výsledek sázky, na devět sázek by potřeboval
již 10(29
- 1) = 5110 Kč a to v průběhu hry nikdy mít nebude (jakmile bude
mít 5100 Kč, tak končí). Aby tedy jeho hra skončila neúspěchem, musel by prohrát
osmkrát v řadě. Pravděpodobnost prohry při jedné sázce je 19/37, pravděpodbnost
prohry v osmi po sobě následujících (nezávislých) sázkách je tedy (19/37)8
. Pravděpodobnost,
že vyhraje 10 Kč (při daném postupu) je tedy 1 - (19/37)8
. Na to,
aby vyhrál 2500 Kč, potřebuje 255 krát vyhrát po desetikoruně. Tedy opět podle
pravidla součinu je pravděpodobnost výhry
1 -
19
37
8 255
.
= 0, 29.
Tedy pravděpodobnost výhry je nižší, než kdyby vsadil rovnou vše na jednu barvu.
1.23.3. Samostatně si můžete vyzkoušet spočítat předchozí příklad za předpokladu,
že Aleš sází stejnou metodou jako v předchozím příkladě, končí však až v okamžiku,
kdy nemá žádné peníze (pokud nemá na vsazení dvojnásobku částky prohrané v
předchozí sázce, ale má ještě nějaké peníze, začíná sázet znovu od 10 Kč).
1.23.4. Do výtahu osmipatrové budovy nastoupilo 5 osob. Každá z nich vystoupí
se stejnou pravděpodobností v libovolném poschodí. Jaká je pravděpodobnost, že
všichni lidé vystoupí
(1) v šestém poschodí,
(2) ve stejném poschodí,
(3) každý v jiném poschodí?
Řešení. Základní prostor všech možných jevů je prostor všech možných způsobů
vystoupení 5 osob z výtahu. Těch je 85
.
V prvním případě je jediná příznivá možnost vystoupení, hledaná pravděpodobnost
je tedy 1
85 , ve druhém případě máme osm možností, hledaná pravděpodobnost
je tedy 1
84 a konečně ve třetím je počet příznivých případů dán pětiprvkovou variací
z osmi prvků (z osmi pater vybíráme pět, ve kterých se vystoupí a dále kteří lidé
vystoupí ve vybraných poschodích), celkem je hledaná pravděpodobnost ve třetím
případě rovna (viz 1.5 a 1.9)
v(5, 8)
V (5, 8)
=
8  7    4
85
.
= 0, 2050781250.
1.23.5. Do řady v kině o 2n místech je náhodně rozmístěno n mužů a n žen. Jaká
je pravděpodobnost, že žádné dvě osoby stejného pohlaví nebudou sedět vedle sebe?
4. PRAVDĚPODOBNOST 21
Řešení. Všech možných rozmístění lidí v řadě je (2n)!, rozmístění splňujících podmínky
je 2(n!)2
(máme dvě možnosti výběru pozice mužů, tedy i žen, na nich jsou
pak muži i ženy rozmístěny libovolně). Výsledná pravděpodobnost je tedy
p(n) =
2(n!)2
(2n)!
, p(2)
.
= 0, 33, p(5)
.
= 0, 0079, p(8)
.
= 0, 00016
1.23.6. Ze skupiny osmi mužů a čtyř žen náhodně vybereme skupinu pěti lidí. Jaká
je pravděpodobnost, že v ní budou alespoň tři ženy?
Pravděpodobnost spočítáme jako podíl počtu příznivých případů ku počtu
všech případů. Příznivé případy rozdělíme podle toho, kolik je v náhodně vybrané
skupině mužů: mohou v ní být buď dva, nebo jeden muž. Skupinek o pěti lidech s
jedním mužem je osm (záleží pouze na výběru muže, ženy v ní musí být všechny),
skupinek se dvěma muži je potom c(8, 2)c(4, 3) = 8
2
4
3 (vybereme dva muže z osmi
a nezávisle na tom tři ženy ze čtyř, tyto dva výběry můžeme nezávisle kombinovat a
podle pravidla součinu dostáváme uvedený počet skupin). Všech možných skupin o
pěti lidech pak můžeme sestavit c(12, 5) = 12
5 . Hledaná pravděpodobnost je tedy
Řešení.
8 + 4
3
8
2
12
5
.
1.23.7. Náhodně vybereme přirozené číslo menší než 105
. Jaká je pravděpodobnost,
že bude složeno pouze z cifer 0, 1, 5 a zároveň bude dělitelné číslem 5?
Řešení. 22
33
-1
105-1 . (v čitateli i jmenovateli odečítáme nulu)
1.23.8. Ze sáčku s pěti bílými a pěti červenými koulemi náhodně vytáhneme tři
(koule do sáčku nevracíme). Jaká je pravděpodobnost, že dvě budou bílé a jedna
červená?
Řešení. Například rozdělíme uvažovaný jev na sjednocení tří disjunktních jevů:
podle toho, kolikátou vytáhneme červenou kouli. Pravděpodobnosti, že vytáhneme
koule přesně ve zvoleném pořadí jsou:
1
2
4
9
5
8
,
1
2
5
9
1
2
,
1
2
5
9
1
2
.
Celkem 5
12 .
1.23.9. Z klobouku, ve kterém je pět bílých, pět červených a šest černých koulí,
náhodně vytahujeme koule (bez vracení). Jaká je pravděpodobnost, že pátá vytažená
koule bude černá?
Řešení. Spočítáme dokonce obecnější úlohu. Totiž pravděpodobnost toho, že i-tá
vytažená koule bude černá, je stejná pro všechna i, 1  i  16. Můžeme si totiž
představit, že vytáhneme postupně všechny koule. Každá taková posloupnost vytažených
koulí (od první vytažené koule po poslední), složená z pěti bílých, pěti červených
a šesti černých koulí, má stejnou pravděpodobnost vytažení. Pravděpodobnost
toho, že i-tá vytažená koule bude černá je tedy rovna podílu počtu posloupností
pěti červených, pěti bílých a šesti černých koulí, kdy je na i-tém místě černá koule
22 1. ÚVOD A MOTIVACE
(těch je tolik, kolik je libovolých posloupností pěti bílých, pěti červených a pěti
černých koulí, tedy P(5, 5, 5) = 15!
5!5!5! ) a počtu všech posloupností složených z pěti
bílých, pěti červených a šesti černých koulí, tedy P(6, 5, 5) = 16!
6!5!5! . Tedy celkem
15!
5!5!5!
16!
6!5!5!
=
3
8
.
1.24. Příklad. Vraťme se k házení kostkou a zkusme popsat jevy ze základního
prostoru  vznikající při házení tak dlouho, dokud nepadne šestka, ne však více
než stokrát.
Pro jeden hod samostatně je základním prostorem šest čísel od jedné do šesti a
jde o klasickou pravděpodobnost. Pro celé série našich hodů bude základní prostor
daleko větší ­ bude to množina konečných posloupností čísel od jedné do šestky,
které buď končí šestkou, mají nejvýše 100 členů a všechna předchozí čísla jsou menší
než šest, nebo jde o 100 čísel od jedné do pěti. Jevem A může být např. podmnožina
,,házení končí druhým pokusem . Všechny příznivé elementární jevy pak jsou
[1, 6], [2, 6], [3, 6], [4, 6], [5, 6].
Ze známé klasické pravděpodobnosti pro jednotlivé hody umíme odvodit pravděpodobnosti
našich jevů v . Není to ale jistě klasická pravděpodobnost. Tak pro
diskutovaný jev chceme popsat, s jakou pravděpodobností nepadne šestka při prvém
hodu a zároveň padne při druhém. Vnucuje se řešení
P(A) =
5
6

1
6
=
5
36
,
protože v prvém hodu padne s pravděpodobností 1 - 1
6 jiné číslo než šest a druhý
hod, ve kterém naopak požadujeme šestku, je zcela nezávislý na prvním. Samozřejmě
toto není poměr počtu příznivých výsledků k velikosti celého stavového
prostoru!
Obecněji můžeme říci, že po právě 1 < k < 100 hodech pokus skončí s pravděpodobností
(5
6 )k-1
 1
6 . Ze všech možností je tedy nejpravděpodobnější, že skončí již
napoprvé.
Jiný příklad, jak z házení kostkou dostat různě pravděpodobné jevy je pozorovat
součty při hodu více kostkami. Uvažujme takto: při hodu jednou kostkou je
každý výsledek stejně pravděpodobný s pravděpodobností 1
6 . Při hodu dvěmi kostkami
je každý předem zvolený výsledek (a, b), tj. dvojice přirozených čísel od jedné
do šesti (včetně pořadí), stejně pravděpodobný s pravděpodobností 1
36 . Pokud se
budeme ptát po dvou pětkách, je tedy pravděpodobnost poloviční než u dvou různých
hodnot bez uvedení pořadí. Pro jednotlivé možné součty uvedené v horním
řádku nám vychází počet možností v řádku dolním:
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
Podobně vyjde pravděpodobnost 1
216 jednotlivých výsledků hodu třemi kostkami,
včetně určeného pořadí. Pokud se budeme ptát na pravděpodobnost výsledného
součtu při hodu více kostkami, musíme pouze určit, kolik je možností, jak daného
součtu dosáhnout a příslušné pravděpodobnosti sečíst.
4. PRAVDĚPODOBNOST 23
Obecně je sčítání pravděpodobností složité. Následující věta je přímým promítnutím
tzv. kombinatorického principu inkluze a exkluze do naší konečné pravděpo-
dobnosti:
1.16 1.25. Věta. Buďte A1, . . . , Ak  A libovolné jevy na základním prostoru  s jevovým
polem A. Pak platí
P(k
i=1Ai) =
k
i=1
P(Ai) -
k-1
i=1
k
j=i+1
P(Ai  Aj)
+
k-2
i=1
k-1
j=i+1
k
=j+1
P(Ai  Aj  A )
-   
+ (-1)k-1
P(A1  A2      Ak).
Jde patrně o dobrý příklad matematického tvrzení, kde nejtěžší je najít dobrou
formulaci a pak se dá říci, že (intuitivně) je tvrzení zřejmé.
Skutečně, díky aditivní vlastnosti pravděpodobnosti si můžeme představit, že
každý jev rozložíme na elementární (tj. jednobodové), jakkoliv ve skutečnosti nemusí
jednoprvkové podmnožiny do jevového pole obecně patřit. Pak je pravděpodobnost
každého jevu dána součtem pravděpodobností jednotlivých elementárních
jevů do něj patřících a tvrzení věty můžeme číst následovně: sečteme všechny pravděpodobnosti
výsledků ze všech Ai zvlášť, pak ovšem musíme odečíst ty, které
tam jsou započteny dvakrát (tj. prvky v průnicích dvou). Teď si ovšem dovolujeme
odečíst příliš mnoho tam, kde ve skutečnosti byly prvky třikrát, tj. korigujeme
přičtením pravděpodobností ze třetího členu, atd.
Aby se takový postup stal důkazem, je zapotřebí si ujasnit, že skutečně všechny
korekce, tak jak jsou napsány, jsou skutečně s koeficienty jedna. Místo toho můžeme
snáze dát dohromady formálnější důkaz matematickou indukcí přes počet k jevů,
jejichž pravděpodobnosti sčítáme. Zkuste si průběžně porovnávat oba postupy, mělo
by to vést k vyjasnění, co to znamená ,,dokázat a co ,,porozumět .
Důkaz. Pro k = 1 tvrzení zjevně platí a předpokládejme, že platí pro všechny
počty množin menší než pevně zvolené k > 1. Nyní si uvědomme, že pro libovolné
dva jevy platí P(B) = P(B  A) + P(B \ A). Podobně
P(A  B) = P(A) + P(B \ A) = P(A) + P(B) - P(B  A).
Toto je ale tvrzení naší věty pro k = 2. Nyní můžeme pracovat v indukčním kroku
na formuli s k + 1 jevy, když sjednocení k jevů bereme jako A ve formuli výše,
zatímco zbývající hraje roli B:
P(k+1
i=1 Ai) = P( k
i=1Ai  Ak+1)
=
k
j=1
-1)j+1
1i1<<ij k
P(Ai1      Aij ) + P(Ak+1)
- P((A1      Ak)  Ak+1).
To už připomíná formuli pro k + 1 sčítaných jevů, nicméně nám ve velké sumě chybějí
všechny výrazy obsahující Ak+1 a člen s pravděpodobností současného nastoupení
všech jevů. Zato nám však přebývá poslední člen. Tento člen výrazu můžeme
24 1. ÚVOD A MOTIVACE
nahradit výrazem
-P (A1  Ak+1)      (Ak  Ak+1)
a pro tento výraz opět použít indukční předpoklad, tj. formuli ve větě. Zjevně tím
právě přidáme všechny dosud chybějící členy.
1.26. Poznámka. Speciálním případem předchozí věty je situace, kdy všechny konečné
podmnožniny základního prostoru jsou jevy a všechny elementární jevy mají
stejnou pravděpodobnost. Ve formuli z předchozí věty pak všechny pravděpodobnosti
dávají právě počet prvků příslušných podmnožin, až na společný faktor 1
n ,
kde n je počet prvků základního prostoru. Pak můžeme vyčíst následující tvrzení
pro obecnou konečnou množinu M a její podmnožiny A1, . . . , Ak. Budeme psát |M|
pro počet prvků množiny M, tj. pro mohutnost množiny M.
(1.22) |M \ (k
i=1Ai)| = |M| +
k
j=1
(-1)i
1i1<<ij k
|Ai1      Aij )| .
Skutečně, | k
i=1 Ai| + |M \ (k
i=1Ai)| = |M|, tzn.
|M \ (k
i=1Ai)| = |M| - | k
i=1 Ai)|
a dosazením z naší věty dostáváme právě požadované tvrzení. Říká se mu princip
inkluze a exkluze.
Uveďme si příklad, jak vypadá využití principu inkluze a exkluze:
1.27. Příklady.
1.27.1. Nepořádná sekretářka Sekretářka má rozeslat pět dopisů pěti různým5.
lidem. Dopisy pro různé adresáty vkládá do obálek s adresami náhodně. Jaká je
pravděpodobnost, že alespoň jeden člověk dostane dopis určený pro něj?
Řešení. Spočítejme pravděpodobnost jevu opačného, tedy toho, že ani jeden člověk
neobdrží správný dopis. Stavový prostor všech možných jevů odpovídá všem
možným pořadím pěti prvků (obálek). Označíme-li jak obálky tak dopisy čísly od
jedné do pěti, tak všechny příznivé jevy (tedy žádný dopis nepřijde do obálky se
stejným číslem) odpovídají takovým pořadím pěti prvků, kdy i-tý prvek není na
i-tém místě (i = 1, . . . , 5), tzv. pořadím bez pevného bodu. Jejich počet spočítáme
pomocí principu inkluze a exkluze. Označíme-li Mi množinu permutací s pevným
bodem i (permutace v Mi ale mohou mít i jiné pevné body), tak výsledný počet d
permutací bez pevného bodu je roven
d = 5! - |M1      M5|
Počet prvků průniku |Mi1   Mik
|, k = 1, . . . , 5 je (5-k)! (pořadí prvků i1, . . . , ik
je pevně dáno, ostatních 5 - k prvků řadíme libovolně). Podle principu inkluze a
exkluze je
|M1      M5| =
5
k=1
(-1)k+1 5
k
(5 - k)!
4. PRAVDĚPODOBNOST 25
a tedy pro hledaný počet d dostáváme vztah
d = 5! -
5
k=1
(-1)k+1 5
k
(n - k)!
=
5
k=0
(-1)k 5
k
(5 - k)! = 5!
5
k=0
(-1)k
k!
Pravděpodobnost toho, že žádný člověk neobdrží ,,svůj dopis je tedy
5
k=0
(-1)k
k!
a hledaná pravděpodobnost pak
1 -
5
k=0
(-1)k
k!
=
19
30
.
1.27.2. Kolika způsoby lze rozestavit n shodných věží na šachovnici n × n tak, aby
bylo každé neobsazené pole ohrožováno některou z věží?
Řešení. Daná rozestavení jsou sjednocením dvou množin: množiny rozestavení,
kdy je alespoň v jednom řádku jedna věž (tedy v každém řádku právě jedna; tato
množina má nn
prvků ­ v každém řádku vybereme nezávisle jedno pole pro věž)
a množiny rozestavení, kdy je v každém sloupci alespoň (tedy právě) jedna věž
(stejnou úvahou jako u první množiny má tato množina rovněž nn
prvků). Průnik
těchto množin pak má n! prvků (místa pro věže vybíráme postupně od prvního
řádku ­ tam máme n možností, ve druhém pak již pouze n - 1 možností ­ jeden
sloupec je již obsazen, . . . ). Podle principu inkluze a exkluze je počet hledaných
rozestavení:
2nn
- n!.
1.28. Nezávislé jevy. Uvažme libovolný pravděpodobnostní prostor (, A, P)
a v něm nějaké jevy A1, . . . , Ak. Řekneme, že tyto jevy jsou stochasticky nezávislé
(vzhledem k pravděpodobnosti P), jestliže pro libovolné z nich vybrané jevy
Ai1 , . . . , Ai , 1   k platí
P(Ai1      Ai ) = P(Ai1 )  . . .  P(Ai ).
Zjevně je každý podsystém stochasticky nezávislých jevů opět stochasticky nezávislý.
Dále si pro dva stochasticky nezávislé jevy A, B spočtěme
P(A  Bc
) = P(A \ B) = P(A) - P(A  B) = P(A)(1 - P(B)) = P(A)P(Bc
).
Odtud už snadno dovodíme, že záměnou jednoho nebo více stochasticky nezávislých
jevů za jejich opačné jevy obdržíme opět stochasticky nezávislé jevy.
Často se hledá pravděpodobnost, že nastane alespoň jeden ze stochasticky nezávislých
jevů, tzn. hledáme P(A1      Ak). Můžeme pak použít elementární
vlastnosti množinových operací, tzv. de Morganova pravidla,
A1      Ak = (Ac
1      Ac
k)c
26 1. ÚVOD A MOTIVACE
a dostáváme:
P(A1      Ak) = 1 - P(Ac
1      Ac
k) = 1 - (1 - P(A1)) . . . (1 - P(Ak)).
1.29. Podmíněná pravděpodobnost. Obvyklé je také klást dotazy s dodatečnou
podmínkou. Např. ,,jaká je pravděpodobnost, že při hodu dvěmi kostkami
padly dvě pětky, je-li součet hodnot deset? . Formalizovat takové potřeby umíme
následovně.
Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním
prostoru (, A, P). Podmíněná pravděpodobnost P(A|H) jevu A  A
vzhledem k hypotéze H je definována vztahem
P(A|H) =
P(A  H)
P(H)
.
Jak je vidět přímo z definice, hypotéza H a jev A jsou nezávislé tehdy a jen
tehdy, je-li P(A) = P(A|H). Přímo z definice také vyplývá tzv. ,,věta o násobení
pravděpodobností pro jevy A1, . . . , Ak splňující P(A1      Ak) > 0:
P(A1      Ak) = P(A1)P(A2|A1)    P(Ak|A1      Ak-1).
Skutečně, dle předpokladu jsou i pravděpodobnosti všech průniků, které jsou brány
ve výrazu za hypotézy, nenulové. Pokrácením čitatelů a jmenovatelů získáme i napravo
právě pravděpodobnost jevu odpovídajícího průniku všech uvažovaných jevů.
1.30. Příklady.
1.30.1. Jaká je pravděpodobnost toho, že při hodu dvěma kostkami padne součet
7, víme-li, že ani na jedné z kostek nepadlo číslo 2.
Řešení. Označme jev, že ani na jedné kostce nepadne dvojka jako B, jev ,,padne
součet 7 jako A. Množinu všech možných výsledků budeme značit opět jako .
Pak
P(A|B) =
P(A  B)
P(B)
=
|AB|
||
|B|
||
=
|A  B|
|B|
Číslo 7 může padnout čtyřmi různými způsoby, pokud nepadne dvojka, tedy |A 
B| = 4, |B| = 5  5 = 25, tedy
P(A|B) =
4
25
.
Všimněme si, že P(A) = 1
6 , tedy jevy A a B nejsou stochasticky nezávislé.
1.31. Geometrická pravděpodobnost. V praktických problémech se často setkáváme
s daleko složitějšími modely, kde základní prostor není konečnou množinou.
Nemáme momentálně k dispozici ani základní nástroje pro dostatečné zobecnění
pojmu pravděpodobnosti, nicméně můžeme uvést alespoň jednoduchou ilustraci.
Uvažme rovinu R2
dvojic reálných čísel a v ní podmnožinu  se známým obsahem
vol  (symbol ,,vol od anglického ,,volume , tj. obsah/objem). Příkladem
může sloužit třeba jednotkový čtverec. Náhodné jevy budou reprezentovány podmnožinami
A   za jevové pole A bereme systém podmnožin, u kterých umíme
určit jejich obsah. Třeba všechna konečná sjednocení trojůhelníků. Nastoupení nebo
nenastoupení jevu je dáno výběrem bodu v , kterým se trefíme nebo netrefíme do
množiny reprezentující jev A.
4. PRAVDĚPODOBNOST 27
Podobně jako u klasické pravděpodobnosti pak definujeme pravděpodobnostní
funkci P : A  R vztahem
P(A) =
vol A
vol 
.
Uvažme jako příklad problém, kdy náhodně vyberem dvě hodnoty a < b v
intervalu (0, 1)  R. Všechny hodnoty a i b jsou stejně pravděpodobné a otázka
zní ,,jaká je pravděpodobnost, že interval (a, b) bude mít velikost alespoň jedna
polovina? .
Odpověď je docela jednoduchá: volba čísel a, b je volbou libovolného bodu (a, b)
ve vnitřku trojúhelníku  s hraničními vrcholy [0, 0], [0, 1], [1, 1] (načrtněte si obrázek!).
Potřebujeme znát plochu podmnožiny, která odpovídá bodům s b > a+ 1
2 , tj.
vnitřku trojúhelníku A ohraničeného vrcholy [0, 1
2 ], [0, 1], [1
2 , 1]. Evidentně dostáváme
P(A) = 1
4 . Zkuste si samostatně odpovědět na otázku ,,pro jakou požadovanou
minimální délku intervalu (a, b) dostaneme pravděpodobnost jedna polovina? .
Jednou z účinných výpočetních metod přibližných hodnot je naopak simulace
známé takovéto pravděpodobnosti pomocí relativní četnosti nastoupení vhodně zvoleného
jevu. Např. známá formule pro obsah kruhu o daném poloměru říká, že obsah
jednotkového kruhu je roven právě konstantě  = 3, 1415 . . . , která vyjadřuje poměr
obsahu a čtverce poloměru. Pokud zvolíme za  jednotkový čtverec a za A průnik
 a jednotkového kruhu se středem v počátku, pak vol A = 1
4 . Máme-li tedy
spolehlivý generátor náhodných čísel mezi nulou a jedničkou a počítáme relativní
četnosti, jak často bude vzdálenost vygenerované dvojice (a, b) menší než jedna, tj.
a2 + b2 < 1, pak výsledek bude při velkém počtu pokusů s velikou jistotou dobře
aproximovat číslo 1
4 . Numerickým postupům založeným na tomto principu se říká
metody Monte Carlo.
Obdobné úlohy na geometrickou pravděpodobnost lze bezezbytku formulovat
v R3
a obecněji. Uveďme ale ještě raději jednoduchý příklad v rovině:
1.32. Příklady.
1.32.1. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost,
že alespoň jeden díl bude nejvýše 20 cm dlouhý.
Řešení. Náhodné rozdělení tyče na tři díly interpretujeme jako náhodný výběr
dvou bodů řezu. Pravděpodobnostní prostor je tedy čtverec o straně 2 m. Umístímeli
čtverec C tak, aby dvě jeho strany ležely na kartézských osách v rovině, tak
podmínka, že alespoň jeden díl má být nejvýše 20 cm dlouhý nám vymezuje ve
čtverci následující oblast O:
O = {(x, y)  C|(x  20)  (x  180)  (y  20)  (y  180)  (|x - y|)  20}.
Jak snadno nahlédneme, zaujímá takto vymezená oblast O 51
100 obsahu čtverce.
1.32.2. Mirek vyjede náhodně mezi desátou hodinou dopolední a osmou hodinou
večerní z Brna do Prahy. Marek vyjede náhodně ve stejném intervalu z Prahy do
Brna. Oběma trvá cesta 2h. Jaká je pravděpodobnost, že se po cestě potkají (jezdí
po stejné trase). Cesta trvá oběma 2h.
Řešení. Prostor všech možných jevů je čtverec 10 × 10, Mirek vyjíždějící v čase x,
potká Marka vyjíždějícího v čase y právě když |x-y|  2. Tato nerovnost vymezuje
v daném čtverci oblast ,,příznivých jevů . Obsah zbylé části spočítáme přímo jednodušeji,
neboť je sjednocením dvou pravoúhlých rovnoramenných trojúhelníků o
28 1. ÚVOD A MOTIVACE
odvěsnách 8, tedy je roven 64, obsah části odpovídající ,,příznivým jevům je tedy
36, celkem je hledaná pravděpodobnost
36
100
=
9
25
1.32.3. Mirek a Marek chodí na obědy do univerzitní menzy. Menza má otevřeno
od 11h do 14h. Každý z nich stráví na obědě půl hodiny a dobu příchodu (mezi
11h a 14h) si vybírá náhodně. Jaká je pravděpodobnost, že se na obědě v daný den
potkají, sedávají-li oba u stejného stolu?
Řešení. Prostor všech možných jevů je čtverec 3×3. Označíme-li x dobu příchodu
Mirka a y dobu příchodu Marka, tak tito se potkají právě když |x - y|  1/2. Tato
nerovnost vymezuje ve čtverci možných událostí oblast, jejíž obsah je roven 11/38
obsahu čtverce. Tomuto zlomku je tedy rovna i hledaná pravděpodobnost.
1.32.4. Jednou denně někdy mezi osmou hodinou ranní a osmou hodinnou večerní
vyjíždí náhodně autobus z Koločavy do Užhorodu. Jednou denně ve stejném časovém
rozmezí jezdí jiný autobus náhodně opačným směrem. Cesta tam trvá pět hodin, zpět
též pět hodin. Jaká je pravděpodobnost, že se autobusy potkají, jezdí-li po stejné
trase?
Řešení. Prostor všech možných jevů je čtverec 12 × 12, Označíme-li doby odjezdu
obou autobusů x, resp. y, pak se tyto na trase potkají právě když |x - y|  5.
Tato nerovnost vymezuje v daném čtverci oblast ,,příznivých jevů . Obsah zbylé
části spočítáme přímo jednodušeji, neboť je sjednocením dvou pravoúhlých rovnoramenných
trojúhelníků o odvěsnách 7, tedy je roven 49, obsah části odpovídající
,,příznivým jevům je tedy 95, celkem je hledaná pravděpodobnost
95
144
.
1.32.5. Extreme games. Z Těšína vyjíždí vlaky co půl hodinu (směrem na Bohumín)
a z tohoto směru přijíždějí také každé půl hodiny. Předpokládejme, že vlaky
se mezi těmito dvěma stanicemi pohybují rovnoměrnou rychostí 72 km/h a jsou
dlouhé 100metrů, cesta trvá 30min, vlaky se míjejí někde na trase. Hazardér Jarda
si vybere jeden z těchto vlaků a během cesty z Těšína do Bohumína náhodně vystrčí
hlavu z okna na pět vteřin nad kolejiště pro protější směr. Jaká je pravděpodobnost,
že mu bude uražena? (předpokládáme, že jiné než zmíněné vlaky na trati nejezdí)
Řešení. Vzájemná rychlost protijedoucích vlaků je 40m/s, protijedoucí vlak mine
Jardovo okno za dvě a půl sekundy. Prostor všech mpžností je tedy úsečka 0, 1800s ,
prostor ,,příznivých možností je úsečka délky 7, 5 ležící někde uvnitř předchozí
úsečky. Pravděpodobnost uražení hlavy je tedy 7, 5/1800.
5. Geometrie v rovině
Na konci minulé kapitoly jsme intuitivně používali elementární pojmy z geometrie
reálné roviny. Budeme teď podrobněji zkoumat jak se vypořádávat s potřebou
popisovat ,,polohu v rovině , resp. dávat do souvislostí polohy různých bodů roviny.
5. GEOMETRIE V ROVINĚ 29
1.23
1.33. Afinní rovina a vektorový prostor R2
. Zkusme si množinu A = R2
představit z pohledu pozorovatele, který sedí v některém pevně zvoleném místě
(můžeme mu říkat třeba bod O = (x0, y0)  R2
). Předpokládejme, že ji vnímá jako
nekonečnou desku bez jakýchkoliv zvolených měřítek a popisů a ví, co to znamená
posunout se v libovolném násobku nějakého směru. Časem takové rovině budeme
říkat ,,afinní rovina . Aby mohl vidět kolem sebe ,,dvojice reálných čísel , musí si
vybrat nějaký bod E1, kterému řekne ,,bod [1, 0] a jiný bod E2, kterému začne
říkat ,,bod [0, 1] . Do všech ostatních se pak dostane tak, že poskočí ,,a­krát ve
směru [1, 0] , pak ,,b­krát ve směru [0, 1] a takovému bodu bude říkat ,,bod [a, b] .
Pokud to bude dělat obvyklým způsobem, nebude výsledek záviset na pořadí, tzn.
může také napřed jít b­krát ve směru [0, 1] a pak teprve v tom druhém.
To, co jsme popsali, se nazývá volba (afinního) souřadného systému v rovině,
bod O je jeho počátkem, posunutí E1 - O ztotožňujeme s dvojicí [1, 0], podobně u
E2 a obecně každý bod P roviny je ztotožněn s dvojicí čísel [a, b] = P - O.
Všimněme si, že zároveň volbou pevného počátku O jsou ztotožněny jednotlivé
body P roviny se směry posuvu v = P - O a že všechny takové posuvy umíme
skládat (budeme říkat ,,sčítat ) a také jednotlivé směry násobit v poměru každého
reálného čísla (budeme říkat ,,násobit skalárem ). Takovéto operace sčítání a násobení
splňují hodně vlastností skalárů, viz 1.1 a 1.2, zkuste si promyslet které.
Uvidíme brzy, že se jedná o standarní příklad (dvourozměrného reálného) vektorového
prostoru. Budeme proto už teď místo o směrech posuvu mluvit o vektorech a
od bodů je budeme rozlišovat tím, že budou dány dvojicemi souřadnic v kulatých
závorkách místo hranatých.
1.24
1.34. Přímky v rovině. Když se náš pozorovatel umí posouvat o libovolný násobek
pevného vektoru, pak také ví, co je to přímka. Je to podmnožina p  A v
rovině taková, že existují bod O a vektor v takové, že
p = {P  A; P - O = t  v, t  R}.
Popišme si P = P(t)  p ve zvolených souřadnicích s volbou v = (, ):
x(t) = x0 +   t, y(t) = y0 +   t.
Jednoduchým výpočtem dostaneme (vyloučíme t z parametrického vyjádření pro x
a y, když pro určitost předpokládáme, že třeba  = 0)
-x + y + (x0 - y0) = 0.
To je obecná rovnice přímky
e1.12 (1.23) ax + by = c,
se známým vztahem dvojice čísel (a, b) a vektoru v = (, )
e1.13 (1.24) a + b = 0.
Výraz nalevo v rovnici přímky (1.23) můžeme vidět jako skalární funkci F
závislou na bodech v rovině a s hodnotami v R, samu rovnici pak jako požadavek
na její hodnotu. Časem uvidíme, že vektor (a, b) je v tomto případě právě směrem,
ve kterém F nejrychleji roste. Proto bude směr kolmý na (a, b) právě tím směrem,
ve kterém zůstává naše funkce F konstantní. Konstanta c pak určuje, pro které
body bude tato konstanta nula.
30 1. ÚVOD A MOTIVACE
Mějme dvě přímky p a q a ptejme se po jejich průniku p  q. Ten bude popsán
jako bod, splňující obě rovnice přímek naráz. Pišme je takto
e1.14 (1.25)
ax + by = r
cx + dy = s.
Opět můžeme levou stranu vnímat jako přiřazení, které každé dvojici souřadnic
[x(P), y(P)] bodů v rovině přiřadí vektor hodnot dvou skalárních funkcí F1 a F2
daných levými stranami jednotlivých rovnic (1.25). Můžeme tedy naše rovnice napsat
jako jediný vztah F(v) = w, kde F je přiřazení, které vektor v popisující
polohu obecného bodu v rovině (v našich souřadnicích) zobrazí na vektor zadaný
levou stranou rovnic, a požadujeme, aby se toto zobrazení strefilo do předem zadaného
vektoru w = (r, s).
1.25
1.35. Lineární zobrazení a matice. Přiřazení F, se kterým jsme pracovali při
popisu průniku přímek, zjevně respektuje operace sčítání a násobení s vektory a
skaláry:
F(a  v + b  w) = a  F(v) + b  F(w)
pro všechny a, b  R, v, w  R2
. Říkáme, že F je lineární zobrazení z R2
do R2
, a
píšeme F : R2
 R2
. Obdobně, v rovnici 1.23 pro přímku šlo o lineární zobrazení
F : R2
 R a jeho předepsanou hodnotu c.
Stručně budeme zapisovat taková zobrazení pomocí matic a jejich násobení,
které definujeme takto:
A =
a b
c d
, v =
x
y
A  v =
a b
c d

x
y
=
ax + by
cx + dy
.
Podobně, můžeme místo vektoru v zprava násobit jinou maticí B stejného rozměru
jako je A. Prostě aplikujeme předchozí formule po jednotlivých sloupcích matice B
a obrdržíme jako výsledek opět matice. Snadno ověříme tzv. asociativitu násobení
(zkuste propočítat!):
(A  B)  v = A  (B  v).
Stejně snadno je vidět i distributivita A  (B + C) = A  B + A  C, neplatí však
komutativita a existují ,,dělitelé nuly . Např.
0 1
0 0

0 0
0 1
=
0 1
0 0
,
0 0
0 1

0 1
0 0
=
0 0
0 0
.
Body v rovině jsou tedy obecně vzory hodnot lineárních zobrazení F roviny do
roviny, přímky jsou obecně vzory hodnot lineárních zobrazení z roviny do reálné
přímky R. Samozřejmě, ve zvláštních situacích tomu tak být nemusí. Tak třeba
průnikem dvou stejných přímek je opět sama přímka (a vzorem vhodné hodnoty
pro takové lineární zobrazení bude celá přímka), nulové zobrazení má za vzor nuly
celou rovinu. V prvém případě to poznáme pomocí vztahu
e1.15 (1.26) ad - bc = 0
tj. vyjádření, kdy jsou nalevo v rovnicích (1.25) stejné výrazy až na skalární násobek.
V takovém případě bud nebude v průniku žádný bod (rovnoběžné různé
přímky) nebo tam budou všechny body přímky (stejné přímky). Ověřte!
5. GEOMETRIE V ROVINĚ 31
Výrazu nalevo v (1.26) říkáme determinant matice A a píšeme pro něj det A =
ad - bc, případně
det A =
a b
c d
= ad - bc.
Jestliže k výsledku lineárního zobrazení ještě dovolíme přičíst pevný vektor
T = (x(T), y(T)), tj. naše zobrazení bude
v =
x
y
 A  v + T =
ax + by + x(T)
cx + dy + y(T)
,
máme popsána právě všechna tzv. afinní zobrazení roviny do sebe. Známými příklady
jsou všechny afinní podobnosti. Lineární zobrazení pak odpovídají těm afinním
zobrazením, které zachovávají pevný bod O.
Co se stane, když náš pozorovatel z odstavce 1.33 bude tutéž rovinu shlížet
z jiného bodu nebo si aspoň vybere jiné body E1, E2? Zkuste si promyslet, že
na úrovni souřadnic to bude právě změna realizovaná pomocí afinního zobrazení.
Časem budeme vidět obecné důvody, proč tomu tak je ve všech dimenzích.
1.26
1.36. Euklidovská rovina. Přidejme nyní schopnost našeho pozorovatele vidět
vzdálenosti. Okamžitě pak můžeme definovat pojmy jako jsou úhel a otočení v
rovině.
Jednoduše si to můžeme představit takto: rozhodne se o nějakých bodech E1 a
E2, že jsou od něj ve vzdálenosti jedna, a zároveň si řekne, že jsou na sebe kolmé.
Vzdálenosti ve směrech souřadných os pak jsou dány příslušným poměrem, obecně
používá Euklidovu větu. Odtud vyjde známý vzorec pro velikost vektoru v = (a, b)
v = a2 + b2.
Jiný možný postup by byl, kdyby pozorovatel vyšel z pojmu vzdálenost (a věděl
co znamená ,,kolmý třeba díky Euklidově větě), zvolil první z vektorů velikosti
jedna, zvolil si orientaci (třeba proti směru hodinových ručiček) a vybral jednotkový
kolmý směr (jednoznačně určí z požadavku platnosti Euklidovy věty třeba pomocí
pravoúhlého trojúhelníku se stranami o velikostech 3, 4 a 5).
Úhel  dvou vektorů v, w v rovině pak zpravidla popisujeme s využitím tzv.
goniometrické funkce cos . Používaný vzorec pro funkci cos je dán hodnotou reálné
první souřadnice jednotkového vektoru, jehož úhel s vektorem (1, 0) je . Zjevně
je pak druhá souřadnice takového vektoru dána reálnou hodnotou 0  sin   1
splňující (cos )2
+ (sin )2
= 1.
Obecně pak pro dva vektory v a w můžeme jejich úhel popsat pomocí souřadnic
v = (x(v), y(v)), w = (x(w), y(w)) takto:
cos  =
x(v)  x(w) + y(v)  y(w)
v  w
.
Dobrým příkladem lineárního zobrazení, které zachovává velikosti, je rotace o
předem daný úhel . Je dáno formulí s maticí R:
v =
x
y
 R  v =
cos  - sin 
sin  cos 

x
y
.
Specielně, aplikací na jednotkový vektor (1, 0) dostáváme skutečně právě očekávaný
výsledek (cos , sin ).
32 1. ÚVOD A MOTIVACE
Pokud bychom chtěli zapsat rotaci kolem jiného bodu P = O + w, snadno
napíšeme formuli pomocí translací:
x
y
= v  v - w  R  (v - w)
 R  (v - w) + w =
cos (x - x(w)) - sin (y - y(w)) + x(w)
sin (x - x(w)) + cos (y - y(w)) + y(w)
.
Dalším příkladem je tzv. zrcadlení vzhledem k přímce. Opět nám bude stačit
popsat zrcadlení vzhledem k přímkám procházejícím počátkem O a ostatní se z nich
odvodí pomocí translací. Hledejme tedy matici Z zrcadlení vzhledem k přímce s
jednotkovým směrovým vektorem v svírajícím úhel  s vektorem (1, 0). Např.
Z0 =
1 0
0 -1
a obecně můžeme psát (otočíme do ,,nulové polohy, odzrcadlíme a vrátíme zpět)
Z = R  Z0  R-.
Můžeme proto (díky asociativitě násobení matic) spočíst:
R =
cos  - sin 
sin  cos 

1 0
0 -1

cos  sin 
- sin  cos 
=
cos  - sin 
sin  cos 

cos  sin 
- sin  cos 
=
cos2
 - sin2
 2 sin  cos 
2 sin  cos  -(cos2
 - sin2
)
=
cos 2 sin 2
sin 2 - cos 2
.
Povšimněme si také, že
Z  Z0 =
cos 2 sin 2
sin 2 - cos 2

1 0
0 -1
=
cos 2 - sin 2
sin 2 cos 2
.
To lze zformulovat jako
Tvrzení. Otočení o úhel  obdržíme následným provedením dvou zrcadlení vzhledem
ke směrům, které spolu svírají úhel 1
2 .
Pokud umíme odůvodnit předchozí tvrzení ryze geometrickou úvahou (zkuste),
dokázali jsme právě standardní formule pro goniometrické funkce dvojnásobného
úhlu.
Hlubší je následující rekapitulace předchozích úvah:
1.27 1.37. Věta. Lineární zobrazení euklidovské roviny je složeno ze zrcadlení právě,
když je dáno maticí R splňující
R =
a b
c d
, ab + cd = 0, a2
+ c2
= b2
+ d2
= 1.
To nastane právě, když toto zobrazení zachovává velikosti. Otočením je přitom právě
tehdy, když je determinant matice R roven jedné, což odpovídá sudému počtu zrcadlení.
Při lichém počtu zdrcadlení je determinant roven -1.
Promyslete si podrobněji úplný důkaz. Na tabuli vypadal jeho náznak takto:
5. GEOMETRIE V ROVINĚ 33
1.28
1.38. Obsah trojúhelníka. Závěrem našeho malého výletu do geometrie se zaměřme
na pojem obsah. Trojúhelník je vymezen dvojicí vektorů v a w, které přiloženy
do počátku O zadají zbylé dva vrcholy. Chtěli bychom tedy najít formuli
(skalární funkci vol), která dvěma vektorům přiřadí číslo rovné obsahu vol (v, w)
takto definovaného trojúhelníku (v, w).
Ze zadání je vidět, že by mělo platit (nakreslete si a uvažujte plochu jako součin
základny krát výšky podělené dvěma ­ výška součtu bude jistě součtem výšek...)
vol (v + v , w) = vol (v, w) + vol (v , w)
vol (av, w) = a vol (v, w)
a přidejme požadavek
vol (v, w) = - vol (w, v),
který odpovídá představě, že opatříme plochu znaménkem podle toho, v jakém
pořadí bereme vektory.
Pokud vektory v a w napíšeme do sloupců matice A, pak
A = (v, w)  det A
splňuje všechny tři naše požadavky. Kolik takových zobrazení ale může být? Každý
vektor umíme vyjádřit pomocí dvou souřadných vektorů v = (1, 0) a w = (0, 1) a
evidentně tedy každá možnost pro vol  je jednoznačně určena už vyčíslením na
této jediné dvojici argumentů (v, w). Jsou si tedy všechny možnosti rovny až na
skalární násobek. Ten umíme určit požadavkem
vol ((1, 0), (1, 0)) =
1
2
,
tj. volíme orientaci a měřítko.
Vidíme tedy, že determinant zadává plochu rovnoběžnostěnu určeného sloupci
matice A (a plocha trojúhelníku je tedy poloviční).
1.29
1.39. Viditelnost v rovině. Předchozí popis hodnot pro orientovaný objem nám
dává do rukou elegantní nástroj pro určování viditelnosti orientovaných úseček.
Orientovanou úsečkou rozumíme dva body v rovině R2
s určením pořadím. Můžeme
34 1. ÚVOD A MOTIVACE
si ji představovat jako šipku od prvého k druhému bodu. Taková orientovaná úsečka
nám rozděluje rovinu na dvě poloroviny, říkejme jim ,,levou a ,,pravou .
Jestliže uvažujeme obvyklou orientaci ,,proti směru hodinových ručiček pro
hranici mnohoúhelníku, pak pozorovatel nalevo od orientované úsečky (tj. uvnitř
takového mnohoúhelníka) tuto vidí a naopak pozorovatel napravo ji nevidí. Má tedy
smysl ptát se, jestli je orientovaná úsečka [A, B] v rovině viditelná z bodu C.
Spočtěme orientovanou plochu příslušného trojúhelníku zadaného vektory A-C
a B-C. Pokud jsme s bodem C nalevo od úsečky, pak při naší orientaci bude vektor
A-C dříve než ten druhý a proto výsledná plocha (tj. hodnota determinantu) bude
kladná. To odpovídá situaci, kdy úsečku vidíme. Naopak, při opačné poloze bude
výsledkem záporná hodnota determinantu a podle zjistíme, že úsečku nevidíme.
Uvedený jednoduchý postup je často využíván pro testování polohy při standardních
úlohách v 2D grafice.
Závěrem této části si uveďme několik standardních příkladů:
1.40. Příklady.
1.40.1. Je dána přímka
p : [2, 0] + t(3, 2).
Určete její obecnou rovnici a nalezněte průnik s přímkou
q : [-1, 2] + s(1, 3).
Řešení. Souřadnice bodů na přímce jsou dány dle daného parametrického zadání
jako x = 2 + 3t a y = 0 + 2t. Vyloučením parametru t ze soustavy těchto dvou
rovnic dostáváme obecnou rovnici přímky p:
2x - 3y - 4 = 0.
Průnik s přímkou q získáme dosazením parametrického vyjádření bodů na úsečce
q, tedy x = -1 + s a y = 2 + 3s do obecné rovnice přímky p:
2(-1 + s) - 3(2 + 3s) - 4 = 0,
odkud s = -12/7 a dosazením do parametrického vyjádření úsečky q dostáváme
souřadnice průsečíku P:
P = [-
19
7
, -
22
7
]
.
1.40.2. Uvažujme rovinu R2
se standardní soustavou souřadnic. Z počátku [0, 0]
je vyslán laserový paprsek ve směru (3, 1). Dopadne na zrcadlovou přímku p danou
parametricky jako
p : [4, 3] + t(-2, 1),
a poté se odrazí (úhel dopadu je shodný s úhlem odrazu). V jakém bodě dopadne
odražený paprsek na přímku q, danou parametricky jako
q : [7, -10] + t(-1, 6)?
Řešení. Směr paprsku svírá s přímkou p úhel 45
, odražený paprsek tedy bude
kolmý na dopadající, jeho směrový vektor bude (1, -3) (pozor na orientaci!; daný
směrový vektor můžeme též získat například zrcadlením podle kolmého vektoru k
přímce p). Paprsek dopadne v bodě [6, 2], odražený paprsek tedy bude mít rovnici
[6, 2] + t(1, -3), t  0.
5. GEOMETRIE V ROVINĚ 35
Průnik přímky dané odraženým paprskem s přímkou q je bod [4, 8], což je mimo
polopřímky dané odraženým paprskem (t = -2). Odražený paprsek tedy přímku q
neprotne.
1.40.3. Z bodu [-2, 0] vyrazila v pravé poledne konstantní rychlostí 1ms-1
ve směru
(3, 2) úsečka délky 1. Rovněž v poledne vyrazila z bodu [5, -2] druhá úsečka délky 1
ve směru (-1, 1), ovšem dvojnásobnou rychlostí. Srazí se?
Řešení. Přímky, po kterých se pohybují dané úsečky, můžeme popsat parametrickým
vyjádřením:
p : [-2, 0] + r(3, 2)
q : [5, -2] + s(-1, 1),
Obecná rovnice přímky p je
2x - 3y + 4 = 0.
Dosazením parametrického vyjádření přímky q získáme průsečík P = [1, 2].
Nyní se snažme zvolit jediný parametr t pro obě úsečky tak, aby nám odpovídající
bod na přímkách p, resp. q, popisoval polohu počátku první, resp. druhé,
úsečky v čase t. V čase 0 je první v bodě [-2, 0], druhá v bodě [5, -2]. Za čas t
sekund urazí první t jednotek délky ve směru (3, 2) druhá pak 2t jednotek délky ve
směru (-1, 1). Odpovídající parametrizace jsou tedy
p : [-2, 0] +
t

13
(3, 2)(1.27)
q : [5, -2] +

2t(-1, 1),(1.28)
(1.29)
Počátek první úsečky dorazí do bodu [1, 2] v čase t1 =

13s, počátek druhé úsečky
v čase t = 2

2s, tedy více než o půl vteřiny dříve a tedy v době, kdy dorazí
do průsečíku P počátek první úsečky, bude již druhá úsečka pryč a úsečky se tak
nesrazí.
1.40.4. Viditelnost stran trojúhelníka. Je dán trojúhelník s vrcholy [5, 6], [7, 8],
[5, 8]. Určete, které jeho strany je vidět z bodu [0, 1].
Řešení. Uspořádáme vrcholy v kladném smyslu, tedy proti směru hodinových ručiček:
[5, 6], [7, 8], [5, 8]. Pomocí příslušných determinantů určíme, je-li bod [0, 1]
,,nalevo či ,,napravo od jednotlivých stran trojúhelníka uvažovaných jako orientované
úsečky,
7 5
7 7
> 0
5 5
7 5
< 0
5 7
5 7
= 0
Z nulovosti posledního determinantu vidíme, že body [0, 1], [5, 6] a [7, 8] leží na
přímce, stranu [5, 6][7, 8] tedy nevidíme. Stranu danou vrcholy [5, 8] a [7, 8] pak
narozdíl od strany [5, 6][5, 8] nevidíme.
1.40.5. Určete, které strany čtyřúhelníka s vrcholy [95, 99], [130, 106], [40, 60], [130, 120].
jsou viditelné z bodu [2, 0].
Řešení. Nejprve je třeba určit strany čtyřúhelníka (,,správné pořadí vrcholů):
[95, 99][40, 60][130, 106][130, 120]. Po spočítání příslušných determinantů (viz přednáška)
zjistíme, že jsou vidět pouze strana [40, 60][130, 106].
36 1. ÚVOD A MOTIVACE
1.40.6. Rovinný fotbalista vystřelí míč z bodu F = [1, 0] ve směru (3, 4) na bránu
(úsečku) ohraničenou body A = [23, 36] a B = [26, 30]. Směřuje míč do brány?
Řešení. Vzhledem k tomu, že se situace odehrává v prvním kvadrantu, stačí uvažovat
směrnice vektorů (FA), (3, 4), (FB). Tvoří-li (v tomto pořadí) buď rostoucí,
nebo klesající posloupnost, míč směřuje na bránu. Tato posloupnost je 36/22, 4/3,
30/25, což je klesající posloupnost, míč tedy směřuje do brány.
1.40.7. Určete obsah čtyřúhelníka ABCD s vrcholy A = [1, 0], B = [11, 13], C =
[2, 5] a D = [-2, -5].
Řešení. Rozdělíme na dva trojúhelníky ABC a ACD. Jejich obsahy pak spočítáme
pomocí patřičných determinantů, viz 1.38
S =
1
2
1 5
10 13
+
1
2
1 5
-3 -5
=
47
2
.
1.40.8. Buď dán pravidelný šestiúhelník ABCDEF (vrcholy jsou označeny v kladném
smyslu) se středem v bodě [1, 0] a vrcholem A = [0, 2] Určete souřadnice vrcholu
C.
Řešení. Souřadnice vrcholu C získáme otočením bodu A okolo středu S šestiúhelníka
o 120
v kladném smyslu:
C =
cos(120
) - sin(120
)
sin(120
) cos(120
)
(C - S) + S =
=
-1
2 -

3
2
3
2 -1
2
-1
2
+ [1, 0] = [
3
2
-

3, -1 -

3
2
].
1.40.9. Buď dán rovnostranný trojúhelník s vrcholy [1, 0] a [0, 1] ležící celý v prvním
kvadrantu. Určete souřadnice jeho třetího vrcholu.
Řešení. [1
2 +

3
2 , 1
2 +

3
2 ] (otáčíme o 60
bod [1, 0] kolem [0, 1] v kladném smyslu).
1.40.10. Napište souřadnice vrcholů trojúhelníka, který vznikne otočením rovnostranného
trojúhelníka jehož dva vrcholy jsou [1, 1] a [2, 3] (třetí pak v polorovině
dané přímkou [1, 1][2, 3] a bodem [0, 0]) o 60
v kladném smyslu kolem bodu [0, 0].
Řešení. Třetí vrchol trojúhelníka dostaneme např. otočením o 60
jednoho z vrcholů
kolem druhého (ve správném smyslu). [-3
2

3,

3 - 1
2 ], [1
2 - 1
2

3, 1
2

3 + 1
2 ]),
[1 - 3
2

3,

3 + 3
2 ].
1.40.11. Určete obsah trojúhelníka A2A3A11, kde A0A1 . . . A11 jsou vrcholy pravidelného
dvanáctiúhelníka vepsaného do kružnice o poloměru 1.
Řešení. Vrcholy dvanáctiúhelníka můžeme ztotožnit s dvanáctými odmocninami
z čísla 1 v komplexní rovině. Zvolíme-li navíc A0 = 1, pak můžeme psát Ak =
cos(2k/12) + i sin(2k/12). Pro vrcholy zkoumaného trojúhelníka máme: A2 =
cos(/3) + i sin(/3) = 1/2 + i

3/2, A3 = cos(/2) + i sin(/2) = i, A11 =
5. GEOMETRIE V ROVINĚ 37
cos(-/6) + i sin(-/6) =

3/2 - i/2. Podle vzorce pro obsah trojúhelníka je
potom hledaný obsah S roven
S =
1
2
A2 - A11
A3 - A11
=
1
2
1
2 -

3
2
1
2 +

3
2
-

3
2 + 3
2
=
3 -

3
4
.
1.40.12. 4. Určete odchylku (nebo její cosinus) úhlopříček A3A7 a A5A10 pravidelného
dvanáctiúhelníka
A0A1A2A3A4A5A6A7A8A9A10A11.
Řešení. Odchylka nezávisí na velikosti daného dvanáctiúhelníka. Volme dvanáctiúhelník
vepsaný do kružnice o poloměru 1. Jako v předchozím příkladě určíme
souřadnice jeho vrcholů a podle vzorce snadno dopočítáme, odchylka je 75
, cos =
1
2

2+

3
.
Úlohu lze řešit čistě metodami syntetické geometrie: označíme ještě S střed dvanáctiúhelníka
a T průsečík úhlopříček A3A7 a A5A10. Nyní |A7A5A10| = 45
(obvodový
úhel příslušný středovému úhlu A7SA10, který je pravý), dále |A5A7A3| =
30
(obvodový úhel příslušný středovému úhlu A5SA3, jehož velikost je 60
). Velikost
úhlu A5TA7 je pak dopňkem výše zmíněných úhlů do 180
, tedy je rovna
105
. Hledaná odchylka je tedy 75
.
1.40.13. Najděte matice A takové, že
A2
=
1
2 -

3
2
3
2
1
2
.
Námět na přemýšlení: jaké geometrické zobrazení v rovině zadává matice A2
?
Řešení. A2
je matice rotace o 60
, takže
A = 

3
2 -1
2
1
2

3
2
,
tedy matice rotace o 30
, resp. 210
.
K dalšímu procvičení nejen geometrických úvah mohou posloužit následující
příklady:
1.41. Příklady.
1.41.1. Kružnice dělící rovinu. Na kolik maximálně částí dělí rovinu k kružnic?
Řešení. Pro maximální počet pk oblastí, na které dělí rovinu kružnice odvodíme
rekurentní vzorec
pk+1 = pk + 2k
(k + 1). kružnice totiž protíná k předchozích maximálně v 2k průsečících (a tato
situace skutečně může nastat). Navíc zřejmě p1 = 1. Pro počet pk tedy dostáváme
pk = pk-1 + 2(k - 1) = pk2 + 2(k - 2) + 2(k - 1) =    = p1 +
k-1
i=1
2i = 2 + (k - 1)k.
1.41.2. Na kolik maximálně částí dělí trojrozměrný prostor n koulí?
38 1. ÚVOD A MOTIVACE
Řešení. Maximální počet yn částí, na které rozdělí n kružnic rovinu je yn = yn-1 +
2(n - 1), y1 = 2, tedy yn = n2
- n + 2.
Pro maximální počet pn částí, na které potom rozdělí n koulí prostor pak
dostáváme rekurentní vztah pn+1 = pn+yn, p1 = 2, tedy celkem pn = n
3 (n2
-3n+8).
1.41.3. Na kolik částí dělí prostor n navzájem různých rovin, které všechny prochází
jedním daným bodem?
Řešení. Pro hledaný počet xn odvodíme rekurentní formuli
xn = xn-1 + 2(n - 1),
dále x1 = 2, tedy
xn = n(n - 1) + 2.
1.41.4. Rovnoběžníková rovnost. Dokažme jako ilustraci našich nástrojů tzv.
,,rovnoběžníkovou rovnost : Jsou­li u, v  R2
, pak:
2( u 2
+ v 2
) = u + v 2
+ u - v 2
.
Neboli součet druhých mocnin délek úhlopříček rovnoběžníka je roven dvojnásobku
součtu druhých mocnin délek jeho stran.
Řešení. Obdržíme například rozepsáním obou stran do souřadnic: u = (u1, u2),
v = (v1, v2). Pak
2( u 2
+ v 2
) = 2(u2
1 + u2
2 + v2
1 + v2
2)
= u2
1 + 2u1v1 + v2
1 + u2
2 + 2u2v2 + v2
2 + u2
1 - 2u1v1 +
v2
1 + u2
2 - 2u2v2 + v2
2
= (u1 + v1)2
+ (u2 + v2)2
+ (u1 - v1)2
+ (u2 - v2)2
= u + v 2
+ u - v 2
1.42. Konstrukce lichoúhelníka.
1.42.1. Sestrojte (2n + 1)-úhelník, jsou-li dány všechny středy jeho stran.
Řešení. K řešení využijeme toho, že složením lichého počtu středových souměrností
je opět středová souměrnost (viz domácí úloha) Označíme-li vrcholy hledaného
(2n + 1)-úhelníka po řadě A1, A2, . . . , A2n+1 a středy stran (od středu A1A2)
postupně S1, S2, . . . S2n+1, tak provedeme-li středové souměrnosti po řadě podle
těchto středů, tak bod A1 je zjevně pevným bodem výsledné středové symetrie,
tedy jejím středem. K jeho nalezení tedy stačí provést uvedenou středovou souměrnost
s libovolným bodem X roviny. Bod A1 leží pak ve středu úsečky XX ,
kde X je obrazem bodu X ve zmíněné středové symetrii. Další vrcholy získáme
zobrazováním bodu A1 ve středových souměrnostech podle S1, . . . , S2n+1.
6. Relace a zobrazení
V této závěrečné části úvodní motivační kapitoly se vrátíme k formálnímu popisu
matematických struktur, budeme se je ale průběžně snažit ilustrovat na již
známých příkladech. Zároveň můžeme tuto část brát jako cvičení ve formálním
přístupu k objektům a konceptům matematiky.
6. RELACE A ZOBRAZENÍ 39
1.30
1.43. Relace mezi množinami. Binární relací mezi množinami A a B rozumíme
podmnožinu R kartézského součinu A × B. Často píšeme a R b pro vyjádření
skutečnosti, že (a, b)  R, tj. že body a  A a b  B jsou v relaci R. Definičním
oborem relace je podmnožina
D  A, D = {a  A; b  B, (a, b)  R}.
Podobně oborem hodnot relace je podmnožina
I  B, I = {b  B; a  A, (a, b)  R}.
Speciálním případem relace mezi množinami je zobrazení z množiny A do množiny
B. Je to případ, kdy pro každý prvek definičního oboru relace existuje právě
jeden prvek z oboru hodnot, který je s ním v relaci. Nám známým případem zobrazení
jsou všechny skalární funkce, kde oborem hodnot zobrazení je množina skalárů,
třeba celých nebo reálných čísel. Pro zobrazení zpravidla používáme značení, které
jsme také u skalárních funcí zavedli. Píšeme
f : D  A  I  B, f(a) = b
pro vyjádření skutečnosti, že (a, b) patří do relace, a říkáme, že b je hodnotou
zobrazení f v bodě a. Dále říkáme, že f je
* zobrazení množiny A do množiny B, jestliže je D = A,
* zobrazení množiny A na množinu B, jestliže je D = A a I = B, často také
surjektivní zobrazení
* injektivní zobrazení, jestliže je D = A a pro každé b  I existuje právě jeden
vzor a  A, f(a) = b.
Vyjádření zobrazení f : A  B jakožto relace
f  A × B, f = {(a, f(a)); a  A}
známe také pod názvem graf zobrazení f.
1.31
1.44. Skládání relací a funkcí. U zobrazení je jasná koncepce, jak se skládají.
Máme-li zobrazení f : A  B a g : B  C, pak jejich složení g  f je definováno
(g  f)(a) = g(f(a)).
Ve značení používaném pro relace totéž můžeme zapsat jako
f  A × B, f = {(a, f(a)); a  A}
g  B × C, g = {(b, g(b)); b  B}
g  f  A × C, g  f = {(a, g(f(a))); a  A}.
Zcela obdobně definujeme skládání relací, v předchozích vztazích jen doplníme
existenční kvantifikátory, tj. musíme uvažovat všechny ,,vzory a všechny ,,obrazy
.Uvažme relace R  A × B, S  B × C. Potom
S  R  A × C, S  R = {(a, c); b  B, (a, b)  R, (b, c)  S}.
Zvláštním případem relace je identické zobrazení
idA = {(a, a)  A × A; a  A}
na množině A. Je neutrální vzhledem ke skládání s každou relací s definičním oborem
nebo oborem hodnot A.
40 1. ÚVOD A MOTIVACE
Pro každou relaci R  A × B definujeme inverzní relaci
R-1
= {(b, a); (a, b)  R}  B × A.
Pozor, u zobrazení, je stejný pojem užíván ve specifičtější situaci. Samozřejmě, že
existuje pro každé zobrazení jeho invezní relace, ta však nemusí být zobrazením.
Zcela logicky proto hovoříme o existenci inverzního zobrazení, pokud každý prvek
b  B je obrazem pro právě jeden vzor v A. V takovém případě je samozřejmě
inverzní zobrazení právě inverzní relací.
Všimněme si, že složením zobrazení a jeho inverzního zobrazení (pokud obě
existují) vždy vznikne identické obrazení, u obecných relací tomu tak být nemusí.
1.32
1.45. Relace na množině. V případě A = B hovoříme o relaci na množině A.
Říkáme, že R je:
* reflexivní, pokud idA  R (tj. (a, a)  R pro všechny a  A),
* symetrická, pokud R-1
= R (tj. pokud (a, b)  R, pak i (b, a)  R),
* antisymetrická, pokud R-1
R  idA (tj. pokud (a, b)  R a zároveň (b, a)  R,
pak a = b),
* tranzitivní, pokud R  R  R, tj. pokud z (a, b)  R a (b, c)  R vyplývá i
(a, c)  R.
Relace se nazývá ekvivalence, pokud je současně reflexivní, symetrická i tranzitivní.
Relace se nazývá uspořádání jestliže je reflexivní, tranzitivní a antisymetrická.
Dobrým příkladem uspořádání je inkluze. Uvažme množinu 2A
všech podmnožin
konečné množiny A (značení je speciálním případem obvyklé notace BA
pro
množinu všech zobrazení A  B) a na ní relací X  Z danou vlastností ,,být
podmnožinou . Evidentně jsou splněny všechny tři vlastnosti pro uspořádání: skutečně,
je­li X  Y a zároveň Y  X musí být nutně množiny X a Y stejné. Je­li
X  Y  Z je také X  Z a také reflexivita je zřejmá.
Říkáme, že uspořádání je úplné, když pro každé dva prvky platí že jsou srovnatelné,
tj. buď a  b nebo b  a. Všimněme si, že ne všechny dvojice (X, Y )
podmnožin v A jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než
jeden prvek, existují podmnožiny X a Y , kdy není ani X  Y ani Y  X.
Připomeňme rekurentní definici přirozených čísel N = {0, 1, 2, 3, . . . }, kde
0 = , n + 1 = {0, 1, 2, . . . , n}.
Definujeme relaci m < n právě, když m  n. Evidentně jde o úplné úspořádání.
Např. 2  4, protože
2 = {, {}}  {, {}, {, {}}, {, {}, {, {}}}} = 4.
Jinak řečeno, samotná rekurentní definice zadává vztah n  n+1 a tranzitivně pak
n  k pro všechna k, která jsou tímto postupem definována později.
1.33
1.46. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává
zároveň rozklad množiny A na podmnožiny vzájemně ekvivalentních prvků, tzv.
třídy ekvivalance. Klademe pro libovolné a  A
Ra = {b  A; (a, b)  A}.
Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci
jde.
Zjevně Ra = Rb právě, když (a, b)  R a každá taková podmnožina je tedy
reprezentována kterýmkoliv svým prvkem, tzv. reprezentantem. Zároveň Ra Rb =
6. RELACE A ZOBRAZENÍ 41
 právě, když Ra = Rb, tj. třídy ekvivalence jsou po dvou disjunktní. Konečně,
A = aARa, tj. celá množina A se suktečně rozloží na jednotlivé třídy.
Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a
,,až na ekvivalenci .
1.34
1.47. Příklad ­ konstrukce celých a racionálních čísel. Na přirozených číslech
umíme sice sčítat a víme, že přičtením nuly se číslo nezmění. Umíme i definovat
odečítání, při něm ale jen někdy existuje výsledek.
Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící
rozdíly. To můžeme udělat tak, že místo výsledku odečítání budeme pracovat
s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují.
Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové
dvojice ekvivalentní. Potřebný vztah tedy je:
(a, b)  (a , b )  a - b = a - b  a + b = a + b.
Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme,
výrazy v pravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a
její třídy označíme jako celá čísla Z. Na nich definujeme operaci sčítání (a s ní i
odečítání) pomocí reprezentantů. Např.
[(a, b)] + [(c, d)] = [(a + c, b + d)],
což zjevně nezávisí na výběru reprezentantů. Lze si přitom vždy volit reprezentanty
(a, 0) pro kladná čísla a reprezentanty (0, a) pro čísla záporná, se kterými se nám
bude patrně počítat nejlépe.
Tento jednoduchý přklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence
jako na celistvý objekt a soustředit se na vlastnosti těchto objektů, nikoliv
formální popisy jejich konstrukcí. Ty jsou však důležité k ověření, že takové objekty
vůbec existují.
U celých čísel nám už platí všechny vlastnosti skalárů (KG1)­(KG4) a (O1)(O4),
viz 1.1 a 1.2. Pro násobení je neutrálním prvkem jednička, ale pro všechna
čísla a různá od nuly a jedničky neumíme najít číslo a-1
s vlastností aa-1
= 1, tzn.
chybí nám inverzní prvky. Zároveň si povšimněte, že platí vlastnost oboru integrity
(OI), viz 1.2, tzn. je-li součin dvou čísel nulový, musí být alespoň jedno z nich nula.
Díky poslední jmenované vlastnosti můžeme zkonstruovat racionální čísla Q
přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali
Z z N. Na množině uspořádáných dvojic (p, q), q = 0, celých čísel definujeme relaci
 tak, jak očekáváme, že se mají chovat podíly p/q:
(p, q)  (p , q )  p/q = p /q  p  q - p  q.
Opět neumíme očekávané chování v prostřední rovnosti v množině Z formulovat,
nicméně rovnost na pravé straně ano. Zjevně jde o dobře definovanou relaci ekvivalence
(ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když
budeme formálně psát p/q místo dvojic (p, q), budeme definovat operace násobení
a sčítání právě pomocí formulí, které nám jsou jistě dobře známy.
1.48. Příklad ­ zbytkové třídy. Jiným dobrým a jednoduchým příkladem jsou
tzv. zbytkové třídy celých čísel. Pro pevně zvolené přirozené číslo k definujeme
equivalenci k tak, že dvě čísla a, b  Z jsou ekvivalentní, jestliže jejich zbytek po
dělení číslem k je stejný. Výslednou množinu tříd ekvivalence označujeme Zk.
42 1. ÚVOD A MOTIVACE
Nejjednodušší je tato procedura pro k = 2. To dostáváme Z2 = {0, 1}, kde
nula reprezentuje sudá čísla, zatímco jednička čísla lichá. Opět lze snadno zjistit,
že pomocí reprezentantů můžeme definovat násobení a sčítání. Zkuste si ověřit, že
výsledná množina ,,skalárů je komutativním tělesem (tj. splňuje i vlastnost (P) z
1.2) právě když je k prvočíslo.
Závěrem si ještě procvičme spolu s relacemi ještě i kombinatoriku:
1.49. Ekvivalence ano či ne.
1.49.1. Rozhodněte, zda následující relace na množině M jsou relace ekvivalence:
(1) M = {f : R  R}, (f  g)  f(0) = g(0).
(2) M = {f : R  R}, (f  g)  f(0) = g(1).
(3) M je množina přímek v rovině, dvě přímky jsou v relaci, jestliže se neprotínají.
(4) M je množina přímek v rovině, dvě přímky jsou v relaci, jestliže jsou rovno-
běžné.
(5) M = N, (m  n)  S(m) + S(n) = 20, kde S(n) značí ciferný součet čísla
n.
Řešení.
(1) Ano. Ověříme tři vlastnosti ekvivalence:
i) Reflexivita: pro libovolnou reálnou funkci f je f(0) = f(0).
ii) Symetrie: jestliže platí f(0) = g(0), pak i g(0) = f(0).
iii) Tranzitivita: jestliže platí f(0) = g(0) a g(0) = h(0), pak platí i f(0) = h(0).
(2) Ne. Definovaná relace není reflexivní, např pro funkci sin máme sin(0) = sin(1)
(3) Ne. Relace opět není reflexivní (každá přímka protíná sama sebe)
(4) Ano. Třídy ekvivalence pak tvoří množinu neorientovaných směrů v rovině.
(5) Ne. Relace není reflexivní. S(1) + S(1) = 2.
1.49.2. Počet injektivních zobrazení mezi množinami
Určete počet injektivních zobrazení množiny {1, 2, 3} do množiny {1, 2, 3, 4}
Řešení. Libovolné injektivní zobrazení mezi uvažovanými množinami je dáno výběrem
(uspořádané) trojice z množiny {1, 2, 3, 4} (prvky ve vybrané trojici budou
po řadě obrazy čísel 1, 2, 3) a obráceně každé injektivní zobrazení nám zadává takovou
trojici. Je tedy hledaných injektivních zobrazení stejně jako možností výběru
uspořádaných trojic ze čtyř prvků, tedy v(3, 4) = 4  3  2 = 24.
1.49.3. Počet surjektivních zobrazení mezi danými množinami
Určete počet surjektivních zobrazení množiny {1, 2, 3, 4} na množinu {1, 2, 3}
Řešení. Počet zjistíme obecným principem ,,inkluze a exkluze . Od počtu všech
zobrazení odečteme ta, která nejsou surjektivní, t.j. ta, jejichž obor hodnot je buď
jednoprvkovou nebo dvouprvkovou množinou. Všech zobrazení je V (3, 4) = 34
,
zobrazení, jejichž oborem hodnot je jednoprvková množina, jsou tři. Počet zobrazení
jejichž oborem hodnot je dvouprvková množina je 3
2 (24
-2) ( 3
2 způsoby můžeme
vybrat definiční obor a máme-li již dva prvky fixovány, máme 24
- 2 možností, jak
na ně zobrazit čtyři prvky). Celkem je tedy počet hledaných surjektivních zobrazení
(1.30) 34
-
3
2
(24
- 2) - 3 = 36.
6. RELACE A ZOBRAZENÍ 43
1.49.4. Počet relací ekvivalence na množině
Určete počet relací ekvivalence na množině {1, 2, 3, 4}.
Řešení. Ekvivalence můžeme počítat podle toho, kolik prvků mají jejich třídy
rozkladu. Pro počty prvků tříd rozkladu ekvivalencí na čtyřprvkové množině jsou
tyto možnosti:
Počty prvků ve třídách rozkladu počet ekvivalencí daného typu
1,1,1,1 1
2,1,1 4
2
2,2 1
2
4
2
3,1 4
1
4 1
Celkem tedy máme 15 různých ekvivalencí.
Závěrem ještě jeden příklad ukazující, že ,,divné skaláry se chovají divně:
1.49.5. Nenulový mnohočlen s nulovými hodnotami
Najděte nenulový mnohočlen s koeficienty v Z7, tj. výraz typu anxn
+    +
a1x+a0, ai  Z7, an = 0, takový, že na množině Z7 nabývá pouze nulových hodnot
(tj. dosadíme-li za x libovolný z prvků Z7 a výraz v Z7 vyčíslíme, dostaneme vždy
nulu).
Řešení. Při konstrukci tohoto mnohočlenu se opřeme o Malou Fermatovu větu,
která říká, že pro livovolné prvočíslo p a číslo a s ním nesoudělné platí:
(1.31) ap-1
 1(mod p).
Hledaný polynom je tedy například polynom x7
- x (polynom x6
- 1 by neměl
nulovou hodnotu v čísle 0).
KAPITOLA 2
Elementární lineární algebra
neumíte ještě počítat se skaláry?
­ zkusme to rovnou s maticemi...
1. Vektory a matice
2.1
2.1. Vektory nad skaláry. Symbolem K budeme nadále značit nějakou množinu
skalárů. Prozatím budeme vektorem rozumět uspořádanou n-tici skalárů, kde pevně
zvolené n  N budeme nazývat dimenzí. Sčítání vektorů definujeme po složkách
(skaláry samozřejmě sčítat umíme) a násobení vektoru u = (a1, . . . , an) skalárem b
definujeme tak, že každý prvek n-tice u vynásobíme skalárem b (skaláry v K násobit
umíme), tj.
u + v = (a1, . . . , an) + (b1, . . . , bn) = (a1 + b1, . . . , an + bn)
b  u = b  (a1, . . . , an) = (b  a1, . . . , b  an).
Zpravidla požadujeme, aby skaláry byly z nějakého pole1
, viz 1.1.
Pro sčítání vektorů v Kn
zjevně platí (KG1)­(KG4) s nulovým prvkem
0 = (0, . . . , 0)  Kn
.
Schválně zde používáme pro nulový prvek stejný symbol jako pro nulový prvek
skalárů. Podobně budeme pro sčítání a násobení používat stále stejný symbol (plus
a buď tečku nebo prosté zřetězení znaků). Navíc nebudeme používat pro vektory
žádné speciální značení, a ponecháváme na čtenáři aby udržoval svoji pozornost
přemýšlením o kontextu. Pro skaláry ale spíše budeme používat písmena ze začátku
abecedy a pro vektory od konce (prostředek nám zůstane na indexy proměných,
komponent a v součtech).
Pro všechny vektory v, w  Kn
a skaláry a, b  K platí
a  (v + w) = a  v + a  w(V1)
(a + b)  v = a  v + b  v(V2)
a  (b  v) = (a  b)  v(V3)
1  v = v(V4)
Pro kterékoliv pole skalárů K se snadno ověří právě sformulované vlastnosti
(V1)­(V4) pro Kn
, protože při ověřování vždy používáme pouze vlastnosti skalárů
uvedené v 1.1 a 1.2. Budeme takto pracovat např. s Rn
, Qn
, Cn
, (Zk)n
, n =
1, 2, 3, . . ..
1Čtenář, který se ještě nesmířil s abstrakcí okruhů a polí, nechť přemýšlí v rámci číselných
oborů. Potom okruhy skalárů zahrnují i celá čísla Z a všechny zbytkové třídy, zatímco mezi poli
jsou pouze R, Q, C a zbytkové třídy Zk s prvočíselným k.
45
46 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Všimněme si také, že k ověření vlastností (V1)­(V4) potřebujeme pro použité
skaláry pouze vlastnosti okruhu. Vlastnost (P) však bude přesto podstatná později.
2.2
2.2. Matice nad skaláry. Maticí typu m/n nad skaláry K rozumíme obdélníkové
schéma
A =


a11 a12 . . . a1n
a21 a22 . . . a2n
...
...
am1 am2 . . . amn


kde aij  K pro všechny 1  i  m, 1  j  n. Matici A s prvky aij značíme také
A = (aij).
Vektory (ai1, ai2, . . . , ain)  Kn
nazýváme (i­té) řádky matice A, i = 1, . . . , m,
vektory (a1j, a2j, . . . , amj)  Km
nazýváme (j­té) sloupce matice A, j = 1, . . . , n.
Matici můžeme také chápat jako zobrazení A : {1, . . . , m} × {1, . . . , n}  K.
Matice typu 1/n nebo n/1 jsou vlastně právě vektory v Kn
. I obecné matice lze
však chápat jako vektory v Kmn
, prostě zapomeneme na řádkování. Zejména tedy
je definováno sčítání matic a násobení matic skaláry:
A + B = (aij + bij),
kde A = (aij), B = (bij),
a  A = (a.aij),
kde A = (aij), a  K. Dále pak matice
-A = (-aij)
se nazývá matice opačná k matici A a matice
0 =


0 . . . 0
...
...
0 . . . 0


se nazývá nulová matice. Zapomenutím řádkování tak získáme následující tvrzení:
Tvrzení. Předpisy pro A + B, a  A, -A, 0 zadávají na množině všech matic typu
m/n operace sčítání a násobení skaláry splňující axiomy (V1)­(V4).
2.3 2.3. Příklad. Matice lze vhodně využít pro zápis lineárních rovnic. Uvažme následující
systém m rovnic v n proměnných:
a11x1 + a12x2 +    + a1nxn = y1
a21x1 + a22x2 +    + a2nxn = y2
...
am1x1 + am2x2 +    + amnxn = ym.
Posloupnost x1, . . . , xn lze chápat jako vektor proměnných, tj. sloupec v matici
typu n/1, a podobně s hodnotami y1, . . . , yn. Systém rovnic lze pak formálně psát
ve tvaru A  x = y :


a11 . . . a1n
...
...
am1 . . . amn


 .


x1
...
xn


 =


y1
...
yn


1. VEKTORY A MATICE 47
Původní rovnice nyní obdržíme tak, že vždy bereme řádky z A a sčítáme součiny
odpovídajících komponent, tj. ai1x1+  +ainxn. Tím získáme i-tý prvek výsledného
vektoru.
V rovině, tj. pro vektory dimenze 2, jsme už zavedli takovýto počet a viděli
jsme, že s ním lze pracovat velice efektivně (viz 1.35). Nyní budeme postupovat
obecněji a zavedeme i na maticích operace násobení.
2.4
2.4. Součin matic. Pro libovolnou matici A = (aij) typu m/n nad okruhem
skalárů K a libovolnou matici B = (bjk) typu n/q nad K definujeme jejich součin
C = A  B = (cik) jako matici typu m/q s prvky
cik =
n
j=1
aijbjk, pro libovolné 1  i  m, 1  k  q.
Například máme
2 1
1 -1

2 1 1
-1 0 1
=
3 2 3
3 1 0
2.5
2.5. Čtvercové matice. Je-li v matici stejný počet řádků a sloupců, hovoříme o
čtvercové matici. Počet řádků a sloupců pak nazýváme také dimenzí matice. Matici
E = (ij) =


1 . . . 0
...
...
...
0 . . . 1


se říká jednotková matice. Na množině čtvercových matic nad K dimenze n je součin
matic definován pro každé dvě matice, je tam tedy definována operace násobení:
Tvrzení. Pro libovolný okruh skalárů je na množině všech čtvercových matic dimenze
n definována operace násobení. Splňuje vlastnosti 1.2(O1) a (O3) vzhledem
k jednotkové matici E = (ij). Dále spolu se sčítáním matic vyhovuje 1.2(O4).
Obecně však neplatí 1.2(O2) ani (OI), zejména tedy neplatí 1.2(P).
Důkaz. Asociativita násobení ­ (O1): Protože skaláry jsou asociativní, distributivní
i komutativní, můžeme spočíst
A = (aij) typu m/n, B = (bjk) typu n/p, C = (ckl) typu p/q
A  B = (
j
aij.bjk), B  C = (
k
bjk.ckl)
(A  B)  C = (
k
(
j
aij.bjk).ckl) =
j,k
aij.bjk.ckl
A  (B  C) = (
j
aij.(
k
bjk.ckl)) =
j,k
aij.bjk.ckl
Jednotkový prvek ­ (O3):
A  E =


a11    a1m
...
am1    amm


1 0    0
0 1    0
...
...
0 0    1


= A = E  A
48 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
(O4) - distributivita: opět díky distributivitě skalárů snadno spočteme pro matice
A = (aij) typu m/n, B = (bjk) typu n/p, C = (cjk) typu n/p, D = (dkl) typu
p/q
A  (B + C) = (
j
aij(bjk + cjk) = ((
j
aijbjk) + (
j
aijcjk)) = A  B + A  C
(B + C)  D = (
k
(bjk + cjk)dkl) = ((
k
bjkdkl) + (
k
cjkdkl)) = B  D + C  D
Není komutativní: - jak jsme již viděli v 1.35, dvě matice dimenze 2 nemusí
komutovat:
1 0
0 0
.
0 1
0 0
=
0 1
0 0
0 1
0 0
.
1 0
0 0
=
0 0
0 0
Tím jsme získali zároveň protipříklad na platnost (O2) i (OI). Pro matice typu
1/1 ovšem oba axiomy samozřejmě platí, protože je mají samy skaláry a pro větší
matice získáme protipříklady snadno tak, že právě uvedené matice umístíme do
levého horního rohu příslušných čtvercových schémat a doplníme nulami. (Ověřte
si sami!)
V důkazu jsme vlastně pracovali s maticemi obecnějšího typu, dokázali jsme
tedy příslušné vlastnosti obecněji:
Tvrzení. Násobení matic je asociativní a distributivní, tj. A  (B  C) = (A  B)  C,
A  (B + C) = A  B + A  C, kdykoliv jsou tato násobení definována. Jednotková
matice je neutrálním prvkem pro násobení zleva i zprava.
2.6
2.6. Inverzní matice. Se skaláry umíme počítat tak, že z rovnosti ax = b umíme
vyjádřit x = a-1
 b, kdykoliv inverze k a existuje. Podobně bychom to měli umět s
maticemi, máme ale problém, jak poznat, zda taková existuje, a jak ji spočítat.
Říkáme, že B je matice inverzní k matici A, když A  B = B  A = E. Píšeme
pak B = A-1
a je samozřejmé, že obě matice musí mít tutéž dimenzi n. Matici, k
níž existuje matice inverzní, říkáme invertibilní matice.
Pokud A-1
a B-1
existují, pak existuje i (A  B)-1
= B-1
 A-1
. Je totiž (díky
právě dokázané asociativitě násobení) (B-1
A-1
)(A.B) = B-1
(A-1
A)B = E
a (A  B)  (B-1
 A-1
) = A  (B  B-1
)  A-1
= E.
Protože s maticemi umíme počítat zrovna jako se skaláry, jen mají složitější
chování, můžeme formálně snadno řešit systémy lineárních rovnic: Jestliže vyjádříme
soustavu n rovnic pro n neznámých součinem matic
A  x =


a11    a1m
...
am1    amm


x1
...
xm


 =


y1
...
ym


a existuje matice inverzní k matici A, pak lze násobit zleva A-1
a dostaneme A-1

y = A-1
 A  x = E  x = x, tj. hledané řešení.
Naopak rozepsáním podmínky A  A-1
= E pro neznámé skaláry v hledané
matici A-1
dostaneme n systémů lineárních rovnic se stejnou maticí na levé straně
a různými vektory napravo.
1. VEKTORY A MATICE 49
2.7
2.7. Ekvivalentní úpravy matic. Z hlediska řešení systémů rovnic
A  x = b
je jistě přirozené považovat za ekvivalentní matice A a vektory b, které zadávají
systémy rovnic se stejným řešením. Uvedeme si jednoduché manipulace s řádky
rovnic a stejným způsobem pak můžeme upravovat i vektor napravo. Když se nám
podaří vlevo dostat systém s jednotkovou maticí, bude napravo řešení původního
systému. Takovým operacím říkáme řádkové elementární transformace. Jsou to:
* záměna dvou řádků
* vynásobení vybraného řádku nenulovým skalárem
* přičtení řádku k jinému řádku.
Je zjevné, že odpovídající operace na úrovni rovnic v systému nemohou změnit
množinu všech jeho řešení. Později bude vidět, že sloupcové transformace odpovídají
řešení téhož systému ale v transformovaných souřadnicích
Analogicky, sloupcové elementární transformace matic jsou
* záměna dvou sloupců
* vynásobení vybraného sloupce nenulovým skalárem
* přičtení sloupce k jinému sloupci,
ty však nezachovávají řešení příslušných rovnic, protože mezi sebou míchají samotné
proměnné.
Systematicky můžeme použít elementární řádkové úpravy k postupné eliminaci
proměnných. Postup je algoritmiclký a většinou se mu říká Gausova eliminace
proměnných.
Tvrzení. Nenulovou matici nad libovolným okruhem skalárů K lze konečně mnoha
elementárními řádkovými transformacemi převést na tzv. (řádkově) schodovitý tvar:
* Je-li aij = 0 a všechny předchozí prvky na i-tém řádku jsou také nulové, potom
akj = 0 pro všechna k  i
* je-li a(i-1)j první nenulový prvek na (i - 1)-ním řádku, pak aij = 0.
Důkaz. Matice v řádkově schodovitém tvaru vypadá takto


0 . . . 0 a1j . . . . . . . . . a1m
0 . . . 0 0 . . . a2k . . . a2m
...
0 . . . . . . . . . . . . 0 alp . . .
...


a matice může, ale nemusí, končit několika nulovými řádky. K převodu libovolné
matice můžeme použít jednoduchý algoritmus:
(1) Záměnou řádků docílíme, že v prvním řádku bude v prvním nenulovém sloupci
nenulový prvek, nechť je to j-tý sloupec.
(2) Pro i = 2, . . ., vynásobením prvního řádku prvkem aij, i-tého řádku prvkem
a1j a odečtením vynulujeme prvek aij na i-tém řádku.
(3) Opakovanou aplikací bodů (1) a (2), vždy pro zbytek řádků a sloupců v získané
matici dospějeme po konečném počtu kroků k požadovanému tvaru.
50 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Uvedený postup je skutečně právě obvyklá eliminace proměnných v systémech
lineárních rovnic. Pro řešení systémů rovnic má ale uvedený postup rozumný smysl
jen, když mezi skaláry neexistují dělitelé nuly. Pokud tvoří skaláry pole, pak můžeme
navíc ze schodovitého tvaru snadno spočíst řešení (případně ověřit jeho neexistenci),
promyslete si pečlivě rozdíl mezi K = Z, K = R a případně Z2 nebo Z3.
2.8 2.8. Poznámka. Všimněme si, že elementární řádkové (resp. sloupcové) transformace
odpovídají vynásobením zleva (resp. zprava) následujícími maticemi:
(1) Přehození i-tého a j-tého řádku (resp. sloupce)
0
B
B
B
B
B
B
B
B
B
B
B
B
B
@
1 0 . . .
0
...
... 0 . . . 1
...
...
...
1 . . . 0
...
1
1
C
C
C
C
C
C
C
C
C
C
C
C
C
A
(2) Vynásobení i-tého řádku (resp. sloupce) skalárem a:
0
B
B
B
B
B
B
B
B
B
B
B
@
1
...
1
a
1
...
1
1
C
C
C
C
C
C
C
C
C
C
C
A
 i
(3) Sečtení i-tého řádku (resp. sloupce) s j-tým:
i 
0
B
B
B
B
B
B
B
B
B
B
B
B
B
B
B
@
1 0
0
...
...
...
1
...
...
1
1
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
A

j
Toto prostinké pozorování je ve skutečnosti velice podstatné, protože součin
invertibilních matic je invertibilní a všechny elementární transformace jsou nad
polem skalárů invertibilní. Pro libovolnou matici A tedy dostaneme násobením
vhodnou invertibilní maticí P = Pk    P1 zleva (postupné násobení k maticemi
zleva) její ekvivalentní řádkový schodovitý tvar A = P  A.
Jestliže obecně aplikujeme tentýž eliminační postup na sloupce, dostaneme z
každé matice B její sloucový schodovitý tvar B vynásobením vhodnou invertibilní
maticí Q = Q1    Q . Pokud ale začneme s maticí B = A v řádkově schodovitém
1. VEKTORY A MATICE 51
tvaru, eliminuje takový postup pouze všechny dosud nenulové prvky mimo diagonálu
matice a závěrem lze ještě i tyto elementárními operacemi změnit na jedničky.
Celkem jsme tedy ověřili důležitý výsledek, ke kterému se budeme mnohokrát vra-
cet:
2.9 2.9. Věta. Pro každou matici A typu m/n nad polem skalárů K existují čtvercové
invertibilní matice P dimenze m a Q dimenze n takové, že matice P A je v řádkově
schodovitém tvaru a
P  A  Q =


1 . . . 0 . . . . . . . . . 0
...
...
0 . . . 1 0 . . . . . . 0
0 . . . 0 1 0 . . . 0
0 . . . 0 0 0 . . . 0
...


.
2.10
2.10. Algoritmus pro výpočet inverzní matice. V předchozích úvahách jsme
se dostali prakticky k úplnému algoritmu pro výpočet inverzní matice. Během jednoduchého
níže uvedeného postupu buď zjistíme, že inverze neexistuje, nebo bude
inverze spočtena. I nadále pracujeme nad polem skalárů.
Ekvivalentní řádkové transformace se čtvercovou maticí A dimenze n vedou
k matici P takové, že P  A bude v řádkově schodovitém tvaru. Přitom může
(ale nemusí) být jeden nebo více posledních řádků nulových. Jestliže má existovat
inverzní matice k A, pak existuje i inverzní matice k P A. Jestliže však je poslední
řádek v P  A nulový, bude nulový i poslední řádek v P  A  B pro jakoukoliv matici
B dimenze n. Existence takového nulového řádku ve výsledku (řádkové) Gaussovy
eliminace tedy vylučuje existenci A-1
.
Předpokládejme nyní, že A-1
existuje. Podle předchozího, nalezneme řádkově
schodovitý tvar bez nulového řádku, tzn. že všechny diagonální prvky v P  A
jsou nenulové. Pak ovšem pokračováním eliminace od pravého dolního rohu zpět
a vynormováním diagonálních prvků na jedničky získáme jednotkovou matici E.
Jinými slovy, najdeme další invertibilní matici P takovou, že pro P = P P platí
P  A = E. Výměnou řádkových a sloupcových transformací lze za předpokladu
existence A-1
stejným postupem najít Q takovou, že A  Q = E. Odtud
P = P  E = P  (A  Q) = (P  A)  Q = Q.
To ale znamená, že jsme nalezli hledanou inverzní matici A-1
= P = Q k A.
Prakticky tedy můžeme postupovat tak, že vedle sebe napíšeme původní matici
A a jednotkovou matici E, matici A upravujeme řádkovými elementárními úpravami
nejprve na schodovitý tvar, potom tzv. zpětnou eliminací na diagonální matici a v té
násobíme řádky inverzními prvky z K. Tytéž úpravy postupně prováděné s E vedou
právě k matici P = P  P z předchozích úvah, tedy z ní získáme právě hledanou
inverzi. Pokud tento algoritmus narazí na vynulování celého řádku v původní matici,
znamená to, že matice inverzní neexistuje.
2.10a
2.11. Závislost řádků a sloupců a hodnost matice. V předchozích úvahách
a počtech s maticemi jsme stále pracovali se sčítáním řádků nebo sloupců coby
vektorů, spolu s jejich násobením skaláry. Takové operaci říkáme lineární kombinace.
V abstraktním pojetí se k operacím s vektory vrátíme za chvíli v 2.23, bude
ale užitečné pochopit podstatu už nyní. Lineární kombinací řádků (nebo sloupců)
52 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
matice A = (aij) typu m/n rozumíme výraz a1ui1
+  +akuik
, kde ai jsou skaláry,
uj = (aj1, . . . , ajn) jsou řádky (nebo uj = (a1j, . . . , amj) jsou sloupce) matice A.
Jestliže existuje lineární kombinace daných řádků s alespoň jedním nenulovým
skalárním koeficientem, jejímž výsledkem je nulový řádek, říkáme, že jsou lineárně
závislé. V opačném případě, tj. když jedinou možnost jak získat nulový řádek je vynásobení
výhradně nulovými skaláry, jsou lineárně nezávislé. Obdobně definujeme
lineárně závislé a nezávislé sloupce matice.
Předchozí výsledky o Gausově eliminaci můžeme vnímat takovým způsobem,
že počet výsledných nenulových ,,schodů v řádkově nebo sloupcově schodovitém
tvaru je vždy roven témuž přirozenému číslu a to počtu lineárně nezávislých řádků
matice a témuž počtu lineárně nezávislých sloupců matice. Tomuto číslu říkáme
hodnost matice, značíme h(A). Zapamatujme si výsledné tvrzení:
Věta. Nechť A je matice typu m/n nad polem skalárů K. Matice A má stejný počet
h(A) linárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost
vždy nejvýše rovna menšímu z rozměrů matice A.
Algoristmus pro výpočet inverzních matic také říká, že čtvercová matice A
dimenze m má inverzi právě, když je její hodnost rovna počtu řádků m.
Ukažme si ještě užití matic pro běžné geometrické transformace, podobně jako
v našich úvahách o geometrii roviny (viz 1.36):
2.12. Matice rotací podle souřadnicových os.
2.12.1. Napište matici zobrazení rotací o úhel  postupně kolem os x, y, z v R3
.
Řešení. Při rotaci libovolného bodu kolem dané osy (řekněme x), se příslušná
souřadnice daného bodu nemění, v rovině dané dvěma zbylými osami pak již je
rotace dána známou maticí 2 × 2. Postupně tedy dostáváme následující matice:
Rotace kolem osy z:


cos  - sin  0
sin  cos  0
0 0 1


Rotace kolem osy y:


cos  0 sin 
0 1 0
- sin  0 cos 


Rotace kolem osy x:


1 0 0
0 cos  - sin 
0 sin  cos 

 .
U matice rotace kolem osy y musíme dávat pozor na znaménko. Je totiž rotace
kolem osy y v kladném smyslu, tedy taková rotace, že pokud se díváme proti směru
osy y, tak se svět točí proti směru hodinových ručiček, je rotací v záporném smyslu
v rovině xz (tedy osa z se otáčí směrem k x). Rozmyslete si kladný a záporný smysl
rotace podél všech tří os.
2. DETERMINANTY 53
2.13. Matice rotace kolem dané osy.
2.13.1. Napište matici zobrazení rotace v kladném smyslu o úhel 60
kolem přímky
dané počátkem a vektorem (1, 1, 0) v R3
.
Řešení. Daná otáčení je složením následujících tří zobrazení:
* rotace o 45
v záporném smyslu podle osy z (osa rotace (1, 1, 0) přejde do osy
x)
* rotace o 60
v kladném smyslu podle osy x.
* rotace o 45
v kladném smyslu podle osy z (osa x přejde zpět na osu danou
vektorem (1, 1, 0)).
Matice výsledné rotace tedy bude součinem matic odpovídajících těmto třem
zobrazením, přičemž pořadí matic je dáno pořadím provádění jednotlivých zobrazení,
prvnímu zobrazení odpovídá v součinu matice nejvíce napravo. Celkem tedy
dostáváme pro hledanou matici A vztah:
A =


2
2 -

2
2 0
2
2

2
2 0
0 0 1


1 0 0
0 1
2 -

3
2
0

3
2
1
2


2
2

2
2 0
-

2
2

2
2 0
0 0 1


 =


3
4
1
4

6
4
1
4
3
4 -

6
4
-

6
4

6
4
1
2


2. Determinanty
V páté části první kapitoly jsme viděli, že pro čtvercové matice dimenze n
nad reálnými čísly existuje skalární funkce det, která matici přiřadí nenulové číslo
právě, když existuje její inverze. Neříkali jsme to sice stejnými slovy, ale snadno si
to ověříte, viz odstavce počínaje 1.35 a formule (1.26). Determinant byl užitečný i
jinak, viz 1.37 a 1.38, kde jsme si volnou úvahou odvodili, že obsah rovnoběžníka by
měl být lineárně závislý na každém ze dvou vektorů definujících rovnoběžník a že
je užitečné zároveň požadovat změnu znaménka při změně pořadí těchto vektorů.
Protože tyto vlastnosti měl, až na pevný skalární násobek, jedině determinant,
odvodili jsme, že je obsah dán právě takto. Nyní uvidíme, že podobně lze postupovat
v každé konečné dimenzi.
V této části budeme pracovat s libovolnými skaláry K a maticemi nad těmito
skaláry.
2.10c
2.14. Definice determinantu. Připomeňme, že bijektivní zobrazení množiny X
na sebe se nazývá permutace množiny X, viz 1.5. Je-li X = {1, 2, . . . , n}, lze permutace
zapsat pomocí výsledného pořadí ve formě tabulky:
1 2 . . . n
(1) (2) . . . (n)
.
Prvek x  X se nazývá samodružným bodem permutace , je-li (x) = x. Permutace
 taková, že existují právě dva různé prvky x, y  X s (x) = y a (z) = z
pro všechna ostatní z  X se nazývá transpozice, značíme ji (x, y).
V dimenzi dva byl vzorec pro determinant jednoduchý ­ vezmeme všechny
možné součiny dvou prvků, po jednom z každého sloupce a řádku matice, opatříme
je znaménkem tak, aby při přehození dvou sloupců došlo ke změně celkového
54 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
znaménka, a výrazy všechny sečteme:
A =
a b
c d
, det A = ad - bc.
Obecně, nechť A = (aij) je čtvercová matice dimenze n nad K. Determinant matice
A je skalár det A = |A| definovaný vztahem
|A| =
n
sgn()a1(1)  a2(2)    an(n)
kde n je množina všech možných permutací na {1, . . . , n} a znaménko sgn pro každou
permutaci ještě musíme popsat. Každý z výrazů sgn()a1(1)  a2(2)    an(n)
nazýváme člen determinantu |A|.
Jednoduché příklady už umíme: je-li n = 1, pak |a11| = a11  K, a pro n = 2 je
a11 a12
a21 a22
= +a11a22 - a12a21.
Podobně pro n = 3 se dá uhodnout (chceme linearitu v každém sloupci a antisy-
metrii)
a11 a12 a13
a21 a22 a23
a31 a32 a33
= + a11a22a33 - a13a22a31 + a13a21a32
- a11a23a32 + a12a23a31 - a12a21a33.
Tomuto vzorci se říká Saarusovo pravidlo.
Jak tedy najít správná znaménka? Říkáme, že dvojice prvků a, b  X =
{1, . . . , n} tvoří inverzi v permutaci , je-li a < b a (a) > (b). Permutace 
se nazývá sudá (resp. lichá), obsahuje-li sudý (resp. lichý) počet inverzí.
Parita permutace  je (-1)počet inverzí
a značíme ji právě sgn(). Tolik definice,
chceme ale vědět, jak s paritou počítat. Z následujícího tvrzení už je jasně vidět,
že Saarusovo pravidlo skutečně počítá determinant v dimenzi 3.
Tvrzení. Na množině X = {1, 2, . . . , n} je právě n! různých permutací. Tyto lze
seřadit do posloupnosti tak, že každé dvě po sobě jdoucí se liší právě jednou transpozicí.
Lze při tom začít libovolnou permutací a každá transpozice mění paritu.
Důkaz. Pro jednoprvkové a dvouprvkové X tvrzení samozřejmě platí. Budeme
postupovat indukcí přes dimenzi.
Předpokládejme, že tvrzení platí pro všechny množiny s n - 1 prvky a uvažme
permutaci (1) = a1, . . . , (n) = an. Podle indukčního předpokladu všechny permutace,
které mají na posledním místě an, dostaneme z tohoto pořadí postupným
prováděním transpozic. Přitom jich bude (n - 1)!. V posledním z nich prohodíme
(n) = an za některý z prvků, který dosud nebyl na posledním místě, a znovu
uspořádáme všechny permutace s tímto vybraným prvkem na posledním místě do
posloupnosti s požadovanými vlastnostmi. Po n-násobné aplikaci tohoto postupu
získáme n! zaručeně různých permutací, tzn. všechny, právě předepsaným způsobem.
Všimněte si, že důležitou částí postupu je možnost začít s libovolnou z per-
mutací.
Zbývá poslední dovětek o paritách. Uvažme pořadí (a1, . . . , ai, ai+1, . . . , n), ve
kterém je r inverzí. Pak zjevně je v pořadí (a1, . . . , ai+1, ai . . . , n) buď r - 1 nebo
r + 1 inverzí. Každou transpozici (ai, aj) lze přitom získat postupným provedením
2. DETERMINANTY 55
(j -i)+(j -i-1) = 2(j -i)-1 transpozic sousedních prvků. Proto se provedením
libovolné transpozice parita permutace změní. Navíc již víme, že všechny permutace
lze získat prováděním transpozic.
Zjistili jsme, že provedení libovolné transpozice změní paritu permutace a že
každé pořadí čísel {1, 2, . . . , n} lze získat postupnými transpozicemi sousedních
prvků. Důsledkem tohoto popisu je, že na každé množině X = {1, . . . , n}, n > 1, je
právě 1
2 n! sudých a 1
2 n! lichých permutací.
Jestliže složíme dvě permutace za sebou, znamená to provést napřed všechny
transpozice tvořící první a pak druhou. Proto pro libovolné permutace ,  : X  X
platí
sgn(  ) = sgn()  sgn(), sgn(-1
) = sgn().
2.15. Rozklad permutace na transpozice.
2.15.1. Napište permutaci
P =
1 2 3 4 5
3 1 2 5 4
jako složení transpozicí. Je tato permutace sudá nebo lichá?
Řešení. Transpozici prvků i a j, budeme značit jako (i, j). Danou permutaci můžeme
rozložit nejprve na nezávislé cykly, ty potom na transpozice. V našem případě
je daná transpozice složením dvou cyklů: (1, 2, 3) a (4, 5) (rozklad dostaneme tak,
že si vybereme jeden prvek a ten opakovaně zobrazujeme pomocí dané permutace,
dokud nedostaneme na počátku zvolený prvek; ,,cesta prvku tvoří cyklus; z prvků,
které jsme ještě neprošli vybereme opět další a opět ho opakovaně zobrazujeme pomocí
dané permutace; opakujeme tak dlouho, dokud neprobereme všechny prvky
množiny, na které permutace působí). V našem případě se prvek 1 zobrazuje na 3,
prvek 3 na prvek 2, prvek 2 zpět na 1, dostáváme tedy cyklus (1, 3, 2). První prvek,
který jsme ještě neprošli je číslo 4: 4 se zobrazuje na 5, 5 zpět na 4; dostáváme
transpozici, neboli cyklus délky dva. Máme tedy
P = (1, 3, 2)  (4, 5).
Cyklus (1, 3, 2) ještě rozložíme na transpozice: (1, 3, 2) = (1, 3)(3, 2). Celkem tedy
P = (1, 3)  (3, 2)  (4, 5).
Parita počtu transpozicí v rozkladu je dána jednoznačně a udává sudost či lichost
permutace. Naše permutace je tedy lichá.
2.12
2.16. Jednoduché vlastnosti determinantu. Pro každou matici A = (aij)
typu m/n na skaláry z K definujeme matici transponovanou k A. Jde o matici
AT
= (aij) s prvky aij = aji typu n/m.
Čtvercová matice A s vlastností A = AT
se nazývá symetrická. Jestliže platí
A = -AT
, pak se A nazývá antisymetrická.
Věta. Pro každou čtvercovou matici A platí
(1) |AT
| = |A|,
(2) Je-li jeden řádek v A tvořen nulovými prvky z K, pak |A| = 0,
(3) Jestliže matice B vznikla z A výměnou dvou řádků, pak |A| = -|B|,
(4) Jestliže matice B vznikla z A vynásobením řádku skalárem a  K, pak |B| =
a|A|,
56 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
(5) Jsou-li prvky k-tého řádku v A tvaru akj = ckj + bkj a všechny ostatní řádky v
maticích A, B = (bij), C = (cij) jsou stejné, pak |A| = |B| + |C|,
(6) Determinant |A| se nezmění, přičteme-li k libovolnému řádku A lineární kombinaci
ostatních řádků.
Důkaz. (1) Členy determinantů |A| a |AT
| jsou v bijektivní korespondenci.
Členu sgn()a1(1)  a2(2)    an(n) přitom odpovídá člen
sgn()a(1)1  a(2)2    a(n)n = sgn()a1-1(1)  a2-1(2)    an-1(n),
přičemž musíme ověřit, že je tento člen opatřen správným znaménkem. Parita  a
-1
je ale stejná, jde tedy opravdu o člen |AT
| a první tvrzení je dokázáno.
(2) Plyne přímo z definice determinantu, protože všechny jeho členy budou
nulové.
(3) Ve všech členech |A| dojde u permutací k přidání jedné transpozice, znaménko
všech členů determinantu tedy bude opačné.
(4) Vyplývá přímo z definice, protože členy determinantu |B| jsou členy |A|
vynásobené skalárem a.
(5) V každém členu |A| je právě jeden součinitel z k-tého řádku matice A.
Protože platí distributivní zákon pro násobení a sčítání v K, vyplývá tvrzení přímo
z definičního vztahu pro determinanty.
(6) Jsou-li v A dva stejné řádky, jsou mezi členy determinantu vždy dva sčítance
stejné až na znaménko. Proto je v takovém případě |A| = 0. Je tedy podle tvrzení
(5) možné přičíst k vybranému řádku libovolný jiný řádek, aniž by se zmněnila
hodnota determinantu. Vzhledem k tvrzení (4) lze ale přičíst i skalární násobek
libovolného jiného řádku.
2.13 2.17. Poznámka. Všimněme si hezkého důsledku prvního tvrzení předchozí věty
o rovnosti determinantů matice a matice transponované. Zaručuje totiž, že kdykoliv
se nám podaří dokázat nějaké tvrzení o determinantech formulované s využitím
řádků příslušné matice, pak analogické tvrzení platí i pro sloupce. Např. tedy
můžeme okamžitě všechna tvrzení (2)­(6) této věty přeformulovat i pro přičítání
lineárních kombinací ostatních sloupců k vybranému.
Vlastnosti (3)­(5) říkají, že determinant jako zobrazení, které n vektorům dimenze
n (řádkům nebo sloupcům matice) přiřadí skalár je antisymetrické zobrazení
lineární v každém svém argumentu, přesně jak jsme podle analogie z dimenze 2 po-
žadovali.
Pro matici v řádkovém nebo sloupcovém schodovitém tvaru je jediným nenulovým
členem determinantu ten, který odpovídá identické permutaci. Vidíme tedy,
že determinant takové matice je |A| = a11  a22     ann. Předchozí věta tedy poskytuje
velice efektivní metodu výpočtu determinantů pomocí Gaussovy eliminační
metody, viz. 2.7.
2.14
2.18. Další vlastnosti determinantu. Časem uvidíme, že skutečně stejně jako
v dimenzi dva je determinant matice roven orientovanému objemu rovnoběžnostěnu
určeného jejími sloupci. Uvidíme časem také, že když uvážíme zobrazení x  A  x
zadané čtvercovou maticí A na Rn
, pak můžeme determinant této matice vidět
jako vyjádření poměru mezi objemem rovnoběžnostěnů daných vektory x1, . . . xn a
jejich obrazy A  x1, . . . , A  xn. Protože skládání zobrazení x  A  x  B  (A  x)
odpovídá násobení matic, je snad docela pochopitelná tzv. Cauchyova věta:
2. DETERMINANTY 57
Věta. Nechť A = (aij), B = (bij) jsou čtvercové matice dimenze n nad okruhem
skalárů K. Pak |A  B| = |A|  |B|.
My tuto větu odvodíme ryze algebraicky už proto, že předchozí odvolávka na
geometrický argument těžko může fungovat pro jakékoliv skaláry. Základním nástrojem
je tzv. rozvoj determinantu podle jednoho nebo více řádků či sloupců.
Budeme potřebovat něco málo technické přípravy. Čtenář, který by snad tolik abstrakce
neztrávil může tyto pasáže přeskočit a vstřebat pouze znění Laplaceovy věty
a jejich důsledků.
Nechť A = (aij) je matice typu m/n a 1  i1 < . . . < ik  m, 1  j1 < . . . <
jl  n jsou pevně zvolená přirozená čísla. Pak matici
M =


ai1j1
ai1j2
. . . ai1j
...
...
aikj1
aikj2
. . . aikj


typu k/ nazýváme submaticí matice A určenou řádky i1, . . . , ik a sloupci j1, . . . , j .
Zbývajícími (m-k) řádky a (n-l) sloupci je určena matice M
typu (m-k)/(n- ),
která se nazývá doplňková submatice k M v A. Při k = je definován |M|, který
nazýváme subdeterminant nebo minor řádu k matice A. Je-li m = n, pak při k =
je i M
čtvercová a |M
| se nazývá doplněk minoru |M|, nebo doplňkový minor k
submatici M v matici A. Skalár
(-1)i1++ik+j1++jl
 |M
|
se nazývá algebraický doplněk k minoru |M|. Submatice tvořené prvními k řádky a
sloupci se nazývají hlavní submatice, jejich determinanty hlavní minory matice A.
Při speciální volbě k = = 1, m = n hovoříme o algebraickém doplňku Aij prvku
aij matice A.
Pokud je |M| hlavní minor matice A, pak přímo z definice determinantu je vidět, že součin
|M| s jeho algebraickým doplňkem je členem determinantu.
Nechť je obecná submatice M určena řádky i1 < i2 <    < ik a sloupci j1 <    < jk.
Pak pomocí (i1 -1)+  +(ik -k) výměn sousedních řádků a (j1 -1)+  +(jk -k) výměn
sousedních sloupců v A převedeme submatici M na hlavní submatici a doplňková matice přitom
přejde právě na doplňkovou matici. Celá matice A přejde přitom v matici B, pro kterou platí
podle 2.16 a definice determinantu |B| = (-1)
|A|, kde  =
Pk
h=1(ih - jh) - 2(1 +    + k).
Tím jsme ověřili:
Tvrzení. Nechť A je čtvercová matice dimenze n a |M| je její minor řádu k < n. Pak
součin libovolného členu |M| s libovolným členem jeho algebraického doplňku je členem
|A|.
Toto tvrzení už podbízí představu, že by se pomocí takových součinů menších determinantů
skutečně mohl determinant matic vyjadřovat. Víme, že |A| obsahuje právě n! různých
členů, právě jeden pro každou permutaci. Tyto členy jsou navzájem různé jakožto polynomy v
prvcích (neznámé obecné) matice A, přitom lze pro každý z členů zvolit matici A takovou, že
pouze tento člen bude nenulový.
Ukážeme si, že uvažované součiny |M|  |M
| obsahují právě n! různých členů z |A|, bude
tvrzení věty dokázáno. Ze zvolených k řádků lze vybrat
`n
k
´
minorů M a podle předchozího
lematu je každý z k!(n - k)! členů v součinech |M| s jejich algebraickými doplňky členem
|A|. Přitom pro různé výběry M nemůžeme nikdy obdržet stejné členy a jednotlivé členy
v (-1)i1++ik+j1++jl  |M|  |M
| jsou také po dvou různé. Celkem tedy máme právě
požadovaný počet k!(n - k)!
`n
k
´
= n! členů.
Tím jme bezezbytku dokázali tzv. Laplaceovu větu:
58 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Věta. Nechť A = (aij) je čtvercová matice dimenze n nad libovolným okruhem
skalárů a nechť je pevně zvoleno k jejích řádků. Pak |A| je součet všech n
k součinů
(-1)i1++ik+j1++jl
 |M|  |M
| minorů řádu k vybraných ze zvolených řádků, s
jejich algebraickými doplňky.
2.15
2.19. Důsledky Laplaceovy věty. Předchozí věta převádí výpočet |A| na výpočet
determinantů nižšího stupně. Této metodě výpočtu se říká Laplaceův rozvoj
podle zvolených řádků či sloupců. Např. rozvoj podle i-tého řádku nebo i-tého
sloupce:
|A| =
n
j=1
aijAij =
n
j=1
ajiAji
kde Aij označuje algebraický doplněk k prvku (minoru stupně 1) aij. Při praktickém
počítání determinantů bývá výhodné kombinovat Laplaceův rozvoj s přímou
metodou přičítání lineárních kombinací řádků či sloupců.
2.20. Příklady.
2.20.1. Spočítejte determinant matice


1 3 5 6
1 2 2 2
1 1 1 2
0 1 2 1


 .
Řešení. Začneme rozvíjet podle prvního sloupce, kde máme nejvíce (jednu) nul.
Postupně dostáváme
1 3 5 6
1 2 2 2
1 1 1 2
0 1 2 1
= 1 
2 2 2
1 1 2
1 2 1
- 1 
3 5 6
1 1 2
1 2 1
+ 1 
3 5 6
2 2 2
1 2 1
Podle Saarusova pravidla
= -2 - 2 + 6 = 2.
2.20.2. Nalezněte všechny hodnoty argumentu a takové, že
a 1 1 1
0 a 1 1
0 1 a 1
0 0 0 -a
= 1.
Pro komplexní a uveďte buď jeho algebraický nebo goniometrický tvar.
Řešení. Spočítáme determinant rozvinutím podle prvního sloupce matice:
D =
a 1 1 1
0 a 1 1
0 1 a 1
0 0 0 -a
= a 
a 1 1
1 a 1
0 0 -a
,
dále rozvíjíme podle posledního řádku:
D = -a  a
1 1
a 1
= -a2
(a2
- 1)
2. DETERMINANTY 59
Celkem dostáváme následující podmínku pro a: a4
- a2
+ 1 = 0. Substitucí t = a2
,
pak máme t2
- t + 1 s kořeny t1 = 1+i

3
2 = cos(/3) + i sin(/3), t1 = 1-i

3
2 =
cos(/3)-i sin(/3) = cos(-/3)+i sin(-/3), odkud snadno určíme čtyři možné
hodnoty parametru a: cos(/6)+i sin(/6) =

3/2+i/2, cos(7/6)+i sin(7/6) =
-

3/2 - i/2, cos(-/6) + i sin(-/6) =

3/2 - i/2, cos(5/6) + i sin(5/6) =
-

3/2 + i/2.
Výpočet determinantů bude standardním krokem v mnoha dalších úlohách,
proto ponecháme i procvičování na tyto praktičtější příležitosti.
2.21. Důkaz Cauchyovy věty. Jde o trikovou ale elementární aplikaci Laplaceovy věty.
Použijeme prostě dvakrát Laplaceův rozvoj na vhodné matice:
Uvažme nejprve matici H dimenze 2n (používáme tzv. blokovou symboliku, tj. píšeme
matici jakoby složenou z matic)
H =
,,
A 0
-E B

=
0
B
B
B
B
B
B
B
B
@
a11 . . . a1n
...
...
an1 . . . ann
0 . . . 0
...
...
0 . . . 0
-1 0
...
0 -1
b11 . . . b1n
...
...
bn1 . . . bnn
1
C
C
C
C
C
C
C
C
A
Laplaceovým rozvojem podle prvních n řádků obdržíme právě |H| = |A|  |B|.
Nyní budeme k posledním n sloupcům postupně přičítat lineární kombinace prvních n
sloupců tak, abychom obdrželi matici s nulami v pravém dolním rohu. Dostaneme
K =
0
B
B
B
B
B
B
B
B
@
a11 . . . a1n
...
...
an1 . . . ann
c11 . . . c1n
...
...
cn1 . . . cnn
-1 0
...
0 -1
0 . . . 0
...
...
0 . . . 0
1
C
C
C
C
C
C
C
C
A
.
Prvky submatice nahoře vpravo přitom musí splňovat
cij = ai1b1j + ai2b2j +    + ainbnj
neboli jde právě o prvky součinu A  B a |K| = |H|. Přitom rozvojem podle posledních n
sloupců dostáváme
|K| = (-1)n+1++2n
|A  B| = (-1)2n(n+1)
 |A  B| = |A  B|.
2.16
2.22. Determinant a inverzní matice. Předpokládejme nejprve, že existuje
matice inverzní k matici A, tj. A  A-1
= E. Protože pro jednotkovou matici platí
vždy |E| = 1, je pro každou invertibilní matici vždy |A| invertibilní skalár a platí
|A|-1
= |A-1
|.
My však kombinací Laplaceovy věty a Cauchyho věty umíme víc. Pro libovolnou
čtvercovou matici A = (aij) dimenze n definujeme matici A
= (a
ij), kde a
ij = Aji
jsou algebraické doplňky k prvkům aji v A. Nazýváme ji algebraicky adjungovaná
matice k matici A.
Věta. Pro každou čtvercovou matici A nad okruhem skalárů K platí
AA
= A
A = |A|  E.
Zejména tedy
60 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
(1) A-1
existuje jako matice nad okruhem skalárů K právě, když |A|-1
existuje v
K.
(2) Pokud existuje A-1
, pak platí A-1
= |A|-1
 A
.
Důkaz. Jak jsme již zmínili, Cauchyova věta ukazuje, že z existence A-1
vyplývá
invertibilita |A|  K. Předpokládejme naopak, že |A| je invertibilní skalár. Spočteme
přímým výpočtem A  A
= (cij):
cij =
nX
k=1
aika
kj =
nX
k=1
aikAjk.
Pokud i = j je to právě Laplaceův rozvoj |A| podle i-tého řádku. Pokud i = j jde o rozvoj
determinantu matice v níž je i-tý a j-tý řádek stejný a proto je cij = 0. Odtud plyne
A  A
= |A|  E, ale již v 2.10 jsme odvodili, že z rovnosti A  B = E plyne i B  A = E.
(Pokud tomu někdo dá přednost, může zopakovat předešlý výpočet pro A
 A.)
3. Vektorové prostory a lineární zobrazení
Vraťme se teď na chvilku k systémům m lineárních rovnic pro n proměnných z
2.3 a předpokládejme navíc, že jde o rovnice tvaru A  x = 0, tj.


a11 . . . a1n
...
...
am1 . . . amn


 .


x1
...
xn


 =


0
...
0


 .
Díky vlastnosti distributivity pro násobení matic je okamžitě zřejmé, že součet dvou
řešení x = (x1, . . . , xn) a y = (y1, . . . , yn) splňuje
A  (x + y) = A  x + A  y = 0
a je tedy také řešením. Stejně tak zůstává řešením i skalární násobek ax. Množina
všech řešení pevně zvoleného systému rovnic je proto uzavřená na sčítání vektorů a
násobení vektorů skaláry. To byly základní vlastnosti vektorů dimenze n v Kn
, viz
2.1. Teď ale máme vektory v prostoru řešení s n souřadnicemi a ,,dimenze tohoto
prostoru určitě nemá být n (pokud matice systému není nulová). Případy dvou
rovnic pro dvě neznámé jsme potkali při řešení geometrických problémů v rovině v
1.34 a pro dvě závislé rovnice byl množinou všech řešení ,,jednorozměrný prostor přímka.
U dvou nezávislých rovnic to byl průsečík dvou přímek, tj. ,,nularozměrný
prostor.
Už v 1.16, jsme ale potkali ještě zajímavější příklad prostoru všech řešení homogenní
lineární diferenční rovnice (druhého řádu). Opět jsme dvě řešení mohli
libovolně kombinovat pomocí sčítání a násobení skaláry a dostali jsme tak všechna
možná řešení. Tyto ,,vektory ovšem jsou nekonečné posloupnosti čísel, přestože
intuitivně očekáváme, že dimenze celého prostoru řešení by měla být dvě.
Potřebujeme proto obecnější definici vektorového prostoru a jeho dimenze:
2.17
2.23. Abstraktní vektorové prostory. Vektorovým prostorem V nad polem
skalárů K rozumíme množinu spolu s operací sčítání, pro kterou platí axiomy
1.1(KG1)­(KG4), a s násobením skaláry, pro které platí axiomy 2.1(V1)­(V4).
Připoměňme naši jednoduchou konvenci ohledně značení: skaláry budou zpravidla
označovány znaky z počátku abecedy, tj. a, b, c, . . . , zatímco pro vektory budeme
užívat znaky z konce, u, v, w, x, y, z. Přitom ještě navíc většinou x, y, z budou
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 61
opravdu n-tice skalárů. Pro úplnost výčtu, písmena z prostředka, např. i, j, k,
budou nejčastěji označovat indexy výrazů.
Abychom se trochu pocvičili ve formálním postupu, ověříme jednoduché vlastnosti
vektorů (které pro n-tice skalárů byly samozřejmé, nicméně teď je musíme
odvodit z axiomů)
Tvrzení. Nechť V je vektorový prostor nad polem skalárů K, dále uvažme a, b, ai 
K, vektory u, v, uj  V . Potom
(1) a  u = 0 právě když a = 0 nebo u = 0
(2) (-1)  u = -u
(3) a  (u - v) = a  u - a  v
(4) (a - b)  u = a  u - b  u
(5)
n
i=1 ai 
m
j=1 uj =
n
i=1
m
j=1 ai  uj.
Důkaz. Můžeme rozepsat
(a + 0)  u
(V 2)
= a  u + 0  u = a  u
což podle axiomu (KG4) zaručuje 0  u = 0. Nyní
u + (-1)  u
(V 2)
= (1 + (-1))  u = 0  u = 0
a odtud -u = (-1)  u. Dále
a  (u + (-1)  v)
(V 2,V 3)
= a  u + (-a)  v = a  u - a  v
což dokazuje (3). Platí
(a - b)  u
(V 2,V 3)
= a  u + (-b)  u = a  u - b  u
a tím je ověřeno (4). Vztah (5) plyne indukcí z (V2) a (V1).
Zbývá (1): a  0 = a  (u - u) = a  u - a  u = 0, což spolu s prvním tvrzením
tohoto důkazu ukazuje jednu implikaci. K opačné implikaci poprvé potřebujeme
axiom pole pro skaláry a axiom (V4) pro vektorové prostory: je-li p  u = 0 a p = 0,
pak u = 1  u = (p-1
 p)  u = p-1
 0 = 0.
V odstavci 2.11 jsme pracovali s tzv. lineárními kombinacemi řádků matice.
S obecnými vektory budeme zacházet zcela analogicky: Výrazy tvaru a1  v1 +    +
ak  vk nazýváme lineární kombinace vektorů v1, . . . , vk  V . Množina vektorů
M  V ve vektorovém prostoru V nad K se nazývá lineárně nezávislá jestliže pro
každou k-tici vektorů v1, . . . , vk  M a každé skaláry a1, . . . , ak  K platí:
a1  v1 +    + ak  vk = 0 = a1 = a2 =    = ak = 0.
Posloupnost vektorů v1, . . . , vk nazveme lineárně nezávislou jestliže v1, . . . , vk jsou
po dvou různé a {v1, . . . , vk} je lineárně nezávislá. Množina M vektorů je lineárně
závislá, jestliže není lineárně nezávislá. Přímo z definice pak vyplývá, že neprázdná
podmnožina M vektorů ve vektorovém prostoru nad polem skalárů K je závislá
právě, když je jeden z jejích vektorů vyjádřitelný jako lineární kombinace ostatních.
Přímo z definic plyne, že každá podmnožina lineárně nezávislé množiny M je
lineárně nezávislá. Stejně snadno vidíme, že M  V je lineárně nezávislá právě
tehdy, když každá konečná podmnožina v M je lineárně nezávislá.
62 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.24. Vektorový prostor ano či ne? Rozhodněte o následujících množinách,
jestli jsou vektorovými prostory nad tělesem reálných čísel:
(1) Množina řešení homogenní diferenční rovnice.
(2) Množina řešení nehomogenní diferenční rovnice.
(3) {f : R  R|f(x) = c, c  R}
Řešení. (1) Ano. Množina řešení, tedy množina posloupností vyhovujících dané
diferenční homogenní rovnici, je evidentně uzavřená vzhledem ke sčítání i násobení
reálným číslem: mějme posloupnosti (xn)
n=0 a (yn)
n=0 vyhovující stejné homogenní
diferenční rovnici, tedy
a(n)xn + a(n - 1)xn-1 +    + a(1)x1 = 0
a(n)yn + a(n - 1)yn-1 +    + a(1)y1 = 0.
Sečtením těchto rovnic dostaneme
a(n)(xn + yn) + a(n - 1)(xn-1 + yn-1) +    + a(1)(x1 + y1) = 0,
tedy i posloupnost (xn + yn)
n=0, vyhovuje stejné diferenční rovnici. Rovněž tak
pokud posloupnost (xn)
n=0 vyhovuje dané rovnici, tak i posloupnost (kxn)
n=0,
kde k  R.
(2) Ne. Součet dvou řešení nehomogenní rovnice
a(n)xn + a(n - 1)xn-1 +    + a(1)x1 = c
a(n)yn + a(n - 1)yn-1 +    + a(1)y1 = c, c  R - {0}
vyhovuje rovnici
a(n)(xn + yn) + a(n - 1)(xn-1 + yn-1) +    + a(1)(x1 + y1) = 2c = c,
zejména pak nevyhovuje původní nehomogenní rovnici.
(3) Vnímáme­li zadání jako ,,pro pevné x  R a pevné c požadujeme po reálných
funkcích, aby f(x) = c , pak je to vektrorový prostor právě, když c = 0.
Pokud nám jde naopak o konstantní funkce, ty pochopitelně vektorový prostor jsou
(opět jednorozměrný reálný prostor R).
2.18
2.25. Generátory a podprostory. Podmnožina M  V se nazývá vektorovým
podprostorem jestliže spolu se zúženými operacemi sčítání a násobení skaláry je
sama vektorovým prostorem. Tzn. požadujeme
a, b  K, v, w  M, a  v + b  w  M.
Rozeberme si hned několik příkladů: Prostor n­tic skalárů Rm
se sčítáním a
násobením po složkách je vektorový prostor nad R, ale také vektorový prostor nad
Q. Např. pro m = 2, jsou vektory (1, 0), (0, 1)  R2
lineárně nezávislé, protože z
a  (1, 0) + b  (0, 1) = (0, 0) plyne a = b = 0. Dále, vektory (1, 0), (

2, 0)  R2
jsou lineárně závislé nad R, protože

2  (1, 0) = (

2, 0), ovšem nad Q jsou lineárně
nezávislé! Nad R tedy tyto dva vektory ,,generují jednorozměrný podprostor,
zatímco nad Q je dvourozměrný.
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 63
Polynomy stupně nejvýše m tvoří vektorový prostor Rm[x]. Polynomy můžeme
chápat jako zobrazení f : R  R a sčítání a násobení skaláry definujeme takto:
(f + g)(x) = f(x) + g(x), (a  f)(x) = a  f(x). Polynomy všech stupňů také tvoří
vektorový prostor R[x] a Rm[x]  Rn[x] je vektorový podprostor pro všechna
m  n  . Podprostory jsou např. všechny sudé polynomy nebo liché polynomy
(f(-x) = f(x)).
Úplně analogicky jako u polynomů můžeme definovat strukturu vektorového
prostoru na množině všech zobrazení R  R nebo všech zobrazení M  V libovolné
pevně zvolené množiny M do vektorového prostoru V .
Protože podmínka v definici podprostoru obsahuje pouze univerzální kvantifikátory,
je jistě průnik podprostorů opět podprostor. Snadno to ověříme i přímo:
Nechť Wi, i  I, jsou vektorové podprostory ve V , a, b  K, u, v  iIWi. Pak
pro všechny i  I, a  u + b  v  Wi, to ale znamená, že a  u + b  v  iIWi.
Zejména je tedy podprostorem průnik všech podprostorů W  V , které obsahují
předem danou množinu vektorů M  V . Říkáme, že takto M generuje
podprostor M , nebo že prvky M jsou generátory podprostoru M .
Zformulujme opět několik jednoduchých tvrzení o generování podprostorů:
Tvrzení. Pro každou podmnožinu M  V platí
(1) M = {a1  u1 +    + ak  uk; k  N, ai  K, uj  M, j = 1, . . . , k}
(2) M = M právě když M je vektorový podprostor
(3) jestliže N  M pak N  M je vektorový podprostor
(4)  = {0}  V , triviální podprostor.
Důkaz. (1) Platí {a1u1 +    + akuk}  M a zároveň je to vektorový podprostor
(ověřte!), který obsahuje M. (2) plyne z (1) a definice vektorového podprostoru.
(3): Nejmenší vektorový podprostor je {0}, protože prázdnou množinu
obsahují všechny podprostory a každý z nich obsahuje 0.
2.26. Báze a součty podprostorů. Nechť Vi, i  I, jsou podprostory ve V . Pak
podprostor generovaný jejich sjednocením, tj. iIVi , nazýváme součtem podprostorů
Vi. Značíme iI Vi. Zejména pro V1, . . . , Vk  V ,
V1 +    + Vk = V1  V2      Vk .
Viděli jsme, že každý prvek v uvažovaném součtu podprostorů můžeme vyjádřit
jako lineární kombinaci vektorů z podprostorů Vi. Protože však je sčítání
vektorů komutativní, lze k sobě poskládat členy patřící do stejného podprostoru a
pro konečný součet k podprostorů tak dostáváme
V1 + V2 +    + Vk = {v1 +    + vk; vi  Vi, i = 1, . . . , k}.
Součet W = V1 +  +Vk  V se nazývá přímý součet podprostorů, jsou-li průniky
všech dvojic triviální, tj. Vi  Vj = {0} pro všechny i = j. V takovém případě lze
každý vektor w  W napsat právě jedním způsobem jako součet
w = v1 +    + vk,
kde vi  Vi. Pro přímé součty píšeme
W = V1      Vk = k
i=1Vi.
Podmnožina M  V se nazývá báze vektorového prostoru V , jestliže M = V
a M je lineárně nezávislá. Vektorový prostor, který má konečnou bázi nazýváme
64 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
konečněrozměrný, mohutnost báze nazýváme dimenzí V 2
. Nemá-li V konečnou bázi,
říkáme, že V je nekonečněrozměrný. Píšeme dim V = k, k  N, případně k = .
Bázi k-rozměrného prostoru budeme obvykle zapisovat jako k-tici v = (v1 . . . , vk)
bázových vektorů. Jde tu především o zavedení konvence: U konečněrozměrných
podprostorů budeme totiž vždy uvažovat bázi včetně zadaného pořadí prvků i když
jsme to takto, striktně vzato, nedefinovali.
Zjevně, je-li (v1, . . . , vn) bazí V , je celý prostor V přímým součtem jednorozměrných
podprostorů
V = v1      vn .
2.20 2.27. Věta. Z libovolné konečné množiny generátorů vektorového prostoru V lze
vybrat bázi. Každá báze V má přitom stejný počet prvků.
Důkaz. První tvrzení je snadno vidět indukcí přes počet generátorů k: Jedině nulový
podprostor nepotřebuje žádný generátor a tedy umíme vybrat prázdnou bázi. Naopak,
nulový vektor vybrat nesmíme (generátory by byly lineárně závislé) a nic jiného už v
podprostoru není. Při k = 1 je V = {v} a v = 0 protože {v} je lineárně nezávislá
množina vektorů. Pak je ovšem {v} zároveň báze V .
Předpokládejme, že tvrzení platí pro k = n, a uvažme V = v1, . . . , vn+1 . Jsou-li
v1, . . . , vn+1 lineárně nezávislé, pak tvoří bázi. V opačném případě existuje index i takový,
že
vi = a1v1 +    + ai-1vi-1 + ai+1vi+1 +    + an+1vn+1.
Pak ovšem V = v1, . . . , vi-1, vi+1, . . . , vn+1 a již umíme vybrat bázi (podle indukčního
předpokladu).
Zbývá ověřit, že báze mají vždy stejný počet prvků. Uvažujme bázi (v1, . . . , vn) prostoru
V a libovolný nenulový vektor
u = a1  v1 +    + an  vn  V
s ai = 0 pro jisté i. Pak
vi =
1
ai
`
u - (a1  v1 +    + ai-1  vi-1 + ai+1  vi+1 +    + an  vn)
´
a proto také u, v1, . . . , vi-1, vi+1, . . . , vn = V . Jistě je to opět báze, protože vektory
v1, . . . , vi-1, vi+1, . . . , vn byly nezávislé, takže kdyby přidáním u vznikly lineárně závislé
vektory, pak by u bylo jejich lineární kombinací, ale to by znamenalo V = v1, . . . , vi-1, vi+1, . . . , vn ,
což není možné. Takže už víme, že pro libovolný nenulový vektor u  V existuje i,
1  i  n, takové, že (u, v1, . . . , vi-1, vi+1, . . . , vn) je opět báze V .
Dále budeme místo jednoho vektoru u uvažovat lineárně nezávislou množinu u1, . . . , uk
a budeme postupně přidávat u1, u2, . . . , vždy výměnou za vhodné vi podle předchozího
postupu. Je třeba pouze ověřit, že takové vi vždy bude existovat (tj. že se nebudou vektory
u vyměňovat vzájemně). Předpokládejme tedy, že již máme umístěné u1, . . . , u . Pak
u +1 se jistě vyjádří jako lineární kombinace těchto vektorů a zbylých vj. Pokud by pouze
koeficienty u u1, . . . , u byly nenulové, znamenalo by to, že již samy vektory u1, . . . , u +1
byly lineárně závislé, což je ve sporu s našimi předpoklady.
Pro každé k  n tak po k krocích získáme bázi ve které z původní došlo k výměně k
vektorů za nové. Pokud by k > n, pak již v n-tém kroku obdržíme bázi vybranou z těchto
vektorů, což znamená, že nemohou být lineárně nezávislé. Zejména tedy není možné, aby
dvě báze měly různý počet prvků.
2Všimněme si, že triviální podprostor je generován prázdnou množinou, která je "prázdnou"
bazí. Má tedy triviální podprostor dimenzi nulovou.
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 65
Ve skutečnosti jsme dokázali silnější tvrzení, tzv. Steinitzovu větu o výměně, která říká,
že pro každou konečnou bázi a každý systém lineárně nezávislých vektorů ve V umíme najít
podmnožinu bázových vektorů, které záměnou za zadané nové vektory dají opět bázi. Můžeme
si také sformulovat zjevné důsledky:
Tvrzení. (1) Každé dvě báze konečněrozměrného vektorového prostoru mají stejný
počet vektorů, tzn. že naše definice dimenze nezávisí na volbě báze.
(2) Má-li V konečnou bázi, lze každou lineárně nezávislou množinu doplnit do báze.
(3) Báze konečněrozměrných vektorových prostorů jsou právě maximální lineárně
nezávislé množiny
(4) Báze prostoru s konečnou dimenzí jsou právě minimální množiny generátorů
Důsledek. Nechť W, W1, W2  V jsou podprostory v prostoru konečné dimenze.
Pak platí
(1) dim W  dim V
(2) V = W právě když dim V = dim W
(3) dim W1 + dim W2 = dim(W1 + W2) + dim(W1  W2).
Důkaz. Zbývá dokázat pouze poslední tvrzení. To je zřejmé, pokud je dimenze
jednoho z prostorů nulová. Předpokládejme tedy dim W1 = r = 0, dim W2 = s = 0
a nechť (w1 . . . , wt) je báze W1 W2 (nebo prázdná množina, pokud je průnik triviální).
Podle předchozí věty lze tuto bázi doplnit na bázi (w1, . . . , wt, ut+1 . . . , ur) pro
W1 a bázi (w1 . . . , wt, vt+1, . . . , vs) pro W2. Vektory w1, . . . , wt, ut+1, . . . , ur, vt+1 . . . , vs
jistě generují W1 + W2. Ukážeme, že jsou přitom lineárně nezávislé. Nechť
a1  w1 +    + at  wt + bt+1  ut+1 +    + br  ur + ct+1  vt+1 +    + cs  vs = 0
Pak -(ct+1  vt+1 +    + cs  vs) = a1  w1 +    + at  wt + bt+1  ut+1 +    + br  ur
musí patřit do W2  W1. To ale má za následek, že bt+1 =    = br = 0. Pak ovšem
i a1  w1 +    + at  wt + ct+1  vt+1 +    + cs  vs = 0 a protože příslušné vektory
tvoří bázi W2, jsou všechny koeficienty nulové. Tvrzení (3) se nyní ověří přímým
počítáním generátorů.
2.21 2.28. Příklady. (1) Kn
má (jako vektorový prostor nad K) dimenzi n. Bazí je
např. n-tice vektorů
((1, 0, . . . , 0), (0, 1, . . . , 0) . . . , (0, . . . , 0, 1)).
Tuto bázi nazýváme standardní báze v Kn
. V případě konečného pole skalárů, např.
Zk, má celý vektorový prostor Kn
jen konečný počet prvků. Kolik?
(2) C jako vektorový prostor nad R má dimenzi 2, bázi tvoří např. čísla 1 a i.
(3) Km[x], tj. prostor polynomů stupně nejvýše m, má dimenzi m + 1, bazí
je např. posloupnost 1, x, x2
, . . . , xm
. Vektorový prostor všech polynomů K[x] má
dimenzi , umíme však ještě stále najít bázi (i když s nekonečně mnoha prvky):
1, x, x2
, . . . .
(4) Vektorový prostor R nad Q má dimenzi  a nemá spočetnou bázi.
(5) Vektorový prostor všech zobrazení f : R  R má také dimenzi  a nemá
spočetnou bázi.
66 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.22
2.29. Souřadnice vektorů. Když je množina {v1, . . . , vn}  V je báze, můžeme
každý vektor v  V vyjádřit jako lineární kombinaci v = a1v1 +    + anvn. Předpokládejme,
že to uděláme dvěma způsoby:
v = a1v1 +    + anvn = b1v1 +    + bnvn.
Potom ale
0 = (a1 - b1)  v1 +    + (an - bn)  vn
a proto ai = bi pro všechna i = 1, . . . , n. Lze tedy každý vektor zadat právě jediným
způsobem jako lineární kombinaci bázových vektorů. Koeficienty této jediné lineární
kombinace vyjadřující daný vektor v  V ve zvolené bázi (v1, . . . , vn) se nazývají
souřadnice vektoru v v této bázi.
Přiřazení, které vektoru u = a1v1 +    + anvn přiřadí jeho souřadnice v bázi
v, budeme značit stejným symbolem v : V  Kn
. Má tyto vlastnosti:3
* v(u + w) = v(u) + v(w); u, w  V
* v(a  u) = a  v(u); a  K, u  V .
To jsou ale vlastnosti zobrazení, kterým jsme v geometrii roviny říkali lineární
(zachovávaly naši lineární strukturu v rovině). Jsou tedy souřadnice vlastně lineární
zobrazení z (abstraktního) vektororového prostoru V do n-tic skalárů Kn
, kde n je
dimenze V . Než se budeme věnovat podrobněji závislosti souřadnic na volbě báze,
podíváme se obecněji na pojem linearity zobrazení.
2.30. Příklad.
2.30.1. Určete všechny konstanty a  R takové, aby polynomy ax2
+x+2, -2x2
+
ax + 3 a x2
+ 2x + a byly lineárně závislé (ve vektorovém prostoru polynomů jedné
proměnné stupně nejvýše 3 nad reálnými čísly).
Řešení. V bázi 1, x, x2
jsou souřadnice zadaných vektorů (polynomů) následující:
(a, 1, 2), (-2, a, 3), (1, 2, a). Polynomy budou závislé, právě když bude mít matice,
jejíž řádky jsou tvořeny souřadnicemi zadaných vektorů menší hodnost, než je počet
vektorů, v tomto případě tedy hodnost dvě a menší. V případě čtvercové matice
nižší hodnost než je počet řádků je ekvivalentní nulovosti determinantu dané matice.
Podmíka na a tedy zní
a 1 2
-2 a 3
1 2 a
= 0,
tj. a bude kořenem polynomu a3
- 6a - 5 = (a + 1)(a2
- a - 5), tj. úloha má tři
řešení a1 = -1, a2,3 = 1

21
2 .
2.23
2.31. Lineární zobrazení. Nechť V a W jsou vektorové prostory nad týmž polem
skalárů K. Zobrazení f : V  W se nazývá lineární zobrazení (homomorfismus)
jestliže platí:
(1) f(u + v) = f(u) + f(v), u, v  V
(2) f(a  u) = a  f(u), a  K, u  V .
3Všimněme si, že operace na levých a pravých stranách těchto rovnic nejsou totožné, naopak,
jde o operace na různých vektorových prostorech! Při této příležitosti se také můžeme zamyslet
nad obecným případem báze M (možná nekonečněrozměrného) prostoru V . Báze pak nemusí být
spočetná, pořád ale ještě můžeme definovat zobrazení M : V  KM (tj. souřadnice vektoru jsou
zobrazení z M do K).
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 67
Samozřejmě, že jsme taková zobrazení již viděli ve formě násobení matic:
Kn
x  A  x  Km
s maticí typu m/n nad K. Obraz Imf := f(V )  W je zjevně vektorový podprostor.
Stejně tak je vektorovým podprostorem množina všech vektorů Ker f :=
f-1
({0})  V . Nazývá se jádro lineárního zobrazení f. Lineární zobrazení, které je
bijekcí nazýváme izomorfismus.
Podobně jako u abstraktní definice vektorových prostorů, i zde je na místě z axiomů ověřit
zdánlivě samozřejmá tvrzení:
Tvrzení. Nechť f : V  W je lineární zobrazení. Pro všechny u, u1, . . . , uk  V ,
a1, . . . , ak  K platí:
(1) f(0) = 0
(2) f(-u) = -f(u)
(3) f(a1  u1 +    + ak  uk) = a1  f(u1) +    + ak  f(uk)
(4) pro každý vektorový podprostor V1  V je jeho obraz f(V1) vektorový podprostor ve
W.
(5) Pro každý podprostor W1  W je množina f-1
(W1) = {v  V ; f(v)  W1} vektorový
podprostor ve V .
Důkaz. Počítáme s využitím axiomů a definic a již dokázaných výsledků ­ dohledejte
samostatně!:
f(0) = f(u - u) = f((1 - 1)  u) = 0  f(u) = 0.
f(-u) = f((-1)  u) = (-1)  f(u) = -f(u).
Vlastnost (3) se ověří snadno indukcí z definičního vztahu.
Z (3) nyní plyne, že f(V1) = f(V1), je to tedy vektorový podprostor.
Je-li naopak f(u)  W1 a f(v)  W1, pak pro libovolné skaláry bude i f(a  u + b  v) =
a  f(u) + b  f(v)  W1.
2.24
2.32. Jednoduché důsledky.
(1) Složení g  f : V  Z dvou lineárních zobrazení f : V  W a g : W  Z je
opět lineární zobrazení.
(2) Lineární zobrazení f : V  W je izomorfismus právě když Im f = W a Ker f =
{0}  V . Inverzní zobrazení k izomorfismu je opět izomorfismus.
(3) Pro podprostory V1, V2 a lineární zobrazení f : V  W platí f(V1 + V2) =
f(V1) + f(V2), f(V1  V2)  f(V1)  f(V2).
(4) Zobrazení "přiřazení souřadnic" u : V  Kn
dané libovolně zvolenou bází
u = (u1, . . . , un) vektorového prostoru V je izomorfismus.
(5) Dva konečněrozměrné vektorové prostory jsou izomorfní právě když mají stejnou
dimenzi.
(6) Složení dvou izomorfismů je izomorfismus.
Důkaz. Ověření prvního tvrzení je snadné cvičení. Pro druhé si uvědomme,
že je-li f lineární bijekce, pak w = f-1
(au + bv) právě, když f(w) = f(a  f-1
(u) +
b  f-1
(v)). Je tedy inverze k lineární bijekci opět lineární zobrazení. Dále, f je
surjektivní právě, když Im f = W a pokud Ker f = {0}, pak f(u) = f(v) zaručuje
f(u - v) = 0, tj. u = v. Je tedy v tom případě f injektivní.
Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v
dokazované inkluzi opravdu nemusí nastat rovnost! Zbývající body jsou již zřejmé.
68 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.33. Opět souřadnice. Uvažujme libovolné vektorové prostory V, W nad K s
dim V = n, dim W = m a mějme lineární zobrazení f : V  W. Pro každou volbu
bází u = (u1, . . . , un) na V , v = (v1, . . . , vn) na W, máme k dispozici příslušná
přiřazení souřadnic:
V
f
//
u

W
v

Kn
fu,v
// Km
Přitom je každé lineární zobrazení jednoznačně určeno svými hodnotami na libovolné
množině generátorů, zejména tedy na bázi u. Označme
f(u1) = a11  v1 + a21  v2 +    + am1vm
f(u2) = a12  v1 + a22  v2 +    + am2vm
...
f(un) = a1n  v1 + a2n  v2 +    + amnvm
tj. skaláry aij tvoří matici A, kde sloupce jsou souřadnice hodnot zobrazení f na
bázových vektorech. Pro obecný vektor u = b1  u1 +    + bn  un spočteme
f(u) = b1  f(u1) +    + bn  f(un)
= b1(a11v1 +    + am1vm) +    + bn(a1nv1 +    + amnvm)
= (b1a11 +    + bna1n)  v1 +    + (b1am1 +    + bnamn)  vm
Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení
fu,v(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že
vektory v Kk
chápeme jako sloupce, tj. matice typu k/1
fu,v(u(w)) = v(f(w)) = A  u(w).
Matici A nazýváme maticí zobrazení f v bázích u, v. Naopak, každá volba matice A
typu m/n zadává jednoznačně lineární zobrazení Kn
 Km
. Máme-li tedy zvoleny
báze prostorů V a W, odpovídá každé volbě matice typu m/n právě jedno lineární
zobrazení V  W.
Jestliže za V i W zvolíme tentýž prostor, ale s různými bazemi, a za f identické
zobrazení, vyjadřuje náš postup vektory báze u v souřadnicích vzhledem k v.
Označme výslednou matici T. Když pak zadáme vektor u
u = x1u1 +    + xnun
v souřadnicích vzhledem k u a dosadíme za ui, obdržíme souřadné vyjádření x
téhož vektoru v bázi v. Stačí k tomu přeskládat pořadí sčítanců a vyjádřit skaláry
u jednotlivých vektorů báze. Podle výše uvedeného postupu musí vyjít x = T  x.
Tuto matici nazýváme matice přechodu od báze u k bázi v. Matice T zadávající
transformaci souřadnic z báze u do báze v je tedy maticí identického zobrazení
idV : V  V :
V
idV
//
u

V
v

Kn
(idV )u,v
// Kn
Přímo z definice vyplývá:
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 69
Tvrzení. Matici T přechodu (od báze u k bázi v) získáme tak, že souřadnice vektorů
báze u v bázi v napíšeme do sloupců matice T.
Funkce matice přechodu je taková, že známe-li souřadnice x vektoru v bázi u,
pak jeho souřadnice v bázi v se obdrží vynásobením sloupce x maticí přechodu
(zleva). Protože inverzní zobrazení k identickému je opět totéž identické zobrazení,
je matice přechodu vždy invertibilní a její inverze je právě matice přechodu opačným
směrem, tj. od báze v k bázi u.
2.26
2.34. Více souřadnic. Nyní snadno vidíme, jak se skládají souřadná vyjádření
lineárních zobrazení. Uvažme ještě další vektorový prostor Z nad K dimenze k s
bází w, lineární zobrazení g : W  Z a označme příslušnou matici gv,w. Pro matice
těchto zobrazení dostáváme čímž jsme odvodili:
gv,w  fu,v(x) = B  (A  x) = (B  A)  x = (g  f)u,w(x)
pro všechny x  Kn
. Všimněte si, že isomorfismy odpovídají právě invertibilním
maticím.
Stejný postup nám dává odpověď na otázku, jak se změní matice zobrazení,
změníme-li báze na definičním oboru i oboru hodnot:
V
idV
//
u

V
f
//
u

W
idW
//
v

W
w

Kn T // Kn
fu,v
// Km S-1
// Km
kde T je matice přechodu od u k u a S je matice přechodu od v k v. Je-li tedy A
původní matice zobrazení, bude nová dána jako A = S-1
AT.
Ve speciálním případě lineárního zobrazení f : V  V vyjadřujeme zpravidla
f pomocí jedné báze u prostoru V , to je přechod k nové bázi u bude znamenat
změnu na A = T-1
AT.
2.35. Příklady.
2.35.1.
2.35.2. Je dáno lineární zobrazení R3
 R3
ve standardní bázi následujicí maticí:


1 -1 0
0 1 1
2 0 0

 .
Napište matici tohoto zobrazení v bázi
f1 = (1, 1, 0)
f2 = (-1, 1, 1)
f3 = (2, 0, 1).
Řešení. Matice přechodu T od báze f = (f1, f2, f3) k standardní bázi, tj. bázi
danou vektory (1, 0, 0), (0, 1, 0), (0, 0, 1), získáme podle Tvrzení 2.25 zapsáním souřadnic
vektorů f1, f2, f3 ve standardní bázi do sloupců matice přechodu T. Máme
tedy
T =


1 -1 2
1 1 0
0 1 1

 .
70 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Matice přechodu od standardní báze k bázi f je potom T-1
, což je


1
4
3
4 -1
2
-1
4
1
4
1
2
1
4 -1
4
1
2

 .
Matice zobrazení v bázi f je potom
T-1
AT =


1
4 2 -3
4
5
4 0 7
4
3
4 -2 9
4

 .
2.35.3. Určete, jaké lineární zobrazení R3
 R3
zadává matice


- 2
3 -1
3 -2
3
4
3 -7
3 -8
3
- 1 1 1


Řešení. Dvojnásobná vlastní hodnota -1, příslušné vlastní vektory [2, 0, 1], [1, 1, 0],
jednonásobná vlastní hodnota 0, vlastní vektor [1, 4, -3]. Osová souměrnost podle
přímky dané posledním vektorem složená s projekcí na rovinu kolmou k poslednímu
vektoru, tedy danou obecnou rovnicí x + 4y - 3z = 0.
2.27
2.36. Lineární a multilineární formy. Speciálním případem lineárních zobrazení
jsou tzv. lineární formy. Jde o lineární zobrazení z vektorového prostoru V nad
polem skalárů K do skalárů K. Jsou-li dány souřadnice na V , je přiřazení jednotlivé
i-té souřadnice vektorům právě takovou lineární formou.
Při pevně zvolené bázi {1} na K jsou s každou volbou báze na V lineární formy
ztotožněny s maticemi typu 1/n, tj. s řádky. Vyčíslení takové formy na vektoru je
pak dáno vynásobením příslušného řádkového vektoru se sloupcem souřadnic.
Množina všech lineárních forem na daném prostoru V je opět vektorový prostor,
značíme jej V 
. Pokud je V konečněrozměrný, je V 
izomorfní prostoru V . Realizace
takového izomorfismu je dána např. volbou tzv. duální báze k zvolené bázi na V ,
jejímiž prvky i jsou právě formy zadávající i-tou souřadnici.
Podobně budeme pracovat i se zobrazeními ze součinu k kopií vektorového
prostoru V do skalárů lineárních v každém argumentu. Hovoříme o k-lineárních
formách. Budeme se setkávat (a již jsme je viděli v dimenzi 2) zejména s n-lineárními
antisymetrickými formami (formy objemu) a symetrickými bilineárními formami.
2.28
2.37. Velikost vektorů. V geometrii roviny jsem již pracovali nejen s bázemi
a lineárními zobrazeními, ale také s velikostí vektorů a jejich úhly. Pro zavedení
těchto pojmů jsme použili souřadného vyjádření pro velikost v = (x, y):
v = x2 + y2,
zatímco úhel  dvou vektorů v = (x, y) a v = (x , y ) byl dán
cos  =
xx + yy
v v
.
3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 71
Povšimněme si, že výraz v čitateli posledního výrazu je lineární v každém ze
svých argumentů, značíme jej v, v a říkáme mu skalární součin vektorů v a v .
Skalární součin je také symetrický ve svých argumentech a platí
v 2
= v, v .
Zejména platí, že v = 0 právě, když v = 0. Z našich úvah je také vidět, že v
Euklidovské rovině jsou dva vektory kolmé právě, když je jejich skalární součin
nulový.
Analogicky budeme postupovat v obecném případě reálného vektorového prostoru.
Skalární součin na vektorovém prostoru V nad reálnými čísly je bilineární
symetrická forma , : V × V  R taková, že v, v  0 a je roven nule pouze při
v = 0. Pro skalární součin se často používá také obvyklé tečky, tj. u, v = u  v.
Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je
skalár) nebo něco jiného.
Vektory v a w  V se nazývají ortogonální, jestliže v, w = 0. Vektor v se
nazývá normovaný, jestliže v = 1. Báze prostoru V složená z ortogonálních vektorů
se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to
ortonormální báze.
Úhel  dvou vektorů v a w je dán vztahem
cos  =
v, w
v w
.
Tvrzení. Skalární součin je v každé ortonormální bázi dán výrazem
x, y = xT
 y.
V obecné bázi V existuje symetrická matice S taková, že
x, y = xT
 S  y.
Důkaz. Skalární součin je plně určen svými hodnotami na dvojicích bázových
vektorů. Zvolme tedy bázi u a označme
sij = ui, uj .
Pak ze symetričnosti skalárního součinu plyne sij = sji a z lineárnosti součinu v
každém z argumentů dostáváme:
i
xiui,
j
yjuj =
i,j
xiyj ui, uj =
i,j
sijxiyj.
Pokud je báze ortonormální, je matice S jednotkovou maticí.
Uvidíme o něco později, že na každém vektroovém prostoru se skalárním součinem
existují ortonormální báze, viz 2.48.
2.38. Příklady.
2.38.1. Označme S střed hrany AB krychle ABCDEFGH (v obvyklém označení,
s hranou AE). Určete cosinus odchylky úseček ES a BG.
Řešení. Vzhledem k tomu, že homotetie (stejnolehlost) je podobným zobrazením,
tj. zachovává úhly, můžeme předpokládat, že krychle má hranu velikosti 1.
Umístíme-li navíc bod A do počátku souřadné soustavy a body B, resp. E do bodů
72 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
o souřadnicích [1, 0, 0], resp. [0, 0, 1], pak mají zbylé uvažované body následující souřadnice:
S = [1/2, 0, 0], G = [1, 1, 1], tedy vektor ES = (1/2, 0, -1) a BG = (0, 1, 1).
Pro hledaný cosinus odchylky  tedy máme
cos() =
(1/2, 0, -1)  (0, 1, 1)
(1/2, 0, -1) (0, 1, 1)
=

2

5
.
4. Vlastnosti lineárních zobrazení
Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní
dostaneme k pořádnějšímu pochopení nástrojů, které nám vektorové prostory pro
lineární modelování procesů a systémů nabízejí.
2.29 2.39. Příklady. Začneme několika příklady v prostorech malých dimenzí. Ve standardní
bázi R2
uvažujme následující matice zobrazení f : R2
 R2
:
A =
1 0
0 0
, B =
0 1
0 0
, C =
a 0
0 b
, D =
0 -1
1 0
.
Matice A zadává kolmou projekci podél podprostoru
W  {(0, a); a  R}  R2
na podprostor
V  {(a, 0); a  R}  R2
.
Evidentně pro toto zobrazení f : R2
 R2
platí f  f = f a tedy f|Im f je identické
zobrazení. Jádrem f je právě podprostor W.
Matice B má vlastnost B2
= 0, platí tedy totéž o příslušném zobrazení f.
Můžeme si jej představit jako matici derivování polynomů R1[x] stupně nejvýše
jedna v bázi (1, x).
Matice C zadává zobrazení f, které první vektor báze zvětší a­krát, druhý
b­krát. Tady se nám tedy celá rovina rozpadá na dva podprostory, které jsou zobrazením
f zachovány a ve kterých jde o pouhou homotetii, tj. roztažení skalárním
násobkem. Např. volba a = 1, b = -1 odpovídá komplexní konjugaci x+iy  x-iy
na dvourozměrném reálném prostoru R2
C v bázi (1, i). Toto je lineární zobrazení
reálného vektorového prostoru, nikoliv však jednorozměrného komplexního prostoru
C. V geometrii roviny jde o zrcadlení podle osy x.
Matice D je maticí rotace o pravý úhel ve standardní bázi. Jako pro každé
lineární zobrazení, které je bijekcí, umíme najít báze na definičním oboru a oboru
hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv
bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto
případě totéž s jednou bází na začátku i konci. Zkusme však uvažovat matici C
jako matici zobrazení g : C2
 C2
. Pak umíme najít vektory u = (i, 1), v = (1, i),
pro které bude platit
g(u) =
0 -1
1 0

i
1
= i  u, g(v) =
0 -1
1 0

1
i
= -i  v.
To ale znamená, že v bázi (u, v) na C2
má g matici
K =
i 0
0 -i
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 73
a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále
prvky a, a = cos(1
2 )+i sin(1
2 ). Jinými slovy, argument v goniometrickém tvaru
tohoto komplexního čísla udává úhel otočení. Navíc, můžeme si označit reálnou a
imaginární část vektoru u takto
u = xu + iyu = Re u + i Im u =
0
1
+ i 
1
0
a zúžení komplexního zobrazení g na reálný vektorový podprostor generovaný vektory
xu a iyu (tj. násobení komplexní jednotkou i) je právě otočení o úhel 1
2 .
2.30
2.40. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v
předchozích příkladech byly odpovědi na otázku ,,jaké jsou vektory splňující rovnici
f(u) = au? pro nějaké skaláry a. Zvolme tedy pevně lineární zobrazní f : V  V
na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou
rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých
bazích, jde o výraz
A  x - a  x = (A - a  E)  x = 0.
Z předchozího víme, že taková soustava rovnic má jediné řešení x = 0, pokud je
matice A - aE invertibilní. My tedy chceme najít takové hodnoty a  K, pro které
naopak A - aE invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta
2.22)
e2.1 (2.1) det(A - a  E) = 0.
Jestliže považujeme  = a za proměnnou v předchozí skalární rovnici, hledáme ve
skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše,
kořeny mohou, ale nemusí existovat podle volby pole skalárů K.
Skaláry vyhovující rovnici f(u) = a  u pro nenulový vektor u  V nazýváme
vlastní čísla zobrazení f, příslušné vektory u pak vlastní vektory zobrazení f.
Z definice vlastních čísel je zřejmé, že jejich výpočet nemůže záviset na volbě
báze a tedy matice zobrazení f. Skutečně, jako přímý důsledek trasformačních vlastností
z 2.34 a Cauchyovy věty 2.18 pro výpočet determinantu součinu dostáváme
jinou volbou souřadnic matici A = P-1
AP s invertibilní maticí P a
|P-1
AP - E| = |P-1
AP - P-1
EP| = |P-1
(A - E)P| = |P-1
)||(A - E||P|,
protože násobení skalárů je komutativní a |P-1
| = |P|-1
.
Obdobnou terminologii používáme i pro matice. Pro matici A dimenze n nad K
nazýváme polynom |A - E|  Kn[] charakteristický polynom matice A. Kořeny
tohoto polynomu jsou vlastní hodnoty matice A. Je-li A matice zobrazení f : V  V
v jisté bázi, pak |A - E| nazýváme také charakteristický polynom zobrazení f.
Protože je charakteristický polynom zobrazení f : V  V nezávislý na volbě
báze V , dim V = n, jsou i jeho koeficienty u jednotlivých mocnin proměnné 
skaláry vyjadřující vlastnosti zobrazení f, tj. nemohou záviset na naší volbě báze.
Zejména je snadné vyjádřit koeficienty u nejvyšších a nejnižších mocnin:
|A -   E| = (-1)n
n
+ (-1)n-1
(a11 +    + ann)  n-1
+    + |A|  0
Součet diagonálních členů matice se nazývá stopa matice, značíme ji TrA, stopa
zobrazení je definována jako stopa jeho matice v libovolné bázi.
2.30a 2.41. Věta. Vlastní vektory lineárního zobrazení f : V  V příslušné různým
vlastním hodnotám jsou lineárně nezávislé.
74 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Důkaz. Nechť a1, . . . , ak jsou různé vlastní hodnoty zobrazení f a u1, . . . , uk
vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet
lineárně nezávislých vektorů mezi zvolenými. Předpokládejme, že u1, . . . , u jsou
lineárně nezávislé a ul+1 = i ciui je jejich lineární kombinací. Alespoň = 1 lze
zvolit, protože vlastní vektory jsou nenulové. Pak ovšem al+1  ul+1 =
l
i=1 al+1 
ci  ui, tj.
f(ul+1) =
l
i=1
al+1  ci  ui =
l
i=1
ci  f(ui) =
l
i=1
ci  ai  ui.
Odečtením dostáváme 0 =
l
i=1(al+1 -ai)ci ui, všechny rozdíly vlastních hodnot
jsou nenulové a alespoň jeden koeficient ci je nenulový. To je spor s předpokládanou
nezávislostí u1, . . . , u .
Důsledek. Jestliže existuje n navzájem různých kořenů ai charakteristického polynomu
zobrazení f : V  V , dim V = n, pak existuje rozklad V na přímý součet
vlastních podprostorů dimenze 1. To znamená, že existuje báze V složená výhradně z
vlastních vektorů a v této bázi má f diagonální matici. Příslušnou bázi (vyjádřenou
v souřadnicích vzhledem k libovolně zvolené bázi V ) obdržíme řešením n systémů
homogenních lineárních rovnic o n neznámých s maticemi (A - ai  E), kde A je
matice f ve zvolené bázi.
2.31 2.42. Příklady. (1) Uvažme zobrazení s maticí ve standardní bázi
f : R3
 R3
, A =


0 0 1
0 1 0
1 0 0

 .
Pak dostáváme
|A - E| =
- 0 1
0 1 -  0
1 0 =
-3
+ 2
+  - 1,
s kořeny 1,2 = 1, 3 = -1. Vlastní vektory s vlastní hodnotou  = 1 se spočtou:


-1 0 1
0 0 0
1 0 -1

 
1 0 -1
0 0 0
0 0 0

 ;
s bází prostoru řešení, tj. všech vlastních vektorů s touto vlastní hodnotou
u1 = (0, 1, 0), u2 = (1, 0, 1).
Podobně pro  = -1 dostáváme třetí nezávislý vlastní vektor


1 0 1
0 2 0
1 0 1

 
1 0 1
0 2 0
0 0 0

  u3 = (-1, 0, 1).
V bázi u1, u2, u3 (všimněte si, že u3 musí být lineárně nezávislý na zbylých
dvou díky předchozí větě a u1, u2 vyšly jako dvě nezávislá řešení) má f diagonální
matici
A =


1 0 0
0 1 0
0 0 -1

 .
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 75
Celý prostor R3
je přímým součtem vlastních podprostorů, R3
= V1 V2, dim V1 =
2, dim V2 = 1. Tento rozklad je dán jednoznačně a vypovídá mnoho o geometrických
vlastnostech zobrazení f. Vlastní podprostor V1 je navíc přímým součtem jednorozměrných
vlastních podprostorů, které lze však zvolit mnoha různými způsoby
(takový další rozklad nemá tedy již žádný geometrický význam).
(2) Uvažme lineární zobrazení f : R2[x]  R2[x] definované derivováním polynomů,
tj. f(1) = 0, f(x) = 1, f(x2
) = 2x. Zobrazení f má tedy v obvyklé bázi
(1, x, x2
) matici
A =


0 1 0
0 0 2
0 0 0

 .
Charakteristický polynom je |A -   E| = -3
, existuje tedy pouze jediná vlastní
hodnota,  = 0. Spočtěme vlastní vektory:


0 1 0
0 0 2
0 0 0

 
0 1 0
0 0 1
0 0 0

 .
Prostor vlastních vektorů je tedy jednorozměrný, generovaný konstantním polynomem
1.
2.43. Příklad včetně změny báze.
2.43.1. Uvažujme lineární zobrazení R3
 R3
dané ve standardní bázi maticí:
A =


1 1 0
1 2 1
1 2 1


Určete toto zobrazení a napište jeho matici v bázi:
e1 = [1, -1, 1]
e2 = [1, 2, 0]
e3 = [0, 1, 1]
Řešení. Spočítejme nejprve vlastní čísla jim příslušné vlastní vektory: charakteristický
polynom dané matice je
1 -  1 0
1 2 -  1
1 2 1 - 
= -3
+ 42
- 2 = -(2
- 4 + 2).
Kořeny tohoto polynomu, vlastní čísla, udávají, kdy nebude mít matice


1 -  1 0
1 2 -  1
1 2 1 - 


plnou hodnost, tedy soustava rovnic


1 -  1 0
1 2 -  1
1 2 1 - 


x1
x2
x3


bude mít i jiné řešení než řešení x = (0, 0, 0). Vlastní čísla tedy jsou 0, 2 +

2,
2 -

2. Spočítejme vlastní vektory příslušné jednotlivým vlastním hodnotám:
76 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
* 0: Řešíme tedy soustavu


1 1 0
1 2 1
1 2 1


x1
x2
x3

 = 0
Jejím řešením je jednodimenzionální vektorový prostor vlastních vektorů (1, -1, 1) .
* 2 +

2: Řešíme soustavu


-(1 +

2) 1 0
1 -

2 1
1 2 -(1 +

2)


x1
x2
x3

 = 0.
Řešením je jednodimenzionální prostor (1, 1 +

2, 1 +

2) .
* 2 -

2: Řešíme soustavu


(

2 - 1) 1 0
1

2 1
1 2 (

2 - 1)


x1
x2
x3

 = 0.
Řešením je prostor vlastních vektorů (1, 1 -

2, 1 -

2) .
Zobrazení tedy můžeme interpretovat jako projekci podél vektoru (1, -1, 1) do
roviny dané vektory (1, 1 +

2, 1 +

2) a (1, 1 -

2, 1 -

2) složenou s lineárním
zobrazením daným natažením daným vlastními čísly ve směru uvedených vlastních
vektorů.
Nyní jej vyjádřeme v uvedené bázi. K tomu budeme potřebovat matici přechodu
T od standardní báze k dané nové bázi. Tu získáme tak, že souřadnice vektorů staré
báze v bázi nové napíšeme do sloupců matice T. My však snadněji zapíšeme matici
přechodu od priklané báze k bázi standardní, tedy matici T-1
. Souřadnice vektorů
nové báze pouze zapíšeme do sloupců:
T-1
=


1 1 0
-1 2 1
1 0 1


Pro matici B zobrazení v nové bázi pak máme (viz 2.34).
B = TAT-1
=


1 1 0
1 2 1
1 2 1

 
1
2 -1
4
1
4
1
2
1
4 -1
4
-1
2
1
4
3
4

 
1 1 0
-1 2 1
1 0 1


2.44. Další příklady.
2.44.1. Nalezňete vlastní čísla a jim příslušné (prostory) vlastních vektorů matice:


-1 -5
6
5
3
0 -2
3 -2
3
0 1
6 -4
3


Řešení. Trojnásobná vlastní hodnota -1, příslušný vektorový prostor je (1, 0, 0), (0, 2, 1) .
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 77
2.32
2.45. Spektra a nilpotentní zobrazení. Spektrum lineárního zobrazení f :
V  V je posloupnost kořenů charakteristického polynomu zobrazení f, včetně
násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako
kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze
příslušného podprostoru vlastních vektorů.
Lineární zobrazení f : V  V se nazývá nilpotentní, jestliže existuje celé číslo
k  1 takové, že iterované zobrazení fk
je identicky nulové. Nejmenší číslo k s touto
vlastností se nazývá stupněm nilpotentnosti zobrazení f. Zobrazení f : V  V se
nazývá cyklické, jestliže existuje báze (u1, . . . , un) prostoru V taková, že f(u1) = 0
a f(ui) = ui-1 pro všechna i = 2, . . . , n. Jinými slovy, matice f v této bázi je tvaru
A =


0 1 0 . . .
0 0 1 . . .
...
...
...


 .
Je-li f(v) = a  v, pak pro každé přirozené k je fk
(v) = ak
 v. Zejména tedy může
spektrum nilpotentního zobrazení obsahovat pouze nulový skalár (a ten tam vždy
je).
Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň
nilpotentnosti roven dimenzi prostoru V . Operátor derivování na polynomech definovaný v
předchozím příkladu 2.42 je příkladem cyklického zobrazení. Kupodivu to platí i naopak a každé
nilpotentní zobrazení je přímým součtem cyklických. Navíc pro každé lineární zobrazení f :
V  V , pro které je součet algebraických násobností vlastních čísel roven dimenzi (to nastane
vždy pro prostory nad komplexními skaláry), existuje jednoznačný rozklad V na invariantní
podprostory Vi příslušné k jednotlivým vlastním číslům i, na kterých je zobrazení f - i idVi
nilpotentní.
Tento dosti hluboký výsledek nebudeme dokazovat, sformulujeme jen výslednou
větu o Jordanově rozkladu. V ní vystupují vektorové (pod)prostory a lineární
zobrazení na nich s jediným vlastním číslem  a maticí
J =


 1 0 . . . 0
0  1 . . . 0
...
...
...
...
0 0 0 . . . 


.
Takovýmto maticím (a odpovídajícím invariantním podprostorům) se řídá Jordanův
blok.
2.33 2.46. Věta. Nechť V je vektorový prostor dimenze n a f : V  V je lineární zobrazení
s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný
rozklad prostoru V na přímý součet podprostorů
V = V1      Vk
takových, že f(Vi)  Vi, zúžení f na každé Vi má jediné vlastní číslo i a zúžení
f - i  id na Vi je buď cyklické nebo nulové zobrazení.
Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální
tvar s Jordanovými bloky podél diagonály. Celkový počet jedniček nad diagonálou
v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou
násobností vlastních čísel.
78 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
Všimněme si, že jsme tuto větu plně dokázali v případech, kdy jsou všechna
vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních
čísel stejné.
2.47. Projekce. Lineární zobrazení f : V  V se nazývá projekce, jestliže platí
f  f = f.
V takovém případě je pro každý vektor v  V
v = f(v) + (v - f(v))  Im(f) + Ker(f) = V
a je-li v  Im(f) a f(v) = 0, pak je i v = 0. Je tedy přechozí součet podprostorů
přímý. Říkáme, že f je projekce na podprostor W = Im(f) podél podprostoru
U = Ker(f). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor
na komponentu ve W a v U a tu druhou zapomeneme.
Předpokládejme nyní, že na V je definován skalární součin, viz 2.37. Pro každý
pevně zvolený podprostor W  V definujeme jeho ortogonální doplněk
W
= {u  V ; u, v = 0 pro všechny v  W}.
Přímo z definice je zjevné, že W
je vektorový podprostor. Jestliže W  V má
bázi (u1, . . . , uk) je podmínka pro W
dána jako k homogenních rovnic pro n
proměnných. Bude tedy mít W
dimenzi alespoň n - k. Zároveň ale u  W  W
znamená u, u = 0 a tedy i u = 0 podle definice skalárního součinu. Zřejmě je tedy
vždy
V = W  W
.
Každý podprostor W = V definuje kolmou projekci na W. Je to projekce na
W podél W
.
2.33a
2.48. Existence ortonormální báze. Přímočaré početní využití kolmých projekcí
vede k tzv. Grammovu­Schmidtovu ortogonalizačnímu procesu. Cílem procedury
je z dané posloupnosti nenulových generátorů v1, . . . , vk konečněrozměrného
prostoru V vytvořit ortogonální množinu nenulových generátorů pro V .
Začneme prvním (nenulovým) vektorem v1 a spočteme kolmou projekci v2 do
v1

 {v1, v2} .
Výsledek bude nenulový právě, když je v2 nezávislé na v1. Ve všech dalších krocích
budeme postupovat obdobně.
V -tém kroku tedy chceme, aby pro v +1 = u +1 + a1v1 +    + a v platilo
v +1, vi = 0, pro všechny i = 1, . . . , . Odtud plyne
0 = u +1 + a1v1 +    + a v , vi = u +1, vi + ai vi, vi
a je vidět, že vektory s požadovanými vlastnostmi jsou určeny jednoznačně až na
násobek. Dokázali jsme tedy následující tvrzení:
Tvrzení. Nechť (u1, . . . , uk) je lineárně nezávislá k-tice vektorů prostoru V se
skalárním součinem. Pak existuje ortogonální systém vektorů (v1, . . . , vk) takový,
že vi  u1, . . . , ui , i = 1, . . . , k. Získáme je následující procedurou:
* Z nezávislosti vektorů ui plyne u1 = 0. Položíme v1 = u1.
* Máme-li již vektory v1, . . . , v potřebných vlastností klademe
v +1 = u +1 + a1v1 +    + a v , ai = u
+1, vi
vi
2
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 79
Kdykoliv máme ortogonální bázi vektorového prostoru V , stačí vektory vynormovat
a získáme bázi ortonormální. Dokázali jsme proto:
Důsledek. Na každém vektorovém prostoru se skalárním součinem existuje ortonormální
báze.
V ortonormální bázi se obzvlášť snadno spočtou souřadnice a kolmé projekce.
Skutečně, mějme ortonormální bázi (e1, . . . , en) prostoru V . Pak každý vektor v =
x1e1 +    + xnen splňuje
ei, v = ei, x1e1 +    + xnen = xi
a platí tedy vždy
e2.2 (2.2) v = e1, v e1 +    + en, v en.
Pokud máme zadán podprostor W  V a jeho ortonormální bázi (e1, . . . , ek),
jde ji jistě doplnit na ortonormální bázi (e1, . . . , en) celého V . Kolmá projekce
obecného vektoru v  V do W pak bude dána vztahem
v  e1, v e1 +    + en, v ek.
Pro kolmou projekci nám tedy stačí znát jen ortonormání bázi podprostoru W, na
nejž promítáme.
Povšimněme si také, že obecně jsou projekce f na podprostor W podél U a
projekce g na U podél W svázány vztahem g = idV -f. Je tedy u kolmých projekcí
na daný podprostor W vždy výhodnější počítat ortonormální bázi toho z dvojice
W, W
, který má menší dimenzi.
Uvědomme si také, že existence ortonormální báze nám zaručuje, že pro každý
prostor V se skalárním součinem existuje lineární zobrazení, které je izomorfismem
mezi V a prostorem Rn
se standardním skalárním součinem. Podrobně to bylo
ukázáno již ve Tvrzení 2.37, kde jsme ukázali, že hledaným izomorfismem je právě
přiřazení souřadnic. Řečeno volnými slovy ­ v ortonormální bázi se skalární součin
pomocí souřadnic počítá stejnou formulí jako standardní skalární součin v Rn
.
2.49. Příklad.
2.49.1. Napište matici zobrazení kolmé projekce do roviny procházející počátkem
a kolmé na vektor (1, 1, 1).
Řešení. Obraz libovolného bodu (vektoru) x = (x1, x2, x3)  R3
v uvažovaném
zobrazení získáme tak, že od daného bodu odečteme jeho kolmou projekci do normálového
směru dané roviny, tedy do směru (1, 1, 1). Tato projekce p je dána (viz
přednáška) jako
(x, (1, 1, 1))
|(1, 1, 1)|2
= (
x1 + x2 + x3
3
,
x1 + x2 + x3
3
,
x1 + x2 + x3
3
).
Výsledné zobrazení je tedy
x-p = (
2x1
3
x2
+ x3
3
,
2x2
3
x1
+ x3
3
,
2x3
3
x1
+ x2
3
) =


2
3 -1
3 -1
3
-1
3
2
3 -1
3
-1
3 -1
3
2
3


x1
x2
x3

 .
80 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA
2.50. Tři příklady k samostatnému řešení.
2.50.1. 1. Napište nějakou bázi reálného vektorového prostoru matic 3 × 3 nad R
s nulovou stopou (součet prvků na diagonále) a napište souřadnice matice


1 2 0
0 2 0
1 -2 -3


v této bázi.
2.50.2. 2. Zaveďte nějaký skalární součin na vektorovém prostoru matic z předchozího
příkladu. Spočítejte normu matice z předchozího příkladu, která je indukovaná
Vámi zavedeným součinem.
2.50.3. 3. Gramm-Schmidtovým ortogonalizačním procesem nalezněte nějakou ortonormální
bází podprostoru V  R, kde V = {(x1, x2, x3, x4)  R4
|x1 +2x2 +x3 =
0}.
2.36
2.51. Ortogonální zobrazení. Zobrazení f : V  W, které zachovává velikosti
pro všechny vektory u  V , se nazývá ortogonální zobrazení. Požadujeme tedy
f(u), f(u) = u, u .
Z linearity f a symetrie skalárního součinu plyne
f(u + v), f(u + v) = f(u), f(u) + f(v), f(v) + 2 f(u), f(v) ,
je tedy ekvivalentní podmínkou i zdánlivě silnější požadavek, aby
f(u), f(v) = u, v ,
pro všechny vektory u, v  V . V úvodní diskusi o geometrii v rovině jsme ve Větě
1.37 dokázali, že lineární zobrazení R2
 R2
zachovává velikosti vektorů právě, když
jeho matice ve standardní bázi (a ta je ortonormální vzhledem ke standardnímu
skalárnímu součinu) splňuje AT
 A = E, tj. A-1
= AT
.
Obecně, ortogonální zobrazení musí vždycky být injektivní, protože podmínka
f(u), f(u) = 0
znamená i u, u = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru
hodnot alespoň taková, jako je dimenze definičního oboru f. Pak ovšem je dimenze
obrazu rovna dimenzi oboru hodnot a bez újmy na obecnost můžeme rovnou předpokládat,
že jsou stejné a f : V  V (pokud by nebyly, doplníme ortonormální
bázi na oboru hodnot na bázi cílového prostoru a matice zobrazení bude čtvercovou
maticí A doplněnou nulami na potřebnou velikost). Naše podmínka pro matici
ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a y v
prostoru Kn
toto:
(A  x)T
 (A  y) = xT
 (AT
 A)  y = xT
 y.
Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že AT
A =
E, tedy tentýž výsledek jako v dimenzi 2! Dokázali jsme tak následující tvrzení:
Věta. Nechť V je reálný vektorový prostor se skalárním součinem a f : V  V je
lineární zobrazení. Pak f je ortogonální právě, když v některé ortonormální bázi (a
pak už všech) má matici A splňující AT
= A-1
.
4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 81
Skutečně, jestliže zachovává f velikosti, musí mít uvedenou vlastnost v každé
ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné
bázi už zaručuje zachovávání velikostí.
Důsledkem této věty je také popis všech matic přechodu S mezi ortonormálními
bázemi. Každá totiž musí zadávat zobrazení Kn
 Kn
zachovávající velikosti a
splňují tady také právě podmínku S-1
= ST
. Při přechodu od jedné báze ke druhé
se tedy matice ortogonálního zobrazení mění podle vztahu
A = ST
AS.
KAPITOLA 3
Linární modely
kde jsou matice užitečné?
­ nakonec skoro všude...
1. Lineární rovnice a procesy
2.37
3.1. Systémy lineárních rovnic. Jednoduché lineární procesy jsou dány lineárními
zobrazeními  : V  W na vektorových prostorech. Pokud nám totiž vektor
v  V představuje stav nějakého námi sledovaného jevu (třeba počty občanů tříděných
dle nejvyšší dosažené kvalifikace, stav zásob jednotlivých dílů a výrobků
atd.), pak (v) může představovat výsledek provedené operace (výsledek vzdělávací
činnosti školské soustavy nebo výroba a prodej za určité časové období apod.).
Pokud chceme dosáhnout předem daného výsledku b  W takového jednorázového
procesu, řešíme problém
(x) = b
pro neznámý vektor x. V pevně zvolených souřadnicích pak máme matici A zobrazení
 a souřadné vyjádření vektoru b. Jak jsme si povšimnuli už v úvodu druhé
kapitoly, řešení tzv. homogenní úlohy
A  x = 0
je vektorovým podprostorem. Pokud je dimenze V konečná, řekněme n, a dimenze
obrazu zobrazení  je k, pak řešením této soustavy pomocí převodu na řádkově
schodovitý tvar (viz 2.7) zjistíme, že dimenze podprostoru všech řešení je právě n-k.
Skutečně, protože sloupce matice zobrazení jsou právě obrazy bázových vektorů, je v
matici systému právě k lineárně nezávislých sloupců a tedy i stejný počet lineárně
nezávislých řádků. Proto nám zůstane při převodu na řádkový schodovitý tvar
právě n-k nulových řádků. Při řešení systému rovnic nám tak zůstane právě n-k
volných parametrů a dosazením vždy jednoho z nich hodnotou jedna a vynulováním
ostatních získáme právě k lineárně nezávislých řešení. Každé takové k­tici řešení
říkáme fundamentální systém řešení daného homogenního systému rovnic.
Uvažme nyní obecný systém rovnic
A  x = b.
Jestliže rozšíříme matici A o sloupec b, můžeme, ale nemusíme, také zvětšit počet
lineárně nezávislých sloupců a tedy i řádků. Pokud se tento počet zvětší, pak systém
rovnic nemůže mít řešení (prostě se naše  vůbec do b nestrefí). Jestliže ale naopak
máme stejný počet nezávislých řádků, znamená to, že sloupec b musí být lineární
kombinací sloupců matice A. Koeficienty takové kombinace jsou právě řešení.
83
84 3. LINÁRNÍ MODELY
Mějme tedy dvě pevně zvolená řešení x a y našeho systému a nějaké řešení z
systému homogenního se stejnou maticí. Pak zjevně
A  (x - y) = b - b = 0
A  (x + z) = 0 + b = b.
Můžeme proto shrnout:
* podprostor všech řešení homogenního systému rovnic A  x = 0 má dimenzi
n - k, kde n je počet proměnných a k je počet lineárně nezávislých rovnic,
* všechna řešení jsou generována tzv. fundamentálním systémem n - k řešení,
který lze obdržet z Gausovy eliminace postupným dosazováním nul a jedniček
za volné parametry,
* řešení nehomogenního systému existuje právě, když přidáním sloupce b k matici
A nezvýšíme počet lineárně nezávislých řádků. V takovém případě je prostor
všech řešení dán součty jednoho pevně zvoleného partikulárního řešení systému
a všech řešení systému homogenního se stejnou maticí.
2.38
3.2. Iterované procesy. Pokud je dán nějaký proces prostřednictvím lineární
operace pro jednotlivá časová období, budeme patrně chtít umět studovat jeho
chování během delší doby. Zatímco pro řešení systémů lineárních rovnic jsme potřebovali
jen minumum znalostí o vlastnostech lineárních zobrazení, teď už to bude
jinak. Uvedeme si alespoň ilustrativní příklady.
Představme si, že zkoumáme nějaký systém jednotlivců (pěstovaná zvířata,
hmyz, buněčné kultury apod) rozdělený do m skupin (třeba podle stáří, fází vývoje
hmyzu apod.). Stav xn je tedy dán vektorem (a1, . . . , am) závisejícím na okamžiku
tn, ve kterém systém pozorujeme. Lineární model vývoje takového systému je dán
maticí A dimenze n, která zadává změnu vektoru xn na
xn+1 = A  xn
při přírůstku času z tk na tk+1. Dobrým příkladem lineárních procesů je tzv. Leslieho
model růstu, viz následující příklad 3.3. V takových modelech vystupuje matice
popisující vývoj populace rozdělené na několik věkových skupin
A =


f1 f2 f3 f4 f5
1 0 0 0 0
0 2 0 0 0
0 0 3 0 0
0 0 0 4 0


,
kde fi označuje relativní plodnost příslušné věkové skupiny (ve sledovaném časovém
skoku vznikne z N jedinců v i­té skupině fiN jedinců nových, tj. ve skupině první),
zatímco i je relativní úmrtnost i-té skupiny během jednoho období.
Všechny koeficienty jsou tedy kladná reálná čísla a  jsou mezi nulou a jedničkou.
Přímým výpočtem (třeba využitím Laplaceova rozvoje) nyní spočteme charakteristický
polynom
p() = det(A - E) = 5
- a4
- b3
- c2
- d - e
s vesměs nezápornými koeficienty a, b, c, d, e, např. e = 1234f5. Je tedy
p() = 5
(1 - q())
1. LINEÁRNÍ ROVNICE A PROCESY 85
kde q je ostře klesající a nezáporná funkce pro  > 0. Evidentně bude proto existovat
právě jedno kladné , pro které bude q() = 1 a tedy p() = 0. Jinými slovy, pro
každou Leslieho matici existuje právě jedno kladné vlastní číslo.
Pro konkrétní koeficienty (např. když všechny fi jsou také mezi nulou a jedničkou)
můžeme dojít k závěru, že absolutní hodnoty ostatních vlastních čísel jsou
ostře menší než jedna, zatímco dominantní vlastní číslo může být vetší než jedna. V
takovém případě při iteraci kroků našeho procesu dojde při libovolné počáteční hodnotě
x0 k postupnému vymizení všech komponent v jednotlivých vlastních podprostorech
a poměrné proporce rozložení populace do věkových skupin se budou blížit
poměrům komponent vlastního vektoru k dominantnímu vlastnímu číslu. Například
pro matici (uvědomme si význam jednotlivých koeficientů)
A =


0 0.2 0.8 0.6 0
0.95 0 0 0 0
0 0.8 0 0 0
0 0 0.7 0 0
0 0 0 0.6 0


vyjdou vlastní hodnoty přibližně
1.03, 0, -0.5, -0, 27 + 0.74i, -0.27 - 0.74i
s velikostmi 1.03, 0, 0.5, 0.78, 0.78 a vlastní vektor příslušný dominantnímu vlastnímu
číslu je přibližně
x = (30 27 21 14 8).
Zvolili jsme rovnou jediný vlastní vektor se součtem souřadnic rovným jedné, zadává
nám proto přímo výsledné procentní rozložení populace.
3.3
3.3. Příklad ­ Leslieho růstový model. Uvažujme následující model vývoje
lidské populace. Buď
* x1(t) = počet jedinců starých 0 - 14 let.
* x2(t) = počet jedinců starých 15 - 29 let.
* x3(t) = počet jedinců starých 30 - 44 let.
* x4(t) = počet jedinců starých 45 - 59 let.
* x5(t) = počet jedinců starých 60 - 75 let.
Vše uvedeno v nějakém čase t. Pokud uvážíme časovou jednotku 15 let, tak v čase
(t + 1) budeme mít následující počty:
x1(t + 1) = f1x1(t) + f2x2(t) + f3x3(t) + f4x4(t) + f5x5(t)
x2(t + 1) = 1,2x1(t)
x3(t + 1) = 2,3x2(t)
x4(t + 1) = 3,4x3(t)
x5(t + 1) = 4,5x4(t)
Pokud označíme jako P následující matici
P :=


f1 f2 f3 f4 f5
1,2 0 0 0 0
0 2,3 0 0 0
0 0 3,4 0 0
0 0 0 4,5 0


,
86 3. LINÁRNÍ MODELY
tak v maticové formě pak můžeme psát
x(t + 1) = Px(t),
kde x(t) = (x1(t), x2(t), x3(t), x4(t), x5(t)).
3.4. Příklad. Usherův model růstu. Variace předchozího. Mějme populaci jako
v předchozím příkladě a uvažujme časovou jednotku 7, 5 let, tedy polovinu předchozí.
Pak můžeme psát opět
x(t + 1) = Px(t),
kde ovšem nyní
P :=


f1 f2 f3 f4 f5
1,2 2,2 0 0 0
0 2,3 3,3 0 0
0 0 3,4 4,4 0
0 0 0 4,5 5,5


.
3.5. Příklad.
3.5.1. Uvažujme Leslieho model růstu pro populaci krys, které máme rozděleny do
tří věkových skupin: do jednoho roku, od jednoho do dvou let a od dvou let do tří.
Předpokládáme, že se žádná krysa nedožívá více než tří let. Průměrná porodnost
v jednotlivých věkových skupinách připadajících na jednu krysu je následující: v
1.skupině je to nula a ve druhé i třetí 2 krysy. Krysy, které se dožijí jednoho roku
umírají až po druhém roce života (úmrtnost ve druhé skupině je nulová). Určete
úmrtnost v první skupině víte-li, že daná populace krys stagnuje (počet jedinců v ní
se nemění).
Řešení. Leslieho matice daného modelu je (úmrtnost v první skupině označíme a)


0 2 2
a 0 0
0 1 0

 .
Podmínka stagnace populace odpovídá tomu, že matice má vlastní hodnotu 1, neboli
polynom 3
- 2a - 2a má mít kořen 1, t.j a = 1/4.
2. Lineární diferenční rovnice a filtry
Diferenčními rovnicemi jsme se zabývali již v první kapitole, viz např 1.16. Nyní
si uvedeme náznak obecné teorie.
2.40
3.6. Diferenční rovnice. Homogenní lineární diferenční rovnice řádu k s konstantními
koeficienty je dána výrazem
a0xn + a1xn-1 +    + akxn-k = 0, a0 = 0 ak = 0.
Říkáme také, že řešíme homogenní lineární rekurenci řádu k. Libovolným zadáním
k po sobě jdoucích hodnot xi jsou určeny i všechny ostatní hodnoty jednoznačně.
Zároveň je zjevné, že součet dvou řešení nebo skalární násobek řešení je opět řešení.
Opět tedy máme příklad vektorového prostoru. Uvědomme si, že vektroy jsou sice
nekonečné posloupnosti čísel, samotný prostor všech řešení ovšem bude konečněrozměrný
a předem víme, že jeho dimenze bude rovna řádu rovnice k.
2. LINEÁRNÍ DIFERENČNÍ ROVNICE A FILTRY 87
Pokud tedy budeme předpokládat řešení v nějaké vhodné formě a podaří se
nám najít k lineárně nezávislých možností, budeme mít opět fundamentální systém
řešení a všechna ostatní budou jejich lineárními kombinacemi.
Uvažujme tedy stejně jako v 1.16 možnost xn = n
pro nějaký skalár . Pak
dostáváme podmínku
n-k
(a0k
+ a1k-1
   + ak) = 0
což znamená, že buď  = 0 nebo je  kořenem tzv. charakteristického polynomu
v závorce. Předpokládejme, že má tento polynom k různých kořenů 1, . . . , k.
Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na R nebo R
na C, protože výsledkem výpočtu pak stejně budou i všechna řešení, která opět
zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno
možné řešení
xn = (i)n
.
Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení.
K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n = 0, . . . , k - 1 pro
k možností i. Dostaneme tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným)
cvičením spočíst, že pro všechna k a jakékoliv k­tice různých i je determinant takovéto matice
nenulový. To ale znamená, že zvolená řešení jsou lineárně nezávislá.
Uvažme nyní násobný kořen  a dosaďme do definiční rovnice předpokládané řešení xn =
nn
. Dostáváme podmínku
a0nn
+ . . . ak(n - k)n-k
= 0.
Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu, kterou značíme apostrofem:
(a0n
+    + akn-k
)
a časem uvidíme, že kořen polynomu f je vícenásobný právě, když je kořenem i jeho derivace
f . Naše podmínka je tedy splněna. Při vyšší násobnosti kořene charakteristického polynomu
 dojdeme obdobně k řešením xn = nj
n
pro j = 0, . . . , - 1.
Úplně obdobně jako u systémů lineárních rovnic můžeme dostat všechna řešení
nehomogenních rovnic tak, že najdeme jedno řešení a přičteme celý vektorový
prostor dimenze k řešení odpovídajících systémů homogenních. Za tímto účelem
zpravidla hledáme řešení ve tvaru polynomu
xn = 0 + 1n +    + k-1nk-1
s neznámými koeficienty i, i = 1, . . . , k - 1. Dosazením do diferenční rovnice
dostatneme systém k rovnic pro k proměnných i.
Nyní můžeme shrnout získané výsledky:
2.41
3.7. Vlastnosti řešení lineárních diferenčních rovnic s konstantními ko-
eficienty.
* prostor všech řešení homogenního systému řádu k je vektroový prostor dimenze
k,
* všechna řešení jsou generována fundamentálním systémem k řešení, který lze
obdržet získat z kořenů charakteristického polynomu (n
i , pokud jsou kořeny
po dvou různé, složitěji v případě násobných kořenů),
* všechna řešení nehomogenního systému obdržíme, když přičteme jedno pevně
zvolené partikulárního řešení systému ke všem řešením systému homogenního
se stejnými koeficienty. Partikulární řešení můžeme hledat pomocí tzv. metody
neurčitých koeficientů, tj. hledáme jej jako polynom s neznámými koeficienty a
řešíme systém lineárních rovnic.
88 3. LINÁRNÍ MODELY
* řešení vyhovující daným počátečním podmínkám
x0 = b0, . . . , xk-1 = bk-1
hledáme z obecného řešení dosazením podmínek a určením koeficientů lineání
kombinace funadamentálních řešení. Opět to znamená řešit systém lineárních
rovnic.
Všimněme si také, že pro rovnice s reálnými koeficienty musí vždy kořeny charakterstického
polynomu být reálné, nebo musí vystupovat po dvou komplexně združené
nereálné kořeny. Jejich lineárními kombinacemi (součet a rozdíl goniometrických
tvarů mocnin) lze pak přímo obdržet reálná řešení vyjádřená pomocí funkcí cos(n)
a sin(n).
3.8. Příklad.
3.8.1. Najděte posloupnost, která vyhovuje nehomogenní diferenční rovnici s počátečními
podmínkami:
xn+2 = xn+1 + 2xn + 1, x1 = 2, x2 = 2.
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(-1)n
+ b2n
. Partikulárním
řešením je konstanta -1/2. Obecné řešení dané nehomogenní rovnice bez
počátečních podmínek je tedy
a(-1)n
+ b2n
-
1
2
.
Dosazením do počátečních podmínek zjistíme konstanty a = -5/6, b = 5/6. Dané
rovnici s počátečními podmínkami tedy vyhovuje posloupnost
-
5
6
(-1)n
+
5
3
2n-1
-
1
2
.
3.9. Příklad.
3.9.1. Určete posloupnost reálných čísel, která vyhovuje následující nehomogenní
diferenční rovnici s počátečními podmínkami:
2xn+2 = -xn+1 + xn + 2, x1 = 2, x2 = 3.
Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(-1)n
+ b(1/2)n
. Partikulárním
řešením je konstanta 1. Obecné řešení dané nehomogenní rovnice bez
počátečních podmínek je tedy
a(-1)n
+ b
1
2
n
+ 1.
Dosazením do počátečních podmínek zjistíme konstanty a = 1, b = 4. Dané rovnici
s počátečními podmínkami tedy vyhovuje posloupnost
(-1)n
+ 4
1
2
n
+ 1.
2. LINEÁRNÍ DIFERENČNÍ ROVNICE A FILTRY 89
3.10. Příklad. Řešte následující diferenční rovnici:
xn+4 = xn+3 - xn+2 + xn+1 - xn.
Řešení. Z teorie víme, že prostor řešení této diferenční rovnice bude čtyřdimenzionální
vektorový prostor, jehož generátory zjistíme z kořenů charakteristického
polynomu dané rovnice. Charakteristická rovnice je
x4
- x3
+ x2
- x + 1 = 0.
Jedná se o reciprokou rovnici (to znamená, že koeficienty u (n-k)-té a k-té mocniny
x, k = 1, . . . , n, jsou shodné). Zavedeme tedy substituci u = x + 1
x . Po vydělení
rovnice x2
(nula nemůže být kořenem) a substituci (všimněte si, že x2
+ 1
x2 = u2
-2)
dostáváme
x2
- x + 1 -
1
x
+
1
x2
= u2
- u - 1 = 0.
Dostáváme tedy neznámé u1,2 = 1

5
2 . Odtud pak z rovnice x2
-ux+1 = 0 určíme
čtyři kořeny
x1,2,3,4 =
1  5  -10  2

5
4
.
Nyní si všimněme, že kořeny charakteristické rovnice jsme mohli ,,uhodnout
rovnou. Je totiž
x5
+ 1 = (x - 1)(x4
- x3
+ x2
- x + 1),
a tedy jsou kořeny polynomu x4
-x3
+x2
-x+1 i kořeny polynomu x5
+1, což jsou
páté odmocniny z -1. Takto dostáváme, že řešením charakteristikého polynomu
jsou čísla x1,2 = cos(
5 )  sin(
5 ) a x3,4 = cos(3
5 )  sin(3
5 ). Tedy reálnou bází
prostoru řešení dané diferenční rovnice je například báze posloupností cos(n
5 ),
sin(n
5 ), cos(3n
5 ) a sin(3n
5 ), což jsou siny a cosiny argumentů příslušných mocnin
kořenů charakteristického polynomu.
Všimněme si, že jsme mimochodem odvodili algebraické výrazy pro cos(
5 ) =
1+

5
4 , sin(
5 ) =

10-2

5
4 , cos(3
5 ) =

5-1
4 a sin(3
5 ) =

10+2

5
4 .
2.39
3.11. Lineární filtry. Uvažujme nyní nekonečné posloupnosti
x = . . . , x-n, x-n+1, . . . , x-1, x0, x1, . . . , xn, . . .
a operaci T, která zobrazí posloupnost x na posloupnost z = Tx se členy
zn = a1xn + a2xn-1 +    + akxn-k+1.
Protože nekonečné posloupnosti x umíme sčítat i násobit skaláry po složkách, jedná
se opět o příklad vektorového prostoru. Zjevně má dimenzi nekonečnou.
Posloupnosti můžeme chápat jako diskrétní hodnoty nějakého signálu, odečítané
zpravidla ve velmi krátkých časových jednotkách, operace T je pak filtrem,
který signál zpracovává. Z definice je zřejmé, že periodické posloupnosti xn splňující
pro nějaké pevné přirozené číslo p
xn+p = xn
budou mít i periodické obrazy z = Tx
zn+p = a1xn+p + a2xn-1+p +    + akxn-k+1+p
= a1xn + a2xn-1 +    + akxn-k+1 = zn
90 3. LINÁRNÍ MODELY
se stejnou periodou p. Pro pevně zvolenou operaci T nás bude zajímat, které vstupní
posloupnosti zůstanou přibližně stejné (případně až na násobek) a které budou
utlumeny na nulové hodnoty.
Jde nám tedy v první řadě o vyčíslení jádra našeho lineárního zobrazení T. To
je ale dáno homogenní diferenční rovnicí
a0xn + a1xn-1 +    + akxn-k = 0, a0 = 0 ak = 0.
2.42
3.12. Špatný equalizer. Jako příklad uvažujme lineární filtr zadaný rovnicí
zn = (Tx)n = xn+2 + xn.
Výsledky takového zpracování signálu jsou naznačeny na následujících čtyřech obrázcích
pro postupně se zvyšující frekvenci periodického signálu xn = cos(n). Červený
je původní signál, zelený je výsledek po zpracování filtrem. Nerovnoměrnosti
křivek jsou důsledkem nepřesného kreslení, oba signály jsou samozřejmě rovnoměrnými
sinusovkami.
1
1
0
2
2
-1
0
-2
43 5
A=7.1250
1
1
0
2
2
-1
0
-2
43 5
A=19.375
1
1
0
2
2
-1
0
-2
43 5
A=25.500
1
1
0
2
2
-1
0
-2
43 5
A=29.583
Všimněme si, že v oblastech, kde je výsledný signál přibližně stejně silný jako
původní, dochází k dramatickému posuvu fáze signálu. Levné equalizery skutečně
podobně špatně fungují.
Výsledek lze samozřejmě podrobně spočítat výše uvedenou metodikou.
3. MARKOVOVY PROCESY 91
3. Markovovy procesy
2.43
3.13. Markovovy řetězce. Velice častý a zajímavý případ lineárních procesů je
popis systému, který se může nacházet v m různých stavech s různou pravděpodobností.
V jistém okamžiku je ve stavu s pravděpodobností ai pro stav i a k přechodu
z možného stavu i do stavu j dojde s pravděpodobností tij.
Můžeme tedy proces zapsat takto: V čase n je systém popsán pravděpodobnostním
vektorem xn = (a1, . . . , am). To znamená, že všechny komponenty vektoru
x jsou reálná nezáporná čísla a jejich součet je roven jedné. Komponenty udávají
rozdělení pravděpodobnosti jednotlivých možností stavů systému. Rozdělení pravděpodobností
pro čas n + 1 bude dáno vynásobením pravděpodobnostní maticí
přechodu T = (tij), tj.
xn+1 = T  xn.
Protože předpokládáme, že vektor x zachycuje všechny možné stavy, budou všechny
sloupce matice T tvořeny také pravděpodobnostními vektory. Takovému procesu
říkáme Markovův proces. Všimněme si, že každý pravděpodobnostní vektor x je
opět zobrazen na vektor se součtem souřadnic jedna:
i,j
tijxj =
j
(
i
tij)xj =
j
xj = 1.
Protože je součet řádků matice T vždy roven vektoru (1, . . . , 1), bude jednička
zaručeně vlastním číslem matice T a k ní musí existovat vlastní vektor x0. Abychom
mohli podrobněji pochopit chování Markovových procesů, uvedeme si docela snadno
pochopitelné obecné tvrzení o maticích, tzv. Perronovu­Frobeniovu větu. Její důkaz
však uvádět nebudeme.
Věta. Nechť A je reálná čtvercová matice dimenze m s kladnými prvky. Pak platí
(1) exituje reálné vlastní číslo m matice A takové, že pro všchna ostatní vlastní
čísla  platí || < m,
(2) vlastní číslo m má algebraickou násobnost jedna,
(3) vlastní podprostor odpovídající m obsahuje vektor se všemi souřadnicemi klad-
nými
(4) platí odhad mini j aij  m  maxi j aij.
Tvrzení bezezbytku platí i pro tzv. regulární matice, tj. takové, jejichž nějaká
mocnina má výhradně kladné prvky.
Důsledkem této věty pro Markovovy procesy s maticí, která nemá žádné nulové
prvky (nebo jejíž některá mocnina má tuto vlastnost), je
* existence vlastního vektoru x pro vlastní číslo 1, který je pravděpodobnostní
* přibližování hodnoty iterací Tk
x0 k vektoru x pro jakýkoliv pravděpodobnostní
vektor x0.
První tvrzení vyplývá přímo z kladnosti souřadnic vlastního vektoru zmíněné v
Perronově­Frobeniově větě, druhé pak z toho, že absolutní hodnoty všech ostatních
vlastních čísel musí být ostře menší než jedna.
3.14. Mlsný hazardér. Hazardní hráč sází na to, která strana mince padne. Na
začátku hry má tři kremrole. Na každý hod vsadí jednu kremroli a když jeho tip
vyjde, tak k ní získá jednu navíc, pokud ne, tak kremroli prohrává. Hra končí,
pokud všechny kremrole prohraje, nebo jich získá pět. Jaká je pravděpodobnost, že
hra neskončí po čtyřech sázkách?
92 3. LINÁRNÍ MODELY
Řešení. Před j-tým kolem (sázkou) můžeme popsat stav, ve kterém se hráč nachází
náhodným vektorem Xj = (p0(j), p1(j), p2(j), p3(j), p4(j), p5(j)), kde pi je pravděpodobnost,
že hráč má i kremrolí. Pokud má hráč před j-tou sázkou i kremrolí
(i=2,3,4), tak po sázce má s poloviční pravděpodobností (i - 1) kremrolí a s poloviční
pravděpodobností (i+1) kremrolí. Pokud dosáhne pěti kremrolí nebo všechny
prohraje už se počet kremrolí nemění. Vektor Xj+1 tak získáme podle podmínek v
priklání z Xj vynásobením maticí
A :=


1 0, 5 0 0 0 0
0 0 0, 5 0 0 0
0 0, 5 0 0, 5 0 0
0 0 0, 5 0 0, 5 0
0 0 0 0, 5 0 0
0 0 0 0 0, 5 1


.
Na začátku máme
X1 =


0
0
0
1
0
0


,
po čtyřech sázkách bude situaci popisovat náhodný vektor
X5 = A4
X1 =


1
8
3
16
0
5
16
0
3
8


,
tedy pravděpodobnost, že hra skončí do čtvté sázky (včetně) je polovina.
Všimněme si ještě, že matice A popisující vývoj pravděpodobnostního vektoru
X je pravděpodobnostní, tedy má součet prvků v každém sloupci 1. Nemá ale
vlastnost vyžadovanou v Perronově­Frobeniově větě a snadným výpočtem zjistíte
(nebo přímo uvidíte bez počítání), že existují dva lineárně nezávislé vlastní vektory
příslušné k vlastnímu číslu 1 ­ případ, kdy hráči nezůstane žádná krémrole, tj. x =
(1, 0, 0, 0, 0, 0)T
, nebo případ kdy získá 5 krémrolí a hra tím pádem končí a všechny
mu už zůstávají, tj. x = (0, 0, 0, 0, 0, 1)T
. Všechna ostatní vlastní čísla (přibližně 0, 8,
0, 3, -0, 8, -0, 3) jsou v absolutníhodnotě ostře menší než jedna. Proto komponenty
v příslušných vlastních podprostorech při iteraci procesu s libovolnou počáteční
hodnotou vymizí a proces se blíží k limitní hodnotě pravděpodobnostího vektoru
tvaru (a, 0, 0, 0, 0, 1 - a), kde hodnota a závisí na počtu krémrolí, se kterými hráč
začíná. V našem případě je to a = 0, 4, kdyby začal se 4 krémrolemi, bylo by to
a = 0, 2 atd.
Ruleta Hráč rulety má následující strategii: přišel hrát se 100 Kč. Vždy všechno,
co aktuálně má. Sází vždy na černou (v ruletě je 37 čísel, z toho je 18 černých, 18
červených a nula). Hráč skončí, pokud nic nemá, nebo pokud získá 800 Uvažte tuto
úlohu jako Markovův proces a napište jeho matici.
4. VÍCE MATICOVÉHO POČTU 93
Řešení. 


1 a a a 0
0 0 0 0 0
0 b 0 0 0
0 0 b 0 0
0 0 0 b 1


,
kde a = 19
37 a b = 18
37 .
3.15. Příklad. Uvažujme situaci z předchozího případu a předpokládejme, že pravděpodobnost
výhry i prohry je 1/2. Označme matici procesu A. Bez použití výpočetního
software určete A100
.
Řešení. Hra skončí po třech sázkách. Jsou tedy všechny mocniny A, počínaje A3
shodné. 


1 7/8 3/4 1/2 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 1/8 1/4 1/2 1


3.16. Sledovanost televizí. V jisté zemi vysílají jisté dvě televizní stanice. Z
veřejného výzkumu vyplynulo, že po jednom roce přejde 1/6 diváků první stanice
ke druhé stanici, 1/5 diváků druhé stanice přejde k první stanici. Popište časový
vývoj počtu diváků sledujících dané stanice jako Markovův proces, napište jeho
matici, nalezněte její vlastní čísla a vlastní vektory.
Řešení.
5
6
1
5
1
6
4
5
.
Matice má dominantní vlastní hodnotu 1, příslušný vlastní vektor je (6
5 , 1). Protože
je vlastní hodnota dominantní, tak se poměr diváků se ustálí na poměru 6 : 5.
4. Více maticového počtu
Na vcelku praktických příkladech jsme viděli, že porozumění vnitřní struktuře
matic a jejim vlastnostem je silným nástrojem pro konkrétní výpočty nebo analýzy.
Ještě více to platí pro efektivitu numerického počítání s maticemi. Proto se budeme
zase chvíli věnovat abstraktní teorii.
2.44
3.17. Invariantní podprostory. Mějme nějaké lineární zobrazení f : V  V na
vektorovém prostoru V a předpokládejme, že pro nějaký podprostor W  V platí
f(W)  W. Říkáme, že W je invariantní podprostor pro zobrazení f. Jestliže je V
konečněrozměrné a vybereme nějakou bázi (u1, . . . , uk) podprostoru W, můžeme ji
vždy doplnit na bázi (u1, . . . , un) celého V a v každé takové bázi má naše zobrazení
matici A tvaru
e2.3 (3.1) A =
B C
0 D
kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n - k a C je
matice typu n/(n - k). Naopak, jestliže existuje v nějaké bázi matice zobrazení f
tvaru (3.1), je W = u1, . . . , uk invariantní podprostor zobrazení f.
94 3. LINÁRNÍ MODELY
Extrémní případy jsme viděli v odstavcích 2.40­2.45, kde jsme zkoumali vlastní
vektory. Ke každému vlastnímu číslu zobrazení (resp. matice) existoval vlastní vektor
a jím generovaný jednorozměrný podprostor je samozřejmě invariantní. V případě
existence n různých vlastních čísel zobrazení f jsme dostali rozklad V na
přímý součet n vlastních podprostorů a v bazích z vlastních vektorů má naše zobrazení
diagonální tvar s vlastními čísly na diagonále. Zároveň jsme viděli dva různé
příklady důvodů, proč zobrazení diagonální matici mít nemusí. První souvisel s
nilpotentními zobrazeními, druhý s rotacemi v dvourozměrných podprostorech.
Nejsložitější a úplně obecný popis jsme potkali v odstavci 2.45, kde jsme pouze
s mlhavým náznakem důkazu uvedli větu o Jordanově rozkladu. Ta říká, že nad
algebraicky uzavřeným polem skalárů se celý prostor vždy rozloží na invariantní
podprostory na kterých je zobrazení dáno tzv. Jordanovými bloky. Budeme teď
pracovat se speciálními typy zobrazení, jejichž struktura je daleko jednodušší. První
budou na řadě ortogonální zobrazení.
2.45
3.18. Rozklad ortogonálního zobrazení. Zkoumejme zobrazení na vektorovém
prostoru V se skalárním součinem. Uvažme pevně zvolené ortogonální zobrazení
f : V  V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně
jako s rotací v příkladu 2.39.
Nejprve se ale podívejme obecně na invariantní podprostory ortogonálních zobrazení
a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W  V a
ortogonální zobrazení f : V  V platí f(W)  W, pak také platí pro všechny
v  W
, w  W
f(v), w = f(v), f  f-1
(w) = v, f-1
(w) = 0
protože i f-1
(w)  W. To ale znamená, že také f(W
)  W
. Dokázali jsme tedy
jednoduché, ale velice důležité tvrzení:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru je také invariantní.
Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto
tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na
ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže
můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad
V . Nicméně většinou nejsou vlastní čísla ortogonálních zorbazení reálná. Musíme si
proto pomoci opět výletem do komplexníxh vektorových prostorů.
Jestliže budeme považovat matici A za matici lineárního zobrazení na komplexním prostoru
Cn
(která je jen shodou okolností reálná), budeme mít právě n kořenů charakteristického
polynomu, včetně jejich algebraické násobnosti. Navíc, protože charakteristický polynom zobrazení
bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice
komplexně sdružených kořenů  a . Příslušné vlastní vektory v Cn
k takové dvojici vektorů
budou také komplexně sdružené, protože budou řešením dvou komplexně sdružených systémů
lineárních rovnic.
Označme v, stejně jako v případě rotace v 2.39, vlastní vektor příslušný k vlastnímu číslu
 =  + i,  = 0. Reálný vektorový podprostor P generovaný reálnou a imaginární částí
x = re v, y = im v je zjevně invariantní vůči násobení maticí A a dostáváme
A  x = x - y, A  y = y + x.
To ale neznamená nic jiného, než že zúžení našeho zobrazení na P je dáno složením rotace
o argument vlastní honoty  (úhel arccos 
2+2
) s násobením velikostí vlastní hodnoty 
(skalárem
p
2 + 2). Protože naše zobrazení zachovává velikosti, musí být velikost vlastní
hodnoty  rovna jedné.
4. VÍCE MATICOVÉHO POČTU 95
Společně s předchozími úvahami jsme tedy dokázali úplný popis všech ortogonálních zob-
razení:
Věta. Nechť f : V  V je ortogonální zobrazení na prostoru se skalárním součinem.
Pak všechny kořeny charakteristického polynomu f mají velikost jedna a
existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům
 = 1 a dvourozměrné podprostory P,, na kterých působí f rotací o úhel
rovný argumentu komplexního čísla . Všchny tyto různé podprostory jsou po dvou
ortogonální.
Příklad. Zkusme si předchozí větu na příkladu v dimenzi tři. Charakteristický
polynom v tomto případě musí mít alespoň jeden reálný kořen, kterým musí být
buď jednička nebo mínus jednička. Další dva musí být opět 1 nebo dva komplexně
sdružené nereálné. V posledním případě zadává vlastní vektor odpovídající
reálnému vlastnímu číslu osu rotace o argument vlastního čísla druhého. Pokud je
reálné vlastní číslo -1, bude navíc ještě uplatněno zrcadlení podle roviny rotace.
Uvažme tedy zobrazení s maticí ve standardní bázi
f : R3
 R3
, A =


0 0 1
0 1 0
-1 0 0

 .
Dostaneme polynom -3
+ 2
-  + 1 = -( - 1)(2
+ 1) s kořeny 1 = 1,  = i a
 = -i. Pochopitelně matice zadává rotaci o devadesát stupnů podle osy y.
2.46
3.19. Symetrická zobrazení. Uvažujme opět reálný vektorový prostor V se skalárním
součinem. Zobrazení f : V  V se nazývá symetrické, jestliže pro všechny
vektory u, v  V platí
f(u), v = u, f(v) .
V libovolné ortonormální bázi můžeme předchozí vztah v souřadnicích vyjádřit
takto:
(A  x)T
 y = xT
 (A  y) = xT
 (AT
y).
Volbou souřadnic bázových vektorů (tj. jedna jednička a zbytek nuly) se dostaneme
ke vztahům aij = aji pro jednotlivé komponenty matice A, tzn. ke vztahu A = AT
.
Dokázali jsme tedy souřadný popis symetrických zobrazení:
Tvrzení. Zobrazení f : V  V na vektorovém prostoru se skalárním součinem
je symetrické právě tehdy, když v některé (a pak už všech) ortonormální bázi má
symetrickou matici.
3.15
3.20. Adjungovaná zobrazení. Jestliže zvolíme pevně jeden vektor v  V , dosazování
vektorů za druhý argument nám dává zobrazení V  V 
= Hom(V, R)
V v  (w  v, w  R).
Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Na
první pohled je vidět, že vektory ortonormální báze jsou zobrazeny na formy tvořící bázi duální.
Každé zobrazení f : V  W mezi vektorovými prostory zadává tzv. duální zobrazení
f
: W
 V 
mezi formami, definované pro všechny w
 W
, v  V pomocí
f
(w
)(v) = w
(f(v)).
96 3. LINÁRNÍ MODELY
V libovolných bazích na V a W a jejich duálních bazích na V 
a W
pak tentýž definiční vztah
má tvar (píšeme A
pro matici zobrazení f
, xT
jsou souřadnice formy w
, y jsou souřadnice
vektoru v)
(A
xT
)  y = xT
 (A  y)
a vidíme, že duální zobrazení má v duálních bazích transponovanou matici k maticí zobrazení
původního.
V případě vektorových prostorů se skalárním součinem, převádí výše uvedené bijekce duální
zobrazení f
na tobrazení f
: W  V zadané formulí
f(u), v = u, f
(v)
a tomuto zobrazení se říká adjungované zobrazení k f. Předchozí výpočet v souřadnicích pro
symetrická zobrazení nám ve skutečnosti sdělil, že je-li A matice zobrazení f v ortonormální
bázi, pak matice adjungovaného zobrazení f
je matice transponovaná AT
. Můžeme proto také
přeformulovat definici takto: Symetrické je takové zobrazení f : V  V , které je rovno svému
adjungovanému zobrazení f
. Často se takovým zobrazením také proto říká samoadjungovaná.
2.47
3.21. Spektrální rozklad symetrického zobrazení. Uvažujme symetrické zobrazení
f : V  V s maticí A v nějaké ortonormální bázi a zkusme postupovat
obdobně jako v 3.18. Opět se nejprve obecně podíváme na invariantní podprostory
ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor
W  V a symetrické zobrazení f : V  V platí f(W)  W, pak také platí pro
všechny v  W
, w  W
f(v), w = v, f(w) = 0.
To ale znamená, že také f(W
)  W
.
Představme si dále, že A je matice symetrického zobrazení a A  x = x pro
nějaký komplexní vektor x  Cn
. Rozšíříme si definici skalárního součinu , na
Cn
vztahem
x, y = xT
 y
kde y je vektor v Cn
s komplexně konjugovanými souřadnicemi. Zjevně platí i pro
rozšířené zobrazení x  A  x vztah
A  x, y = x, A  y
a pro náš vlastní vektor x tedy dostáváme
 x, x =  x, x .
Kladným reálným číslem x, x můžeme krátit a proto musí být  = , tj. vlastní
čísla jsou skutečně reálná.
Komplexních kořenů má charakteristický polynom det(A - E) tolik, kolik je
dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme
tak důležitý obecný výsledek:
Tvrzení. Ortogonální doplněk k invariantnímu podprostoru pro symetrické zobrazení
je také invariantní. Navíc jsou všechna vlastní čísla symetrické matice A
reálná.
Ze samotné definice je zřejmé, že zúžení symetrického zobrazení na invariantní
podprostor je opět symetrické. Předchozí tvrzení nám tedy zaručuje, že bude vždy
existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk
invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze
přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V . Vlastní
4. VÍCE MATICOVÉHO POČTU 97
vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností
f(u) = u, f(v) = v vyplývá
 u, v = f(u), v = u, f(v) =  u, v .
Obvykle se náš výsledek formuluje pomocí projekcí na vlastní podprostory.
O projektoru P : V  V říkáme, že je kolmý, je-li Im P  Ker P. Dva kolmé
projektory P, Q jsou vzájemně kolmé, je-li Im P  ImQ.
3.17 3.22. Věta. Pro každé symetrické zobrazení f : V  V na vektorovém prostoru se
skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li 1, . . . , k
všechna různá vlastní čísla f a P1, . . . , Pk příslušné kolmé a navzájem kolmé projektory
na vlastní podprostory, pak
f = 1P1 +    + kPk.
Poznámka. Všechna zobrazení, pro která lze najít ortonormální bázi jako v této větě
o spektrálním rozkladu se nazývají normální. Lze poměrně snadno ukázat, že zobrazení
f : V  V je normální právě, když komutuje se svým adjungovaným zobrazením. Stopa
zobrazení f
 f je rovna součtu absolutních hodnot kvadrátů všech prvků A. V bázi
z předchozí věty je tento výraz ovšem roven součtu kvadrátů absolutních hodnot všech
vlastních čísel i matice A. Rovnost
X
i,j
|aij|2
=
X
i
|i|2
v některé a pak už ve všech ortonormálních bazích je nutnou a dostatečnou podmínkou
pro to, aby zobrazení f bylo normální. Důkaz nebudeme uvádět.
2.48
3.23. Nezáporná zobrazení a odmocniny. Nezáporná reálná čísla jsou právě
ta, která umíme psát jako druhé mocniny. Zobecnění takového chování pro matice
a zobrazení lze vidět u součinů B = AT
 A (tj. složení zobrazení f
 f):
B  x, x = AT
 A  x, x = A  x, A  x  0
pro všechny vektory x. Navíc zjevně
BT
= (AT
 A)T
= AT
 A = B.
Symetrickým maticím B s takovou vlastností říkáme nezáporné a pokud nastane
nulová hodnota pouze pro x = 0, pak jim říkáme kladné. Obdobně hovoříme o
kladných a nezáporných zobrazeních f : V  V .
Pro každé nezáporné zobrazení f : V  V umíme najít jeho odmocninu, tj.
zobrazení g takové, že g  g = f. Nejjednodušeji to uvidíme v ortonormální bázi,
ve které bude mít f diagonální matici. Taková podle našich předchozích úvah vždy
existuje a matice A zobrazení f v ní bude mít na diagonále nezáporná reálná vlastní
čísla zobrazení f. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka
nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat
zobrazení g pomocí matice B s odmocninami příslušných vlastních čísel na diago-
nále.
98 3. LINÁRNÍ MODELY
5. Rozklady matic a pseudoinverze
I při počítání s reálnými čísly užíváme pro zjednodušení rozklady na součiny.
Nejjednodušším je vyjádření každého reálného čísla jednoznačně ve tvaru
a = sgn(a)|a|, tj. jako součin znaménka a abolutní hodnoty. V dalším textu si uvedeme
stručně přehled několika takových rozkladů pro různé typy matic, které bývají
nesmírně užitečné při numerických výpočtech s maticemi. Ve skutečnosti jsme příslušný
rozklad pro nezáporné symetrické matice využili v předchoyím odstavci pro
konstrukci odmocniny z matice.
Začneme přeformulováním několika výsledků, které jsme už dávno odvodili. V
odstavcích 2.7 a 2.8 jsme upravovali matice nad skaláry z libovolného pole na řádkový
schodovitý tvar. K tomu jsme používali elementární úpravy, které spočívaly v
postupném násobení naší matice invertibilními dolními trojúhelníkovými maticemi
Pi, které postihovaly přičítání násobků řádků pod právě zpravovávaným. Předpokládejme
pro jednoduchost, že naše matice A je čtvercová a že má všechny hlavní
minory nenulové. Pak se nemůže stát, že bychom potřebovali při Gausově eliminaci
přehazovat řádky a všechny naše matice Pi mohou být dolní trojúhelníkové s
jedničkami na diagonálách (nikdy nepotřebujeme přehaovat řádky). Konečně, stačí
si povšimnout, že inverzní matice k takovýmto Pi jsou opět dolní trojúhelníkové s
jedničkami na diagonálách a dostáváme
U = P  A = Pk    P1  A
kde U je horní trojúhelníková matice a tedy
A = L  U
kde L je dolní trojúhelníková matice s jedničkami na diagonále a U je horní trojúhelníková.
Tomuto rozkladu se říká LU­rozklad matice A. V případě obecné matice
můžeme při Gausově eliminaci na řádkově schodovitý tvar potřebovat navíc permutace
řádků, někdy i sloupců matice. Pak dostáváme obecněji A = P  L  U  Q,
kde P a Q jsou nějaké permutační matice.
Přímým důsledkem Gausovy eliminace bylo také zjištění, že až na volbu vhodných
bází na definičním oboru a oboru hodnot je každé zobrazení f : V  W
zadáno maticí v blokově diagonálním tvaru s jednotkovou maticí s rozměrem daným
dimenzí obrazu f nulovými bloky všude kolem. To lze přeformulovat takto:
Každou matici A typu m/n nad polem skalárů K lze rozložit na součin
A = P 
E 0
0 0
 Q.
Pro čtvercové matice jsme v 2.46 ukázali při diskusi vlastností lineárních zobrazení
f : V  V na komplexních vektorových prostorech, že každou čtvercovou
matici A dimenze m umíme rozložit na součin
A = P  B  P-1
kde B je blokově diagonální s Jordanovými bloky příslušnými k vlastním číslům
na diagonále. Všimněme si, že násobení maticí P a její inverzí z opačných stran
odpovídá v tomto přípaě právě změně báze na vektorovém prostoru V .
Obdobně, pro symetrické matice jsme dokázali, že jdou rozložit na součin
A = P  B  PT
,
5. ROZKLADY MATIC A PSEUDOINVERZE 99
kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále,
včetně násobností. Zde jde také o součin s maticemi vystihující změnu báze, nicméně
připouštíme nyní pouze změny mezi mezi ortonormálními bazemi a proto i matice
přechodu P musí být ortogonální. Odtud P-1
= PT
.
Pro ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických,
pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími
buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podpro-
storům.
2.50
3.24. Věta o singulárním rozkladu. Jestliže se omezíme na ortonormální báze,
ale chceme znát více informací o struktuře obecných lineárních zobrazení, musíme
postupovat o hodně rafinovaněji, než v případě bazí libovolných:
Věta. Nechť A je reálná matice typu m/n. Pak existují čtvercové ortogonální matice
U a V dimenzí m a n, a reálná diagonální matice s nezápornými prvky D
dimenze r, r  min{m, n}, takové, že
A = USV T
, S =
D 0
0 0
,
kde r je hodnost matice AAT
. Přitom je S určena jednoznačně až na pořadí prvků
a prvky diagonální matice D jsou druhé odmocniny vlastních čísel di matice AAT
.
Důkaz. Předpokládejme nejprve m  n a označme  : Rn
 Rm
zobrazení zadané
maticí A ve standardních bazích. Máme vlastně ukázat, že existují ortonormální báze na
Rn
a Rm
ve kterých bude mít  matici S z tvrzení věty. Jak jsme viděli výše, matice
AT
A je pozitivně semidefinitní. Proto má samá reálná nezáporná vlastní čísla a existuje
ortonormální báze w v Rn
, ve které má příslušné zobrazení 
  diagonální matici s
vlastními čísly na diagonále. Jinými slovy, existuje ortogonální matice V taková, že AT
A =
V BV T
pro reálnou diagonální matici s nezápornými vlastními čísly (d1, d2, . . . , dr, 0, . . . , 0)
na diagonále, di = 0 pro všechny i = 1, . . . , r. Odtud B = V T
AT
AV = (AV )T
(AV ). To je
ale je ekvivalentní tvrzení, že prvních r sloupců matice AV je ortogonálních a zbývající jsou
nulové, protože mají nulovou velikost. Označme prvních r sloupců v1, . . . , vr  Rm
. Tzn.
vi, vi = di, i = 1, . . . , r a tedy vektory ui = 1
di
vi tvoří ortonormální systém nenulových
vektorů. Doplňme je na ortonormální bázi u1, . . . , un celého Rm
. Vyjádříme-li zobrazení
 v bazích w na Rn
a u na Rm
, dostáváme matici

B. Přechody od standardních bází k
nově vybraným odpovídají násobení zleva ortogonálními maticemi U a zprava V -1
= V T
.
Pokud je m > n, můžeme aplikovat předchozí část důkazu na matici AT
. Odtud pak
přímo plyne požadované tvrzení.
Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít
pro výpočet ortogonálních matic U, V a diagonálních nenulových prvků matice S.
2.51
3.25. Geometrická interpretace singulárního rozkladu. Diagonálním hodnotám
matice D z předchozí věty se říká singulární hodnoty matice A. Pro příslušné
zobrazení  : Rn
 Rm
mají jednoduchý geometrický význam: Nechť K  Rn
je
jednotková sféra pro standardní skalární součin. Obrazem (K) pak vždy bude (případně
degenerovaný) m-rozměrný elipsoid. Singulární čísla matice A jsou přitom
velikosti hlavních poloos a věta navíc říká, že původní sféra vždy připouští ortogonální
sdružené průměry, jejichž obrazem budou právě všechny poloosy tohoto
elipsoidu.
Pro čtvercové matice je vidět, že A je invertibilní právě, když všechna singulární
čísla jsou nenulová. Poměr největšího a nejmenšího singulárního čísla je důležitým
100 3. LINÁRNÍ MODELY
parametrem pro robustnost řady numerických výpočtů s maticemi, např. pro výpočet
inverzní matice.
2.52
3.26. Věta o polárním rozkladu. Uvažujme společně nad důsledky věty o singulárním
rozkladu. Plyne z ní A = USWT
s diagonální S s nezápornými reálnými čísly na diagonále
a ortogonálními U, W. Pak A = USUT
UWT
a můžeme přímo definovat P := USUT
,
V := UWT
. Odtud ale vyplývá, že P symetrická a pozitivně semidefinitní zatímco V je
ortogonální. Navíc AT
= WSUT
a tedy AAT
= USSUT
= P2
.
Předpokládejme, že A = PV = QU jsou dva takové rozklady a A je invertibilní. Pak
ovšem je AAT
= PV V T
P = P2
= QUUT
Q = Q2
positivně definitní a proto jsou matice
Q = P =

AAT jednoznačně určené a invertibilní. Pak také U = V = P-1
A. Odvodili
jsme tedy velice užitečnou analogii rozkladu reálného čísla na znaménko (ortogonální matice
v případě dimenze jedna jsou právě 1) a absolutní hodnotu (matice P, ke které umíme
odmocninu)
Věta. Každou čtvercovou reálnou matici A dimenze n lze vždy vyjádřit ve tvaru A = P V ,
kde P je symetrická a positivně definitní čtvercová matice téže dimenze a V je ortogonální.
Přitom P =

AAT . Je-li A invertibilní, je rozklad jednoznačný a V = (

AAT )-1
A.
Když budeme tutéž větu aplikovat na AT
místo A, dostaneme tentýž výsledek, ovšem s
obráceným pořadím symetrických a ortogonálních matic. Matice v příslušných pravých a levých
rozkladech budou samozřejmě obecně různé.
2.53 3.27. Poznámka. V tomto textu se bohužel z nedostatku prostoru vyhýbáme
komplexním maticím. Ve skutečnosti jsou pro všechny koncepty a pojmy zavedené
kolem skalárních součinů také přímočaré komplexní analogie a obvyklejší postup
v literatuře je, že se z výsledků pro tzv. unitární prostory, hermiteovská zobrazení,
samoadjungovaná zobrazení apod. odvozují i výsledky reálné. Například věta
o spektrálním rozkladu pak pracuje s maticí s pozitivně definitní samoadjungovanou
maticí P, která opět hraje roli absolutní hodnoty čísla, zatímco unitární
matice V je analogií argumentu komplexního čísla (tj. komplexní jednotky, která
se také rozkládá na součet  + i se samoadjungovanými , , které navíc splňují
2
+ 2
= idV ). Přitom ale nyní není jedno v jakém pořadí samoadjungované a
unitární matice chceme násobit. Umíme v obou, vyjdou ale pokaždé jiné.
Pro řadu aplikací bývá rychlejší použití tzv. QR rozkladu:
2.54 3.28. Věta. Pro každou reálnou matici A typu m/n existuje ortogonální matice Q
a horní trojúhelníková matice R takové, že A = QT
R.
Důkaz. V geometrické formulaci potřebujeme dokázat, že pro každé zobrazení
 : Rn
 Rm
s maticí A v standardních bazích můžeme zvolit novou bázi na Rm
tak, aby potom  mělo horní trojúhelníkovou matici.
Uvažme obrazy (e1), . . . , (en)  Rm
vektorů standardní báze, vyberme z
nich maximální lineárně nezávislý systém v1, . . . , vk takovým způsobem, že vypouštěné
závislé vektory jsou vždy lineární kombinací předchozích vektorů, a doplňme
jej do báze v1, . . . , vm. Nechť u1, . . . , um je ortonormální báze vzniklá GrammSchmidtovou
ortogonalizací tohoto systému vektorů. Nyní pro každé ei je (ei)
buď jedno z vj, j  i, nebo je lineární kombinací v1, . . . , vi-1, proto ve vyjádření
(ei) v bázi u vystupují pouze vektory u1, . . . , ui. Zobrazení  má proto ve standardní
bázi na Rn
a ortonormální bázi u na Rm
horní trojúhelníkovou matici R.
Přechod k bázi u na Rm
odpovídá násobení ortogonální maticí Q, tj. R = QA,
ekvivalentně A = QT
R.
5. ROZKLADY MATIC A PSEUDOINVERZE 101
Závěrem této části textu si všimněme mimořádně užitečné a důležité aplikace
našich výsledků pro přibližné numerické výpočty. Opět uvádíme pro jednoduchost
pouze reálnou variantu, obdobně platí a dokazuje se i varianta komplexní.
2.55 3.29. Definice. Nechť A je reálná matice typu m/n a nechťA = USV T
je její
singulární rozklad, S =
D 0
0 0
. Matici A(-1)
:= V S UT
s S =
D-1
0
0 0
nazýváme pseudoinverzní matice k matici A.
Jak ukazuje následující věta, je pseudoinverze důležité zobecnění pojmu inverzní
matice.
2.56 3.30. Věta. Nechť A je reálná matice typu m/n. Platí
(1) Je-li A invertibilní (zejména tedy čtvercová), pak
A(-1)
= A-1
.
(2) pro pseudoinverzi A(-1)
platí, že A(-1)
A i AA(-1)
jsou symetrické a
AA(-1)
A = A, A(-1)
AA(-1)
= A(-1)
.
(3) Uvažme pro danou matici A systém lineárních rovnic Ax = b, b  Rm
. Pak
y = A(-1)
b  Rn
minimalizuje vzdálenost Ax - b pro všechny x  Rn
.
Důkaz. (1): Je-li A invertibilní, pak i S = UT
AV je invertibilní a přímo z definice je
S = S-1
. Odtud A(-1)
A = AA(-1)
= E.
(2): Přímým výpočtem dostáváme SS S = S a S SS = S , proto
AA(-1)
A = USV T
V S UT
USV T
= USS SV T
= USV T
= A
a analogicky pro druhou rovnost. Dále
(AA(-1)
)T
= (USS UT
)T
= U(S )T
ST
UT
= U(SS )T
UT
= USS UT
= AA(-1)
a podobně se ukáže (A(-1)
A)T
= A(-1)
A.
(3): Uvažme zobrazení  : Rn
 Rm
, x  Ax, a přímé součty Kn
= (Ker )

Ker , Rm
= im   (im )
. Zúžené zobrazení ~ := |(Ker ) : (Ker )
 Im  je
lineární isomorfismus. Zvolíme-li vhodně ortonormální báze na (Ker )
a Im  a doplníme
je na ortonormální báze na celých prostorech, bude mít  matici S a ~ matici D z věty o
singulárním rozkladu. Pro dané b  Rm
je bod z  im  minimalizující vzdálenost b - z (tj.
realizující vzdálenost od podprostoru (b, Im )) právě komponenta z = b1 rozkladu b = b1 +
b2, b1  Im , b2  (Im )
. Přitom ale ve zvolené bázi je zobrazení (-1)
, původně zadané
ve standardních bazích pseudoinverzí A(-1)
, dáno maticí S z věty o singulárním rozkladu,
zejména je (-1)
(Im ) = (Ker )
a D-1
maticí zúžení 
(-1)
| Im  a 
(-1)
|(Im ) je nulové. Je
tedy skutečně
  (-1)
(b) = ((-1)
(z)) = z
a důkaz je ukončen.
Lze také ukázat, že matice A(-1)
minimalizuje výraz AA(-1)
- E 2
(tj. sumu kvadrátů
všech prvků uvedené matice).
102 3. LINÁRNÍ MODELY
2.57
3.31. Lineární regrese. Aproximační vlastnost (3) předchozí věty je velice užitečná
v případech, kdy máme najít co nejlepší přiblížení (neexistujícího) řešení
přeurčeného systému Ax = b, kde A je reálná matice typu m/n a m je větší než n.
Např. máme experimentem dáno mnoho naměřených hodnot bj a chceme najít
lineární kombinaci několika funkcí fi, která bude co nejlépe aproximovat hodnoty bj.
Skutečné hodnoty zvolených funkcí v bodech yj  R zadají matici aij = fi(yj) a naším
úkolem je tedy určit koeficienty xj  R tak, aby
m
i=1(bi -(
n
j=1 xjaij))2
byla
minimální. Jinými slovy, hledáme lineární kombinaci funkcí fi takovou, abychom
"dobře" proložili zadané hodnoty bi. Díky předchozí větě jsou hledané optimální
koeficienty A(-1)
b.
Abychom měli konkrétnější představu, uvažujme pouze dvě funkce f1(x) = x,
f2(x) = x2
a předpokládejme, že ,,naměřené hodnoty jejich neznámé kombinace
g(x) = y1x + y2x2
v celočíselných hodnotách pro x mezi 1 a 10 jsou
bT
= (1.44 10.64 4.48 14.56 31.12 39.20 54.88 71.28 85.92 104.16).
Tento vektor vzniknul výpočtem hodnot x + x2
v daných bodech posunutých o
náhodné hodnoty v rozmezí 8. Matice B = (bij) je tedy v našem případě rovna
BT
=
1 2 3 4 5 6 7 8 9 10
1 4 9 16 25 36 49 64 91 100
a y = B(-1)
 b = (0.61, 0.99). Výsledné proložení je možné dobře vidět na obrázku,
kde zeleně jsou proloženy zadané hodnoty b lomenou čarou, zatímco červený je graf
příslušné kombinace g. Výpočty byly provedeny v systému Maple pomocí příkazu
leastsqrs(B,b).
6420
100
80
60
x
40
20
10
0
8
5. ROZKLADY MATIC A PSEUDOINVERZE 103
Pokud jste spřáteleni s Maplem (nebo jiným podobným souftwarem), zkuste si
zaexperimentovat s podobnými úlohami.
KAPITOLA 4
Analytická geometrie
poloha, incidence, projekce?
­ a zase skončíme u matic...
1. Afinní geometrie
Vrátíme se teď k úlohám elementární geometrie z podobného pohledu, jako
když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.33. Motivací
k abstraktní definici vektorového prostoru nám byly množiny řešení systémů
lineárních diferenciálních rovnic s nulovou pravou stranou, kde součty i skalární násobky
řešení byly opět řešeními, ,,dimenzi celého prostoru řešení ale určoval rozdíl
mezi počtem proměnných a počtem nezávislých rovnic. Taková dimenze bývá výrazně
menší než počet proměnných a už proto není ideální pracovat s vektory jen
jako s n­ticemi skalárů. Když jsme pak zkoumali aplikace obecné teorie na systémy
rovnic v první části předchozí kapitoly, zjistili jsme v ostavci 3.1, že všechna
řešení nehomogenních systémů rovnic sice netvoří vektorové podprostory, vždy ale
vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení
příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je
vždy řešením homogenní. Obdobně se chovají lineární difereční rovnice, viz 3.6.
Návod na teoretické uchopení takové situace jsme viděli už při diskusi geometrie
roviny, viz odstavec 1.34 a dále. Tam jsme totiž popisovali přímky a body
jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla ,,jednorozměrným
prostorem, přestože její body byly popisovány dvěmi souřadnicemi.
Prametricky jsme ji zadávali tak, že k jednomu bodu (tj. dvojici souřadnic) jsme
přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i
teď v libovolné dimenzi.
2.58
4.1. Afinní prostory. Standarní afinní prostor An je množina všech bodů v Rn
spolu s operací, kterou k bodu A = (a1, . . . , an)  An a vektoru v = (v1, . . . , vn) 
Rn
přiřadíme bod A + v = (a1 + v1, . . . , an + vn)  Rn
. Tyto operace splňují
následující tři vlastnosti:
(1) A + 0 = A pro všechny body A  P a nulový vektor 0  V
(2) A + (v + w) = (A + v) + w pro všechny vektory v, w  V , A  P
(3) pro každé dva body A, B  P existuje právě jeden vektor v  P takový, že
A + v = B. Značíme jej B - A, někdy také AB.
Vektorový prostor Rn
nazýváme zaměření afinního prostoru An.
Všimněme si několika formálních nebezpečí: Používáme stejný symbol ,,+ pro
dvě různé operace: přičtení vektoru ze zaměření k bodu v afinním prostoru, ale také
sčítání vektorů v zaměření Rn
. Také nezavádíme zvláštní písmena pro samotnou
105
106 4. ANALYTICKÁ GEOMETRIE
množinu bodů afinního prostoru, tj. An pro nás představuje jak samotnou množinu
bodů, tak i celou strukturu definující afinní prostor.
Proč vlastně chceme rozlišovat množinu bodů prostoru An od jeho zaměření V ,
když se jedná jakoby o stejné Rn
? Je to patrně podstatný formální krůček pro pochopení
geometrie v Rn
: Geometrické objekty jako jsou přímky, body, roviny apod.
nejsou totiž přímo závislé na vektorové struktuře na množině Rn
a už vůbec ne na
tom, že pracujeme s n­ticemi skalárů. Musíme ale mít možnost říci, co je to ,,rovně
v daném směru . K tomu právě potřebujeme na jedné straně vnímat třeba rovinu
jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o
zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme
umět diskutovat ,,rovinnou geometrii pro dvourozměrné podprostory, tj. roviny
ve vícerozměrných prostorech, ,,prostorovou pro třírozměrné atd., aniž bychom
museli přímo manipulovat k-ticemi souřadnic.
Definice. Afinním prostorem A se zaměřením V rozumíme množinu bodů P, spolu
se zobrazením P ×V  P, (A, v)  A+v, splňující vlastnosti (1)­(3). Pro libovolný
pevně zvolený vektor v  V je tak definována translace v : A  A jako zúžené
zobrazení
v : P P × {v}  P, A  A + v.
Dimenzí afinního prostoru A rozumíme dimenzi jeho zaměření.
Nadále nebudeme rozlišovat A a P v označení. Z axiomů okamžitě plyne pro
libovolné body A, B, C v afinním prostoru A
A - A = 0  V(4)
B - A = -(A - B)(5)
(B - A) + (C - B) = (C - A).(6)
(Dokažte si podrobně formálně sami!)
Všimněme si, že volba jednoho pevného bodu A0  A nám určuje bijekci mezi V
a A. Při volbě pevné báze u ve V tak dostáváme pro každý bod A  A jednoznačné
vyjádření
A = A0 + x1u1 +    + xnun.
Hovoříme o afinní soustavě souřadnic (A0; u1, . . . , un) zadané počátkem afinní souřadné
soustavy A0 a bazí zaměření u. Hovoříme také o afinním repéru (A0, u).
Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě
(A0, u) jsou souřadnicemi vektoru A - A0 v bázi u zaměření V .
Volba afinního souřadného systému ztotožňuje n-rozměrný afinní prostor A se
standardním afinním prostorem An.
2.59
4.2. Afinní podprostory. Jestliže si vybereme v A jen body, které budou mít
některé předem vybrané souřadnice nulové (třeba poslední jednu). Dostaneme opět
množinu, která se bude chovat jako afinní prostor. Takto budeme skutečně parametricky
popisovat tzv. afinní podprostory ve smyslu následující definice.
Definice. Neprázdná podmnožina Q  A afinního prostoru A se zaměřením V
se nazývá afinní podprostor v A, je-li podmnožina W = {B - A; A, B  Q}  V
vektorovým podprostorem a pro libovolné A  Q, v  W je A + v  Q.
Skutečně je rozumné mít obě podmínky v definici, protože je snadné najít
příklady podmnožin, které budou splňovat první, ale nikoliv druhou. Přemýšlejte
např. o přímce v rovině s vyjmutým jedním bodem.
1. AFINNÍ GEOMETRIE 107
Pro libovolnou množinu bodů M  A v afinním prostoru se zaměřením V
definujeme vektorový podprostor
Z(M) = {B - A; B, A  M}  V.
Zejména je V = Z(A) a každý afinní podprostor Q  A splňuje sám axiomy
afinního prostoru se zaměřením Z(Q).
Přímo z definic je zřejmé, že průnik libovolné množiny afinních podprostorů je
buď opět afinní podprostor nebo prázdná množina.
Afinní podprostor M v A generovaný neprázdnou podmnožinou M  A je
průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M.
Přímo z definic plyne, že pro kterýkoliv bod A0  M je M = {A0 + v; v 
Z(M)  Z(A)}, tj. pro generování afinního podprostoru vezmeme vektorový podprostor
Z(M) v zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme
k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M v A.
Naopak, kdykoliv zvolíme podprostor U v zaměření Z(A) a jeden pevný bod
A  A, pak podmnožina A + U vzniklá všemi možnými součty bodů A s vektory v
U je afinní podprostor. Takový postup vede k pojmu parametrizace podprostorů:
Nechť Q = A + Z(Q) je afinní podprostor v An a (u1, . . . , uk) je báze Z(Q) 
Rn
. Pak vyjádření podprostoru
Q = {A + t1u1 +    + tkuk; t1, . . . , tk  R}
nazýváme parametrický popis podprostoru Q. Jeho zadání systémem rovnic v daných
souřadnicích je implicitní popis podprostoru Q.
2.60
4.3. Příklady afinních prostorů. (1) Jednorozměrný (standardní) afinní prostor
je množina všech bodů reálné přímky A1. Její zaměření je jednorozměrný
vektorový prostor R (a nosná množina také R). Afinní souřadnice dostaneme volbou
počátku a měřítka (tj. báze ve vektorovém prostoru R). Všechny vlastní afinní
podprostory jsou 0-rozměrné, jsou to právě všechny body reálné přímky R.
(2) Dvourozměrný (standardní) afinní prostor je množina všech bodů prostoru A2
se zaměřením R2
. (Nosnou množinou je R2
.) Afinní souřadnice dostaneme volbou
počátku a dvou nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory
jsou pak všechny body a přímky v rovině (0-rozměrné a 1-rozměrné). Přímky přitom
jednoznačně zadáme jejich jedním bodem a jedním generátorem zaměření (tzv.
parametrický popis přímky).
(3) Trojrozměrný (standardní) afinní prostor je množina všech bodů prostoru A3 se
zaměřením R3
. Afinní souřadnice dostaneme volbou počátku a tří nezávislých vektorů
(směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body, přímky
a roviny (0-rozměrné, 1-rozměrné a 2-rozměrné).
(4) Podprostor všech řešení jedné lineární rovnice a  x = b pro neznámý bod
(x1, . . . , xn)  An, známý nenulový vektor koeficientů (a1, . . . , an) a skalár b  R je
afinní podprostor dimenze n-1 (říkáme také, že je kodimenze 1), tj. tzv. nadrovina
v An.
Poslední příklad je zvláštním případem následující obecné věty popisující geometrickou
podstatu systémů lineárních rovnic.
2.61 4.4. Věta. Nechť (A0; u) je afinní souřadný systém v n-rozměrném afinním prostoru
A. Afinní podprostory dimenze k v A, vyjádřené v daných souřadnicích, jsou
právě množiny řešení řešitelných systémů n-k lineárně nezávislých lineárních rovnic
v n proměnných.
108 4. ANALYTICKÁ GEOMETRIE
Důkaz. Uvažujme libovolný řešitelný systém n-k lineárně nezávislých rovnic
i(x) = bi, bi  R, i = 1, . . . , n - k. Je-li A = (a1, . . . , an)T
 Rn
libovolné pevně
zvolené řešení tohoto (nehomogenního) systému rovnic a je-li U  Rn
vektorový
podprostor všech řešení zhomogenizovaného systému i(x) = 0, pak dimenze U je k
a podmnožina všech řešení daného systému je tvaru {B; B = A+(y1, . . . , yn)T
, y =
(y1 . . . , yn)T
 U}  Rn
, viz. 3.1. Příslušný afinní podprostor je tím popsán parametricky
ve výchozích souřadnicích (A0; u).
Naopak, uvažme libovolný afinní podprostor Q  An a zvolme nějaký jeho bod
B za počátek afinního souřadného systému (B, v) pro afinní prosotr A. Protože
Q = B + Z(Q), potřebujeme popsat zaměření podprostoru Q jako podprostor
řešení homogenního systému rovnic. Zvolme tedy bázi v na Z(A) tak, aby prvních
k vektorů tvořilo bázi Z(Q). Pak v těchto souřadnicích jsou vektory v  Z(Q) dány
rovnostmi
j(v) = 0, j = k + 1, . . . , n,
kde i jsou lineární formy z tzv. duální báze k v, tj. funkce přiřazení jednotlivých
souřadnic v naší bázi v.
Náš vektorový podprostor Z(Q) dimenze k v n-rozměrném Rn
je tedy skutečně
dán jako řešení homogenního systému n-k nezávislých rovnic. Popis zvoleného afinního
podprostoru ve vybraném souřadném systému (A0; u) je proto dán systémem
homogenních lineárních rovnic.
Zbývá nám se vypořádat důsledky přechodu z původního zadaného souřadného
systému (A; u) do našeho přizpůsobeného (B; v). Z obecné úvahy o transformacích
souřadnic v následujícím odstavci vyplyne, že výsledný popis podprostoru bude
opět pomocí systému rovnic, tentokrát ale už obecně nehomogenních.
2.62
4.5. Transformace souřadnic. Dvě libovolně zvolené afinní soustavy souřadnic
(A0, u), (B0, v) se obecně liší posunutím počátku o vektor (B0 - A0) a jinou bazí
zaměření. Transformační rovnice tedy vyčteme ze vztahu pro obecný bod X  A
X = B0 + x1v1 +    + xnvn = B0 + (A0 - B0) + x1u1 +    + xnun.
Označme y = (y1, . . . , yn)T
sloupec souřadnic vektoru (A0 - B0) v bázi v a M =
(aij) buď matice vyjadřující bázi u prostřednictvím báze v. Potom
x1 = y1 + a11x1 +    + a1nxn
...
xn = yn + an1x1 +    + annxn
tj. maticově
x = y + M  x.
Jako příklad si můžeme spočítat dopad takové změny báze na vyjádření řešení
systémů rovnic. Nechť v souřadnicích (A0; u) má systém rovnic tvar
S  x = b
s maticí systému S. Pak S  x = S  M-1
 (y + M  x) - S  M-1
 y = b. Proto v
nových výše uvažovaných souřadnicích (B0; v) bude mít náš systém rovnic tvar
(S  M-1
)  x = b = b + (S  M-1
)  y.
To plně dokončuje důkaz předchozí věty.
1. AFINNÍ GEOMETRIE 109
2.63
4.6. Afinní kombinace bodů. Nechť A0, . . . , Ak jsou body v afinním prostoru
A. Jejich afinní obal {A0 . . . , Ak} můžeme zapsat jako
{A0 + t1(A1 - A0) +    + tk(Ak - A0); t1, . . . , tk  R}
a v libovolných afinních souřadnicích (tj. Ai je vyjádřen sloupcem skalárů) můžeme
tutéž množinu zapsat jako
A0, . . . , Ak = {t0A0 + t1A1 +    + tkAk; ti  R,
k
i=0
ti = 1}.
Obecně výrazy t0A0 + t1A1 +    + tkAk s koeficienty splňujícícmi
k
i=0 ti = 1
rozumíme body A0 +
k
i=1 ti(Ai - A0) a nazýváme je afinní kombinace bodů.
Body A0 . . . , Ak jsou v obecné poloze, jestliže generují k-rozměný podprostor.
Z našich definic je vidět, že to nastane právě, když pro kterýkoliv z nich platí, že
vektory vzniklé pomocí rozdílů tohoto pevného s ostatními jsou lineárně nezávislé.
Všimněme si také, že zadání posloupnosti dim A bodů v obecné poloze je ekvivalentní
zadání afinního repéru s středem v prvním z nich.
Afinní kombinace je obdobná konstrukce pro body afinního prostoru jako byla
lineární kombinace pro vektorové prostory. Skutečně, afinní podprostor generovaný
body A0 . . . , Ak je roven množině všech afinních kombinací svých generátorů. Můžeme
však nyní dobře zobecnit i pojem ,,mezi dvěma body na přímce . V dvojrozměrném
případě tomu odopovídá vnitřek trojúhelníku. Obecně budeme postupovat
takto:
Nechť A0, . . . , Ak je k+1 bodů afinního prostoru A v obecné poloze. k­rozměrný
simplex  = (A0, . . . , Ak) generovaný těmito body je definován jako množina
všech afinních kombinací bodů Ai s pouze nezápornými koeficienty, tzn.
 = {t0A0 + t1A1 +    + tkAk; ti  [0, 1]  R,
k
i=0
ti = 1}.
Jednorozměrný simplex je úsečka, dvourozměrný trojúhelník.
Zadání podprostoru jako množiny afinních kombinací bodů v obecné poloze je
ekvivalentní parametrickému popisu. Obdobně pracujeme s parametrickými popisy
simplexů.
2.64
4.7. Konvexní množiny. Podmnožina M afinního prostoru se nazývá konvexní,
jestliže s každými svými dvěma body A, B obsahuje i celou úsečku (A, B). Přímo
z definice je vidět, že každá konvexní množina obsahuje s každými k + 1 body v
obecné poloze i celý jimi definovaný simplex.
Konvexními množinami jsou např.
(1) prázdná podmnožina
(2) afinní podprostory
(3) úsečky, polopřímky p = {P + t  v; t  0}, obecněji k­ rozměrné poloprostory
 = {P + t1  v1 +    + tk  vk; t1, . . . , tk  R, tk  0}, úhly v dvojrozměrných
podprostorech  = {P + t1  v1 + t2  v2; t1  0, t2  0}, atd.
Přímo z definice také plyne, že průnik libovolného systému konvexních množin
je opět konvexní. Průnik všech konvexních množin obsahujících danou množinu M
nazýváme konvexní obal K(M) množiny M.
110 4. ANALYTICKÁ GEOMETRIE
Věta. Konvexní obal libovolné podmnožiny M  A je
K(M) = {t1A1 +    + tsAs;
s
i=1
ti = 1, ti  0}
Důkaz. Označme S množinu všech afinních kombinací na pravé straně dokazované
rovnosti. Nejprve ověříme, že je S konvexní. Zvolme tedy dvě sady parametrů
ti, i = 1, .., s1, tj, j = 1, . . . , s2 s požadovanými vlastnosti. Bez újmy na obecnosti
můžeme předpokládat, že s1 = s2 a že v obou kombinacích vystupují stejné body
z M (jinak prostě přidáme sčítance s nulovými koeficienty). Uvažme libovolný bod
úsečky zadané takto získanými body:
(t1A1 +    + tsAs) + (1 - )(t1A1 +    + tsAs), 0   1.
Zřejmě jsou opět všechny v S.
Zbývá ukázat, že konvexní obal bodů A1, . . . , As nemůže být menší než S.
Samotné body Ai odpovídají volbě parametrů tj = 0 pro všechny j = i a ti = 1.
Předpokládejme, že tvrzení platí pro všechny množiny s nejvýše s - 1 body. To
znamená, že konvexní obal bodů A1, . . . , As-1 je (podle předpokladu) tvořen právě
těmi kombinacemi z pravé strany dokazované rovnosti, kde ts = 0. Uvažme nyní
libovolný bod A = t1A1 +    + tsAs  S, ts = 1, a afinní kombinace
(t1A1 +    + ts-1As-1) + (1 - (1 - ts))As, 0   1
1-ts
.
Jde o úsečku s krajními body určenými parametry = 0 (bod As) a = 1/(1 - ts)
(bod v konvexním obalu bodů A1, . . . , As-1). Bod A je vnitřním bodem této úsečky
s parametrem = 1.
Konvexní obaly konečných množin bodů se nazývají konvexní mnohostěny.
Jsou-li definující body A0, . . . , Ak konvexního mnohostěnu v obecné poloze, dostáváme
právě k-rozměrný simplex. V případě simplexu je vyjádření jeho bodů ve
tvaru afinní kombinace definujících vrcholů jednoznačné.
Jiným příkladem jsou konvexní podmnožiny generované jedním bodem a konečně
mnoha vektory: Nechť u1, . . . , uk, jsou libovolné vektory v zaměření Rn
,
A  An je libovolný bod. Rovnoběžnostěn Pk(A; u1, . . . , uk)  An je množina
Pk(A; u1, . . . , uk) = {A + c1u1 +    + ckuk; 0  ci  1, i = 1, . . . , k}.
Jsou-li vektory u1, . . . , uk nezávislé, hovoříme o k-rozměrném rovnoběžnostěnu
Pk(A; u1, . . . , uk)  An. Z definice je zřejmé, že rovnoběžnostěny jsou konvexní. Ve
skutečnosti jde o konvexní obaly jejich vrcholů.
2.65
4.8. Příklady standardních afinních úloh. (1) K podprostoru zadanému implicitně
nalézt parametrický popis a naopak:
Nalezením partikulárního řešení nehomogenního systému a fundamentálního
řešení zhomogenizovaného systému rovnic získáme (v souřadnicích, ve kterých byly
rovnice zadány) právě hledaný parametrický popis. Naopak, zapíšeme-li parametrický
popis v souřadnicích, můžeme volné parametry t1, . . . , tk vyeliminovat a získáme
právě rovnice zadávající daný podprostor implicitně.
(2) Nalézt podprostor generovaný několika podprostory Q1, . . . , Qs (obecně různých
dimenzí, např. v R3 nalézt rovinu danou bodem a přímkou, třemi body apod.) a
zadat jej implicitně či parametricky:
1. AFINNÍ GEOMETRIE 111
Výsledný podprostor Q je vždy určen jedním pevně zvoleným bodem Ai v
každém z nich a součtem všech zaměření. Např.
Q = A1 + (Z({A1, . . . , Ak}) + Z(Q1) +    + Z(Qs)).
Pokud jsou podprostory zadány implicitně, je možné je nejdříve převést na parametrický
tvar. V konkrétních situacích býají funkční i jiné postupy. Všimněme si,
že obecně je skutečně nutné využít jednoho bodu z každého podprostoru. Např.
dvě paralelní přímky v rovině vygenerují celou rovinu, ale sdílí totéž jednorozměrné
zaměření.
(3) Nalézt průnik podprostorů Q1, . . . , Qs:
Pokud jsou zadány v implicitním tvaru, stačí sjednotit všechny rovnice do jednoho
systému (a případně vynechat lineárně závislé). Pokud je vzniklý systém neřešitelný,
je průnik prázdný. V opačném případě získáme implicitní popis afinního
podprostoru, který je hledaným průnikem.
Pokud máme dány parametrické tvary, můžeme také hledat přímo společné
body jako řešení vhodných rovnic, podobně jako při hledání průniků vektorových
podprostorů. Získáme tak přímo opět parametrický popis. Pokud je podprostorů
více než dva, musíme průnik hledat postupně.
Máme-li jeden prostor zadaný parametricky a ostatní implicitně, stačí dosadit
parametrizované souřadnice a řešit výsledný systém rovnic.
(4) Nalezení příčky mimoběžek p, q v A3 procházející daným bodem nebo mající
předem daný směr (tj. zaměření):
Příčkou rozumíme přímku, která má neprázdný průnik s oběmi mimoběžkami. Výsledná
příčka r tedy bude jednorozměrným afinním podprostorem. Pokud máme zadán
jeho bod A  r, pak afinní podprostor generovaný p a A je buď přímka (A  p)
nebo rovina (A / p). V prvém případě máme nekonečně mnoho řešení, jedno pro
každý bod z q, v druhém stačí najít průnik B roviny p  A s q a r = {A, B} .
Pokud je průnik prázdný, úloha nemá řešení, v případě že q  p  A , máme opět
nekonečně mnoho řešení, a pokud je průnik jednoprvkový, dostáváme právě jedno
řešení.
Máme-li místo bodu dán směr u  Rn
, tj. zaměření r, pak uvažujeme opět
podprostor Q generovaný p a zaměřením Z(p) + u  Rn
. Opět, pokud q  Q,
máme nekonečně mnoho řešení, jinak uvážíme průnik Q s q a úlohu dokončíme
stejně jako v předchozím případě.
Řešení mnoha dalších standardních geometrických úloh spočívá v používání
výše uvedených kroků.
4.9. Příklad. Uvádíme několik příkladů s výsledky.
4.9.1. 1. Parametricky vyjádřete průnik následujících rovin v R3
:
 : 2x + 3y - z + 1 = 0 a  : x - 2y + 5 = 0.
Řešení. Přímka (2t, t, 7t) + [-5, 0, -9].
4.9.2. 2. Najděte příčku přímek (úsečku, jejíž jeden koncový bod leží na jedné z
přímek, druhý pak na druhé z nich)
p : [1, 1, 1] + t(2, 1, 0), q : [2, 2, 0] + t(1, 1, 1),
takovou, že přímka jí určená prochází bodem [1, 0, 0].
112 4. ANALYTICKÁ GEOMETRIE
Řešení. Hledaný bod v q najdeme jako průnik přímky q s rovinou
[1, 1, 1] + t(2, 1, 0) + s(0, 1, 1).
Jde o úsečku s krajními body [5, 5, 3]  q, [7/3, 5/3, 1]  p.
4.9.3. 3. Určete osu mimoběžek
p : [3, 0, 3] + (0, 1, 2)t
q : [0, -1, -2] + (1, 2, 3)t.
Řešení. Úsečka ([2, 3, 4], [3, 1, 5]).
4.9.4. 4. Nalezněte osu mimoběžek
p : [1, 1, 1] + t(2, 1, 0), q : [2, 2, 0] + t(1, 1, 1).
Řešení. [3, 2, 1][8/3, 8/3, 2/3].
4.9.5. 5. Určete patu kolmice spuštěné z bodu [0, 0, 7] na rovinu
 : [0, 5, 3] + (1, 2, 1)t + (-2, 1, 1)s.
Řešení. (-1, 3, 2).
4.9.6. 6. Zjistěte, zda leží body [0, 2, 1], [-1, 2, 0], [-2, 5, 2] a [0, 5, 4] z R3
v jedné
rovině.
Řešení. Libovolná dvojice zadaných bodů z afinního prostoru R3
určuje vektor (viz
definice afinního prostoru; jeho souřadnice jsou dány po složkách rozdíly souřadnic
daných dvou bodů). To, že dané čtyři body leží v rovině je ekvivalentní tomu, že
jsou tři vektory dané jedním vybraným bodem a vždy jedním ze tří zbylých lineárně
závislé. Vybereme např. bod [0, 2, 1] (na výběru nezáleží), pak uvažujeme vektory
[0, 2, 1] - [-1, 2, 0] = (1, 0, 1), [0, 2, 1] - [-2, 5, 2] = (2, -3, -1) a [0, 2, 1] - [0, 5, 4] =
(0, -3, -3). Vidíme, že součet dvojnásobku prvního vektoru a třetího vektoru je
roven druhému vektoru, vektory jsou tedy lineárně závislé (jinak má taky matice,
jejíž řádky jsou tvořeny souřadnicemi daných vektorů, hodnost nižší než tři; v tomto
případě se tedy jedná o matici


1 0 1
2 -3 -1
0 -3 -3

 ,
která má hodnost dva). Dané body tedy leží v rovině.
4.9.7. 7. Na kolik částí mohou dělit prostor (R3
) tři roviny? Pro každou možnost
popište odpovídající případ.
Řešení. 2, 3, 4, 6, 7, 8. Polohy rovin, které realizují dané počty si rozmyslete
samostatně.
4.9.8. 8. Rozhodněte, zda leží bod [2, 1, 0] uvnitř konvexního obalu bodů [0, 2, 1],
[1, 0, 1], [3, -2, -1], [-1, 0, 1].
1. AFINNÍ GEOMETRIE 113
Řešení. Sestavíme nehomogenní lin. soustavu, pro koeficienty t1, t2, t3, t4, afinní
kombinace daných bodů, která dává první bod (jsou určeny jednozačně, pokud dané
body neleží v rovině).


0 1 3 -1
2 0 -2 0
1 1 -1 1
1 1 1 1


t1
t2
t3
t4


 =


2
1
0
1


 .
Poslední rovnice udává, že jde o afinní kombinaci. Jejím řešením dostáváme (t1, t2, t3, t4) =
(1, 0, 1/2, -1/2), nejedná se tedy o konvexní kombinaci. (nelze odvodit pomocí projekcí
na jednotlivé osy).
4.9.9. 9. Určete odchylku rovin
 : [1, 0, 2] + (1, -1, 1)t + (0, 1, -2)s
 : [3, 3, 3] + (1, -2, 0)t + (0, 1, 1)s
Řešení. Průsečnice má směrový vektor (1, -1, 1), kolmá rovina na ni má pak s danými
rovinami průniky generované vektory (1, 0, -1) a (0, 1, 1). Tyto jednorozměrné
podprostory svírají úhel 60
.
4.9.10. 10. Je dán rovnoběžník [0, 0, 1], [2, 1, 1], [3, 3, 1], [1, 2, 1]. Určete bod X na
přímce p : [0, 0, 1] + (1, 1, 1)t tak, aby rovnoběžnostěn určený daným rovnoběžníkem
a bodem X měl objem 1.
Řešení. Sestavíme determinant udávající objem rovnoběžnostěnu při pohyblivém
bodu X:
t t t
2 1 0
1 2 0
.
Podmínka, že má být roven jedné dává t = 1/3.
4.9.11. 11. Je dána krychle ABCDA B C D (ve standardním označení, tj. ABCD
a A B C D jsou stěny, AA pak hrana). Určete odchylku vektorů AB a AD .
Řešení. Uvažujme krychli o hraně 1 a umístěme ji v R3
tak, že bod A bude
mít ve standardní bázi souřadnice [0, 0, 0], bod B pak souřadnice [1, 0, 0] a bod
C souřadnice [1, 1, 0]. Potom má bod B souřadnice [1, 0, 1] a bod D souřadnice
[0, 1, 1]. Pro vyšetřované vektory tedy můžeme psát AB = B - A = [1, 0, 1] [0,
0, 0] = (1, 0, 1), AD = D - A = [0, 1, 1] - [0, 0, 0] = (0, 1, 1). Podle definice
odchylky  těchto vektorů je pak
cos() =
(1, 0, 1)  (0, 1, 1)
(1, 0, 1) (0, 1, 1)
=
1
2
,
tedy  = 60
.
114 4. ANALYTICKÁ GEOMETRIE
2.66
4.10. Afinní zobrazení. Zobrazení f : A  B mezi afinními prostory nazýváme
afinní zobrazení, jestliže existuje lineání zobrazení  : Z(A)  Z(B) takové, že pro
všechny A  A, v  Z(A) platí
f(A + v) = f(A) + (v).
Zobrazení f a  jsou jednoznačně zadána touto vlastnostní a libovolně zvolenými
obrazy (dim A + 1) bodů v obecné poloze.
Pro libovolnou afinní kombinaci bodů t0A0 +    + tsAs  A pak dostaneme
f(t0A0 +    + tsAs) = f(A0) + t1(A1 - A0) +    + ts(As - A0)
= t0f(A0) + t1f(A1) +    + tsf(As).
Naopak, pokud pro nějaké zobrazení platí, že zachovává afinní kombinace, můžeme
číst předchozí výpočet v opačném pořadí a zjistíme, se jedná o afinní zobrazení.
Ekvivalentně lze tedy definovat afinní zobrazení jako ta, která zachovávají afinní
kombinace bodů.
Volbou afinních souřadnic (A0, u) na A a (B0, v) na B dostáváme souřadné
vyjádření afinního zobrazení f : A  B. Přímo z definice je zřejmé, že stačí vyjádřit
obraz počátku souřadnic v A v souřadnicích na B, tj. vyjádřit vektor f(A0) - B0
v bázi v a vše ostatní je pak určeno násobením maticí zobrazení  ve zvolených
bazích a přičtením výsledku.
4.11. Příklad. Napište matici B afinního zobrazení f daného ve standardní bázi
v R2
jako
f(x1, x2) =
2 1
0 1
x1
x2
+
1
1
souřadné soustavě dané bází u = {(1, 1), (-1, 1)} a počátkem [2, 0].
Řešení. Matice přechodu od dané báze u ke standardní bázi k je
1 -1
1 1
.
Matici zobrazení v bázi ([2, 0], u) získáme tak, že nejprve transformujeme souřadnice
priklané v bázi ([2, 0], u) na souřadnice ve standardní bázi, tedy v bázi
([0, 0], (1, 0), (0, 1)), poté aplikujeme matici zobrazení f ve standardní bázi a na
závěr výsledek transformujeme zpět do souřadnic v bázi ([2, 0], u). Transformační
rovnice přechodu od suouřadnic y1, y2 v bázi ([2, 0], u) k souřadnicím x1, x2 v
standardní bázi jsou
x1
x2
=
1 -1
1 1
y1
y2
+
2
0
.
Odtud máme, že
y1
y2
=
1 -1
1 1
-1
x1
x2
-
2
0
. =
1
2
1
2
-1
2
1
2
x1
x2
+
-1
1
.
Pro matici zobrazení pak dostáváme
B =
1
2
1
2
-1
2
1
2
2 1
0 1
1 -1
1 1
+
2
0
+
1
1
+
-1
1
=
2 0
-1 1
+
2
-1
2. EUKLIDOVSKÁ GEOMETRIE 115
4.12. Příklad.
4.12.1. Mejme dánu standardní souřadnou soustavu v trojrozměrném Eukleidovském
prostoru. Agent K sídlí v bodě S o souřadnicích [0, 1, 2] a ústředí mu přidělilo
pro používání souřadnou soustavu s počátkem S a bází {(1, 1, 0), (-1, 0, 1), (0, 1, 2)}.
Agent Sokol bydlí domě D na kótě [1, 1, 1] a používá souřadnou soustavu s bází
{(0, 0, 1), (-1, 1, 2), (1, 0, 1)}. Agent K žádá Sokola o schůzku v cihelně, která leží
podle jeho souřadné soustavy v bodě [1, 1, 0]. Kam má přijít Sokol (podle jeho sou-
řadnic)?
Řešení. Matice přechodu od báze agenta K k Sokolově bázi (při stejných počátcích)
je
T =


-4 2 -1
1 0 1
2 -1 1


Vektor (0, 1, 2) má tedy souřadnice T  (0, 1, 2)T
= (0, 2, 1)T
, posunutím počátku
(přičteme vektor (-1, 0, 1)) dostáváme výsledek (-1, 2, 2).
2. Euklidovská geometrie
Na minulé kapitole jsme vytvořili východisko pro elementární geometrii a nepotřebovali
jsme k tomu pojem vzdálenosti nebo velikosti. Ve skutečnosti jsme pojem
velikosti vektorů a odchylku vektorů zavedli na konci třetí kapitoly této části. Několikrát
jsme také nejen v geometrii roviny se vzdálenostmi pracovali, viz třeba
optimalizační výsledek o neřešitelných systémech lineárních rovnic a pseudoinverzních
maticích ve Větě 3.30. Asi proto dobře tušíme, jak se s problémem vypořádat:
4.13. Definice. Standardní bodový euklidovský prostor En je afinní prostor An,
jehož zaměřením je standardní euklidovský prostor Rn
se skalárním součinem
x, z = xT
 y.
Kartézská souřadná soustava je afinní souřadná soustava (A0; u) s ortonormální
bazí u. Vzdálenost bodů A, B  En definujeme jako velikost vektoru B - A ,
budeme ji značit (A, B). Euklidovské podprostory v En jsou afinní podprostory
jejichž zaměření uvažujeme spolu se zúženými skalárními součiny.
Bodovým euklidovským prostorem E pak obecně rozumíme afinní prostor, jehož
zaměření je euklidovský vektorový prostor. Pojem kartézské souřadné soustavy má
opět jasný smysl. Každá volba takové souřadné soustavy ovšem zadává ztotožnění
E se standardním prostorem En. Proto se budeme v dalším, bez újmy na obecnosti,
zabývat hlavně standardními euklidovskými prostory a jejich podprostory.
Opět si napřed uvedeme několik jednoduchých tvrzení o euklidovských prostorech.
K jejich formulaci i důkazům se ale musíme zamyslet nad standardními vztahy
mezi velikostmi vektorů, které podobně jako v rovinné geometrii platí obecně:
4.12 4.14. Věta. Pro každé vektory u a v, které leží v reálném vektorovém prostoru V
se skalárním součinem, platí
(1) u+v  u + v (trojúhelníková nerovnost). Přitom rovnost nastane právě,
když jsou u a v lineárně závislé.
116 4. ANALYTICKÁ GEOMETRIE
(2) |u  v|  u v (Cauchyova nerovnost). Přitom rovnost nastane právě, když
jsou u a v lineárně závislé.
(3) pro každý ortonormální systém vektorů (e1, . . . , ek) platí
u 2
 |u  e1|2
+    + |u  ek|2
(Besselova nerovnost).
(4) Pro ortonormální systém vektorů (e1, . . . , ek) je u  e1, . . . , ek právě když
u 2
= |u  e1|2
+    + |u  ek|2
(Parsevalova rovnost).
(5) Pro ortonormální systém vektorů (e1, . . . , ek) a u  V je vektor
w = (u  e1)e1 +    + (u  ek)ek
jediným vektorem, který minimalizuje velikost u-v pro všechny v  e1, . . . , ek .
Důkaz. Všechny důkazy spočívají v podstatě v přímých výpočtech:
(2): Definujme vektor w := u - uv
vv v, tzn. w  v a počítejme
0  w 2
= u 2
(u
 v)
v 2
(u  v) u
 v
v 2
(v  u) +
(u  v)(u  v)
v 4
v 2
0  w 2
v 2
= u 2
v 2
- 2(u  v)(u  v) + (u  v)(u  v)
Odtud již přímo plyne, že u 2
v 2
 |u  v|2
a rovnost nastane právě tehdy,
když w = 0, tj. když jsou u a v lineárně závislé.
(1): Opět stačí počítat
u + v 2
= u 2
+ v 2
+ u  v + v  u = u 2
+ v 2
+ 2u  v
 u 2
+ v 2
+ 2|u  v|  u 2
+ v 2
+ 2 u v
= ( u + v )2
Protože se přitom jedná o kladná reálná čísla, je opravdu u+v  u + v . Navíc,
při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je
ekvivalentní podmínce, že u a v jsou lineárně závislé (podle předchozí části důkazu).
(3), (4): Nechť (e1, . . . , ek) je ortonormální systém vektorů. Doplníme jej do ortonormální
báze (e1, . . . , en). Pak je pro každý vektor u  V
u 2
=
n
i=1
(u  ei)(u  ei) =
n
i=1
|u  ei|2

k
i=1
|u  ei|2
.
To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě
tehdy, když u  ei = 0 pro všechny i > k, a to dokazuje Parsevalovu rovnost.
(5): Zvolme libovolný v  e1, . . . , ek a doplňme daný ortonormální systém na
ortonormální bázi (e1, . . . , en). Nechť (u1, . . . , un) a (x1, . . . , xk, 0, . . . , 0) jsou po
řadě souřadnice u a v v této bázi. Pak
u - v 2
= |u1 - x1|2
+    + |uk - xk|2
+ |uk+1|2
+    + |un|2
a tento výraz je zjevně minimalizován při volbě x1 = u1, . . . , xk = uk.
Nyní již dostáváme jednoduché důsledky pro euklidovskou geometrii:
4.13 4.15. Věta. Pro body A, B, C  En platí
(1) (A, B) = (B, A)
(2) (A, B) = 0 právě, když A = B
(3) (A, B) + (B, C)  (A, C)
2. EUKLIDOVSKÁ GEOMETRIE 117
(4) V každé kartézké souřadné soustavě (A0; e) mají body
A = A0 + a1e1 +    + anen, B = A0 + b1e1 +    + bnen
vzdálenost
n
i=1(ai - bi)2.
(5) Je­li dán bod A a podprostor Q v En, pak existuje bod P  Q minimalizující
vzdálenosti bodů Q od A. Vzdálenost bodů A a P je rovna velikosti kolmého
průmětu vektoru A - B do Z(Q)
pro libovolný B  Q.
(6) Obecněji, pro podprostory R a Q v En existují bod P  Q a Q  R minimalizující
vzdálenosti bodů B  Q a A  R. Vzdálenost bodů Q a P je rovna velikosti
kolmého průmětu vektoru A-B do Z(Q)
pro libovolné body B  Q a A  R.
Důkaz. První tři vlastnosti vyplývají přímo z vlastností velikosti vektorů v
prostorech se skalárním součinem, čtvrtá plyne přímo z vyjádření skalárního součinu
v libovolné ortonormální bázi.
Podívejme se na vztah pro minimalizaci vzdleností (A, B) pro B  Q. Vektor
A - B se jednoznačně rozkládá na A - B = u1 + u2, u1  Z(Q), u2  Z(Q)
.
Přitom u2 nezávisí na volbě B  Q, P = A + (-u2) = B + u1  Q a A - B 2
=
u1
2
+ u2
2
 u2
2
= A - P . Odtud již vyplývá, že infima je skutečně
dosaženo, a to pro bod P. Vypočtená vzdálenost je skutečně u2 .
Obecný výsledek se dokáže zcela obdobně.
4.16. Vzdálenost přímek. Určete vzdálenost přímek v R3
.
p : [1, -1, 0] + t(-1, 2, 3), a q : [2, 5, -1] + t(-1, -2, 1).
Řešení. Vzdálenost je dána jako velikost kolmého průmětu libovolné příčky (spojnice)
daných přímek do ortogonálního doplňku vektorového podprostoru generovaného
jejich zaměřeními. Tento ortogonální doplňek zjistíme například pomocí
vektorového součinu:
(-1, 2, 3), (-1, -2, 1) 
= (-1, 2, 3) × (-1, -2, 1) = (8, -2, 4) = (4, -1, 2) .
Spojnicí daných přímek je například úsečka [1, -1, 0][2, 5, -1], promítneme tedy
vektor [1, -1, 0] - [2, 5, -1] = (-1, -6, 1). Pro vzdálenost přímek pak dostáváme:
(p, q) =
|(-1, -6, 1)  (4, -1, 2)|
(4, -1, 2)
=
4

21
.
Stejně jako vzdálenost, i řada dalších geometrických pojmů jako odchylky, orientace,
objem apod. je v bodových prostorech En zaváděna prostřednictvím vhodných
pojmů ve vektorových euklidovských prostorech. Proto se nyní budeme chvíli
věnovat opět reálným unitárním prostorům. Začneme s diskusí velikosti úhlů. Z
Cauchyovy nerovnosti plyne 0  |uv|
u v  1, má tedy smysl následující definice.
4.15 4.17. Definice. Odchylka (u, v) vektorů u, v  V v reálném vektorovém prostoru
se skalárním součinem je dána vztahem
cos (u, v) =
u  v
u v
, 0  (u, v)  2.
118 4. ANALYTICKÁ GEOMETRIE
Jak jsme viděli, v rovině R2
pro (obvyklou) odchylku vektorů na jednotkové
kružnici u = (1, 0), v = (cos , sin ) skutečně platí cos  = uv
u v . Protože odchylka
je nezávislá na velikostech vektorů, platí stejný vztah i pro vektory u =
(x1, 0), v = (a cos , a sin ). Protože vhodnou rotací dosáhneme toho, že jeden z
dvojice vektorů má tvar (x1, 0), platí náš vztah zcela obecně v rovině. Ve vícerozměrných
prostorech je odchylka dvou vektorů vždy měřena v rovině, kterou tyto
vektory generují (nebo je nula), jistě tedy náš definiční vztah odpovídá zvyklostem
ve všech dimenzích.
V libovolném reálném vektorovém prostoru se skalárním součinem přímo z definic
plyne
u - v 2
= u 2
+ v 2
- 2(u  v) = u 2
+ v 2
- 2 u v cos (u, v).
To je tzv. kosinová věta.
Dále platí pro každou ortonormální bázi e a u  V vztah u 2
= i |u  ei|2
,
tj.
1 =
i
(cos (u, ei))2
,
což je obvyklé tvrzení o směrových kosinech (u, ei) vektoru u.
Z definice odchylek vektorů nyní můžeme dovodit rozumné definice pro obecné
podprostory v každém euklidovském vektorovém prostoru.
4.16 4.18. Definice. Nechť U1, U2 jsou podprostory v euklidovském prostoru V . Odchylka
podprostorů U1, U2 je reálné číslo  = (U1, U2)  [0, 
2 ] splňující:
(1) Je-li dim U1 = dim U2 = 1, U1 = u , U2 = v , pak
cos  =
|u.v|
u v
.
(2) Jsou-li dimenze U1, U2 kladné a U1 U2 = {0}, pak je odchylka minimem všech
odchylek jednorozměrných podprostorů
 = min{( u , v ); 0 = u  U1, 0 = v  U2}.
Ukážeme v zápětí, že takové minimum skutečně vždy existuje.
(3) Je-li U1  U2 nebo U2  U1 (zejména je-li jeden z nich nulový), je  = 0.
(4) Je-li U1  U2 = {0} a U1 = U1  U2 = U2, pak
 = (U1  (U1  U2)
, U2  (U1  U2)
).
Odchylka podprostorů Q1, Q2 v bodovém euklidovském prostoru En se definuje
jako odchylka jejich zaměření Z(Q1), Z(Q2).
Všimněme si, že odchylka je vždy dobře definována, zejména v posledním případě
je
(U1  (U1  U2)
)  (U2  (U1  U2)
) = {0}
můžeme tedy opravdu odchylku určit podle bodu (2). Všimněme si také, že v případě
U1  U2 = {0}, jsou U1 a U2 kolmé podle našich dřívějších definic právě, když
jejich odchylka je /2. Pokud však mají netriviální průnik, nemohou být kolmé v
dřívějším smyslu.
Ke korektosti definice zbývá ukázat, že ve skutečnosti vždy existují vektory
u  U1, v  U2, pro které nabývá výraz pro odchylku požadovaného minima.
Nejdříve speciální případ:
2. EUKLIDOVSKÁ GEOMETRIE 119
4.19. Lemma. Nechť v je vektor v euklidovském prostoru V a U  V libovolný
podprostor. Označme v1  U, v2  U
(jednoznačně určené) komponenty vektoru
v, tj. v = v1 + v2. Pak pro odchylku  podprostoru generovaného v od U platí
cos ( v , U) = cos ( v , v1 ) =
v1
v
.
Důkaz. Pro všechny u  U platí
|u  v|
u v
=
|u  (v1 + v2)|
u v
=
|u  v1|
u v

u v1
u v
=
v1
v
=
v1
2
v v1
=
|v1  v|
v v1
.
Odtud plyne
cos ( v , u )  cos ( v , v1 ) =
v1
v
a protože funkce cos je na intervalu [0, 
2 ] klesající, je tvrzení dokázané.
4.20. Výpočet odchylek. Uvažujme dva podprostory U1, U2 v euklidovském prostoru V ,
U1  U2 = {0} a zvolme pevně ortonormální báze e, a e tak, aby U1 = e1, . . . , ek , U2 =
e1, . . . , el . Nechť  je kolmý průmět na U2, jeho zúžení na U1 budeme opět značit  : U1 
U2. Zobrazení  : U2  U1 nechť vznikne podobně z kolmého průmětu na U1. Tato zobrazení
mají v bazích (e1, . . . , ek) a (e1, . . . , el) matice
A =
0
B
@
e1  e1 . . . ek  e1
...
...
e1  el . . . ek  el
1
C
A , B =
0
B
@
e1  e1 . . . el  e1
...
...
e1  ek . . . el  ek
1
C
A
Zejména platí B = AT
. Složené zobrazení    : U1  U1 má tedy symetrickou matici
AT
A. Viděli jsme, že každé takové zobrazení má pouze nezáporná reálná vlastní čísla a že
má ve vhodné ortonormální bázi diagonální matici s těmito vlastními čísly na diagonále, viz
3.21­3.23.
Nyní můžeme odvodit obecný postup pro výpočet odchylky  = (U1, U2).
Věta. V předchozím označení nechť  je největší vlastní hodnota matice AT
A. Pak
cos2
 = 
Důkaz. Nechť u  U1 je vlastní vektor zobrazení    příslušný největší vlastní
hodnotě , 1, . . . , k nechť jsou všechna vlastní čísla (včetně násobnosti) a nechť u =
(u1, . . . , un) je příslušná ortonormální báze U1 z vlastních vektorů. Můžeme přímo předpokládat,
že  = 1, u = u1. Potřebujeme ukázat, že odchylka libovolného v  U1 od U2
je nejméně tak velká jako odchylka u od U2. Tzn. že kosinus příslušného úhlu nesmí být
větší. Podle předchozího lemmatu stačí diskutovat odchylku u a (u)  U2 a přitom víme,
že u = 1. Zvolme tedy v  U1, v = a1u1 +    + akuk,
Pk
i=1 a2
i = v 2
= 1. Pak
(v) 2
= (v)  (v) =   (v)  v    (v) v =   (v) .
Předchozí lemma navíc dává i vzorec pro odchylku  vektoru v od U2
cos  =
(v)
v
= (v) .
120 4. ANALYTICKÁ GEOMETRIE
Protože jsme zvolili za 1 největší z vlastních hodnot, dostáváme
(cos )2
= (v) 2
   (v) =
v
u
u
t
kX
i=1
(iai)2 =
=
v
u
u
t2
1 +
kX
i=1
a2
i (2
i - 2
1) 
q
2
1.
Při v = u dostáváme ovšem přesně (v) 2
= 2
1 v 2
= 2
a tedy odchylka dosahuje pro
tento vektor minimální možné hodnoty. Tím je věta dokázána.
4.21. Příklady standardních úloh. 1. Najděte vzdálenost bodu A  En od podprostoru
Q  En:
Viz. věta 4.15.
2. V E2 veďte bodem A přímku q svírající s danou přímkou p daný úhel:
Najdeme vektor u  R2
ležící v zaměření přímky q a zvolíme vektor v mající
od u zadanou odchylku. Hledaná přímka je dána bodem A a zaměřením v . Úloha
má dvě nebo jedno řešení.
3. Spočtěte patu kolmice vedené bodem na danou přímku:
Viz. důkaz předposledního bodu věty 4.15.
4. V E3 určete vzdálenost dvou přímek p, q: Zvolíme libovolně jeden bod z
každé přímky, A  p, B  q. Komponenta vektoru A - B v ortogonálním doplňku
(Z(p) + Z(q))
má velikost rovnu vzdálenosti p a q.
5. V E3 najděte osu dvou mimoběžek p a q:
Nechť  je rovina generovaná jedním bodem A  p a součtem Z(p) + (Z(p) +
Z(q))
. Pak průnik   q spolu se zaměřením (Z(p) + Z(q))
dávají parametrický
popis hledané osy. (Prověřte, kolik má úloha obecně řešení!)
4.22. Příklad. Najděte průnik kolmé roviny spuštěné z bodu A = [1, 2, 3, 4]  R4
na rovinu
: [1, 0, 1, 0] + (1, 2, -1, -2)s + (1, 0, 0, 1)t, s, t  R.
Řešení. Nalezněme nejprve kolmou rovinu k . Její zaměření bude kolmé na zaměření
, pro vektory (a, b, c, d) patřící do jejího zaměření dostáváme tedy soustavu
rovnic
(a, b, c, d)  (1, 2, -1, -2) = 0  a + 2b - c - 2d = 0
(a, b, c, d)  (1, 0, 0, 1) = 0  a + d = 0.
Jejím řešením je dvojdimenzionální vektorový prostor (0, 1, 2, 0), (-1, 0, -3, 1) .
Rovina  kolmá k rovině procházející bodem A má tedy parametrické vyjádření
 : [1, 2, 3, 4] + (0, 1, 2, 0)u + (-1, 0, -3, 1)v, u, v  R.
Průnik rovin potom můžeme získat pomocí obou parametrických vyjádření. Pro
parametry popisující průnik tedy dostáváme soustavu rovnic:
1 + s + t = 1 - v
2s = 2 + u
1 - s = 3 + 2u - 3v
-2s + t = 4 + v,
2. EUKLIDOVSKÁ GEOMETRIE 121
která má jediné řešení (musí tomu tak být, protože sloupce matice soustavy jsou
dány lineárně nezávislými vektory zaměření obou rovin) s = -8/19, t = 34/19,
u = -54/19, v = -26/19. Dosazením hodnot parametrů s a t do parametrického
vyjádření roviny pak dostaneme souřadnice průniku [45/19, -16/19, 11/19, 18/19]
(stejný výsledek pochopitelně obdržíme, dosadíme-li hodnoty parametrů u a v do
parametrického vyjádření roviny ).
4.23. Příklad. Bodem [1, 2]  R2
veďte přímku, která má odchylku 30
od přímky
p : [0, 1] + t(1, 1).
Řešení. Odchylka dvou přímek je dána úhlem, který svírají jejich směrové vektory.
Stačí tedy najít směrový vektor v hledané přímky. Ten získáme například rotací
směrového vektoru přímky p o 30
. Matice rotace o 30
je
cos 30
- sin 30
sin 30
cos 30 =

3
2 -1
2
1
2

3
2
.
Hledaný vektor v je tedy
v =

3
2 -1
2
1
2

3
2
1
1
=

3
2 - 1
2
3
2 + 1
2
.
Rotovat jsme mohli i v opačném smyslu. Hledaná přímka (jedna ze dvou možných)
má tedy parametrické vyjádření
[1, 2] + (

3
2
-
1
2
,

3
2
+
1
2
)t.
4.24. Příklad.
4.24.1. Určete cos , kde  je odchylka dvou sousedních stěn pravidelného osmistěnu
(těleso, jehož stěny tvoří osm rovnostranných trojúhelníků).
Řešení. Odchylky libovolných dvou sousedních stěn jsou ze symetrie osmistěnu
shodné. Rovněž tak nezáleží na jeho velikosti. Uvažujme osmistěn s délkou hrany 1,
který je umístěn do standardní kartézské souřadné soustavy v R3
tak, že jeho těžiště
je v bodě [0, 0, 0]. Jeho vrcholy jsou pak v bodech A = [

2
2 , 0, 0], B = [0,

2
2 , 0],
C = [-

2
2 , 0, 0], D = [0, -

2
2 , 0], E = [0, 0, -

2
2 ] a F = [0, 0,

2
2 ].
Určeme odchylku stěn CDF a BCF. Ta je dána odchylkou vektorů kolmých
na jejich průnik a ležících v daných stěnách, tedy vekorů kolmých na CF. Těmi
jsou vektory dané výškami z bodů D, resp. F na stranu CF v trojúhelnících CDF,
resp. BCF. Výšky v rovostranném trojúhelníku splývají s těžnicemi, jedná se tedy
o úsečky SD a SB, kde S je střed strany CF. Protože známe souřadnice bodů C a
F, má bod S souřadnice [-

2
4 , 0,

2
4 ] a pro vektory máme SD = (

2
4 , -

2
2 , -

2
4 )
a SB = (

2
4 ,

2
2 , -

2
4 ). Celkem
cos  =
(

2
4 , -

2
2 , -

2
4 )  (

2
4 ,

2
2 , -

2
4 )
(

2
4 , -

2
2 , -

2
4 ) (

2
4 ,

2
2 , -

2
4 )
= -
1
3
.
Je tedy 
.
= 132
.
122 4. ANALYTICKÁ GEOMETRIE
4.21
4.25. Počítání objemu. Orientovaný (bodový) euklidovský prostor je euklidovský
bodový prostor, jehož zaměření je orientované. V dalším budeme uvažovat
standardní En spolu s orientací zadanou standardní bazí Rn
.
Nechť u1, . . . , uk, jsou libovolné vektory v zaměření Rn
, A  En je libovolný
bod. Rovnoběžnostěn Pk(A; u1, . . . , uk)  En jsme definovali jako množinu
Pk(A; u1, . . . , uk) = {A + c1u1 +    + ckuk; 0  ci  1, i = 1, . . . , k}.
Jsou-li vektory u1, . . . , uk nezávislé, hovořili jsme o k­rozměrném rovnoběžnostěnu
Pk(A; u1 . . . , uk)  En. Pro dané vektory u1, . . . , uk máme k dispozici také rovnoběžnostěny
menších dimenzí
P1(A; u1), . . . , Pk(A; u1, . . . , uk)
v euklidovských podprostorech A + u1 , . . . , A + u1, . . . , uk .
Jsou-li u1, . . . , uk lineárně závislé definujeme objem Vol Pk = 0. Pro nezávislé
vektory pak platí u1, . . . , uk = u1, . . . , uk-1  ( u1, . . . , uk-1

 u1, . . . , uk ).
Navíc v tomto rozkladu se uk jednoznačně vyjádří jako
uk = uk + ek, kde ek  u1, . . . , uk-1 .
Absolutní hodnotu objemu definujeme induktivně:
| Vol |P1(A; u1) = u1
| Vol |Pk(A; u1, . . . , uk) = ek | Vol |P(A; u1, . . . , uk-1).
Je-li u1, . . . , un báze kompatibilní s orientací V , definujeme (orientovaný) objem
rovnoběžnostěnu Vol Pk(A; u1, . . . , un) = | Vol |Pk(A; u1, . . . , un), v opačném případě
klademe Vol Pk(A; u1, . . . , un) = -| Vol |Pk(A; u1, . . . , un).
Věta. Nechť Q  En je euklidovský podprostor a nechť (e1, . . . , ek) je jeho ortonormální
báze. Pak pro libovolné vektory u1, . . . , uk  Z(Q) a A  Q platí
(1) Vol Pk(A; u1, . . . , uk) = det


u1  e1 . . . uk  e1
...
...
u1  ek . . . uk  ek


(2) (Vol Pk(A; u1, . . . , uk))2
= det


u1  u1 . . . uk  u1
...
...
u1  uk . . . uk  uk


Důkaz. Matice
A =
0
B
@
u1  e1 . . . uk  e1
...
...
u1  ek . . . uk  ek
1
C
A
má ve sloupcích souřadnice vektorů u1, . . . , uk ve zvolené ortonormální bázi. Platí
|A|2
= |A||A| = |AT
||A| = |AT
A| = det
0
B
@
u1  u1 . . . uk  u1
...
...
u1  uk . . . uk  uk
1
C
A .
Přímo z definice je neorientovaný objem roven součinu v1 v2 . . . vk , kde v1 = u1,
v2 = u2 + a2
1v1, . . . , vk = uk + ak
1 v1 +    + ak
k-1vk-1 je výsledek Grammova-Schmidtova
2. EUKLIDOVSKÁ GEOMETRIE 123
ortogonalizačního procesu. Je tedy
(Vol Pk(A; u1, . . . , uk))2
= det
0
B
@
v1  v1 . . . vk  v1
...
...
v1  vk . . . vk  vk
1
C
A
= det
0
B
@
v1  v1 0 . . . 0
...
...
0 0 . . . vk  vk
1
C
A .
Označme B matici jejíž sloupce jsou souřadnice vektorů v1, . . . , vk v bázi e. Protože v1, . . . , vk
vznikly z u1, . . . , uk jako obrazy v lineární transformaci s horní trojúhelníkovou maticí C s
jedničkami na diagonále, je B = CA a |B| = |C||A| = |A|. Pak ovšem |A|2
= |B|2
=
|A||A|, proto Vol Pk(A; u1, . . . , uk) = |A|. Přitom pokud jsou vektory u1, . . . , uk závislé
vyjde objem nulový, pokud jsou nezávislé, pak znaménko determinantu je kladné právě když
je báze u1, . . . , uk kompatibilní s orientací danou bazí e.
Determinant
det


u1  u1 . . . uk  u1
...
...
u1  uk . . . uk  uk


se nazývá Grammův determinant k­tice vektorů u1, . . . , uk. V geometrické formulaci
dostáváme jako velice důžitý důsledek následující tvrzení:
4.26. Důsledek. Pro každé lineární zobrazení  : V  V euklidovského vektorového
prostoru V je det  roven (orientovanému) objemu obrazu rovnoběžnostěnu
určeného vektory ortonormální báze. Obecněji, obraz rovnoběžnostěnu P určeného
libovolnými dim V vektory má objem roven det ­násobku původního objemu.
4.27. Příklad. Jsou dány vektory u = (u1, u2, u3) a v = (v1, v2, v3). Doplňte je
třetím jednotkovým vektorem tak, aby rovnoběžnostěn daný těmito třemi vektory
měl co největší objem.
Řešení. Označme hledaný jednotkový vektor jako t = (t1, t2, t3). Podle Tvrzení ??
je objem rovnoběžnostěnu P3(0; u, v, t) dán jako abolutní hodnota determinantu
u1 v1 t1
u2 v2 t2
u3 v3 t3
=
t1 t2 t3
u1 u2 u3
v1 v2 v3
= t  (u × v)  t u × v = u × v .
Použité znaménko nerovnosti vyplývá z Cauchyovy nerovnosti, přičemž víme, že
rovnost nastává právě pro t = c(u × v), c  R. Velikost objemu hledaného rovnoběžnostěnu
tedy může být maximálne rovna velikosti obsahu rovnoběžníka daného
vektory u, v (tj. velikosti vektoru (u × v)). Rovnost nastane právě když
t = 
(u × v)
(u × v)
.
124 4. ANALYTICKÁ GEOMETRIE
4.28. Vnější a vektorový součin vektorů. Předchozí úvahy úzce souvisí s tzv.
vnějším tensorovým součinem vektorů. Nepůjdeme do této technicky poněkud nepřehledné
oblasti, ale zmíníme alespoňpřípad vnějšího součinu n = dim V vektorů
u1, . . . , un  V .
Nechť (u1j, . . . , unj) jsou souřadná vyjádření vektorů uj v nějaké pevně zvolené
ortonormální bázi V a M nechť je matice s prvky (uij). Pak determinant |M| nezávisí
na volbě báze a jeho hodnotu nazýváme vnějším součinem vektorů u1, . . . , un
a značíme [u1, . . . , un]. Viz 4.25.
Přímo z definice nyní vyplývají užitečné vlastnosti vnějšího součinu
(1) Zobrazení (u1, . . . , un)  [u1, . . . , un] je antisymetrické n­lineární zobrazení.
Tzn., že je lineární ve všech argumentech a výměna dvou argumentů se vždy
projeví změnou znaménka výsledku.
(2) Vnější součin je nulový právě, když jsou vektory u1, . . . , un lineárně závislé
(3) Vektory u1, . . . , un tvoří kladnou bázi právě, když je jejich vnější součin kladný.
V R3 patrně již známe další významnou operaci, tzv. vektorový součin, který
dvojici vektorů přiřazuje vektor třetí. Uvažme obecný euklidovský vektorový prostor
V dimenze n  2 a vektory u1, . . . , un-1  V . Vektor v  V nazveme vektorový
součin vektorů u1, . . . , un-1, jestliže pro každý vektor w  V platí
v, w = [u1, . . . , un-1, w].
Značíme v = u1 × . . . un-1.
V ortonormálních souřadnicích, kde v = (y1, . . . , yn)T
, w = (x1, . . . , xn)T
a
uj = (u1j, . . . unj)T
, předchozí vztah znamená
y1x1 +    + ynxn =
u11 . . . u1(n-1) x1
...
...
...
un1 . . . un(n-1) xn
Odtud vyplývá, že vektor v je tímto vztahem zadán jednoznačně a jeho souřadnice
spočteme formálním rozvojem tohoto determinantu podle posledního sloupce.
Věta. Pro vektorový součin v = u1 × . . . × un-1 platí
(1) v  u1, . . . , un-1

(2) v je nenulový vektor právě, když jsou vektory u1, . . . , un-1 lineárně nezávislé
(3) velikost v vektorového součinu je rovna absolutní hodnotě objemu rovnoběžníku
P(0; u1, . . . , un-1)
(4) (u1, . . . , un-1, v) je kladná báze orientovaného euklidovského prostoru V
Důkaz. První tvrzení plyne přímo z definičního vztahu pro v, protože dosazením
libovolného vektoru uj za w máme nalevo skalární součin v  uj a napravo
determinant s dvěma shodnými sloupci.
Hodnost matice s n - 1 sloupci uj je dána maximální velikostí nenulového
minoru. Minory, které zadávají souřadnice vektorového součinu jsou stupně n - 1
a tím je dokázáno tvrzení (2).
Jsou-li vektory u1, . . . , un-1 závislé, pak platí i (3). Nechť jsou tedy nezávislé, v
je jejich vektorový součin a zvolme libovolnou ortonormální bázi (e1, . . . , en-1) prostoru
u1, . . . , un-1 . Z již dokázáného vyplývá, že existuje nějaký násobek (1/)v,
0 =   R, takový, že (e1, . . . , ek, (1/)v) je ortonormální báze celého V . Souřadnice
našich vektorů v této bázi jsou
uj = (u1j, . . . , u(n-1)j, 0)T
, v = (0, . . . , 0, )T
.
2. EUKLIDOVSKÁ GEOMETRIE 125
Proto je vnější součin [u1, . . . , un-1, v] roven (viz. definice vektorového součinu)
[u1, . . . , un-1, v] =
u11 . . . u1(n-1) 0
...
...
...
u(n-1)1 . . . u(n-1)(n-1) 0
0 . . . 0 
= v, v = 2
.
Rozvojem determinantu podle posledního sloupce zároveň obdržíme
2
=  Vol P(0; u1, . . . , in-1).
Odtud už vyplývají obě zbylá tvrzení věty.
4.29. Kvadratické formy. Závěrem zmíníme ještě pár poznámek o objektech v
En zadaných kvadratickými rovnicemi, hovoříme o kvadrikách. Zvolme v En pevně
kartézskou souřadnou soustavu (tj. bod a ortonormální bázi zaměření) a uvažme
obecnou kvadratickou rovnici pro souřadnice (x1, . . . , xn) bodů A  En
n
i,j=1
aijxixj +
n
i=1
2aixi + a = 0, aij = aji.
Můžeme ji zapsat jako f(u) + g(u) + a = 0 pro kvadratickou formu f (tj. zúžení
symetrické bilineární formy F na dvojice stejných argumentů), lineární formu g a
skalár a  R a předpokládáme že hodnost f je nenulová (jinak by se jednalo o
lineární rovnici popisující euklidovský podprostor).
Začněme s kvadratickou částí, tj. bilineární symetrickou formou f : Rn
×Rn

R. Stejně dobře můžeme přemýšlet o obecné symetrické bilineární formě na libovolném
vektorovém prostoru. Pro libovolnou bázi na tomto vektorovém prostoru bude
hodnota f(x) na vektoru x = x1e1 +    + xnen dána vztahem
f(x) = F(x, x) =
i,j
xixjF(ei, ej) = xT
 A  x
kde A = (aij) je symetrická matice s prvky aij = F(ei, ej). Takovýmto zobrazením
f říkáme kvadratické formy a výše uvedená formula pro hodnotu formy s použitím
zvolených souřadnic se nazývá analytický tvar formy. Jestliže změníme bázi ei na
jinou bázi e1, . . . , en, dostaneme pro stejný vektor jiné souřadnice x = S  x a tedy
f(x) = (S  x )T
 A  (S  x ) = (x )T
 (ST
 A  S)  x .
Předpokládejme opět, že je na našem vektorovém prostoru zadán skalární součin.
Předchozí výpočet pak můžeme shrnout slovy, že matice bilineární formy F a tedy
i kvadratické formy f se transformuje při změně souřadnic způsobem, který pro ortogonální
změny souřadnic splývá s transformací matic zobrazení (skutečně, pak je
S-1
= ST
). Tento výsledek můžeme intepretovat také jako následující pozorování:
Tvrzení. Nechť V je reálný vektorový prostor se skalárním součinem. Pak vztah
  F, F(u, u) = (u), u
zadává bijekci mezi symetrickými lineárními zobrazeními a kvadratickými formami
na V .
126 4. ANALYTICKÁ GEOMETRIE
4.30. Euklidovská klasifikace kvadrik. Z poslední věty vyplývá okamžitý důsledek,
že pro každou kvadratickou formu f existuje ortonormální báze zaměření,
ve které má f diagonální matici (a diagonální hodnoty jsou jednoznačně určeny až
na pořadí). Předpokládejme tedy přímo rovnici ve tvaru
n
i=1
ix2
i +
n
i=1
bixi + b = 0.
V dalším kroku pro souřadnice xi s i = 0 provedeme doplnění do čtverců, které
,,pohltí kvadráty i lineární členy týchž neznámých (tzv. Lagrangeův algoritmus,
viz poznámka níže) Tak nám zůstanou nejvýše ty neznámé, pro které byl jejich
koeficient u kvadrátu nulový, a získáme tvar
n
i=1
i(xi - pi)2
+
n
j splňující j = 0
bjxj + c = 0.
Pokud nám opravdu zůstaly nějaké lineární členy, můžeme zvolit novou bázi zaměření
tak, aby odpovídající lineární forma byla prvkem duální báze a novou volbou
počátku v En pak dosáhneme výsledného tvaru
k
i=1
iy2
i + byk+1 + c = 0,
kde k je hodnost kvadratické formy f, lineární člen se může (ale nemusí) objevit
jen pokud je hodnost f menší než n, c  R může být nenulové pouze když je b = 0.
4.31. Případ E2. Proveďme celou diskusi ještě jednou pro nejjednodušší případ
netriviální dimenze. Původní rovnice má tvar
a11x2
+ a22y2
+ 2a12xy + a1x + a2y + a = 0.
Volbou vhodné báze zaměření a následným doplněním čtverců dosáhneme tvaru
(opět používáme stejného značení x, y pro nové souřadnice):
a11x2
+ a22y2
+ a1x + a2y + a = 0
kde ai může být nenulové pouze v případě, že aii je nulové. Posledním krokem
obecného postupu, tj. v dimenzi n = 2 jen případnou volbou posunutí, dosáhneme
právě jedné z rovnic:
0 = x2
/a2
+ y2
/b2
+ 1 prázdná množina
0 = x2
/a2
+ y2
/b2
- 1 elipsa
0 = x2
/a2
- y2
/b2
- 1 hyperbola
0 = x2
/a2
- 2py parabola
0 = x2
/a2
+ y2
/b2
bod
0 = x2
/a2
- y2
/b2
2 různoběžné přímky
0 = x2
- a2
2 rovnoběžné přímky
0 = x2
2 splývající přímky
0 = x2
+ a2
prázdná množina
2. EUKLIDOVSKÁ GEOMETRIE 127
4.32. Afinní pohled. V předchozích dvou odstavcích jsme hledali podstatné vlastnosti
a standardizované analytické popisy objektů zadávaných v euklidovských prostorech
kvadratickými rovnicemi. Hledali jsme přitom co nejjednodušší rovnice v
mezích daných volností výběru kartézských souřadnic. Geometrická formulace našeho
výsledku pak může být taková, že pro dva různé objekty ­ kvadriky, zadané
v obecně různých kartézských souřadnicích, existuje euklidovská transformace na
En (tj. afinní bijektivní zobrazení zachovávající velikosti) tehdy a jen tehdy, pokud
výše uvedený algoritmus vede na stejný analytický tvar, až na pořadí souřadnic.
Pochopitelně se můžeme ptát, do jaké míry umíme podobnou věc v afinních
prostorech, tj. s volností výběru jakékoliv afinní souřadné soustavy. Např. v rovině
to bude znamenat, že neumíme rozlišit kružnici od elipsy, samozřejmě bychom ale
měli odlišit hyperbolu a všechny ostatní typy kuželoseček. Hlavně ale splynou mezi
sebou všechny hyperboly atd.
Ukážeme si hlavní rozdíl postupu na kvadratických formách a k záležitosti se
pak ještě vrátíme níže.
Uvažme nějakou kvadratickou formu f na vektorovém prostoru V a její analytické
vyjádření f(u) = xT
Ax vzhledem ke zvolené bázi na V . Pro vektor u =
x1u1 +    + xnun pak také zapisujeme formu f ve tvaru
f(x1, n) =
ij
aijxixj,
V předchozích odstavcích jsme již s využitím skalárního součinu ukázali, že pro
vhodnou bázi bude matice A diagonální, tj. že pro příslušnou symetrickou formu
F bude platit F(ui, uj) = 0 při i = j. Každou takovou bázi nazýváme polární báze
kvadratické formy f. Samozřejmě si pro takový účel můžeme vždy skalární součin
vybrat. Dokážeme si ale toto tvrzení znovu bez využití skalárních součinů tak, že
získáme daleko jednodušší algoritmus na to, jak takovou polární bázi najít mezi
všemi bazemi. Tím se zároveň dovíme podstatné informace o afinních vlastnostech
kvadratických forem. Nasledující věta bývá v literatuře uváděna pod názvem
Lagrangeův algoritmus.
Věta. Nechť V je reálný vektorový prostor dimenze n, f : V  R kvadratická
forma. Pak na V existuje polární báze pro f.
Důkaz. (1) Nechť A je matice f v bázi u = (u1, . . . , un) na V a předpokládejme
a11 = 0. Pak můžeme psát
f(x1, . . . , xn) = a11x2
1 + 2a12x1x2 +    + a22x2
2 + . . .
= a-1
11 (a11x1 + a12x2 +    + a1nxn)2
+ členy neobsahující x1
Provedeme tedy transformaci souřadnic (tj. změnu báze) tak, aby v nových souřadnicích
bylo
x1 = a11x1 + a12x2 +    + a1nxn, x2 = x2, . . . , xn = xn.
To odpovídá nové bázi (spočtěte si jako cvičení příslušnou matici přechodu!)
v1 = a-1
11 u1, v2 = u2 - a-1
11 a12u1, . . . , vn = un - a-1
11 a1nu1
a tak jak lze očekávat, v nové bázi bude příslušná symetrická bilinerání forma splňovat
g(v1, vi) = 0 pro všechny i > 0 (přepočtěte!). Má tedy f v nových souřadnicích
analytický tvar a-1
11 x1
2
+ h, kde h je kvadratická forma nezávislá na proměnné x1.
128 4. ANALYTICKÁ GEOMETRIE
Z technických důvodů bývá lepší zvolit v nové bázi v1 = u1, opět dostaneme
výraz f = f1 + h, kde f1 závisí pouze na x1, zatímco v h se x1 nevyskytuje. Přitom
pak g(v1, v1) = a11.
(2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu
o jedničku menšího) s koeficientem u x2
2
různým od nuly. Pak můžeme zopakovat
přesně stejný postup a získáme vyjádření f = f1 + f2 + h, kde v h vystupují pouze
proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buď
provedeme n-1 kroků a získáme diagonální tvar, nebo v řekněme i-tém kroku bude
prvek aii dosud získané matice nulový.
(3) Nastane-li poslední možnost, ale přitom existuje jiný prvek ajj = 0 s j > i,
pak stačí přehodit i-tý prvek báze s j-tým a pokračovat podle předešlého postupu.
(4) Předpokládejme, že jsme narazili na situaci ajj = 0 pro všechny j  i.
Pokud přitom neexistuje ani žádný jiný prvek ajk = 0 s j  i, k  i, pak jsme již
úplně hotovi neboť jsme již dosáhli diagonální matici. Předpokládejme, že ajk = 0.
Použijeme pak transformaci vj = uj + uk, ostatní vektory báze ponecháme (tj.
xk = xk -xj, ostatní zůstávají). Pak h(vj, vj) = h(uj, uj)+h(uk, uk)+2h(uk, uj) =
2ajk = 0 a můžeme pokračovat podle postupu v (1).
4.33. Příklad. Nechť f : R3
 R, f(x1, x2, x3) = 3x2
1 + 2x1x2 + x2
2 + 4x2x3 + 6x2
3.
Její matice je
A =


3 1 0
1 1 2
0 2 6

 .
Podle bodu (1) algoritmu provedeme úpravy
f(x1, x2, x3) =
1
3
(3x1 + x2)2
+
2
3
x2
2 + 4x2x3 + 6x2
3
=
1
3
y2
1 +
3
2
(
2
3
y2 + 2y3)2
=
1
3
z2
1 +
3
2
z2
2
a vidíme, že forma má hodnost 2 a matice přechodu do příslušné polární báze w se
získá posbíráním provedených transformací:
z3 = y3 = x3, z2 =
2
3
y2 + 2y3 =
2
3
x2 + 2x3, z1 = y1 = 3x1 + x2
Pokud by ale např. f(x1, x2, x3) = 2x1x3 + x2
2, tj. matice je
A =


0 0 1
0 1 0
1 0 0

 ,
pak hned v prvním kroku můžeme přehodit proměnné: y1 = x2, y2 = x1, y3 = x3.
Aplikace kroku (1) je pak triviální (nejsou tu žádné společné členy), pro další krok
ale nastane situace z bodu (4). Zavedeme tedy transformaci z1 = y1, z2 = y2,
z3 = y3 - y2. Pak
f(x1, x2, x3) = z2
1 + 2z2(z3 + z2) = z2
1 +
1
2
(2z2 + z3)2
-
1
2
z2
3.
Matici přechodu do příslušné polární báze opět dostaneme posbíráním jednotlivých
transformací (tj. vynásobením jednotlivých dílčích matic přechodu).
2. EUKLIDOVSKÁ GEOMETRIE 129
4.34. Afinní klasifikace kvadratických forem. Po výpočtu polární báze Lagrangeovým
algoritmem můžeme ještě vylepšit bázové vektory pomocí násobení skalárem
tak, aby v příslušném analytickém vyjádření naší formy vystupovaly v roli
koeficientů u kvadrátů jednotlivých souřadnic pouze skaláry 1, -1 a 0. Následující
věta o setrvačnosti říká navíc, že počet jedniček a mínus jedniček nezávisí na našich
volbách v průběhu algoritmu. Tyto počty nyzýváme signaturou kvadratické formy.
Opět tedy dostáváme úplný popis kvadratických forem ve smyslu, že dvě takové
formy jsou převoditelná jedna na druhou pomocí afinní transformace tehdy a jen
tehdy, když mají stejnou signaturu.
Věta. Pro každou nenulovou kvadratickou formu hodnosti r na reálném vektorovém
prostoru V existuje celé číslo 0  p  r a r nezávislých lineárních forem
1, . . . , r  V 
takových, že
f(u) = (1(u))2
+    + (p(u))2
- (p+1(u))2
-    - (r(u))2
.
Jinak řečeno, existuje polární báze, ve které má f analytické vyjádření
f(x1, . . . , xn) = x2
1 +    + x2
p - x2
p+1 -    - x2
r.
Počet p kladných diagonálních koeficientů v matici dané kvadratické formy nezávisí
na volbě polární báze.
Dvě symetrické matice A, B dimenze n jsou maticemi téže kvadratické formy
v různých bazích právě, když mají stejnou hodnost a když matice příslušných forem
v polární bázi mají stejný počet kladných koeficientů.
Důkaz. Lagrangeovým algoritmem obdržíme f(x1, . . . , xn) = 1x2
1 +    +
rx2
r, i = 0, v jisté bázi na V . Předpokládejme navíc, že právě prvních p koeficientů
i je kladných. Pak transformace y1 =

1x1, . . . , yp = pxp, yp+1 =
-p+1xp+1, . . . , yr =

-rxr, yr+1 = xr+1, . . . , yn = xn již vede na požadovaný
tvar. Formy i pak jsou právě formy z duální báze ve V 
k získané polární bázi.
Musíme ale ještě ukázat, že p nezávisí na našem postupu. Přepokládejme, že se nám
podařilo najít vyjádření téže formy f v polárních bazích u, v, tj.
f(x1, . . . , xn) = x2
1 +    + x2
p - x2
p+1 -    - x2
r
f(y1, . . . , yn) = y2
1 +    + y2
q - y2
q+1 -    - y2
r
a označme podprostor generovaný prvními p vektory prvé báze P = u1, . . . , up , a
obdobně Q = vq+1, . . . , vn . Pak pro každý u  P je f(u) > 0 zatímco pro v  Q
je f(v)  0. Nutně tedy platí P Q = {0} a proto dim P +dim Q  n. Odtud plyne
p + (n - q)  n, tj. p  q. Opačnou volbou podprostorů však získáme i q  p.
Je tedy p nezávislé na volbě polární báze. Pak ovšem pro dvě matice se stejnou
hodností a stejným počtem kladných koeficientů v diagonálním tvaru příslušné
kvadratické formy získáme stejný analytický tvar.
Při diskusi symetrických zobrazení jsme hovořili o definitních a semidefitních
zobrazeních. Tatáž diskuse má jasný smysl i pro symetrické bilineární formy a kvadratické
formy. Kvadratickou formu f forma na reálném vektorovém prostoru V
nazýváme
(1) positivně definitní, je-li f(u) > 0 pro všechny u = 0
(2) positivně semidefinitní, je-li f(u)  0 pro všechny u  V
(3) negativně definitní, je-li f(u) < 0 pro všechny u = 0
(4) negativně semidefinitní, je-li f(u)  0 pro všechny u  V
130 4. ANALYTICKÁ GEOMETRIE
(5) indefinitní, je-li f(u) > 0 a f(v) < 0 pro vhodné u, v  V .
Stejné názvy používáme i pro symetrické reálné matice, jsou-li maticemi patřičných
kvadratických forem. Signaturou symetrické matice pak rozumíme signaturu
příslušné kvadratické formy.
3. Projektivní geometrie
V mnoha elementárních textech o analytické geometrii autoři končí afinními
a euklidovskými objekty popsanými výše. Na mnoho praktických úloh euklidovská
nebo afinní geometrie stačí, na jiné bohužel ale nikoliv.
Tak třeba při zpracovávání obrazu z kamery nejsou zachovávány úhly a rovnoběžné
přímky se mohou (ale nemusí) protínat. Dalším dobrým důvodem pro hledání
širšího rámce geometrických úloh a úvah je požadovaná robustnost a jednoduchost
numerických operací. Daleko jednodušší jsou totiž operace prováděné prostým násobením
matic a velice těžko se totiž od sebe odlišují malinké úhly od nulových,
proto je lepší mít nástroje, které takové odlišení nevyžadují.
Základní ideou projektivní geometrie je rozšíření afinních prostorů o body v
nekonečnu způsobem, který bude dobře umožňovat manipulace s lineárními objekty
typu bodů, přímek, rovin, projekcí, apod.
4.35. Projektivní rozšíření afinní roviny. Začneme tím nejjednodušším zajímavým
případem, geometrií v rovině. Jestliže si body roviny A2 představíme
jako rovinu z = 1 v R3
, pak každý bod P naší afinní roviny představuje vektor
u = (x, y, 1)  R3
a tím i jednorozměrný podprostor u  R3
. Naopak, skoro
každý podprostor v R3
protíná naši rovinu v právě jednom bodě P a jednotlivé
vektory takového podprostoru jsou dány souřadnicemi (x, y, z) jednoznačně, až na
společný skalární násobek. Žádný průnik s naší rovinou nebudou mít pouze podprostory
s body o souřadnicích (x, y, 0).
Projektivní rovina P2 je množina všech jednorozměrných podprostorů v R3
.
Homogenní souřadnice bodu P = (x : y : z) v projektivní rovině jsou trojice
reálných čísel určené až na společný skalární násobek a alespoň jedno z nich musí být
nenulové. Přímka v projektivní rovině je definována jako množina jednorozměrných
podprostorů (tj. bodů v P2)
Příklad. V afinním prostoru R2
uvažujme dvě přímky L1 : y - x - 1 = 0 a
L2 : y - x + 1 = 0.
Jestliže budeme body přímek L1 a L2 chápat jako konečné body v projektivním
prostoru P2, budou zjevně jejich homogenní souřadnice (x : y : z) splňovat rovnice
L1 : y - x - z = 0, L2 : y - x + z = 0.
Podívejme se, jak budou rovnice těchto přímek vypadat v souřadnicích v afinní rovině,
která bude dána jako y = 1. Za tím účelem stačí dosadit y = 1 do předchozích
rovnic:
L1 : 1 - x - z = 0, L2 : 1 - x + z = 0
Nyní jsou ,,nekonečné body naší původní afinní roviny dány vztahem z = 0 a
vidíme, že naše přímky L1 a L2 se protínají v bodě (1, 1, 0). To odpovídá geometrické
představě, že rovnoběžné přímky L1, L2 v afinní rovině se protínají v nekonečnu (a
to v bodě (1 : 1 : 0)).
3. PROJEKTIVNÍ GEOMETRIE 131
4.36. Projektivní prostory a transformace. Postup z roviny se přirozeným
způsobem zobecňuje na každou konečnou dimenzi. Volbou libovolné afinní nadroviny
An ve vektorovém prostoru Rn+1
, která neprochází počátkem, můžeme ztotožnit
body P  An s jednorozměrnými podprostory, které tyto generují. Zbylé
jednorozměrné podprostory vyplní rovinu rovnoběžnou s An a říkáme jim ,,nekonečné
body v projektivním rozšíření Pn afinní roviny An. Zjevně je vždy množina
nekonečných bodů v Pn projektivním prostorem dimenze o jedničku nižším. Abstraktněji
hovoříme o projektivizaci vektorového prostoru: pro libovolný vektorový
prostor V dimenze n + 1 definujeme
P(V ) = {P  V ; P je jednorozměrný vektorový podprostor}.
Volbou libovolné báze u ve V dostáváme tzv. homogenní souřadnice na P(V ) tak, že
pro P  P(V ) použijeme jeho libovolný nenulový vektor u  V a souřadnice tohoto
vektoru v bázi u. Afinní přímka má tedy ve svém projektivním rozšíření pouze
jediný bod (oba konce se ,,potkají v nekonečnu a projektivní přímka vypadá jako
kružnice), projektivní rovina má projektivní přímku nekonečných bodů atd.
Při zvolených homogenních souřadnicích je možné jednu z jejich hodnot zafixovat
na jedničku (tj. vyloučíme všechny body projektivního prostoru s touto souřadnicí
nulovou) a získáme tak vložení n­rozměrného afinního prostoru An  P(V ). To
je přesně konstrukce, kterou jsme použili v opačném směru v příkladu projektivní
roviny.
Každé prosté lineární zobrazení  : V1  V2 mezi vektorovými prostory samozřejmě
zobrazuje jednorozměrné podprostory na jednorozměrné podprostory. Tím
vzniká zobrazení na projektivizacích T : P(V1)  P(V2). Takovým zobrazením říkáme
projektivní zobrazení. Jinak řečeno, projektivní zobrazení je takové zobrazení
mezi projektivními prostory, že v každé soustavě homogenních souřadnic na definičním
oboru i obrazu je toto zobrazení zadáno násobením vhodnou maticí. Obecněji,
pokud naše pomocné lineární zobrazení není prosté, definuje projektivní zobrazení
pouze mimo svoje jádro, tj. na bodech, jejichž homogenní souřadnice se nezobrazují
na nulu.
4.37. Perspektivní projekce. Velmi dobře jsou výhody projektivní geometrie
vidět na perspektivní projekci R3
 R2
. Bod (X, Y, Z) ,,reálného světa se promítá
na bod (x, y) na průmětně takto:
x = -f
X
Z
, y = -f
Y
Z
.
To je nejen nelineární formule, ale navíc při Z malém bude velice problematická
přesnost výpočtů.
Při rozšíření této transformace na zobrazení P3  P2 dostáváme zobrazení
(X : Y : Z : W)  (x : y : z) = (-fX : -fY : Z), tj. popsané prostou lineární
formulí


x
y
z

 =


-f 0 0 0
0 -f 0 0
0 0 1 0

 
X
Y
Z
W


Tento jednoduchý výraz zadává perspektivní projekci pro všechny konečné body
v R3
 P3, které dosazujeme jako výrazy s W = 1. Navíc jsme odstranili problémy
132 4. ANALYTICKÁ GEOMETRIE
s body, jejichž obraz leží v nekonečnu. Skutečně, je­li Z-ová souřadnice skutečného
bodu scény blízká nule, bude hodnota třetí homogenní souřadnice obrazu mít
souřadnici blízkou nule, tj. bude představovat bod blízký nekonečnu.
4.38. Afinní a projektivní transformace. Invertibilní projektivní zobrazení
projektivního prostoru Pn na sebe odpovídají v homogenních souřadnicích invertibilním
maticím dimenze n + 1. Dvě takové matice zadávají stejnou projektivní
transformaci právě, když se liší o konstantní násobek.
Jestliže si zvolíme první souřadnici jako tu, jejíž nulovost určuje nekonečné
body, budou transformace, které zachovávají konečné body, dány maticemi, jejichž
první řádek musí být až na první člen nulový. Jestliže budeme chtít přejít do afinních
souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku,
musí být první prvek na prvním řádku být také rovný jedné. Matice projektivních
transformací zachovávajících konečné body tedy mají tvar:


1 0    0
b1 a11    a1n
...
...
bn an1    ann


kde b = (b1, . . . , bn)T
 Rn
a A = (aij) je invertibilní matice dimenze n. Působení
takové matice na vektoru (1, x1, . . . , xn) je právě obecná afinní transformace.
4.39. Projektivní klasifikace kvadrik. Závěrem ještě poznámka o složitějších
objektech studovaných v afinní geometrii nejlépe prostřednictvím projektivních rozšíření.
Jestliže popíšeme kvadriku v afinních souřadnicích pomocí obecné kvadratické
rovnice, viz výše, jejím přepsáním v homogenních souřadnicích dostaneme
vždy výlučně homogenní výraz, jehož všechny členy jsou druhého řádu. Důvod je
ten, že pouze takové homogenní výrazy budou mít pro homogenní souřadnice smysl
nezávisle na zvoleném konstantním násobku souřadnic (x0, x1, . . . , xn). Hledáme
tedy takový, jehož zúžením na afinní souřadnice, tj. dosazením x0 = 1, získáme původní
výraz. To je ale mimořádně jednoduché, prostě dopíšeme dostatek x0 ke všem
výrazům ­ žádny ke kvadratickým členům, jedno k lineárním a x2
0 ke konstantnímu
členu.
Získáme tak dobře definovanou kvadratickou formu na našem pomocném vektorovém
prostoru Rn+1
, ale jsme už vůči libovolné volbě báze klasifikovali. Zkuste si
samostatně převést tuto klasifikaci do projektivní i afinní podoby. (Hezké a náročné
cvičení na závěr semestru!)
4.40. Příklad. Nalezněte polární bázi kvadratické formy f : R3
 R, která je ve
standardní bázi dána předpisem
f(x1, x2, x3) = x1x2 + x1x3.
3. PROJEKTIVNÍ GEOMETRIE 133
Řešení. Aplikací uvedeného Lagrangeova algoritmu dostáváme:
f(x1, x2, x3) = 2x1x2 + x2x3
provedeme substituci podle bodu (4) algoritmu y2 = x2 - x1, y1 = x1, y3 = x3
= 2x1(x1 + y2) + (x1 + y2)x3 = 2x2
1 + 2x1y2 + x1x3 + y2x3 =
=
1
2
(2x1 + y2 +
1
2
x3)2
-
1
2
y2
2 -
1
8
x2
3 + y2x3 =
substituce y1 = 2x1 + y2 + 1
2
x3
=
1
2
y2
1 -
1
2
y2
2 -
1
8
x2
3 + y2x3 =
1
2
y2
1 - 2(
1
2
y2 -
1
2
x3)2
+
3
8
x2
3 =
substituce y3 = 1
2
y2 - 1
2
x3
=
1
2
y2
1 - 2y2
3 +
3
8
x2
3.
V souřadnicích y1, y3, x3 má tedy daná kvadratická forma diagonální tvar, to znamená
že báze příslušná těmto souřadnicím je polární bází dané kvadratické formy.
Pokud ji máme vyjádřit musíme získat matici přechodu od této polární báze ke
standardní bázi. Z definice matice přechodu jsou pak její sloupce bázovými vektory
polární bázi. Matici přechodu získáme tak, že buď vyjádříme staré proměnné (x1,
x2, x3) pomocí nových proměnných (y1, y3, x3), nebo ekvivalentně vyjádříme nové
proměnné pomocí starých (což jde jednodušeji), pak ale musíme spočítat inverzní
matici.
Máme y1 = 2x1 + y2 + 1
2 x3 = 2x1 + (x2 - x1) + 1
2 x3 a y3 = 1
2 y2 - 1
2 x3 =
-1
2 x1 + 1
2 x3 - 1
2 x3. Matice přechodu od standardní báze ke zvolené polární je tedy
T =


2 1 1
2
-1
2
1
2 -1
2
0 0 1

 .
Pro inverzní matici pak máme
T-1


1
3 -2
3 -1
2
1
3
4
3
1
2
0 0 1

 .
Jedna z polárních bazí dané kvadratické formy je tedy například báze
{(1/3, 1/3, 0), (-2/3, 4/3, 0), (-1/2, 1/2, 1)}.
4.41. Příklad. Určete typ kuželosečky dané rovnicí:
3x2
1 - 3x1x2 + x2 - 1 = 0.
Řešení. Pomocí algoritmu úpravy na čtverec postupně dostáváme:
3x2
1 - 3x1x2 + x2 - 1 =
1
3
(3x1 -
3
2
x2)2
-
3
4
x2
2 + x2 - 1 =
=
1
3
y2
1 -
4
3
(
3
4
x2 -
1
2
)2
+
1
3
- 1 =
=
1
2
y2
1 -
4
3
y2
2 -
2
3
.
Podle uvedeného seznamu kuželoseček se tedy jedná o hyperbolu.
KAPITOLA 5
Zřízení ZOO
jaké funkce potřebujeme pro naše modely?
­ pořádný zvěřinec...
1. Interpolace polynomy
Touto kapitolou započneme budování nástrojů umožňujících modelování závislostí,
které nejsou ani lineární ani diskrétní. S takovou potřebou se např. setkáme,
kdykoliv popisujeme systém vyvíjející se v čase a to ne jen v několika vybraných
okamžicích ale ,,souvisle , tj. pro všechny možné okamžiky. Někdy je to přímo záměr
či potřeba (třeba ve fyzikálních procesech), jindy je to vhodné přiblížení diskrétního
modelu (třeba u ekonomických nebo populačních modelů).
V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných
nebo komplexních čísel, tj. se skalárními funkcemi N  K nebo Z  K, kde K
byl zvolený okruh skalárů, případně N  V , kde V je vektorový prostor nad K.
Připomeňme si diskusi z odstavce 1.3, kde jsme přemýšleli nad způsoby, jak pracovat
se skalárními funkcemi. Na této diskusi se vůbec nic nemění a rádi bychom (pro
začátek) uměli pracovat s funkcemi R  R (reálné funkce reálné proměnné) nebo
R  C (komplexní funkce reálné proměnné), případně funkcemi Q  Q (funkce
jedné racionální proměnné s racionálními hodnotami) apod. Většinou půjdou naše
závěry snadno rozšířit na případ s vektorovými hodnotami nad stejnými skaláry, ve
výkladu se ale zpravidla omezíme jen na případ reálných čísel, případně komplexních
čísel.
Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro
naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat
dostatek modelů pro reálné situace. Cílem našich prvních dvou kapitol matematické
analýzy bude proto explicitně zavést několik typů elementárních funkcí, implicitně
popsat více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se
tomu říká diferenciální a integrální počet jedné proměnné.
5.1
5.1. Polynomy. Připomeňme si vlastnosti skalárů. Umíme je sčítat i násobit a
tyto operace splňují řadu vlastností, které jsme vyjmenovali už v odstavcích 1.1
a 1.2. Polynomem nad okruhem skalárů K rozumíme zobrazení f : K  K dané
výrazem
f(x) = anxn
+ an-1xn-1
+    + a1x + a0,
kde ai, i = 0, . . . , n, jsou pevně zadané skaláry, násobení je znázorněno prostým
zřetězením symbolů a ,,+ označuje sčítání. Pokud je an = 0, říkáme, že polynom
f je stupně n. Stupěň nulového polynomu není definován. Skaláry ai označujeme
jako koeficienty polynomu f. Polynomy stupně nula jsou právě konstantní nenulová
zobrazení x  a0. V algebře jsou častěji polynomy definovány jako formální výrazy
f(x), tj. jako posloupnosti koeficientů a0, a1, . . . s konečně mnoha nenulovými
135
136 5. ZŘÍZENÍ ZOO
prvky. Následující jednoduché lemma ukazuje, že v analýze budou oba přístupy
ekvivalentní. Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh,
kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot
polynomů. Připomeňte si při této příležitosti vlastnosti skalárů a ověřte!
Nad každým polem skalárů (viz axiom ,,P v odstavcích 1.1 a 1.2) funguje
dělení polynomů se zbytkem, tj. pro polynomy f stupně n a g stupně m, existují
jednoznačně určené polynomy q a r takové, že stupeň r je menší než m nebo je r = 0
a f = q g +r. Je-li pro nějaký prvek b  K hodnota f(b) = 0, pak to znamená, že v
podílu f(x) = q(x)(x-b)+r musí být r = 0. Jinak by totiž nebylo možné dosáhnout
f(b) = q(b)0+r, kde stupeň r je nulový. Říkáme, že b je kořen polynomu f. Stupeň
q je pak právě n - 1. Pokud má q opět kořen, můžeme pokračovat a po nejvýše n
krocích dojdeme ke konstatnímu polynomu. Dokázali jsme tedy, že každý nenulový
polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již
snadno dovodíme i následující pozorování:
Lemma. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si
rovny jako zobrazení, právě když mají shodné koeficienty.
Důkaz. Předpokládejme f = g, tj. f - g = 0 jako zobrazení. Polynom (f g)(x)
tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým
polynomem.
Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Uvažte
např. polynom x2
+ x nad Z2.
5.2
5.2. Interpolační polynom. Častá praktická úloha vyžaduje stanovení počítatelné
formule pro funkci, pro kterou máme zadány hodnoty v předem daných daných
bodech x0, . . . , xn. Pokud by šlo o nulové hodnoty, umíme přímo zadat polynom
f(x) = (x - x0)(x - x1) . . . (x - xn),
který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není
jediná odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom
jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n.
Obdobně to dopadne i v obecném případě:
Věta. Nechť K je nekonečné pole skalárů, pak pro každnou množinu po dvou různých
bodů x0, . . . , xn  K a předepsaných hodnot y0, . . . , yn  K existuje právě
jeden polynom f stupně nejvýše n (případně nulový polynom), pro který platí
f(xi) = yi, i = 0, . . . , n.
Důkaz. Označme si prozatím neznámé koeficienty polynomu f stupně n
f = anxn
+    + a1x + a0.
Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet
neznámých koeficientů ai
a0 + x0a1 +    + (x0)n
an = y0
...
a0 + xna1 +    + (xn)n
an = yn.
1. INTERPOLACE POLYNOMY 137
Jak je dobře známo z lineární algebry, tento systém lineárních rovnic má právě
jedno řešení pokud je determinant jeho matice invertibilní skalár, tj. pokud je nenulový
(viz 3.1 a 2.22). Musíme tedy vyšetřit tzv. Vandermondův determinant
V (x0, . . . , xn) = det


1 x0 (x0)2
. . . (x0)n
1 x1 (x1)2
. . . (x1)n
...
...
...
...
...
1 xn (xn)2
. . . (xn)n


.
Tento determinant umíme nad libovolným nekonečným polem skalárů snadno spo-
číst:
Lemma. Pro všechny hodnoty x0, . . . , xn  K platí
V (x0, . . . , xn) =
n
i>k=0
(xi - xk).
Důkaz. Vztah dokážeme indukcí přes počet bodů xi. Evidentně je správný pro
n = 1 (a pro n = 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný
pro n - 1, tj.
V (x0, . . . , xn-1) =
n-1
i>k=0
(xi - xk).
Nyní považujme hodnoty x0, . . . , xn-1 za pevné a hodnotu xn ponechme jako volnou
proměnnou. Rozvojem determinantu podle posledního řádku (viz 2.19) obdržíme
hledaný determinant jako polynom
e5.1 (5.1) V (x0, . . . , xn) = (xn)n
V (x0, . . . , xn-1) - (xn)n-1
   .
Toto je polynom stupně n, protože víme, že jeho koeficient u (xn)n
je nenulový
dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv
hodnoty xn = xi pro i < n, protože bude v takovém případě obsahovat původní
determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem
(xn - x0)(xn - x1)    (xn - xn-1),
který má sám již stupeň n. Odtud vyplývá, že celý Vandermondův determinant
coby polynom v proměnné xn musí být tomuto výrazu roven až na konstantní
násobek, tj.
V (x0, . . . , xn) = c  (xn - x0)(xn - x1)    (xn - xn-1).
Porovnáním koeficientů u nejvyšší mocniny v (5.1) a tomto výrazu dostáváme
c = V (x0, . . . , xn-1)
a tím je důkaz lemmatu ukončen.
Ukázali jsme, že je determinant naší soustavy rovnic vždy roven součinu rozdílů
definičních bodů. Pro naše po dvou různé body xi tedy musí být nenulový. Odtud
ale vyplývá jednoznačná existence řešení. Protože polynomy jsou jako zobrazení
stejné, právě když mají stejné koeficienty, věta je dokázána.
Jednoznačně určený polynom f z předchozí věty nazýváme interpolační polynom
pro hodnoty yi v bodech xi.
138 5. ZŘÍZENÍ ZOO
5.3
5.3. Poznámky. Uvažujme nyní pro jednoduchost pouze reálné nebo případně
racionální polynomy, tj. polynomiálně zadané funkce R  R nebo Q  Q. Na
první pohled se může zdát, že polynomy tvoří hezkou velikou třídu funkcí jedné
proměnné, kterou můžeme použít na proložení jakékoliv sady předem zadaných
hodnot. Navíc se zdají být snadno vyjádřitelné, takže by s jejich pomocí mělo být
dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné.
Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik
problémů.
Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme.
Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat
čas úměrný třetí mocnině počtu bodů, což při hustějších datech je jistě těžko
přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého
stupně v zadaném bodě. Obojí lze částečně obejít tak, že zvolíme vhodné vyjádření
intepolačního polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru
všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x2
, . . . , xn
).
Jednou z možností je tzv. Lagrangeův interpolační polynom, kterým rychle a
snadno zapíšeme řešení. Sestrojíme si nejprve pomocné polynomy i s vlastností
i(xj) =
1 i = j
0 i = j
.
Zřejmě musí být tyto polynomy až na konstantu rovny výrazům (x - x0) . . . (x xi-1)(x
- xi+1) . . . (x - xn) a proto
i(x) =
j=i(x - xj)
j=i(xi - xj)
.
Hledaný Lagrangeův interpolační polynom pak snadno zadáme formulí
f(x) = y0 0(x) + y1 1(x) +    + yn n(x).
Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých
rozdílech zadaných hodnot xi, protože se v ní těmito rozdíly dělí. Všimněme si ale,
že přímá konstrukce Lagrangeova polynomu může nahradit existenční část důkazu
v předchozí Větě 5.2. (Jednoznačnost pak je také jednoduchá i bez příslušné lineární
algebry: dvě možná řešení f a g mají stejné hodnoty v n + 1 různých bodech, tj.
polynom f - g má n + 1 různých kořenů a stupeň nejvýše n a proto musí být
nulovým polynomem.)
Ještě horším problémem je velice špatná stabilita hodnot reálných nebo racionálních
polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na
přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle
znaménka koeficientu u nejvyšší mocniny polynomu se hodnoty velice rychle při rostoucím
x vydají buď do plus nebo mínus nekonečna. Ani toto znaménko koeficientu
u nejvyššího stupně se ale u interpolačního polynomu při malých změnách prokládaných
hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo
jedenáct hodnot funkce sin(x) s různými malými náhodnými změnami hodnot.
Zelenou barvou je vynesena aproximovaná funkce, kolečka jsou malinko posunuté
hodnoty a červeně je vynesen jednoznačně zadaný interpolační polynom. Zatímco
uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná.
1. INTERPOLACE POLYNOMY 139
-4
x
2
4
1
2
0
-1
0
-2
-2 -4
x
2
4
1
2
0
-1
0
-2
-2
Kolem interpolačních polynomů existuje bohatá teorie. Částečně se budeme k
některým jejich vlastnostem vracet, podrobnější rozbor lze najít např. v pěkných
textech [11].
5.4. Určování interpolačních polynomů.
5.4.1. Nalezněte polynom P splňující následující podmínky:
P(2) = 1, P(3) = 0, P(4) = -1, P(5) = 6.
Řešení. Řešíme buď přímo, t.j. sestavením soustavy čtyř lineárních rovnic o čtyřech
neznámých. Předpokládáme polynom ve tvaru a3x3
+ a2x2
+ a1x1 + a0. Víme, že
polynom stupně nejvýše tři splňující podmínky v zadání je dán jednoznačně.
a0 + 2a1 + 4a2 + 8a3 = 1
a0 + 3a1 + 9a2 + 27a3 = 0
a0 + 4a1 + 16a2 + 64a3 = -1
a0 + 5a1 + 25a2 + 125a3 = 6.
Každá rovnice vznikla z jedné z podmínek v zadání.
Druhou možností je vytvořit hledaný polynom pomocí fundamentálních Lagrangeových
polynomů:
P(x) = 1 
(x - 3)(x - 4)(x - 5)
(2 - 3)(2 - 4)(2 - 5)
+ 0  (. . . ) +
= (-1) 
(x - 2)(x - 3)(x - 5)
(4 - 2)(4 - 3)(4 - 5)
+ 6 
(x - 2)(x - 3)(x - 4)
(5 - 2)(5 - 3)(5 - 4)
=
=
4
3
z3
- 12z2
+
101
3
z - 29.
Koeficienty tohoto polynomu jsou samozřejmě jediným řešením výše sestavené soustavy
lineárních rovnic.
5.4.2. Nalezněte polynom P splňující následující podmínky:
P(1 + i) = i, P(2) = 1, P(3) = -i.
140 5. ZŘÍZENÍ ZOO
Řešení. P(x) = (-3
5 - 4
5 i)x2
+ (2 + 3i)x - 3
5 - 14
5 i.
5.4
5.5. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou
rychle míří k nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že
polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje
(jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně
lepší výsledky budeme alespoň mezi body xi dosahovat, když si budeme
kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou.
Pro tento účel zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy.
Můžeme přitom pracovat opět s reálnými, komplexními nebo racionálními
polynomy. Rychlost růstu v bodě x  R pro reálný polynom f(x) dobře vyjadřují
podíly
e5.2 (5.2)
f(x + x) - f(x)
x
a protože umíme spočíst (nad libovolným okruhem)
(x + x)k
= xk
+ kxk-1
x +    +
k
l
xl
(x)k-l
+    + (x)k
,
dostaneme pro polynom f(x) = anxn
+    + a0 výše vedený podíl ve tvaru
f(x + x) - f(x)
x
= an
nxn-1
x +    + (x)k
x
+    + a1
x
x
= nanxn-1
+ (n - 1)an-1xn-2
+    + a1 + x(. . . ),
kde výraz v závorce je polynomiálně závislý na x. Evidentně pro hodnoty x
velice blízké nule dostaneme hodnotu libovolně blízkou výrazu
f (x) = nanxn-1
+ (n - 1)an-1xn-2
+    + a1,
který nazýváme derivace polynomu f podle proměnné x. Z definice je jasné, že
právě hodnota f (x0) derivace polynomu nám dává dobré přiblížení jeho chování v
okolí bodu x0. Přesněji řečeno, přímka
y = f (x0)(x - x0) + f(x0)
velice dobře aproximuje přímky procházející body [x0, f(x0)] a [x0+x, f(x0+x)]
pro malé hodnoty x. Hovoříme o lineárním přiblížení polynomu f jeho tečnou.
Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně
nejvýše n polynomy stupně nejvýše n - 1. Iterací této operace dostáváme druhé
derivace f , třetí derivace f(3)
a obecně po k­násobném opakování polynom f(k)
stupně n - k. Po n + 1 derivacích je výsledkem nulový polynom. S tímto lineárním
zobrazením jsme se již potkali v odstavci 2.45 o nilpotentních zobrazeních.
5.5
5.6. Hermiteův interpolační problém. Uvažme opět m + 1 po dvou různých
reálných nebo racionálních hodnot x0, . . . , xm, tj. xi = xj pro všechna i = j.
Předepišme dále hodnoty y
(k)
i aproximované funkce a jejich derivací pro k = 0
a k = 1. To znamená, že máme předepsány hodnoty a první derivace v zadaných
bodech xi. Hledáme polynom f, který bude nabývat těchto předepsaných hodnot
a derivací.
1. INTERPOLACE POLYNOMY 141
Zcela analogicky jako u interpolace pouhých hodnot obdržíme pro neznámé
koeficienty polynomu f(x) = anxn
+ . . . a0 systém rovnic
a0 + x0a1 +    + (x0)n
an = y
(0)
0
...
a0 + xma1 +    + (xm)n
an = y(0)
m
a1 + 2x0a2 +    + n(x0)n-1
an = y
(1)
0
...
a1 + 2xma2 +    + n(xm)n-1
an = y(1)
m .
Opět bychom mohli ověřit, že při volbě n = 2m+1 bude determinant tohoto systému
rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, stejně jako
při konstrukci Lagrangeova polynomu lze zkonstruovat takový polynom f přímo.
Nazýváme jej Hermiteův interpolační polynom.
Hermiteův polynom můžeme určit podobně pomocí fundamentálních Hermiteových
polynomů:
h1
i (x) = 1 l
(xi)
l (xi)
(x - xi) (li(x))
2
h2
i (x) = (x - xi) (li(x))
2
,
kde l(x) =
n
i=1(x - xi). Tyto polynomy splňují následující podmínky:
h1
i (xj) = j
i =
1 pro i = j
0 pro i = j
(h1
i ) (xj) = 0
h2
i (xj) = 0
(h2
i ) (xj) = j
i
Máme-li dán systém podmínek f(x1) = y1, f (x1) = y1, . . . , f(xk) = yk, f (xk) =
yk, pak je odpovídající polynom dán předpisem
f(x) =
k
i=1
[yih1
i (xi) + yih2
i (xi)].
Úplně nejjednodušší případ je zadání hodnoty a derivace v jediném bodě. Tím
určíme beze zbytku polynom stupně 1
f(x) = f(x0) + f (x0)(x - x0)
tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě x0. Když zadáme
hodnotu a derivaci ve dvou bodech, tj. y0 = f(x0), y0 = f (x0), y1 = f(x1),
y1 = f (x1) pro dva různé body xi, dostaneme ještě pořád snadno počítatelný
problém. Ukažme si jej v zjednodušeném provedení, kdy x0 = 0, x1 = 1. Pak
matice systému a její inverze budou
A =


0 0 0 1
1 1 1 1
0 0 1 0
3 2 1 0


 , A-1
=


2 -2 1 1
-3 3 -2 -1
0 0 1 0
1 0 0 0


 .
142 5. ZŘÍZENÍ ZOO
Přímým vynásobením A  (y0, y1, y0, y1)T
pak vyjde vektor (a3, a2, a1, a0)T
koeficientů
polynomu f, tj.
f(x) = (2y0 - 2y1 + y0 + y1)x3
+ (-3y0 + 3y1 - 2y0 - y1)x2
+ y0x + y0.
V případě, že máme zadány hodnoty a derivace v jiných bodech x0 a x1, lze využít
tohoto výsledku s pomocí vhodné afinní transformace R  R (pozor ale na vliv
transformace na velikosti derivací, podrobněji budeme podobné úkony diskutovat
později).
5.6.1. Příklad Nalezněte polynom P splňující následující podmínky:
P(1) = 0, P (1) = 1, P(2) = 3, P (2) = 3.
Řešení. Opět ukážeme dvě možnosti řešení. 1.řešení. Dané podmínky určují čtyři
lineární rovnice pro koeficienty hledaného polynomu. Budeme-li hledat polynom
třetího stupně, dostáváme tedy přesně tolik rovnic, kolik je neznámých koeficientů
polynomu (nechť např. P(x) = a3x3
+ a2x2
+ a1x + a0):
P(1) = (a3 + a2 + a1 + a0 = 0,
P (1) = 3a3 + 2a2 + a1 = 1,
P(2) = 8a3 + 4a2 + 2a1 + a0 = 3,
P (2) = 12a3 + 4a2 + a1 = 3.
Vyřešením tohoto systému obdžíme polynom P(x) = -2x3
+ 10x2
- 13x + 5.
2.řešení. Použijeme fundamentální Hermiteovy polynomy:
h1
1(x) = 1 -
2
0 + (-1)
(x - 1) (2 - x)2
= (2x - 1)(x - 2)2
,
h1
2(x) = (5 - 2x)(x - 1)2
,
h2
1(x) = (x - 1)(x - 2)2
,
h2
2(x) = (x - 2)(x - 1)2
.
Celkem
P(x) = 0  h1
1(x) + 3  h1
2(x) + 1  h2
1(x) + 3  h2
2(x) = -2x3
+ 10x2
- 13x + 5.
Obdobně lze předepisovat libovolný konečný počet derivací v jednotlivých bodech
a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace.
Nebudeme zde uvádět podrobnosti, viz opět text [11].
Bohužel, u těchto interpolací pořád zůstávají problémy zmíněné už v případě
jednoduchých interpolací hodnot ­ složitost výpočtů a nestabilita. Použití derivací
však podbízí jednoduché vylepšení metodiky:
5.6
5.7. Interpolace splajny. 1
Jak jsme viděli na obrázcích demonstrujících nestabilitu
interpolace jedním polynomem dostatečně vysokého stupně, malé lokální
změny hodnot zapřičiňovaly dramatické celkové změkjny chování výsledného polynomu.
Nabízí se tedy využití malých polynomiálních kousků, které ale musíme
umět rozumně navazovat.
1Ošklivé české slovo ,,splajn vzniklo fonetickým přepisem anglického ekvivalentu ,,spline ,
který znamenal tvárné pravítko užívané inženýry pro kreslení křivek.
1. INTERPOLACE POLYNOMY 143
Nejjednodušší je propojení vždy dvou sousedních bodů lineárním polynomem.
Tak se nejčastěji zobrazují data. Z pohledu derivací to znamená, že budou na jednotlivých
úsecích konstantní a pak se skokem změní. O něco sofistikovanější možností
je předepsat v každém bodě hodnotu a derivaci, tj. pro dva body budeme
mít 4 hodnoty a jednoznačně tím určíme Hermiteův polynom 3. stupně, viz výše.
Tento polynom pak můžeme použít pro všechny hodnoty nezávislé proměnné mezi
krajními hodnotami x0 < x1. Hovoříme o intervalu [x0, x1]. Takové polynomiální
příblížení po kouskách už bude mít tu vlastnost, že derivace na sebe budou nava-
zovat.
V praxi ale není pouhé navazování první derivace dostatečné a navíc při naměřených
datech nemíváme hodnoty derivací k dispozici. Přímo se proto vnucuje
pokus využívat pouze zadané hodnoty ve dvou sousedních bodech, ale požadovat
zároveň rovnost prvních i druhých derivací u sousedních kousků polynomů třetího
stupně:
Definice. Nechť x0 < x1 <    < xn jsou reálné (nebo racionální) hodnoty, ve kterých
jsou zadány požadované hodnoty y0, . . . , yn. Kubickým interpolačním splajnem
pro toto zadání je funkce S : R  R (nebot S : Q  Q), která splňuje následující
podmínky:
* zúžení S na interval [xi-1, xi] je polynom Si třetího stupně, i = 1, . . . , n
* Si(xi-1) = yi-1 a Si(xi) = yi pro všechny i = 1, . . . n,
* Si(xi) = Si+1(xi) pro všechny i = 1, . . . , n - 1,
* Si (xi) = Si+1(xi) pro všechny i = 1, . . . , n - 1.
Kubický splajn pro n + 1 bodů sestává z n kubických polynomů, tj. máme k
dispozici 4n volných parametrů (první definiční podmínka). Další podmínky přitom
zadávají 2n + (n - 1) + (n - 1) rovností, tj. dva parametry zůstávají volné. Při
praktickém použití se dodávají předpisy pro derivace v krajních bodech, tzv. úplný
splajn, nebo jsou tyto zadány jako nula, tzv. přirozený splajn.
Výpočet celého splajnu už není bohužel tak jednoduchý jako u nezávislých výpočtů
Hermiteových polynomů třetího stupně, protože data se prolínají vždy mezi
sousedními intervaly. Při vhodném uspořádání se však dosáhne matice systému,
která má nenulové prvky prakticky jen ve třech diagonálách, a pro takové existují
vhodné numerické postupy, které umožní splajn počítat také v čase úměrném počtu
bodů. Podrobnosti vynecháme, lze je dohledat např. v [11]. Pro srovnání se
podívejme na interpolaci stejných dat jako v případě Lagrangeova polynomu, nyní
pomocí splajnů:
144 5. ZŘÍZENÍ ZOO
0
-4 0
-0,5
2
-1
1
-2 4
x
0,5
0
-4
-0,5
x
2
-1
1
0
0,5
4-2
2. Spojité funkce
Viděli jsme právě, že je důležité mít dostatečně velkou zásobu funkcí, se kterými
bude možné možné vyjadřovat všechny běžné závislosti, zároveň ale musí být výběr
šikovně omezen, abychom uměli vybudovat nějaké univerzální nástroje pro práci s
nimi.
Polynomů je přitom zjevně příliš málo, i když jejich šikovné využití ve splajnech
může ledacos vynahradit. Nejvýraznější vlastností polynomů je jejich ,,spojitá
závislost hodnot na nezávislé proměnné. Intuitivně řečeno, když dostatečně málo
změníme x, určitě se nám moc nezmění ani hodnota f(x). Takové chování naopak
nemáme u po částech konstantních funkcí f : R  R v okolí ,,skoků . Např. u tzv.
Heavisideovy funkce
f(x) =


0 pro všechny x < 0
1/2 pro x = 0
1 pro všechny x > 0
taková ,,nespojitost nastane pro x = 0.
Začneme formalizací takovýchto intuitivních výroků. K tomu budeme potřebovat
upřesnit vlastnosti našich skalárů a zasvést pojem limity.
5.7
5.8. Reálná a komplexní čísla. Prozatím jsme docela dobře vystačili s algebraickými
vlastnostmi reálných čísel, které říkaly, že R je pole. Už jsme ale používali
i relaci uspořádání reálných čísel, kterou značíme ,, (viz odstavec 1.45).
Připoměňme si nyní vlastnosti (axiomy) reálných čísel včetně souvislostí uspořádání
a ostatních relací. Dělící čáry naznačují, jak axiomy postupně zaručují, že jsou
reálná čísla komutativní grupou vůči sčítání, že R \ {0} je komutativní grupa vůči
násobení, R je pole, množina R spolu s operacemi +,  a s relací uspořádání je tzv.
uspořádané pole a konečně poslednímu axiomu můžeme rozumět tak, že R je ,,dostatečně
husté , tj. nechybí nám tam body, jako např. druhá odmocnina ze dvou v
číslech racionálních. Formálně poslední axiom vysvětlíme níže.
2. SPOJITÉ FUNKCE 145
(R1) (a + b) + c = a + (b + c), pro všechny a, b, c  R
(R2) a + b = b + a, pro všechny a, b  R
(R3) existuje prvek 0  R takový, že pro všechny a  R platí a + 0 = a
(R4) pro všechny a  R existuje opačný prvek (-a)  R takový, že
platí a + (-a) = 0
(R5) a  b)  c = a  (b  c), pro všechny a, b, c  R
(R6) a  b = b  a pro všechny a, b  R
(R7) existuje prvek 1  R takový, že pro všechny a  R platí 1  a = a
(R8) pro každý a  R, a = 0 existuje inverzní prvek a-1
 R takový,
že platí a  a-1
= 1
(R9) a  (b + c) = a  b + a  c, pro všechny a, b, c  R
(R10) relace  je úplné uspořádání, tj. reflexivní, antisymetrická, tranzitivní
a úplná relace na R
(R11) pro všechny a, b, c  R platí, že z a  b vyplývá také a + c  b + c
(R12) pro všechny a, b  R, a > 0, b > 0, platí také a  b > 0
(R13) každá neprázdná ohraničená množina A  R má supremum.
Pojem suprema má smysl pro každou uspořádanou množinu. Uvažme podmnožinu
A  B v uspořádané množině B. Horní závorou množiny A je každý prvek
b  B, pro který platí, že b  a pro všechny a  A. Obdobně definujeme dolní
závory množiny A jako prvky b  A takové, že b  a pro všechny a  A.
Nejmenší horní závora podmnožiny A, pokud existuje, se nazývá supremum
této podmnožiny a značíme ji sup A. Přesněji:
sup A = b, jestliže z c  a pro všechny a  A vyplývá také c  b.
Obdobně, největší dolní závora se nazývá infimum, píšeme inf A, tzn.
inf A = b, jestliže z c  a pro všechny a  A vyplývá také c  b.
Pro formální výstavbu další teorie potřebujeme vědět, zda námi požadované vlastnosti
reálných čísel lze realizovat, tj. zda existuje taková množina R s operacemi a
relací uspořádání, které (R1)­(R13) splňují. Skutečně lze reálná čísla nejen zkonstruovat,
ale také lze ukázat, že až na izomorfismus to jde jediným způsobem. Pro
naši potřebu vystačíme s intuitivní představou reálné přímky, jednoznačnost nebudeme
diskutovat vůbec a existenci jen naznačíme v dalším odstavci.
Pole komplexních čísel splňuje axiomy (R1)­(R9), není na nich ale žádným rozumným
způsobem definováno uspořádání, které by naplnilo axiomy (R10)­R(13).
Nicméně s nimi budeme také občas pracovat a již dříve jsme viděli, že rozšíření
skalárů na komplexní čísla je často pro výpočty mimořádně užitečné. Protože jsou
komplexní čísla z = re z + i im z dána jako dvojice reálných čísel, je dobrou představou
rovina komplexních čísel.
Operací, která je u komplexních čísel navíc je tzv. konjugace. Je to zrcadlení
podle přímky reálných čísel, tj. obrácení znaménka u imaginární složky. Značíme ji
pruhem nad daným číslem, z = re z - i im z. Protože je pro z = x + iy
z  z = (x + iy)(x - iy) = x2
+ y2
,
zadává nám tento výraz právě kvadrát vzdálenosti komplexního čísla od nuly. Odmocnině
z tohoto reálného nezáporného čísla říkáme absolutní hodnota komplexního
čísla z, píšeme
e5.3 (5.3) |z|2
= z  z
146 5. ZŘÍZENÍ ZOO
5.8.1. Načrtněte následující podmnožiny v C
(1) {z  C| |z - 1| = |z + 1|}
(2) {z  C| 1  |z - i|  2}
(3) {z  C| Re(z2
) = 1}
(4) {z  C| Re(1
z ) < 1
2 }
Řešení.
* imaginární osa
* mezikruží okolo i
* hyperbola a2
- b2
= 1.
* vnějšek jednotkového kruhu se středem v 1.
5.8
5.9. Hromadné body a konvergence. Uvažujme na chvíli nějaké pole skalárů
K, které splňuje axiomy (R1)­(R12). Takové určitě existuje, protože racionální čísla
Q jsou příkladem. Zkonstruovali jsme je v odstavci 1.47 a čtenář si snadno může
ověřit platnost všech požadovaných axiomů. Pro každý prvek a  K definujeme
jeho absolutní hodnotu |a| takto
|a| =
a je-li a  0
-a je-li a < 0.
Samozřejmě platí pro každá dvě čísla a, b  K
e5.4 (5.4) |a + b|  |a| + |b|.
Této vlastnosti říkáme trojúhelníková nerovnost a splňuje ji také absolutní hodnota
komplexních čísel definovaná výše.
Uvažme nyní libovolnou posloupnost prvků a0, a1, . . . v našem uspořádaném
poli K takovou, že pro libolné pevně zvolené kladné číslo > 0 platí pro všechny
prvky ak až na konečně mnoho výjimek
|ai - aj| < .
Jinak řečeno, pro každé pevné > 0 existuje index N takový, že předcházející
nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká Cauchyovská
posloupnost. Intuitivně jistě cítíme, že buď jsou v takové posloupnosti všechny
prvky stejné až na konečně mnoho z nich (pak bude od určitého indexu N počínaje
vždy |ai - aj| = 0) nebo se taková posloupnost ,,hromadí k nějaké hodnotě.
Pokud by taková hodnota a  K existovala, očekávali bychom od ní patrně
následující vlastnost: pro libovolné pevně zvolené číslo platí pro všechny i, až na
konečně mnoho výjimek,
|ai - a| < .
Říkáme v takovém případě, že posloupnost ai, i = 1, 2, . . . konverguje k hodnotě
a  K.
Uvažme nyní jakoukoliv množinu A  K a předpokládejme, že naše posloupnost
je vybraná z prvků A. Pokud konverguje k a  K a navíc je nekonečně mnoho bodů
ai  A různých od a, hovoříme o hromadném bodu množiny A.
2. SPOJITÉ FUNKCE 147
Jestliže nějaká posloupnost ai  K konverguje k a  K, pak pro zvolené víme,
že |ai - a| < pro vhodné N  N a všechny i  N. Pak pro i, j  N dostaneme
|ai - aj| < |ai - aN | + |aN - aj| < 2 .
Vidíme tedy, že každá konvergující posloupnost je Cauchyovská.
V poli racionálních čísel se může snadno stát, že pro takovéto posloupnosti
příslušná hodnota a neexistuje. Např. číslo

2 můžeme libovolně přesně přiblížit
racionálními čísly ai, ale samotná odmocnina racionální není. Uspořádaná pole
skalárů, ve kterém všechny Caychyovské posloupnosti konvergují, se nazývají úplná.
Následující tvrzení říká, že axiom (R13) takové chování zaručuje:
Lemma. Každá Cauchyovská posloupnost reálných čísel ai konverguje k reálné hodnotě
a  R.
Důkaz. Každá Cauchyovská posloupnost je zjevně ohraničená množina (dokažte si
podrobně ­ pro libovolné ohraničíte všechny členy až na konečně mnoho z nich!). Definujme
si množinu
B = {x  R, x < aj pro všechny prvky ai, až na konečně mnoho z nich}.
Zřejmě má B horní závoru, tudíž podle axiomu (R13) má i supremum. Definujme a =
sup B. Nyní pro nějaké > 0 zvolme N takové, aby |ai - aj| < pro všechny i, j  N.
Zejména pak
aj > aN - , aj < aN +
takže aN - patří do B, zatímco aN + už nikoliv. Souhrnně z toho dostáváme, že
|a - aN |  , a proto také
|a - aj|  |a - aN | + |aN - aj|  2
pro všechny j > N. To ale značí právě, že a je hromadný bod posloupnosti.
Při jedné z možností, jak vybudovat reálná čísla, postupujeme podobně jako při zúplňování
přirozených čísel na celá (abychom přidali opačné hodnoty) a celých na racionální (abychom
přidali podíly nenulových čísel). Skutečně, vhodným formálním způsobem přidáme všechny
chybějící hromadné body pro podmnožiny racionálních čísel (např. vhodným způsobem zavedeme
ekvivalenci na množině všech Cauchyovských posloupností racionálních čísel). Pak se lze
již snadno přesvědčit, že všechny požadované axiomy skutečně dojdou naplnění.
Další teorické nuance tady není vhodné rozebírat. Zájemce může ale nahlédnout např. do
[5] pro další informace i odkazy.
5.9
5.10. Otevřené a uzavřené množiny. Uzavřená podmnožina v R je taková,
která obsahuje i všechny své hromadné body. Typickou uzavřenou množinou je tzv.
uzavřený interval
[a, b] = {x  R, a  x  b}.
Zde a je reálné číslo nebo hraniční hodnota chybí a píšeme a = - (mínus nekonečno)
a podobně b > a je reálné číslo nebo +. Uzavřenou množinu bude tvořit
i posloupnost reálných čísel bez hromadného bodu nebo posloupnost s konečným
počtem hromadných bodů spolu s těmito body. Zjevně je konečné sjednocení uzavřených
množin opět uzavřená množina.
Otevřená množina v R je taková množina, jejíž doplněk je uzavřenou množinou.
Typickou otevřenou množinou je otevřený interval
(a, b) = {x  R, a < x < b},
kde pro hraniční hodnoty máme stejné možnosti jako výše.
148 5. ZŘÍZENÍ ZOO
Okolím bodu a  R nazýváme libovolný otevřený interval O, který a obsahuje.
Je-li okolí definované jako interval
O(a) = (a - , a + )
pro kladné číslo , hovoříme o -okolí bodu a.
Všimněme si, že pro libovolnou množinu A je a  R hromadným bodem A,
právě když v libovolném okolí a leží také alespoň jeden bod b  A, b = a.
Lemma. Množina reálných čísel A je otevřená, právě když každý její bod a  A do
ní patří i s nějakým svým okolím.
Důkaz. Nechť je A otevřená a a  A. Kdyby neexistovalo žádné okolí bodu a
uvnitř A, musela by existovat posloupnost an / A, |a - an|  1/n. Pak je ovšem
a  A hromadným bodem množiny R \ A, což není možné, protože doplněk A je
uzavřený.
Naopak předpokládejme, že každé a  A leží v A i s nějakým svým okolím. To
přirozeně zabraňuje, aby nějaký hromadný bod b pro množinu R \ A ležel v A. Je
proto R \ A uzavřená a tedy je A otevřená.
Zjevně je libovolné sjednocení otevřených množin opět otevřenou množinou a
každý konečný průnik otevřených množin je opět otevřená množina.
Množina A reálných čísel se nazývá ohraničená, jestliže celá leží v nějakém
konečném intervalu [a, b], a, b  R. V opačném případě je neohraničená. Ohraničená
a uzavřená množina se nazývá kompaktní.
5.10
5.11. Několik topologických vlastností. Přidejme ještě několik pojmů, které
nám umožní účinné vyjadřování. Vnitřním bodem množiny A reálných čísel nazveme
takový bod, který do A patří i s nějakým svým okolím. Hraniční bodem
množiny A rozumíme takový bod, jehož každé okolí má neprázdný průnik jak s A
tak s doplňkem R \ A. Otevřené pokrytí množiny A je takový systém otevřených
intervalů Ui, i  I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny
A rozumíme bod a  A, který má okolí, jehož průnik s A je právě jednobodová
množina {a}.
Věta. Pro podmnožiny A reálných čísel platí:
(1) A je otevřená, právě když je sjednocením nejvýše spočetného systému otevřených
intervalů,
(2) každý bod a  A je buď vnitřní nebo hraniční,
(3) každý hraniční bod je buď izolovaným nebo hromadným bodem A,
(4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má
podposloupnost konvergující k bodu v A,
(5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné pokrytí.
Důkaz. (1) Zjevně je každá otevřená množina sjednocením nějakých okolí svých
bodů, tj. otevřených intervalů. Jde tedy pouze o to, jestli nám jich vždy stačí spočetně
mnoho. Zkusme tedy najít ,,co největší intervaly. Řekneme, že body a, b  A jsou v relaci,
jestliže celý otevřený interval (a, b) je v A. To je zjevně relace ekvivalence a její třídy
budou zjevně intervaly, které budou navíc po dvou disjunktní. Každý z těchto intervalů
jistě musí obsahovat nějaké racionální číslo a tyto musí být různé. Všech racionálních čísel
je ale spočetně mnoho, proto máme tvrzení dokázané.
2. SPOJITÉ FUNKCE 149
(2) Přímo z definic vyplývá, že bod nemůže být vnitřní a hraniční zároveň. Nechť tedy
a  A není vnitřní. Pak ovšem existuje posloupnost bodů ai / A s hromadným bodem a.
Zároveň a patří do každého svého okolí. Proto je a hraniční.
(3) Předpokládejme, že a  A je hraniční a není izolovaný. Pak stejně jako v poslední
argumentaci existují body ai, tentokrát uvnitř A, jejichž hromadným bodem je a.
(4) Předpokládejme, že je A kompaktní, tj. uzavřená a ohraničená, a uvažme nějakou
nekonečnou posloupnost bodů ai  A. Tato podmnožina má jistě supremum b i infimum a
(nebo můžeme zvolit libovolnou horní a dolní závoru množiny A). Rozdělme nyní interval
[a, b] přesně na dvě poloviny [a, 1
2
(b - a)] a [1
2
(b - a), b]. V alespoň jedné z nich musí být
nekonečně mnoho prvků ai. Vyberme takovou polovinu, jeden z prvků v ní obsažených a
následně tento interval opět rozdělme uvažovaný interval na poloviny. Znovu vybereme tu
polovinu, kde je nekonečně mnoho prvků posloupnosti a vybereme si jeden z nich. Tímto
způsobem dostaneme posloupnost, která bude Cauchyovská (dokažte si detailně ­ vyžaduje
si jen pozorné hraní s odhady, podobně jako výše). O Cauchyovských posloupnostech
ovšem už víme, že mají vždy hromadné body nebo jsou konstantní až na konečně mnoho
výjimek. Existuje tedy podposloupnost s námi hledanou limitou. Z uzavřenosti A zase
vyplývá, že námi nalezený bod musí opět ležet v A.
Opačně, jestliže každá v A obsažená nekonečná podmnožina má hromadný bod v
A, znamená to, že všechny hromadné body jsou v A a tedy je A uzavřená. Pokud by
nebyla množina A zároveň ohraničená, uměli bychom najít posloupnost stále rostoucí
nebo klesající s rozdíly dvou po sobě jdoucích čísel třeba alespoň 1. Taková posloupnost
bodů z A ale nemůže mít hromadný bod vůbec.
(5) Nejprve se věnujme snadnější implikaci, tj. předpokládejme, že z každého otevřeného
pokrytí lze vybrat konečné. Jistě lze A pokrýt spočetným systémem intervalů
In = (n - 2, n + 2), n  Z, a jakýkoliv výběr konečně mnoha z nich říká, že je množina A
ohraničená. Předpokládejme nyní, že a  R\A je hromadným bodem posloupnosti ai  A
a předpokládejme rovnou, že |a - an| < 1
n
. Množiny
Jn = R \ [a -
1
n
, a +
1
n
]
pro všechny n  N, n > 0, jsou sjednocení dvou otevřených intervalů a jistě také pokrývají
naši množinu A. Protože je možné vybrat konečné pokrytí A, bod a je uvnitř doplňku
R\A včetně nějakého svého okolí a není tedy hromadným bodem. Proto musí být všechny
hromadné body A opět v A a tato množina je i uzavřená.
Opačný směr je opět založený na existenci a vlastnostech suprem. Předpokládejme,
že je A kompaktní a že je dáno nějaké její otevřené pokrytí C. Z předchozího je zjevné, že
v A existují největší a nejmenší prvek, které jsou zároveň rovny b = sup A a a = inf A.
Označme si teď ,,nejzašší mez , pro kterou ještě půjde konečné pokrytí vybrat:
B = {x  [a, b], a existuje výběr konečného pokrytí [a, x]  A z C}.
Evidentně a  B, jde tedy o neprázdnou zhora ohraničenou množinu a existuje proto
c = sup B. Jde nám o to dokázat, že ve skutečnosti musí být c = b. Argumentace je
trochu nepřehledná, dokud si ji nenačrtneme na obrázku, podstata je ale snadná: Víme,
že a < c  b, předpokládejme tedy chvíli, že c < b. Protože je R \ A otevřená, pro c / A
existuje okolí bodu c obsažené v [a, b] a zároveň disjunktní s A. To by ale vylučovalo
možnost c = sup B. Zbývá tedy v takovém případě c  A a tedy je i nějaké okolí O bodu c
v otevřeném pokrytí C. Zvolme si body p < c < q v O. Opět nyní bude existovat konečné
pokrytí pro [a, q]  A. To ale značí, že q > c leží v B, což není možné. Původní volba c < b
tedy vedla ke sporu, což dokazuje požadovanou rovnost b = c. Nyní ale s pomocí okolí b,
které patří do C umíme najít konečné pokrytí v C pro celé A.
5.11.1. Určete hromadné, izolované, hraniční a vnitřní body následujících podmnožin
v R:
150 5. ZŘÍZENÍ ZOO
(1) N
(2) Q
(3) {x  R| 0  x < 1}.
Svá tvrzení zdůvodněte.
Řešení.
(1) , N, N, 
(2) R, , R, 
(3) 0, 1 , , {0, 1}, (0, 1)
5.11
5.12. Limity funkcí a posloupností. Pro diskusi limit je vhodné rozšířit množinu
reálných čísel R o dvě nekonečné hodnoty . Pro tyto účely si zavádíme i
pravidla pro počítání s těmito formálně přidanými hodnotami pro libovolná ,,konečná
čísla a  R:
a +  = 
a -  = a
  = , je-li a > 0
a   = -, je-li a < 0
Okolím nekonečna rozumíme interval (a, ), resp. (-, a) je okolí -. Pojem
hromadného bodu množin rozšiřujeme tak, že  je hromadným bodem množiny
A  R jestliže každé okolí  s ní má neprázdný průnik, tj. jestliže je A zprava
neohraničená. Obdobně pro -.
Protože je užitečné od začátku sledovat i možné komplexní hodnoty funkcí,
rozšíříme také pojem okolí do komplexní roviny. Pro kladné reálné číslo  rozumíme
-okolím komplexního čísla z  C množinu
O(z) = {w  C, |w - z| < }.
Definice. Nechť A  R je libovolná podmnožina a f : A  R je reálná funkce
(nebo f : A  C je komplexní funkce) definovaná na A a nechť x0 je hromadný
bod množiny A. Říkáme, že f má v x0 limitu a  R (nebo a  C) a píšeme
lim
xx0
f(x) = a,
jestliže pro každé okolí bodu O(a) bodu a lze najít okolí O(x0) bodu x0 takové, že
pro všechny x  A  (O(x0) \ {x0}) je f(x)  O(a).
Limita reálné funkce se nazývá nevlastní, jestliže je a = , V opačném případě
se nazává vlastní.
Je důležité si všimnout, že hodnota f v bodě x0 v definici nevystupuje a f v
tomto hromadném bodě vůbec nemusí být definována! Také je zřejmé, že nevlastní
limity komplexních funkcí nejsou definovány.
5.12 5.13. Příklady. (1) Jestliže je A = N, tj. funkce f je definována pouze pro přirozená
čísla, hovoříme o limitách posloupností reálných nebo komplexních hodnot.
Jediným hromadným bodem A je pak  a píšeme pro f(n) = an
lim
n
an = a.
2. SPOJITÉ FUNKCE 151
Podle definice to pak znamená, že pro každé okolí O(a) limitní hodnoty a existuje
index N  N takový, že an  O(a) pro všechny n  N. Ve skutečnosti jsme tedy
v tomto speciálním případě přeformulovali definici konvergence posloupnosti (viz
5.9). Říkáme také, že posloupnost an konverguje k a.
Přímo z naší definice pro komplexní hodnoty je také vidět, že komplexní posloupnost
má limitu a, právě když reálné části ai konvergují k re a a zároveň imaginární
části konvergují k im a.
(2) Jestliže je f definována na intervalu A = [a, b] a x0 je vnitřním bodem intervalu,
hovoříme o limitě funkce ve vnitřním bodě jejího definičního oboru. Podívejme
se, proč je důležité v definici požadovat f(x)  O(a) pouze pro body x = x0 i v
tomto případě. Vezměme jako příklad funkci f : R  R
f(x) =
0 je-li x = 0
1 je-li x = 0.
Pak zjevně limita v nule je dobře definována a limx0 = 0, přestože f(0) = 1 do
malých okolí limitní hodnoty 0 nepatří.
(3) Je-li A = [a, b] ohraničený interval a x0 = a nebo x0 = b, hovoříme o
limitě v hraničním bodě definičního oboru funkce f. Jestliže je ale bod x0 vnitřním
bodem, můžeme pro účely výpočtu limity definiční obor zúžit na [x0, b] nebo [a, x0].
Výsledným limitám pak říkáme limita zprava, resp. limita zleva pro funkci f v bodě
x0. Označujeme ji výrazem limxx+
0
f(x), resp. limxx-
0
f(x). Jako příklad nám
může sloužit limita zprava a zleva v x0 = 0 pro Heavisideovu funkci h z úvodu této
části. Evidentně je
lim
x0+
h(x) = 1, lim
x0h(x)
= 0.
Limita limx0 f(x) přitom neexistuje. Je snadné dokázat, že limita ve vnitřním
bodu definičního oboru libovolné reálné funkce f existuje, právě když existují limity
zprava i zleva a jsou si rovny.
(4) Limita komplexní funkce f : A  C existuje tehdy a jen tehdy, jestliže
existují limity její reálné a imaginární části. V takovém případě je pak
lim
xx0
f(x) = lim
xx0
(re f(x)) + i lim
xx0
(im f(x)).
(5) Nechť f je reálný nebo komplexní polynom. Pak pro každý bod x  R je
lim
xx0
f(x) = f(x0).
Skutečně, je-li f(x) = anxn
+  +a0, pak roznásobením (x0 +)k
= xk
0 +kxk-1
0 +
   + k
a dosazením pro k = 0, . . . , n vidíme, že volbou dostatečně malého  se
hodnotou libovolně blízko přiblížíme f(x0).
(6) Uvažme nyní obzvlášť ošklivou funkci definovanou na celém R
f(x) =
1 je-li x  Q
0 jestliže x / Q.
Jistě snadno ověříte, že tato funkce nemá limitu v žádném bodě (dokonce ani zleva
nebo zprava).
(7) Ale definice spojitosti je ještě záludnější, než jsme viděli v předchozím
případě. Definujme následující funkci f : R  R:
f(x) =
1
q jestliže x = p
q  Q, p a q nesoudělná
0 jestliže x / Q
152 5. ZŘÍZENÍ ZOO
Tato funkce je spojitá ve všech iracionálních bodech a nespojitá ve všech racionálních
realných bodech. Důkaz přenecháváme jako cvičení.
5.14. Věta. Věta o třech limitách. Buď f, g, h reálné funkce takové, že existuje
okolí bodu x0  R, kde platí f(x)  g(x)  h(x). Pak pokud existují limity
lim
xx0
f(x) = f0 a lim
xx0
h(x) = h0 a navíc f0 = h0, pak také existuje limita
lim
xx0
g(x) = g0 a platí g0 = f0 = h0.
Důkaz. Z definice limity, pro libovolné  > 0 existuje okolí U bodu x0, ve
kterém je f(x), h(x)  (g0 - , g0 + ). z podmínky f(x)  g(x)  h(x) vyplývá, že
i g(x)  (g0 - , g0 + ), tedy lim
xx0
g(x) = g0.
5.13 5.15. Věta. Nechť A  R je definiční obor reálných nebo komplexních funkcí f a
g, x0 nechť je hromadný bod A a existují limity
lim
xx0
f(x) = a  R, lim
xx0
g(x) = b  R.
Potom:
(1) limita a je určena jednoznačně,
(2) limita součtu f + g existuje a platí
lim
xx0
(f(x) + g(x)) = a + b,
(3) limita součinu f  g existuje a platí
lim
xx0
(f(x)  g(x)) = a  b,
(4) pokud navíc b = 0, pak limita podílu f/g existuje a platí
lim
xx0
f(x)
g(x)
=
a
b
.
Důkaz. (1) Předpokládejme, že a a a jsou dvě hodnoty limity limxx0 f(x).
Pokud je a = a , pak existují disjunktní okolí O(a) a O(a ). Pro dostatečně malá
okolí x0 ale mají hodnoty f ležet v obou naráz, což je spor. Proto je a = a .
(2) Zvolme si nějaké okolí a + b, třeba O2 (a + b). Pro dostatečně malé okolí x0
a x = x0 bude jak f(x), tak g(x) v ­okolích bodů a a b. Proto jejich součet bude
v 2 ­okolí kýžené hodnoty a + b. Tím je důkaz ukončen.
(3) Obdobně postupujeme u součinu s O 2 (ab). Pro malá okolí x0 se nám hodnoty
f i g trefí do ­okolí hodnot a a b. Proto jejich součin bude v požadovaném
2
­okolí.
(4) Podobný postup ponechán jako cvičení.
Poznámka. Podrobnějším sledováním důkazů jednotlivých bodů věty můžeme její
tvrzení rozšířit i na některé nekonečné hodnoty limit: V prvém případě je zapotřebí,
aby buď alespoň jedna z limit byla konečná nebo aby obě měly stejné znaménko.
Pak opět platí že limita součtu je součet limit s konvencemi z 5.12. Případ ,,ale
není zahrnut.
V druhém případě může být jedna z limit nekonečná a druhá nenulová. Pak
opět platí, že limita součinu je součin limit. Případ ,,0  () není ale zahrnut.
V případě podílu může být a  R a b = , kdy výsledek limity bude nula,
nebo a =  a b  R, kde výsledek bude  podle znamének čitatele a jmenovatele.
Případ ,,
 není zahrnut.
2. SPOJITÉ FUNKCE 153
Zdůrazněme, že naše věta jako speciální případ pokrývá také odpovídající tvrzení
o konvergenci posloupností.
5.15.1. Spočítejte následující limity posloupností:
(1) lim
n
2n2
+3n+1
n+1 ,
(2) lim
n
2n2
+3n+1
3n2+n+1 ,
(3) lim
n
n+1
2n2+3n+1 ,
(4) lim
n

4n2+n
n ,
(5) lim
n

4n2 + n - 2n.
Řešení.
(1) lim
n
2n2
+3n+1
n+1 = lim
n
2n+3+ 1
n
1+ 1
n
= .
(2) lim
n
2n2
+3n+1
3n2+n+1 = lim
n
2+ 3
n + 1
n2
3+ 1
n + 1
n2
= 2
3 .
(3) lim
n
n+1
2n2+3n+1 = lim
n
1+ 1
n
2n+3+ 1
n
= 1
 = 0.
(4) Podle věty o třech limitách: n  N :

4n2
n <

4n2+n
n <

4n2+n+ 1
16
n .
Dále pak
lim
n

4n2
n
= lim
n
2n
n
= 2,
lim
n
4n2 + n + 1
16
n
= lim
n
2n + 1
4
n
= 2.
Tedy i
lim
n

4n2 + n
n
= 2
.
(5)
lim
n
4n2 + n - 2n = lim
n
(

4n2 + n - 2n)(

4n2 + n + 2n)

4n2 + n + 2n
= lim
n
n

4n2 + n + 2n
=
= lim
n
1

4n2+n
n + 2
=
1
4
5.14
5.16. Spojité funkce. Nechť f je reálná nebo komplexní funkce definovaná na
intervalu A  R. Říkáme, že f je spojitá v bodě x0  A, jestliže je
lim
xx0
f(x) = f(x0).
Funkce f je spojitá na A, jestliže je spojitá ve ve všech bodech x0  A.
Všiměme si, že pro hraniční body intervalu A říká naše definice, že f v nich má
být spojitá zprava, resp. zleva. Již jsme také viděli, že každý polynom je spojitou
funkcí na celém R, viz 5.13(5).
Z předchozí věty okamžitě vyplývá většina následujících tvrzení
154 5. ZŘÍZENÍ ZOO
Věta. Nechť f a g jsou spojité funkce na intervalu A. Pak
(1) součet f + g je spojitá funkce
(2) součin f  g je spojitá funkce
(3) pokud navíc g(x0) = 0, pak podíl f/g je dobře definován v nějakém okolí x0 a
je spojitý v x0.
(4) pokud spojitá funkce h je definována na okolí hodnoty f(x0), pak složená funkce
h  f je definována na okolí bodu x0 a je v x0 spojitá.
Důkaz. Tvrzení (1) a (2) jsou zřejmá, doplnit důkaz potřebujeme u tvrzení
(3). Jestliže je g(x0) = 0, pak také celé ­okolí čísla g(x0) neobsahuje nulu pro
dostatečně malé > 0. Ze spojitosti g pak vyplývá, že na dostatečně malém ­okolí
x0 bude g neulové a podíl f/g tam bude tedy dobře definován. Pak bude ovšem i
spojitý v x0 podle předchozí věty.
(4) Zvolme nějaké okolí O hodnoty h(f(x0)). Ze spojitosti h k němu existuje
okolí O bodu f(x0), které je celé zobrazeno funkcí h do O. Do tohoto okolí O
spojité zobrazení f zobrazí dostatečně malé okolí bodu x0. To je ale právě definiční
vlastnost spojitosti a důkaz je ukončen.
Nyní si vcelku snadno můžeme odvodit zásadní souvislosti spojitých zobrazení
a topologie reálných čísel:
5.15 5.17. Věta. Nechť f : R  R je spojitá funkce. Pak
(1) vzor f-1
(U) každé otevřené množiny je otevřená množina,
(2) vzor f-1
(W) každé uzavřené množiny je uzavřená množina,
(3) obraz f(K) každé kompaktní množiny je kompaktní množina,
(4) na libovolné kompaktní množině K dosahuje spojité zobrazení maxima a mi-
nima.
Důkaz. (1) Uvažme nějaký bod x0  f-1
(U). Nějaké okolí O hodnoty f(x0)
je celé v U, protože je U otevřená. Pak ovšem existuje okolí O bodu x0, které se
celé zobrazí do O, patří tedy do vzoru. Každý bod vzoru je tedy vnitřní a tím je
důkaz ukončený.
(2) Uvažme nějaký hromadný bod x0 vzoru f-1
(W) a nějakou posloupnost xi,
f(xi)  W, která k němu konverguje. Ze spojitosti f nyní zjevně vyplývá, že f(xi)
konverguje k f(x0), a protože je W uzavřená, musí i f(x0)  W. Zřejmě jsou tedy
všechny hromadné body vzoru W ve W také obsaženy.
(3) Zvolme libovolné otevřené pokrytí f(K). Vzory jednotlivých intervalů budou
sjednoceními otevřených intervalů a tedy také vytvoří pokrytí množiny K. Z
něho lze vybrat konečné pokrytí a proto nám stačilo konečně mnoho odpovídajících
obrazů k pokrytí původní množiny f(K).
(4) Protože je obrazem kompaktní množiny opět kompaktní množina, musí být
obraz ohraničený a zároveň musí obsahovat svoje supremum i infimum. Odtud ale
vyplývá, že tyto musí být zároveň maximem a minimem hodnot.
5.16 5.18. Důsledek. Nechť f : R  R je spojitá. Potom
(1) obraz každého intervalu je opět interval
(2) f na uzavřeném intervalu [a, b] nabývá všech hodnot mezi svou maximální a
minimální hodnotou.
Důkaz. (1) Uvažme nějaký interval A (a ponechme stranou, jestli je A uzavřený
nebo otevřený, ať už zleva nebo zprava) a předpokládejme, že existuje bod
2. SPOJITÉ FUNKCE 155
y  R takový, že f(A) obsahuje body menší i větší než y, ale y / f(A). Znamená
to tedy, že pro otevřené množiny B1 = (-, y) a B2 = (y, ) jejich vzory
A1 = f-1
(B1) a A2 = f-1
(B2) pokrývají A. Tyto množiny jsou přitom opět otevřené,
jsou disjunktní a obě mají neprázdný průnik s A. Nutně tedy musí existovat
bod x  A, který neleží v B1, je ale jejím hromadným bodem. Musí však ležet
v B2 a to u disjunktních otevřených množin není možné. Dokázali jsme tedy, že
pokud nějaký bod y nepatří do obrazu intervalu, musí být všechny hodnoty buď
zároveň větší nebo zároveň menší. Odtud vyplývá, že obrazem bude opět interval.
Všimněme si, že jeho krajní body mohou a nemusí do obrazu patřit.
(2) Toto tvrzení je přímým důsledkem předchozího.
5.17
5.19. Přírůstky do ZOO. Zatím jsme v podstatě pracovali pouze s polynomy a
s funkcemi, které se z nich dají vyrobit ,,po částech . Zároveň jsme dovodili spoustu
vlastností pro obrovskou třídu spojitých funkcí, nemáme ale zatím moc prakticky
zvladatelných příkladů. Naše úvahy nám teď umožňují alespoň trochu rozšířit naši
zásobárnu funkcí.
(1) Nechť f a g jsou dva polynomy, které mohou mít i komplexní hodnoty (tj.
připouštíme výrazy anxn
+  +a0 s komplexními ai  C, ale dosazujeme jen reálné
hodnoty za x). Pak funkce
h : R \ {x  R, g(x) = 0}  C
h(x) =
f(x)
g(x)
je dobře definována ve všech reálných bodech kromě kořenů polynomu g. Takové
funkce nazýváme racionální funkce. Z věty 5.16 vyplývá, že racionální funkce jsou
spojité ve všech bodech svého definičního oboru. V bodech, kde definovány nejsou
mohou mít
* konečnou limitu, když jde o společný kořen polynomů f i g (a v tomto případě
rozšířením jejich definice o limitní hodnotu v tomto bodě dostaneme funkci i v
tomto bodě spojitou)
* nekonečnou limitu, když limity zprava a zleva v tomto bodě jsou stejné
* různé nekonečné limity zprava a zleva.
Názorně je možné tuto situaci vidět na obrázku, který ukazuje hodnoty funkce
h(x) =
(x - 0.05a)(x - 2 - 0.2a)(x - 5)
x(x - 2)(x - 4)
pro hodnoty a = 0 (obrázek vlevo tedy vlastně zobrazuje racionální funkci (x -
5)/(x - 4)) a pro a = 5/3.
156 5. ZŘÍZENÍ ZOO
y
x
6
5
4
2
4
0
-2
3
-4
-6
210-1
a=0.
y
x
6
5
4
2
4
0
-2
3
-4
-6
210-1
a=1.6667
(2) Polynomy jsou pomocí sčítání a násobení skaláry seskládány z jednoduchých
mocninných funkcí x  xn
s přirozených číslem n = 0, 1, 2, . . . . Samozřejmý smysl
má také funkce x  x-1
pro všechny x = 0. Tuto definici teď rozšíříme na obecnou
mocninnou funkci s n  R.
Pro n = -a s a  N definujeme
x-a
= (xa
)-1
= (x-1
)a
.
Dále jistě chceme, aby ze vztahu bn
= x pro n  N vyplývalo b = x
1
n . Je třeba ale
ověřit, že taková b skutečně existují. Předpokládejme x > 0 a označme B množinu
B = {y  R, y > 0, yn
 b}. To je zřejmě zhora ohraničená množina a lze ověřit,
že pro b = sup M skutečně platí požadovaná rovnost.
Zdůvodnili jsme tedy existenci xa
pro všechny x > 0 a a  Q. Konečně, pro
a  R, x > 1 klademe
xa
= sup{xy
, y  Q, y  a}.
Pro 0 < x < 1 buď definujeme analogicky (je třeba si jen pohrát s nerovnítky) nebo
klademe přímo xa
= (1
x )-a
. Pro x = 1 je pak 1a
= 1 pro libovolné a.
Obecnou mocninnou funkci x  xa
máme tedy dobře definovanou pro všechny
x  [0, ) a a  R. Naši konstrukci ale můžeme také číst následujícím způsobem:
Pro každé pevné reálné c > 0 existuje dobře definovaná funkce na celém R, y  cy
.
Této funkci říkáme exponenciální funkce o základu c.
Na obrázcích vidíme funkce x  ax
a x  xb
pro jednu konkrétní hodnotu
a = 2.5167 a b = 4.5833.
3. DERIVACE 157
20
0
0
-2-4
y
b
100
4
80
60
2
40
a=2.5167
a
32,5
y
2
100
80
1,5
60
40
1
20
0
0,5
b=4.5833
Z našich definic je vcelku zřejmé, že mocninné i exponenciální funkce jsou spojité
na celých svých definičních oborech. Zároveň se ze spojitosti definice pomocí
suprem množin hodnot zjevně přenáší základní vlastnosti platné pro racionální
čísla, a, x, y:
e5.3a (5.5) ax
 ay
= ax+y
, (ax
)y
= axy
.
5.20. Příklady.
5.20.1. Buď c  R+
(kladné reálné číslo). Ukážeme, že lim
n
n

c = 1.
Řešení. Uvažme nejprve c > 1. Vzhledem k tomu, že funkce n

c je vzhledem k n
klesající a její hodnoty jsou stále větší než 1, tak musí mít posloupnost n

c limitu
a tou je infimum jejich členů. Předpokládejme, že by tato limita byla větší než 1,
řekněme 1 + , kde  > 0. Pak by podle definice limity byly všechny hodnoty dané
posloupnosti od jistého m menší než 1 +  + 2
4 , t.j. zejména m

c < 1 +  + eps2
4 .
Potom by však
2m

c = m

c < 1 +  +
2
4
= 1 +

2
< 1 + ,
což je spor s tím, že 1 +  je infimem dané posloupnosti.
5.20.2. Určete limitu
lim
x0
1 - cos x
x2 sin(x2)
Řešení. .
3. Derivace
U polynomů jsme již v odstavci 5.5 diskutovali, jak popisovat jednoduše velikost
růstu hodnot polynomu kolem daného bodu jeho definičního oboru. Tehdy jsme
pozorovali podíl (5.2), který vyjadřoval směrnici sečny mezi body [x, f(x)]  R2
a
[x + x, f(x + x)]  R2
pro (malý) přírůstek x nezávisle proměnné. Tehdejší
úvaha funguje zrovna stejně pro libovolnou reálnou nebo komplexní funkci f, jen
musíme místo intuitivního ,,zmenšování přírůstku x pracovat s pojmem limity.
158 5. ZŘÍZENÍ ZOO
5.18 5.21. Definice. Nechť f je reálná nebo komplexní funkce s definičním oborem
A  R a x0  A. Jestliže existuje limita
lim
xx0
f(x) - f(x0)
x - x0
= a
pak řídáme, že f má v bodě x0 derivaci a. Píšeme často a = f (x0) nebo a = df
dx (x0)
případně a = d
dx f(x0).
Derivace funkce je vlastní, resp. nevlastní, když je takovou příslušná limita.
Jednostranné derivace (tj. derivaci zprava a zleva) definujeme zcela stejně pomocí
limity zprava a zleva.
Z formulace definice lze očekávat, že f (x0) bude opět umožňovat dobře aproximovat
danou funkci pomocí přímky
y = f(x0) + f (x0)(x - x0).
Takto lze snad vnímat následující lemma, které říká, že nahrazením konstantního
koeficientu f (x0) spojitou funkcí dostaneme přímo hodnoty f.
Lemma. Reálná nebo komplexní funkce má v bodě x0 vlastní derivaci, právě když
existuje na nějakém okolí O(x0) funkce  spojitá v x0 a taková, že pro všechny
x  O(x0) platí
f(x) = f(x0) + (x)(x - x0).
Navíc pak vždy (x0) = f (x0).
Důkaz. Nejprve předpokládejme, že f (x0) je vlastní derivace. Pokud má 
existovat, má jistě tvar (x) = (f(x) - f(x0))/(x - x0) pro všechny x  O \ {x0}.
V bodě x0 naopak definujme hodnotu derivací. Pak jistě
lim
xx0
(x) = f (x0) = (x0)
jak je požadováno.
Naopak, jestliže taková funkce  existuje, tentýž postup vypočte její limitu v
x0. Proto existuje i f (x0) a je (x0) rovna.
5.18a
5.22. Geometrický význam derivace. Předchozí lemma lze názorně vysvětlit
geometricky a tím popsat smysl derivace. Říká totiž, že na grafu funkce y = f(x),
tj. na příslušné křivce v rovině se souřadnicemi x a y, poznáme, zda existuje derivace
podle toho, jestli se spojitě mění hodnota směrnice sečny procházející body
[x0, f(x0)] a [x, f(x)]. Pokud ano, pak limitní hodnota této směrnice je hodnotou
derivace.
Důsledek. Má-li reálná funkce f v bodě x0  R derivaci f (x0) > 0, pak pro nějaké
okolí O(x0) platí f(b) > f(a) pro všechny body a, b  O(x0), b > a.
Je-li derivace f (x0) < 0, pak naopak pro nějaké okolí O(x0) platí f(b) < f(a)
pro všechny body a, b  O(x0), b > a.
Důkaz. Uvažme prvý případ. Pak podle předchozího lematu platí f(x) =
f(x0) + (x)(x - x0) a (x0) > 0. Protože je ale  v x0 spojitá, musí existovat
okolí O(x0), na kterém bude (x) > 0. Pak ale s rostoucím x nutně poroste i
hodnota f(x).
Stejná argumentace ověří i tvrzení se zápornou derivací.
3. DERIVACE 159
Funkce, které mají vlastnost f(b) > f(a) kdykoliv b > a pro nějaké okolí
bodu x0 se nazývají rostoucí v bodě x0. Funkce rostoucí ve všech bodech nějakého
intervalu se nazývá rostoucí na intervalu. Podobně je funkce klesající v bodu, resp.
klesající na intervalu, jestliže f(b) < f(a) kdykoliv je a < b. Náš důsledek tedy
říká, že funkce která má v bodě nenulovou konečnou derivaci je v tomto bodě buď
rostoucí nebo klesající podle znaménka této derivace.
5.19
5.23. Pravidla pro počítání. Uveďme si nyní několik základních tvrzení o výpočtech
derivací. Říkají nám, jak dobře se snáší operace derivování s algebraickou
strukturou sčítání a násobení na reálných nebo komplexních funkcích. Poslední z
pravidel pak umožňuje efektivní výpočet derivace složených funkcí a říkává se mu
,,chain rule . Intuitivně jim můžeme všem velice snadno rozumět, když si derivaci
funkce y = f(x) představíme jako podíl přírůstků závislé proměnné y a nezávislé
proměnné x:
f =
y
x
.
Samozřejmě pak při y = h(x) = f(x) + g(x) je přírůstek y dán součtem přírůstků
f a g a přírůstek závislé proměnné zůstává stejný. Je tedy derivace součtu součtem
derivací.
U součinu musíme být malinko pozornější. Pro y = h(x) = f(x)g(x) je přírůstek
y = f(x + x)g(x + x) - f(x)g(x)
= f(x + x)(g(x + x) - g(x)) + (f(x + x) - f(x))g(x)
Nyní ale když budeme zmenšovat přírůstek x, jde vlastně o výpočet limity součtu
součinů a o tom už víme, že jej lze počítat jako součet součinů limit. Proto z naší
formulky lze očkávat pro derivaci součinu fg výraz fg + f g.
Ještě zajímavější je to pro derivaci složené funkce g = h  f, kde definiční obor
funkce z = h(y) obsahuje obor hodnot funkce y = f(x). Opět vypsáním přírůstků
dostáváme
g =
z
x
=
z
y
y
x
.
Můžeme tedy očekávat, že pravidlo pro výpočet bude (h  f) (x) = h (f(x))f (x).
Podáme nyní korektní formulace a důkaz:
Věta. Nechť f a g jsou reálné nebo komplexní funkce definované na okolí bodu
x0  R a mající v tomto bodě vlastní derivaci. Potom
(1) funkce f je v bodě x0 spojitá,
(2) pro každé reálné nebo komplexní číslo c má funkce x  c  f(x) derivaci v x0 a
platí
(cf) (x0) = c(f (x0)),
(3) funkce f + g má v x0 derivaci a platí
(f + g) (x0) = f (x0) + g (x0),
(4) funkce f  g má v x0 derivaci a platí
(f  g) (x0) = f (x0)g(x0) + f(x0)g (x0).
(5) Je-li dále h funkce definovaná na okolí obrazu y0 = f(x0), která má derivaci v
bodě y0, má také složená funkce h  f derivaci v bodě x0 a platí
(h  f) (x0) = h (f(x0))  f (x0)
160 5. ZŘÍZENÍ ZOO
Důkaz. (1) Předpokládejme, že f (x0) existuje a je vlastní (tj. není nekonečná).
Pak můžeme vyjádřit pro každé x = x0
f(x) =
f(x) - f(x0)
x - x0
(x - x0) + f(x0).
Protože je ale limita součtu a součinu funkcí dána jako součet a součin limit (viz
Věta 5.15), dostáváme
lim
xx0
f(x) = f (x0)  0 + lim
xx0
f(x0) = f(x0),
což ověřuje spojitost f v x0.
(2) a (3) Opět přímé použití věty o součtech a součinech limit funkcí dává
výsledek.
(4) Přepíšeme vztah pro podíl přírůstků, který jsme zmínili před formulací věty,
takto
(f  g)(x) - (f  g)(x0)
x - x0
= f(x)
g(x) - g(x0)
x - x0
+
f(x) - f(x0)
x - x0
g(x0).
Limita tohoto výrazu pro x  x0 dá právě požadovaný výsledek, protože je funkce
f spojitá v x0.
(5) Podle předchozího lematu existují funkce  a  spojité v bodech x0 a
y0 = f(x0) takové, že
h(y) = h(y0) + (y)(y - y0), f(x) = f(x0) + (x)(x - x0)
na nějakých okolích x0 a y0. Navíc pro ně platí (x0) = f (x0) a (y0) = h (y0).
Pak ovšem také platí
h(f(x)) - h(f(x0)) = (f(x))(f(x) - f(x0)) = (f(x))(x)(x - x0)
pro x z okolí bodu x0. Součin (f(x))(x) je ovšem spojitá funkce v x0 a její
hodnota v bodě x0 je právě požadovaná derivace složené funkce.
Důsledek. Nechť f a g jsou reálné funkce, která mají v bodě x0 vlastní derivace a
g(x0) = 0. Pak pro funkci h(x) = f(x)(g(x))-1
platí
h (x0) =
f
g
(x0) =
f (x0)g(x0) - f(x0)g (x0)
(g(x0))2
.
Důkaz. Dokážeme si speciální případ formulky pro h(x) = x-1
. Přímo z definice
derivace dostáváme
h (x) = lim
x0
1
x+x - 1
x
x
= lim
x0
x - x - x
x(x2 + xx)
= lim
x0
-1
x2 + xx
.
Z pravidel pro počítání limit okamžitě dostáváme
h (x0) = -x-2
.
Nyní pravidlo pro derivaci složené funkce říká, že (g-1
) = -g2
 g a konečně
pravidlo pro derivaci součinu nám dává právě kýžený vzorec:
(f/g) = (f  g-1
) = f g-1
- fg-2
g =
f g - gf
g2
.
3. DERIVACE 161
5.20
5.24. Derivace inverzních funkcí. V odstavci 1.43 jsme při obecné diskusi relací
a zobrazení formulovali pojem inverzní funkce. Pokud k dané funkci f : R  R
inverzní funkce f-1
existuje (nezaměňujme značení s funkcí x  (f(x))-1
), pak je
dána jednoznačně kterýmkoliv ze vztahů
f-1
 f = idR, f  f-1
= idR,
a druhý již pak platí také. Pokud je f definováno na podmnožině A  R a f(A) = B,
je existence f-1
podmíněna stejnými vztahy s identickými zobrazeními idA resp.
idB na pravých stranách.
Pokud bychom věděli, že pro diferencovatelnou funkci f je i f-1
diferencovatelná,
pravidlo pro derivaci složené funkce nám říká
1 = (id) (x) = (f-1
 f) (x) = (f-1
) (f(x))  f (x)
a tedy přímo víme formuli (zjevně f (x) v takovém případě nemůže být nulové)
e5.5 (5.6) (f-1
) (f(x)) =
1
f (x)
.
To dobře odpovídá intuitivní představě, že pro y = f(x) je f = y
x zatímco pro
x = f-1
(y) je (f-1
) (y) = x
y . Takto skutečně můžeme derivace inverzních funkcí
počítat:
Věta. Je-li f diferencovatelná funkce na okolí bodu x0 a f (x0) = 0, pak existuje
na nějakém okolí bodu y0 = f(x0) funkce f-1
inverzní k f a platí vztah (5.6).
Pokud je f (x0) = 0 izolovaným nulovým bodem derivace f (x) a inverzní
funkce k f na okolí f(x0) existuje, pak limity zprava i zleva funkce f jsou v bodě
x0 nevlastní.
Důkaz. Nejprve si povšimněme, že nenulovost derivace znamená, že na nějakém
okolí je naše funkce f buď ostře rostoucí nebo klesající, viz důsledek 5.22.
Proto na nějakém okolí nutně existuje inverzní funkce. Přímo z definice spojitosti
pomocí okolí je pak tato inverzní funkce také spojitá.
Pro odvození našeho tvrzení nyní postačí pozorně znovu pročíst důkaz pátého
tvrzení věty 5.23. Jen volíme f místo funkce h a f-1
místo f a místo předpokladu
existence derivací pro obě funkce víme, že funkce složená je diferencovatelná (a
víme, že její derivace je identita): Skutečně, podle lematu 5.21 existuje funkce 
spojitá v bodě y0 taková, že
f(y) - f(y0) = (y)(y - y0),
na nějakém okolí y0. Navíc pro ni platí (y0) = f (y0). Pak ovšem po dosazení
y = f-1
(x) také platí
x - x0 = (f-1
(x))(f-1
(x) - f-1
(x0)),
pro x z nějakého okolí O(x0) bodu x0. Dále platí f-1
(x0) = y0 a protože je f
buď ostře rostoucí nebo klesající, je (f-1
(x)) = 0 pro všechny x  O(x0) \ {x0}.
Můžeme tedy psát
f-1
(x) - f-1
(x0)
x - x0
=
1
(f-1(x))
= 0,
162 5. ZŘÍZENÍ ZOO
pro všechny x  O(x0) \ {x0}. Pravá strana tohoto výrazu je spojitá v bodě x0 a
limita je rovna (y0) = (f (y0))-1
, proto i limita levé strany existuje a je rovna
témuž výrazu.
Předpokládejme, že je x0 izolovaný nulový bod derivace f a že inverzní funkce
na nějakém okolí f(x0) existuje. Pak je f na okolí bodu x0 nenulová, její hodnota
se ale blíží nule. Proto má nalevo i napravo derivaci i inverzní funkce a na nějakém
levém, resp. pravém, okolí bodu x0 tato nemění znaménko. Odtud již vyplývá, že
existují limity zprava i zleva pro f v bodě x0 a jsou nevlastní.
5.22
5.25. Derivace vyšších řádů. Říkáme, že reálná nebo komplexní funkce f má v
bodě x0 derivaci druhého řádu v bodě x0, jestliže derivace f existuje na nějakém
okolí bodu x0 a existuje její derivace v bodě x0. Píšeme
f (x0) = (f ) (x0)
nebo také f(2)
(x0). Funkce f je dvakrát diferencovatelná na nějakém intervalu A,
jestliže má druhou derivaci v každém jeho bodě.
Derivace vyšších řádů definujeme induktivně. Známe již pojem první a druhá
derivace a říkáme, že reálná nebo komplexní funkce f je k-krát diferencovatelná
pro nějaké přirozené číslo k v bodě x0, jestliže je (k - 1)-krát diferencovatelná na
nějakém okolí bodu x0 a její (k - 1)-ní derivace má v bodě x0 derivaci.
Pro k-tou derivaci funkce f(x) užíváme značení f(k)
(x).
Jestliže existují derivace všech řádů na intervalu, říkáme, že je tam funkce f
hladká. Většinou se také užívá konvence, že 0-krát diferencovatelná funkce znamená
spojitá funkce. Používáme pro takové funkce označení třída funkcí Ck
(A) na
intervalu A, kde k může nabývat hodnot 0, 1, . . . , . Často píšeme pouze Ck
, je-li
definiční obor znám z kontextu.
Ilustrovat můžeme rychle pojem derivace vyššího řádu na polynomech. Protože
výsledkem derivování polynomu je opět polynom, ale derivací se vždy o jedničku
snižuje jeho stupeň, dostaneme po konečném počtu derivací nulový polynom. Přesněji
řečeno, právě po k + 1 derivacích, kde k je stupeň polynomu, dostaneme nulu.
Samozřejmě pak existují derivace všech řádů, tj. f  C
(R).
Při konstrukci splajnů, viz 5.7, jsme pohlídali, aby výsledné funkce byly třídy
C2
(R). Jejich třetí derivace budou po částech konstantní funkce. Proto nebudou
splajny patřit do C3
(R), přestože jejich všechny derivace vyšších řádů budou nulové
ve všech vnitřních bodech jednotlivých intervalů v interpolaci. Promyslete si
podrobně tento příklad!
5.26. Zvěřinec. Zatím máme shromážděny ctyři typy funkcí:
* polynomy f definované na celém R s hodnotami v R nebo v C,
* racionální funkce f/g definované na celém R kromě nejvýše konečné množiny
kořenů polynomu g ve jmenovateli zlomku, s hodnotami v R nebo C,
* mocninné funkce xb
s obecným b  R, definované pro x > 0 a hodnotami v R,
* exponenciální funkce ax
o libovolném základu a > 0 definované pro všechna
x  R a s hodnotami v R.
Polynomy. Derivace polynomů jsme spočítali již v odstavci 5.5. Ilustrujme naše
nástroje pro výpočet derivací při diskusi kořenů polynomů. Předně platí tzv. základní
věta algebry, kterou však nebudeme dokazovat:
3. DERIVACE 163
Věta. Každý nenulový komplexní polynom f : C  C stupně alespoň jedna má
kořen.
Nutně tedy polynom stupně k > 0 má právě k kořenů včetně násobností a
můžeme jej vždy psát jednoznačně ve tvaru
f(x) = (x - a1)c1
 (x - aq)cq
kde a1, . . . , aq jsou všechny kořeny polynomu f a 1  c1, . . . , cq  k jsou jejich
násobnosti. Derivací dostaneme
f (x) = c1(x - a1)c1-1
. . . (x - aq)cq
+    + cq(x - a1)c1
. . . (x - aq)cq-1
.
Jestliže je c1 = 1, bude hodnota derivace f v bodě a1 nenulová, protože první člen
výrazu je nenulový, zatímco všechny zbývající po dosazení hodnoty x = a1 zmizí.
Oddobně to bude i s ostatními kořeny. Ověřili jsme tedy užitečnou vlastnost, že
kořen a polynomu f je vícenásobný tehdy a jen tehdy, když je zároveň kořenem
derivace f .
Protože polynomy jen zřídka jsou výhradně rostoucí nebo klesající funkce, nemůžeme
očekávat, že by existovaly globálně definované inverzní funkce k nim. Naopak
ovšem inverzní funkce k polynomu f existují na každém intervalu mezi kořeny
derivace f , tj. tam kde derivace polynomu je nenulová a nemění znaménko. Tyto
inverzní funkce nebudou nikdy polynomy, až na případ polynomů stupně jedna, kdy
z rovnice
y = ax + b
spočteme přímo
x =
1
a
(y - b).
U polynomu druhého řádu obdobně
y = ax2
+ bx + c
vede k formuli
x =
-b  b2 - 4a(c - y)
2a
,
a inverze tedy existuje (a je dána touto formulí) jen pro x na intervalech (-, - b
2a ),
(- b
2a , ).
Pro práci s inverzními funkcemi k polynomům nevystačíme s našimi funkcemi
a dostáváme v našem zvířetníku nové přírůstky.
Racionální funkce. Všechny racionální funkce jsou také třídy C
ve všech bodech
svého definičního oboru. Jejich derivace se snadno počítá pomocí formule pro
derivaci podílu. Samozřejmě bude také racionální funkcí.
Inverze také budou jako u polynomů existovat obecně jen lokálně a jsou novými
přírůstky do našeho společenstva funkcí.
Mocninné funkce. Obecnou mocninou funkci není tak snadné zderivovat, i když
bychom mohli věřit, že formulka
e5.6 (5.7) (xa
) = axa-1
známá pro přirozená a bude platit i pro obecné a. K tomu totiž máme dobrý důvod,
protože ji umíme přímo ověřit pro racionální a = p/q. Je-li a celé a záporné, pak
tvrzení přímo vidíme z věty o složené funkci:
(x-n
) = ((xn
)-1
) = -(xn
)-2
nxn-1
= -nx-2n+n-1
= -nx-n-1
.
164 5. ZŘÍZENÍ ZOO
Pokračujme dále s odmocninami, tj. a = 1/q. Pišme x = h(y) = y1/q
, y = xq
a
počítejme podle věty o derivaci inverzní funkce
h (y) =
1
q
1
xq-1
=
1
q
y-(q-1)/q
=
1
q
y1/q-1
.
Pro obecné racionální a = p/q máme
(xp/q
) = ((x1/q
)p
) = p(x1/q
)p-1 1
q
x1/q-1
=
p
q
xp/q-1
.
Nyní bychom mohli zvládnout důkaz platnosti formule (5.7) pomocí spojitosti
definice mocninné funkce xa
v parametru a. Vrátíme se raději k důkazu z jiného
pohledu za malou chvíli.
Funkce f(x) = x0
= 1 má samozřejmě derivaci nulovou, pro všechny jiné
hodnoty a = 0 je derivace nenulová. Je záporná pro a  (0, 1), kladná pro a 
(1, ). Proto je mocninná funkce na celém definičním oboru (0, ) klesající v
prvém případě a rostoucí v druhém. Její inverzní funkce je opět mocninnou funkcí.
Exponenciální funkce. Zbývají nám funkce f(x) = ax
. Zde se také budeme s
derivací poněkud potýkat. Pokud budeme umět derivovat ax
ve všech bodech x,
bude jistě platit
f (x) = lim
x0
ax+x
- ax
x
= ax
lim
x0
ax
- 1
x
= f (0)ax
.
Naopak, pokud existuje derivace v nule, pak tento výpočet ověřuje existenci derivace
v kterémkoliv bodě a dává její hodnotu. Zároveň jsme ověřili platnost téhož vztahu
pro derivace zprava a zleva.
Exponenciální funkce jsou tedy zvláštními případy funkcí, kdy jejich derivace
jsou úměrné hodnotám s konstantním koeficientem úměrnosti.
Spočtěme derivaci f (0), tj. výraz
lim
x0
ax
- 1
x
a předpokládejme, že naše a > 1. Z definice hodnot exponenciální funkce pomocí suprem množin
hodnot s racionálními x je zjevné, že exponenciální funkce ax
je na celém svém definičním
oboru rostoucí. Stačí nám proto při výpočtu derivace zprava dosazovat za x postupně hodnoty
xn = 1/n a dostaneme
lim
x0+
ax
- 1
x
= lim
n
a1/n
- 1
1/n
.
Zkusíme najít takové a, aby limita existovala a byla rovna jedné. Toho dosáhneme, pokud
budeme umět s rostoucím n libovolně dobře přibližovat hodnotu a1/n
k hodnotě 1 + 1/n, tj.
ekvivalentně (dle pravidel pro počítání limit) a je s rostoucím n libovolně přesně aproximováno
hodnotou
an =
,,
1 +
1
n
n
.
Z binomického rozvoje je zřejmé, že pro každé kladné číslo b a přirozené n platí (1+b)n
> 1+nb,
dostáváme proto pro dva po sobě jdoucí členy naší posloupnosti podíl
(1 + 1
n
)n
(1 + 1
n-1
)n-1
=
(n2
- 1)n
n
n2n(n - 1)
=
,,
1 -
1
n2
n
n
n - 1
> (1 -
1
n
)
n
n - 1
= 1.
Je tedy naše posloupnost rostoucí. Zároveň stejným výpočtem ověříme, že posloupnost čísel
bn = (1 +
1
n
)n+1
= (1 +
1
n
)(1 +
1
n
)n
3. DERIVACE 165
je klesající a jistě je bn > an. Ověřili jsme tedy existenci limity poslounosti an (a zároveň
vidíme, že je rovna limitě klesající posloupnosti bn).
Tato limita je jedním z nejdůležitějších čísel v matematice (vedle nuly, jedničky
a Ludolfova čísla ), nazýváme jej Eulerovým číslem e. Je tedy
e = lim
n
1 +
1
n
n
.
Náš postup zároveň ověřil, že existuje derivace v nule zprava exponenciální funkce
ex
a je rovna jedné. Proto existuje ve všech bodech x také derivace zprava a je rovna
ex
. Nyní můžeme spočíst derivaci zleva pomocí derivací složených funkcí. Skutečně,
lim
x0-
ex
-1
x
= lim
x0+
e-x
-1
-x
= (e0
)-2
e0
= 1.
Derivace zleva i zprava tedy pro funkci f(x) = ex
existují ve všech bodech a jsou
si rovny.
Přirozený logaritmus. Protože je exponenciální funkce ex
všude dobře definována
a kladná, existuje všude i její funkce inverzní. Označujeme ji ln x a říkáme jí
přirozený logaritmus nebo logaritmus se základem e. Je definována vztahem
eln x
= x.
Z vlastností mocninných funkcí, viz vztahy (5.5), okamžitě dostáváme
5.6a (5.8) ln(x  y) = ln x + ln y, ln xy
= y  ln x.
Derivaci přirozeného logaritmu spočteme podle pravidla pro derivaci složené funkce
(užíváme již, že ex
je rovno své derivaci, a také definiční vztah pro logaritmus):
e5.7 (5.9) (ln) (y) = (ln) (ex
) =
1
(ex)
=
1
ex
=
1
y
.
Derivaci obecné exponenciální funkce f(x) = ax
můžeme nyní spočíst takto:
e5.8 (5.10) (ax
) = (ex ln a
) = ex ln a
(x ln a) = ax
ln a.
Podobně také můžeme konečně ověřit i formuli pro derivaci obecné mocninné
funkce pro všechny x > 0:
(xa
) = (ea ln x
) = ea ln x
(a ln x) = axa-1
.
Pro obecnou exponenciální funkci ax
se základem a = 1, a > 0 také existuje
všude inverzní funkce. Říkáme jí logaritmus při základu a, píšeme loga x.
Vlastnosti dosavadního osazenstva našeho zvířetníku funkcí zpřehledňuje následující
tabulka, kde jsou shrnuty vlastnosti jednotlivých obyvatelů a jejich vztahy:
166 5. ZŘÍZENÍ ZOO
funkce definiční
obor
třída derivace inverze
polynomy f celé R C
f opět polynom f-1
existuje jen lokálně
a neumíme
obecnou formulí
kubické
splajny h
celé R C2
h je opět splajn formule s odmocninami
a jen lokálně
racionální
funkce f/g
celé R kromě
kořenů jmenovatele
g
C
opět racionální
funkce: f g-fg
g2
existuje jen lokálně
a neumíme obecnou
formulí
mocninné
funkce xa
interval
(0, )
C
funkce axa-1
existuje všude a je
opět mocninnou
funkcí y1/a
exponenciální
funkce ax
s
a > 0, a = 1
celé R C
existuje všude a
je ln a  ax
logaritmická funkce
loga
4. Mocninné řady
5.24
5.27. Vraťme se k exponenciální funkci ex
. Jestliže v posloupnosti am = (1+ 1
m )m
dosadíme za m hodnoty m = n/x pro nějaké pevné x  R, dostaneme
bn = 1 +
x
n
n
x
, bx
n = 1 +
x
n
n
.
Přitom, je limita bn pro n jdoucí do nekonečna opět e. Odvodili jsme tedy důležitý
vztah platný pro všechna x  R
e5.11 (5.11) ex
= lim
n
1 +
x
n
n
.
Označme si n-tý člen této posloupnosti un(x) a vyjádřeme si jej pomocí bionomické
věty:
e5.11a (5.12)
un(x) = 1 + n
x
n
+
n(n - 1)x2
2!n2
+    +
n!xn
n!nn
= 1 + x +
x2
2!
1 -
1
n
+
x3
3!
1 -
1
n
1 -
2
n
+ . . .
+
xn
n!
1 -
1
n
1 -
2
n
. . . 1 n
- 1
n
.
Protože jsou všechny závorky v součinech menší než jedna, dostáváme také
un(x) < vn(x) =
n
j=0
1
j!
xj
.
Podívejme se nyní na formální nekonečný součet
e5.12 (5.13)
X
j=0
cj =
X
j=0
1
j!
xj
tj. vn(x) je právě částečný součet prvních n členů. Podíl dvou po sobě jdoucích členů v řadě
je cj+1/cj = x/(n + 1). Pro každé pevné x tedy existuje N  N takové, že cj+1/cj < 1/2 pro
4. MOCNINNÉ ŘADY 167
všechny j > N. Pro takto velké j je ovšem cj+1 < 1
2
cj < 2-(j-N+1)
cN . To ale znamená, že
částečné součty prvních n členů v našem formálním součtu jsou shora ohraničeny součty
vn <
NX
j=0
1
j!
xj
+
1
j!
xj
n-NX
j=0
1
2j
.
Poslední sumu ovšem umíme snadno spočíst. Jde o zvláštní případ součtu geometrické řadyPk
j=0 qj
. Protože platí pro každé q
(1 - q)(1 + q +    + qk
) = 1 - qk+1
,
existuje limita částečných součtů v geometrické řadě
P
j=0 qk
právě když |q| < 1 a v takovém
případě platí
e5.13 (5.14)
X
j=0
qj
= lim
k
kX
j=0
qj
=
1
1 - q
.
Protože čísla vn tvoří rostoucí posloupnost, jistě také tato posloupnost konverguje. Říkáme,
že řada (5.13) konverguje.
Nyní si prohlédněme pozorněji posloupnost čísel un, jejíž limitou je ex
. Budeme uvažovat
n > N pro nějaké pevné N (hodně velké) a zvolíme si k < N pevné (docela malé). Pak
pro dostatečně velká N umíme součet prvních k členů ve vyjádření uN v (5.12) aproximovat
libovolně přesně výrazem vk. Protože je tato část součtu uN ostře menší než uN samotné,
musí posloupnost un konvergovat k téže limitě jako poslounost vn. Dokázali jsme tedy:
Věta. Exponenciální funkce je pro každé x  R vyjádřena jako limita částečných
součtů ve výrazu
ex
= 1 + x +
1
2!
x2
+    +
1
n!
xn
+    =

n=0
1
n!
xn
.
Při dovození tohoto mimořádně důležitého tvrzení jsme mimoděk pracovali s
několika užitečnými pojmy a nástroji. Sformulujeme si je nyní obecněji:
5.25 5.28. Definice. Nekonečná řada je výraz

n=0
an = a0 + a1 + a2 +    + ak + . . . ,
kde an jsou reálná nebo komplexní čísla. Posloupnost částečných součtů je dána
svými členy sk =
k
n=0 an a říkáme, že řada konverguje a je rovna s, jestliže
existuje konečná limita částečných součtů
s = lim
k
sn.
K tomu, aby posloupnost sn konvergovala, je nutné a stačí, aby byla Cauchyovská.
Tzn. že
|sm - sn| = |an+1 +    + am|
musí být libovolně malé pro dostatečně velká m > n. Protože je
|an+1| +    + |am| > |an+1 +    + am|,
vyplývá z konvergence řady

k=0 |an| i konvergence řady

k=0 an. Říkáme, že
řada

k=0 an konverguje absolutně, jestliže konverguje řada

n=0 |an|.
Jestliže posloupnost částečných součtů řady má nevlastní limitu, říkáme že řada
diverguje k  nebo -.
168 5. ZŘÍZENÍ ZOO
Jednoduché algebraické operace s absolutně konvergentními řadami se chovají
všechny dobře:
Věta. Nechť S =

n=0 an a T =

n=0 bn jsou dvě absolutně konvergentní řady.
Pak
(1) jejich součet absolutně konverguje k součtu
S + T =

n=0
an +

n=0
bn =

n=0
(an + bn),
(2) jejich rozdíl absolutně konverguje k rozdílu
S - T =

n=0
an -

n=0
bn =

n=0
(an - bn),
(3) jejich součin absolutně konverguje k součinu
S  T =

n=0
an 

n=0
bn =

n=0
n
k=0
an-kbk .
Důkaz. První i druhé tvrzení jsou bezprostředním důsledkem obdobných vlastností
limit. Třetí tvrzení vyžaduje větší pozornost. Označme si
cn =
n
k=0
an-kbk.
Z předpokladů a podle pravidel pro limitu součinu posloupností dostáváme
k
n=0
an 
k
n=0
bn 

n=0
an 

n=0
bn .
Máme tedy dokázat, že
0 = lim
k
k
n=0
an 
k
n=0
bn -
k
n=0
ck .
Porovnejme si nyní výrazy
k
n=0
an 
k
n=0
bn =
0i,jk
aibj, cn =
i+j=n
0i,jk
aibj,
k
n=0
cn =
i+jk
0i,jk
aibj.
Dostáváme tedy odhad
k
n=0
an 
k
n=0
bn -
k
n=0
ck =
i+j>k
0i,jk
aibj 
i+j>k
0i,jk
|aibj|.
K odhadu posledního výrazu nám poslouží jednoduchý trik: aby mohl být součet
idexů větší než k, musí být alespoň jeden z nich větší než k/2. Jistě tedy výraz
nezmenšíme, když do něj přidáme více členů, tj. vezmeme všechny jako v součinu
a odebereme pouze ty, u kterých jsou oba nejvýše k/2.
i+j>k
0i,jk
|aibj| 
0i,jk
|aibj| -
0i,jk/2
|aibj|.
4. MOCNINNÉ ŘADY 169
Oba výrazy v rozdílu jsou ale částečné součty pro součin S  T, mají tedy také
stejnou limitu a proto jejich rozdíl jde k nule.
Jako obvykle si hned shrneme několik dalších jednoduchých tvrzení o řadách:
5.26 5.29. Věta. Nechť S =

n=0 an je nekonečná řada reálných nebo komplexních
čísel.
(1) Jestliže S konverguje, pak limn an = 0.
(2) Předpokládejme, že existuje limita podílů po sobě jdoucích členů řady a platí
lim
n
an+1
an
= q.
Pak řada S konverguje absolutně při |q| < 1 a nekonverguje při |q| > 1. Při
|q| = 1 může řada konvergovat ale nemusí.
(3) Jestliže existuje limita
lim
n
n
|an| = q,
pak při q < 1 řada konverguje, zatímco při q > 1 diverguje. Je-li q = 1, může
konvergovat i divergovat.
Důkaz. (1) Jestliže limn an neexistuje nebo je nenulová, exituje pro dostatečně
malé číslo > 0 nekonečně mnoho členů ak s |ak| > . Zároveň tedy musí mezi
nimi existovat nekončeně mnoho kladných nebo nekonečně mnoho záporných. Pak
ovšem při přidání kteréhokoliv z nich do částečného součtu dostáváme rozdíl dvou
po sobě jdoucích sn a sn+1 o velikosti alespoň . Posloupnost částečných součtů
proto nemůže být Cauchyovská a tedy ani konvergentní.
(2) Protože chceme dokazovat absolutní konvergenci, můžeme rovnou předpokládat ai >
0. Důkaz jsme pro speciální hodnotu q = 1/2 provedli při dovození hodnoty ex
pomocí řady.
Stejnou úvahou z existence limity podílů dovodíme pro dostatečně veliké N
aj+1 < q  aj < q-(j-N+1)
cN .
To ale znamená, že částečné součty prvních sn jsou shora ohraničeny součty
sn <
NX
j=0
aj + cN
n-NX
j=0
1
qj
.
Je-li 0 < q < 1, je množina všech částečných součtů shora ohraničená a proto je limitou naší
řady její supremum.
Při hodnotě q > 1 použijeme obdobný postup, ale z existence limity q na začátku odvo-
díme
aj+1 < q  aj < q-(j-N+1)
cN .
To ale znamená, že částečné součty prvních sn jsou zdola ohraničeny součty
sn >
NX
j=0
aj + cN
n-NX
j=0
1
qj
.
Při q > 0 tento výraz poroste nad všechny meze
(3) Důkaz je zde velmi podobný předchozímu případu. Z existence limity q < 1 vyplývá, že
pro každé q < r < 1 existuje N takové, že pro všechny n > N platí n
p
|an| < r. Umocněním
pak
|an| < rn
takže jsme opět v situaci, kdy srovnáváme s geometrickou řadou. Důkaz se proto dokončí
stejně jako v případě podílového testu.
170 5. ZŘÍZENÍ ZOO
V důkazu druhého i třetího tvrzení jsme využívali slabšího tvrzení, než je
existecne limity. Potřebovali jsme pro studované posloupnosti nezáporných výrazů
pouze tvrzení, že od určitého indexu už budou větší nebo menší než dané číslo.
K takovému odhadu nám ale postačí pro danou posloupnost bn uvažovat s
každým indexem n supremum hodnot členů s indexy vyššími. Tato suprema vždy
existují a budou tvořit nerostoucí posloupnost. Její infimum pak označujeme jako
limes superior dané posloupnosti a značíme
lim sup
n
bn.
Výhodou je, že limes superior vždy existuje, můžeme proto předchozí výsledek
(včetně důkazu) přeformulovat v silnější podobě:
Důsledek. Nechť S =

n=0 an je nekonečná řada reálných nebo komplexních čísel.
(1) Je-li
q = lim sup
n
an+1
an
,
pak řada S konverguje absolutně při q < 1 a nekonverguje při q > 1. Při q = 1
může řada konvergovat ale nemusí.
(2) Je-li
q = lim sup
n
n
|an|,
pak při q < 1 řada konverguje, zatímco při q > 1 diverguje. Je-li q = 1, může
konvergovat i divergovat.
5.29.1. Ukažte, že tzv. harmonická řada

i=1
1
i
diverguje.
Řešení. Pro libovolné přirozené k je součet prvních 2k
členů řady větší než k/2:
1 +
1
2
> 1
2
+
1
3
+
1
4
> 1
4 + 1
4 = 1
2
+
1
5
+
1
6
+
1
7
+
1
8
> 1
8 + 1
8 + 1
8 + 1
8 = 1
2
+ . . . ,
součet členů od 2l
+1 do 2l+1
je totiž vždy větší než 2l
-krát (jejich počet) číslo 1/2l
(nejmenší z nich), což je dohromady 1/2.
5.29.2. Rozhodněte o následujících řadách, jestli konvergují či divergují:
(1)

n=1
2n
n
(2)

n=1
1
n
(3)

n=1
1
n2100000
(4)

n=1
1
(1+i)n
Řešení.
4. MOCNINNÉ ŘADY 171
(1) Budeme zkoumat konvergenci podílovým kritériem:
lim
n
an+1
an
= lim
n
2n+1
n+1
2n
n
= lim
n
2(n + 1)
n
= 2 > 1,
řada tedy diverguje.
(2) Odhadneme řadu ze spodu: víme, že pro libovolné přirozené n platí 1
n  1
n
.
Pro posloupnost částečných součtů sn zkoumané řady a posloupnost částečných
součtů harmonické řady sn tedy platí:
sn =
n
i=1
1

n

n
i=1
1
n
= sn.
A protože harmonická řada diverguje (viz předchozí příklad), diverguje i její posloupnost
částečných součtů {sn}
n=1, tedy diverguje i posloupnost částečných
součtů {sn}
n=1, tedy diverguje i zadaná posloupnost.
(3) Diverguje, jedná se o násobek harmonické řady.
(4) Jedná se o geometrickou řadu s koeficientem 1
1+i , ta bude konvergovat, bude-li
absolutní hodnota koeficientu menší než 1. Víme, že
|
1
1 + i
| = |
1 - i
2
| = |
1
2
-
1
2
i| =
1
4
+
1
4
=

2
2
< 1,
řada tedy konverguje a umíme ji dokonce sečíst:

n=1
1
(1 + i)n
=
1
1 - 1
1+i
=
1 + i
i
= 1 - i.
5.27
5.30. Mocninné řady. Jestliže máme místo posloupnosti čísel an k dispozici posloupnost
funkcí fn(x) se stejným definičním oborem A, můžeme bod po bodu
použít definici řady a dostáváme pojem součtu řady funkcí
S(x) =

n=0
fn(x).
Mocninná řada je dána výrazem
S(x) =

n=0
anxn
.
Řekneme, že S(x) má poloměr konvergence   0, jestliže S(x) konverguje pro
každé x splňující |x| <  a diverguje při |x| > .
Věta. Nechť S(x) =

n=0 anxn
je mocninná řada a existuje limita
 = lim
n
n

an.
Pak je poloměr konvergece řady S roven r = -1
.
Mocninná řada S(x) je spojitá na celém svém intervalu konvergence (včetně
krajních bodů, pokud v nich konverguje) a existuje také její derivace S (x),
S (x) =

n=1
nanxn-1
.
172 5. ZŘÍZENÍ ZOO
Důkaz. Pro ověření konvergence řady můžeme pro každou pevnou hodnotu x
použít odmocninový test z věty 5.29(3). Počítáme přitom
lim
n
n

anxn = x
a řada konverguje, resp. diverguje, jestliže je tato limita různá od 1.
Tvrzení o spojitosti a derivaci dokážeme později v obecnějším kontextu, viz
6.28­6.30.
Všimněme si také, že můžeme při důkazu konvergence použít silnější variantu
odmocninového testu a tedy lze poloměr konvergence r pro každou mocninnou řadu
přímo zadat fomulí
r-1
= lim sup
n
n

an.
5.28 5.31. Příklad. Prodíváme se na mocninné řady
S(x) =

n=0
xn
, T(x) =

n=1
1
n
xn
.
První příklad je geometrická řada, kterou jsme se zabývali již dříve, a její součet
je pro všechny x s |x| < 1
S(x) =
1
1 - x
,
zatímco |x| > 1 zaručuje divergenci. Pro x = 1 dostáváme také zjevně divergentní
řadu 1 + 1 + 1 + . . . s nekonečným součtem, při x = -1 jde o řadu 1 - 1 + 1 - . . . ,
jejíž částečné součty nemají limitu vůbec.
Věta 5.29(3) ukazuje, že poloměr konvergence druhého příkladu je také jedna,
protože existuje
lim
n
1
n+1 xn+1
1
n xn
= x lim
n
n
n + 1
= x
Pro x = -1 tu dostaneme divergentní řadu 1+ 1
2 + 1
3 +. . . (dokažte si jako cvičení!).
Naopak, řada T(-1) = -1 + 1
2 - 1
3 + . . . konverguje. Vyplývá to z obecnějšího
platného tvrzení:
O řadě T =

n=0 bn s reálnými členy řekneme, že je alternující, jestliže je znaménko
dvou po sobě jdoucích členů vždy opačné. Pokud je navíc |bn| klesající posloupnost
a pro řadu T platí nutná podmínka konvergence z 5.29, tj. limn bn = 0,
pak řada konverguje. Důkaz teď nebudeme provádět, vyplyne z obecnějších výsledků
později, viz ??.
5.31.1. 7. Určete poloměr konvergence následujících mocninných řad:
(1)

n=1
2n
n xn
(2)

n=1
1
(1+i)n xn
Řešení.
(1)
r =
1
lim sup
n
an+1
an
=
1
2
,
4. MOCNINNÉ ŘADY 173
viz úloha ??. Daná mocniná řada tedy konverguje pro reálná x  (-1
2 , 1
2 ),
případně pro komplexní |x| < 1
2 . Všimněme si, že řada je divergentní pro x =
1
2 (jde o harmonickou řadu) a naopak konverguje pro x = -1
2 (alternující
harmonická řada). Rozhodnout o konvergenci pro libovoné x ležící v komplexní
rovině na kružnici o poloměru 1
2 je těžší otázka a přesahuje rámec našeho kurzu.
(2) Opět díky přechozímu příkladu víme, že
lim sup
n
n
1
(1 + i)n
= lim sup
n
1
1 + i
=

2
2
.
je tedy poloměr konvergence dané mocninné řady r =

2.
5.29
5.32. Zvěřinec. S mocninnými řadami nám do našeho společenství přibyla spousta
nových příkladů hladkých funkcí, tj. funkcí libovolněkrát diferencovatelných na celém
svém definičním oboru. Pohrejme si chvíli s nejvýznamnějším a prvním naším
příkladem, exponenciálou
ex
= 1 + x +
1
2
x2
+    +
1
n!
xn
+ . . . .
Tato mocninnná řada má poloměr konvergence nekonečný a dobře proto definuje
hladkou funkci pro všechna komplexní čísla x. Její hodnoty jsou limitami
hodnot (komplexních) polynomů s reálnými koeficienty a ze spojitosti tedy musí
pro ni platit i obvyklé vztahy, které jsme pro reálné hodnoty proměnné x již odvodili.
Zejména tedy platí
ex+y
= ex
 ey
,
viz (5.5) a věta 5.28(3). Dosaďme si hodnoty x = i  t, kde i  C je imaginární
jednotka, t  R libovolné.
eit
= 1 + it -
1
2
t2
- i
1
3!
t3
+
1
4!
t4
+ i
1
5!
t5
- . . .
a zjevně tedy je komplexně konjugované číslo k z = eit
číslo z = e-it
. Proto
|z|2
= z  z = eit
 e-it
= e0
= 1
a všechny hodnoty z = eit
proto leží na jednotkové kružnici v komplexní rovině.
Reálné a imaginární složky bodů na jednotkové kružnici přitom bývají popisovány
pomocí goniometrických funkcí cos  a sin , kde  je patřičný úhel. Derivací
parametrického popisu bodů kružnice,
t  eit
dostáváme vektory ,,rychlostí , které budou dány výrazem (lze např. zderivovat
skutečně zvlášť reálnou a imaginární složku a sečíst výsledky)
t  eit
) = i  eit
a jejich velikost proto také bude pořád jednotková. Odtud lze tušit, že celou kružnici
oběhneme po dosažení hodnoty parametru rovného délce oblouku, tj. 2 (i když ke
skutečnému ověření této skutečnosti budeme potřebovat integrální počet). Takto
bývá Ludolfovo číslo  také definováno. Můžeme se ale nyní aspoň částečně ujistit
pohledem na nejmenší kladné kořeny reálné části částečných součtů naší řady, tj.
174 5. ZŘÍZENÍ ZOO
příslušných polynomů. Již při řádu deset nám vyjde číslo  přesně na 5 desetinných
míst.
Dostali jsem tedy přímou definici goniometrických funkcí pomocí mocninných
řad:
cos t = re eit
= 1 -
1
2
t2
+
1
4!
t4
-
1
6!
t6
+    + (-1)k 1
(2k)!
t2k
+ . . .e5.15 (5.15)
sin t = im eit
= t -
1
3!
t3
+
1
5!
t5
-
1
7!
t7
+    + (-1)k 1
(2k + 1)!
t2k+1
+ . . .e5.16 (5.16)
Ilustraci konvergence řady pro funkci cos je vidět na obrázku. Jde o graf příslušného
polynomu stupně 68. Při postupném vykreslení částečných součtů je vidět, že
aproximace v okolí nuly je velice dobrá a prakticky beze změn. S rostoucím řádem
se pak zlepšuje i dále od počátku.
y
t~
1,5
30
1
0,5
20
0
-0,5
10
-1
-1,5
0-10-20-30
Přímo z definice vyplývá známý vztah
sin2
t + cos2
t = 1
a také z derivace (eit
) = i eit
vidíme, že
(sin t) = cos t, (cos t) = - sin t.
Tentýž výsledek lze samozřejmě ověřit přímo derivací našich řad člen po členu.
Předpokládejme, že t0 je nejmenší kladné číslo, pro které je e-it0
= - eit0
, tj.
první kladný nulový bod funkce cos t. Podle naší definice Ludolfova čísla je t0 = 1
2 .
Pak e-i2t0
= (e-it0
)2
= ei2t0
a jde proto o nulový bod funkce sin t. Samozřejmě pak
platí pro libovolné t
ei(4kt0+t)
= (eit0
)4k
 eit
= 1  eit
.
Jsou tedy obě funkce goniometrické funkce periodické s periodou 2. Z našich definic
je přitom vidět, že je to nejmenší jejich perioda.
Nyní můžeme snadno odvodit všechny obvyklé vztahy mezi goniometrickými
funkcemi. Uvedeme na ukázku několik z nich. Nejprve si všimněme, že definice
4. MOCNINNÉ ŘADY 175
vlastně říká
cos t =
1
2
(eit
+ e-it
)
sin t =
1
2i
(eit
- e-it
).
Součin těchto funkcí jde tedy vyjádřit jako
sin t cos t =
1
4i
(eit
- e-it
)(eit
+ e-it
) =
1
4i
(ei2t
- e-i2t
) =
1
2
sin 2t.
Dále můžeme využít naši znalost derivací:
cos 2t = (
1
2
sin 2t) = (sin t cos t) = cos2
t - sin2
t.
Vlastnosti dalších goniometrických funkcí
tg t =
sin t
cos t
, cotg t = (tg t)-1
se snadno odvodí z jejich definice a pravidel pro derivování. Grafy funkcí sinus,
cosinus, tangens a cotangens jsou na obrázcích (postupně červený a zelený vlevo,
červený a zelený vpravo):
1
x
0,5
0
10-5
-0,5
5
-1
0-10
x
3210-1-2
y
-3
10
5
0
-5
-10
Cyklometrické funkce jsou inverzní ke goniometrickým. Protože jsou goniometrické
funkce všechny periodické s periodou 2, jsou jejich inverze definované vždy
jen v rámci jedné periody a to ještě jen na části, kdy je daná funkce buď rostoucí
nebo klesající. Jsou to funkce
arcsin = sin-1
s definičním oborem [-1, 1] a oborem hodnot [-/2, /2]. Dále
arccos = cos-1
s definičním oborem [-1, 1] a oborem hodnot [0, ], viz obrázek vlevo.
176 5. ZŘÍZENÍ ZOO
3
2
1
0
-1
x
10,50-0,5-1
3
2
1
x
0
-1
1050-5-10
Zbývají ještě funkce (zobrazené na obrázku vpravo)
arctg = tg-1
s definičním oborem [-, ] a oborem hodnot [-/2, /2] a konečně
arccotg = cotg-1
s definičním oborem [-, ] a oborem hodnot [0, ].
Velice často se také využívají tzv. hyperbolické funkce
sinh x =
1
2
(ex
- e-x
), cosh x =
1
2
(ex
+ e-x
).
Název naznačuje, že by funkce mohly mít něco společného s hyperbolou. Přímý
výpočet dává (druhé mocniny se v roznásobených dvojčlenech všechny odečtou a
zůstanou smíšené členy)
(cosh x)2
- (sinh x)2
= 2
1
2
(ex
e-x
) = 1.
Body [cosh t, sinh t] tedy skutečně parametricky popisují hyperbolu v rovině. Pro
hyperbolické funkce lze snadno odvodit podobné identity jako pro funkce goniometrické.
Mimo jiné je přímo z definice snadno vidět
cosh x = cos(ix), i sinh x = sin(ix)
(ověřte si jako cvičení).
5.32.1. Sečtěte:
2 + 1 +
2
2!
+
1
3!
+
2
4!
+
1
5!
+
2
6!
+   
Řešení. Porovnáme tvar součtu s mocninným rozvojem funkcí sinh a cosh a dostáváme
výsledek
sinh(1) + 2 cosh(1)
.
4. MOCNINNÉ ŘADY 177
5.30
5.33. Poznámky. Mocninné řady můžeme zcela stejně definovat takto:
S(x) =

n=0
an(x - x0)n
,
kde x0 je libovolné pevně zvolené reálné číslo. Všechny naše předchozí úvahy jsou
pořád platné, jen je třeba mít na paměti, že se vztahují k bodu x0. Zejména tedy taková
řada konverguje na intervalu (x0 -, x0 +), kde  je její poloměr konvergence.
Říkáme, že S je mocninná řada se středem v x0.
Dále platí, že má-li mocninná řada y = T(x) hodnoty v intervalu, kde je dobře
definována řada S(y), potom i hodnoty funkce S  T jsou vyjádřeny mocninnou
řadou, kterou dostaneme formálním dosazením y = T(x) za y do S(y).
Zejména lze takto počítat členy mocninných řad zadávajících inverzní funkce.
Nebudeme zde uvádět seznam formulí, snadno se k nim dostaneme například v
Maplu procedurou ,,series .
KAPITOLA 6
Diferenciální a integrální počet
zvěřinec teď máme, ale co s ním?
­ naučíme se s ním zacházet...
V minulé kapitole jsme si postupně hráli buď s mimořádně velikými třídami
funkcí -- všechny spojité, všechny diferencovatelné apod. -- nebo jen s konkrétními
funkcemi -- např. exponenciální, goniometrické, polynomy atd. Měli jsme ale
přitom jen minimum nástrojů a vše jsme počítali tak říkajíc na koleně. Teď dáme
dohromady několik výsledků, které umožní snáze pracovat s funkcemi při modelování
reálných problémů.
1. Derivování
Začneme několika jednoduchými výsledky o derivování funkcí.
6.1 6.1. Věta. Nechť funkce f : R  R je spojitá na intervalu [a, b] a diferencovatelná
uvnitř tohoto intervalu. Jestliže platí f(a) = f(b), pak existuje c  (a, b) takové, že
f (c) = 0.
Důkaz. Protože je funkce f spojitá na uzavřeném intervalu (tj. kompaktní
množině), má na něm maximum a minimum. Pokud by maximum i minimum mělo
stejnou hodnotu f(a) = f(b), pak by funkce f byla konstantní a tedy i její derivace
by byla nulová ve všech bodech intervalu (a, b). Předpokládejme tedy, že buď
maximum nebo mimimum je jiné a nechť nastává jedno z nich ve vnitřním bodě c.
Pak ovšem není možné, aby v c bylo f (c) = 0, protože to by v tomto bodě byla
byla funkce f buď rostoucí nebo klesající (viz 5.22) a jistě by tedy v okolí bodu c
nabývala větších i menších hodnot, než je f(c).
Právě dokázanému tvrzení se říká Rolleova věta. Z ní snadno vyplývá následující
důsledek, známý jako věta o střední hodnotě.
6.2 6.2. Věta. Nechť funkce f : R  R je spojitá na intervalu [a, b] a diferencovatelná
uvnitř tohoto intervalu. Pak existuje c  (a, b) takové, že
f (c) =
f(b) - f(a)
b - a
.
Důkaz. Důkaz je prostým zápisem geometrického významu tvrzení: k sečně
mezi body [a, f(a)] a [b, f(b)] existuje tečna, která je s ní rovnoběžná (namalujte si
obrázek). Rovnice naší sečny je
y = g(x) = f(a) +
f(b) - f(a)
b - a
(x - a).
179
180 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Rozdíl h(x) = f(x) - g(x) udává vzdálenost grafu od sečny (v hodnotách y). Jistě
platí h(a) = h(b) a
h (x) = f (x) f(b)
- f(a)
b - a
.
Podle předchozí věty existuje bod c, ve kterém je h (c) = 0.
Větu o střední hodnotě můžeme také přepsat ve tvaru:
e6.1 (6.1) f(b) = f(a) + f (c)(b - a).
V případě parametricky zadané křivky v rovině, tj. dvojice funkcí y = f(t),
x = g(t), je stejný výsledek o existenci rovnoběžné tečny k sečně krajními body
popsán takto:
Důsledek. Nechť funkce y = f(t) a x = g(t) jsou spojité na intervalu [a, b] a
diferencovatelné uvnitř tohoto intervalu a g (t) = 0 pro všechny t  (a, b). Pak
existuje bod c  (a, b) takový, že platí
f(b) - f(a)
g(b) - g(a)
=
f (c)
g (c)
.
Důkaz. Opět spoléháme na použití Rolleovy věty. Položíme proto
h(t) = (f(b) - f(a))g(t) - (g(b) - g(a))f(t).
Nyní h(a) = f(b)g(a)-f(a)g(b), h(b) = f(b)g(a)-f(a)g(b), takže existuje c  (a, b)
takový, že h (c) = 0. Protože je g (c) = 0, dostáváme právě požadovaný vztah.
Podobná úvaha jako v posledním tvrzení vede k mimořádně užitečnému nástroji
pro počítání limit funkcí. Je znám jako L'Hospitalovo pravidlo:
6.3 6.3. Věta. Předpokládejme, že f a g jsou funkce diferencovatelné v okolí bodu
x0  R, ne však nutně v bodě x0 samotném, a nechť existují limity
lim
xx0
f(x) = 0, lim
xx0
g(x) = 0.
Jestliže existuje limita
lim
xx0
f (x)
g (x)
pak existuje i limita
lim
xx0
f(x)
g(x)
a jsou si rovny.
Důkaz. Bez újmy na obecnosti můžeme předpokládat, že v x0 mají funkce f
a g nulovou hodnotu.
Výsledek je opět jednoduše představitelný pomocí obrázku. Uvažujme body
[g(x), f(x)]  R2
parametrizované proměnnou x. Podíl hodnot pak odpovídá směrnici
sečny mezi body [0, 0] a [f(x), g(x)]. Zároveň víme, že podíl derivací odpovídá
směrnici tečny v příslušném bodě. Z existence limity směrnic tečen tedy chceme
dovodit existenci limity směrnic sečen.
1. DERIVOVÁNÍ 181
Technicky lze využít věty o střední hodnotě v parametrickém tvaru. Předně si
uvědomme, že v tvrzení věty implicitně předpokládáme existenci výrazu f (x)/g (x)
na nějakém okolí x0, zejména tedy pro dostatečně blízké body c k x0 bude g (c) = 0.1
lim
xx0
f(x)
g(x)
= lim
xx0
f(x) - f(x0)
g(x) - g(x0)
= lim
xx0
f (cx)
g (cx)
,
kde cx je číslo mezi x0 a x. Nyní si všimněme, že z existence limity
lim
xx0
f (x)
g (x)
vyplývá, že stejnou hodnotu bude mít i limita libovolné posloupnosti vzniklé dosazením
hodnot x = xn jdoucích k x0 do f (x)/g (x). Zejména tedy můžeme dosadit
jakoukoliv posloupnost cxn
pro xn  x0 a proto bude existovat i limita
lim
xx0
f (cx)
g (cx)
a poslední dvě limity zjevně budou mít stejnou hodnotu. Dokázali jsme tedy, že
naše hledaná limita existuje a má také stejnou hodnotu.
6.4
6.4. Důsledky. Jednoduše lze rozšířit L'Hospitalovo pravidlo i pro limity v nevlastních
bodech  a v případě nevlastních hodnot limit. Je-li, např.
lim
x
f(x) = 0, lim
x
g(x) = 0,
potom je limx0+
f(1/x) = 0 a limx0+
g(1/x) = 0. Zároveň z existence limity
podílu derivací v nekonečnu dostaneme
lim
x0+
(f(1/x))
(g(1/x))
= lim
x0+
f (1/x)(-1/x2
)
g (1/x)(-1/x2)
= lim
x0+
f (1/x)
g (1/x)
= lim
x
f (x)
g (x)
.
Použitím předchozí věty tedy dostáváme, že v tomto případě bude existovat i limita
podílu
lim
x
f(x)
g(x)
= lim
x0+
f(1/x)
g(1/x)
= lim
x
f (x)
g (x)
.
Ještě jednodušší je postup při výpočtu limity v případě, kdy
lim
xx0
f(x) = , lim
xx0
g(x) = .
Stačí totiž psát
lim
xx0
f(x)
g(x)
= lim
xx0
1/g(x)
1/f(x)
,
což je již případ pro použití L'Hospitalova pravidla z předchozí věty. Lze ale i
dokázat, že L'Hospitalovo pravidlo platí ve stejné formě pro nevlastní limity:
Věta. Nechť f a g jsou funkce diferencovatelné v okolí bodu x0  R, ne však nutně
v bodě x0 samotném, a nechť existují limity limxx0 f(x) =  a limxx0 g(x) =
. Jestliže existuje limita
lim
xx0
f (x)
g (x)
1Pro samu existenci limity v obecném smyslu to vždy nutné není, nicméně pro tvrzení
L'Hospitalovy věty je to potřebné. Podrobnou diskusi je možné najít (vygooglovat) v populárním
článku "R. P. Boas, Counterexamples to LHôpitals Rule, The American Mathematical Monthly,
October 1986, Volume 93, Number 8, pp. 644­645."
182 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
pak existuje i limita
lim
xx0
f(x)
g(x)
a jsou si rovny.
Důkaz. Opět lze vyjít z věty o střední hodnotě. Základem je vyjádření podílu tak,
abychom dostali do hry derivaci:
f(x)
g(x)
=
f(x)
f(x) - f(y)

f(x) - f(y)
g(x) - g(y)

g(x) - g(y)
g(x)
kde y volíme nějaký pevný ze zvoleného okolí x0 a x necháme blížit k x0. Protože jsou
limity f i g v x0 nekonečné, můžeme jistě předpokládat, že rozdíly hodnot v x a y jsou u
obou funkcí při pevném y nenulové.
Pomocí věty o střední hodnotě můžeme nyní nahradit prostřední zlomek podílem
derivací ve vhodném bodě c mezi x a y a výraz ve zkoumané limitě dostává tvar
f(x)
g(x)
=
1 - g(y)
g(x)
1 - f(y)
f(x)

f (c)
g (c)
,
kde c závisí na x i y. Při pevném y a x jdoucím k x0 jde první zlomek zjevně k jedničce.
Když zároveň budeme y přibližovat k x0, bude se nám druhý zlomek libovolně přesně blížit
k limitní hodnotě podílu derivací.
6.4a
6.5. Příklady užití. Vhodnými úpravami sledovaných výrazů lze využít L'Hospitalova
pravidla také na výrazy typu -, 1
, 0 apod. Zpravidla jde o prosté
přepsání výrazů nebo o využití nějaké hladké funkce, např. exponenciální. Uveďme
alespoň dva příklady hned:
lim
x0
1
sin 2x
-
1
2x
= lim
x0
2x - sin 2x
2x sin 2x
= lim
x0
2 - 2 cos 2x
2 sin 2x + 4x cos 2x
= lim
x0
4 sin 2x
4 cos 2x + 4 cos 2x - 8x sin 2x
= 0,
přičemž získané tvrzení je třeba číst od konce. Tj. z existence poslední limity (podíl
druhých derivací) vyplývá existence limity podílů prvních derivací a z toho plyne
existence i hodnota původní limity.
Druhý příklad nám ukáže souvislost aritmetického a geometrického průměru z
n hodnot. Aritmetický průměr
M1
(x1, . . . , xn) =
x1 +    + xn
n
je speciálním případem tzv. mocninného průměru stupně r:
Mr
(x1, . . . , xn) =
xr
1 +    + xr
n
n
1
r
.
Speciální hodnota M-1
se nazývá harmonický průměr. Spočtěme si nyní limitní
hodnotu Mr
pro r jdoucí k nule. Za tímto účelem spočteme limitu pomocí L'Hospitalova
1. DERIVOVÁNÍ 183
pravidla (jde o výraz 0/0):
lim
r0
ln(Mr
(x1, . . . , xn)) = lim
r0
ln( 1
n (xr
1 + . . . xr
n))
r
= lim
r0
xr
1 ln x1++xr
n ln xn
n
xr
1+...xr
n
n
=
ln x1 +    + ln xn
n
= ln n

x1      xn.
Odtud tedy je přímo vidět, že
lim
r0
Mr
(x1, . . . , xn) = n

x1 . . . xn,
což je hodnota známá pod názvem geometrický průměr.
6.5
6.6. Význam druhé derivace. Již jsme viděli, že první derivace funkce je jejím
lineárním přiblížením v okolí daného bodu a že ze znaménka nenulové derivace
vyplývá, že funkce je v bodě x0 rostoucí nebo klesající. Body, ve kterých je první
derivace nulová se nazývají kritické body dané funkce.
Je-li x0 kritický bod funkce f, může být chování funkce f v okolí bodu x0
jakékoliv. Vidíme to již z chování funkce f(x) = xn
v okolí nuly pro libovolné
n. Pro lichá n > 0 bude f(x) rostoucí, pro sudá n naopak bude nalevo klesající
a napravo rostoucí, dosáhne tedy v bodě x0 své minimální hodnoty mezi body z
(dostatečně malého) okolí bodu x0 = 0.
Tentýž pohled můžeme aplikovat na funkci f . Jestliže totiž je druhá derivace
nenulová, určuje její znaménko chování derivace první. Proto v kritickém bodě
x0 bude derivace f (x) rostoucí při kladné druhé derivaci a klesající při záporné.
Jestliže je ale rostoucí, znamenená to, že nutně bude záporná nalevo od kritického
bodu a kladná napravo od něj. Funkce f v takovém případě je klesající nalevo od
kritického bodu a rostoucí napravo od něj. To znamená, že má funkce f v bodě x0
minimum ze všech hodnot z nějakého malého okolí bodu x0.
Naopak, je-li druhá derivace záporná v x0, je první derivace klesající, tedy
záporná vlevo od x0 a kladná vpravo. Funkce f bude tedy mít v bodě x0 maximální
hodnotu ze všech hodnot na nějakém okolí.
Funkce diferencovatelná na (a, b) a spojitá na [a, b] má jistě na tomto intervalu
absolutní maximum a minimum. Může ho dosáhnout pouze buď na hranici nebo
v bodě s nulovou derivací, tj. v kritickém bodě. Pro diskusi extrémů nám tedy
mohou stačit kritické body a druhé derivace pomůžou určit typy extrémů, pokud
jsou nenulové. Pro přesnější diskusi ale potřebujeme lepší než lineární aproximace
zkoumaných funkcí. Proto se nejprve budeme věnovat úvahám v tomto směru a
teprve poté se vrátíme k diskusi průběhu funkcí.
6.6
6.7. Taylorův rozvoj. Jako překvapivě jednoduché využití Rolleovy věty teď odvodíme
mimořádně důležitý výsledek. Říkává se mu Taylorův rozvoj se zbytkem.
Intuitivně se k němu můžeme dostat obrácením našich úvah kolem mocninných
řad. Máme-li totiž mocninnou řadu
S(x) =

n=0
an(x - a)n
184 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
a derivujeme-li ji opakovaně, dostáváme mocninné řady (víme, že je možné takový
výraz derivovat člen po členu, i když jsme to ještě nedokázali)
S(k)
(x) =

n=k
n(n - 1) . . . (n - k + 1)an(x - a)n-k
.
V bodě x = a je tedy S(k)
(a) = k!ak. Můžeme tedy naopak číst poslední tvrzení
jako rovnici pro ak a původní řadu přepsat jako
S(x) =

n=0
1
k!
S(k)
(a)(x - a)n
.
Jestliže místo mocninné řady máme nějakou dostatečně hladkou funkci f(x), je
tedy na místě se ptát, zda ji můžeme vyjádřit jako mocninnou řadu a jak rychle
budou konvergovat částečné součty (tj. přiblížení funkce f polynomy). Naše úvaha
právě naznačila, že můžeme očekávat v okolí bodu a dobrou aproximaxi polynomy,
tzv. Taylorovými polynomy k­tého řádu:
Pkf(x) = f(a) + f (a)(x - a) +
1
2
f (a)(x - a)2
+    +
1
k!
fk
(a)(x - a)k
.
Přesná odpověď vypadá podobně jako věta o střední hodnotě, jen pracujeme s
vyššími stupni plynomů (tzv. Taylorův rozvoj se zbytkem):
Věta. Nechť je f(x) funkce k­krát diferencovatelná na intervalu (a, b) a spojitá na
[a, b]. Pak pro každé x  (a, b) existuje číslo c  (a, x) takové, že
f(x) = f(a) + f (a)(x - a) +    +
1
(k - 1)!
f(k-1)
(a)(x - a)k-1
+
1
k!
f(k)
(c)(x - a)k
= Pk-1f(x) +
1
k!
f(k)
(c)(x - a)k
.
Důkaz. Definujme zbytek R (tj. chybu při aproximaci pro pevně zvolené x) takto
f(x) = Pk-1f(x) + R
tj. R = 1
k!
r(x - a)k
pro vhodné číslo r (závislé na x). Nyní uvažujme funkci F() defino-
vanou
F() =
k-1X
j=0
1
j!
f(j)
()(x - )j
+
1
k!
r(x - )k
Její derivace je
F () = f () +
k-1X
j=1
,,
1
j!
f(j+1)
()(x - )j
-
1
(j - 1)!
f(j)
()(x - )j-1

-
1
(k - 1)!
r(x - )k-1
=
1
(k - 1)!
f(k)
()(x - )k-1
-
1
(k - 1)!
r(x - )k-1
=
1
(k - 1)!
(x - )k-1
(f(k)
() - r),
protože výrazy v sumě se postupně vzájemně ruší. Nyní si stačí všimnout, že F(a) =
F(x) = f(x) (připoměňme, že x je pevně zvolená ale pevná hodnota). Proto podle Rolleovy
věty existuje číslo c, a < c < x, takové, že F (c) = 0. To ale je právě požadovaný vztah.
1. DERIVOVÁNÍ 185
Pokud tedy umíme odhadnout velikost k­té derivace na celém intervalu, dostaneme
přímo odhady chyb. Speciálním případem je samozřejme věta o střední
hodnotě coby aproximace řádu nula, viz (6.1). Dobrým příkladem jsou tady třeba
goniometrické funkce. Iterováním derivace funkce sin x dostaneme vždy buď sinus
nebo cosinus s nějakým znaménkem, ale v absolutní hodnotě budou hodnoty vždy
nejvýše jedna. Dostáváme tedy přímý odhad rychlosti konvergence mocninné řady
| sin x - (Pk sin)(x)| 
|x|k+1
(k + 1)!
.
Vidíme tedy, že pro x výrazně menší než k bude chyba malá, pro x srovnatelné s k
nebo větší ale bude obrovská.
6.8. Příklady.
6.8.1. Určete Taylorovy rozvoje Tk
x (k-tého řádu v bodě x) z následujících funkcí:
(1) T3
0 z funkce sin x,
(2) T3
1 z funkce ex
x .
Řešení.
(1) Spočítáme hodnoty první až třetí derivace funkce f = sin v bodě 0: f (0) =
cos(0) = 1, f(2)
(0) = - sin(0) = 0, f(3)
(0) = - cos(0) = -1, dále f(0) = 0
Taylorův rozvoj 3-tího řádu funkce sin(x) v bodě 0 je tedy
T3
0 (sin(x)) = x -
1
6
x3
.
(2) Opět f(1) = e,
f (1) =
ex
x
-
ex
x2
1 = 0
f(2)
=
ex
x
- 2
ex
x
2
+
2ex
x3
1 = e
f(3)
=
ex
x
- 3
ex
x
2
+
6ex
x3
-
6ex
x4
1 = -2e
Dostáváme tedy Taylorův rozvoj třetího řádu funkce ex
x v bodě 1:
T3
1 (
ex
x
) = e +
e
2
(x - 1)2
-
e
3
(x - 1)3
= e(-
x3
3
+
3x2
2
- 2x +
5
6
).
6.8.2. Určete Taylorův polynom T6
0 funkce sin a pomocí věty 6.6 odhadněte chybu
polynomu v bodě /4.
Řešení. Podobně jako v předchozím příkladu určíme
T6
0 (sin(x)) = x -
1
6
x3
+
1
120
x5
.
Dle věty 6.7 pak odhadneme velikost zbytku (chyby) R. Podle věty existuje c 
(0, 
4 ) takové, že
R(/4) =
- cos(c)7
7!47
<
1
7!
.
= 0, 0002.
186 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.8.3. Rozviňte funkci ln(1+x) do mocninné řady v bodech 0 a 1 a určete všechna
x  R, pro která tyto řady konvergují.
Řešení. Rozvinout funkci do mocninné řady v daném bodě je to stejné, jako určit
její Taylorův rovoj v daném bodě.
ln(x + 1) = x -
1
2
x2
+
1
3
x3
-
1
4
x4
+ . . .
= ln(2) +
1
2
(x - 1) -
1
8
(x - 1)2
+
1
3  23
(x - 1)3
-
1
4  24
(x - 1)4
+ . . .
První řada konverguje pro -1 < x  1, druhá pro -1 < x  3.
6.8.4. Rozviňte do mocninné řady funkci cos2
(x) v bodě 0 a určete pro která reálná
čísla tato řada konverguje.
Řešení.

i=0
(-1)i 22i-1
(2i)!
x2i
,
konverguje pro libovolné reálné x.
6.8.5. Rozviňte do mocninné řady funkci sin2
(x) v bodě 0 a určete pro která reálná
čísla tato řada konverguje.
Řešení.

i=1
(-1)i+1 22i-1
(2i)!
x2i
,
konverguje pro libovolné reálné x.
6.7
6.9. Analytické a hladké funkce. Je-li f v bodě a hladká, pak můžeme napsat
formálně mocninnou řadu
S(x) =

n=0
1
k!
f(k)
(a)(x - a)n
.
Taylorova věta nám říká, že pokud tato mocninná řada má nenulový poloměr konvergence,
pak je S(x) = f(x) na příslušném intervalu. Takovým funkcím říkáme
analytické funkce v bodě a. Funkce je analytická na intervalu, je-li analytická v
každém jeho bodě.
Ne všechny hladké funkce jsou ale analytické. Ve skutečnosti lze dokázat, že
pro každou posloupnost čísel an umíme najít hladkou funkci, jejiž derivace řádů k
budou tato čísla ak.
Abychom si alespoň představili podstatu problému, ukážeme si funkci, která
má v nule všechny derivace nulové, je však všude kromě tohoto bodu nenulová:
f(x) = e-1/x2
.
Je dobře definovaná hladká funkce pro všechny body x = 0. Derivací dostaneme
f (x) = f(x)  2x-3
a iterovanou derivací dostaneme součet konečně mnoha členů
tvaru C  f(x)  x-k
, kde C je nějaké celé číslo a k je přirozené číslo. Pro každý
výraz P(x)e-1/x2
, kde P je nějaký polynom, lze opakovanou aplikací L'Hospitalova
1. DERIVOVÁNÍ 187
pravidla snadno zjistit, že jde limitně k nule, při x jdoucím k nule. Dodefinujeme-li
tedy hodnoty všech derivací naší funkce v nule rovnicí
f(k)
= 0,
získáme hladkou funkci na celém R. Je vidět, že skutečně jde o nenulovou funkci
všude mimo x = 0, všechny její derivace v tomto bodě jsou ale nulové. Samozřejmě
to tedy není analytická funkce v bodě x0 = 0.
Snadno můžeme naši funkci modifikovat takto:
g(x) =
0 je-li x  0
e-1/x2
je-li x > 0
.
Opět jde o hladkou funkci na celém R. Další úpravou můžeme získat funkci nenulovou
ve všech vnitřních bodech intervalu [-a, a], a > 0 a nulovou jinde:
h(x) =
0 je-li |x|  a
e
1
x2-a2 + 1
a2
je-li |x| < a.
Tato funkce je opět hladká na celém R. Poslední dvě funkce jsou na obrázcích,
vpravo je použit parametr a = 1.
0,8
0,6
0,4
0,2
x
0
43210 0-0,2-0,4
1
x
0,8
0,6
0,4
0,4
0,2
0,2
0
Nakonec ještě ukážeme, jak lze dostat hladké analogie Heavisideových funkcí.
Pro dvě pevně zvolená reálná čísla a < b definujeme funkci f(x) s použitím výše
definované funkce g takto:
f(x) =
g(x - a)
g(x - a) + g(b - x)
.
Zjevně je pro každé x  R jmenovatel zlomku kladný (pro každý z intervalů určených
čísly a a b je totiž alespoň jeden ze sčítanců jmenovatele nenulový a tedy
je celý jmenovatel kladný). Dostáváme z našeho definičního vztahu proto hladkou
funkci f(x) na celém R. Při x  a je přitom jmenovatel zlomku přímo dle definice
funkce g nulový, při x  b je čitatel i jmenovatel stejný. Na dalších dvou obrázcích
jsou právě funkce f(x) a to s parametry a = 1 - , b = 1 + , kde nalevo je  = 0.8
a napravo  = 0.4.
188 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
1
0,8
0,6
0,4
0,2
0
x
21,510,50
alpha=.8
1
0,8
0,6
0,4
0,2
0
x
21,510,50
alpha=.40000
6.8
6.10. Popis lokálního chování funkcí. Už jsme se setkali s významem druhé
derivace při popisu kritických bodů. Teď zobecníme diskusi kritických bodů pro
všechny řády. Budeme v dalším uvažovat funkce s dostatečným počtem spojitých
derivací, aniž bychom tento předpoklad přímo uváděli.
Řekneme, že bod a v definičním oboru funkce f je kritický bod řádu k, jestliže
platí
f (a) =    = f(k)
(a) = 0, f(k+1)
(a) = 0.
Předpokládejme, že f(k+1)
(a) > 0. Pak je tato spojitá derivace kladná i na jistém
okolí O(a) bodu a. Taylorův rozvoj se zbytkem nám v takovém případě dává pro
všechna x z O(a)
f(x) = f(a) +
1
(k + 1)!
f(k+1)
(c)(x - a)k+1
.
Je proto změna hodnot f(x) v okolí bodu a dána chováním funkce (x - a)k+1
.
Je-li přitom k + 1 sudé číslo, jsou nutně hodnoty f(x) v takovém okolí větší než
hodnota f(a) a zjevně je proto bod a bodem lokálního minima. Pokud je ale k
sudé číslo, pak jsou hodnoty vlevo menší a vpravo větší než než f(a), extrém tedy
ani lokálně nenastává. Zato si můžeme všimnout, že graf funkce f(x) protíná svoji
tečnu y = f(a) bodem [a, f(a)].
Naopak, je-li f(k+1)
(a) < 0, pak ze stejného důvodu jde o lokální maximum při
lichém k a extrém opět nenastává pro k sudé.
Říkáme, že funkce f je v bodě a konkávní v bodě a, jestliže se její graf nachází
v jistém okolí celý pod tečnou v bodě [a, f(a)], tj.
f(x) < f(a) + f (a)(x - a).
Říkáme, že funkce f je konvexní v bodě a, jetliže naopak je její graf nad tečnou v
bodě a, tj.
f(x)  f(a) + f (a)(x - a).
Funkce je konvexní nebo konkávní na intervalu, jestliže má tuto vlastnost v každém
jeho bodě.
1. DERIVOVÁNÍ 189
Z Taylorova rozvoje druhého řádu se zbytkem dostáváme
f(x) = f(a) + f (a)(x - a) +
1
2
f (c)(x - a)2
.
Proto je zjevně funkce konvexní, kdykoliv je f (a) > 0, a je konkávní, kdykoliv
f (a) < 0. Pokud je druhá derivace nulová, můžeme použít derivace vyšších řádů.
Bod a nazýváme inflexní bod funkce f, jestliže graf funkce f přechází z jedné
strany tečny na druhou. Napišme si Taylorův rozvoj třetího řádu se zbytkem:
f(x) = f(a) + f (a)(x - a) +
1
2
f (a)(x - a)2
+
1
6
f (c)(x - a)3
.
Je-li a nulový bod druhé derivace takový, že f (a) = 0, pak je třetí derivace
nenulová i na nějakém okolí a jde proto zjevně o inflexní bod. Znaménko třetí
derivace nám v takovém případě určuje, zda graf funkce přechází tečnu zdola nahoru
nebo naopak.
Poslední dobrou pomůckou pro náčrtek grafu funkce je zjištění asymptot, tj.
přímek, ke kterým se blíží hodnoty funkce f. Asyptotou v nevlastním bodě  je
proto taková přímka y = ax + b, pro kterou je
lim
x
(f(x) - ax - b) = 0.
Pokud asymptota existuje, platí
lim
x
(f(x) - ax) = b
a tedy existuje i limita
lim
x
f(x)
x
= a.
Pokud ovšem existují poslední dvě limity, existuje i limita z definice asymptoty,
jde proto i o podmínky dostatečné. Obdobně se definuje a počítá asymptota i v
nevlastním bodě -.
Tímto způsobem dohledáme všechny potenciální přímky splňující vlastnosti
asymptot s konečnou reálnou směrnicí. Zbývají nám případné přímky kolmé na osu
x: Asymptoty v bodech a  R jsou přímky x = a takové, že funkce f má v bodě a
alespoň jednu nekonečnou jednostrannou limitu.
Např. racionální funkce lomené mají v nulových bodech jmenovatele, které
nejsou nulovými body čitatele, asymptotu.
Spočtěme aspoň jeden jednoduchý příklad: Funkce f(x) = x+1
x má za asymptoty
přímky y = x a x = 0 (ověřte podrobně!). Derivací obdržíme
f (x) = 1 - x-2
, f (x) = 2x-3
.
Funkce f (x) má dva nulové body 1. V bodě x = 1 má funkce lokální minimum,
v bodě x = -1 lokální maximum. Druhá derivace nemá nulové body v celém definičním
oboru (-, 0)  (0, ), f tedy nemá žádný inflexní bod.
190 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
-4
0-2-4
y
x
4
4
2
0
2
-2
6.11. Příklady.
6.11.1. Do rovnostranného trojúhelníka o straně a je vepsán pravoúhelník (jedna
jeho strana leží na straně trojúhelníka, zbylé dva vrcholy leží na zbylých stranách
trojúhelníka). Jaký může mít maximálně obsah?
Řešení. Vepsaný pravoúhelník má strany x,

3/2(a-x), tedy obsah

3/2(a-x)x.
Maximum pro x = a/2, tedy maximální obsah je (

3/8)a2
.
6.11.2. Ve čase t = 0 se začaly pohybovat tři body P, Q, R v rovině a to bod P
z bodu [-2, 1] směrem (3, 1), rovnoměrnou rychlostí

10 m/s, bod Q z bodu [0, 0]
směrem (-1, 1) rovnoměrně zrychleným pohybem se zrychlením 2

2 m/s2
a bod R
z bodu [0, 1] směrem (1, 0) rovnoměrnou rychlostí 2 m/s. V jakém čase bude obsah
trojúhelníku PQR minimální?
Řešení. Rovnice bodů P, Q, R v čase jsou
P : [-2, 1] + (3, 1)t
Q : [0, 0] + (-1, 1)t2
R : [0, 1] + (2, 0)t
Obsah trojúhelníka PQR je určený např. polovinou absolutní hodnoty determinantu,
jehož řádky jsou souřadnice vektorů PQ a QR (viz Matematika I). Minimalizujeme
tedy determinant:
-2 + t t
-t2
- 2t -1 + t2 = 2t3
- t + 2.
Derivace je 6t2
- 1, extrémy tedy nastávají pro t =  1
6
, vzhledem k tomu, že
uvažujeme pouze nezáporný čas, vyšetřujeme pouze t = 1
6
, jde o minimum, navíc
je hodnota determinantu v tomto bodě kladná a menší, než hodnota v bodě 0
(krajní bod intervalu, na kterém hledáme extrém), je tedy o globální minimum
obsahu v čase.
6.11.3. V devět hodin ráno vylezl starý vlk z nory N a v rámci ranní rozcvičky začal
běhat proti směru hodinových ručiček po kružnici o poloměru 1km, kolem svého
oblíbeného pařezu P a to rovnoměrnou rychlostí 4 km/h. Ve stejnou dobu vyrazila
Karkulka z domu D k babičce sídlící v chaloupce C rychlostí 4 km/h (po přímce).
Kdy si budou nejblíž a jaká tato vzdálenost bude? Souřadnice (v kilometrech): N =
[2, 3], P = [3, 3], D = [0, 0], C = [5, 5].
1. DERIVOVÁNÍ 191
Řešení. Vlk se pohybuje po jednotkové kružnici, jeho úhlová rychlost je tedy stejná
jako jeho absolutní rychlost a jeho dráhu můžeme v závislosti na čase popsat následujícími
parametrickými rovnicemi:
x(t) = 2 - cos(4t), y(t) = 2 - sin(4t),
Karkulka se pak pohybuje po dráze
x(t) = 2

2t, y(t) = 2

2t.
Nalezněme extrémy (čtverce) vzdálenosti  jejich drah v čase:
(t) = (2 - cos(4t) - 2

2t)2
+ (2 - sin(4t) - 2

2t)2
 (t) = 16(cos(4t) - sin(4t))(

2t - 1) + 32t + 4

2(cos(4t) + sin(4t)) - 16

2
Řešit algebraicky rovnici  (t) = 0 se nám nepodaří (ani to nelze), zbývá pouze
najít řešení numericky (pomocí výpočetního softwaru). Zjistíme, že lokální minima
nastávají pro t
.
= 0, 31 a poté pro t
.
= 0, 97, kdy bude vzdálenost vlka a Karkulky
asi 5 metrů. Je zřejmé, že půjde i o globální minimum.
Situace, kdy neumíme explicitně vyřešit daný problém je v praxi velmi častá a
použití numerických metod výpočtu tedy má velký význam.
6.11.4. Určete parametr c  R tak, aby tečna ke grafu funkce ln(cx)

x
v bodě [1, 0]
procházela bodem [2, 2].
Řešení. Podle zadání má mít tečna směrnici 2 (2-0
2-1 ). Směrnice je určena derivací
funkce v daném bodě, dostáváme tedy podmínku
2 - ln(cx)
2

x
(1) = 2, neboli 2 - ln(c) = 4,
tedy c = 1
e2 . Pro c = 1
e2 je však hodnota fce ln(cx)

x
v bodě 1 rovna -2. Tedy žádné
takové c neexistuje.
6.11.5. Vyšetřete průběh funkce
x
ln(x)
,
a načrtněte její graf.
Řešení.
(1) Nejprve určíme definiční obor funkce: R+
\ {1}.
(2) Nalezneme intervaly monotónnosti funkce: nejprve nalezneme nulové body de-
rivace:
f (x) =
ln(x) - 1
ln2
(x)
= 0
Tato rovnice má kořen e. Dále vidíme, že f (x) je na intervalu (0, 1) i (1, e)
záporná, tedy je f(x) na intervalu (0, 1) i na (1, e) klesající, dále je f (x) na
intervalu (e, ) kladná a tedy f(x) rostoucí. Má tedy funkce f jediný extrém v
bodě e a to minimum. (také bychom o tom mohli rozhodnout pomocí znaménka
druhé derivace funkce f v bodě e, je totiž f(2)
(e) > 0)
192 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
(3) Určíme inflexní body:
f(2)
(x) =
ln(x) - 2
x ln3
(x)
= 0
Tato rovnice má kořen e2
, který musí být inflexním bodem (extrém to již být
nemůže vzhledem k předchozímu bodu).
(4) Asymptoty. Funkce má asymptotu přímku x = 1. Dále hledejme asymptoty s
konečnou směrnicí k:
k = limx
x
ln(x)
x
= lim
x
1
ln(x)
= 0.
Pokud asymptota existuje, má tedy směrnici 0. Pokračujme tedy ve výpočtu
lim
×
x
ln(x)
- 0  x = lim
x
ln(x) = ,
a protože limita není konečná, asymptota s konečnou směrnicí neexistuje.
Průběh funkce:
­4
­2
0
2
4
6
8
10
y
2 4 6 8 10 12 14 16 18 20
x
6.11.6. Vyšetřete průběh funkce ln(x)
x (tj. mimo jiné najít extrémy, inflexní body,
asymptoty) a načrtněte její graf.
Řešení. Def. obor R+
, globální maximum x = e, infl. bod x =

e3, rostoucí na int
(0, e), klesající na (e, ), konkávní (0,

e3, konvexní (

e3, ), asymptoty x = 0 a
y = 0, limx0 f(x) = -, limx f(x) = 0.
6.11.7. Vyšetřete průběh funkce (mimo jiné najít extrémy, inflexní body, asymptoty).
ln(x2
- 3x + 2) + x.
Řešení. Def. obor R \ 1, 2 . Lokální maximum x = 1-

5
2 , na celém def. oboru
konkávní, asymptoty x = 1, x = 2.
6.11.8. Vyšetřete průběh funkce (mimo jiné najít extrémy, inflexní body, asymptoty).
ln(x2
- 3x + 2) + x.
Řešení. Def. obor R \ 1, 2 . Lokální maximum x = 1-

5
2 , na celém def. oboru
konkávní, asymptoty x = 1, x = 2.
2. INTEGROVÁNÍ 193
6.11.9. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a
asymptoty):
(x2
- 2)ex2
-1
.
Řešení. Def. obor R. Lokální minima v -1, 1, maximum v 0. Funkce sudá. Inflexní
body  1
2
, bez asymptot.
6.11.10. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a
asymptoty):
ln(2x2
- x - 1).
Řešení. Def. obor R\ -1
2 , 1 . Glob. extrémy nemá. Bez inflexních bodů, asymptoty
x = -1
2 , x = 1.
6.11.11. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a
asymptoty):
x2
- 2
x - 1
.
Řešení. Def. obor R \ {1}. Bez extrémů. Bez infl. bodů, na int. (-, 1) konvexní,
(1, ) konkávní, Asymptota bez směrnice x = 1. Asymptota se směrnicí y = x + 1.
2. Integrování
6.9
6.12. Newtonův integrál. Předpokládejme, že známe na intervalu [a, b] reálnou
nebo komplexní funkci F(x) reálné proměnné x a její derivaci
F (x) = f(x).
Jestliže rozdělíme interval [a, b] na n částí volbou bodů
e6.2 (6.2) a = x0 < x1 <    < xn = b
a přiblížíme hodnoty derivací v bodech xi výrazy
f(x)
F(xi+1) - F(xi)
xi+1 - xi
dostáváme součtem
F(b) - F(a) =
n-1
i=0
F(xi+1) - F(xi)
xi+1 - xi
 (xi+1 - xi)
n-1
i=0
f(xi)  (xi+1 - xi).
Funkci F nazýváme antiderivace nebo neurčitý integrál k funkci f a poslední výraz
pro reálnou funkci f(x) zjevně přibližně vyjadřuje plochu vytyčenou grafem funkce
f, souřadnou osou x a přímkami x = a, x = b (včetně znaménka zohledňujícího
pozici plochy nad nebo pod osou x -- namalujte si obrázek!). Dá se tedy očekávat,
že takovou plochu skutečně spočteme jako rozdíl hodnot antiderivace v krajních
bodech intervalu. Tomuto postupu se také říká Newtonův integrál. Píšeme
b
a
f(x)dx = [F(x)]b
a = F(b) - F(a).
V případě komplexní funkce f je i reálná a imaginární část jejího integrálu jednoznačně
dána reálnou a imaginární částí f, budeme proto v dalším pracovat výhradně
s reálnými funkcemi.
194 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
V dalším skutečně ukážeme, že lze rozumně definovat pojem plocha v rovině
tak, aby ji bylo možné počítat právě uvedeným způsobem. Newtonův integrál má ale
jednu podstatnou vadu -- jeho vyčíslení vyžaduje znalost antiderivace. Tu obecně
není snadné spočíst i když ukážeme, že ke všem spojitým funkcím f existuje. Proto
budeme napřed diskutovat i jinou definici integrálu.
Všimněme si ještě, že antiderivace je na každém souvislém intervalu [a, b] určena
jednoznačně až na konstantu. Skutečně, pokud je F (x) = G (x) = f(x), pak
Taylorův rozvoj prvního řádu se zbytkem v bodě a dává
F(x) - G(x) = F(a) - G(a) + (f(c) - f(c))(x - a) = F(a) - G(a)
na nějakém okolí bodu a. Pokud by ale x0 < b bylo supremem hodnot, pro které
tento vztah ještě platí, opětovnou volbou tohoto bodu za a dosáhneme rozšíření
tohoto vztahu i napravo od něj. Musí tedy platit na celém intervalu. S poukazem
na toto pozorování budeme neurčitý integrál také zapisovat ve tvaru
F(t) = f(x)dx + C.
6.11
6.13. Riemannův integrál. Pro definici integrálu využijeme přímo intuitivní
úvahy, kterou jsme v minulém odstavci odůvodňovali souvislost Newtonova integrálu
s velikostí plochy.
Uvažme reálnou funkci f definovanou na intervalu [a, b] a zvolme dělení (6.2)
tohoto intervalu, spolu s výběrem reprezentantů i jednotlivých částí, tj. a = x0 <
x1 <    < xn = b a zároveň i  [xi-1, xi], i = 1, . . . , n. Normou takového dělení
nazýváme číslo min{xi - xi-1}. Riemannův součet odpovídající zvolenému dělení
 = (x0, . . . , xn) a reprezentantům  je dán výrazem
S, =
n
i=1
f(i)  (xi - xi-1)
Řekneme, že Riemannův integrál funkce f na intervalu [a, b] existuje, jestliže pro
každou posloupnost dělení s reprezentanty (k, k) s normou dělení jdoucí k nule
existuje limita
lim
k
Sk,k
= S,
jejíž hodnota navíc nezávisí na volbě posloupnosti dělení a reprezentantů. Píšeme
v takovém případě opět
S =
b
a
f(x)dx.
Tato definice nevypadá příliš prakticky, nicméně nám dovolí sformulovat a dokázat
některé jednoduché vlastnosti Riemannova integrálu.
Věta. (1) Je-li f omezená reálná funkce definovaná na reálném intervalu [a, b] a
c  [a, b] nějaký vnitřní bod, potom integrál
b
a
f(x)dx existuje tehdy a jen tehdy
když existují oba integrály
c
a
f(x)dx a
b
c
f(x)dx. V takovém případě pak také platí
b
a
f(x)dx =
c
a
f(x)dx +
b
c
f(x)dx.
2. INTEGROVÁNÍ 195
(2) Jsou-li f a g dvě reálné funkce definované na intervalu [a, b], a existují-li
integrály
b
a
f(x)dx a
b
a
g(x)dx, pak existuje také integrál jejich součtu a platí
b
a
(f(x) + g(x))dx =
b
a
f(x)dx +
b
a
g(x)dx.
(3) Je-li f reálná funkce definovaná na intervalu [a, b], C  R konstanta a
existuje-li integrál
b
a
f(x)dx, pak existuje také integrál
b
a
C  f(x)dx a platí
b
a
C  f(x)dx = C 
b
a
f(x)dx.
Důkaz. (1) Předpokládejme nejprve, že existuje integrál přes celý interval.
Jistě se lze při jeho výpočtu omezit na limity Riemannových součtů, jejichž dělení
mají bod c mezi svými dělícími body. Každý takový součet dostaneme jako součet
dvou dílčích Riemannových součtů. Pokud by tyto dílčí součty v limitě závisely
na zvolených rozděleních a reprezentantech, pak by celkové součty nemohly být v
limitě na volbách nezávislé (stačí ponechat jednu posloupnost dělení podintervalu
stejnou a druhou měnit tak, aby se limita změnila).
Naopak, jestliže existují Riemannovy integrály na obou podintervalech, jsou
libovolně přesně aproximovatelné Riemannovými součty a to navíc nezávisle na jejich
volbě. Pokud do libovolné posloupnosti Riemannových součtů přes celý interval
[a, b] přidáme jeden dělící bod c navíc, změníme hodnotu celého součtu i částečných
součtů přes intervaly patřící do [a, c] a [c, b] nejvýše o násobek normy dělení a možných
rozdílů omezené funkce f na celém [a, b]. To je číslo jdoucí libovolně blízko
k nule při zmenšující se normě dělení. Proto nutně i částečné Riemannovy součty
nutně konvergují k limitám, jejichž součtem je Riemannův integrál přes [a, b].
(2) V každém Riemannově součtu se součet funkcí projeví jako součet hodnot ve
vybraných reprezentantech. Protože je násobení reálných čísel distributivní, vyplývá
odtud právě dokazované tvrzení.
(3) Stejná úvaha jako v předchozím případě.
6.12 6.14. Věta. Pro každou spojitou funkci f na konečném intervalu [a, b] existuje
její Riemannův integrál
b
a
f(x)dx. Navíc, je funkce F(t) zadaná na intervalu [a, b]
pomocí Riemannova integrálu
F(t) =
t
a
f(x)dx
antiderivací funkce f na tomto intervalu.
Důkaz. Pro důkaz existence použijeme alternativní definici, která nahrazuje
výběr reprezentatů a příslušné hodnoty f(i) pomocí suprem hodnot f(x) v příslušném
podintervalu, resp. pomocí infim f(x) tamtéž. Hovoříme o horních Riemannových
součtech, resp. dolních Riemannových součtech (někdy také o tzv. Darbouxově
integrálu). Protože je naše funkce spojitá, je jistě i omezená na uzavřeném intervalu
a proto jsou všechna výše uvažovaná suprema i infima konečná. Je tedy horní
součet příslušný dělení  zadán výrazem
S,sup =
n
i=1
sup
xi-1xi
f()  (xi - xi-1)
196 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Zatímco dolní Riemannův součet je
S,inf =
n
i=1
inf
xi-1xi
f()  (xi - xi-1).
Protože zjevně pro každé dělení s reprezentanty (, ) platí
S,inf  S,  S,sup
a infima i suprema lze libovolně přesně aproximovat skutečnými hodnotami, bude
Riemannův integrál existovat právě když bude existovat pro libovolné posloupnosti
dělení s normou jdoucí k nule limita horních i dolních součtů a tyto si budou rovny.
Dokážeme, že tomu tak skutečně musí být.
Tvrzení. Nechť je funkce f omezená na uzavřeném intervalu [a, b]. Pak
Ssup = inf

S,sup, Sinf = sup

S,inf
jsou limity všech posloupností horních, resp. dolních, součtů s normou jdoucí k nule.
Důkaz. Pokud zjemníme nějaké rozdělení 1 na 2 přidáním dalších bodů, zřejmě
bude
S1,sup  S2,sup, S1,inf  S2,inf .
Každá dvě dělení mají společné zjemnění, jsou tedy hodnoty
Ssup = inf

S,sup, Sinf = sup

S,inf
dobrými kandidáty na limity horních a dolních součtů. Skutečně, pokud existuje společná
limita horních součtů S nezávislá na zvolené posloupnosti dělení, musí to být právě Ssup,
a podobně pro dolní součty.
Naopak, uvažme nějaké pevně zvolené dělení  s n vnitřními dělícími body intervalu
[a, b], a jiné dělení 1, jehož norma je hodně malé číslo . Ve společném zjemnění 2
bude jen n intervalů, které budou do součtu Ssup přispívat případně menším příspěvkem
než je tomu v 1. Protože je f omezená funkce na [a, b], bude každý z těchto příspěvků
ohraničený univerzální konstantou krát velikost intervalu. Při zvolení dostatečně malého 
tedy nebude vzdálenost S1,sup od Ssup více než dvakrát vzdálenost S,sup od Ssup. Právě
jsme ukázali, že pro libovolné číslo > 0 umíme najít takové  > 0, že pro všechna dělení s
normou nejvýše  bude |S,sup -S| < . To je přesné tvrzení, že číslo Ssup je limitou všech
posloupností horních součtů s normami dělení jdoucími k nule. Úplně stejně se dokáže i
tvrzení pro součty dolní.
Prozatím jsme ze spojitosti naší funkce f využili pouze to, že každá taková
funkce je na konečném uzavřeném intervalu omezená. Zbývá nám ale ukázat, že pro
spojité funkce je Ssup = Sinf . Ze definice spojitosti víme, že pro každý pevně zvolený
bod x  [a, b] a každé okolí O (f(x)) existuje okolí O(x) takové, že f(O(x)) 
O (f(x)). Toto tvrzení lze přepsat takto: jsou-li y, z  O(x), tzn. mimo jiné platí
|y - z| < 2,
je také f(y), f(z)  O (f(x)), tzn. mimo jiné platí
|f(y) - f(z)| < 2 .
Budeme potřebovat globální variantu takového tvrzení:
Tvrzení. Nechť je f spojitá funkce na uzavřeném konečném intervalu [a, b]. Pak
pro každé číslo > 0 existuje takové číslo  > 0, že pro všechny z, y  [a, b] splňující
|y - z| <  platí |f(y) - f(z)| < .
2. INTEGROVÁNÍ 197
Důkaz. Protože je každý konečný uzavřený interval kompaktní, umíme jej celý pokrýt
konečně mnoha okolími O(x)(x) zmiňovanými v souvislosti se spojitostí výše, přičemž
jejich poloměr (x) závisí na středu x zatímco čísla budeme uvažovat pořád stejná. Zvolíme
konečně za  minimum ze všech (konečně mnoha) (x). Naše spojitá funkce f tedy
má požadovanou vlastnost (pouze zaměňujeme čísla a  za jejich dvojnásobky).
Nyní již snadno dokončíme celý důkaz existence Riemannova integrálu. Zvolme
si a  jako v posledním tvrzení a uvažujme jakékoliv dělení  s n intervaly a
normou nejvýš . Pak
n
i=1
sup
xi-1xi
f()  (xi - xi-1) -
n
i=1
inf
xi-1xi
f()  (xi - xi-1)

n
i=1
sup
xi-1xi
f() - inf
xi-1xi
f()  (xi - xi-1)
  (b - a).
Vidíme tedy, že se zmenšující se normou dělení jsou k sobě horní a dolní součty
libovolně blízké. Proto infima a suprema splývají. To jsme potřebovali ukázat.
Víme již, že pro spojitou funkci f na intervalu [a, b] existuje pro každé t  [a, b]
integrál
t
a
f(x)dx. Zvolme jako výše k pevnému malému > 0 číslo  > 0 tak,
aby |f(x + x) - f(x)| < pro všechna 0  x < . Potom ovšem při použití
dostatečně jemného dělení intervalu [a, t + t] dostaneme
1
t
t+t
a
f(x)dx -
t
a
f(t)dt - f(t) < .
Skutečně, přiblížením integrálů kterýmkoliv Riemannovým součtem s dělením ,
v němž je t jedním z vnitřních bodů, dostaneme sčítance f(i)(xi - xi-1) s i 
[t, t + t] (ostatní se vyruší v rozdílu). Všechny hodnoty f(i) jsou ale k f(t) blíže
než o .
To ovšem znamená, že existuje v bodě t derivace funkce F(t) zprava a je rovna
f(t). Stejně dokážeme výsledek pro derivaci zleva a celá věta je dokázaná.
Důležité poznámky. (1) Předchozí dvě věty nám říkají, že integrál je lineární
zobrazení
: C[a, b]  R
vektorového prostoru spojitých funkcí na intervalu [a, b] do reálných čísel (tj. lineární
forma).
(2) Dokázali jsme, že každá spojitá funkce je derivací nějaké funkce. Newtonův
a Riemannův integrál tedy jako koncepty pro spojité funkce splývají. Riemannův
integrál spojitých funkcí lze proto spočíst pomocí rozdílu hodnot F(b) - F(a) antiderivace
F.
(3) V prvním pomocném tvrzení v důkazu předchozí věty jsme dokázali důležité
tvrzení, že pro omezenou funkci f na intervalu [a, b] vždy existují limity horních
součtů i dolních součtů. Říká se jim také horní Riemannův integrál a dolní Riemannův
integrál. Takto lze pro omezené funkce ekvivalentně definovat i Riemannův
integrál (jak jsme konečně v důkazu i činili).
(4) V dalším tvrzení v důkazu jsme odvodili důležitou vlastnost spojitých
funkcí, které se říká stejnoměrná spojitost na uzavřeném intervalu [a, b]. Zjevně
198 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
je každá stejnoměrně spojitá funkce také spojitá, naopak to ale na otevřených intervalech
platit nemusí.
(5) Uvažme funkci f na intervalu [a, b], která je pouze po částech spojitá. To
znamená, že je spojitá ve všech bodech c  [a, b] kromě konečně mnoha bodů nespojitosti
ci, a < ci < b. Vzhledem k aditivnosti integrálu vůči intervalu přes který
se integruje, viz 6.13(1), existuje podle poslední věty v takovém případě integrál
F(t) =
t
a
f(x)dx
pro všechna t  [a, b] a derivace funkce F(t) existuje ve všech bodech t, ve kterých
je f spojitá. Navíc se snadno ověří, že ve zbývajících bodech je funkce F(t) spojitá,
je to tedy spojitá funkce na celém intervalu [a, b]. Při výpočtu integrálu pomocí
antiderivací je zapotřebí volit její jednotlivé části tak, aby na sebe navazovaly. Pak
bude i celý integrál vyčíslen jako rozdíl v krajních hodnotách.
6.13
6.15. Integrace ,,po paměti . Neurčitý integrál nám formálně dovoluje spočíst
Riemannův integrál pro každou spojitou funkci. Nicméně prakticky bývá zejména
použitelný tam, kde v integrované funkci umíme derivaci přímo uvidět. K tomu
v jednoduchých případech stačí číst tabulky pro derivace funkcí v našem zvěřinci
naopak. Dostáváme tak např. následující tvrzení pro všechna a  R a n  Z,
n = -1:
a dx = ax + C
axn
dx =
a
n + 1
xn+1
+ C
eax
dx =
1
a
eax
+C
a
x
dx = a ln x + C
a cos bx dx =
a
b
sin bx + C
a sin bx dx = -
a
b
cos bx + C
a cos bx sinn
bx dx =
a
b(n + 1)
sinn+1
bx + C
a sin bx cosn
bx dx = -
a
b(n + 1)
cosn+1
bx + C
a tg bx dx = -
a
b
ln(cos bx) + C
a
a2 + x2
dx = arctg
x
a
+ C
-1

a2 - x2
dx = arccos
x
a
+ C
1

a2 - x2
dx = arcsin
x
a
+ C
2. INTEGROVÁNÍ 199
kde ve všech případech je zapotřebí zvážit definiční obor, na kterém je neurčitý
integrál dobře definován.
K takovýmto tabulkovým hodnotám lze relativně snadno dodávat další jednoduchými
pozorováními vhodné struktury integrovaných funkcí. Např.
f (x)
f(x)
dx = ln f(x) + C.
6.13
6.16. Integrace per partes a substitucí. Výpočet integrálu pomocí antiderivace
(neurčitého integrálu), spolu s pravidlem
(F  G) (t) = F (t)  G(t) + F(t)  G (t)
pro derivaci součinu funkcí, dává následující formuli pro neurčitý integrál
F(x)  G(x) + C = F (x)G(x) dx + F(x)G (x) dx.
Tato formule se většinou používá v případě, že jeden z integrálů napravo máme
počítat, zatímco druhý umíme počítat lépe.
Uveďme si nějaké příklady. Nejprve spočteme
I = x sin x dx.
V tomto případě pomůže volba F(x) = x, G (x) = sin x. Odtud G(x) = - cos x,
proto také
I = -x cos x - - cos x dx = -x cos x + sin x + C.
Obvyklým trikem je také použít tento postup s F (x) = 1:
ln x dx = 1  ln x dx = x ln x -
1
x
x dx = x ln x - x + C.
Další užitečný vzorec je odvozen z derivování složených funkcí. Je-li F (y) =
f(y) a y = (x), potom
dF((x))
dx
= F (y)   (x)
a tedy F(y) + C = f(y) dy lze spočíst jako
F((x)) + C = f((x)) (x) dx.
Dosazením x = -1
(y) pak dostaneme původně požadovanou antiderivaci. Častěji
zapisujeme tuto skutečnost takto:
f(y) dy = f((x)) (x) dx
a hovoříme o substituci za proměnnou y. Přímo na úrovni Riemannových součtů
je možné substituci porozumět snadno tak, že přírůstky v proměnné y a v x jsou
vzájemně ve vztahu popsaném formálně jako
dy =  (x) dx
který odpovídá vztahu dy
dx =  (x) a snadno jej spočítáme výpočtem derivace.
Jako příklad ověříme touto metodou předposlední integrál v seznamu v 6.14.
Pro integrál
I =
1

1 - x2
dx
200 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
zvolíme substituci x = sin t. Odtud dx = cos t dt a dostáváme
I =
1
1 - sin2
t
cos t dt =
1

cos2 t
cos t dt = dt = t + C.
Zpětným dosazením t = acrsin x dopočítáme již známý vzorec I = arcsin x + C.
Při substitucích je třeba dát pozor na skutečnou existenci inverzní funkce k
y = (x) a při výpočtu určitého integrálu je třeba řádně přepočítávat i meze.
6.15
6.17. Příklad. Často vede použití substitucí a metody per partes k rekurentním
vztahům, ze kterých teprve lze dopočíst hledané integrály. Spočtěme si alespoň
jeden příklad. Metodou per partes počítáme
Im = cosm
x dx = cosm-1
x cos x dx
= cosm-1
x sin x - (m - 1) cosm-2
x(- sin x) sin x dx
= cosm-1
x sin x + (m - 1) cosm-2
x sin2
x dx.
Odtud díky vztahu sin2
x = 1 - cos2
x dostáváme
mIm = cosm-1
x sin x + (m - 1)Im-2
a počáteční hodnoty jsou
I0 = x, I1 = sin x.
K těmto typům integrálů se substitucí x = tg t často převádí integrály, kde
integrovaná funkce závisí na výrazech tvaru (x2
+ 1). Skutečně, např. pro
Jk =
dx
(x2 + 1)k
dostáváme touto substitucí dx = cos-2
t dt
Jk =
dt
cos2 t sin2 t
cos2 t + 1
k
= cos2k-2
t dt.
Pro k = 2 je výsledkem
J2 =
1
2
(cos t sin t + t) =
1
2
tg t
1 + tg2
t
+ t
a proto také po zpětné substituci t = arctg x
J2 =
1
2
x
1 + x2
+ arctg x + C.
Při počítání určitých integrálů je možné celou rekurenci rovnou počítat po
vyčíslení v zadaných mezích. Tak například je okamžitě vidět, že při integraci přes
2. INTEGROVÁNÍ 201
interval [0, 2] je
I0 =
2
0
dx = [x]2
0 = 2
I1 =
2
0
cos x dx = [sin x]2
0 = 0
Im =
2
0
cosm
x dx =
0 pro sudá m
m-1
m Im-2 pro lichá m
.
Pro sudé m = 2n tedy dostáváme přímo výsledek
2
0
cos2n
x dx =
(2n - 1)(2n - 3) . . . 3  1
2n(2n - 2) . . . 2
2,
zatímco u lichých m je to vždy nula (jak bylo možné přímo uhádnout z grafu funkce
cos x).
6.17.1. 1. Vypočtěte:
(1) x cos x dx
(2) ln x dx
Řešení. V obou případech řešíme metodou per partes.
(1) x sin x + cos x
(2) x ln x - x
6.17.2. 2. Vypočtěte:
(1)

2
0
sin x sin 2x dx
(2) sin2
x sin 2x dx
Řešení.
(1) 2
3
(2) 1
2 sin4
x
6.17.3. 3. Dokažte, že
1
2
sin4
x = -
1
4
cos(2x) +
1
16
cos(4x) +
3
16
.
Řešení. Funkce na pravé a levé straně rovnosti mají shodné derivace, tudíž se liší o
reálnou konstantu. Tuto konstantu určíme porovnáním funkčních hodnot v jednom
bodě, například bodě 0. Hodnota obou funkcí je v nule nulová, jsou si tedy rovny.
202 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
6.16
6.18. Integrace racionálních funkcí lomených. U racionálních funkcí lomených
si můžeme při integraci pomoci několika zjednodušeními. Zejména v případě,
že je stupeň polynomu f v čitateli větší nebo roven stupni polynomu g v jmenovateli,
je rozumné hned z kraje dělením se zbytkem převést integraci na součet dvou
integrálů. První pak bude integrací polynomu a druhý integrací výrazu f/g se stupněm
g ostře větším, než je stupeň f. Toho skutečně dosáhneme prostým vydělením
polynomů:
f = q  g + h,
f
g
= q +
h
g
.
Můžeme tedy zrovna předpokládat, že stupeň g je ostře větší než stupeň f. Další
postup si ukažme na jednoduchém příkladě. Zkusme si rozebrat, jak se dostaneme
k výsledku
f(x)
g(x)
=
4x + 2
x2 + 3x + 2
=
-2
x + 1
+
6
x + 2
,
který již umíme integrovat přímo:
4x + 2
x2 + 3x + 2
dx = -2 ln |x + 1| + 6 ln |x + 2| + C.
Především převedením součtu zlomků na společného jmenovatele tuto rovnost snadno
ověříme. Pokud naopak víme, že lze náš výraz rozepsat ve tvaru
4x + 2
x2 + 3x + 2
=
A
x + 1
+
B
x + 2
a jde nám pouze o výpočet koeficientů A a B, můžeme pro ně získat rovnice pomocí
roznásobení obou stran polynomem x2
+ 3x + 2 ze jmenovatele a porovnáním
koeficientů u jednotlivých mocnin x ve výsledných polynomech napravo i nalevo:
4x + 2 = A(x + 2) + B(x + 1) = 2A + B = 2, A + B = 4.
Odtud již přímo vychází náš rozklad. Říká se mu rozklad na parciální zlomky.
Zkusme nyní zobecnit naše pozorování. Předpokládejme, že jmenovatel g(x)
naší racionální funkce lomené má právě n různých reálných kořenů a1, . . . , an a
předpokládejme, že naopak čitatel f(x) ani jedno z těchto čísel jako kořen nemá.
Pak jsou body a1, . . . an právě všechny body nespojitosti funkce f(x)/g(x) a nabízí
se tedy jako co nejjednodušší sčítance v součtu s podobnou vlastností výrazy tvaru
p(x)
(x - ai)ni
.
Chceme úspěšně použít stejný postup pro výpočet jako v předchozím jednoduchém
příkladě. Musíme si proto hlídat, abychom po roznásobení uměli dosazením vhodných
hodnot za volné koeficienty v polynomech p(x) dostat napravo i nalevo stejné
polynomy. Podbízí se tedy hledat sčítance, kde ni bude násobnost kořene ai, zatímco
p(x) bude polynom stupně ni - 1. Ověřte si, že taková volba naplňuje právě
sformulovaný záměr. Např. lze snadno spočíst, že
x - 4
(x + 1)(x - 2)2
=
-5
9(x + 1)
+
5x - 16
9(x - 2)2
.
Takto to skutečně projde vždy, kdy má polynom g(x) v čitateli právě tolik reálných
kořenů včetně násobnosti, kolik je jeho stupeň. Opět už umíme integrovat výsledné
2. INTEGROVÁNÍ 203
sčítance. První typ jsme už viděli. Druhý typ rozdělíme na součet dvou zlomků:
5x - 16
9(x - 2)2
=
5
9

x - 2
(x - 2)2
-
6
9

1
(x - 2)2
=
5
9

1
x - 2
-
6
9
1
(x - 2)2
.
tyto už opět integrovat umíme. Mohli jsme samozřejmě již rovnou hledat původní
rozklad na parciální zlomky ve tvaru
x - 4
(x + 1)(x - 2)2
=
A
x + 1
+
B
x - 2
+
C
(x - 2)2
.
Obdobně můžeme vždy spočíst rozklad na parciální zlomky u mocniny stupně n bude
v něm n sčítanců s konstantou v čitateli a postupně narůstajícími mocninami
příslušného lineárního faktoru ve jmenovateli.
Zbývá ošetřit ještě případ, kdy reálných kořenů není dostatek. Vždycky ale
existuje rozklad g(x) na lineární a kvadratické faktory (ty kvadratické odpovídají
dvojicím komplexně sdružených kořenů). Každý takový kvadratický faktor lze upravit
na součet čtverců (x-a)2
+b2
, budeme pro zjednodušení rovnou počítat s x2
+b2
.
Opět stejný požadavek na počet volných koeficientů a stupně nám naznačuje, že
bude možné hledat příslušné sčítance ve tvaru
Bx + C
(x - a)2 + b2
.
Obdobně jako v případě násobných kořenů se i v případě mocniny (x2
+ b2
)n
takového
faktoru druhého řádu vždy podaří najít odpovídající rozklad na parciální
zlomky tvaru
A1x + B1
(x - a)2 + b2
+    +
Anx + Bn
((x - a)2 + b2)n
.
Konkrétní výsledky lze také snadno ozkoušet v Maplu pomocí volání procedury
,,convert(h, parfrac, x) , které rozloží výraz h v proměnné x na parciální zlomky.
Všechny výše uvedené parciální zlomky už umíme integrovat. Připoměňme, že
ty poslední zmíněné vedou mimo jiné na integrály diskutované v Příkladu 6.17.
Celkově můžeme shrnout, že racionální funkce f(x)/g(x) lze poměrně snadno
integrovat, pokud se podaří najít příslušný rozklad polynomu ve jmenovateli g(x).
Při výpočtu určitých integrálů jsou ale problematické body nespojitosti racionálních
funkcí lomených, v jejichž okolí jsou tyto funkce neohraničené. Tomuto problému
se budeme obecně věnovat v následujícím odstavci.
6.17
6.19. Nevlastní a nekonečné integrály. Jak jsme právě viděli, občas musíme
pracovat s určitými integrály přes intervaly, v nichž jsou i body, kde integrovaná
funkce f(x) má nevlastní (jednostranné) limity. V takovém případě není integrovaná
funkce ani spojitá ani omezená a proto pro ni nemusí platit námi odvozené výsledky.
Hovoříme o ,,nevlastním integrálu .
Jednoduchým východiskem je diskutovat v takovém případě určité integrály
na menších intervalech s hranicí blížící se problematickému bodu a zkoumat, zda
existuje limitní hodnota takovýchto určitých integrálů. Pokud existuje, řekneme,
že příslušný nevlastní integrál existuje a je roven této limitě. Uvedeme postup na
jednoduchém příkladě:
I =
2
0
dx
4

2 - x
204 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
je nevlastní integrál, protože je má funkce f(x) = (2 - x)-1/4
v bodě b = 2 limitu
zleva rovnou . V ostatních bodech je integrovaná funkce spojitá. Zajímáme se
proto o integrály
I =
2-
0
dx
4

2 - x
=
2

y-1/4
dy = -
4
3
y3/4
2

=
4
3
23/4
-
4
3
3/4
.
Všimněme si, že jsme ve výpočtu substitucí dostali integrál s přepočtenou horní
mezí  a dolní mezí 2. Otočením mezí do obvyklé polohy jsme do výrazu přidali
jedno znaménko - navíc.
Limita pro   0 zprava zjevně existuje a spočítali jsme tedy nevlastní určitý
integrál
I =
2
0
dx
4

2 - x
=
4
3
23/4
.
Stejně budeme postupovat, pokud je zadáno integrování přes neohraničený interval.
Hovoříme o nekonečných integrálech. Obecně tedy např. pro a  R
I =

a
f(x) dx = lim
b
b
a
f(x) dx,
pokud limita vpravo existuje. Obdobně můžeme mít horní mez integrování konečnou
a druhou nekonečnou. Pokud jsou nekonečné obě, počítáme integrál jako součet
dvou integrálů s libovolně pevně zvolenou pevnou mezí uprostřed, tj.

f(x)
dx =
a
f(x)
dx +

a
f(x) dx
Existence ani hodnota nezávisí na volbě takové meze, protože její změnou pouze
o stejnou konečnou hodnotu měníme oba sčítance, ovšem s opačným znaménkem.
Naopak limita při které by stejně rychle šla horní i dolní mez do  může vést k
odlišným výsledkům! Např.
a
-a
x dx = [
1
2
x2
]a
-a = 0,
přestože hodnoty integrálů

a
x dx s jednou pevnou mezí utečou rychle k nekončených
hodnotám.
Ukažme si opět výpočet nekonečného integrálu na příkladě (jeden z typů parciálních
zlomků, integrál vyřešíme snadno substitucí x2
+ a2
= t, 2x dx = dt)

0
x
(x2 + a2)2
dx = lim
b
-1
2(x2 + a2)
b
0
= lim
b
-
1
2b2 + 2a2
+
1
2a2
=
1
2a2
.
Při výpočtu určitého integrálu z racionální funkce lomené musíme pečlivě rozdělit
zadaný interval podle bodů nespojitosti integrované funkce a spočítat jednotlivé
nevlastní integrály každý zvlášť. Navíc je nutné rozdělit celý interval tak, abychom
vždy integrovali funkci neohraničenou pouze v okolí jednoho z krajních bodů.
6.20. Příklady.
6.20.1. Spočtěte neurčitý integrál
1
x4 + 3x3 + 5x2 + 4x + 2
dx.
Řešení. 1
2 ln(x2
+ 2  x + 2) - 1
2 ln(x2
+ x + 1) + 1
3

3 arctan (2x+1)

3
3 + C.
2. INTEGROVÁNÍ 205
6.20.2. Vypočtěte integrál

2

4
sin(t)
1 - cos2 x
dt.
Řešení. 1
2 ln 2+ln(2)
2-ln(2) .
6.20.3. Vypočtěte integrál
ln(2)
0
dx
e2x - 3ex
.
Řešení. -1
6 - 2
9 ln(2).
6.18
6.21. Příklady užití integrálu. Sama definice Riemanova integrálu byla odvozena
od představy velikosti plochy v rovině se souřadnicemi x a y ohraničené osou
x, hodnotami funkce y = f(x) a hraničními přímkami x = a, x = b. Přitom je
plocha nad osou x dána s kladným znaménkem zatímco hodnoty pod osou vedou
ke znaménku zápornému. Ve skutečnosti víme pouze, co je to plocha rovnoběžnostěnu
určeného dvěma vektory, obecněji ve vektorovém prostoru Rn
víme, co je to
objem rovnoběžnostěnu. Plochy jiných podmnožin je teprve třeba definovat. Pro
některé jednoduché objekty jako třeba mnohoúhelníky je definice dána přirozeně
předpokládanými vlastnostmi. Námi vybudovaný koncept Riemannova integrálu je
možné zatím přímo použít pouze k měření ,,objemu jednorozměrných podmnožin.
O podmnožině A  R řekneme, že je (Riemannovsky) měřitelná, jestliže je funkce
 : R  R
A(x) =
1 jestliže je x  A
0 jestliže je x / A
Riemannovsky integrovatelná, tj. existuje integrál (ať už s konečnou nebo nekonečnou
hodnotou)
m(A) =


A(x) dx.
Funkci A říkáme charakteristická funkce množiny A. Všimněme si, že pro interval
A = [a, b] jde vlastně o hodnotu


A(x) dx =
b
a
dx = b - a,
přesně jak jsme očekávali. Zároveň má takováto definice ,,velikosti očekávanou
vlastnost, že míra sjednocení dvou Riemannovsky měřitelných disjunktních množin
vyjde jako součet (detailně tu ani nebudeme dokazovat). Pokud ale vezmeme
spočetné sjednocení, taková vlastnost již neplatí. Např. stačí vzít množinu Q všech
racionálních čísel jakožto sjednocení jednoprvkových podmnožin. Zatímco každá
množina o konečně mnoha bodech má podle naší definice míru nulovou, charakteristická
funkce Q není Riemannovsky integrovatelná.
Pro definici plochy (objemu) ve vícerozměrných prostorech budeme umět použít
koncept Riemannova integrálu, až jej zobecníme do vícerozměrného případu.
Nicméně je dobré si už teď povšimnout, že skutečně původní představa o ploše rovinného
útvaru uzavřeného výše uvedeným způsobem grafem funkce bude bezezbytku
naplněna.
206 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Střední hodnota funkce f(x) na intervalu (konečném nebo nekonečném) [a, b]
je definována výrazem
m =
1
b - a
b
a
f(x) dx.
Z definice je m výška obdélníka (s orientací podle znaménka) nad intervalem [a, b],
který má stejnou plochu jako je plocha mezi osou x a grafem funkce f(x).
Námi vybudovaný integrál jde také dobře použít pro výpočet délky křivky ve
vícerozměrném vektorovém prostoru Rn
. Pro jednoduchost si to předvedeme na
případu křivky v rovině R2
se souřadnicemi x, y. Mějme tedy parametrický popis
křivky F : R  R2
,
F(t) = [g(t), f(t)]
a představme si ji jako dráhu pohybu. Derivací tohoto zobrazení dostaneme hodnoty,
které budou odpovídat rychlosti pohybu po takovéto dráze. Proto celková
délka křivky (tj. dráha uražená za dobu mezi hodnotami t = a, t = b) bude dána
integrálem přes interval [a, b], kde integrovanou funkcí h(t) budou právě velikosti
vektorů F (t). Chceme tedy spočíst délku s rovnou
s =
b
a
h(t) dt =
b
a
(f (t))2 + (g (t))2 dt.
Ve speciálním případě, kdy křivka je grafem funkce y = f(x) mezi body a < b
obdžíme pro její délku
s =
b
a
1 + (f (x))2 dx
Tentýž výsledek lze intuitivně vidět jako důsledek Pythagorovy věty: pro lineární
přírůstek délky křivky s odpovídající přírůstku x proměnné x spočteme totiž
právě
s = x2 + y2
a to při pohledu přímo na naši definici integrálu znamená
s =
b
a
1 +
dy
dx
2
dx.
Jako snadný příklad spočteme délku jednotkové kružnice jako dvojnásobek integrálu
funkce y =

1 - x2 v mezích [-1, 1]. Víme již, že musí vyjít číslo 2, protože jsme
takto číslo  definovali.
s = 2
1
-1
1 + (y )2 dx = 2
1
-1
1 +
x2
1 - x2
dx
= 2
1
-1
1

1 - x2
dx = 2[arcsin x]1
-1 = 2.
Jestliže v předchozím výpočtu budeme počítat s y =

r2 - x2 = r 1 - (x/r)2 a
meze budou [-r, r], dostaneme substitucí x = rt déku kružnice o poloměru r:
s(r) = 2
r
-r
1 +
(x/r)2
1 - (x/r)2
dx = 2
1
-1
r

1 - t2
dt = 2r[arcsin x]1
-1 = 2r,
tzn. že je skutečně délka kružnice lineárně závislá na jejím poloměru.
2. INTEGROVÁNÍ 207
Podobně plochu takové kružnice spočteme substitucí x = r sin t, dx = r cos t dt
(s využitím výsledku pro I2 v 6.17)
a(r) = 2
r
-r
r2 - x2 dx = 2r2
/2
-/2
cos2
t dt =
2r2
2
[cos t sin t + t]
/2
-/2 = r2
.
Další obdobou téhož principu je výpočet povrchu nebo objemu rotačního tělesa.
Pokud vznikne těleso rotací grafu funkce f kolem osy x v intervalu [a, b], vzniká při
přírůstku x nárůst plochy o násobek s délky křivky zadané grafem funkce f a
velikosti kružnice o poloměru f(x). Plocha se proto spočte formulí
A(f) = 2
b
a
f(x) ds = 2
b
a
f(x) 1 + (f (x))2 dx,
kde ds = dx2 + dy2 je dán přírůstkem délky křivky y = f(x).
Objem stejného tělesa naroste při změně x o násobek tohoto přírůstku a
plochy kružnice o poloměru f(x). Proto je dán formulí
V (f) = 
b
a
(f(x))2
dx.
Jako příklad užití posledních dvou vzorců odvodíme známé formule pro plochu
jednotkové sféry a objem jednotkové koule.
Ar = 2
r
-r
r 1 - (x/r)2
1
1 - (x/r)2
dt = 2r
r
-r
dt = 4r2
Vr = 
r
-r
r2
- x2
dx = 2rr2
- 
1
3
x3
r
-r
=
4
3
r3
.
6.21.1. Odvoďte vzorec pro výpočet povrchu a objemu kužele.
6.21.2. Určete délku křivky dané parametricky
x = sin2
(t), y = cos2
(t),
pro t  0, 
2 .
Řešení. Možno počítat i přímo (jedná se o část přímky y = 1 - x).

2.
6.21.3. Určete délku křivky dané parametricky
x = t2
, y = t3
pro t  0,

5 .
Řešení. 335
27
6.21.4. Určete plochu ležící napravo od přímky x = 3 a dále ohraničenou grafem
funkce y = 1
x3-1 a osou x.
208 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Řešení. Plocha je dána nevlastním integrálem

1
1
x3-1 dx. Vypočteme jej metodou
rozkladu na parciální zlomky:
1
x3 - 1
=
Ax + B
x2 + x + 1
+
C
x - 1
1 = (Ax + B)(x - 1) + C(x2
+ x + 1)
x = 1 = C =
1
3
x0
: 1 = C - B = B = -
2
3
x2
: 0 = A + C = A = -
1
3
a můžeme psát

1
1
x3 - 1
dx =
1
3

1
1
(x - 1)
x
+ 2
x2 + x + 1
dx
Nyní určíme zvlášť neurčitý integrál x+2
x2+x+1 dx:
x + 2
x2 + x + 1
dx =
=
x + 1
2
(x + 1
2 )2 + 3
4
dx +
3
2
1
(x + 1
2 )2 + 3
4
dx =
substituce u prvního integrálu
t = x2
+ x + 1
dt = 2(x + 1
2 ) dx
=
1
2
1
t
dt +
3
2
1
(x + 1
2 )2 + 3
4
=
substituce u prvního integrálu
s = x + 1
2
ds = dx
=
1
2
ln(x2
+ x + 1) +
3
2
1
s2 + 3
4
ds =
=
1
2
ln((x2
+ x + 1) +
3
2
4
3
1
2
3
s
2
+ 1
ds =
substituce u druhého integrálu
u = 2
3
s
du = 2
3
s ds
=
1
2
ln(x2
+ x + 1) + 2

3
2
1
u2 + 1
du =
=
1
2
ln(x2
+ x + 1) +

3 arctan(u) =
1
2
ln(x2
+ x + 1) +

3 arctan
2x + 1

3
.
Celkem pak pro nevlastní integrál můžeme psát:

1
1
x3 - 1
dx =
1
3
lim

ln |x - 1| -
1
2
ln(x2
+ x + 1) -

3 arctan
2x + 1

3

3
=
=
1
3
lim

1
3
ln | - 1| -
1
2
ln(2
+  + 1) -

3 arctan
2 + 1

3
-
-
1
3
ln(2) +
1
6
ln(13) +

3
3
arctan
7

3
=
=
1
6
ln(13) -
1
3
ln(2) +

3
3
arctan
7

3
-
2. INTEGROVÁNÍ 209
-
1
3
lim

ln
x - 1

x2 + x + 1
-
1
3
lim


3 arctan
2 + 1

3
=
=
1
6
ln(13) +
1

3
arctan
7

3
-
1
3
ln(2) -

3
6

6.21.5. Určete povrch a objem rotačního paraboloidu, který vznikne rotací části
paraboly y = 2x2
pro x  0, 1 kolem osy y.
Řešení. Vzorce uvedené v textech platí pro rotaci křivek kolem osy x! Je tedy
nutno buď integrovat podle danou křivku neznámé y, nebo transformovat.
V =
2
0
x
2
dx = 
S = 2
2
0
x
2
( 1 +
1
8x
) dx = 2
2
0
x
2
+
1
16
dx = 
17

17 - 1
24
dx.
Pomocí nevlastního integrálu také umíme rozhodnout o konvegenci širší třídy
nekonečných řad než doposud:
6.22. Věta. Integrální kriterium konvergence řad. Buď

n=1 f(n) řada taková,
že funkce f : R  R je kladná a nerostoucí na intervalu 1, ). Pak tato
řada konverguje právě tehdy, když konverguje intergrál

1
f(x) dx.
Důkaz. Pokud interpretujeme integrál, jako plochu pod křivkou, je kriterium
zřejmé.
Pokud daná řada diverguje, pak diverguje i řada

n=2 f(n). Pro libovolné
k  N máme pro k-tý částečný součet sk (řady bez prvního člene) nerovnost
sk =
k
n=2
f(n) <
k
1
f(x) dx,
neboť sk je dolním součtem Riemannova integrálu
k
1
f(x) dx. Pak ale je

1
f(x) dx = lim
k
k
1
f(x) dx > lim
k
sk = ,
a uvažovaný integrál diverguje.
Předpokládeme nyní, že daný integrál konverguje a označme k-tý částečný součet
dané řady jako sk. Potom máme nerovnosti

1
f(x) dx = lim
k
k
1
f(x) dx < lim
k
sk < ,
neboť sk je horním součtem Riemannova integrálu
k
1
f(x) dx a předpokádáme, že
daná řada konverguje.
6.22.1. 3. Rozhodněte, zda následující sumy konvergují či divergují:
a)

n=1
1
n ln n ,
210 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
b)

n=1
1
n2 .
Řešení. Všimněme si nejprve, že ani u jedné z uvažovaných řad neumíme o její
konvergenci rozhodnout na základě podílového či odmocninového kriteria (všechny
limity lim
n
|an+1
an
| i lim
n
n

an jsou rovny 1). Pomocí integrálního kriteria pro konvergenci
řad pak dostáváme:
a)

1
1
x ln(x)
dx =

0
1
t
dt = lim

[ln(t)]

0 = ,
daná řada tedy diverguje.
b)

1
1
x2
dx = lim

-
1
x

1
= 1,
a daná řada tedy konverguje.
3. Nekonečné řady
Již jsme se při budování našeho zvířetníku funkcí setkali s mocninnými řadami,
které přirozeným způsobem rozšiřují skupinu všech polynomů, viz 5.28. Zároveň
jsme si říkali, že takto získáme třídu analytických funkcí, ale nedokazovali jsme
tehdy ani to, že jsou mocninné řady spojitými funkcemi. Snadno nyní ukážeme,
že tomu tak je a že skutečně umíme mocninné řady i diferencovat a integrovat po
jednotlivých sčítancích. Právě proto ale také uvidíme, že není možné pomocí mocninných
řad získat dostatečně širokou třídu funkcí. Např. nikdy tak nedostaneme
jen po částech spojisté periodické funkce, které jsou tak důležité pro modelování a
zpracování audio a video signálů.
6.19
6.23. Jak ochočené jsou řady funkcí? Vraťme se nyní k diskusi limit posloupností
funkcí a součtu řad funkcí z pohledu uplatnění postupů diferenciálního a
integrálního počtu. Uvažujme tedy konvergentní řadu funkcí
S(x) =

n=1
fn(x)
na intervalu [a, b]. Přirozené dotazy jsou:
* Jsou-li všechny funkce fn(x) spojité v nějakém bodě x0  [a, b], je spojitá i
funkce S(x) v bodě x0?
* Jsou-li všechny funkce fn(x) diferencovatelné v a  [a, b], je v něm diferencovatelná
i funkce S(x) a platí vztah S (x) =

n=1 fn(x)?
* Jsou-li všechny funkce fn(x) integrovatelné na intervalu [a, b], je integrovatelná
i funkce S(x) a platí vztah S (x) =

n=1 fn(x)?
Ukážeme si nejprve na příkladech, že odpovědi na všechny tři takto kladené
otázky jsou ,,NE! . Poté ale najdeme jednoduché dodatečné podmínky na konvergenci
řady, které naopak platnosti všech tří tvrzení zajistí. Řady funkcí tedy
obecně moc zvladatelné nejsou, nicméně si umíme vybrat velikou třídu takových,
se kterými se už pracuje velmi dobře. Mezi ně samozřejmě budou patřit mocninné
řady.
3. NEKONEČNÉ ŘADY 211
Uvažme funkce fn(x) = (sin x)n
na intervalu [0, ]. Hodnoty těchto funkcí
budou ve všech bodech 0  x   nezáporné a menší než jedna, kromě x = 
2 , kde
je hodnota 1. Proto
lim
n
fn(x) =
0 pro všechna x = 
2
1 pro x = 
2 .
Zjevně tedy je limita posloupnosti funkcí fn nespojitou funkcí. Tentýž jev umíme najít
i pro řady funkcí, protože součet je limitou částečných součtů. Stačí tedy v předchozím
příkladě vyjádřit fn jako n-tý částečný součet. Např. f1(x) = sin x, f2(x) =
(sin x)2
- sin x, atd. Levý obrázek vykresluje funkce fn3 (x) pro n = 1, . . . , 10.
x
32,5
0,2
1
0,5
0,4
1 20
0,6
1,5
0,8
0
-0,5
0,4
0,2
x
1
-0,4
-0,2
0
0-1 0,5
Obrázek na pravo vykresluje fn(x) = x(1-x2
)n
na intervalu [-1, 1] pro hodnoty
n = m2
, m = 1, . . . , 10. Na první pohled je zjevné, že
lim
n
fn(x) = 0,
všechny funkce fn(x) jsou hladké, ale v bodě x = 0 je jejich derivace
fn(0) = (1 - x2
)n
- 2nx2
(1 - x2
)n-1
|x=0 = 1
nezávisle na n. Limitní funkce pro posloupnost fn přitom má samozřejmě všude
derivaci nulovou!
Protipříklad k třetímu tvrzení jsme už viděli. Charakteristickou funkci Q racionálních
čísel můžeme vyjádřit jakou součet spočetně mnoha funkcí, které budou
očíslovány právě racionálními čísly a budou vždy všude nulové, kromě množiny
bodů, podle které jsou pojmenovány, kde jsou rovny 1. Riemannovy integrály všech
takových funkcí budou nulové, jejich součet ale není Riemannovsky inegrovatelnou
funkcí.
6.20
6.24. Stejnoměrná konvergence posloupností a řad funkcí. Zjevným důvodem
neúspěchu ve všech třech předchozích příkladech je skutečnost, že rychlost
bodové konvergence hodnot fn(x)  f(x) se bod od bodu velice liší. Přirozenou
myšlenkou tedy je omezit se na takové případy, kdy bude naopak konvergence probíhat
přibližně podobně rychle po celém intervalu.
212 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Říkáme, že posloupnost funkcí fn(x) konverguje stejnoměrně na intervalu [a, b]
k limitě f(x), jestliže pro každé kladné (malé) číslo existuje (velké) přirozené číslo
N  N takové, že pro všechna n  N a všechna x  [a, b] platí
|fn(x) - f(x)| < .
Graficky si definici můžeme představit tak, že do pásu vzniklého posunutím limitní
funkce f(x) na f(x) pro libovolně malé, ale pevně zvolené kladné , vždy padnou
všechny funkce fn(x), až na konečně mnoho z nich. Tuto vlastnost zjevně neměl
první a poslední z předchozích příkladů, u druhého ji postrádala posloupnost derivací
fn.
O řadě funkcí řekneme, že konverguje stejnoměrně na intervalu, jestliže stejnoměrně
konverguje posloupnost jejích částečných součtů.
Následující tři věty lze stručně shrnout tvrzením, že všechna tři obecně neplatná
tvrzení v 6.23 platí pro stejnoměrnou konvergenci (pozor ale na jemnosti u
derivování).
6.21 6.25. Věta. Nechť fn(x) je posloupnost funkcí spojitých na intervalu [a, b], která
na tomto intervalu stejnoměrně konverguje k funkci f(x). Pak je také f(x) spojitá
funkce na intervalu [a, b].
Důkaz. Chceme ukázat, že pro libovolný pevný bod x0  [a, b] a jakékoliv
pevně zvolené malé > 0 bude |f(x) - f(x0)| < pro všechna x dostatečně blízká
k x0. Z definice stejnoměrné spojitosti je pro naše > 0
|fn(x) - f(x)| <
pro všechna x  [a, b] a všechna dostatečně velká n. Zvolme si tedy nějaké takové
n a uvažme  > 0 tak, aby |fn(x) - fn(x0)| < pro všechna x z -okolí x0 (to je
možné, protože všechny fn(x) jsou spojité). Pak
|f(x) - f(x0)| < |f(x) - fn(x)| + |fn(x) - fn(x0)| + |fn(x0) - f(x0)| < 3
pro všechna x z námi zvoleného -okolí bodu x0.
6.22 6.26. Věta. Nechť fn(x) je posloupnost Riemannovsky integrovatelných funkcí na
konečném intervalu [a, b], které stejnoměrně konvergují k funkci f(x). Pak také f(x)
je integrovatelná a platí
lim
n
b
a
fn(x) dx =
b
a
( lim
n
fn(x)) dx =
b
a
f(x) dx.
Důkaz. Důkaz se opírá o zobecnění vlastností Cauchyovských posloupností
čísel na stejnoměrnou konvergenci funkcí. Tímto způsobem umíme pracovat s existencí
limity posloupnosti integrálů, aniž bychom ji potřebovali znát.
Řekneme, že posloupnost funkcí fn(x) na intervalu [a, b] je stejnoměrně Cauchyovská,
jestliže pro každé (malé) kladné číslo existuje (velké) přirozené číslo N
takové, že pro všechna x  [a, b] a všechna n  N platí
|fn(x) - fm(x)| < .
Zřejmě je každá stejnoměrně konvergentní posloupnost funkcí na intervalu [a, b]
také stejnoměrně Cauchyovská na témže intervalu. Toto pozorování nám už stačí k
důkazu naší věty, zastavíme se ale napřed u užitečného obráceného tvrzení:
Tvrzení. Každá stejnoměrně Cauchyovská posloupnost funkcí fn(x) na intervalu
[a, b] stejnoměrně konverguje k nějaké funkci f na tomto intervalu.
3. NEKONEČNÉ ŘADY 213
Důkaz. Z podmínky Cauchyovskosti posloupnosti funkcí okamžitě vyplývá,
že také pro každý bod x  [a, b] je posloupnost hodnot fn(x) Cauchyovskou posloupností
reálných (případně komplexních) čísel. Bodově tedy nutně konverguje
posloupnost funkcí fn(x) k nějaké funkci f(x).
Ukážeme, že ve skutečnosti konverguje posloupnost fn(x) ke své limitě stejnoměrně.
Zvolme N tak velké, aby
|fn(x) - fm(x)| <
pro nějaké předem zvolené malé kladné a všechna n  N, x  [a, b]. Nyní zvolíme
pevně jedno takové n a odhadneme
|fn(x) - f(x)| = lim
m
|fn(x) - fm(x)| 
pro všechna x  [a, b].
Konečně se vrátíme ke snadnému důkazu věty: Připomeňme, že každá stejnoměrně
konvergentní posloupnost funkcí je také stejnoměrně Cauchyovská a že
Riemannovy součty pro jednotlivé členy naší posloupnosti konvergují k
b
a
fn(x) dx
nezávisle na výběru dělení a reprezentantů. Proto jestliže platí
|fn(x) - fm(x)| <
pro všechna x  [a, b], pak také
b
a
fn(x) dx -
b
a
fm(x) dx  |b - a|.
Je tedy posloupnost čísel
b
a
fn(x) dx Cauchyovská a proto konvergentní. Současně
ale také díky stejnoměrné konvergenci posloupnosti fn(x) platí pro limitní funkci
f(x) ze stejného důvodu, že její Riemannovy součty jsou libovolně blízké Riemannových
součtům pro funkce fn s dostatečně velkým n a limitní funkce f(x) bude
tedy opět integrovatelná. Zároveň
b
a
fn(x) dx -
b
a
f(x) dx  |b - a|.
a musí proto jít o správnou limitní hodnotu.
Pro příslušný výsledek o derivacích je třeba zvýšené pozornosti ohledně před-
pokladů:
6.23 6.27. Věta. Nechť fn(x) je posloupnost funkcí diferencovatelných na intervalu
[a, b], která na tomto intervalu stejnoměrně konverguje k funkci f(x). Dále nechť
jsou všechny derivace gn(x) = fn(x) spojité a nechť konvergují na témže intervalu
stejnoměrně k funkci g(x). Pak je také funkce f(x) diferencovatelná na intervalu
[a, b] a platí zde f (x) = g(x).
Důkaz. Bez újmy na obecnosti můžeme předpokládat, že všechny naše funkce
splňují fn(a) = 0 (v opačném případě je pozměníme o konstanty a na výsledku
úvah se nic nezmění). Pak ovšem můžeme psát pro všechny x  [a, b]
fn(x) =
x
a
gn(t) dt.
214 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET
Protože ale funkce gn stejnoměrně konvergují k funkci g na celém [a, b], tedy tím
spíše na intervalech [a, x], kde a  x  b, platí také
f(x) =
x
a
g(t) dt.
Protože je funkce g coby stejnoměrná limita spojitých funkcí opět spojitou funkcí,
dokázali jsme vše potřebné, viz Věta 6.13 o Riemannově integrálu a antiderivaci.
6.24 6.28. Důsledek. Pro nekonečné řady můžeme předchozí výsledky shrnout takto:
Uvažme funkce fn(x) na intervalu I = [a, b].
(1) Jsou-li všechny funkce fn(x) spojité na I a řada S(x) =

n=1 fn(x) konverguje
stejnoměrně k funkci S(x), je i funkce S(x) spojitá na I.
(2) Jsou-li všechny funkce fn(x) spojitě diferencovatelné na I, a obě řady
S(x) =

n=1
fn(x), T(x) =

n=1
fn(x)
konvergují stejnoměrně, pak je také funkce S(x) spojitě diferencovatelná a platí
S (x) = T(x), tj.

n=1
fn(x) =

n=1
fn(x).
(3) Jsou-li všechny funkce fn(x) Riemannovsky integrovatelné na I a řada
S(x) =

n=1 fn(x) konverguje stejnoměrně k funkci S(x) na I, je tamtéž integrovatelná
i funkce S(x) a platí vztah
b
a

n=1
fn(x) dx =

n=1
b
a
fn(x) dx.
6.25
6.29. Test pro stejnoměrnou konvergenci. Nejjednodušším způsobem pro zjištění
stejnoměrné konvergence funkcí je porovnání s absolutní konvergencí vhodné
posloupnosti. Říkává se tomu často Weierstrassův test. Předpokládejme tedy, že
máme řadu funkcí fn(x) na intervalu I = [a, b] a že navíc známe odhad
|fn(x)|  an  R
pro vhodné reálné konstanty an a všechna x  [a, b]. Okamžitě můžeme odhadnout
rozdíly částečných součtů sk(x) =
k
n=1 fn(x) pro různé indexy k. Pro k > m
dostáváme
|sk(x) - sm(x)| 
k
n=m+1
fn(x) 
k
n=m+1
|fn(x)| 
k
n=m+1
ak.
Pokud je řada (kladných) konstant

n=1 an konvergentní, pak bude samozřejmě
posloupnost jejích částečných součtů Caychyovská. Právě jsme ale spočetli, že v
takovém případě bude posloupnost částečných součtů sn(x) stejnoměrně Caychyovská.
Díky tvrzení dokázanému před chvílí v 6.26 jsme tedy právě dokázali násle-
dující
Tvrzení. Nechť fn(x) je posloupnost funkcí definovaných na intervalu I = [a, b]
a platí |fn(x)|  an  R. Je-li řada čísel

n=1 an konvergentní, pak řada S(x) =

n=1 fn(x) konverguje stejnoměrně.
3. NEKONEČNÉ ŘADY 215
6.26
6.30. Důsledky pro mocninné řady. Weistrassův testu je velice užitečný pro
diskusi mocninných řad
S(x) =

n=1
an(x - x0)n
se středem v bodě x0. Při našem prvním setkání s mocninnými řadami jsme ukázali
v 5.30, že každá taková řada konverguje na (x0 - , x0 + ), kde tzv. poloměr
konvergence   0 může být také nula nebo . (viz také 5.33). Zejména jsme v
důkazu věty 5.30 pro ověření konvergence řady S(x) používali srovnání s vhodnou
geometrickou posloupností. Podle Weistrassova testu je proto řada S(x) stejnoměrně
konvergentní na každém kompaktním (tj. konečném) intervalu [a,b] uvnitř
intervalu (x0 - , x0 + ). Dokázali jsme tedy
Důsledek. Každá mocninná řada S(x) je ve všech bodech uvnitř svého intervalu
konvergence spojitá a spojitě diferencovatelná. Funkce S(x) je také integrovatelná
a derivování i integrování lze provádět člen po členu.
Ve skutečnosti platí také tzv. Abelova věta, která říká, že mocninné řady jsou
spojité i v hraničních bodech svého definičního oboru (včetně případných nekonečných
limit). Tu zde nedokazujeme.
Právě dokázané příjemné vlastnosti mocninných řad zároveň poukazují na hranice
jejich použitelnosti při modelování závislostí nějakých praktických jevů nebo
procesů. Zejména není možné pomocí mocninných řad dobře modelovat po částech
spojité funkce. Jak uvidíme v zápětí, je možné pro konkrétněji vymezené potřeby
nacházet lepší sady funkcí fn(x) než jsou hodnoty fn(x) = xn
. Nejznámějšími příklady
jsou Fourierovy řady a tzv. wawelety, které přibolížíme v další kapitole.
6.30.1. Sečtěte řadu

n=1
1
n2n
.
Nápověda:

2
dx
xn+1 = 1
n2n .
Řešení. Zaměnou sumace s integrací dostaneme integrál

2

n=1
1
xn+1 dx =
ln 2.
KAPITOLA 7
Spojité modely
jak šikovně zachytit nelinární změny?
­ pořádně si je lineárně přibližme...
V této kapitole se budeme snažit podat stručné náznaky, jak lze relativně jednoduše
používat nástroje diferenciálního a integrálního počtu. V jistém smyslu půjde
o postupy a nástroje podobné, jako jsme již viděli v kapitole třetí. Jen místo konečně
rozměrných vektorů budou naše objekty nebo jejich stavy často prezentovány
pomocí funkcí.
V první části budeme aproximovat funkce pomocí předem pevně zvolených
sad generátorů. V zásadě budeme ideově pokračovat v postupech, které známe z
konce třetí části druhé kapitoly. Poté se budeme zabývat integrálními operacemi,
tj. lineárními operátory definovanými na funkcích pomocí integrování.
1. Aproximace pomocí Fourierových řad
7.1
7.1. Vzdálenosti funkcí. Zvolme si pevně nějaký interval I = [a, b], konečný
nebo nekonečný. Koncept integrování můžeme velice intuitivním způsobem využít
pro vyjádření vzdálenosti funkcí definované na I: Pro každé dvě (reálné nebo komplexní)
funkce f, g na I zkusíme definovat jejich vzdálenost f - g jako plochu
oblasti vymezené mezi jejich grafy, tj.
f - g 2
=
b
a
|f(x) - g(x)|2
dx.
Samozřejmě je třeba předpokládat, že tento Riemannův integrál existuje. Velikost
f funkce f je pak její vzdálenost od funkce nulové, tj.
f 2
=
b
a
|f(x)|2
dx.
Pro jednoduchost budeme pracovat s množinou S = S[a, b] omezených a po
částech spojitých reálných funkcí na I, ale úvahy lze rozšiřovat podle potřeby (často
ale za cenu značné technické námahy).
Z námi již dokázaných vlastností integrování je okamžitě vidět, že S je vektorový
prostor a že námi právě uvažovaná velikost je odvozena z dobře definovaného
symetrického bilineárního zobrazení
f, g =
b
a
f(x)g(x) dx,
které má všechny vlastnosti skalárního součinu. V konečněrozměrném případě jsme
takto definovali velikost vektorů v odstavci 2.37. Nyní je to naprosto stejné a pokud
zúžíme naši definici na vektorový prostor generovaný nad reálnými čísly jen konečně
217
218 7. SPOJITÉ MODELY
mnoha funkcemi f1, . . . , fk, dostaneme opět dobře definovaný skalární součin na
tomto konečněrozměrném vektorovém podprostoru.
Jako příklad uvažme funkce fi = xi
, i = 0, . . . , k. Jimi je v S generován (k+1)rozměrný
vektorový podprostor Rk[x] všech polynomů stupně nejvýše k. Skalární
součin dvou takových polynomů je dán integrálem. Každý polynom stupně nejvýše k
je vyjádřen jednoznačným způsobem jako lineární kombinace generátorů f0, . . . , fk.
Pokud by navíc naše generátory měly tu vlastnost, že
e7.1 (7.1) fi, fj =
0 pro i = j
1 pro i = j
jde o tzv. ortonormální bázi. Připomeňme si v této souvislosti proceduru GrammovySchmidtovy
ortogonalizace, viz 2.48, která z libovolného systému generátorů fi vytvoří
nové ortogonální generátory gi téhož prostoru, tj. gi, gj = 0 pro všechny
i = j. Spočteme je přitom postupně jako g1 = f1 a formulemi
g +1 = f +1 + a1g1 +    + a g , ai = f
+1, gi
gi
2
pro > 1.
Aplikujme tuto proceduru na první tři polynomy 1, x, x2
na intervalu [-1, 1].
Dostaneme g1 = 1,
g2 = x -
1
g1
2
1
-1
x  1 dx  1 = x - 0 = x
g3 = x2
-
1
g1
2
1
-1
x2
 1 dx  1 -
1
g2
2
1
-1
x2
 x dx  x
= x2
-
1
3
.
Příslušná ortogonální báze prostoru R2[x] na intervalu [-1, 1] je tedy 1, x, x2
- 3.
Normalizací, tj. vhodným násobením skalárem tak, aby prvky v bázi měly velikost
jedna dostaneme ortonormální bázi
h1 =
1
2
, h2 =
3
2
x, h3 =
1
2
5
2
(3x2
- 1).
Takovým ortonormálním generátorům Rk[x] se říká Legendreovy polynomy.
7.2
7.2. Ortogonální systémy funkcí. Připomeňme si výhody, které ortonormální
báze podprostorů měly pro konečněrozměrné vektorové prostory. Můžeme pokračovat
v předchozím příkladu polynomů a uvažovat třeba V = Rk[x] pro libovolné
k > 2. Pro libovolnou funkci h  V bude funkce
H = h, h1 h1 + h, h2 h2 + h, h3 h3
jednoznačně určenou funkcí, která minimalizuje vzdálenost h - H mezi všemi
funkcemi v R2[x]. Koeficienty pro nejlepší aproximaci zadané funkce pomocí funkce
z vybraného podprostoru je možné tedy získat prostě integrací.
Uvedený příklad podbízí následující zobecnění: Když provedeme proceduru
Grammovy­Schmidtovy ortogonalizace pro všechny monomy 1, x, x2
, . . . , tj. pro
spočetný systém generátorů, co z toho vznikne? Nebo ještě obecněji ­ co se stane,
když zvolíme úplně libovolný spočetný systém lineárně nezávislých funkcí v S takový,
že každé dvě různé z nich mají nulový skalární součin? Takovému systému
1. APROXIMACE POMOCÍ FOURIEROVÝCH ŘAD 219
funkcí na intervalu I říkáme ortogonální systém funkcí. Jestliže jsou všechny funkce
fn v posloupnosti po dvou ortogonální a zároveň je pro všechna n velikost fn = 1
normovaná, hovoříme o ortonormálním systému funkcí.
Nechť tedy tvoří posloupnost funcí fn ortogonální systém po částech spojitých
funkcí na intervalu I = [a, b] a předpokládejme, že pro konstanty cn konverguje
řada
F(x) =

n=1
cnfn
stejnoměrně na I. Pak snadno vyjádříme skalární součin F, fn po jednotlivých
sčítancích (viz Důsledek 6.28) a dostaneme
F, fn =

m=1
cm
b
a
fm(x)fn(x) dx = cn fn
2
.
Máme tedy tušení, v jakou přibližně odpověď je možné doufat, a docela přehledně
nám ji skutečně dává následující věta:
7.3 7.3. Věta. Nechť fn, n = 1, 2, . . . , je ortogonální posloupnost funkcí Riemannovsky
integrovatelných na I = [a, b] a nechť g je libovolná funkce Riemannovsky integrovatelná
na I. Označme
cn = fn
-2
b
a
fn(x)g(x) dx.
(1) Pro libovolné pevné n  N má ze všech lineárních kombinací funkcí f1, . . . , fn
nejmenší vzdálenost od g výraz
hn =
n
i=1
cifi(x).
(2) Řada čísel

n=1 c2
n fn
2
vždy konverguje a platí

n=1
c2
n fn
2
 g 2
.
(3) Vzdálenost g od částečných součtů sk =
k
n=1 cnfn jde v limitě k nule, tj.
lim
k
g - sk
2
= 0,
tehdy a jen tehdy, když

n=1
c2
n fn
2
= g 2
.
Ještě než se pustíme do důkazu, zkusíme lépe porozumět významu jednotlivých
tvrzení této věty. Protože pracujeme s úplně libovolně zvoleným ortogonálním
systémem funcí, nemůžeme očekávat, že lze dobře aproximovat jakoukoliv funkci
pomocí lineárních kombinací funkcí fi. Např. když se omezíme u ortogonálních polynomů
pouze na sudé stupně, určitě budeme dobře aproximovat pouze sudé funkce.
Nicméně hned první tvrzení nám říká, že vždycky budeme dosahovat nejlepší možné
aproximace částečnými součty. Druhé a třetí tvrzení pak můžeme vnímat jako analogii
ke komým průmětům do podprostorů vyjádřených pomocí souřadnic. Skutečně,
že pokud k dané funkci g bodově konverguje řada F(x) =

n=1 cnfn, pak je funkce
F(x) kolmým průmětem g do vektorového podprostoru všech takovýchto řad.
220 7. SPOJITÉ MODELY
Na druhé straně ale naše věta neříká, že by částečné součty uvažované řady
musely bodově konvergovat k nějaké funkci. Tj. řada F(x) nemusí být obecně konvergentní
ani v případě, kdy nastane rovnost v (3). Pokud ale např. existuje konečná
hodnota

n=1 |ci| a všechny funkce fn jsou stejnoměrně omezené na I, pak zřejmě
řada F(x) konverguje v každém x.
Důkaz. Zvolme libovolnou lineární kombinaci f =
k
n=1 anfn a spočtěme její
vzdálenost od g. Dostáváme
g -
k
n=1
anfn
2
=
b
a
g -
k
n=1
anfn
2
dx
=
b
a
g2
dx - 2
b
a
k
n=1
anfng dx +
b
a
k
n=1
anfn
2
dx
= g 2
- 2
k
n=1
ancn +
k
n=1
a2
n fn
2
= g 2
+
k
n=1
fn
2
((cn - an)2
- c2
n).
Evidentně lze poslední výraz minimalizovat právě volbou an = cn a tím je první
tvrzení dokázáno.
Dosazením této volby dostáváme tzv. Besselovu identitu
g -
k
n=1
cnfn
2
= g 2
-
k
n=1
c2
n fn
2
,
ze které okamžitě díky nezápornosti levé strany vyplývá tzv. Besselova nerovnost
k
n=1
c2
n fn
2
 g 2
.
Tím je dokázáno druhé tvrzení, protože každá neklesající a shora omezená posloupnost
reálných čísel má limitu (a je jí supremum celé množiny hodnot prvků
posloupnosti).
Jestliže v Besselově nerovnosti nastane rovnost, hovoříme o tzv. Parsevalově
rovnosti. Přímo z definic vyplývá nyní tvrzení (3).
Ortonogonální systém funkcí nazveme úplný ortogonální systém na intervalu
I = [a, b], jetliže platí Parsevalova rovnost pro každou funkci g s konečnou velikostí
g na tomto intervalu.
7.4
7.4. Fourierovy řady. Předchozí věta naznačuje, že umíme se spočetnými ortogonálními
systémy fn funkcí pracovat velice podobně jako s konečnými ortogonálními
bazemi vektorových prostorů, jsou tu ale zásadní rozdíly:
* Není snadné říci, jak vypadá celý prostor konvergentních nebo stejnoměrně
konvergentních řad F(x) =

n=1 cnfn.
* Pro danou integrovatelnou funkci umíme najít jen nejlepší možné přiblížení
takovou řadou F(x).
1. APROXIMACE POMOCÍ FOURIEROVÝCH ŘAD 221
V případě, že místo ortonogonálního systému fn máme systém ortonormální,
jsou formulky ve větě o něco jednodušší, žádné další zlepšení ale nenastane.
Jako pěkný příklad na integrování lze elementárními metodami ověřit, že systém
funkcí
1, sin x, cos x, sin 2x, cos 2x, . . . , sin nx, cos nx, . . .
je ortogonální systém na intervalu [-, ] (a také na kterémkoliv jiném intervalu
o délce 2). Řady z předchozí věty odpovídající tomuto systému nazýváme Fourierovy
řady. I v obecném případě diskutovaném výše se někdy hovoří o obecných
Fourierových řadách vzhledem k ortogonálnímu systému funkcí fn. Koeficienty cn
se pak nazývají Fourierovy koeficienty funkce f.
Na intervalu [-, ] jsou velikosti všech funkcí kromě první vždy

, první má
velikost

2. Lze dokázat, že náš systém funkcí je úplným ortogonálním systémem,
nebudeme to zde ale dokazovat. Ve smyslu vzdálenosti funkcí definované pomocí
našeho skalárního součinu proto budou částečné součty Fourierovy řady F(x) pro
libovolnou funkci g(x) s konečným integrálem
b
a
g(x)2
dx, tj.
F(x) =
a0
2
+

n=1
(an cos(nx) + bn sin(nx))
s koeficienty
an =
1


g(x)
cos(nx) dx, bn =
1


g(x)
sin(nx) dx,
vždy konvergovat k funkci g(x).
Z obecnějších úvah lze dovodit, že z konvergence v tomto smyslu vždy vyplývá
bodová konvergence částečných součtů ve skoro všech bodech x  I. Nebudeme zde
ale ani vysvětlovat, co znamená ,,skoro všechny , ani nebudeme takový výsledek
dokazovat.
Jako příklad Fourierovy řady si uvedeme Fourierovu řadu pro periodickou
funkci vzniklou z Heavisideovy funkce zúžením na jednu periodu. Tj. naše funkce
g bude na intervalu [-, 0] rovna -1 a na intervalu [0, ] bude rovna 1. Protože
jde o funkci lichou, jistě budou všechny koeficienty u funkcí cos(nx) nulové, a pro
coeficienty u funkcí sin(nx) spočteme
bn =
1


g(x)
sin(nx) dx =
2


0
sin(nx) dx =
2
n
(1 - (-1)n
).
Výsledná Fourierova řada je tedy tvaru
g(x) =
4

sin(x) +
1
3
sin(3x) +
1
5
sin(5x) + . . .
a součet jejích prvních pěti a prvních padesáti členů je na následujících dvou ob-
rázcích.
Všimněme si, že se zvyšujícím se počtem členů řady se výrazně spřesňuje aproximace
s výjimkou stále se zmenšujícího okolí bodu nespojitosti, na němž je ale
maximum odchylky stále zhruba stejné. Je to obecná vlastnost Fourierových řad,
které se říká Gibbsův jev. Povšimněme si také, že v samotném bodě nespojitosti
je hodnota aproximující funkce právě v polovině mezi limitami zprava a zleva pro
Heavisideovu funkci.
222 7. SPOJITÉ MODELY
-1
0 2
x
0
-2
-0,5
0,5
-4
1
4
t=2.
-1
0 2
x
4-2
-0,5
0
-4
1
0,5
t=24.
Samozřejmě nelze očekávat, že by konvergence Fourierových řad pro funkce g s
body nespojitosti mohla být stejnoměrná (to by totiž g musela být coby stejnoměrná
limita spojitých funkcí sama spojitá!).
Bez podrobného důkazu si uvedeme následující větu podávající ucelený obrázek
o bodové konvergenci Fourierových řad. Nejde o nutné podmínky konvergence a v
literatuře lze najít řadu jiných formulací. Tato je ale jednoduchá a postihuje velké
množství užitečných případů.
Věta. Nechť g je po částech spojitá a po částech monotonní funkce na intervalu
[-, ]. Pak její Fourierova řada F(x) konverguje na [-, ] a její součet je
* roven hodnotě g(x0) v každém bodě x0  [-, ], ve kterém je funkce g(x)
spojitá,
* v každém bodě nespojitosti x0 funkce g(x) roven
1
2
lim
xx+
0
g(x) + lim
xx-
0
g(x) ,
* v krajních bodech intervalu [-, ] je roven
1
2
lim
x-+
g(x) + lim
xg(x)
.
Pokud navíc je funkce g(x) spojitá, periodická s periodou 2 a všude existuje její
po částech spojitá derivace, pak konverguje její Fourierova řada stejnoměrně.
7.5
7.5. Wavelety. Fourierovy řady a další z nich vycházející nástroje jsou využívány
ke zpracování různých signálů, obrázků apod. Povaha použitých periodických goniometrických
funkcí a jejich prosté škálování pomocí zvětšující se frekvence zároveň
omezují jejich použitelnost. V mnoha oborech proto vyvstala přirozená potřeba
nalézt šikovnější úplné ortogonální systémy funkcí, které budou vycházet z předpokládané
povahy dat a které bude možné efektivněji zpracovávat.
Takový systém se lze například vytvořit volbou vhodné spojité funkce  s
kompaktním nosičem, ze které sestrojíme spočetně mnoho funkcí ij, j, k  Z,
pomocí dyadických translací a dilatací:
jk(x) = 2j/2
(2j
x - k).
2. INTEGRÁLNÍ OPERÁTORY 223
Pokud tvar mateřské funkce  dobře vystihuje možné chování dat, a zároveň její
potomci jk tvoří úplný ortogonální systém, pak se zpravidla dobře daří konkrétní
zpracovávaný signál aproximovat pomocí jen několika málo funkcí.
Nebudeme zde zacházet do podrobností, jde o mimořádně živý směr výzkumu i
základ komerčních aplikací. Zájemce snadno najde spoustu literatury. Na obrázku
je ilustrována tzv. Daubechies mateřská wavelet D4(x) a její dcera D4(2-3
x - 1).
1,2
2
0,8
0,4
1
0
0-1
t
3 4
t
252015
0
1,2
0 5 30
0,8
10
0,4
2. Integrální operátory
7.6
7.6. Integrální operátory. V případě konečněrozměrných vektorových prostorů
jsme mohli vnímat vektory jako zobrazení z konečné množiny pevně zvolených generátorů
do prostoru souřadnic. Nejjednodušší lineární zobrazení zobrazovala vektory
do skalárů (tzv. lineární formy) a byla definována pomocí jednořádkových matic
jako součet součinů těchto souřadnic s pevně zvolenými hodnotami na generátorech.
Složitější zobrazení s hodnotami opět v tom samém prostoru pak byla obdobně
zadána maticemi. Velice podobně umíme přistoupit k lineárním operacím na
prostorech funkcí.
V případě vektorového prostoru S všech po částech spojitých funkcí na intervalu
I = [a, b] se lineární zobrazení S  R nazývají (reálné) lineární funkcionály.
Jednoduše je můžeme zadat dvěma způsoby ­ pomocí vyčíslení funkce (případně
jejích derivací) v jednotlivých bodech nebo pomocí integrování. Příkladem funkcionálu
L tedy může být vyčíslení v jediném pevném bodě x0  I
L(f) = f(x0)
integrální funkcionál pak je zadán pomocí pevně zvolené funkce g(x)
L(f) =
b
a
f(x)g(x) dx.
Funkce g(x) zde hraje roli váhy, se kterou při definici Riemannova integrálu bereme
jednotlivé hodnoty reprezentující funkci f(x). Nejjednodušším příkladem takového
funkcionálu je samozřejmě Riemannův integrál samotný, tj. případ s g(x) = 1 pro
224 7. SPOJITÉ MODELY
všechny body x. Dobrou představu dává také volba
g(x) =
0 je-li |x|  a
e
1
x2-a2 + 1
a2
je-li |x| < a.
To je funkce hladká na celém R s kompaktním nosičem v intervalu (-a, a), viz 6.9.
V bodě x = 0 má přitom hodnotu jedna. Integrální funkcionál
Ly(f) =
b
a
f(x)g(y - x) dx
je možné vnímat jako ,,rozmlžené zprůměrování hodnot funkce f kolem bodu x = y
(obrázek funkce g je v 6.9 ­ ve svém středu má hodnotu jedna a hladkým monotonním
způsobem se plynule přimkne k nule ve vzdálenosti a na obě strany). Ještě
lepší volbou je z tohoto pohledu libovolná funkce g jejíž integrál přes celou reálnou
osu je jednička.
7.7
7.7. Konvoluce funkcí. Pohled na integrální funkcionál Ly jako na zprůměrované
chování funkce f v okolí daného bodu je názornější pro případ nevlastních
mezí integrálu a = -, b = . Místo prostoru S všech po částech spojitých funkcí
na R budeme uvažovat po částech spojité a v absolutní hodnotě integrovatelné
funkce f v roli argumentu pro náš funkcionál. Volný parametr y může být vnímán
jako nová nezávislá proměnná a naše operace tedy ve skutečnosti zobrazuje funkce
opět na funkce f  ~f:
~f(y) = Ly(f) =


f(x)g(y - x) dx.
Této operaci se říká konvoluce funkcí f a g, značíme ji f  g. Většinou se konvoluce
definuje pro reálné nebo komplexní funkce s kompaktním nosičem na celém R.
Pomocí transformace t = z - x se snadno spočte
(f  g)(z) =

f(x)g(z
- x) dx = -
-

f(z - t)g(t) dt = (g  f)(z),
je tedy konvoluce coby binární operace na dvojicích funkcí s kompaktními nosiči
komutativní.
Konvoluce je mimořádně užitečný nástroj pro modelování způsobu, jak můžeme
pozorovat experiment nebo jak se projevuje prostředí při přenosu informací
(např. analogový audio nebo video signál ovlivňovaný šumy apod.). Argument f
je přenášenou informací, funkce g je volena tak, aby co nejlépe vystihovala vlivy
prostředí či zvoleného technického postupu.
Konvoluce jsou jedním z mnoha případů obecných integrálních operátorů na
prostorech funkcí
K(f)(y) =
b
a
f(x)k(y, x) dx
s jádrem daným funkcí dvou proměnných k : R2
 R. Definiční obor takových
funkcionálů je nutné vždy volit s ohledem na vlastnosti jádra tak, aby vždy existoval
použitý integrál.
2. INTEGRÁLNÍ OPERÁTORY 225
7.8
7.8. Fourierova transformace. Teorie integrálních operátorů s jádry a rovnic,
které je obsahují je velice užitečná a zajímavá zároveň, bohužel pro ni zde teď
ale nemáme dost prostoru. Zaměříme teď alespoň na jeden mimořádně důležitý
případ, tzv. Fourierovu transformaci F, která úzce souvisí s Fourierovými řadami.
Připomeňme si základní formuli pro parametrizaci jednotkové kružnice v komplexní
rovině s rychlostí obíhání  = 2/T, kde T je čas jednoho oběhu:
eit
= cos t + i sin t.
Pro (reálnou nebo komplexní) funkci f(t) můžeme spočíst její tzv. komplexní Fourierovy
koeficienty jako komplexní čísla
cn =
1
T
T/2
-T/2
f(t) e-int
dt.
Přitom platí vztahy mezi koeficienty an a bn Fourierových řad (po přepočtu formulí
pro tyto koeficienty pro funkce s obecnou periodou délky T) a těmito čísly cn
cn = 1
2 (an - ibn), c-n = 1
2 (an + ibn)
a při reálném f jsou samozřejmě cn a c-n komplexně konjugované. Označíme-li
n = n, bude tedy původní funkce f(t) s konvergující Fourierovou řadou rovna
f(t) =

n=cn
eint
.
Při pevně zvoleném T vyjadřuje výraz  = 2/T právě změnu ve frekvenci způsobenou
nárustem n o jedničku. Je to tedy právě diskrétní krok, se kterým při
výpočtu koeficientů Fourierovy řady měníme frekvence. Koeficient 1/T u formule
pro cn je pak roven /2, takže můžeme řadu pro f(t) přepsat jako
f(t) =

n=-
1
2

T/2
-T/2
f(x) e-inx
dx eint
.
Představme si nyní hodnoty n pro všechna n  Z jako vybrané reprezentanty pro malé
intervaly [n, n+1] o délce . Pak náš výraz ve vnitřní velké závorce v poslední formuli pro
f(t) ve skutečnosti vyjadřuje sčítance Riemannových součtů pro nevlastní integrál
1
2
Z 
g()
eit
d
kde g() je funkce nabývající v bodech n hodnoty
g(n) =
Z T/2
-T/2
f(x) e-inx
dx.
Předpokládejme, že naše funkce f je integrovatelná v absolutní hodnotě přes celé R. Pak
můžeme limitně přejít T   a dojde ke zejmňování normy  našich intervalů. Zároveň se
dostaneme v posledním výrazu k integrálu
g() =
Z 
f(x)
e-ix
dx.
Můžeme tedy položit pro (každou v absolutní hodnotě Riemannovsky integrovatelnou)
funkci f na R
F(f)() = ~f() =
1

2

f(t)
e-it
dt.
226 7. SPOJITÉ MODELY
Této funkci ~f říkáme Fourierova trasnformace funkce f. Přechozí úvahy pak ukazují,
že pro ,,rozumné funkce f(t) bude také platit
f(t) = F-1
( ~f)(t) =
1

2

~f()
eit
d.
Tím říkáme, že existuje k právě definované Fourierově transformaci F inverzní
operace F-1
, které říkáme inverzní Fourierova transformace.
Všimněme si, že Fourierova transformace a její inverze jsou integrální operátory
se skoro shodným jádrem k(, t) = eit
.
7.9
7.9. Vlastnosti Fourierovy transformace. Fourierova transformace zajímavým
způsobem převrací lokální a globální chování funkcí. Začněme jednoduchým
příkladem, ve kterém najdeme funkci f(t), která se ztransformuje na charateristickou
funkci intervalu [-, ], tj. ~f() = 0 pro || >  a ~f = 1 pro ||  . Inverzní
transformace F-1
nám dává
f(t) =
1

2

-
eit
d =
1

2
1
it
eit

-
=
2

2t
1
2i
(eit
- e-it
)
=
2

2t
sin(t).
Přímým výpočtem limity v nule (L'Hospitalovo pravidlo) spočteme, že f(0) =
2(2)-1/2
, nejbližší nulové body jsou v t = / a funkce poměrně rychle klesá
k nule mimo počátek x = 0. Na obrázku je tato funkce znázorněná zelenou křivkou
pro  = 20. Zároveň je vynesena červenou křivkou oblast, ve které se s rostoucím
 naše funkce f(t) stále rychleji ,,vlní .
t
32
y
1
20
0
15
10
-1
5
0
-2
-5
-3
Omega=20.000
V dalším příkladu spočtěme Fourierovu transformaci derivace f (t) pro nějakou
funkci f. Pro jednoduchost předpokládejme, že f má kompaktní nosič, tj, zejména
2. INTEGRÁLNÍ OPERÁTORY 227
F(f ) i F(f) skutečně existují a počítejme metodou per partes:
F(f )() =
1

2


f (t) e-it
dt
=
1

2
[e -itf(t)]

- +
i

2

f(t)
e-it
dt
= iF(f)()
Vidíme tedy, že Fourierova transformace převádí (infinitesimální) operaci derivování
na (algebraickou) operaci prostého násobení proměnnou. Samozřejmě můžeme tento
vzorec iterovat, tj.
F(f )() = -2
F(f), . . . , F(f(n)
) = in
n
F(f).
Další mimořádně důležitou vlastností je vztah mezi konvolucemi a Fourierovou
transformací. Spočtěme, jak dopadne transformace konvoluce h = f  g, kde opět
pro jednoduchost předpokládáme, že funkce mají kompaktní nosiče. Při výpočtu
prohodíme pořadí integrovanání, což je krok, který ověříme teprve v diferenciálním
a integrálním počtu později, viz 8.25. V dalším krůčku pak zavedeme substituci
t - x = u.
F(h)() =
1

2

-

f(x)g(t
- x) dx e-it
dt
=
1

2

-
f(x)

g(t
- x) e-it
dt dx
=
1

2

-
f(x)

g(u)
e-i(u+x)
du dx
=
1

2

f(x)
e-ix
dx 

g(u)
e-iu)
du
=

2F(f)  F(g)
Podobný výpočet ukazuje i obrácené tvrzení, že Fourierova transformace součinu
je, až na konstantu, konvoluce transformací.
F(f  g) =
1

2
F(f)  F(g).
Jak jsme si uváděli výše, konvoluce f  g velice často modeluje proces našeho pozorování
nějaké sledované veličiny f. Pomocí Fourierovy transformace a její inverze
nyní můžeme snadno rozpoznat původní hodnoty této veličiny, pokud známe konvoluční
jádro g. Prostě spočteme F(f  g) a podělíme obrazem F(g). Hovoříme o
dekonvoluci.
Vraťme se nyní ještě k prvnímu příkladu s inverzní transformací k charakteristické funkci
f intervalu [-, ]. Zkusme provést limitní přechod pro  jdoucí k nekonečnu a označme
2(t) kýženou limitní ,,funkci pro F-1
(f)(t). Pro součin s libovolným obrazem F(g)
platí
F-1
(f  F(g))(z) =
1

2
Z 
-
g(t)F-1
(f)(z - t) dt.
Při    přejde výraz nalevo k F-1
(F(g))(z) = g(z), zatímco napravo dostáváme
g(z) =
Z 
g(t)(z
- t) dt.
228 7. SPOJITÉ MODELY
Naše hledaná (t) tedy vypadá na ,,funkci , která je všude nulová, kromě jediného bodu t = 0,
kde je tak ,,nekonečná , že integrováním jejího součinu s libovolnou integrovatelnou funkcí
g dostaneme právě hodnotu g v bodě t = 0. Není to samozřejmě funkce v našem smyslu,
nicméně jde o objekt často používaný. Říká se jí Diracova funkce  a korektně ji lze popsat
jako tzv. distribuci. Z nedostatku času nebudeme distribuce podrobněji rozebírat a omezíme se
na konstatování, že si lze dobře Diracovo  představit jako jednotkový impulz v jediném bodě.
Fourierova transformace jej pak přetransformuje na konstantní funkci F()() = 1
2
. Naopak
mnohé funkce, které nejsou integrovatelné v absolutní hodnotě na R transformuje Fourierova
transformace na výrazy s Diracovým . Např.
F(cos(nt))() =
r

2
((n - ) + (n + )).
7.10
7.10. Poznámky o dalších transformacích. Pokud použijeme Fourierovu transformaci
na lichou funkci f(t), tj. f(-t) = -f(t), příspěvek integrace součinu f(t) a
funkce cos t se pro kladná a záporná t vyruší. Dostaneme proto přímým výpočtem
F(f)() =
-2i

2

0
f(t) sin t dt.
Výsledná funkce je opět lichá, proto ze stejného důvodu i inverzní transformaci lze
spočíst obdobně. Vynecháním imaginární jednotky i dostáváme vzájemně inverzní
transformace, kterým se říká Fourierova sinusová transformace pro liché funkce:
~fs() =
2


0
f(t) sin t dt, f(t) =
2


0
~fs(t) sin t dt.
Obdobně se definuje Fourierova cosinová transformace pro sudé funkce.
Fourierovu transformaci nelze dobře využít pro funkce, které nejsou integrovatelné
v absolutní hodnotě přes celé R (minimálně nedostáváme opravdové funkce).
Laplaceova transformace se chová docela podobně jako Fourierova a tuto vadu
nemá:
L(f)(s) = f(s) =

0
f(t) e-st
dt.
Integrální operátor L má velice rychle se zmenšující jádro, proto bude existovat
L(p(t)) například pro každý polynom p a všechna kladná s. Obdobně jako pro Fourierovu
transformaci dostaneme prostým výpočtem per partes vztah pro Laplaceovu
transformaci derivované funkce při s > 0:
L(f (t))(s) =

0
f (t) e-st
dt = [f(t) e-st
]
0 + s

0
f(t) e-st
dt
= -f(0) + sL(f)(s).
Vlastnosti Laplaceovy transformace a řadu dalších zejména v technické praxi používaných
transformací je možné snadno dohledat v literatuře.
KAPITOLA 8
Spojité modely s více proměnnými
jedna proměnná nám k modelování nestačí?
­ nevadí, stačí vzpomenout na vektory ...
1. Funkce a zobrazení na Rn
8.1
8.1. Funkce a zobrazení. Na počátku našeho putování matematickou krajinou
snad čtenáři vstřebali, že s vektory lze počítat velice podobně jako se skaláry, jen
je třeba si věci dobře rozmyslet. Zcela obdobně si budeme počínat nyní.
Pro praktické modelování procesů (nebo objektů v grafice) jen velice zřídka
vystačíme s funkcemi R  R jedné proměnné. Přinejmenším bývají potřebné funkce
závislé na parametrech a často právě změna výsledků v závislosti na parametrech
bývá důležitější než výsledek samotný. Připustíme proto funkce
f(x1, x2, . . . , xn) : Rn
 R
a budeme se snažit co nejlépe rozšířit naše metody pro sledování změn a hodnot do
této situace. Říkáme jim funkce více proměnných.
Pro snažší pochopení budeme nejčastěji pracovat s případy n = 2 nebo n =
3 a přitom budeme místo číslovaných proměnných používat písmena x, y, z. To
znamená, že funkce f definované v ,,rovině R2
budou značeny
f : R2
(x, y)  f(x, y)  R
a podobně v ,,prostoru R3
f : R3
(x, y, z)  f(x, y, z)  R.
Podobně jako u funkcí jedné proměnné hovoříme o definičním oboru A  Rn
, na
kterém je ta která funkce definována.1
S každou takovou funkcí více proměnných bývá užitečné uvažovat její graf, tj.
podmnožinu Gf  Rn
× R = Rn+1
definovanou vztahem
Gf = {(x1, . . . , xn, f(x1, . . . , xn)); (x1, . . . , xn)  A},
kde A je definiční obor f. Např. grafem funkce definované v rovině vztahem
f(x, y) =
x + y
x2 + y2
je docela pěkná plocha na levém obrázku a jejím maximálním definičním oborem
jsou všechny body roviny kromě počátku (0, 0).
1Častou hříčkou pro písemky a úlohy je naopak úkol pro danou formuli pro funkci najít co
největší definiční obor, na kterém má tato formule smysl.
229
230 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
3
2
1
0 y-4
-3
-1
-2
-2
-1 0
-2
0
1x 2
2
-3
3
4
15/62/31/21/31/6
0
2*Pi
11/6*Pi
5/3*Pi
3/2*Pi
4/3*Pi
7/6*Pi
Pi
5/6*Pi
2/3*Pi
1/2*Pi
1/3*Pi
1/6*Pi
0
Při definici a zejména při kreslení obrázku grafu jsme používali pevně zvolené
souřadnice v rovině. Pro pevně zvolené x tak např. dostáváme zobrazení
R  R3
, y  (x, y, f(x, y)),
tj. křivku v prostoru R3
. Na obrázku jsou také čarami vyneseny obrazy takovýchto
křivek pro některé pevně zvolené hodnoty souřadnic x a y. Křivky c : R  Rn
jsou
nejjednoduššími příklady zobrazení F : Rm
 Rn
.
Stejně jako u vektorových prostorů, volba našeho ,,pohledu na věc , tj. volba
souřadnic, může zdánlivě zjednodušit nebo zhoršit naše vnímání studovaného objektu.
Změna souřadnic je nyní na místě v daleko obecnější formě než jen u afinních
zobrazení v kapitole čtvrté. Opět je ale vhodné na změnu souřadnic pohlížet jako
na zobrazení Rn
 Rn
. Velice obvyklý příklad je změna nejobvyklejších souřadnic
v rovině na tzv. polární, tj. polohu bodu P zadáváme pomocí jeho vzdálenosti od
počátku souřadnic r = x2 + y2 a úhlem  = arctan(y/x) (pokud je x = 0) mezi
spojnicí s počátkem a osou x. Přechod z polárních souřadnic do standardních je
Ppolární = (r, )  (r cos , r sin ) = Pkartézské
Je přitom zjevné, že je nutné polární souřadnice vhodně omezit na podmnožinu
bodů (r, ) v rovině, aby existovalo i zobrazení inverzní. Kartézský obraz přímek v
polárních souřadnicích s konstantními souřadnicemi r nebo  je na obrázku vpravo.
8.2
8.2. Euklidovské prostory. Bude velice užitečné připomenout a rošířit naše vědomosti
o vlastnostech euklidovských afinních prostorů. Začneme připomenutím
metrických (topologických) vlastností prostoru En = Rn
:
Prostor En vnímáme jako množinu bez volby souřadnic a na jeho zaměření
Rn
pohlížíme jako na vektorový prostor možných přírůstků, které umíme k bodům
prostoru En přičítat. Navíc je na Rn
zvolen standardní skalární součin u  v =
n
i=1 xiyi, kde u = (x1, . . . , xn) a v = (y1, . . . , yn) jsou libovolné vektory. Tím je
na En dána metrika, tj. funkce vzdálenosti P - Q dvojic bodů P, Q předpisem
P - Q 2
= u 2
=
n
i=1
x2
i ,
1. FUNKCE A ZOBRAZENÍ NA Rn
231
kde u je vektor, jehož přičtením k P obdržíme Q. Např. v rovině E2 je tedy vzdálenost
bodů P1 = (x1, y1) a P2 = (x2, y2) dána
P1 - P2
2
= (x1 - x2)2
+ (y1 - y2)2
.
Takto definovaná metrika splňuje trojúhelníkovou nerovnost pro každé tři body
P, Q, R
P - R = (P - Q) + (Q - R)  (P - Q) + (Q - R) ,
viz 4.14(1) (nebo stejnou nerovnost (5.4) pro skaláry). Můžeme proto bez probleému
přenést (rozšířit) pro body Pi libovolného Euklidovského prostoru pojmy:
* Cauchyovská posloupnost ­ Pi - Pj < , pro každé pevně zvolené > 0 až na
konečně mnoho výjimečných hodnot i, j,
* konvergentní posloupnost ­ Pi - P < , pro každé pevně zvolené > 0
až na konečně mnoho výjimečných hodnot i, j, bod P pak nazýváme limitou
posloupnosti Pi,
* hromadný bod P množiny A  En ­ existuje posloupnost bodů v A konvergující
k P a vesměs různých od P,
* uzavřená množina ­ obsahuje všechny své hromadné body,
* otevřená množina ­ její doplněk je uzavřený,
* otevřené ­okolí bodu P ­ množina O(P) = {Q  En; P - Q < },
* hraniční bod P množiny A ­ každé ­okolí bodu P má neprázdný průnik s A i
s komplementem En \ A,
* vnitřní bod P množiny A ­ existuje ­okolí bodu P, které celé leží uvnitř A,
* ohraničená množina ­ leží celá v nějakém ­okolí některého svého bodu (pro
dostatečně velké ),
* kompaktní množina ­ uzavřená a ohraničená množina.
Čtenář by měl nyní investovat něco málo úsilí do pročtení odstavců 4.14, 5.10
a 5.11 a zkusit si promyslet definice a souvislosti všech těchto pojmů.
Zejména by mělo být z definic přímo zřejmé, že posloupnosti bodů Pi mají
vlastnosti zmiňované v prvních dvou bodech předchozím výčtu tehdy a jen tehdy,
když stejně nazvané vlastnosti mají reálné posloupnosti vzniklé z jednotlivých souřadnic
bodů Pi ve kterékoliv kartézské souřadné soustavě. Proto také z Lemma 5.9
vyplývá, že každá Caychovská posloupnost bodů v En je konvergentní.
Stejně jako v případě E1 definujeme otevřené pokrytí množiny a platí s drobnými
formulačními úpravami i Věta 5.11:
Věta. Pro podmnožiny A  En v euklidovských prostorech platí:
(1) A je otevřená, právě když je sjednocením nejvýše spočetného systému ­okolí,
(2) každý bod a  A je buď vnitřní nebo hraniční,
(3) každý hraniční bod je buď izolovaným nebo hromadným bodem A,
(4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má
podposloupnost konvergující k bodu v A,
(5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné pokrytí.
Důkaz z 5.11 lze bez úprav použít v případě tvrzení (1)­(3), byť s novým chápání pojmů
a nahrazením ,,otevřených intervalů jejich vícerozměrnými ­okolími vhodných bodů.
Důkaz pro zbylá dvě tvrzení je však třeba dosti zásadně upravit. Nebudeme se tu zabývat
detaily, ambicióznější čtenáři mohou zkusit samostatně princip ohraničování stále menšími a
menšími intervaly modifikovat s použitím ­okolí.
232 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.3. Příklady.
8.3.1. Rozhodněte o následujících podmnožinách v E3
, zda jsou otevřené, uzavřené
či kompaktní. Dále určete jejich hraniční a vnitřní body.
(1) M = {(x, 0, 0)  R3
|x  (0, 1)}
(2) M = {(x, 0, 0)  R3
|x  0, 1 }
(3) M = {(x, y, z)  R3
|x2
+ y2
+ z2
 1}
(4) M = {(x, y, z)  R3
|x2
+ y2
 1}
(5) M = {(x, y, z)  R3
|x2
+ y2
= 1}
(6) M = {(x, y, z)  R3
|x2
+ y2
- z2
 1}
(7) M = {(x, y, z)  R3
|x  N}
Řešení. V řešeních budeme ve zkratce uvádět, že množina je např. OU (otevřená
i uzavřená, není kompaktní),  znamená, že nemá žádnou z uvedených vlastností,
množinu hraničních bodů budeme značit H, vnitřek množiny jako V .
(1) , H = M, V = 
(2) UK, H = M, V = 
(3) UK, H = {(x, y, z)  R3
|x2
+y2
+z2
= 1}, V = {(x, y, z)  R3
|x2
+y2
+z2
< 1},
M je koule
(4) U, H = {(x, y, z)  R3
|x2
+ y2
= 1}, V = {(x, y, z)  R3
|x2
+ y2
< 1}, M je
(nekonečný) válec
(5) U, H = M, V = , M je válcová plocha
(6) U, H = {(x, y, z)  R3
|x2
+y2
-z2
= 1}, V = {(x, y, z)  R3
|x2
+y2
-z2
< 1}
je dvojdílný hyperboloid
(7) U, H = M, V = , M je sjednocení nekonečně mnoha rovnoběžných rovin
8.3
8.4. Křivky v En. Celá naše diskuse kolem limit, derivací a integrálů funkcí
v 5. a 6. kapitole pracovala s funkcemi s jednou reálnou proměnnou a reálnými
nebo komplexními hodnotami s odůvodněním, že používáme pouze trojúhelníkovou
nerovnost platnou pro velikosti reálných i komplexních čísel. Ve skutečnosti se tento
argument do značné míry přenáší na jakékoliv funkce jedné reálné proměnné s
hodnotami v euklidovském prostoru En = Rn
.
Pro každou křivku2
, tj. zobrazení c : R  Rn
v n­rozměrném prostoru, můžeme
pracovat s pojmy, které jednoduše rozšiřují naše úvahy z funkcí jedné proměnné:
* limita: limtt0 c(t)  Rn
* derivace: c (t0) = limtt0
1
|t-t0|  (c(t) - c(t0))  Rn
* integrál:
b
a
c(t)dt  Rn
.
V případě integrálu přitom musíme uvažovat křivky ve vektorovém prostoru
Rn
. Důvod je vidět už v jednorozměrném případě, kde potřebujeme znát počátek,
abychom mohli vidět ,,plochu pod grafem funkce .
Opět je přímo z definice zjevné, že limity, derivace i integrály lze spočíst po
jednotlivých n souřadných složkách v Rn
a stejně se rozpozná i jejich existence.
2v geometrii se většinou rozlišuje mezi křivkou jakožto podmnožinou v En a její parametrizací
R  Rn. My zde pod pojmem ,,křivka rozumíme výhradně parametrizované křivky.
1. FUNKCE A ZOBRAZENÍ NA Rn
233
U integrálu můžeme také přímo formulovat pro křivky analogii souvislosti Riemannova
integrálu a antiderivace (viz 6.14): Nechť c je křivka v Rn
, spojitá na
intervalu [a, b]. Pak existuje její Riemannův integrál
b
a
c(t)dt. Navíc je křivka
C(t) =
t
a
c(s)ds  Rn
dobře definovaná, diferencovatelná a platí C (t) = c(t) pro všechny hodnoty t 
[a, b].
Horší je to s větou o střední hodnotě a obecněji s Taylorovou větou, viz 6.2 a
6.7. Ve zvolených souřadnicích je můžeme aplikovat na jednotlivé souřadné funkce
diferencovatelné křivky c(t) = (c1(t), . . . , cn(t)) na konečném intervalu [a, b]. Dostaneme
např. u věty o střední hodnotě existenci čísel ti takových, že
ci(b) - ci(a) = (b - a)  ci(ti).
Tato čísla ale budou obecně různá, nemůžeme proto vyjádřit rozdílový vektor koncových
bodů c(b) - c(a) jako násobek derivace křivky v jediném bodě. Např. v
rovině E2 pro diferencovatelnou křivku c(t) = (x(t), y(t)) takto dostáváme
c(b) - c(a) = (x ()(b - a), y ()(b - a)) = (b - a)  (x (), y ())
pro dvě (obecně různé) hodnoty ,   [a, b]. Pořád nám ale tato úvaha stačí na
následující odhad
Lemma. Je-li c křivka v En se spojitou derivací na kompaktním intervalu [a, b],
pak pro všechny a  s  t  b platí
c(t) - c(s) 

n maxr[a,b] c (r)  |t - s|.
Důkaz. Přímým použitím věty o střední hodnotě dostáváme pro vhodné body
ri uvnitř intervalu [s, t]:
c(t) - c(s) 2
=
n
i=1
(ci(t) - ci(s))2

n
i=1
(ci(ri)(t - s))2
 (t - s)2
n
i=1
(maxr[s,t] |ci(r)2
 n(maxr[s,t], i=1,...,n |ci(r)|)2
(t - s)2
 n maxr[s,t] c (r) 2
(t - s)2
.
Důležitým pojmem je tečný vektor ke křivce c : R  En v bodě c(t0)  En,
který definujeme jako vektor v prostoru zaměření Rn
daný derivací c (t0)  Rn
.
Přímka T zadaná parametricky
T : c(t0) +   c (t0)
se nazývá tečna ke křivce c v bodě t0. Na rozdíl od tečného vektoru, tečna T zjevně
nezávisí na parametrizaci křivky c.
8.5. Příklad. Určete parametrické i obecné rovnice tečny ke křivce c : R  R3
,
c(t) = (c1(t), c2(t), c3(t)) = (t, t2
, t3
) v bodě odpovídajícím hodnotě parametru
t = 1.
234 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Řešení. Parametru t = 1 odpovídá bod c(1) = [1, 1, 1]. Derivace jednotlivých
složek jsou c1(t) = 1, c2(t) = 2t, c3(t) = 3t2
. Hodnoty derivací v bodě t = 1 jsou 1,
2, 3. Parametrické vyjádření tečny tedy zní:
x = c1(1)s + c1(1) = t + 1
y = c2(1)s + c2(1) = 2t + 1
z = c3(1)s + c3(1) = 3t + 1.
Vyloučením parametru t dostáváme obecné rovnice tečny (nejsou dány kanonicky):
2x - y = 1
3x - z = 2.
8.4
8.6. Parciální derivace a diferenciál. Pro každou funkci f : Rn
 R a libovolnou
křivku c : R  Rn
máme k dispozici jejich kompozici (f  c)(t) : R  R. Za
hladké nebo diferencovatelné funkce bychom tedy mohli např. považovat ty, jejichž
kompozice se všemi hladkými nebo diferencovatelnými funkcemi jsou opět hladké
nebo diferencovatelné. Začneme ale raději s nejjednoduššími křivkami, tj. přímkami.
Řekneme, že f : Rn
 R má derivaci ve směru vektoru v  Rn
v bodě x  En,
jestliže existuje derivace dvf(x) složeného zobrazení t  f(x + tv) v bodě t = 0, tj.
dvf(x) = lim
t0
1
t
(f(x + tv) - f(x)).
Často se dvf říká směrová derivace. Speciální volbou přímek ve sěru souřadných os
dostáváme tzv. parciální derivace funkce f, které značíme f
xi
, i = 1, . . . , n, nebo
bez odkazu na samotnou fukci jako operace 
xi
. Pro funkce v rovině tak dostáváme

x
f(x, y) = lim
t0
1
t
(f(x + t, y) - f(x, y)),

y
f(x, y) = lim
t0
1
t
(f(x, y + t) - f(x, y)).
Se samotnými parciálními nebo směrovými derivacemi nevystačíme pro dobrou
aproximaci chování funkce lineárními výrazy. Podívejme se např. na funkce v rovině
dané výrazy
g(x, y) =
1 když xy = 0
0 jinak
, h(x, y) =
1 když y = x2
= 0
0 jinak
.
Evidentně žádná z nich neprodlužuje všechny hladké křivky procházející bodem
(0, 0) na hladké křivky. Přitom ale pro g existují obě parciální derivace v (0, 0) a
jiné směrové derivace neexistují, zatímco pro h existují všechny směrové derivace
v bodě (0, 0) a je dokonce dvh(0) = 0 pro všechny směry v, takže jde o lineární
závislost na v  R2
.
Budeme sledovat případ funkcí jedné proměnné co nejdůsledněji a podobné
patologické chování vyloučíme přímo definicí:
Definice. Funkce f : Rn
 R je diferencovatelná v bodě x, jestliže
* v bodě x existují všechny směrové derivace dvf(x), v  Rn
,
* dvf(x) je lineární v závislosti na přírůstku v a
* 0 = limv0
1
v f(x + v) - f(x) - dvf(x) .
1. FUNKCE A ZOBRAZENÍ NA Rn
235
Řečeno slovy požadujeme, aby v bodě x existovalo dobré lineární přiblížení
přírůstků funkce f lineární funkcí přírůstků proměnných veličin. Lineární výraz dvf
(ve vektorové proměnné v) nazýváme diferenciál funkce f vyčíslený na přírůstku v.
V literatuře se často také říká totální diferenciál df funkce f.
Pro ilustraci se podívejme se, jak se chová diferenciál funkce f(x, y) v rovině
za přepokladu, že obě parciální derivace f
x , f
y existují a jsou spojité v okolí bodu
(x0, y0). Uvažme jakoukoliv hladkou křivku t  (x(t), y(t)) s x0 = x(0), y0 = y(0).
S použitím věty o střední hodnotě na funkce jedné proměnné v obou sčítancích
dovodíme
1
t
(f(x(t), y(t)) - f(x0, y0)) =
1
t
f(x(t), y(t)) - f(x(0), y(t) +
+
1
t
f(x(0), y(t)) - f(x(0), y(0)
=
1
t
(x(t) - x(0)) 
f
x
(x(), y(t)) +
1
t
(y(t) - y(0)) 
f
y
(x(0), y())
pro vhodná čísla  a  mezi 0 a t. Limitním přechodem t  0 pak díky spojitosti
parciálních derivací dostáváme
d
dt
f(x(t), y(t))|t=0 = x (0)
f
x
(x0, y0) + y (0)
f
y
(x0, y0)
což je příjemné rozšíření platnosti věty o derivování složených funkcí. Samozřejmě,
speciální volbou parametrizovaných přímek
(x(t), y(t)) = (x0 + t, y0 + t)
přechází náš výpočet při v = (, ) na rovnost
dvf(x0, y0) =
f
x
 +
f
y

a tento vztah můžeme pěkně vyjádřit způsobem, kterým jsme v lineární algebře
zapisovali souřadná vyjádření lineárních funkcí na vektorových prostorech:
df =
f
x
dx +
f
y
dy.
Jinými slovy, diferenciál je lineární funkce Rn
 R na přírůstcích se souřadnicemi
danými právě parciálními derivacemi. Náš výpočet zároveň ukázal, že skutečně
tato lineární funkce df má aproximační vlastnosti diferenciálu, kdykoliv parciální
derivace jsou spojité v okolí daného bodu.
V případě funkcí více proměnných píšeme obdobně
e8.1 (8.1) df =
f
x1
dx1 +
f
x2
dx2 +    +
f
xn
dxn
a platí:
Věta. Nechť f : En  R je funkce n proměnných, která má v okolí bodu x  En
spojité parciální derivace. Pak existuje její diferenciál df v bodě x a jeho souřadné
vyjádření je dáno rovnicí (8.1).
Důkaz. Odvození věty je naprosto analogické výše uvedenému důkazu v případě
n = 2.
236 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.5
8.7. Tečná rovina ke grafu funkce. Uvažujme libovolnou diferencovatelnou
funkci f : En  R. Protože každá směrová derivace je vyčíslena jako derivace
funkce jedné proměnné t  f(x + tv), můžeme i v této souvislosti využít větu o
střední hodnotě:
e8.2 (8.2) f(x + tv) - f(x) = t  df(x + t0v)(v) = t  dvf(x + t0v)
pro vhodné t0 mezi nulou a t. Jinými slovy, přírůstek funkčních hodnot v bodech
x + tv a x je vždy vyjádřen pomocí směrové derivace ve vhodném bodě na jejich
spojnici.
Pro případ funkce na E2 a pevně zvoleného bodu (x0, y0)  E2 uvažme rovinu
v E3 zadanou rovnicí
z = f(x0, y0) + df(x0, y0)(x - x0, y - y0)
= f(x0, y0) +
f
x
(x0, y0)(x - x0) +
f
y
(x0, y0)(y - y0).
Tato rovina má jako jediná ze všech rovin procházejících bodem (x0, y0) vlastnost,
že v ní leží derivace a tedy i tečny všech křivek
c(t) = (x(t), y(t), f(x(t), y(t))).
Říkáme jí tečná rovina ke grafu funkce f.
Na obrázku jsou zobrazeny dvě tečné roviny ke grafu funkce
f(x, y) = sin(x) cos(y).
Červená čára je obrazem křivky c(t) = (t, t, f(t, t)).
0
1
2
3
x
0
-2 4
1 2
-1
5
3 4
0
y 5
6
6
1
2
0
1
2
3
x
0
-2 4
1 2
-1
5
3 4
0
y 5
6
6
1
2
Pro funkce n proměnných definujeme tečnou rovinu jako afinní nadrovinu v
En+1. Místo zaplétání se do spousty indexů bude snad užitečná vzpomínka na
afinní geometrii: Je to nadrovina procházející bodem (x, f(x)) se zaměřením, které
je grafem lineárního zobrazení df(x) : Rn
 R, tj. diferenciálu v bodě x  En. Ještě
jinak můžeme také říci, že směrová derivace dvf je dán přírůstkem na tečné rovině
odpovídajícím přírůstku argumentu v.
Z těchto úvah vyplývá řada analogií s funkcemi jedné proměnné. Zejména má
diferencovatelná funkce f na En v bodě x  En nulový diferenciál tehdy a jen tehdy,
když její složení s libovolnou křivkou procházející tímto bodem zde má stacionární
bod, tj. ani neroste ani neklesá v lineárním přiblížení. Jinak řečeno, tečná rovina
je rovnoběžná s nadrovinou proměnných (tj. její zaměření je En  En+1 s nulovou
přidanou souřadnicí pro hodnoty f). To ovšem neznamená, že v takovém bodě
1. FUNKCE A ZOBRAZENÍ NA Rn
237
musí mít f aspoň lokálně buď maximum nebo minimum. Stejně jako u funkcí jedné
proměnné můžeme rozhodovat teprve podle derivací vyšších.
8.8. Příklady.
8.8.1. Určete, zda tečná rovina ke grafu funkce f : R × R+
 R, f(x, y) = x  ln(y)
v bodě [1, 1
e ] prochází bodem (1, 2, 3)  R3
.
Řešení. Určíme nejdříve parciální derivace: f(x,y)
x = ln(y), f(x,y)
y = x
y , jejich
hodnoty v bodě (1, 1
e ) jsou -1, e, dále f(1, 1
e ) = -1. Rovnice tečné roviny je tedy
z = f 1,
1
e
+
f(x, y)
x
1,
1
e
(x + 1) +
f(x, y)
y
1,
1
e
y -
1
e
= -1 - x + ey.
Této rovnici daný bod nevyhovuje, v tečné rovnině tedy neleží.
8.8.2. Určete parametrické vyjádření tečny k průsečnici grafů funkcí f : R2
 R,
f(x, y) = x2
+ xy - 6, g : R × R+
 R, g(x, y) = x  ln(y) v bodě [2, 1].
Řešení. Tečna k průsečnici je průsečnicí tečných rovin v daném bodě. Tečná rovina
ke grafu funkce f procházející bodem [2, 1] je
z = f (2, 1) +
f(x, y)
x
(2, 1) (x - x0) +
f(x, y)
y
(2, 1) (y - y0)
= 5x + 2y - 12.
Tečná rovina k grafu g je pak
z = f (2, 1) +
g(x, y)
x
(2, 1) (x - x0) +
g(x, y)
y
(2, 1) (y - y0)
= 2y - 2.
Průsečnicí těchto dvou rovin je přímka daná parametricky jako [2, t, 2t - 2], t  R
Alternativně: normála k ploše určené rovnicí f(x, y, z) = 0 v bodě b = [2, 1, 0] je
(fx(b), fy(b), fz(b)) = (5, 2, -1), normála k ploše určené jako g(x, y, z) = 0 v tomtéž
bodě je (0, 2, -1). Tečna je kolmá na obě normály, její směrový vektor získáme tedy
např. vektorovým součinem normál, což je (0, 5, 10). Protože tečna prochází bodem
[2, 1, 0] je její parametrické vyjádření [2, 1 + t, 2t], t  R.
8.6
8.9. Derivace vyšších řádů. Jestliže vybereme pevný přírůstek v  Rn
, zadává
vyčíslení diferenciálů na tomto přírůstku (diferenciální) operaci na diferencovatelných
funkcích f : En  R
f  dvf = df(v)
a výsledkem je opět funkce df(v) : En  R. Jestliže je tato funkce opět diferencovatelná,
může opakovat totéž s jiným přírůstkem atd. Zejména tedy můžeme pracovat
s iteracemi parciálních derivací. Pro parciální derivace druhého řádu píšeme
(

xj


xi
)f =
2
xixj
f =
2
f
xixj
v případě opakované volby i = j píšeme také
(

xi


xi
)f =
2
x2
i
f =
2
f
x2
i
.
238 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Úplně stejně postupujeme při dalších iteracích a hovoříme o parciálních derivacích
k-tého řádu
k
f
xi1
. . . xik
.
Obecněji můžeme iterovat (u dostatečně diferencovatelných funkcí) také libovolné
směrové derivace, např. dv  dwf pro dva pevné přírůstky v, w  Rn
.
Abychom si vše ukázali v co nejjednodušší formě, budeme opět pracovat chvíli
v rovině E2 za přepokladu spojitosti parciálních derivací druhého řádu. V rovině a
prostoru se často stručně značí iterované derivace pouhými odkazy jmen proměnných
v pozici indexů u funkce, např.
fx =
f
x
, fxx =
2
f
x2
, fyx =
2
f
xy
, fxy =
2
f
yx
.
Ukážeme, že ve skutečnosti spolu parciální derivace komutují, tzn. není potřeba
dbát na pořadí, ve kterém je provádíme.
Podle předpokladu existuje limita
fxy(x, y) = lim
t0
1
t
`
fx(x, y + t) - fx(x, y)
´
= lim
t0
1
t
,,
lim
s0
1
s
`
f(x + s, y + t) - f(x, y + t) - f(x + s, y) + f(x, y)
´

= lim
t0
1
t2
,,
`
f(x + t, y + t) - f(x, y + t)
´
-
`
f(x + t, y) - f(x, y)
´

a je spojitá v (x, y). Označme si výraz, ze kterého bereme poslední limitu, jako funkci (x, y, t)
a zkusme jej vyjádřit pomocí parciálních derivací. Pro dočasně pevné t si označme g(x, y) =
f(x + t, y) - f(x, y). Pak výraz v poslední velké závorce je roven
g(x, y + t) - g(x, y) = t  gy(x, y + t0).
pro nějaké vhodné t0, které je mezi nulou a t (a na t závisí), viz rovnost (8.2) s dosazenou
hodnotou přírůstku v = (0, 1)). Nyní gy(x, y) = fy(x + t, y) - fy(x, y) a proto můžeme psát
 jako
(x, y, t) =
1
t
gy(x, y + t0) =
1
t
`
fy(x + t, y + t0) - fy(x, y + t0)
´
.
Opětovnou aplikací věty o střední hodnotě,
(x, y, t) = fyx(x + t1, y + t0)
pro vhodné t1 mezi nulou a t. Když ale velkou závorku rozdělíme na (f(x + t, y + t) - f(x +
t, y)) - (f(x, y + t) - f(x, y)), dostaneme stejným postupem s funkcí h(x, y) = f(x, y + t) f(x,
y) vyjádření
(x, y, t) = fxy(x + s0, y + s1)
s obecně jinými konstantami s0 a s1. Protože jsou druhé parciální derivace podle našeho
předpoklady spojité, musí i limita pro t  0 zaručit požadovanou rovnost
fxy(x, y) = fyx(x, y)
ve všech bodech (x, y).
Stejný postup pro funkce n proměnných dokazuje následující tvrzení:
Věta. Nechť f : En  R je k-krát diferencovatelná funkce se spojitými parciálními
derivacemi až do řádu k včetně v okolí bodu x  Rn
. Pak všechny parciální derivace
nezávisí na pořadí derivování.
1. FUNKCE A ZOBRAZENÍ NA Rn
239
Důkaz. Důkaz pro druhý řád byl proveden výše pro n = 2 a postup v obecném případě
se nijak neliší. Formálně můžeme obecný případ u dvou derivací odbýt i tvrzením, že se vždy
celá argumentace odehraje ve dvourozměrném afinních podprostoru.
U derivací vyššího řádu lze důkaz dokončit indukcí podle řádu. Skutečně, každé pořadí
indexů lze vytvořit záměnami sousedících dvojic.
Definice. Je-li f : Rn
 R libovolná dvakrát diferencovatelná funkce, nazýváme
symetrickou matici funkcí
Hf(x) =
2
f
xixj
(x) =


2
f
x1x1
(x) . . . 2
f
x1xn
(x)
...
...
...
2
f
xnx1
(x) . . . 2
f
xnxn
(x)


Hessián funkce f v bodě x.
Z předchozích úvah jsme již viděli, že vynulování diferenciálu v bodě (x, y)  E2
zaručuje stacionární chování podél všech křivek v tomto bodu. Hessián
Hf(x, y) =
fxx(x, y) fxy(x, y)
fxy(x, y) fyy(x, y)
hraje roli druhé derivace.
Pro každou křivku c(t) = (x(t), y(t)) = (x0 +t, y0 +t) budou totiž mít funkce
jedné proměnné
(t) = f(x(t), y(t))
(t) = f(x0, y0) +
f
x
(x0, y0) +
f
y
(x0, y0)
+
1
2
fxx(x0, y0)2
+ 2fxy(x0, y0) + fyy(x0, y0)2
stejné derivace do druhého řádu včetně (přepočtěte!). Funkci  přitom můžeme
zapsat vektorově jako
(t) = f(x0, y0) + df(x0, y0) 


+
1
2
( )  Hf(x0, y0) 


nebo (t) = f(x0, y0)+df(x0, y0)(v)+ 1
2 Hf(x0, y0)(v, v), kde v = (, ) je přírůstek
zadaný derivací křivky c(t) a Hessián je použit jako symetrická 2­forma.
To je vyjádření, které již určitě připomíná Taylorovu větu funkcí jedné proměnné,
přesněji řečeno kvadratické přiblížení funkce Taylorovým polynomem druhého
řádu. Na následujícím obrázku je vynesena jak tečná rovina tak toto kvadratické
přiblížení pro dva různé body a funkci f(x, y) = sin(x) cos(y).
240 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
6
5
4 x
3
2
1
0
0
1
2
3
4 y
5
6-2
-1
0
1
2
6
5
4 x
3
2
1
0
0
1
2
3
4 y
5
6-2
-1
0
1
2
8.7
8.10. Taylorova věta. Vícerozměrná verze Taylorovy věty je také příkladem matematického
tvrzení, kde složitou částí je nalezení správné formulace. Důkaz je už
pak snadný. Budeme postupovat ve výše naznačeném směru a zavedeme si značení
pro jednotlivé části Dk
f aproximací vyšších řádů. Budou to vždy k­lineární výrazy
v přírůstcích a nás bude zajímat jen jejich vyčíslení na k stejných hodnotách. Již
jsme diskutovali diferenciál D1
f = df v prvním řádu a hessián D2
f = Hf v řádu
druhém. Obecně pro funkce f : En  R, body x = (x1, . . . , x2)  En a přírůstky
v = (1, . . . , n) klademe
Dk
f(x)(v) =
1i1,...,ikn
k
f
xi1 . . . xik
(x1, . . . , xn)  i1    ik
.
Názorným příkladem (s využitím symetrií parciálních derivací) je pro E2 výraz
třetího řádu
D3
f(x, y)(, ) =
3
f
x3
3
+ 3
3
f
x2y
2
 + 3
3
f
xy2
2
+
3
f
y3
3
a obecně
Dk
f(x, y)(, ) =
k
=0
k k
f
xk- y
k-
 .
Věta. Nechť f : En  R je k­krát diferencovatelná funkce v okolí O(x) bodu
x  En. Pro každý přírůstek v  Rn
s velikostí v <  pak existuje číslo 0    1
takové, že
f(x + v) = f(x) + D1
f(x)(v) +
1
2!
D2
f(x)(v) +    +
1
(k - 1)!
Dk-1
f(x)(v)
+
1
k!
Dk
f(x +   v)(v).
Důkaz. Pro přírůstek v  Rn
zvolme křivku c(t) = x + tv v En a zkoumejme
funkci  : R  R definovanou složením (t) = f  c(t). Taylorova věta pro funkce
jedné proměnné říká (viz Věta 6.7)
e8.3 (8.3) (t) = (0) +  (0)t +    +
1
(k - 1)!
(k-1)
(0)tk-1
+
1
k!
(k)
()tk
.
Zbývá nám tedy jen ověřit, že postupným derivováním složené funkce  dostaneme
právě požadovaný vztah. To lze snadno provést indukcí přes řád k.
1. FUNKCE A ZOBRAZENÍ NA Rn
241
Pro k = 1 splývá Taylorova věta se vztahem v rovnosti (8.2). Při jeho odvození jsme vyšli
ze vztahu
d
dt
(t) =
f
x1
(x(t))  x1(t) +    +
f
xn
(x(t))  xn(t),
který platí pro každou křivku a funkci f. To znamená, že
D1
f(c(t))(v) = D1
f(c(t))(c (t))
pro všechna t v okolí nuly. Stejně budeme postupovat pro funkce D f. Místo přírůstku v
můžeme psát c (t) a zapamatujme si, že další derivování c(t) již vede identicky na nulu všude,
tj. c (t) = 0 pro všechna t (protože jde o parametrizovanou přímku).
Předpokládejme, že
D f(x)(v) =
X
1i1,...,i n
 f
xi1 . . . xi
(x1(t), . . . , xn(t))  xi1
(t)    xi (t)
a spočtěme totéž pro + 1. Derivování složené funkce dá podle pravidla o derivání součinu
(viz Věta 5.23)
d
dt
D f(c(t))(c (t)) =
d
dt
X
1i1,...,i n
 f
xi1 . . . xi
(x1(t), . . . , xn(t))  xi1
(t)    xi (t)
=
X
1i1,...,i n
,, nX
j=1
 +1
f
xi1 . . . xi xj
(x1(t), . . . , xn(t))  xj(t)  xi1
(t)    xi (t)

+ 0
a to skutečně je požadovaný vztah pro řád + 1. Taylorova věta nyní vyplývá z vyčíslení v
bodě t = 0 a dosazení do (8.3).
8.11. Příklady.
8.11.1. Napište Taylorův rozvoj druhého řádu funkce f : R2
 R, f(x, y) = ln(x2
+
y2
+ 1) v bodě [1, 1].
Řešení. Nejprve spočítáme první parciální derivace:
fx =
2x
x2 + y2 + 1
, fy =
2y
x2 + y2 + 1
,
poté druhý totální diferenciál daný Hessiánem:
Hf =
2y2
-2x2
+2
(x2+y2+1)2 - 4xy
(x2+y2+1)2
- 4xy
(x2+y2+1)2
2x2
-2y2
+2
(x2+y2+1)2
.
Hodnota Hessiánu v bodě [1, 1] je
2
9 -4
9
-4
9
2
9
,
celkem tedy již můžeme napsat Taylorův rozvoj druhého řádu v bodě [1, 1]:
T2
(f)(1, 1) = f(1, 1) + fx(1, 1)(x - 1) + fy(1, 1)(y - 1) +
+
1
2
(x - 1, y - 1)Hf(1, 1)
x - 1
y - 1
= ln(3) +
2
3
(x - 1) +
2
3
(y - 1) +
1
9
(x - 1)2
-
-
4
9
(x - 1)(y - 1) +
1
9
(y - 1)2
=
1
9
(x2
+ y2
+ 8x + 8y - 4xy - 14) + ln(3).
242 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.11.2. Určete Taylorův polynom druhého řádu funkce ln(x2
y) v bodě [1, 1].
Řešení.
T2
ln(xy+1)(1, 1) = ln(2) +
1
4
(x2
+ y2
+ xy - x - y - 1).
8.11.3. Určete Taylorův rozvoj druhého řádu funkce f : R2
 R,
f(x, y) = tan(xy + y)
v bodě (0, 0).
Řešení.
y + xy.
8.12. Lokální extrémy funkcí více proměnných. Zkusme se nyní s pomocí
diferenciálu a hessiánu podívat na lokální maxima a minima funkcí na En. Stejně
jako v případě funkce jedné proměnné řekneme o vnitřním bodu x0  En definičního
oboru funkce f, že je (lokálním) maximem nebo minimem, jestliže existuje jeho
okolí U takové, že pro všechny body x  U splňuje funkční hodnota f(x)  f(x0)
nebo f(x)  f(x0). Pokud nastává v předchozích nerovnostech ostrá nerovnost pro
všechny x = x0, hovoříme o ostrém extrému.
Pro jednoduchost budeme nadále předpokládat, že naše funkce f má spojité
parciální derivace prvního i druhého řádu na svém definičním oboru. Nutnou podmínkou
pro existenci maxima nebo minima v bodě x0 je vymizení diferenciálu v
tomto bodě, tj. df(x0) = 0. Skutečně, pokud je df(x0) = 0, pak existuje směr v, ve
kterém je dvf(x0) = 0. Pak ovšem nutně je podél přímky x0 + tv na jednu stranu
od bodu x0 hodnota funkce roste a na druhou klesá, viz (8.2).
Vnitřní bod x  En definičního oboru funkce f, ve kterém je diferenciál df(x)
nulový nazýváme stacionární bod funkce f.
Budeme opět pracovat s jednoduchou funkcí v E2 abychom závěry přímo mohli
ilustrovat. Uvažme funkci f(x, y) = sin(x) cos(y), která už byla předmětem diskuse
a obrázků v odstavcích 8.9 a 8.7. Svým tvarem tato funkce připomíná známá
kartonová plata na vajíčka, je tedy předem zřejmé, že najdeme řadu extrémů, ale
ještě více stacionárních bodů, která ve skutečnosti extrémy nebudou (ta ,,sedýlka
viditelná na obrázku).
1. FUNKCE A ZOBRAZENÍ NA Rn
243
00
-1
22
-0,5
44
0
66
0,5
8 8
1
Spočtěme si tedy první a poté druhé derivace:
fx(x, y) = cos(x) cos(y), fy(x, y) = - sin(x) sin(y),
takže obě derivace budou nulové pro dvě sady bodů
(1) cos(x) = 0, sin(y) = 0, to je (x, y) = (2k+1
2 , ), pro libovolné k,  Z
(2) cos(y) = 0, sin(x) = 0, to je (x, y) = (k, 2 +1
2 ), pro libovolné k,  Z.
Druhé parciální derivace jsou
Hf(x, y) =
fxx fxy
fxy fyy
(x, y) =
- sin(x) cos(y) - cos(x) sin(y)
- cos(x) sin(y) - sin(x) cos(y)
V našich dvou sadách bodů tedy dostáváme následující hessiány:
(1) Hf(k + 
2 , ) = 
1 0
0 1
, přičemž znaménko + nastává, když parity k a
jsou stejné a naopak pro -,
(2) Hf(k,  + 
2 ) = 
0 1
1 0
, přičemž znaménko + nastává, když parity k a
jsou stejné a naopak pro -.
Když se nyní podíváme na tvrzení Taylorovy věty pro řád k = 2, dostáváme v
okolí jednoho ze stacionárních bodů (x0, y0)
f(x, y) = f(x0, y0) +
1
2
Hf(x0 + (x - x0), y0 + (y - y0))(x - x0, y - y0),
kde Hf nyní vnímáme jako kvadratickou formu vyčíslenou na přírůstku (x-x0, yy0).
Protože naše funkce má spojitý hessián (tj. spojité parciální derivace do druhého
řádu včetně), a matice hessiánu jsou nedegenerované, nastane lokální maximum
tehdy a jen tehdy, když náš bod (x0, y0) patří do první skupiny se stejnými
paritami k a . Když budou parity opačné, pak bod z první skupiny bude naopak
bodem lokálního minima.
Naopak, hessián u druhé skupiny bodů se vždy vyčíslí kladně na některých
přírůstcích a záporně na jiných. Proto se tak bude chovat i celá funkce f v malém
okolí daného bodu.
Abychom mohli zformulovat obecné tvrzení o hessiánu a lokálních extrémech
ve stacionárních bodech, musíme připomenout diskusi o kvadratických formách v
odstavcích ??­?? v kapitole o afinní geometrii. Zavedli jsme tam pro kvadratickou
formu h : En  R následující přívlastky
* positivně definitní, je-li h(u) > 0 pro všechny u = 0
244 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
* positivně semidefinitní, je-li h(u)  0 pro všechny u  V
* negativně definitní, je-li h(u) < 0 pro všechny u = 0
* negativně semidefinitní, je-li h(u)  0 pro všechny u  V
* indefinitní, je-li h(u) > 0 a f(v) < 0 pro vhodné u, v  V .
Zavedli jsme také nějaké metody, které umožňují přímo zjistit, zda daná forma má
některý z těchto přívlastků.
Způsob našeho předchozího využití Taylorovy věty dokazuje i v obecném případě
funkce f více proměnných následující výsledek:
Věta. Nechť f : En  R je dvakrát spojitě diferencovatelná funkce a x  En nechť
je stacionární bod funkce f. Potom
(1) f má v x ostré lokální minimum, je-li Hf(x) positivně definitní,
(2) f má v x ostré lokální maximum, je-li Hf(x) negativně definitní,
(3) f nemá v bodě x lokální extrém je-li Hf(x) indefinitní.
Všimněme si, že věta nedává žádný výsledek, pokud je hessián funkce ve zkoumaném
bodě degenerovaný a přitom není indefinitní. Důvod je opět stejný jako u
funkcí jedné proměnné. V takových případech totiž existují směry, ve kterých první
i druhá derivace zmizí a my proto v tomto řádu přiblížení neumíme poznat, zda se
funkce bude chovat jako t3
nebo jako t4
dokud nespočteme alespoň v potřebných
směrech derivace vyšší.
8.13. Příklady.
8.13.1. Určete stacionární body funkce f : R2
 R, f(x, y) = x2
y + y2
x - xy a
rozhodněte, které z těchto bodů jsou lokální extrémy a jakého druhu.
Řešení. První derivace jsou fx = 2xy + y2
- y, fy = x2
+ 2xy - x. Položíme-li
obě parciální derivace současně nule, má soustava následující řešení: {x = y = 0},
{x = 0, y = 1}, {x = 1, y = 0}, {x = 1/3, y = 1/3}, což jsou čtyři stacionární body
dané funkce.
Hessián funkce Hf je
2y 2x + 2y - 1
2x + 2y - 1 2x
.
Hodnoty ve stacionárních bodech jsou postupně
0 -1
-1 0
,
1 1
1 0
,
0 1
1 1
,
2
3
1
3
1
3
2
3
,
tedy první tři Hessiány jsou indefinitní, poslední pak pozitivně definitní, bod
[1/3, 1/3] je tedy lokálním minimem.
8.13.2. Určete bod v rovině x + y + 3z = 5 ležící v R3
, který má nejmenší vzdálenost
od počátku souřadnic. A to jak metodami lineární algebry, tak metodami
diferenciálního počtu.
Řešení. Jde o patu kolmice spuštěné z bodu [0, 0, 0] na rovinu. Normála k rovině
je (t, t, 3t), t  R. Dosazením do rovnice roviny dostaneme patu kolmice
[5/11, 5/11, 15/11].
Alternativně minimalizujeme vzdálenost (resp. její kvadrát) bodů v rovině od
počátku, tj. funkci dvou proměnných,
(5 - y - 3z)2
+ y2
+ z2
.
1. FUNKCE A ZOBRAZENÍ NA Rn
245
Položením parciálních derivací rovných nule dostaneme soustavu
3y + 10z - 15 = 0
2y + 3z - 5 = 0,
která má řešení jako výše. Protože víme, že minimum existuje a jedná se o jediný
stacionární bod, nemusíme už ani počítat Hessián.
8.9
8.14. Zobrazení a transformace. Koncept derivace a diferenciálu lze snadno
rozšířit na zobrazení F : En  Em. Při zvolených kartézských souřadnicích na
obou stranách je takové zobrazení obyčejná m­tice
F(x1, . . . , xn) = (f1(x1, . . . , xn), . . . , fm(x1, . . . , xn))
funkcí fi : En  R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné
zobrazení, jestliže tuto vlastnost mají všechny funkce f1, . . . , fm.
Diferenciály dfi(x) jednotlivých funkcí fi poskytují lineární přiblížení přírůstků
jejich hodnot. Lze proto očekávat, že budou společně dávat také souřadné vyjádření
lineárního zobrazení D1
F(x) : Rn
 Rm
mezi zaměřeními, které bude lineárně
aproximovat přírůstky našeho zobrazení. Výsledná matice
D1
F(x) =


df1(x)
df2(x)
...
dfm(x)


=


f1
x1
f1
x2
. . . f1
xn
f2
x1
f2
x2
. . . f2
xn
...
...
...
...
fm
x1
fm
x2
. . . fm
xn


(x)
se nazývá Jacobiho matice zobrazení F v bodě x. Lineární zobrazení D1
F(x) definované
na přírůstcích v = (v1, . . . , vn) pomocí stejně značené Jacobiho matice
nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže platí
lim
v0
1
v
F(x + v) - F(x) - D1
F(x)(v) = 0.
Přímé použití Věty 8.6 o existenci diferenciálu pro funkce n proměnných na jednotlivé
souřadné funkce zobrazení F a sama definice euklidovské vzdálenosti vede
k následujícímu tvrzení:
Důsledek. Nechť F : En  Em je zobrazení, jehož všechny souřadné funkce mají
spojité parciální derivace v okolí bodu x  En. Pak existuje diferenciál D1
F(x)
zadaný Jacobiho maticí.
Diferencovatelná zobrazení F : En  En, která mají inverzní zobrazení G :
Em  En definované na celém svém obrazu, se nazývají (diferencovatelné) transformace.
Příkladem transformace byl přechod mezi kartézkými a polárními souřadnicemi,
který jsme diskutovali hned na začátku této kapito v 8.1.
8.10 8.15. Věta (,,Chain Rule ). Nechť F : En  Em a G : Em  Er jsou dvě diferencovatelná
zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak
také složené zobrazení G  F je diferencovatelné a jeho diferenciál je v každém bodě
z definičního obodu F kompozicí diferenciálů
D1
(G  F)(x) = D1
G(F(x))  D1
F(x).
Příslušná Jacobiho matice je dána součinem příslušných Jacobiho matic.
246 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Důkaz. V odstavci 8.6 a při důkazu Taylorovy věty jsme odvodili, jak se chová
diferencování pro složená zobrazení vzniklá z funkcí a křivek. Tím jsme dokázali
speciální případy této věty s n = r = 1. Obecný případ se ve prakticky stejným
postupem, jen budeme pracovat více s vektory.
Zvolme libovolný pevný přírůstek v a počítejme směrovou derivaci pro kompozici
G  F. Ve skutečnosti to znamená spočíst diferenciál pro jednu ze souřadných
funkcí zobrazení G, pišme tedy jednodušeji g  F pro kteroukoliv z nich.
dv(g  F)(x) = lim
t0
1
t
g(F(x + tv)) - g(F(x)) .
Výraz v závorce můžeme ovšem z definice diferenciálu g vyjádřit jako
g(F(x + tv)) - g(F(x) = dg(F(x))(F(x + tv) - F(x)) + (F(x + tv) - F(x))
kde  je definovaná na okolí bodu F(x), je spojitá a limv0
1
w (w) = 0. Dosazením
do rovnosti pro směrovou derivaci dostáváme
dv(g  F)(x) = lim
t0
1
t
dg(F(x))(F(x + tv) - F(x)) + (F(x + tv) - F(x))
= dg(F(x)) lim
t0
1
t
F(x + tv) - F(x) + lim
t0
1
t
(F(x + tv) - F(x))
= dg(F(x))  D1
F(x)(v) + 0,
kde jsme využili skutečnosti, že lineární zobrazení mezi konečněrozměrnými prostory
jsou vždy spojitá a vlastnosti funkce .
Dokázali jsme tedy tvrzení pro jednotlivé funkce g1, . . . , gr zobrazení G. Celá
věta nyní vyplývá z toho, jak se násobí matice.
Příklad. Ukažme si na jednoduchém příkladě, jak funguje věta o derivování složených
zobrazení. Polární souřadnice vzniknou z kartézských transformací F : R2

R2
, kterou v souřadnicích (x, y) a (r, ) zapíšeme takto (samozřejmě jen na vhodném
definičním oboru)
r = x2 + y2,  = arctan
y
x
.
Uvažme funkci gt : E2  R, která má v polárních souřadnicích vyjádření
g(r, , t) = sin(r-t) .
Funkce nám docela dobře přibližuje vlnění povrchu hladiny po bodovém vzruchu v
počátku v čase t (časem i uvidíme proč), viz obrázek s hodnotou t = -/2.
1. FUNKCE A ZOBRAZENÍ NA Rn
247
Spočtěme nyní derivaci této funkce v kartézských souřadnicích. Použitím naší
věty dostaneme
g
x
(x, y, t) =
g
r
(r, )
r
x
(x, y) +
g

(r, )

x
(x, y)
= cos( x2 + y2 - t)
x
x2 + y2
+ 0
a podobně
g
y
(x, y, t) =
g
r
(r, )
r
y
(x, y) +
g

(r, )

y
(x, y)
= cos( x2 + y2 - t)
y
x2 + y2
.
U funkcí jedné proměnné rozhodovala nenulovost první derivace o tom, je-li
funkce rostoucí či klesající. Pak takovou musela být i na nějakém okolí zvoleného
bodu a tudíž tam existovala i inverzní funkce. Její derivace pak byla převrácenou
hodnotou derivace funkce původní. Když tuto situaci interpretujeme z pohledu
zobrazení E1  E1 a lineárních zobrazení R  R coby jejich diferenciálů, je nenulovost
nutnou a dostatečnou podmínkou k invertibilitě příslušného diferenciálu.
Takto obdržíme tvrzení platné pro konečněrozměrné prostory obecně:
8.11 8.16. Věta (O inverzním zobrazení). Nechť F : En  En je spojitě diferencovatelné
zobrazení na nějakém okolí bodu x0  En a nechť je Jacobiho matice D1
f(x0)
invertibilní. Pak na nějakém okolí bodu x0 existuje inverzní zobrazení F-1
a jeho
diferenciál v bodě F(x0) je inverzním zobrazením k D1
F(x0), tzn. je zadán inverzní
maticí k Jacobiho matici zobrazení F v bodě x0.
Důkaz. Nejdříve si zkusme ověřit, že tvrzení je rozumné a očekávatelné. Pokud
bychom předpokládali, že inverzní zobrazení existuje a je diferencovatelné v bodě
F(x0), věta o derivování složených funkcí si vynucuje vztah
idRn = D1
(F-1
 F)(x0) = D1
(F-1
)  D1
F(x0)
což ověřuje formuli v závěru věty. Víme proto od začátku, jaký diferenciál pro F-1
hledat.
V dalším kroku předpokládejme, že inverzní zobrazení existuje a je spojité a
budeme ověřovat existenci diferenciálu. Z diferencovatelnosti F na okolí x0 vyplývá,
248 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
že
F(x) - F(x0) - D1
F(x0)(x - x0) = (x - x0)
s funkcí  : Rn
 0 splňující limv0
1
v (v) = 0. Pro ověření aproximační vlastnosti
lineárního zobrazení (D1
F(x0))-1
je třeba spočíst limitu pro y = F(x) jdoucí
k y0 = F(x0)
lim
yy0
1
y - y0
F-1
(y) - F-1
(y0) - (D1
F(x0))-1
(y - y0) .
Dosazením z předchozí rovnosti dostáváme
e8.4 (8.4)
lim
yy0
1
y - y0
x - x0 - (D1
F(x0))-1
(D1
F(x0)(x - x0) + (x - x0))
= lim
yy0
-1
y - y0
(D1
F(x0))-1
((x - x0))
= (D1
F(x0))-1
lim
yy0
-1
y - y0
((x - x0)),
kde poslední rovnost vyplývá ze skutečnosti, že lineární zobrazení mezi konečněrozměrnými
prostory jsou vždy spojitá a díky invertibilitě diferenciálu jeho předřazení
limitnímu procesu neovlivní ani existenci limity.
Všimněme si, že jsme skoro dosáhli úplného úspěchu ­ limita na konci našeho
výrazy je v důsledku vlastností funkce  nulová, pokud jsou velikosti F(x)-F(x0)
větší než C x - x0 pro nějakou konstantu C. Zbývá nám tedy už ,,jen dokázat
existenci spojitého inverzního zobrazení k F a získat přitom dostatečnou kontrolu
nad chováním hodnot F.
Pro další úvahy si zjednodušíme práci převedením obecného případu na o něco
jednodušší tvrzení. Zejména bez újmy na obecnosti lze vhodnou volbou kartézských
souřadnic dosáhnout x0 = 0  Rn
, y0 = F(x0) = 0  Rn
.
Složením zobrazení F s jakýmkoliv lineárním zobrazením G dostateme opět
diferencovatelné zobrazení a víme také, jak se změní diferenciál. Volbou G(x) =
(D1
F(0))-1
(x) dostáváme D1
(GF)(0) = idRn . Můžeme tedy zrovna předpokládat
D1
F(0) = idRn .
Uvažme nyní zobrazení K(x) = F(x) - x. Toto zobrazení je opět diferencovatelné
a jeho diferenciál v bodě 0 je zjevně nulový.
Pro libovolné spojitě diferencovatelné zobrazení K v okolí počátku Rn
platí
podle našeho odhadu v Lemmatu 8.4 a díky definici euklidovské normy
K(x) - K(y)  Cn2
x - y ,
kde C je ohraničeno maximem přes všechny parciální derivace G na sledovaném
okolí. Protože v našem případě je diferenciál K v x0 = 0 nulový, můžeme volbou
dostatečně malého okolí U počátku dosáhnout platnosti ohraničení
K(x) - K(y) 
1
2
x - y .
Dále dosazením za definici K(x) = F(x) - x a použitím trojúhelníkové nerovnosti
(u - v) + v  u - v + v , tj. v podobě u - v  u - v , dostáváme
y - x - F(x) - F(y)  F(x) - F(y) + y - x 
1
2
y - x
1. FUNKCE A ZOBRAZENÍ NA Rn
249
a tedy také
e8.5 (8.5) (1 -
1
2
) x - y =
1
2
x - y  F(x) - F(y) .
Tímto odhadem jsme dosáhli opravdu pěkného pokroku: jsou-li na našem malém
okolí U počátku x = y, pak nutně musí být také F(x) = F(y). Je tedy naše
zobrazení vzájemně jednoznačné. Pišme F-1
pro jeho inverzi definovanou na obrazu
U. Pro ni náš odhad říká
F-1
(x) - F-1
(y)  2 x - y ,
je tedy toto zobrazení určitě spojité. Konečně, odhad (8.5) také zajišťuje existenci
a nulovost limity, kterou jsme v (8.4) potřebovali pro pro aproximační vlastnosti a
tudíž existenci diferenciálu F-1
.
Zdánlivě jsme tedy již úplně hotoví (s důkazem), to ale není pravda. Abychom
skutečně dokončili důkaz, musíme ukázat, že je F zúžené na dostatečně malé okolí
nejen vzájemně jednoznačné, ale že také zobrazuje otevřené okolí nuly na otevřené
okolí nuly.
Zvolme si  tak malé, aby okolí V = O(0) leželo v U včetně své hranice a zároveň
aby Jacobiho matice zobrazení F byla na celém V invertibilní. To je jistě možné, protože
determinant je spojité zobrazení. Označme B hranici množiny V (tj. příslušnou sféru). Protože
je B kompaktní a F spojité, má funkce
(x) = F(x)
na B maximum i minimum. Označme a = 1
2
minxB (x) a uvažujme libovolné y  Oa(0).
Chceme ukázat, že existuje alespoň jedno x  V takové, že y = F(x), čímž bude celá věta o
inverzní funkci dokázána. Za tímto účelem uvažme (s naším pevně zvoleným bodem y) funkci
h(x) = F(x) - y 2
Opět obraz h(V )  h(B) musí mít minimum. Ukážeme nejprve, že toto minimum nemůže
nastat pro x  B. Platí totiž F(0) = 0 a proto h(0) = y < a. Zároveň podle naší definice
a je pro y  Oa(0) vzdálenost y od F(x) pro x  B alespoň a, protože a jsme volili jako
polovinu minima z velikosti F(x) na hranici. Minimum tedy nastává uvnitř V a musí být ve
stacionárním bodě z funkce h. To ale znamená že pro všechna j = 1, . . . , n platí
h
x
(z) =
nX
i=1
2(fj(z) - yj)
fi
xi
(z) = 0.
Na tento systém rovnic se můžeme dívat jako na systém lineárních rovnic s proměnnými
j = fj(z) - yj a koeficienty zadanými dvojnásobkem Jacobiho matice D1
F(z). Pro každé
z  V má takový systém ovšem pouze jedno řešení a to je nulové, protože Jacobiho matice je
podle našeho předpokladu invertibilní.
8.12
8.17. Věta o implicitní funkci. Naším dalším cílem je využít větu o inverzním
zobrazení pro práci s implicitně definovanými funkcemi.
Uvažujme spojitě diferencovatelné zobrazení F(x, y) definované v E2 a hledejme
body (x, y), ve kterých platí F(x, y) = 0. Příkladem může být třeba obvyklá
(implicitní) definice přímek a kružnic:
F(x, y) = ax + by + c = 0
F(x, y) = (x - s)2
+ (y - t)2
- r2
= 0, r > 0.
Zatímco v prvém případě je (při b = 0) předpisem zadaná funkce
y = f(x) = -
a
b
x -
c
b
250 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
pro všechna x, ve druhém případě můžeme pro libovolný bod (a, b) splňující rovnici
kružnice a takový, že b = t (to jsou totiž krajní body kružnice ve směru souřadnice
x), najít okolí bodu a, na kterém bude buď y = f(x) = t + (x - s)2 - r nebo
y = f(x) = t - (x - s)2 - r.
Při načrtnutí obrázku je důvod zřejmý ­ nemůžeme chtít pomocí funkce y =
f(x) postihnout horní i dolní půlkružnici zároveň. Zajímavější jsou krajní body
intervalu [t-r, t+r]. Ty také vyhovují rovnici kružnice, platí v nich ale Fy(sr, t) =
0, což vystihuje polohu tečny ke kružnici v těchto bodech rovnoběžnou s osou y.
V těchto bodech skutečně neumíme najít okolí, na němž by kružnice byla popsána
jako funkce y = f(x).
Navíc umíme i derivace naší funkce y = f(x) = t + (x - s)2 - r2, tam kde je
definována, vyjádřit pomocí parciálních derivací funkce F:
f (x) =
1
2
2(x - s)
(x - s)2 - r2
=
x - s
y - t
= -
Fx
Fy
.
Když prohodíme roli proměnných x a y a budeme chtít najít závislost x = f(y)
takovou, aby F(f(y), y) = 0, pak v okolí bodů (s  r, t) bez problémů uspějeme.
Všimněme si, že v těchto bodech je parciální derivace Fx nenulová.
Naše pozorování tedy (pro pouhé dva příklady) říká: pro funkci F(x, y) a bod
(a, b)  E2 takový, že F(a, b) = 0, umíme jednoznačně najít funkci y = f(x)
splňující F(x, f(x)) = 0, pokud je Fy(a, b) = 0. V takovém případě umíme i vypočíst
f (x) = -Fx/Fy. Dokážeme, že ve skutečnosti toto tvrzení platí vždy. Poslední
tvrzení o derivaci přitom je dobře zapamatovalné (a při pečlivém vnímání věcí i
pochopitelné) z výrazu pro diferenciál dy = f (x)dx a tedy:
0 = dF = Fxdx + Fydy = (Fx + Fyf (x))dx.
Obdobně bychom mohli pracovat s implicitními výrazy F(x, y, z) = 0, přičemž
můžeme hledat funkci g(x, y) takovou, že F(x, y, g(x, y)) = 0. Jako příklad uvažme
třeba funkci f(x, y) = x2
+ y2
, jejímž grafem je rotační paraboloid s počátkem v
bodě (0, 0). Ten můžeme implicitně zadat také rovnicí
0 = F(x, y, z) = z - x2
- y2
.
Než sformulujeme výsledek rovnou pro obecnou situaci, všimněme si ještě, jaké
dimenze se mohou/mají v problému vyskytovat. Pokud bychom pro tuto funkci F
chtěli najít křivku c(x) = (c1(x), c2(x)) v rovině takovou, že
F(x, c(x)) = F(x, c1(x), c2(x)) = 0,
pak to jistě budeme umět (dokonce pro všechny počáteční podmínky x = a) také,
ale výsledek nebude jednoznačný pro danou počáteční podmínku. Stačí totiž uvážit
libovolnou křivku na rotačním paraboloidu, jejíž průmět do první souřadnice má
nenulovou derivaci. Pak považujeme x za parametr křivky a za c(x) zvolíme její
průmět do roviny yz.
Viděli jsme tedy, že jedna funkce m + 1 proměnných zadává implicitně nadplochu
v Rm+1
, kterou chceme vyjádřit alespoň lokálně jako graf jedné funkce v m
proměnných. Lze očekávat, že n funkcí v m+n proměnných bude zadávat průnik n
nadploch v Rm+n
, což je ve ,,většině případů m­rozměrný objekt. Uvažujme proto
spojitě diferencovatelné zobrazení
F = (f1, . . . , fn) : Rm+n
 Rn
.
1. FUNKCE A ZOBRAZENÍ NA Rn
251
Jacobiho matice tohoto zobrazení bude mít n řádků a m + n sloupců a můžeme si
ji symbolicky zapsat jako
D1
F = (D1
xF, D1
yF) =


f1
x1
. . . f1
xm
...
...
...
fn
x1
. . . fn
xm
f1
xm+1
. . . f1
xm+n
...
...
...
fn
xm+1
. . . fn
xm+n


 ,
kde (x1, . . . , xm+n)  Rm+n
zapisujeme jako (x, y)  Rm
× Rn
, D1
xF je matice s
n řádky a prvními m sloupci v Jacobiho matici, zatímco D1
yF je čtvercová matice
řádu n se zbylými sloupci. Vícerozměrnou analogií k předchozí úvaze s nenulovou
parciální derivací podle y je požadavek, aby matice D1
y byla invertibilní.
Věta. Nechť F : Rm+n
 Rn
je spojitě diferencovatelné zobrazení na otevřeném
okolí bodu (a, b)  Rm
× Rn
= Rm+n
, ve kterém je F(a, b) = 0 a det D1
yF = 0.
Potom existuje spojitě diferencovatelné zobrazení G : Rm
 Rn
definované na
nějakém okolí U bodu a  Rm
s obrazem G(U), který obsahuje bod b, a takové, že
F(x, G(x)) = 0 pro všechny x  U.
Navíc je Jacobiho matice D1
G zobrazení G na okolí bodu a zadána součinem
matic
D1
G(x) = -(D1
yF)-1
(x, G(x))  D1
xF(x, G(x)).
Důkaz. Pro zvýšení srozumitelnosti uvedeme napřed kompletní důkaz pro nejjednodušší
případ rovnice F(x, y) = 0 s funkcí F dvou proměnných. Rozšíříme
funkci F na
~F : R2
 R2
, (x, y)  (x, F(x, y)).
Jacobiho matice zobrazení ~F je
D1 ~F(x, y) =
1 0
Fx(x, y) Fy(x, y)
.
Z předpokladu Fy(a, b) = 0 vyplývá, že totéž platí i na nějakém okolí bodu (a, b)
a tedy je na tomto okolí funkce ~F invertibilní podle věty o inverzním zobrazení.
Vezměme tedy jednoznačně definované a spojitě diferencovatelné inverzní zobrazení
~F-1
na nějakém okolí bodu (a, 0).
Nyní označme  : R2
 R projekci na druhou souřadnici a uvažujme funkci
f(x) =   ~F-1
(x, 0). To je dobře definovaná a spojitě diferencovatelná funkce.
Máme ověřit, že následující výraz
F(x, f(x)) = F(x, ( ~F-1
(x, 0)))
bude na okolí bodu x = a nulový. Přitom z definice ~F(x, y) = (x, F(x, y)) vyplývá,
že i její inverze musí mít tvar ~F-1
(x, y) = (x,  ~F-1
(x, y)). Můžeme proto
pokračovat v předchozím výpočtu:
F(x, f(x)) = ( ~F(x, ( ~F-1
(x, 0)))) = ( ~F( ~F-1
(x, 0))) = (x, 0) = 0.
Tím máme dokázánu první část věty a zbývá spočíst derivaci funkce f(x). Tuto
derivaci můžeme odečíst opět z věty o inverzním zobrazení pomocí matice (D1 ~F)-1
.
Následující výsledek je snadné ověřit roznásobením matic. (Spočíst lze také
přímo explicitní formulí pro inverzní matici s pomocí determinantu a algebraicky
adjungované matice, viz odstavec 2.22)
1 0
Fx(x, y) Fy(x, y)
-1
= (Fy(x, y))-1 Fy(x, y) 0
-Fx(x, y) 1
.
252 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Dle definice f(x) =  ~F-1
(x, 0) nás z této matice zajímá první položka na druhém
řádku, která je právě Jakobiho maticí D1
f. V našem jednoduchém případě je to
právě požadovaný skalár -Fx(x, f(x))/Fy(x, f(x)).
Obecný důkaz je bezezbytku stejný, není v něm potřeba změnit žádnou z uvedených formulí,
kromě posledního výpočtu derivace funkce f, kde místo jednotlivých parciálních derivací
budou vystupovat příslušné části Jacobiho matice D1
xF a D1
yF. Samozřejmě je přitom třeba
místo se skaláry pracovat s vektory a maticemi. Pro výpočet Jacobiho matice zobrazení G opět
použijeme výpočtu inverzní matice, není ale až tak vhodné přímo využít postupu z odstavce
2.22. Snadnější je nechat se přímo inspirovat případem v dimenzi m + n = 2, označit si matici
(D1 ~F-1
) =
,,
idRm 0
D1
xF(x, y) D1
yF(x, y)
-1
=
,,
A B
C D

s bloky danými dělením na m a n řádků i sloupců (tj. např. A má rozměr m × m, zatímco C
je rozměru n × m) a přímo spočíst matice A, B, C, D z definiční rovnosti pro inverzi:
,,
idRm 0
D1
xF(x, y) D1
yF(x, y)


,,
A B
C D

=
,,
idRm 0
0 idRn

.
Zjevně odtud plyne A = idRm , B = 0, D = (D1
yF)-1
a konečně D1
xF + D1
yF  C = 0. Z
poslední rovnosti pak dostáváme požadovaný vztah
D1
G = C = -(D1
yF)-1
 D1
xF.
Tím je věta dokázána.
8.18. Příklad. Buď dáno zobrazení F : R2
 R, F(x, y) = xy sin 
2 xy2
. Ukažte,
že rovnost F(x, y) = 1 zadává v nějakém okolí U bodu 1 implicitně funkci f : U 
R, tak že F(x, f(x)) = 1 pro x  U. Navíc f(1) = 1. Určtete f (1).
Řešení. Fy(1, 1) = x sin 
2 xy2
+x2
y2
cos 
2 xy2
(1, 1) = 1, tedy předpis F(x, y) =
1 zadává implicitně na okolí bodu (1, 1) funkci f : R  R. Pro její derivaci potom
platí
f (x) = -
Fx
Fy
(1, 1) = -
1
1
= -1.
8.13
8.19. Gradient funkce. Jak jsme viděli v minulém odstavci, je-li F spojitě diferencovatelná
funkce n proměnných, zadává předpis F(x1, . . . , xn) = b s nějakou
pevnou hodnotou b  R podmnožinu M  Rn
, která mívá vlastnosti (n - 1)rozměrné
nadplochy. Přesněji řečeno, pokud je vektor parciálních derivací
D1
F =
f
x1
, . . . ,
f
xn
nenulový, můžeme lokálně množinu M popsat jako graf spojitě diferencovatelné
funkce v n - 1 proměnných. Hovoříme v této souvislosti také o úrovňových množinách
Mb. Vektor D1
F  Rn
se nazývá gradient funkce F. V technické a fyzikální
literatuře se často zapisuje také jako grad F.
Protože je Mb zadáno pomocí konstantní hodnoty funkce F, budou derivace
křivek ležících v M mít jistě tu vlastnost, že na nich bude diferenciál dF vždy
vyčíslen nulově ­ skutečně, pro každou takovou křivku bude F(c(t)) = b a tedy i
d
dt
F(c(t)) = dF(c (t)) = 0.
1. FUNKCE A ZOBRAZENÍ NA Rn
253
Naopak uvažme obecný vektor v = (v1, . . . , vn)  Rn
a velikost příslušné směrové
derivace
|dvF| =
f
x1
v1 +    +
f
xn
vn = cos  D1
F v
kde  je odchylka vektoru v od gradientu F, viz pojednání o odchylkách vektorů a
přímek ve čtvrté kapitole (definice 4.17). Odtud ovšem vyplývá, že nulové jsou právě
ty směrové derivace, které jsou kolmé na gradient, zatímco směr zadaný gradientem
je právě ten směr, ve kterém funkce f nejrychleji roste.
Je tedy zřejmé, že tečná rovina k neprázdné úrovňové množině Mb v okolí jejího
bodu s nenulovým gradientem D1
F je určena ortogonálním doplňkem ke gradientu
a samotný gradient je tzv. normálovým vektorem nadplochy Mb.
Např. pro sféru v R3
o poloměru r > 0 a středu (a, b, c) zadanou rovnicí
F(x, y, z) = (x - a)2
+ (y - b)2
+ (z - c)2
= r2
dostáváme normálové vektory v bodě P = (x0, y0, z0) jako nenulový násobek gradientu,
tj. násobek průvodiče
D1
F = (2(x0 - a), 2(y0 - b), 2(z0 - c)),
a tečné vektory budou právě všechny vektory kolmé na gradient. Implicitně proto
jde vždy tečnou rovinu ke sféře v bodě P popsat s pomocí gradientu rovnicí
0 = (x0 - a)(x - x0) + (y0 - b)(y - y0) + (z0 - c)(z - z0).
To je speciální případ obecné formule:
Věta. Pro funkci F n proměnných a bod P = (a1, . . . , an)  Mb v jehož okolí je
Mb grafem funkce (n - 1) proměnných je implicitní rovnice pro tečnou nadrovinu
0 =
f
x1
(P)  (x1 - a1) +    +
f
xn
(P)  (xn - an).
Důkaz. Tvrzení je zřejmé z předchozího výkladu. Tečná nadrovina totiž musí
být (n - 1)­rozměrná, její zaměření je proto zadané jako jádro lineární formy dané
gradientem (nulové hodnoty příslušného lineárního zobrazení Rn
 R zadaného
násobení sloupce souřadnic řádkovým vektorem grad F). Zvolený bod P přitom
naší rovnici zjevně vyhovuje.
Příklad. Uvažujme model osvětlení 3D objektu, kde známe směr v dopadu světla
na 2D povrch, tj. množinu M zadanou implicitně rovnicí F(x, y, z) = 0. Intenzitu
osvětlení bodu P  M pak definujme jako I cos , kde  je úhel mezi normálou
zadanou gradientem a vektorem opačným ke směru světla. Znaménko našeho výrazu
pak bude označovat, kterou stranu plochy osvětlujeme.
Např. směr osvětlení o intezitě I0 může být v = (1, 1, -1) (tj. ,,šikmo dolů )
a objektem může být třeba koule (tj. F(x, y, z) = x2
+ y2
+ z2
- 1). Pro bod
P = (x, y, z)  M proto dostaneme intenzitu
I(P) =
grad F  v
grad F v
I0 =
-2x - 2y + 2z
2

3
I0.
Všimněme si, že dle očekávání je maximální (plnou) intenzitou I0 osvětlen bod
P = 1
3
(-1, -1, 1) na povrchu koule.
254 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.14
8.20. Tečny a normály k implicitně definovaným plochám. Přejděme nyní
k obecným dimenzím. Máme-li zobrazení F : Rm+n
 Rn
, tj. n rovnic
fi(x1, . . . , xm+n) = bi, i = 1, . . . , n,
pak za podmínek věty o implicitní funkci je množina všech řešení (x1, . . . , xm+n)
grafem zobrazení G : Rm
 Rn
. Pro pevnou volbu b = (b1, . . . , bn) je samozřejmě
množinou všech řešení průnik nadploch M(bi, fi) příslušejících jednotlivým
funkcím fi. Totéž musí platit pro tečné směry a normálové směry. Je-li proto
D1
F Jacobiho matice zobrazení implicitně zadávajícího množinu M s bodem P =
(a1, . . . , am+n)  M, v jehož okolí je M grafem zobrazení,
D1
F =


f1
x1
. . . f1
xm+n
...
...
...
fn
x1
. . . fn
xm+n


potom bude afinní podprostor v Rm+n
obsahující právě všechny tečny bodem P
dán rovnicemi:
0 =
f1
x1
(P)  (x1 - a1) +    +
f1
xn
(P)  (xm+n - am+n)
...
0 =
fn
x1
(P)  (x1 - a1) +    +
fn
xn
(P)  (xm+n - am+n).
Tento podprostor se nazývá tečný prostor k (implicitně zadané) ploše M v bodě P.
Normálový prostor v bodě P je afinní podprostor generovaný bodem P a gradienty
všech funkcí f1, . . . , fn v bodě P, tj. řádky Jacobiho matice D1
F.
Jako jednoduchý příklad si spočtěme tečnu a normálový prostor ke kuželosečce
v R3
. Uvažujme rovnici
0 = f(x, y, z) = z - x2 + y2
kuželu s vrcholem v počátku a rovinu zadanou
0 = g(x, y, z) = z - 2x + y + 1.
Bod P = (1, 0, 1) patří jak kuželu tak rovině a průnik M těchto dvou ploch je křivka
(namalujte si obrázek). Její tečnou v bodě P bude přímka zadaná rovnicemi
0 = -
1
2 x2 + y2
2x
x=1,y=0
 (x - 1) -
1
2 x2 + y2
2y
x=1,y=0
 y + 1  (z - 1)
= -x + z
0 = -2(x - 1) + y + (z - 1) = -2x + y + z + 1
zatímco rovina kolmá k naší křivce bodem P bude parametricky dána výrazem
(1, 0, 1) + (-1, 0, 1) + (-2, 1, 1)
s parametry  a .
1. FUNKCE A ZOBRAZENÍ NA Rn
255
8.15
8.21. Vázané extrémy. Nyní se dostáváme k první opravdu vážné aplikaci diferenciálního
počtu více proměnných. Typickou úlohou optimalizace nebo řízení je
najít extrémy hodnot závisejících na několika (ale konečně mnoha) parametrech,
ovšem za nějakých dalších podmínek na vzájemné vztahy parametrů.
Velice často má řešená úloha m+n parametrů, které jsou vázány n podmínkami.
V našem jazyce diferenciálního počtu tedy hledáme extrémy spojitě diferencovatelné
funkce h na množině bodů M zadaných implicitně rovnicí F(x1, . . . , xm+n) =
0. K tomu můžeme použít tytéž postupy jako dříve.
Pokud je M ve všech svých bodech grafem hladkého zobrazení v m proměnných,
musí být každý extrém P  M stacionárním bodem, tj. pro každou křivku c(t) 
M procházející přes P = c(0) musí být h(c(t)) extrémem pro tuto funkci jedné
proměnné. Proto také musí být derivace
d
dt
h(c(t))|t=0 = dc (0)h(P) = dh(P)(c (0)) = 0.
To ale znamená, že diferenciál funkce h se v bodě P nuluje na všech tečných přírůstcích
k M v bodě P. Tato vlastnost je ekvivalentní tvrzení, že gradient h leží v
normálovém podprostoru (přesněji v jeho zaměření). Takové body P  M budeme
nazývat stacionární body funkce H vzhledem k vazbám F.
Jak jsme viděli v minulém odstavci, normálový prostor k naší množině M je
generován řádky Jacobiho matice zobrazení F a stacionární body jsou proto ekvivalentně
určeny následujícím tvrzením, kterému se říká metoda Lagrangeových mul-
tiplikátorů:
Věta. Nechť F = (f1, . . . , fn) : Rm+n
 Rn
je spojitě diferencovatelná v okolí
bodu P, F(P) = 0 a M je zadána implicitně rovnicí F(x, y) = 0 a hodnost matice
D1
F v bodě P je n. Pak P je stacionárním bodem spojitě diferencovatelné funkce
h : Rm+n
 R právě, když existují reálné parametry 1, . . . , n takové, že
grad h = 1 grad f1 +    + n grad fn.
Všimněme si počtu neznámých a rovnic v tomto algoritmu: gradienty jsou vektory
o m+n souřadnicích, tedy požadavek z věty dává m+n rovnic. Jako proměnné
máme jednak souřadnice x1, . . . , xm+n hledaných stacionárních bodů P, ale navíc
také n parametrů i v hledané lineární kombinaci. Zbývá však požadavek, že hledaný
bod P patří implicitně zadané množině M, což představuje dalších n rovnic.
Celkem tedy máme n + m rovnic pro n + m proměnných a proto lze očekávat, že
řešením bude diskrétní množina bodů P (tj. každý z nich bude izolovaným bodem).
8.22. Příklady.
8.22.1. Zkusme nějaký explicitní příklad. Za množinu S zvolme opět jednotkovou
sféru v R3
a K bude kružnice K  S vzniklá průnikem této sféry s rovinou zadanou
rovnicí x + y + z = 0. Budeme hledat extrémní hodnoty funkce
h(x, y, z) = x3
+ y3
+ z3
na objektech zadaných implicitně pomocí buď jen funkce F nebo dvojice funkcí F a
G, které jsou definovány výrazy
F(x, y, z) = x2
+ y2
+ z2
- 1, G(x, y, z) = x + y + z.
256 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Řešení. Začněme hledáním stacionárních bodů pro funkci h na sféře S. Výpočtem
příslušných gradientů (např. grad h(x, y, z) = (3x2
, 3y2
, 3z2
)) dostaneme systém
rovnic
0 = 3x2
- 2x
0 = 3y2
- 2y
0 = 3z2
- 2z
0 = x2
+ y2
+ z2
- 1,
což je systém čtyř rovnic o čtyřech proměnných. Před řešením tohoto systému si
zkusme odhadnout, kolik lokálních vázaných extrémů bychom měli čekat. Určitě
bude h(P) v absolutní hodnotě rovno na jednotkové sféře nejvýše jedné a to nastane
ve všech průnicích souřadných os s S. Máme tedy pravděpodobně 6 lokálních
extrémů. Dále uvnitř každé osminy sféry vytčené souřadnými rovinami může, ale
nemusí, být další extrém. Jednotlivé kvadranty lze snadno oparametrizovat a průběh
funkce h coby funkce dvou parametrů ověřit standardním způsobem (nebo si
nechat vykreslit třeba v Maplu).
Řešením systému (ať už rukou nebo opět v Maplu) obdržíme ve skutečnosti
spoustu stacionárních bodů. Kromě šesti, o kterých už víme (dvě souřadnice nulové
a jedna 1) a u kterých je  = 3
2 , jsou to např. ještě body
P = (

3
3
,

3
3
,

3
3
),
ve kterých skutečně nastává lokální extrém.
Jestliže omezíme náš zájem na body kružnice K, musíme přidat další funkci
G jeden další volný parametr  coby koeficient u jejího gradientu. Dostaneme tak
větší systém rovnic
0 = 3x2
- 2x - 
0 = 3y2
- 2y - 
0 = 3z2
- 2z - 
0 = x2
+ y2
+ z2
- 1
0 = x + y + z.
Protože je i kružnice kompaktní množinou, nutně na ní musí mít h globální maximum
a globální minimum. Další rozbor ponecháme na čtenáři.
8.22.2. Určete, zda existují maxima a minima funkce f : (R+
)n
 R, f(x1, . . . , xn) =
n

x1    xn za podmínky x1 +    + xn = c, c  R+
, x1 > 0,. . . , xn > 0.
Řešení. Normálový vektor k nadrovině definované podmínkou je (1, . . . , 1). Extrém
může nastat v bodech, kdy je gradient zkoumané funkce násobkem normály. Pro
tyto body tedy dostáváme soustavu
1
n
n
x1    ^xi    xn
1
n
xn-1
i
= k, i = 1, . . . n.
Tato soustava má na zkoumané množině jediné řešení x1 =    = xn, k = 1,
což odpovídá maximu dané funkce. Pokud bychom totiž v omezení uvažovali xi
nezáporná, jednalo by se o kompaktní množinu, tedy daná funkce by na ní měla
1. FUNKCE A ZOBRAZENÍ NA Rn
257
jak maximum, tak minimum. Minimum (nula) by nastávalo, pokud by libovolná z
proměnných byla nulová, v nalezeném bodě tedy musí nastat maximum.
Poznamenejme, že předchozí příklad je důkazem známé AG nerovnosti. Pro n
reálných čísel x1, x2,. . . ,xn definujeme jejich aritmetický průměr jako číslo
A(x1, . . . , xn) =
x1 +    + xn
n
.
Geometrický průměr nezáporných reálných čísel x1, . . . , xn pak definujeme jako číslo
G(x1, . . . , xn) = n

x1    xn.
Zmíněná nerovnost pak praví, že pro nezáporná reálná čísla x1, . . . , xn platí
A(x1, . . . , xn)  G(x1, . . . , xn),
přičemž rovnost nastává právě pro x1 =    = xn.
8.22.3. Rozhodněte, zda funkce f : R3
 R, f(x, y, z) = x2
y nabývá extrémů na
ploše 2x2
+ 2y2
+ z2
= 1. Pokud ano, tak tyto extrémy nalezněte a určete o jaké
extrémy se jedná.
Řešení. Protože vyšetřujeme extrémy spojité funkce na kompaktní množině (elipsoidu)
­ je to uzavřená a omezená množina v Rn
­ musí na něm daná funkce nabývat
jak minima, tak maxima. Navíc, protože vazební podmínka je dána spojitě diferencovatelnou
funkcí a zkoumaná funce je diferencovatelná, extrémy musí nastat ve
stacionárních bodech vyšetřované funkce na dané množině. Pro stacionární body
sestavíme soustavu:
2xy = 4kx
x2
= 4ky
0 = 2kz
Jejím řešením jsou body ( 1
3
, 1
6
, 0) a ( 1
3
, - 1
6
, 0). Funkce nabývá pouze dvou
funkčních hodnot v těchto čtyřech stacionárních bodech. Z výše uvedeného vyplývá,
že první dva uvedené stacionární body jsou maxima dané funkce na uvedeném
elipsoidu a druhé dva potom minima.
8.22.4. Určete, zda existují maxima a minima funkce f : R3
 R, f(x, y, z) =
z - xy2
na sféře
x2
+ y2
+ z2
= 1.
Pokud extrémy existují, určete je.
Řešení. Řešíme soustavu
x = -ky2
y = -2kxy
z = k
Z druhé rovnice dostáváme, že buď y = 0, nebo x = - 1
2k . První možnost vede k
bodům (0, 0, 1), (0, 0, -1). Druhá pak nemůže být splněna (dosazením do rovnice
koule dostaneme rovnici
1
4k2
+
1
2k2
+ k2
= 1,
která nemá řešení. Ve dvou vypočtených bodech na dané sféře má funkce maximum,
resp. minimum.
258 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.22.5. Rozhodněte, zda existují extrémy funkce f : R3
 R, f(x, y, z) = xyz, na
elipsoidu určeném rovnicí
g(x, y, z) = kx2
+ ly2
+ z2
= 1, k, l  R+
Pokud extrémy existují, určete je.
Řešení. Nejprve sestavíme rovnice, které musí splňovat stacionární body dané
funkce na elipsoidu:
g
x
= 
f
x
: yz = 2kx
g
y
= 
f
y
: xz = 2ly
g
z
= 
f
z
: xy = 2z.
Snadno nahlédneme, že řešením dané rovnice musí být trojice nenulových čísel. Po
vydělení dvojic rovnic a dosazení do rovnice elipsy dostaneme osm řešení Dostaneme
osm stacionárních bodů x =  1
3k
, y =  1
3l
, z =  1
3
, v nichž ovšem
funkce f nabývá pouze dvou různých hodnot. Protože f je spojitá a daný elipsoid
je kompaktní, tak na něm f nabývá jak svého minima, tak maxima. Neboť navíc
jak f tak g jsou spojitě diferencovatelné, tak tyto extrémy musí nastat v stacionárních
bodech. Není tedy jiné možnosti, než že čtyři z daných stacionárních bodů
jsou lokálními maximy dané funkce s maximem 1
3

3kl
, zbývající čtyři pak minima
s hodnotou - 1
3

3kl
.
8.22.6. Rozhodněte, zda funkce f : R3
 R, f(x, y, z) = y2
z nabývá extrémů na
úsečce dané rovnicemi 2x + y + z = 1,
x - y + 2z = 0 a omezením x  -1, 2 . Pokud ano, tak tyto extrémy nalezněte
a určete o jaké extrémy se jedná. Všechna svoje rozhodnutí zdůvodněte.
Řešení. Hledáme extrémy spojité funkce na kompaktní množině, funkce tedy bude
nabývat na dané množině jak svého minima tak maxima a to buď v bodech, kde je
gradient zkoumané funkce lineární kombinací gradientů funkcí zadávající vazební
podmínky, nebo v krajních bodech úsečky. Najděme body splňující podmínku s
gradienty:
0 = 2k + l
2yz = k - l
y2
= k + 2l
2x + y + z = 1
x - y + 2z = 0,
která má řešení (x, y, z) = (2
3 , 0, -1
3 ) a (x, y, z) = (4
9 , 2
9 , -1
9 ) (proměnné k a l
můžeme samozřejmě dopočítat také, ale nezajímají nás). Krajní body dané úsečky
jsou (-1, 5
3 , 4
3 ) a (2, -4
3 , -5
3 ). Z těchto čtyř bodů nabývá funkce největší hodnoty
v prvním z krajních bodů (f(x, y, z) = 100
27 ), tam tedy nabývá maxima na dané
úsečce a nejmenší hodnoty v druhém z krajních bodů (f(x, y, z) = -80
27 ), tam tedy
nabývá svého minima na dané úsečce.
1. FUNKCE A ZOBRAZENÍ NA Rn
259
Jiné řešení. Z rovnic úsečky vyjádříme proměnné y a z pomocí proměnné x:
y = 2
3 - x, z = 1
3 - x a dosadíme do vyšetřované funkce: 27f(x, y, z) = 27f(x) =
-27x3
+ 45x2
- 24x + 4 a vyšetříme extrémy funkce jedné proměnné: f (x) =
-27x2
+ 30x - 8, f (x) = 0 pro x = 2
3 nebo x = 4
9 a porovnáme hodnoty funkce
v těchto bodech s hodnotami v krajních bodech úsečky a dospějeme ke stejnému
závěru jako výše.
8.22.7. Rozhodněte, zda existují extrémy funkce f : R3
 R, f(x, y, z) = x2
+y2
+
z2
, na přímce x + y - z = 1, x - y + z = 0. Pokud extrémy existují, určete je.
Řešení. Pro stacionární body sestavíme soustavu:
2x = l + k
2y = l - k
2z = k - l
Jejím jediným řešením je bod (1
2 , 1
4 , -1
4 ). Vzhledem k tomu, že funkce f roste nade
všechny meze na dané přímce jak pro t  , tak pro t  -, musí se jednat o
globální minimum funkce (lze spočítat i Hessián Lagrangeovy funkce). Maximum
daná funkce na zadaném objektu nemá.
Obdobně jako v předchozím příkladu jsme mohli úlohu převést na hledání extrémů
funkce jedné proměnné.
260 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
2. Integrování podruhé
Nyní se vrátíme k procesu integrování, který jsme částečně popsali v druhé
části šesté kapitoly. Nepůjdeme do detailů a budeme se soutředit na rozšíření tohoto
procesu pro veličiny závislé na více proměnných, případně závislé na parametrech.
8.16
8.23. Integrály závislé na parametrech. Jestliže integrujeme podle jedné proměnné
x funkci n + 1 proměnných f(x, y1, . . . , yn), potom výsledek bude funkcí
F(y1, . . . , yn) v zbývajících proměnných.
Často se v praktických úlohách setkáváme s úkolem vyšetřovat právě takovou
funkci F. Např. můžeme hledat objem, povrch nebo obsah tělesa závisejícího na parametrech
a určit třeba minimální a maximální hodnoty (i s dodatečnými vazbami).
Z první části této kapitoly víme, že pro takové účely máme nástroje opírající se o
parciální derivace funkcí. Ideální by proto jistě bylo, kdybychom mohli operace
derivování a integrování prohodit a následující věta to skutečně pro dosti širokou
třídu funkcí potvrzuje:
Věta. Pro spojitě diferencovatelnou funkci f(x, y1, . . . , yn) definovanou pro x z
konečného intervalu [a, b] a na nějakém okolí bodu c = (c1, . . . , cn)  Rn
uvažujme
integrál
F(y1, . . . , yn) =
b
a
f(x, y1, . . . , yn)dx.
Potom platí pro všechny indexy j = 1, . . . , n
F
yj
(c) =
b
a
f
yj
(x, c1, . . . , cn)dx
Důkaz. Pro ověření našeho vztahu je třeba vzpomenout definici Riemannova
integrálu. Ta vyčísluje pro libovolnou spojitou funkci jeho hodnotu pomocí aproximací
konečnými součty (ekvivalentně horními, dolními nebo Riemannovými součty
s libovolnými reprezentanty, viz odstavec 6.14 v šesté kapitole). Je zřejmé, že při
důkazu je třeba brát v úvahu pouze souřadnici yj parametrů (ostatní jsou prostě
konstantní pro všechny naše úvahy), proto si technicky formulace zjednodušíme,
když se rovnou omezíme na případ n = 1 a tedy y = (y1).
Zvolme proto nějaké dělení  intervalu [a, b] a jeho reprezentanty i a zkoumejme
jednotlivé sčítance Riemannova součtu S, pro integrál derivované funkce
f. S využitím věty o střední hodnotě dostáváme pro každý malý přírůstek h parametru
c = (c1):
f(i, c + h) - f(i, c) = h
f
y
(i, y)
s hodnotou y  [c, c + h]. Díky předpokládané spojitosti parciálních derivací a při
známé normě dělení  lze proto odhadnout odchylku sčítance
f
y
(i, c)(xi+1 - xi)
v Riemannově součtu od výrazu v příslušné aproximaci Riemannovými součty pro
derivaci integrálu
1
h
(F(c + h) - F(c))
i
1
h
(f(i, c + h) - f(i, c))(xi+1 - xi).
2. INTEGROVÁNÍ PODRUHÉ 261
V limitě pro h  0 se tedy blížíme právě požadovanému tvrzení. Potřebujeme již
pouze ověřit, že chybu v tomto odhadu budeme umět odhadnout pouze v závislosti
na h, stejnoměrně přes celý interval přes který integrujeme.
Při důkazu existence Riemannova integrálu pro spojité funkce jsme dokazovali, že funkce
spojitá na konečném intervalu je ve skutečnosti stejnoměrně spojitá, tj. rozdíly hodnot umíme
kontrolovat podél celého intervalu stejnoměrně ohraničením vzdálenosti nezávisle proměnné.
Jestliže se podíváme na tuto argumentaci pozorněji, zjistíme, že podstanou vlastností intervalu
byla pouze jeho kompaktnost. Proto platí, že i funkce více proměnných spojité na kompaktním
intervalu jsou zde spojité stejnoměrně.
Odtud vyplývá, že pro zvolenou malou mez  pro vzdálenost |y - c|   máme k dispozici
univerzální odhad |f
y
(i, y) - f
y
(i, c)|  () a ()  0 při   0. V našem přiblížení
Riemannovými součty můžeme proto přímo nahradit diferenci parciální derivací, aniž bychom
chybu zvětšili o více než (). Tím je důkaz ukončen.
Předchozí věta má četná využití. Např. ji můžeme ocenit při zkoumání integrálních
transformací, kterým jsme se věnovali v druhé části předchozí kapitoly sedmé.
Derivacemi známých výsledků tak dostaneme v řadě případů snadno transformace
derivací původně transformovaných funkcí.
Také naše předchozí výsledky o extrémech funkcí více proměnných nyní mají
přímé použití např. pro minimalizaci ploch nebo objemů objektů zadanými funkcemi
v závislosti na parametrech.
8.17
8.24. Integrace funkcí více proměnných. Tak jak jsme motivovali integrování
představou o výpočtu plochy pod grafem funkce jedné proměnné, můžeme prakticky
stejně postupovat u objemu části trojrozměrného prostoru pod grafem funkce
z = f(x, y) dvou proměnných. Místo výběru malých intervalů [xi, xi+1] dělících
celý interval, přes který integrujeme, a přiblížením příslušné části objemu ploškou
obdélníku s výškou danou hodnotou funkce f v reprezentantu tohoto intervalu ,
tj. výrazem
f()(xi+1 - xi),
budeme pracovat s děleními v obou proměnných a hodnotami reprezentujícími
výšku grafu nad jednotlivými obdélníčky v rovině.
Prvně se ale musíme vypořádat s oborem integrace, tj. oblastí v rovině proměnných,
nad kterou chceme naši funkci f integrovat. Příkladem může sloužit funkce
z = f(x, y) = 1 - x2 - y2, která pro (x, y) uvnitř jednotkového kruhu má za svůj
graf povrch jednotkové sféry. Integrováním této funkce na jednotkovém kruhu tedy
dostaneme objem poloviny jednotkové koule.
Nejjednodušším přístupem je uvažovat pouze obory integrace S, které jsou dány
jako součiny intervalů, tj. jsou zadány rozsahem x  [a, b] a y  [c, d]. Hovoříme v
této souvislosti o vícerozměrném intervalu. Pokud je S jiná ohraničená množina v
R2
, pracujeme místo ní s dostatečně velikou oblastní [a, b]×[c, d], ale upravíme naši
funkci tak, že f(x, y) = 0 pro všechny body mimo S. Pro naši kouli bychom tedy
integrovali na množině S = [-1, 1] × [-1, 1] funkci
f(x, y) =
1 - x2 - y2 pro x2
+ y2
 1
0 jinak.
Definice Riemannova integrálu pak zcela věrně sleduje náš postup z odstavce
6.13. Můžeme tak přitom činit pro libovolný konečný počet proměnných. Integrál
existuje, jestliže pro každou volbu posloupnosti dělení  (nyní ve všech proměnných
262 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
zároveň) a reprezentantů jednotlivých krychliček
i  [xi, xi+1] × . . . × [zj, zj+1]  Rn
,
s maximální velikostí mezi všemi použitými intervaly jdoucí k nule, budou integrální
součty (všimněme si, že potřebujeme tolik indexů pro označování subintervalů, kolik
máme souřadnic)
S, =
i,...,j
f(i,...,j)(xi+1 - xi) . . . (zj+1 - zj).
konvergovat k jedné hodnotě, kterou zapisujeme
S
f(x, . . . , z) dx . . . dz
Pro všechny spojité funkce f opět lze dokázat existenci Riemannova integrálu a
tento výsledek lze snadno rozšířit pro ,,dostatečně spojité funkce na ,,dostatečně
rozumných oborech integrace.
Omezenou množinu S  Rn
označujeme za Riemannovsky měřitelnou, jestliže
je její charakteristická funkce, definovaná (x1, . . . , xn) = 1 pro (x1, . . . , xn)  S a
(x1, . . . , xn) = 0 pro všechny ostatní body v Rn
, Riemannovsky integrovatelná.
Tato definice Riemannova integrálu nedává přímo rozumný návod, jak hodnoty
integrálů skutečně vypočíst. Sama ale okamžitě vede k základním vlastnostem
Riemannova integrálu (srovnejte s Větou 6.13):
Věta. Množina Riemannovsky integrovatelných funkcí na vícerozměrném intervalu
S  Rn
je vektorovým prostorem a Riemannův integrál je na něm lineární formou.
Pokud je obor integrace S zadán jako disjunktní sjednocení konečně mnoha Riemannovsky
měřitelných oborů Si, je integrál funkce f přes S dán součtem integrálů
přes obory Si.
Důkaz. Všechny vlastnosti plynou přímo z definice Riemannova integrálu. Doporučujeme
promyslet samostatně podrobnosti.
První část věty lze zapsat obvyklou formulí říkající, že integrace lineární kombinace
(nad skaláry v R) integrovatelných funkcí fi : Rn
 R, i = 1, . . . , k, je vždy
možná a spočte se takto:
S
(a1f1(x1, . . . , xn) +    + akfk(x1, . . . , xn)) dx1 . . . dxn
= a1
S
f1(x1, . . . , xn) dx1 . . . dxn +    + ak
S
fk(x1, . . . , xn) dx1 . . . dxn.
Druhá část pak říká že pro disjukntní Riemannovsky měřitelné množiny S1 a S2 a
na obou těchto množinách integrovatelnou funkci f : Rn
 R platí
S1S2
f(x1, . . . , xn) dx1 . . . dxn
=
S1
f(x1, . . . , xn) dx1 . . . dxn +
S2
f(x1, . . . , xn) dx1 . . . dxn.
2. INTEGROVÁNÍ PODRUHÉ 263
8.18
8.25. Násobné integrály. Riemannovsky integrovatelné množiny zejména zahrnují
případy, kdy lze S definovat pomocí spojité funkční závislosti souřadnic hraničních
bodů tak, že pro danou první souřadnici x umíme zadat dvěmi funkcemi rozsah
další souřadnice y  [(x), (x)], poté rozsah další souřadnice z  [(x, y), (x, y)]
apod. pro všechny další souřadnice.
V případě naší koule to skutečně umíme: pro x  [-1, 1] definujeme pro y rozsah
y  [-

1 - x2,

1 - x2]. Objem koule pak můžeme buď spočítat integrováním výše
uvedené funkce f nebo můžeme integrovat charakteristickou funkci koule, tj. funkci
identicky rovnou jedné na oblasti S  R3
, která je definována ještě dalším určením
z  [- 1 - x2 - y2, 1 - x2 - y2].
Podstatná je přitom následující věta, která převádí výpočet Riemannova integrálu
na postupný výpočet několika integrálů v jedné proměnné (a ostatní proměnné
jsou přitom považovány za parametry, které se mohou objevovat i mezích
pro integraci)
Věta. Nechť S je ohraničená množina zadaná jako výše a f je spojitá funkce na
S. Pak je Riemannův integrál funkce f přes množinu S vyčíslen formulí
S
f(x1, x2, . . . , xn)dx . . . dz
=
b
a
(x1)
(x1)
. . .
(x,y,... )
(x,y,... )
f(x1, x2, . . . , xn) dxn . . . dx2 dx1
Důkaz. Výsledek vyplývá docela snadno přímo z definice Riemannova integrálu pomocí
konečných součtů. Stačí si pečlivě hlídat vhodné poskládání jednotlivých sčítanců konečných
součtů tak, aby vycházely postupně přiblížení integrálů ve vnitřních závorkách. Díky stejnoměrné
spojitosti
Důsledek. Pro vícerozměrný interval S = [a1, b1]×[a2, b2]×. . .×[an, bn] a spojitou
funkci f(x1, . . . , xn) na S je násobný integrál
S
f(x1, . . . , xn) dx1 . . . dxn =
b1
a1
b2
a2
. . .
bn
an
f(x1, . . . , xn) dx1 . . . dxn
nezávislý na pořadí ve kterém postupně integraci provádíme.
Důkaz. V předchozí větě je v případě vícerozměrného intervalu S kterékoliv
pořadí integrace vyjádřením oblasti S v požadovaném tvaru. Na výsledku integrálu
tak pořadí integrace nemůže mít vliv.
Tento důsledek jsme už jednou dříve využili při studiu vztahu Fourierových
transformací a konvolucí, viz odstavec 7.9.
8.26. Změna souřadnic při integraci. Při výpočtu integrálů funkcí jedné proměnné
jsme používali transformace souřadnic jako mimořádně silný nástroj. Zkusme
proto závěrem naší diskuse o integrování naznačit, jak lze transformace souřadnic
používat pro integrály funkcí více proměnných.
Připomeňme nejdříve (s vhodnou interpretací pro následné zobecnění), jak je to
s transformacemi pro jednu proměnnou. Integrovaný výraz f(x) dx vyjadřuje plochu
obdélníčku určeného (linearizovaným) přírůstkem proměnné x a hodnotou f(x).
264 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Pokud proměnnou transformujeme vztahem x = u(t), vyjadřuje se i linearizovaný
přírůstek jako
dx =
du
dt
dt
a proto i příslušný příspěvek pro integrál je vyjádřen jako
f(u(t))
du
dt
dt,
přičemž buď předpokládáme, že znaménko derivace u (t) je kladné, nebo dojde k
obrácení mezí integrálu, takže ve výsledku se znaménko neprojeví.
Intuitivně je postup v n proměnných docela podobný, pouze musíme použít
znalostí z lineární algebry o objemu rovnoběžnostěnů.
V Riemannových součtech proužíváme pro Riemannovy integrály přiblížení,
které bere objem (plochu) malého vícerozměrného intervalu a násobí tuto hodnotou
funkce v reprezentujícím bodě. Pokud použijeme transformaci souřadnic, dostaneme
nejen hodnotu funkce v reprezentujícím bodě v novém souřadném vyjádření,
ale musíme také vést v patrnosti změnu plochy nebo objemu příslušného malého vícerozměrného
intervalu. Opět tu půjde o lineární přiblížení změny a tu máme dobře
zvládnutou -- jde přeci o působení lineárního přiblížení použité transformace, tj.
akci Jacobiho matice, viz 8.14. Změna objemu je přitom dána (v absolutní hodnotě)
pomocí determinantu z této matice (viz naše úvahy na toto téma v lineární algebře,
zejména 4.25).
Věta. Nechť G(t1, . . . , tn) : Rn
 Rn
, (x1, . . . , xn) = G(t1, . . . , tn), je spojitě
diferencovatelné zobrazení, S = G(T) a T jsou Riemannovsky měřitelné množiny a
f : S  R spojitá funkce. Potom platí
S
f(x1, . . . , xn)dx1 . . . xn =
T
f(G(t1, . . . , tn))| det(D1
G(t1, . . . , tn))|dt1 . . . dtn.
Důkaz. Podrobný formální důkaz nebudeme prezentovat, je však přímočarou
realizací výše uvedené úvahy ve spojení s definicí Riemannova integrálu.
Abychom si přiblížili obsah tvrzení poslední věty, uvedeme jeho speciální případ
pro integrál funkce f(x, y) ve dvou proměnných a transformaci
G(s, t) = (g(s, t), h(s, t)).
Dostáváme
G(T )
f(x, y)dxdy =
T
f(g(s, t), h(s, t))
g
s
h
t
-
g
t
h
s
dsdt.
Úplně konkrétně, zkusme spočíst integrál z charakteristické funkce kružnice o
poloměru R (tj. její plochu) a integrál z funkce f(t, ) = cos(t) zadané v polárních
souřadnicích uvnitř kružnice o poloměru 1
2  (tj. objem schovaný pod takovou
,,čepičkou jarmulkou posazenou nad počátek , viz obrázek).
2. INTEGROVÁNÍ PODRUHÉ 265
-1,5
-1
-0,5
0
0,2
0,4
0
0,6
0,8
y 1
-1,50,5
-1
-0,51
0
0,5
11,5
x1,5
Nejprve spočítáme Jacobiho matici transformace x = r cos , y = r sin 
D1
G =
cos  -r sin 
sin  r cos 
.
Proto je determinant z této matice roven
det D1
G(r, ) = r(sin2
 + cos2
) = r.
Můžeme tedy přímo počítat pro kružnici S, která je obrazem obdélníku (r, ) 
[0, R] × [0, 2] = T. Dostaneme tedy plochu kružnice:
S
dxdy =
2
0
R
0
rdr d =
R
0
2rdr = R2
.
Integrace funkce f proběhne s využitím násobného integrování a integrace per partés
obdobně:
S
dxdy =
2
0
/2
0
r cos rdr d = 2
- 2.
8.27. Určování integračních mezí v R3
. Pokud integrujeme přes tělesa, která
leží v R3
, může nám při určování integračních mezí pomoci prostorová představivost.
Uvádíme obrázky některých ploch v R3
a jejich rovnice v různých souřadných
soustavách:
Koule se středem v bodě (x0, y0, z0) a poloměrem r0: (x - x0)2
+ (y - y0)2
+
(z - z0)2
= r2
.
266 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
-1.0
-0.5
0.0
0.5
-1.0 -0.5
1.0
0.0 0.5
-1.0
1.0
-0.5
0.0
0.5
1.0
Elipsoid se středem v bodě (x0, y0, z0): a(x-x0)2
+b(y -y0)2
+(y -y0)2
= r2
,
a, b  R+
.
-1
1
-1
x
0
0
y
0
z
-1
1
1
Paraboloid a(x - x0)2
+ b(y - y0)2
= z - z0, a, b  R+
, nebo a, b  R-
.
2. INTEGROVÁNÍ PODRUHÉ 267
-2
0
2
2
0
-2
0
2
4
Jednodílný hyperboloid s vrcholem v bodě (x0, y0, z0): a(x - x0)2
+b(y -
y0)2
+(z - z0)2
=1, a  R+
, b  R-
.
5.0
2.5
0.0
x-5.0
5.0 -2.5
2.5
0.0
-2.5
-2.5y
-5.0
-5.0
z 0.0
2.5
5.0
Dvoudílný hyperboloid s vrcholem v bodě (x0, y0, z0): a(x - x0)2
+b(y -
y0)2
+(z - z0)2
=-1, a  R+
, b  R-
.
268 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
5
-5.0
5
-2.5
z
0
0.0
y
x
0
2.5
5.0
-5
-5
Kužel s vrcholem v bodě (Sx, Sy, Sz): a(x - Sx)2
+ b(y - Sy)2
= (z - Sz)2
,
a, b  R+
.
Demonstrujme si určování mezí na následujícím příkladu:
8.28. Příklady.
8.28.1. Určete objem tělesa v R3
, které je dáno nerovnostmi x2
+ y2
+ z2
 1,
3x2
+ 3y2
 z2
, x  0.
Řešení.
2. INTEGROVÁNÍ PODRUHÉ 269
Nejprve si uvědomme, o jaké těleso se jedná. Jde o část zadané koule, která leží
vně daného kužele (viz obr.).
Objem spočítáme asi nejlépe jako rozdíl objemu poloviny koule a poloviny
kulové výseče dané zadaným kuželem (všimněme si, že objem tělesa se nezmění,
nahradíme-li podmínku x  0 podmínkou z  0 ­ výseč řežeme buď ,,vodorovně
nebo ,,svisle , ale vždy napůl) Budeme počítat ve sférických souřadnicích.
x = r cos() sin()
y = r sin() sin()
z = r cos(),
  0, 2),   0, ), r  (0, ).
Tato transformace R3
 R3
má Jakobián r2
sin().
Určeme nejprve objem koule. Integrační meze: je vhodné si vyjádřit podmínky,
kterými je těleso omezeno v souřadnicích, ve kterých budeme počítat. Ve sférických
souřadnicích je koule dána nerovnicí
x2
+ y2
+ z2
= r2
cos2
() sin2
() + r2
sin2
() sin2
() + r2
cos2
() = r2
 1.
Hledejme integrační meze nejprve například pro proměnnou . Označíme-li  projekci
na souřadnici  ve sférických souřadnicích ((, , r) = ), pak obraz projekce
 uvažovaného tělesa nám udává integrační meze proměnné . Víme, že
(koule) = 0, 2) (to víme buď díky naší prostorové představivosti, nebo z rovnice
koule r2
 1, ve které proměnná  nevystupuje a nejsou na ni tedy kladena
žádná omezení, nabývá tudíž všech možných hodnot).
Máme-li již meze jedné z proměnných určeny, můžeme určit meze další z proměnných.
Tyto již mohou záviset na proměnných, jejichž meze jsme již určili (v
tomto případě tomu tak nebude). Volíme tedy libovolně 0  0, 2) a pro toto
0 (dále již pevně zvolené) určíme průnik tělesa (koule) s plochou  = 0 a jeho
projekci  na proměnnou . Opět jako při určování mezí pro  není proměnná 
nijak omezena (ani nerovnicí r2
 1, ani rovnicí  = 0] může tak nabývat všech
svých hodnot,   0, ).
270 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Konečně hledáme pro libovolně (dále ale pevně) zvolené  = 0 a  = 0
průmět r(U) objektu (úsečky) U dané omezeními r2
 1,  = 0,  = 0 na
proměnnou r. Jediným omezením na r je podmínka r2
 1, tedy r  (0, 1 .
Všimněme si, že integrační meze proměnných jsou na sobě nezávislé, můžeme
tedy integrovat v libovolném pořadí. Je tedy
Vkoule =
1
0
2
0

0
r2
sin() d d dr =
4
3
.
Vypočtěme objem kulové výseče dané podmínkami x2
+ y2
+ z2
 1 a 3x2
+
3y2
 z2
. Opět vyjádřeme podmínky ve sférických souřadnicích: r2
 1, 3 sin2
() 
cos2
(), neboli tan()  1
3
. Opět jako v případě koule vidíme, že v podmínkách
se vyskytují proměnné nezávisle, intergrační meze jednotlivých proměnných tedy
budou na sobě nezávislé. Z podmínky r2
 1 máme r  (0, 1 , z podmínky tan() 
1
3
vyplývá   0, 
6 . Na proměnnou  žádné podmínky neklademe, je tedy
  0, 2 .
Vvýseč =
2
0
1
0

6
0
r2
sin  d dr d =
2 -

3
3
,
celkem
V = Vkoule - Vvýseč =
2
3
 -
2 -

3
3
 =


3
.
Mohli bychom též počítat objem přímo:
V =

0
1
0
5
6

6
r2
sin  d dr d =


3
.
Ve válcových souřadnicích
x = r cos()
y = r sin()
z = z
s Jakobiánem této transformace r, vypadá výpočet objemu jako rozdílu objemu
koule a kulové výseče následovně:
V =
2
3
 -
2
0
1
2
0
1
0
r dz dr d =


3
.
Všimněme si, že ve válcových souřadnicích nemůžeme spočítat objem tělesa přímo,
musíme ho rozdělit na dvě tělesa daná navíc omezením r  1
2 , resp. r  1
2 .
V = V1 + V2 =
2
0
1
2
0

3r
0
r dz dr d +
2
0
1
1
2

1-r2
0
r dz dr d
=


3
Další alternativou by byl výpočet objemu jako objemu rotačního tělesa, opět
bychom těleso rozdělili na stejné dvě části jako v předchozím případě a to na část
,,pod kuželem a část ,,pod sférou . Tyto části však nejsou přímo rotačními tělesy,
které dostaneme rotací podle některé z os. Objem první z nich spočítáme jako rozdíl
objemu válce x2
+ y2
 1
4 , 0  z 

3
2 a části kužele 3x2
+ 3y2
 z2
, 0  z 

3
2 ,
2. INTEGROVÁNÍ PODRUHÉ 271
objem druhé pak jako rozdíl objemu rotačního tělesa vziklého rotací části oblouku
y = (1 - x2
), 1
2  x  1 kolem osy z a válce x2
+ y2
 1
4 , 0  z 

3
2 .
V = V1 + V2 =


3
8
-


3
24
+ 

3
2
0
(1 - r2
) dr -


3
8
=


3
4
+

4

3
=


3
8.28.2. Vypočtěte objem kulové úseče, který odřezává rovina z = 1 z koule x2
+
y2
+ z2
= 2.
Řešení. Spočítáme integrál v kulových souřadnicích. Úseč si můžeme představit
jako kulovou výseč bez kužele (s vrcholem v bodě [0, 0, 0] a kruhovou podstavou
z = 1, x2
+ y2
= 1). Výseč je v těchto souřadnicích součinem intervalů (0,

2) ×
0, 2) × 0, /4 . Integrujeme tedy v daných mezích a to v libovolném pořadí.
2
0

2
0

4
0
r2
sin() d dr d =
4
3
(

2 - 1).
Musíme ještě odečíst objem kužele. Ten je roven 1
3 R2
V (kde R je poloměr podstavy
kužele a V jeho výška, v našem případě jsou obě hodnoty rovny jedné) tedy celkový
objem je
Vvýseč - Vkužel =
4
3
(

2 - 1) -
1
3
 =
1
3
(4

2 - 5).
Stejným způsobem bychom mohli obecně spočítat objem kulové úseče o výšce
v v kouli o poloměru R:
V = Vvýseč - Vkužel
=
2
0
arccos(R-v
R )
0
R
0
r2
sin() dr d d -
1
3
(2Rv - v2
)(R - v)
=
1
3
v2
(3R - v)
8.28.3. Určete objem části válce x2
+ z2
= 16, který leží uvnitř válce x2
+ y2
= 16.
Řešení.
Integrál vypočteme v kartézských souřadnicích. Vzhledem k symetrii tělesa
stačí integrovat přes první oktant (záměníme-li x za -x, či y za -y, či z za -z tak
se rovnice tělesa nezmění). Část tělesa ležící v prvním kvadrantu je dána prostorem
ležícím pod grafem funkce z =

16 - x2 a nad čtvrtkruhem x2
+ y2
 16, x  0,
y  0. rovinou z = 0, je
S = 8
4
0

16-x2
0
4

16 - x2
dy dx = 128.
8.28.4. Určete objem části prostoru ležící uvnitř válce x2
+ y2
= 4 a ohraničené
rovinami z = 0 a z = x + y + 2.
272 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Řešení. V příkladu budeme používat válcových souřadnic daných rovnicemi x =
r cos(), y = r sin(), z = z s Jakobiánem této transformace J = r. Těleso rozdělíme
na dvě části, ležící nad, respektive pod rovinou z = 0, jejich objemy označíme
V1, resp. V2. Dále si všimněme, že částí tělesa o objemu V1 je i jehlan s vrholy
[0, 0, 0], [0, 0, 2], [-2, 0, 0], [0, -2, 0]. Část tělesa ležící nad rovinou z = 0 tedy rozdělíme
ještě na dvě části, jejichž objem spočítáme zvlášť.
V1 - Vjehlan =

-/2
2
0
r2
(sin() + cos()) + 2r dr d = 6 +
16
3
,
Vjehlan =
4
3
Dále
V1 - V2 =
-

2
0
r2
(sin() + cos()) + 2r dr d = 8,
tedy V1 + V2 = 4 + 40
3 .
8.28.5. Určete těžiště části elipsy 3x2
+ 2y2
= 1 ležící v prvním kvadrantu roviny
R2
.
Řešení. Spočítejme nejprve obsah dané elipsy. Transformací souřadnic x = 1
3
x ,
y = 1
2
y s Jakobiánem 1
6
dostaneme
S =
1
3
0
q
1-3x2
2
0
dy dx =
1

6
1
0

1-x2
0
dy dx =

4

6
.
Další potřebné integrály můžeme spočítat přímo v kartézkých souřadnicích x a
y:
Tx =
1
3
0
q
1-3x2
2
0
x dy dx =
1
3
0
x
1 - 3x2
2
dx =
=
1
2
1
3
0
1 - 3t
2
dt =

2
18
.
Ty =
1
3
0
q
1-3x2
2
0
y dy dx =
1
2
1
3
0
1 - 3x2
2
dx =
=
1
4
1
3
0
(1 - 3x2
) dx =

3
18
.
Souřadnice těžiště jsou potom [4

3
9 , 2

2
 ].
8.28.6. Určete objem a souřadnice těžiště kužele o kruhové podstavě s poloměrem
r a výšce h.
Řešení. Otočíme-li kužel vrcholem dolů a ten umístíme do počátku souřadnic, pak
ve válcových souřadnicích:
2. INTEGROVÁNÍ PODRUHÉ 273
V = 4
/2
0
r
0
h
h
r 
 dz d d =
1
3
hr2
.
Těžiště zjevně leží na ose z. Pro z-tovou souřadnici pak máme
z =
1
V kužel
zdV =
1
V
/2
0
r
0
h
h
r 
z dz d d =
3
4
h.
Těžiště tedy leží ve výšce 1
4 h nad středem podstavy kužele.
8.28.7. Určete objem tělesa v R3
, které je dáno průnikem koule x2
+ y2
+ z2
= 4 s
válcem x2
+ y2
= 1.
Opět vzhledem k symetrii tělesa spočítáme pouze objem části tělesa ležící v prvním
oktantu. Integrujeme ve válcových souřadnicích daných rovnicemi x = r cos(),
y = r sin(), z = z, s Jacobiánem dané trasformace J = r, a to část prostoru mezi
rovinou z = 0 a grafem funkce z = 4 - x2 - y2 =

4 - r2. Můžeme tedy rovnou
psát dvojný integrál
Řešení.
V = 8
/2
0
1
0
r 4 - r2 dr d =
2
3
(8 - 3

3).
8.28.8. Určete objem tělesa v R3
, které je dáno průnikem koule x2
+ y2
+ z2
= 2 s
paraboloidem z = x2
+ y2
. Použijeme opět válcových souřadnic.
Řešení.
V =
2
0
1
0

(2-r2
)
r2
r dz dr d =
4

2
3
-
7
6
.
8.28.9. Určete objem tělesa v R3
, které je ohraničeno eliptickým válcem 4x2
+y2
=
1, rovinami z = 2y a z = 0, ležící nad rovinou z = 0.
Řešení. Vzhledem k symetrii úlohy bude výhodné zavést souřadnice x = 1
2 r cos(),
y = r cos(), z = z, s Jakobiánem příslušné transformace J = 1
2 r. Eliptický válec
má v těchto souřadnicích rovnici r2
= 1.
V =

0
1
0
r sin()
1
2
r dr d
=

0
1
0
r2
sin() dr d =

0
1
3
sin() d =
2
3
.
8.28.10. Určete objem tělesa v R3
, které je ohraničeno paraboloidem 2x2
+ y2
= z
a rovinou z = 2.
Řešení. Obdobně jako v předchozí úloze volíme ,,speciální souřadnice respektující
symetrii úlohy: x = 1
2
r cos(), y = r sin(), z = z s Jacobiánem J = 1
2
r. Rovnice
274 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
paraboloidu je v těchto souřadnicích z = r2
a pro objem tělesa můžeme psát
V = 4
/2
0

2
0
2
r2
1

2
r dz dr d =
= 2

2
/2
0

2
0
2r - r3
dr d = 2

2
/2
0
d =
=

2.
8.28.11. Vypočtěte objem elipsoidu x2
+ 2y2
+ 3z2
= 1.
Řešení. Uvážíme souřadnice
x = r cos() sin()
y = 1
2
r sin() sin()
z = 1
3
r cos()
Odpovídající determinant z Jakobiánu je pak 1
6
r2
sin(), objem je tedy
2
0

0
1
0
1

6
r2
sin() dr d d =
4
3

6
r3
.
8.28.12. Vypočtěte objem tělesa omezeného paraboloidem 2x2
+ 5y2
= z a rovinou
z = 1.
Řešení. Volíme souřadnice
x = 1
2
r cos()
y = 1
5
r sin()
z = z
Determinant Jakobiánu je r
10
, objem je tedy
2
0
1
0
1
r2
r

10
dz dr d =

2

10
.
8.28.13. 2. Určete objem tělesa ležícího v prvním oktantu a ohraničeném plochami
y2
+ z2
= 9 a y2
= 3x.
Řešení. Ve válcových souřadnicích
/2
0
3
0
r2
3 cos2
()
0
r dx dr d =
27
16
.
8.28.14. Určete objem tělesa v R3
, které je ohraničeno částí kužele 2x2
+ y2
=
(z - 2)2
, z  2 a paraboloidem 2x2
+ y2
= 8 - z (malý návrh: určete nejprve průnik
zadaných ploch)
3. DIFERENCIÁLNÍ OPERÁTORY 275
Řešení. Zjistíme nejprve průnik zadaných ploch:
(z - 2)2
= -z + 8, z  2,
tedy z = 4 a dostáváme rovnici průniku daných ploch 2x2
+ y = 4. Substitucí
x = 1
2
r cos(), y = r sin(), z = z převedeme dané plochy na tvar r2
= (z - 2)2
,
z  2 a r2
= 8-z, tedy z = r +2 pro první plochu a z = 8-r2
pro druhou plochu.
Celkem je průmět daného tělesa do souřadnice  roven intervalu 0, 2 , pro dané
0  0, 2 je potom průmět průniku tělesa s rovinou  = 0 do souřadnice r
roven (pro lib 0) intervalu 0, 2 . Pro dané r0 a 0 je pak průmět průniku tělesa
s přímkou r = r0,  = 0 na souřadnici z roven intervalu r0 + 2, 8 - r2
0 . Jakobián
uvažované transformace je J = 1
2
r, celkem tedy můžeme psát
V =
2
0
2
0
8-r2
r+2
r

2
dz dr d =
16

2
3
.
8.28.15. Určete objem tělesa ležícího uvnitř válce y2
+ z2
= 4, dále v polorovině
x  0 a konečně ohraničeného plochou y2
+ z2
+ 2x = 16.
Řešení. Ve válcových souřadnicích
2
0
2
0
8- r2
2
0
r dx dr d = 28.
3. Diferenciální operátory
7.11
8.29. Lineární a nelineární modely. Pojem derivace jsme zavedli, abychom
mohli pracovat s okamžitými změnami studovaných veličin. Ze stejných důvodů
jsme kdysi v úvodní kapitole zaváděli diference a právě vztahy mezi hodnotami
veličin a změnami těch samých nebo jiných veličin vedly k rovnicím. Nejjednodušším
modelem bylo úročení vkladů nebo půjček (a totéž pro tzv. Malthusiánský model
populace). Přírůstek byl úměrný hodnotě, viz 1.11. V rámci spojitého modelování
by stejný požadavek vedl na rovnici vztahující derivaci funkce y (x) s její hodnotou
e7.20 (8.6) y (x) = r  y(x)
s konstantou úměrnosti r. Je snadné uhodnout řešení této rovnosti
y(x) = C erx
s libovolnou konstantou C. Tuto konstantu určíme jednoznačně volbou tzv. počáteční
hodnoty y0 = y(x0) v nějakém bodě x0. Pokud by část růstu v našem modelu
byla dána konstatním působením nezávislém na hodnotě y nebo x (jako jsou např.
paušální poplatky za vedení účtu nebo přirozený úbytek populace třeba v důsledku
porážek na jatkách), mohli bychom použít rovnici s konstantou s na pravé straně
e7.21 (8.7) y (x) = r  y(x) + s.
Zjevně bude řešením této rovnice funkce
y(x) = C erx
-
s
r
.
276 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
K tomuto závěru je velice lehké dojít, pokud si uvědomíme, že množinou věech
řešení rovnice (8.6) je jednorozměrný vektorový prostor, zatímco řešení rovnice (8.7)
se obdrží přičtením kteréhokoliv jednoho jejího řešení ke všem řešením předchozí
rovnice. Lze pak snadno najít konstantní řešení y(x) = k pro k = -s
r .
Podobně se nám v odstavci 1.18 podařilo vytvořit tzv. logistický model populačního
růstu založený na předpokladu, že poměr změny velikosti populace p(n +
1) - p(n) a její velikosti p(n) je v afinní závislosti na samotné velikosti populace.
Nyní bychom tentýž vztah pro spojitý model patrně formulovali pro populaci p(t)
závislou na čase t jako
e7.22 (8.8) p (t) = p(t) -
r
K
p(t) + r ,
tj. při hodnotě p(t) = K pro velkou konstantu K je přírůstek nulový, zatímco pro
p(t) blízké nule je poměr rychlosti růstu populace k její velikosti blízký r, což je
malé číslo v řádu setin vyjadřující rychlost růstu populace za dobrých podmínek.
Není jistě snadné vyřešit bez znalostí teorie takovou rovnici (i když právě tento
typ rovnic zanedlouho zvládneme), nicméně jako cvičení lze jistě ověřit, že následující
funkce řešením pro každou konstantu C je
p(t) =
K
1 + CK e-rt
.
y
100
80
60
40
20
t
0
200150100500
100
80
60
40
20
x
200150100500
Srovnáním červeného grafu (levý obrázek) této funkce s volbou K = 100, r =
0, 05 a C = 1 (první dvě jsme takto použili v 1.18, poslední odpovídá přibližně
počáteční hodnotě p(0) = 1) s pravým obrázkem (řešení diferenční rovnice z 1.18)
vidíme, že skutečně oba přístupy k modelování populací dávají docela podobné
výsledky. Pro srovnání výstupu je také do levého obrázku zeleně vkreslen graf řešení
rovnice (8.6) s touž konstantou r a počáteční podmínkou.
7.12
8.30. Diferenciální rovnice prvního řádu. Obecně rozumíme (obyčejnou) diferenciální
rovnicí prvního řádu vztah mezi derivací funkce y (x) v proměnné x, její
hodnotou y(x) a samotnou proměnnou, který lze zapsat jako
F(y (x), y(x), x) = 0
nějakou pevnou funkci F, která každé trojici reálných čísel přiřadí jedno reálné číslo.
Zápis připomíná implicitně zadané funkce y(x), nicméně navíc je tu závislost na
3. DIFERENCIÁLNÍ OPERÁTORY 277
derivaci hledané funkce y(x). Pokud je alespoň rovnice explicitně vyřešena vzhledem
k derivaci, tj.
y (x) = f(x, y(x)),
můžeme si dobře graficky představit, co taková rovnice zadává. Pro každou hodnotu
(x, y) v rovině si totiž můžeme představit šipku udávající vektor (1, f(x, y)), tj.
rychlost se kterou nám rovnice grafu řešení přikazuje pohybovat se rovinou. Např.
pro rovnici (8.8) dostaneme takovýto obrázek (i s vyneseným řešením pro počáteční
hodnotu jako výše).
0
x
200150100500
y(x)
100
80
60
40
20
Intuitivně lze na základě takových obrázků očekávat, že pro každou počáteční
podmínku bude existovat právě jedno řešení naší rovnice. Takové tvrzení skutečně
platí pro všechny rozumné funkce f, my si výsledek sformulujeme pro dosti velkou
třídu rovnic takto:
Věta (O existenci a jednoznačnosti řešení ODE). Nechť funkce f(x, y) : R2
 R
má spojité parciální derivace. Pak pro každý bod (x0, y0)  R2
existuje interval
[x0 - a, x0 + a], s a  R kladným, a právě jedna funkce y(x) : R  R, která je
řešením rovnice
y (x) = f(x, y(x)).
Důkaz. Všimněme si, že funkce y(x) je řešením naší rovnice tehdy a jen tehdy, když
y(x) = y0 +
Z x
x0
y (x) dx = y0 +
Z x
x0
f(x, y(x)) dx.
Pravá strana tohoto výrazu je ovšem, až na konstantu, integrální operátor
L(y)(x) = y0 +
Z x
x0
f(x, y(x)) dx
a při řešení diferenciální rovnice vlastně hledáme pevný bod pro tento operátor L, tj. chceme
najít funkci y = y(x) s L(y) = y.
Pro operátor L můžeme docela lehce odhadnout, jak se liší jeho hodnoty L(y) a L(z) pro
různé argumenty y(x) a z(x). Skutečně, díky spojitosti parciálních derivací funkce f (ve skutečnosti
využíváme pouze tzv. Lipschitzovy podmínky pro parciální derivaci podle y) dostáváme,
278 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
viz ??
|(L(y) - L(z))(x)| =
˛
˛
˛
˛
Z x
x0
f(x, y(x)) - f(x, z(x)) dx
˛
˛
˛
˛

Z x
x0
|f(x, y(x)) - f(x, z(x))| dx
 C
Z x
x0
|y(x) - z(x)| dx
 D|x - x0| dx
pro vhodné konstanty C a D. Pro a dostatečně malé proto bude platit
sup|x-x0|<a |L(y)(x) - L(z)(x)| < sup|x-x0|<a |y(x) - z(x)|.
Takovýmto operátorům se říká kontrakce.
Dokončit ­ poznámka o větě o kontrakci... ????????
8.22
8.31. Rovnice se separovanými proměnnými. Užitečným typem rovnic, pro
který máme elementární postup k řešení jsou tzv. rovnice se separovanými proměn-
nými:
7.23 (8.9) y (x) = f(x)  g(y(x))
pro dvě dostatečně hladké funkce jedné reálné proměnné f a g. Obecné řešení tu
lze získat integrací, tj. nalezením primitivních funkcí
G(y) =
dy
g(y)
, F(x) = f(x)dx.
Pak totiž spočtením funkce y(x) z implicitně zadaného vztahu F(x)+C = G(y) s libovolnou
konstantou C vede k řešení, protože derivováním této rovnosti (s použitím
pravidla pro derivování složené funkce G(y(x)) dostaneme skutečně 1
g(y)  y (x) =
f(x).
Jako příklad najděme řešení rovnice
y (x) = x  y(x).
Přímým výpočtem dostaneme ln |y(x)| = 1
2 x2
+ C. Odtud to vypadá (alespoň pro
kladná y) na
y(x) = e
1
2 x2
+C
= D  e
1
2 x2
,
kde D je nyní libovolná kladná konstanta. Zastavme se ale pozorněji u výsledné
formule a znamének. Konstantní řešení y(x) = 0 vyhovuje naší rovnici také a pro
záporná y můžeme použít stejné řešení s zápornými konstantami D. Ve skutečnosti
může být konstanta D jakákoliv a našli jsme řešení vyhovující jakékoliv počáteční
hodnotě.
3. DIFERENCIÁLNÍ OPERÁTORY 279
y(x)
x
3
3
2
1
2
0
-1
1
-2
-3
0-1-2-3
y(x)
x
3
3
2
1
2
0
-1
1
-2
-3
0-1-2-3
Na obrázku jsou vynešena dvě řešení, která ukazují na nestabilitu rovnice vůči
počátečním podmínkám: Jestliže pro libovolné x0 volíme y0 blízké nule, pak se
nám dramaticky mění chování výsledného řešení. Navíc si povšimněme konstatního
řešení y(x) = 0, které odpovídá počáteční podmínce y(x0) = 0.
Jestliže lehce pozměníme rovnici na
y (x) = 1 - x  y(x),
narazíme naopak na stabilní chování viditelné na následujícím obrázku. Tuto rovnici
už ale neumíme řešit pomocí separace proměnných.
y(x)
x
3
6
2,5
2
5
1,5
1
4
0,5
0
3210
y(x)
x
3
6
2,5
2
5
1,5
1
4
0,5
0
3210
Zato umíme stejným postupem vyřešit nelineární model z předchozího odstavce,
která popisovala logistický model populace. Zkuste si jako cvičení.
8.31.1. Vyřešte diferenciální rovnici pro funkci y = y(x)
dy
dx
=
1 + y2
1 + x2
.
Řešení. y = x+C
1-Cx . (použijte součtového vzorce pro tangens).
8.31.2. Čistička vody o objemu 2000 m3
byla znečištěna olovem, které se nachází
ve vodě v ní v množství 10 g/m3
. Do čističky přitéká čistá voda rychlostí 2 m3
/s
a stejnou rychlostí i vytéká. Za jak dlouho poklesne obsah olova ve vodě v čističce
280 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
pod 10 g/m3
(což je hygienická norma pro obsah olova v pitné vodě podle směrnice
Evropského společenství), předpokládáme-li, že voda je neustále rovnoměrně
promíchávána?
Řešení. Označme objem vody v nádrži jako V (m3
), rychlost vytékání vody jako v
(m3
/s). Za infinitezimální (nekonečně malou) časovou jednotku dt vyteče z nádrže
m
V  v dt gramů olova, pro změnu hmotnosti množství olova v čističce tedy můžeme
sestavit diferenciální rovnici
dm = -
m
V
 v dt.
Separací proměnných dostáváme rovnici
dm
m
= -
v
V
dt,
integrací obou stran rovnice a odlogaritmováním dostaneme řešení ve tvaru m(t) =
m0e- v
V t
, kde m0 je množství olova v nádrži v čase t = 0. Po dosazení číselných
hodnot zjistíme, že t
.
= 6 h 35 min.
8.31.3. Rychlost šíření zprávy v populaci o P lidech je přímo úměrná počtu lidí,
kteří zprávu ještě neslyšeli. Určete funkci f popisující počet lidí v čase, kteří již
zprávu slyšeli. Je vhodné tento model šíření zprávy používat pro malá nebo velká
P?
Řešení. Sestavíme diferenciální rovnici pro f. Rychlost šíření zprávy df
dt = f (t)
má být přímo úměrná počtu lidí, kteří o ní ještě neslyšeli, tedy hodnotě P - f(t).
Celkem
df
dt
= k(P - f(t)).
Separací proměnných a zavedením konstanty K (počet lidí, kteří znají zprávu v
čase t = 0 musí být P - K) dostáváme řešení
f(t) = P - Ke-kt
,
kde k je kladná reálná konstanta.
Tento model má zřejmě smysl jen pro velká P.
8.31.4. Rychlost, kterou se šíří epidemie v dané uzavřené populaci o P lidech je
přímo úměrná součinu počtu lidí, kteří jsou nakaženi, a počtu lidí, kteří jsou ještě
nenakaženi. Určete funkci f(t) popisující počet nakažených v čase.
Jako v přechozím příkladě sestavíme diferenciální rovnici
Řešení.
df
dt
= k  f(t) (P - f(t)) .
Opět separací proměnných a zavedením vhodných konstant K a L dostáváme
f(t) =
K
1 + Le-Kkt
.
8.31.5. Rychlost, kterou se rozpadá daný izotop daného prvku, je přímo úměrná
množství daného izotopu. Poločas rozpadu izotopu Plutonia, 239
94 Pu, je 24 100 let.
Za jak dlouho ubude setina z nukleární pumy, jejíž aktivní složkou je zmiňovaný
izotop?
3. DIFERENCIÁLNÍ OPERÁTORY 281
Řešení. Označíme-li množství Plutonia jako m, tak pro rychlost rozkladu můžeme
napsat diferenciální rovnici
dm
dt
= k  m,
kde k je nějaká neznámá konstanta. Řešením je tedy funkce m(t) = m0e-kt
. Dosazením
do rovnice pro poločas rozpadu (e-kt
= 1
2 ) získáme konstantu k
.
= 2, 88105
.
Hledaný čas je pak přibližně 349 let.
8.31.6. Změna rychlosti předmětu padajícího v konstantním gravitačním poli v prostředí
s jistým odporem je dána vztahem:
dv
dt
= g - kv,
kde k je konstanta udávající odpor prostředí. Byl vypuštěn předmět pohybující se počáteční
rychlostí 5ms-1
v gravitačním poli g = 10ms-2
, konstanta odporu prostředí
je k = 0.5s-1
. Jaká bude rychlost předmětu za 3 vteřiny?
Řešení.
v =
g
k
- (
g
k
- v0)e-kt
,
po dosazení v(3) = 20 - 15e- 3
2 ms-1
.
8.31.7. 1. Rychost nárůstu populace odmocninového brouka je nepřímo úměrná
její velikosti. V čase t = 0 čítala populace 100 brouků. Za měsíc se populace zdvojnásobila.
Jak bude populace velká za dva měsíce?
Řešení. Uvažujme spojitou aproximaci počtu brouků a označme jejich počet P.
Pak můžeme sestavit následující rovnici:
dP
dt
=
k
P
,
P =

Kt + c. Dopočtením ze zadaných hodnot P(2) =

7  100, což je odhad
skutečného množství brouků (což musí být přirozené číslo).
8.23
8.32. Systémy obyčejných diferenciálních rovnic prvního řádu. Na řešení
rovnice y (x) = f(x, y) lze také pohlížet jako na hledání (parametrizované) křivky
(x(t), y(t)) v rovině, kde jsme již předem pevně zvolili parametrizaci proměnné
x(t) = t. Pokud ale akceptujeme tento pohled, pak můžeme jednak zapomenout na
tuto pevnou volbu pro jednu proměnnou a hlavně přibrat libovolný počet proměn-
ných.
Například v rovině můžeme psát takový systém ve tvaru
x (t) = f(t, x(t), y(t)), y (t) = g(t, x(t), y(t))
se dvěmi funkcemi f, g : R3
 R se spojitými derivacemi. Obdobně pro více pro-
měnných.
Jednoduchým příkladem v rovině může sloužit systém rovnic
x (t) = -y(t), y (t) = x(t).
Snadno lze uhádnout (nebo aspoň ověřit), že řešením takového systému je např.
x(t) = R cos t, y(t) = R sin t
s libovolnou nezápornou konstantou R a křivky řešení budou právě parametrizované
kružnice o poloměru R.
Na takové systémy umíme přímo rozšířit platnost věty o jednoznačnosti a řešení:
282 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Věta (O existenci a jednoznačnosti řešení systémů ODE). Nechť funkce fi(t, x1, . . . , xn) :
Rn+1
 R, i = 1, . . . , n všechny mají spojité parciální derivace. Pak pro každý bod
(t0, z1, . . . , zn)  R2
existuje interval [t0 -a, t0 +a], s a  R kladným, a právě jedna
funkce y(t) : R  Rn
, která je řešením systému rovnic
x1(x) = f1(t, x1(t), . . . , xn(x)), . . . xn(x) = fn(t, x1(t), . . . , xn(x))
s počáteční podmínkou
x1(t0) = z1, . . . , xn(t0) = zn.
Důkaz. Důkaz je skoro identický s důkazem existence a jednoznačnosti pro jednu rovnici
s jednou neznámou funkcí, viz Věta 8.30. Neznámá funkce y = (x1(t), . . . , xn(t)) je křivkou
v Rn
vyhovující nejen zadané rovnici ale také jsou její komponenty opět vyjádřitelné pomocí
integrálů
xi(t) = xi(t0) +
Z t
t0
xi(t) dt = xi(0) +
Z t
t0
fi(t, y(t)) dt.
Opět tedy pracujeme s integrálním operátorem y  L(y), tentokrát definovaným na křivkách
v Rn
a hledáme jeho pevný bod. Protože je euklidovská vzdálenost dvou bodů v Rn
vždy shora
odhadnuta součtem velikostí rozdílů jednotlivých komponent, důkaz se dokončí stejně jako v
případě 8.30. Je pouze zapotřebí si povšimnout, že velikost vektoru
f(t, z1, . . . , zn) - f(t, y1, . . . , yn)
je odhadnuta shora součtem
f(t, z1, . . . , zn) - f(t, y1, z2 . . . , zn) +    + f(t, y1, . . . , yn-1, zn) - f(t, y1, . . . , yn) .
Jako o něco složitější příklad systému rovnic prvního řádu si uveďme klasický
populační model ,,dravec ­ kořist , který zavedli ve dvacátých létech minulého století
pánové Lotka a Volterra.
Označme x(t) vývoj počtu jedinců v populaci kořisti a y(t) totéž pro dravce.
Přepokládáme, že přírůstek kořisti by se řídil Malthusiánským modelem (tj. exponenciální
růst), kdyby nebyli loveni. U dravce naopak očekáváme, že by bez kořisti
pouze přirozeně vymíral (tj. exponenciální pokles stavů). Přitom ale ještě musíme
uvážit interakci dravce s kořistí, kterou očekáváme přímo úměrnou počtu obou.
Dostáváme tak tzv. Lotka­Volterra model
x (t) = x(t) - y(t)x(t)
y (t) = -y(t) + x(t)y(t)
kde koeficient  vyjadřuje efektivitu růstu populace dravců v důsledku lovu.
Tento model je krásným příkladem pro studium stability či nestability řešení v
důsledku volby počátečních hodnot, nebudeme zde však zacházet do podrobností.
O tomto a podobných modelech lze nalézt nepřeberné množství literatury.
8.24
8.33. Rovnice vyšších řádů. Obyčejnou diferenciální rovnicí řádu k (vyřešenou
vzhledek k nejvyšší derivaci) rozumíme rovnici
y(k)
(x) = f(x, y(x), y (x), . . . , y(k-1)
(x)),
kde f je známá funkce v k + 1 proměnných, x je nezávisle proměnná a y(x) je
neznámá funkce v jedné proměnné.
Ukážeme, že taková rovnice je vždy ekvivalentní systému k rovnic prvního řádu:
Zavedeme nové neznámé funkce v proměnné x takto: y0(x) = y(x), y1(x) = y0(x),
3. DIFERENCIÁLNÍ OPERÁTORY 283
. . . , yk-1(x) = yk-2. Nyní je funkce y(x) řešením naší původní rovnice tehdy a jen
tehdy, když je první komponentou řešení systému rovnic
y0(x) = y1(x)
y1(x) = y2(x)
...
yn-2(x) = yn-1(x)
yn-1(x) = f(x, y0(x), y1(x), . . . , yn-1(x)).
Přímým důsledkem Věty 8.32 je proto následující
Věta (O existenci a jednoznačnosti řešení ODE). Nechť funkce f(x, y0, . . . , yk-1) :
Rk+1
 R, má spojité parciální derivace. Pak pro každý bod (x0, z0, . . . , zk-1)  R2
existuje interval [x0 - a, x0 + a], s a  R kladným, a právě jedna funkce y(x) : R 
Rn
, která je rovnice
y(k)
(x) = f(x, y(x), y (x), . . . , y(k-1)
(x))
s počáteční podmínkou
y(x0) = z0, . . . , yk-1(x0) = zk-1.
Vidíme tedy, že pro jednoznačné zadání řešení obyčejné diferenciální rovnice ktého
řádu musíme zadat v jednom bodě hodnotu a prvních k - 1 derivací výsledné
funkce.
7.13
8.34. Lineární diferenciální rovnice. Již jsme přemýšleli o operaci derivování
jako o lineárním zobrazení z (dostatečně) hladkých funkcí do funkcí. Pokud derivace
( d
dx )j
jednotlivých řádů j vynásobíme pevnými funkcemi aj(x) a výrazy sečteme,
dostaneme tzv. lineární diferenciální operátor:
y(x)  D(y)(x) = ak(x)y(k)
(x) +    + a1(x)y (x) + a0y(x).
Řešit příslušnou homogenní lineární diferenciální rovnici pak znamená najít funkci
y splňující D(y) = 0, tj. obrazem je identicky nulová funkce.
Ze samotné definice je zřejmé, že součet dvou řešení bude opět řešením, protože
pro libovolné funkce y1 a y2 platí
D(y1 + y2)(x) = D(y1)(x) + D(y2)(x).
Obdobně je také konstantní násobek řešení opět řešením. Celá mmnožina všech
řešení lineární diferenciální rovnice k-tého řádu je tedy vektorovým prostorem. Přímou
aplikací předchozí věty o jednoznačnosti a existenci řešení rovnic dostáváme:
Důsledek. Vektorový prostor všech řešení homogenní lineární diferenciální rovnice
k­tého řádu je vždy dimenze k. Proto můžeme vždy řešení zadat jako lineární kombinaci
libovolné množiny k lineárně nezávislých řešení. Taková řešení jsou zadána
jednoznačně lineárně nezávislými počátečními podmínkami na hodnotu funkce y(x)
jejích prvních (k - 1) derivací.
284 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
8.35. Tlumený oscilátor. Zkusme si popsat jednoduchý model pro pohyb nějakého
tělesa upnutého k jednomu bodu silnou pružinou. Je-li y(t) výchylka našeho
tělesa od bodu y0 = y(0) = 0, pak lze uvažovat, že zrychlení y (t) v čase t bude
úměrné velikosti výchylky, avšak s opačným znaménkem. Dostáváme tedy tzv. rovnici
oscilátoru
y (t) = -y(t).
Tato rovnice odpovídá systému rovnic
x (t) = -y(t), y (t) = x(t)
z 8.32. Řešením takového systému je
x(t) = R cos(t - ), y(t) = R sin(t - )
s libovolnou nezápornou konstantou R, která určuje maximální amplitudu, a konstantou
, která určuje fázový posun.
Pro určení jednoznačného řešení potřebujeme proto znát nejen počáteční polohu
y0, nýbrž také rychlost pohybu v tomto okamžiku. Těmito dvěma údaji bude
určena jak amplituda tak fázový posun jednoznačně.
Představme si navíc, že vlivem vlastností materiálu pružiny bude ještě dodatečně
působit síla, která bude úměrná okamžité rychlosti pohybu našeho objektu,
opět se znaménkem opačným než je amplituda. To vyjádříme dodatečným členem
s první derivací a naše rovnice je
y (t) = -y(t) - y (t),
kde  je konstanta, která vyjadřuje velikost tlumení. Na následujícím obrázku jsou
vynešeny tzv. fázové diagramy pro řešení s dvěmi různými počátečními podmínkami
a to nalevo při nulovém tlumení, zatímco napravo je použit koeficient  = 0.3
0
5
-3-3
10-2
-2
t-1
-1
0 15
0
1x(t)
y(t)
1
2
203
2
3
Tlumeneoscilace
0
5
-3-3
10-2
-2
t-1
-1
0 15
0
1x(t)
y(t)
1
2
203
2
3
Tlumeneoscilace
Samotné oscilace jsou vyjádřeny hodnotami na ose y, hodnoty x zobrazují rychlost
pohybu.
8.27
8.36. Lineární diferenciální rovnice s konstantními koeficienty. To vše jistě
připomíná situaci s homogenními lineárními diferenčními rovnicemi, se kterými
jsme se potýkali v odstavci 3.6 třetí kapitoly. Analogie jde i dále v okamžiku, kdy
jsou všechny koeficienty aj diferenciálního operátoru D konstantní. Už jsme viděli u
takové rovnice prvního řádu (8.6), že řešením je exponenciála s vhodnou konstantou
u argumentu. Stejně jako u diferenčních rovnic se podbízí vyzkoušet, zda takový
3. DIFERENCIÁLNÍ OPERÁTORY 285
tvar řešení y(x) = ex
s neznámým parametrem  může splnit rovnici k­tého řádu.
Dosazením dostaneme
D(ex
) = akk
+ ak-1k-1
+    + a1 + a0(x) ex
.
Parametr  tedy vede na řešení lineární diferenciální rovnice s konstantními koeficienty
tehdy a jen tehdy, když je  kořenem tzv. charakteristického polynomu
akk
+    + a1 + a0. Pokud má tento polynom k různých kořenů, dostáváme bázi
celého vektorového prostoru řešení. Pokud je  násobný kořen, přímým výpočtem
s využitím toho, že je pak také kořenem derivace charakteristického polynomu, dostaneme,
že je řešením i funkce x ex
. Podobně pak pro vyšší násobnost dostáváme
různých řešení e
, x ex
, . . . , x ex
.
U obecné lineární diferenciální rovnice předepisujeme nenulovou hodnotu diferenciálního
operátoru D. Opět úplně analogicky k úvahám o systémech lineárních
rovnic nebo u lineárních diferenčních rovnic přímo vidíme, že obecné řešení takovéto
(nehomogenní) rovnice
D(y)(x) = b(x)
pro nějakou pevně zadanou funkci b(x) je součtem jednoho jakéhokoliv řešení této
rovnice a množiny všech možných řešení příslušné homogenní rovnice D(y)(x) = 0.
Celý prostor řešení je tedy opět pěkný konečněrozměrný afinní prostor, byť ukrytý
v obrovském prostoru funkcí.
8.37. Příklady.
8.37.1. 1. Určete obecné řešení rovnice
y + 3y + 2y = e-2x
.
Řešení. Nejprve vyřešíme zhomogenizovanou rovnici
y + 3y + 2y = 0.
Její charakteristický polynom je
x2
+ 3x + 2 = (x + 1)(x + 2),
s kořeny x1 = -1 a x2 = -2. Obecné řešení zhomogenizované rovnice je tedy
c1e-x
+ c2e-2x
,
kde c1, c2 jsou libovolné reálné konstanty.
Nyní metodou neurčitých koeficientů nalezneme (nějaké) partikulární řešení
původní nehomogenní rovnice. Podle tvaru nehomogenity a protoľe -2 je kořenem
charakteristického polynomu dané rovnice hledáme řešení ve tvaru y0 = axe-2x
,
kde a  R.
Dosazením do původní rovnice obdržíme
a[-4e-2x
+ 4xe-2x
+ 3(e-2x
- 2xe-2x
) + 2xe-2x
] = e-2x
,
odkud a = -1. Partikulárním řešením dané rovnice je tedy funkce -xe-2x
, obecným
řešením potom prostor funkcí c1e-x
+ c2e-2x
- xe-2x
, c1, c2  R.
8.37.2. Určete obecné řešení rovnice
y + y = 1.
286 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Řešení. Charakteristický polynom dané rovnice je x2
+ x s kořeny 0 a -1, obecné
řešení zhomogenizované rovnice je tedy c1 + c2e-x
, kde c1, c2  R.
Partikulární řešení hledáme ve tvaru ax, a  R. Po dosazení do původní rovnice
dostáváme a = 1. Obecné řešení dané nehomogenní rovnice je c1 + c2e-x
+ x,
c1, c2  R.
8.37.3. Určete obecné řešení rovnice
y + 5y + 6y = e-2x
.
Řešení. Charakteristický polynom rovnice je x2
+ 5x + 6 = (x + 2)(x + 3), jeho
kořeny jsou -2 a -3, obecné řešení zhomogenizované rovnice je tedy c1e-2x
+
c2e-3x
, c1, c2  R. Partikulární řešení hledáme metodou neurčitých koeficientů ve
tvaru axe-2x
, a  R (-2 je kořenem charakteristického polynomu). Dosazením
do původní rovnice získáme a = 1. Obecné řešení dané rovnice je tedy c1e-2x
+
c2e-3x
+ xe-2x
.
8.37.4. Určete obecné řešení rovnice
y - y = 5.
Řešení. Charakteristický polynom je x2
- x s kořeny 1, 0, obecné řešení zhomogenizované
rovnice je tedy c1 + c2ex
, kde c1, c2  R. Partikulární řešení hledáme
metodou neurčitých koeficientů ve tvaru ax, a  R, dostáváme a = -5. Obecné
řešení dané rovnice je tvaru c1 + c2ex
- 5x.
8.37.5. Určete jedinou funkci y vyhovující lineární diferenciální rovnici y(3)
+3y +
3y + y = 4 s počátečními podmínkami y(0) = 1, y (0) = 0, y (0) = 0.
Řešení. Charakteristický polynom zhomogenizované rovnice je x3
+ 3x2
+ 3x +
1 = (x + 1)3
s trojnásobným kořenem -1. Obecné řešení zhomogenizované rovnice
je tedy c1e-x
+ c2xe-x
+ c3x2
e-x
, c1, c2, c3  R. Partikulární řešení hledáme ve
tvaru konstanty a dosazením snadno zjistíme, že jím je konstanta 4. Nyní hledáme
takové obecné řešení dané nehomogenní rovnice, tedy funkci tvaru yp(x) = c1e-x
+
c2xe-x
+ c3x2
e-x
+ 4, c1, c2, c3  R, které splňuje počáteční podmínky:
yp(0) = 1  c1 + 4 = 1
yp(0) = 0  -c1 + c2 = 0
yp (0) = 0  c1 - 2c2 + 2c3 = 0
Tato lineární soustava má jediné řešení c1 = -3, c2 = -3, c3 = -3
2 . Jedinou
funkcí splňující danou diferenciální rovnici s uvedenými počátečními podmínkami
je funkce
y(x) = -3e-x
- 3xe-x
-
3
2
x2
e-x
+ 4.
8.37.6. Určete jedinou funkci y vyhovující lineární diferenciální rovnici
y(3)
- 3y - 2y = 2ex
,
s počátečními podmínkami y(0) = 0, y (0) = 0, y (0) = 0.
4. POZNÁMKY O NUMERICKÝCH METODÁCH 287
Řešení. Charakteristický polynom je x3
- 3x - 2 s kořeny 2 a dvojnásobným
kořenem -1, partikulární řešení hledáme ve tvaru aex
, a  R, snadno zjistíme že
je jím funkce -1
2 ex
, obecné řešení dané rovnice je tedy
c1e2x
+ c2e-x
+ c3xe-x
-
1
2
ex
.
Dosazením do počátečních podmínek získáme jedninou funkci vyhovující zadání
2
9
e2x
+
5
18
e-x
+
1
3
xe-x
-
1
2
ex
.
4. Poznámky o numerických metodách
Kromě tak jednoduchých rovnic, jako jsou ty lineární s konstantními koeficienty
se v praxi většinou setkáváme s postupy, jak přibližně spočíst řešení rovnice, se
kterou pracujeme.
Už jsme podobné úvahy dělali všude tam, kde jsme se zabývali aproximacemi
(tj. zejména lze doporučit porovnání s dřivějšími odstavci o splajnech, Taylorových
polynomech a Fourierových řadách). S trochou odvahy můžeme také považovat
diferenční a diferenciální rovnice za vzájemné aproximace. V jednom směru nahrazujeme
diference diferenciály (např. u ekonomických nebo populačních modelů), ve
druhém pak naopak.
Zastavíme se na chvilku u nahrazování derivací diferencemi. Nejdříve si však
zavedeme obvyklé značení pro zápis odhadů chyb.
8.28
8.38. Odhady ,,velké O . Pro funkci f(x) v proměnné x řekneme, že je v okolí
hromadného bodu x0 svého definičního oboru řádu velikosti O((x)) pro nějakou
funkci (x), jestliže existuje okolí U bodu x0 a konstanta C taková, že
|f(x)|  C  |(x)|
pro všechny x  U. Limitní bod x0 bývá často i nevlastní hodnota .
Nejobvyklejší příklady jsou O(xp
) pro polynomiální řád velikosti a to v nule
nebo v nekonečnu, O(ln x) pro logaritmický řád velikosti v nekonečnu atd. Všimněme
si, že logaritmický řád velikosti nezávisí na volbě základu.
Dobrým příkladem je aproximace funkce jejím Taylorovým polynomem řádu k
v bodě x0. Taylorova věta pro funkce jedné proměnné říká, že chyba této aproximace
je O(hk+1
), kde h je přírůstek argumentu x - x0 = h.
Podobné úvahy jsme dělali i u Fourierových řad.
8.29
8.39. Eulerova metoda. V případě obyčejných diferenciálních rovnic je nejjednodušším
schématem aproximace tzv. Eulerovými polygony. Budeme ji prezentovat
pro jednu obyčejnou rovnici s jednou nezávislou a jednou závislou veličinou. Úplně
stejně ale funguje pro systémy rovnic, když skalární veličiny a jejich derivace v čase
t nahradíme vektory závislé na času a jejich derivacemi.
Uvažujme tedy opět rovnici (pro jednoduchost a bez újmy na obecnosti prvního
řádu)
y (t) = f(t, y(t)).
Označme si diskrétní přírůstek času h, tj. tn = t0 + nh, a yn = y(tn). Z Taylorovy
věty (se zbytkem druhého řádu) a naší rovnice vyplývá, že
yn+1 = yn + y (tn)h + O(h2
) = yn + f(tn, yn)h + O(h2
).
288 8. SPOJITÉ MODELY S VÍCE PROMĚNNÝMI
Jestliže tedy od t0 do tn uděláme n takových kroků o přírůstek h, bude očekávaný
odhad celkové chyby vyplývající z lokálních nepřesností naší lineární aproximace
nejvýše hO(h2
), tj. chyba bude v řádu velikosti O(h). Ve skutečnosti vstupují při
výpočtu do hry ještě zaokrouhlovací chyby.
Při numerickém řešení Eulerovou metodou postupujeme tak, že za přibližné
řešení považujeme po částech lineární polygon definovaný výše.
8.40. Další metody. (metoda Taylorových řad, Runge­Kutta atd) ????????????????
KAPITOLA 9
Kombinatorické metody
že tak často myslíme raději v obrázcích?
­ ano, ale spočíst zvládneme jen diskrétní věci ...
V této kapitole se vrátíme k problémům, ve kterých jde o vzájemné vztahy nebo
vlastnosti konečných množin objektů. Tzv. kombinatorické úlohy jsme naznačili již
v druhé části první kapitoly a zavedly nás také k rekurencím v části následující.
Čtenář si jistě ulehčí další práci připomenutím odstavců 1.5­1.18.
1. Grafy a algoritmy
Začneme dvěma příklady docela typických kombinatorických postupů:
9.1
9.1. Dva příklady. Na večírku se někteří návštěvníci po dvojicích znají a jiné
dvojice se naopak neznají. Kolik lidí musíme pozvat, abychom zaručili, že se alespoň
tři hosté budou buď navzájem znát nebo neznát?
Situace, jako je tato si umíme dobře představit pomocí obrázku. Puntíky nám
představí jednotlivé hosty, plnou čarou spojíme ty dvojice, které se znají, čárkovanou
ty ostatní. Naše tvrzení pak zní: při jakém počtu puntíků vždy nejdeme
trojúhelník, jehož strany jsou buď všechny plné nebo všechny čárkované?
0000
00
1111
11
000000
111111
000000
111111000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000000000000000000
000000000000000000000000000000000000000000000
000000000000000
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111
111111111111111111111111111111111111111111111
111111111111111111111111111111
111111111111111111111111111111111111111111111
000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000
000000000000000000000000000000000000000000000000000000000000
000000000000000000000000000000
000000000000000000000000000000000000000000000
000000000000000
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111111111111111111111111111111111
111111111111111111111111111111
111111111111111111111111111111111111111111111
111111111111111111111111111111
111111111111111111111111111111111111111111111
0000
00
1111
11
00000
00000
00000
00000
00000
00000
0000000000
00000
0000000000
00000
00000
00000
00000
0000000000
00000
00000
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
1111111111
11111
11111
11111
11111
11111
0
0
1
1
0
0
0
1
1
1
0
0
1
1
0
0
1
1
0
0
0
1
1
10000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
0000000000
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
1111111111
111111111100000
00000
00000
00000
00000
00000
00000
00000
00000
11111
1111111111
1111111111
11111
11111
11111
11111
00000
00000
00000
00000
00000
00000
00000
00000
00000
11111
1111111111
1111111111
11111
11111
11111
11111
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
0000000000
0000000000
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
00000
0000000000
0000000000
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
0000000000
0000000000
1111111111
1111111111
00000000001111111111
00000
00000
00000
00000
00000
00000
0000000000
00000
0000000000
00000
00000
00000
00000
0000000000
00000
00000
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
11111
1111111111
11111
11111
11111
11111
11111
00000
00000
00000
00000
00000
00000
00000
00000
11111
11111
11111
11111
11111
11111
11111
11111
00000
00000
00000
00000
00000
00000
0000000000
00000
11111
11111
11111
11111
11111
11111
11111
11111
11111
0011
000
000
000
000
111
111
111
111
0000
00
1111
11
00
00
00
11
11
11
0000
00
1111
11
Na levém obrázku se čtyřmi puntíky takový trojúhelník není, uprostřed je.
Snadno ověříme, že jej najdeme vždy, když počet hostů bude alespoň pět:
Skutečně, máme-li večírek s n hosty, bude z každého puntíku vycházet n - 1
čar. Při n > 5 budou jistě buď aspoň tři plné nebo aspoň tři čárkované. Situace
je znázorněná na pravém obrázku. Ve zobrazeném kousku celé situace se sledovaný
host se třemi jinými zná, zbylé puntíky jsou spojeny čárkovaně ­ to by znamenalo,
že máme trojúhelník hostů, kteří se neznají. Pokud by se ale jedna dvojice z nich
znala, vznikl by naopak trojúhelník hostů, kteří se znají.
Nyní předpokládejme, že máme krabičku, která požírá jeden bit za druhým
(třeba podle toho, jestli dveřmi zrovna prošel muž nebo žena ­ jednička nechť
označuje třeba ženu), a má svítit buď modře nebo červeně podle toho, zda byl
289
290 9. KOMBINATORICKÉ METODY
poslední bit nula nebo jednička (a bodle barvy světla tedy můžeme tedy poznat,
zda je za dveřmi muž nebo žena). Opět si schéma můžeme pěkně znázornit:
0
S
BLUE
RED
0
1 1
1 0
Třetí uzel, ze kterého pouze vychází dvě šipky naznačuje start před prvním
zaslaným bitem.
9.2
9.2. Základní pojmy grafů. V obou příkladech máme společné schéma. Máme
nějakou konečnou množinu objektů, kterou si znázorňujeme jako uzly a jejich vlastností,
které znázorňujeme spojnicemi mezi nimi. Už dávno víme, že takové situace
umíme popisovat pomocí tzv. relací, viz. text začínající odstavcem 1.43 v šesté
části první kapitoly. Třeba čtenáře neodstraší ukázka, jak se jednoduchým věcem
dá složitě říkat: V našem prvním příkladu pracujeme na stejné množině hostů se
dvěmi komplementárními symetrickými a antireflexními relacemi, ve druhém pak
jde o příklad dvou antisymetrických relací na třech prvcích.
My teď ale můžeme na relace pozapomnět a budeme pracovat s terminologií
odpovídající našim obrázkům. Nenechte se zmást novým významem slova graf, pro
který jsme již měli význam u funkcí. Ve skutečnosti není věcná podobnost až tak
vzdálená.
Definice. Grafem G = (V, E) rozumíme množinu V jeho vrcholů spolu s podmnožinou
E množiny V
2 všech dvouprvkových podmnožin ve V . Prvkům E říkáme
hrany grafu. Vrcholům ve hraně e = {v, w}, v = w, říkáme hraniční vrcholy hrany
e. O hranách, které mají daný vrchol v za hraniční říkáme, že z vrcholu v vycházejí.
Orientovaným grafem G = (V, E) rozumíme množinu V jeho vrcholů spolu
s podmnožinou E  V × V . Prvnímu z vrcholů definujících hranu e = (v, w)
říkáme počáteční vrchol hrany, druhému pak koncový vrchol. Hrana e vychází ze
svého počátečního vrcholu a vchází do koncového. U orientovaných hran mohou
být koncový a počáteční vrchol totožný, hovoříme pak o smyčce.
Sousední hrany grafu jsou ty, které sdílí hraniční vrchol, u sousedních hran
orientovaného grafu musí být vrchol pro jednu koncový a pro druhou počáteční.
Naopak, sousední vrcholy jsou ty, které jsou hraničními pro tutéž hranu.
Grafy jsou mimořádně dobrým jazykem pro přemýšlení o postupech a odvozování
vztahů týkajících konečných množin objektů. Jsou totiž pěkným příkladem
kompromisu mezi přirozeným sklonem k ,,přemýšlením v obrázcích a přesným matematickým
vyjadřováním. Obecný jazyk teorie grafů nám v konkrétních úlohách
také umožňuje přidávat informace o vrcholech nebo hranách. Můžeme tak např.
,,obarvit vrcholy podle příslušnosti objektů k několika disjunktním skupinám nebo
můžeme označit hrany několika různými hodnotami apod. Existence hrany mezi vrcholy
různých barev může naznačit ,,konflikt . Např. když modré a červené uzly
1. GRAFY A ALGORITMY 291
představují pánskou a dámskou část večírku, pak hrana mezi vrcholy různých barev
může znamenat potenciální nevhodnost sdílení pokoje pro přenocování. Náš
první příklad v předchozím odstavci můžeme tedy chápat jako graf s obarvenými
hranami. Dokázané tvrzení v této řeči zní: V grafu Kn = (V, V
2 ) s n vrcholy a se
všemi možnými hranami obarvenými na dvě barvy je vždy alespoň jeden trojúhelník
z hran o stejné barvě, pokud je počet vrcholů alespoň šest.
Výše znázorněný orientovaný graf s označenými hranami (hodnotami nula nebo
jedna) představuje jednoduchý konečný automat. Tento název odráží představu, že
graf popisuje proces, který se vždy nachází ve stavu popsaným některým z uzlů a
další stav nastane procesem, odpovídajícím jedn z hran, které z vrcholu vychází.
Teorií konečných automatů se zde nebudeme podrobněji zabývat.
9.3
9.3. Příklady užitečných jednoduchých grafů. Nejjednodušším grafem je graf
bez hran, pro ten si ale ani nebudeme zavádět zvláštní označení.
Opačný extrém je naopak užitečný a grafu se všemi možnými hranami říkáme
úplný graf. Značíme symbolem Kn, kde n je počet vrcholů grafu. Graf K4 a K5
jsme již viděli, K3 je trojúhelník, K2 je úsečka.
Dalším důležitým grafem je cesta, tj. graf, kde existuje uspořádání vrcholů
(v0, . . . , vn) takové, že E = {e1, . . . , en}, kde ei = {vi-1, vi}, pro všechny i =
1, . . . , n. Hovoříme o cestě délky n a značíme ji Pn. Pokud cestu upravíme tak, že
poslední a první vrchol splývají, dostaneme kružnici délky n a značíme CN . Na
dalším obrázku vidíme K3 = C3, C5 a P5
0
000
00
000
00
0
1
111
11
11
111
1
0
0
1
1
0011
0
0
1
1
0011
0011 0011
0011
0011
0
0
1
1
0011 0011
0011 00110000
000000000000
00000000
00000000
000000000000
1111
11111111
111111111111
11111111
111111111111
0000
000000000000
00000000
00000000
000000000000
1111
11111111
111111111111
11111111
111111111111
0000000011111111
000000000000
00000000
00000000
111111111111
11111111
11111111
000000000000
00000000
00000000
111111111111
11111111
11111111
0000
0000
000000
00
11
111111
111111
11
00000111110000
0000
000000
00
11
111111
111111
11
0000
0000
000000
00
11
111111
111111
11 0000011111
00
00
000
0
1
111
111
1
00000
00000
11111
11111
0011
Dalším příkladem je tzv. úplný bipartitní graf, který vznikne tak, že vrcholy si
obarvíme dvěmi barvami a pak přidáme všechny hrany, které spojí vrcholy různých
barev. Značíme jej Km,n, kde m a n jsou počty vrcholů s jednotlivými barvami. Na
obrázku je vidět K1,3, K2,3 a K3,3.
00110011 0011 0011 0011 0011 0011 0011 0011 0011
0011 0011 0011 0011 0011000000000000000000000000
000000000
111111111111111111111
111111111111
000000000000000000000000
000000000
111111111111111111111
111111111111
0000000000000000
000000
11111111111111
11111111
0000000000000000
000000
11111111111111
11111111
00000000000000000000000000000000
000000000000
1111111111111111111111111111
1111111111111111
00000000
000
1111111
1111
0000000000000000
000000
11111111111111
11111111
0000000000000000000000000000000000000000
000000000000000
11111111111111111111111111111111111
11111111111111111111
000000000000000000000000
000000000
111111111111111111111
111111111111
000000000000000000000000
000000000
111111111111111111111
111111111111
000000000000000000000000
000000000
111111111111111111111
111111111111
000000000000000000000000
000000000
111111111111111111111
111111111111
0000000000000000000000000000000000000000
000000000000000
11111111111111111111111111111111111
11111111111111111111
0000000000000000000000000000000000000000
000000000000000
11111111111111111111111111111111111
11111111111111111111
0011
Dobrým příkladem grafu je také tzv. hyperkostka Hn v dimenzi n, která vznikne
tak, že vrcholy jsou všechna čísla 0, . . . , 2n
- 1. Hrany spojí právě ta čísla, která
se v zápisu v dvojkové soustavě liší v právě jednom bitu. Na obrázku níže je H4 a
popis vrcholů je naznačen.
Všimněme si, že přímo z definice vyplývá, že hyperkostku v dané dimenzi vždy
cky dostaneme tak, že vhodně spojíme hranami dvě hyperkostky o jednu dimenzi
menší. Na obrázku je to naznačeno tak, že příslušné hrany mezi dvěmi disjunktními
292 9. KOMBINATORICKÉ METODY
kopiemi H3 jsou čárkované. Samozřejmě ale můžeme tímto způsobem rozložit H4
mnoha různými způsoby.
1001
0011
0011
0
0
1
1
0
0
1
1
0011
0
0
1
1
0
0
1
1
000000001111111100000
0000000000
000000000000000
00000
000000000000000
00000
11111
1111111111
1111111111
1111111111
111111111111111
11111
00000
0000000000
000000000000000
00000
000000000000000
00000
11111
1111111111
1111111111
1111111111
111111111111111
11111
00000
000000000000000
0000000000
0000000000
0000000000
00000
11111
1111111111
111111111111111
11111
11111
1111111111
11111
0000000011111111
00000
000000000000000
0000000000
0000000000
0000000000
00000
11111
1111111111
111111111111111
11111
11111
1111111111
11111
0000000011111111
0000000011111111
0011 0011
0
0
1
1
0011 0011
0
0
1
1
0
0
1
1
0
0
1
1
000000001111111100000
0000000000
0000000000
0000000000
00000
00000
00000
00000
11111
1111111111
1111111111
1111111111
1111111111
11111
11111
00000
0000000000
0000000000
0000000000
00000
00000
00000
00000
11111
1111111111
1111111111
1111111111
1111111111
11111
11111
00000
00000
00000
0000000000
00000
0000000000
00000
00000
00000
11111
11111
11111
1111111111
11111
1111111111
11111
11111
11111
0000000011111111
00000
00000
00000
0000000000
00000
0000000000
00000
00000
00000
11111
11111
11111
1111111111
11111
1111111111
11111
11111
11111
0000000011111111
0000000011111111
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
0000000000000000
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
1111111111111111
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
00000000000000000000000000000000
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
11111111111111111111111111111111
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
0000000000000000
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
1111111111111111
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
00000000000000000000000000000000
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
11111111111111111111111111111111
0000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
1111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000
000000000000000000000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
1111111111111111
111111111111111111111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000
000000000000000000000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
1111111111111111
111111111111111111111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
0000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
00000000000000000000000000000000
000000000000000000000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
00000000000000000000000000000000
0000000000000000
0000000000000000
1111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
11111111111111111111111111111111
111111111111111111111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
11111111111111111111111111111111
1111111111111111
1111111111111111
0000 0001
0010
0100
0110
1110 1111
1011
0011
Poslední dva príklady jsou tzv. cyklický žebřík CLn s 2n vrcholy, který je složen
propojením dvou kopií kružnice Cn tak, že hrany spojí odpovídající vrcholy dle
pořadí a tzv. Petersenův graf, který je sice docela podobný CL5, ale ve skutečnosti
je to nejjednoduší ,,vyvraceč nesprávných úvah ­ graf, na němž se vyplatí testovat
tvrzení, než je začneme dokazovat.
0
0
1
1
0
0
1
1
0011
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
00110011
0
0
1
1
0011
0011
0011
0
0
1
1
0011 0011
0011
0011
0011
0
0
1
1
9.4
9.4. Morfismy grafů a podgrafy. Jako u všech matematických pojmů, klíčovou
roli hrají zobrazení mezi objekty, která zachovávají uvažovanou strukturu.
Definice. Pro grafy grafy G = (V, E) a G = (V , E ) budeme za morfismus f :
G  G považovat zobrazení fV : V  V mezi množinami vrcholů takové, že je-li
e = {v, w} hrana v E, pak e = {f(v), f(w)} musí být hranou v E . V dalším textu
nebudeme ve značení odlišovat morfismus f a zobrazení fV . Zároveň pak takové
zobrazení fV určuje i zobrazení fE : E  E , f(e) = e , kde e a e jsou jako výše.
Pro orientované grafy je definice shodná, jen pracujeme s uspořádanými dvojicemi
e = (v, w) v roli hran.
Všimněme si, že u grafů tato definice znamená, že pokud f(v) = f(w) pro
dva různé vrcholy ve V , pak mezi nimi nesměla být hrana. U orientovaných grafů,
taková hrana je přípustná, pokud je na společném obrazu smyčka.
1. GRAFY A ALGORITMY 293
Speciálním případem je morfismus libovolného grafu G do úplného grafu Km.
Takový morfismus je ekvivalentní vybranému obarvení vrcholů grafu V pomocí
m různých jmen uzlů Km tak, že stejně obarvené uzly nejsou spojeny hranou.
Hovoříme v tomto případě o barvení grafu pomocí m barev.
V případě, že je morfismus f : G  G bijekcí na vrcholech takovou, že i f-1
je morfismem, hovoříme o izomorfismu grafů. Izomorfní grafy se liší pouze různým
pojmenováním vrcholů.
Snadno si budeme umět načrtnout až na izomorfismus všechny grafy na málo
vrcholech (třeba třech nebo čtyřech). Obecně jde ale o nesmírně složitý kombinatorický
problém a i rozhodnutí o konkrétních dvou daných grafech, zda jsou izomorfní
je obecně mimořádně obtížné.
Jednoduchými a mimořádně užitečnými příklady morfismů grafů jsou pojmy
cesta, sled a kružnice v grafu:
Cestou délky n v grafu G rozumíme morfismus p : Pn  G takový, že p je
injektivní zobrazení (tj. všechny obrazy vrcholů v0, . . . , vn z Pn jsou různé). Sled
délky n v grafu G je jakýkoliv morfismus s : Pn  G (tj. v obrazu se mohou
opakovat vrcholy).
Sled si můžeme představit jako dráhu ,,přičinlivého ale tápajícího poutníka z
uzlu f(v0) do uzlu fvn . Poutník se totiž v žádném uzlu nezastaví, ale klidně se po
cestě grafem vrací do uzlů nebo i dokonce po hranách, kterými dříve šel. Cesta je
naopak průchod grafem z počátečního uzlu f(v0) do koncového f(vn) bez takových
zbytečných oklik.
Obrazy cest i sledů jsou příkladem tzv. podgrafů, ne však stejným způsobem.
Definujme nejprve obecně, co je to podgraf.
Uvažujme graf G = (V, E) a nějakou podmnožiny V  V . Indukovaný podgraf
je graf G = (V , E ), kde e  E patří i do E právě, když oba krajní vrcholy hrany
e patří do V . Podgraf G = (V, E ) je takový graf, který má stejnou množinu
vrcholů jako G, ale jeho množina hran E je libovolnou podmnožinou. Obecně
můžeme pro konstrukci podgrafu použít oba procesy ­ napřed zvolíme V  V a
pak v indukovaném podgrafu vybereme cílovou množinu hran E . Úplně formálně
tedy dostáváme:
Definice. Graf G = (V , E ) je podgrafem v grafu G = (V, E), jestliže V  V ,
E  E.
Snadno je vidět, že každý obraz homomorfismu (tj. obraz jak vrcholů tak hran)
tvoří podgraf. Podgraf, který je homomorfním obrazem cesty nazýváme také cestou.
Je zřejmé, každá taková cesta o n  2 vrcholech v grafu vzniká právě dvěma způsoby
jako homomorfní obraz Pn, které se liší v počátečním a koncovém uzlu. Naopak,
jestliže obraz sledu obsahuje k uzlů, můžeme obecně pro n > k najít nepřeberně
způsobů, jak takový obraz obdržet.
Kružnice v grafu G je injektivním homomorfním obrazem grafu Cn v G. Všimněte
si, že sama kružnice Cn je také homomorfním obrazem cesty Pn, kdy první a
poslední bod cesty zobrazíme do téhož vrcholu a zvolíme orientaci cesty.
Najděte si v předchozích obrázcích cesty nebo kružnice obsažené ve větších
grafech.
9.5
9.5. Kolik je vlastně neizomorfních grafů? Odpovědět přesně je děsně těžké. Odhadnout,
že je neizomorfních grafů moc, je poměrně snadné:
Všech možných grafů na n vrcholech je tolik, kolik je všech podmnožin v množině všech
hran. Všech podmnožin o mohutnosti N je 2N
. Isomorfních grafů nemůže být víc, než kolik je
294 9. KOMBINATORICKÉ METODY
bijekcí na n vrcholech. Těch je n!. Neizomorfních grafů tedy nemůže být méně než
k(n) =
2(n
2)
n!
.
Jestliže si tuto funkci zlogaritmujeme při základu 2, dostaneme (s využitím zjevného vztahu
n!  nn
)
log2 k(n) =
n
2
!
- log2 n! 
n2
2
,,
1 -
1
n
-
2 log2 n
n

Pro n   tedy zjevně dostáváme
log2 k(n) =
1
2
n2
- O(n log2 n)
viz terminologii pro odhady z 8.38. To znamená, že počet neizomorfních grafů na n uzlech
roste asymptoticky stejně rychle jako množství všech možných grafů, tj. číslo 2(n
2). Můžeme
to nepřesně formulovat tak, že velká většina všech možných grafů bude po dvou neizomorfní.
9.6. Příklad.
9.6.1. Určete, kolik existuje homomorfismů grafů
a) z P2 do K5,
b) z K3 do K5
Řešení.
a) 5  4  4 = 80.
b) 5  4  3 = 60.
Jediné omezení je, že se uzly mezi kterými vede hrana nesmí zobrazit na tentýž
uzel.
9.6
9.7. Stupně uzlů a skóre grafu. Izomorfní grafy se od sebe liší pouze přejmenováním
vrcholů. Proto musí mít stejné všechny číselné charakteristiky, které se
přešíslováním vrcholů nemění. Jednoduché údaje tohoto typu můžeme dostat sledováním
počtů hran vycházejících z jednotlivých vrcholů.
Pro vrchol v  V v grafu G = (V, E) říkáme, že jeho stupeň je k, jestliže v E
existuje k hran, jejichž hraničním vrcholem v je. Píšeme v takovém případě
deg v = k.
Skóre grafu G s vrcholy V = (v1, . . . , vn) je posloupnost
(deg v1, deg v2, . . . , deg vn)
Je zřejmé, že pro izomorfní grafy se jejich skóre může lišit pouze permutací hodnot.
Pokud tedy porovnáme skóre grafů setříděné podle velikosti hodnot, pak různá skóre
zaručují neizomorfnost grafu. Naopak ale snadno najdeme příklad grafů se stejným
skóre, které izomorfní být nemohou, např. G = C3  C3 má skóre (2, 2, 2, 2, 2, 2),
stejně jako C6. Zjevně ale izomorfní nejsou, protože v C6 existuje cesta délky 5,
která v druhém grafu být nemůže.
Zajímají nás samozřejmě také kritéria, jaká skóre mohou vůbec grafy mít. Protože
každá hrana vychází ze dvou vrcholů, musí být v celkovém součtu skóre započtena
každá hrana dvakrát. Proto platí
e9.1 (9.1)
vV
deg v = 2|E|.
Zejména tedy musí být součet všech hodnot skóre sudý.
1. GRAFY A ALGORITMY 295
Následující věta je naší první úvahou o operacích nad grafy. Protože je důlaz
konstruktivní, jde vlastně o návod, jak pro dané skóre buď zjistit
Věta (Algoritmus na sestrojení grafu s daným skóre). Pro libovolná přirozená čísla
0  d1      dn existuje graf G na n vrcholech s těmito hodnotami skóre tehdy a
jen tehdy, když existuje graf se skóre
(d1, d2, . . . , dn-dn
- 1, dn-dn+1 - 1, . . . , dn-1 - 1)
na n - 1 vrcholech.
Důkaz. Na jednu stranu je implikace jednoduchá: Pokud existuje graf G o
n - 1 vrcholech se zadaným skóre, pak můžeme přidat ke grafu G nový vrchol vn
a spojit jej hranou s posledními dn uzly grafu G . Tím dostaneme požadovaný graf
G s předepsaným skóre.
Naopak je to o něco těžší. Postup nám zároveň ukáže, jak málo skóre určuje
graf, z něhož vzniklo. Ukážeme, že při pevně zadaném skóre (d1, . . . , dn) s 0  d1 
    dn vždy existuje graf, jehož uzel vn je spojen hranou právě s posledními dn
uzly vn-dn
,. . . , vn-1.
Idea je jednoduchá -- pokud některý z posledních dn uzlů vk není hranou
spojen s vn, musí být vn spojen s některým z vrcholů dřívějších. Pak bychom měli
umět prohodit koncové vrcholy dvou hran tak, aby vn a vj spojeny byly a skóre se
nezměnilo. Technicky to lze provést takto: Uvažme všechny grafy G s daným skóre a
označme si pro každý takový graf číslo (G), které je největší index vrcholu, který
není spojen hranou s vn. Nechť G je nyní pevně zvolený graf s (G) nejmenším
možným. Pak buď je (G) = n - dn - 1 a tedy jsme získali požadovaný graf nebo
je (G)  n - dn.
V posledním případě ale musí být vn spojen hranou s některým vi, i < (G).
Protože je deg v(G)  deg vi, nutně existuje také hrana spojující v(G) s v pro
< i. Nyní záměnou hran {v , v(G)} s {v , vi} a {vi, vn} s {v(G), vn} dostáváme
graf G s týmž skóre, ale menším (G ), což je spor s naší volbou. (Namalujte si
obrázek!)
Nutně tedy platí první z možností a důkaz je hotov.
Všimněme si, že skutečně věta dává přesný postup, jak zkonstruovat graf se
zadaným skóre. Pokud by takový graf neexistoval, algoritmus to po cestě pozná.
Postup je takový, že od zadaného vzestupně uspořádaného skóre postupně odprava
od hodnot odečítáme tolikrát jedničku, kolik je největší hodnota dn. Uspořádáme
znovu výsledné skóre postupujeme stejně, dokud buď neumíme přímo graf se zadaným
skóre napsat nebo naopak nevidíme, že takový neexistuje. Jestliže graf v
některém z kroků sestrojíme, zpětným postupem přidáváme vždy jeden nový uzel
a hrany podle toho, jak jsme odečítali jedničky. Zkuste si několik jednoduchých
příkladů sami. Důležité upozornění -- lgoritmus sestrojuje pouze jeden z mnoha
grafů, které mohou k danému skóre existovat!
U orientovaných grafů rozlišujeme vstupní stupeň deg+ v vrcholu v a výstupní
stupeň deg- v. Říkáme, že orientovaný graf je vyvážený, když pro všechny uzly platí
deg- v = deg+ v.
9.7
9.8. Algoritmy a reprezentace grafů. Jak jsme již naznačovali, grafy jsou jazykem,
ve kterém často formulujeme algoritmy.
Samotný pojem (grafového) algoritmu můžeme (pro naše potřeby) formalizovat
jako postup, kdy v nějakém orientovaném grafu přecházíme z uzlu do uzlu podél
296 9. KOMBINATORICKÉ METODY
orientovaných hran a přitom zpracováváme informace, které jsou určeny a ovlivněny
výsledkem předchozích operací, uzlem, ve kterém se zrovna nacházíme, a hranou,
kterou jsme do uzlu vstoupili. Při zpracování informace se zároveň rozhodujeme,
kterými výstupními hranami budeme pokračovat a v jakém pořadí. Pokud je graf
neorientovaný, můžeme všechny hrany považovat za dvojice hran orientované opačnými
směry.
Abychom mohli dobře takové algoritmy realizovat (většinou s pomocí počítače),
je třeba umět uvažovaný graf efektivně zadat. Jednou z možností je tzv. hranový
seznam (Edge List). Graf G = (V, E) si v něm reprezentujeme jako dva seznamy V
a E propojené ukazately tak, že každý vrchol ukazuje na všechny z něj vycházející
hrany a každá hrana ukazuje na svůj počáteční a koncový vrchol. Je vidět, že pamět
potřebná na uchování grafu je v tomto případě O(|V | + |E|), protože na každou
hranu ukazujeme právě dvakrát a na každý vrchol ukazujeme tolikrát, kolik je jeho
stupeň a součet stupňů je také roven dvojnásobku počtu hran. Až na konstantní
násobek jde tedy stále o optimální způsob uchovávání grafu v paměti.
Zcela jiný způsob je zadání tzv. matice sousednosti grafu. Uvažme (neorientovaný)
graf G = (V, E), zvolme uspořádání jeho vrcholů V = (v1, . . . , vn) a definujme
matici AG = (aij) nad Z2 (tj. zaplněnou jen nulami a jedničkami) takto:
aij =
1 jestliže je hrana eij = {vi, vj} v E
0 jestliže není hrana eij = {vi, vj} v E
Popřemýšlejte samostatně, jak vypadají matice grafů z příkladů na začátku této
kapitoly.
Při nejjednodušším způsobu uchovávání matic v poli je zadání grafu pomocí
matice sousednosti velice neefektivní metoda. Potřebuje totiž vždy O(n2
) místa v
paměti. Pokud je ale v grafu málo hran, dostáváme tzv. řídkou matici se skoro
všemi prvky nulovými. Existují ovšem postupy, jak tyto řídké matice uchovávat v
paměti efektivněji.
Promyslete si podrobně, jak se v obou způsobech zadání grafu zpracují základní
operace nad grafem, kterými rozumíme:
* odebrání hrany
* přidání hrany
* přidání vrcholu
* odebrání vrcholu
* dělení hrany nově přidaným vrcholem
Jako jednoduchou aplikaci maticového počtu si uvedeme následující tvrzení:
9.8 9.9. Věta. Nechť G = (V, E) je graf s uspořádanými vrcholy V = (v1, . . . , vn) a
maticí sousednosti AG. Označme Ak
G = (a
(k)
ij ) prvky k-té mocniny matice AG =
(aij). Pak a
(k)
ij je počet sledů délky k mezi vrcholy vi a vj.
Důkaz. Tvrzení je pouze jiným vyjádřením definice matice sousednosti pro
případ k = 1 a celý důkaz povedeme indukcí přes délku k. Předpokládejme tedy, že
věta platí pro nějaké k a zkoumejme, kolik je sledů délky k + 1 mezi vrcholy vi a vj
pro nějaké pevné indexy i a j. Jistě každý takový sled obdržíme pomocí jedné hrany
z vi do nějakého uzlu v a nějakého sledu délky k mezi v a vj. Různé volby přitom
dávají vždy různé výsledky. Proto, označíme-li a
(k)
j počet různých sledů délky k z
1. GRAFY A ALGORITMY 297
v do vj, pak námi hledaný počet sledů délky k + 1 bude
a
(k+1)
ij =
n
=1
ai  a
(k)
j .
To je ale právě formulka pro násobení matice AG s mocninou Ak
G. Dokázali jsme,
že naše čísla a
(k+1)
ij jsou prvky matice Ak+1
G .
Důsledek. Jsou-li G = (V, E) a AG jako v předchozí větě, pak lze všechny vrcholy
G spojit cestou právě, když má matice (A + In)n-1
samé nenulové členy (zde In
označuje jednotkovou matici s n řádky a sloupci).
Důkaz. Díky distributivitě násobení matic a skutečnosti, že jednotková matice
In komutuje s každou jinou maticí stejného rozměru, dostaneme roznásobením
(A + In)n-1
= An-1
+
n - 1
1
An-2
+    +
n - 1
n - 2
A + In.
Výsledná matice má za členy čísla (ve značení jako v minulé větě)
a
(n-1)
ij +
n - 1
1
a
(n-2)
ij +    +
n - 1
a
(n-1- )
ij +    + (n - 1)aij + ij,
kde ii = 1 pro všechny i a ij = 0 pro i = j.
Toto číslo evidentně zadává součet počtů sledů délek 0, . . . , n - 1 mezi vrcholy
vi a vj vynásobených kladnými konstantami. Bude proto nenulové právě tehdy,
jestliže mezi těmito vrcholy existuje nějaká cesta.
9.9 9.10. Poznámka. Ještě si všimněme vlivu permutace našeho uspořádání uzlů V na matici
sousednosti grafu. Není obtížné si uvědomit, že permutace uzlů grafu G má za následek jednu
a tutéž permutaci řádků a i sloupců matice AG. Každou takovou permutaci můžeme zadat
právě jednou tzv. permutační maticí, tj. maticí z nul a jedniček, která má v každém řádku a
každém sloupci právě jednu jedničku a jinak nuly. Je-li P taková parmutační matice, pak nová
matice sousednosti izomorfního grafu G bude
AG = P  AG  PT
,
kde PT
značí transponovanou matici a tečkou označujeme násobení matic. Každou permutaci
umíme napsat jako složení transpozic a proto příslušnou permutační matici dostaneme jako
součin příslušných matic pro transpozice.
V případě permutačních matic je matice transponovaná zároveň maticí inverzní. Tyto
úvahy lze dále rozvíjet a přemýšlet o souvislostech matic sousednosti a matic lineárních zobrazení
mezi vektorovými prostory. Nebudeme zde zacházet do podrobností.
9.10
9.11. Prohledávání v grafu. Mnoho užitečných algoritmů je založeno na postupném
prohledávání všech všech vrcholů v grafu. Zpravidla máme zadaný počáteční
vrchol nebo si jej na začátku procesu zvolíme. V průbehu procesu vyhledávání pak
v každém okamžiku máme vrcholy
* již zpracované, tj. ty, které jsme již při běhu algoritmu procházeli a definitivně
zpracovali;
* aktivní, tj. ty vrcholy, které jsou detekovány a připraveny pro zpracovávání;
* spící, tj. ty vrcholy, na které teprve dojde.
298 9. KOMBINATORICKÉ METODY
Zároveň si udržujeme přehled o již zpracovaných hranách. V každém okamžiku
musí být množiny vrcholů a/nebo hran v těchto skupinách disjunktním rozdělením
množin V a E vrcholů a hran grafu G a některý z aktivních vrcholů je aktuálně
zpracováván. Sledujme nejprve princip obecně na příkladě prohledávání vrcholů.
V dalších odstavcích pak budeme postup používat pro algoritmy řešící konkrétní
úlohy.
Na počátku průběhu tedy máme jeden aktivní vrchol a všechny ostaní vrcholy
jsou spící. V prvním kroku projdeme všechny hrany vycházející z aktivního vrcholu
a jejich příslušným koncovým vrcholům, které jsou spící, změníme statut na aktivní.
V dalších krocích vždy u zpracovávaného vrcholu probíráme ty z něho vycházející
hrany, které dosud nebyly probrány a jejich koncové vrcholy přidáváme mezi aktivní.
Tento postup aplikujeme stejně u orientovaných i neorientovaných grafů, jen se
drobně mění význam adjektiv koncový a počáteční u vrcholů.
V konkrétních úlohách se také můžeme omezovat na některé z hran, které vychází
z aktuálního vrcholu. Na principu to ale nic podstatného nemění.
Pro realizaci algortimů je nutné se rozhodnout, v jakém pořadí zpracováváme
aktivní vrcholy a v jakém pořadí zpracováváme hrany z nich vycházející. V zásadě
příchází v úvahu dvě možnosti zpracovávání vrcholů:
(1) vrcholy vybíráme pro další zpracování ve stejném pořadí, jak se stávaly aktivními
(fronta)
(2) dalším vrcholem vybraným pro zpracování je poslední zaktivněný vrchol (zá-
sobník).
V prvním případě hovoříme o prohledávání do šířky, ve druhém o prohledávání do
hloubky.
Na první pohled je zřejmá role volby vhodných datových struktur pro uchovávání
údajů o grafu. Hranový seznam umožňuje projít všechny hrany vycházející z
právě zpracovávaného vrcholu v čase lineárně úměrném jejich počtu. Každou hranu
přitom diskutujeme nejvýše dvakrát, protože má právě dva konce. Zjevně tedy platí:
Věta. Celkový čas realizace vyhledávání do šířky i do hloubky v čase O((n+m)K),
kde n je počet vrcholů v grafu, m je počet hran v grafu a K je čas potřebný na
zpracování jedné hrany, resp. jednoho vrcholu.
1. GRAFY A ALGORITMY 299
Následující obrázky slouží pro ilustraci prohledávání do šířky a do hloubky:
0011
0
0
1
1
0011
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0011
0
0
1
1
0011
0
0
1
1
0
0
1
1
0011
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0011 0011 0011
Je na nich zachyceno prvních osm kroků prohledávání do šířky Petersenova
grafu na 10 vrcholech.
Zakroužkovaný vrchol je ten právě zpracovávaný, modré velké puntíky jsou již
zpracované uzly, čárkované červené hrany jsou již zpracované a červené drobné uzly
jsou ty aktivní (poznají se také podle toho, že do nich již vede některá zpracovaná
hrana). Hrany zpracováváme v pořadí orientace proti hodinovým ručkám, přičemž
za ,,první bereme směr ,,kolmo dolů .
Totéž je dalších obrázcích postupem ,,do hloubky . Všimněte si, že první krok
je stejný jako v předchozím případě.
0011
0
0
1
1
0011
0011
0
0
1
1
0011
0
0
1
1
0
0
1
1
0011
0
0
1
1
0
0
1
1
0011
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
9.11
9.12. Souvislé komponenty grafu. Každý graf G = (V, E) se přirozeně rozpadá
na disjunktní podgrafy Gi takové, že vrcholy v  Gi a w  Gj jsou spojeny nějakou
cestou právě, když i = j.
Tento postup si můžeme formalizovat takto: Nechť je G = (V, E) neorientovaný
graf. Na množině vrcholů grafu G zavedeme relaci  tak, že v  w právě když
existuje cesta z v do w. Promyslete si, že tato relace je dobře definovaná a že se
jedná o ekvivalenci. Každá třída [v] této ekvivalence definuje indukovaný podgraf
G[v]  G a disjunktní sjednocení těchto podgrafů je ve skutečnosti původní graf
G. Skutečně, podle definice naší ekvivalence, žádná hrana původního grafu nemůže
300 9. KOMBINATORICKÉ METODY
propojovat uzly z různých komponent. Podgrafům G[v] říkáme souvislé komponenty
grafu G.
Je-li graf G orientovaný, pak postupujeme úplně stejně, pouze u definice relace
výslovně požadujeme aby cesta existovala z uzlu v do uzlu w nebo naopak z uzlu
w do uzlu v.
Jako skutečně jednoduchý příklad prohledávání v grafu si můžeme uvést algoritmus
na vyhledání všech souvislých komponent v grafu. Jedinou informací, kterou
musíme zpracovávat je, kterou komponentu aktuálně procházíme. Samotné prohledávání,
tak jak jsme jej prezentovali, projde právě všechny vrcholy jedné komponenty.
Kdykoliv při běhu algoritmu skončíme s prázdnou množinou aktivních
vrcholů ke zpracování, máme nachystánu jednu celou komponentu na výstup. Stačí
pak vzít jakýkoliv další dosud spící vrchol a pokračovat dále. Teprve až nebudou
ani žádné spící vrcholy, ukončíme algoritmus.
Definice. Řekneme, že graf G = (V, E) je
* souvislý, jestliže má právě jednu souvislou komponentu;
* vrcholově k­souvislý, jestliže má alespoň k + 1 vrcholů a bude souvislý po odebrání
libovolné podmnožiny k - 1 vrcholů;
* hranově k­souvislý, jestliže bude souvislý po odebrání libovolné podmnožiny
k - 1 hran.
Případ k = 1 v definici jen opakuje souvislost grafu G. Silnější souvislost grafu
je žádoucí např. u síťových aplikací, kdy klient požaduje značnou redundanci poskytovaných
služeb v případě výpadku některých linek (tj. hran) nebo uzlů (tj.
vrcholů).
Obecně lze dokázat tvrzení tzv. Mengerovy věty, kterou teď nebudeme dokazo-
vat:
Tvrzení. Pro každé dva vrcholy v a w v grafu G = (V, E) je počet hranově různých
cest z v do w roven minimálnímu počtu hran, které je třeba odstranit, aby se v a w
ocitly v různých komponentách vzniklého grafu.
Speciálním případem je 2­souvislý graf. To je takový souvislý graf o alespoň
třech vrcholech, kdy vynecháním libovolného vrcholu nenarušíme jeho souvislost.
Na tomto příkladu si odvodíme několik pěkných charakterizací:
Věta. Pro graf G = (V, E) s alespoň třemi vrcholy jsou následující podmínky ekvi-
valentní:
* G je 2­souvislý;
* každé dva vrcholy v a w v grafu G leží na společné kružnici;
* graf G je možné vytvořit z trojúhelníku K3 pomocí postupných dělení hran.
Důkaz. Na jednu stranu je implikace zřejmá: Jestliže každé dva vrcholy sdílejí
kružnici, pak jsou mezi nimi vždy alespoň dvě různé cesty a tedy odebrání vrcholu
nemůžeme pokazit souvislost.
Opačná implikace není o mnoho složitější. Budeme postupovat indukcí podle
minimální délky cesty spojující vrcholy v a w. Pokud vrcholy sdílí hranu e, pak díky
2­souvislosti je i graf bez této hrany souvislý a je v něm proto cesta mezi v a w.
Spolu s hranou e tato cesta vytváří kružnici. Předpokládejme, že umíme takovou
sdílenou kružnici sestrojit pro všechny vrcholy spojitelné cestou délky nejvýše k a
uvažujme vrcholy v a w a je spojující nejkratší cestu (v = v0, e1, . . . , vk = w) délky
1. GRAFY A ALGORITMY 301
k + 1. Pak v1 a w umíme spojit cestou o délce nejvýše k a proto leží na společné
kružnici. Označme si P1 a P2 příslušné dvě různé cesty mezi v1 a w. Graf G \ {v1}
je ale také souvislý, existuje tedy cesta P z v do w, která neprochází vrcholem v1
a tato nutně musí někdy poprvé narazit na jednu z cest P1 a P2. Předpokládejme,
že se tak stane ve vrcholu z na cestě P1. Pak je cesta, která vznikne složení části
cesty P z v do z, části cesty P1 ze z do w a opačnou cestou k P2 z w do v hledanou
kružnicí (nakreslete si obrázek!).
9.12
9.13. Metrika na grafech. V posledním důkazu jsme používali délku cest pro
měření ,,vzdálenosti vrcholů. Ukážeme, že takto skutečně lze matematicky vybudovat
pojem vzdálenosti na grafu:
Na každém (neorientovaném) grafu definujeme vzdálenost uzlů v a w jako číslo
dG(v, w), které je rovno počtu hran v nejkratší možné cestě z v do w. Pokud cesta
neexistuje, píšeme dG(v, w) = .
Budeme v dalším uvažovat pouze souvislé graf G. Pak pro takto zadanou funkci
dG : V × V  N platí obvyklé tři vlastnosti vzdálenosti:
* dG(v, w)  0 a přitom dG(v, w) = 0 právě, když v = w;
* vzdálenost je symetrická, tj dG(v, w) = dG(w, v);
* platí trojúhelníková nerovnost, tj. pro každou trojici vrcholů v, w, z platí
dG(v, z)  dG(v, w) + dG(w, z).
Říkáme, že dG je metrika na grafu G.
Kromě těchto standardních tří vlastností splňuje metrika na grafu evidentně
ještě
* dG(v, w) má vždy nezáporné celočíslené hodnoty;
* je-li dG(v, w) > 1, pak existuje nějaký vrchol z různý od v a w a takový, že
dG(v, w) = dG(v, z) + dG(z, w).
Lze dokázat, že pro každou funkci dG s výše uvedenými pěti vlastnostmi na V × V pro
konečnou množinu V lze nadefinovat hrany E tak, aby G = (V, E) byl graf s metrikou dG.
Zkuste si ukázat jako cvičení!
9.13
9.14. Dijkstrův algoritmus pro hledání nejkratších cest. Dá se tušit, že
nejkratší cestu v grafu, která vychází z daného uzlu v a končí v jiném uzlu w budeme
umět hledat pomocí prohledávání grafu do šířky. Při tomto typu prohledávání totiž
postupně diskutujeme vrcholy, do kterých se umíme dostat z výchozího vrcholu po
jediné hraně, poté projdeme všechny, které mají vzdálenost nejvýše 2 atd. Na této
jednoduché úvaze je založen jeden z nejpoužívanějších grafových algoritmů ­ tzv.
Dijkstrův algoritmus.
Tento algoritmus hledá nejkratší cesty v realističtější podobě, kdy jednotlivé
hrany e jsou ohodnoceny ,,vzdálenostmi , tj. kladnými reálnými čísly w(e). Kromě
aplikace na hledání vzdáleností v silničních nebo jiných sítích to mohou být také
výnosy, toky v sítích atd. Vstupem algoritmu je graf G = (V, E) s ohodnocením
hran a počáteční vrchol v0. Výstupem je ohodnocení vrcholů čísly dw(v), která
udávají nejmenší možný součet ohodnocení hran podél cest z vrcholu v0 do vrcholu
v. Postup dobře funguje v orientovaných i neorientovaných grafech.
Pro konečný chod algoritmu a jeho výsledek je skutečně podstatné, že všechna
naše ohodnocení jsou kladná. Zkuste si rozmyslet třeba cestu P3 se záporně ohodnocenou
prostřední hranou. Při procházení sledu mezi krajními vrcholy bychom
302 9. KOMBINATORICKÉ METODY
,,vzdálenost zmenšovali každým prodloužením sledu o průchod prostřední hranou
tam a zpět.
Dijkstrův algoritmus vyžaduje jen drobnou modifikaci obecného prohledávání
do šířky:
* U každého vrcholu v budeme po celý chod algoritmu udržovat číselnou hodnotu
d(v), která bude horním odhadem skutečné vzdálenosti vrcholu v od vrcholu
v0.
* Množina již zpracovaných vrcholů bude v každém okamžiku obsahovat ty vrcholy,
u kterých již nejkratší cestu známe, tj. d(v) = dw(v).
* Do množiny aktivních (právě zpracovávaných) vrcholů W zařadíme vždy právě
ty vrcholy y z množiny spících vrcholů Z, pro které je d(y) = min{d(z); z  Z}.
Předpokládáme, že graf G má alespoň dva vrcholy. Formálněji lze Dijkstrův
algoritmus popsat takto:
(1) Iniciační krok: Nastavíme hodnoty u všech v  V ,
d(v) =
0 pro v = v0
 pro v = v0,
nastavíme Z = V , W = .
(2) Test cyklu: Jestliže ohodnocení všech vrcholů y  Z je rovno rovno , algoritmus
končí, v opačném případě pokračujeme dalším krokem. (Algoritmus tedy
zejména končí, pokud je Z = .)
(3) Aktualizace statutu vrcholů:
* Najdeme množinu N všech vrcholů v  Z, pro které d(v) nabývá nejmenší
možné hodnoty
 = min{d(y); y  Z};
* posledně zpracované aktivní vrcholy W přesuneme do množiny zpracovaných
a za nové aktivní vrcholy zvolíme W = N a odebereme je ze spících,
tj. množina spících bude nadále Z \ N.
(4) Tělo hlavního cyklu: Pro všechny hrany v množině EW Z všech hran vycházejících
z některého aktivního vrcholu v a končících ve spícím vrcholu y opakujeme:
* Vybereme dosud nezpracovanou hranu e  EW Z;
* Pokud je d(v) + w(e) < d(y), nahradíme d(y) touto menší hodnotou.
Pokračujeme testem v kroku 2.
9.14 9.15. Věta. Pro všechny vrcholy v v souvislé komponentě vrcholu v0 najde Dijsktrův
algoritmus vzdálenosti dw(v). Vrcholy ostatních souvislých komponent zůstanou
ohodnoceny d(v) = . Algoritmus lze implementovat tak, že ukončí svoji práci v
čase O(n log n + m), kde n je počet vrcholů a m je počet hran v grafu G.
Důkaz. Napřed ukážeme správnost algoritmu, tj. budeme muset ověřit, že
* algortimus po končeném počtu kroků skončí;
* výstup v okamžiku ukončení bude mít požadované vlastnosti.
Formulace testu cyklu zaručuje, že při každém jeho průchodu se zmenší počet spících
vrcholů alespoň o jeden, protože N bude vždy neprázdná. Nutně tedy algoritmus
po konečném počtu kroků skončí.
Po průchodu iniciačním cyklem zjevně platí
e9.1 (9.2) d(v)  dw(v)
1. GRAFY A ALGORITMY 303
pro všechny vrcholy grafu. Předpokládejme tedy, že tato nerovnost platí při vstupu
do hlavního cyklu algoritmu a ověříme, že platí i po výstupu z cyklu. Skutečně,
pokud v kroku 4 měníme d(y), pak je to proto, že jsme našli vrchol v s vlastností
dw(y)  dw(v) + w({v, y})  d(v) + w({v, y}) = d(y),
kde napravo již máme nově změněnou hodnotu.
Rovnost (9.2) bude proto jistě platit i v okamžiku ukončení algoritmu a zbývá
nám ověřit, že na konci algoritmu bude platit i nerovnost opačná. Za tímto účelem
si promysleme, co se vlastně děje v krocích 3 a 4 v algoritmu. Označme si 0 =
d0 <    < dk všechny existující různé konečné vzdálenosti dv(v) vrcholů grafu G
od počátečního vrcholu v0. Tím máme zároveň rozdělenu množinu vrcholů grafu G
na disjunktní podmnožiny Vi vrcholů se vzdáleností právě di. Při prvním průchodu
hlavním cyklem máme N = V0 = {v0}, číslo  bude právě d1 a množinu spících
vrcholů změníme na V \ V0. Předpokládejme, že by tomu takto bylo až do j­tého
průchodu včetně, tj. při vstupu do cyklu by platilo N = Vj,  = dj a j
i=0Vi =
V \ N. Uvažme nějaký vrchol y  Vj+1, tj. dwy = dj+1 <  a existuje cesta
(v0, e1, v1, . . . , v , e +1, y) celkové délky dj+1. Pak ovšem jistě
e9.2 (9.3) dw(v )  dj+1 - w({v , y}) < d +1
Podle našeho předpokladu tedy již dříve (v některém z předchozích průchodů hlavním
cyklem) byl vrchol v aktivní a tedy již v tom průchodu bylo jeho ohodnocení
rovno dw(v ) = d(v ) = di pro některé i  j. Proto při stávajícím průchodem
hlavním cyklem bude výsledkem nastavení
d(y) = dwv + w({v , y}) = dj+1
a toto v dalších průchodech již nikdy nebude měněno. V nerovnosti (9.2) tedy ve
skutečnosti nastává po ukončení chodu algoritmu rovnost.
Naše analýza průchodu hlavním cyklem nám zároveň umožňuje odhadnout čas
potřebný na chod algoritmu (tj. počet elementárních operací s grafem a dalšími
objekty s ním spojenými). Je totiž vidět, že hlavním cyklem projdeme tolikrát,
kolik v grafu existuje různých vzdáleností di. Každý vrchol při jeho zpracování v
kroku 3 budeme uvažovat právě jednou a budeme muset přitom umět setřídit dosud
spící vrcholy. To dává odhad O(n log n) na tuto část algoritmu, pokud budeme
používat pro uchovávání grafu seznam hran a vrcholů obohacený o ohodnocení hran
a spící vrcholy budeme uchovávat ve vhodné datové struktruře umožňující vyhledání
množiny N aktivních vrcholů v čase O(log n + |N|). To lze dosáhnout datovou
strukturou, které se říká halda. Každá hrana bude právě jednou zpracovávána v
kroku 4 protože vrcholy jsou aktivní pouze při jednom průchodu cyklem.
Všimněme si, že pro nerovnost (9.3), která byla podstatná pro analýzu algoritmu,
je nutný předpoklad o nezáporných vahách všech hran.
V praktickém použití bývají přidávána různá heuristická vylepšení. Např. není
nutné dopočítávat celý algoritmus, pokud nás zajímá pouze nejkratší cesta mezi
dvěma vrcholy. V okamžiku, kdy totiž je vrchol vyřazován z aktivních víme, že jeho
vzdálenost je již spočtena správně.
Také není nutné na začátku algoritmus iniciovat s nekonečnou hodnotou. Samozřejmě
by to při programování ani nešlo, můžeme však postupovat ještě daleko
lépe než jen přiřadit dostatečně velikou konstantu. Například při počítání nejkratší
cesty po silniční síti můžeme jako iniciaci volit předem známe vzdušné vzdálenosti
304 9. KOMBINATORICKÉ METODY
bodů. Pak totiž známe předem odhady vzdáleností d0
w(v) vrcholů v a v0 takové, že
pro všechny hrany e = {v, y} platí
|d0
w(v) - |d0
w(y)|  w(e)
a tato nerovnost nám stačí pro důkaz správnosti algoritmu.
9.15
9.16. Eulerovy sledy a Hamiltonovy kružnice. Každý si asi pamatujeme na
hříčky typu ,,nakreslete obrazek jedním tahem .
V řeči grafů to zachytíme takto:
Definice. Sled, který projde všechny hrany grafu právě jednou a začíná a končí
ve stejném vrcholu se nazývá eulerovský sled a souvislým grafům, které takový sled
připouští říkáme eulerovské.
Eulerovský sled samozřejmě projde zároveň každý vrchol grafu alespoň jednou,
může ale vrcholy procházet i vícekrát. Nakreslit graf jedním tahem, který začíná a
končí v jednom vrcholu, tedy znamená najít eulerovský sled. Terminologie odkazuje
na klasický příběh o sedmi mostech ve městě Královec (Königsberg, tj. Kaliningrad),
které se měly projít na procházce každý právě jednou, a důkaz nemožnosti takové
procházky pochází od Leonharta Eulera z roku 1736.
Situace je znázorněna na obrázku. Nalevo neumělý náčrt řeky s ostrovy a mosty,
napravo odpovídající (multi)graf. Vrcholy tohoto grafu odpovídají ,,souvislé pevnině
, hrany mostům. Pokud by nám vadily násobné hrany mezi vrcholy (což jsme
zatím formálně nepřipouštěli), stačí do hran za každý most přidat ještě jeden vrchol,
tj. rozdělit hrany pomocí nových vrcholů. Kupodivu je obecné řešení takového
problému dosti snadné, jak ukazuje následující věta. Samozřejmě také ukazuje, že
se Euler zamýšleným způsobem procházet skutečně nemohl.
Věta. Graf G je eulerovský tehdy a jen tehdy, když je souvislý a všechny vrcholy v
G mají sudé stupně.
Důkaz. Je-li graf eulerovský, nutně musíme při procházení všech hran každý
vrchol stejněkrát opustit jako do něj vstupujeme. Proto nutně musí být stupeň každého
vrcholu sudý. Kdo důkaz této implikace formalizovanější, může uvážit kružnici,
která začne a skončí ve vrcholu v0 a projde všechny hrany. Každý vrchol bude jedenkrát
nebo vícekrát na této cestě a jeho stupeň bude roven dvojnásobku počtu
výskytů.
Předpokládejme naopak, že graf G má všechny vrcholy jen sudých stupňů, a
uvažme nejdelší možný sled (v0, e1, . . . , vk) v G bez opakujících se hran. Předpokládejme
na okamžik, že vk = v0. To znamená, že do v0 vchází nebo vychází v tomto
sledu jen lichý počet hran a tedy jistě existuje nějaká hrana vyházející z v0, která v
tomto sledu není. To by ale znamenalo, že jej umíme prodloužit, aniž bychom opakovali
hranu, což je spor. Nutně proto musí být v našem sledu v0 = vk. Definujme
nyní podgraf G = (V , E ) v grafu G tak, že do něj dáme právě všechny vrcholy a
hrany v našem pevně zvoleném sledu. Pokud V = V , pak díky souvislosti grafu G
1. GRAFY A ALGORITMY 305
nutně existuje hrana e = {v, w} taková, že v  V a w / V . Pak ovšem můžeme
náš pevně zvolený sled začít a skončit ve vrcholu v a následně pokračovat hranou
e, což je opět spor s jeho největší možnou délkou. Proto nutně V = V . Zbývá tedy
už jen ukázat, že také E = E. Předpokládejme, že by hrana e = {v, w} / V . Opět
stejně jako výše můžeme náš sled začít a skončit ve v a poté pokračovat hranou e,
což by opět byl spor.
Důsledek. Graf lze nakreslit jedním tahem právě, když má všechny stupně vrcholů
sudé nebo má právě dva vrcholy lichého stupně.
Důkaz. Nechť G je graf s právě dvěma vrcholy lichého stupně. Uvažme graf G ,
který vznikne z G přidáním jednoho nového vrcholu w a dvou hran, které spojují
w s dvěma vrcholy lichého stupně. Tento graf už bude eulerovský a eulerovský sled
v G vede na požadovaný výsledek.
Naopak, pokud jde graf G nakreslit jedním tahem, který končí v různých vrcholech,
bude nutně náš graf G eulerovský a proto má G požadované stupně vr-
cholů.
Obdobný požadavek na průchod grafem, ovšem tak, abychom prošli právě jednou
každým vrcholem (tj. zároveň nejvýše jednou každou hranou), vede na obtížné
problémy. Takový průchod grafem je realizován kružnicí, která obsahuje všechny
vrcholy grafu G, hovoříme o hamiltonovských kružnicích v grafu G. Graf se nazývá
hamiltonovský, jestliže má hamiltonovskou kružnici. Lze ukázat, že neexistuje
algoristmus, který by v polynomiálním čase rozhodnul, zda je graf hamiltonovský.
Problém nalezení hamiltonovské kružnice je podstatou mnoha problémů v logistice,
tj. když řešíme optimální cesty při dodávkách zboží.
9.17. Příklady.
9.17.1. Dokažte, že vrcholový graf musí být vrcholově 2-souvislý. Udejte příklad
grafu, který je vrcholově 2-souvislý a přesto v něm neexistuje hamiltonovská kruž-
nice.
Řešení. V hamiltonovském grafu vedou mezi libovolnými dvěma uzly dvě neprotínající
se cesty (,,oblouky hamiltonovské kružnice). Odstraněním jednoho bodu, se
tedy zjevně neporuší souvislost grafu (odstraněný bod může ležet pouze na jedné
ze dvou cest).
9.17.2. Dokažte nebo vyvraťte:
a) Každý graf s méně než devíti hranami je rovinný.
b) Graf, který není rovinný, není ani hamiltonovský.
c) Graf, který není rovinný, je hamiltonovský.
d) Graf, který není rovinný, není eulerovský.
e) Graf, který není rovinný, je eulerovský.
f) Každý hamiltonovský graf je rovinný.
g) Každý eulerovský graf je rovinný.
Řešení.
a) Ano. Triviální důsledek charakterizace rovinných grafů (K3,3 i K5 mají minimálně
9 hran)
b) Ne. (K3,3)
c) Ne. (k libovolnému nerovinnému grafu přidáme jeden vrchol a ten spojíme
jedinou hranou s libovolným vrcholem původního grafu)
306 9. KOMBINATORICKÉ METODY
d) Ne. (Protipříklad K5)
e) Ne. (K3,3)
f) Ne. (K5)
g) Ne. (K5)
9.16
9.18. Stromy. Často potřebujeme při řešení praktických problémů místo posilování
redundancí (jako u počítačových nebo rozvodných sítí) naopak minimalizovat
počet hran grafu při zachování jeho souvislosti. To samozřejmě je vždy možné,
dokud je v grafu alespoň jedna kružnice.
Souvislý graf, ve kterém není žádná kružnice, se nazývá strom. Graf neobsahující
kružnice nazýváme les (nepožadujeme přitom souvislost grafu). Můžeme tedy
formulovat matematickou větu: ,,Strom je souvislý les.
Obecně v grafech nazýváme vrcholy stupně jedna listy (případně také koncové
vrcholy). Následující lemma ukazuje, že každý strom lze vybudovat postupně z
jediného vrcholu přidáváním listů:
Lemma. Každý strom s alespoň dvěma vrcholy obsahuje alespoň dva listy. Pro
libovolný graf G s listem v jsou následující tvrzení ekvivalentní:
* G je strom;
* G \ v je strom.
Důkaz. Pro důkaz existence listů opět použijeme cestu nejdelší možné délky
v grafu G. Nechť P = (v0, . . . , vk) je taková cesta. Pokud by v0 nebyl list, pak by
z něj vedla hrana e s druhým koncovým vrcholem v, který nemůže být vrhcolem v
P, protože to bychom získali kružnici. Pak by ale bylo možné prodloužit P o tuto
hranu, což také nejde. Ze sporu tedy plyne, že v0 je list a totž platí o vk.
Předpokládejme nyní, že v je list stromu G. Uvážíme-li libovolné dva jiné vrcholy
w, z v G, nutně mezi nimi existuje cesta a žádný vrchol uvnitř této cesty
nemůže mít stupeň jedna. Proto tato cesta zůstane i v G \ v a dokázali jsme, že po
odbrání v zůstane graf spojitý. Samozřejmě v něm nemůže být kružnice, když ze
stromu vzniknul odebráním vrcholu.
Je-li naopak G \ v strom, nemůže přídání vrcholu stupně 1 vytvořit kružnici a
také souvislost výsledného grafu je zřejmá.
Ve skutečnosti lze stromy popsat mnoha ekvivalentními a prakticky užitečnými
vlastnostmi. Některé z nich jsou v následující větě:
9.17 9.19. Věta. Pro každý graf G = (V, E) jsou následující podmínky ekvivalentní
(1) G je strom;
(2) pro každé dva vrcholy v, w grafu G existuje právě jedna cesta z v do w;
(3) graf G je souvislý, ale vyjmutím libovolné hrany vznikne nesouvislý graf
(4) graf G neobsahuje kružnici, každým přidáním hrany do grafu G však již kružnice
vznikne
(5) G je souvislý graf a mezi velikostí množin jeho vrcholů a hran platí vztah
|V | = |E| + 1.
Důkaz. Větu bylo ve skutečnosti obtížnější sformulovat než dokázat.
1. GRAFY A ALGORITMY 307
Dokážeme nejprve, že vlastnosti 2­5 platí pro stromy. Každý strom o alespoň
dvou vrcholech má list v a jeho odebráním dostaneme opět strom. Stačí tedy dokázat,
že platí-li 2­5 pro nějaký strom, platí také po přidání nového listu. To je ale
vesměs zřejmé.
Pro důkazy opačných implikací opět nemusíme dělat mnoho. V případě vlastností
2 a 3 pracujeme se souvislým stromem a přímo jejich formulace vylučují
existenci kružnice. V případě čtvrté vlastnosti naopak stačí ověřit souvislost G. Libovolné
dva vrcholy v a w v G jsou ovšem buď spojeny hranou nebo přidáním této
hrany vznikne kružnice, tj. i bez ní existuje mezi nimi cesta.
Poslední implikaci zvládneme indukcí vzhledem k počtu vrcholů. Předpokládejme,
že grafy o n vrcholech a n - 1 hranách jsou stromy. Graf o n + 1 vrcholech
a n hranách má celkový součet stupňů vrcholů 2n a tedy musí obsahovat alespoň
jeden list. Pak ovšem vzniknul přidáním listu ke stromu.
Stromy jsou velice speciální třída grafů a většinou je používáme v různých podobách
s dodatečnými požadavky. Vrátíme se k nim později v souvislosti s praktickými
aplikacemi.
9.18
9.20. Rovinné grafy. Velice často se setkáváme s grafy, které jsou nakresleny v
rovině. To znamená, že každý vrchol grafu je ztotožněn s nějakým bodem v rovině
a hrany mezi vrcholy v a w odpovídají spojitým křivkám c : [0, 1]  R2
spojujícím
vrcholy c(0) = v a c(1) = w.
Pokud navíc platí, že se jednotlivé dvojice hran protínají nejvýše v koncových
vrcholech, pak hovoříme o rovinném grafu G.
Otázka, jestli daný graf připouští realizaci jako rovinný graf, vyvstává velice
často v aplikacích. Jednoduchý příklad je následující:
Tři dodavatelé vody, elektřiny a plynu mají každý své jedno přípojné místo
v blízkosti tří rodinných domků. Chtějí je všichni napojit tak, aby se jejich sítě
nekřížily (třeba se jim nechce kopat příliš hluboko. . . ). Je to možné zvládnout?
Odpověď zní ,,není .
V tomto případě se to zdá být jasné. Jde o bipartitní úplný graf K3,3, kde
tři vrcholy představují přípojná místa, další tři pak domky. Hrany jsou linie sítí.
Všechny hrany umíme zvládnout, jedna poslední ale už nejde, viz obrázek na kterém
neumíme čárkovanou hranu nakreslit bez křížení:
0
0
1
1
0
0
1
1
0011 0011000
000000000000
000000000
000000
111
111111111
111111111
111111111
000
000000000000
000000000
000000
111
111111111111
111111111
111111
0
0000
000
00
1
111
111
111
0
0000
000
00
1
111
111
111
0
0000
000
00
1
111
111
1110
0
1
1
Pro skutečný důkaz ovšem potřebujeme skutečné matematické nástroje. V
tomto případě alespoň naznačíme:
308 9. KOMBINATORICKÉ METODY
Můžeme se opřít o docela pracně dokazatelný topologický výsledek, že každá
spojitá uzavřená křivka v rovině, která sama sebe neprotíná (tj. ,,pokřivená kružnice
), rozděluje rovinu na dvě části. Jinými slovy, každá jiná spojitá křivka spojující
jeden bod uvnitř takové křivky a jeden vně musí nutně naši křivku protínat.
Protože jsou v grafu K3,3 jednotlivé vrcholy v každé z trojic vrcholů nespojených
hranami stejné, až na volbu pořadí, můžeme naši modrou silnou kružnici považovat
za obecný případ kružnice čtyřmi body a diskutovat umístění zbylých dvou vrcholů.
Aby byl graf rovinný, musely by být oba buď uvnitř naší kružnice nebo vně. Obě
možnosti jsou opět rovnocenné, nechť jsou tedy uvnitř. Nyní diskutujme jejich polohu
vůči vhodné kružnici se dvěma modrými silnými a dvěma černými hranami
(tj. přes tři modré a jeden černý vrchol) a vůči ní diskutujme pozici zbývajícího
černého vrcholu. Dojdeme k nemožnosti umístit poslední hranu bez křížení.
Zcela obdobně lze ukázat, že úplný graf K5 také není rovinný. Obecně se dá
dokázat tzv. Kuratowského věta:
Věta. Graf G je rovinný právě tehdy když žádný jeho podgraf není izomorfní dělení
grafu K3,3 nebo grafu K5.
Jedna implikace této věty je zřejmá ­ dělením rovinného grafu vzniká vžy opět
rovinný graf a jestliže podgraf nelze v rovině nakreslit bez křížení, totéž musí platit
i pro celý graf G. Opačný směr důkazu je naopak velice složitý a nebudeme se jím
zde zabývat.
Problematice rovinných grafů je věnováno ve výzkumu a aplikacích hodně pozornosti,
my se zde omezíme pouze na vybrané ilustrace.
Zmiňme alespoň naokraj, že existují algoritmy, které testují rovinatost grafu
na n vrcholech v čase O(n), což určitě nejde přímou aplikací Kuratowského věty.
9.19
9.21. Stěny v rovinných grafech. Uvažme (konečný) rovinný graf G, včetně
jeho realizace v R2
a nechť S je množina všech bodů x  R2
, které nepatří žádné
hraně, ani nejsou vrcholem. Množina R2
\ G se rozpadne na disjunktní souvislé
podmnožiny Si, kterým říkáme stěny rovinného grafu G. Jedna stěna je výjimečná
­ ta jejíž doplněk obsahuje všechny vrcholy grafu. Budeme jí říkat neohraničená
stěna S0. Množinu všech stěn budeme označovat S = {S0, S1, . . . , Sk} a rovinný
graf G = (V, E, S).
Jako příklad si můžme rozebrat stromy. Každý strom je zjevně rovinný graf, jak
je vidět například z možnosti realizovat jej postupným přidáváním listů k jedinému
vrcholu. Samozřejmě také můžeme použít Kuratowského větu ­ když není v G
žádná kružnice, nemůže obsahovat jakékoliv dělení grafů K3,3 nebo K5. Protože
strom G neobsahuje žádnou kružnici, dostáváme pouze jedinou stěnu S0 a to tu
neohraničenou. Protože víme, jaký je poměr mezi počty vrcholů a hran pro všechny
stromy, dostáváme vztah
|V | - |E| + |S| = 2.
Vztah mezi počty hran, stěn a vrcholů lze odvodit pro všechny rovinné grafy.
Jde o tzv Eulerův vztah. Všimněme si, že z něho zejména vyplývá, že počet stěn v
rovinném grafu nezávisí na způsobu, jak jeho rovinnou realizaci vybereme:
Věta. Nechť G = (V, E, S) je souvislý rovinný graf. Pak platí
|V | - |E| + |S| = 2.
Důkaz. Pokud G neobsahuje kružnici, tj. jde o strom, tvrzení jsme již dokázali
v 9.19(5), protože každý strom má zjevně pouze jedinou stěnu S0.
1. GRAFY A ALGORITMY 309
Předpokládejme dále, že hrana e v grafu G je obsažena v kružnici. Pak je i graf
G \ e souvislý. Můžeme tedy postupovat indukcí přes počet hran. Graf s jedinou
hranou vztah splňuje a jestliže jej splňuje i G , pak to znamená
|V | - |E| + 1 + |S| - 1 = 2
protože s odebráním jedné hrany dojde nutně i k propojení právě dvou stěn grafu
G do jedné v G .
9.20
9.22. Konvexní mnohostěny v prostoru. Rovinné grafy si můžeme dobře představit
jako namalované na povrchu koule místo v rovině. Sféra vznikne z roviny
tak, že přidáme jeden bod ,,v nekonečnu . Opět můžeme stejným způsobem hvořit
o stěnách a pro takovýto graf pak jsou všechny jeho stěny rovnocenné (i stěna S0
je ohraničená).
Naopak, každý konvexní mnohostěn P  R3
si můžeme představit jako graf
nakreslený na povrchu koule (můžeme si představit, že hrany a vrcholy daného
mnohostěnu promítneme na dostatečně velkou sféru z libovolného bodu uvnitř P).
Vypuštěním jednoho bodu uvnitř jedné ze stěn (ta stane neohraničenou stěnou S0)
pak obdržíme rovinný graf jako výše tak, že ,,proděravěnou sféru natáhneme do
roviny .
Rovinné grafy, které vzniknou z konvesních mnohočlenů zjevně 2­souvislé, protože
každé dva vrcholy v konvexním mnohoúhelníku leží na společné kružnici. Navíc
v nich platí, že každá stěna kromě S0 je vnitřkem nějaké kružnice a S0 je vnějškem
nějaké kružnice (při kreslení na sféře jsou všechny stěny vnitřek nějaké kružnice).
Názorné se zdá i to, že ve skutečnosti budou grafy vznikající z konvexních mnohoúhelníků
3­souvislé.
Ve skutečnosti platí dosti náročná Steinitzova věta:
Věta. Libovolný vrcholově 3­souvislý rovinný graf G vzniká z konvexního mnohostěnu
v R3
.
9.21
9.23. Platónská tělesa. Jako ilustraci kombinatorické práce s grafy odvodíme
klasifikaci tzv. pravidelných mnohostěnů, tj. mnohostěnů poskládaných ze stejných
pravidelných mnohoúhelníků tak, že se jich v každém vrcholu dotýká stejný počet.
Již v dobách antického myslitele Platóna se vědělo, že jich je pouze pět:
Přeložíme si požadavek pravidelnosti do vlastností příslušného grafu: chceme
aby každý vrchol měl stejný stupeň d  3 a zároveň aby na hranici každá stěny byl
stejný počet k  3 vrcholů. Označme n počet vrcholů, e počet hran a s počet stěn.
Máme k dispozici jednak vztah provazující stupně vrcholů s počtem hran:
dn = 2e
310 9. KOMBINATORICKÉ METODY
a podobně počítáme počet hran, které ohraničují jednotlivé stěny, a bereme v úvahu,
že každé je hranicí dvou stěn, tj.
2e = ks.
Eulerův vztah pak říká
2 = n - e + s =
2e
d
- e +
2e
k
.
Úpravou odtud dostáváme pro naše známé d a k vztah
1
d
+
1
k
=
1
2
+
1
e
.
Protože nejen d a k, ale také e a n musí být přirozená čísla (tj. zejména je 1
e > 0),
dostáváme z této rovnosti velice silné omezení možností. Dosadíme-li minimální
možnou hodnotu d = 3, obdržíme drobnou úpravou nerovnost
-
1
6
+
1
k
=
1
e
> 0.
Odtud vyplývá k, d  {3, 4, 5} a dopočítáním ostatních hodnot pro jednotlivé možnosti
těcho hodnot dostáváme následující výčet všech možností řešení:
d k n e s
3 3 4 6 4
3 4 8 12 6
4 3 6 12 8
3 5 20 30 12
5 3 12 30 20
Ve skutečnosti ale také všechny odpovídající pravidelné mnohostěny existují již
jsme je viděli na obrázcích výše. U prvních třech jistě nejsou pochybnosti, naznačíme
pro ilustraci konstrukci dvanáctistěnu (malujte si přitom obrázek). Začneme s
krychlí a na všech jejích stěnách budeme zaráz a stejným způsobem stavět ,,stany
áčka . Horní vodorovné tyčky přitom nachystáme na úrovni ploch stěn krychle tak,
aby byly pro sousední stěny vždy na sebe kolmé a jejich délku zvolíme tak, aby
lichoběžníky bočních stěn stanu měly tři stejně dlouhé strany. Nyní budeme zdvihat
zaráz stejně všechny stany při zachovávání poměrů tří stran lichoběžníku. Jistě
nastane právě jednou okamžik, ve kerém budou sousední lichoběžníkové a trojůhelníkové
stěny koplanární (tj. v jedné rovině). Tak vznikne pravidelný dvanáctistěn.
Zkuste si sestrojit dvacetistěn jako cvičení.
9.24. Příklady.
9.24.1. Kolik minimálně hran může mít šestistěn?
Řešení. V libovolném mnohostěnu je každá stěna ohraničena minimálně třemi
hranami. Každá hrana pak leľí ve dvou stěnách. Označíme-li s počet stěn a h počet
hran mnohostěnu dostáváme tak odhad 3s  2h. Pro šestistěn dává tento odhad
18  2h, neboli h  9. Šestistěn s devíti hranami skutečně existuje, dostaneme jej
například ,,slepením dvou stejně velikých pravidelných čtyřstěnů stěnou k sobě.
Minimální moľný počet hran šestistěnu je tedy devět.
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 311
2. Aplikace kombinatorických postupů
I v této části budeme nejprve pokračovat v úvahách založených na grafových
postupech.
9.22
9.25. Kořenové stromy, binární stromy a haldy. Stromy využíváme pro organizaci
dat tak, abychom v datech uměli buď rychle vyhledávat nebo v nich udržovat
pořádek, nejčastěji obojí.
Protože ve stromu není žádná kružnice, volba jednoho vrcholu vr zadává orientaci
všech hran. Skutečně, do každého vrcholu vede z vr právě jedna cesta a orientaci
hran bereme podél ní. Přitom není možné, že by pro různé cílové vrcholy probíhaly
příslušné cesty jednu hranu v různých směrech ­ to by opět vedlo na kružnici.
Situace se tedy po výběru jednoho vrcholu začíná více podobat skutečnému
stromu v přírodě ­ jeden jeho vrchol je výjimečný tím, že roste ze země. Stromy
s jedním vybraným ,,počátečním vrcholem nazýváme kořenové stromy, význačný
vrchol vr je kořen stromu.
V kořenovém stromu je dobře definován pojem následník a předchůdce vrcholu
takto: vrchol w je následník v a naopak v je předchůdce w právě tehdy, když existuje
cesta z kořene stromu do w která prochází v a v = w. Přímý následník a přímý
předchůdce vrcholu jsou pak následníci a předchůdci přímo spojení hranou. Často o
nich mluvíme také jako o synech a otcích (patrně v narážce na genealogické stromy).
K vyhledávání se nejčastěji používají tzv. binární stromy, které jsou speciálním
případem kořenového stromu, kdy každý otec má nejvýše dva následníky (někdy se
ale pod stejným označením binární strom předpokládá, že všechny vrcholy kromě
listů mají právě dva následníky). Pokud máme s vrcholy spojeny klíče v nějaké
úplně uspořádané množině (např. reálná čísla), hledání vrcholu s daným klíčem je
realizováno jako hledání cesty od kořene stromu a v každém vrcholu se podle velikosti
rozhodujeme, do kterého ze synů budeme pokračovat (resp. zastavíme hledání,
pokud jsme již ve hledaném vrcholu). Abychom mohli tuto cestu jednoznačně krok
po kroku určovat, požadujeme aby jeden syn společně se všemi jeho následníky měli
menší klíče než druhý syn a všichni jeho následníci.
Pro efektivní vyhledávání se snažíme o tzv. vyvážené binární stromy, ve kterých
se délky cest z kořene do listů liší maximálně o jedničku. Nejdále od vyváženého
stromu na n vrcholech je tedy cesta Pn (která formálně může být považována za
binární strom), zatímco dokonale vyvážený strom, kde kromě listů má každý otec
právě dva syny je možné sestrojit pouze pro hodnoty n = 2k
- 1, k = 1, 2, . . . .
Ve vyvážených stromech dohledání vrcholu podle klíče bude vždy vyžadovat pouze
O(log2 n) kroků. Hovoříme v této souvislosti také často o binárních vyhledávacích
stromech. Jako cvičení si rozvažte, jak lze účinně vykonávat základní operace s grafy
(přidávání a odebírání vrcholů se zadanými klíči, včetně vyvážení) nad binárními
vyhledávacími stromy.
Mimořádně užitečným příkladem využití struktury binárních stromů je datová
struktura halda. Jde opět o vyvážené binární stromy s vrcholy opatřenými klíči a
požadujeme aby podél všech cest od kořene k listům ve stromu klíče klesaly (tzv.
maximální halda) nebo naopak stoupaly (tzv. minimální halda). Díky tomuto uspořádání
umíme v konstatním čase odebírat z haldy podmnožiny buď maximálních
nebo minimálních prvků a skutečné náklady na takovou operaci spočívají v obnovení
struktury haldy po odebrání kořene. Jako cvičení si ukažte, že je to možné
zvládnout v logaritmickém čase.
312 9. KOMBINATORICKÉ METODY
4 6 11
9
8
7
3
1 5
Na obrázku nalevo je binární vyhledávací strom (který ale není vyvážený),
napravo je příklad maximální haldy.
9.23
9.26. Izomorfismy stromů. Stromům, jejich různým variantám a použití je věnována
obsáhlá literatura. My se zde už pouze na chvíli zamyslíme nad obecným
problémem hledání izomorfismu grafů pro speciální třídu stromů. Budeme postupovat
tak, že napřed zesílíme strukturu, kterou mají naše izomorfismy zachovávat
a nakonec ukážeme, že postup je použitelný i pro úplně obecné stromy.
Pro přehled nad strukturou kořenových stromů je kromě vztahů otec­syn ještě
užitečné mít syny uspořádány v pořadí (třeba v představě odleva doprava nebo
podle postupného růstu atd.). Hovoříme o pěstěných stromech T = (V, E, vr, ),
kde  je částečné uspořádání na hranách takové, že srovnatelné jsou vždy právě
hrany směřující od jednoho otce k synům.
Morfismem kořenových stromů T = (V, E, vr) a T = (V , E , vr) rozumíme
takový morfismus grafů  : T  T , který převádí vr na vr. Obdobně pro izomorfismy.
Pro pěstěné stromy navíc požadujeme aby zobrazení hran zachovávalo
částečná uspořádání  a  .
Pro pěstěné stromy T = (V, E, vr, ) zavedeme jejich (jak uvidíme) jednoznačný
popis pomocí slov z nul a jedniček. Obrazně si můžeme představit, že strom kreslíme
a každý přírůstek naznačíme dvěma tahy, které si označíme 0 (dolů) a 1 (nahoru).
Začneme od listů, kterým takto všem přiřadíme slovo 01. Celý strom pak budeme
popisovat zřetězováním částí slov tak, že má-li otec v syny uspořádány jako posloupnost
v1, . . . , v , a jsou-li již jednotliví synové označeni slovy W1, . . . W , pak
pro otce použijeme slovo
0W1 . . . W 1.
Strom na levém obrázku výše tedy zapíšeme postupně takto (přidáváme postupně
vrcholy podle vzdálenosti od kořene, syny máme uspořádány zleva doprava)
01, 01, 01  01, 001011, 0011  0010010111, 000111  000100101110001111.
Hovoříme o kódu pěstěného stromu. Ověřte si, že skutečně kreslením cest dolů a
nahoru (třeba si můžeme představit že dolů malujeme levý obrubník cesty a nahoru
pravý) získáme skutečně původní strom s jednou hranou směřující shora do kořene
navíc.
Věta. Dva pěstěné stromy jsou izomorfní právě, když mají stejný kód
Důkaz. Z konstrukce je zřejmé, že izomorfní stromy budou mít stejný kód,
zbývá tedy pouze dokázat, že různé kódy vedou na neizomorfní stromy.
Dokážeme to indukcí podle délky kódu (tj. počtu nul a jedniček). Ten je roven
dvojnásobku počtu hran zvýšenému o jedničku, tj. dvojnásobku počtu vrcholů, jde
tedy vlastně o indukci vzhledem k počtu vrcholů stromu T. Nejkratší možný kód
odpovídá nejmenšímu stromu s jedním vrcholem. Předpokládejme, že věta platí pro
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 313
stromy o nejvýše n vrcholech, tj. pro kódy o délce nejvýše k = 2n, a uvažme kód
tvaru 0W1, kde W je slovo o délce 2n. Jistě je ve W jednoznačně určena nejmenší
levá část W1, která obsahuje stejně nul a jedniček (při kreslení stromu to znamená
první okamžik, kdy se vrátíme do kořenového vrcholu stromu odpovídajícího
0W1). Stejně najdeme W2 jako další úsek obsahující stejně nul a jedniček atd., až
celé slovo W vyjádříme jako W = W1W2 . . . W . Podle indukčního předpokladu odpovídají
všem kódům Wi jednoznačně pěstěné stromy, až na izomorfismy, a pořadí
jejich kořenů jakožto synů kořenu našeho stromu T je dáno jednoznačně pořadím
v kódu. Nutně proto je i pěstěný strom T jednoznačně určený kódem 0W1, až na
izomorfismus.
Nyní můžeme docela snadno využít klasifikaci pěstěných stromů pomocí kódů
k popisu všech stromů. U kořenových stromů potřebujeme určit pořadí jejich synů
jednoznačně až na izomorfismus. Na pořadí synů ovšem nezáleží právě tehdy, když
jsou podgrafy určené jejich následníky izomorfní. Můžeme proto využít obdobu
(v jistém smyslu rekurzivní) konstrukce kódu pro pěstěné stromy a postupovat
obdobně s využitím lexikografického uspořádní synů podle jejich kódů. Tzn. že kód
W1 > W2 jestliže buď ve W1 narazíme při čtení z leva dříve na jedničku než ve W2
nebo je W2 počátečním úsekem slova W1. Kořenový strom budeme tedy popisovat
zřetězováním částí slov tak, že má-li otec v syny již označeny kódy W1, . . . W , pak
pro otce použijeme slovo
0W1 . . . W 1
kde pořadí W1, . . . , W je zvoleno tak aby W1  W2      W .
Pokud není určen kořen ve stromě, můžeme se jej pokusit určit tak, aby byl
,,přibližně uprostřed stromu . To lze realizovat tak, že všechny jednotlivé vrcholy
stromu označíme hodnotou tzv. výstřednosti. Definujeme výstřednost exT(v) vrcholu
v v grafu T jako největší možnou vzdálenost z v do nějakého vrcholu w v
T, kterou lze dosáhnout. Tento pojem má smysl pro všechny grafy, u stromu ale
díky nepřítomnosti kružnic platí, že maximální hodnoty excentricity vždy dosahuje
buď právě jeden vrchol nebo právě dva vrcholy. Skutečně, nejdelší možná cesta z
kteréhokoliv vrcholu stromu nutně končí v některém z jeho listů. Pro strom na dvou
vrcholech tvrzení platí a u stromu na n  3 vrcholech odebráním listů dostaneme
strom menší, u nějž se excentrity všech vrcholů, které zůstaly, zmenší právě o jedničku.
Tvrzení tedy plyne indukcí podle počtu vrcholů stromu. Navíc je zřejmé, že
dva vrcholy s maximální excentricitou musí být spojeny hranou.
Nyní tedy můžeme přiřadit jednoznačný kód, až na izomorfismus i každému
stromu. Pokud existuje jediný vrchol s maximální excentricitou, použijeme jej jako
kořene, v opačném případě postupujeme stejně pro dva stromy vzniklé z T odebráním
hrany spojující vrcholy s maximální excentricitou a kód vznikne zřetězením
kódů obou stromů v pořadí podle lexikografického uspořádání.
Důsledek. Dva stromy T a T jsou izomorfní právě, když mají společný kód.
9.24
9.27. Kostra grafu. V praktických aplikacích často zadává graf všechny možnosti
propojení mezi objekty, příkladem může být třeba silniční nebo vodovodní nebo
elektrická síť. Pokud nám stačí zajistit propojitelnost každých dvou vrcholů při
minimálním počtu hran, hledáme vlastně v grafu G podgraf T na všech vrcholech
grafu G, který je stromem.
Definice. Libovolný strom T = (V, E ) v grafu G = (V, E), E  E se nazývá
kostra grafu G.
314 9. KOMBINATORICKÉ METODY
Evidentně může kostra v grafu existovat pouze, pokud je graf G souvislý. Místo
formálního důkazu, že platí i opak uvedeme přímo algoritmus, jak kostru grafu
sestrojit.
Algoritmus 1. Postupovat můžeme například takto: Seřadíme zcela libovolně
všechny hrany e1, . . . , em v E do pořadí a postupně budujeme množiny hran Ei
tak, že v (i + 1)­vém kroku přidáme hranu ei k Ei jestliže tím nevznikne v grafu
Gi = (V, Ei  {ei}) kružnice, a ponecháme Ei beze změny v případě opačném. Algoritmus
skončí pokud buď má již graf Gi pro nějaké i právě n - 1 hran nebo je již
i = m. Pokud zastavujeme z druhého důvodu, byl původní graf nesouvislý a kostra
neexistuje.
Lemma. Výsledkem předchozího algoritmu je vždy les T. Jestliže algoritmus skončí
s k  n - 1 hranami, má původní graf n - k komponent. Zejména je tedy T kostrou
právě, když algoritmus skončí pro dosažení n - 1 hran.
Důkaz. Podle pravidla v algoritmu, výsledný podgraf T v G nikdy neobsahuje
kružnice. Je tedy lesem. Jestliže je výsledný počet hran n-1, jde o strom, viz Věta
9.19.
Zbývá pouze ukázat, že souvislé komponenty grafu T mají stejné množiny vrcholů
jako souvislé komponenty původního grafu G. Každá cesta v T je i cestou v G,
musí tedy všechny vrcholy ze jednoho stromu v T ležet všechny v jedné komponentě
G. Pokud by ale existovala v G cesta z v do w takové, že její koncové vrcholy leží v
různých stromech v T, pak na ní existuje poslední vrchol vi v komponentě určené
v a vi+1 v ní neleží. Příslušná hrana {vi, vi+1} musela někdy při chodu algoritmu
ale vytvářet kružnici, protože jinak by se bývala ocitla mezi hranami v T. Protože
se během algoritmu hrany neodebírají, musí tedy zůstavat cesta mezi vi a vi+1 v
T. To je ovšem spor s našimi předpoklady a proto v a w nemohou ležet v různých
stromech v T. Počet komponent v T je dán pevným vztahem mezi počtem vrcholů
a hran ve stromech.
Poznámka. Jako vždy bychom se měli zabývat otázkou, jak složitý je uvedený
algoritmus. Kružnice přidáním nové hrany vznikne tehdy a jen tehdy, jestli její
koncové vrcholy leží ve stejné souvislé komponentě budovaného lesu T. Stačí nám
proto průběžně udržovat znalost souvislých komponent.
K realizaci algoritmu proto potřebujeme (v abstraktní podobě) umět pro již
zadané třídy ekvivalence na dané množině (v našem případě jsou to vrcholy) slučovat
dvě tříd ekvivalence do jedné a nalézat pro daný prvek, do které třídy patří.
Pro sjednocení jistě potřebujeme O(k) času, kde k je počet prvků slučovaných tříd
a jistě můžeme použít ohraničení počtu k celkovým počtem vrcholů n. Můžeme si
ale pamatovat spolu se třídami i počty jejich prvků a průběžně pro každý vrchol
uchovávat informaci do které třídy patří. Sjednocení dvou tříd tedy představuje
přeznačení jména u všech prvků jedné z nich. Jestliže při přeznačování příslušnosti
vrcholů k třídám budeme vždy přeznačovat tu menší z nich, pak celkový počet
operací potřebných v našem algoritmu bude O(n log n + m). Dokažte si jako cvičení!
Algoritmus 2. Kostru můžeme ale hledat také jinak a rychleji: Budeme v grafu
G = (V, E) s n vrcholy a m hranami postupně budovat strom T. Začneme v libovolně
zvoleném vrcholu v a prázdnou množinou hran, tj. T0 = ({v}, ). V i­tém
kroku hedáme mezi hranami, které dosud nejsou v Ti-1, mají v Ti-1 jeden koncový
vrchol, ale druhý koncový vrchol fo Ti-1 nepatří. První takovou hranu přidáme i s
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 315
druhým koncovým vrcholem a získáme tak Ti. Algoritmus skončí, až taková hrana
neexistuje.
Evidentně je výsledný graf T souvislý a podle počtu vrcholů a hran je to strom.
Ukážeme, že vrcholy T splývají s vrcholy souvislé komponenty G. Předpokládejme
proto, že do nějakého vrcholu w vede z v cesta. Pokud by w nebyl vrchol v T, pak
zcela stejně jako v důkazu předchozího lematu na ní najdeme poslední vrchol vi,
který ještě do T patří. Další hrana cesty by ale v okamžiku ukončení algoritimu
připadal v úvahu pro přidání do T, což je spor.
Tento algoritmus tedy v čase O(n + m) nalezne kostru souvislé komponenty
zvoleného počátečního vrcholu v.
9.28. Počet koster úplného grafu. K určení počtu koster úplného grafu o n uzlech
může sloužit pojem Prüferovy posloupnosti kostry grafu. Prüferovu posloupnost
můžeme přiřadit kostře grafu Kn a to následujícím způsobem: označme vrcholy
v grafu Kn postupně od 1 do n a odstraňujme postupně listy dané kostry
(od nejmenšího) a s každým odstraněným listem zapíšme do posloupnosti souseda
právě odstraněného listu. Opakujeme tak dlouho, dokud v kostře nezbubou pouze
dva vrcholy.
Získaná posloupnost má evidentně n-2 členů, které mohou nabývat hodnot od
1 do n. Obráceně není těžké dokázat, že pro každou takovou posloupnost existuje
právě jedna kostra grafu Kn, která se do této posloupnosti výše popsaným postupem
zakóduje.
Celkem dostáváme, že existuje právě nn-2
různých koster grafu Kn.
9.29. Příklady.
9.29.1. Kolik existuje různých koster grafu K5? Kolik různých jich existuje až na
izomorfismus?
Řešení. Existují tři navzájem neizomorfní kostry (se skóre (1, 2, 2, 2, 1), (1, 2, 3, 1, 1),
(4, 1, 1, 1, 1)). Příslušné třídy isomorfních grafů mají postupně 5  4
2  2, 5  4  3 a 5
prvků, celkem 125 různých koster, což souhlasí s obecným vzorcem pro počet koster
úplného grafu.
9.25
9.30. Minimální kostra. Protože je to obecnou vlastností stromů, každá kostra
grafu G má stejný počet hran. Tak, jak jsme ale již dříve hledali nejkratší cesty v
grafech s ohodnocenými hranami, budeme v případě koster jistě chtít umět najít
kostry s minimálním součtem ohodnocení použitých hran.
Definice. Nechť G = (V, E, w) je souvislý graf s ohodnocenými hranami s nezápornými
vahami w(e) pro všechny hrany. Jeho minimální kostra T je taková kostra
grafu G, která má mezi všemi jeho kostrami minimální součet ohodnocení všech
hran.
O praktičnosti takové úlohy můžete přemýšlet třeba v souvislosti s rozvodnými
sítěmi elektřiny, plynu, vody apod.
Kupodivu je docela jednoduché minimální kostru najít za předpokladu, že jsou
všechna ohodnocení w(e) hran v grafu G nezáporná. Následujícímu postupu se říká
Kruskalův algoritmus:
* Setřídíme všech m hran v E tak, aby w(e1)  w(e2)      w(em).
* v tomto pořadí aplikujeme na hrany postup z Algoritmu 1 pro kostru v předchozím
odstavci.
316 9. KOMBINATORICKÉ METODY
Jde o typický příklad takzvaného ,,hladoveckého přístupu , kdy se k maximalizaci
zisku (nebo minimalizaci nákladů) snažíme dostat výběrem momentálně (snad)
nejvýhodnějšího kroku. Často tento přístup zklame, protože nizké náklady na začátku
procesu mohou zavinit vysoké na jeho konci. V našem případě ale skutečně
dostaneme vždy minimální kostru:
Věta. Kruskalův algoritmus správně řeší problém minimální kostry pro každý souvislý
graf G s nezáporným ohodnocením hran. Algoritmus pracuje v čase O(m log m),
kde m je počet hran v G.
Důkaz. POZDEJI ???
9.26
9.31. Další algoritmy pro minimální kostru. I druhý z našich algoritmů pro
kostru grafu v předchozím odstavci vede na minimální kostru, když v každém okamžiku
volíme ze všech možných hran ei = {vi, vi1+}, vi  Vi, vi+1  V \vi tu, která
má minimální ohodnocení. Výsledný postup se zpravidla nazývá Primův algoritmus
podle jeho práce z r. 1957, ve skutečnosti byl ale popsán českým matematikem Jarníkem
již v roce 1930. Raději mu proto říkejme Jarníkův algoritmus. Jarník přitom
reagoval na ještě dřívější algoritmus brněnského matematika O. Borůvky z r. 1928.
Věta. Jarníkův algoritmus najde minimální kostru pro každý souvislý graf s libovolným
ohodnocením hran.
Důkaz. POZDEJI ???
Poznámka. Borůvkův algoritmus je docela podobný, konstruuje ale postupně stále
co nejvíce souvislých komponent zaráz. Začneme tedy s jednoprvkovými komponentami
v grafu T0 = (V, ) a pak postupně vždy každou komponentu propojíme
nejkratší možnou hranou s komponentou jinou. Opět lze dokázat, že takto obdržíme
minimální kostru. V pseudokódu by šel tento algoritmus zapsat následovně:
(1) Inicializace. Udělej graf S složený z vrcholů grafu G;
(2) Hlavní cyklus. Dokud má S více než jednu komponentu opakuj:
pro každý strom T v S najdi nejmenší hranu spojující T s G \ T, tuto
hranu přidej do E;
všechny hrany z E přidej do S;
9.32. Příklady.
9.32.1. Uvažme následující postup pro určování minimální cesty mezi dvěma vrcholy
v ohodnoceném neorientovaném grafu: nejprve nalezneme minimální kostru
grafu, za minimální cestu pak prohlásíme jedinou cestu spojující dva dané vrcholy
v minimální kostře. Dokažte, že je tento postup správný, nebo uveďte protipříklad.
Řešení. Postup není správný. Stačí uvážit například kružnici s hranami ohodnocenými
až na jednu jedničkami, zbývající hrana ohodnocená dvojkou.
9.32.2. Máme dánu následující tabulku vzdáleností světových metropolí: Londýna,
Mexico City, New Yorku, Paříže, Pekingu a Tokia:


L MC NY P Pe T
L 5558 3469 214 5074 5959
MC 2090 5725 7753 7035
NY 3636 6844 6757
P 5120 6053
Pe 1307


2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 317
Jaká je nejmenší délka kabelu, kterým je možné propojit tato města? (předpokládáme,
že délka kabelu potřebného k propojení daných dvou měst je právě vzdálenost
v tabulce).
Řešení. Aplikací algoritmu na hledání minimální kostry zjistíme, že hledaná délka
je 12154. (v kostře jsou hrany LPe, LP, LNY, PeT, MCNY).
9.32.3. Určete počet podgrafů grafu K5.
Řešení. Počet podgrafů spočítáme postupně podle počtu v jejich vrcholů:
* v = 0. Jde o prázdný graf. Ten je pouze jediný.
* v = 1. Jeden vrchol můžeme vybrat pěti způsoby, celkem 5 grafů.
* v = 2. Dva vrcholy můžeme vybrat 5
2 způsoby, mezi vybranými vrcholy pak
buď vede nebo nevede hrana. Celkem 5
2 2 grafů.
* v = 3. Tři vrcholy můžeme vybrat 5
3 způsoby, mezi každými dvěma vybranými
vrcholy buď vede, nebo nevede hrana, celkem 5
3  2(3
2) grafů.
* v = 4. 5
4  2(4
2) grafů.
* v = 5. 5
5  2(5
2) grafů.
Celkem 1550 podgrafů grafu K5.
9.32.4. Určete počet kružnic v grafu K5.
Řešení. Počet kružnic spočítáme postupně podle jejich délky. Nejkratší kružnice
může mít délku 3, nejdelší kružnice v K5 pak délku pět. Kružnice je určena svými
vrcholy, tak jak v ní jdou popořadě, přičemž je jedno, který vrchol prohlásíme za
počáteční a který za koncový. Počet kružnic je tedy 543/32+5432/42+5!/52 =
10 + 15 + 12 = 37.
9.32.5. Určete počet cest mezi dvěma různými pevně vybranými vrcholy v grafu
K7.
Řešení. Spočítáme cesty postupně podle jejich délky. Cesta délky jedna je jedna
(hrana spojující dva vybrané vrcholy). Cest délek dva je pět (vybíráme jeden z pěti
zbylých vrcholů, přes který cesta půjde). Cest délek tři je 5  4 (vybíráme v daném
pořadí dva vrcholy, přes které cesta půjde), obdobně cest délky čtyři je 5  4  3, cest
délky pět je 5432 a konečně cest délky šest je taktéľ 5!. Delší cesty v K7 nejsou.
9.32.6. Označme vrcholy v grafu K6 postupně čísly 1, 2, . . . 6 a každou hranu {i, j}
ohodnoťme číslem [(i + j) mod 3] + 1. Kolik existuje různých minimálních koster v
tomto grafu?
Řešení. Hrany s ohodnocením jedna tvoří kružnici 12451 délky čtyři a hranu 36.
Jde tedy o nesouvislý podgraf daného grafu. Není tedy možné vybrat kostru daného
grafu pouze z hran s ohodnocením jedna. Minimální kostra bude mít tedy součet
ohodnocení hran v ní minimálně 4  1 + 2 = 6. Kostru s touto hodnotou skutečně
můžeme vybrat. Z hran s ohodnocením 1 můžeme vypustit libovolnou hranu ze
zmiňované kružnice a nezávisle přidáme nějakou hranu s ohodnocením dvě, která
spojuje v podgrafu hran s ohodnocením jedna komponentu 1245 s komponentou 36.
Takové hrany jsou celkem čtyři. Celkem má daný graf 44 = 16 různých minimálních
koster.
318 9. KOMBINATORICKÉ METODY
9.32.7. Označme vrcholy v grafu K6 postupně čísly 1, 2, . . . 6 a každou hranu {i, j}
ohodnoťme číslem [(i + j) mod 3] + 1. Kolik existuje různých maximálních koster v
tomto grafu?
Řešení. Hrany s ohodnocením tři tvoří kruľnici 23562 délky čtyři a hranu 14. Jde
tedy o nesouvislý podgraf daného grafu. Není tedy moľné vybrat kostru daného
grafu pouze z hran s ohodnocením tři. Maximální kostra bude mít tedy součet
ohodnocení hran v ní nejvýše 4  3 + 2 = 14. Kostru s touto hodnotou skutečně
můžeme vybrat. Z hran s ohodnocením 3 můžeme vypustit libovolnou hranu ze
zmiňované kružnice a nezávisle přidáme nějakou hranu s ohodnocením dvě, která
spojuje v podgrafu hran s ohodnocením tři komponentu 2356 s komponentou 14.
Takové hrany jsou celkem čtyři. Celkem má daný graf 44 = 16 různých maximálních
koster.
9.32.8. Označme vrcholy v grafu K7 postupně čísly 1, 2, . . . 7 a každou hranu {i, j},
ohodnoťme číslem [(i + j) mod 3] + 1. Kolik existuje různých minimálních koster v
tomto grafu?
Řešení. Nejlevnější hrany s ohodnocením jedna tvoří podgraf obshahující všechny
vrcholy a mající dvě komponenty, které mohou být propojeny nějakou hranou s
druhým nejmenším ohodnocením. Minimální kostra má tedy součet ohodnocení
jejch hran minimálně 6 × 1 + 2 = 8. Kostry s touto hodnotou skutečně existují, je
totiž šest hran hodnoty 2, které propojují zmiňované dvě komponenty. Konkrétně
jde o komponentu {1, 2, 4, 5, 7} a {3, 6}. V první komponentě existují právě tři
kružnice a to délky 4, přičemž každá ze šesti hran této komponenty leží právě ve
dvou kružnicích. Abychom z dané komponenty získali strom, musíme dvě hrany
vypustit, to můžeme udělat 6  4/2 způsoby. Celkem dostáváme 12  6 = 72 různých
minimálních koster.
9.32.9. Označme vrcholy v grafu K7 postupně čísly 1, 2, . . . 7 a každou hranu {i, j},
ohodnoťme číslem [(i + j) mod 3] + 1. Kolik existuje různých maximálních koster v
tomto grafu?
Řešení. Nejdražší hrany s ohodnocením tři tvoří v daném grafu podgraf obsahující
všechny vrcholy a mající dvě komponenty a to dvě kruľnice délek tři a čtyři.
Pouze z hran s tímto ohodnocením tedy maximální kostru nesloľíme. Bude v ní
tedy minimálně jedna levnější hrana. Kostry s právě jednou hranou s ohodnocením
2 pak skutečně existují. Existuje šest hran s ohodnocením 2 propojující dvě zmíněné
komponenty. Abychom dostali kostru, musíme ještě vypustit po jedné hraně
z každé z kružnic. To můžeme udělat 3  4 = 12 způsoby. Celkem máme 72 různých
maximálních koster.
9.32.10. Označme vrcholy v grafu K5 postupně čísly 1, 2,. . . 5 a každou hranu i, j,
i = 1, . . . , 5 ohodnoťme číslem 1, pokud je (i + j) liché, číslem 2, pokud je (i + j)
sudé. Kolik existuje různých maximálních koster v tomto grafu?
Řešení. 18.
9.32.11. Označme vrcholy v grafu K5 postupně čísly 1, 2,. . . 5 a každou hranu
{i, j}, i = 1, . . . , 5 ohodnoťme číslem 1, pokud je (i + j) liché, číslem 2, pokud je
(i + j) sudé. Kolik existuje různých minimálních koster v tomto grafu?
Řešení. 12.
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 319
9.32.12. Označme vrcholy v grafu K6 postupně čísly 1, 2,. . . 6 a každou hranu i, j,
i = 1, . . . , 6 ohodnoťme číslem 1, pokud je (i + j) dává zbytek 1 po dělení třemi,
číslem 2, pokud je (i + j) dává zbytek 2 po dělení třemi a konečně číslem 3, pokud
je (i + j) dělitelné třemi. Kolik existuje různých minimálních koster v tomto grafu?
Řešení. 16.
9.32.13. Označme vrcholy v grafu K6 postupně čísly 1, 2,. . . 5 a každou hranu i, j,
i = 1, . . . , 6 ohodnoťme číslem 1, pokud je (i + j) dává zbytek 1 po dělení třemi,
číslem 2, pokud je (i + j) dává zbytek 2 po dělení třemi a konečně číslem 3, pokud
je (i + j) dělitelné třemi. Kolik existuje různých maximálních koster v tomto grafu?
Řešení. 16.
9.27
9.33. Problém obchodního cestujícícho. Z naší krátké exkurze do grafových
problémů a algoritmů by mohl vzniknout dojem, že je v zásadě možné nalézat hezké
a jednoduché algoritmy řešící uvažované problémy. To bylo ale způsobeno tím, že
jsme si dosud vybírali pouze problémy jednoduché. V drtivé většině případů je
tomu naopak, teoretické výsledky pouze ukazují, že algoritmus fungující alespoň v
polynomiálním čase neexistuje a používají se takové, které dávají výsledky rozumně
dobré, nikoliv však optimální.
Jedním z nejsledovanějších takových kombinatorických problémů je úloha, kdy
máme najít v grafu s ohodnocenými hranami minimální hamiltonovskou kružnici,
tzn. kružnici s minimálním součtem vah použitých hran mezi všemi možnými hamiltonovskými
kružnicemi.
Praktické vyjádření ne vždy na první pohled prozradí, že jde právě o tento
problém. Setkáváme se s ním např. při
* plánování dodávek zboží nebo služeb
* organizaci poštovní služby (rozvoz pošty, výběr pošty ze schránek)
* plánování údržby sítí (např. bankomatů)
* obsluha požadavků z fronty (např. při paralelních požadavcích na čtení z hard
disku)
* plánování postupného měření jednotlivých částí celku (např. při studiu struktury
krystalu proteinu pomocí rentgenu, kdy náklady jsou soustředěny zejména
na posuvy a zaostření pro jednotlivá měření)
* plánování dělení materiálů (např. při kladení tapet jejich dělení na použité pásy
tak, aby navazoval vzorek a došlo k co nejmenším ztrátám)
I v případě hledání minimální hamiltonovské kružnice můžeme uplatnit hladovecký
(anglicky ,,greedy ) přístup. Algoritmus začne v libovolném vrcholu v1, který
se stane aktivním a všechny ostatní si označí za spící. Postupuje pak postupně v
krocích tak, že vždy najde ten dosud neumístěný vrchol z spících, do kterého vede
z aktivního vrcholu nejméně ohodnocená hrana, aktivní vrchol označí jako zpracovaný,
tento nový vrchol se stane aktivním. Algoritmus skončí buď neúspěchem,
když nenajde žádnou hranu z aktivního uzlu do spícího uzlu, ale hamiltonovská
kružnice ještě nebyla nalezena, nebo využitím všech vrcholů. Pokud ve druhém přípědě
existuje hrana z posledního přidaného uzlu vn do v1, získáme hamiltonovskou
kružnici.
320 9. KOMBINATORICKÉ METODY
Je zjevné, že tento algoritmus jen velice zřídka vyprodukuje skutečně minimální
hamiltonovskou kružnici. Na úplném grafu zato vždy alespoň nějakou najde. Je dokázáno,
že se dokonce polynomiálně rychlými algoritmy nelze libovolně přibližovat
k optimálnímu řešení.
9.28
9.34. Toky v sítích. Další skupina aplikací jazyka teorie grafů se týká přesunu
nějakého měřitelného materiálu v pevně zadané síti. Vrcholy v orientovaném grafu
představují body, mezi kterými lze podél hran přenášet předem známá množství,
která jsou zadána formou ohodnocení hran. Některé vybrané vrcholy představují
zdroj sítě ), jiné výstup ze sítě. Podle analogie potrubní sítě pro přenos kapaliny
říkáme výstupním vrcholům stok sítě ). Síť je tedy pro nás orientovaný graf s ohodnocenými
hranami a vybranými vrcholy, kterým říkáme zdroje a stoky.
Je zřejmé, že se můžeme bez újmy na obecnosti omezit na orientované grafy
s jedním zdrojem a jedním stokem. V obecném případě totiž vždy můžeme přidat
jeden stok a jeden zdroj navíc a spojit je vhodně orientovanými hranami s všemi
zadanými zdroji a stoky tak, že ohodnocení přidaných hran bude zároveň zadávat
maximální kapacity jednotlivých zdrojů a stoků. Situace je naznačena na obrázku,
kde černými vrcholy nalevo jsou zobrazeny všechny zadané zdroje, zatímco černé
vrcholy napravo jsou všechny zadané stoky. Nalevo je jeden přidaný (virtuální) zdroj
jako bílý vrchol a napravo jeden stok. Označení hran není v obrázku uvedeno.
Definice. Síť je orientovaný graf G = (V, E) s vybraným jedním vrcholem z nazvaným
zdroj a jiným vybraným vrcholem s nazvaným stok, spolu s nezáporným
ohodnocením hran w : E  R. Tokem v síti S = (V, E, z, s, w) rozumíme ohodnocení
hran f : E  R takové, že součet hodnot u vstupních hran u každého vrcholu
v, kromě zdroje a stoku, je stejný jako součet u výstupních hran z téhož vrcholu,
tj.
eIN(v)
f(e) =
eOUT (v)
f(e).
Velikost toku f je dána celkovou balancí hodnot u zdroje
.
Z definice je zřejmé, že velikost toku můžeme stejně dobře vypočíst jako hod-
notu
|f| =
eIN(s)
f(e) eOUT
(v)
f(e).
Na obrázku máme nakreslenu jednoduchou síť se zvýrazněným bílým zdrojem
a černým stokem. Součtem maximálních kapacit hran vstupujících do stoku vidíme,
že maximální možný tok v této síti je 5.
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 321
4
0011
0
0
1
1
0
0
1
1
0
0
1
1
0011
0011
00110011
0011
2
3
2
5
3
3
2
2
1
3
2 1
2
0
0
1
1
9.29
9.35. Problém maximálního toku v síti. Naší úlohou bude pro zadanou síť na
grafu G určit maximální možný tok. Na konci minulého odstavce jsme pohledem na
obrázek zjistili, že maximální tok v této síti nemůže přesáhnout císlo 5. Podstatné
na naší úvaze bylo, že jsme sečetli hodnoty maximálních kapacit u množiny hran,
pres které musí jít každá cesta ze z do s. Zároven umíme snadno najít tok, který
toto maximum skutecne realizuje (protože je naše sít tak jednoduchá). Tuto rozvahu
mužeme zformalizovat takto:
Definice. Řezem v síti S = (V, E, z, s, w) rozumíme takovou množinu hran C  E,
že po jejím odebrání nebude v grafu G = (V, E \ C) žádná cesta z z do s. Číslo
|C| =
eC
w(e)
nazýváme velikost řezu C.
Evidentně platí, že nikdy nemůžeme najít větší tok, než je hodnota kteréhokoliv
z řezů. N a dalším obrázku máme zobrazen tok sítí s hodnotou 5 a čárkovanými
lomenými čarami jsou naznačeny řezy o hodnotách 12, 8 a 5.
2/3
0011
0011
0011 0011
0
0
1
1
0
0
1
1
00110011
0
0
1
1
2/2
1/3
1/2
0/2
1/2 1/1
0/2
1/3
2/2
2/4
1/3
2/5
1/1
0011
Sestavíme funkční algoritmus, který pomocí postupných konstrukcí vhodných
cest najde řez s minimální možnou hodnotou a zároveň najde tok, který tuto hodnotu
realizuje. Tím dokážeme následující větu:
Věta. Maximální velikost toku v dané síti S = (V, E, z, s, w) je rovna minimální
velikosti řezu v této síti.
Myšlenka algoritmu je vcelku prostá ­ prohledáváme cesty mezi uzly grafu a
snažíme se je ,,nasytit co největším tokem. Zavedeme si za títo účelem terminologii.
O neorientované cestě v síti S = (V, E, z, s, w) z vrcholu v do vrcholu w řekneme,
že je nenasycená, jestliže pro všechny hrany této cesty orientované ve směru z v do
w platí f(e) < w(e) a f(e) > 0 pro hrany orientované opačně. Za rezervu kapacity
hrany e pak označujeme číslo w(e) - f(e) pro případ hrany orientované ve směru
z v do w a číslo f(e) při orientaci opačné. Pro zvolenou cestu bereme za rezervu
kapacity minimální rezervu kapacity z jejích hran.
322 9. KOMBINATORICKÉ METODY
Fordův-Fullkersonův algoritmus. Vstupem je síť S = (V, E, z, s, w) a výstupem
maximální možný tok f : E  R.
* Iniciace: zadáme f(e) = 0 pro všechny hrany e  E a prohledáváním do šířky
z vrcholu z najdeme množinu vrcholů U  V , do kterých existuje nenasycená
cesta;.
* Hlavní cyklus: Dokud s  U opakujeme
­ zvolíme nenasycenou cestu P ze zdroje z do s a zvětšíme tok f u všech
hran této cesty o její minimální rezervu
­ obnovíme U.
* na výstup dáme maximální tok f a minimální řez C tvořený všemi hranami
vycházejícími z U a končícími v doplňku V \ U.
Důkaz správnosti algoritmu. Jak jsme viděli, velikost každého toku je nejvýše
rovna hodnotě kteréhokoliv řezu. Stačí nám tedy ukázat, že v okamžiku zastavení
algoritmu jsme vygenerovali řez i tok se stejnou hodnotou.
Algoritmus se zastaví při prvním případu, kdy neexistuje nenasycená cesta ze
zdroje z do stoku s. To znamená, že U neobsahuje s a pro všechny hrany e z U do
zbytku je f(e) = w(e), jinak bychom museli koncový vrchol e přidat k U.
Zároveň ze stejného důvodu všechny hrany e, které začínají v komplementu
V \ U a končí v U musí mít tok f(e) = 0.
Pro velikost toku celé sítě jistě platí
|f| =
hrany z U do V \ U
f(e) hrany
z V \ U do U
f(e).
Tento výraz je ovšem v okamžiku zastavení roven
hrany z U do V \ U
f(e) =
hrany z U do V \ U
w(e) = |C|,
což jsme chtěli dokázat.
Zbývá ovšem ukázat, že algoritmus skutečně zastaví.
Všimněme si, že pro celočíslené hodnoty ohodnocení hran získáme také celočíselný
tok.
0/3
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0/2
0/2
0/2 1/1
0/2
0/3
0/2
2/4
0/3
1/5
0/1
2/3
2/2
0011
0/3
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
0/2
0/2
2/2 1/1
0/2
2/3
2/2
2/4
0/3
3/5
0/1
2/3
2/2
0011
Chod algoritmu je ilustrován na obrázku. Vlevo jsou vybaveny dvě nejkratší nenasycené
cesty ze zdroje do stoku (horní má dvě hrany, spodní tři). Jsou vyznačeny
červeně. Napravo je pak nasycena další cesta v pořadí a je vyznačena modře. Je
nyní zjevné, že nemůže existovat další nenasycená cesta ze zdroje do stoku. Proto
algoritmus v tomto okamžiku skončí.
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 323
9.30
9.36. Dodatečné podmínky na tok. Naše úloha připouští i další podmínky.
Můžeme např. požadovat dodržení maximální kapacity průtoku přes jednotlivé vrcholy.
Nebo můžeme chtít dodržet nejen maximální ale také minimální toky přes
jednotlivé hrany či vrcholy.
Přidání kapacit vrcholů je jednoduché ­ prostě vrcholy zdvojíme a dvojčata
oznčující vstup do vrcholu a výstup z vrcholu spojíme právě jednou hranou s příslušnou
kapacitou.
Omezení minimálními průtoky lze zahrnout do iniciace našeho algoritmu. Je
ovšem zapotřebí otestovat, jestli takový tok vůbec existuje.
V literatuře lze najít řadu dalších nuancí, nebudeme se jim zde věnovat.
9.37. Příklady.
9.37.1. Řezem v síti (V, E, z, s, w) můžeme také rozumět množinu hran C  S
takovou, že v síti (V, E \C, z, s, w) neexistuje žádná cesta ze zdroje z do stoku (cíle,
spotřebiče) s, ale pokud z C odebereme libovolnou hranu e, tak už nová množina
tuto vlastnost mít nebude, tedy v (V, E\Ce, z, s, w) existuje cesta ze z do s. Určete
všechny tyto řezy (a jejich hodnoty) v následující síti:
4
5
6 2
1
2
10
Z
S
4
2
2
Řešení. Označíme-li hrany dle obrázku
Z
S
a
b
c d e
f
gh
i
j
pak jsou řezy následující: {f,i},{f,h,j,a},{f,j,c,a,d,e},{f,j,c,a,d,f}, {b,j,c},{b,j,h},{b,i},
jejich hodnoty jsou pak 12, 9, 20, 18, 15, 10, 15.
9.37.2. Najděte maximální tok v síti z předchozího příkladu.
Řešení. Z teorie a předchozího příkladu víme, že hodnota maximálního řezu je
9. Tento tok f není zadán jednoznačně. Můžeme volit například f(a) = 2, f(b) =
4, f(c) = 1, f(h) = 1, f(j) = 4, f(f) = 2, f(i) = 7, f(v) = 0 pro všechny ostatní
hrany v daného grafu.
9.37.3. Určete maximální tok a jemu odpovídající minimální řez v následujícím
ohodnoceném orientovaném grafu:
324 9. KOMBINATORICKÉ METODY
01 01
01
0101
01 01
8
7
10
7
12
13
8
18
28
16
5
9
18
17
7 6
20
17
8
Z
S
A B
C D
E F
13
Řešení. Min. řez. dán množinou {F, S}, jeho hodnota je 39.
9.37.4. Určete maximální tok a jemu odpovídající minimální řez v následujícím
ohodnoceném orientovaném grafu:
01 01
01
0101
01 01
13
19
23
8
7
11
9 7
10
15
14
7
17
23
11
9
20
15
10
2
Z S
A B
C D
E F
Řešení. Řez je dán množinou {F, S, D}, hodnota je 29.
9.37.5. Určete maximální tok a jemu odpovídající minimální řez v následujícím
ohodnoceném orientovaném grafu:
01 01
01
0101
01 01
10
20
30
9
9
19
20
20
5
10
8
9 7
4
8
11
5
9
12
14
Z
S
A B
C D
E F
Řešení. Min. řez odpovídá množině (B, D, S). Hodnota je 40.
9.37.6. Určete maximální tok a jemu odpovídající minimální řez v následujícím
ohodnoceném orientovaném grafu:
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 325
01 01
01
0101
01 01
20
18
3
7
5 10
7
11
9
12
8
20
17
10
11
9
11
Z
S
A B
C D
E F
7
2
2
Řešení. Min. řez je dán množinou {Z, A, E}. Hodnota je 32.
9.31
9.38. Další aplikace. Hezkým využitím toků v sítí je řešení úlohy bipartitního
párování. Úlohou je v bipartitním grafu najít maximální párování, tedy maximální
podmnožinu hran takovou, aby žádné dvě hrany nesdílely vrchol.
Jde o abstraktní variantu docela obvyklé úlohy ­ třeba spárování kluků a holek
k tanci v tanečních, kdybychom měli předem známé možnosti, ze kterých vybíráme.
Tento problém docela snadno převedeme na hledání maximálního toku. Přidáme
si uměle navíc ke grafu zdroj, který propojíme hranami jdoucími do všech
vrcholů v jedné skupině v bipartitním grafu, zatímco ze všech vrcholů ve druhé
skupině vedeme hranu do přidanéhoho stoku. Všechny hrany opatříme maximální
kapacitou 1 a hledáme maximální tok. Za páry pak bereme hrany s nenulovým
tokem.
Jiným využitím toků je důkaz tzv. Mengerovy věty (uvedli jsme ji jako tvzerní
v 9.12). Můžeme se na ně dívat takto: V orientovaném grafu ohodnotíme všechny
hrany e maximální kapacitou 1 a totéž pro všechny vrcholy. Dále si zvolíme libovolnou
dvojici vrcholů v a w, které považujeme za zdroj a stok. Jestliže nás
pak zajímá tok tímto grafem, dostaneme právě počet zcela různých cest z v do w
(hrany i vrcholy jsou různé kromě začátku a konce). Každý řez přitom odděluje v
a w do různých souvislých komponent zbylého grafu. Ze skutečnosti, že hodnota
minimálního řezu je rovna hodnotě toku v síti nyní vyplývá požadované tvrzení.
9.39. Příklady.
9.39.1. Nalezněte maximální párování následujícího bipartitního grafu:
A
B
C
D
E
F
G
T
U
V
W
X
Y
Z
Pro maximální tok určující Vámi nalezené maximální párování dále určete jemu
odpovídající minimální řez v síti.
326 9. KOMBINATORICKÉ METODY
Řešení. Z daného bipartitního grafu vyrobíme síť přidáním zdroje Zd a stoku
St, orientovaných hran (Zd, A), . . . , (Zd, G), (T, St), . . . , (Z, St), stávající hrany orientujeme
,,abecedně od nižšího písmena k vyššímu, všem hranám pak přiřadíme
kapacitu 1. Ford-Fulkersonovým algoritmem pak snadno nalezneme některý maximální
tok a jemu odpovídající max. párování. Jeden z možných maximálních toků
je vyznačen na následujícím obrázku (červené hrany znázorňují tok o velikosti 1
danou hranou zleva do prava):
A
B
C
G
T
U
V
W
X
Y
Z
Zd
E
D
F
St
Odpovídající maximální párování (A, W), (B, Z), (C, T), (D, V ), (F, X), (G, Y ).
Modře jsou v obrázku vyznačeny vrcholy, do nichž existuje rezervní cesta, minimální
řez je pak tvořen hranami jdoucích z modrých vrcholů do černých vrcholů,
tedy hranami (Zd, A), (Zd, B),(Zd, C),(V, St),(X, St),(Y, St).
9.32
9.40. Stromy her. Obrátíme teď naši pozornost k velice rozšířeným užitím stromových
struktur při analýzách možných strategií nebo postupů. Zcela jistě se s
nimi setkáme v teorii umělé inteligence a v části teorie her. Své místo ale mají také
v ekonomii a mnoha dalších oblastech lidských činností.
Budeme v této souvislosti hovořit o hrách. V matematickém smyslu se teorie
her zabývá modely, ve kterých jeden nebo více partnerů činí kroky podle předem
známých pravidel a většinou také ve předem známém pořadí. Většinou se možné
kroky nebo úkony ohodnocují nějakými výnosy nebo ztrátami pro daného partnera.
Smyslem je pak nalezení strategie hráče, tj. algoritmického postupu, podle kterého
může hráč maximalizovat výnos, případně minimalizovat ztrátu.
Budeme se zabývat tzv. extenzivním popisem her. To je takový popis, kdy
máme k dispozici úplnou a konečnou analýzu všech možných stavů hry a výsledná
analýza zadává skutečně přesnou rozvahu o výnosech či ztrátách za předpokladu
nejlepšího možného chování zúčastněných partnerů. Strom hry je kořenový strom,
který má za uzly všechny možné stavy hry, a tyto uzly budou označeny podle toho,
který z hráčů je zrovna na tahu. Hrany budou všechny možné tahy daného hráče v
daném stavu. Takový úplný popis pomocí stromu můžeme konstruovat pro běžné
hry jako jsou piškvorky, šachy, apod.
Jako jednoduchý příklad uveďme jednoduchou variantu hry Nim. (Názem zavedl
patrně Charles Bouton ve své analýze těchto her z roku 1901 ­ prý pochází z
německého ,,Nimm! , což česky znamená ,,Ber! .)
Na stole leží na jedné hromádce k sirek, kde k > 1 je přirozené číslo, a hráči
postupně odebírají každý jednu nebo dvě sirky. V normální variantě hry vyhraje
ten, kdo jako poslední má co vzít. Ve variantě hry ,,na žebráka naopak prohrává
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 327
ten, kdo vzal všechny zbývající sirky. Strom takové hry, včetně všech potřebných
informací můžeme setrojit následovně:
* Stavu s sirkami na stole a s prvním hráčem na tahu odpovídá podstrom s
kořenem označeným F , stavu s týmž počtem sirek a druhým hráčem na tahu
odpovídá podstrom s kořenem S .
* Uzel F má levého syna S -1 a pravého syn S -2, u uzlu S jsou to obdobně
synové F -1 a F -2.
* Listy jsou vždy buď F0 nebo S0 (při normálním režimu hry, při hře na žebráka
by to byly stavy F1 a S1, ve kterých příslušný hráč prohrál).
Každý průběh hrou začínající v kořenu Fk odpovídá právě jednomu listu výsledného
stromu. Je tedy vidět, že celkový počet p(k) možných her pro Fk je roven
p(k) = p(k - 1) + p(k - 2)
pro k  3 a snadno vidíme, že p(1) = 1 a p(2) = 2. Takovou diferenční rovnici
jsme už řešili. Jejím řešením jsou tzv. Fibonacciova čísla a umíme pro ně explicitní
formuli, viz. část o diferenčních rovnicích v první kapitole. Známe proto i formuli
pro počet možných průběhů her. Počet možných stavů hry je přitom roven počtu
všech uzlů ve stromu. Hra přitom vždy skončí výhrou buď prvního nebo druhého
hráče. U podobných her může kromě toho hra končit také remízou.
9.33
9.41. Analýza hry. Připravená stromová struktura nám teď snadno umožní analyzovat
hru tak, abchom mohli sestavit skutečně algoritmickou strategii pro každého
hráče. Je k tomu jednoduchý rekurzivní postup pro ohodnocení kořene podstromu.
Budeme označovat jako W uzly ve kterých (při optimální strategii obou) vítězí
první hráč a L v případě opačném, případně ještě můžeme značit jako T (z anglického
,,win a ,,loose z pohledu prvého hráče, znak T odpovídá anglickému ,,tie
ro remízu). Postup je tento:
(1) Listy označíme buď W nebo L, případně T, podle pravidel hry (u normálního
průběhu naší varianty Nim to tedy bude W pro S0 a L pro F0)
(2) Uzel F označíme W, jestliže existuje syn, který je W. Pokud takový syn neexistuje,
ale mezi syny existuje uzel s označením T, bude i označovaný uzel T.
Ve zbývajícím případě, kdy jsou všichni synové L bude i označovaný uzel L.
(3) Uzel S označíme L, jestliže existuje syn označený L. Pokud takový syn neexistuje,
ale mezi syny existuje uzel s označením T, bude i označovaný uzel T.
Ve zbývajícím případě, kdy jsou všichni synové W bude i označovaný uzel W.
Voláním této procedury na kořen stromu obdžíme ohodnocení všech uzlů a tím
také i strategii pro každého z hráčů:
* První hráč se snaží v každém svém kroku přesunout do uzlu označeném W,
pokud to ale nejde, hledá alespoň T
* Druhý hráč je se snaží v každém svém kroku dostat hru do uzlu označeného L,
pokud to nejde, hledá alespoň T.
Hloubka rekurze je dána hloubkou stromu. Např. u našeho Nim s k sirkami je to
právě k.
Získaná analýza ještě není příliš užitečná. Pro její užití v uvedené formě totiž
potřebujeme mít k dispozici celý strom hry a to je obecně skutečně velice mnoho dat
(u minipiškvorek na hřišti 3 × 3 má příslušný strom jednotlivé desítky tisíc uzlů).
Zpravidla se v takovéto podobě používá analýza pomocí stromové struktury tehdy,
když zkoumáme pouze malý úsek celého stromu pomocí vhodných heuristických
328 9. KOMBINATORICKÉ METODY
metod a tento kousek si naopak dynamicky utváříme během hry. To je fascinující
oblast moderní teorie umělé inteligence, my se jí zde ale nebudeme věnovat.
Pro naše potřeby úplné formální analýzy ale umíme najít kompaktnější vyjádření
stromové struktury grafu. Pokud si nakreslíme náš strom pro hru Nim, okamžitě
vidíme, že se nám mnohokráte opakují pořád ty stejné situace hry v různých listech,
a to podle toho, jaká byla historie hry. Ve skutečnosti, jsou ale strategie určeny
pouze počtem zbývajících sirek a tím, kdo je na tahu. Můžeme proto stejnou hru
popsat pomocí grafu, který bude mít za uzly počty zývajících sirek a celá strategie
bude zadána určením, jestli v dané situaci vyhrává ten, kdo je na tahu nebo naopak
ten, kdo táhl předtím. K popisu možných tahů budeme používat orientované hrany.
Příklad pro naši hru Nim je na obrázku. Nalevo je úplný strom pro hru se třemi
sirkami, napravo je orientovaný graf zobrazující hru se sedmi sirkami. Úplný strom
pro hru se sedmi sirkami by měl již 21 listů a počet listů roste exponenciálně s
počtem sirek!
5N
F0
L L
F3
L
S2 S1
F1 F0
W L L
S0
W
0P
1N
3P
7N
6P
4N
2N
Orientovaný acyklický graf má pro každý počet sirek právě jeden vrchol a ten
zároveň nese označení, zda při jeho průchodu celkově vyhrá ten, kdo je zrovna na
řadě (písmeno N od ,,next ), nebo ten druhý (písmeno P od slova ,,previous ).
Celkově je v něm vždy jen k + 1 vrcholů pro hru s k sirkami. Zároveň v sobě graf
uschovává kompletní strategii: pokud z uzlu, ve kterém se hráč nachází, vychází
hrana končící v uzlu s označením P, hráč použije tento tah.
Naopak, každý acyklický orientovaný graf můžeme považovat za popis hry.
Výchozími situacemi jsou v ní ty uzly, do kterých nevedou žádné hrany (jeden
nebo více), hra končí v listech (opět jeden nebo více). Strategii hry obdržíme opět
jednoduchou rekurzivně volanou procedurou:
* Listy označíme písmenem P (skutečně prohrává ten, kdo je na tahu a nachází
se v listu).
* Uzel grafu označíme jako N, pokud z něj vede hrana do uzlu označeného jako
P. V opačném případě označíme uzel jako P.
(Pro zjednodušení nyní uvádíme pouze případy her bez remíz.)
V našem speciálním případě hry Nim je tedy situace obzvláště jednoduchá. Z
uvedené strategie vyplývá, že hráč, který je na tahu prohrává, pokud je počet sirek
dělitelný třemi, a vyhrává ve zbylých dvou případech zbytků 1 a 2 po dělení třemi.
Hry, které umíme reprezentovat výše uvedeným způsobem pomocí acyklického
orientovaného grafu nazýváme nestranné. Jde právě o takévé hry, ve kterých
* V každé herní situaci mají oba hráči stejné možnosti tahů.
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 329
* Hra má konečný celkový počet herních situací.
* Hra má tzv. nulový součet, tj. lze její výsledek formulovat pomocí výhry jednoho
(a tím prohry druhého) hráče, resp. remízy.
Příkladem nestranné hry jsou např. piškvorky na předem známém rozměru použité
čtverečkové sítě. Zde sice hráči používají různé symboly, podstatné ale je, že je
mohou umístit do kteréhokoliv dosud neobsazeného pole. Naopak šachy nestrannou
hrou v tomto smyslu nejsou, protože možné tahy jednotlivých hráčů jsou v každé
situaci silně závislé od množství figurek, které zrovna mají k dispozici.
9.34
9.42. Součet her. Klasická hra Nim se hrává poněkud složitěji. Hráči mají před
sebou tři hromádky sirek (nebo jiných objektů), každou o daném počtu k. Ten kdo
je na řadě může brát libovolný počet sirek, ale pouze z jedné hromádky. Vyhrává,
při normální hře, ten, kdo bere naposled. (Při hře na žebráka takový hráč naopak
prohrává.) Pokud bychom takto hráli s jednou hromádkou, je to jednoduché. První
hráč shrábne vše a druhý prohrál. Se třemi to ovšem tak snadno nepůjde. Zároveň se
nám patrně nechce věřit, že znalost analýzy možností pro jednu hromádku nebude
pro takovouto kombinovanou hru užitečná.
Zavedeme si tzv. součet nestranných her. Věcně to bude tak, že situace ve
hře kombinované ze dvou současných her budou uspořádané dvojice jednotlivých
možných situací. Tahem pak rozumíme využití možného tahu v jedné z her (a
druhá zůstane nezměněna). Jsou-li G1 = (V1, E1) a G2 = (V2, E2) dva acyklické
orientované grafy, pak jejich součtem rozumíme graf G = (V, E), kde
V = V1 × V2
E = {(v1v2, w1v2); (v1, w1)  E1}  {(v1v2, v1w2); (v2, w2)  E2}.
V případě jedné hry jsme si vystačili s postupným označováním uzlů grafu od
listů písmeny N a P podle toho, jestli je nebo není (pomocí orientovaných hran)
,,vidět nějaké P. V součtu her se ovšem pohybujeme po jednotlivých hranách
složitěji, budeme proto potřebovat jemnější nástroj, jak si vyjadřovat dosažitelnost
uzlů značených jako P z dalších uzlů. Dobře k tomu poslouží tzv. SpragueovaGrundyova
funkce g : V  N, kterou definujeme na acyklickém orientovaném grafu
G = (v, E) rekurzivně takto:
(1) Všechny listy v označíme g(v) = 0.
(2) Pro vrchol v  V definujeme
g(v) = min{a  N; neexistuje hrana (v, w) s g(w) = a}.
Při definici jsme použili funkci, které se říkává minimální vyloučená hodnota.
Definujeme ji pro podmnožiny S přirozených čísel N = {0, 1, . . . } vztahem
mex S = min N \ S.
Naše funkce g(v) je právě mex S pro množinu S všech hodnot g(w), které podél
hran vidím z vrcholu v.
Na přirozených číslech definujeme ještě jednu operaci. Je to binární operace
(a, b)  a  b, kterou dostaneme tak, že vyjádříme čísla a a b ve dvojkové soustavě
a vzniklé vektory a a b ve vektrovém prostoru (Z2)k
nad Z2 sečteme (k je dostatečně
velké). Výsledkem je opět vyjádření pro ab ve dvojkové soustavě. Sčítání vektorů
ve (Z2)k
je známá operace XOR na jednotlivých bitech.
Věta. (1) Vrchol v  V v orientovaném acyklickém grafu G = (V, E) je P pozice
právě, když je hodnota Spragueovy­Grundyho funkce g(v) = 0.
330 9. KOMBINATORICKÉ METODY
(2) Pro orientované acyklické grafy G1 = (V1, E1), G2 = (V2, E2) a G = (V, E) =
G1 + G2 a jejich Spragueovy­Grundyovy funkce g1, g2 a g platí:
g(v1v2) = g1(v1)  g2(v2)
Důkaz. První tvrzení věty je zřejmé.
Důkaz druhé části povedeme následovně: nechť (v1v2) je pozice hry G1 + G2 a
nechť a  N0, a < g1(v1)g2(v2) je jinak libovolné. Ukážeme, že existuje stav (x1x2)
hry G1 + G2 tak, že (v1v2, x1x2)  E a zároveň pro žádnou hranu (v1v2, y1y2)  E
neplatí g1(y1)  g2(y2) = g1(v1)  g2(v2).
i) Nechť tedy a < g1(v1)  g2(v2). Uvažme číslo b := a  g1(v1)  g2(v2). Nechť
binární zápis tohoto čísla má k cifer. Potom na k-tém místě v binárním rozvoji
čísla g1(v1)+g2(v2) musí být cifra 1 (právě jedno z čísel a a g1(v1)g2(v2) tam
musí mít cifru 1 a nemůže to být číslo a, protože ve vyšších řádech si obě čísla
musejí být rovna a číslo a je menší). Tedy právě jedno z čísel g1(v1) a g2(v2) má
na k-tém místě cifru 1. Bez ujmy na obecnosti předpokládejme, že to je g1(v1),
a uvažme číslo c := g1(v1)  b. Toto číslo je v binárním zápise nejvýše k - 1
ciferné (obě sčítaná čísla mají v k-tém řádu cifru 1), je tedy menší než g1(v1).
Potom dle definice funkce v1 existuje stav w1 hry G1 takový, že (v1, w1)  E1
a g1(w1) = c. Nyní však (v1v2, w1v2)  H a g1(w1)  g2(v2) = c  g2(v2) =
g1(v1)  b  g2(v2) = g1(v1)  a  g1(v1)  g2(v2)  g2(v2) = a.
ii) Nechť (v1v2, y1y2), kde (v1, y1)  E1), je hrana v G a nechť g1(y1)  g2(y2) =
g1(v1)  g2(v2). Pak ovšem g1(y1)  g2(v2) = g1(v1)  g2(v2) a tedy g1(y1) =
g1(v1), ale to je ve sporu s vlastnostmi Spragueovy-Grundyovy funkce g1 hry
G1.
Z věty okamžitě dostáváme srozumitelný a prakticky užitečný výsledek:
Důsledek. Vrchol v1v2 v součtu grafů je P­pozice právě, když g1(v1) = g2(v2).
Poznámka. V tomto textu nemůžeme jít do podrobností, obecně lze ale dokázat, že
každý konečný acyklický orientovaný graf je izomorfní s konečným součtem vhodně
zobecněných her Nim. Naší analýzou jednoduché hry a konstrukcí funkce g jsme
tedy v podstatě (alespoň implicitně) zvládli analýzu všech nestranných her.
9.35
9.43. Vytvořující funkce. Docela často jsou v kombinatorických úvahách užitečné
výsledky dosahované ve ,,spojitých metodách , tj. zejména klasické matematické
analýze. Tomu můžeme rozumět i naopak ­ v podstatě byly všechny výsledky
v analýze dosaženy vhodným přeložením problému na kombinatorickou úlohu (za
příklad může sloužit třeba převedení problému integrace racionálních funkcí lomených
na rozklad těchto funkcí na tzv. parciální zlomky). Není proto divu, že tyto
již zvládnuté postupy můžeme dobře využívat přímo.
V závěru naší procházky po aplikacích kombinatorických postupů se proto podíváme
alespoň na jednu oblast, kde se nám shodí znalosti ze spojitých metod.
Začněme jednoduchým příkladem: Máme v peněžence 4 korunové mince, 5 dvoukorunových
a 3 pětikorunové. Z automatu, který nevrací, chceme Colu za 22 Kč.
Kolika způsoby to umíme, aniž bychom ztratili přeplatek? Hledáme zjevně čísla i, j
a k taková, že i + j + k = 22 a zároveň
i  {0, 1, 2, 3, 4}, j  {0, 2, 4, 6, 8, 10}, k  {0, 5, 10, 15}.
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 331
Uvažme součin polynomů (třeba nad reálnými čísly)
(1 + x2
+ x3
+ x4
)(x2
+ x4
+ x6
+ x8
+ x10
)(x5
+ x10
+ x15
).
Mělo by být zřejmé, že hledaný počet řešení je právě koeficient u x22
ve výsledném
polynomu. Skutečně tak dostáváme 4 možnosti 35+32+11, 35+22+31,
2  5 + 5  2 + 2  1 a 2  5 + 4  2 + 4  1.
Tento prostinký příklad zasluhuje větší pozornost, než by se mohlo na první
pohled zdát. Jednotlivé polynomy svými koeficienty vyjadřovaly posloupnost hodnot,
kterých jsem uměli dosahovat: Jestliže budeme (pro jistotu, abychom nemuseli
předem dělat odhady velikostí) pracovat s nekonečnými posloupnostmi, pak pomocí
jednotlivých korun umíme dosáhnout hodnot 0, 1, 2, . . . s četnostmi
(1, 1, 1, 1, 1, 0, 0, . . . )
(pokračují samé nuly), u dvoukorun a pětikorun to budou poslounosti četností
(1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, . . . ), (1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, . . . ).
Ke každé takové posloupnosti s konečně mnoha nulovými členy můžeme přiřadit
polynom a hodou okolností řešení naší úlohy bylo možné odečíst ze součinu těchto
polynomů. Takový postup můžeme používat obecně pro práci s posloupnostmi.
Definice. Vytvořující funkce pro nekonečnou posloupnost a = (a0, a1, a2, . . . ) je
(formální) mocninná řada
a(x) = a0 + a1x + a2x2
+    =

i=0
aixi
.
Některým jednoduchým operacím s posloupnostmi odpovídají jednoduché operace
nad mocninnými řadami:
* Sčítání (ai +bi) posloupností člen po členu odpovídá součet a(x)+b(x) příslušných
vytvořujících funkcí.
* Vynásobení (  ai) všech členů posloupnosti stejným skalárem  odpovídá
vynásobení   a(x) příslušné vytvořující funkce.
* Vynásobení vytvořující funkce a(x) monomem xk
odpovídá posunutí posloupnosti
doprava o k míst a její doplnění nulami zleva.
* Pro posunutí posloupnosti doleva o k míst (tj. vynechání prvních k míst posloupnosti)
nejprve od a(x) odečteme polynom bk(x) odpovídají posloupnosti
(a0, . . . , ak-1, 0, . . . ) a poté podělíme vytvořující funkci xk
.
* Dosazením monomu f(x) za x vytvoříme specifické kombinace členů původní
posloupnosti. Jednoduše je vyjádříme pro f(x) = x, což odpovídá vynásobení
k­tého členu posloupnosti skalárem k
. Dosazení f(x) = xn
nám do posloupnosti
mezi každé dva členy vloží n - 1 nul.
První dvě pravidla říkají, že přiřazení vytvořující funkce posloupnosti je homomorfismus
vektorových prostorů nad zvoleným prostorem skalárů.
9.36
9.44. Příklady vytvořujících funkcí. Uvedeme několik jednoduchých příkladů
vytvořujících funkcí. Řadu z nich jsme viděli při práci s mocninnými řadami ve
třetí části šesté kapitoly. Snad si všichni vzpomenou na vytvořující funkci zadanou
geometrickou řadou:
a(x) =
1
1 - x
= 1 + x + x2
+ . . .
332 9. KOMBINATORICKÉ METODY
která tedy odpovídá konstantní posloupnosti (1, 1, 1, . . . ). Obecně, pro každou posloupnost
ai s členy velikosti |an| = O(nk
) s konstantním exponentem k, konverguje
její vytvořující funkce na nějakém okolí nuly (viz 5.31 a 6.30). Můžeme s nnimi pak
opravdu na konvergenčním intervalu zacházet jako s funkcemi, zejména je umíme
sčítat, násobit, skládat, derivovat a integrovat.
Několik jednoduchých příkladů ­ DODĚLAT ????
9.37
9.45. Diferenční rovnice s konstantními koeficienty. Hezkým a poučným
příkladem na užití vytvořujících funkcí je úplná diskuse řešení lineárních diferenčních
rovnic s konstantními koeficienty. Zabývali jsme se jimi již v třetí části první
kapitoly, viz např. 1.16. Tam jsme ale přímo odvodili vzorec pro rovnice prvního
řádu, odůvodnili jednoznačnost a existenci řešení, ale řešení samo jsme pak v podstatě
,,uhádli . Nyní můžeme řešení skutečně odvodit.
Zkusme nejprve dobře známý příklad Fibonaciovy posloupnosti zadané reku-
rencí
Fn+2 = Fn + Fn+1, F0 = 0, F1 = 1
a pišme F(x) pro vytvořující funkci této posloupnosti. Definiční rovnost můžeme
vyjádřit pomocí F(x), když použijeme naše operace pro posuv členů poslounosti.
Víme totiž, že xF(x) odpovídá posloupnosti (0, F0, F1, F2, . . . ) a x2
F(x) posloupnosti
(0, 0, F0, F1, . . . ). Proto vytvořující funkce xF(x) + x2
F(x) - F(x) odpovídá
posloupnosti
(-F0, F0 - F1, 0, 0, . . . , 0, . . . ).
Obdrželi jsme tedy rovnici pro vytvořující funkci F(x):
(1 - x - x2
)F(x) = x.
Abychom lépe viděli odpovídající posloupnost, můžeme ještě výsledný výraz upravit
na součet jednodušších. Víme totiž, že lineární kombinace vytvořujících funkcí
odpovídá stejným kombinacím posloupností. Racionální funkce lomené jsme se naučili
rozkládat na tzv. parciální zlomky, viz 6.18. Tímto postupem vyjádříme
F(x) =
1
1 - x - x2
=
A
x - x1
+
B
x - x2
=
a
1 - 1x
+
b
1 - 2x
kde A, B jsou vhodné (obecně) komplexní konstanty a x1, x2 jsou kořeny polynomu
ve jmenovateli. Konstanty a, b, 1 a 2 získáme jednoduchou úpravou jednotlivých
zlomků. Výsledkem je obecné řešení pro naši vytvořující funkci
F(x) =

n=0
(an
1 + bn
2 )xn
a tím i obecně řešení naší rekurence. Srovnejte tento postup s výsledkem v 1.17.1.
Pro obecné lineární diferenční rovnice řádu k je účinný stejný postup. Je-li
Fn+k = a0Fn +    + ak-1Fn+k-1,
pak vytvořující funkce pro výslednou posloupnost je
F(x) =
xk-1
1 - a0xk-1 -    - ak-1x
.
Rozkladem na parciální zlomky dostaneme obecný výsledek, který jsme zmiňovali
již v odstavci 3.6.
2. APLIKACE KOMBINATORICKÝCH POSTUPŮ 333
9.38
9.46. Pěstované binární stromy. Jako další příklad uvedeme výpočet počtu pn
neizomorfních pěstovaných binárních stromů na n vrcholech.
Každý takový pěstovaný strom je vyjádřen jako kořen, podstrom jeho levého
syna a podstrom jeho pravého syna (které mohou být i prázdné). Výjimkou je
pouze strom na prázdné množině uzlů, který nemá ani kořen. Pro nízké hodnoty n
můžeme určit přímo (jediný prázdný strom, na jednom uzlu pouze kořen, na dvou
uzlech je buď pravý nebo levý syn atd.):
p0 = 1, p1 = 1, p2 = 2, p3 = 5, . . . .
Označme si P(x) = p0 + p1x + p2x2
+ . . . vytvořující funkci pro naši posloupnost
pi. Protože pro každé rozdělení n - 1 uzlů mezi dva syny můžeme použít kterékoliv
ze synů nezávisle na sobě, platí pro počet všech různých možností vztah
pn =
i+j=n-1
pi  pj
kde i, j  0. To je ovšem koeficient u xn-1
ve funkci P(x)P(x). Odvodili jsme tedy
vztah (konstatní jednička napravuje první člen po posuvu o jednu pozici doprava)
P(x) = 1 + x(P(x))2
.
Odtud spočteme P(x) jako řešení kvadratické rovnice (x považujeme za parametr,
zatímco P(x) hledanou neznámou), tj.
P(x) =
1 

1 - 4x
2x
.
Protože naše hodnota P(x) se pro x  0+ blíží k hodnotě p0 = 1, nemůže vyhovovat
řešení se znaménkem +. Zkusíme tedy znaménko mínus. Abychom dostali řešení,
potřebujeme vyjádřit jako mocnicnou řadu výraz

1 - 4x. Dosazením této řady a
dalšími úpravami dostáváme
pn = -
1
2
(-4)n+1 1/2
n + 1
=
1
n + 1
2n
n
.
Jsou to tzv. Catalánova čísla, která se v kombinatorice často objevují.
KAPITOLA 10
Algebraické struktury a techniky
čím větší abstrakce, tím větší zmatek?
­ ne, často to bývá naopak ...
Nyní se vrátíme k docela formálnímu studiu pojmů, jejichž na první pohled
zcela abstraktní definice ve skutečnosti odráží velmi širokou třídu reálných vlastností
věcí kolem nás. Určitě bude užitečné si před dalším čtením připomenout první
a šestou část první kapitoly, kde jsme podobně abstraktně pohlíželi na čísla, se kterými
počítáme, a obecněji na vztahy mezi objekty, které jsme abstrahovali do tzv.
relací.
1. Grupy
Budeme si pohrávat s objekty a se situacemi, ve kterých je možné rovnice
a  x = b vždy jednoznačně řešit (tak jako u lineárních rovnic jsou objekty a a b
jsou dány, zatímco x hledáme). Půjde o tzv. teorii grup. Všimněme si, že zatím nic
nevíme o povaze objektů, ani co znamená ta tečka.
Nejprve si zavedeme malý slovníček pojmů. Následně projdeme příklady, ve
kterých se s takovými objekty potkáváme. A pak už budeme moci ,,budovat teo-
rii...
10.1 10.1. Definice. Pro libovolnou množinu A:
* binární operace na A je zobrazení A × A  A, které budeme zpravidla značit
(a, b)  a  b, množina s binární operací je grupoid
* binární operace je asociativní, jestliže pro všechny prvky v A platí a  (b  c) =
(a  b)  c
* binární operace je komutativní, jestliže pro všechny prvky v A platí a  b = b  a
* levá jednotka v A je takový prvek e  A, že pro všechny prvky v A platí ea = a;
obdobně pro pravou jednotku musí platit pro všechny prvky a  e = a
* jednotka binární operace je prvek e, který je pravou i levou jednotkou zároveň
* pologrupa (A, ) je grupoid s binární operací, která je asociativní
* prvek a-1
je levou inverzí k prvku a v pologrupě (A, ) s jednotkou e, jestliže
platí a-1
 a = e; obdobně je pravou inverzí a-1
takový prvek, pro který je
a  a-1
= e
* prvek a-1
je inverzní k a v pologrupě s jednotkou, jestliže je levou i pravou
inverzí zároveň
* monoid (M, ) je pologrupa s neutrálním prvkem
* grupa (G, ) je pologrupa s jednotkou, ve které má každý prvek inverzi
* komutativní grupa, resp. komutativní pologrupa, je taková, kde je operace 
komutativní.
335
336 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
* Je-li (A, ) grupa (případně pologrupa), pak její podmnožinu B  A, která
je uzavřená vůči zúžení operace  a zároveň je spolu s touto operací grupou,
nazýváme podgrupa.
10.2
10.2. Řešené příklady.
(1) Přirozená čísla N = {0, 1, 2, . . . }, spolu s kteroukoliv z operací sčítání a násobení
jsou asociativní a komutativní pologrupa s jednotkou, neexistují v ní ale inverzní
prvky.
(2) Celá čísla Z = {. . . , -2, -1, 0, 1, 2, . . . } jsou grupoid vůči kterékoliv z operací
sčítání, odčítání, násobení. Jsou dokonce komutativní grupou vzhledem ke sčítání,
jsou však jen komutativní pologrupou vůči násobení (neexistují inverze k
prvkům a = 1). Operace odčítání není ani asociativní (např. (5 - 3) - 2 =
0 = 5 - (3 - 2) = 4). Všimněte si také, že pro odečítání je nula pravý neutrální
prvek, ne však levý. Dokonce v tomto případě levý neutrální prvek neexistuje.
(3) Racionální čísla Q jsou komutativní grupou vzhledem ke sčítání a nenulová
racionální čísla jsou grupou vůči násobení. Celá čísla spolu se sčítáním jsou
jejich podgrupou.
(4) Pro k  N, množina všech k-tých odmocnin z jedničky, tj. množina {z  C; zk
=
1} je konečná grupa vůči násobení komplexních čísel. Např. pro k = 2 dostaneme
grupu {-1, 1} se dvěma prvky, které jsou oba samy sobě inverzí, zatímco
pro k = 4 dostáváme grupu G = {1, i, -1, -i}.
(5) Množina Matn všech čtvercových matic je (nekomutativní) pologrupa vzhledem
k násobení matic a komutativní grupa vzhledem ke sčítání matic (viz odstavce
2.2­2.5).
(6) Množina všech lineárních zobrazení Hom(V, V ) na vektorovém prostoru je pologrupa
vzhledem ke skládání zobrazení a komutativní grupa vzhledem ke sčítání
zobrazení (viz odstavec 2.31).
(7) v obou předchozích příkladech, podmnožina invertibilních objektů uvažované
pologrupy tvoří grupu. V případě (5) jde o tzv. grupu invertibilních matic, ve
druhém o grupu lineárních transformací vektorového prostoru.
10.2.1. Rozhodněte o následujících množinách a operacích, jaké tvoří struktury
(grupoid, pologrupa, grupa, monoid):
(1) podmnožiny množiny přirozených čísel spolu s operací sjednocení
(2) přirozená čísla spolu s binární operací největší společný dělitel
(3) přirozená čísla spolu s binární operací nejmenší společný násobek
(4) množina všech invertibilních matic 2 × 2 nad R spolu se sčítáním
(5) množina všech matic 2 × 2 nad R spolu s násobením matic
(6) množina všech matic 2 × 2 spolu s odčítáním matic
(7) množina všech invertibilních matic 2 × 2 nad Z2 s násobením matic
(8) množina Z6 spolu s násobením (modulo 6)
(9) množina Z7 spolu s násobením (modulo 7)
Svá tvrzení zdůvodněte (proč je něco např. pouze grupoid a není pologrupa . . . ). U
třetího příkladu od konce sestavte tabulku dané operace.
Řešení.
(1) monoid (neutrálním prvkem je prázdná množina)
(2) pologrupa (bez neutrálního prvku)
(3) monoid (číslo 1 je neutrálním prvkem)
1. GRUPY 337
(4) není ani grupoid (uvážíme A + (-A) pro nějakou invertibilní matici A)
(5) monoid (násobení matic je asociativní operace, viz 2.5, jednotková matice je
neutrálním prvkem)
(6) grupoid (není asociativní)
(7) grupa (je monoidem stejně jako v bodě 5, z definice má každá invertibilní matice
inverzi, tedy jde o grupu)
(8) monoid (operace je indukována klasickým násobením, je tedy asociativní, třída
[1]Z6 je neutrálním prvkem, např. třída [2]Z6 nemá inverzi, není tedy grupou)
(9) grupa (jedná se o monoid ze stejných důvodů jako v předchozím bodě, z Bezoutovy
věty věty vyplývá, že každý prvek v Zp, kde p je prvočíslo je invertibilní)
V příkladě 7 má grupa následující prvky:
A =
1 0
0 1
, B =
0 1
1 0
, C =
1 1
0 1
,
D =
1 1
1 0
, E =
0 1
1 1
, F =
1 0
1 1
.
Tabulka operace násobení těchto matic vypadá následovně:
A B C D E F
A A B C D E F
B B A E F C D
C C D A B F E
D D C F E A B
E E F B A D C
F F E D C B A
10.2.2. Doplňte následující tabulku operace na množině {a, b, c} tak, aby zadávala
pologrupu.
a b c
a b a a
b
c
Je toto doplnění jednoznačné? Kolik jich existuje?
Řešení.
Začneme postupně tabulku doplňovat:
ba = (aa)a = a(aa) = ab = a,
bb = (aa)b = a(ba) = aa = b,
bc = (aa)c = a(ac) = aa = b,
a(ca) = (ac)a = aa = b, tedy (ca) = a.
Dále cb = c(aa) = (ca)a = aa = b.
Na cc dostáváme omezení (díky acc = ac) cc = b, nebo cc = c. Obě možnosti
jsou možné.
Existují tedy dvě různá doplnění:
a b c
a b a a
b a b b
c a b [b, c]
338 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
10.2.3. Doplňte následující tabulku operace tak, aby zadávala strukturu pologupy
na množině {a, b, c, d}.
a b c d
a d d a c
b b
c
d
Řešení. db = aab = ad = c, db = abb = ab = d, tabulku nelze doplnit tak, aby
zadávala pologrupu.
10.2.4. Nakreslete Hasseův diagram (viz ??) uspořádané množiny všech podgrup
(Z24, +) uspořádaných inkluzí.
Řešení. Nejprve určeme všechny podgrupy (Z24, +). Každá podgrupa je dána třídami
násobků některého dělitele čísla 24 (vyplývá z Bezoutovy věty, viz ??). Jedná
se tedy o následující grupy:
G1 = (Z24, +)
G2 = ({[0], [2], [4], [6], [8], [10], [12], [14], [16], [18], [20], [22]}, +)
G3 = ({[0], [3], [6], [9], [12], [15], [18], [21]}, +)
G4 = ({[0], [4], [8], [12], [16], [20]}, +)
G6 = ({[0], [6], [12], [18]}, +)
G8 = ({[0], [8], [16]}, +)
G12 = ({[0], [12]}, +)
G24 = ({[0]}, +)
Hasseův diagram potom vypadá následovně:
G1
EEEEEEEE
{{{{{{{{
G2
QQQQQQQQQQQQQQQQ G3
G4
QQQQQQQQQQQQQQQQ G6
G8
CCCCCCCC G12
yyyyyyyy
G24
1. GRUPY 339
10.3
10.3. Grupy permutací. Zpravidla grupy a pologrupy potkáváme jako množiny
zobrazení na pevně dané množině M, které jsou uzavřeny vůči skládání zobrazení.
Často si ale tuto skutečnost přímo neuvědomujeme.
Nejsnáze je tato souvislost vidět na konečných množinách M. Na každé takové
množině o m = |M|  N prvcích (prázdná množina má 0 prvků) máme k dispozici
mm
možných definic zobrazení (každý z m prvků můžeme zobrazit na kterýkoliv v
M) a všechna taková zobrazení umíme skládat.
Pokud chceme, aby existovala k zobrazení  : M  M jeho inverze -1
, musí
být  bijekcí. Složením dvou bijekcí vznikne opět bijekce a proto podmnožina m
všech bijekcí na množině M o m prvcích je grupa. Říkáme jí grupa permutací (na
m prvcích). Sám název přitom uvádí jinou souvislost, kdy místo bijekcí na konečné
množině vnímáme permutace jako přerovnání rozlišitelných prvků. Potkávali jsme
se s ní např. při studiu determinantů, 2.14.
Promysleme si podrobněji, jak vlastně násobení v takové grupě vypadá. U
(malé) konečné grupy si můžeme snadno sestavit úplnou tabulku všech operací.
Jestliže v grupě permutací 3 na číslech {1, 2, 3} označíme jednotlivá pořadí
a = (1, 2, 3), b = (2, 3, 1), c = (3, 1, 2),
d = (1, 3, 2), e = (3, 2, 1), f = (2, 1, 3),
pak skládání našich permutací je zadáno tabulkou
 a b c d e f
a a b c d e f
b b c a f d e
c c a b e f d
d d e f a b c
e e f d c a b
f f d e b c a
Všimněme si podstatného rozdílu mezi permutacemi a, b a c a dalšími třemi.
Ty první tři tvoří tzv. cyklus generovaný prvkem b nebo prvkem c:
b2
= c, b3
= a, c2
= b, c3
= a
a samy o sobě jsou tyto tři prvky komutativní podgrupou. V ní a je jednotka, a b s
c jsou vzájemně inverzní. Je tedy tato podgrupa stejná jako je grupa Z3 zbytkových
tříd celých čísel modulo 3, resp. jako grupa třetích odmocnin z jedničky v 10.2(4).
Další tři prvky jsou samy sobě inverzí a každý z nich je tedy společně s jednotkou
a podgrupou stejnou jako je Z2. Říkáme, že b a c jsou prvky řádu 3, zatímco prvky
d, e a f jsou řádu 2.
Obdobně se chovají všechny grupy permutací m konečných množin o m prvcích.
Každá permutace  rozkládá množinu M na disjunktní sjednocení maximálních
invariantních podmnožin, které dostaneme tak, že postupně vybíráme dosud
nezpracované prvky x  M a do třídy rozkladu Mx přidáváme všechny akce iterací
k
(x), k = 1, 2, . . . , dokud není k
(x) = x. Každou permutaci tak dostáváme jako
složení jednodušších permutací, tzv. cyklů, které se chovají jako identická permutace
vně Mx a tak jako  na Mx. Pokud přitom očíslujeme prvky v Mx jako pořadí
(1, 2, . . . , |Mx|) tak aby i odpovídalo i
(x), pak je naše permutace prostým posunutím
o jednu pozici v cyklu (tj. poslední prvek je zobrazen zpátky na první). Odtud
340 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
název cyklus. Zjevně přitom tyto cykly komutují, takže je jedno, v jakém pořadí z
nich permutaci  složíme.
Nejjednodušší cykly jsou jednoprvkové pevné body permutace  a dvouprvkové
(x, (x)), kde ((x)) = x. Těm se říká transpozice. Protože každý cyklus zjevně
můžeme poskládat z permutací sousedních prvků (necháme ,,probublat první prvek
nakonec), lze každou permutaci napsat jako složení transpozic sousedních prvků.
Můžeme samozřejmě vyjádřit pomocí transpozic i jinak, ale skutečnost, jestli potřebujeme
sudý nebo lichý počet permutací je na volbách nezávislá. Máme tedy
definováno dobře zobrazení sgn : m  Z2 = {1}, tzv. paritu. Dokázali jsme si
znovu tvrzení, která jsme již využívali při studiu determinantů (viz 2.14 a dále):
Věta. Každá permutace konečné množiny je složením cyklů. Cyklus délky lze
vyjádřit jako složení -1 transpozic. Parita cyklu délky je (-1) -1
. Parita složení
permutací je součinem parit jednotlivých z nich, tzn. že zobrazení sgn převádí složení
permutací    na součin sgn   sgn  v komutativní grupě Z2.
10.4. Příklady.
10.4.1. Rozložte na součin transpozic následující permutaci:
 =
1 2 3 4 5 6 7 8 9
9 8 6 7 1 2 3 4 5
Spočtěte 336
.
Řešení. Danou permutaci nejprve rozložíme na součin nezávislých cyklů: v dvojřádkovém
zápisu permutace vybereme první prvek (číslo 1), to se zobrazuje na číslo 9,
devítka se zobrazuje na pětku, pětka na jedničku a dostáváme první cyklus (159).
Dále vybereme číslo neobsažené v prvním cyklu, např. dvojku a pokračujeme stejně,
tedy dvojka se zobrazuje na osmičku, osmička na čtyřku, čtyřka na sedmičku, sedmička
na trojku, trojka na šestku a konečně šestka na dvojku a dostáváme cyklus
(2, 8, 4, 7, 3, 6) (tento cyklus bychom také jako v prvním případě mohli zapsat jako
(284736) protože nemůže dojít k nedorozumění). Celkem
 = (159)(284736)
Každý z cyklů dále rozložíme na transpozice a dostáváme
 = (15)  (59)  (2, 8)  (8, 4)  (4, 7)  (7, 3)  (3, 6).
Při počítání 336
využijeme toho že  je složením dvou cyklů délky tři a šest.
Pro cyklus c délky l zřejmě platí cl
= id, tedy 6
= id a
336
= 6 56
= id
10.4.2. Rozložte na součin transpozic permutaci
 =
1 2 3 4 5 6 7 8 9 10
9 8 5 1 10 2 3 4 6 7
Řešení.  = (19)  (96)  (62)  (28)  (84)  (73)  (35)  (5, 10).
1. GRUPY 341
10.4
10.5. Symetrie ohraničených rovinných útvarů. V páté části první kapitoly
jsme podrobně a elementárně rozebrali souvislosti invertibilních matic se dvěma
řádky a dvěma sloupci a lineárními transformacemi v rovině. Viděli jsme také, že
matice zadávají lineární zobrazení R2
 R2
, které zachovávají standardní vzdálenosti
právě, když jsou jejich sloupce ortonormální bazí R2
(což je jednoduchá
podmínka na souřadnice matice, viz 1.36). Ve skutečnosti není obtížné dokázat (ale
nebudeme to tu dělat), že každé zobrazení roviny do sebe, které zachovává velikosti
je affinní, tj. je složením lineárního a vhodné translace. 1
Jak jsme již připomněli,
lineární část takového zobrazení přitom musí navíc být ortogonální. Všechna taková
zobrazení tedy tvoří grupu všech ortogonálních transformací (nebo také euklidovských
transformací) v rovině. Navíc jsme ukazovali, že kromě translací Ta o vektor
a jde pouze o rotace R o jakýkoliv úhel  kolem počátku a zrcadlení Z vůči jakékoliv
přímce procházející počátkem (povšimněme si, že středová souměrnost je
totéž jako rotace o ).
Uvažme nyní nějaký rovinný obrazec, pro začátek třeba úsečku a rovnostranný
trojúhelník. Ptáme se, jak moc jsou symetrické, tzn. vůči kterým trasformacím
(zachovávajícím velikost) jsou invariantní. Jinak řečeno, chceme aby obraz našeho
obrazce byl od původního k nerozeznání, dokud si nepopíšeme nějaké význačné
body, třeba vrcholy trojúhelníka A, B a C a konce úseček. Zároveň je předem jasné,
že všechny symetrie pevně zvoleného útvaru budou vždy tvořit grupu (většinou
pouze s jediným prvkem, identickým zobrazením).
U úsečky je situace obzvlášť jednoduchá ­ na první pohled je zřejmé, že jedinými
jejími netriviálními symetriemi jsou rotace o , zrcadlení vůči ose této úsečky a
zrcadlení vůči úsečce samotné a všechny tyto symetrie jsou samy sobě inverzí. Celá
grupa symetrií úsečky má tedy čtyři prvky. Její tabulka násobení vypadá takto:
 R0 R ZH ZV
R0 R0 R ZH ZV
R R R0 ZV ZH
ZH ZH ZV R0 R
ZV ZV ZH R R0
a je tedy celá tato grupa komutativní.
Pro rovnostranný trojúhelník už symetrií nacházíme víc: můžeme rotovat o
/3 nebo můžeme zrcadlit vůči osám stran. Abychom dostali grupu celou, musíme
přidat všechna složení takovýchto transformací. Už v 1.36 jsme viděli, že složení
dvou zrcadlení je vždy otočením. Zároveň je zřejmé, že složení takových zrcadlení v
opačném pořadí dá otočení o stejný úhel, ale s opačnou orientací. V našem případě
tedy zrcadlení kolem dvou různých os vygenerují postupnou opakovanou aplikací
všechny symetrie, který bude dohromady šest. Jestliže si umístíme trojúhelník v
1Jestliže totiž má zobrazení F : R2
 R2
zachovávat velikosti, totéž musí být pravda pro
přenášené vektory rychlostí, tj. Jacobiho matice DF(x, y) musí být v každém bodě ortogonální.
Rozepsání této podmínky pro dané zobrazení F = (f(x, y), g(x, y)) : R2
 R2
vede na
systém diferenciálních rovnic, který má pouze afinní řešení. Zkuste si aspoň začít výpočet
jako cvičení! (Návod: máme ukázat, že všechny parciální derivace F jsou nulové. To ale je
podmínka nezávislá na volbě afinních souřadnic, proto složením F s lineárním zobrazením
výsledek nemění. Můžeme proto pro pevný bod (x, y) složit (DF)-1
 F, takže bez újmy na
obecnosti lze rovnou předpokládat, že DF(x, y) je matice identického zobrazení. Derivováním
rovnic pak dostáváme důsledky, které přímo říkají požadované tvrzení.) Ve skutečnosti vede
stejný postup ke stejnému výsledku pro euklidovské prostory libovolné dimenze.
342 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
souřadnicích jako na obrázku, bude našich šest transformací zadáno maticemi
a =
1 0
0 1
, b =
-1
2

3
2
-

3
2 -1
2
, c =
-1
2 -

3
2
3
2 -1
2
d =
-1 0
0 1
, e =
1
2 -

3
2
-

3
2 -1
2
, f =
1
2

3
2
3
2 -1
2
.
Sestavením tabulky pro násobení, tak jak jsme ji udělali pro grupu permutací 3
obdržíme právě stejný výsledek. Pro větší názornost jsou vrcholy označeny čísly,
takže jsou příslušné permutace přímo čitelné.
Obdobně umíme nacházet grupy symetrií s k různými rotacemi a k zrcadleními.
Stačí si k tomu vzít pravidelný k-úhelník. Takové grupy symetrií se často označují
jako grupy Dk a říká se jim dihedrální grupy řádu k. Tyto grupy jsou nekomutativní
pro všechny k  3, zatímco D2 je komutativní. Název patrně je odvozen od
skutečnosti, že D2 je grupa symetrií molekuly vodíku.
Stejně tak lze snadno najít obrazce, které mají pouze rotační symetrie a jde
tedy o komutativní grupy, které se v chemii značí jako Ck. Říkáme jim cyklické
grupy řádu k. K tomu postačí např. uvažovat pravidelný mnohoúhelník, u kterého
nesymetricky ale pořád stejně pozměníme chování hran, viz. čerchované rozšíření
trojúhelníku na obrázku. Všimněme si, že grupu C2 lze realizovat dvěma způsoby
­ buď jedinou netriviální rotací o  nebo jediným zrcadlením.
Věta. Nechť je M ohraničená množina v rovině R2
s nejvýše spočetnou grupou
grupou symetrií G. Pak je grupa G buď triviální nebo jedna z grup Ck, Dk, s k  1.
Důkaz. Kdyby nějaká množina M připouštěla jako svoji symetrii translaci, nemůže být
ohraničená. Pokud by M připouštěla netriviální rotace s různými středy, opět nemůže být
ohraničená. Totéž platí pro případ, že by existovala rotační symetrie a zrcadlení podél přímky,
která neprochází středem rotace.
Máme tedy k dispozici pouze rotace se společným středem a zrcadlení podél přímek tímto
středem procházející. Zbývá tedy dokázat, že je celá grupa složena vždy buď pouze z rotací nebo
vždy ze stejného počtu rotací a symetrií. Protože je ale vždy složením dvou různých zrcadlení
rotace o úhel rovný polovině úhlu svíraného osami zrcadlení (viz 1.36) a tedy i naopak složením
zrcadlení podle přímky p s rotací o úhel /2 dostame zrcadlení podél přímky svírající úhel 
s p. Odtud již vcelku snadno lze odvodit požadované tvrzení.
10.5
10.6. Symetrie rovinných dláždění. Složitější chování lze vypozorovat u rovinných
obrazců v pásech nebo v celé rovině (něco jako možnosti symetrií pro různé
dlažby).
Nejprve uvažme množinu M, která je celá obsažena v pásu uzavřeném mezi
dvěma rovnoběžkami. Pro symetrie takové množiny nepřicházejí v úvahu žádné
netriviální rotace, kromě R, a jediná možná zrcadlení jsou buď podle osy pásu
nebo vertikální. Zůstavají ještě pouze translace podle vektoru rovnoběžného s osou
pásu. Všimněme si, že každá netriviální translace svými iteracemi zapřičiní, že celá
grupa symetrií M bude již nutně nekonečná.
Nepříliš složitá diskuse vede k popisu všech tzv. diskrétních grup symetrií pro
rovinné pásy. Jsou to takové, kdy obraz libovolného bodu při působení všemi prvky
grupy je diskrétní podmnožinou v rovině. Každá takové grupa je generována některými
z následujících možných symetrií: translace T, posunutá reflexe G, vertikální
reflexe V , horizontální reflexe H a rotace R o .
1. GRUPY 343
Věta. Každá grupa symetrií je jednoho z následujících sedmi typů. Jsou generovány
(1) jedinou translací T
(2) jedinou posunutou translací G
(3) jednou translací T a jedním vertikálním zrcadlením V
(4) jednou translací T a jednou rotací R
(5) jednou posunutou translací G a jednou rotací R
(6) jednou translací T a horizontálním zrcadlením H
(7) jednou translací T, horizontálním zrcadlením H a jedním vertikálním zrcadlením
V .
Důkaz nebudeme uvádět, zkuste si alespoň vykreslit symbolicky vzory s těmito
symetriemi.
Složitější je to se symetriemi obrazců, které vyplní celou rovinu. Nemáme zde
prostor pro podrobnější zkoumání, nicméně alespoň poznamenejme, že všech takových
grup symetrií v rovině je pouze sedmnáct. Říká se jim dvourozměrné krystalografické
grupy.
Obdobná úplná diskuse je známa i pro trojrozměrné konečné nebo spočetné
grupy symetrií. Bohatá teorie byla vypracována zejména v 19. století v souvislosti
se studiem symetrií krystalů a molekul chemických prvků.
(symbolický obrázek všech symetrií, odkazy na literaturu a trochu podrobnější
diskusi dodám snad později ...)
10.6
10.7. Homomorfismy grup. Zobrazení f : G  H mezi dvěmi grupami G a H
se nazývá homomorfismus grup, jestliže respektuje násobení, tj. pro všechny prvky
a, b  G platí
f(a  b) = f(a)  f(b).
Povšimněme si, že násobení vlevo je uvnitř grupy G předtím, než zobrazujeme,
zatímco vpravo jde o násobení v H poté, co zobrazujeme.
Přímo z definice se snadno ověří následující vlastnosti homomorfismů:
Tvrzení. Pro každý homomorfismus f : G  H grup platí
(1) obraz jednotky e  G je jednotka v H
(2) obraz podgrupy K  G je podgrupa f(K)  H.
(3) vzorem f-1
(K)  G podgrupy K  H je podgrupa.
(4) obraz inverze k prvku je inverzí obrazu. tj. f(a-1
) = f(a)-1
.
(5) je-li f zároveň bijekcí, pak i inverzní zobrazení f-1
je homomorfismus.
(6) f je injektivní zobrazení právě, když f-1
(e) = {e}.
Důkaz. Je-li K  G podgrupa, pak pro každé dva prvky y = f(a), z = f(b)
v H nutně také y  z = f(a  b) patří do obrazu. Je proto vždy obrazem podgrupy
opět podgrupa.
Specielně, triviální podgrupy mají za obrazy opět podgrupy. Protože z rovnosti
a  a = a vynásobením prvkem a-1
vyplývá a = e, ověřili jsme, že jedinou
jednoprvkovou podgrupou je triviální podgrupa {e}, zejména tedy f(e) = e.
Stejně postupujeme u vzorů: jestliže a, b  G splňují f(a), f(b)  K  H,
potom také f(a  b)  K.
Předpokládejme, že existuje inverzní zobrazení g = f-1
a zvolme libovolné
y = f(a), z = f(b)  H. Pak f(a  b) = y  z = f(a)  f(b), což je ekvivalentní výrazu
g(y)  g(z) = a  b = g(y  z). Je tedy inverze skutečně homomorfismem.
344 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Pokud platí f(a) = f(b), pak f(a  b-1
) = e  H. Pokud je tedy jediným
vzorem jednotky v H jednotka v G, pak a  b-1
= e, tj. a = b. Opačná implikace je
zřejmá.
Podgrupa f-1
(e) jednotkového prvku e  H se nazývá jádro homomorfismu f
a značíme ji ker f. Bijektivní homomorfismus grup nazýváme izomorfismus.
Z předchozích tvrzení okamžitě vyplývá, že homomorfismus f : G  H s
triviálním jádrem je izomorfismem na obraz f(G).
10.7
10.8. Řešené příklady. (1) Pro každou grupu permutací G = n jsme definovali
zobrazení sgn : n  Z2 přiřazující permutaci její paritu. Z tvrzení Věty 10.3 vyplývá,
že jde o homomorfismus grup. Jádrem tohoto homomorfismu jsou permutace
se sudou paritou.
(2) Při studiu grupy symetrií rovnostranného trojúhelníka jsme našli izomorfismus
této grupy s grupou permutací 3. Realizaci 3 si snadno můžeme zvolit tak, že
za množinu tří prvků pro permutace vezmeme vrcholy trojúhelníka a jednotlivým
symetriím přiřadíme permutace těchto vrcholů, které vyvolají.
(3) Zobrazení exp : R  R+ (nebo C  C \ 0, pokud pracujeme s příslušnou mocninnou
řadou a rozšíříme zobrazení na komplexní čísla) je homomorfismus aditivní
grupy reálných nebo komplexních čísel na multiplikativní grupu kladných reálných
čísel, resp. na multiplikativní grupu všech nenulových komplexních čísel. V případě
reálných čísel jde o izomorfismus. Pro komplexní čísla dostáváme netriviální jádro.
Viděli jsme totiž, že zúžení exp na ryze imaginární čísla (což je podgrupa izomorfní
R) je homomorfismem it  eit
= cos t + i sin t, tzn. že čísla 2ki, k  Z, jsou v
jádru. Snadno se dopočítá, že je to celé jádro (je-li es+it
= es
 eit
v jádru, musí být
es
= 1, tj. s = 0, a pak zbývá pouze t = 2k pro libovolné celé k).
(4) Determinant matice je zobrazením, které každé matici skalárů z K přiřazuje
nějaký skalár v K (pracovali jsme s K = Z, Q, R, C). Cauchyova věta o determinantu
součinu čtvercových matic det(A  B) = (det A)  (det B) je tvrzením, že pro grupu
G = GL(n, K) invertibilních matic je det : G  K \ 0 homomorfismem grup.
(5) Pro každé dvě grupy G, H definujeme součin grup G × H takto: Jako množina
je G × H skutečně součin a násobení definujeme po složkách. tj.
(a, x)  (b, y) = (a  b, x  y)
kde nalevo vystupuje součin, který definujeme, zatímco napravo používáme tečku
k naznačení součinů v jednotlivých grupách G a H. Zobrazení
pG : G × H (a, x)  a  G, pH : G × H (a, x)  x
jsou surjektivní homomorfismy s jádry
ker pG = {(eG, x); x  H} ker pH = {(a, eH); a  G}.
(6) Grupy zbytkových tříd Zk jsou izomorfní grupám komplexních k­tých odmocnin
z jedničky, což jsou zároveň izomorfní obrazy konečných grup otočení v rovině o
celé násobky úhlu 2
k .
(7) Grupa Z6 je izomorfní součinu Z2 × Z3. Docela snadno můžeme toto tvrzení
vidět při multiplikativní realizaci grup zbytkových tříd Zk jakožto komplexních
k-tých odmocnin z jedničky. Skutečně tak vidíme, že Z6 je tvořeno body na jednotkové
kružnici v komplexní rovině ve vrcholech pravidleného šestiúhelníku, Z2 pak
odpovídá 1, Z3 pravidelnému trojúhelníku s jedním vrcholem v jedničce. Jestliže
budeme ztotožňovat příslušné body s otočeními v rovině, které jedničku převede
1. GRUPY 345
právě do nich, pak skládání dvou takových otočení bude vždy komutativní a kombinacemi
jednoho otočení ze Z2 a jednoho ze Z3 dostaneme právě všechna otočení
ze Z6. Nakreslete si obrázek! Takto tedy dostaneme (při obvyklejší aditivní notaci)
izomorfismus:
[0]6  ([0]2, [0]3)
[1]6  ([1]2, [2]3)
[2]6  ([0]2, [1]3)
[3]6  ([1]2, [0]3)
[4]6  ([0]2, [2]3)
[5]6  ([1]2, [1]3)
Zkuste se přesvědčit, že to takto skutečně funguje. Umíte tvrzení zobecnit?
(8) Libovolný prvek a v grupě G je obsažen v minimální podgrupě {a, a2
, a3
, . . . },
která jej obsahuje. Je zjevné, že je tato podgrupa komutativní, a pokud je celá grupa
G konečná, nutně musí jednou nastat případ ak
= e. Nejmenší k s touto vlastností
nazýváme řád prvku a v G. Grupa G je cyklická grupa je-li celé G generované
nějakým svým prvkem a výše uvedeným způsobem. Z definice přímo vyplývá, že
každá cyklická grupa je izomorfní buď grupě celých čísel Z (pokud je nekonečná)
nebo některé grupě zbytkových tříd Zk (když je konečná).
10.8.1. Určete všechny podgrupy grupy invertibilních čtvercových matic nad Z2
(vzhledem k násobení matic), viz 10.2. Je tato grupa isomorfní grupě S3? Zdůvodněte
(buď najděte isomorfismus, nebo udejte důvod, proč neexistuje).
Řešení. Grupy jsou isomorfní, transposice odpovídají prvkům řádu 2. Podgrupy
pak odpovídají podgrupám S3
10.8.2. Rozhodněte (se zdůvodněním) o následujících předpisech, zda jsou zobrazeními,
případně homomorfismy či isomorfismy grup:
(1) f : (Z7, +)  (Z8, +), f([a]Z7
) = [a]Z8
(2) f : (Z
7, )  (Z
14, ), f([a]Z
7
) = [a]Z
14
(3) f : (Z
14, )  (Z
7, ), f([a]Z
14
) = [a]Z
7
(4) f : (Z
15, )  (Z
15, ), f([a]Z
15
) = [3a]Z
15
(5) f : (Z
15, )  (Z
15, ), f([a]Z
15
) = [4a]Z
15
(6) f : (Z
k, )  (Z
k, ), f([a]Z
k
) = [l  a]Z
k
, k, l  N, k, l > 1
(7) f : Sk  Sk, f() = 2
Řešení.
(1) není zobrazení
(2) není zobrazení
(3) je isomorfismus
(4) není zobrazení
(5) je bijekce, není isomorfismus
(6) je bijekce pro (k, l) = 1 (pro l  1 mod k), jinak není zobrazení
(7) je zobrazení, je homomorfismem pouze pro k = 2
346 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
10.8
10.9. Rozklady podle podgrup. Uvažme grupu G a její podgrupu H. Na množině
prvků grupy G nyní definujeme relaci a H b jestliže b-1
 a  H. Snadno
ověříme, že je takto definována relace ekvivalence:
* a-1
 a = e  H,
* je-li b-1
 a = h  H, potom a-1
 b = (b-1
 a)-1
= h-1
 H,
* je-li c-1
 b  H a zároveň je b-1
 a  H, potom c-1
 a = c-1
 b  b-1
 a  H.
Celá grupa G se tedy rozpadá na tzv. levé třídy rozkladu podle podgrupy H vzájemně
ekvivalentních prvků. Třídu příslušející prvku a značíme a  H a skutečně
platí, že
a  H = {a  h; h  H},
neboť prvek b je ve stejné třídě s a, právě když jde takovýmto způsobem vyjádřit.
Množinu všech levých tříd rozkladu podle podgrupy H označujeme G/H.
Obdobně definujeme pravé třídy rozkladu H a. Příslušná ekvivalence je: a  b,
jestliže a  b-1
 H. Proto
H \ G = {H  a; a  G}.
Tvrzení. Pro třídy rozkladu grupy platí:
(1) Levé a pravé třídy rozkladu podle podgrupy H  G splývají právě, když pro
každé a  G, h  H platí a  h  a-1
 H.
(2) Všechny třídy (levé i pravé) mají shodnou mohutnost s podgrupou H.
Důkaz. Obě vlastnosti vyplývají bezprostředně z definičních vlastností. V prvém
případě chceme, aby pro jakékoliv a  G, h  H platilo ha = ah pro vhodné
h  H. To ale nastane právě, když a-1
 h  a = h  H.
Ve druhém případě si stačí uvědomit, že pokud a  h = a  h , pak také vynásobením
a-1
zleva obdržíme h = h .
10.9 10.10. Důsledek. Nechť G je konečná grupa s n prvky, H její podgrupa. Potom
(1) Mohutnost n = |G| je součinem mohutnosti H a mohutnosti G/H, tj.
|G| = |G/H|  |H|
(2) Přirozené číslo |H| je dělitelem čísla n.
(3) Je-li a  G prvek řádu k, pak k dělí n.
(4) pro každé a  G je an
= e.
(5) je-li mohutnost grupy G prvočíslo, pak je G izomorfní cyklické grupě Zn.
Druhému tvrzení se říkává Lagrangeova věta, předposlednímu malá Fermatova
věta.
Důkaz. Viděli jsme, že každá třída levého rozkladu má právě |H| prvků. Přitom
dvě různé třídy rozkladu musí mít nutně prázdný průnik. Odtud vyplývá první
tvrzení.
Druhá je okamžitým důsledkem prvního.
Každý prvek generuje cyklickou podgrupu {a, a2
, . . . , ak
= e} a právě počet
prvků této podgrupy je řádem prvku a. Proto musí řád dělit počet prvků v G.
Jelikož je řád k prvku a dělitelem čísla n a již ak
= e, je také an
= (ak
)s
= e.
Jestliže je n > 1, pak existuje prvek a  G různý od jednotky. Jeho řád je
přirozené číslo různé od jedničky a nutně dělí n. Proto musí být rovno n. Pak
ovšem jsou všechny prvky G tvaru ak
pro k = 1, . . . , n.
1. GRUPY 347
10.10
10.11. Normální podgrupy a faktorgrupy. Podgrupy H, pro které platí, že
a  h  a-1
 H pro všechny a  G, h  H, se nazývají normální podgrupy.
Pro normální podgrupy je dobře definováno násobení na G/H vztahem
(a  H)  (b  H) = (a  b)  H.
Skutečně, volbou jiných reprezentantů a  h, b  h dostaneme opět stejný výsledek
(a  h  b  h )  H = ((a  b)  (b-1
 h  b)  h )  H.
Totéž si můžeme odůvodnit tak, že nezáleží na tom jestli pracujeme s pravými
nebo levými třídami, můžeme rovnou naše třídy psát jako H aH a potom snadno
definujeme (H  a)  (b  H) = H  (a  b)  H.
Zřejmě jsou splněny pro nové násobení na G/H všechny vlastnosti grupy: jednotkou
je sama grupa H jakožto třída e  H jednotky, inverzí k a  H je zřejmě
a-1
 H a asociativita násobení je zřejmá z definice. Hovoříme o faktorové grupě
G/H grupy G podle normální podgrupy H.
V komutativních grupách jsou všechny podgrupy normální. Podmnožina
nZ = {na; a  Z}  Z
zadává v celých číslech podgrupu a její faktorgrupou je právě (aditivní) grupa zbytkových
tříd Zn.
Jak jsme viděli, všechna jádra homomorfismů jsou normální podgrupy. Naopak,
jestliže je podgrupa H  G normální, pak zobrazení
p : G  G/H, a  a  H
je surjektivní homomorfismus grup s jádrem H. Skutečně, p je dobře definované,
přímo z definice násobení na G/H je vidět, že to musí být homomorfismus a je zjevně
na. Je tedy vidět, že normální podgrupy jsou právě všechna jádra homomorfismů.
Dále, pro libovolný homomorfismus grup f : G  K je dobře definován také
homomorfismus
~f : G/ ker f  K, ~f(a  H) = f(a),
který je injektivní.
Zdánlivě paradoxní je příklad homomorfismu C
 C
definovaný na nenulových
komplexních číslech vztahem z  zk
s přirozeným k. Zjevně jde o surjektivní
homomorfismus a jeho jádro je množina k­tých odmocnin z jedničky, tj. cyklická
podgrupa Zk. Předchozí úvaha tedy dává pro všechna přirozená k izomorfismus
~f : C
/Zk  C
.
Tento příklad ukazuje, že u nekonečných grup nejsou počty s mohutnostmi tak
přehledný jako u konečných grup v Důsledku 10.10.
10.12. Řešené příklady.
10.12.1. Rozhodněte, zda jsou podgrupy generované
* cyklem (1, 2, 3) v S3,
* cyklem (1, 2, 3, 4) v S4
* cyklem (1, 2, 3) v A4
normální. V posledním případě určete pravé třídy rozkladu A4 podle uvažované
podgrupy. Určete, kdy je podmnožina všech cyklů délky n podgrupou grupy Sn.
Ukažte, že se pak jedná o normální podgrupu.
348 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Řešení.
* Jde o normální podgrupu A3.
* Není to normální podgrupa ( (1, 2)(1, 3)(2, 4)(1, 2) = (4, 1)(2, 3) ).
* Podgrupa není normální. Pravé třídy rozkladu jsou pak {(124), (243), (13)(24)},
{(142), (143), (14)(23)}, {(234), (12)(34), (134)}, {Id, (123), (132)}.
Podmnožina je podgrupou pouze pro n = 3. Potom jde o podgrupu A3 sudých
permutací v S3, jedná se tedy o normální podgrupu. (pro jiná n snadno najdeme
dva cykly délky n jejichž složením není cyklus délky n).
10.12.2. Určete podgrupu v S6 generovanou permutacemi (12)(34)(56), (1234) a
(56). Je tato podgrupa normální? Pokud ano, popište třídy rozkladu S6/H.
Řešení. Nejprve si všimněme, že všechny zadané permutace leží v podgrupě S4 ×
S2  S6. Proto i jimi generovaná podgrupa bude ležet v této podgrupě. Dále zřejmě
(protože mezi generátory je transposice (56)) je hledaná podgrupa tvaru H × S2,
kde H  S4. Stačí tedy popsat H, tato grupa je generována prvky (12)(34) a (1234)
(projekce generátorů na S4). Máme
(1234)2
= (13)(24)
(1234)3
= (4321)
(1234)4
= id
[(12)(34)]
2
= id
(12)(34)  (1234) = (24)
(1234)  (12)(34) = (13)
(12)(34)  (4321) = (13)
(4321)  (12)(34) = (24)
(12)(34)  (13)(24) = (14)(23)
(13)(24)  (12)(34) = (14)(23)
(12)(34)  (42) = (1234)
(13)  (42) = (13)(24)
Stačí si rozmyslet, že dalším skládáním již nedostaneme nic nového (např (13) 
(1234) = (12)(34)  (4321)  (1234) = (12)(34)  id = (12)(34)). Podgrupa H  S4
má tedy osm prvků (osm je dělitel čísla 24, tedy podle Lagrangeovy věty je to
skutečně možný počet prvků podgrupy).
H = {id, (1234), (13)(24), (4321), (12)(34), (13), (24), (14)(23)}.
Všech prvků hledané podgrupy v S6 je tedy 16 (pro každý prvek h  H jsou v
ní prvky h × id a h × (56)).
10.12.3. Určete podgrupu v S4 generovanou permutacemi (12)(34), (123).
Řešení. Oba zadané generátory jsou sudé permutace, jejich libovolným složením
tedy vznikne opět pouze sudá permutace. Hledaná podgrupa tedy bude i podgrupou
1. GRUPY 349
grupy A4 všech sudých permutací. Máme
[(12)(34)]
2
= id
(123)2
= (321)
(12)(34)  (123) = (243)
(123)  (12)(34) = (134)
(12)(34)  (321) = (314)
(321)  (12)(34) = (234)
a v tomto okamžiku máme již sedm prvků hledané podgrupy A4, protože A4 má
dvanáct prvků a počet prvků podgrupy musí být dělitem čísla dvanáct, musí být
hledanou podgrupou celá grupa A4.
10.11
10.13. Akce grupy. Již jsme viděli, že často potkáváme grupy jako množiny
transformací nějaké pevné množiny. Musí přitom být všechny invertibilní a zároveň
musí být naše množina transformací uzavřená na skládání. Často ale také můžeme
pracovat s pevně zvolenou grupou, jejíž prvky reprezentujeme jako zobrazení na nějaké
množině. Přitom ale ne nutně jsou zobrazení příslušná různým prvkům grupy
různá. Např. všechna otočení roviny kolem počátku o všechny možné úhly odpovídají
grupě reálných čísel. Otočení o 2 je ale identické zobrazení.
Formálně si můžeme takovou situaci popsat jako tzv. (levou) akci grupy G
na množině S. Jde o homomorfismus grupy G do podgrupy invertibilních prvků
v pologrupě SS
všech zobrazení S  S. Takový homomorfismus si také můžeme
představit jako zobrazení
 : G × S  S,
které splňuje
(a  b, x) = (a, (b, x)),
odtud název ,,levá akce . Často se k vyjádření akce prvku grupy na prvku S používá
pouze zápis a  x (byť jde o jinou tečku než u násobení uvnitř grup), definiční
vlastnost pak vypadá takto:
(a  b)  x = a  (b  x).
Obraz prvku x  S v akci celé grupy G nazýváme orbita Sx prvku x
Sx = {y = (a, x); a  G}.
Pro každý bod x  S definujeme izotropní podgrupu Gx  G akce ,
Gx = {a  G; (a, x) = x}.
Je-stliže pro každé dva prvky x, y  S existuje a  G tak, že (a, x) = y, pak
říkáme, že akce  je tranzitivní. Snadno se vidí, že u tranzitivních akcí jsou všechny
izotropní podgrupy stejně mohutné.
Jako příklad tranzitivní akce konečné grupy můžeme uvést např. zjevnou akci
grupy permutací pevně zvolené množiny X na samotné množině X. Přirozená akce
všech lineárních transformací na nenulových prvcích vektorového prostoru V je také
tranzitívní. Pokud vezmeme ale prostor V celý, je nulový vektor zvláštní orbitou.
Jiný příklad akce grupy G je přirozená akce na množině levých tříd G/H pro
nějakou podgrupu H zadaná levým násobením na reprezentantech tříd.
Věta. Pro každou akci konečné grupy G na konečné množině S platí:
350 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
(1) Pro každý prvek x  S je
|G| = |Gx|  |Sx|.
(2) (Burnsidovo lemma) Je-li N počet orbit akce G na S pak
|G| =
1
N
gG
|Sg|,
kde Sg = {x  S; g  x = x} označuje množinu pevných bodů akce prvku g.
Důkaz. Uvažmě x  S a izotropní podgrupu Gx  G. Akce grupy G zadává
zobrazení G/Gx  Sx, g  Gx  g  x. Pokud (g  Sx)  x = (h  Sx)  x, pak zjevně
g-1
h  Sx, je tedy naše zobrazaní injektvní. Zároveň je zjevně surjektivní, proto
|G/Gx| = |Sx|. Odtud již vyplývá první vlastnost z věty, protože |G| = |G/Gx||Gx|.
Druhé tvrzení dokážeme tak, že dvěma způsoby spočteme mohutnost množiny
pevných bodů akce v jejím grafu:
F = {(x, g)  S × G; g(x) = x}  S × G.
Protože jde o konečné množiny, můžeme si představit prvky součinu S × G jako
prvky v matici (sloupce označujeme prvky v S, řádky pak podle prvků v G). Sčítáním
po řádcích i sloupcích obdržíme
|F| =
gG
|Sg| =
xS
|Gx|.
Nyní si pro přehlednost vyberme po jednom reprezentantu x1, . . . , xN z každé orbity
v S. Dostáváme
|F| =
gG
|Sg| =
N
i=1 xSxi
|Gx| =
N
i=1
|Sxi ||Gxi | = N  |G|
a důkaz je ukončen.
Tato tvrzení jsou velice často užitečná pro řešení kombinatorických úloh.
Příklad. Kolika způsoby můžeme vytvořit náhrdelník z 3 černých a 6 bílých korálků
stejného tvaru? Kusy stejné barvy nerozlišujeme a za stejné náhrdelníky považujeme
všechny, které lze na sebe převést symetrií v rovině.
Pro řešení úlohy si náhrdelník představíme jako obarvení pevně označených
vrcholů pravidelného devítiúhelníka. Za množinu S volíme všechna možná taková
obarvení. Každé takové obarvení je jednoznačně určeno pozicí tří černých korálků.
Velikost množiny S je tedy 9
3 = 84.
Víme, že grupou všech symetrií je grupa D9 složená z 9 rotací (včetně identity)
a stejného počtu reflexí. Stejné náhrdelníky jsou ty, které leží ve stejné orbitě akce
grupy D9 na množině všech konfigurací S, zajímá nás tedy počet orbit N. Pro
výpočet N stačí probrat prvky grupy D9 a všímat si velikostí Sg:
Identita je jediný prvek řádu 1, |Sid| = 84. Příspěvek do sumy je 84.
Zrcadlení g jsou všechna řádu 2 a je jich 9. Přitom je zjevně |Sg| = 4, celkový
příspěvek je proto 4  9 = 36.
Dvě rotace g o úhel 2/3 nebo 4/3 mají řád 3 a |Sg| = 3. Jejich příspěvek je
tedy 6.
Konečně, zbývajících rotací (řádu 9 v D9) je 6 a nenechávají na místě žádný
prvek, do celkové sumy tedy ničím nepřispívají.
1. GRUPY 351
Celkem dostáváme podle formule z Burnsidovy věty:
N =
1
|D9|
gD9
|Sg| =
126
18
= 7.
Najděte si příslušných sedm různých náhrdelníků!
10.14. Příklady.
10.14.1. Určete počet obarvení políček tabulky 3 × 3 třemi barvami, považujeme-li
za stejná obarvení, která na sebe přejdou při nějaké symetrii tabulky (tedy rotací
nebo zrcadlením).
Řešení. Grupa symetrií tabulky je grupou symetrií čtverce, tedy dihedrální grupa
D4. Všech obarvení tabulky, pokud považujeme každé políčko za jedinečné, je 39
.
Na těchto obarveních nám tedy působí grupa G = D4. Postupně projdeme všechny
symetrie g z G a určíme, kolik takových obarvení zachovávají:
* g = Id. |Sg| = 39
.
* g je rotace o 90
či o 270
(= -90
). Při takové rotaci přejde libovolné rohové
pole na sousední rohové pole, aby se obarvení nezměnilo, musí mít všechna
rohová pole stejnou barvu. Obdobně musí mít stejnou barvu středová políčka
stran. Středové políčko celé tabulky pak může být libovolné. Celkem existuje
33
různých obarvení, která se nezmění, provedeme-li s tabulkou jednu z uvažovaných
rotací.
* g je rotace o 180
. Čtyři dvojice políček středově symetrických podle středu
tabulky musí mít stejnou barvu, středové políčko pak může opět být obarveno
libovolně. Celkem |Sg| = 35
.
* g je jednou ze čtyř osových symetrií. Políčka, která se při osové symetrii zachovávají
(jsou tři), mohou být obarvena libovolně, zbylých šest polí tvoří tři
dvojice políček, které se na sebe při osové symetrii zobrazí. Políčka ve dvojici
musí tedy mít stejnou barvu. Celkem |Sg| = 36
.
Podle Burnsidova lemmatu je počet hledaných obarvení roven
1
8
(39
+ 2  34
+ 35
+ 4  36
) = 2862.
10.14.2. a) Určete všechny rotační symetrie pravidelného osmistěnu.
b) Určete počet obarvení pravidelného osmistěnu třemi barvami, považujeme-li za
stejná ta obarvení, která na sebe přejdou při nějaké rotaci osmistěnu.
Řešení.
a) Umístíme-li osmistěn do kartézské souřadné soustavy tak, že dvojice protějších
vrcholů bude na osách a střed v počátku souřadnic, pak je každá rotační symetrie
dána tím, který z osmi vrcholů bude po jejím provedení na ose z ,,dole
a která ze čtyř z něj vedoucích hran z něj půjde ,,dopředu nahoru . Grupa má
tedy celkem 24 prvků. Jde o rotace o 90
a o 180
okolo os procházejících
protějšími vrcholy, o rotace o 180
podle os procházejících středy protějších
hran a konečně o rotace o 120
okolo os procházejích středy protějších stěn.
b) Obarvení osmistěnu, považujeme-li každou stěnu za jedinečnou, je celkem 38
.
Pro každou rotační symetrii g spočtěme, kolik zachovává různých obarvení:
­ g je rotace o 90
podle osy procházející protějšími vrcholy. Potom g zachovává
32
obarvení. Takových rotací je celkem 6.
352 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
­ g je rotace o 180
podle osy procházející protějšími vrcholy nebo podle
osy procházející středy protějších hran. Potom g zachovává 34
různých
obarvení. Takových rotací je celkem 3 + 6 = 9.
­ g je rotace o 120
. Potom g zachovává opět 34
různých obarvení. Takových
rotací je osm.
Celkem je hledaný počet obarvení roven
1
24
(38
+ 6  32
+ 17  34
) = 333.
10.14.3. Kolik různých náramků lze sestavit právě z devíti bílých, šesti červených
a tří černých korálků? (dva náramky považujeme za stejné, pokud se liší pouze
nějakou rotací v prostoru)
Řešení. Grupa symetrií náramku je dihedrální grupa D18 o 36 prvcích. Ta operuje
na množině náramků, kde máme pevně očíslovaná místa na náramku (od jedné
do osmnácti), těch je 18!/(9!6!3!) = 4084080. Symetrie, které zachovávají nenulový
počet takovýchto náramků jsou zjevně pouze rotace o 120
a 240
a zrcadlení podle
osy procházející protějšími vrcholy (takových je devět) a samozřejmě identita. Podle
Burnsidova lematu je hledaný počet náramků roven
1
36
(4084080 + 2 
6
3
3
3
+ 9 
8
4
4
3
) = 113590.
2. Okruhy polynomů a tělesa
10.12
10.15. Okruhy a tělesa. Jak jsme viděli, s grupami se potkáváme nejčastěji jako
s množinami transformací. Zároveň ale byly vlastnosti grupy podstatné u skalárů
i vektorů, tam ovšem vystupovalo několik obdobných struktur zároveň. Zaměříme
se teď právě na takové případy. Jako standardní příklady přitom mějme na mysli
skaláry (tj. celá čísla Z, racionální čísla Q, komplexní čísla C) a množiny polynomů
nad takovými skaláry K.
Celá čísla mají následující vlastnosti tzv. okruhu:
Definice. Komutativní grupa (M, +) s neutrálním prvkem 0  M, spolu s další
operací  splňující
* (a  b)  c = a  (b  c), pro všechny a, b, c  M;
* a  b = b  a, pro všechny a, b  M;
* existuje prvek 1 takový, že pro všechny a  M platí 1  a = a;
* a  (b + c) = a  b + a  c, pro všechny a, b, c  M;
se nazývá komutativní okruh.
Jestliže v okruhu K platí c  d = 0 právě, když alespoň jeden z prvků c a d je
nulový, pak nazýváme okruh K oborem integrity.
Poslední vlastnosti v našem výčtu axiomů okruhu se říká distributivita. Pokud
neplatí vlastnost komutativity operace , hovoříme o (nekomutativním okruhu). V
dalším se ovšem omezíme pouze na okruhy komutativní. Operaci + budeme říkat
sčítání a operaci  násobení. Navíc budeme vždy předpokládat existenci jedničky 1
pro operaci násobení, neutrálnímu prvku pro sčítání říkáme nula.
2. OKRUHY POLYNOMŮ A TĚLESA 353
Obecně říkáme, že a  K dělí c  K, jestliže existuje b tak, že a  b = c.
Skutečnost že c  K je dělitelné a  K zapisujeme a|c. Dodatečnou vlastností
oboru integrity oproti obecnému okruhu je neexistence netriviálních dělitelů nuly.
Okamžitě odtud také vyplývá jednoznačnost dělitelů: je-li b = a  c a b = 0, pak c je
jednoznačně dáno volbou a, b. Pro b = ac = ac totiž platí 0 = a  (c - c ) a a = 0,
proto c = c .
Dělitelé jedničky, tj. invertibilní prvky v K, se nazývají jednotky. Jednotky
v komutativním okruhu vždy tvoří komutativní grupu. Netriviální (komutativní)
okruh, ve kterém jsou všechny nenulové prvky invertibilní, se nazývá (komutativní)
těleso. Komutativní těleso se také nazývá pole.
Typickým příkladem komutativních okruhů, tj. polí, jsou číslené obory Q, R, C.
Dále pak všechny okruhy zbytkových tříd Zp s prvočíselným p. Dobrým příkladem
nekomutativního okruhu s jedničkou je množina Matk(K) všech čtvercových matic
nad okruhem K s k řádky a sloupci. Jak jsme viděli dávno, není to ani obor integrity.
Jako příklad nekomutativního tělesa uveďme těleso kvaternionů H.
V každém komutativním okruhu K s jedničkou platí následující vztahy (které
nám jistě připadají samozřejmé u skalárů)
(1) 0  c = c  0 = 0 pro všechny c  K,
(2) -c = (-1)  c = c  (-1) pro všechny c  K,
(3) -(c  d) = (-c)  d = c  (-d) pro všechny c, d  K,
(4) a  (b - c) = a  b - a  c,
(5) celý okruh K je triviální množinou {0} = {1} právě, když 0 = 1.
Důkaz. Všechna tvrzení vyplývají z jednoduché úvahy a definičních axiomů.
V prvém případě počítáme pro jakákoliv c, a:
c  a = c  (a + 0) = c  a + c  0 = c  a
a protože jediným neutrálním prvkem vůči sčítání je nula, dostáváme a  0 = 0.
Stejně se dokáže i 0  a. Ve druhém případě teď stačí spočíst
0 = c  0 = c  (1 + (-1)) = c + c  (-1),
proto je c  (-1) opačný prvek k prvku c, což jsme chtěli dokázat.
Další dvě tvrzení jsou už přímým důsledkem druhého vztahu a základních axiomů.
Jestliže je celý okruh tvořen jediným prvkem, je pochopitelně 0 = 1. Naopak,
jestliže platí 1 = 0, pak pro jakékoliv c  K je c = 1  c = 0  c = 0.
10.13
10.16. Polynomy. Definice komutativního okruhu s jedničkou abstrahuje právě
vlastnosti potřebné k násobení a sčítání. Můžeme je hned využít pro práci s tzv.
polynomy. Rozumíme jimi jakýkoliv konečný výraz, který lze poskládat ze známých
konstantních prvků K a jedné neznámé proměnné pomocí operací sčítání a násobení.
Formálně můžeme definovat polynomy takto:2
Definice. Nechť K je jakýkoliv komutativní okruh skalárů s jedničkou. Polynomem
nad K rozumíme konečný výraz
f(x) =
k
i=0
aixi
2Ne náhodou je pro okruh použit symbol K ­ představujte si pod ním třeba kterýkoliv okruh
naších skalárů, definice je ovšem obecná.
354 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
kde ai  K, i = 0, 1, . . . , k, jsou tzv. koeficienty polynomu. Je-li ak = 0, říkáme,
že f(x) má stupeň k, píšeme deg f = k. Nulový polynom nemá stupeň, polynomy
stupně nula jsou právě nenulové prvky v K, kterým říkáme konstantní polynomy.
Polynomy f(x) a g(x) jsou stejné, jestliže mají stejné nenulové koeficienty.
Množinu všech polynomů nad okruhem K budeme značit K[x].
Každý polynom zadává zobrazení f : K  K, jehož hodnota vznikne dosazením
hodnoty c za nezávislou proměnnou x, tj.
f(c) = a0 + a1c +    + akck
.
Všimněme si, že konstantní polynomy odpovídají právě konstantním zobrazením.
Kořen polynomu f(x) je takový prvek c  K, pro který je f(c) = 0  K.
Obecně mohou různé polynomy definovat různá zobrazení. Např. polynom x2
+
x  Z2[x] zadává identicky nulové zobrazení. Obecněji, pro každý konečný okruh
K = {a0, a1, . . . , ak} zadává polynom f(x) = (x - a0)(x - a1) . . . (x - ak) identicky
nulové zobrazení. Zároveň ale platí tvrzení, které dokážeme zanedlouho:
Tvrzení. Jestliže je K nekonečný okruh, pak dva polynomy f(x) a g(x) nad K jsou
stejné právě, když jsou stejná příslušná zobrazení f a g.
Dva polynomy f(x) = i aixi
a g(x) = i bixi
umíme přirozeně také sčítat i
násobit:
(f + g)(x) = (a0 + b0) + (a1 + b1)x +    + (ak + bk)xk
(f  g)(x) = (a0b0) + (a0b1 + a1b0)x +    + (a0b + a1b -1 +    + a b0)x + . . .
kde uvažujeme nulové koeficienty všude, kde v původním výrazu pro polynomy
nenulové koeficienty nejsou3
a u sčítání nechť je k maximální ze stupňů f a g.
Tato definice vskutku odpovídá příslušným operacím sčítání a násobení hodnot
zobrazení f, g : K  K, díky vlastnostem ,,skalárů v původním okruhu K.
Přímo z definice vyplývá, že množina polynomů K[x] nad komutativním okruhem
s jedničkou je opět komutativním okruhem s jedničkou, přičemž jedničkou v
K[x] je opět jednička 1 v okruhu K vnímaná jako polynom stupně nula.
Lemma. Okruh polynomů nad oborem integrity je opět obor integrity.
Důkaz. Máme ukázat, že v K[x] mohou být netriviální dělitelé nuly pouze,
jetliže jsou už v K. To je ale zřejmé z výrazu pro násobení polynomů. Jsou-li f(x)
a g(x) polynomy stupně k a jako výše, pak koeficient u xk+
v součinu f(x)  g(x)
je součin ak  b a ten musí být nenulový, pokud nejsou dělitelé nuly v K.
10.14
10.17. Dělitelnost a nerozložitelnost. Naším dalším cílem bude pochopit, jak
je to v obecném případě polynomů nad oborem integrity s jejich rozkladem na
součin polynomů jednodušších, tj. ve speciálním případě budeme diskutovat kořeny
polynomů.
Směřujeme tedy ke zobecnění rozkladů polynomů nad číslenými obory a k tomu
nejprve potřebujeme ujasnit, co je dělitelnost v základním okruhu K samotném.
Uvažujme proto nějaký pevně zvolený obor integrity K, třeba celá čísla Z nebo
okruh Zp s prvočíselným p.
* je-li a|b a zároveň b|c pak také a|c;
3Formálně bychom mohli naopak za polynom považovat nekonečný výraz pro i = 0, . . . ,  s
podmínkou, že jen konečně mnoho koeficientů je nenulových.
2. OKRUHY POLYNOMŮ A TĚLESA 355
* a|b a zároveň a|c pak také a|(b + c) pro všechny ,   K;
* a|0 pro všechny a  K (je totiž a  0 = 0);
* každý prvek a  K je dělitelný všemi jednotkami e  K a jejich násobky a  e
(jak přímo plyne z existence e-1
)
Řekneme, že prvek a  K je nerozložitelný, jestliže je dělitelný pouze jednotkami
e  K a jejich násobky a  e. Řekneme, že okruh K je obor integrity s jednoznačným
rozkladem, jestliže platí:
* pro každý nenulový prvek a  K existují nerozložitelné a1, . . . , ar  K takové,
že a = a1  a2 . . . ar
* jsou-li prvky a1, . . . , ar a b1, . . . , bs nerozložitelné, nejsou mezi nimi žádné jednotky
a a = a1a2 . . . ar = b1b2 . . . bs, pak je r = s a ve vhodném přeuspořádání
platí aj = ejbj pro vhodné jednotky ej.
Příklad. (1) Z je obor integrity s jednoznačným rozkladem.
(2) Každé pole (komutativní těleso) je obor integrity s jednoznačným rozkladem
(a každý nenulový prvek je jednotka).
(3) Nechť K má prvky tvaru a0 +
k
i=1 ai
2ni

xmi kde a0, . . . , ak  Z, mi, n 
Z>0. Pak jednotky jsou pouze prvky 1, všechny prvky s a0 = 0 jsou rozložitelné,
ale např. výraz x nelze vyjádřit jako součin nerozložitelných. (Nerozložitelných
je zde příliš málo.)
10.15
10.18. Dělení se zbytkem a kořeny polynomu. Základním nástrojem pro diskusi
dělitelnosti, společných dělitelů apod. v okruhu celých čísel Z je procedura
dělení se zbytkem a Euklidův algoritmus pro hledání největších společných dělitelů.
Tyto postupy nyní zobecníme.
Lemma (Algoritmus pro dělení se zbytkem). Nechť K je komutativní okruh bez
dělitelů nuly a f, g  K[x] polynomy, g = 0. Pak existuje a  K, a = 0, a polynomy
q a r splňující af = qg+r, kde r = 0 nebo deg r < deg g. Je-li navíc K pole, nebo je
aspoň vedoucí koeficient polynomu g roven jedné, potom lze volit a = 1 a polynomy
q a r jsou v tomto případě určeny jednoznačně.
Důkaz. Tvrzení dokážeme indukcí vzhledem ke stupni f. Je-li deg f < deg g
nebo f = 0, pak volíme a = 1, q = 0, r = f , což vyhovuje všem našim podmínkám.
Pro konstantní polynom g klademe a = g, q = f, r = 0.
Předpokládejme tedy, že deg f  deg g > 0 a pišme f = a0+  +anxn
, g = b0+
  +bmxm
. Buď platí bmf-anxn-m
g = 0 a nebo je deg(bmf-anxn-m
g) < deg f. V
prvém případě jsme hotovi, ve druhém pak, podle indukčního předpokladu, existují
a , q , r splňující a (bmf - anxn-m
g) = q g + r a buď r = 0 nebo deg r < deg g.
Tzn.
a bmf = (g + a anxn-m
)g + r .
Přitom je-li bm = 1 nebo BbbK je pole, pak podle indukčního předpokladu lze
volit a = 1 a q , r jsou tak určeny jednoznačně. V takovém případě ovšem získáme
bmf = (g + anxn-m
)g + r a je-li BbbK pole, můžeme rovnost vynásobit b-1
.
Předpokládejme, že f = q1g+r1 je jiné řešení. Pak 0 = f-f = (q-q1)g+(r-r1)
a buď je r = r1, nebo deg(r - r1) < deg g. V prvém případě odtud ovšem plyne i
q = q1, protože K[x] neobsahuje dělitele nuly. Nechť axs
je člen nejvyššího stupně
v q - q1 = 0 (určitě existuje). Potom jeho součin se členem nejvyššího stupňe v g
musí být nulový (protože nejvyšší stupeň dostaneme tak , že vynásobíme nejvyšší
stupně). To ovšem znamená, že a = 0. Protože axs
byl největší nenulový stupeň,
356 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
nutně dostáváme, že q - q1 žádné nenulové monomy neobsahuje, je tedy určitě
nulové. Pak ovšem i r = r1.
Proceduru dělení se zbytkem můžeme okamžitě využít k diskusi kořenů polynomů.
Uvažme tedy polynom f(x)  K[x], deg f > 0, a zkusme jej vydělit polynomem
x - b, b  K. Protože je vedoucí koeficient jednička, algoritmus pro dělení
dává jednoznačný výsledek. Dostáváme tedy jednoznačně zadané polynomy q a r
splňující f = q(x-b)+r, kde r = 0 nebo deg r = 0, tj. r  BbbK. Tzn., že hodnota
polynomu f v b  K je rovna právě f(b) = r. Z toho plyne, že prvek b  K je kořen
polynomu f právě, když (x - b)|f. Protože po vydělení polynomem stupně jedna
vždy klesne stupeň výsledku alespoň o jedničku, dokázali jsme následující tvrzení:
Důsledek. Každý polynom f  K[x] má nejvýše deg f kořenů.
Tento výsledek také ověřil Tvrzení 10.16, protože dva polynomy nad nekonečným
komutativním okruhem, které zadávají stejné zobrazení K  K, mají rozdíl,
jehož kořenem je každý prvek v K. To však není možné, protože rozdíl polynomů
má jen konečný stupeň, pokud není nulový.
10.16
10.19. Největší společný dělitel polynomů. Nejprve si připomeňme, že h je
největší společný dělitel dvou polynomů a f a g  K[x] jestliže:
* h|f a zároveň h|g
* jestliže k|fa zároveň k|g pak také k|h.
Důsledek (Bezoutova rovnost). Nechť K je pole a nechť f, g  K[x]. Pak existuje
největší společný dělitel h polynomů f a g. Polynom h je určený jednoznačně, až
na násobek nenulovým skalárem. Přitom existují polynomy A, B  K[x] takové, že
h = Af + Bg.
Důkaz. Přímá konstrukce polynomů h, A a B se provede tzv. Euklidovým
algoritmem. Provádíme postupně dělení se zbytkem (K je pole, takže to vždy umíme
jednoznačně, viz. předchozí lemma):
f = q1g + r1
g = q2r1 + r2
r1 = q3r2 + r3
...
rp-1 = qp+1rp + 0.
V tomto postupu neustále klesají stupně ri, proto jistě nastane rovnost z posledního
řádku (pro vhodné p) a ta říká, že rp|rp-1. Z předposledního řádku pak ale plyne
rp|rp-2 a postupně dojdeme až nazpět k prvnímu a druhému řádku, které dají rp|g
a rp|f.
Pokud h|f a h|g, pak ze stejných rovností postupně plyne, že h dělí všechny ri,
zejména tedy rp, tzn. získali jsme největšího společného dělitele h = rp polynomů
f a g.
2. OKRUHY POLYNOMŮ A TĚLESA 357
Nyní můžeme postupně dosazovat z poslední do předchozích rovnic.
h = rp = rp-2 - qprp-1
= rp-2 - qp(rp-3 - qp-1rp-2)
= -qprp-3 + (1 + qp-1)rp-2
= -qprp-3 + (1 + qp-1qp)rp-2
= -qprp-3 + (1 + qpqp-1)(rp-4 - qp-2rp-3)
...
= Af + Bg.
Zformulujeme si nyní velice elegantní tvrzení, jehož důkaz je poměrně technický
a nebudeme jej prezentovat v detailech (i když jsme si vše potřebné pro něj již v
podstatě připravili).
10.17 10.20. Věta. Je-li K obor integrity s jednoznačným rozkladem, pak také okruh
polynomů K[x] je obor integrity s jednoznačným rozkladem.
Důkaz. Myšlenka důkazu je velice jednoduchá. Uvažujme polynom f  K[x].
Je-li f rozložitelný, pak je f = f1  f2, kde žádný z polynomů f1, f2  K[x] není
jednotka. Předpokládejme na chvíli navíc, že je-li f dělitelný nerozložitelným polynomem
h, pak jistě h dělí f1 nebo f2.
Pokud tomu tak vždy bude, docílíme postupnou aplikací předchozí úvahy jednoznačný
rozklad. Pokud je totiž f1 dále rozložitelné, opět f1 = g1  g2, kde g1, g2
nejsou jednotky, a přitom vždy buď oba polynomy g1 a g2 mají menší stupeň než
f, nebo se sníží počet nerozložitelných faktorů ve vedoucích členech g1 a g2 (např.
nad celými čísly Z je 2x2
+2x+2 = 2(x2
+x+1)). Proto po konečném počtu kroků
dojdeme k rozkladu f = f1 . . . fr na nerozložitelné polynomy f1, . . . , fr.
Z našeho dodatečného předpokladu také plyne, že každý nerozložitelný polynom
h dělící f, dělí některý z f1, . . . , fr. Proto pro každý další rozklad f = f1f2 . . . fs
nutně každý z faktorů fi dělí některý z fj a v takovém případě musí být fj = efi
pro vhodnou jednotku e. Postupným krácením takových dvojic odvodíme, že r = s
a jednotlivé faktory se liší pouze o násobky jednotek.
Zbývá tedy dokázat, že je-li f = f1f2 dělitelný nerozložitelným polynomem h,
pak jistě h dělí f1 nebo f2. Tento důkaz zde nebudeme provádět.
Důsledkem této věty je skutečnost, že každý polynom nad komutativním okruhem
s jednoznačným rozkladem můžeme rozložit tak, jak to známe s polynomy s
reálnými nebo komplexními koeficienty. Pokud má polynom tolik kořenů, včetně
násobnosti, jako je jeho stupeň deg f = k, je odpovídající rozklad tvaru
f(x) = (x - a1)  (x - a2) . . . (x - ak).
Zatímco reálné polynomy mohou být i úplně bez kořenů, každý komplexní polynom
naopak takovýto rozklad připouští. To je obsahem tzv. základní věty algebry, kterou
pro úplnost uvádíme s (v podstatě) kompletním důkazem:
10.18 10.21. Věta (Základní věta algebry). Pole C je algebraicky uzavřené, tj. každý polynom
stupně alespoň 1 má kořen.
358 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Důkaz. Předpokládejme, že f  C[z] je nenulový polynom, který nemá kořen, tj. f(z) =
0 pro všechny z  C. Definujme zobrazení
 : C  C, z 
f(z)
|f(z)|
tj.  zobrazí celé C do jednotkové kružnice K1 = {eit
, t  R}  R2
= C. Díky našemu
předpokladu o nenulovosti f(z) je to skutečně dobře definované zobrazení. Dále definujme
zobrazení s hodnotami v kružnici Kr  C se středem v nule a poloměrem r  0
r : R  Kr, t  (t) = reit
.
Pro každé r  0, ) máme definováno spojité zobrazení r =   r : R  K1. Ze
spojité závislosti  na parametru r navíc vyplývá existence zobrazení r : R  R jednoznačně
zadaných podmínkami 0  r(0) < 2 a r(t) = eir(t)
. Získané zobrazení r opět spojitě
závísí na r. Celkem tedy máme spojité zobrazení
 : R × 0, )  R, (t, r)  r(t)
a z jeho konstrukce plyne že pro všechna r je 1
2
(r(2) - r(0)) = nr  Z. Protože je 
spojité, znamená to, že nr je celočíselná konstanta nezávislá na r. Podívejte se na obrázek,
odkud kam jdou jednotlivá zobrazení v naší konstrukci!
$0$
$2\pi$
$0$
$\psi_r$
$\alpha_r$
$psi_1$
$K_1$
$\phi$$e^{it}$
$K_r$
$2\pi$
Pro dokončení důkazu si stačí uvědomit, že pokud f = a0 +    + adzd
a ad = 0, pak pro
malá r se bude r chovat podobně jako konstantní zobrazení, zatímco pro velká r to vyjde
stejně, jako kdyby f = zd
. Nejprve si spočtěme, jak tedy nr dopadne při f = zd
, pak toto
tvrzení upřesníme a důkaz tím bude ukončen.
Funkce C  C, z  zd
, z  zd
|zd|
se snadno vyjádří pomocí goniometrického tvaru
komplexních čísel z = r(cos  + i sin ).
zd
= rd
(cos d + i sin d) = rd
eid
zd
|zd|
= 1(cos d + i sin d) = eid
zobrazení  je tedy v tomto případě pouze ,,zatočení na jednotkové kružnici. Pak tedy r(t) =
eidt
a proto r(t) = dt, nezávisle na r. Odtud pro naši volbu f = zd
vyplývá nr = d. Pokud
zvolíme f = azd
, a = 0, nebude to mít na předchozí výsledek žádný vliv (přesvědčte se!).
2. OKRUHY POLYNOMŮ A TĚLESA 359
Zvolme nyní obecný polynom f = a0 +  +adzd
, který nemá kořen. Víme tedy, že a0 = 0
(pokud by bylo a = 0, existoval by kořen). Pro z = 0 platí
f(z)
adzd
= 1 +
1
ad
(a0z-d
+    + ad-1z-1
)
a proto lim|z|
f(z)
adzd = 1. Když tohle víme, můžeme spočítat
lim
|z|
˛
˛
˛
˛
f(z)
|f(z)|
-
adzd
|adzd|
˛
˛
˛
˛ = lim
|z|
˛
˛
˛
˛
f(z)
adzd
adzd
|adzd|
|adzd
|
|f(z)|
-
adzd
|adzd|
˛
˛
˛
˛ = 0.
Proto nr = d pro velká r.
Podobnou úvahu uděláme i pro malá r. Připomeňme si, že a0 = 0.
f(z)
a0
= 1 +
1
a0
(a1z +    + adzd
)
proto lim|z|0
f(z)
a0
= 1. Přitom opět platí f(z)
|f(z)|
= f(z)
a0
a0
|a0|
|a0|
|f(z)|
. Odtud lim|z|0
f(z)
|f(z)|
=
lim|z|0
a0
|a0|
, tj. nr = 0 pro malá r. Celkem vidíme, že stupeň našeho polynomu je d = 0.
10.22. Řešené příklady.
10.22.1. Určete inverze prvků 17, 18 a 19 v (Z
131, ), tedy v grupě invertibilních
prvků ze Z131 s operací násobení.
Řešení. Nalezneme pomocí Eukleidova algoritmu: 131 = 7  17 + 12,
17 = 12 + 5,
12 = 2  5 + 2,
5 = 2  2 + 1,
je tedy 1 = 5 - 2  2 = 5 - 2(12 - 2  5) = 5  5 - 2  12 = 5  (17 - 12) - 2  12 =
5  17 - 7  12 =
= 5  17 - 7  (131 - 7  17) = 54  17 - 7  131,
inverze k 17 je 54.
Obdobně [18]-1
= 51 a [19]-1
= 69.
10.22.2. Rozložte nad C a nad R mnohočlen
x4
+ 2x3
+ 3x2
+ 2x + 1.
Řešení. Příklad lze řešit jak hledáním největšího společného dělitele s derivací, tak
jako reciprokou rovnici:
* Spočítejme Eukleidovým algoritmem největšího společného dělitele daného polynomu
a jeho derivace 4x3
+ 6x2
+ 6x + 2. Největší společný dělitel je dán v
libovolném okruhu až na násobek jednotky a i v průběhu Eukleidova algoritmu
můžeme mezivýsledky násobit jednotkami daného okruhu. V případě okruhu
polynomů nad okruhem skalárů jsou jednotky právě všechny skaláry. Násobíme
tak, abychom se v co největší míře vyhnuli počítání se zlomky.
360 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
2x4
+ 4x3
+ 6x2
+ 4x + 2 : 2x3
+ 3x2
+ 3x + 1 = x +
1
2
2x4
+ 3x3
+ 3x2
+ x
x3
+ 3x2
+ 3x + 2
x3
+
3
2
x2
+
3
2
x +
1
2
3
2
x2
+
3
2
x +
3
2
Dále dělíme polynom 2x3
+3x2
+3x+1 zbytkem 3
2 x2
+ 3
2 x+ 3
2 (pronásobeným
jednotkou 2
3 )
2x3
+ 3x2
+ 3x + 1 : x2
+ x + 1 = 2x + 1
2x3
+ 2x2
+ 2x
x2
+ x + 1
Násobné kořeny původního polynomu jsou právě kořeny největšího společného
dělitele tohoto polynomu se svojí derivací, tedy kořeny polynomu x2
+ x + 1.
Tento má právě kořeny -1
2  i

3/2, které jsou dvojnásobnými kořeny původního
polynomu. Rozklad polynomu nad C je tedy rozkladem na součin kořenových
činitelů (tak je tomu podle základní věty algebry vždy):
x4
+ 2x3
+ 3x2
+ 2x + 1 = (x +
1
2
- i

3
2
)2
(x +
1
2
+ i

3
2
)2
.
Rozklad nad R pak dostaneme vynásobením kořenových závorek odpovídajících
komplexně sdruženým kořenům polynomu (tento součin musí být polynom s
reálnými koeficienty, ověřte!):
x4
+ 2x3
+ 3x2
+ 2x + 1 = (x2
+ x + 1)2
.
* Řešme rovnici
x4
+ 2x3
+ 3x2
+ 2x + 1 = 0.
Vydělením x2
a substitucí t = x + 1
x dostáváme rovnici
t2
+ 2t + 1 = 0,
s dvojnásobným kořenem -1. Dosazením do substituce dostáváme již známou
rovnici x2
+ x + 1 = 0 s výše uvedenými řešeními.
10.23. Poznámka. Připomeňme na tomto místě známé tvrzení, že jedinými ireducibilnímy
polynomy nad R jsou lineární polynomy a kvadratické polynomy se
záporným diskriminantem. Toto tvrzení vyplývá i z úvah v předchozím příkladě.
10.23.1. Rozložte polynom
x5
+ 3x3
+ 3
na ireducibilní složky nad
(1) Q
(2) Z7
Řešení.
2. OKRUHY POLYNOMŮ A TĚLESA 361
(1) Podle Eisensteinova kriteria je daný polynom ireducibilní nad Z i Q (použijeme
prvočíslo 3)
(2) (x - 1)2
(x3
+ 2x2
- x + 3). Např. pomocí Hornerova schematu zjistíme dvojnásobný
kořen 1. Po vydělení polynomem (x - 1)2
dostáváme polynom (x3
+
2x2
- x + 3), který již nemá nad Z7 kořeny. Proto je ireducibilní (kdyby byl
rozložitelný, musel by mít jeden faktor stupeň jedna, tedy (x3
+ 2x2
- x + 3)
by musel mít kořen).
10.23.2. Rozložte polynom x4
+ 1 nad
* Z3,
* C,
* R.
Řešení.
* (x2
+ x + 2)(x2
+ 2x + 2)
* Kořeny jsou všechy čtvrté odmocniny z -1, ty leží v komplexní rovině na jednotkové
kružnici a mají argumenty postupně /4, /4+/2, /4+ a /4+3/2,
jsou to tedy čísla 

2/2  i

2/2. Rozklad tedy je
(x -

2
2
- i

2
2
)(x -

2
2
+ i

2
2
)(x +

2
2
- i

2
2
)(x -

2
2
+ i

2
2
).
* Vynásobením kořenových činitelů komplexně sdružených kořenů v rozkladu nad
C dostáváme rozklad nad R:
(x2
-

2x + 1)(x2
+

2x + 1).
10.23.3. Nalezněte polynom s racionálními koeficienty a s co nejmenším stupněm,
jehož kořenem je číslo 2007

2.
Řešení. P(x) = x2007
- 2. Ukažme, že neexistuje polynom menšího stupně s
kořenem 2007

2. Buď totiž Q(x) nenulový polynom nejmenšího stupně s kořenem
2007

2. Pak st Q(x)  2007. Vydělme P(x) polynomem Q(x) se zbytkem: P(x) =
Q(x)  D(x) + R(x), kde D(x) je neúplný podíl po dělení a R(x) zbytek po dělení,
st R(x) < st Q(x), nebo R(x) = 0. Dosazením čísla 2007

2 do poslední rovnice vidíme,
že 2007

2 je kořenem i polynomu R(x), z definice polynomu Q(x) musí být
tedy R(x) nulový polynom, tedy Q(x) dělí P(x). Polynom P(x) je však ireducibilní
(podle Eisensteinova kriteria), jeho jediným netriviálním dělitelem je on sám (až na
násobení jednotkou okruhu polynomů nad Q, tedy racionální konstantou), je tedy
Q(x) = P(x) (opět až na pronásobení jednotkou). Například polynom 1
3 x2007
- 2
3
také splňuje podmínky zadání. Normovaný polynom splňující tyto podmínky je
však již jediný a je to polynom P(x).
10.23.4. Najděte všechny irreducibilní polynomy stupně nejvýše 2 nad Z3.
Řešení. Nerozložitelné jsou z definice všechny lineární mnohočleny. Nerozložitelné
polynomy stupně dva dostame tak, že z množiny všech polynomů stupně 2 nad
Z3 ,,vyškrtáme rozložitelné polynomy, tedy násobky dvojic lineáních polynomů.
362 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Reducibilní polynomy stupně dva jsou tedy: (x + 1)2
= x2
+ 2x + 1, (x + 2)2
=
x2
+x+1, (2x+1)2
= (2  (x + 2))
2
= x2
+x+1, (2x+2) = x2
+2x+1, x2
, x(x+1) =
x2
+ x, x(x + 2) = x2
+ 2x. Stačí uvažovat pouze normované polynomy, ostatní
z nich dostaneme násobením dvojkou (rozmysli). Celkem normované ireducibilní
polynomy stupně 2 nad Z3 jsou x2
+ 2x + 2, x2
+ x + 2, x2
+ 1.
10.23.5. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte
jeho rozklad:
x4
+ x3
+ x + 2
Řešení. Dosazením čísel 0, 1, 2 zjistíme, že daný polynom nemá v Z3 kořen. Je
tedy buď ireducibilní nebo je součinem dvou polynomů stupně 2. Vzhledem k tomu,
že daný polynom je normovaný, tak je-li součinem nějakých dvou polynomů stupně
dva, je součinem i normovaných polynomů stupně dva (po případném pronásobení
obou polynomů dvojkou). Hledejme tedy konstanty a, b, c, d  Z3 tak, aby
x4
+x3
+x+2 = (x2
+ax+b)(x2
+cx+d) = x4
+(a+c)x3
+(ac+b+d)x2
+(ad+bc)x+bd.
Porovnáním koeficientů u jednotlivých mocnin x dostáváme soustavu čtyř rovnic o
čtyřech neznámých:
1 = a + c
0 = ac + b + d
1 = ad + bc
2 = bd
Z poslední rovnice je jedno z čísel b, d rovno jedné, druhé pak dvěma, vzhledem k
symetrii soustavy vůči dvojicím (a, b) a (c, d) můžeme zvolit například b = 1, d = 2.
Z druhé rovnice potom ac = 0, tedy jedno z čísel a, b je nula, z první rovnice je pak
druhé z nich jednička. Ze třetí rovnice 2a + c = 1, je tedy a = 0, c = 1. Celkem
x4
+ x3
+ x + 2 = (x2
+ 1)(x2
+ x + 2).
10.23.6. Pro libovolné liché prvočíslo p určete všechny kořeny polynomu
P(x) = xp-2
+ xp-3
+    + x + 2
v tělese Zp.
Řešení. Vzhledem k rovnosti
xp-1
- 1 = (x - 1)(P(x) - 1)
jsou všechna čísla ze Zp kromě jedničky kořeny P(x)-1, nemohou tedy být kořeny
P(x) + 1. Jednička je kořenem triviálně vždy, je to tedy jediný kořen.
10.24. Příklady na procvičení.
10.24.1. Nalezněte inverzi prvku [49]Z253 v Z253
Řešení. 31
10.24.2. Nalezněte inverzi prvku [37]Z208
v Z208.
Řešení. 45
2. OKRUHY POLYNOMŮ A TĚLESA 363
10.24.3. Nalezněte inverzi prvku [57]Z359
v Z359.
Řešení. 63.
10.24.4. Nalezněte inverzi prvku [17]Z40
v Z40.
Řešení. 33.
10.24.5. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte
jeho rozklad na ireducibilní faktory:
x5
+ x2
+ 2x + 1
Řešení. x5
+ x2
+ 2x + 1 = (x2
+ 1)(x3
+ 2x + 1)
10.24.6. Rozhodněte, zda je následující polynom nad Z3 ireducibilní, případně nalezněte
jeho rozklad:
x4
+ 2x3
+ 2
Řešení. x4
+2x3
+2 je ireducibilní. Nemá kořeny a není součinem dvou polynomů
stupně 2 (nutno početně ověřit!).
10.24.7. Nalezněte všechny normované ireducibilní polynomy stupně 3 nad Z3.
10.25. Eulerova funkce. Eulerova funkce  : N  N udává počet čísel nepřevyšujících
n s číslem n nesoudělných. Je-li n =
s
i=1 pi
i rozklad přirozeného čísla n
na prvočísla, pak
(n) =
s
i=1
(pi
i - pi-1
i )
Tvrzení. Eulerova věta. Pro nesoudělná (a, m), a, m  Z platí
a(m)
 1 (mod m)
Důkaz. Grupa všech invertibilních prvků v Zm má (m) prvků, jedná se tedy
o speciální případ důsledku 10.10.
Bezprostředním důsledkem je potom
10.26. Důsledek. Malá Fermatova věta. Buď p prvočíslo a nechť a je celé číslo,
které není násobkem p. Potom
ap-1
 1 (mod p)
10.27. Čínská věta o zbytcích. Vrátíme se nyní k dělitelnosti v oboru celých
čísel a souvisejícím pojmům, které nám budou později užitečné při diskusi některých
kódů a šifer.
Čínská věta o zbytcích, nebo též Čínská zbytková věta, má, jak její název napovídá,
původ v Číně. Objevuje se v knize Sun Tsu Suan Ching (Sun Tsuovy klasické
počty) ze 4.století, kde je ilustrována na příkladu:
Máme jistý neznámý počet předmětů. Pokud je rozdělíme do trojic, zbydou
dva. Při dělení do pětic zbydou tři, při dělení do sedmic zůstanou opět dva.
Kolik předmětů máme?
364 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Tvrzení. Buď m1, m2,. . . ,mn navzájem nesoudělná přirozená čísla (větší než jedna)
a nechť a1, a2,. . . ,ar jsou libovolná celá čísla, pak má soustava kongurencí
x  a1 (mod m1)
x  a2 (mod m2)
...
x  ar (mod mr)
s jednou neznámou x, právě jedno řešení v množině {1, 2, . . . , m1m2    mr}.
Důkaz. Označme M := m1m2    mr. Potom pro libovolné i, 1  i  r je mi
nesoudělné s M/mi, existuje tedy nějaké bi  {1, . . . , mi - 1} tak, že bi(M/mi) 
1 (mod mi) (čísla 0, 1  M/mi, 2  M/mi,. . . ,(mi - 1)(M/mi) vyčerpávají díky
nesoudělnosti mi a M/mi všechny zbytkové třídy při dělení mi). Všimněme si, že
bi(M/mi) je dělitelné všemi mj, 1  j  n, i = j. Proto je x := a1b1(M/mi) +
a2b2(M/m2) +    + anbn(M/mn) řešením dané kongruence, kde ai  ai (mod mi)
a ai  {0, . . . , mi - 1}.
Čínskou větu o zbytcích můžeme také ekvivalentně sformulovat v řeči okruhů
a jejich izomorfismů:
Tvrzení. Okruh Zmn je izomorfní okruhu Zm ×Zn právě, když je největší společný
dělitel (m, n) roven 1.
Důkaz. Definujeme f : Zmn  Zm × Zn vztahem
f([x]mn) = ([x]m, [x]n).
To je zjevně homomorfismem aditivních grup a zároveň přímý výpočet ukazuje, že
jde i o homomorfismus multiplikativních grup, který jedničku zobrazuje na jedničku.
10.28. Příklady.
10.28.1. Najděte poslední dvě cifry čísla 799
.
Řešení. Poslední dvě cifry daného čísla je jeho zbytek po dělení číslem 100. Stačí
tedy určit zbytek čísla 799
po dělení číslem 100. K tomu si všimněme, že 74

1 (mod 100) (z Eulerovy věty víme pouze, že 7
(100) = 74
0  1 (mod 100) a
nejmenší číslo t splňující 7t
 1 (mod 100) musí být dělitelem (100) = 40.). Dále
víme, že 9  1 (mod 4), proto i 99
 1 (mod 4). Celkem
799
= 74k+1
= 7k 4
1
7  7 (mod 100).
Poslední dvě cifry čísla 799
jsou tedy 07.
10.28.2. Určete poslední tři cifry čísla 131011
.
Řešení. Tři poslední cifry jsou zbytkem po dělení daného čísla čísla číslem 1000.
Ten jednoznačně určíme podle Čínské zbytkové věty pokud určíme zbytky po dělení
nesoudělnými čísly 125 a 8. Protože (13, 125) = 1 (125) = 100, platí
13100
 1 (mod 1)25.
2. OKRUHY POLYNOMŮ A TĚLESA 365
Zřejmě 101
1 je násobkem čísla 100, a tedy
131011
= 13102
109
= 13102 109
 1109
 1 (mod 125).
Podobně (8, 13)=1, (8) = 4 a
131011
= 134k
= 134 k
 1k
 1 (mod 8)
Mezi čísly 0,1,. . . ,999 existuje podle Čínské zbytkové věty právě jedno číslo, které
dává zbytek 1 jak po dělení osmi tak po dělení 125 a tím je číslo 1. Poslední tři
cifry čísla 131011
jsou tedy 001.
Mohli vyšetřovat přímo zbytek po dělení číslem 1000. Víme, že (1000) =
400 a 400|1011
, tedy 131011
 1 (mod 1000). Obecně ale bývá početně výhodnější
pracovat s nižšími moduly.
10.28.3. Určete poslední tři cifry čísla 121011
.
Řešení. Stejně jako v předchozím příkladě budeme zkoumat zbytky po dělení
nesoudělnými čísly 125 a 8. Víme, že (12, 125) = 1, tedy
121011
 12102
109
= 12102 109
 1109
 1 (mod 1)25.
Dále 4|12 tedy 121011
je dělitelné dokonce číslem 41011
, zejména tedy číslem 8, tedy
121011
 0 (mod 8). Podle Čínské zbytkové věty existuje je právě jedno z čísel
0, 1, 999, které dává zbytek 1 po dělení číslem 125 a je dělitelné osmi. To je číslo
376 (toto číslo můžeme snadno najít například tak, že procházíme násobky čísla
125, zvětšíme je o jedna a po té zkoumáme dělitelnost osmi). Poslední tři cifry čísla
131011
jsou tedy 376.
10.28.4. Dokažte, že pro libovolné prvočíslo p  N platí: p|(p - 1)p2
-1
- 1.
Řešení.
(p - 1)p2
-1
- 1 = (p - 1)(p-1)
(p+1)
- 1  1(p+1)
- 1 = 0 (mod p)
10.19
10.29. Polynomy více proměnných. Okruhy polynomů v proměnných x1, . . . , xr
definujeme induktivně vztahem
K[x1, . . . , xr] := K[x1, . . . , xr-1][xr].
Např. K[x, y] = K[x][y], tzn. že uvažujeme polynomy v proměnné y nad okruhem
K[x]. Snadno si každý ověří (proveďte si to!), že polynomy v proměnných x1, . . . , xr
lze chápat jako výrazy vzniklé z písmen x1, . . . , xn a prvků okruhu K konečným
počtem (formálního) sčítání a násobení v komutativním okruhu. Například prvky
v K[x, y] jsou tvaru
f = an(x)yn
+ an-1(x)yn-1
+    + a0(x)
= (amnxm
+    + a0n)yn
+    + (bp0xp
+    + b00)
= c00 + c10x + c01y + c20x2
+ c11xy + c02y2
+ . . .
Pro zjednodušení zápisu se často zavádí tzv. multiidexová symbolika. Multiindex  délky r
je r-tice nezáporných celých čísel (1, . . . , r). Celé číslo || = 1 +  +r nazýváme velikost
366 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
multiindexu . Stručně pak píšeme x
místo x1
1 x2
2 . . . xr
r . Pro polynomy v r proměnných
pak máme symbolické vyjádření velice podobné obvyklému značení pro polynomy v jedné
proměnné:
f =
X
||n
ax
, g =
X
||m
ax
 K[x1, . . . , xr].
Říkáme, že f má celkový stupeň n, je-li alespoň jeden z koeficientů s multiindexem  velikosti
n nenulový.
Okamžitě se také nabízejí analogické vzorce pro sčítání a násobení polynomů
f + g =
X
||max(m,n)
(a + b)x
fg =
m+nX
||=0
0
@
X
+=
(ab)x
1
A
kde multiindexy se sčítají po složkách a formálně neexistující koeficienty považujeme za nulové.
Samozřejmě musíme ověřit, že tyto vzorce opravdu popisují sčítání a násobení v induktivně
definovaném okruhu polynomů v r proměnných. Dokážeme to indukcí přes počet proměnných.
Předpokládejme, že vztahy platí v K[x1, . . . , xr-1] a počítejme součet
f = ak(x1, . . . , xr-1)xk
r +    + a0(x1, . . . , xr-1) =
X

ak,x
!
xk
r + . . .
g = bl(x1, . . . , xr-1)xl
r +    + b0(x1, . . . , xr-1) =
0
@
X

bl,x
1
A xk
r + . . .
f + g =
`
a0(x1, . . . , xr-1) + b0(x1, . . . , xr-1)
´
+
+
`
a1(x1, . . . , xr-1) + b1(x1, . . . , xr-1)
´
xr + . . .
=
`X

(ak, + bk,)(x1, . . . , xr-1)´
xk
r +    +
`X

(a0, + b0,)(x1, . . . , xr-1)´
=
X
(,j)
(aj, + bj,)(x1, . . . , xr-1)
xj
r.
Podobně se provede důkaz pro součin (proveďte!).
Jako důsledek naší definice a předchozích výsledků pro polynomy nad obecnými
komutativními okruhy dostaneme:
Důsledek. (1) Jestliže v okruhu K nejsou dělitelé nuly, pak také v okruhu polynomů
K[x1, . . . , xr] nejsou dělitelé nuly.
(2) Je-li K obor integrity s jednoznačným rozkladem, pak také okruh polynomů
K[x1, . . . , xr] je obor integrity s jednoznačným rozkladem.
Důkaz. Budeme postupovat indukcí přes počet proměnných r. 4
Pro r = 1
uvažujme polynomy f = anxn
1 +    + a1x1 + a0 a g = bmxm
+    + b0, přičemľ
bm = 0 a an = 0. Vedoucí člen součinu fg je anbmxn+m
, protože anbm = 0, zejména
tedy je součin nenulových polynomů opět nenulový.
Pokud tvrzení platí pro r - 1 proměnných, pak použijeme předchozí úvahu pro
okruh polynomů v jedné proměnné xr s koeficienty v K[x1, . . . , xr-1].
Druhé tvrzení vyplývá s induktivní definice polynomů v r proměnných a z Věty
10.20.
4Důkaz lze vést také přímo s použitím multiindexových formulí pro součin, ale museli bychom
si nadefinovat určité vhodné uspořádání monomů, abychom mohli pracovat s vedoucím koeficientem.
Zkuste si to!
3. USPOŘÁDANÉ MNOŽINY A BOOLEOVSKÁ ALGEBRA 367
10.20
10.30. Podílová tělesa. Nechť K je komutativní okruh (s jedničkou) bez dělitelů
nuly. Jeho podílové těleso definujeme jako třídy ekvivalence dvojic (a, b)  K × K,
b = 0, které zapisujeme a
b , a ekvivalence je dána
a
b
=
a
b
 ab = a b.
Sčítání a násobení definujeme prostřednictvím reprezentantů tříd
a
b
+
c
d
=
ad + bc
bd
a
b
c
d
=
ac
bd
Snadno se ověří korektnost této definice a všechny axiomy komutativního tělesa.
Zejména je 0
1 neutrální prvek vzhledem ke sčítání, 1
1 je neutrální prvek vzhledem k
násobení a pro a = 0, b = 0 je a
b
b
a = 1
1 .
Podílové těleso okruhu K[x1, . . . , xr] nazýváme těleso racionálních funkcí a značíme
je K(x1, . . . , xr). Všechny algebraické operace s polynomy v softwarových systémech
jako je Maple nebo Mathematica jsou prováděny ve skutečnosti nad podílovými
tělesy, tj. v tělesech raciolnálních funkcí, zpravidla s použitím K = Q.
3. Uspořádané množiny a Booleovská algebra
Tak jako jsme z vlastností čísel nebo symetrií objektů abstrahovali podstatné
axiomy a dostali jsme daleko šířeji použitelné nástroje linerární algebry, teorie grup
apod., nyní budeme postupovat obdobně a za východisko si vezmeme základní
operace s množinami, tj. jejich sjednocení, průnik a vztahy inkluze.
10.21
10.31. Množinová algebra. S každou množinou M máme také množinu K = 2M
všech jejích podmnožin a na ní operace  : K × K  K sjednocení množin a
 : K ×K  K průniku množin. To jsou dvě binární operace, které se častěji značí
 a . Dále máme ke každé množině A  K také její množinu doplňkovou A , což je
další unární operace. Konečně máme ,,největší objekt , tj. celou množinu M, který
je neutrální vůči operaci  a který proto budeme v této souvislosti označovat jako
1, a obdobně se chová prázdná množina   K vůči operaci . Tu budeme v této
souvislosti značit jako 0.
Na množině K všech podmnožin v M přitom platí pro všechny prvky A, B, C
následující vlastnosti:
A  (B  C) = (A  B)  C, A  (B  C) = (A  B)  C(1)
A  B = B  A, A  B = B  A(2)
A  (B  C) = (A  B)  (A  C), A  (B  C) = (A  B)  (A  C)(3)
existuje 0 tak, že A  0 = A(4)
existuje 1 tak, že A  1 = A(5)
A  A = 0, A  A = 1.(6)
Vlastnost (1) je asociativní zákon pro obě operace, (2) je komutativita, (3)
je distributivita obou operací. Poslední vlastnost (6) vystihuje vlastnosti komple-
mentu.
368 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Definice. Množině K spolu s dvěmi binárními operacemi  a  a jednou unární
operací splňující vlastnosti (1)­(7) říkáme Booleovská algebra. Operaci  budeme
říkat infimum (případně sjednocení, anglicky často také meet), operaci  budeme
říkat supremum (případně průnik, anglicky také join). Prvku A se říká doplněk k
prvku A.
Všimněme si, že axiomy Booleovské algebry jsou zcela symetrické vůči záměně
operací  a , společně se záměnou prvků 0 a 1. Důsledkem tohoto faktu je, že
jakékoliv tvrzení, které odvodíme z axiomů, má také platné duální tvrzení, které
vznikne z prvého právě záměnou všech výskytů  za  a naopak a stejně tak všech
výskytů 0 a 1. Hovoříme o principu duality.
Jako obvykle si hned odvodíme několik elementárních důsledků axiomů. Zejména
si povšimněme, že stejně jako u speciálního případu Booleovské algebry všech podmnožin
v dané množině M je doplněk k A  K určen jednoznačně (tj. máme-li
dáno (K, , ), může existovat nejvýše jedna unární operace, se kterou dostaneme
Booleovskou algebru). Skutečně, pokud B a C  K splňují vlastnosti A , platí
B = B  0 = B  (A  C) = (B  A)  (B  C) = 1  (B  C) = B  C
a podobně také C = C  B. Je tedy nutně B = C.
V následujícím výčtu se vlastnostem (2) říká absorpční zákony, vlastnosti (3)
popisují idempotentnost operací a (4) jsou tzv. De Morganova pravidla.
Tvrzení. V každé Booleovské algebře (K, , , ) platí pro všechny prvky v K
(1) A  0 = 0, A  1 = 1
(2) A  (A  B) = A, A  (A  B) = A
(3) A  A = A, A  A = A
(4) (A  B) = A  B , (A  B) = A  B
(5) (A ) = A.
Důkaz. Podle principu duality potřebujeme z každého z duálních tvrzení na
jednotlivých řádcích dokázat pouze jedno. Počítejme s využitím axiomů:
A  0 = A  (A  A ) = (A  A)  A = A  A = 0
A  (A  B) = (A  0)  (A  B) = A  (0  B) = A  0 = A
A = A  (A  A ) = (A  A)  0 = A  A
a první tři dvojice tvrzení máme dokázány. K důkazu De Morganových pravidel
stačí ověřit, že A  B má vlastnosti doplňku k A  B (pak to totiž bude doplněk
dle úvahy výše). S využitím (1) spočteme
(A  B)  (A  B ) = ((A  B)  A )  ((A  B)  B ) = (0  B)  (A  0) = 0.
Obdobně, s použitím (2) dostáváme
(A  B)  (A  B ) = (A  (A  B ))  (B  (A  B )) = (1  B )  (1  A ) = 1.
Konečně, přímo z definice je A  A = 0 a A  A = 1, má proto A požadované
vlastnosti doplňku k A a je tedy A = (A ) .
3. USPOŘÁDANÉ MNOŽINY A BOOLEOVSKÁ ALGEBRA 369
10.22
10.32. Výroková logika jako Booleova algebra. V předchozím odstavci jsme
použili symboliku, kterou je často rozumné interpretovat tak, že z prvků A, B,    
K tvoříme ,,slova pomocí operací , , a závorek vyjasňujících v jakém pořadí a
na jaké argumenty jsou operace aplikovány. Samotné axiomy a jejich důsledky pak
říkají, že velice často různá slova dávají stejnou hodnotu výsledku v K.
V případě množiny všech podmnožin K = 2M
je to zřejmé ­ prostě jde o
rovnost podmnožin. Nyní uvedeme stručně jinou podobnou souvislost.
Budeme pracovat opět se slovy jako výše, interpretujeme je ale jako tvrzení
složené z elementárních výroků A, B, . . . a logických operací AND (binární operace
), OR (binární operace ) a negace NOT (unární operace ). Takové slova nazýváme
výroky a přiřazujeme jim pravdivostní hodnotu v závislosti na pravdivostní
hodnotě jednotlivých elementárních argumentů. Pravdivostní hodnotu přitom bereme
jako prvek z triviální Booleovy algebry Z2, tedy buď 0 nebo 1. Pravdivostní
hodnota výroku je plně určena přiřazením hodnot pro nejjednoduší výroky A  B,
AB a A , tj. AB je pravdivé pouze, když jsou oba výroky A a B pravdivé, AB
je nepravdivé pouze. když jsou oba výroky nepravdivé a A má opačnou hodnotu
než A.
Výrok obsahující k elementárních výroků tedy představuje funkci (Z2)k
 Z2 a
dva výroky nazýváme logicky ekvivalentní, jestliže zadávají stejnou funkci. Snadno
se nyní přímo ověří, že na množině tříd logicky ekvivalentních výroků jsme takto
zadefinovali strukturu Booleovy algebry (je pouze třeba projít naše axiomy a ověřit
je). Nutně tedy pro výrokovou logiku bude v tomto smyslu platné vše, co dokážeme
pro obecné Booleovy algebry.
Stručně si proberme, jak vypadají obvyklé další jednoduché výroky ve výrokové
logice jakožto prvky Booleovy algebry (tj. reprezentujeme vždy naším výrazem třídu
výroků ekvivalentních):
Implikaci A  B dostaneme jako A  B, ekvivalenci A  B odpovídá (A 
B)  (A  B ). Dále vylučovací OR, neboli XOR, je dáno jako (A  B )  (A  B),
negace NOR operace OR je vyjádřena jako A  B a negace NAND operace AND
je dána jako A  B . Všimněme si také, že XOR odpovídá v množinové algebře
symetrickému rozdílu množin.
10.23
10.33. Přepínače jako Booleova algebra. Přepínač je pro nás černá skříňka,
která má jen dva stavy, buď je zapnut (a signál prochází) nebo naopak vypnut (a
signál neprochází).
B
A B
A
Jeden nebo více přepínačů zapojujeme do sítě sériově nebo paralelně. Sériové
zapojení je popsáno pomocí binární operace , paralelní je naopak . Unární operace
A zadává přepínač, který je vždy v opačné poloze než A. Každé konečné slovo
vytvořené pomocí přepínačů A, B, . . . a operací ,  a umíme převést na obrázek,
který bude představovat systém přepínačů propojených dráty a zcela obdobně jako
v minulém odstavci nám každá volba poloh jednotlivých přepínačů zadá hodnotu
,,zapnuto/vypnuto pro celý systém.
Opět se snadno krok po kroku ověří platnost základních axiomů Booleových
algeber pro náš systém. Na obrázku je ilustrován jeden z axiomů distributivity.
370 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Propojení bez přepínače odpovídá prvku 1, koncové body bez propojení (nebo
sériové zapojení A a A ) dává prvek 0.
=A
A
A
B
C
B
C
10.24
10.34. Dělitelé. Dalším přirozeným příkladem Booleovské algebry je systém dělitelů
přirozeného čísla nebo polynomu.
Zvolme pevně takové číslo p  N nebo polynom p  K[x1, . . . , xs] nad oborem
integrity K s jednoznačným rozkladem. Za nosnou množinu Dp bereme množinu
všech dělitelů q našeho p. Pro dva takové dělitele definujeme q  r jako největší
společný dělitel prvků q a r, q  r je nejmenší společný násobek. Dále klademe
p = 1  Dp a neutrálním prvkem vůči supremu je jednička v Z, resp. 1  K 
K[x1, . . . , xs]. Unární operaci dostáváme pomocí dělení: q = p/q.
Lemma. Množina Dp spolu s výše uvedenými operacemi ,  a je Booleova
algebra právě, když rozklad p neobsahuje kvadráty (tj. v jednoznačném rozkladu p =
q1 . . . qn na nerozložitelné faktory jsou všechna qi po dvou různá).
Důkaz. Ověření axiomů je vcelku snadné, projdeme jeden po druhém a budeme
zkoumat, kdy je zapotřebí nešeho požadavku na nepřítomnost kvadrátů v
rozkladu.
Největší společný dělitel konečného počtu čísel nebo polynomů nezávisí na pořadí,
ve kterém jej počítáme. Stejně tak pro nejmenší společný násobek. To odpovídá
axiomu (1) v 10.31. Komutativita, tj. axiom (2) je zcela zřejmá.
Pro tři libovolné prvky a, b, a c můžeme bez újmy na obecnosti psát jejich
rozklad ve tvaru a = qp1
1 . . . qps
s , b = qm1
1 . . . qms
s a c = qk1
1 . . . qks
s , kde připouštíme i
mocniny 0 a všechny prvky qj jsou po dvou nesoudělné. ab prvek s rozkladem, ve
kterém se objeví všechna společná qi v mocnině, která bude minimem z mocnin v
a a b. Naopak a  b bude mít rozklad, ve kterém se objeví všechny členy z rozkladů
a a b a to s mocninou, která bude tou větší z mocnin příslušného faktoru v a a b.
Přímo se nyní snadno ověří distributivní zákony.
Problém nemáme ani s existencí prvku 0 a 1, které jsme přímo definovali a
zjevně splňují axiomy (4) a (5). Existecne kvadrátů ale znemožní definici doplňku.
Např. v D12 = {1, 2, 3, 4, 6, 12} nelze 6  6 = 1 dosáhnout, protože má 6 netriviálního
společného dělitele se všemi ostatními prvky v D12 mimo jedničku, ta ovšem
nesplňuje 6  1 = 12.
Pokud ovšem nejsou v rozkladu čísla nebo polynomu p kvadráty, definujeme
doplněk jako q = p/q. Snadno ověříme potřebné vlastnosti z axiomů (4)­(6).
10.25
10.35. Částečná uspořádání. K Booleovským algebrám teď půjdeme z jiné strany.
Základní strukturou pro nás bude pojem uspořádání. Vzpomeňme na definici uspořádání
jakožto reflexivní, antisymetrické a tranzitivní relace  na množině K. Taková
relace obecně neříká o každé dvojici a, b  K jestli je a  b nebo b  a (takové
uspořádání se nazývá úplné uspořádání nebo dobré uspořádání). Často v našem
případě obecného uspořádání hovoříme také o částečném uspořádání a množina
(K, ) vybavená částečným uspořádáním se nazývá poset (z anglického ,,partial
ordered set ).
3. USPOŘÁDANÉ MNOŽINY A BOOLEOVSKÁ ALGEBRA 371
Takové uspořádání je zejména vždy na množině K = 2M
všech podmnožin
množiny M prostřednictvím inkluze podmnožin. Pomocí naší relace infima na K je
můžeme definovat jako A  B právě, když A  B = A. Ekvivalentně, A  B právě,
když A  B = B.
Lemma. Je-li (K, , , ) Booleova algebra, pak relace  definovaná vytahem A 
B právě, když A  B = A, je částečné uspořádání. Navíc platí
(1) A  B  A
(2) A  A  B
(3) jestliže A  C a zároveň B  C, pak také A  B  C
(4) A  B právě, když A  B = 0
(5) 0  A a A  1 pro všechny A  K.
Důkaz. Všechny dokazované vlastnosti a vztahy jsou výsledkem jednoduchého
výpočtu v Booleovské algebře K. Začněme s vlastnostmi uspořádání pro . Reflexivita
je přímým důsledkem idempotence: A  A = A, tj. A  A. Podobně komutativita
pro  zaručuje antisymetrii , protože z A  B = A a zároveň B  A = B
vyplývá A = A  B = B  A = B. Konečně z platnosti A  B = A a B  C = B
vyvodíme A  C = (A  B)  C = A  (B  C) = A  B = A, což dává tranzitivitu.
Dále počítáme (A  B)  A = (A  A)  B = A  B, takže A  B  A. Ze
vztahu A  (A  B) = A plyne A  A  B, což dokazuje tvrzení (2). Distributivita
ukazuje (A  B)  C = (A  C)  (B  C), což zapředpokladu (3) dává A  B, takže
skutečně platí (3). Tvrzení (5) plyne přímo z axiomů pro 1 a 0. Jestliže A  B, pak
A  B = A  B  B = 0. Naopak je-li A  B = 0, pak A = A  1 = A  (B  B ) =
(AB)(AB ) = (AB)0 = AB. Odtud A  B a dokázali jsme i zbývající
tvrzení (4).
Všimněme si, že stejně jako v případě algebry podmnožin je v Booleovských
algebrách A  B = A právě, když je A  B = B. Skutečně, je-li A  B = A, pak z
absorpčních zákonů plyne A  B = (A  B)  B = B, a naopak.
10.26
10.36. Svazy. Viděli jsme, že každá Booleova algebra zadává poset (K, ). Zdaleka ne
každý poset ovšem vzniká takovýmto způsobem. Např. triviální částečné uspořádání, kdy A 
A pro všechny A a všechny dvojice různých prvků jsou nesrovnatelné, samozřejmě z Booleovy
algebry vzniknout nemůže, pokud je v K více než jeden prvek (viděli jsme, že největší a nejmenší
prvek v Booleově algebře je totiž srovnatelný s každým prvkem). Zkusme se zamyslet, do jaké
míry lze z uspořádání budovat operace  a .
Pracujme s pevně zvoleným posetem (K, ). O prvku C  K řekneme, že je dolní závorou
pro nějakou množinu prvků L  K, je-li C  A pro všechny A  L. Prvek C  K je infimem
množiny L  K, jestliže je dolní závorou a pro každou jinou dolní závoru D téže množiny
platí D  C.
Obdobně definujeme horní závory a supremum podmnožiny L záměnou  za  v posledním
odstavci.
Konečné posety se přehledně zobrazují pomocí orientovaných grafů. Prvky K jsou představovány
uzly a hranou jsou spojeny právě prvky v relaci s orientací od většího k menšímu.
Hasseho diagram posetu je zakreslení takového grafu v rovině tak, že větší prvky jsou zobrazeny
vždy výš než menší (a orientace hran je tedy dána takto implicitně).
Definice. Svaz je poset (K, ), ve kterém každá dvouprvková množina {A, B} má supremum
A  B a infimum A  B v K.
Na svazu (K, ) tedy máme definovány binární operace  a  a přímo z definice je zjevná
asociativita a komutativita těchto operací.
372 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Snadno lze ale nakreslit Hasseho diagram svazu, který není distributivní.
Nyní můžeme snadno definovat Booleovskou algebru v jazyce svazů: Booleovská algebra
je distributivní svaz s největším prvkem 1 a nejmenším prvkem 0 takový, že v něm existují ke
všem prvkům komplementy.
Ověřili jsme již, že v takovém případě komplementy jsou definovány jednoznačně (viz
úvahy za definicí 10.31), takže je naše alternativní definice Booleovské algebry korektní.
Všimněme si také, při diskusi dělitelů daného čísla nebo polynomu p jsme narazili na svazy
Dp, které jsou Booleovskou algebrou právě tehdy, když rozklad p neobsahuje kvadráty.
10.27
10.37. Normální tvary. Při diskusi výrokové logiky jsme se potýkali s problémem,
co vlastně jsou prvky příslušné Booleovy algebry. Formálně vzato jsme je
definovali jako třídy ekvivalentních výroků. Jinak řečeno, pracovali jsme s hodnotovými
funkcemi pro výroky s daným počtem argumentů. Vůbec jsme přitom
neřešili obtížný problém, jak rozpoznat stejné výroky v tomto smyslu. Také jsme
neřešili, jestli všechny formálně možné hodnotové funkce (Z2)n
 Z2 lze zadat
pomocí základních logických operací.
Zcela obdobně se můžeme tázat, jak poznat, zda dva systémy přepínačů mají
stejnou funkci. Obdobně jako u výroků zde pro systém s n přepínači pracujeme
s funkcemi (Z2)n
 Z2 a zjevně existuje právě 22n
různých takových přepínacích
funkcí. Na těchto funkcích umíme přirozeným způsobem zadat strukturu Booleovy
algebry (využíváme, že hodnoty, tj. Z2 jsou Booleovou algebrou).
Odpovíme nyní na výše uvedené otázky tak, že pro libovolný prvek o becné
Booleovy algebry sestrojíme jeho tzv. normální disjunktivní tvar, tj. napíšeme jej
pomocí vybrané skupiny nejjednodušších prvků a operace .
Prvek A  K nazveme atom v Booleově algebře K, jestliže pro všechny B  K
platí A  B = A nebo A  B = 0.
Jinak řečeno, A je atom, když pro všechny ostatní prvky B  A implikuje
B = 0 nebo B = A.
Lemma. Booleova algebra funkcí přepínačového systému s n přepínači A1, . . . , An
má 2n
atomů, které jsou tvaru A1
1      An
n , kde buď A
i = Ai nebo Ai
i = Ai.
Důkaz. Pro dvě funkce  a  je jejich infimem funkce , jejíž hodnoty jsou
dány součinem jejich hodnot v Z2. Platí tedy    jestliže  má hodnotu 1 všude
kde má  hodnotu 1  Z2. Odtud už plyne, že v naší Booleově algebře hodnotových
funkcí je funkce  atomem právě, když z 2n
hodnot  na jednotlivých možnostech
hodnot jednotlivých argumentů má právě jednou hodnotu 1  Z2. Všechny takové
funkce ovšem lze vytvořit právě způsobem uvedeným v dokazovaném tvrzení.
Věta. Každý prvek B v konečné Booleově algebře (K, , , ) lze zapsat jako supremum
atomů
B = A1      Ak.
Tato formule je navíc jednoznačná až na pořadí atomů.
Důkaz. Uvažme všechny atomy A1, A2, . . . , Ak v K, které jsou menší nebo
rovny B. Z vlastností uspořádání na množině K (viz 10.35(3)) je okamžitě vidět,
že také
Y = A1      Ak  B.
Dokážeme, že B  Y = 0, což podle 10.35(4) zaručuje B  Y . Tím bude dokázána
rovnost B = Y .
Budeme postupně potřebovat tři jednoduchá tvrzení:
3. USPOŘÁDANÉ MNOŽINY A BOOLEOVSKÁ ALGEBRA 373
Tvrzení. Jestliže jsou Y, X1, . . . , X atomy v K, pak Y  X1      X tehdy a
jen tehdy, když Y = Xi pro nějaké i = 1, . . . , .
Tvrzení. Pro každý prvek Y = 0 v K existuje atom X, pro který je X  Y .
Tvrzení. Jestliže jsou X1, . . . , Xr všechny atomy v K, pak Y = 0 právě, když
Y  Xi = 0 pro všechny i = 1, . . . , r.
Důkaz. Dokončím později...
10.38. Řešené příklady.
10.38.1. Nalezněte disjuktivní normální formu výrazu
((A  B)  C)  (A  (B  C  D))
Řešení.
(A  C )
10.38.2. Buď A a B prvky boolovy algebry. Ukažte, že jestliže v ní existuje prvek
X takový, že A  X = B  X a A  X = B  X pak A = B.
Řešení.
A = A  (A  X) = A  (B  X) = (A  B)  (A  X) = (A  B)  (B  X)  B
poslední nerovnost plyne z toho, že spojení dvou prvků menších rovných než B je
menší rovno B. Vzhledem k symetrii B  A, tedy A = B.
10.28
10.39. Homomorfismy. Jak jsme již viděli u mnoha matematických struktur, o
objektech se dozvídáme informace pomocí tzv. homomorfismů, tj. zobrazení, které
zachovávají příslušné operace. V případě Booleovských algeber definujeme podobně
jako u okruhů:
Definice. Zobrazení f : (K, , , )  (L, , , ) se nazývá homomorfismus Booleovských
algeber, jestliže pro všechny A, B  K platí
(1) f(A  B) = f(A)  f(B)
(2) f(A  B) = f(A)  f(B)
(3) f(A ) = f(A) .
Homomorfismus f je izomorfismus Booleovských algeber, jestliže je f bijektivní.
Snadno se ověří, že bijektivnost f již zaručí, že f-1
je opět homomorfismem.
Z definice uspořádání na Booleových algebrách je zřejmé, že každý homomorfismus
f : K  L bude také splňovat f(A)  f(B) pro všechny prvky A  B v K.
To je definiční vlastnost pro tzv. izotonní zobrazení neboli homomorfismy posetů.
Jakkoliv umíme rekonstruovat operace suprema a infima z uspořádání, pokud
toto vzniklo z Booleovy algebry, není pravda, že by každý homomorfismus posetů
byl automaticky homomorfismem příslušných algeber. Zkuste si najít příklad (stačí
vkládat algebru se dvěma atomy do algebry s alespoň čtyřmi atomy)!
Věta. Každá konečná Booleova algebra je izomorfní Booleově algebře K = 2M
, kde
M je množina atomů v K.
374 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Důkaz. Dokončím později.
4. Kódy a šifry
Kódy a šifry spolu často úzce souvisí. Často potřebujeme přenášet informace
a přitom zajišťovat jejich správnost. Někdy stačí zajistit, abychom poznali, zda je
informace nezměněná, a při chybě si vyžádáme informaci znovu, jindy potřebujeme
zajistit, aby chyby byly i opraveny bez nového přebnášení správy. To vše je úkol
kódování. Pokud navíc chceme, aby zprávu mohl číst pouze adresát, potřebujeme i
tzv. šifrování.
10.29
10.40. Kódování. Při přenosu informace zpravidla dochází k její deformaci. Budeme
pro jednoduchost pracovat s modelem, kdy jednotlivé částečky informace jsou
buď nuly nebo jedničky (tj. prvky v Z2) a přenášíme slova o k bitech. Obdobné postupy
jsou možné nad konečnými poli. Přenosové chyby chceme
* rozpoznávat
* opravovat
a za tím účelem přidáváme dodatečných n - k bitů informace pro pevně zvolené
n > k.
Všech slov o k bitech je 2k
a každé z nich má jednoznačně určovat jedno kódové
slovo z 2n
možných. Máme tedy ještě
2n
- 2k
= 2k
(2n-k
- 1)
slov, které jsou chybové. Lze tedy tušit, že pro veliké k nám i malý počet přidaných
bitů dává hodně redundantní informace.
Úplně jednoduchým příkladem je kód kontrolující paritu. Kódové slovo o k + 1
bitech je určené tak, aby přidáním prvního bitu byl zaručen sudý počet jedniček ve
slově.
Pokud při přenosu dojde k lichému počtu chyb, přijdeme na to. Dvě různá
kódová slova se při tomto kódu vždy liší alespoň ve dvou pozicích, chybové slovo
se ale od dvou různých kódových slov liší pouze v pozici jedné. Nemůžeme proto
umět chyby opravovat ani kdybychom věděli, že došlo k právě jedné. Přehledně jsou
všechna možná slova vidět na obrázku níže, kódová slova jsou zvýrazněna tučným
puntíkem.
Navíc neumíme detekovat tak obvyklé chyby, jako je záměna dvou sousedních
hodnot ve slově.
100
110
101
111
001
010
011
000
10.30
10.41. Vzdálenost slov.
Definice. Hammingova vzdálenost dvou slov je rovna počtu bitů, ve kterých se
liší.
Věta. (1) Kód odhaluje r a méně chyb právě, když je minimální Hammingova
vzdálenost kódových slov právě r + 1.
4. KÓDY A ŠIFRY 375
(2) Kód opravuje r a méně chyb právě, když je minimální Hammingova vzdálenost
kódových slov právě 2r + 1.
Důkaz. Obě tvrzení jsou zřejmá z přeedchozí diskuse.
10.31
10.42. Konstrukce polynomiálních kódů. K praktickému použití potřebujeme
efektivně konstruovat kódová slova tak, abychom je mezi všemi slovy sladno rozpoznali.
Kontrolu parity jsme už viděli, další triviální možnost je prosté opakování
bitů ­ např. (3, 1)­kód bere jednotlivé bity a posílá je třikrát po sobě.
Docela systematickou cestou ke konstrukci kódů je využití dělitelnosti polynomů.
Zpráva b0b1 . . . bk-1 je reprezentována jako polynom
m(x) = b0 + b1x +    + bk-1xk-1
.
Definice. Nechť p(x) = a0 +    + an-kxn-k
 Z2[x] je polynom s a0 = 1, an-k =
1. Polynomiální kód generovaný polynomem p(x) je (n, k)­kód jehož slova jsou
polynomy stupně menšího než n dělitelné p(x).
Zpráva m(x) je zakódována jako v(x) = r(x) + xn-k
m(x), kde r(x) je zbytek
po dělení polynomu xn-k
m(x) polynomem p(x).
Z definice víme
v(x) = xn-k
m(x) + r(x) = q(x)p(x) + r(x) + r(x) = q(x)p(x).
Budou tedy všechna kódová slova dělitelná p(x).
Původní zpráva je obsažena přímo v polynomu v(x), takže dekódování správného
slova je snadné.
Příklad. (1) Polynom p(x) = 1 + x generuje (n, n - 1)­kód kontroly parity pro
všechna n  3.
(2) Polynom p(x) = 1 + x + x2
generuje (3, 1)­kód opakování bitů.
První tvrzení plyne z toho, že 1 + x dělí polynom v(x) tehdy a jen tehdy, když
v(1) = 0 a to nastane tehdy, když je ve v(x) sudý počet nenulových koeficientů.
Druhé je zřejmé.
10.32
10.43. Detekce chyb. Přenos slova v  (Z2)n
dopadne příjmem polynomu
u(x) = v(x) + e(x)
kde e(x) je tzv. chybový polynom repzentující vektor chyby přenosu.
Chyba je rozpoznatelná pouze, když generátor kódu p(x) nedělí e(x). Máme
proto zájem o polynomy, které které nevystupují jako dělitelé zbytečně často.
Definice. Ireducibilní polynom p(x)  Z2[x] stupně m se nazývá primitivní, jestliže
p(x) dělí polynom (1 + xk
) pro k = 2m
- 1 ale nedělí jej pro žádná menší k.
Věta. Je-li p(x) primitivní polynom stupně m, pak pro všechna n  2m
- 1 rozpoznává
příslušný (n, n - m)­kód všechny jednoduché a dvojité chyby.
Důkaz. Důkaz doplním.
Důsledek. Je-li q(x) primitivní polynom stupně m, pak pro všechna n  2m
- 1
rozpoznává (n, n - m - 1)­kód generovaný polynomem p(x) = q(x)(1 + x) všechny
dvojité chyby a všechna slova s lichým počtem chyb.
376 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Tabulka dává o informace o výsledcích předchozích dvou vět pro několik poly-
nomů:
primitivní polynom kontrolní bity délka slova
1 + x + x2
2 3
1 + x + x3
3 7
1 + x + x4
4 15
1 + x2
+ x5
5 31
1 + x + x6
6 63
1 + x3
+ x7
7 127
1 + x2
+ x3
+ x4
+ x8
8 255
1 + x4
+ x9
9 511
1 + x3
+ x10
10 1023
Nástroje pro konstrukci primitivních polynomů dává teorie konečných polí. Souvisí s tzv.
primitivními prvky v Galoisových polích G(2m
).
Ze stejné teorie lze také dovodit příjemnou realizaci dělení se zbytkem (tj.) ověřování, zda
je přijaté slovo kódové, pomocí zpožďovacích registrů. Jde o jednoduchý obvod s tolika prvky,
kolik je stupeň polynomu.5
.
10.33
10.44. Lineární kódy. Polynomiální kódy lze efektivně popisovat také pomocí
elemnetárního maticového počtu. Vyjdeme z obecnější definice, která požaduje lieární
závislost kdového slova na původní informaci:
Definice. Lineární kód je injektivní lineární zobrazení g : (Z2)k
 (Z2)n
. Matice
G typu k/n reprezentující toto zobrazení v standardních bazích se nazývá generující
matice kódu.
Pro každé slovo v je
u = G  v
příslušné kódové slovo.
Věta. Každý polynomiální (n, k)­kód je lineární kód.
Důkaz. Vyplývá přímo z vlastností dělení polynomů se zbytkem.
Např. matice příslušná k polynomu p(x) = 1 + x + x2
a odpovídajícímu (6, 3)kódu
je
G =


1 0 1
1 1 1
0 1 1
1 0 0
0 1 0
0 0 1


.
10.34 10.45. Věta. Je-li g lineární kódování s maticí
G =
P
Ik
,
potom zobrazení h : (Z2)n
 (Z2)k
s maticí
H = In-k P
má následující vlastnosti
5
detaily později
4. KÓDY A ŠIFRY 377
(1) Ker h = Im g
(2) přijaté slovo u je kódové slovo právě, když je H  u = 0
Důkaz. Dodám později (je snadný)
Matici H z věty se říká matice kontroly parity přílušného (n, k)­kódu.
10.35
10.46. Samoopravné kódy. Jak jsme viděli, přenos zprávy u dává výsledek
v = u + e.
To je ale nad Z2 ekvivalentní e = u + v.
Pokud tedy známe podprostor V  (Z2)n
správných kódových slov, víme u
každého výsledku, že správné slovo (s opravenými prřípadnými chybami) je ve třídě
rozkladu v + V v prostoru (Z2)n
/V .
Zobrazení h : (Z2)n
 (Z2)n-k
má V za jádro, proto indukuje injektivní lineární
zobrazení h : (Z2)n
/V  (Z2)n-k
. Jeho hodnoty jsou jednoznačně určeny
hodnotami H  u.
Definice. Hodnota H  u se nazývá syndrom slova u.
Věta. Dvě slova jsou ve stejné třídě rozkladu u + V právě, když sdílí syndrom.
Samoopravné kódy lze konstruovat tak, že pro každý syndrom určíme prvek v
příslušné třídě, který je nejvhodnějším slovem.
10.47. Příklady.
10.47.1. Buď dán (6, 3) kód nad Z2 generovaný polynomem x3
+ x2
+ 1.
(1) Určete jeho generující matici a matici kontroly parity.
(2) Dekódujte zprávu 111101 předpokládáte-li, že při přenosu došlo k nejmenšímu
možnému počtu chyb.
Řešení.
(1) Protože se jedná o lineární kód, stačí určit jak se zakódují bázové vektory 1, x
a x2
, tedy určit zbytky polynomů x3
, x4
a x5
po dělení polynomem x3
+x2
+1.
Máme
x3
 x2
+ 1 (mod x3
+ x2
+ 1)
x4
= x(x3
)  x(x2
+ 1) = x3
+ x  x2
+ x + 1 (mod x3
+ x2
+ 1)
x5
= x(x4
)  x(x2
+ x + 1) = x3
+ x2
+ x  x + 1 (mod x3
+ x2
+ 1)
Bázové vektory (zprávy) 100, 010 a 001 se tedy zakódují do vektorů (kódů)
101100, 111010 a 110001, generující matice kódu je tedy
G =


1 1 1
0 1 1
1 1 0
1 0 0
0 1 0
0 0 1


.
378 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
Matice kontroly parity je pak dle věty 10.45


1 0 0 1 1 1
0 1 0 0 1 1
0 0 1 0 0 1


(2) Vynásobíme-li přijatou zprávu 111101 maticí kontroly parity, dostáváme


1 0 0 1 1 1
0 1 0 0 1 1
0 0 1 0 0 1


1
1
1
1
0
1


=


1
0
0

 ,
tedy nenulový vektor a víme, že při přenosu došlo k chybě. Syndrom naší kódové
zprávy je tedy 100. Sestavme tabulku všech syndromů a jim odpovídajících
kódových slov. Syndrom 000 mají všechna kódová slova. Všechna slova s daným
syndromem pak dostaneme přičtením syndromu (doplněného nulami na délku
kódového slova) ke všem kódovým slovům.
Syndrom Kódová slova s daným syndromem
000 000000 110001 111010 101100 010110 001011 011101 100111
001 001000 111001 110010 100100 011110 000011 010101 101111
010 010000 100001 101010 111100 000110 011011 001101 110111
100 100000 010001 011010 001100 110110 101011 111101 000111
011 011000 101001 100010 110100 001110 010011 000101 111111
101 101000 011001 010010 000100 111110 100011 110101 001111
110 110000 000001 001010 011100 100110 111011 101101 010111
111 111000 001001 000010 010100 101110 110011 100101 011111
Počínaje druhým řádkem, je každý řádek tabulky afinním prostorem jehož zaměřením
je vektorový prostor daný prvím řádkem (daný kód je lineární, všechna
kódová slova tedy tvoří vektorový prostor). Zejména je tedy rozdíl každých dvou
slov ve stejném řádku nějakým kódovým slovem. Tučně vyznačená slova jsou
takzvaní vedoucí representanti třídy (řádku, afinního prostoru) odpovídajícího
danému syndromu. Jsou to slova s nejmenším počtem jedniček v řádku. Udávají
tak nejmenší počet bitových změn, které musíme v libovolném slovu na
řádku provést, abychom dostali kódové slovo.
Naše kódové slovo má syndrom 100, vedoucím representantem ve třídě tohoto
syndromu je slovo 100000 a jeho odečtením od obdženého kódového slova
dostaneme platné kódové slovo 011101. Je to platné kódové slovo s nejmenší Hammingovou
vzdáleností od obdrženého slova (pro malý počet kódových slov lze
nalézt přímo, pro větší počet je vhodnější ­ rychlejší ­ námi uvedená metoda).
Odeslaná zpráva tedy byla 101.
10.47.2. V lineárním (6, 3)-kódu nad Z2 zadaném maticí


1 1 0
0 0 1
1 0 1
1 0 0
0 1 0
0 0 1


4. KÓDY A ŠIFRY 379
byla přijata zpráva 110100. Dekódujte ji (tj. nalezněte odesílanou zprávu) za předpokladu,
že při přenosu došlo k nejmenšímu možnému počtu chyb.
Řešení. 101
10.47.3. V lineárním (6, 3)-kódu nad Z2 zadaném maticí


0 1 1
1 0 0
0 1 0
1 0 0
0 1 0
0 0 1


byla přijata zpráva 001001. Dekódujte ji (tj. nalezněte odesílanou zprávu) za předpokladu,
že při přenosu došlo k nejmenšímu možnému počtu chyb.
Řešení. 011
10.47.4. Máme množinu čtyř slov, která chceme přenášet binárním kódem, který
by uměl opravovat jednoduché chyby. Jakou nejmenší délku kódového slova můžeme
použít, požadujeme-li, aby všechna kódová slova měla stejnou délku? Proč?
Řešení. Označme hledanou délku jako n. Minimální Hammingova vzdálenost dvou
kódových slov musí být alespoň tři. To znamená, že když pokud ve dvou kódových
slovech změním jeden bit, nemohu dostat stejná slova. Množina slov, které dostanu z
jednoho kódového slova změnou nejvýše jednoho bitu čítá (včetně původního slova)
n+1 slov. Pro různá kódová slova musím dostat různé množiny. Celkem tedy takto
dostáváme 4(n + 1) různých slov délky n. Slov délky n je ovšem 2n
, požadujeme
tedy 4(n+1)  2n
. Tato nerovnost je splňena až pro n  5. Kódová slova musí tedy
mít délku minimálně 5. Hledaná kódová slova délky 5 s minimální Hammingovou
vzdáleností 3 jsou například: 00111, 01001, 10100, 11010.
10.36
10.48. Poznámky o šifrách. Šifrování slouží k tomu, abychom přenesli mezi
danými (dvěma) uživateli tajnou informaci, který by měl zůstat ostatním lidem
nepřístupný. Historie šifrování sahá až do starověku, kde je známým příkladem
Spartská skytála. Šifry nacházely využití zejména pro vojenské účely a například
prolomení německé šifry Enigma za druhé světové války poskytlo spojencům možná
rozhodující převahu. V současné době se šifrují například i televizní kanály, i když
názvosloví je zde odlišné od matematematického, protože se spíše hovoří o kódovaných
kanálech, nikoliv o šifrovaných.
10.49. RSA Algoritmus. Jde o algoritmus, který byl publikován v sedmdesátých
letech dvacátého století pány Ronem Rivestem, Adi Shamirem a Leonardem
Aldlemanem v roce 1978. Tento algoritmus umožňuje výměnu soukromých informací
aniž by si odesílatel a příjemce museli vyměnit nějaký tajný klíč, na jehož
utajení by závisla bezpečnost algoritmus.
Vlastní algoritmus probíhá v těchto fázích:
(1) Příjemce zvolí dvě velká prvočísla p a q a dále zvolí přirozené e nesoudělné s
(N), kde N = pq, tedy (N) = (p - 1)(q - 1).
(2) Příjemce zveřejní N a e.
(3) Příjemce spočítá d = e-1
(mod (N)).
380 10. ALGEBRAICKÉ STRUKTURY A TECHNIKY
(4) Odesílatel chce odeslat zprávu Z, kde Z  N, 1  Z  N -1. Odesílatel spočítá
S  Ze
(mod N), kde 1  S  N - 1.
(5) Odesílatel odešle šifru S.
(6) Příjemce dešifruje, tedy nalezne W, 1  W  N -1, W  Sd
(mod N). Potom
W = Z.
Důkaz. Ukažme si, že algoritmus skutečně funguje, tedy že popsaným procesem
dostaneme po dešifrování zašifrované zprávy skutečně původní zprávu.
a) Nejprve rozeberme případ, kdy je zpráva Z nesoudělná s číslem N. Potom podle
Eulerovy věty
Sd
 (Ze
)d
= Zed
= Zk(N)+1
= Zk(N)
1
Z  Z (mod N).
b) N a Z jsou soudělná čísla. Potom je vzhledem k velikosti Z největším společným
násobkem buď prvočíslo p, nebo q. Bez újmy na obecnosti předpokládejme, že
největším společným násobkem je číslo p, tedy že Z = ap, kde 1  a < q.
Potom dle Malé Fermatovy věty je
Sd
= (ap)ed
= (ap)k(N)+1
= (ap)k
(p - 1)
(q-1)
(ap)  ap = Z (mod q).
Triviálně ovšem
Sd
= (ap)ed
 ap = Z( 0) (mod p),
a protože kongruence Sd
 Z platí podle dvou nesoudělných modulů, platí i
podle jejich součinu, což je to, co chceme.
10.50. Poznámka. Dodejme, že tento algoritmus je hojně používán v praxi. Panuje
obecný názor6
, že bezpečnost tohoto algoritmu je založena na tom, že problém
faktorizace (rozklad na součin mocnin prvočísel) velkých přirozených čísel je těžký
problém (pro velká čísla ­ řádově se stovkami cifer ­ to neumíme v rozumném čase).
Nicméně nebylo dokázáno, že by prolomení RSA-algoritmu bylo ekvivalentní nalezení
efektivního algoritmu na faktorizaci velkých čísel a nebylo ani dokázáno, že
takový algoritmus neexistuje.
Velkou výhodou algoritmu je, že není třeba žádné domluvy (výměny tajné
informace, klíče) před vlastním použitím algoritmu. To je zřejmě důvod popularity
tohoto algoritmu.
10.51. Rabinův kryptosystém. Je prvním veřejným kryptosystémem, o kterém
bylo dokázáno, že jeho prolomení je stejně obtížné jako faktorizace velkých čísel.
Uvedeme si jej ve zjednodušené verzi:
* každý účastník A potřebuje dvojici klíčů ­ veřejný VA a soukromý SA
* generování klíčů: zvolí dvě podobně velká prvočísla p, q  3 (mod 4), vypočte
n = pq.
* VA = n, SA = (p, q)
* zašifrování numerického kódu zprávy Z: S = Se(Z)  Z2
(mod n)
* dešifrování šifry S: vypočtou se (čtyři) odmocniny z S modulo n a snadno se
otestuje, která z nich byla původní zprávou.
Výpočet druhé odmocniny z S modulo n = pq, kde p  q  3 (mod 4):
6Říká se, že ve fyzice tato formulace znamená ,,ještě jeden můj známý si to také myslí ,
nicméně my máme na mysli běžný význam tohoto sousloví.
4. KÓDY A ŠIFRY 381
* vypočti a, b tak, že ap + bq = 1
* vypočti r = S(p+1)/4
(mod p) a s = S(q+1)/4
(mod q)
* polož x = (aps + bqr) (mod n), y = (aps - bqr) (mod n)
* druhými odmocninami z S modulo n jsou x, y.
10.52. Algoritmus ElGamal.
* Odesílatel zvolí cyklickou grupu G spolu s generátorem g.
* Odesílatel zvolí tajný klíč x, spočítá h = gx
a zveřejní veřejný klíč (G, g, h).
* Šifrování zprávy Z: Bob zvolí náhodné y a vypočte S1 = gy
a S2 = Z  hy
a
pošle (S1, S2).
* Dešifrování zprávy: M = C2/Cx
1
10.53. Příklady.
10.53.1. Martin a Honza chtějí komunikovat šifrou ElGamal navrženou podle protokolu
pánu Diffieho a Hellmana. Domluvili se na cyklické grupě Z+
41 a Martin si
náhodně zvolil generátor grupy 11 a číslo 10 a zveřejnil trojici (Z41, 11, A), kde
A  1110
(mod 41). Honza mu pošle veřejně dvojici (22, 6). Jakou zprávu Honza
poslal?
Řešení. A = 9 (k dekódování není třeba). Zprávu Z dostaneme jako Z  (6/2210
)
(mod 41). Spočtěme nejprve 2210
 222
 (222
)2
 ((222
)2
)  (-8)  (-8)2
 (-8)2

(-8)  23  23  -9 (mod 41), (-9)-1
= 9, Z = 9  6  13 (mod 41).
10.53.2. Martin a Honza chtějí komunikovat šifrou ElGamal navrženou podle protokolu
pánu Diffieho a Hellmana. Domluvili se na cyklické grupě Z+
37 a Martin si
náhodně zvolil generátor grupy 5 a číslo 10 a zveřejnil trojici (Z37, 5, A), kde A  510
(mod 37). Honza mu pošle veřejně dvojici (17, 21). Jakou zprávu Honza poslal?
Řešení. Zprávu spočteme jako Z  21/171
0 (mod 37). Spočtěme nejprve 171
0 =
172
 (172
)2
 (172
)2
 (-7)  (-7)2
 (-7)2
 (-7)  12  12  28 (mod 37), 28-1
 4
(mod 37), tedy Z  4  21  10 (mod 37).
KAPITOLA 11
Statistické metody
Je statistika částí matematiky?
­ když ano, tak matematiky potřebuje hodně . . .
11.1
11.1. Pravděpodobnost nebo statistika? Statistika v širším slova smyslu je
jakékoliv zpracování číselných dat o nějakém souboru objektů a jejich více či méně
přehledná prezentace. V tomto smyslu hovoříme také o popisné statistice, když
jsou zpracovávána a zpřehledňována data o všech objektech daného souboru (např.
roční příjmy všech občanů zpracovávané z kompletních dat finančních úřadů), a matematické
statistice, když matematickými metodami zkoumáme jen data menšího
počtu objektů (např. zjišťujeme údaje o příjmech pomocí dat získaných u několika
nahodile vybraných osob).
Podstatou matematické statistiky je pro prezentovaná data zjišťovat, jaké vlastnosti
skutečně mají objekty, které jou daty popisovány, a zároveň, jak věrohodné
odvozené výsledky jsou. Zpravidla přitom jde o sběr a zpracování dat o nějakém
souboru objektů, jejich následnou analýzu a konečně o vyslovení důsledků pozorování
pro rozsáhlejší soubor objektů než jsou ty, jejichž data jsme zpracovávali.
Jinak řečeno, výsledkem práce matematického statistika je sdělení o velkém souboru
objektů na základě studia malé (zpravidla náhodně vybrané) části z nich, společně
s kvalitativním odhadem věrohodnosti výsledného sdělení.
Matematická statistika se opírá o teorii pravděpodobnosti, o které jsme něco
málo uváděli na samotném počátku naší cesty matematikou, ve čtvrté části první
kapitoly. Zatímco teorie pravděpodobnosti se zabývá modely popisujícími chování
abstraktních souborů (hovořili jsme o pravděpodobnosti jevů z jevového pole), statistika
pracuje se skutečným náhodným výběrem z nějakého základního souboru
a poskytuje podklady pro výběr teoretického pravděpodobnostního modelu, resp.
kvalitativní informace o jeho parametrech. Uvidíme, že při zpracovávání statistických
dat provádíme v podstatě úkony popisné statistiky, teorii pravděpodobnosti
však potřebujeme pro vyslovení kvalitativních údajů o výsledcích.
Ne náhodou se právě k této části našich motivačních náznaků z první kapitoly
vracíme až na samém konci našich přednášek. Statistikami je totiž dnes zaplaveno
kdejaké sdělení, ať už v médiích, politické nebo odborné, nicméně porozumět obsahu
takového sdělení a pochopit možnosti či oprávněnost využití jednotlivých statistických
metod a pojmů si vyžaduje mnoho znalostí z různých oblastí matematiky,
kterými jsme dosud procházeli.
Příklad. Za soubor objektů vezměme všechny studenty této přednášky ,,Drsná
matematika , jako číselný údaj můžeme uvažovat
(1) ,,průměrný počet bodů dosažený při hodnocení tohoto předmětu v minulém
semestru,
383
384 11. STATISTICKÉ METODY
(2) ,,průměrnou známku dosaženou u zkoušky z tohoto a z jiných pevně vybraných
předmětů,
(3) číslená data vypovídající o historii dřívějšího studia,
(4) počet pracovních hodin týdně odpracovaných studentem či studentkou mimo
fakultu
a mnoho dalších údajů. Zastavme se u prvního údaje. Samotný aritmetický průměr
bodů nám mnoho neřekne ani o kvalitě přednášky ani o kvalitě přednášejícího ani o
samotném hodnocení konkrétních studetnů. Možná nás bude více zajímat hodnota,
která bude ,,uprostřed souboru , tj. počet bodů, pro které je stejně studentů pod ní
a nad ní (nebo obdobně první a poslední čtvrtina, desetina apod.). Všem takovým
údajům říkáme statistiky posuzované veličiny. V uvedených příkladech se jim říká
medián, kvartil, decil apod. Takové statistiky budou jistě zajímavé pro samotné
studenty a je docela jednoduché je zavést a spočíst.
Z obecné zkušenosti nebo jako výsledek teoretických úvah mimo samotnou matematiku
víme, že rozumné hodnocení by na mělo mít tzv. normální rozdělení. Tento
pojem patří do teorie pravděpodobnosti a k jeho zavedení potřebujeme poměrně
dost matematiky. Porovnáním výsledku třeba i docela malého náhodného výběru
studentů s teoretickým předpokladem můžeme zjistit odhad parametrů takového
rozdělení a činit závěry, zda je celé hodnocení postaveno rozumně. Zároveň lze z
číselných hodnot našich statistik pro konkrétní výběr kvalitativně popsat věrohodnost
našich závěrů. Stejně tak budeme umět spočíst statistiky, které nebudou měřit
polohy uvnitř daného statistického souboru ale variabilitu sledovaných hodnot.
Tak například když výsledky hodnocení nebudou vykazovat dostatečnou variabilitu,
přičemž studenti jistě různé výkony prokazují, jde opět o náznak, že je něco v
nepořádku.
Daleko zajímavější vývody ovšem můžeme činit, když porovnáním statistik pro
různé veličiny uvedené výše budeme moci dovozovat informace o souvislostech.
Pokud např. neexistuje žádná doložitelná souvislost mezi historií předchozího studia
a výsledky v dané přednášce, je jedním z možných vysvětlení vývod, že je přednáška
prostě špatná.
Zamysleme se nad závěry našich úvodních úvah:
* V matematice pracujeme s abstraktním matematickým popisem pravděpodob-
nosti.
* Vývody pro konktrétní soubory dat, pro které je zvolený model relevantní, dává
matematická statistika.
* To, zda je takový popis adekvátní pro konkrétní výběr dat, je také možné
podpořit nebo zavrhnout pomocí metod matematické statistiky.
Než se pustíme do elementárního náznaku statistických postupů, budeme se
věnovat chvíli matematické pravděpodobnosti.
1. Pravděpodobnost
11.2
11.2. Jevová pole. Před dalším čtením lze čtenářům vřele doporučit zopakování
obsahu čtvrté části první kapitoly (tj. odstavce ??­??). Tehdy jsme pracovali převážně
s tzv. klasickou konečnou pravděpodobností zavedli jsme základy formalismu,
který nyní zobrecníme. Hlavní změnou bude, že náš základní prostor  už nebude
obecně obsahovat jen konečně mnoho prvků.
1. PRAVDĚPODOBNOST 385
Budeme pracovat s neprázdnou pevně zvolenou množinou  všech možných
výsledků, kterou nazýváme základní prostor. Prvky    představují jednotlivé
možné výsledky. Systém podmnožin A základního prostoru se nazývá jevové pole a
jeho prvky se nazývají jevy, jestliže
*   A, tj. základní prostor, je jevem,
* je-li A, B  A, pak A\B  A, tj. pro každé dva jevy je jevem i jejich množinový
rozdíl,
* je-li Ai  A, i  I, nejvýše spočetný systém jevů, pak také jejich sjednocení je
jevem, tj. iIAi  A.
V souladu s obvyklými verbálními popisy skutečných problémů používáme také
následující terminologii:
* Komplement Ac
=  \ A jevu A je jevem, který nazýváme opačný jev k jevu
A.
* Průnik dvou jevů opět jevem, protože pro každé dvě podmnožiny A, B  
platí
A \ ( \ B) = A  B.
Jevové pole je tedy systém podmnožin základního prostoru uzavřený na konečné
průniky, spočetná sjednocení a množinové rozdíly. Jednotlivé množiny A  A
nazýváme náhodné jevy (vzhledem k A).
Jako příklad, proč nám i u zdánlivě klasických problémů nestačí konečná klasická
pravděpodobnost, můžeme promyslet třeba experiment, ve kterém opakovaně
házíme mincí dokud nepadne líc. Ptáme se, jaká je pravděpodobnost, že budeme
házet právě 3­krát nebo právě 35­krát nebo nejvýš 10­krát apod. Elementární jevy
jsou tedy tvaru k  N1 {}, které slovně vyjadřujeme ,,líc padne poprvé právě
v k­tém hodu .
Zjevně můžeme takový problém dobře zvládat, když vyjdeme z pravděpodobnosti
0,5 pro obě možné strany mince při jednom hodu, nemůžeme ale v abstraktním
modelu vyloučit možnost neustálých rubů a už vůbec ne omezit celkový počet hodů
nějakým povným přirozeným číslem N. Na druhé straně, očekávaná pravděpodobnost,
že padne právě (k - 1)­krát rub v n  k pokusech je dána zlomkem
2n-k
2n
= 2-k
,
kde v čitateli je počet možností příznivých z n nezávislých hodů (tj. možností jak
rozestavit dvě hodnoty do n - k pozic) a ve jmenovateli je počet všech možností
výsledků. Podle očekávání tato pravděpodobnost nezávisí na zvoleném n a platí

k=1 2-k
= 1 a tedy musí být pravděpodobnost neustálého opakování rubu nulová.
11.3
11.3. Pravděpodobnostní prostor. Souvislosti s popisem skutečných jevů a jejich
formálním pravděpodobnostním popisem vedou k definicím:
* celý základní prostor  se nazývá jistý jev, prázdná podmnožina   A se
nazývá nemožný jev,
* jednoprvkové podmnožiny {}   se nazývají elementární jevy,
* společné nastoupení jevů Ai, i  I, odpovídá jevu iIAi, nastoupení alespoň
jednoho z jevů Ai, i  I, odpovídá jevu iIAi,
* A, B  A jsou neslučitelné jevy, je-li A  B = ,
* jev A má za důsledek jev B, když A  B,
* je-li A  A, pak se jev B =  \ A nazývá opačný jev k jevu A, píšeme B = Ac
.
386 11. STATISTICKÉ METODY
Konečně umíme popsat, co je v našem matematickém modelu pravděpodobnost:
Definice. Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního
prostoru , na kterém je definována skalární funkce P : A  R s následujícími
vlastnosti:
* je nezáporná, tj. P(A)  0 pro všechny jevy A,
* je aditivní, tj. P(iIAi) = iI P(Ai), pro každý nejvýše spočetný systém
po dvou neslučitelných jevů,
* pravděpodobnost jistého jevu je 1.
Funkci P nazýváme pravděpodobností na jevovém poli (, A).
Příklad takto definované pravděpodobnosti na nekonečné množině elementárních
jevů jsme viděli na konci předchozího odstavce.
Jako přímé důsledky naší definice vidíme, že pro všechny jevy platí
P(Ac
) = 1 - P(A).
Zdůrazněme také, že additivnost platí pro jakýkoliv spočetný počet neslučitelných
jevů Ai  , i  I, tj.
P(iIAi) =
iI
P(Ai), kdykoliv je Ai  Aj = , i = j, i, j  I.
Připomeňme si dále klasickou konečnou pravděpodobnost: Nechť  je konečný
základní prostor a nechť jevové pole A je právě systém všech podmnožin v . Klasická
pravděpodobnost je pravděpodobnostní prostor (, A, P) s pravděpodobnostní
funkcí P : A  R,
P(A) =
|A|
||
.
Zjevně takto zadaná funkce skutečně definuje pravděpodobnost.
11.4
11.4. Peterburgský paradox. (Bernoulli, 1738) Typický příklad klasické pravděpodobnosti
jsou jevy související s házením mincí. Představme si následující pravidla
kasina:
Návštěvník zaplatí vklad C a poté hází mincí. Je-li T počet hodů potřebných
k první hlavě, pak obdrží výhru 2T
. Jaká je ,,fér hodnota pro vklad C?
Pravděpodobnostní model pro tuto hru jsme zavedli na konci 11.2. Pravděpodobnost,
že padne hlava je u férové mince 1/2, je proto P(T = k) = 2-k
.
Sečteme-li všechny pravděpodobnosti výsledků vynásobené výhrami 2k
, dostaneme

1 1 = . Zdá se proto, že se vyplatí vložit i velký vklad. . .
Ve skutečnosti simulací hry zjistíme, že nezávisle na počtu pokusů se prakticky
všechny výhry budou pohybovat v rozmezí 3 až 6. Důvodem je, že vysoké výhry jsou
velice nepravděpodobné a proto je při reálných úvahách nelze brát vážně. Zkuste si
promyslet zdůvodnění podrobněji.
11.5
11.5. Podmíněná pravděpodobnost. Obvyklé je klást dotazy s dodatečnou
podmínkou. Např. ,,jaká je pravděpodobnost, že při hodu dvěmi kostkami padly
dvě pětky, je-li součet hodnot deset? . Připomeneme, že formalizovat takové úvahy
umíme následovně.
1. PRAVDĚPODOBNOST 387
Definice. Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v
pravděpodobnostním prostoru (, A, P). Podmíněná pravděpodobnost P(A|H) jevu
A  A vzhledem k hypotéze H je definována vztahem
P(A|H) =
P(A  H)
P(H)
.
Definice odpovídá požadavku, že jevy A a H nastanou zároveň, za předpokladu,
že A nastal s pravděpodobností P(A  H)/P(A).
Je také vidět přímo z definice, hypotéza H a jev A jsou nezávislé tehdy a jen
tehdy, je-li P(A) = P(A|H).
Přepsáním formule pro podmíněnou pravděpodobnost dostáváme
P(A  B) = P(B  A) = P(A)P(B|A) = P(B)P(A|B).
Věta (Bayesovy věty). Pro pravděpodobnost jevů A a B platí
P(A|B) =
P(A)P(B|A)
P(B)
(1)
P(A|B) =
P(A)P(B|A)
P(A)P(B|A) + P(A )P(B|A )
.(2)
Důkaz. První tvrzení je přepsáním předchozí formule, druhé z prvého plyne
doszením P(B) = P(A)P(B|A) + P(A )P(B|A ).
11.6. Poznámka. Dodejme ještě, že vztahům z předchozí věty se někdy říká
Bayesovy vzorce a že druhý z nich bývá formulován i v lehce obenějším tvaru:
nechť je jevový prostor sjednocením disjunktních jevů A1,. . . An. Pak pro libovolné
i  {1, . . . , n} platí
P(Ai|B) =
P(B|Ai)P(Ai)
n
i=1 P(B|Ai)P(Ai)
.(3)
11.7. Důsledek. Pro jevy A, B, C platí
P(A|B  C) =
P(A|B)P(C|A  B)
P(C|B)
=
P(A)P(B|A)P(C|A  B)
P(B)P(C|B)
(4)
Důkaz.
P(A|B  C) =
P(A  B  C)
P(B  C
=
P(B|A  C)P(A  C)
P(C)P(B|C)
=
=
P(C|A  B)P(A|B)P(B)
P(B)P(C|B)
=
P(C|A  B)P(A|B)
P(C|B
Poslední výraz pak dostaneme dalším dosazením (1) za P(A|B).
Uveďme si ještě jedno lemma, které vyplývá z definice podmíněné pravděpo-
dobnosti:
11.8. Lemma. Nechť jev B je disjunktním sjednocením jevů B1, B2,. . . ,Bn. Potom
P(A|B) =
n
i=1
P(A|Bi)P(Bi|B)(5)
388 11. STATISTICKÉ METODY
Důkaz. Všimněme si nejprve, že jevy A  B1, A  B2,. . . ,A  Bn jsou rovněž
disjunktní. Můžeme tedy psát
P(A|B1      Bn) =
P (A  (B1      Bn))
P(B1      Bn)
=
=
P ((A  B1)  (A  B2)      (A  Bn))
P(B)
=
=
n
i=1 P(A  Bi)
P(Bi)

P(Bi)
P(B)
=
=
n
i=1
P(A|Bi)P(Bi|B).
11.6
11.9. Příklad ­ preventivní screening. Předpokládejme, že krevní test na HIV
pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní. Zároveň
předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0.2% případů.
Náhodně z populace vybereme osobu a otestujeme pozitivně. S jakou pravděpodobností
je skutečně HIV pozitvní, jestliže četnost výskytu HIV v populaci je p
promile (tj. p osob z tisíce je skutečně HIV pozitivní).
Označme A jev, že je daná osoba HIV pozitivní, a B jev, že daná osoba má
pozitivní test. Dle druhé Bayesovy věty je hledaná pravděpodobnost
P(A|B) =
p/1000  99/100
p/1000  99/100 + (1000 - p)/1000  2/1000
.
Jestliže zvolíme za p nějaké konkrétní četnosti, dostaneme příslušné očekávatelné
spolehlivosti testu. V následující tabulce je spočten výsledek pro 100 promile (tj.
jeden z deseti je nemocný), pro 10 promile (tj. každý stý člověk je infikován), 1
promile a 1/10 promile (tj. pouze jeden z deseti tisíc je infikován ­ to asi může
odpovídat realitě).
p 100 10 1 0.1
P(A|B) 0.982 0.8333 0.3313 0.0471
Výsledek asi neodpovídá naší intuici a může se zdát šokující ve vztahu k použití
takovýchto testů. V případě 0,1 promile nakažených lidí totiž při pozitivním testu
nemáme ani 5% pravděpodobnost, že je dotčená osoba skutečně infikovaná.
Všimněme si také, že i 100% účinný test při testu pozitvní osoby v podstatě
neovlivní výsledné pravděpodobnosti.
Evidentně prostý výběr náhodné osoby a použití jediného testu, byť velmi citlivého,
specifického a účinného, nejsou vhodné ani na otestování skutečného stavu
populace, ani na preventivní vyšetření jednotlivců, pokud nemáme další podpůrné
informace a lepší nástroje.
Právě matematická statistika dává nástroje na kvalifikovanější postupy v medicínské
i průmyslové diagnostice, ekonomických modelech, vyhodnocování experimentálních
dat atd. Opírají se většinou o několik parametrů, které k danému jevu
přiřazujeme a při praktickém vyhodnocování je zjišťujeme a zpracováváme. Jsou
obdobou obyčejných funkcí, potřebujeme je ale vztáhnout k danému prvděpodobnostnímu
prostoru.
1. PRAVDĚPODOBNOST 389
11.10. Příklady.
11.10.1. Máme čtyři sáčky a v nich následující počty koulí: v prvním čtyři bílé, ve
druhém tři bílé a jednu černou, ve třetím dvě bílé a dvě černé a ve čtvrtém čtyři
černé. Náhodně vybereme sáček a z něj začneme bez vracení vytahovat koule. Určete
pravděpodobnost, že
a) první dvě vytažené koule budou různých barev
b) a že druhá vytažená koule bude bílá, jestliže první vytažená koule byla bílá.
Řešení. Protože ve všech sáčcích je stejný počet koulí, je pravděpodobnost vytažení
libovolné z koulí, potažmo libovolné dvojice koulí, stejná. Budeme tedy příklad řešit
pomocí klasické pravděpodobnosti
a) Celkem můžeme vytáhnout 24 různých dvojic koulí, z toho je sedm dvojic
složených z různobarevných koulí, hledaná pravděpodobnost je tedy 7/24.
b) Označme A jev, že první vytažená koule byla bílá, B jev, že druhá vytažená
koule bude bílá. Potom P(B  A) je pravděpodobnost, že první dvě vytažené
koule budou bílé a ta je podobně jako v předchozím případě 10/24 = 5/12. A
opět klasickou pravděpodobností můžememe spočítat i P(A), všech koulí je 16,
z toho 9 bílých. Celkem
P(B|A) =
P(B  A)
P(A)
=
5
12
9
16
=
20
27
.
Jiné řešení. Jev A můžeme uvážit jako sjednocení tří disjunktních jevů
A1, A2, resp. A3 a to, že jsme zvolili první sáček a z něj vytáhli bílou kouli, že
jsme zvolili druhý sáček a z něj vytáhli bílou kouli a konečně že jsme zvolili třetí
sáček a z něj vytáhli bílou kouli. Protože v každém sáčku je stejný počet koulí,
je pravděpodobnost vytažení libovolné (bílé) koule shodná a tudíž P(A) = 9
16
a P(A1|A) =
4
16
9
16
= 4
9 , P(A2|A) = 3
9 = 1
3 , P(A3|A) = 2
9 . Použitím vztahu (5)
pak dostáváme
P(B|A) = P(B|A1)P(A1|A) + P(B|A2)P(A2|A) + P(B|A3)P(A3|A) =
= P(B|A1) 
P(A1)
P(A)
+ P(B|A2) 
P(A2)
P(A)
+ P(B|A3) 
P(A3)
P(P(A)
=
= 1 
4
9
+
2
3

3
9
+
1
3
2
9
=
20
27
.
11.10.2. Mirek má čtyři sáčky, v každém jsou bílé a černé kuličky a to v těchto
počtech: čtyři bílé; tři bílé a jedna černá; dvě bílé a dvě černé; jedna bílá a tři
černé. Mirek náhodně jeden sáček vybral a náhodně z něj vytáhl jednu kouli. Byla
černá. Mirek tento sáček zahodil a náhodně vybral jeden ze zbylých tří sáčků a z něj
náhodně jednu kouli. Jaká je pravděpodobnost, že bude bílá?
Řešení. Podobně jako v předchozím příkladě, označíme jako A jev, že Mirek náhodně
vybral sáček a z něj náhodně černou kouli. Tento jev disjuktním sjednocením
jevů Ai, i = 2, 3, 4, kde Ai je jev, že Mirek vybral i-tý sáček a z něj potom černou
kouli. Opět je pravděpodobnost vytažení libovolné (černé) koule stejná a tedy
P(A2|A) = 1
6 , P(A3|A) = 2
6 = 1
3 a P(A4|A) = 3
6 = 1
2 . Nechť B je jev, že Mirek
po zahození jednoho ze sáčků vybral ze zbylých bílou kouli. Pokud vyhodil druhý
390 11. STATISTICKÉ METODY
sáček, tak ve zbylých sáčcích je dohromady 7 bílých koulí a pravděpodobnost, že
vytáhne jednu z nich je P(B|A1) = 7
12 (opět můžeme použít klasickou pravděpodobnost,
protože v každém sáčku je stejný počet koulí a tedy má každá stejnou
pravděpodobnost, že bude vytažena). Obdobně P(B|A2) = 8
12 a P(B|A3) = 9
12 .
Pak podle (5) je hledaná pravděpodobnost
P(B|A) = P(B|A2)P(A2|A) + P(B|A3)P(A3|A) + P(B|A4)P(A4|A) =
=
7
12

1
6
+
8
12

1
3
+
9
12

1
2
=
25
36
.
11.10.3. Mirek má čtyři sáčky, v každém jsou bílé a černé kuličky a to v těchto
počtech: jedna bílá a jedna černá; tři bílé a jedna černá; jedna bílá a dvě černé;
jedna bílá a tři černé. Mirek náhodně jeden sáček vybral a náhodně z něj vytáhl
jednu kouli. Byla bílá. Mirek tento sáček zahodil a náhodně vybral jeden ze zbylých
tří sáčků a z něj náhodně jednu kouli. Jaká je pravděpodobnost, že bude bílá?
Řešení. Podobně jako v předchozím příkladě uvážíme jev A, totiž že Mirek vybral
náhodně sáček a z něj náhodně bílou kouli jako sjednocení čtyř disjunktních
jevů A1, A2, A3 a A4: Mirek vytáhl bílou kouli a před tím zahodil druhý, resp.
třetí, resp. čtvrtý sáček. Pravděpodobnost vytažení bílé koule z prvního sáčku je
P(A1) = 1
4  1
2 (jev A2 je dán tím, že současně nastaly dva nezávislé jevy a to, že
vytáhl první sáček a že z prvního sáčku vytáhl bílou kouli), podobně P(A2) = 1
4  3
4 ,
P(A3) = 1
4  1
3 , P(A4) = 1
4  1
4 . P(A) = P(A1)+P(A2)+P(A3)+P(A4) = 11
24 . Všimněme
si, že pravděpodobnost P(A) nemůžeme počítat klasickou pravděpodobností,
tedy prostým podělením počtu bílých koulí ku počtu všech koulí, protože například
pravděpodobnost vytažení dané koule v prvním sáčku je dvojnásobná oproti
vytažení dané koule ze čtvrtého sáčku. Pro podmíněné pravděpodobnosti pak platí
P(A1|A) = P(A1)/P(A) = 3
11 , P(A2|A) = 9
22 , P(A3|A) = 2
11 , P(A4|A) = 3
22 .
Označíme ještě písmenem B jev, že Mirek po zahození jednoho ze sáčků vytáhne
bílou 3kouli a znovu budeme chtít použít vztah (5). Zbývá ještě dopočítat P(B|Ai),
i = 1, . . . 4. Jev P(B|A1) rozdělíme na tři disjunktní jevy B2, B3, B4, totiž že druhá
vytažená koule byla z druhého, resp. třetího, resp. čtvrtého sáčku. Celkem
P(B|A1) = P(B2|A1) + P(B3|A1) + P(B4|A1) =
1
3
3
4
+
1
3
1
3
+
1
3
1
4
=
4
9
Obdobně
P(B|A2) = 1
3
1
2 + 1
3
1
3 + 1
3
1
4 =
13
36
,
P(B|A3) = 1
3
1
2 + 1
3
3
4 + 1
3
1
4 =
1
2
,
P(B|A4) = 1
3
1
2 + 1
3
3
4 + 1
3
1
3 =
19
36
.
Celkem pak
P(B|A) = P(B|A1)P(A1|A) + P(B|A2)P(A2|A) + P(B|A3)P(A3|A) + P(B|A4)P(A4|A) =
=
4
9
3
11
+
13
36
9
22
+
1
2
2
11
+
19
36
3
22
=
=
19
44
1. PRAVDĚPODOBNOST 391
11.7
11.11. Náhodné veličiny. Vraťme se k jednoduchému a názornému příkladu statistik
kolem výsledků studentů1
v daném předmětu. Ten je a není podobný klasické
pravděpodobnosti a s ní související statistice při házení kostkou.
Na jedné straně máme pouze konečný počet studentů a připustili jsme pouze
konečný počet možných bodových hodnocení práce studenta za semestr (celá čísla
od 0 do 20). Zároveň ale není patrně vhodné představovat si výsledky jednotlivých
studentů jako analogii nezávislého házení pravidelnou kostkou (jednak neexituje
pravidelný 21­stěn, ale hlavně by to byla skutečně divně vedená přednáška). Na
základním (konečném) prostoru  všech studentů máme ve skutečnosti definovánu
funkci bodového ohodnocení X :   R, která má tu vlastnost, že můžeme modelovat
pravděpodobnosti, že její hodnota při náhodném výběru studenta padne do
předem zvoleného intervalu. Např. můžeme chtít modelovat pravděpodobnost, že
student uspěl s hodnocením A nebo B.
Je to typický příklad náhodné veličiny a každá taková náhodná veličina je spojena
s vhodnou množinou jevů. V našem příkladě bychom tedy měli umět říci pravděpodobnost
pro kterýkoliv interval (a, b)  [0, 20] s reálnými čísly a, b a uzavřenými
i otevřenými konci intervalu. Patrně bychom od rozumně vedené přednášky a dobrých
studentů očekávali, že nejvyšší pravděpodobnost výsledku bude ležet někde
uprostřed škály v ,,úspěšném intervalu , zatímco ideální výsledek plného bodového
zisku příliš pravděpodobný nebude.
I obecné pro takové číselné veličiny X na základním prostoru požadujeme,
abychom mohli pracovat s pravděpodobnostmi příslušnosti hodnoty X do předem
zadaného intervalu. Musíme proto uvést do souladu požadavky na pravděpodobnostní
prostor s vlastnostmi takových funkcí:
Na prostoru Rk
uvažujme nejmenší jevové pole B obsahující všechny k­rozměrné
intervaly. Množinám v B říkáme Borelovské množiny na Rk
. Specielně pro k = 1
půjde o všechny množiny, které ze všech intervalů obdržíme konečnými průniky a
nejvýše spočetnými sjednoceními. 2
Definice. Náhodná veličina X na pravděpodobnostním prostoru (, A, P) je taková
funkce X :   R, že vzor X-1
(B) patří do A pro každou Borelovskou
množinu B  B na R. Reálná funkce PX(B) = P(X-1
(B)) definovaná na všech
Borelovských množinách B  R se nazývá rozdělení (pravděpodobnosti) náhodné
veličiny X
Všimněme si, že pro klasickou konečnou pravděpodobnost je náhodnou veličinou
každá reálná funkce X :   R. Skutečně, na konečné množině  nabývá X
jen konečně mnoho hodnot a každá podmnožina v  je jevovým prostorem.
Rozdělení pravděpodobnosti náhodných veličin zadáváme nejčastěji pomocí
pravidla, jak roste pravděpodobnost s přírůstkem intervalu B:
11.8
11.12. Distribuční funkce. Definice náhodné veličiny zajišťuje, že pro všechny
-  a  b   existují pravděpodobnost P(a < X < b), kde používáme stručné
1Myslíme samozřejmě na ,,studenty a studentky , pro zestručnění textu ale používám podobně
jako v legislativních textech bezpohlavní označní ,,student
2V této souvislosti se často také hovoří o tzv. ­algebře Borelovsky měřitelných množin na
Rk a následující definici lze formulovat tak, že náhodné veličiny jsou Borelovsky měřitelné funkce.
392 11. STATISTICKÉ METODY
značení pro jev A = (  ; a < X() < b)). Stejně tak existují pravděpodobnosti
pro hodnoty v intervalech uzavřených nebo z jedné strany uzavřených.
Definice. Distribuční funkcí náhodné veličiny X je funkce F : R  R definovaná
pro všechny x  R vztahem3
F(x) = P(X < x).
11.9
11.13. Diskrétní a spojité náhodné veličiny. Náhodné veličiny se chovají zásadně
odlišně podle toho, jestli je veškerá nenulová pravděpodobnost ,,soustředěna
do několika konečných hodnot nebo je naopak ,,spojitě rozprostřena po (části)
reálné osy.
Předpokládejme nejprve, že náhodná veličina X na pravděpodobnostním prostoru
(, A, P) nabývá jen konečně mnoha hodnot x1, x2, . . . , xn  R. Pak existuje
tzv. pravděpodobnostní funkce f(x) taková, že
f(x) =
P(X = xi) x = xi
0 jinak.
Evidentně
n
i=1 f(xi) = 1 a pro rozdělení pravděpodobnosti platí
P(X-1
B) =
xiB
f(xi)
a tedy zejména je distribuční funkce tvaru
FX(t) =
xi<t
f(xi).
Říkáme, že X je diskrétní náhodná veličina.
Každá náhodná veličina definovaná pro klasickou pravděpodobnost je diskrétní.
Obdobně lze definici pravděpodobnostní funkce rozšířit na veličiny se spočetně
mnoha hodnotami. Pracujeme pak s nekonečnými řadami a musíme hlídat pečlivě
jejich konvergenci.
I když hodnoty náhodné veličiny X nejsou diskrétní, můžeme postupovat podobně
s užitím ideí diferenciálního a integrálního počtu. Intuitivně lze při infinitesimální
změně hodnoty x o dx uvažovat takto: hustotu f(x) pravděpodobnosti pro
X si představíme jako
P(x  X < x + dx) = f(x)dx.
To znamená, že chceme pro -  a  b  
() P(a  X < b) =
b
a
f(x)dx.
Definice. Náhodná veličina X, pro kterou existuje její hustota pravděpodobnosti
splňující (), se nazývá spojitá náhodná veličina.
11.10 11.14. Věta. Nechť X je náhodná veličina, F(x) je její distribuční funkce.
(1) F je zleva spojitá4
, limx- = 0 a limx = 1.
(2) Vždy platí P(a  X < b) = F(b) - F(a).
3V literatuře se stejně často potkáváme také s definicí s neostrou nerovností, tj. pravděpodobnost
P(X = x) je ještě započtena také.
4Pokud definujeme distribuční funkci s neostrou nerovností, bude naopak zprava spojitá,
ostatní tvrzení této věty zůstavají v platnosti beze změny.
1. PRAVDĚPODOBNOST 393
(3) Je-li X diskrétní s hodnotami x1, . . . , xn, pak je F(x) po částech konstantní,
F(x) = xi<x P(X = xi) a F(x) = 1 kdykoliv x > xn.
(4) Je-li X spojitá, pak je F(x) diferencovatelná a její derivace se rovná hustotě
pravděpodobnosti X, tj. platí F (x) = f(x).
Důkaz. Dodám později...
11.11 11.15. Důsledek. Distribuční funkce náhodné veličiny má vždy nejvýše spočetně
mnoho bodů nespojitosti.
Důkaz. Dodám později...
Dodat poznámku o distribuci u veličin, které mají spojité i diskrétní chování současně
(Riemann­Stieltjesův integrál a něco málo o míře).
11.12
11.16. Příklady diskrétních rozdělení. Požadavky na vlastnosti rozdělení náhodných
veličin zpravidla vychází z modelovaných situací a ve skutečnosti pak ani
nemáme moc možností, jak rozdělení pravděpodobnosti může vypadat.
Uvedeme nejprve několik jednoduchých diskrétních rozdělení.
Degenerované rozdělení Dg(). Toto rozdělení odpovídá konstantní hodnotě
X = . Distribuční funkce FX a pravděpodobnostní funkce fX jsou tedy rovny
FX(t) =
0 t  
1 t > 
fX(t) =
1 t = 
0 jinak
.
Alternativní rozdělení A(p) popisuje pokus s pouze dvěma možnými výsledky,
kterým budeme říkat zdar a nezdar. Náhodné veličině X pro určitost přiřadíme
hodnotu 0 pro nezdar a 1 pro zdar. Pokud má zdar pravděpodobnost p, pak nezdar
musí mít pravděpodobnost 1-p. Jsou tedy distribuční a pravděpodobnostní funkce
tvaru:
FX(t) =


0 t  0
1 - p 0 < t  1
1 t > 1
fX(t) =


p t = 1
1 - p t = 0
0 jinak
.
Binomické rozdělení Bi(n, p) odpovídá n­krát nezávisle opakovanému pokusu
popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet
zdarů. Je tedy zjevné, že pravděpodobnostní funkce bude mít nenulové hodnoty
právě v celých číslech 0, . . . , n odpovídajícím celkovému počtu úspěchů v pokusech
(a nezáleží nám na pořadí). Je tedy
fX(t) =
n
t pt
(1 - p)1-t
t  {0, 1, . . . , n}
0 jinak
.
Na obrázku jsou pravděpodobnostní funkce pro Bi(50, 0.2), Bi(50, 0.5) a Bi(50, 0.9).
Rozdělení pravděpodobnosti dobře odpovídá intuici, že nejvíce výsledků bude blízko
u hodnoty np:
394 11. STATISTICKÉ METODY
S binomickým rozdělením se potkáváme velice často v praktických úlohách.
Jednou z nich je popis náhodné veličiny, která popisuje počet X předmětů v jedné
zvolené příhrádek z n možných, do nichž jsme náhodně rozdělili r předmětů. Umístění
kteréhokoliv předmětu do pevně zvolené přihrádky má pravděpodobnost 1/n
(každá z nich je stejně pravděpodobná). Zjevně tedy bude pro jakýkoliv počet
k = 0, . . . , r
P(X = k) =
r
k
1
n
k
1 -
1
n
r-k
=
r
k
(n - 1)r-k
nr
,
jde proto o rozložení X typu Bi(r, 1/n).
Jestliže nám bude vzrůstat počet přihrádek n společně s počtem předmětů rn tak, že v
průměru nám na každou přihrádku bude připadat (přibližně) stejný počet prvků , můžeme
dobře vyjádřit chování našeho rozdělení veličin Xn při limitním přechodu n  . Takovéto
chování popisuje např. fyzikální soustavy s velikým počtem molekul plynu. Standardní úpravy
(s řádným připomenutím analýzy funkcí jedné proměnné!) vedou při limn rn/n =  k
výsledku:
lim
n
P(Xn = k) = lim
n
rn
k
!
(n - 1)rn-k
nrn
= lim
n
rn(rn - 1) . . . (rn - k + 1)
(n - 1)k
1
k!
,,
1 -
1
n
rn
=
k
k!
lim
n
,,
1 +
-rn
n
rn
rn
=
k
k!
eprotože
obecně funkce (1 + x/n)n
konvergují stejnoměrně k funkci ex
na každém omezeném
intervalu v R.
Poissonovo rozdělení Po() popisuje náhodné veličiny s pravděpodobnostní funkcí
fX(t) =
k
k! et
 N
0 jinak.
Jak jsme odvodili výše, toto diskrétní rozdělení (rozložené do nekonečně mnoha
bodů) dobře aproximuje binomická rozložení Bi(n, /n) pro konstantní  > 0 a
veliká n.
Přímým výpočtem snadno ověříme, že

k=0
fX(k) =
k
k
k!
e=
e-
k
k
k!
= e-+
= 1.
1. PRAVDĚPODOBNOST 395
Takové chování lze očekávat při sledování výskytu jevů v prostoru s konstatní
očekávanou hustotou na jednotku objemu (např. při sledování výskytu bakterií
na sklíčku pod mikroskopem, které se stejně pravděpodobně vyskytují v kterékoliv
jeho části). Je-li ,,průměrná hustota výskytu v jednotkové ploše , pak při rozdělení
celé oblasti na n stejných částí bude výskyt k jevů v jedné výbrané části modelován
náhodnou veličinou X s Poissonovým rozdělením. Takovéto pozorování při praktické
diagnostice v biochemické laboratoři umožní výpočet docela přesného celkového
počtu bakterií ve vzorku ze skutečného počtu odečteného jen v několika náhodně
vybraných malých částech vzorku.
Další přípak výskytu Poissonova rozdělení jsou události, které se vyskytují náhodně
v čase a přitom pravděpodobnost výskytu v následujícím časovém intervalu
o jednotkové délce nezávisí na předchozí historii a je rovna stále stejné hodnotě
. Označme si náhodnou veličinu Xt vyčíslující počet výskytu sledovaného jevu v
intervalu [0, t).
Přesněji řečeno, požadujeme aby
* pravděpodobnost události v každém časovém úseku o délce h byla rovna h + o(h)
* pravděpodobnost více než jedné události v časovém úseku délky h je o(h)
* jevy [Xt = j] a [Xt+h - Xt = k] jsou nezávislé pro všechny j, k  N a t, h > 0.
Označíme-li si funkce pk(t) = P(Xt = k), k  N, a položíme přirozené okrajové podmínky
pk(0) = 0 pro k > 0 a p0(0) = 1, pak limitními přechody s využitím předchozích podmínek
(dodat podrobnosti!!!!!!!!!!!!) obdržíme pro derivace funkcí pk
p0(t) = -p0(t), t > 0, p0(0) = 1
pk(t) = -pk(t) + pk-1(t), t > 0, k > 0, pk(0) = 0.
To je nekonečný (!) systém obyčejných diferenciálních rovnic s počáteční podmínkou, z nichž
první má jediné řešení p0(t) = e-t
. Pak okamžitě můžeme dosadit a vyřešit druhou a obdržíme
p1(t) = t e-t
. Matematickou indukcí teď už snadno dovodíme, že ve skutečnosti má celý
systém jediné řešení a to
pk(t) =
(t)k
k!
e-t
, t > 0, k  N.
Ověřili jsme tedy, že pro každý proces splňující tři výše uvedené vlastnosti má náhodná veličina
Xt udávají počet výskytů v časovém intervalu [0, t) rozdělení Po(t).
V praxi jsou takové procesy spojeny např. s poruchovostí strojů a zařízení.
11.13
11.17. Příklady spojitých rozdělení. Nejjednoduším příkladem spojitého rozdělení
je tzv. rovnoměrné rozdělení. Na něm lze dobře ilustrovat, že při jednoduše
formulovaném požadavku na chování rozdělení nám nezbude moc prostoru pro
jeho definici. Nyní chceme, aby pravděpodobnost každé hodnoty v předem daném
intervalu (a, b)  R byla stejná, tj. hustota fX našeho rozdělení náhodné veličiny
X má být konstantní. Pak ovšem jsou pro libovolná reálná čísla - < a < b < 
jen jediné možné hodnoty
fX(t) =


0 t  a
1
b-a t  (a, b)
0 t  b,
FX(t) =


0 t  a
t-a
b-a t  (a, b)
1 t  b.
Exponenciální rozdělení ex() je dalším rozdělením, které je snadno určeno
požadovanými vlastnostmi náhodné veličiny. Předpokládejme, že sledujeme výskyt
náhodného jevu tak, že výskyty v nepřekrývajících se intervalech jsou nezávislé. Jeli
tedy P(t) pravděpodobnost, že jev nenastane během intervalu délky t, pak nutně
396 11. STATISTICKÉ METODY
P(t + s) = P(t)P(s) pro všechna t, s > 0. Předpokládejme navíc diferencovatelnost
funkce P a P(0) = 1. Pak jistě ln P(t + s) = ln P(t) + ln P(s), takže limitním
přechodem
lim
s0+
ln P(t + s) - ln P(t)
s
= P (0).
Označme si spočtenou derivaci zprava v nule jako -  R. Pak tedy pro P(t) platí
ln P(t) = -t + C a počáteční podmínka dává jediné řešení
P(t) = e-t
.
Všimněme si, že z definice našich objektů vyplývá, že  > 0.
Nyní uvažme náhodnou veličinu X udávající (náhodný) okamžik, kdy náš jev
poprvé nastane. Zřejmě tedy je distribuční funkce rozdělení pro X dána
FX(t) = 1 - P(t) =
1 - e-t
t > 0
0 t  0.
Je vidět, že skutečně jde rostoucí funkci s hodnotami mezi nulou a jedničkou a
správnými limitami v .
Hustotu tohoto rozdělení dostaneme derivováním distribuční funkce, tj.
fX =
e-t
t > 0
0 t  0.
Normální rozdělení je ze všech nejdůležitější. Jestliže v binomiálním rozdělení
zachováme konstatní úspěšnost p, ale budeme přidávat počet pokusů n,
bude pravděpodobnostní funkce kupodivu pořád mít podobný tvar (i když jiné
rozměry). Na obrázku při rostoucím n se budou vynesené bodové hodnoty slívat do
křivky, pro hodnoty Bi(500, 0.5) a Bi(5000, 0.5) je výsledek vidět na obrázku níže,
rozdělení Bi(50, 0.5) jsme viděli dříve. Třetí křivka na obrázku je grafem funkce
f(x) = e-x2
/2
.
Podbízí se proto hledat vhodné spojité rozdělení, které by mělo hustotu danou
nějakou obdobnou funkcí. Protože je e-x2
/2
vždy kladná funkce, potřebovali
bychom spočíst
b
a
e-x2
/2
dx což není pomocí elementárních funkcí možné. Je však
možné (i když ne úplně snadné) ověřit, že příslušný nevlastní integrál konverguje k
hodnotě

-
e-x2
/2
dx =

2.
1. PRAVDĚPODOBNOST 397
Odtud vyplývá, že možná hustota rozdělení náhodného rozdělení může být
fX(x) =
1

2
ex
.
Rozdělení s touto hustotou se nazývá normální rozdělení N(0, 1). Příslušnou distribuční
funkci
FX(x) =
x
-
e-x2
/2
dx
nelze vyjádřit pomocí elementárních funkcí, přesto se s ní numericky běžně počítá
(pomocí tabulek nebo softwarových aplikací).
Hustotě fX se také často říká Gaussova křívka.
Abychom uměli pořádněji sformulovat asymptotickou blízkost normáního a binomického
rozdělení pro n  , musíme si vytvořit další nástroje pro práci s
náhodnými veličinami. Budeme k tomu používat funkce dvojím různým způsobem.
11.18. Příklady.
11.18.1. Určete konstantu a tak aby funkce
f(x) =


0 pro x  1
a ln(x) pro 1 < x < 2
0 pro 2  x
zadávala hustotu pravděpodobnosti nějaké náhodné veličiny.
Řešení. Podmínka na to, aby zadaná funkce zadávala hustotu pravděpodobnosti
je

f(x)
= 1
Bude potřeba spočítat ln(x) dx:
ln(x) dx = x ln(x) - 1 dx = x ln(x) - x = x(ln(x) - 1).
Celkem

f(x)
=
2
1
a ln(x) = a[x(ln(x) - 1)]2
1 = a(2 ln(2) - 1),
tedy a = 1
2 ln(2)-1 .
11.18.2. V lese, jehož hranice tvoří na mapě pravidelný šestiúhelník se ztratilo dítě.
Předpokládejme, že pravděpodobnost toho, že dítě je v určíté části lesa, je úměrná
pouze velikosti této části, nikoliv jejímu umístění.
* Jaké je rozdělení pravděpodobnosti vzdálenosti dítěte od zvolené strany (přímky)
lesa
* Jaké je rozdělení pravděpodobnosti vzdálenosti dítěte od nejbližší strany lesa.
Řešení.
* Nechť a je strana šestiúhelníka. Pak rozdělení pravděpodobnosti je
f(x) =


0 pro x  0
4
9a2 x + 2
3

3a
pro 0 < x  1
2

3a
- 4
9a2 x + 2
3a
pro 1
2

3a  x 

3a
0 pro x >

3a
,
pro část a.
398 11. STATISTICKÉ METODY
* Spočtěme nejprve distribuční funkci F hledaného rozložení náhodné veličiny X
udávající vzdálenost dítěte od nejbližší strany lesa. Vzdálenost se může pohybovat
v intervalu I = 0,

3
2 a . Pro y  I potom máme
F(y) = P[X < y] =

3
4 a2
-
(

3
2 a-y)2
3
4 a2

3
4 a2

3
4 a2
= 1 -
4(

3
2 a - y)2
3a2
Celkem tedy
F(y) =


0 pro y  0
1 -
4(

3
2 a-y)2
3a2 pro y  0,

3
2 a
1 pro y 

3
2 a
Pro hustotu pravděpodobnosti, která je derivací distribuční funkce dostáváme:
f(x) =


0 pro x  0
8(

3
2 a-y)
3a2 pro y  0,

3
2 a
0 pro y 

3
2 a
11.18.3. Nechť veličina náhodná veličina X má rovnoměrné rozdělení na intervalu
0, r . Určete distribuční funkci a hustotu pravděpodobnosti rozdělení objemu koule
o poloměru X.
Řešení. Určeme nejprve distribuční funkci F (pro 0 < d < 4
3 r3
)
F(d) = P
4
3
X3
 d = P X 
3 3d
4
=
3 3d
4
r
,
celkem
F(x) =


0 pro x  0
3 3
4r3 x
1
3 pro 0 < x < 4
3 r3
1 pro x  4
3 r3
Derivováním pak obdržíme hustotu pravděpodobnosti:
f(x) =


0 pro x  0
3 1
36r3 x- 2
3 pro 0 < x < 4
3 r3
0 pro x  4
3 r3
11.18.4. Stanovte hodnotu parametru a  R tak, aby funkce
f(x) =


0 pro x  0
ax2
pro 0 < x < 3
0 pro x  3
zadávala hustotu pravděpodobnosti náhodné veličiny X. Určete distribuční
funkci, hustotu pravděpodobnosti a střední hodnotu rozdělení objemu krychle, jejíž
délka hrany je náhodná veličina s hustotou pravděpodobnosti danou funkcí f.
Řešení. Jednoduše a = 1
9 . Distribuční funkce náhodné veličiny X je tedy FX(t) =
1
27 t3
pro t  (0, 3), pro menší t je tato funkce nulová, pro větší rovna 1. Označme
1. PRAVDĚPODOBNOST 399
Z = X3
náhodnou veličinu označující objem krychle. Ten je v intervalu (0, 27), pro
t  (0, 27) a distribuční funkci FZ náhodné veličiny Z tedy můžeme psát FZ(t) =
P[Z < t] = P[X3
< t] = P[X < 3

t] = FX( 3

t) = 1
27 t, hustota pravděpodobnosti
je pak fZ(t) = 1
27 na intervalu (0, 27), jinak nula, jedná se tedy o rovnoměrné
rozdělení pravděpodobnosti na daném intervalu, střední hodnota je tudíž 13, 5.
11.18.5. 2. Stanovte hodnotu parametru a  R tak, aby funkce
f(x) =


0 pro x  0
ax pro 0 < x < 3
0 pro x  3
zadávala hustotu pravděpodobnosti náhodné veličiny X. Určete distribuční
funkci, hustotu pravděpodobnosti a střední hodnotu rozdělení obsahu čtverce, jehož
délka hrany je náhodná veličina s hustotou pravděpodobnosti danou funkcí f.
Řešení. Budeme postupovat jako v předchozím příkladě. Opět snadno zjistíme
a = 2
9 . Distribuční funkce náhodné veličiny X je tedy FX(t) = 1
9 t2
pro t  (0, 3),
pro menší t je tato funkce nulová, pro větší rovna 1. Označme Z = X2
náhodnou
veličinu označující obsah čtverce. Ten je v intervalu (0, 9), pro t  (0, 9) a distribuční
funkci FZ náhodné veličiny Z tedy můžeme psát FZ(t) = P[Z < t] = P[X2
<
t] = P[X <

t] = FX(

t) = 1
9 t, hustota pravděpodobnosti je pak fZ(t) = 1
9 na
intervalu (0, 9), jinak nula, jedná se tedy o rovnoměrné rozdělení pravděpodobnosti
na daném intervalu, střední hodnota je tudíž 4, 5.
11.18.6. Náhodně rozřízneme úsečku délky l na dvě části. Určete distribuční funkci
a hustotu pravděpodobnosti rozdělení obsahu obdélníka, jehož délky stran jsou rovny
délkám takto vzniklých úseček.
Řešení. Spočítejme hledanou distr. funkci. Označme ještě X náhodnou veličinu s
rovnoměrným rozložením na intervalu 0, l udávající délku jedné ze stran (délka
druhé je pak l - X). Obsah obdélníka S, tedy součin x(l - x) pro x  0, l může
zřejmě nabývat hodnot 0, l2
/4 . Volíme-li d  0, l2
/4 , můžeme psát
F(d) = P[S  d] = P[X(l - X)  d]
Hledáme tedy ty hodnoty x, pro které je x(l - x)  d. Řešíme kvadr. nerovnici,
kořeny odpovídající kvadratické rovnice jsou l-

l2-4d
2 a l+

l2-4c
2 , hodnoty x uvnitř
tohoto intervalu nerovnici nesplňují, hodnoty vně potom ano. Je tedy
P[X(l - X)  d] = P[X  0, l \ (
l -

l2 - 4d
2
,
l +

l2 - 4d
2
)] =
l -

l2 - 4d
l
=
= 1 -

l2 - 4d
l
Celkem
F(x) =


0 pro x  0
1 -

l2-4x
l pro 0  x  l2
4
1 pro x > l2
4
Hustotu pravděpodobnosti pak dostaneme derivací:
x(x) =


0 pro x  0
2
l

l2-4x
pro 0  x  l2
4
0 pro x > l2
4
400 11. STATISTICKÉ METODY
11.18.7. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X má rovnoměrné
rozdělení pravděpodobnosti na intervalu (0, 2), Y je pak dána následující hustotou
pravděpodobnosti:
f(x) =


0 pro x  0
2x pro 0 < x < 1
0 pro x  1.
Určete pravděpodobnost, že Y je menší než X2
.
Řešení. Protože X a Y jsou nezávislé náhodné veličiny, je sdružená hustota pravděpodobnosti
f(X,Y ) : R2
 R2
veličiny (X, Y ) dána součinem hustot pravděpodobnosti
fX veličiny X a fY veličiny Y , tedy
f(X,Y )(u, v) =
fX(u)  fY (v) = 1
2  2v = v pro(u, v)  (0, 2) × (0, 1),
0 jinak.
Hledaná pravděpodobnost P je pak dána integrálem hustoty pravděpodobnosti
f(X,Y ) přes tu část roviny O, kde je Y < X2
:
P =
O
f(X,Y ) dx dy = 1 -
R2\O
f(X,Y ) dx dy = 1 -
1
0
1
x2
y dy dx =
3
5
.
11.18.8. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X je dána následující
hustotou pravděpodobnosti:
f(x) =


0 pro x  0
2x pro 0 < x < 1
0 pro x  1,
veličina Y pak touto hustotou pravděpodobnosti:
f(x) =


0 pro x  0
x
2 pro 0 < x < 2
0 pro x  2.
Určete pravděpodobnost, že Y je větší než X2
.
Řešení. Obdobně jako v předchozím příkladě určíme, že f(X,Y )(u, v) = uv, pro
(u, v)  (0, 1)×(0, 2), f(X,Y )(u, v) = 0 jinak. Pro hledanou pravděpodobnost P pak
máme
P =
1
0
2
x2
xy dy dx =
11
12
.
11.18.9. Nechť X, Y jsou nezávislé náhodné veličiny, přičemž X je dána následující
hustotou pravděpodobnosti:
f(x) =


0 pro x  0
2x
9 pro 0 < x < 3
0 pro x  1,
1. PRAVDĚPODOBNOST 401
veličina Y pak touto hustotou pravděpodobnosti:
f(x) =


0 pro x  0
x
2 pro 0 < x < 2
0 pro x  2.
Určete pravděpodobnost, že Y je větší než X3
.
Řešení.
P =
3
2
0
2
x3
xy dy dx =
3

4
12
.
11.14
11.19. Funkce náhodných veličin. Místo náhodné veličiny X, např. ,,roční plat
zaměstnance , budeme vyčíslovat jinou závislou hodnotu (X), např. ,,roční čistý
příjem zaměstnance po zdanění a včetně sociálních dávek . V systému se značnou
sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro
konstantní. Statisticky se proto budou značně odlišovat.
Nejjednodušší funkcí, po konstantách, je afinní závislost
(x) = a + bx
s konstatními a, b  R, b = 0. Je-li fX(x) pravděpodobnostní funkce náhodné
veličiny s diskrétním rozdělením, snadno se vypočte
f(X)(y) = P((X) = y) =
(xi)=y
f(xi).
V případě afinní závislosti x = 1
b (y - a) je proto pravděpodobnostní funkce nenulová
právě v bodech yi = axi + b. V případě rozdělení Xn typu Bi(n, p) převádí
transformace
x = y np(1 - p) + np
náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci
spojitého rozdělení N(0, 1).
Podobně zkusme opačnou transformaci provést na veličinu Y s normálním rozdělením
N(0, 1). Pro pevně zvolená čísla ,   R,  > 0 spočtěme rozdělení náhodné
veličiny Z =  + Y . Dostáváme distribuční funkci
FZ(z) = P(Z < z) = P( + Y < z)
= FY (
z - 

) =
z-

-
1

2
e-t2
/2
dt
=
z
-
1

2
e-
(x-)2
22
dx,
kde poslední úprava vychází ze substituce x =  + t. Hustota naší nové náhodné
veličiny Z je proto
fZ =
1

2
e-
(x-)2
22
a takovému rozdělení se říká normální typu N(, ).
402 11. STATISTICKÉ METODY
11.15
11.20. Číselné charakteristiky náhodných veličin. Při statistickém zkoumání
hodnot náhodných veličin (např. zpracování výsledků nějakého měření) hledáme
výpovědi o náhodné veličině pomocí různých z ní odvozených čísel.
Jako nejjednodušší příklad může sloužit střední hodnota EX náhodné veličiny
X, která je definována
EX = i xifX(xi) pro diskrétní veličinu

xfX(x)dx
pro spojitou veličinu.
Obecně střední hodnota náhodných veličin nemusí existovat, protože příslušné sumy
či integrály nemusí konvergovat. Obvykle říkáme, že střední hodnota existuje, když
nastává absolutní konvergence.
Střední hodnotu můžeme přímo vyjádřit také pro funkce Y = (X) náhodné
veličiny X. V diskrétním případě můžeme přímo spočíst
EY =
j
yjP(Y = yj)
=
j
yj
(xi)=yj
P(X = xj)
=
i
(xi)P(X = xi).
Je tedy E(X) přímo spočítatelná pomocí pravděpodobnostní funkce fX.
Podobně vyjadřujeme střední hodnotu funkce ze spojité náhodné veličiny:
E(X) =

-
(x)fX(x)dx
pokud tento integrál absolutně konverguje.
Dalšími užitečnými charakteristikami jsou tzv. kvantily. Pro ryze monotóní
distribuční funkci FX (tj. spojitou náhodnou veličinu X s všude nenulovou hustotou,
jako je tomu např. u normálního rozdělení) jde prostě o inverzní funkci
F-1
X : (0, 1)  R. To znamená, že hodnota y = F-1
() je taková, že P(X < y) = .
Obecněji, je-li FX(x) distribuční funkce náhodné veličiny X, pak definujeme
kvantilovou funkci
F-1
() = inf{x  R; F(x)  },   (0, 1).
Zřejmě jde o zobecnění předchozí definice.
Nejčastěji jsou používané kvantily s  = 0.5, tzv. medián, s  = 0.25, tzv.
první kvartil,  = 0.75, tzv. třetí kvartil, a podobně pro decily a percentily (kdy
je  rovno násobkům desetin a setin). K těmto hodnotám se vrátíme v popisné
statistice později.
11.16
11.21. Střední hodnoty některých rozložení. Spočtěme si nejprve střední
hodnotu náhodné veličiny X s rozdělením Bi(n, p).
1. PRAVDĚPODOBNOST 403
EX =
n
i=0
i
n
i
pi
(1 - p)(n-i)
=
n
i=1
i
n
i
pi
(1 - p)(n-i)
(11.1)
= np
n
i=1
n - 1
i - 1
p(i-1)
(1 - p)(n-i)
=(11.2)
= np
n-1
j=0
n - 1
j
pj
(1 - p)(n-1)-j
=(11.3)
= np.(11.4)
11.17
11.22. Náhodné vektory.
11.17
11.23. Elementární vlastnosti střední hodnoty.
11.24. Věta. Buď X náhodná veličina s existující střední hodnotou. Potom
E(a + bX) = a + bE(X),
pro libovolná reálná a, b.
Důkaz. Snadný, plyne z možnosti vytýkat reálná čísla ze sumy, resp. integrálu.
11.25. Věta. Pro náhodné veličiny X, Y s existujícími středními hodnotami platí
E(X + Y ) = EX + EY.
Důkaz. Nechť například X je spojitá náhodná veličina s hustotou pravděpodobnosti
f a Y spojitá náhodná veličina s hustotou pravděpodobnosti g a nechť h
je hustota pravděpodobnosti X + Y . Potom . . .
Následující věta nám poskytuje návod, jak počítat střední hodnotu transformované
náhodné veličiny.
i_hodnota_transformovane 11.26. Věta. Nechť X je spojitá náhodná veličina s hustotou pravděpodobnosti f
a g : R  R je hladnká funkce. Pak
E(g(X)) =

g(x)f(x)
dx.
Důkaz.
11.19
11.27. Rozptyl a směrodatná odchylka. Rozptyl a směrodatná odchylka náhodné
veličiny popisují, do jaké míry se hodnoty náhodné veličiny kumulují kolem
její střední hodnoty. Pro náhodnou veličinu X s konečnou střední hodnotou definujeme
její rozptyl
var X = E (X - EX)2
.
Snadno se ukáží tyto vlastnosti konečného rozptylu náhodné veličiny X:
var X = E(X2
) - (EX)2
var(a + bX) = b2
var X
404 11. STATISTICKÉ METODY
11.20
11.28. Momenty a momentová funkce rozdělení.
11.29. Definice. Charakteristiku E(Xk
) nazýváme k-tým momentem, charakteristiku
k = E (X - EX)k
pak k-tým centrálním momentem náhodné veličiny
X. Funkci MX(t) : R  R definovanou předpisem
MX(t) = EetX
pak momentovou vytvořující funkcí náhodné veličiny X.
11.30. Věta. (doplnit předpoklady!) Koeficienty Taylorova rozvoje funkce MX(t)
jsou právě centrální momenty náhodné veličiny X.
Momentová funkce poskytuje za jistých podmínek úplnou charakterizaci náhodné
veličiny, obdobně jako její distribuční funkce.
Spočítejme momentovou funkci náhodné veličiny X s normálním rozložením.
Použijeme pro to větu 11.26.
MX(t) =

etx
1

2
e- x2
2 dx =
=

-
1

2
e- 1
2 (x2
-2tx+t2
-t2
)
dx =
= e
t2
2

-
1

2
e-
(z-t)2
2 dx =
= e
t2
2 .
11.21
11.31. Kovariance. Pro náhodné veličiny X, Y s existujícími rozptyly definujeme
jejich kovarianci C(X, Y ) (též cov(X, Y )) jako
C(X, Y ) = E ((X - EX)(Y - EX))
11.32. Poznámka.
Pro kovarianci náhodných veličin X, Y , Z platí
cov(X, Y ) = E(XY ) - (EX)(EY )
cov(X + Y, Z) = cov(X, Z) + cov(Y, Z)
cov(a + bX, c + dY ) = bd cov(X, Y ), a, b, c, d  R
Důkaz. Vyplývá z vlastností střední hodnoty náhodné veličiny. Proveďme např.
důkaz třetího vztahu:
cov(a + bX, c + dY ) = E ((a + bX - E(a + bX))(c + dY - E(c + dY )))
= E ((bX - bE(X))(dY - dE(Y ))) =
= E (bd(X - E(X))(Y - E(Y )) =
= bdE ((X - EX)(Y - EY )) =
= bd cov(X, Y ).
1. PRAVDĚPODOBNOST 405
Vidíme, že podle definice je var(X, X) = cov(X, Y ). Pokud uvážíme náhodné
veličiny s definovaným rozptylem jako vektorový prostor nad R, tak kovariance je
symetrická bilineární forma a rozptyl jí odpovídající kvadratická forma. Odtud
kovariance (11.5) cov(X, Y ) =
1
2
(var(X + Y ) - var(X) - var(Y )) .
Korelace dvou náhodných veličin vypovídá o míře jejich závislosti.
11.33. Věta. Pokud jsou X a Y nezávislé, pak C(X, Y ) = 0.
Důkaz. Jsou-li X a Y nezávislé, jsou nezávislé též veličiny (X-EX) a (Y - EY )
a tudíž
C(X, Y ) = E ((X - EX)(Y - EY )) = E(X - EX)E(Y - EY ) =
= (EX - EX)(EY - EY ) = 0.
Bezprostředním důsledkem předchozí věty a vztahu (11.5) je potom
11.34. Důsledek. Pro nezávislé náhodné veličiny X a Y platí
cov(X + Y ) = cov(X) + cov(Y ).
Ještě lépe než kovariance (i když opět ne úplně) vystihuje míru (ne)závislosti
dvou náhodných veličin korelační koeficient.
náhodných veličin X a Y rozumíme hodnotu
X,Y =
cov(X, Y )

var X

var Y
.
Schwarzova nerovnost pro positivně semi-definitní formu cov nám pak říká, že
|X,Y |  1
Dále snadno dostáváme
a+bX,c+dY = sign(bd)X,Y
a pro nezávislé veličiny X, Y pak X,Y = 0.
11.35. Příklady.
11.35.1. Hodíme třemi mincemi. Určete korelační koeficient veličiny X udávající
počet padlých líců dohromady na první a druhé minci a veličiny Y udávající počet
padlých líců dohromady na druhé a třetí minci.
Řešení. Nejprve sestavíme pravdivostní tabulku vektorové diskrétní náhodné veličiny
(X, Y ), ze které snadno určíme pravděpodobnostní rozdělení veličin, které
budeme potřebovat (samozřejmě to můžeme udělat i bez tabulky):
Y 0 1 2
X
0 1
8
1
8 0
1 1
8
1
4
1
8
2 0 1
8
1
8
406 11. STATISTICKÉ METODY
Diskrétní veličiny X a Y mají stejné rozdělení pravděpodobnosti a to hodnotu
0 nabývají s pravděpodobností 1/4, hodnotu 1 s pravděpodobností 1/2 a hodnotu
2 s pravděpodobností 1/4. Veličina XY pak může nabývat hodnot 0, 1, 2, 4 a to
postupně s pravděpodobnostmi 3/8, 1/4, 1/4, 1/8 Nyní spočítáme střední hodnoty
veličin X, X2
, Y , Y 2
, XY :
E(X) = E(Y ) = 0 
1
4
+ 1 
1
2
+ 2 
1
4
= 1
E(X2
) = E(Y 2
) = 0 
1
4
+ 1 
1
2
+ 4 
1
4
=
3
2
E(XY ) = 0 
3
8
+ 1 
1
4
+ 2 
1
4
+ 4 
1
8
=
5
4
Máme tedy
2
(X) = 2
(Y ) = E(X2
) - [E(X)]2
=
1
2
cov(X, Y ) = E(XY ) - E(X)E(Y ) =
1
4
Celkem
X,Y =
cov(X, Y )
(X)  (Y )
=
1
2
11.35.2. Dvakrát hodíme šestibokou kostkou. Určete korelační koeficient veličiny
X udávající počet padlých sudých čísel a veličiny Y udávající počet padlých lichých
čísel.
Řešení. Řešíme analogicky jako předchozí příklad:
X,Y = -1.
11.22
11.36. Přehled rozdělení odvozených od normálního.
11.23
11.37. Limitní vlastnosti.
11.24 11.38. Věta (Centrální limitní věta).
11.39. Příklady.
11.39.1. Pomocí distribuční funkce standardního normálního rozdělení určete pravděpodobnost,
že při 1600 hodech mincí bude rozdíl mezi počtem padlých hlav a orlů
alespoň 82.
Řešení. Označíme-li jako X náhodnou veličinu udávající počet padlých hlav, tak X
má binomické rozložení pravděpodobnosti Bi(1600, 1/2) (se střední hodnotou 800
a směrodatnou odchylkou 20) a tudíž lze distribuční funkci veličiny X-800
20 lze pro
dané velké n = 1600 podle Moivreovy-Laplaceovy věty velmi dobře odhadnout jako
distribuční funkci  standardního normálního rozdělení. Hledaná pravděpodobnost
je tedy
P = 1 - P[759  X  841] = 1 - P -2, 05 
X - 800
20
 2, 05
.
=
.
= 2(-2, 05)
.
= 0, 0404.
2. POPISNÁ STATISTIKA 407
11.39.2. Pomocí distribuční funkce standardního normálního rozdělení určete pravděpodobnost,
že při 3600 hodech mincí bude rozdíl mezi počtem padlých hlav a orlů
nejvýše 66.
Řešení. Označíme-li jako X náhodnou veličinu udávající počet padlých hlav, tak X
má binomické rozložení pravděpodobnosti Bi(3600, 1/2) (se střední hodnotou 1800
a směrodatnou odchylkou 30) a tudíž lze distribuční funkci veličiny X-1800
30 lze pro
dané velké n = 1600 podle Moivreovy-Laplaceovy věty velmi dobře odhadnout jako
distribuční funkci  standardního normálního rozdělení. Hledaná pravděpodobnost
je tedy
P[1767  X  1833] = P -1, 1 
X - 1800
30
 1, 1
.
=
.
= (1, 1) - (-1, 1)
.
= 0, 7498.
11.39.3. Pravděpodobnost narození chlapce je 0, 515. Jaká je pravděpodobnost, že
mezi deseti tisíci novorozenci bude stejně nebo více děvčat než chlapců.
Řešení.
P[X < 5000] = P[
X - 5150

5150  0, 485
N(0,1)
<
-150

5150  0, 485
-3,001...
]
.
=
.
= 0, 00135
11.39.4. Pomocí distribuční funkce standardního normálního rozdělení určete pravděpodobnost,
že při 18000 hodech šestibokou kostkou padne alespoň 3100 šestek.
Řešení. Obdobně, jako v předchozích příkladech. X má binomické rozdělení pravděpodobnosti
Bi(18000, 1/6). Určíme střední hodnotu ((1/6)(18000) = 3000), směrodatnou
odchylku ((1/6)(1 - 1/6)18000) = 50, tedy veličinu X-3000
50 lze odhadnout
jako distribuční funkci  stadardního normálního rozložení:
P[X  3100] = P[
X - 3000
50

3100 - 3000
50
] = P[
X - 3000
50
 2]
.
= 1-(2)
.
= 0, 0228.
2. Popisná statistika
11.25
11.40. Soubor hodnot a jeho popis.
11.26
11.41. Číselné charakteristiky polohové.
11.27
11.42. Míry variability souboru.
11.28
11.43. Další výběrové koeficienty.
11.29
11.44. Diagramy.
408 11. STATISTICKÉ METODY
3. Matematická statistika
11.30
11.45. Výběry z populace. V praxi často potkáváme veliký základní statistický
soubor s N jednotkami, který budeme stručně nazývat populace. Na každé z N
jednotek přitom můžeme měřit hodnotu nějakého pevně zvoleného číselného znaku
X, čímž bychom celkem získali N hodnot x1, x2, . . . , xN . Průměr x všech hodnot
xi označíme  a populační rozptyl 2
, tj.
 =
1
N
N
i=1
xi, 2
=
1
N
N
i=1
(xi - )2
.
Je-li naše populace skutečně veliká, nemůžeme (nebo alespoň z různých důvodů
nechceme) získávat skutečně všechny hodnoty xi. Místo toho provedeme výběr (tj.
zvolíme tzv. výběrový soubor) o rozsahu n < N jednotek, který bude ,,dobře
reprezentovat celou populaci. Pro naše potřeby budeme nyní za dobrý považovat
takový výběr, kdy všechny n­tice jednotek mají stejnou šanci na vybrání.
Uvažme neprve případ, kdy použijeme náhodný výběr bez vracení, tzn. že postupně
vybíráme jednotky jednu za druhou, aniž bychom dosud zpracované do
základní populace vraceli. Pro celý výběrový soubor máme zjevně N
n možností a
každou pevně zvolenou n­tici indexů  můžeme zvolit (N-n)!
N! způsoby.
Pracujeme tedy s konečným jevovým polem s elementárními jevy  a přiřazování
číslené charakteristiky xi má charakter náhodného vektoru
(X1(), X2(), . . . , Xn()),
který vzniká z n­násobného výběru elemntárního jevu  a přiřazení příslušné číselné
honoty znaku. Při výpočtech průměrů a rozptylů pracujeme se symetrickými funkcemi,
budou nás proto nyní skutečně zajímat pouze neuspořádané n­tice. Každý z
takových výběrů je sjednocením n! jevů a má tedy pravděpodobnost 1
(N
n )
.
Chceme nyní ověřit, do jaké míry vede použití standardních formulí pro výběrové
průměry a rozptyly k dobrým odhadům skutečných hodnot pro celou populaci.
Uvažujme proto náhodné veličiny
X = X(s) =
1
n
n
i=1
Xi, S2
=
1
n
n
i=1
(Xi - X)2
.
Věta. Za výše uvedených podmínek a označení platí
E X = , ES2
=
N
N - 1
2
, var X =
N - n
N - 1
2
n
.
Tvrzení řeší, zda průměr číselného znaku X populace a příslušný rozptyl tohoto
znaku jsou ve střední hodnotě (tj. ,,v průměru ) stejné jako odpovídající hodnoty
spočtené na náhodném výběru. Pokud ano, říkáme, že jde o nestranné odhady.
Výběrový průměr tedy je nestranným odhadem, zatímco výběrový rozptyl se jím
stane teprve po korekci koeficientem N-1
N . K nestranným odhadům se jestě vrátíme
obecněji.
Důkaz. Za tím účelem si technicky popišme naše náhodné výběry pomocí
N náhodných veličin Wi, které jsou definovány tak, aby pro výběr n­tice s bylo
Wi(s) = 1 pokud i  s a nula jinak (tzv. indikátory zahrnutí). Snadno se pak ukáže
. . .
4. POZNÁMKY O NĚKTERÝCH APLIKACÍCH 409
11.31
11.46. Poznámky o statistické indukci.
11.32
11.47. Poznámky o testování hypotéz.
11.33
11.48. Poznámky o lineárních modelech.
11.34
11.49. Závěrem.
4. Poznámky o některých aplikacích
AŽ NĚKDY BUDE DELŠÍ SEMESTR!!!! (třeba pravděpodobnostní model datového
kanálu, Kalmanův filtr v matematické ekonomii atd.)
Literatura
[1] Frank Ayres, Jr., Theory and Problems of Differential and Integral Calculus, second edition,
Schaum publishing, New York, 1964, 336s.
[2] Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická
statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-
210-3313-4.
[3] Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita,
3. vydání, 2002, 48 stran, ISBN 80-210-1831-3.
[4] Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova
univerzita, 2005, 170 stran, ISBN 80-210-3886-1.
[5] Zuzana Došlá, Jaromír Kuben, Diferenciální počet funkcí jedné proměnné, MU Brno, 2003,
215 s., ISBN 80-210-3121-2.
[6] Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem
Maple, MU Brno, 1999, 273 s.
[7] William J. Gilbert, W. Keith Nicholson, Modern algebra with applications, 2nd ed. John
Wiley and Sons (Pure and applied mathematics) ISBN 0-471-41451-4
[8] Jiří Herman, Radan Kučera, Jaromír Šimša, Metody řešení matematických úloh I, MU Brno,
2. přepsané vydání, 1996
[9] Jiří Herman, Radan Kučera, Jaromír Šimša, Metody řešení matematických úloh II, MU
Brno, 2. přepsané vydání, 1997
[10] Pavel Horák, Úvod do lineární algebry, MU Brno, skripta.
[11] Ivana Horová, Jiří Zelinka, Numerické metody, MU Brno, 2. rozšířené vydání, 2004, 294 s.,
ISBN 80-210-3317-7.
[12] Jiří Matoušek, Jaroslav Nešetřil, Kapitoly z diskrétní matematiky, Univerzita Karlova v
Praze, Karolinum, Praha, 2000, 377 s.
[13] Luboš Motl, Miloš Zahradník, Pěstujeme lineární algebru, 3. vydání, Univerzita
Karlova v Praze, Karolinum, 348 stran (elektronické vydání také na
http://www.kolej.mff.cuni.cz/~lmotm275/skripta/).
[14] Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering,
second edition, Cambridge University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii +
1232 pp.
[15] František Šik, Lineární algebra zaměřená na numerickou analýzu, MU, 1998, 176 s. ISBN
80-210-1996-2.
[16] Jan Slovák, Lineární algebra. učební texty, Masarykova univerzita, elektronicky dostupné
na www.math.muni.cz/~slovak
[17] Pavol Zlatoš, Lineárna algebra a geometria, skripta MFF Univerzity komenského v Brati-
slavě.
[18] Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, Universita
Karlova, 2006, 230 s.
411