1
Přírodovědecká fakulta
TEORIE MNOŽIN pro učitele
Eduard FUCHS
MASARYKOVA UNIVERZITA
Brno, 2000
Obsah
předmluva 4
1 Formální výstavba matematiky 6
1 Axiomatická teorie a její model.......................... 6
2 Jazyk matematických teorií............................ 8
3 Výrokový kalkul ................................. 13
4 Predikátový kalkul................................ 28
5 Axiomatická teorie................................ 37
6 Axiomatická teorie množin............................ 42
2 Základní množinové pojmy 52
1 Základní operace na systémech množin ..................... 52
2 Dobře uspořádané množiny............................ 56
3 Aritmetika uspořádaných množin......................... 60
4 Axióm výběru a věty s ním ekvivalentní..................... 66
3 Kardinální a ordinální čísla 73
1 Kardinální číslo. Spočetné množiny....................... 73
2 Nerovnost mezi kardinálními čísly........................ 78
3 Aritmetika kardinálních čísel........................... 84
4 Mohutnost kontinua................................ 90
5 Ordinální typy a ordinální čísla.......................... 93
6 Třída všech ordinálních čísel. Alefy....................... 99
4 Historický vývoj teorie množin 108
1 Vývoj pojmu nekonečno..............................108
2 Georg Cantor a jeho dílo.............................120
3 Antinomie teorie množin. Třetí krize matematiky................133
4 Východiska z krize................................137
2
3
5      Godelovy výsledky................................143
Dodatek 148
Literatura 154
Rejstřík 155
předmluva
Množinově-logický jazyk matematiky je dnes již zcela běžný od 1. třídy základní školy. Proto musí být pro budoucí učitele matematiky jeho dokonalé zvládnutí — včetně nezbytného nadhledu — naprostou samozřejmostí.
Cíle tohoto textu lze shrnout následovně:
1. vysvětlit nutnost formalizace matematických teorií a nastínit základní metody této formalizace;
2. vyložit základní pojmy teorie množin, především pak popsat základní vlastnosti kardinálních a ordinálních čísel;
3. popsat vývoj teorie množin a vliv této teorie na matematiku 20. století.
K pochopení probírané látky není potřeba žádných hlubších předběžných znalostí. (Stručný přehled nejpotřebnějších elementárně-množinových pojmů je uveden v dodatku na konci této části CD).
Rada těchto pojmů je dnes již součástí středoškolské matematiky a všechny jsou podrobně probírány v základních matematických přednáškách. Jejich dokonalé zvládnutí — a to v rozsahu výrazně převyšujícím zmíněný dodatek —je proto možno považovat za samozřejmé.
Teorie množin sehrála ve vývoji matematiky roli zcela zásadní. Proto je historii teorie množin a důsledkům této teorie pro matematiku 20. století věnována celá 4. kapitola. V této kapitole jsou rovněž uvedeny autentické ukázky z klíčových textů B. Bolzana a G. Cantora.
Zvláštní pozornost si zaslouží ta část 4. kapitoly, která je věnována dílu K. Gôdela. Význam jeho „věty o neúplnosti" dnes již přesahuje rámec matematiky samotné. Přesné odvození této věty a charakterizace jejích důsledků přitom není součástí učitelského studia matematiky, neboť k tomu nemají vybudován dostatečný logický aparát. Forma zpracování této problematiky ve 4. kapitole by však měla čtenářům umožnit alespoň pochopení základních idejí Gôdelova důkazu.
4
5
Symbolika užívaná v textu je běžná a význam všech symbolů je v textu (respektive v připojeném dodatku) definován. Upozorněme pouze, že — na rozdíl od středoškolské praxe — rozlišujeme inkluzi Cac. Symbol A c B tak značí, že A je vlastní podmnožinou množiny B.
Běžné množiny čísel označujeme následovně: N... množina všech přirozených čísel Z ... množina všech celých čísel Q... množina všech racionálních čísel R... množina všech reálných čísel.
Kapitola 1
Formální výstavba matematiky
1   Axiomatická teorie a její model
Cítíte-li se skvěle, buďte bez, obav. To přejde. BOLINGŮV POSTULÁT.
S rychlým rozvojem matematiky — zejména pak matematické analýzy — vznikla v 19. století naléhavá potřeba řádné výstavby základů matematických teorií. Vhodnou základnou se stala teorie množin, kterou počal v 70. letech minulého století systematicky budovat německý matematik Georg Cantor. (Podrobně historii vzniku teorie množin popíšeme ve 4. kapitole.)
Základní množinové pojmy jsou natolik jednoduché, názorné a pro matematiku potřebné, že dnes už pronikly i do školské matematiky na té nejzákladnější úrovni. I malé děti snadno chápou „množiny" jako označení toho, co se v běžné řeči nazývá „soubor", „souhrn" a podobně a bez problémů zvládají základní množinovou algebru.
Na první pohled jistě není zřejmé, že by se v takto budované teorii mohly objevit těžkosti zásadního rázu. Velmi snadno však lze ukázat, že nelze beztrestně předpokládat, že každý souhrn nějakých objektů vytváří množinu. Stačí připustit, že existuje množina všech množin, které nejsou svým vlastním prvkem, tj. množina
A = {X; X je množina, X £ X}.
Z definice množiny A okamžitě vyplývá, že nemůže platit ani vztah A £ A (podle definice množiny A odtud totiž plyne A £ A), ani vztah A £ A (odtud zase naopak plyne A £ A, neboť právě z takových množin jsme množinu A vytvořili). V tomto okamžiku jsme se však ocitli v neřešitelné situaci, neboť z intuitivní představy množiny je okamžitě zřejmé, že pro
6
1. Axiomatická teorie a její model
7
každý objekt x a každou množinu A nutně platí právě jeden ze vztahů x e A, respektive x A. (I když samozřejmě nemusíme vždy vědět, která z těchto situací v daném případě nastává.)
Právě jsme zformulovali nejznámější z tzv. antinomií teorie množin, antinomii Russellovu. Antinomií, tj. tvrzení vedoucích ke sporu, se na přelomu 19. a 20. století objevila celá řada; podrobně o nich budeme hovořit v kapitole IV, §3. Jejich důsledky pro moderní matematiku byly dalekosáhlé, neboť přesvědčivě prokázaly, že celou matematiku je nutno budovat jinými metodami, když dosavadní postupy totálně selhaly. V teorii množin samotné pak antinomie ukázaly, že je neudržitelné Cantorovo původní stanovisko, že totiž množina je souhrn jakýchkoliv objektů, chápaných jakožto jeden celek. (Takto pojímané teorii se dnes říká naivní nebo intuitivní teorie množin.)
Nalezení východisek z této situace nebylo vůbec jednoduché a jak uvidíme, nebylo všeobecně přijaté řešení vlastně nalezeno dodnes. Nejobvyklejším způsobem výstavby matematických teorií je dnes axiomatická metoda.
Čtenář jistě dobře ví, v čem tato metoda spočívá. Každou matematickou teorii lze chápat jako systém nějakých tvrzení o objektech z určité oblasti. Například aritmetika je v tomto smyslu množinou výroků o číslech, geometrie množinou výroků o „vhodných" podmnožinách daného prostoru a podobně.
Je zřejmé, že při deduktivní výstavbě (a matematika je ve své podstatě nesporně deduktivní vědou) není možné každé tvrzení odvodit z tvrzení jednodušších a každý pojem definovat pomocí jednodušších pojmů. Proto je nutné o některých nedefinovaných pojmech, tzv. primitivních pojmech dané teorie, vyslovit tvrzení — axiómy, považované za pravdivé bez důkazu. Podle předem stanovených odvozovacích pravidel se pak z těchto tvrzení odvozují další.
V této kapitole se budeme zabývat formální stránkou takto budovaných matematických teorií.
V závěru tohoto paragrafu si však vyjasněme ještě jednu věc. Uvedli jsme, že Cantorova intuitivní teorie množin je ve světle antinomií neudržitelná. Přitom však i dnes učíme děti ve školách, že množina je totéž jako souhrn, systém, soubor a podobně. Znamená to tedy, že na školách vědomě učíme „špatnou" teorii?
Uvedli jsme, že při axiomatické výstavbě se o jistých nedefinovaných objektech (například v eukleidovské geometrii jsou to pojmy „bod", „přímka" atd.) vysloví nedokazovaná tvrzení (v eukleidovské geometrii je to 5 známých postulátů). Podle předem dohodnutých pravidel se pak na tomto základě deduktivně buduje celá teorie. Takto budovanou teorii (například geometrii) může chápat a rozumět jí každý, kdo užívá stejná odvozovací pravidla jako tvůrce dané teorie, i když si nedefinované pojmy může představovat zcela jinak (nebo šije eventuálně nepředstavuje vůbec). (Axiomatickou geometrii tedy může zvládnout i ten, kdo si vůbec nic konkrétního nedovede představit pod pojmy „bod", „přímka" apod.) Jakmile si takovou představu vytvoříme, jakmile si nedefinované pojmy nějak interpretujeme, vytváříme tím tzv. model
8
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
dané axiomatické teorie. I když je zřejmé, že tento model si nelze vytvořit zcela libovolně, je snad jasné, že obecně lze k dané teorii vytvořit modelů více.
V tomto smyslu se například učíme na školách pouze jeden z možných modelů eukleidovské geometrie. Je to ovšem model vytvořený tisíciletou zkušeností lidstva, model, který nejvěrněji odráží náš makrosvet. (Čtenář se však jistě setkal i s jinými modely, které jsou zvlášť výhodné při výkladu neeukleidovské geometrie.)
A jak je to tedy s teorií množin? Standardní model axiomatické teorie množin obdržíme tak, že si primitivní, tj. nedefinovaný pojem „množina" interpretujeme jakožto synonymum slova soubor. Intuitivní teorie množin — lépe řečeno její jistá modifikace — se tak stává modelem axiomatické teorie množin. (Později uvidíme, že ve školách učíme model tzv. teorie Zermelo-Fraenkelovy). V modelu dané teorie lze ovšem, na rozdíl od intuitivní teorie, provádět jen ty konstrukce a zavádět jen ty pojmy, které jsou odrazem konstrukcí a pojmů přípustných v axiomatické teorii.
Proto například nemůže být množinou jakýkoliv souhrn nějakých objektů (například souhrn všech množin) a proto nemůžeme dospět k antinomiím, které se objevily v Cantorově teorii.
2   Jazyk matematických teorií
Všechno lz,e udělat snáz,.
ILESŮV ZÁKON
Při popisu matematických jazyků záhy vypozorujeme řadu analogií s jazyky přirozenými (hovorovými). I s nematematiky se jistě shodneme na následujících skutečnostech:
(a) K popisu každého jazyka (češtiny, ruštiny, angličtiny apod.) se užívá jistých znaků, jejichž souhrn nazvěme abecedou.
(b) Z prvků této abecedy se tvoří větší celky, nazývané slova, respektive věty. Přitom jen některá formálně utvořená „slova" z daných znaků jsou slovy daného jazyka. Tak například slovo „vhpaimple" je sice utvořena ze znaků české abecedy, zcela jistě to však není české slovo, „window" sice není české slovo, ale je to slovo anglického jazyka a podobně.
(c) Jen některé v předcházejícím smyslu „správně" vytvořené věty mají smysl, respektive jsou pravdivé. Například „věta" „Jan a slunce včera prší" je gramaticky správně utvořena, jistě se však shodneme, že je to naprostý nesmysl. Věta „Molekula každého prvku je složena z pěti atomů" je utvořena gramaticky správně, je smysluplná, avšak každý, kdo má alespoň minimální znalosti chemie ví, že je nepravdivá.
Slova daného jazyka (ať přirozeného nebo matematického) můžeme posuzovat ze dvou hledisek. Studujeme-li jazyk, aniž přihlížíme k tomu, co jednotlivé znaky, slova atd. znamenají, studujeme-li tedy pouze zákonitost sdružování znaků, závislosti tvaru slov apod. na tvaru jejich
2. Jazyk matematických teorií
9
částí a podobně, říkáme, že jazyk studujeme z hlediska syntaktického. Jestliže nám jde o to, jaký je význam jednotlivých znaků, slov atd., studujeme jazyk z hlediska sémantického.
V této kapitole nám půjde téměř výhradně o studium matematických jazyků z hlediska syntaktického.
Konečně si ujasněme poslední věc, než budeme hovořit o matematických jazycích podrobněji. Zadáváme-li určitý jazyk S, užíváme při tvoření tohoto jazyka nějaký jiný jazyk, odlišný od S. Tento jazyk nazýváme metajazykem1 jazyka S. Prvky abecedy tohoto metajazyka nazýváme metaznaky, tuto abecedu nazýváme metaabecedou a podobně.
Konečně zdůrazněme, že hlavním cílem této kapitoly je popsat formalizaci matematických teorií, vyjasnit základní principy této formalizace a na některých příkladech ji ilustrovat, nikoliv provedení formální výstavby jako takové.
★ ★ ★
Symboly, které již nedělíme na symboly jednodušší, nazvěme znaky. Za znaky obvykle volíme písmena (latinská, řecká), číslice, závorky, čárky, ale často i jiné symboly, jako například U, n, v, A, +, V, 3 a podobně. Přitom předpokládáme, že poznáme, kdy jsou dva znaky totožné (kdy je například na dvou místech napsán stejný znak). Neobsahuje-li abeceda žádný znak, nazývá se prázdná. My však v dalším, kdykoliv řekneme abeceda, budeme mít na mysli abecedu neprázdnou.
Skupinám znaků napsaným zleva doprava budeme říkat slova (vytvořená v dané abecedě). Je-li například dána abeceda
a      b       *       A +
jsou slova například nápisy
*ab A A      nebo        * * + *b A a
nikoliv však nápis a * v b A Ac (symbol v nepatří do naší abecedy). Účelné je definovat tzv. prázdné slovo, které není tvořeno žádným znakem. Prázdné slovo je zřejmě slovem v každé abecedě. Za slovo považujeme také jednotlivé znaky.
Nyní je rovněž zřejmé, co rozumíme posloupností slov. Doplníme-li zvolenou abecedu o nový znak, který nazveme oddělujícím znakem, nazýváme každé slovo v této rozšířené abecedě posloupností slov v abecedě původní. Často oddělující znak nepíšeme a místo něho uděláme mezi slovy mezeru.
Abychom si nyní usnadnili popis studovaného jazyka, zvolíme si nějaké znaky, kterými budeme označovat slova vytvořená v naší abecedě. Čtenáři je jistě zřejmé, že to nemohou být
1Meta (z řečtiny), v složených slovech první část s významem „za", „po". Například metateorie je teorie zkoumající jinou teorii. Podrobně je studována zejména metamatematika.
10
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
znaky naší abecedy, ale že to budou metaznaky. Dohodněme se, že za metaznaky označující slova, zvolíme malá písmena řecké abecedy (eventuálně s indexy; tyto indexy však nepovažujeme za samostatný znak).
Označují-li a, p totéž slovo, napíšeme a ~ ji. Je-li například cp znak označující slovo *ba+, píšeme cp ~ *ba+. Prázdné slovo označíme symbolem co.
Jsou-li a, p dvě slova a napíšeme-li je bez oddělovacího znaku těsně za sebou, dostaneme opět slovo, které nazýváme slovem složeným ze slov a,p a značíme je or/J.
V dalším budeme běžně užívat řady zřejmých tvrzení následujícího typu, z nichž některá ani nebudeme výslovně formulovat.
2.1. Věta.
(a) Pro libovolné slovo cp platí cocp ~ <p, cpco ~ cp.
(b) Pro libovolná slova a, /3, y je slovo složené z,e slov afi, y totožné se slovem složeným z,e slov a, /3y (tj. skládám slov je asociativní).
2.2. Definice. Slovo a se nazývá podslovem slova fí, jestliže existují slova y, S taková, že ji ~ yaS.
2.3. Poznámka. ( Je zřejmé, že prázdné slovo je podslovem každého slova a každé slovo je podslovem sebe sama. (Stačí totiž, aby y ~ co, S ~ co v definici 2.2).
2.4. Příklad. Je-li 3098114 slovo v nějaké abecedě, jsou například 309, 811 nebo 4 jeho podslova, avšak slovo 814 není jeho podslovem.
Poněvadž znaky považujeme za slova, je zřejmá následující definice:
2.5. Definice. Řekneme, že znak £ se vyskytuje ve slově a (nebo že slovo a obsahuje znak £), je-li £ podslovem slova a.
I laik při pozorování matematikovy činnosti brzy postřehne, že matematik podle nějakých pravidel umí některá slova nahrazovat slovy jinými. Výuka počtů na základní škole například spočívá v tom, naučit děti nahrazovat slova utvořená v abecedě 0123456789 + x slovy jinými. (Slovo „4 + 17" nahradíme slovem „21", slovo „4 x 9" slovem „36" a podobně.)
Nyní si tento případ zobecníme.
Pojem funkce je nám znám. Je tedy zřejmé, že když udáme předpis, jak slova utvořená v dané abecedě nahrazujeme jednoznačně slovy jinými, zadáváme tím nějakou funkci na slovech této abecedy.
2. Jazyk matematických teorií
11
Je-li / taková funkce a a slovo, značí f (a) slovo, které funkce / přiřazuje slovu a. (f(a) musí být tedy určeno jednoznačně; je přitom zřejmé, že / je opět metaznak.)
Mezi funkcemi definovanými na slovech však mohou být podstatné rozdíly v tom, jak obtížné je nalézt k danému slovu slovo přiřazené. Dokumentujme to na následujících příkladech.
2.6. Příklad. Buď dána abeceda
123456789 + . Definujme na slovech této abecedy funkce /, g, h takto:
Bud'a slovo vytvořené v této abecedě. Nechť a ~ /? + y, kde /? ani y není prázdné a obě označují nějaké přirozené číslo. Pak je:
(a) f (a) slovo označující součet slov f), y (například f (2 + 3) ~ 5).
(b) g (a) slovo, které získáme takto: číslo jt umocníme na racionální exponent, jehož čitatelem je přirozené číslo označené slovem f), jmenovatelem číslo označené slovem y, v dekadickém rozvoji takto vzniklého čísla vezmeme cifru stojící na lO^-tém místě, kde k je přirozené číslo, které je součinem čísel označených slovy /? a y. Tato cifra je pak slovem, které označíme g (a). (Například g (2 + 3) je miliontá cifra dekadického rozvoje čísla Tt2/3.)
(c) h (a) je slovo, které označuje průměrnou teplotu v Praze ve °C zaokrouhlenou na celé stupně (p-tý den po 1. 1. 2100, kde cp ~ f (a.) (například h (2 + 3) je průměrná teplota ve °Cdne 6. 1.2100).
Není-li a slovo uvedeného tvaru, položme f (a) ~ co, g (a) ~ co, h (a) ~ co.
Je zřejmé, že funkce / a g se výrazně liší od funkce h. U funkcí /, g lze popsat návod, podle něhož zcela mechanicky dovede ke slovu a přiřadit slovo f (a) (alespoň teoreticky) i stroj. Takové funkce nazveme algoritmizovatelné. Funkce h však zcela prokazatelně algoritmizovatelná není.
I algoritmizovatelné funkce se však mohou podstatně lišit. Máme-li zadánu nějakou funkci a udáme-li stroji slovo a, vypočítá stroj příslušnou funkční hodnotu až po nějaké době. Čas, který stroj k výpočtu potřebuje, však nedovedeme vždycky předem odhadnout. U funkce / z příkladu 2.6 nám hodnotu f (a.) — alespoň v „běžných" případech — udává i kapesní kalkulačka prakticky okamžitě. Hodnotu g (a) by asi i ten nejvýkonnější počítač počítal obecně velmi dlouho. Je tedy jasný smysl následující definice2.
2Ani tato definice není zcela výstižná. Kdybychom u nějaké funkce sice potřebný čas uměli odhadnout, byl by však řádově v milionech roků — nebo snad ještě delší — vyhovovala by příslušná funkce právě vyslovené definici, evidentně by však nesplňovala požadavek jisté „jednoduchosti", kterou chceme touto definicí postihnout. Spíše než o „předem odhadnutelný" čas nám jde o výpočet v „rozumném" čase. Tento pojem je však nemožné precizovat. Čtenáři je současně jistě zřejmé, že právě definovaný pojem mechanické počitatelnosti se v čase výrazně mění.
12
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
2.7. Definice. Řekneme, že funkce / je mechanicky počitatelná, je-li algoritmizovatelná a obdržíme-li pro každé slovo a hodnotu f(a) v čase, který lze předem odhadnout.
Uveďme si nyní některé jednoduché mechanicky počitatelné funkce.
2.8. Definice. Buď£ nějaký znak. Definujme funkce /, g takto
f(a) = Ša, g(a)=aš. Funkci / nazýváme připsáním znaku £ zleva, funkci g připsáním znaku £ zprava.
2.9. Definice. Bud'a libovolný znak, /? libovolné slovo. Buď / funkce, splňující následující tři požadavky:
(i) pro každá dvě slova <p, xfr platí
f(<PÝ) ~ f(<p)M),
(ii) f (a) ~ p,
(iii) je-li £ znak, který není totožný se znakem a, je /(£) ~ £.
Pak se / nazývá substituce slova /? za znak a. Tuto substituci označíme symbolem
[a -> £].
Zcela analogický smysl má označení
[«i -> £i, ■ ■ ■, oí„ -> P„]. Rozumíme jím substituci slov    za znaky a,-, i = 1, ..., n (viz následující příklady).
2.10. Příklad. Zvolme abecedu jako v příkladu 2.6. Nechť / je substituce:
(a) [1 -> 04]
(b) [1 -> 2, 2 -> 3, + -> «]
(c) [+ -> 1, 0 -> 2, 9 -> +].
Pak / přiřazuje slovu „21 + 4890" slovo:
(a) 204 + 4890
(b) 324890
(c) 21148+ 2.
3. Výrokový kalkul
13
Prozatím jsme popisovali víceméně mechanicky práci se znaky. Dobře však víme, že v matematickém jazyce — stejně jako v jazycích přirozených — nepovažujeme za slovo každé seskupení znaků ze zvolené abecedy a slova neskládáme do posloupností zcela nahodile. Víme, že například při sčítání čísel uvažujeme slova typu „48 + 290" a nikoliv slova „+ + +01" nebo „28 + 42+" a podobně. Při odvozování nějakého vzorce nepíšeme za sebou slova namátkou, ale podle jistých předem stanovených pravidel.
Souhrnu pravidel, kterými se matematik řídí ve své činnosti, říkáme kalkul. Pojem kalkulu zde však nebudeme definovat. Je snad ale jasné, že kalkulů je celá řada; každá matematická teorie má svůj specifický kalkul. Prakticky všechny kalkuly však mají „něco" společného. V následujících dvou paragrafech budeme precizovat výrokový kalkul, který v intuitivním smyslu běžně užíváme.
3   Výrokový kalkul
Dobrý úsudek si vytvoříme díky špatné zkušenosti. Zkušenost nabudeme díky špatnému úsudku.
HlGDONŮV ZÁKON
3.1. Definice. Abeceda výrokového kalkuluje tvořena následujícími znaky:
1. Velkými písmeny latinské abecedy A, B, ..., X,Y, Z případně opatřenými indexy. Tyto znaky nazýváme výrokovými proměnnými (nebo též proměnnými pro výroky).
2. Znaky -■, v, A, =>•, <£> nazývanými logické spojky.
3. Znaky ( a ) (levá a pravá závorka).
3.2. Poznámka. Označíme-li proměnnou pro výroky symbolem A\, P3, Z10 a podobně, neznamená to, že naši abecedu de facto rozšiřujeme o znaky označující přirozená čísla. Na uvedené znaky, jednoduše řečeno, pohlížíme jako na jediný symbol.
Při počítání s výroky samozřejmě nebereme v úvahu všechna slova, která lze v dané abecedě vytvořit. Za správně utvořené slovo jistě nepovažujeme slovo A—> v B nebo (A)->(Z?) v (C-1). Na první pohled ovšem není jasné, jak popsat ta slova, která ve výrokovém kalkulu budeme považovat za správně utvořená. Správná slova, která popíšeme následující definicí, budeme nazývat výrokové formule nebo stručně jen formule, pokud nebude moci dojít k nedorozumění. (Ve shodě s §2 budeme k označování formulí a obecně slov v abecedě výrokového kalkulu užívat metaznaků a, fi, y, ..., eventuálně s indexy.)
14
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
3.3. Definice.
(1) Každá výroková proměnná je výrokovou formulí.
(2) Jsou-li <p, xfr výrokové formule, je každé ze slov —>(<p), (<p) v (xfr), (<p) A (xfr), (<p) =>• (ý), (p) <^> (xfr) výrokovou formulí.
(3) Žádné slovo, které nelze získat pomocí (1) a (2) není výrokovou formulí.
3.4. Poznámka. Definice 3.3 samozřejmě není a nemůže být výčtem všech výrokových formulí, neboť těch je evidentně nekonečně mnoho. Definice je pouze rekurentním návodem ke tvorbě výrokových formulí. Ukažme alespoň na několika příkladech, jak lze podle definice 3.3 konstruovat komplikovanější formule a jak poznáme, zda zadané slovo je nebo není výrokovou formulí.
Jsou-li například A, B, C, D výrokové proměnné, jsou podle (2) slova
(A)^(B), (C)v(-(D)) výrokovými formulemi. Opět podle (2) jsou pak výrokovými formulemi i slova
(-((A) =» (5))) 4» (D),       (A) A ((C) v (-(£>))), takže je výrokovou formulí i slovo
((-((A) =» (5))) 4» (£>)) =» ((A) A ((C) v (-(£>)))) (*)
atd.
Je vidět, že definice 3.3 nám umožňuje vytvářet dostatečně komplikované formule. Zcela analogicky postupujeme, když chceme zjistit, zdaje dané slovo výrokovou formulí. Nechť například je
<p ~ (-(-(A))) =» ((-(B) v (C)) 4» ((£>) v (-(A)))).
Zjišťujeme, zda <p je formule.
K tomu, aby <p byla formule, je podle 3.3 nutné, aby slova
-(-(A))   a   (-(B) v (C))     ((D) v (-(A))) byla formulemi. Aby druhé z těchto slov bylo formulí, je nutné, aby byla formulemi slova
-(B)v(C)      a (D)v(-(A)).
3. Výrokový kalkul
15
Nyní již vidíme, že (p není formule, neboť —•(B) v (C) není formule. V tomto slovu totiž chybí jedny závorky; správně by měla vypadat takto:
(-(B))v(C)   nebo   -((B) v (C)).
Podle definice 3.3 tedy poznáme, zda dané slovo je nebo není formulí a současně nám tato definice umožňuje z jednodušších formulí vytvářet formule složitější. (Později uvidíme, že dovedeme v jistém slova smyslu sestavit libovolně komplikovanou formuli - viz větu 3.19.)
I z několika mála dosud uvedených formulí je však zřejmé, že zápisy výrokových formulí jsou leckdy příliš komplikované, zejména pokud jde o užívání závorek. Například slova —>AvB, respektive A A B nejsou podle definice 3.3 formule, i když je nám naprosto zřejmé, jaký smysl těmto slovům přikládáme. Proto uzavřeme následující dohodu, která nám umožní zjednodušení zápisů výrokových formulí.
3.5. Úmluva. Zápisy výrokových formulí lze zjednodušit pomocí následujících tří pravidel. Jejich dodržování však nebudeme striktně vyžadovat, budeme se řídit tím, jaký z povolených zápisů bude v dané situaci nejúčelnější.
1. Je-li podslovem slova <p slovo (xfr), kde xfr je libovolná výroková proměnná, budeme místo (xfr) psát pouze znak xfr.
2. U logických spojek stanovíme následující pořadí „předností":
(a) znak -■ má přednost před všemi ostatními logickými spojkami;
(b) znaky A, v jsou rovnocenné a mají přednost před rovnocennými znaky =>•,
Závorky, které nám zajišťují realizaci uvedených předností, při psaní formulí vynecháme.
3. Při kumulaci většího počtu závorek užijeme i závorek hranatých [, ], resp. složených {,}, které však nezmění význam formule.
3.6. Příklad.
(a) Slovo ((A) v (B)) =>• (C) lze podle (1) zapsat ve tvaru (A v B) =>• C. Podle (2) lze toto slovo ještě zjednodušit na tvar AvB=^C.
(b) Slovo
HA))v^(-((C)a(D)))J lze podle (1) a (2) zjednodušit takto:
-A v     (C A D).
16
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
Podle (4) však můžeme totéž slovo napsat také například takto:
-■A v-.(-.(cad))
-(-(cad))].
nebo
(-A) v
(c) Formuli (★) v poznámce 3.4 lze přepsat takto:
[(-A 4B)^/)]4[Aa(Cv -.d)].
Při konstrukci výrokových formulí lze s výhodou často využívat následujícího tvrzení, které vyplývá bezprostředně z definice výrokové formule.
3.7. Věta. Buďte a, p výrokové formule, £ libovolná výroková proménná. Buď f substituce [£ -> /?]. Pak je f (a) výroková formule. (Tz,n., ž,e když, ve výrokové formuli nahradíme proměnnou formulí, dostaneme opět formuli).
3.8. Příklad. Buď / substituce [A -> -(5 v c)     D a c] a
í>~A=).(Sa -c) v (-.A a 5). Pak je (p zřejmě formule a podle 3.7 je výrokovou formulí slovo
(-(5 v c) =^ D a c) =^ j (5 a -.c) v -(-(5 v c) =^ d a c) a B
Ve výrokovém kalkulu nám ovšem nejde o to, psát výrokové formule nebo zjišťovat, zda dané slovo je výrokovou formulí. Dobře víme, co rozumíme výrokem; smyslem námi popisovaných výrokových formulí je to, že pokud výrokové proměnné chápeme jako označení pro výroky, pak jsou výrokové formule rovněž zápisy (složených) výroků. Víme také, že charakteristickou vlastností výroků je jejich pravdivost, respektive nepravdivost. Hlavním cílem výrokového kalkulu je právě studium toho, jak pravdivost či nepravdivost složeného výroku závisí na pravdivosti či nepravdivosti výroků, z nichž byl tento výrok pomocí logických spojek utvořen3.
3 V této chvíli je čtenáři jistě zcela zřejmý rozdíl mezi sémantickým přístupem k výstavbě výrokového kalkulu, jak ho zná například ze střední školy, a syntaktickým přístupem, který demonstrujeme nyní. Při středoškolské výuce se nejdříve zavede, či — lépe řečeno — vysvětlí pojem výrok jako označení pro tvrzení, o němž má smysl prohlásit, že je pravdivé, respektive nepravdivé a pak se intuitivně budují další potřebné pojmy. Při syntaktické výstavbě se pojem výrok vůbec nedefinuje, je to primitivní pojem. Zato jsme však přesně popsali, jak vypadají formule, což při sémantické výstavbě pouze mimochodem vyplývá z toho, jak zavádíme formální označení. Při sémantické výstavbě je tedy pravdivost či nepravdivost výroku zabudována přímo v jeho „definici", my však tímto atributem musíme výrokový kalkul teprve opatřit.
3. Výrokový kalkul
17
Výrokový kalkul nám neumožní zjistit, zda jednoduché tvrzení nějaké teorie je pravdivé či nikoli; to jsme nuceni zjišťovat jiným způsobem. (Pomocí výrokového kalkulu například nejsme schopni zjistit, zda je pravdivé tvrzení „213 — 1 je prvočíslo"; že je toto tvrzení pravdivé, je možno dokázat v teorii čísel.) Výrokový kalkul nám jen upřesní, jak správně tvořit z výroků jednodušších výroky složitější a jak pravdivost těchto složitějších výroků závisí na pravdivosti příslušných výroků jednodušších. (Z výrokového kalkulu lze například zjistit, kdy je pravdivé tvrzení: „Je-li 213 — 1 prvočíslo, je také 217 — 1 prvočíslo".)
Výrokový kalkul je tedy natolik obecný, že nepostačuje k vytvoření speciálních matematických teorií. Na druhé straně je ovšem natolik univerzální, že je součástí prakticky každého matematického jazyka. Proto věnujeme výrokovému kalkulu takovou pozornost.
3.9. Definice. Rozšiřme abecedu výrokového kalkulu o znaky 0, 1. Buď p funkce na slovech utvořených v této rozšířené abecedě taková, že platí:
(1) není-li slovo <p výrokovou formulí ve smyslu definice 3.3, je p(<p) ~ co (prázdné slovo);
(2) je-li slovo (p výrokovou formulí, je p(<p) ~ 0 nebo p(<p) ~ 1;
(3) jsou-li <p,ý libovolné výrokové proměnné, pak jsou hodnoty p(—><p), p(<p v xjr), p(<p A A xfr), p(<p =>• ý), p(<p O Ý) zadány následující tabulkou.
p(<p)	p(f)	p(^<p)	p((p A xfr)	p((p v xfr)	P(<P =>■ f)	p(<p o f)
1	1	0	1	1	1	1
1	0	0	0	1	0	0
0	1	1	0	1	1	0
0	0	1	0	0	1	1
Pak se funkce p nazývá pravdivostní hodnota a hodnota p(cp) se nazývá pravdivostní hodnota slova (p. Je-li p ((p) ~ 1, říkáme, že výrok označený formulí (p je pravdivý (nebo stručně výrok (p je pravdivý), je-li p(cp) ~ 0, říkáme, že výrok označený formulí (p je nepravdivý (nebo stručně výrok (p je nepravdivý).
3.10. Poznámka.
(a) Podmínky (1) a (2) nám zaručují, že funkce p přiřadí hodnotu 0 nebo 1 jen výrokovým formulím. Uvědomme si přitom, že žádná výroková formule neobsahuje znak 0 ani znak 1. Z podmínky (2) současně plyne, že každé výrokové proměnné je přiřazena hodnota 0 nebo 1.
(b) Funkce p není mechanicky počitatelná, dokonce ani algoritmizovatelná, neboť pro výrokovou proměnnou <p nemůžeme čistě syntakticky určit, zdaje p(<p) ~ 0 nebo p((p) ~ 1.
18
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
p{A)	p{B)	P(C)	p{D)		p(a)	P(P)	p(-D)	p(y)	P(S)	p(<p)
1	1	1	1	0	1	1	0	1	1	1
1	1	1	0	0	1	0	1	1	1	1
1	1	0	1	0	1	1	0	0	0	0
1	0	1	1	0	1	1	0	1	1	1
0	1	1	1	1	1	1	0	1	0	0
1	1	0	0	0	1	0	1	1	1	1
1	0	1	0	0	1	0	1	1	1	1
1	0	0	1	0	1	1	0	0	0	0
0	1	1	0	1	1	0	1	1	0	1
0	1	0	1	1	1	1	0	0	0	0
0	0	1	1	1		0	0	1	0	1
1	0	0	0	0	1	0	1	1	1	1
0	1	0	0	1	1	0	1	1	0	1
0	0	1	0	1	0	1	1	1	0	0
0	0	0	1	1	0	0	0	0	0	1
0	0	0	0	1	0	1	1	1	0	0
Tabulka 1.1:
(c) Podmínka (3) v definici 3.9 nám zaručuje, že logické spojky ve výrokovém kalkulu mají běžný4 význam.
(d) Z definic 3.3 a 3.9 plyne, že když <p je libovolná výroková formule, lze určit hodnotu p((p) zcela mechanicky, pokud j sou určeny pravdivostní hodnoty p(a) všech výrokových proměnných a, které slovo <p obsahuje.
3.11. Příklad. Určeme pravdivostní hodnotu formule
q> ~ [(--A =» B)     D] =» [A A (C v ->D)]
z příkladu 3.6(c).
Označme pro jednoduchost a ~ —'A =^ 5, ~ cc Z), y ~ C v —•D, S ~ A A y. Pak je (p ~ y6 =3- S. Hodnoty p(<p) jsou uvedeny v tabulce 1.1:
Slovem „běžný" samozřejmě rozumíme běžný v matematice. Dobře víme, že tyto spojky, byť jsou do matematiky přeneseny z hovorového jazyka, mají v matematice přece jen význam odlišný. Vzhledem k tomu je proto zásadně nevhodné při výuce těchto partií demonstrovat smysl logických spojek na příkladech ze života.
3. Výrokový kalkul
19
3.12. Příklad. Určíme pravdivostní hodnotu formule
p ~ (/>=>. e)^-(pa-e).
(Viz tabulku 1.2)
p(p)	p(Q)	p(-Q)	p(PA^Q)	a-g))	pop =» Ô)	p(<p)
1	1	0	0	1	1	1
1	0	1	1	0	0	1
0	1	0	0	1	1	1
0	0	1	0	1	1	1
Tabulka 1.2:
Mezi formulemi, jejichž pravdivostní hodnoty jsme zjišťovali v příkladech 3.11a 3.12, je na první pohled zřejmý jeden rozdíl. Zatím co pro formuli z příkladu 3.11 je někdy p(<p) ~ 0 a někdy p(93) ~ 1, je výrok označený formulí <p z příkladu 3.12 vždycky pravdivý. Uvidíme, že takové výroky budou hrát v dalších úvahách důležitou roli.
3.13. Definice. Výroková formule (p se nazývá tautologie, jestliže p(cp) ~ 1 při jakékoliv volbě pravdivostních hodnot výrokových proměnných, které se vyskytují ve formuli <p.
Tzn., že formule (p z příkladu 3.11 není tautologií, formule z příkladu 3.12 je tautologií.
Tautologií výrokového počtu je nekonečně mnoho. My zde uvedeme jen nejběžnější. Ještě před tím si však uveďme jedno tvrzení, které nám umožňuje z jakékoliv tautologie vytvářet řadu dalších tautologií.
3.14. Věta. Buď f libovolná substituce výrokových formulí za výrokové proměnné. Je-li (p libovolná tautologie, je f (cp) rovněž, tautologie.
Důkaz. Je-li / substituce a <p tautologie, je podle věty 3.7 f(<p) výroková formule. Zeje však f((p) tautologie, je okamžitě zřejmé. • Nyní tedy uveďme přehled nejznámějších tautologií výrokového počtu, nazývaných též zákony výrokového počtu. Důkaz tvrzení, že všechny uvedené formule jsou tautologiemi, přenecháme čtenáři.
3.15. Věta.  Všechny formule (1) až (15) jsou tautologiemi výrokového počtu:
20
I. FORMÁLNI VÝSTAVBA MATEMATIKY
(1)
(2)
(3)
(4)
(5)
->(p a -<P)
p v -p P O P — p 4» P (-./> =>. p) =>. p (p =>. -,/>) =>. ^p
(p a p) 4» p; (p v p) 4» p
[(p g) a (g =» i?)] ^ (p ^ i?) [(p 4» g) a (g 4» i?)] ^ (p ^;?) (p a-p) =» e
(p a Q) =» p
-(p a g) 4» (-p v-j3) -(p v g) 4» (-p a-j3)
[(P ^Q)^P]^P P^lQ^(P^Q)]
(zákon vyloučeného třetího)
(zákon totožnosti)
(zákon dvojí negace)
(zákon Claviův, též, reductio ad
absurdum )
(6)
(7)
(8)
(9)
(10)
(H)
(12)
(13)
(14)
(15)
(zákon hypotetického sylogismu)
(zákon Dunse Scota)
(de Morganovo pravidlo) (de Morganovo pravidlo) (Peirceův zákon)
V poznámce 3.10(d) jsme uvedli, že pro libovolnou výrokovou formuli lze mechanicky sestrojit tabulku pravdivostních hodnot této formule, tj. tabulku, která udává závislost hodnoty p((p) na hodnotách p (a) výrokových proměnných, které se ve formuli <p vyskytují.
Nyní se pokusme zodpovědět opačnou otázku, zda k předem zadané tabulce pravdivostních hodnot lze sestrojit výrokovou formuli, jejíž tabulka pravdivostních hodnot je totožná s touto předem zvolenou tabulkou. Přesně si tento problém zformulujeme následovně.
3.16. Problém. Buď n přirozené číslo. Pak existuje 2" navzájem různých w-členných posloupností utvořených z nul a jedniček. Uspořádejme všechny tyto posloupnosti do tabulky o 2" řádcích a n sloupcích a přidejme k takto vzniklé tabulce ještě jeden sloupec utvořený z nul a jedniček. Znak stojící v průsečíku i-tého řádku a y-tého sloupce označme cr,j. (Je tedy cŕ,j ~ 0 nebo cŕ,j ~ 1 pro i = 1, 2, ..., 2" a j = 1, ..., n + 1).
Nyní chceme zjistit, zda:
(1) existuje výroková formule <p, v níž se vyskytuje právě n výrokových proměnných A\, ..., A„ taková, že pro každé i = 1,2, ... ,2" platí: je-li p(Aj) = a.ij pro j = 1, ..., n, pak
(2) v případě, že taková formule <p existuje, je určena jednoznačně.
3.17. Příklad. Pro n = 1 je situace jednoduchá, neboť výchozí tabulku je možno zadat pouze čtyřmi způsoby:
Je však evidentní, že lze volit například v případě (a) formuli <p ~ A v -> A, v případě (b) formuli (p ~ A, v případě (c) formuli <p ~ —'A a v případě (d) formuli <p ~ A a —>A. V každém z těchto čtyř případů však bez obtíží lze zkonstruovat i jiné výrokové formule se stejnou pravdivostní tabulkou, například takto:
3. Výrokový kalkul
21
A	<P
1	1
0	1
A 1	<P 1
0	0
A	<P
1	0
0	1
A	<P
1	0
0	0
(a)
(b)
(c)
(d)
Tabulka 1.3:
A	B	<Pi	<P2	<P3	<P4	<P5	<P6	<P7	<P8
1	1	1	1	1	1	0	1	1	1
1	0	1	1	1	0	1	1	0	0
0	1	1	1	0	1	1	0	1	0
0	0	1	0	1	1	1	0	0	1
A	B	<P9	<PlO	<Pn	<Pl2	<Pl3	<Pl4	<Pl5	<Pl6
1	1	0	0	0	1	0	0	0	0
1	0	1	1	0	0	1	0	0	0
0	1	1	0	1	0	0	1	0	0
0	0	0	1	1	0	0	0	1	0
Tabulka 1.4:
(a) 93 ~ ->(A A ->A)
(b) 93 ~ -1-1A
(c) 93 ~ A =3- ->A
(d) 93 ~ -.(-.--A 4» A).
Dokázali jsme tak, že v případě w = 1 je odpověď na problém 3.16 (1) kladná, na problém 3.16(2) záporná.
3.18. Příklad. Buďra = 2. Pak lze tabulku podle 3.16 sestavit celkem 16 způsoby, které jsou souhrnně uvedeny v tabulce 1.4.
Porovnáním s tabulkou v definici 3.9 je okamžitě vidět, které sloupce v tabulce 1.4 odpovídají tabulkám logických spojek. Zřejmě lze volit (P2 ~ A v B, 934 ~ A =3- B, <p% ~ A <£> B, (P12 ~ A A B.
Evidentní je však skutečnost, že lze velmi jednoduše zkonstruovat výrokovou formuli s požadovanou vlastností v každém ze zbývajících dvanácti případů. Za <p\ lze například zvolit libovolnou tautologii ve dvou proměnných (například formuli (7), (10), (11), (12), (13), (14) ve
22
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
větě 3.15), za q)\^ negaci libovolné z těchto tautologií. Určit zbývající formule je jednoduchým cvičením pro čtenáře. Mechanický návod pro jejich konstrukci však plyne z důkazu věty 3.19.
3.19. Věta. Buďn libovolné přirozené číslo. Pak lz.e v každém případě zkonstruovat výrokovou formuli s vlastnostmi požadovanými v problému 3.16(1), přičemž, tato výroková formule není určena jednoznačně.
Důkaz provedeme indukcí vzhledem k počtu výrokových proměnných, které se v hledané výrokové formuli vyskytují.
Pro n = 1 jsme tvrzení dokázali v příkladu 3.17. K důkazu dalšího indukčního kroku využijeme výrokové formule
T ~ (-.A A B) V (A A C) . Sestrojme tabulku pravdivostních hodnot formule r :
p{A)	p{B)	P(C)	p(->A A B)	p(A A C)	P(r)
1	1	1	0	1	1
1	1	0	0	0	0
1	0	1	0	1	1
0	1	1	1	0	1
1	0	0	0	0	0
0	1	0	1	0	1
0	0	1	0	0	0
0	0	0	0	0	0
Tabulka 1.5:
Z tabulky 1.5 je ihned vidět, že platí následující tvrzení.
Lemma. Je-li p (A) ~ 1, je p{x) ~ p(C), je-li p (A) ~ 0, je p{x) ~ p{B).
Předpokládejme nyní, že pro přirozené n je věta 3.19 dokázána. Dokážeme, že tvrzení platí i pro n + 1. Nechť tedy je zadána tabulka o 2"+1 řádcích a n + 2 sloupcích. Rozdělme nyní tuto tabulku na dvě části následovně: vyškrtněme z tabulky předposlední sloupec (odpovídající pravdivostním hodnotám p(An+\)) a do první části zařaďme ty řádky, v nichž je ve vyškrtnutém sloupci 0, do druhé části zařaďme zbývající řádky. Každá část je nyní tabulkou pravdivostních hodnot nějaké výrokové formule, v níž se vyskytují pouze výrokové proměnné A\, ..., A„. Podle předpokladu však dovedeme zkonstruovat výrokové formule <p\, <p2 tak, že první část naší tabulky je tabulkou pravdivostních hodnot formule <p\ a druhá část tabulkou pravdivostních hodnot formule q>2.
3. Výrokový kalkul
23
Definujme nyní
(p ~ (->A„+1 A (pi) V (An+Í A <p2). Výroková formule <p vznikla z formule r substitucí
[A -> A„+1, B -> (pi,C -> (pi]-
Z lemmatu však nyní plyne:
Je-li p(A„+1) ~ 0,je p((p) ~ p(íOi), je-li p(a„+1) ~ l,je ~ p((p2), takže naše tabulka je skutečně tabulkou pravdivostních hodnot výrokové formule <p.
Dokázali jsme tedy, že pro každé přirozené n lze mechanicky zkonstruovat k předem zadané tabulce pravdivostních hodnot příslušnou výrokovou formuli. Nejednoznačnost této konstrukce plyne z toho, že již pro n = 1 lze ke každé tabulce pravdivostních hodnot najít více výrokových formulí (viz příklad 3.17). Tím je věta dokázána. •
3.20. Příklad. Zkonstruujme formule (p3 a <pu z příkladu 3.18. (a) Tabulku pro p((fh) si zapišme následovně:
p(A)	p(B)	P(<P3)
1	0	1
0	0	1
1	1	1
0	1	0
Tabulka 1.6:
Nyní vyškrtneme sloupec p(B) a zbývající sloupce rozdělíme do dvou tabulek takto:
1	1
0	1
1	1
0	0
první část
druhá část
Tabulka 1.7:
K těmto pravdivostním tabulkám však dovedeme zkonstruovat příslušné výrokové formule podle 3.17 například takto:
<Pi ~ A v —>A,       (p2 ~ A.
Podle důkazu věty 3.19 je nyní
<p3 ~ [-5 A (A v -A)] v (B A A).
24
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
Podle příkladu 3.17 však lze k tabulkám 8 zvolit formule cpi,cp2Í takto:
<P\ ~ —•(A A —•A),       (p2 ~ —•—•A
a pak lze (ps přepsat do tvaru
<p3 ~ [-.fi A -.(A A -A)] v (B A -—A), (b) Pravdivostní tabulku pro 9314 rozdělíme na dvě části takto:
1	1
0	1
1	1
0	0
první část druhá část
Tabulka 1.8:
Podle příkladu 3.17 lze nyní volit
(pi ~ A A —>A,       (f2 ~ —A,
takže
<p14 ~ [-5 A (A A -A)] v (B A -A). Zvolíme-li však (opět podle příkladu 3.17)
n(-.-.A 4» A),       <p2 ~ A -"A,
dostaneme
<Pl4
[-5 A -(—A 4» A)] v [fi A (A 4 -A)].
3.21. Poznámka. Z věty 3.19 plyne, že logické spojky -■, v, A, =>•, <£> nám umožňují zkonstruovat libovolně komplikované výrokové formule. Nevyřešena je prozatím otázka, zda není možné vybudovat výrokový kalkul s menším počtem logických spojek; toho by bylo možno dosáhnout jednak vypuštěním některé z pěti uvedených spojek (dobře víme, že to fakticky možné je, neboť například spojku <£> lze vyjádřit pomocí spojek =>•, A), jednak zavedením nových spojek, které by eventuálně mohly být při tvorbě výrokového kalkulu výhodnější.
K tomuto účelu je vhodné zavést pojem logické ekvivalence výrokových formulí, jehož užitečnost vyplývá bezprostředně z věty 3.19, podle které ke každé tabulce pravdivostních hodnot existuje více výrokových formulí.
3. Výrokový kalkul
25
3.22. Definice. Řekneme, že výrokové formule <p, xjr jsou logicky ekvivalentní, když platí:
(a) Každá výroková proměnná, která se vyskytuje ve <p, se vyskytuje ivýa každá výroková proměnná, která se vyskytuje v xfr, se vyskytuje i ve <p.
(b) Zadáme-li libovolně pravdivostní hodnoty všech výrokových proměnných, které se ve formulích <p, xfr vyskytují, platí p((p) ~ p(ý).
Jsou-li formule <p, xfr logicky ekvivalentní, píšeme <p = xfr (= je zřejmě metaznak).
3.23. Poznámka.    (a) Zřejmě tedy <p = xjr platí právě tehdy, když mají formule <p, xjr stejnou tabulku pravdivostních hodnot.
(b) Zřejmě je <p = xjr právě tehdy, když formule <p <£> xjr je tautologie.
Přímo z definice 3.22 plyne
3.24. Věta. Buďte a, /3, y libovolné výrokové formule. Pak platí:
(i) a = a,
(ii) je-li a = /3, pak je p = a,
(iii) je-li a = p a p = y, pak je a = y.
Nyní si ukážeme, že místo pěti logických spojek -■, v, A, =>•, vystačíme pouze s vhodnými dvojicemi.
3.25. Veta. Buď(p libovolná výroková formule. Pak existují formule a, /3, y takové, ž.e cp = = a = p = y a přitom platí:
(a) ve formuli a se nevyskytují jiné logické spojky než. A, —> ;
(b) ve formuli p se nevyskytují jiné logické spojky než. V, —> ;
(c) ve formuli y se nevyskytují jiné logické spojky než. =>•,—>.
Důkaz této věty nebudeme podrobně provádět. (Je například v [3]). Ukážeme si pouze, jak lze nalézt například formuli a. V následující definici zadáme rekurentně mechanicky počitatelnou funkci h na slovech výrokového kalkulu, která nám umožní k libovolné výrokové formuli najít logicky ekvivalentní výrokovou formuli, v níž se nevyskytují jiné logické spojky než A a ->. •
26
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
3.26. Definice. Funkci h na slovech výrokového kalkulu definujeme takto: není-li slovo (p výrokovou formulí, klademe h(<p) ~ co (prázdné slovo). Jsou-li <p, xjr libovolné výrokové formule, klademe:
(i) h((p) ~ (p, je-li (p výroková proměnná;
(ii) h(—•%>) ~ —>h(<p);
(iii) h((p A xfr) ~ Mí0) a h(x[r);
(ÍV) /l(<£ v l/f) ~ —■[—'Ä(^)) a —■A(^r)];
(v) /l(<p =>• i/f) ~ ->[A(^) a —■A(^t)];
(vi) h((p ^ xjr) ^ ->[&(?>) a -■/i(Vf)] a -^\h(xjr) a -1/1(93)].
3.27. Poznámka. Z definice výrokové formule plyne, že definice 3.26 nám vskutku umožňuje převést libovolnou výrokovou formuli postupně na tvar, v němž se nevyskytují znaky v, =>• a
Přitom je opravdu zřejmé, že funkce h je mechanicky počitatelná.
Nyní bychom, přesně vzato, měli dokázat, že formule, kterou obdržíme postupným užitím definice 3.26, je logicky ekvivalentní s výchozí výrokovou formulí. Důkaz však ponecháme čtenáři. (Je vcelku zřejmé, že podmínky (i) - (iii) zajišťují, že funkce h nemění formuli, která je již napsána ve vhodném tvaru a podmínky (iv) - (vi) využívají vhodných elementárních tautologií. Tak například (iv) zřejmě využívá de Morganova pravidla.)
3.28. Příklad. Najděte k formuli <p z příkladu 3.11 logicky ekvivalentní formuli, v níž se nevyskytují znaky v, =>•,
h(^A     B) ~ -.[A(-.A) a ->h(B)] ~ -(-A a -5) h(C v -£>) ~ ->[->h(C) a -.A(-.D)] ~ -.(-.C a — D) h[A a (C v ->D)] ~ /i(A) a h(C v -D) ~ A a -(-C a — D) h[(->A     B) 4» D] ~ -.[ä(-.A =^ 5) a -■A(D)] a -■[ä(D) a -/i(-A =^ 5)] ~ ~ -[-(-A a -5) a -.D] a -.[D a —(-A a -5)]
/i(<p) ~ -í/i[(-A =^ B) 4» D] a -.ä[A a (C v -■£>)]} ~
~ -.] -.[-.(-.A a -5) a -.D] a -.[D a —(-A a -5)] a -[A a -.(-.C a -.-.D)
Je tedy
p ~ [(-A =» 5) 4» D] =» [A a (C v -"£>)].
Pak:
3. Výrokový kalkul
27
3.30. Definice. Definujme logické spojky,, |" a „\." následujícími tabulkami pravdivostních hodnot:
p(<p)	p(f)	P(<P\Ý)	p(<p i f)
1	1	0	0
1	0	1	0
0	1	1	0
0	0	1	1
Tabulka 1.9:
(Spojka | se nazývá Shefferova).
3.29. Poznámka. Z věty 3.25 tedy plyne, že výrokový kalkul lze vybudovat pomocí tří různých dvojic logických spojek. Již v 3.21 jsme se však zmínili, že je otázkou, zda nelze najít jiné logické spojky, které by byly „efektivnější", než jsou logické spojky běžně užívané. Ukážeme, že to opravdu možné je. Uvedeme dvě logické spojky, z nichž každá sama o sobě nám umožňuje vybudovat výrokový kalkul.
3.31. Věta. Buďte A, B libovolné výrokové proměnné. Pak platí:
(1) A\B = ->(A A B)
(2) A|A = -A
(3) A\B = ->A v ->B
(4) A ; B = -(A v B)
(5) A \, B = —>A A —>B
Důkaz je triviální a přenecháme jej čtenáři. •
Z vět 3.25 a 3.31 plyne
3.32. Důsledek. Buď(p libovolná formule výrokového kalkulu. Pak existují formule a, p takové, Že (p = a = p a formule a neobsahuje jinou logickou spojku než. \ a formule p jinou logickou spojku než. \.
28
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
4   Predikátový kalkul
Některé věci nelze vědět — nevíme však, o které věci jde.
Jaffova poučka
Výrokový kalkul, který jsme podrobně probrali v §3, zkoumá závislost pravdivosti složených výroků na pravdivosti či nepravdivosti jednodušších výroků, z nichž je složen.
Uvedli jsme však již, že v jeho obecnosti je současně i jeho omezení. Pravidly výrokového kalkulu by se měly řídit úvahy v matematice stejně jako v biologii, v lingvistice stejně jako v meteorologii.
Výrokový kalkul je však v jistém slova smyslu jen prvním přiblížením k našemu cíli, tj. k popisu formalizace matematických teorií. Víme již, že výrokový kalkul nám vůbec neumožňuje rozhodovat, zda jednoduché — atomární — výroky dané teorie jsou pravdivé či nikoliv, ani nám neumožňuje rozhodnout, které formule v dané teorii jsou správně utvořené a podobně.
V tomto paragrafu nám půjde pouze o syntaktický popis studované problematiky. Na rozdíl od výrokového kalkulu nám však predikátový kalkul umožní i syntaktický popis atomárních výroků.
Víme již, že různé matematické teorie mají navzájem odlišné jazyky, užívají různých symbolů, tvoří se v nich formule odlišnými způsoby. Přesto však mají mnoho věcí společných. A právě tento „společný základ" nyní popíšeme.
V jistém slova smyslu budeme postupovat obdobně jako v §3. Nejprve popíšeme abecedu, pak určíme, která slova v této abecedě budeme považovat za správně utvořená (ta budeme nazývat predikátové formule), budeme definovat tautologie predikátového kalkulu a podobně.
Nejprve tedy k abecedě predikátového kalkulu. Vzhledem k tomu, že již budeme studovat i syntaktickou strukturu atomárních výroků, musí naše abeceda nutně obsahovat znaky, které jsou specifické pro danou teorii (například v teorii množin je to znak e, v aritmetice znaky +, < apod.). Kromě logických spojek je do naší abecedy nutno zařadit i znaky V a 3 (kvantifikátory). Samozřejmě abecedu vytvoříme tak, aby neobsahovala metaznaky, jichž budeme užívat analogicky jako v §§2 - 3.
4.1. Definice. Abeceda predikátového kalkuluje, tvořena následujícími znaky:
1. Znaky pro proměnné pro objekty (obvykle jsou to písmena latinské abecedy, případně s indexy).
2. Znaky —■, V, A, =>•, •£>•, V, 3 pro logické spojky a kvantifikátory.
3. Specifické znaky pro popisovanou teorii (například v teorii množin znak e).
4. Závorky ( a ).
4. Predikátový kalkul
29
4.2. Poznámka. V tomto paragrafu budeme proměnné pro objekty označovat malými písmeny a, b, c, ..., x, y, z atd. Velká písmena si prozatím rezervujeme pro výrokové proměnné, které budeme ještě potřebovat k zápisu výrokových formulí. O užití indexů v naší abecedě platí totéž, co jsme již uvedli v poznámce 3.2.
4.3. Definice. Řekneme, že proměnná x je vázána ve slově <p, je-li slovo Vx nebo slovo 3x podslovem slova <p.
Každá proměnná, která ve slově <p není vázána, se nazývá volná proměnná ve slově <p. Proměnná, která se ve slově <p vyskytuje a je volnou proměnnou ve <p, se nazývá podstatně volná ve (p.
4.4. Příklad. Buď
(p ~ (x V (y =>• 3z)) 4» (Ví V w)
Pak jsou zřejmě:
x, y,w podstatně volné proměnné ve <p
z, t vázané proměnné ve <p
u, v, p,r, ... volné proměnné ve <p.
4.5. Definice. Řekneme, že slova <p, xfr jsou slučitelná, jestliže žádná podstatně volná proměnná v jednom z těchto slov není vázaná ve druhém slově.
4.6. Příklad. Nechť
(p ~ 3x(y =>• z) V Ví Ý ~ Vxw(vu;) £ ~ f 4» (3x V z).
Pak jsou slova 93, i/r slučitelná, slova i/r, g> jsou také slučitelná, ale slova 93, q slučitelná nejsou.
Je zřejmé, že v žádné teorii nemá smysl uvažovat všechna možná slova vytvořená v abecedě definované v 4.1. „Správně" vytvořená slova budeme, podobně jako v §3, opět definovat rekurentně; udáme návod, jak lze ze slov jednodušších vytvářet slova složitější. K tomu je však především nutné mít k dispozici „základní", nejjednodušší formule, které již nevznikají z formulí jednodušších. Ve výrokovém kalkulu roli těchto formulí plnily přímo výrokové proměnné. V predikátovém kalkulu tuto úlohu zastávají tzv. primitivní predikáty.
30
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
Definovat primitivní predikáty však v této chvíli nemůžeme. Čtenář si již jistě uvědomil, že každá matematická teorie nutně má své vlastní primitivní predikáty. (Představíme-li si totiž, co po primitivních predikátech požadujeme, snadno si uvědomíme, že to zřejmě budou formule, z nichž se po dosazení konstant za proměnné stanou atomární výroky dané teorie; v aritmetice jsou to například slova „x < y", „x + y < z" apod., v teorii množin slovo „x e y" atd.).
Shrneme-li tedy uvedené úvahy, znamená to, že při budování každé teorie je nutno, kromě jiného, po zadání abecedy stanovit primitivní predikáty, přesněji řečeno: prohlásit některá slova za primitivní predikáty. V každé teorii jsou přitom tyto primitivní predikáty stanoveny jinak a je tak do značné míry na vůli toho, kdo teorii tvoří, která slova za primitivní predikáty prohlásí. Při jejich volbě je však užitečné dodržovat jistá pravidla.
Především je vhodné, aby primitivních predikátů bylo co nejméně. Poněvadž primitivní predikáty hrají roli nejjednodušších formulí, nesmí se v nich vyskytovat logické spojky a z mnoha důvodů předpokládáme, že se v nich nevyskytují ani kvantifikátory. (Později uvidíme, že teorii množin lze vybudovat pomocí jediného primitivního predikátu „x e y".) Často jsou primitivní predikáty stanoveny tak, že jsou za primitivní predikáty prohlášena jistá slova, z nichž lze všechny ostatní primitivní predikáty obdržet substitucí proměnných za proměnné.
Vlastnosti primitivních predikátů shrneme do následující úmluvy.
4.7. Dohoda.
1. Je-li (p primitivní predikát, pak se ve <p nevyskytuje žádný ze znaků -■, v, A, =>•,     V, 3.
2. Je-li (p primitivní predikát a /libo volná substituce tvaru [£ -> rj], kde £, rj j sou proměnné pro objekty, pak je f(<p) primitivní predikát.
Nyní již můžeme přistoupit k definici formulí.
4.8. Definice.
1. Každý primitivní predikát je predikátovou formulí.
2. Je-li (p predikátová formule, je také slovo —•(%>) predikátová formule.
3. Jsou-li <p, xfr slučitelné predikátové formule, jsou také slova (<p) v (xfr), (<p) A (xfr), ((p) =>• (xfr) a ((p) <£> (xfr) predikátovými formulemi.
4. Je-li (p predikátová formule a proměnná x není ve slově <p vázaná, jsou slova (3x)(<p) a (Vx) (<p) predikátovou formulí.
5. Slovo, které nelze vytvořit pomocí (1) - (4), není predikátovou formulí.
4. Predikátový kalkul
31
4.9. Příklad. V teorii množin je slovo x e y primitivním predikátem. Podle definice 4.8 jsou tedy následující slova predikátovými formulemi:
(a) (iěj)v(jě z),
(b) -.((* v y) v (y vz)),
(c) (x e z) 4» (-■((* e y) v (y e z))),
(d) (Vx)((x e z) 4» (-((x e y) v (y e z)))) atd.
Predikátovou formulí však není slovo
(Vx)((xey)^((3x)(xez))),
neboť ve formuli (x e y) =>• ((3x)(x e z)) je proměnná x vázaná a proto nelze této formuli předřadit slovo Vx.
4.10. Poznámka. I v predikátovém kalkulu, pokud to bude možné, budeme zjednodušovat zápis predikátových formulí. Z úmluvy 3.5 převezmeme všechna pravidla, která doplníme navíc o dohodu, že každý z kvantifikátorů V, 3 má přednost před kteroukoliv z logických spojek v, A, -i, =>•,     takže například (3x)cp v \jr značí ((3x)(cp)) v (\jr) a nikoliv (3x)(cp v \jr).
4.11. Definice. Řekneme, že predikátová formule je uzavřená, nevyskytuje-li se v ní podstatně volná proměnná.
4.12. Poznámka. Každé dvě uzavřené formule jsou slučitelné. Uvědomme si rovněž, že každé tvrzení matematické teorie je nutně uzavřenou formulí, což však zdaleka neznamená, že by každá uzavřená formule měla být pravdivým výrokem. Je-li <p predikátová formule v níž se vyskytují podstatně volné proměnné, není <p zřejmě výrok. Výrok však z <p utvoříme, dosadíme-li za podstatně volné proměnné do <p konstanty, tj. konkrétní objekty dané teorie. Obecně tak můžeme z <p utvořit výrok pravdivý i nepravdivý.
4.13. Definice. Řekneme, že predikátová formule <p je tautologií predikátového kalkulu (nebo stručně jen tautologií), jestliže po každém dosazení konstant za podstatně volné proměnné ve (p obdržíme pravdivý výrok. (Triviálně je tedy tautologií každá pravdivá uzavřená formule.)
32
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
4.14. Příklad. Tautologií v teorii množin jistě je například formule
<P ~ (Vy)((x e y) v-(x e y))
s jedinou podstatně volnou proměnnou x.
Je evidentní, že vyšetřování tautologií predikátového kalkuluje podstatně komplikovanější než popis tautologií výrokového kalkulu. Nyní však ukážeme šest jednoduchých pravidel, která umožňují vytvářet tautologie predikátového kalkulu. Důležitost těchto pravidel bude zřejmá z definice, kterou uvedeme později (definice 4.29).
4.15. Pravidlo 1. Buďcp libovolná tautologie výrokového kalkulu, buďte A\, ..., An všechny výrokové proměnné vyskytující se ve <p. Buďte ýi, ..., x[r„ libovolné navzájem slučitelné formule. Buď konečně / substituce
[Ai -> Vl> ■ ■ ■ ,An ~+ Ýn\ ■
Pak je formule f(<p) tautologií predikátového kalkulu.
Důkaz tvrzení, že popsaným způsobem opravdu vždy vznikne tautologie, je jednoduchý a přenecháme jej čtenáři. •
4.16. Poznámka. Je zřejmé, že f(<p) je uzavřená formule, pokud jsou všechny formule ýi, ..., Ýn uzavřené.
4.17. Příklad.
(a) Podle věty 3.15(8) je
[(P =>• Q) a (Q =>• R)] ^(P^R) tautologie výrokového kalkulu. Slova
Ýi ~ (x e y) =3- (z e y)
f 2 ~ (Vr) (x e t)
Ý3 ~ (3iu)[(x £ w) a (u; £ z)] jsou zřejmě slučitelné formule. Podle pravidla 4.15 je tedy
{{[(xey)^(zey)]^[(VO(xeť)]}/
a
[(Vr)(x e 0] =>• j(3^)[(x s w) a (w s z)]] J [(x e y) =>■ (z e y)] =>• j(3w)[(x e w;) a (w; e z)]} J
tautologie predikátového kalkulu.
4. Predikátový kalkul
33
(b) Podle věty 3.15(10) je tautologií formule
(P a-P) =» g.
Je tedy tautologií predikátového kalkulu například formule
[(x £ v) A
(x e j)] =» (Vz)(x e z)
nebo formule
Z příkladu 4.17 je vidět, že každá tautologie výrokového kalkulu je vlastně návodem k vytváření tautologií predikátového kalkulu. Lehce se však ukáže že pravidlo 4.15 nám ještě neumožňuje odvodit všechny tautologie predikátového kalkulu.
Další pravidlo k získávání tautologií uvedeme nyní.
4.18. Pravidlo 2. Je-li (3x)<p predikátová formule, jsou formule
1. (3x)<p 4» -(Vx)Hp)
2. (Vx)<p -(3x)(-<p)
tautologie predikátového kalkulu.
Uvedené pravidlo vlastně formalizuje to, jak negujeme výroky s kvantifikátory, což známe již ze střední školy.
4.19. Příklad. Poněvadž (p ~ (3x)[(x e y) =^ (x e z)] je predikátová formule, jsou tautologiemi formule
4.20. Pravidlo 3. Buď (Vx)<p predikátová formule, v níž není proměnná y vázaná. Buď / substituce [x -> j]. Pak je (Vx)<p =^ /(<?>) tautologie.
4.21. Poznámka. Jestliže je formule (Vx)<p nepravdivá, je formule (Vx)<p =^ /(<?>) tautologií triviálně. Pravidlo 4.20 rovněž není zajímavé v případě, kdy se proměnná x ve slově <p nevyskytuje. Smysl pravidla 4.20 spočívá v následujícím: vyskytuje-li se ve slovu <p proměnná x a (Vx)<p je pravdivá formule, je <p pravdivou formulí po dosazení libovolné proměnné (která ovšem nesmí být ve <p vázaná) za x.
a
34
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
4.22. Příklad. Podle pravidla 4.20 je tautologií například predikátová formule
(Vx)[(x e y) v (x e z)] =» [(r e y) v (r e z)].
4.23. Pravidlo 4. Buď <p predikátová formule, v níž je proměnná x vázaná a v níž se proměnná y nevyskytuje. Buď / substituce [x —> y]. Pak je
<P O f'(9)
tautologie.
4.24. Příklad. Buď<p ~ (3x)((x ě j) <s> (i e z)), / buď substituce [x -> w]. Pak je
(3x)[(x e j) 4» (x e z)] 4» (3u)[(u ěj)<s>(»ě z)] tautologie. Vidíme, že podle pravidla 4.23 nezáleží na označení vázané proměnné.
4.25. Pravidlo 5. Jsou-li následující dvě slova predikátové formule, jsou to tautologie:
(a) (Wx)(<p^Ý)
(b) (3x)(<p & Ý)
Qix)q> 4» (Vx)V] (3x)(p 4» (3x)xfr].
4.26. Příklad. Formule
(Vx)[(x £j)^(ie z)] =» [(Vx)(x e v) 4» (Vx)(x e z)] (3x)[(x e v) 4» (x e z)] =» [(3x)(x e y) 4» (3x)(x e z)]
jsou tautologie.
4.27. Pravidlo 6. Buď ((3x)<p) A i/f predikátová formule a nechť se proměnná x nevyskytuje ve slovu xfr. Pak jsou následující formule tautologie:
(a) ((3x)<p) A xfr     (3x)(<p A i/0
(b) ((Vx)<p) A V 4» (Vx)(<p A V)
(c)
((Vx)<?) =» ^] 4» (Vx)(<? =»
4.28. Příklad. Buď 93 ~ x e z, V ~ """O7 e 2). Pak jsou podle pravidla 4.27 všechny následující formule tautologiemi:
(i) [(3x)(x £ v) A -(y e z)] 4» (3x)[(x e y) A -(y e z)]
(ii) [(Vx)(x e y) A ^(y e z)] 4» (Vx)[(x e y) A ^(y e z)]
(iii) [(Vx)(x e y) =» ^(y e z)] 4» (Vx)[(x ey)4 -(y e z)].
4. Predikátový kalkul
35
4.29. Definice. Tautologie utvořená pomocí některého z pravidel 1 - 6 se nazývá elementární tautologie predikátového kalkulu.
Lze dokázat, že existují tautologie, které nejsou elementární. Proto si nyní stanovíme další dvě jednoduchá doplňující pravidla pro odvozování tautologií.
4.30. Doplňující pravidla.
(DP 1) Jsou-li (p a (p =>• xfr tautologie predikátového kalkulu, je i xfr tautologie predikátového kalkulu.
(DP 2) Je-li x volná proměnná v tautologii <p, je (Vx)<p tautologie predikátového kalkulu.
Význam elementárních tautologií a doplňujících pravidel je zřejmý z následující definice.
4.31. Definice. Důkazem v predikátovém kalkulu nazýváme takovou posloupnost formulí, že každý člen této posloupnosti je buďto elementární tautologií nebo je odvozen z některých předchozích členů této posloupnosti pomocí pravidel (DP 1) a (DP 2).
Důkazem formule <p je posloupnost, která je důkazem a jejímž posledním členem je formule (p. Řekneme, že formule <p je dokazatelná v predikátovém kalkulu, když existuje její důkaz. Je-li (p dokazatelná, píšeme h <p. (h je tedy nový metaznak).
4.32. Poznámka. Podle definice 4.31 je každá dokazatelná formule tautologií. Neznamená to však, že najít důkaz dané formule je obecně snadnou záležitostí. Stejně tak je evidentní, že jedna a táž formule může mít několik důkazů.
4.33. Příklad. Ukážeme, že predikátová formule
j(3z)[(j e z) v (w e z)]} =» |(3x){[(x ey)4 -(x e y)] =» -(x e y)} 4»
4» -(V*)-{[(* é)")4 -(x e y)]    ^(x e j)} J (*)
je dokazatelná.
Podle věty 3.15 je výroková formule
(P => -P) => -P
tautologie výrokového kalkulu. Podle pravidla 4.15 je tedy predikátová formule
<p ~ [(x e y)     -(x e y)] =±> -(x e j) (i)
36
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
elementární tautologií predikátového kalkulu. Podle pravidla 4.18(1) je pak ale elementární tautologií predikátového kalkulu i formule
Ý ~ (3x)J[x ey)4 -(x e y)] 4-(jěj))<S> -(Vx)-J[(x ey)4
4^éj)]4-(iéj)|, (ii) tj. xfr ~ (3x)<p <£> -i(Vx)(-"^o). Poněvadž je výroková formule
P     (g P)
zřejmě tautologií výrokového kalkulu, je opět podle pravidla 4.15 formule
f =» Jj(3z)[(j e z) a (io e z)]} =» VJ (iii) elementární tautologií. Pak ale podle (DP 1) je elementární tautologií i formule
j(3z)[(j e z) a (w e z)]} =» V,
což je ovšem formule (★), kterou chceme dokázat. Jinak řečeno, posloupnost formulí
<p, ý, Ý
Jj(3z)[(vez)A(«;ez)]}^^},(*)
je důkaz formule (★).
4.34. Věta. Buďte <p, \jr dokazatelné slučitelné formule predikátového kalkulu. Pak je i formule (p A \jr dokazatelná.
Důkaz. Podle předpokladu existují důkazy formulí <p,ý. Označme tyto důkazy
<P\, <P2, ■ ■ ■ , <P
Ýi, Ý2, ■ ■ ■, Ý-Podle pravidla 4.15 a věty 3.15(15) je tedy
a ~ <p =>• \ý =>• (<p A ý)]
5. Axiomatická teorie
37
elementární tautologie. Podle (DP 1) je pak elementární tautologií formule
i ~ ý 4 (y a ý).
Opět podle (DP 1) je ale elementární tautologií i formule <p A xfr. Tím je tvrzení dokázáno, neboť posloupnost
<Pl, <p2, ■ ■ ■ , <p, Ýl, Ý2, ■ ■ ■ , Ý, O,     <P A Ý
je důkazem formule (pAxfr. •
4.35. Poznámka. Tvrzení 4.34 je dalším návodem na vytváření dokazatelných formulí (a tedy tautologií) predikátového kalkulu. Je přitom zřejmé, že pravidla pro vytváření elementárních tautologií spolu s pravidly (DP 1) a (DP 2) nám umožňují zformulovat takových návodů celou řadu. Čtenář nechť si promyslí, že důkaz dokazatelnosti formule (★) v příkladu 4.33 je založen na následujícím návodu:
Je-li hýa slovo <p =>• xfr je formule, je také h^4ý.
5   Axiomatická teorie
Pokusy musí být opakovatelné — jen tak mohou naprosto stejným způsobem vždy selhat.
PÁTÁ FlNAGLOVA ZÁSADA
Ukázali jsme si rozdíl mezi výrokovým a predikátovým kalkulem a víme již, jak užitečný je predikátový kalkul při popisu a zkoumání teorie ze syntaktického hlediska. Predikátový kalkul nám umožnil precizovat syntaktickou strukturu atomárních výroků a definovat dokazatelnost formule (v predikátovém kalkulu). V příkladu 4.33 jsme si ukázali, že pomocí predikátového kalkulu můžeme dokázat i poměrně komplikované formule a je zřejmé, že náš příklad byl přitom zvolen velmi jednoduše. Současně z §4 plyne, že dokazatelných formulí v predikátovém kalkulu je nekonečně mnoho.
Čtenáři je však jistě zřejmé, že ani predikátový kalkul není dostatečným nástrojem k vybudování konkrétní matematické teorie. Víme totiž, že dokazatelné formule v predikátovém kalkulu nemohou vypovídat nic o tom, čím se dvě různé matematické teorie odlišují. Predikátový kalkul je pořád jen „společným základem" těch teorií, při jejichž výstavbě tohoto kalkulu použijeme. Navíc je podle poznámky 4.32 každá dokazatelná formule predikátového kalkulu tautologií, jinak řečeno, dosadíme-li do dokazatelné formule za podstatně volné proměnné libovolné konstanty dané teorie, obdržíme vždycky pravdivé tvrzení. Víme však, že při výstavbě matematické teorie nám nejde o hledání tautologií, ale právě naopak, chceme většinou dokázat pravdivost uzavřených formulí, které považujeme za zápisy výroků.
38
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
My však již víme, co je nutno v této situaci provést. Jisté formule prohlásíme za pravdivé bez důkazu.Tyto formule nazveme axiómy dané teorie a z těchto axiómů pak odvozujeme další tvrzení. Jak lze takto vybudovat nějakou teorii prakticky, uvidíme v §6. Nyní si jen stručně uvedeme některé základní vlastnosti společné všem axiomatickým teoriím.
K vytvoření axiomatické teorie je tedy nutno: (a) stanovit konkrétně primitivní predikáty (a tím tedy vlastně zadat predikátový kalkul), (b) udat soupis axiómů.
Při výstavbě axiomatické teorie uvidíme, že axiómy jsou, zhruba řečeno, dvojího druhu. Některé axiómy pouze upřesňují jazyk matematické teorie, nejčastěji tak, že zadávají jisté vztahy mezi primitivními predikáty. Jiné axiómy naopak postulují základní vlastnosti objektů, které v dané situaci studujeme. Po formální stránce je nejjednodušší systém axiómů zadat tak, že udáme jejich soupis. To však není vždycky možné — například proto, že axiómů dané teorie je nekonečně mnoho. (Tak je tomu například u Zermelo-Fraenkelovy teorie množin — viz §6.) V takovém případě je obvykle udáván alespoň tvar formulí, které za axiómy považujeme. V každém případě je však přirozené požadovat, aby bylo o každé formuli možno mechanicky rozhodnout, zdaje nebo není axiómem.
Nyní již předpokládejme, že jsme stanovili primitivní predikáty a axiómy teorie T.
5.1. Definice. Důkazem v teorii T nazýváme takovou posloupnost formulí, že každý člen této posloupnosti:
(a) je axiómem teorie T, nebo
(b) je elementární tautologií, nebo
(c) je utvořen z některých předcházejících členů důkazu užitím pravidel (DP 1) a (DP 2).
5.2. Definice. Řekneme, že formule <p je dokazatelná v teorii T, existuje-li důkaz v teorii T, jehož posledním členem je formule <p. Je-li <p dokazatelná v T, píšeme T h <p. Uzavřená dokazatelná formule <p v teorii T se nazývá veta (nebo teorém nebo též v některých případech lemma) teorie T.
Bezprostředně z definic 5.1 a 5.2 plyne
5.3. Veta. Je-li h <p, je také T h (p.
Při axiomatické výstavbě nějaké teorie je obvyklé, že stanovením počátečních axiómů vytvoříme teorii T a tu pak postupně doplňujeme o další axiómy. Analogií věty 5.3 je pak následující zřejmé tvrzení:
5.4. Věta. Nechť teorie T\ vznikla z, teorie T přidáním dalších axiómů. Pak z.e vztahu T h (p plyne T\ h (p.
5. Axiomatická teorie
39
V dalším bude užitečné přijmout následující označení: teorii T\, která vznikne z teorie T přidáním jediného axiómu x, označíme (T, x). Má-li teorie T jen konečně mnoho axiómů (pi,...,(p„, označíme ji ((pi, ..., (p„).
Jednou ze základních vět (přesněji řečeno metavět) je následující tvrzení:
5.5. Věta o dedukci. Buďte <p, xjr slučitelné formule, xjr nechť je uzavřená. Pak je formule <p dokazatelná v (T, xfr) právě tehdy, když je v T dokazatelná formule xfr =>• <p.
Důkaz. Tvrzení je intuitivně zcela zřejmé. Formální důkaz je rovněž poměrně jednoduchý.
Z jedné strany je důkaz triviální: je-li T \~ xjr =>• <p, existuje v T důkaz q>\, ..., xfr =>• <p. Ale xjr je axióm v (T, xjr), takže <p je podle (DP 1) tautologie v (T, xjr). Posloupnost
cpi, .. ., x\r     cp, \\r, cp
je tedy důkazem formule <p v (T ,x[r).
Důkaz tvrzení, že z (T, xjr) h <p plyne T \~ xjr =3- <p nebudeme provádět. Je uveden například v [3]. •
V úvodu tohoto paragrafu jsme uvedli, že axiomatická teorie může obsahovat nekonečně mnoho axiómů. Z následujícího tvrzení však plyne, že k důkazu jednotlivých formulí by stačila teorie s konečně mnoha axiómy. Je totiž zřejmé, že platí
5.6. Věta. Buď T h (p a buďte xjr j, .. ., x\rn všechny axiómy, které se vyskytují v některém důkazu (p. Pak je
(Ýi, . . . ,xfrn) h (p.
Z následující věty pak plyne, že každou teorii s konečně mnoha axiómy lze považovat za teorii s jediným axiómem.
5.7. Věta. [(xjn, ...,ýn)\-<p]<& [(xjn a ... a xjrn) h <p\
Důkaz. I. Nechť (^i, ..., ý„) h cp. Podle pravidla 4.15 a věty 3.15(11) je
Ul ~ \ý\ a (Ý2 a . . . a Ýn)] =>■ Ýl
elementární tautologie. Formule
Pl ~ Ýl a (Ý2 a . . . a Ýn)
je axióm v (ýi a ... a xjr„), takže ýi může být členem důkazu podle (DP 1). Posloupnost
40
I. FORMÁLNI VÝSTAVBA MATEMATIKY
důkaz formule (p v teorii (Ýi, ■ ■ ■, Ýn), je
«1, Pl, fl, ■ ■ ■ , "n, Pn, Ýn, <Pl,<P2, ■ ■ ■ , <P
důkaz formule (p v (Ýi A 1/^2 A ... A Ýn)-
II. Nechť (ýi A ... A Ýn) l~~ <P- Důkaz formule <p v této teorii je podle věty 4.34 i důkazem
Nyní již lehce zformulujeme vztah mezi důkazem formule v T a důkazem vhodné formule v predikátovém kalkulu.
5.8. Věta. T \- (p právě tehdy, když existují axiómy xjr\, ..., \fr„ v T takové, ž,e h (ijfi A ... A A Ýn) =>■ V-
Důkaz. I. Nechť T h <p. Buďte ýi, ..., x[r„ axiómy, které se vyskytují v důkazu formule <p. Podle 5.6 je (xfn, ■ ■ ■, Ýn) ^~ 9, takže podle 5.7 je (xfn A ... A Ýn) ^~ 9- Podle 5.5 je pak ale h (Ýi, ...,Ýn)^(P-
II. Obrácené tvrzení plyne opět z vět 5.5, 5.6 a 5.7. • V §1 jsme uvedli, že teorie, v níž se objeví antinomie, je prakticky bezcenná. Nyní již můžeme ukázat z jakého důvodu.
5.9. Definice. Řekneme, že teorie T je sporná, existuje-li taková formule <p, že
Není-li teorie sporná, říkáme, že je bezesporná.
5.10. Věta.  Ve sporné teorii je dokazatelná každá formule.
Důkaz. Nechť v T platí T h <p, T I--<<p a buď ý libovolná formule. Je-li ý ~ í°> neni co
dokazovat. Nechť tedy ý není totožná s <p. (a) ý Íe slučitelná s (p: Nechť
v teorii (ý1,...,ý„).
T h (p
T I—>(p.
Cťi, Cť2, . . . , (p
5. Axiomatická teorie
41
je důkaz (p v T,
důkaz —><p v T. Podle věty 4.34 je <p A —><p v T dokazatelná. Existuje tedy důkaz
Yi, Y2, ■ ■ ■, q> A -<$. Podle pravidla 4.15 a věty 3.15(10) je
((p A ->q>) =>• xjr
elementární tautologie, takže xjr je dokazatelná podle (DP 1). Důkazem xjr v T je posloupnost
di, a2, . . ., (p, Pi, P2, ■ ■ ■ , Ý, Yi> Y2, ■ ■ ■ , (P A -•(p, ((p A ->q>) =3- f, f.
(b) Nechť<p, xfr nejsou slučitelné. Buď t libovolná formule slučitelná s (p i s xfr- Podle (a) jsou tedy dokazatelné formule r i -r. Z dokazatelnosti těchto formulí však opět podle (a) plyne dokazatelnost formule xjr. •
Dokázat bezespornost zadané axiomatické teorie je nesmírně komplikovaná záležitost, jejíž rozbor přesahuje naše možnosti. Uveďme si alespoň jedno kritérium bezespornosti.
5.11. Definice. Řekneme že <p je nerozhodnutelná formule teorie T, jestliže v T není dokazatelná ani (p ani —><p.
5.12. Věta. Existuje-li v teorii T nerozhodnutelná formule, je T bezesporná.
Důkaz. Tvrzení plyne z věty 5.10. •
5.13. Důsledek. Je-li (p nerozhodnutelná formule teorie T, jsou teorie (T,<p) i (T,—<(p) bezesporné.
Důkaz. Buď <p nerozhodnutelná formule v T a připusťme že (T, <p) je sporná. Podle věty 5.10 je pak (T,(p) I--<<p. Podle věty 5.5 je pak ale T \~ (<p =>• —'(p). Existuje tedy v T důkaz
Oíi, «2, ...,#>=>• —<(p
formule <p =3- —><p. Podle pravidla 4.15 a (DP 1) je pak ale
oři, cť2, ■ ■ ■, (p =3- -'(p, (sp =3- -'(p) =3- -'(p, -'(p
důkaz formule —><p v T a to je spor s předpokladem, že <p je nerozhodnutelná. To znamená, že teorie (T, <p) je bezesporná.
Důkaz bezespornosti teorie (T, —><p) lze provést zcela analogicky. •
5.14. Definice. Řekneme, že teorie T je úplná, jestliže v T neexistuje nerozhodnutelná formule (tj. pro každou formuli <p je T \~ <p nebo T I--<<p).
42
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
5.15. Poznámka. Při konstrukci axiomatické teorie se zdá samozřejmý požadavek takové volby axiómů, aby teorie byla bezesporná a úplná. Jak uvidíme v kapitole IV, §5, nelze takovou teorii množin sestrojit.
6   Axiomatická teorie množin
Když vše vysvětlíte tak, aby to všichni pochopili, najde se někdo, kdo to chápat nebude. DŮSLEDEK KRANSKEHO ZÁKONA
Nyní již můžeme bez potíží hovořit o axiomatických teoriích množin a můžeme předvést, jak je nějaká teorie axiomaticky budována.
První úspěšnou axiomatickou teorii množin předložil v roce 1908 německý matematik Zermelo. Později tuto teorii doplnil Fraenkel a vzniklá axiomatická teorie, tak zvaná Zermelo-Fraenkelova teorie množin, patří dodnes k nejužívanějším. (Nadále ji budeme označovat ZF.) Podstatným rysem ZF teorie je to, že je omezena možnost vytvářet množiny ze všech objektů daných vlastností. (Nelze hovořit o množině všech množin, o množině všech grup a podobně.)
Při zadání množiny všech objektů daných vlastností musí být předem stanoveno, ze které množiny (předem zadané) tyto objekty vybíráme. Nyní je tedy zřejmé, že tak často zdůrazňovaná nutnost vždycky zvolit „základní" množinu při výuce množinových pojmů na střední škole de facto znamenala, že teorie množin byla na střední škole fakticky budována (i když se o tom nikde nehovořilo) v rámci ZF teorie. Přesněji řečeno (ve smyslu §1), na střední škole se vyučuje model Zermelo-Fraenkelovy teorie.
V moderní matematice je však dnes častěji než teorie Zermelo-Fraenkelova užívána jiná axiomatická teorie, na jejímž vybudování mají největší podíl J. von Neumann, P. Bernays a K. Gódel. Tato teorie je nazývána Godel-Bernaysova teorie množin. (Budeme ji označovat GB). Na první pohled je možná GB teorie komplikovanější než teorie ZF. (Uvedli jsme však již v §5, že ZF teorie obsahuje nekonečně mnoho axiómů, zatím co GB teorii lze vybudovat na základě konečně mnoha axiómů.)
Hlavním přínosem GB teorie je skutečnost, že v ní lze bez obtíží hovořit i o těch systémech, které v ZF teorii netvoří množinu. Primitivním (tj. nedefinovaným) pojmem v ZF teorii je pojem „množina". Primitivním pojmem GB teorie je „třída", jejíž intuitivní smysl je následující. Třídou nazýváme systém všech objektů, patřících do oboru pravdivosti nějaké výrokové formy. Některé třídy se pak nazvou množiny, ukáže se však, že některé třídy množinou nejsou. Takové třídy se nazývají vlastní (to je pak například třída všech množin, třída všech grup a podobně).
V našich možnostech samozřejmě není budovat systematicky nějakou axiomatickou teorii množin. Ukažme si však alespoň, jak lze v rámci poněkud upravené GB teorie vybudovat
6. Axiomatická teorie množin
43
některé běžné množinové pojmy. Čtenář tím získá představu o postupech užívaných v axiomatické teorii a dovede si zrekonstruovat formalizaci teorie, kterou budeme v kapitolách II a III probírat neformálně.
Přesný popis ZF a GB teorie pak mohou čtenáři najít například v [4] nebo v [5].
6.1. Definice. Abecedu teorie tříd tvoří následující znaky:
1. Velká písmena latinské abecedy (eventuálně s indexy) označující proměnné pro objekty.
2. Znaky -■, v, A, =>•,•£>•, V, 3 pro logické spojky a kvantifikátory.
3. Specifický znak e.
4. Závorky ( a ).
6.2. Poznámka.    (a) Abecedu definovanou v definici 6.1 nazýváme základní abecedou teorie
tříd. Později bude vhodné tuto abecedu rozšířit o další znaky.
(b) Definice 6.1 je v naprosté shodě s definicí 4.1.
(c) Objekty naší teorie, označované znaky A, B, C, ..., X, Y, Z a podobně nazýváme třídy.
(d) Specifický symbol e čteme slovy „je prvkem".
(e) K označování slov v naší abecedě budeme užívat opět metaznaků <p, xfr atd. Z praktických důvodů přitom uzavřeme následující dohodu: když některé slovo naší abecedy označíme metaznakem
(P(X1,...,Xn),
rozumíme tím skutečnost, že X\, ..., Xn jsou právě všechny podstatně volné proměnné v tomto slově.
Jak jsme již uvedli v §5, lze teorii množin i teorii tříd vybudovat na základě jediného primitivního predikátu. Uvědomme si, že následující definice je ve shodě s dohodou 4.7:
6.3. Definice. Primitivním predikátem teorie tříd nazýváme slovo X e Y a každé slovo, které z něho vznikne substitucí proměnných za proměnné.
6.4. Poznámka. Uvádět definici formule v teorii tříd není nutné, neboť to bychom jen opsali definici 4.8. Beze změny lze nyní na teorii tříd aplikovat všechny další pojmy z §4, jako například uzavřená formule, tautologie, slučitelné formule, dokazatelná formule atd. V příkladech v §4 jsme si všechny tyto pojmy na formulích teorie tříd demonstrovali.
44
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
Víme již, že pomocí predikátového kalkulu je dokazatelných nekonečně mnoho formulí v teorii tříd. Chceme-li však obdržet výsledky specifické pro teorii tříd, musíme za axiómy prohlásit některé uzavřené formule.
Za první axióm, zvaný existenční, zvolíme formuli, která nám zaručí, že se alespoň jednou realizuje vztah, který označujeme symbolem e.
Axióm 1 (3X)(3Y)(X e Y)
Význam axiómu 1 bude zvláště patrný po vyslovení následující definice:
6.5. Definice. Řekneme, že třída X je množina, jestliže existuje třída Y tak, že X e Y.
6.6. Poznámka. Z axiómu 1 plyne, že existuje alespoň jedna množina. Čtenář nyní může namítnout, že definici 6.5 nelze takto vyslovit ve formalizovaném jazyku. Striktně vzato by bylo nutno postupovat následovně: zaveďme nový metaznak M a dohodněme se, že symbolem M(X) budeme označovat slovo (37)(X e Y), tj.
M(X) ~ (3Y)(X e Y).
(Vzhledem k pravidlu 4.23 nám přitom ve slově M (X) nezáleží na označení vázané proměnné.) Slovo M(X) pak čteme: X je množina.
Metaznak M nám sice umožňuje stručné vyjádření toho, že daná třída je množinou, přesto si však toto vyjádření ještě zjednodušíme následující dohodou:
6.7. Dohoda o rozšíření základní abecedy. Základní abecedu definovanou v 6.1 doplníme o malá písmena latinské abecedy (event. s indexy), kterými budeme rovněž označovat třídy. Budeme však striktně dodržovat pravidlo, že malým písmenem označíme jen ty třídy, které jsou množinami.
6.8. Poznámka, (a) Znak „x" tedy čteme „množina x", znak „X" čteme „třída X". Může se ovšem stát, že třída X je současně množinou. Podle dohody 6.7 je tak možno množiny označit malými i velkými písmeny, třídu, která není množinou, však malým písmenem označit nesmíme.
(b) Stejného faktu by bylo možno ovšem dosáhnout i bez doplnění základní abecedy. Malá písmena bychom mohli považovat za metaznaky a slovo „x" považovat za jiný zápis formule
„M(xy\
V dalším textu budeme běžně postupovat způsobem uvedeným v poznámce 6.6. Nové pojmy budeme běžně zavádět tak, že je popíšeme nějakou formulí v naší abecedě. K jednoduchému popisu těchto situací zavedeme metaznak :=, který značí, že na levé straně stojí symbol
6. Axiomatická teorie množin
45
nebo formule definovaný formulí (nebo slovem) na pravé straně. Na příklad definici množiny můžeme zapsat takto:
M(X) := (3Y)(X e Y)
popřípadě
x := (37)(X e Y). Nyní již můžeme definovat rovnost tříd.
6.9. Definice. X = Y := (VZ)(Z e X Z e Y). Slovy: dvě třídy se rovnají, když. mají stejné prvky.
Někdy se znak = považuje za znak základní abecedy a slovo X = Y se považuje za primitivní predikát. Aby však rovnost měla smysl, který jí intuitivně připisujeme, je nutné, aby měla následující tři vlastnosti, které nyní z axiómu 1 odvodíme. (Uvědomme si, ze kdybychom slovo X = Y považovali za primitivní predikát, museli bychom následující formule prohlásit za axiómy.)
6.10. Věta. Platí:
(1) Q/xxx = x)
(2) (VX)(V7)[(X = y) =» (Y = X)]
(3) (VX)(V7)(VZ) j[(X = Y) a (Y = Z)] =» (X = Z)}.
Důkaz. (1) a (2) plyne bezprostředně z definice.
(3) Nechť (X = Y) a (Y = Z) a buď W libovolná třída. Podle definice 6.9 je
[(W éí)^(ffe 7)] a [(W £ľ)^(ff£ Z)],
tj. W e X 4» W e Z, tj. X = Z. •
6.11. Poznámka. V každé teorii, v níž je zavedena rovnost, lze zavést nový kvantifikátor zpravidla označený symbolem „3!", který čteme „existuje právě jeden". Tento intuitivně zcela zřejmý pojem lze formalizovat následovně: Buď <p formule s volnou proměnnou X, v níž se nevyskytuje Y. Buď / substituce [X —»- Y]. Pak klademe
(3\X)(p := (3X)(p a (VX)(V7)
(<p a f (q>)) =*(X = Y)]
(tato formule znamená: existuje právě jedno X tak, ž.e (p).
Symbol 3! můžeme opět buďto považovat za metaznak nebo o tento symbol můžeme doplnit základní abecedu a odpovídajícím způsobem pak rozšířit definici formule.
46
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
Prozatím jsme uvedli jen jeden axióm. Nyní však již budeme nuceni zavést další. Promyslíme -li si totiž, co intuitivně rozumíme rovností dvou objektů, zjistíme, že kromě vlastností (1) - (3) z věty 6.10 musí být splněn požadavek, že dva sobě rovné objekty mají stejné vlastnosti, tj. v jakékoliv situaci lze jeden z nich nahradit druhým. Přesně řečeno, po rovnosti požadujeme, aby bylo splněno následující tvrzení:
6.12. Metavěta. Bud'(p{X\, ..., Xn) libovolná formule, v níž se nevyskytují proměnné Y\, ... ,Yn Pak je dokazatelná formule
(VXj)... (VXJCVFj)... (Vy„){[(X! = Fj) A (*! = Y2) A ...
... A (Xn = Y„) A yiXu     X„)] =» <p(Yu ..., y„)}.
Prozatím nemůžeme tuto metavětu demonstrovat v teorii tříd. To nám umožní až zavedení tzv. axiómu invariance:
Axióm 2. (VX)(V7)(VZ)J[(X = Y) A (X e Z)] =» (Y e Z)}
6.13. Věta.
(VX)(V7)(VZ)(W)J[(X = Y) A (Z = W) A (X e Z)] =» (Y e W)} .
Důkaz. Tvrzení plyne bezprostředně z definice 6.9 a z axiómu 2. •
6.14. Poznámka. Je zřejmé, že 6.13 je zvláštním případem metavěty 6.12. Stačí totiž do věty 6.13 za formuli <p(X\, ..., X„) dosadit formuli X e Y.
Následující schéma axiómů (tj. obecný návod, které uzavřené formule je nutno považovat za axiómy) činí teorii tříd tak nadmíru v matematice užitečnou. Postuluje nám totiž existenci třídy, jejímiž prvky jsou právě všechny množiny s nějakou předem zvolenou vlastností. Schéma axiómů 3. Buď(p(x, X\, ..., X„) libovolná formule, v níž se nevyskytuje znak Y. Pak je formule
(VX!)(VX2)... (VX„)(37)(Vx)[(x e Y) ^ <p(x, Xu ..., X„)]
axióm.
Uvedené schéma axiómů nám umožňuje uvést následující definici:
6. Axiomatická teorie množin
47
6.15. Definice. Buď<p(x, X\, ..., X„) libovolná formule, v níž se nevyskytuje Y. Pakklademe
Y = {x; <p(x, Xi, ..., Xn)) := [x e Y & <p(x, Xu ..., X„)]. (Slovně: {x; <p(x, X\, ..., Xn)} je třída všech množin x, pro které platí
cp(x, Xi.....X„),
což souhlasí s běžně užívaným označením).
6.16. Definice. Označme
V = {x; x = x},    0 = {x; x 7^ x}. Konstantu V nazýváme univerzální třída, konstantu 0 nazýváme prázdná třída.
6.17. Poznámka. Symbol ^definujeme (zcela obvykle) takto:
X i-Y := -(X = Y).
Analogicky
X i Y := -(X e F).
6.18. Věta.
(1) (VX)[(X ěV)^ «Ať(X)]
(2) (Vx)(x i 0).
Důkaz. (1) (a) -M(X) =» -[(37)(X e F)] =» X i V
(b) Podle věty 6.10 je (Vx)(x = x), tj. x e V. (2) (Vx)-(x ^x) =» x i 0. • Podle věty 6.18 je univerzální třída V právě třídou všech množin.
6.19. Definice.
XUY :={x;x e Xvx e 7} XnF :={x;x e Xax e 7} X-7 :={x;x e Xax £ 7} X' := {x; x £ X}
X c Y := (VZ)[(Z e X) =» (Z e 7)] X c 7 := (X c Y) a (X ^7) ^(X) := {x;x c X}.
48
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
6.20. Poznámka. Na základě schématu axiómů 3 je definice 6.19 korektní. Důkaz obvyklých vlastností operací U, n, — je jednoduchým cvičením.
Třída P(X) se nazývá potenční třída třídy X. Pozor na to, že prvky P(X) jsou množinyl Axiomatika nám nedovoluje definovat objekt {X; X c Y] !!
6.21. Poznámka. Definovali jsme tedy pro třídy operace sjednocení, průniku a rozdílu. Zřejmě lze bez obtíží definovat i symetrickou diferenci. Pro tyto operace evidentně platí všechna běžná tvrzení. Nejasná zůstává pouze následující otázka. Jsou-li X, Y množiny, je i X U Y (a analogicky X n Y, X — Y, P (X)) množina! Intuitivně se zdá samozřejmé, že odpověď na tuto otázku je kladná. Vcelku bez potíží však lze ukázat, že tomu tak není; přesněji řečeno, bez dodatečných axiómů nelze dokázat, ž.e sjednocení dvou množin je množina a podobně pro další operace. Proto jsou v GB teorii axiómy následujícího typu:
Axióm 4. (Vx)(Vy)(3Z)(x U y £ Z)
Pomocí metaznaku M lze tento axióm stručně napsat takto:
M(xUy).
Analogický smysl mají axiómy Axióm 5. M (x n y)
Axióm 6. M (x — y)
Axióm 7. M (P (x))
Axióm 8. M(0)
Schéma axiómů 3 nám umožňuje vyslovit i následující definici:
6.22. Definice.
{x} := {t; t = x}
{x, y} := {t;t=xVt = y}.
Třída {x} se nazývá jednoprvková třída, třída {x, y} se nazývá neuspořádaná dvojice (nebo stručněji dvojice) prvků x, y.
Z analogických důvodů jako u axiómů 4 - 8 je nutno přijmout následující axióm: Axióm 9. M({x, y})
6.23. Lemma. (Vx)jW({x}).
6. Axiomatická teorie množin
49
Důkaz. Tvrzení plyne z axiómu 9 a ze vztahu {x, x] = {x}. • Rada předcházejících axiómů nám umožňuje prohlásit některé třídy za množiny. Je tedy přirozená otázka, zda nelze přijmout axióm, který by nám zaručoval, že každá třída je množinou, tj. axióm
(VX)(37)(X e Y).
Z následující věty plyne, ž,e přijetím tohoto axiómu bychom obdrželi spornou teorii. 6.24. Věta. Existuje třída, která není množinou. Důkaz. Podle axiómu 3 lze definovat třídu
B = {x; x £ x}.
Připusťme, že B je množina. Pak je buďto B e B nebo B <£ B. Nechť tedy B e B. Podle definice třídy B to však znamená, že B £ B: spor. Musí tedy platit B £ B. Protože však je B množina, plyne odtud B e B: spor. Výchozí předpoklad, tj. předpoklad, že B je množina, je tedy nesprávný. • Má tedy smysl následující definice:
6.25. Definice. Třída, která není množinou, se nazývá vlastní.
6.26. Poznámka, (a) Lze ukázat, že vlastní třídou je například také univerzální třída V. Diference tříd a množin je tedy v GB teorii podstatná.
(b) Čtenář si při důkazu věty 6.24 jistě uvědomil, že vlastně opakujeme Russellův paradox z § 1. Z tohoto důkazu tedy plyne, že v GB teorii nelze Russellův paradox vůbec zformulovat, neboť množina, která nám tento paradox v intuitivní teorii množin realizovala, je v GB teorii vlastní třídou. Zcela analogicky je tomu v axiomatických teoriích množin s ostatními paradoxy intuitivní teorie množin.
(c) Víme již, že bychom dostali spornou teorii, kdybychom připustili, že V je množina (tj. že existuje „množina všech množin"). Nyní je ovšem otázkou, zda nelze analogické antinomie v teorii tříd obdržet, kdybychom uvažovali objekt „třída všech tříd" a podobně. Uvědomme si však, že takový objekt v naší teorii vůbec neexistuje. Ve schématu axiómů 3 je podstatné, že x je množinová proměnná. Kdybychom tento axióm „zobecnili" tak, že bychom znak „x" nahradili znakem „X", dostali bychom spornou teorii !!
★ ★ ★
Na tomto místě můžeme demonstraci axiomatické výstavby teorie množin ukončit. Podstata axiomatické teorie je snad nyní jasná. Budeme-li v následujících kapitolách budovat teorii
50
I. FORMÁLNÍ VÝSTAVBA MATEMATIKY
množin neformálně, dovede si již čtenář jistě zrekonstruovat, jak by se tato teorie formálně precizovala.
Nebudeme-li v dalším ani například důkazy provádět přesně tak, jak jsme je formalizovali v této kapitole (ostatně takto to probíhá téměř ve všech partiích matematiky), neznamená to, že formalizace v této kapitole popisovaná je zbytečná. Podstatné je to, že úvahy, které v dalším budeme provádět, formalizovat lze a že víme, jakým způsobem.
Cvičení ke kapitole 1
Jestliže pokus vyjde, stala se někde chyba. První Finaglův zákon
1. Určete všechna podslova slov „383 + 4081", „3333", „1056 - 1056".
2. Dokažte, že pro každou substituci / platí f (co) ~ co.
3. Dokažte, že když / je nějaká substituce slov za znaky a a je libovolné slovo, stačí k určení slova f (a) znát, jak se transformují znaky, které se ve slově a vyskytují.
4. Buď dána abeceda jako v příkladu 2.6. Najděte nějakou substituci / slov za znaky takovou, že v žádném slovu f (a) se nevyskytují znaky „1", „2" a „3".
5. Dokažte, že následující výrokové formule jsou tautologie:
a) [(/>=>• Q) a-g]
b) (P a Q =» R) 4» [P =» (Q =» R)]
c) [P =» (Q =» R)] =» [(P     g)     (P R)]
d) [(P     Q) a P] Q
e) [(P v g) A-P] g
f) [(P =>. g) a (R =>■ 5)] =>• [(P aS)4(6v i?)] (Návod: Určete, kdy p(Q v v i?) ~ 0, p(P A S) ~ 1. Pravdivost implikace pak bude zřejmá.)
6. Dokažte, že následující výrokové formule jsou tautologie:
a) [(P V0 4 4 (-P v Q) (Návod: Vyšetřete případ p(P) ~ 1,
P(G) ~0.)
6. Axiomatická teorie množin
51
b) j [(P aQ)^R]a [(P a Q) =» -i?]} =»       A -g A -i?)
(Návod: Vyšetřete případ p(P) ~ p(<2) ~ 0, ~ 1. Uvědomte si, že lze
přitom volit pravdivostní hodnoty tak, že p(P a Q) ~ 0,        ~ 1.)
7. Vyjádřete formule ze cvičení 6 pomocí spojek -■, v, respektive -■, =>•, respektive -■, A.
8. K formulím A =>• B, A a B, (A =>• B) v C, (A 4» B) v [C A (A =>• 5)] najděte logicky ekvivalentní formule, v nichž se vyskytují pouze logické spojky |, respektive
Kapitola 2
Základní množinové pojmy
1   Základní operace na systémech množin
Právě o těch nejednodušších věcech nevíme vůbec nic. De Neversův zákon složitosti
1.1. Definice. Buď 7^0 libovolná (tzv. indexová) množina. Buď A, množina pro každé i e /. Sjednocením množin A,-, i £ 7, nazýváme množinu
Je-li P| A, = 0, říkáme, že systém A,, i e 7, je disjunktní. Platí-li pro každé i, j & I, i ý j,
í e/
Aŕ n Aj = 0, říkáme, že množiny Aŕ, i e 7, jsou po dvo disjunktní
Nyní ukážeme, že sjednocení a průniky libovolných systémů množin mají zcela analogické vlastnosti jako odpovídající operace s konečně mnoha množinami. Následující tvrzení jsou zřejmá.
1.2. Věta. Buďte I ^ 0, M libovolné množiny, Ai, 5,- buďte množiny pro každé i e 7. Pak platí:
Průnikem množin aŕ, i e 7, nazýváme množinu
52
1. Základní operace na systémech množin
53
(a) P| Ai c Ai c |J Aŕ    pro fazží/e i e /;
re/ ŕe/
(b) n^nB^flAinflfii;
re/ re/ re/
(c) U(AiUS,) = LUiUU*,-;
re/ re/ re/
(d) n a,- u n Bi = n(Ai u b}) c p(Aŕ u b,o ;
/e/ í e/ i, j i e/
(e) U A,- n U b,- = U(Ai n b,-) 2 U(Ai n Bŕ);
/e/ í e/ í, j i e/
(f) P|(M U A,) = M U P| Aŕ;
ŕe/ ŕe/
(g) U(^nAi) = MnUAŕ;
ŕe/ ŕe/
(h) M c Aŕ pra ikaží/e i e / =^ M c f| Aŕ;
ŕ e/
(i) Aŕ c M pro každé i e / =>• U A,- c M.
ŕe/
Distributivní zákony (f), (g) ve větě 1.2 lze zobecnit následujícím způsobem. 1.3. Věta. Budí ý 0 libovolná množina, buď Ti ý 0 množina pro každé i £ /. Položme M = [JTí, K = {X; X CM a pra fazžde i e / p/aďX n T{ 4 0}.
ŕe/
Buď konečně Ai množina pro každé t £ 7], i e 7. platí:
a) n u a, = u n a,;
ŕe/íer; ZeZíeZ
(2) u n a, = p u Aj.
ŕe/íer; XčK tčX
Důkaz. Dokážeme například tvrzení (2). Důkaz vztahu (1) je zcela analogický.
I. Bud'x e (J f| A, libovolný prvek. Pak existuje i'o e I tak, že x e f| A,, tj. x e A,
ŕe/íer; íerio pro každé t e TÍQ. Buď X & K libovolná množina. Podle definice množiny K je X n 7^0 7^ 0,
tj. existuje to e X íl ľ;,. Podle předpokladu platí x e Aí0 a tedy tím spíše x e |J A,. Protože
íeZ
poslední vztah nastává pro každou množinu X & K, plyne odtud x e  P |J A,. Dokázali
XčK íeX
jsme tak, že |J p At c p (J Ař.
ŕe/íer; XčK t£X
54
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
II. Nyní zvolme libovolně x £ H U At. Pak pro každou množinu X e oplatí x £ [J A,,
XčK t£X íeX
takže v každé množině X £ K existuje t £ X tak, že x e At. Položme Y £ {t; t £ M, x ^ A,}. Pak zřejmě Y <£ K, takže existuje i'o e 7 tak, že Y n 7;0 = 0. To však znamená, že pro každé t £ 7i0 platí x e AÍ5 tj. x e P| Ař a tím spíše x £ U P| Ař. Dokázali jsme tak i opačnou
inkluzi n U a, c u n A,-
XčK t£X i£l tčTi
Formulace zobecněného komutativního i zobecněného asociativního zákona je podstatně jednodušší. Důkazy jsou snadné a proto je přenecháme čtenáři.
1.4. Věta. (Zobecněný komutativní zákon) Budí ý $ libovolná množina, A,- bud 'množina pro každé i £ I. Bud' f: I -> I bijekce. Pak platí:
(jA!=|jA/(!),       f|A! = f|A/(!).
re/ re/ re/ re/
1.5. Věta. (Zobecněný asociativní zákon) Bud' I ý 0 libovolná množina, bud'{Jk; k £ K] rozklad na množině I. Buď'A,- množina pro každé i £ 7. 7>a& platí:
u*=uu*. i>=nrv.-
re/ k€K íěJ/c íěI IcěKíěJic
Pro systémy množin lze snadno uvést i de Morganova pravidla.
1.6. Věta. (De Morganova pravidla) Buď A libovolná množina, buď 7?, množina pro každé i £ I, kde 7^0. Pak platí:
(a) A - U Bi = p(A-Bi);
(b) A - H B,- = U(A-Bi)-
ŕe/ ŕe/
Důkaz. Důkazy obou tvrzení jsou zcela analogické. Dokážeme proto jen tvrzení (a):
x e A - (J 7?,-      [x e A a x ^ (J 7?,-]      [x e A a pro každé i £ 7 je x ^ 7?,] 4» Ví £
re/ re/
£ 7: x £ A — 7?,-     x £ Q(A — Bi). •
re/
Ponecháme čtenáři, aby si promyslel, jak právě uvedená de Morganova pravidla souvisejí s pravidly (12) a (13) ve větě 3.15.
Nyní zobecníme pojem kartézského součinu konečného počtu množin.
1.7. Definice. Buď 7^0 libovolná množina, A, buď množina pro každé i £ 7. Kartézským součinem množin A,, i £ 7, nazýváme množinu
0 at := {/; /: 7 -> (J A,-, /(i) £ Ar   pro každé   i £ 7}.
re/ re/
1. Základní operace na systémech množin
55
1.8. Poznámka, (a) Je-li v definici 1.7 / množina všech přirozených čísel, píšeme místo (g) A,
ieN
oo
symbol (g) A,. Podle definice je tento kartézský součin množina všech posloupností
! = 1
takových, že a, e A, pro každé i e /.
(b) Nechť / = {1, 2}. Kartézské součiny (g) A, a A\ x A2 nejsou formálně totožné, neboť
re/
prvky součinu (g) A, jsou některá zobrazení množiny / do množiny A\ U A2, prvky Aj x A2
re/
jsou všechny uspořádané dvojice [x, y] takové, že x e A\, y e A2. Je však zřejmé, že když každému prvku [x, y] e Aj x A2 přiřadíme to zobrazení / e (g) A,, pro které platí /(l) = x,
re/
/(2) = y, dostáváme bijekci mezi oběma kartézskými součiny. Rozdíl mezi těmito formálními zápisy kartézského součinu není tedy podstatný a budeme jej nadále zanedbávat.
(c) Nechť jsou si v definici 1.7 všechny množiny A, navzájem rovny, tj. A, = A pro každé i e I. Z definice pak plyne, že (g) A, = (g) A je množina všech zobrazení množiny I do
re/ re/
množiny A, tj. množina, kterou značíme A1.
Z definice kartézského součinu je zřejmé, že platí:
1.9. Věta. Buď I ý 0> M buď množina pro každé i £ I. Pak je (g) A, =0 právě tehdy, když
re/
A,- = 0 pro některé i e /.
Důkaz. Vzhledem k tomu, že je důkaz jednoduchý, přenecháme jej čtenáři. Poznamenejme pouze, že k důkazu tvrzení, že z neprázdnosti množin A, plyne neprázdnost kartézského součinu, je nutno užít axiómu výběru (viz §4). •
1.10. Věta. (Distributivní zákon) Buď A ^ 0 množina, Ba ý 0 buď množina pro každé a & A. Pro každé a £ A, p £ Ba bud'Cap množina. Pak platí
® U Cafi = \J(g)Cay(a),
cíěA fSĚBa yeT aeA
kde r = <g) 5„.
aeA
Důkaz. ^ e 0 U <í==^ [<?>: A ^ |J |J Ca/? a pro každé a e A platí <p(cŕ) e e U ^<*ŕ] <í==^ [Va e A: 3f3 £ 5„ tak, že <p(a) e Ca/3] •<=>• [Vor £ A: <p(cŕ) e CaY{a), kde y e T = (g) 5„ je to zobrazení A do U 5„, pro které y (a.) = P je některý prvek, pro který
a€A ciěA
(p(a) £ Cap\ <í=^ 3y e T takové, že <p £ (g) CaK(a) <í=^ q> £ U (g) Cffy(ff). •
aeA yeTaeA
56
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
Cvičení k §1
Nevěř na zázraky — spoléhej na né. Šestá Finaglova zásada
1. Buďte X, Y, T množiny, F:T -> P(X), f:X -> Y. Dokažte, že platí:
a) /(U F (t)) = U f [F (t)];
Vier        / t£T
b) f (íl F (t)) c p f[F(t)\
Ver / t€T
2. Dokažte, že když je zobrazení / injektivní, lze ve cvičení 1 (b) psát místo inkluze rovnost.
2   Dobře uspořádané množiny
Nikdy předem nezdůrazňujte, Ž.e se chystáte říci něco významného.
rossův zákon
Jak v dalším uvidíme, budou hrát dobře uspořádané množiny v dalším textu významnou roli.
2.1. Definice. Uspořádaná množina se nazývá dobře uspořádaná, když každá její neprázdná podmnožina obsahuje nejmenší prvek.
2.2. Věta. Buď A dobře uspořádaná množina. Pak platí:
(a) A je řetězec;
(b) je-li A ý 0, obsahuje A nejmenší prvek;
(c) je-li B c A, je B (s indukovaným uspořádáním) dobře uspořádaná;
(d) je-li B = A, je B dobře uspořádaná;
(e) bud'x e A libovolný prvek. Není-li x největší prvek v A, existuje v A prvek y, který pokrývá prvek x (t j. y je bezprostřední následovník prvku x ).
Důkaz.
2. Dobře uspořádané množiny
57
(a) Buďte x, y & A libovolné. Podle definice obsahuje množina {x, y] nejmenší prvek, takže prvky x, y jsou srovnatelné.
(b) Tvrzení plyne z definice 2.1.
(c) Buď B c A libovolná. Je-li 0^Xcfí libovolná, je X c A a podle definice X obsahuje nejmenší prvek. Je tedy B dobře uspořádaná.
(d) Tvrzení je zřejmé.
(e) Pro libovolný prvek x e A označme E(x) = {t; t e A, f > x}. Není-li x největší prvek v A, je E(x) ý 0 (neboť podle (a) je A řetězec), takže E(x) obsahuje nejmenší prvek íq. Nyní je zřejmé, že prvek to pokrývá prvek x.
2.3. Věta. Řetězec A je dobře uspořádaný právě tehdy, když, každý jeho klesající řetězec je konečný, tj. každá množina {x\, 12, . ..) C A taková, ž,ex\ > x2 > ■ ■ ■ > xn > . .., je konečná.
Důkaz. I. Nechť každý klesající řetězec v A je konečný. Ukážeme, že A je dobře uspořádaná.
Buď 0 ^ B c A libovolná. Potřebujeme dokázat, že B obsahuje nejmenší prvek. Zvolme i! e S libovolně. Je-li x\ nejmenší prvek B, je důkaz hotov. Není-li x\ nejmenší, existuje X2 £ B, X2 < x1; neboť A je řetězec. Není-li x2 nejmenší v B, existuje 13 e 6, 13 < 12 atd. Indukcí lze takto v B definovat klesající řetězec x\ > x2 > X3 > ..., který však podle předpokladu musí být konečný. Odtud již plyne, že B obsahuje nejmenší prvek.
II. Nechť v řetězci A existuje nekonečný klesající řetězec x\ > x2 > ... . Pak množina 0 ý {x\, x2, ... x„, ...} c A neobsahuje nejmenší prvek, takže A není dobře uspořádaná množina. •
Z věty 2.3 okamžitě plyne
2.4. Důsledek. Každý konečný řetězec je dobře uspořádaný.
2.5. Věta. Buď A dobře uspořádaná množina, buď B c A taková, ž.e existuje izomorfismus f: A —>- B. Pak pro každý prvek x e A platí x < f (x).
Důkaz. Označme K = {x; x e A, f (x) < x} a připusťme, že K ý 0. Pak K obsahuje nejmenší prvek xo. Položme x\ = f(xo). Protože je xq e K, je /(xo) = xi < xo- Protože je / izomorfismus, je f(x\) < /(xo) = xi> tj- xi e ^- To je však spor, neboťxq je nejmenší prvek množiny K. Je tedy K = 0. •
58
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
2.6. Definice. Buď A libovolná uspořádaná množina. Množina X c A se nazývá začátek množiny A, když pro každý prvek t e X platí
{w; m e A, m < t] c X.
Začátek X c A se nazývá vlastní začátek množiny A, je-li X 7í A.
2.7. Věta. Dobře uspořádaná množina není izomorfní s žádným svým vlastním začátkem ani s jeho žádnou podmnožinou.
Důkaz. Buď A dobře uspořádaná množina, B buď vlastní začátek v A. Pak je B c A, takže A — B ý 0. Množina A — B obsahuje nejmenší prvek oq. Je zřejmé, že a$ je horní závora množiny 5, ao ^ 5. Připusťme, že existuje X c B tak, že A = X. Buď /: A -> X izomorfismus. Pak je f(ao) e X c B, tj. /(ao) < ao> což podle věty 2.5 není možné. •
2.8. Důsledek. Buď A dobře uspořádaná množina, buďte B, C začátky v A. Je-li B = C, pak je B = C.
Důkaz. Je-li B = A, B = C, je B = C podle věty 2.7. Buďte B, C vlastní začátky v A. Je-li B ý C, je buďto B vlastní začátek v C nebo C vlastní začátek v B. Pak ale B, C nemohou být podle věty 2.7 izomorfní. •
2.9. Označení. Buď A uspořádaná množina, x e A buď libovolný. Klademe
A(x) = {t; t e A, t < x}.
Je zřejmé, že pro každý prvek x e A je A(x) ý A a A(x) je začátek v A. Dále je zřejmé, že platí:
2.10. Lemma. Buď A dobře uspořádaná množina, B c A buď vlastní začátek v A. Pak existuje x e A tak, že B = A(x).
2.11. Věta. Buďte A, B dobře uspořádané množiny. Je-li A = B, existuje právě jeden izomorfismus f: A -> B.
Důkaz. Buďte /: A —> B, g: A —> B izomorfismy a připusťme, že / ý g. Pak existuje xo e A tak, že f(xo) ý g(xo)- Protože je / izomorfismus, je A(xo) = 5(/(xo)); protože je g izomorfismus, je A(xo) = B(g(xo)), takže 5(/(xo)) = 5(g(xo)). Podle důsledku 2.8 je pak ale B(f(x0)) = B(g(x0)), tj. /(x0) = g(x0): spor. •
2.12. Poznámka. Z předcházejícího je již zřejmé, že dobře uspořádané množiny jsou řetězce s jistými vlastnostmi. Podle důsledku 2.4 je každý konečný řetězec dobře uspořádaný, nekonečný řetězec je však dobře uspořádaný jen v některých případech. Například řetězec N všech přirozených čísel je dobře uspořádaný, ale řetězce Z, Q, respektive R dobře uspořádané nejsou.
2. Dobře uspořádané množiny
59
Následující věta udává, že struktura dobře uspořádaných řetězců je dokonce v jistém slova smyslu jednoznačně předepsána.
2.13. Věta. Buďte A, B dobře uspořádané množiny. Pak nastane právě jedna z. následujících možností:
(1) A = B;
(2) A = B(x) pro vhodný prvek x £ B;
(3) B = A(x) pro vhodný prvek x £ A.
Důkaz. Buďte A, B dobře uspořádané množiny. Řekneme, že prvek x e A je normální, jestliže existuje prvek y & B takový, že A(x) = B(y). Označme G = {x; x e A, x je normálni}. Zcela analogicky definujeme množinu H = {x; x e B, x je normálni}.
Je-li A = 0 nebo 5 = 0, je tvrzení věty triviální. Nechť tedy A ^ 0 7^ 5. Pak je také G ý $ ý H, neboť nejmenší prvek množiny A, respektive B je evidentně normální. Dále je zřejmé, že G je začátek v A a H je začátek v B. Podle lemmatu 2.10 to však znamená, že je G = A nebo G = A(ao) pro vhodný prvek ao £ A a analogicky H = B nebo // = B(&o) pro vhodný prvek bo & B.
Nyní dokážeme, že je G = H. Definujme zobrazení f.G—>H takto: pro x e G buď /(x) = y ten prvek v H, pro který platí A(x) = B(y). Pak je zřejmě / izomorfismus G na H. Nyní mohou nastat čtyři možnosti.
(a) G = A, H = B. Pak je však A = B, takže platí (1).
(b) G = A,H = B(b0). Pak je A = 5(Z?0), tj. platí (2).
(c) G = A(a0), H = B. Pak je 5 = A(a0), tj. platí (3).
(d) G = A(oo), íř = B(feo).
Je však zřejmé, že poslední případ ve skutečnosti nastat nemůže. Ze vztahu G = H totiž plyne A(oq) = B(bo), takže ao e G, bo e íř a to není možné. •
2.14. Poznámka. Je-li A konečná množina, lze na ní jednoduše definovat uspořádání < tak, aby (A, <) byla dobře uspořádaná. Podle důsledku 2.4 stačí za relaci < zvolit jakékoliv úplné uspořádání. Je tedy přirozená otázka, zda lze dobré uspořádání definovat na každé množině. Odpověď na tuto otázku dal Ernst ZERMELO (viz věta 4.7). Vzhledem k potížím spojeným s důkazem Zermelova tvrzení tento stav objasníme v §4.
V závěru tohoto paragrafu uveďme jednu z nejdůležitějších aplikací dobře uspořádaných množin, tak zvaný princip transfinitní indukce.
Ze střední školy známe důkazovou metodu nazývanou úplná indukce (nebo též matematická indukce). Touto metodou se nejčastěji dokazují vzorce, formule apod., které mají být pravdivé pro všechna přirozená čísla. Připomeňme si, že důkaz úplnou indukcí spočívá v tom, že důkaz výroku (Vra e N) y (ji) se provede ve dvou krocích:
60 //. ZÁKLADNI MNOŽINOVÉ POJMY
(1) V(l),
(2) (V/i e N) (V(n) =>• V(n + 1)).
Poněvadž množina N všech přirozených čísel je dobře uspořádaná, je zřejmé, že úplná indukce je speciálním případem následujícího tvrzení.
2.15. Věta. (Princip transfinitní indukce) Bud'W dobře uspořádaná množina s nejmenším prvkem xq. Bud' P(x) výroková funkce o jedné proměnné s definičním oborem W. Nechť platí:
(1) P(xq) je pravdivý výrok;
(2) pro každý prvek x £ W platí: je-li P (t) pravdivý výrok pro každý prvek t £ W, t < x, je také P (x) pravdivý výrok.
Pak je P (x) pravdivý výrok pro každý prvek x € W.
Důkaz. Nechť jsou splněny předpoklady věty. Připusťme, že množina W = {x; x e W, P (x) je nepravdivý výrok} je neprázdná. Protože W je dobře uspořádaná, obsahuje W nejmenší prvek jo- Je Jo > xq, neboť P(xq) je pravdivý výrok. Pro každé t & W,t < jo, je ^(0 pravdivý výrok, takže podle předpokladu je také P (jo) pravdivý výrok: spor. Je tedy W = 0. •
2.16. Poznámka. V kapitole III uvidíme, že množina W při transfinitní indukci je obvykle nějaká množina tzv. ordinálních čísel. Uvědomme si také, že transfinitní indukci lze užít nejen k důkazům, ale i v definicích, respektive při popisu konstrukcí apod. Chceme-li totiž definovat objekt f (a) pro každé a e W (W je dobře uspořádaná množina s nejmenším prvkem xq), stačí podle věty 2.15 definovat objekt f(xo) a udat předpis, jak objekt f (a) definovat pomocí všech P e W, p < a.
3   Aritmetika uspořádaných množin
/ ta nejjednodušší myšlenka se dá vyjádřit složitě. Malekův zákon
Nyní jednoduše zavedeme početní operace pro uspořádané množiny.
3.1. Definice. Buďte (G, < q), (H, < H) disjunktní uspořádané množiny. Jejich součtem G + H nazýváme uspořádanou množinu (GUH, <), na níž je uspořádání < definováno takto: Pro x, y e G U H platí x < y právě tehdy, když nastane jedna z možností:
(1) x,y e G, x < g y;
(2) x, y e H, x < h y ;
(3) x e G, y e H.
3. Aritmetika uspořádaných množin
61
Relaci < definovanou v 3.1 můžeme vyjádřit takto:
< = < g U < h U (G x H).
Je však třeba dokázat, že uvedená definice je správná, tj. že G + H je vskutku uspořádaná množina.
3.2. Věta. Relace < definovaná v 3.1 je uspořádám na množině G U H.
Důkaz. Musíme dokázat, že relace < je reflexivní, antisymetrická a tranzitivní.
(a) Reflexivita: Buď x e G U H libovolný. Je-li x e G, platí x < q x, neboť < q je uspořádání na G a tedy je reflexivní. Podle definice relace < však odtud plyne x < x. Podobně postupujeme v případě x e H.
(b) Antisymetrie: Buďte x, y e G U H libovolné takové, že x < y a y < x. Je-li x e G, j e G, platí x < Gy a y < q x. Protože je < G antisymetrická, plyne odtud x = y. Podobně obdržíme x = y i v případě, že x & H, y & H. Přitom není možné, aby například x e G, y & H, neboť v tomto případě nemůže platit y < x (vzhledem k předpokladu, že G n H = 0). Tím je antisymetrie relace < dokázána.
(c) Tranzitivita: Buďte x, y, z e G U H libovolné takové, že x < y a y < z. Je-li x, y, z e G, respektive x, y, z e /ŕ, vyplývá platnost vztahu x < z okamžitě z tranzitivity relace < G , respektive < H . Nechť tedy neleží všechny prvky x, y, z v G, respektive v H. Vzhledem ke (3) v definici 3.1 je okamžitě zřejmé, že nutně platí x, y e G,z e Hnebox e G, j, z e //.V obou těchto případech však podle (3) platí x < z a relace < je tranzitivní. •
3.3. Příklad. Na obrázku 1 jsou hasseovské diagramy uspořádaných množin G, H a součtů G + H a H + G.
G+H H+G
Obr. 1
3.4. Poznámka. Z příkladu 3.3 je zřejmé, že operace + definovaná v 3.1 obecně není komutativní. Komutativní zákon neplatí ani v zeslabeném tvaru G + H = H + G. V dalším však ukážeme, že operace + je asociativní.
62
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
Definici 3.1 nyní zobecníme následujícím způsobem:
3.5. Definice. Buď 7^0 uspořádaná množina, buď G, uspořádaná množina pro každé i e 7. Nechť jsou množiny G i, i £ 7, po dvou disjunktní. Součtem Y G i množin G, přes
množinu 7 rozumíme uspořádanou množinu ([J G,■, <) s uspořádáním < definovaným takto:
pro x, y e U G,- platí x < y právě tehdy, když nastane jedna z následujících možností:
re/
(1) existuje i'o £ 7 tak, že x e G,0, y e G,0 a x < y v G,0;
(2) x e d, y e G j a i < j y I.
Podobně jako ve větě 3.2 bychom nyní měli dokázat, že relace < definovaná v 3.5 je uspořádání na množině U G,. Vzhledem k tomu, že důkaz věty 3.2 lze snadno přeformulovat
re/
i pro tento obecnější případ, přenecháme jeho provedení čtenáři. 3.6. Příklad.
(a) Součet definovaný v 3.1 je zřejmě speciálním případem definice 3.5; odpovídá případu, kdy 7 je dvouprvkový řetězec.
(b) Buď 7 = {a, b, c] uspořádaná množina s hasseovským diagramem na obrázku 2a, Ga,Gb, G c buďte uspořádané množiny s diagramy na obrázcích 2b, 2c, 2d. Na obrázku
2e je hasseovský diagram množiny Y^, G i.
re/
a) b) c) d) e)
Obr. 2
3.7. Veta. f Asociativní zákon) Buď I ý $ uspořádaná množina, buďte G i, i e I, po dvou disjunktní uspořádané množiny. Nechť I = Y J k- Pak platí:
kčK
re/ k€K íe/jt
3. Aritmetika uspořádaných množin
63
Důkaz. Množinová rovnost obou stran dokazovaného vztahu plyne z věty 1.4. Dokážeme rovnost uspořádání.
Nechť tedy x, y e Yl     Existuje-li i'o e I, tak, že x e G,0, y e G,0, je zřejmě x < y
í e/
v XI G, právě tehdy, když x < v v ^ 5ľ      Nechť tedy x e G,, v e G j, i < j v I.
i€l k€K ŕe/jt
Existuje-li ko & K tak, že i, y e /^0, je tvrzení zřejmé. Nechť tedy i e     j & Je, k < £ v K.
Pak je x < v v ^ G, právě tehdy, když i < j. Avšak i < j v I právě tehdy, když k < £v K,
re/
tj. x < y v X X G,. Tím je věta dokázána. •
k€K íe/jt
Zvolíme-li ve větě 3.7 za 7 speciálně tříprvkový řetězec, plyne z ní 3.8. Důsledek. Buďte A, B,C libovolné po dvou disjunktní uspořádané množiny. Pak platí:
(A + B) + C = A + (B + C).
3.9. Definice. Buďte (G, < q), (H, < H) uspořádané množiny. Jejich součinem G ■ H rozumíme uspořádanou množinu (G x H, <) s uspořádáním < definovaným takto:
[xi, yú < [x2, y2]   v   G • H   <í=^   (l)yj < H y2 nebo
3.10. Věta. Relace < definovaná v 3.9 je uspořádání na množině G x H.
Důkaz, (a) Reflexivita relace < je zřejmá z definice.
(b) Nechť [x\, yi] < [x2, y2] a současně [x2, y2] < [xj, ji]. Vzhledem k antisymetrii relace
< # není možné, aby ji i- y2- Pro yi = y2 však z antisymetrie relace < G okamžitě plyne x\ = x2. To znamená, že i relace < je antisymetrická.
(c) Nechť[xl yi] < [x2, y2] a [x2, y2] < [x3, y3]. Je-li y1 < y2 < y3, plyne vztah [xb yj <
< tx3> j3] z tranzitivity relace < H . Je-li yj = y2 = y3, plyne uvedený vztah z tranzitivity relace
< a . Je-li yi = y2, y2 < y3, platí y1 < y3 a tedy [xj, yj < [x3, y3]. Podobně v případě y1 < y2, y2 = y3. Žádný další případ evidentně nastat nemůže, takže relace < je tranzitivní. •
3.11. Příklad. Na obrázku 3 jsou hasseovské diagramy uspořádaných množin G, H a jejich součinů G • H a H ■ G.
64
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
GH HG
a) b) c) d)
Obr. 3
3.12. Poznámka. Z příkladu 3.11 plyne, že ani násobení uspořádaných množin není obecně komutativní, a to ani v zeslabeném tvaru G • H = H • G. Podobně jako pro operaci + však i pro násobení platí asociativní zákon.
3.13. Věta. Buďte G, H, K libovolné uspořádané množiny. Pak platí
(G ■ H) ■ K = G ■ (H ■ K).
Důkaz. Množinová rovnost obou stran dokazovaného vztahu je zřejmá. Podle definice 3.9 platí [xi,yi, zi] < [x2, y2, z2] v (G • H) ■ K právě tehdy, když je zi < z2 nebo zi = z2, [xi, yi] < [x2, y2]. Avšak [x\, yi] < [x2, y2] v G H právě tehdy, když je yi < y2neboy! = y2, x\ < x2. Přesně tytéž vztahy však platí, jestliže je [x1; y1; zi] < [x2, y2, z2] v G • (H ■ K). Odtud plyne, že v obou množinách (G • H) ■ K a G • (H ■ K) je definováno stejné uspořádání. •
3.14. Věta. (Levý distributivní zákon). Buďl ^ 0 uspořádaná množina, buďte G, Hi (i e I) uspořádané množiny. Nechť jsou množiny Hi po dvou disjunktní. Pak platí
g-J2h' = T,g-h'-
Důkaz. Množinová rovnost obou stran dokazovaného vztahu je zřejmá. Dokážeme rovnost uspořádání v obou množinách.
Nechť tedy platí [x1; yj < [x2, y2] v G • Yl Hi- nastane jedna z následujících dvou možností:
(1) yi < y2 v Y Hr,
(2) y: = y2 a xi < x2 v G. Nechť nastane případ (1). Pak buď
(la) existuje i0 e I tak, že y1,y2 e Hio ay1 < y2 v Hio, nebo (lb) yj e Hi, y2 e Hj a i < j v I.
V obou případech (la) i (lb) však dostáváme tvrzení ekvivalentní s tím, že [x1; yj < < [x2, y2] v YG ■ Hi.
3. Aritmetika uspořádaných množin
65
Nechť tedy nastane případ (2). Pak existuje i'o e 7 tak, že y1; y2 £ 77,0. Tvrzení [x1; yj < <       lx2, yi]     v     G   ■ je     však     nyní    ekvivalentní     s     tím, že
[xi, yi] < [x2, y2] v G ■ Hi0 a tedy i v    G • 77,. Tím je věta dokázána. •
3.15. Důsledek. Buďte G,H,K,Hf~)K = @, libovolné uspořádané množiny. Pak platí
G ■ (H + K) = G ■ H+ G ■ K.
3.16. Poznámka. Pravý distributivní zákon, tj. tvrzení (5^ 7/,) ■ G = XX ^ ■ G) obecně neplatí. Položíme-li například G = {a}, H = {b}, pak G + 77 je řetězec {a < b}. Zvolíme-li nyní K = {c, d, e] tak, že hasseovský diagram uspořádané množiny (K, <) je na obrázku 3b, je zřejmě na obrázku 3c diagram množiny (G + 77) ■ K a na obrázku 3d diagram množiny G • K + H ■ K. Tyto dvě množiny však nejsou ani izomorfní.
3.17. Věta. Budí ý $ uspořádaná množina, buďte A{ i e I, po dvou disjunktní uspořádané množiny. Nechť existuje množina A tak, ž.e A{ = A pro každé i e I. Pak platí
£> = A-/.
i e/
Důkaz. Nechť pro každé i e I je g,: A, -> A izomorfismus. Definujme zobrazení /: U A, ->
ŕ e/
A x I takto: bud'x e U A, libovolný prvek. Pak /(x) = [g,(x), /], kde i e I je ten prvek,
íe/
pro který platí x e A,. Pak je zřejmě / hledaný izomorfismus. •
3.18. Věta. Buď I ý 0 dobře uspořádaná množina. Buďte A,-, i e 7, po dvou disjunktní dobře
uspořádané množiny. Pak je X A,- dobře uspořádaná množina.
íe/
Důkaz. Buď 0     5 c £ Aŕ libovolná. Označme 7B = {i; i e 7, 5 d Aŕ 7í 0}. Pak je
íe/
0 7^ 7b c 7, takže 7# obsahuje nejmenší prvek íq. B d A,0 je nyní neprázdná podmnožina v A,0, takže Ti n A,0 obsahuje nejmenší prvek b. Je však zřejmé, že b je nejmenší prvek množiny B. •
3.19. Důsledek. Buďte A, B disjunktní dobře uspořádané množiny. Pak je A + B dobře uspořádaná množina.
Z věty 3.18 a důsledku 3.19 plyne
3.20. Věta. Buďte G, H dobře uspořádané množiny. Pak je také množina G ■ H dobře uspořádaná.
3.21. Důsledek. Buďte G, H konečné řetězce. Nechťmá řetězec G m prvků, a řetězec H nechť má n prvků. Pak je G ■ H řetězec obsahující m ■ n prvků.
66
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
4   Axióm výběru a věty s ním ekvivalentní
Neodpovídají-li fakta vaší teorii, je třeba se jich co nejrychleji zbavit.
maierův zákon
V kapitole I jsme viděli, jak se postupuje při axiomatické výstavbě teorie množin a jak vypadají axiómy. V různých axiomatických teoriích jsou samozřejmě za axiómy volena odlišná tvrzení, vesměs jsou však axiómy vcelku jednoduchá tvrzení a proti jejich volbě nejsou vznášeny žádné principiální výhrady. Jedinou výjimkou je právě tak zvaný axióm výběru, někdy též nazývaný Zermelův axióm. V tomto paragrafu si ukážeme některé těžkosti s tímto axiómem spojené. Podrobněji budeme o axiómu výběru hovořit ještě v kapitole IV, §4.
Nejprve si však ukažme, jaké důvody vedly k formulaci tohoto axiómu.
4.1. Příklad.    (a) Buďte A, B, C, D následující množiny: A = {a, b, c}, B = {a, f g, h},
C = {c, d, e, f}, D = {a, f k}.
Potřebujeme-li sestrojit množinu M takovou, že M c AUBUCUDa průnik množiny M s každou z množin A, B, C, D jejednoprvkový, můžeme zvolit například M = {b, e, g, k] nebo M = {a, e] a podobně.
(b) Buď 7^0 libovolná množina, buďte A, ^ 0, i e I, po dvou disjunktní dobře uspořádané množiny. Pak můžeme bez potíží definovat množinu M s následujícími vlastnostmi:
(i) M c (J Au
(ii) pro každé i e / je M íl A, jednoprvková množina.
Lze to udělat například tak, že množinu M utvoříme z nejmenších prvků všech množin Ai.
Množina M je v obou případech definována tak, že jsme z každé ze zadaných množin vybrali jeden prvek.
4.2. Příklad. Definujme na množině R všech reálných čísel relaci q takto:
q := {[x, y]; x e M, j e M, x — y je racionálni číslo}.
Pak je zřejmě q ekvivalence na R. Utvoříme-li faktormnožinu m./q, je ihned vidět, že m./q je nekonečná množina a každá třída rozkladu m./q je rovněž nekonečná množina.
Chceme-li nyní sestrojit množinu M analogicky jako v příkladech 4.1, je ihned vidět, že nelze vůbec podat konstrukci této množiny. Chceme-li vůbec tvrdit, že existuje množina M taková, že
4. Axióm výběru a věty s ním ekvivalentní
67
(i) M c R,
(ii) pro každý prvek x e R/q je M n X jednoprvková množina,
nelze toto tvrzení v běžných axiomatických systémech vůbec odvodit bez axiómu výběru.
Nyní tedy axióm výběru zformulujeme. Nebudeme uvádět jeho symbolický zápis, pouze budeme tento zápis slovy interpretovat.
Axióm výběru. Buď A ý 0 libovolná množina, buď{Ma, <x £ A} systém neprázdných množin, které jsou po dvou disjunktní. Pak existuje množina M taková, že:
1. M c U Ma,
a€A
2. M d Ma je jednoprvková množina pro každé a € A. Z axiómu výběru lze lehce odvodit následující tvrzení:
4.3. Věta. (Zobecněný axióm výběru) Buď M = {Ma; a e A] neprázdný systém neprázdných množin. Pak existuje zobrazení
f:M^[JMa
a€A
takové, že f(Ma) £ Ma pro každé a € A.
Důkaz. Pro každou množinu Ma e M položme
M'a = {[Ma,ma]; ma e Ma],
tj. M'a = {Ma} x Ma. Definujeme-li zobrazení g: M'a     Ma takto:
g([Ma,        = ma   pro každý prvek   [Ma, ma\ e M'a,
je zřejmě g bijekce. Označme M' = {M'a; a e A}. Množiny ze systému M' jsou zřejmě neprázdné a po dvou disjunktní, takže lze na M' aplikovat axióm výběru. Z každé množiny M'a lze tedy vybrat jeden prvek [Ma, ma\. Definujeme-li nyní pro každé Ma e M prvek f(Ma) tak, že f(Ma) = ma,je důkaz hotov. •
4.4. Poznámka. Stručně lze tedy axióm výběru zformulovat takto: Buď M libovolný neprázdný systém neprázdných množin. Pak lz.e z. každé množiny systému M vybrat jeden prvek.
68
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
4.5. Poznámka. Axióm výberu je v „běžných" axiomatických teoriích množin (například v ZF nebo v GB) nezávislým axiómem. Principiálně lze tedy vybudovat teorii množin i bez užití axiómu výběru. Je však vcelku zřejmé, že bychom se tak velmi rychle dostali do značných a mnohdy nepřekonatelných potíží. Již v důkazu věty 1.9 jsme uvedli, že teprve s užitím axiómu výběru můžeme tvrdit, že (^) A, ^ 0, pokud je I ý 0 a A,■ ^ 0 pro každé i e I. Bez užití
axiómu výběru nelze dokázat ani řadu jiných, stejně zdánlivě evidentních tvrzení (a to nejen v teorii množin, ale i například v analýze a podobně).
Prozatím však asi není jasné, proč by proti přijetí axiómu výběru měly být vznášeny nějaké výhrady. (Tvrzení axiómu se samo o sobě zdá jistě vcelku samozřejmé.)
Hlavní potíže spojené s přijetím axiómu výběru si demonstrujme opět na příkladu 4.2. Užijeme-li axióm výběru, lze „zkonstruovat" množinu M tak, že z každé třídy rozkladu R/q vybereme jeden prvek. Přesněji řečeno, axióm výběru nám zaručí existenci takové množiny M, přesto však neznáme žádné pravidlo, které by nám umožnilo sestrojit konkrétní příklad takové množiny. Právě v tomto tkví zásadní potíž spojená s axiómem výběru: lze-li existenci nějakého objektu dokázat pouze užitím axiómu výběru, nelze tento objekt zkonstruovat. To si ostatně budeme ještě několikrát demonstrovat.
S axiómem výběru je ekvivalentní řada tvrzení. Ve větě 4.7 uvedeme některá z nich. K jejich formulaci však potřebujeme následující definici.
4.6. Definice. Buď A uspořádaná množina. Řekneme, že X c A je maximální řetězec v A, když platí:
(1) X je řetězec,
(2) je-li Y c A takový řetězec, že X c Y, pak je X = Y.
Z celé řady tvrzení, která jsou s axiómem výběru ekvivalentní, uvedeme pouze Zermelovu větu, Hausdorffovu větu a Zornovo lemma.
4.7. Věta. Následující tvrzení jsou ekvivalentní s axiómem výběru:
(a) Zermelova věta: Na každé množině existuje dobré uspořádání.1
(b) Hausdorffova věta: Každý řetězec uspořádané množiny je podmnožinou některého maximálního řetězce této množiny.
(c) Zornovo lemma: Je-li každý řetězec uspořádané množiny A shora ohraničený, existuje ke každému prvku x e A maximální prvek mx £ A takový, ž.e x < mx.
1 Obvykle je Zermelova věta formulována tak, že každou množinu lze dobře uspořádat. Tato formulace je však značně nepřesná a — pro toho, kdo se v popisované problematice nevyzná — matoucí, neboťjak již víme, konstrukci onoho dobrého uspořádání alespoň v těch případech, kdy opravdu užijeme axiómu výběru, popsat nelze.
4. Axióm výběru a věty s ním ekvivalentní
69
Důkaz věty 4.7 lze nalézt například v [7], kapitola I, §6. My zde provedeme na ukázku alespoň důkaz tvrzení, že z axiómu výběru plyne Zermelova věta. Důkaz tohoto tvrzení lze sice provést stručněji; z původního Zermelova důkazu, který zde jen s nepatrnými úpravami provedeme, je však lépe vidět roli axiómu výběru. •
Nejprve však některé potřebné pojmy.
4.8. Definice. Buď A řetězec, buďte G, H neprázdné podmnožiny v A. Řekneme, že uspořádaná dvojice [G, H] je řez v množině A, když platí:
(a) G U H = A,
(b) G n H = 0,
(c) pro libovolné x e G, y e H platí x < y.
Je-li [G, H] řez v A, nazývá se G dolní třída a H horní třída tohoto řezu.
4.9. Lemma. Řetězec A ý 0 je dobře uspořádaný právě tehdy, když obsahuje nejmenší prvek a horní třída každého řezu v A obsahuje nejmenší prvek.
Důkaz. I. Buď A dobře uspořádaná množina, [G, H] buď řez v A. Protože je H ý 0, obsahuje H nejmenší prvek.
II. Nechť horní třída každého řezu v A obsahuje nejmenší prvek a 0A je nejmenší prvek v A. Buď0 ^ B c A libovolná podmnožina. Označme
C = {x; x e A, existuje t e B takové, že x > t }.
Pak je zřejmě C = A neboje [A — C, C] řez v A. V obou případech však C obsahuje nejmenší prvek, který je zřejmě nejmenším prvkem množiny B. Je tedy množina A dobře uspořádaná. • Důkaz Zermelovy věty.
Buď M libovolná množina. Je-li M konečná, lze ji podle poznámky 2.14 dobře uspořádat, takže není co dokazovat.
Buď tedy M nekonečná. Označme
M = {X; X c M, X 7^0}.
Podle věty 4.3 vybereme z každé množiny X e M jeden prvek f(X). Tento prvek nazveme vyznačený prvek množiny X. Je-li A c M libovolná, nazveme připojeným prvkem k množině A vyznačený prvek množiny M — A a označíme jej p a- (Tj. p a = f(M — A).) Konečně pro každou A c M nazveme množinu
A+ = A U {pA} následovníkem množiny A. Protože je pA £ A, je A c A+.
70
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
Nyní zavedeme následující označení: systém A c P (M) podmnožin v M nazveme řetězem v M, když platí:
(1) 0 e A;
(2) je-li 0 ý <S c A libovolná podmnožina v A, je U X e «A;
(3) je-li A & A, A c M, je A+ e «A.
Alespoň jeden řetěz v M existuje — například P (M). Dále je zřejmé, že průnik libovolného neprázdného systému řetězů v M je opět řetěz v M. Odtud však plyne, že množina všech řetězů v M, uspořádaná inkluzí, obsahuje nejmenší prvek Aq — průnik všech řetězů v M.
Buď tedy Aq nejmenší řetěz v M. Řekneme, že množina A e Aq je normální, jestliže je srovnatelná s každou množinou X e Aq (tj. platí A c X nebo X c A). Dokážeme nyní následující tvrzení:
(a) Buď A e Aq, A C M. Je-li A normální, je také A+ normálni. Potřebujeme   dokázat,   že   když   je   A   normální,   pak   pro   libovolnou množinu X e Aq platí X c A+ nebo A+ c X. Dokážeme však víc než to: dokážeme, že pro libovolnou X e Aq je X c A nebo A+ c X.
Označme
<A0(A) = {X; X £ Aq, X c A   nebo   A+ c X}.
Pak je   <Ao(A)    c   Aq.  Dokážeme-li  nyní,  že   Aq(A)  je  řetěz  v  M, je nutně Aq(A) = Aq, neboť Aq je nejmenší řetěz v M. Tím však bude dokázáno tvrzení (a). Je zřejmé, že 0 e Aq(A), takže Aq(A) splňuje podmínku (1).
Buď 0 ý <S c <>4>o(A) libovolná podmnožina. Jestliže pro každou množinu X e <S platí X c A, pak také |J X c A, takže |J X e <Ao(A). Existuje-li X0 e B tak, že A+ c X0, je
tím spíše A+ c U X. To však znamená, že <Ao(A) splňuje i podmínku (2).
Zbývá již dokázat jen to, že Aq(A) splňuje i podmínku (3). Buď tedy K e Aq(A), K c M, libovolná. Pak je buďto K c A nebo A+ c K. Je-li však A+ c K, je tím spíše A+ c K+, takže iř+ e A0(A). Nechťje tedy řcA. Je-li K = A, je K+ = A+, takže A+ c K+ a opět je K+ e «Ao(-^)- Zbývá tedy již jen případ K c A. Dokážeme, že pak platí K+ c A.
Podle předpokladu je A normální, takže je K+ c A nebo A c Je-li Ä"1" c A, není co dokazovat. Nechť tedy A c = Ä" U {pz}- Protože podle podle předpokladu je K c A, je zřejmě A = K+, tj. iř+ c A. Opět tak platí K+ e A0(A).
Je tedy ^o(^) řetěz v M a tvrzení (a) je dokázáno.
Nyní dokážeme následující tvrzení:
(fi) (Aq, c) je řetězec.
Zřejmě stačí dokázat, že každá množina X e Aq je normální, neboť pak jsou každé dvě
4. Axióm výběru a věty s ním ekvivalentní
71
množiny X, Y e Ao srovnatelné. K tomu však stačí dokázat, že množina
N(A0) = {X; X e A0, X je normální}
je řetěz v M, neboť je N(Aq) —      a <A>o Je nejmenší řetěz v M. Zřejmě je 0 e N(Aq), takže N(Aq) splňuje podmínku (1).
Buď 0 ^ <g c N(Ao) libovolná podmnožina. Pak se vztah |J X e N(Aq) dokáže
analogicky jako obdobný vztah v důkazu tvrzení (a). Splňuje tedy N(Aq) i podmínku (2). Tvrzení (a) znamená však právě ten fakt, že N(Aq) splňuje i podmínku (3). Tím je dokázáno i tvrzení (/?). Nyní dokážeme, že:
(y) Řetězec (Ao, í=) je dobře uspořádaný.
Je zřejmé, že 0 je nejmenší prvek v Ao- Podle lemmatu 4.9 stačí dokázat, že horní třída každého řezu v množině Ao obsahuje nejmenší prvek.
Buď tedy [4,7"] řez v Aq-Položme S = U X. Poněvadž je Ao řetěz v M, plyne z podmínky
(2) v definici řetězu, že S £ Ao- To však znamená, že je S £ S nebo S & T. Je-li S e S, platí pro každou množinu X & T vztah S C X, přičemž je T ý 0. Je tedy S C M. Pak ale S C S+, takže S+ e T. Nyní je však zřejmé, že S+ je nejmenší prvek v T, neboť množina S+ — S je jednoprvková, takže nemůže existovat W e Ao tak, že S C W C S+.
Nechť tedy je S e T. Pak je ale zřejmé, že S je nejmenší prvek množiny T. Pro libovolnou množinu ľ e ľ totiž platí
X c Y   pro každou množinu   X e S   (podle definice 4.8(c)),
takže také S = [j X c Y.
XěS
Tím je tvrzení (y) dokázáno. Konečně dokážeme tvrzení:
(<5) Existuje bijekce množiny Ao — {M} na množinu M.
Definujme zobrazení g: {Ao — {M}) —»- M takto: g (A) = p a pro každou množinu A e Ao, A c M. Ukážeme, že zobrazení g je bijekce.
Buďte A, B e Ao - {M} libovolné takové, že A i- B. Pak je A c B nebo B c A.
Nechť tedy je například A c B. Pak je nutně A+ c B (neboť A+, B jsou srovnatelné a nemůže platit B c A+), tj. pA e B. Protože však pB £ B, je g (A) = Pa ¥ Pb = g(B), takže g je injekce.
Buď nyní a e M libovolný. Položme
A = |J{X; X e Aq, a £ X}.
72
II. ZÁKLADNÍ MNOŽINOVÉ POJMY
Alespoň jedna taková množina X e ^existuje— například 0. Protože je Aq řetěz, je A e Aq-Nyní dokážeme, že je a = pA.
Připusťme, že je a ^ p a-Pak je a £ A+ D A, přičemž A+ e Aq: spor, neboť A je sjednocení všech množin z Aq, které neobsahují prvek a. Je tedy a = p a, tj. a = g (A), takže g je surjekce.
Tím je tvrzení (<5) dokázáno.
Defmujeme-li nyní na množině M relaci < takto:
x, y e M, x < y        g~\x) c g-^v),
je zřejmé, že (M, <) je dobře uspořádaná, neboť g je evidentně izomorfismus.
Dokázali jsme tedy, že pomocí axiómu výběru lze dokázat Zermelovu větu. •
4.10. Poznámka. V důkazu Zermelovy věty jsme uvedli „konstrukci" dobrého uspořádání na libovolné množině M. Ve skutečnosti však obecně nedovedeme každou množinu dobře uspořádat (nelze například udat konkrétní dobré uspořádání množiny R všech reálných čísel, byť podle Zermelovy věty takové dobré uspořádání existuje). Víme již, že potíž tkví v podstatě axiómu výběru. Tohoto axiómu jsme užili jen v počátku důkazu, když jsme v každé množině vybírali jeden prvek. Právě tato okolnost však způsobila to, že důkaz Zermelovy věty je pouze „existenční" a nikoliv „konstruktivní".
Kapitola 3
Kardinální a ordinální čísla
1   Kardinálni číslo. Spočetné množiny
Věda má vždycky pravdu. Nenechte se zmást fakty. FlNAGLOVO KRÉDO
1.1. Definice. Řekneme, že množiny A, B jsou ekvivalentní a píšeme A ~ B, jestliže existuje bijekce f: A -> B.
1.2. Poznámka. Je zřejmé, že když A je konečná množina, platí A ~ B právě tehdy, když i B je konečná množina a obě množiny mají stejný počet prvků.
1.3. Příklad.
(a) Množina N všech přirozených čísel je ekvivalentní s množinou S všech sudých čísel, neboť zobrazení /: N -> S definované vztahem f (x) = 2x je zřejmě bijekce.
(b) Buďte a\ < a2, b\ < b2 libovolná reálná čísla. Pak jsou intervaly (ai,a2), (b\,b2) ekvivalentní, neboť zobrazení /: (a\, a2) —> (b\, b2) definované vztahem
b2 — b\ f (x) = -(x - aj) + bi
a2 — a\
je zřejmě bijekce.
1.4. Věta. Buďte A, B, C libovolné množiny. Pak platí:
73
74
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
(1) A ~ A;
(2) A ~ B =>• B ~ A;
(3) A~fiAfi~C4A~C.
Důkaz. Tvrzení jsou zřejmá, neboť ícÍa je bijekce, je-li f:A—>B bijekce, je také f^1. B —> A bijekce, a konečně, jsou-li f:A—>B,g:B—>C bijekce, je g o f: A —> C bijekce. •
1.5. Věta. Budí ^0 množina, A,-, 5, (i e /), A, 5, C buďte libovolné množiny. Pak platí:
1. Je-li f:I—>I bijekce, pak (g) A, ~ (g) Ay(r), zejména (A x 5) ~ (5 x A).
re/ re/
2. Nechť pro každé i £ / platí A t ~ 5,. Pa£ (g) A, ~ (g) 5,.
re/ re/
3. A ~ 5 =^ P(A) ~ ^(5).
4. Jsou-li množiny A{ i množiny 5, /?o dvow disjunktní a platí-li A,- ~ 5,- pro každé i £ /, p/aň'|J A; ~ U B{.
5. Jsou-li množiny A{ po dvou disjunktní, pak Ai£í    ~ Q£) A '; zejména pro disjunktní množiny B, C platí ABUC ~ (AB x Ac).
6. ABxC ~ (AB)C
7. «g) Ai)B ~ <g) Af, zejména (A x 5)c ~ (Ac x 5C).
re/ re/
Důkaz. Důkazy vztahů (1) - (4) jsou jednoduché a proto je nebudeme uvádět.
(5) Pro každý prvek (p e Ai£í   , tj. (p: U A, -> A, označme <p,- restrikci zobrazení (p na
re/
množinu A,. Pak je <pŕ e AAi. Definujme zobrazení
F: Ai£í ^60AA'
re/
takto: pro cp e AUi; je F(np) = f to zobrazení množiny / do množiny U AA>, pro které platí /(/) = (pt. Pak je zřejmě F požadovaná bijekce.
(6) Buď / e ABxC libovolný prvek. Pro každý prvek c e C definujme zobrazení gc: B —> —> A, tj. prvek množiny AB, takto: gc(x) = f(x, c) pro každý prvek x e 5. Defmujeme-li nyní F(y) = gy pro každý prvek y e C, je F.C —> AB, tj. F e (AB)C. Nyní je však zřejmé, že
1. Kardinální číslo. Spočetné množiny
75
zobrazení, které každému prvku / e A c přiřadí takto zkonstruované zobrazení F, je bijekce množiny ABxC na množinu (AB)C.
(7) Buď / e ((g) Ai)B libovolný prvek. Pro každý prvek b e B je /(Z?) prvek množiny
(g) Aŕ,tj. f(b) = fb:I —> y A,-, přičemž ft(i) £ A, pro každé/ e 7. Definujme nyní zobrazení
re/ re/
fi\ B ^ At takto: =        pro každý prvek b e 5. Zobrazení F: ((g) A,)B -> (g) Af
definované vztahem F (/)(/) = /) je pak evidentně bijekce. •
1.6. Definice. Řekneme, že množina je spočetná, je-li ekvivalentní s množinou všech přirozených čísel. Množina, která je konečná nebo spočetná, se nazývá nejvýše spočetná.
1.7. Poznámka. Je-li A spočetná množina, existuje podle definice 1.1 bijekce /: N —> A. Takové funkce /, pro něž je Dom / = N, se nazývají posloupnosti. Lze tedy říci, že množina A je spočetná, lze-li její prvky uspořádat do posloupnosti.
1.8. Věta. Každá podmnožina spočetné množiny je nejvýše spočetná.
Důkaz. Buď A spočetná množina. Podle poznámky 1.7 je tedy A = (a„)^r Buď B c A libovolná podmnožina. Buď ti\ nejmenší přirozené číslo takové, že ani e B, «2 nejmenší přirozené číslo takové, že «2 > n\ a a„2 e B atd. Posloupnost (a„k) je buďto konečná a tedy B je konečná, nebo je nekonečná a to znamená, že B je spočetná. •
1.9. Věta. Budí nejvýše spočetná množina, bud'A,- nejvýše spočetná množina pro každé i £ I.
Pak je množina [J A,- nejvýše spočetná. re/
Důkaz. Je zřejmé, že stačí dokázat, že když je I spočetná a všechny A, jsou spočetné, pak je také U A, spočetná. V tomto případě můžeme bez újmy na obecnosti předpokládat, že I = N.
re/
Každou z množin A, lze podle předpokladu uspořádat do posloupnosti takto:
^i    =   {^ii, ai2, . .. , ai„, . ..}
A2 = {(221, <222, ■ ■ ■ , d2„, . . . } A-n &n2-> ■ ■ ■ > ■ ■ ■ }
Pak je ale [J Ai = {au, ayi, fl2i> ai3> a22, a3i> ai4> a23> a32> a4i> ■ ■ ■ L takže množina [J Ai je
re/ re/
spočetná. •
76
///. KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
1.10. Důsledek. Množina všech celých čísel je spočetná.
1.11. Věta. Každá nekonečná množina A obsahuje spočetnou podmnožinu B takovou, ž.e množina A — B je opět nekonečná.
Důkaz. Je-li množina A nekonečná, existují prvky a\,b\ £ A, a\ ýb\. Protože je A — {a\, b\\ nekonečná, existují prvky ai, bi e A — {a\, b\], ai ý bi atd. Indukcí lze zřejmě v A sestrojit dvě disjunktní spočetné podmnožiny
B = (an)T=1, C=(bn)™1.
Tím je tvrzení dokázáno. (Pozorný čtenář však jistě postřehl, že jsme v důkazu využili axiómu výběru.) •
1.12. Věta. Kartézský součin dvou spočetných množin je spočetná množina.
Důkaz. Podle věty 1.5(2) víme, že když A ~ C, B ~ D, pak je A x B ~ C x D. Stačí tedy dokázat, že N2 je spočetná množina.
Pro každý prvek [p, q] £ N2 nazveme výškou tohoto prvku číslo p + q. Je zřejmé, že pro každé n £ N, n > 1, existuje n — 1 dvojic výšky n: [í, n — 1], [2, n — 2], ..., [n — 1, 1]. Označme P„ = {[p, q]; [p, q] e N2, výška [p, q] je
oo
n }. Pak je N2=[JP„ podle věty 1.9 spočetná. •
n=2
1.13. Důsledek. Kartézský součin konečného (nenulového) počtu spočetných množin je spočetná množina.
1.14. Důsledek. Množina Q všech racionálních čísel je spočetná.
Důkaz. Víme, že každé kladné racionální číslo r lze jednoznačně vyjádřit jako podíl - nesou-dělných přirozených čísel. Těchto podílů je nejvýše tolik, jako všech dvojic [p, q] e N2, tj. nejvýše spočetně mnoho. Odtud a z věty 1.9 nyní plyne tvrzení. •
1.15. Věta. Bud'A spočetná množina. Pak je množina K všech konečných posloupností prvků množiny A spočetná.
Důkaz. Bud'ra e N libovolné. Podle důsledku 1.13 je množina A" všech uspořádaných ra-tic
oo
z prvků množiny A spočetná. Podle věty 1.9 je i množina K = U A" spočetná. •
n=l
1.16. Důsledek. Množina všech polynomů (jedné proměnné) s racionálními koeficienty je spočetná.
1. Kardinální číslo. Spočetné množiny
77
Důkaz. Každému polynomu a§xn + a\xn 1 + • • • + a„_ix + a„ (oq ý 0) stačí přiřadit prvek
1.17. Poznámka. Nyní si můžeme uvést jeden z prvních dokladů toho, jak teorie množin umožnila zodpovědět problém jiné matematické disciplíny, v tomto případě teorie čísel.
Reálné číslo se nazývá algebraické, je-li kořenem nějakého polynomu s racionálními koeficienty. Reálné číslo, které není algebraické, se nazývá transcendentní. Je okamžitě zřejmé, že každé racionální číslo je algebraické, stejně tak jako například čísla -J2, V3, V26 atd.
Teprve v 19. století se však podařilo dokázat, že například číslo jt je transcendentní. Otázkou však bylo, kolik vlastně transcendentních čísel existuje. Teorie množin tuto otázku jednoduše vyřešila. Z faktu, že každý polynom ra-tého stupně má nejvýše n reálných kořenů a z důsledku 1.16 okamžitě plyne, že množina všech algebraických čísel je spočetná. V dalším uvidíme, že to znamená, že transcendentních čísel je „více" než čísel algebraických — viz důsledek 2.11.
1.18. Poznámka. Při formální výstavbě teorie množin lze přesně popsat, jak lze každé množině A přiřadit objekt card A, nazývaný kardinální číslo množiny A. Přitom pro každé dvě množiny A, B platí
Poněvadž zde nebudeme tuto formalizovanou konstrukci uvádět, spokojíme se s konstatováním, že každé množině A lze přiřadit symbol card A tak, že je splněna výše uvedená podmínka (★).
Kardinální číslo množiny A se často také nazývá mohutnost množiny A. Podle poznámky 1.2 mají dvě konečné množiny stejné kardinální číslo právě tehdy, když mají stejný počet prvků. Má tedy smysl přijmout následující označení:
má-li konečná množina A n prvků, označíme card A = n. Zejména tedy card 0 = 0. Kardinální číslo spočetných množin značíme symbolem Ko — čti „alef" —je první písmeno hebrejské abecedy). (Důvod tohoto označení uvidíme v §6 - viz poznámka 6.9.)
[oq, ai, ..., an] e Q'
jj+i
(*)
Cvičení k §1
Pouze v jediném případě si můžeme být neomylně jisti:
jsme-li si jisti, ž.e se mýlíme.
HOLTENOVA POUČKA
1. Dokažte následující tvrzení:
a) Množina všech intervalů v R, jejichž koncové body jsou racionální, je spočetná.
b) Buď A nějaká množina po dvou disjunktních intervalů v R. Pak je A nejvýše spočetná. (Návod: Vyberte v každém intervalu jedno racionální číslo.)
78
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
2. Buď / reálná funkce jedné reálné proměnné. Dokažte, že množina všech bodů, v nichž má funkce / ostrý lokální extrém, je nejvýše spočetná. (Návod: Využijte výsledku cvičení
3. Dokažte, že množina všech bodů nespojitosti monotónní reálné funkce jedné reálné proměnné je nejvýše spočetná. (Návod: Využijte cvičení l(b) a faktu, že monotónní funkce má v každém bodě limitu zleva i limitu zprava.)
Následující Cantor-Bernsteinova věta patří k základním tvrzením teorie množin.
2.1. Cantor-Bernsteinova věta. Buďte A, B libovolné množiny. Existují-li množiny A\ c A, Bi c B takové, že A ~ B\, B ~ Au platí A ~ B.
Důkaz. Je-li některá z množin A, B konečná, je tvrzení triviální. Buď tedy A nekonečná, f: B —> A\ buďbijekce. Je-li A\ = A, není co dokazovat. Nechť tedy je A\ C A a analogicky Bi c B. Označme A2 = f(B{). Pak platí:
l(a).)
2   Nerovnost mezi kardinálními čísly
Jde-li to s věcmi do háje, nikdo netuší, jak je hluboký.
HANEŮV ZÁKON
A2 C Aj C A, A ~ A2, B ~ Aj.
(2.1.)
Stačí tedy dokázat, že je A ~ Aj, neboť z tranzitivity relace ~ pak plyne A ~ B. Podle (1) existuje bijekce g: A —> A2. Pak platí:
Aj c A => A3 := g(AO C A2, A2 c Aj => A4 := g(A2) C A3, A3 c A2 => A5 := g(A3) C A4,
Přitom platí
g(A2
Aj) = A2 - A3
A2) = A3 - A4 A3) = A4 - A5
Protože je g bijekce, plyne odtud ekvivalence následujících množin:
2. Nerovnost mezi kardinálními čísly
79
(A - Aj) U (A2 - A3) U (A4 - A5) U ... U (A„ - An+1) U ... (A2 - A3) U (A4 - A5) U (A5 - A6) U ... U (An+1 - An+2) U ... (2.2.)
Označme
oo
Z) := AnP|Ar.
re/
Pak je zřejmé, že platí:
A = Z) U (A - Ai) U (Ai - A2) U (A2 - A3) U (A3 - A4) U ...
Ai = D U (Aj - A2) U (A2 - A3) U (A3 — A4) U ... (2.3.)
Protože pro sjednocení množin platí asociativní a komutativní zákon, lze vztahy (2.3) přepsat na tvar
A = [D U (Aj - A2) U (A3 — A4) U ... ] U [(A — Aj) U (A2 - A3) U ... ] Aj = [D U (Aj - A2) U (A3 - A4) U ... ] U [(A2 - A3) U (A4 - A5) U ... ]
V prvních závorkách množin A i Aj však stojí tytéž množiny, množiny ve druhých závorkách jsou podle (2.2) ekvivalentní. To však znamená, že A ~ A\, což jsme chtěli dokázat. •
2.2. Definice. Buďte a, b libovolná kardinální čísla, A, B libovolné takové množiny, že a = card A, b = card B. Pak klademe:
a < b <í==^ existuje injektivní zobrazení f:A—>B.
2.3. Poznámka, (a) Relaci < mezi kardinálními čísly jsme definovali pomocí množin o příslušných mohutnostech. Analogicky budeme postupovat i později například při definici aritmetických operací. To však znamená, že je nutno dokázat, že platnost vztahu a < b nezávisí na konkrétní volbě množin A, B, přesněji řečeno, je nutno dokázat, že když je A ~ A\, B ~ B\, pak injekce A do B existuje právě tehdy, když, existuje injekce A\ do B\. Toto tvrzení je však evidentní a zformulování jednoduchého důkazu přenecháme čtenáři. V dalším pak tvrzení tohoto typu většinou nebudeme uvádět.
(b) Definici 2.2 jsme mohli zformulovat i jinak. Uvědomíme-li si totiž, že zřejmě injekce A do B existuje právě tehdy, když, existuje B\ c B tak, ž,e A ~ B\,
můžeme říci, že
a < b <í==^ existuje B\ c B   taková, že   A ~ B\.
80
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
Nyní je však nutno dokázat, že relace < definovaná v 2.2 je uspořádání. Vzhledem k tomu, že později uvidíme, že neexistuje množina všech kardinálních čísel (tj. systém všech kardinálních čísel tvoří vlastní třídu), je nutno toto tvrzení zformulovat následovně:
2.4. Věta. Bud' A libovolná množina kardinálních čísel. Pak je (A, <) uspořádaná množina.
Důkaz. Reflexivita a tranzitivita relace < je zřejmá, neboť id^ je injekce pro každou množinu A a složení dvou injekcí je opět injekce.
Antisymetrie relace < plyne z Cantor-Bernsteinovy věty 6.10. •
Následující tvrzení je dalším ekvivalentem axiómu výběru.
2.5. Věta. Pro každá dvě kardinální čísla a, b platí a < b nebo b < a.
Důkaz. Buďte A, B libovolné takové množiny, že card A = a, card B = b. Podle Zermelovy věty 4.7 lze množiny A, B dobře uspořádat. Tvrzení nyní plyne z věty 2.13 v kapitole II. •
2.6. Poznámka. Podle věty 2.5 tvoří každá množina kardinálních čísel řetězec. Zejména platí
0<l<2<-<«<-< Ko.
Z věty 1.11 plyne, že Ko je nejmenší nekonečné kardinální číslo. Prozatím však nevíme, zda existují nekonečná kardinální čísla různá od Ko. V následující větě dokážeme, že taková kardinální čísla existují. Jinými slovy, existují nekonečné množiny, které nejsou spočetné. Takové množiny se nazývají nespočetné.
2.7. Cantorova věta. Buďte X ý 0 ý Y libovolné množiny, card Y > 2. Pak platí
card Yx > card X.
Důkaz. Nejprve dokážeme, že platí card X < card Yx.
Podle předpokladu existují prvky y\,y2 £ Y, yx ý y2. Pro každý prvek x e X definujme zobrazení fx:X—> Y takto:
f(t\ = l yi   Pro r = x
i j2   pro r e X, t i-x.
Pak je pro xx, x2 e X, xx 4 x2, zřejmě fxx 4 fX2, neboť například fxx (xx) = yu fX2 (xj) = y2. Zobrazení F: X —> Yx definované vztahem F (x) = fx pro každý prvek x e X je tedy injekce, což jsme chtěli dokázat.
Nyní dokážeme, že je card X ^ card Yx.
Připusťme, že existuje bijekce <p: X —> Yx. Definujme zobrazení /: X —> Y následovně:
2. Nerovnost mezi kardinálními čísly
81
ftx\ = í ^1.   jestliže (p(x)(x) ý yr \ y2,   jestliže <p(x)(x) = yx.
Pak je / e Yx a pro každé x e X je <p(x) ý f, takže <p není surjekce: spor.
Dokázali jsme tak, že card X < card Yx. •
2.8. Poznámka. Dokázali jsme právě, že ke každému kardinálnímu číslu existuje kardinální číslo vetší. Proto existují kardinální čísla větší než Ko, tj- existují nespočetné množiny. Uvědomme si však, že z věty 2.7 okamžitě plyne, že kardinálních čísel větších než je Ko je nekonečné mnoho. Zejména to znamená, že dvě nespočetné množiny ani zdaleka nemusí mít stejné kardinální číslo!
Metoda, kterou jsme dokázali, že v důkazu věty 2.7 neexistuje surjekce <p: X —> Yx, je tzv. Cantorova diagonální metoda. Jejím speciálním případem je důkaz následujícího tvrzení.
2.9. Věta. Množina všech reálných čísel x, 0 < x < 1 je nespočetná.
Důkaz. Buď x e (0, 1) libovolné. Pak lze x napsat pomocí dekadického rozvoje ve tvaru 0,aia2a3 ■ ■ ■ > přičemž tento rozvoj je určen jednoznačně, vyloučíme-li rozvoje, v nichž se od jistého indexu počínaje vyskytuje pouze devítka. (Takže například číslo 0,3209 zapíšeme ve tvaru 0,321.)
Předpokládejme nyní, že množina reálných čísel z intervalu (0, 1) je spočetná. Pak lze tato čísla uspořádat do posloupnosti (r„)^1 a každé číslo r, lze jednoznačně vyjádřit pomocí dekadického rozvoje takto:
r\ = 0,aiiai2ai3<zi4 ■ ■ ■ r2    =   0,a2ia22a23a24 ■ ■ ■
r-i     =     0,(331(332(333(334 . . .
rn    -   0,an\an2anjan4 .. .
Zkonstruujme nyní číslo r = 0,aia2a3a4 ■ ■ ■ takto: pro i = 1, 2, ..., n, ... je
1   je-li au i- 1
[ 2   je-li au = 1.
Pak je r £ (0, 1) a pro každé n e N přitom r ý rn: spor. Interval (0, 1) tedy není spočetný.
2.10. Důsledek. Množina R všech reálných čísel je nespočetná a platí R ~ (0, 1).
82
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
Důkaz. Zobrazení f(x) = arctg x je bijekce R na interval (—f )• Podle příkladu 1.3(b) jsou však intervaly (—f, \) a (0, 1) ekvivalentní. •
2.11. Důsledek.
(a) Množina I všech iracionálních čísel je nespočetná.
(b) Množina všech transcendentních čísel je nespočetná.
Důkaz, (a) Je R = Q U E a Q je podle důsledku 1.14 spočetná. Kdyby byla množina I spočetná, byla by R spočetná podle věty 1.9: spor. Je tedy I nespočetná.
(b) Analogicky (z 1.9, 1.17 a 2.10). •
2.12. Věta. Bud'X libovolná množina. Pak platí
card P(X) > card X.
Důkaz. Je-li X = 0, je card X = 0 a card P(X) = card {0} = 1 > 0. Nechť tedy X 4 0. Zvolme ve větě 2.7 Y = {0, 1}. Definujme nyní zobrazení F:YX —> P(X) takto:
pro každé f:X ^ Y je F(f) = {x; x e X, /(x) = 0}.
Pak je zřejmě F bijekce a tvrzení věty nyní plyne z věty 2.7, neboť
card^(X) = card7z > cardX.
2.13. Věta. Bud'M nespočetná množina, A nejvýše spočetná podmnožina množiny M. Pak je card M = card (M — A).
Důkaz. Je M = (M — A) U A. Protože je A nejvýše spočetná množina, plyne z věty 1.9, že M — A je nespočetná. Podle věty 1.11 existuje spočetná množina A\ c M — A. Označme P ={M-A)-Al. Pak je M - A = Aj U P, tj. M = (A U Aj) U P. Protože je množina A U Aj spočetná, existuje bijekce /: Aj —»- A U A\. Položme pro každé x e M — A
^XJ    j x   pro x e P. Pak je g: (M — A) —> M bijekce a věta je dokázána. •
2.14. Důsledek. Bud' A libovolná nekonečná množina, B nejvýše spočetná množina. Pak card (A U B) = card A.
2. Nerovnost mezi kardinálními čísly
83
Důkaz. Je-li A spočetná, plyne tvrzení z věty 1.9. Je-li A nespočetná, plyne tvrzení z věty 2.13. Zásadní důležitost v teorii nekonečných množin má následující tvrzení:
2.15. Věta. Množina A je nekonečná právě tehdy, když, obsahuje vlastní podmnožinu B G A takovou, že A ~ B.
Důkaz. I. Je-li A konečná, není podle poznámky 1.2 ekvivalentní s žádnou svou vlastní podmnožinou.
II. Nechť je A nekonečná. Je-li spočetná, plyne tvrzení z věty 1.11, je-li nespočetná, plyne tvrzení z věty 2.13. •
2.16. Poznámka. Dosud jsme neuvedli, jak lze při axiomatické výstavbě teorie množin for-malizovat intuitivně zřejmý pojem konečné a nekonečné množiny. Nyní vidíme, že nám to umožňuje věta 2.15. Při axiomatické výstavbě lze podle této věty říci, že množina je nekonečná, je-li ekvivalentní s nějakou svou vlastní podmnožinou. Přitom je snad evidentní, že to, zda nekonečné množiny v axiomatické teorii existují nebo ne, závisí na tom, zda přijmeme nebo nepřijmeme axióm, který nám jejich existenci postuluje. (V ZF a GB samozřejmě takový axióm je.)
Cvičení k §2
Nejméně vysilující je spolehnout se na vlastní síly. MURPHYHO PARADOX
1. Buďte (an)™=l, (b,,)^ rostoucí posloupnosti reálných čísel. Řekneme, že posloupnost (b„) roste než posloupnost (a„), když platí lim jf- = 0. Dokažte:
a) Ke každé rostoucí posloupnosti existuje posloupnost, která roste rychleji.
b) Je-li A ^ 0 taková množina rostoucích posloupností, že s každou posloupností obsahuje všechny posloupnosti, které rostou rychleji, pak je množina A nespočetná. (Návod: Důkaz provádějte sporem. Předpokládejte, že A je nejvýše spočetná a Cantorovou diagonální metodou sestrojte posloupnost, která roste rychleji než všechny posloupnosti z A.)
84
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
3   Aritmetika kardinálních čísel
Pokud vycházejí matematické poučky z,e skutečnosti,
nejsou spolehlivé. Pokud jsou spolehlivé, nevycházejí z.e skutečnosti.
Einsteinův postřeh
Aby byl název kardinální číslo oprávněný, je přirozené požadovat, abychom pro kardinální čísla zavedli obvyklé spolehlivé a ze skutečnosti vycházející aritmetické operace. V tomto paragrafu ukážeme, jak je definován součet, součin a mocnina kardinálních čísel. Ponecháme na čtenáři, aby si promyslel, že pro konečná kardinální čísla budou uváděné definice odpovídat obvyklým aritmetickým operacím v množině nezáporných celých čísel.
Poznamenejme ještě, že definici součtu a součinu dvou kardinálních čísel (a tedy i libovolného konečného počtu kardinálních čísel) lze zformulovat bez užití axiómu výběru. Pro definici součtu,qf respektive součinu nekonečného systému kardinálních čísel se však užití axiómu výběru nelze vyhnout. (Přesněji řečeno, bez axiómu výběru nelze dokázat, že každá množina kardinálních čísel má součet a součin.)
3.1. Definice. Buďte a, b libovolná kardinální čísla, A, B buďte libovolné takové množiny, že card A = a, card B = b, A n B = 0. Součtem kardinálních čísel a, b rozumíme kardinální číslo
a + b := card (AU B).
Obecněji: Buď K ý 0 libovolná množina, buď ak kardinální číslo pro každé k e K. Buďte Ak, k e K po dvou disjunktní množiny takové, že pro každé k e K platí card Ak = ak. Pak definujeme
y^flfr := card Ak.
kčK kčK
3.2. Poznámka. Nyní bychom při formálně přesném postupu měli dokázat, že:
(a) pro každý systém ak, k e K, kardinálních čísel součet     ak existuje;
kčK
(b) tento součet nezávisí na volbě množin Ak, tj. jsou-li Ak, respektive Bk po dvou disjunktní systémy množin takové, že pro každé k e K platí Ak ~ Bk, pak card |J =
kčK
= card (J Bk.
k€K
Dokázat bod (a) značí dokázat, že když K ý 0 je množina a ak, k e K, jsou libovolná kardinální čísla, pak existují po dvou disjunktní množiny Ak, k e K, takové, že card Ak = ak
3. Aritmetika kardinálních čísel
85
pro každý index k e K. Zvolme tedy libovolné množiny Bk, k € K, tak, že card Bk = a^. Položíme-li Ak := {k} x Bk, je zřejmě Ak ~ Bk, tj. card Ak = ak a množiny jsou evidentně po dvou disjunktní.
Tvrzení (b) vyplývá z věty 1.5(4).
Ve shodě s tím, co jsme uvedli již v poznámce 2.3, nebudeme v dalším úvahy tohoto typu opakovat a ponecháme ověření platnosti analogických vztahů u dalších aritmetických operací čtenáři.
3.3. Věta. (Komutativní zákon) Bud' K ý 0 libovolná množina, bud'ak kardinální číslo pro každé k e K. Bud' f permutace množiny K. Pak platí
^2,ak = ^2af(k).
kčK kčK
Důkaz. Tvrzení plyne z věty 1.4. •
3.4. Důsledek. Pro každá dvě kardinální čísla a, b platí
a + b = b + a.
Z věty 1.5 okamžitě plyne
3.5. Věta. Bud'K ý 0 libovolná množina, ak bud'kardinální číslo pro každé k £ K. Bud' {Kx; x e X} rozklad množiny K. Pak platí
J2ak = J2J2ak-
kčK xčX k£Kx
3.6. Důsledek. Pro každá tři kardinální čísla a, b, c platí
(a + b) + c = a + (b + c).
3.7. Příklad.    (a) Z věty 1.9 plyne, že:
(i) Ko + w = Ho pro každé konečné kardinální číslo n;
(ii) K0 + K0 = K0 + K0 + K0 = • • • = K0 + K0 + • • • + K0 + ... = K0;
Ko-krát
oo
(iii) je-li pro každé přirozené číslo n: 1 < a„ < Ho, pak X an =      například 1 + 2 +
n=l
oo
+ 3 • • • = E n = Ko-
86
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
(b) Je-li a > Ko libovolné, pak pro každé konečné n podle 2.14 platí
a + n = a + $o = a.
3.8. Definice. Buďte a, b libovolná kardinální čísla, A, B buďte libovolné takové množiny, že card A = a, card B = b. Součin kardinálních čísel a, b definujeme takto:
a ■ b := card (A x B).
Obecněji: Buď K ý 0 množina, buď kardinální číslo pro každé k e K. Buďte Ak, k e K, libovolné takové množiny, že card Ak = ak Pro každý index k e K. Pak
Y[ ak ■= card ^)Ak.
kčK kčK
3.9. Věta. (Komutativní zákon) Buď K ^ 0, ak buď pro každé k € K kardinálni číslo, f buď permutace množiny K. Pak
Y\ak = Y\am-
kčK kčK
Důkaz. Potřebujeme dokázat, že pro libovolný systém množin Ak, k e K a pro libovolnou bijekci f: K -> K platí (g) Ak ~ ® A/^)- Buď q> e (g) Ak libovolný prvek. Pak je
kčK kčK kčK
<p: K —>  U Ak a platí <p(k) £ Ak- Je-li /: K —> K bijekce, pak pro každé k e K platí
kčK
((pof)(k) =(p[f(k)] e Af(k), takže (<pof) e (g) Afg^. Defmujeme-lizobrazeníF: (^) Ak —>
kčK kčK
->      Af(k) takto: F(93) = <p o / pro každé A^, je F zřejmě požadovaná bijekce.
kčK kčK
3.10. Důsledek. Pro každá dvě kardinální čísla a, b platí
a ■ b = b ■ a.
3.11. Věta. (Asociativní zákon) Buďte ak, k e K (ý 0), kardinální čísla. Buď{Ky; y € Y} rozklad množiny K. Pak platí
Y[ak = Yi Y\ak
k€K y€Y k€Ky
3. Aritmetika kardinálních čísel
87
Důkaz. Potřebujeme dokázat, že (při odpovídajícím označení)
k€K y€Y k€Ky
Buď tedy <p e (g) Ak libovolný prvek. Pak je <p: K —> [J Aj takové, že pro každý index
kčK kčK
k e K platí f (k) e Ak- Pro každé y e Y nyní položme (py := <p\Ky. Definujeme-li zobrazení O: (g) A i —> (g) (g) A i vztahem [O^Ky) = <py pro každé y e 7, je zřejmě <$> potřebná
keK y€Y k€Ky
bijekce. •
3.12. Důsledek. Pro každá tři kardinální čísla a, b, c platí
(a • b) • c = a • (b • c).
Pro praktické počítání s kardinálními čísly je obzvlášť důležitý následující distributivní zákon, který plyne bezprostředně z věty 1.10.
3.13. Věta. (Distributivní zákon) Buď A ý 0 libovolná množina. Nechť Ba ¥ ^ Je množina pro každé a € A. Pro každé a € A a každé p £ Ba buď aap kardinální číslo. Nechť Y = (g) Ba. Pak platí
Y[ X! aaľJ = X ľ! a€A fÍĚBa /EľueA
3.14. Důsledek. Pro každá tři kardinální čísla a, b, c platí
a ■ (b + c) = a ■ b + a ■ c;       (a + b) ■ c = a ■ c + b ■ c.
3.15. Věta. Buď A ¥ 0 množina, card A = a a ba = b buď kardinální číslo pro každé a e A. Pak platí
^2,ba = ^2/b = a- b.
a e A a e A
Důkaz. Buďte Ba po dvou disjunktní množiny takové, že card Ba=b pro každé a e A. Nechť card B = b. Dokážeme, že U Ba ~ (A x B).
a e A
Pro každé a e A existuje podle předpokladu bijekce /„: Ba -> B. Pro každý prvek x e U Ba existuje právě jeden index ax e A takový, že x e Bax, neboť množiny Ba jsou
a e A
po dvou disjunktní. Položíme-li f(x) = [ax, fax(x)], je zřejmě / bijekce množiny U Ba na
a e A
množinu A x B. •
88
///. KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
3.16. Příklad.
(a) 1 • a = a pro každé kardinální číslo a;
(b) 2 • K0 = K0 + K0 = K0;
(c) w • K0 = K0 + K0 + • • • + K0 = K0;
(d) K0 • K0 = K0 + • • • + K0 + • • • = K0-
3.17. Poznámka. V příkladu 3.7 jsme viděli, že pro libovolné nekonečné kardinální číslo a a libovolné kardinální číslo b < Ko platí
a + b = a (= max (a, b)).
Podle příkladu 3.16 platí
a ■ Ko =       (= max (a> ^o))    Pro každé    0 ý a < Ko.
V §6 odvodíme , že tyto vztahy jsou speciálním případem tzv. pohlcovacích zákonů: pro libovolná dvě kardinální čísla a,b, z nichž alespoň jedno je nekonečné (v případě součinu samozřejmě musí být obě nenulová) platí
a + b = a ■ b = max (a, b).
Aritmetika nekonečných kardinálních čísel je proto velmi jednoduchá. Nyní ještě musíme definovat mocniny kardinálních čísel.
3.18. Definice. Buďte a, b kardinální čísla, A, B buďte takové množiny, že card A = a, card B = b. Pak definujeme
ab := card AB.
První otázkou, kterou nyní musíme rozřešit, je to, zda operace umocňování souvisí „běžným" způsobem s násobením. Ze tomu tak opravdu je, uvidíme v následujícím tvrzení.
3.19. Věta. Bud' B libovolná množina, card B = b. Buďte ap kardinální čísla pro všechna P e B. Jsou-li si všechna čísla ap navzájem rovna, tj. platí-li ap = a pro všechna p e B, pak
J-J ap = J"J a = ab.
3. Aritmetika kardinálních čísel
89
Důkaz. Potřebujeme dokázat, že když Ap,fS e B,jsou takové množiny, že Ap ~ A pro všechna P e B, pak (g) Ap ~ AB.
Buď tedy /'^: A -> A p bijekce pro každé f3 e B. Pro každej e 0 A p bud F (cp): B -» A
zobrazení definované takto: [F(cp)](j6) = /^(fi)] (= (//? o q>){P)). Pak je zřejmě F bijekce (g) Ap na AB. •
3.20. Příklad.
(a) K95 = K0 • K0 = K0;
(b) *l = K0 • K0 ... K0 = K0 pro každé 1 < n < K0;
(c) a° = 1 pro každé kardinální číslo a, zejména tedy 0° = 1;
(d) 0fl = 0 pro každé a > 0.
Cantorovu větu 2.7 nyní můžeme přeformulovat takto:
3.21. Věta. Buďte a, b libovolná kardinální čísla, a > 2. Po/r Z důkazu věty 2.12 a z věty 3.21 okamžitě plyne
3.22. Věta. Buď A libovolná množina, card A = a. Pak card P (A) = 2a, zejména tedy card P (A) > cardA.
3.23. Věta. Budí ý $ libovolná množina, a, b, c, aŕ(i e 7) bwiiie kardinální čísla. Pak platí: (1) až>' = f] aa", z.ejména ab+c = ab ■ ac;
16/
(b) (afc)c = abc;
(c) (]~[ a,)6 = W af, zejména (a ■ b)c = ac ■ bc.
Důkaz. Tvrzení věty plyne bezprostředně z věty 1.5(5) - (7). • O počítání s nerovnostmi mezi kardinálními čísly nás informuje následující tvrzení.
3.24. Věta. Bud A ý 0 množina, buďte ma, na taková kardinální čísla, ž.e pro každé a G A platí ma < na. Pak:
(1) Yl ma < E w«;
ciěA a€A
90
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
(2) f] ma < f] na.
ciěA a e A
Důkaz. (1) Buďte Ma a Na takové po dvou disjunktní systémy množin, že pro každé a e A platí card Ma = ma, card Na = na. Ze vztahu ma < na plyne, že Ma ~ N'a c Na. Pak ale podle věty 1.5(4) platí U Ma ~ U K c U Na, tj. £ ™<* < E n„.
uea aeA aeA aeA aeA
Tvrzení (2) se dokáže analogicky. • Z vět 3.24 a 3.19 okamžitě plyne
3.25. Důsledek. Pro každá kardinální čísla m, n, p platí:
(1) n < p =3- m" < mp;
(2) m < n =ŕ mp < np.
3.26. Poznámka. Protože z věty 3.24 zejména plyne, že pro každá kardinálni čísla m, n, p taková, že m < n, platí m + p < n + pa rovněž m- p < n- p, vidíme, že pro počítání s nerovností < platí v aritmetice kardinálních čísel tatáž pravidla jako v aritmetice čísel přirozených. Je však zřejmé, že při počítání s ostrou nerovností < analogická pravidla neplatí: ačkoliv například 2 < 3, přesto 2 + Ko = 3 + Ko (a nikoliv 2 + Ko < 3 + Ko) nebo 5 • Ko = Ko • Ko = Ko (a nikoliv 5 • K0 < K0 • K0).
4   Mohutnost kontinua
Odborník je člověk, který úzkostlivě dbá na to, aby se vyvaroval drobných chyb, zatím co se nezadržitelně řítí k jednomu velkému omylu. Weinbergův důsledek Allisonovy zásady
Již ve větě 2.10 jsme odvodili, že množina R všech reálných čísel je nespočetná. Poněvadž číslo card R hraje v řadě úvah důležitou roli, budeme se jím nyní zabývat podrobněji.
4.1. Definice. Kardinální číslo c := 2^° nazýváme mohutností kontinua.
Z věty 3.21 víme, že c = 2^° > Ko. Nyní uvedeme další vlastnosti čísla c. 4.2. Věta. Bud'n libovolné přirozené číslo (tj. 1 < n < Koj. Pak platí:
(1) n + c = K0 + c = c + c = c;
(2) n ■ c = K0 • c = c • c = c;
4. Mohutnost kontinua
91
(3) c" = c;
(4) pro n > 1 platín*0 =      = c*° = C. Důkaz.
(1) Platí: c<ra + c<Ko + c<c + c = 2- c = 2-2*0 = 21+*°
(2) Platí: c < n • c < K0 • c < c • c = 2*° • 2*° = 2*0+*° = 2*°
(3) Plyne indukcí z (2).
(4) c = 2*° < n*° < Kq0 < c*° = (2*°)*° = 2^°^° = 2*° = c. 4.3. Věta. Následující množiny mají mohutnost kontinua:
(a) množina R všech reálnych čísel;
(b) interval (O, 1);
(c) každý (netriviálni) interval reálných čísel;
(d) množina všech iracionálních čísel;
(e) množina všech transcendentních čísel;
(f) množina všech posloupností přirozených čísel;
(g) množina R" (n přirozené) všech uspořádaných n-tic reálných čísel;
(h) množina ^P(N) všech podmnožin množiny přirozených čísel.
Důkaz. Dokážeme nejprve, že card (0, 1) = c.
Podle věty 4.2(4) je 10^° = c. Podle definice mocniny kardinálních čísel je 10^° = card AN, kde card A = 10. Zvolíme-li A = {0, 1, 2, ..., 9}, je F = AN množina všech posloupností utvořených z cifer 0, 1, ..., 9. Označme G množinu těch posloupností, v nichž se od jistého indexu počínaje opakuje pouze devítka, tj.
G= j/eF; / = (a„)^j, existuje k & N tak, že a,- = 9 pro všechna i >
Podle věty 1.15 je G spočetná, takže podle věty 2.13 platí card (F — G) = cardF = c. Přiřadíme-li nyní každému prvku / = (ch,)^ e F — G číslo 0,a\a2 .. .an ..., obdržíme zřejmě bijekci množiny F — G na interval (0, 1). Dokázali jsme tak, že card (0, 1) = c. Z důsledku 2.10 okamžitě plyne, že i card R = c.
Vzhledem k tomu, že card Q = Ko (důsledek 1.14) a rovněž množina algebraických čísel je spočetná (poznámka 1.17), plyne z předchozího okamžitě tvrzení (d) i (e). Tvrzení (c) plyne z příkladu 1.3(b). (Uvědomme si, že podle věty 4.2 na mohutnost intervalu reálných čísel nemá vliv, zda koncové body do tohoto intervalu patří či nikoliv.)
= 2*° = c. = c.
92
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
Množina všech posloupností přirozených čísel je množina N . Její mohutnost K0° je však c podle věty 4.2(4), tj. platí (f).
Tvrzení (g) plyne z věty 4.2(3), tvrzení (h) z věty 3.22. •
4.4. Příklad. V příkladu 3.7(iii) jsme odvodili, že
l+2+3 + --- = ^w = K0.
Nyní ukážeme, že
Y\n=l  2 3> =c.
Platí totiž
1 • 2 • 3 • ... < K0 • K0 • K0 • ... =      = c,
«o-krát
avšak současně
l-2-3---- = 2- 3- 4- ...> 2_2_2___. = 2*° = c.
Ko-krát
4.5. Poznámka. Jak jsme uvedli již v §2, systém všech kardinálních čísel tvoří vlastní třídu. (Toto tvrzení dokážeme v §6, důsledek 6.15.) V definici 2.2 jsme na této třídě definovali uspořádání a z věty 2.5 víme, že vzhledem k tomuto uspořádání tvoří každá množina kardinálních čísel řetězec. Víme například, že Ko je nejmenší nekonečné kardinální číslo (poznámka 2.6) a že ke každému kardinálnímu číslu existuje číslo větší (poznámka 2.8), avšak prakticky žádné další informace o struktuře řetězce kardinálních čísel nemáme. Víme například, že Ko < 2^°, nevíme však, existuje-li kardinální číslo m takové, že Ko < m < 2®°. (Předpoklad, že takové číslo m neexistuje, tzv. hypotéza kontinua, patří k nejznámějším matematickým problémům 20. století. O jeho vyřešení viz poznámku 6.23.) V této chvíli neumíme ani rozhodnout, zda má každé kardinální číslo svého bezprostředního následníka či nikoliv.
Tyto a další informace získáme pomocí tzv. ordinálních čísel.
Cvičení k §4
Hlavní příčinou problémů jsou jejich řešení. Sevareidův zákon
1. Dokažte, že když je 2a > Kq, pak je 2a > c.
5. Ordinální typy a ordinální čísla
93
2. Dokažte následující tvrzení: Množina všech spojitých funkcí f: R -> R má mohutnost kontinua.
(Návod: Buď (an)^! posloupnost všech racionálních čísel. Přiřaďte každé spojité funkci /: R —> R posloupnost (/(an))^. Dokažte, že f ^ g právě tehdy, když (f(a„)) ý ¥ (g(fln))- Tvrzení pak lze již snadno odvodit.)
3. Dokažte, že množina všech funkcí /: R —> R má mohutnost 2C.
5   Ordinální typy a ordinální čísla
Pokrok neznamená, Ž,e se chybná teorie nahradí správnou. Pokrok spočívá v tom, ž,e se chybná teorie nahradí takovou,
na které to není tolik znát. Hawkinsova teorie pokroku
V §1 jsme každé množině A přiřadili její kardinální číslo. Nyní analogicky každé uspořádané množině přiřadíme její ordinální typ. Tak jako podstata kardinálních čísel spočívala v tom, že card A = card B právě tehdy, když A ~ B, spočívá smysl ordinálních typů ve skutečnosti, že stejný ordinální typ mají právě jen izomorfní uspořádané množiny.
5.1. Definice. Řekneme, že uspořádané množiny A, B mají stejný ordinální typ a píšeme ~A~ = ~B, je-li A = B.
5.2. Poznámka. Pro ordinální typy některých často se vyskytujících množin je výhodné zavést si standardní označení. Tak například ordinální typ prázdné množiny značíme symbolem 0, ordinální typ řetězce o n prvcích (n libovolné přirozené) značíme symbolem n, ordinální typ množiny N všech přirozených čísel s obvyklým uspořádáním značíme co, ordinální typ množiny N* značíme co* a podobně1. (Značíme tedy stejnými symboly konečná kardinální čísla i ordinální typy konečných řetězců. K omylu však v dalším nedojde, neboť z kontextu bude vždy zřejmé, v jakém významu budeme těchto symbolů užívat.)
Připomeňme, že pro uspořádanou množinu A značí A* množinu uspořádanou duálně, tj. (A, <)* = (A, >). Typ ai* má tedy například množina všech celých záporných čísel s obvyklým uspořádáním.
94
///. KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
Z definice izomorfismu také plyne, že když A = B, pak také card A = card B (pozor: ne naopak!). Má tedy smysl mluvit o mohutnosti daného ordinálního typu. (Například typy co i co* mají mohutnost Ko.)
Pomocí aritmetických operací mezi uspořádanými množinami, které jsme definovali v kapitole II, §3, nyní snadno zavedeme aritmetické operace mezi ordinálními typy.
Poznamenejme ještě, že zápisem A = a rozumíme fakt, že ordinální typ uspořádané množiny A jsme označili symbolem a (například N = co).
5.3. Definice. Buďte a, p ordinální typy. Zvolme disjunktní uspořádané množiny A, B tak, že A = a, B = {3. Pak součet typů a, p definujeme vztahem:
Obecněji: Buď 7^0 uspořádaná množina, buď a, ordinální typ pro každé i e I. Buďte A,, i e I, po dvou disjunktní uspořádané množiny takové, že A, = a, pro každé i e I. Pak definujeme
5.4. Poznámka. Podobně jako u početních operací s kardinálními čísly i operace mezi ordinálními typy definujeme pomocí množin o příslušných ordinálních typech. U každé operace je pak ale nutno dokázat, že výsledek nezávisí na konkrétní volbě těchto množin. K definici 5.3 je tedy nutno dokázat, že když A,, 7?,, i e I jsou po dvou disjunktní systémy uspořádaných množina takové, že A, = 7?, (tj. A, = 7?,) pro každé i e I, pak také     A,- = Yl Bi- Důkaz
tohoto tvrzení je však jednoduchý a proto ho přenecháme čtenáři. V dalším pak již úvahy tohoto typu nebudeme opakovat.
Z věty 3.11 v II. kapitole okamžitě plyne:
5.5. Věta. (Asociativní zákon) Budí ý 0 uspořádaná množina, buďoii ordinální typ pro každé i e I. Nechť I = Y h- Pak platí
kčK
a + p := A + B.
5.6. Důsledek. Buďte a, /3, y libovolné ordinální typy. Pak platí
(a + f}) + y = a + (fi + y).
5. Ordinální typy a ordinální čísla
95
5.7. Poznámka. Z příkladu 3.3 v II. kapitole plyne, že sečítání ordinálních typů obecně není komutativní.
5.8. Příklad.
(a) co + 1 ý 1 + co, neboť je zřejmé, že 1 + co = co avšak co + 1 ^ co;
(b) 1 + 2 + 3 + • • • + n + ■ ■ ■ = co.
5.9. Definice. Buďte a, p libovolné ordinální typy. Buďte A, B libovolné uspořádané množiny takové, že A = a, B = {3. Pak definujeme
Z věty 3.14 v II. kapitole plyne levý distributivní zákon.
5.11. Věta. Bud' I ý 0 uspořádaná množina, bud'a i ordinální typ pro každé i e 7. Pak pro libovolný ordinální typ a platí
5.12. Důsledek. Buďte a, /3, y libovolné ordinální typy. Pak platí
a-(P + y)=a-p+a-y.
5.13. Věta. Budí ý 0 uspořádaná množina, I = /3. Buďoti = a ordinální typ pro každé i e 7. Pak platí
a ■ p := A ■ B.
Z věty 3.13 v II. kapitole plyne
5.10. Věta. Buďte a, /3, y libovolné ordinální typy. Pak platí
(a ■ P)- y = a ■ (P-y).
a = a ■ p.
Důkaz plyne z věty 3.17 v II. kapitole.
5.14. Příklad.
(a) 2-ftj = 2 + 2 + 2 + -- - + 2+ -- - = ftj;
96
///. KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
(b) (ú-2 = (ú + (úý(o;
(c) a>-a> = co + a> + a> + -- - + a>+....
5.15. Definice. Buď a libovolný ordinální typ. Mocninu s konečným exponentem definujeme indukcí takto:
5.16. Příklad. (a)a>=a>-a> = a> + a> + -- - + a>+...
(b) a) + a)2 = ctí(l + ctí) = ctí • ctí = ctí2
(c) ctí2 + ctí = ctí • (ctí + 1) 7^ ctí2
(d) (ctí + ctí) • ctí = (ctí • 2) • ctí = ctí • (2 • ctí) = ctí2
(e) ctí • (ctí + ctí) = ctí • (ctí • 2) = (ctí • ctí) • 2 = co2 + ctí2
Uvědomme si, že všechny ordinální typy v příkladu 5.16 jsou spočetné.
5.17. Definice. Ordinální typ dobře uspořádané množiny se nazývá ordinální číslo.
5.18. Příklad. 0,1,2,3,...,co,co+í,cú + 2,cú + cú atd. jsou ordinální čísla, a>* není ordinální číslo, R není ordinální číslo atd.
Z věty 3.18 v kapitole II. plyne
5.19. Věta. Budí ý 0 dobře uspořádaná množina, buď<Xi ordinální číslo pro každé i £ I. Pak je 2~2<Xi ordinální číslo.
Z vět 3.19 a 3.20 v II. kapitole plyne
5.20. Věta. Buďte a, p libovolná ordinální čísla. Pak jsou a + /3, a ■ /3 rovněž, ordinální čísla. Nyní budeme definovat mezi ordinálními čísly nerovnost.
5.21. Definice. Buďte a, p ordinální čísla. Nechť A, B jsou takové uspořádané množiny, že A = a, B = ji. Pak definujeme a < p právě tehdy, když existuje x e B tak, že A = B(x). Je-li a < p nebo a = ji, píšeme a < ji.
5.22. Věta. Buď A libovolná množina ordinálních čísel. Pak je (A, <) řetězec.
5. Ordinální typy a ordinální čísla
97
Důkaz. Je zřejmé, že relace < je reflexivní a tranzitivní. Antisymetrická je podle věty 2.7, úplnost plyne z věty 2.13. •
5.23. Poznámka. Později uvidíme, že podobně jako kardinální čísla tvoří i všechna ordinální čísla vlastní třídu. (Viz §6.)
5.24. Definice. Buď a libovolné ordinální číslo. Symbolem W(a) označíme množinu všech ordinálních čísel f3 takových, že f3 < a.
5.25. Příklad.
W(0) = 0 W(0) = 0 = 0
W(l) = {0} WjV) = {0} = 1
W(2) = {0, 1} W(2) = {ČU} = 2
W(co) = {0,1,2,...} W(co) = co
To, co naznačují uvedené příklady, dokážeme zcela obecně.
5.26. Věta. Buď a libovolné ordinální číslo. Pak platí
W(ä) = a,
tj. W(a) je dobře uspořádaná množina a má typ a.
Důkaz. Buď a ordinální číslo, A taková uspořádaná množina, že A = a. Pro každé x e A označme <p(x) ordinální typ množiny A(x). Pak je zřejmě cp: A —> W(a). Dokážeme, že cp je izomorfismus.
Buď f3 e W(a) libovolné ordinální číslo. Pak je yS < a. Podle definice 6.7 existuje ke každé množině B, B = f3, prvek x e A takový, že B = A(x), tj. f3 = <p(x). Je tedy cp surjekce.
Pro x, j e A, x < y je zřejmě A(x) < A(y), tj. <p(x) < <p(j), takže cp je izotonní injekce. Pak je cp^1: W(a)     A zřejmě také izotonní, takže cp je izomorfismus. •
5.27. Věta. Každá množina ordinálních čísel je dobře uspořádaná.
Důkaz. Buď M libovolná množina ordinálních čísel, N ý 0 její libovolná podmnožina. Zvolme a e N libovolně. Není-li a nejmenší prvek množiny N, je P = N n W(a) ^ 0. Protože je 0 ^ P c W(a), obsahuje množina P podle věty 5.26 nejmenší prvek f3. Je však zřejmé, že f3 je nejmenší prvek množiny N, takže množina M je dobře uspořádaná. •
5.28. Poznámka. Buď M ^ 0 libovolná množina ordinálních čísel. Podle věty 5.27 je M = fi ordinální číslo. Podle věty 5.26 platí W(ijl) = /x, tj. W(ijl) = M. Podle věty 2.11 existuje právě jeden izomorfismus f:M—> W(ijl). Tzn., že množinu M lze jednoznačně psát jako řetězec
M = {a0 <«!<•••< orf < ... }?<ří.
98
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
5.29. Věta. Každé ordinální číslo a má svého bezprostředního následovníka, kterým je číslo a+1.
Důkaz. Nechť A = a. Buď b £ A libovolný prvek (například {A}). Položme B = A + {b}. Pak B = a + 1. Protože A = B(b), platí a < a + 1. Buď nyní p < a + 1 libovolné ordinální číslo. Podle definice uspořádání je p typ některého začátku množiny B, takže zřejmě platí p < a. Neexistuje tedy p takové, i&a < Ě <a+\. • Z věty 5.29 neplyne, že by každé ordinální číslo muselo mít svého bezprostředního předchůdce! (Víme, že bezprostředního předchůdce nemá například číslo co). Má tedy smysl následující definice:
5.30. Definice. Ordinální číslo, které má bezprostředního předchůdce, se nazývá izolované. Číslo, které není izolované, se nazývá limitní.
5.31. Příklad. Čísla 1,2, ... ,n,co + l, co + 2, ..., co + co + 1 jsou izolovaná, čísla 0, co, co ■ ■ 2, ..., co ■ n jsou limitní.
5.32. Věta. Buďte a, p,y libovolná ordinální čísla. Pak platí:
(1) a<p^y+a<y+P;
(2) a<p^>a + y<p + y.
Důkaz. (1) Buďte A, B, C po dvou disjunktní uspořádané množiny, A = a, B = p, C = y. Protože je a < fi, existuje x e B takový, že A = B(x). Označme C + A = D,C + B = E. Pak je zřejmě D = E (x), tj. y + a < y + fi.
(2) Je-li a = p,]ea + y = p + y,t].a + y < p + y. Nechť tedy a < p. Nechť A, B, C jsou množiny s vlastnostmi jako v (1). Protože A = B(x) pro vhodný prvekx, existuje izomorfismus A + C do B + C. Tvrzení je nyní zřejmé. •
5.33. Důsledek. Buďte a, p libovolná ordinální čísla. Pak platí:
(1) je-li {3^0, pak a + p > a;
(2) a + p > p.
Důkaz. (1) Je-li p > 0, je podle věty 5.32(1) a + 0 < a + p, tj. a < a + p.
(2) Protože 0 < a, je 0 + p < a + p, tj. p <a + p podle věty 4.2(2). •
5.34. Věta. Buď M ¥ $ množina ordinálních čísel neobsahující největší prvek. Nechť M = = {cŕo < aj < • • • < cťj < .. . }^<m- Pak pro každý prvek ae e M platí
ae <       cŕ£.
6. Třída všech ordinálních čísel. Alefy
99
Důkaz. Připusťme, že existuje ag e M takový, že ag >  Yl a%- Protože aQ není nej větší
prvek v M, existuje ae+1 e M, ae+1 > ae > X a%- Buďte Aj, £ < M, po dvou disjunktní
uspořádané množiny takové, že pro každé £ < M platí A^ = cťj. Označme A = X ^? • Protože
X      < cťe+i, existuje x e Ae+1 takový, že A = Ae+1(x). Protože Ae+1 c A, plyne odtud, že
Ae+i je izomorfní s vlastní podmnožinou svého vlastního začátku, což je spor s větou 2.7. • V definici 5.15 jsme definovali mocninu libovolného ordinálního typu v případě, že exponentem bylo konečné ordinální číslo. Transfmitní indukcí nyní tuto definici zobecníme.
5.35. Definice. Buď a libovolné ordinální číslo. Pak definujeme:
1. a°= 1;
2. a^+1 =     ■ a;
3. = X aQ pr° £ ¥ 0 limitní.
5.36. Příklad. coa = £ «e = 1 + o) + co2 + ... .
g<co
Z věty 5.34 okamžitě plyne, že pro každé přirozené n platí co" < cow. Dále víme, že co" je spočetný ordinální typ, takže i cow je spočetný ordinální typ.
6   Třída všech ordinálních čísel. Alefy
Po složitém řešení vždy přichází jednoduché vysvětlení. LUNSFORDOVO PRAVIDLO
6.1. Věta. Bud' M ý 0 libovolná množina ordinálních čísel. Pak existuje ordinální číslo a takové, ž.e pro každý prvek q € M platí q < a.
Důkaz. Obsahuje-li M nej větší prvek £, stačí položit a = £ + 1. Nechť tedy M neobsahuje největší prvek. Podle poznámky 5.28 lze psát
M = {a0 < ■ ■ ■ < orf < ... }?<^
a podle věty 5.34 stačí položit a = X a%- •
100
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
6.2. Důsledek. Neexistuje množina všech ordinálních čísel (tj. třída všech ordinálních čísel je vlastní).
Důkaz. Připusťme, že existuje množina M všech ordinálních čísel. Podle 6.1 existuje ordinální číslo a takové, že a > £ pro každé £ e M. Protože však a e M, plyne odtud a > a: spor. •
6.3. Věta. Buď M libovolná množina ordinálních čísel. Pak mezi ordinálními čísly, která nepatří do M, existuje nejmenší.
Důkaz. Podle věty 6.1 existuje ordinální číslo a £ M. Pokud a není nejmenší číslo nepatřící do M, je W(a) - Hledaný prvek je nyní nejmenší prvek množiny W(a) — M. •
6.4. Poznámka. Je-li m konečné kardinální číslo, existuje právě jedno ordinální číslo mohutnosti m. Pro nekonečné kardinální číslo je však situace nepoměrně složitější. Podívejme se například, jak vypadá množina Z\ všech spočetných ordinálních čísel.
Nejmenším prvkem množiny Z\ je prvek co. Je-li totiž a ordinální číslo, a < co, je a typ množiny izomorfní s některou množinou N(x), x e N, takže a je konečné ordinální číslo.
Když využijeme odvozených vlastností aritmetických operací mezi ordinálními čísly, vidíme, že množina Z\ vypadá následovně (čtenář nechťsi promyslí, že všechna uváděná ordinální čísla jsou opravdu spočetná):
co, co + 1, co + 2, ..., co + n,..., co + co = co ■ 2, co ■ 2 + 1, ..., co ■ 2 + n, ..., co • 2 + co = co • 3, 4, ..., co ■ n, ..., co ■ co = co2, co2 + 1, ..., co2 + n,... co2 + co,
co2 + co + 1, ..., co2 + co + co = co2 + co ■ 2, co2 + co ■ 2 + 1, ..., co2 + co ■ 2 + co = co2 + co ■ 3, ..., co2+co-4,..., co2+co-co = co2+co2 = co2-2, co2-2+1,..., co2-2+co,..., co2-2+co+co = co2-2+co-2, ..., co2 ■ 2 + co ■ 3,..., co2 ■ 2 +a)2 = co2 ■ 3,..., co2 ■ 4,..., co2 ■ co = co3, co3 + 1,..., co3 +co,..., co3 + co • 2,..., co3 + co • 3,..., co3 + co2, ..., co3 + co2 + co, ..., co3 + co2 + co • 2,..., co3 + co2 • 2, ...,Ctí + co • í, . . . , co + co = co ■ Z, ..., co • í, ..., co - co = co,...,co,...,co,..., coOJ = m<° + 1, • • •, m<° +     • • •, m<° + m ■ 2, • • •, coOJ + co ■ co = coa + co2,... ,coa + c02 + co,
n<cú
..., co03 + co2 + co ■ 2, ..., co03 + co2 + co ■ 3, ..., co03 + co2 ■ 2, ..., co03 + co3,..., coOJ + coOJ = coOJ ■ 2, ..., co03 ■ 3, co03 ■ 3 + 1, co03 ■ 3 + 2, ..., co03 ■ 3 + co, ..., co03 ■ 3 + co ■ 2,..., co03 ■ 3 + co2, co03 ■ 4,..., co03 ■ co = co03+\..., co03+1 -2,..., co03+2,co03+3,co03+03 = co03'2,co03 03 = co03\
3 4 co co0-1 co0-1' co co0J
. . . , co    ,. . . , co    , . . . , co    , . . . , co       , . . . , co .= co   + co     + co       + ■ ■ ■ + co +■■■=.£,
s + 1, s + 2,..., s + ctí,... atd., atd.
Nyní je samozřejmá otázka, zdaje množina Z\ spočetná nebo nespočetná. Najít odpověď na tuto otázku je však velmi jednoduché. Podle Zermelovy věty 4.7 existují nespočetné dobře uspořádané množiny, tj. existují nespočetná ordinální čísla. Podle věty 6.3 existuje nejmenší nespočetné ordinální číslo; označme toto číslo co\. Podle věty 5.26 je W(co\) = co\, takže W(coi) = {0} U N U Z\ je nespočetná. Protože N je spočetná, je Z\ nutně nespočetná. Číslo card Z\ ý    označme Kj.
6. Třída všech ordinálních čísel. Alefy
101
Nyní zobecníme postup, který jsme prováděli pro kardinální číslo Kq.
6.5. Definice. Buď m libovolné nekonečné kardinální číslo. Označme Z(m) množinu všech ordinálních čísel mohutnosti m. Nej menší prvek množiny Z(m) označme co(m). Číslo co(m) nazýváme počáteční ordinální číslo mohutnosti m.
6.6. Poznámka. Uvědomme si, že definice 6.5 je naprosto regulérní. Z Zermelovy věty 4.7 plyne, že Z(m) je vždy neprázdná množina. Zvolíme-li totiž libovolné nekonečné kardinální číslo m a libovolnou množinu M této mohutnosti, existuje podle Zermelovy věty 4.7 na této množině dobré uspořádání. Ordinální typ takto vzniklé uspořádané množiny je tedy ordinální číslo zvolené mohutnosti m, takže existují ordinální čísla každé mohutnosti. Existence čísla co(m) plyne z věty 5.27. Číslo co(m) je přitom vždy limitní. Kdyby totiž platilo co(m) = a + 1 pro některé a, bylo by a e Z (m), a < co(m), což není možné.
6.7. Věta. Bud'm libovolné nekonečné kardinální číslo. Pak je Z (ni) limitní ordinální číslo.
Důkaz. Označme £ = Z(m). Podle věty 5.27 je £ ordinální číslo. Množina Z(m) neobsahuje nej větší prvek, neboť a £ Z (m) =>• a+l e Z (m). Odtud však plyne, že Z(m) c   U   W(a) =
a€Z(m)
= W. Je-li p e W libovolný prvek a y < p libovolné ordinální číslo, je také y e W (neboť P e W(a) =^ y e W(a) c W). To znamená, že W = W(q), kde q je nejmenší ordinální číslo takové, že q £ W. Podle věty 5.26 platí W(q) = q, tj. W = q a číslo q je limitní ordinální číslo podle poznámky 6.6. Nyní však platí
W = W(q) = W[co(m)] + Z(m),
tj. q = co (m) + £. Protože je q limitní, je nutně i £ limitní. (Kdyby totiž platilo £ = £ + 1, platilo by q = co (m) + (£ + 1) = (co(m) + £) + 1 ag>by nebylo limitní.) •
6.8. Definice. Buď m libovolné nekonečné kardinální číslo. Označme
A(m) := {co(n); Ko < n < m}.
Nechť A(m) = a. Pak číslo co(m) označíme coa a kardinální číslo m označíme K„.
6.9. Poznámka. Protože je A(m) množina ordinálních čísel, je dobře uspořádaná, tj. A(m) = a je ordinální číslo. Protože W(a) = a, je A(m) = W(a). Platí například
A(K0) = {co(n)\ H0 < « < K0} = 0,
tj. A(Ko) = 0. Nejmenší ordinální číslo o mohutnosti Ko, tj. číslo co, máme tedy podle 6.8 označit coq. Značení čísla    je přitom ve shodě s touto definicí.
102
///. KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
Z definic 6.5 a 6.8 okamžitě plyne následující tvrzení:
6.10. Věta. Každé nekonečné číslo je některým alefem.
Z uvedené konstrukce plyne, že každé počáteční ordinální číslo i každá mohutnost je coa, respektive K„, kde a je nějaké ordinální číslo. Nyní postupně ukážeme, že naopak každé ordinální číslo je indexem některého počátečního ordinálního čísla a tedy i některého alefu.
6.11. Věta. Buďte coa, cop libovolná počáteční ordinální čísla. Pak coa < cop právě tehdy, když a < ji.
Důkaz. Podle poznámky 6.9 platí A (m) = W(a), kde a = A(m),A(n) = W(B), kde p = A (n). Platí:
a < p   <í==^   W(a) je vlastní začátek v množině W(fi) <í=í>
<í=í>   A(m) je vlastní začátek v A(n) ^=>- co(m) < co (ti) <í=í> <í=^   coa < cop.
6.12. Věta. Každé ordinální číslo je indexem některého alefu.
Důkaz. Připusťme, že existuje ordinální číslo a, které není indexem žádného alefu a tedy ani žádného počátečního ordinálního čísla. Pak lze předpokládat, že a je nejmenší takové ordinální číslo.
Mohou nastat dva případy:
(a) a je izolované číslo, tj. a = /? + 1. Podle předpokladu tedy existuje počáteční ordinální číslo cot a $p = card cop. Označme cp = Z(K^). Podle věty 6.7 je cp limitní ordinální číslo. Označíme-li q = cop + cp, platí (viz důkaz věty 6.7)
W(q) = W(cop) + Z(Kp) = W(cjop) + {y; card y = K^}.
Odtud však
A(cardq) = {coa; a < cop} + cop,
takže index počátečního ordinálního čísla mohutnosti card q je roven p + 1 = a: spor.
(b) a je limitní číslo. Platí a > 0, neboť 0 je indexem alefu. Podle předpokladu je každé ordinální číslo £ < a indexem některého počátečního ordinálního čísla co%. Toto číslo co% je přitom podle věty 6.11 jednoznačně určeno. Položme nyní
Z=   (J   Z(card£),       W = |J Pak je cp = W opět počáteční ordinální číslo a zřejmě cp = coa: spor. •
6. Třída všech ordinálních čísel. Alefy
103
6.13. Důsledek. Každé ordinální číslo je indexem právě jednoho alefu, přičemž, pro každá ordinální čísla a, p platí
a < p    právě když    H„ < .
Odtud a z věty 5.27 plyne
6.14. Důsledek. Každá množina kardinálních čísel je dobře uspořádaná. Z důsledků 6.13 a 6.2 plyne
6.15. Důsledek. Neexistuje množina všech kardinálních čísel (tj. třída všech kardinálních čísel je vlastní).
Z důsledku 6.13 a věty 5.29 plyne
6.16. Důsledek. Pro každé ordinální číslo a platí Ka < Ka+i, přičemž, neexistuje kardinální číslo m takové, ž.e Ka < m < Ka+i.
Již v poznámce 3.17 jsme uvedli, že aritmetika nekonečných kardinálních čísel je jednoduchá vzhledem k platnosti tzv. pohlcovacích zákonů. Nyní již můžeme platnost těchto zákonů dokázat. Nejprve však uveďme jedno pomocné tvrzení.
6.17. Lemma. Buďte a > f3 libovolná ordinální čísla. Pak existuje právě jedno ordinální číslo y takové, že a = f3 + y.
Důkaz. Buď A libovolná taková uspořádaná množina, že A = a. Pak v A existuje právě jeden začátek B takový, že B = f3. Označíme-li y = A — B, je a = f3 + y. Zbývá tedy dokázat, že toto číslo y je určeno jednoznačně.
Nechť f3 + Yi = f3 + y2. Podle věty 5.32(1) nemůže platit y\ < y2 ani y2 < y1; takže platí Yi = Y2- •
6.18. Věta. Pro každé ordinální číslo a platí
Důkaz. Pro a = 0 jsme tvrzení dokázali v příkladu 3.16. Podle principu transfmitní indukce tedy stačí dokázat, že když • = pro každé £ < r, pak také Kr • Kr = Kr (při libovolné volbě čísla t).
Položme tedy M := W(coľ) x W(cor) (podle definice platí card W(cor) = Kr). Pro [f3, y] e e M platí f3 < coľ, y < cor. Číslo X = f3 + y nazveme výškou prvku [f3, y\. Nejprve ukážeme, že X = f3 + y < cor.
Označme a = card W(f3), b = card W(y). Nechť například a < b. Pak platí a < b < Kr. Nyní mohou nastat tři případy:
104
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
(1) B, y jsou konečná ordinální čísla. Pak je tvrzení P + y < cor zřejmé.
(2) B je konečné, y nekonečné. Pak je a + b = b, tj. card (B + y) = card y < < KT, tj. yS + y < Kr.
(3) B, y jsou nekonečná kardinální čísla. Pak jsou a, b některé alefy a podle indukčního předpokladu platí a ■ a = a, b ■ b = b. Pak ale
b<a + b<b + b = 2- b<b-b = b,
takže stejně jako v (2) platí a + b = b, tj. platí B + y < coľ.
Dokázali jsme tak, že výška X každého prvku množiny M je prvek množiny W(cor). Pro každé X < cor nyní položme
Mx= { [B,y] eM; B + y = X},    M = \J Mx.
X<cút
Zvolme nyní X < cox libovolně. Podle lemmatu 6.17 existuje pro každé B < X právě jedno ordinální číslo y takové, že p + y = X, tj. existuje právě jeden prvek y] e Mx- To však znamená, že Mi ~ Wx+i, tj-existuje bijekce /: W(Á+1) —»- Mx-Definujeme-li nyní uspořádání na Mx tak, aby / byl izomorfismus, je Mx = W(X + 1), tj. Mx = X + 1. Protože jsou množiny Mx, X < cůx, po dvou disjunktní, můžeme utvořit jejich součet; jinak řečeno, M lze uspořádat tak, že platí M =    X   m'a- platí ~M = $ =    E   O + !)•
XěW(ojt) XěW(ojt)
Nyní dokážeme, že ů = cor. Protože podle věty 5.34 platí ů > cor, stačí dokázat, že nemůže platit ů > Lúr. Dokážeme to sporem.
Připusťme tedy, že ů > cor. Pak ale existuje £j = [B\,y\\ e M tak, že pro vlastní začátek M(£i) platí M(%i) = cor. Označme X i = f3\ + y\. Podle předchozího je X j < cor, tj. cardÁj < Kr. Pro každé £ = [b, y] e M(£\) však platí p + y < X\, takže tím spíše je B < X\, y < X\. Poněvadž je však card X\ < Kr, platí podle indukčního předpokladu
card {[B, y] e M; B < Aj + 1, y < Aj + 1} = card Aj.
Odtud však plyne, že card M(£i) < card Aj < Kr: spor.
Tím je věta dokázána. •
6.19. Důsledek. (Pohlcovací zákony) Buďte a, B libovolná ordinální čísla, max (a, B) buď větší z, nich. Pak platí
tj. součet i součin dvou nekonečných kardinálních čísel je větší z těchto dvou kardinálních čísel.
6. Třída všech ordinálních čísel. Alefy
105
Důkaz. Nechť například p < a. Pak je     < H„ a platí
K < K + tip < K + K = 2 • K < K ■ K = K«,
tj. K„ + ^ = K„. Podobně
tj. K •    = K- •
Nyní již můžeme snadno určit mohutnost množiny Z(m) pro libovolné nekonečné kardinální číslo m. Platí
6.20. Věta. Pro každé ordinální číslo a platí
card Z(K„) = Ha+1.
Důkaz. Je zřejmé, že Z(K„) = W(coa+i) — W(coa). Avšak card Z(K„) je některý alef. Nechť tedy například card Z(K„) = KK. Protože W(coa+i) = Z(K„) + W(coa), dostáváme Ka+1 = KK + + K„ = Kmax(Ka), tj. a + 1 = max(y, a). Protože a < a + 1, znamená to, že y = a + 1. •
Tvrzení věty 6.20 lze ještě zesílit. Podle ní totiž platí card Z(K„) = = Ka+i = card W(cůa+\). Ukážeme, že množiny Z(K„) a W(coa+i) mají nejen stejné kardinální číslo, ale i stejný ordinální typ.
6.21. Věta. Bud'(júa libovolné počáteční ordinální číslo. Pak pro každý prvek £ e W((oa) platí
W(coa) = W(coa) -
Důkaz. Označme        = W(eoa) - Pak W(eoa) = + Protože = £,
platí card W(ij) < K, neboť£ < coa. Dále platí card W(coa) = Kfl = card [W(ij) +B(ij)], takže card = H„, podle důsledku 6.19. Protože platí B(%) < coa acoa je nejmenší ordinální číslo o mohutnosti K„, plyne odtud celkem B(%) = coa. •
6.22. Důsledek. Pro každé ordinální číslo a platí
Z(K„) = ftja+1.
Důkaz. Platí Z(K«) = - Podle věty 6.21 platí
Z(K) = W(coa+1) - W(coa) = W(coa+1) =a+l.
106
KARDINÁLNÍ A ORDINÁLNÍ ČÍSLA
6.23. Poznámka. Mohutnost kontinua c = 2^° je podle věty 6.10 některým alefem. Podle věty 3.21 platíc > Kj. Již Cantor předpokládal, že c = Kj. Jak jsme uvedli již v 4.5, nazýval se tento předpoklad hypotéza kontinua.
Tato hypotéza patří k nej známějším matematickým problémům 20. století. Samotný Cantor ji zformuloval již v r. 1878 a dokonce několikrát prohlašoval, že její důkaz v nejbližší době uveřejní. Nikdy se mu však hypotézu nepodařilo rozřešit. Dnes víme, že to bylo vcelku zákonité; hypotéza kontinua byla prostředky, které měl Cantor k dispozici, neřešitelná a odpověď se zcela vymyká představám, které mohli matematikové Cantorovy doby vůbec mít.
Přes značné úsilí mnoha matematiků se tuto hypotézu dlouho nikomu nedařilo ani dokázat ani vyvrátit, ačkoliv řada důvodů stále výrazněji nasvědčovala tomu, že by hypotéza měla být správná. První významný krok učinil až v r. 1940 K. Gódel, který v jím vybudované axiomatické teorii množin2 dokázal, že pokud je tato teorie bezesporná, je bezesporná i teorie, která vznikne přidáním axiómu výběru a zobecněné hypotézy kontinua.3
Co z tohoto výsledku plyne? Kdyby bylo například v ZF možné hypotézu kontinua vyvrátit, musela by být teorie „ZF+hypotéza kontinua" sporná. Protože však není (pokud není ZF sporná sama o sobě, v což samozřejmě doufáme), plyne odtud, že hypotézu kontinua nelze v ZF vyvrátit. My však již víme, že to samozřejmě neznamená, že ji lze v ZF dokázat!
Stejná situace byla i s axiómem výběru. Přes četné výhrady k jeho používání Gódelův výsledek znamenal, že axióm výběru nevede ke sporu.4
Definitivně byl problém hypotézy kontinua vyřešen v r. 1963, kdy americký matematik P. Cohen dokázal, že hypotéza kontinua tvoří v Zermelo-Fraenkelově teorii množin neroz-hodnutelné tvrzení (srovnej s definicí 5.11). Téměř současně s Cohenem, v r. 1964, dokázal totéž v teorii Gódel-Bernaysově český matematik P. Vopěnka.
O této problematice se ještě zmíníme v kapitole IV, §5.
Cvičení k §6.
Nic není nemožné, pokud to nemusíte dělat sami.
Weilerův zákon
1. Dokažte následující tvrzení:
2V tzv. teorii S, která je „hodně blízká" teorii ZF. Zejména bezespornost jedné z těchto teorií implikuje bezespornost druhé.
3Hypotéza kontinua je zvláštním případem tzv. zobecněné hypotézy kontinua 2^a = Ka+i pro každé ordinální číslo a. (Připomeňme si, že z věty 3.21 víme, že vždy platí 2^" > Ka+i.)
4Vzájemný vztah mezi axiómem výběru a zobecněnou hypotézou kontinua dokázali W. Sierpiŕiski (1947) a e. Specker (1952), když odvodili, že ze zobecněné hypotézy kontinua axióm výběru vyplývá.
6. Třída všech ordinálních čísel. Alefy
107
Bud'aa nekonečné kardinální číslo. Bud'K ¥ 0 libovolná taková množina, ž.e card K <
< Ka. Buďte nik, k £ K, taková kardinální čísla, ž.e mk < Ka pro každé k £ K. Pak
kčK
2. Kardinální číslo K„ se nazývá iregulární, jestliže K„ =   Yl mk, kde card K <
kčK
< K„, m k < H„ pro každé k e K.
Nekonečné kardinální číslo, které není iregulární, se nazývá regulární. Dokažte:
a) Každé číslo Ka+1 je regulární. (Návod: Využijte cvičení 1.)
b) Číslo KM0 je iregulární. (Návod: Dokažte, že KM0 = K„.)
n<úiQ
3. Všechna známá regulární čísla K„ jsou taková, že a je izolované ordinální číslo (považujeme -li nyní 0 za izolované číslo). Dodnes není známo, zda existují regulární kardinální čísla K„, jejichž index a je limitní ordinální číslo; takové kardinální číslo se nazývá nedosažitelné.
Promyslete si, že pokud existuje nedosažitelné kardinální číslo K„, musí být nesmírně velké. (Uvažte, že mohutnost jeho indexu a by sama musela být nedosažitelným kardinálním číslem.)
4. Kardinální číslo m se nazývá měřitelné, jestliže existuje taková množina A, card A = m, a takové zobrazení /: P(A) -> {0, 1}, že platí:
a) f (A) = 1;
b) pro každý prvek a e A platí f ({a}) = 0;
c) jsou-li množiny X„ c A, n = 1, 2, ..., po dvou disjunktní, pak
(oo        \ oo
Číslo, které není měřitelné, se nazývá neměřitelné. Dokažte následující tvrzení: a) Ko ye neměřitelné.
/3) Je-li Ka neměřitelné, je každé číslo m < Ka neměřitelné.
y) Nejmenší měřitelné kardinální číslo je nedosažitelné, přičemž, nejmenší nedosažitelné kardinální číslo je ještě neměřitelné. (Viz [1], str. 318.)
Kapitola 4
Historický vývoj teorie množin
1   Vývoj pojmu nekonečno.
Dílo B. Bolzana
Co dobře začíná — špatně skončí. Co špatně začíná — skončí ještě hůř.
PUDDERŮV ZÁKON
Teorie množin je dnes základem, na němž je vystavěna převážná část současné matematiky. Přes náročnost a vysokou abstraktnost této teorie jsou její základní pojmy natolik věrným odrazem reality, že jsou již zahrnuty i do učiva základní školy. Je proto do jisté míry překvapující, že se teorie množin jakožto samostatná matematická disciplína začala formovat až v 70. letech minulého století v díle vynikajícího německého matematika Georga Cantora. V této kapitole se budeme zabývat historií teorie množin a důsledky této teorie pro vývoj matematiky ve 20. století.
Vzhledem k tomu, že teorie množin vznikla především z potřeby vyrovnat se s problematikou nekonečna, připomeneme nejprve, jak se vyvíjely představy matematiků a filozofů v tomto směru.
Aktuální a potenciální nekonečno
Často podléháme klamnému dojmu, že lidské poznatky se rozvíjejí „přímočaře": přidáváme pouze nové a nové poznatky k těm dřívějším, víme toho stále „více a více". Své představy podsouváme našim předkům a mnohdy si vůbec neuvědomujeme, že leckteré naše „samozřejmosti" ani zdaleka nemusely být „samozřejmé" v minulosti.
108
1. Vývoj pojmu nekonečno.
109
Na základní škole dětem říkáme, že množina N všech přirozených čísel je nekonečná (a nikdo se nad tím nepozastaví), všichni samozřejmě víme, že bodů na úsečce je nekonečně mnoho (a navíc jsme zjistili, že je jich „více" než přirozených čísel, protože je jich nespočetně mnoho, zatím co N je pouze spočetná). I malé děti chápou, že přímka nemá žádný konec a při pohledu na večerní oblohu přímo „cítíme" nekonečno vesmíru, který nás obklopuje. Málokdo si přitom uvědomuje, že po dlouhá staletí, dokonce ještě v minulém století, bylo všechno jinak.
Vraťme se v našich úvahách do starého Řecka, kde se formovaly základy moderní vědy včetně matematiky. S pojmem „nekonečno" samozřejmě starořečtí filosofové běžně pracovali. Byli si však dobře vědomi problémů, které jsou s tímto pojmem spojeny.1 Postupně vykrystalizoval dvojí přístup k nekonečnu. Místo dlouhého teoretického popisu tyto přístupy ilustrujme na jednoduchém příkladu.
Samozřejmě, že již staří Řekové dobře věděli, že přirozených čísel
1,2,3,...,«,...
je nekonečně mnoho. Tuto skutečnost však můžeme popsat a chápat dvěma způsoby.
Budeme-li postupně psát přirozená čísla, nikdy je nevypíšeme všechna. Za každým číslem následuje další, jakoukoliv předem stanovenou mez dříve nebo později překročíme. Takto chápané nekonečno popisující proces, který nikdy neskončí, mez, které nikdy nedosáhneme, to je tzv. potenciální nekonečno.
My dnes však, pod vlivem vývoje, který trvá již několik desetiletí, chápeme nekonečnost systému přirozených čísel jinak: díváme se na množinu N jako kdybychom ji „viděli" hotovou, stavíme se do pozice, kterou Řekové přenechali bohům a která nebyla určena lidskému zkoumání. Nekonečné množiny si představujeme jako završené a zkoumáme bez obav vlastnosti těchto systémů. Tomuto nekonečnu, chápanému v završené, definitivní formě, se říká aktuální nekonečno.
Z řady důvodů věcných i filozofických dospěli Řekové —jak jsme již naznačili — k tomu, že lidskému zkoumání je přístupné pouze nekonečno potenciální. Proto když Eukleidés ve 3. století př. Kr. hovoří o přímce, má na mysli úsečku, kterou může „neomezeně" prodlužovat, nikdy ji však nemůže prodloužit „do nekonečna", jak si to dnes představujeme my. Z téhož důvodu formuluje Eukleidés tvrzení o počtu prvočísel tak, že jich je více než, jakékoliv předem dané množství, neboť věděl a uměl dokázat, že jich není jen konečně mnoho. Nemohl však říci, že jich je „nekonečně mnoho", protože to by musel připustit aktuální nekonečno, tvářit se, že vidí množinu všech prvočísel hotovou, dokončenou.
A proto také, abychom nezůstali jen u příkladů z matematiky, byl vesmír v antickém Řecku konečný. Za nej vzdálenější sférou stálic nebylo nic a nikoho nenapadalo klást si otázku,
JZa mnohé uveďme Zénóna z Eleje, který proslulými aporiemi, z nichž nejznámější je Achilleus a želva, dokazoval nemožnost pohybu. Všechny aporie využívaly představy nekonečné dělitelnosti prostoru, respektive času.
110
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
kterou si my, navyklí již nekonečnu aktuálnímu, snad ani nedovedeme nepoložit: co je za onou poslední sférou? Krása jejich vesmíru spočívala v jeho konečnosti, v řádu, který odpovídal jejich představám o harmonii světa.
Vývoj pojmu nekonečno
Chápání nekonečna, které se vyvinulo v antice, se udrželo dlouhá staletí. Lidskému poznávání bylo dáno nekonečno potenciální a myšlenka na aktuální nekonečno se jevila jako nepatřičná a člověku nepříslušející. Až velký raně renesanční myslitel Mikuláš Kusánský si jako jeden z prvních troufá rozvíjet myšlenku, co by to znamenalo, kdyby byl vesmír nekonečný. Jeho myšlenky však byly příliš odvážné a ojedinělé.
Jen nesměle se v myšlenkách vědců rodily otázky, které nám dnes připadají samozřejmé, především pak ta, která v 70. letech 19. století koneckonců stála u zrodu teorie množin: má vůbec smysl porovnávat nekonečné systémy podle velikosti? Tuto otázku si například v roce 1638 položil jeden z géniů oné doby, Galileo Galilei. Ten si vypsal dvě řady čísel: přirozená čísla
1,2,3,4,5,...
a jejich druhé mocniny
1,4,6,16,25,...
a uvědomil si, dnešní terminologií řečeno, že mezi těmito množinami existuje bijekce! To by však mělo znamenat, že uvedené systémy čísel jsou stejně velké! A to se, vcelku zákonitě, Ga-lileimu jevilo jako naprostý nesmysl. Vždyť přece jeden ze základních Eukleidových logických axiómů, které byly nezpochybnitelným pilířem tehdejší matematiky, říká, že celek je větší než, část. A tady se zdá, že by druhý systém, který je evidentní částí prvního, měl být stejně velký.
Jaký závěr z této „absurdní" situace Galilei vyvodil? Pro nekonečné systémy nemá otázka o jejich velikosti naprosto žádný smysl!
Takový tedy byl stav úvah o nekonečnu zhruba v polovině 17. století. A záhy se měla celá situace ještě více zkomplikovat. Uvažovalo-li se zatím o (potenciálně) nekonečně velkých veličinách, ve druhé polovině 17. století se situace ještě více zdramatizovala.
Jak je všeobecně známo, vzniká v této době diferenciální a integrální počet. Přestože jeho tvůrci Gottfried Wilhelm Leibniz a Isaac Newton přistoupili k jeho výstavbě z odlišných pozic, byl infinitesimální počet u obou založen na pojmu nekonečně malé veličiny. Jakkoliv tento pojem nebyl řádně definován a pravidla pro počítání s nekonečně malými veličinami byla dána jen velmi vágně, ukázalo se záhy, že diferenciální a integrální počet je vskutku mocným nástrojem nejen v matematice, ale i v řadě aplikací, především pak ve fyzice. Nejasnosti v jeho základech se však postupně vyhrocovaly a posléze v 18. století vyústily ve stav, který dnes nazýváme druhou krizí matematiky.
1. Vývoj pojmu nekonečno.
111
Problémy matematické analýzy se postupně odstraňovaly až od počátku 19. století. Zásadní roli zde sehrál Augustin Louis Cauchy zavedením limity na počátku dvacátých let, významně však do této problematiky zasáhl svými pracemi z matematické analýzy i Bolzano.2
Dospěli jsme tak v tomto stručném přehledu do období, v němž Bolzano píše své dílo Paradoxy nekonečna, které nás v souvislosti s teorií množin mimořádně zajímá.
Zrekapitulujeme-li tedy stav v polovině 19. století, lze říci následující: vědecká komunita pracuje s potenciálním nekonečnem a odmítá nekonečno aktuální jako něco, co není přístupno lidskému zkoumání. V matematické analýze již sice existují nástroje k odstranění problémů s „nekonečně malými" veličinami, přesto však v matematické, fyzikální a další literatuře přetrvávají nesprávné a nelogické postupy, které člověka s tak kritickým a analytickým myšlením, jaké měl Bolzano, musely zákonitě vyprovokovat k formulaci svého náhledu na problematiku nekonečna.
B. Bolzano a „Paradoxy nekonečna"
Paradoxy nekonečna, nejznámější Bolzanova kniha, vyšly v roce 1851, tři roky po jeho smrti. Bolzano ji psal poslední dva roky před smrtí, v letech 1847 - 1848, a tak ji lze v mnoha ohledech považovat za vyvrcholení a uzavření jeho díla.
Jakkoliv si Bolzano sám ze svých knih nejvíce cenil monumentální čtyřdílné učebnice logiky a metodologie vědy Wissenschaftlehre (v českém překladu Vědosloví), ovlivnily právě Paradoxy nekonečna další vývoj matematiky ze všech jeho děl nejvýrazněji. Podstatnou měrou k tomu samozřejmě přispěla i ta skutečnost, že rukopis nestihl osud mnoha jeho dalších děl, která zůstala ležet v nezpracované pozůstalosti dlouhá desetiletí. Bolzanův žák, František Přrhonský, jenž po Bolzanově smrti rukopis obdržel se žádostí o přípravu do tisku, se tohoto úkolu vskutku obětavě a zodpovědně ujal a tak v roce 1851 mohly Paradoxy v Lipsku opravdu vyjít.3
Paradoxy nekonečna přitom nejsou ryze matematickou knihou. Jde spíše o dílo matematicko-filozofické, v němž je značná pozornost věnována i fyzice, lépe řečeno fyzikálnímu nazírání na svět, teologii apod. Bezesporu však je skutečností, jak v dalším ukážeme, že právě „matematické" pasáže knihy patří k těm pozoruhodnějším.
Sledujeme-li vývoj hodnocení Bolzanova přínosu ke světové matematice, vypozorujeme záhy dva obvyklé extrémy: od přehlížení k nekritickému nadsazování a k podsouvání myšlenek a úmyslů, které Bolzano prokazatelně neměl. Jak v dalším uvedeme, hlavní Bolzanův přínos
2Poznamenejme, že tento proces zpřesňování matematické analýzy dovršil ve 2. polovině 19. století Karl Weierstrass zavedením tzv. „e — <5 jazyka". V rámci těchto snah byla v 70. letech minulého století řádně zavedena reálná čísla G. Cantorem a Richardem Dedekindem. V systému reálných čísel již samozřejmě nemohou existovat žádné „nekonečně malé" veličiny.
3Jak známo, Bolzano psal své práce německy nebo latinsky. Originální název německy psaných Paradoxů je Paradoxien des Unendlichen. Česky vyšly Paradoxy nekonečna až v roce 1963 (!) v zasvěceném překladu Otakara Zicha, který knihu doprovodil podrobnými poznámkami a komentárem. Z tohoto překladu také v dalším textu citujeme.
112
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
lze spatřovat v těch myšlenkových proudech, které za zhruba čtvrt století vyvrcholily vznikem teorie množin. Zakladatel této teorie, Georg Cantor, Paradoxy dobře znal a vysoce je hodnotil.4 V této souvislosti se často píše o Bolzanovi jako o spoluzakladateli teorie množin, což je poněkud nadsazené a někdy se dokonce objevují evidentní nesprávnosti. Tak například jeden z nejznámějších historiků matematiky, Dirk Struik, píše, že Bolzano dospěl k pojmu spočetné a nespočetné množiny, což je naprostá nepravda.
Pokusme se tedy objektivně zhodnotit faktický přínos Paradoxů nekonečna. Ty jsou ostatně natolik významné a v mnoha ohledech dodnes inspirativní, že ani v nejmenším nepotřebují nekritické a přehnané hodnocení k tomu, aby byly popravu považovány za jedno z nejvýznam-nějších děl matematické literatury minulého století.
Obsah Paradoxů nekonečna
Jak jsme již uvedli, nejsou Paradoxy ryze matematickou knihou, ale dílem, v němž se prolínají pasáže matematické, fyzikální, filozofické a teologické. Kdybychom se stručně snažili vystihnout základní myšlenky celého díla, byly by to asi dvě následující:
1. zdůvodnění, proč je v matematice nutno pracovat i s aktuálním nekonečnem;
2. analýza chyb, jichž se vědci dopouštějí při úvahách o nekonečnu.
První z uvedených myšlenek Bolzano zdůraznil již mottem celé knihy, za něž si zvolil následující Leibnizův citát: Jsem natolik pro aktuální nekonečno, ž.e namísto abych připustil, Ž.e se ho příroda děsí, jak se běžně říká, jsem přesvědčen, ž.e je má v oblibě všude, aby lépe zdůraznila dokonalosti svého Tvůrce.5 Celá práce6 je rozdělena do 70 paragrafů. I přečtení obsahu, v němž jsou jednotlivé paragrafy stručně charakterizovány, dá čtenáři alespoň hrubou orientaci o obsahu práce. Současně se však může stát zdrojem omylů a dezinterpretací podobných Struikovu omylu, o němž jsme se zmínili před chvílí. Například §19 má „název" Existují nekonečné množiny, které jsou větší nebo menší než. jiné nekonečné množiny. To by mohlo vskutku evokovat dojem, že Bolzano dospěl k něčemu, co připomíná pojem kardinální číslo a odtud je pak jen krůček k tomu podsouvat mu „objevení" spočetných a nespočetných množin. Jak v dalším uvedeme, je podstata úplně jiná; Bolzano pouze v této pasáži dokumentuje, že například jedna úsečka (obsahující nekonečně mnoho bodů) může být částí jiné, větší úsečky apod. K pojmu „kardinální číslo", jak rovněž uvidíme, Bolzano ani v náznaku nedospěl.
4V práci Über unendliche lineare Punktmannigfaltigkeiten, Math. Ann. 21(1883) o nich píše jako o „skvělém a obsažném díle".
5Z terminologického hlediska je přitom zajímavé, že Bolzano v celé knize sám ani jednou neužije pojmu „aktuální", resp. „potenciální" nekonečno. Z celého jeho textu je evidentní, že aktuální nekonečno považoval za tak samozřejmé, že nepotřebovalo žádný přívlastek. Naopak, potenciální nekonečno dle něho žádným faktickým nekonečnem není, což v různých obměnách mnohokrát opisuje.
6Bolzanův text, bez poznámkového aparátu překladatele, má v českém překladu 100 stran.
1. Vývoj pojmu nekonečno.
113
Všimněme si nyní konečně obsahu Paradoxů systematicky a podrobněji.
Prvních deset paragrafů tvoří stručný Bolzanův výklad toho, jak je nutno chápat pojem „nekonečný souhrn"; v naší dnešní terminologii je to nekonečná množina. Tato část dnešnímu čtenáři připadne zcela samozřejmá a argumentaci jistě přijme bez problémů, neboť je s aktuálním nekonečnem zvyklý zcela běžně pracovat. Následující pasáže knihy jsou polemikou a kritikou názorů některých filozofů a matematiků. Ocitujme některé pasáže z 11. a 12. paragrafu; v nich lze snadno vystopovat Bolzanův vztah k potenciálnímu nekonečnu. (Poznamenejme v této souvislosti, že například Cauchyho zmiňuje Bolzano ve své práci několikrát, vždy však v souvislostech poněkud nelichotivých. V pozdějších úvahách o matematické analýze, kde by odvolání se na Cauchyho bylo zcela na místě, se o něm zato nezmiňuje vůbec. Analogicky lze vystopovat i jeho „náklonnost" k některým filosofům, například k Hegelovi.)
§11
Tímto nekonečnem, tak dobře známým matematikům, nelze však ještě uspokojit některé filosofy, zvláště novější doby, jako Hegela a jeho přívržence, kteří je pohrdavě nazývají špatným nekonečnem a tvrdí, že znají ještě mnohem vyšší, pravé, kvalitativní nekonečno, které nacházejí zejména v bohu a vůbec jen v absolutnu. Jestliže si myslí, jako Hegel, Erdmann a jiní, matematické nekonečno pouze jako veličinu, která je proměnná a jejíž růst nemá žádnou hranici (což ovšem mnozí matematikové, jak brzo uvidíme, stanovili jako výměr svého pojmu), pak s nimi souhlasím, když kritizují tento pojem jako veličinu do nekonečna pouze rostoucí, nikdy však nekonečna nedosahující. ...
§12
Nevidím však také jinou možnost, než zamítnout jako nesprávné i jiné výměry nekonečna, jež byly podány samotnými matematiky v domnění, že představují jenom součásti tohoto jednoho a téhož pojmu.
1. Vskutku byli někteří matematikové přesvědčeni, jak jsem právě výše poznamenal, mezi nimi sám Cauchy (ve svém Cours d'Analyse a mnoha jiných spisech), autor článku „Nekonečno" v Klugelově slovníku, že definují nekonečno, jestliže je popíší jako proměnnou veličinu, jejíž hodnota neomezeně roste a podle toho může být větší než jakákoli sebe větší daná veličina. Mezí tohoto neomezeného růstu je nekonečně velká veličina. Tak je tangenta pravého úhlu, myšlená jako spojitá veličina, neomezená, bez konce, ve vlastním slova smyslu nekonečná. Chybnost tohoto výměru vysvítá již z toho, že co nazývají matematikové proměnnou veličinou, není vlastně veličina, nýbrž pouhý pojem, pouhá představa veličiny, a to taková představa, která v sobě pojímá nejen jednu jedinou veličinu, nýbrž dokonce nekonečně mnoho veličin, které se navzájem liší
114
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
ve své hodnotě, tj. ve své velikosti. To, co nazýváme nekonečným, nejsou ony různé hodnoty, které tu představuje výraz tangens <p, zvolený jako příklad, pro různé hodnoty <p, nýbrž pouze ona jediná hodnota, o níž si představují (ač v tomto případě neprávem), že jí onen výraz nabývá při hodnotě <p = jt/2. Je v tom jistě také protimluv, mluví-li se o mezi neomezeného růstu a právě tak, mluví-li se při výměru nekonečně malého o mezi neomezeného ubývání. A prohlásí-li se ona první mez za nekonečnou veličinu: pak by se měla podle analogie tato druhá, tj. pouhá nula (nic) prohlásit za nekonečně malé: což je jistě nesprávné a ani Cauchy ani Grunert si to nedovolují říci.
2. Byl-li právě uvedený výměr příliš široký, je naproti tomu příliš úzký onen výměr, který přijímá Spinoza a mnoho jiných, jak filozofů, tak matematiků, a to že nekonečné je pouze to, co není schopno žádného zvětšení, nebo k čemu již nelze nic připojit (přičíst). Matematik si dovoluje připojit ke každé veličině, i k nekonečně velké, jiné veličiny, a to nejen konečné, nýbrž i jiné veličiny, které jsou samy nekonečné, ba dokonce znásobuje nekonečnou veličinu nekonečně -krát atd. A vedou-li ještě někteří spory o tom, zda je takový postup přípustný: který matematik, jen když nezavrhne jakékoli nekonečno, nebude musit uznat, že délka přímky, omezené jen v jednom směru a prostírající se v druhém směru do nekonečna, je nekonečně velká a že může být nicméně v onom prvním směru prodloužena? ....
V dalším si Bolzano všímá problematiky existence aktuálně nekonečných souhrnů, tj. nekonečných množin a vyvrací některé nejobvyklejší námitky proti jejich existenci. Otázky existence nekonečných množin se týká celý § 13. Protože je argumentace v této části pro Bolzana v mnoha ohledech typická, ocitujeme jej celý.
Z obsáhlého §14 ocitujeme jen úvodní část, v níž Bolzano vyvrací některé námitky odpůrců aktuálního nekonečna. Přesně tytéž námitky se ovšem opakovaly o několik desetiletí později, kdy byly vznášeny proti Cantorově teorii.
§13
Jestliže jsme se již shodli v tom, který pojem budeme vázat se slovem nekonečno, a jestliže jsme si také již jasně uvědomili části, z nichž tento pojem skládáme: pak je nejbližší otázka, má-li též předmětnost, tj. zda jsou také věci, na něž se dá aplikovat, zda existují množiny, které smíme nazývat nekonečnými ve vyloženém významu toho slova. A na toto si troufám rozhodně odpovědět kladně. Nepochybně existují množiny, které jsou nekonečné, již v oblasti těch věcí, které si nečiní nárok na skutečnost, ba ani na možnost. Množina vět a pravd o sobě je nekonečná, jak se dá velice snadno nahlédnout; neboť vezmeme-li jakoukoli pravdu, například větu, že vůbec existují pravdy, nebo ostatně jakoukoli jinou
1. Vývoj pojmu nekonečno.
115
větu, kterou označíme A; pak shledáme, že věta, kterou vyjadřujeme slovy „A je pravdivé" je odlišná od A sama; neboť tato věta má zřejmě zcela jiný subjekt než ona první. Jejím subjektem je totiž celá věta A sama. Avšak podle téhož zákona, podle něhož z věty A vyvozujeme větu od ní odlišnou, kterou nazvu B, dá se opět z B vyvodit třetí věta C, a tak stále bez konce. Souhrn všech těchto vět, kde každá následující je k nejblíže předcházející ve vztahu právě uvedeném, vezme totiž předcházející větu za svůj subjekt a vysloví o něm, že je pravdivou větou, tento souhrn — říkám — zahrnuje množinu částí (vět), která je větší, než jakákoli konečná množina. Neboť i bez mého upozornění si všimne čtenář podobnosti, kterou má řada těchto vět, sestrojená podle právě uvedeného vytvořujícího zákona, s řadou číselnou, o níž se uvažovalo v §8; podobnost spočívá v tom, že ke každému členu této druhé řady existuje odpovídající člen předchozí řady tak, že k jakémukoli sebe většímu jejich počtu existuje stejně velký počet různých vět, a že nad to můžeme ještě vždy tvořit nové věty, nebo, lépe řečeno, ža takové věty samy o sobě existují, ať již je tvoříme nebo ne. Z toho pak plyne, že souhrnu všech těchto vět přísluší množství, které převyšuje libovolné číslo, tj. nekonečné množství.
§14
Jakkoli jednoduchý a jasný je právě podaný důkaz: přece je značný počet učených a velmi bystrých mužů, kteří samu větu, o níž věřím, že jsem ji tu dokázal, prohlašují nejen za paradoxní, nýbrž dokonce za falešnou. Popírají, že existuje vůbec nějaké nekonečno. Nejen mezi věcmi, které jsou skutečné, ale ani mezi ostatními není podle jejich tvrzení ani jediná, a rovněž tak ani souhrn více věcí, u níž by se dala z nějakého hlediska předpokládat nekonečná množina částí. O důvodech, které uvádějí proti nekonečnu v říši skutečna, budeme uvažovat později, protože také teprve později podáme důvody pro existenci takového nekonečna. Zde tedy vyslechněme pouze důvody, jimiž má být prokázáno, že něco nekonečného není nikde, ani u těch věcí, které si činí nárok na skutečnost.
1. „Nekonečná množina" říká se, „nemůže již proto existovat, protože nekonečná množina nemůže být nikdy sjednocena v celek, nemůže být nikdy myšlením obsáhnuta." — Toto tvrzení musím označit přímo za omyl, který byl vyvolán nesprávným názorem, že k tomu, abychom si mohli myslit celek, sestávající z předmětů a, b,c,d, ... musili bychom si nejprve o každém z nich vytvořit představu, která představuje každý z těchto předmětů zvlášť (jednotlivé jejich představy). Tak tomu naprosto není: mohu si myslit množinu, souhrn, či chceme-li raději obyvatele Prahy nebo Pekinu jako celek, aniž bychom představovali každého z těchto obyvatel jednotlivě, tj. aniž bych měl představu, která se
116
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
vztahuje výhradně jen k němu. Činím to skutečně právě nyní, mluvím-li o této množině obyvatel a vyslovím-li např. soud, že jejich počet je v Praze mezi čísly 100 000 a 120 000. Je totiž zcela snadné, mám-li představu A, která reprezentuje každý z předmětů a,b,c,d,..., ale již nic jiného, dospět k představě souhrnu, utvořeného všemi těmito předměty. K tomu není vskutku zapotřebí ničeho jiného, než spojit s představou A pojem, který je označen slovem souhrn, tak jak to naznačují slova: souhrn všech A. Touto jedinou poznámkou, jejíž správnost musí být každému zřejmá, jak jsem přesvědčen, padá celá obtíž, kterou hledají v pojmu množiny sestávající z nekonečně mnoha částí: pokud jen tu je rodový pojem, který zahrnuje každou z těchto částí, jinak však nic jiného, jak tomu je u pojmu: „množina všech vět nebo pravd o sobě", kde není použito žádného jiného rodového pojmu než toho, který tu již máme, totiž: „věta nebo pravda o sobě". — Nemohu však ponechat bez kritiky ještě druhý omyl, který se v uvedené námitce prozrazuje.
Je to názor, že „ množina by nebyla, kdyby tu dříve nebyl někdo, kdo si ji myslí". Kdo tvrdí toto, měl by nejen tvrdit, že neexistuje žádná nekonečná množina vět anebo pravd o sobě, aby tak byl důsledný, pokud je to vůbec při omylu možné, ale měl by tvrdit, že neexistují vůbec žádné věty a pravdy o sobě. Neboť jestliže si již jasně uvědomili pojem vět a pravd o sobě a nepochybujeme opravdu vůbec o jejich predmetnosti: můžeme jen ztěžka dospěti k tvrzením, že by množina nebyla bez někoho, kdo šiji myslí, avšak jistě u nich nesetrváme. Abych to každému jasně ukázal, dovolím si nadhodit otázku, zda se též na zemských pólech nevyskytují tělesa, tekutá i tuhá, vzduch, voda, kameny atd., zda tato tělesa na sebe navzájem nepůsobí podle určitých zákonů, např. tak, že rychlosti, které si navzájem sdělují při srážce, se mají k sobě v obráceném poměru jejich hmot apod., a zda se toto vše neděje i když tam není ani člověk, ani jiná myslící bytost, aby to pozoroval?...
Při čtení Bolzanova textu nás okamžitě napadá řada otázek. Jak Bolzano sám upozorňuje, nabízí se evidentní analogie jím popisované množiny vět s množinou všech přirozených čísel. Proč tedy vůbec onu konstrukci uvádí a nepopisuje přímo množinu přirozených čísel? Aniž bychom chtěli Bolzanovi podsouvat nepodložené domněnky, tkví zřejmě odpověď v odlišném chápání „existence" čísel a pravd.7
Podstatnější námitka je následující: popsaná konstrukce vět přece popisuje potenciální nekonečno. Uvedená konstrukce přece nikdy nekončí, tak j ako nekončí posloupnost přirozených čísel! Této námitky si Bolzano samozřejmě byl vědom, odpověď však nabídl již v §11. Tam totiž uvádí:
Jak uvádí ve Vědosloví, alespoň jedna pravda nepochybně existuje: je to pravda o existenci Boží.
1. Vývoj pojmu nekonečno.
117
Říkám tedy: nazývám Boha nekonečným, poněvadž, mu musíme přiznat síly více než. jednoho druhu, které mají nekonečnou velikost. Tak mu musíme připsat poznávací schopnost, která je pravou vševědoucností, tedy obsáhne nekonečnou množinu pravd, protože je v sobě obsáhne vůbec všechny, atd.
Popsaná množina pravd je tedy podle Bolzana aktuálně nekonečná, protože Bůh je všechny vidí.
Konečně poslední námitka, o níž se chceme zmínit: ačkoliv Bolzano v úvodu paragrafu píše o „predmetnosti" nekonečna, je jeho příklad z oblasti, kterou sám nazývá „věcmi, které si nečiní nárok na skutečnost". O tom, že se nekonečno (a jak jsme se již zmínili, znamená to u něj vždy aktuální nekonečno) vyskytuje i v „oblasti samého skutečna", se Bolzano zmiňuje až mnohem později, v §25. Zde uvedené příklady však, po pravdě řečeno, nejsou příliš přesvědčivé. Kromě již očekávaného argumentu, že existuje bůh, bytost která je více než. v jednom ohledu nekonečná ..., je to jen argument založený na představě časového kontinua: množina stavů, kterých každá bytost během sebekratší doby nabývá, musí být nekonečně velká (neboť každá taková doba obsahuje nekonečně mnoho okamžiků).
Nyní se dostáváme k nejzajímavějším — alespoň pro matematiky — pasážím knihy. Uvedeme klíčové pasáže §§19-21, kde jsou prokazatelné úvahy, které předjímají vznik teorie množin. V §19 Bolzano nejprve zdůvodňuje, že i nekonečné množiny má smysl porovnávat podle velikosti, v dalších dvou paragrafech pak uvažuje o kritériu, které by nám to umožňovalo. Komentář k těmto úvahám uvedeme až po citaci.
§19
Již u těch příkladů nekonečna, o kterých jsme dosud uvažovali, nám nemohlo uniknout, že není možno pokládat všechny nekonečné množiny za sobě rovné z hlediska jejich množství; ale že mnohá z nich je větší nebo menší než jiná, tj. obsahuje v sobě jinou množinu jako svůj díl (nebo naopak, je sama obsažena v jiné jako její pouhý díl). I to je tvrzení, které zní mnoha lidem paradoxně. Jistěže všichni, kteří vykládají nekonečno jako to, co není schopno žádného zvětšení, musí nejen uznat za paradoxní, ale přímo za sporné, že by jedno nekonečno bylo větší než jiné. Avšak poznali jsme již dříve, že tento názor spočívá na takovém pojmu nekonečna, který vůbec nesouhlasí s jazykovým užitím toho slova. Podle našeho výkladu, který odpovídá nejen jazykovému užití, nýbrž i účelům vědy, nemůže najít nikdo nic sporného, ba ani nápadného, na myšlence, že jedna nekonečná množina je větší než jiná. ...
Domníváme se, že Bolzanova úvaha je zcela jednoznačně čitelná. Jsou-li dvě množiny ve vztahu inkluze, je samozřejmě jedna menší a druhá větší. (Což samozřejmě není pravda v cantorovské teorii množin. Už tento fakt, dle našeho názoru, evidentně znamená, že Bolzana
118
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
nelze považovat za spoluzakladatele Cantorovy teorie). Problém tedy podle Bolzana nastává, máme-li porovnat velikosti dvou množin, které ve vztahu inkluze nejsou. Ocitujme nejprve Bolzanovu úvahu.
§20
Přejděme nyní k úvaze o nanejvýš pozoruhodné zvláštnosti, jež se může vyskytnout u vztahu dvou množin, jsou-li obě nekonečné, dokonce jež se vlastně vyskytuje vždy, avšak byla dosud přehlížena ke škodě pro poznání mnohých důležitých pravd metafyzických, jakož i fyzikálních a matematických, a která i nyní, vyřknu-li ji, bude pokládána za tak paradoxní, že by bylo velmi potřebné se při úvaze o ní trochu déle zdržet. Tvrdím totiž: dvě množiny, obě nekonečné, mohou být k sobě v takovém vztahu, že je na jedné straně možno spojit ve dvojici každou věc, náležející jedné z nich, s věcí, náležející druhé z nich, tak, aby vůbec žádná věc v obou množinách nezůstala bez spojení ve dvojici a také žádná aby se nevyskytovala ve dvou nebo více dvojicích; a přitom je na druhé straně možno, aby jedna z obou množin obsahovala druhou jako svůj pouhý díl, takže množství, která ony množiny představují, jsou k sobě v nej rozmanitějších poměrech, považujeme-li věci v nich za stejné, tj. za jednotky....
Bolzano tedy uvádí fakt, jehož si povšiml již Galilei: nekonečná množina může být ekvivalentní se svou vlastní podmnožinou. Na rozdíl od Galileiho, který za této situace usoudil, že u nekonečných množin nemá smysl poměřovat jejich velikost, je Bolzano přesvědčen, že to nutné je. Domníváme se však, že v této chvíli se dopustil osudového omylu, který způsobil, že se nestal faktickým zakladatelem teorie množin. Jak z následujícího paragrafu uvidíme, usoudil, že existence bijekce mezi nekonečnými množinami nás ještě neopravňuje k tvrzení, že jsou stejně velké.8 Jednoduše řečeno, Bolzano překročil mnohé dosavadní bariéry, evidentně však nepřesáhl horizont tvrzení, že celek musí být větší než, část. Z následujícího textu je to zcela zřejmé.
§21
Tedy jen z toho důvodu, že dvě množiny AaB jsou v takovém vzájemném vztahu, že ke každé části a, obsažené v A, můžeme též vyhledat podle určitého pravidla část b, obsaženou v B, tak aby všechny dvojice (a +b), které vytvoříme, obsahovaly každý předmět z A nebo z B, a každý pouze jednou - jen z této okolnosti —jak vidíme — není ještě nijak dovoleno uzavírat, že by si tyto množiny z hlediska
8 Jak víme, vyřešil tuto věc definitivně až o čtvrt století později Cantor, když dokázal, že mezi přirozenými a reálnými čísly bijekce neexistuje, takže lze existenci bijekce vzít za kritérium toho, zda jsou množiny stejně velké.
1. Vývoj pojmu nekonečno.
119
množství svých částí byly navzájem rovny (tj. abstrahujeme-li od všech jejich rozdílů), jsou-li nekonečné; nýbrž mohou být přes tento svůj vztah, který je sám o sobě ovšem obapolně stejný, ve vztahu nerovnosti vzhledem ke svým množstvím, takže se může ukázat, že jedna z nich je celkem, jehož dílem je druhá. Na rovnost těchto množství se smí usoudit teprve tehdy, přistoupí-li k tomu ještě nějaký jiný důvod, jako například to, že obě množiny mají zcela stejná základní určení, například zcela stejný způsob vzniku.
Formulaci, že dvě množiny jsou stejně velké, když mají „zcela stejná základní určení" sice Bolzano opakuje vícekrát, nikde však neprecizuje, co tím přesně myslí.
Okomentovali jsme tedy podrobně Bolzanovy úvahy, které byly předobrazem teorie množin. Přitom se domníváme, že právě v uvedených 21 prvních paragrafech jsou ukryty nej-hodnotnější myšlenky celého díla. Přes veškeré (z dnešního hlediska viděné) nedostatky bylo Bolzanovou velkou zásluhou především fundované zdůvodnění nutnosti zkoumat aktuální nekonečno. O dalších pasážích Paradoxů se již zmíníme jen stručně.
Dalších cca 20 paragrafů se zabývá počítáním s „nekonečně malými" a „nekonečně velkými" veličinami v analýze a v geometrii. Stručně řečeno, Bolzano zde podává výklad toho, jak počítat s limitou (i když tohoto pojmu ani jednou neužije) a tím se vyhnout užívání nekonečně malých či velkých veličin. Zvláštní pozornost věnuje problémům spojeným s nulou, kterou nepovažuje za číslo, ale pouze za symbol, přičemž přesně specifikuje, jak lze tohoto symbolu užívat. Zhruba druhá polovina knihy je věnována úvahám o prostoru, čase, fyzikálních zákonech, o duchovních a hmotných substancích apod. Síla těchto pasáží je ve srovnání s matematickými partiemi podstatně menší. Některé Bolzanovy názory byly evidentně překonané již v době, kdy svou práci psal. Stručně řečeno, Bolzano zastává divnou směs tzv. mechanického materialismu kombinovaného s vírou v boží všemohoucnost. Ze stavu všech součástí vesmíru bychom mohli podle platných zákonů rekonstruovat stavy další, pokud ovšem pomineme případ, kdy nastane přímý boží zásah, protože odchylka od tohoto zákona vyžaduje sílu, která by ve srovnání se spojitou silou musila být nekonečně velká apod. Tělesa mohou podle Bolzana na sebe působit „bezprostředně na dálku", a všechny tyto úvahy jsou prostoupeny dobovými úvahami o éteru a nedělitelných atomech. I v těchto partiích lze sice najít hodnotné myšlenky (například o „dimensi prostoru", kterou Bolzano zavedl již ve svých dřívějších pracích), celkově je však vyznění této části knihy, byť je čtivá a poutavá, mnohem nižší.
Co říci závěrem? Bolzanova kniha je v mnoha ohledech pozoruhodná. Samozřejmě, že ve světle dalších objevů jsou některé pasáže nepřesné či zastaralé. V každém případě je to však dílo pozoruhodné a podává nám dobrý obrázek o prenikavosti Bolzanova ducha a o stavu vědeckého myšlení v polovině minulého století. O kterém současném textu to asi bude možno bez obav říci za půldruhé století?
120
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
2   Georg Cantor a jeho dílo
Historie je věda o tom, co se nikdy nestane dvakrát. Valeryho zákon
Viděli jsme, jak blízko byl Bolzano k odhalení a pochopení vlastností nekonečných množin. To, co se nám dnes ovšem jeví jako malý krůček v poznání, byl v tehdejší době — v polovině 19. století — velký myšlenkový posun, kvalitativní skok v matematickém a filozofickém myšlení. Učinit tento krok — to vyžadovalo hluboké matematické vzdělání, široký filozofický rozhled, bohatou tvůrčí fantazii a velkou osobní odvahu. Tím vším byl vrchovatě obdařen Georg Ferdinand Ludwig Philipp Cantor, jak se plným jménem jmenoval vynikající německý matematik, jenž je v celém světě zaslouženě uznáván za zakladatele teorie množin; teorie, která tak výrazně ovlivnila tvář soudobé matematiky, teorie, proti níž byly vedeny v matematických kruzích tak ostré boje a nevybíravé výpady jako proti málokteré jiné matematické disciplíně, které se však na přelomu 19. a 20. století dostalo prakticky všeobecného uznání a která se stala základnou téměř veškeré moderní matematiky. Zhroucení matematiky vystavěné na Cantorově teorii na počátku 20. století (budeme o něm podrobně hovořit v §3), které tak dramaticky poznamenalo vývoj matematiky ve 20. století, ani v nejmenším nesnižuje význam Cantorovy role v dějinách světové matematiky.
G. Cantor se narodil v r. 1845 v Petrohradě, kde jeho otec vedl až do r. 1856 obchodní firmu. Malý Georg od malička tíhnul k matematice a přes počáteční otcův odpor ji také (současně s fyzikou a filozofií) studoval v Curychu, Gôttingen a především v Berlíně, kde r. 1867 promoval. Největší vliv ze všech učitelů na něj měl Karl Weierstrass, který také patřil k těm nemnoha matematikům, u nichž našel Cantor i v nejtěžších chvílích oporu. Od r. 1869 až do r. 1913 působil Cantor na univerzitě v Halle.
Od studentských let projevoval vynikající nadání; koncem 60. let napsal řadu prací z teorie čísel, algebry a teorie funkcí. Jeho nejplodnějším životním obdobím však byla léta 1873 - 1884, v nichž geniálním způsobem položil základy teorie množin a po obsahové stránce tuto teorii vybudoval prakticky do dnešní podoby.
Při studiu trigonometrických řad dokázal v r. 1873 nespočetnost množiny všech reálných čísel (v práci Uber eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen — tj. O jedné vlastnosti souhrnu všech reálných algebraických čísel; tato práce byla publikována v r. 1874). Je to jeho první práce s množinovou tématikou. (Překlad této práce dále uvádíme.) V sérii dalších prací z uvedeného období zavedl pojem mohutnosti množiny a vybudoval teorii kardinálních a ordinálních čísel.
Proti teorii množin byly od počátku vznášeny četné výhrady. Hlavní námitky byly vznášeny proti tomu, jak se v ní pracuje s aktuálně nekonečnými množinami; řada matematiků nikdy nepochopila hloubku a dosah Cantorova učení. V čele tohoto proticantorovského tažení byl až
2. Georg Cantor a jeho dílo
121
do své smrti bývalý Cantorův berlínský učitel Leopold Kronecker. Cantor měl četné problémy s uveřejňováním svých prací, byl napadán a jeho dílo bylo znevažováno. Skutečných přátel a zastánců měl jen nemnoho. Kromě Weierstrasse to byl především již zmiňovaný R. Dedekind, s nímž Cantora pojilo od r. 1872, kdy se víceméně náhodně ve Švýcarsku seznámili, dlouholeté přátelství. (Ze zachované korespondence mezi nimi lze dobře vysledovat, jak oboustranně plodné bylo toto přátelství prudkého bouřlivého „romantika" Cantora a suchého střízlivého „klasika" Dedekinda.)
Úporná práce, dílčí neúspěchy při řešení některých problémů, spojených především s „hypotézou kontinua" a neustálé útoky jeho odpůrců však vykonaly své. V r. 1884 podléhá Cantor prudké depresi, musí být léčen na nervové klinice a vážně uvažuje o tom, že matematiky zcela zanechá. Od té doby se u něho střídají období tvůrčí práce s depresivními stavy. V r. 1897, tedy v době, kdy jeho teorie konečně dochází všeobecného uznání, publikuje Cantor svou poslední práci. V roce 1899 se ještě na krátký čas vrací k tvůrčí práci, aby se pak již definitivně odmlčel. V r. 1905 končí svou přednáškovou činnost, v r. 1913 odchází z univerzity a v r. 1918 v psychiatrické léčebně umírá.
Nebyl to lehký život, co Georg Cantor prožil. V mnoha směrech byl podobný osudu jiných géniů v historii lidské vědy a kultury. Jednou provždy však zůstane zapsán v dějinách lidského poznávání, neboť to byl on, kdo nám zpřístupnil krásný a tajuplný svět — svět nekonečných množin.
Ukázky z Cantorova díla
Nejprve uvedeme již zmiňovanou práci z r. 1874. Jak jsme již napsali, je to ve světové matematické literatuře první práce týkající se teorie množin (byťpojem „množina" — německy „die Menge" — se v ní vůbec nevyskytuje). (Cantor hovoří jen o „souhrnu" čísel — tak překládáme výraz „Inbegriff". Pojem „množina" se vůbec poprvé vyskytuje až v jeho práci z r. 1879.) Stejně tak se v práci nevyskytují pojmy „spočetný", respektive „nespočetný". Přesto je tu však učiněn rozhodující krok — krok, který Bolzano, jak jsme viděli, možná tušil, ale neudělal; máme zde na mysli důkaz faktu, že existují dvě neekvivalentní nekonečné množiny. Tato skutečnost byla pro Cantora odrazovým můstkem k vybudování teorie kardinálních čísel.
O jedné vlastnosti souhrnu všech reálných algebraických čísel
Reálným algebraickým číslem obecně rozumíme reálnou veličinu co, která vyhovuje neidentické rovnici tvaru
a0a>" + aiCú"^1 + ■ ■ ■ + an = 0 (1)
122
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
kde n, ao, ai, ..., an jsou celá čísla. Můžeme zde přitom bez újmy na obecnosti předpokládat, že čísla n a ao jsou kladná, koeficienty ao, a\, ..., a„ nemají společného dělitele a rovnost (1) je nerozložitelná. Za těchto předpokladů bude zaručeno, že podle známých základních aritmetických a algebraických pravidel je rovnost (1), jíž vyhovuje nějaké reálné algebraické číslo, plně určena. Obráceně, každé rovnici tvaru (1) přísluší nejvýše tolik reálných algebraických čísel co, které jí vyhovují, kolik činí její stupeň n. Reálná algebraická čísla tvoří jako celek souhrn veličin, který označíme (co). Jak je jednoduše vidět, má tento systém tu vlastnost, že v každém okolí jakéhokoliv myšleného čísla a leží nekonečně mnoho čísel z (co). O to nápadnější proto na první pohled může být skutečnost, že souhrn (co) může být jednoznačně přiřazen souhrnu (v) všech celých kladných čísel tak, že každému algebraickému číslu co přísluší jisté celé kladné číslo a naopak, každému celému číslu v odpovídá plně určené reálné algebraické číslo co, tak, že jinými slovy řečeno, souhrn (co) si můžeme představit ve tvaru nekonečné zákonitě utvořené řady
coi, co2, ..., cov, ... , (2)
v níž se vyskytnou všechny prvky z (co) a každý z nich přitom na určitém místě v (2), přičemž toto místo je dáno příslušným indexem. Jakmile nalezneme zákonitost, podle níž je toto přiřazení prováděno, je možno ji libovolně modifikovat. Bude tudíž postačovat, když v §1 uvedu to přiřazovací pravidlo, které, jak se domnívám, je nejjednodušší.
Této vlastnosti souhrnu všech reálných algebraických čísel využiji k tomu, abych pomocí §1 v §2 ukázal, že když utvoříme libovolnou řadu reálných čísel veličin tvaru (2), můžeme určit v každém zadaném intervalu (a ... B) číslo rj, které nebude obsaženo v (2). Kombinací výsledků těchto dvou paragrafů podáme nový důkaz dřívějšího Liouvilleova tvrzení, že v každém zadaném intervalu (a ... B) leží nekonečně mnoho transcendentních, tj. ne algebraických čísel. Dále uvedeme v §2 Větu jako základ k zdůvodnění toho, proč souhrn reálných veličin, které tvoří kontinuum (jako reálná čísla, která jsou > 0 a < 1) nelze jednoznačně přiřadit souhrnu (v). Tak najdeme zřetelný rozdíl mezi tak zvaným kontinuem a souhrnem utvořeným ze všech reálných algebraických čísel.
§1.
Vraťme se k rovnici (1), které vyhovuje algebraické číslo co a která je za uvedených předpokladů plně určena. Zvětšeme číslo n — 1, kde n je stupeň čísla co, o součet absolutních hodnot koeficientů uvedené rovnice a označme výsledek N;
2. Georg Cantor a jeho dílo
123
N nazveme výškou čísla co. Při použití obvyklého označení tedy platí
N = n — 1 + |a0| + \ai\ + ■ ■ ■ + \an\.
(3)
Výška N je podle toho pro každé reálné algebraické číslo co jisté kladné celé číslo; obráceně, ke každé kladné celočíselné hodnotě N existuje jen konečně mnoho algebraických reálných čísel o výšce N; jejich počet označme cp(N). Je například cp(l) = 1, (p(2) = 2, (p(3) = 4. Nyní čísla souhrnu (co), tj. algebraická reálná čísla, postupně uspořádáme do řady tak, že nejprve vezmeme číslo co\ jako jediné číslo o výšce 1; poté vezmeme následující cp(2) =2 algebraická reálná čísla o výšce 2 a označme je co2, coj. K těmto můžeme připojit cp(3) = 4 čísla o výšce N = 3 tak, aby jejich velikosti vzrůstaly. Obecně můžeme tímto způsobem očíslovat všechna čísla z (co) až do určité výšky N = Ni, rozmístit je na určená místa a za ně připojit reálná algebraická čísla o výšce N = Ni + 1 a sice tak, aby jejich velikosti vzrůstaly. Takto obdržíme souhrn (co) všech reálných algebraických čísel ve tvaru
a s ohledem na dané uspořádání můžeme hovořit o v-tém reálném algebraickém čísle, přičemž není opomenuto žádné z čísel souhrnu (co).
Je-li dána jakýmkoliv způsobem utvořená nekonečná řada navzájem různých reálných veličin
lze v každém zadaném intervalu (a... /3) určit číslo r\ (a tedy nekonečně mnoho takových čísel), které se nevyskytuje v řadě (4). Toto tvrzení nyní dokážeme. Mějme tedy libovolně zadaný interval (a ... /3) takový, že a < /3. První dvě čísla naší řady (4), která leží uvnitř tohoto intervalu (z něhož vyloučíme hranici) můžeme označit a', B' tak, že a' < /3'. Stejně tak označme první dvě čísla z naší řady, která leží uvnitř (a'... 6') jako a", ji" a to tak, že a" < ji"; podle téhož pravidla utvoříme následující interval (a" ... B") atd. Zde uvedená čísla a',a" ... jsou podle definice jistá čísla naší řady (4), jejichž velikosti se monotónně mění a totéž platí o číslech B', B" ...; velikost čísel a', a", ... neustále roste, velikost čísel B', B", ■ ■ ■ klesá. Každý z intervalů (a ... B), (a'... B'), (a" ... B"), ... v sobě uzavírá všechny následující. — Jsou tedy nyní myslitelné dvě možnosti. Buďto je počet takto utvořených intervalů konečný; poslední z nich nechť je (cr(v)... /3(v)). Protože uvnitř tohoto intervalu může ležet nejvýše jedno číslo řady (4), můžeme
COl, co2, . .. , CŮV, . . .
§2.
COi, C02, . . . ,COv, . . .
(4)
124
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
v tomto intervalu zvolit číslo rj, které není ve (4) obsaženo. V tomto případě je věta dokázána.
Nebo je počet utvořených intervalů nekonečně velký. Pak ale mají čísla a, a', a", ..., vzhledem k tomu, že jejich velikosti neustále rostou aniž by rostly do nekonečna, jistou horní závoru a°°. Totéž platí pro čísla /?, , jejichž
velikosti klesají; jejich závoru označme Je-li a°° = (což je případ, který vždy nastane v případě souhrnu (co) všech reálných algebraických čísel), lze se lehce přesvědčit, podíváme-li se nazpět na definici intervalu, že číslo rj = a°° = nemůže být v naší řadě obsaženo. (Kdyby totiž bylo číslo rj v naší řadě obsaženo, měli bychom rj = cop, kde p je jistý index. To však není možné, protože cop neleží uvnitř intervalu (a^ ... fí^), zatímco číslo rj podle definice uvnitř tohoto intervalu leží.) Je-li však a°° < pak žádné číslo rj z vnitřku intervalu (a°° ... y6°°) nebo též hranice tohoto intervalu, pokud jen odpovídá uvedeným požadavkům, není v řadě (4) obsaženo. Tvrzení dokázaná v tomto odstavci nám umožňují různá zobecnění, z nichž zvolíme následující: „Je-li co\, co2, ..., co„, ... konečná nebo nekonečná řada vzájemně lineárně nezávislých čísel (takže není splněna žádná rovnice tvaru cl\ců\ + a2co2 + • • • + a„co„ = 0 s celočíselnými koeficienty, které nejsou všechny nulové) a je-li dán souhrn (Q) všech takových čísel Q, která lze určit pomocí racionálních funkcí s celočíselnými koeficienty z daných čísel co, pak v každém intervalu (a ... ji) existuje nekonečně mnoho čísel, která nejsou v (Q) obsažena." Skutečně, můžeme se podobně jako v §1 přesvědčit, že souhrn (Q) lze seřadit do tvaru
z čehož, vzhledem k §2, plyne správnost tvrzení.
★ ★ ★
Druhou Cantorovou prací, kterou zde v překladu uvedeme, je článek uveřejněný v r. 1890. V této krátké stati se poprvé objevuje známá důkazová metoda, dnes běžně nazývaná Cantorova diagonální metoda. Vyjádřeno v řeči kardinálních čísel je zde dokázáno, že 2^° > Ko a poté je ukázáno, že zcela analogicky lze pro každé kardinální číslo odvodit 2m > m.
Povšimněme si, že ani v této práci se nevyskytuje pojem „množina", i když v této době již Cantor toto pojmenování v jiných pracích užíval.
O jedné elementární otázce z nauky o souhrnech
V práci nazvané: O jedné vlastnosti souhrnu všech reálných algebraických čísel (Journ. Math. Bd. 77, S. 258) se poprvé nachází důkaz věty, že existují souhrny,
2. Georg Cantor a jeho dílo
125
které nelze, byť jsou nekonečné, jednoznačně přiřadit souhrnu všech konečných celých čísel 1, 2, 3, ..., v, ... nebo, jak říkáme, které nemají mohutnost číselné řady 1, 2, 3, ..., v, ... .Z toho, co jsme tam dokázali v §2, okamžitě plyne, že například systém všech reálných čísel ležících v libovolném intervalu (a ... ji) nelze sestavit do řady tvaru
COi, ců2, ... ,cův, ... .
Toto tvrzení však lze dokázat mnohem jednodušeji, nezávisle na vlastnostech iracionálních čísel.
Jsou-li totiž m a w dva navzájem rozdílné objekty, můžeme studovat souhrn M prvků tvaru
E = (xi,x2, ... ,xv, ...),
které závisí na nekonečně mnoha souřadnicích x\, x2, ..., xv, ..., kde každá z těchto souřadnic je buďto m nebo w.
K prvkům M patří například tři následující:
E1 = (m, m, m, m, .. .),
E11 = (w, w, w, w, . ..),
E111 = (m, w, m,w, .. .). Nyní   tvrdím,   že   takový   systém   M   nemá   mohutnost   řady 1,2,..., v, . . . .
Plyne to z následující věty:
Je-li E\, E2, . .. , Ev, .. . jakákoliv jednoduchá nekonečná řada prvků systému M, pak existuje prvek E$ z, M, který není žádným z prvků Ev. K důkazu nechť je El = («1,1, tii,2, ■ ■ ■ , a\,v, ■ ■ ■), E2 = (a2ti, (22,2, ■ ■ ■ , a2,v, .. .),
........................... Tato ajJL,v jsou zde buďto m nebo w. Buď
E li = OV.l* aíí,2> ■ ■ ■ , ati,v, ■ ■ ■),
nyní řada bi, b2, , ..., bv,... definována tak, že bv bude rovněž rovno m nebo w a přitom různé od av,v.
Je-li tedy av ,v = m, nechť je bv = w a je-li av ,v = w, nechť bv = m.
Povšimneme-li si nyní prvku
Eo = (bi, b2, b-i,...)
z M, vidíme okamžitě, že rovnost Eq = EIÁ nemůže být splněna pro žádné celé číslo jjL. Kdyby totiž pro jisté jjl a pro všechny hodnoty v platilo
126
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
pak by zejména platilo
což je podle definice čísla bv vyloučeno.
Z této věty bezprostředně plyne, že souhrn všech prvků z M nelze seřadit do tvaru řady E\, E2, ..., Ev, ...; dostali bychom totiž spor, že Eq by současně bylo i nebylo prvkem M.
Tento důkaz překvapuje nejen svou velkou jednoduchostí, ale zejména tím, že princip v něm uvedený lze bezprostředně použít k důkazu obecnějšího tvrzení, že totiž mohutnosti systémů nemají maximum, což je totéž jako tvrzení, že ke každému zadanému systému L existuje jiný systém M, který má větší mohutnost než L.
Buď například L lineární kontinuum, jako třeba souhrn všech reálných čísel, která jsou > 0 a < 1.
Pod M rozumějme souhrn všech jednoznačných funkcí f(x), které nabývají hodnot 0 nebo 1, přičemž x proběhne všechny reálné hodnoty, které jsou > 0 a < 1.
To, že M nemá menší mohutnost než L, plyne z toho, že v M existují podmnožiny, které mají stejnou mohutnost jako L; například je to podmnožina utvořená z těch funkcí proměnné x, které mají v jednom jediném xo z x hodnotu 1 a ve všech ostatních x mají hodnotu 0.
M ale nemá ani stejnou mohutnost jako L. Kdybychom totiž souhrn M mohli jednoznačně popsat pomocí proměnné z, mohli bychom si M představit ve tvaru jednoznačné funkce obou proměnných x a z
(p(x, z),
a to tak, že zadáním z bychom mohli obdržet prvek f(x) = (p(x, z) z M a také naopak, každý prvek f(x) z M bychom získali jako <p(x,z) jedinou volbou z. Tím však dostáváme spor. Myslíme-li si, že g(x) je ta jednoznačná funkce x, která nabývá jen hodnot 0 a 1 a pro každou hodnotu x je různá od <p(x, z), pak je na jedné straně g(x) prvek M, na druhé straně však žádnou volbou z = Zo nemůžeme tuto funkci dostat z (p(x, z), neboť<p(xo, Zo) je různé od g(zo).
Není-li tedy mohutnost systému M ani menší ani rovna mohutnosti L, plyne odtud, že je větší než mohutnost L. (Viz Crelles Journal Bd. 84, S. 242.)
V práci Grundlagen einer allgemeinen Mannigfaltigkeitlehre (Leipzig 1883) jsem dokázal pomocí zcela jiných metod, že mohutnosti nemají maximum. Dokonce je tam dokázáno, že souhrn všech mohutností, když ho uspořádáme podle velikostí, tvoří „dobře uspořádanou množinu", takže ve skutečnosti
2. Georg Cantor a jeho dílo
127
ke každé mohutnosti existuje větší a rovněž ke každé shora neohraničené množině mohutností existuje nějaká mohutnost ještě větší.
„Mohutnosti" reprezentují jediné a zákonité zobecnění konečných „kardinálních čísel"; nejsou ničím jiným, než aktuálně nekonečně velkými kardinálními čísly a patří jim táž realita a určitost jako těm původním. Jen zákonitosti mezi nimi, nazývané „teorie čísel", jsou zde částečně odlišné od zákonitostí ve světě „Konečna".
Další objevy na tomto poli jsou úkolem budoucnosti.
★ ★ ★
Poslední ukázkou z Cantorova díla, kterou uvedeme, bude několik partií z obsáhlé práce Beiträge zur Begründung der transfiniten Mengelehre, tj. Příspěvky k základům teorie transfinitních množin, která je poslední Cantorovou publikovanou prací. (První část vyšla v časopise Mathematische Annalen v r. 1895, druhá část tamtéž v r. 1897. Celá práce má 76 stran.) Toto dílo je vynikajícím završením Cantorovy více než dvacetileté práce na výstavbě teorie množin.
V úvodu 1. paragrafu Cantor poprvé vysvětluje, co rozumí množinou. (Tato pasáž bývá často a nepřesně citována. Z textuje zřejmé, že ji Cantor zcela jistě nepokládal za definici, jak bývá často nesprávně uváděno. Pojem samotný na jedné straně podle Cantorových původních představ zjevně pro svou „samozřejmost" žádnou definici nevyžadoval; na druhé straně v době publikace této práce již Cantor znal těžkosti, k nimž jeho intuitivní přístup vede.) Ve 2. paragrafu Cantor definuje nerovnost mezi kardinálními čísly.
Kromě těchto dvou paragrafů v následující ukázce uvedeme část §4, v němž je zavedeno umocňování kardinálních čísel, část §6, v němž je popsána specifická role čísla Ko a konečně část §15, v němž se hovoří o množině Z(Ko) ordinálních čísel. Čtenář jistě i bez zvláštního upozornění postřehne, že styl vyjadřování a důkazové metody této práce jsou již zcela moderní; §15 by mohl být bez větších úprav — stejně jako další části práce — zařazen i do moderní učebnice.
Rozdíl mezi první Cantorovou množinovou prací a touto poslední je jistě dostatečným svědectvím, jak obrovské dílo Cantor v uvedeném období vykonal.
Příspěvky k základům teorie transfinitních množin
§i.
MOHUTNOSTI ČILI KARDINÁLNÍ ČÍSLA
128
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
„Množinou" rozumíme každý souhrn M určitých rozlišitelných objektů m našeho nazírání nebo našeho myšlení (nazývaných „prvky" v M) shrnutých v jeden celek. Symbolicky to zapíšeme takto:
M = {m}. (1)
Sjednocením více množin M, N, P, ..., které nemají společné prvky, rozumíme množinu označenou
(M,N,P,...). (2)
Prvky této množiny jsou prvky z M, z N, z P atd., brány všechny společně.
„Část" nebo „podmnožina" množiny M je každá jiná množina M\, jejíž prvky jsou současně prvky v M.
Je-li M2 částí Mi a Mx částí M, pak je také M2 částí M.
Každé množině M přísluší jistá „mohutnost", kterou nazýváme také „kardinální číslo".
„Mohutností" nebo „kardinálním číslem" množiny M rozumíme obecný pojem, který v našem myšlení přiřadíme každé množině M tak, že přitom abstrahujeme od vlastností jejích různých prvků m a od uspořádání při jejich zadávání!
Výsledek této dvojí abstrakce, kardinální číslo čili mohutnost množiny M, označujeme
(3)
Takto z každého jednotlivého prvku m, nepřihlížíme-li k jeho vlastnostem, vznikne „jednotka", takže kardinální číslo M samotné je určitá množina utvořená z těchto jednotek, jakožto rozumový odraz projekce dané množiny v naší mysli. O dvou množinách M a N řekneme, že jsou ekvivalentní, což označíme
M ~ N      nebo      N ~ M, (4)
jestliže lze nalézt takové jejich vzájemné přiřazení, že každému prvku z jedné odpovídá při tomto přiřazení jeden a jenom jeden prvek druhé.
Každé části M\ v M odpovídá tedy jistá ekvivalentní část N\ z N.
Je-li dáno takové přiřazení dvou ekvivalentních množin, pak lze toto přiřazení (až na případ, že obě množiny jsou jednoprvkové) libovolně modifikovat. Zejména lze zařídit, že danému prvku nio z M odpovídá jistý prvek n$zN. Jestliže si totiž prvky nio a no neodpovídají při původním přiřazení, ale prvku nio z M odpovídá prvek ni z N a prvku no z N odpovídá prvek m\ z M, pak pozměníme zadání tak,
2. Georg Cantor a jeho dílo
129
aby si vzájemně odpovídaly prvky niQ a «o a rovněž tak     a n\; ostatní prvky pak zůstanou přiřazeny podle původního pravidla. Takto je úkol splněn. Každá množina je ekvivalentní se sebou samotnou:
M ~ M. (5)
Jsou-li dvě množiny ekvivalentní s třetí, pak jsou také vzájemně ekvivalentní:
zM~řaiV~P plyne M ~ N. (6)
Základní význam má nyní skutečnost, že dvě množiny M a N jsou ekvivalentní tehdy a jen tehdy, když, mají stejné kardinální číslo:
ze vztahu M ~ N plyne M = N, (7)
a
ze vztahu M = N plyne M ~ N. (8)
Ekvivalence množin tedy tvoří nutné a neklamné kritérium toho, že jejich kardinální čísla jsou stejná....
§2.
„VĚTŠÍ" a „MENŠÍ" MEZI MOHUTNOSTMI
Nechť pro dvě množiny M a N s kardinálními čísly a = M a b = N jsou splněny následující dvě podmínky:
1) M neobsahuje část ekvivalentní s N,
2) N obsahuje část N\ takovou, že N\ ~ M.
Pak je především patrno, že tyto podmínky zůstanou splněny, když množiny M a N nahradíme dvěma ekvivalentními M' a N'. Takto je však určen jistý vzájemný vztah mezi kardinálními čísly a,b.
Dále, ekvivalence množin M a N, jakož tedy i rovnost čísel a, b je vyloučena; kdyby platilo M ~ ./Vpak by vzhledem k tomu, že N\ ~ M, také platilo N\ ~ N a tedy předpoklad M ~ N by nás přivedl k tomu, že existuje část Mi v M taková, že Mi ~ M a tedy také Mj ~ TV, což je spor s podmínkou 1).
Za třetí, tento vztah mezi čísly a, b je takový, že tentýž vztah mezi b, a není možný. Když tedy v 1) a 2) prohodíme role M a N, obdržíme dvě vzájemně kontradiktorické podmínky.
130
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
Vztah mezi a, b charakterizovaný podmínkami 1) a 2) vyjádříme slovy: a je menší než b nebo také b je větší než a; symbolicky
a < b      nebo      b > a. (1)
Lehce lze dokázat, že
když a < b, b < c,    pak také a < c.
Právě tak okamžitě z definice plyne, že když P\ je část množiny P, pak z a < P\ plyne také a < P a ze vztahu P < b plyne P\ <b. Ukázali jsme, že ze tří vztahů
a = b,    a < b,    b < a
každý vylučuje zbývající dva.
Naproti tomu se v žádném případě nerozumí samo sebou, a také bychom to nyní nemohli dokázat, že pro každá dvě kardinální čísla a, b musí nutně nastat některá z uvedených možností.
Teprve později, až přehlédneme rostoucí posloupnost transfmitních kardinálních čísel a poznáme jejich vzájemné vztahy, budeme moci dokázat tvrzení: A. „Jsou-li a,b libovolná dvě kardinální čísla, pak platí buďto a = b nebo a < b nebo a > b."
§4.
UMOCŇOVÁNÍ MOHUTNOSTÍ
„Pokrytím množiny N prvky množiny M" nebo stručněji „pokrytím N prvky M" rozumíme pravidlo, kterým je s každým prvkem n z N svázán jistý prvek z M, přičemž jeden a tentýž prvek z M může být použit i opakovaně. Takto je tedy prvek z M, který je svázán s n, jistou jednoznačnou funkcí n a můžeme ho proto označit f (ji). Tuto funkci nazveme „pokrývači funkcí prvků n". Odpovídající pokrytí množiny N označíme f(N).
Řekneme, že dvě pokrytí f\(N) a f2(N) jsou si rovna právě tehdy, když pro všechny prvky n z N platí rovnost
f1(n) = f2(n); (1)
to znamená, že když existuje byť jen jediný prvek n = no, pro který uvedená rovnost není splněna, pak již považujeme pokrytí f\(N) a f2(N) za navzájem různá.
2. Georg Cantor a jeho dílo
131
Kupříkladu můžeme, když Oto je jistý prvek z M, zadat pro všechny n
f (n) = mQ.
Takto je pak určeno pokrytí N prvky množiny M.
Jiné pokrytí obdržíme, když pro dva různé prvky Oto a m\ z M a pro jistý prvek no z N zadáme
f(n0) = ot0,    f(n) = ml
pro všechna n různá od n$.
Souhrn všech rozdílných pokrytí N množinou M tvoří jistou množinu s prvky f(N). Nazveme ji „množinou všech pokrytí N prvky M" a označíme ji (N\M). Je tedy
mm(N\M) = {/(#)}. (2)
Platí-li M ~ M' a N ~      pak lze lehce odvodit, že také
(N\M) ~ (iV'|M'). (3)
Kardinální číslo množiny (N\M) tedy závisí jen na kardinálních číslech M = a a N = b. Můžeme proto definovat mocninu ab takto:
afc = (N\M). (4)
§6.
NEJMENŠÍ KARDINÁLNÍ ČÍSLO ALEF NULA
Množiny s konečným kardinálním číslem nazýváme „konečnými množinami"; všechny ostatní množiny nazýváme „transfmitními množinami" a jejich odpovídající kardinální čísla nazýváme „transfmitními kardinálními čísly".
Souhrn všech konečných kardinálních čísel v nám udává následující příklad transfmitní množiny; jí odpovídající kardinální číslo (§1) „alef nula", symbolicky Ko, definujeme vztahem
K0 = M. (1)
To, že Ko je transfmitní číslo, tj. není rovno žádnému konečnému číslu /x, plyne z té jednoduché skutečnosti, že když přidáme k množině {v} nějaký nový prvek eo, je sjednocení ({v}, eo) ekvivalentní s původní množinou {v}. Existuje totiž mezi
132
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
nimi vzájemně jednoznačné přiřazení, při němž prvku eo odpovídá první prvek 1 druhé množiny, prvku v první množiny pak odpovídá prvek v + 1. Podle §3 tak dostáváme
H0+1 = K0. (2)
V §5 jsme však dokázali, že (pro konečná /x) je /x + 1 různé od /x, takže Ko není rovno žádnému konečnému číslu /x.
Číslo Ko je větší než všechna konečná čísla /x:
K0 > /x. (3)
Toto plyne okamžitě z §3, neboť/x = {1, 2, 3, ..., /x}, žádná část množiny {1, 2, 3, ..., /x} není ekvivalentní s množinou {v} a samotná množina {1, 2, 3, ..., /x} je částí {v}.
Na druhé straně je Ko nejmenší transfmitní kardinální číslo. Je-li a jakékoliv transfmitní kardinální číslo různé od Ko, Pak
K0 < a. (4)
Toto plyne z následujících vět:
A. V každé transfmitní množině T existuje podmnožina s kardinálním číslem
Důkaz: Odstraníme-li podle nějakého pravidla z T konečný počet prvků t\, t2, ■ ■ ■, tv-i, zůstane zde pořád možnost odstranit i další prvek tv. Množina {?„}, kde v je libovolné konečné kardinální číslo, je podmnožinou v T s kardinálním číslem Ho, protože {tv} ~ {v} (§1).
B. Je-li S transfmitní množina s kardinálním číslem Ho a S\ je transfmitní podmnožina v S, pak je rovněž. S\ = Ho-
§15.
ČÍSLA DRUHÉ ČÍSELNÉ TŘÍDY Z(K0)
Druhá číselná třída Z (Ho) je souhrn {a} všech ordinálních typů dobře uspořádaných množin, jejichž kardinální číslo je Ho (§6).
A. Druhá číselná třída obsahuje nejmenší prvek co = Limvv.
Důkaz: Symbolem a> rozumíme typ dobře uspořádané množiny Fq = (fi, fi, ■ ■ ■, fv, ■ ■ ■),
(1)
3. Antinomie teorie množin.
133
kde v probíhá všechna konečná ordinální čísla a
f v < fv+1-
(2)
Je tedy (§7)
co = F0
(3)
a (§6)
co = K0.
(4)
ctí je tedy číslo druhé třídy a sice to nejmenší. Je-li y jakékoliv ordinální číslo < co, musí být (§14) typem nějakého řezu v Fq. Fq má však pouze řezy
s konečným ordinálním číslem v. Proto platí y = v.
Neexistuje tedy transfinitní ordinální číslo, které by bylo menší než co, takže ctí je nejmenší takové. Podle toho, co jsme uvedli v §14 o Limvcrv je zřejmě ctí = Limvv.
B. Je-li a libovolné číslo druhé třídy, pak za ním následuje jako nejbližší větší číslo téže číselné třídy číslo a + 1.
19. století bylo obdobím prudkého rozvoje přírodních i společenských věd. V řadách vědců řady oborů narůstá uspokojení nad dosaženými výsledky: zdá se jim, že přírodní vědy zmapovaly a popsaly vše podstatné v reálném světě. Zasloužilo by si hlubšího rozboru, čím to bylo způsobeno, že téměř současně — na přelomu 19. a 20. století — dochází v řadě z nich, včetně matematiky, k dramatickému zvratu.
Tak například známý americký fyzik Albert Abraham Michelson, jehož jistě nebudeme podezírat z malého přehledu a nedostatku odbornosti, v roce 1894 prohlašuje:
Důležité základní zákony a fakta ve fyzice již. byly všechny objeveny a jsou dnes tak pevně prokázány, ž.e možnost, ž.e by vůbec kdy byly nahrazeny v důsledku nových objevů, je nesmírně vzdálená... Naše budoucí objevy je třeba hledat na šestém desetinném místě!
A = (f1,f2,..., /„)
3   Antinomie teorie množin. Třetí krize matematiky
Nikdy není tak zle, aby nemohlo být ještě hůř. Gattusovo rozšíření Murphyho zákona
134
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
Dva roky poté, v r. 1896, objevuje Antoine Henri Becquerel přirozenou radioaktivitu, v r. 1905 publikuje Albert Einstein speciální teorii relativity (vr. 1916 pak obecnou), ve 20. letech se konstituuje kvantová mechanika atd.: co z fyzikálního obrazu světa z konce 19. století vlastně přetrvalo až do dneška?
Něco podobného se na přelomu století odehrálo i v matematice, s důsledky pro matematiku samotnou asi ještě závažnějšími.
Uváděli jsme již, jak podrážděné reakce vyvolaly první Cantorovy množinové práce. Postupně se však prokázalo, jak mocným a potřebným nástrojem se teorie množin pro matematiku stala. Ke konci 19. století dosáhla teorie množin téměř všeobecného uznání a stala se základnou, na níž byla budována prakticky celá matematika. Všeobecné mínění matematiků té doby vystihuje známý výrok čelného francouzského matematika a fyzika Henri Poincarého, jednoho z vůdčích duchů tehdejšího vědeckého světa, který na II. mezinárodním matematickém kongresu v Paříži v roce 1900 prohlašuje:
... nyní v matematice zůstávají jen celá čísla a konečné, respektive nekonečné systémy celých čísel ... Matematika je plně aritmetizpvána. Dnes můžeme říci, ž.e dosáhla absolutní přesnosti.
Je vskutku ironií osudu, že v době, kdy Poincaré tato slova pronášel, už bylo de facto jasné, že teorie oněch „nekonečných systémů celých čísel", jakožto část teorie množin, má k oné absolutní přesnosti dále než daleko. Antinomie teorie množin, z nichž první již byla tehdy známa, vyvedly matematiky krutě z mylného zdání, že mají k dispozici spolehlivou základnu pro výstavbu svých teorií. A strastiplná cesta za překonáním těchto antinomií, cesta, na jejíž konec matematika dodnes nedorazila, nám ukázala, jak podstatně je nutno revidovat původní představy o možnosti spolehlivého vybudování základů matematiky. (O tom však budeme podrobněji hovořit v §4.) Z tohoto hlediska není označení 3. krize matematiky pro období, které matematika od počátku 20. století prožívá, nijak přehnané.
(Připomeňme si, že 1. krize matematiky cca v 5. stol. př. n.l. souvisela s objevem iracionálních čísel a se Zenónovými aporiemi o nemožnosti sestrojení konečných veličin z nekonečně mnoha částí. 2. krize matematiky, jak jsme již uvedli, je spojována s nejasnostmi kolem počítání s nekonečně malými veličinami. Newton a Leibniz při výstavbě infinitesimálního počtu nedovedli tyto operace řádně zdůvodnit. Během doby bylo čím dál nejasnější jak je možné, že nezdůvodněné postupy s přesně nedefinovanými veličinami dávají převážně správné výsledky. Tato krize byla překonána díky práci Cauchyho, Weierstrasse a dalších v 19. století.)
V kapitole I jsme ukázali (viz větu 5.10), že když lze v nějaké teorii dokázat nějaké tvrzení a současně i jeho negaci, lze v této teorii dokázat každé tvrzení. Taková teorie je ovšem prakticky bezcenná. Přesně toto se ovšem stalo v Cantorově teorii množin, když se v ní objevily tzv. antinomie, někdy též nesprávně nazývané paradoxy.
První z těchto antinomií publikoval v r. 1897 italský matematik Césare Búrali-Fořti v práci Una questione sui numeri transfiniti, Rendiconti Palermo 11, 154 - 164). Cantor sám znal tuto
3. Antinomie teorie množin.
135
antinomii již v r. 1895; spočívá v tom, že ordinální číslo dobře uspořádané množiny všech ordinálních čísel je větší než. všechna ordinální čísla (tzn., že existuje ordinální číslo větší než ono samo). (Srovnej s III. 6.2.)
Po objevení této antinomie bylo ještě možno chovat jistou naději, že ji bude možno nějak odstranit a situaci tedy bude možno zachránit. (Samotný Cantor až do konce života věřil, že jeho teorii bude možno nějak „opravit".) V prvním desetiletí 20. století se však těchto antinomii objevila celá řada; jednoznačně se tak prokázalo, že tato sporná tvrzení se neobjevují jen na „periférii" matematiky a netýkají se jen objektů, bez nichž se lze snadno obejít, ale právě naopak, ukázalo se, že obtíže tkví v podstatě věci a celá teorie množin musí být vybudována na zcela nových základech. Za 80 let, které od té doby uplynuly, ovšem nebylo nalezeno všeobecně přijaté řešení této situace — viz §4.
Nyní podáme stručný přehled nejznámějších antinomii.
Nejznámější je antinomie, kterou v r. 1902 objevil a v r. 1903 publikoval anglický matematik, filozof, logik, sociolog a veřejný činitel, lord Bertrand Russell. (Nezávisle na něm objevil tuto antinomii rovněž Ernst Zermelo. Russellova antinomie spočívá, j ak j sme uvedli již v kapitole I, v tom, že když utvoříme „množinu S všech množin, které nejsou svým vlastním prvkem", vede ke sporu předpoklad S £ S i předpoklad S <£ S.
Tato antinomie byla zpopularizována samotným Russellem a mnoha dalšími matematiky. Z celé řady těchto populárních variant uveďme alespoň následující:
Jistý vojín, povoláním holič, dostal od svého velitele příkaz, že musí holit všechny vojáky své čety, kteří se neholí sami a nesmí holit nikoho jiného. Tím se ovšem tento vojín ocitl v neřešitelné situaci, neboť sám se má holit právě tehdy, když se sám nebude holit.
V roce 1905 uveřejnil francouzský lékař a matematik — a v té době ředitel Oceánogra-fického muzea v Monaku — Jules Richard Richardova antinomieanúnomii, v níž vynikajícím způsobem využil (nebo zneužil?) Cantorovy diagonální metody. Nejsnáze lze tuto antinomii zformulovat takto: všech konečných posloupností českých slov (nazvěme tyto posloupnosti „větami") je spočetně mnoho. Některé z těchto vět jednoznačně definují nějaké reálné číslo, například „šest pětin", „nejmenší prvočíslo, které je větší než deset milionů" apod. Množina T všech těchto čísel je spočetná (neboť všech vět je pouze spočetně mnoho). Lze tedy množinu T uspořádat do posloupnosti. Nyní Cantorovou diagonální metodou sestrojíme číslo r £ T. To podle definice množiny znamená, že číslo r nelze definovat žádnou konečnou posloupností českých slov. To je však zřejmý spor s tím, že jsme takto číslo r právě definovali.
Zjednodušením Richardovy antinomie je následující antinomie Berryho, kterou poprvé publikoval Russell v r. 1906: protože všech českých „vět" (ve výše uvedeném smyslu), které mají nejvýše 20 slov, je pouze konečně mnoho, existují nutně přirozená čísla, která takovou větou definovat nelze. Můžeme proto vyslovit následující definici:
Buďk nejmenší přirozené číslo, které nelze definovat českou větou o nejvýše dvaceti slovech.
Čtenář nechť si promyslí, co jsme právě udělali: větou o 14 slovech jsme definovali číslo,
136
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
které nelze definovat žádnou větou, která by měla dvacet nebo méně slov!
V literatuře (viz například [5]) lze najít ještě další antinomie. Uvedené ukázky však — doufejme — udávají dostatečný přehled o tom, jakého druhu byla ona tvrzení, která způsobila 3. krizi matematiky.
Pravděpodobně je však nyní nutné podrobněji vysvětlit, proč uvedené antinomie nejsou jen zajímavými logickými hříčkami bez hlubšího významu (jak se původně řadě matematiků zdálo a jak na ně ostatně i dnes může pohlížet ten, kdo k matematice přistupuje „pseudoinženýrsky" jako ke snůšce výpočetních metod), ale závažnými problémy, které zbouraly pracně vybudovanou budovu moderní matematiky a způsobily v matematice dodnes nepřekonanou krizi.
Nešlo jen o to, že se objevila v teorii množin sporná tvrzení, znehodnocující tuto teorii. Horší bylo, že — jak jsme již uvedli — v uvedené době již byla teorie množin základnou převážné části matematiky. (Je zřejmé, že to znamenalo, že teorii množin je nutno buďto „opravit" nebo najít jinou a „lepší" základnu. Co by však mělo a mohlo být onou novou základnou? To si prakticky nikdo nedovedl představit. Vynikající německý matematik David Hilbert, o němž budeme ještě hovořit v §4, to v r. 1925 vyjádřil často citovanými slovy: Nikdo nás nemůže vyhnat z ráje, který pro nás vybudoval Cantor. (Opravám „cantorovského ráje" se budeme věnovat v následujícím paragrafu.)
Nejzávažnější důsledky antinomií však spočívaly ještě v něčem jiném. Připomeňme si, jaké bylo východisko Cantorovy teorie. „Množina" bylo jen synonymum slov souhrn, systém apod. Tento pojem je tak samozřejmý a názorný, že není nutno ho nijak definovat. (Podobně jako je v Eukleidově geometrii zřejmé, co je to bod nebo přímka. Ostatně pojem „množina" je jistě intuitivně jednodušší než například pojem „přímka".) O těchto souhrnech — množinách pak Cantor běžně užívanými matematickými a logickými metodami dokazuje tvrzení a odvozuje jejich vlastnosti. (Takto budované teorii se dnes říká „naivní", respektive „intuitivní" teorie množin.) Nebylo nejmenšŕho důvodu předpokládat, že teorie budovaná tímto způsobem by mohla být principiálně nesprávná; vždyť takto se matematika budovala od starověku. A přesto antinomie prokázaly, že matematiku takto bezelstně budovat nelze! Toto je nejzávažnější důsledek antinomií.
A jaký je tedy „správný" způsob výstavby matematiky? Právě proto, že na odpovědi na tuto otázku se matematikové dodnes neshodli, hovoříme o důsledcích vzniklé situace jako o 3. krizi matematiky.
Tato krize pochopitelně neznamená, že by se matematika ve 20. století nevyvíjela; dobře víme, že je tomu právě naopak. Tato krize samozřejmě ani nemá bezprostřední negativní důsledky na ty matematické disciplíny — a těch je samozřejmě většina — které přímo nesouvisejí s výstavbou základů matematiky. Matematik, který by se však stavěl do pozice, že jeho práce se toto všechno nedotýká, by nápadně připomínal pštrosa, strkajícího hlavu do písku. Jeden z velkých matematiků 20. století, Hermann Weyl, jenž je právě autorem téze o nástupu 3. krize matematiky, tuto situaci charakterizoval v r. 1946 slovy:
4. Východiska z, krize
137
Méně než, kdykoliv dříve jsme přesvědčeni o prvotních základech logiky a matematiky. Jako všichni a všechno v dnešním světě prožíváme „krizi". Ta trvá už, téměř padesát let. Na první pohled nám nepřekáží v každodenní práci; mohu se však přiznat, ž,e ve skutečnosti měla silný vliv na mou matematickou činnost: směrovala mé zájmy do oblasti, která se mě zdála relativně „bezpečnou", a neustále ve mně podrývala nadšenia odhodlání nezbytné pro každou vědeckou práci.
4   Východiska z krize
Když, se všechno daří, něco se pokazí. První Chisholmův zákon
Jak jsme uvedli v §3, bylo po objevení antinomií teorie množin zřejmé, že dosavadní styl výstavby matematiky je neudržitelný. Přístup matematiků k řešení vzniklé situace byl samozřejmě odlišný podle jejich filozofického i profesionálního zaměření. Přesně definovat a ohraničit jednotlivé myšlenkové proudy je přitom nemožné. V hrubých rysech však lze říci, že základní přístup k řešení byl dvojí: intuicionistický a formalistický, přičemž mezi formalistické směry patří několik vyhraněných a velmi odlišných skupin.
Podle intuicionistických názorů byla matematika v posledních desetiletích budována nepřípustnými metodami. Některá logická pravidla, zřejmě platná pro konečné systémy, jako například princip vyloučeného třetího (tertium non datur — viz větu 3.15 (2)v kapitole L), byla nedovoleným způsobem přenesena i na nekonečné systémy. Intuicionisté odmítají aktuální nekonečno, neuznávají existenční důkazy. Objekt, který nelze zkonstruovat pomocí jiných uznaných postupů, prostě neexistuje. Je evidentní, že tím před nimi vyvstaly obrovské potíže. Po formální i obsahové stránce byli nuceni prakticky nově budovat řadu matematických disciplín, neboť jen malá část klasické matematiky pro ně byla „přípustná".
V poslední době sílí tendence dívat se na intuicionismus jako na historickou kuriozitu. Přínos intuicionistů k rozvoji matematiky však byl nemalý. A přinejmenším k zamyšlení by nás měla přimět skutečnost, že mezi ně patřila řada nejvěhlasnějších matematiků posledních generací. První intuicionistické ideje v novodobé matematice lze najít v 70. - 80. letech 19. století v díle Leopolda Kroneckera, o němž již z §2 víme, že stál v čele proticantorovského hnutí. Zrod moderního intuicionismu je však spojován se jménem holandského matematika Leutzena Egberta Jana Brouwera, který základní intuicionistické ideje zformuloval ve své disertační práci v r. 1907. Kromě již zmíněných H. Weyla a H. Poincarého lze k intuicionistům přiřadit například matematiky takového kalibru, jako byli Emile Borel, Henri Leon Lebesgue či Nikolaj Nikolajevič Lužin.
Základní formalistické přístupy k výstavbě teorie množin a základům matematiky jsou
138
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
dvojí: metoda teorie typů a axiomatická výstavba.
Zakladatelem teorie typů je již několikrát zmiňovaný B. Russell. Podle jeho mínění byly antinomie způsobeny tím, že pomocí všech prvků daného systému byl opět definován prvek daného systému. V teorii typů, kde jsou jednotlivé pojmy „hierarchicky" rozvrstveny, nemůže být pomocí prvků jisté úrovně definován prvek téže úrovně. Tím je samozřejmě vyloučen vznik antinomií Russellova druhu. Z prací rozvíjejících teorii typů uveďme alespoň dvě nejvýznam-nější a nejznámější. Je to především tzv. New Foundations amerického matematika Ormana Willarda van Quinea poprvé publikovaná v r. 1937 a dále tzv. Systém £ jiného amerického matematika Hao Wanga, poprvé Wangem popsaný v roce 1954.
Teorie typů bývá často nesprávně zaměňována s jiným filozoficko-matematickým směrem, tzv. logicismem. Původ této záměny je jednoduchý — hlavním představitelem logicismu je zakladatel teorie typů Bertrand Russell. Zformulovat hlavní tezi logicismu není jednoduché; vyžadovalo by to zevrubnější rozbor vzájemného vztahu matematiky a matematické logiky. Nepřesně ji lze vyslovit asi následovně: všechny speciální matematické pojmy lz.e definovat pomocí slovníku matematické logiky a k důkazům matematických tvrzení není třeba žádných axiómů kromě logických ani žádných odvozpvacích pravidel kromě těch, která jsou akceptována logikou.
Faktickým zakladatelem logicismu byl německý matematik Friedrich Ludwig Gottlob Frege. Jakou ideou byl Frege veden? Poslední čtvrtina 19. století byla obdobím značně úspěšné aritmetizace matematiky. (Svědectvím o této skutečnosti je například Poincarého výrok, který jsme citovali v úvodu 3. paragrafu nebo známý výrok Kroneckerův: Celá čísla stvořil Bůh, vše ostatní je dílem lidí.) Frege se pokoušel aritmetiku zredukovat na logiku. Jeho dílo zůstalo v době vzniku prakticky nepochopeno. Až Russell na tuto ideu navázal a pokoušel se totéž udělat s Cantorovou teorií množin. Právě při této práci přišel na onu klasickou antinomii nazvanou jeho jménem.
Základním dílem logicismu je třídílná monografie Principia Mathematica, kterou v letech 1910-1913 vydal Russell společně s anglickým matematikem, filozofem a logikem Alfredem Northern Whiteheadem. Logicismus měl sice značný vliv na rozvoj matematické logiky, mezi matematiky však logicistická redukce matematiky na odnož logiky nikdy nezaznamenala větší ohlas.
Většina matematiků za východisko z krize považovala axiomatickou výstavbu matematiky. Dnes je to nejběžnější a nejuznávanější způsob budování matematických teorií. Axiomatické metody již dokonce dávno překročily rámec matematiky samotné a jsou stále hojněji užívány i v jiných vědách, a to nejen přírodních. Proto se o nich zmíníme podrobněji.
Je samozřejmé, že při deduktivní výstavbě nějaké vědecké teorie, kdy složitější pojmy definujeme pomocí pojmů jednodušších a nová tvrzení odvozujeme z tvrzení již dokázaných, není principiálně možno definovat všechny pojmy a dokázat všechna tvrzení. Na jisté úrovni je nutno započít; jisté tzv. „primitivní" pojmy je nutno zavést bez definice a jistá tvrzení —
4. Východiska z. krize
139
tzv. axiómy —je nutno pokládat za pravdivé bez důkazu. Zásady takové deduktivní výstavby vědy zpracoval již Aristoteles. První — a geniální — takto zpracované matematické dílo jsou Eukleidovy Základy.
Nový impuls pro rozvoj axiomatické metody dala opět geometrie. Pokusy o důkaz 5. Eukleidova postulátu o rovnoběžkách, vedoucí — jak známo - až ke vzniku neeukleidovské geometrie, vyvolaly nový zájem o důslednou axiomatizaci geometrie. Tato práce byla završena dílem Davida Hilberta Grundlagen der Geometrie (1899), o němž se ještě později zmíníme. A 20. století je obdobím konjunktury axiomatického přístupu k matematice.
Je samozřejmé, že v průběhu doby axiomatické metody zaznamenaly značný vnitřní vývoj. Tento proces lze zhruba rozdělit do tří základních etap:
(a) tradiční axiomatika (Eukleidés);
(b) formální axiomatika (19. století);
(c) formalizovaná axiomatika (20. století).
V čem spočívají hlavní rozdíly mezi axiomatikami jednotlivých období?
Tradiční axiomatika byla popisována v běžném hovorovém jazyce. V tom ovšem bylo potenciálně skryto nebezpečí, že se v takto budované teorii objeví nepřesnosti, nejasnosti nebo dokonce zásadní obtíže; žádný hovorový jazyk není natolik přesný, aby se tomu dalo zabránit. Za druhé, při tradiční axiomatice nejsou přesně zformulována pravidla pro odvozování jedněch výroků z druhých. Při „intuitivně jasném" odvozování je ovšem vyloučena jednoznačná kontrola správnosti úsudků. Jak prokázaly antinomie, byla především tato okolnost zdrojem těch největších problémů. A konečně, v klasické axiomatice byly axiómy tvrzení, která nebylo nutno dokazovat proto, že byla zcela „samozřejmá". Teorie byla v tomto slova smyslu budována „sémanticky".
V dalších dvou etapách vývoje axiomatických metod došlo ve všech uvedených bodech k výrazným změnám. Již ve 2. etapě, při budování formální axiomatiky, dochází mimo jiné k tomu, že:
(a) je dán přesný počet výchozích pojmů a tvrzení;
(b) jsou přesně stanovena odvozovací pravidla;
(c) systém axiómů se mění v souhrn pravidel implicitně určujících, jak je možno pracovat s výchozími pojmy;
(d) proces formální výstavby axiomatického systému je oddělován od jeho možných interpretací (tzv. modelů);
(e) zkoumá se nezávislost, bezespornost a úplnost systémů axiómů (jak o tom hovoříme dále) pomocí modelů daného systému.
140
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
Ve třetí, formalizovane etapě, dochází navíc k důslednému oddělení jazyka, v němž je daná teorie budována (tzv. „objektový jazyk") od jazyka užívaného k popisu objektového jazyka (tzv. „metajazyk"). (Rada antinomií právě vznikla záměnou těchto dvou jazyků.) Objektový jazyk je přitom „symbolizován", tj. na začátku je zadána „abeceda" (souhrn užívaných symbolů -znaků), jsou udána pravidla, jak tvořit, respektive poznávat správně utvořená „slova" (nazývaná „formule") a jsou dána pravidla odvozování jedněch formulí z dalších. Za axiómy jsou pak prohlášeny některé z formulí. Proces oddělení formální výstavby teorie od jejích modelů je takto zcela dovršen. (V uvedeném smyslu je například geometrie vyučovaná na školách pouze jedním z možných modelů axiomatické eukleidovské geometrie.
Podobně je tomu s teorií množin, vyučovanou dnes u nás již od 1. třídy. Již v 1. kapitole jsme ostatně uvedli, že ve školách se de facto učí model ZF teorie.)
Ještě než začneme hovořit o axiomatických teoriích množin, stručně k uvedeným požadavkům na volbu axiómů. Ta samozřejmě není předem jednoznačně determinována; volba axiómů je do značné míry věcí libovůle toho, kdo danou teorii vytváří. Jako přirozené se však jevilo požadovat, aby zvolená soustava axiómů byla vždy:
1. nezávislá (tzn., že žádný z axiómů nelze odvodit ze zbývajících; takové tvrzení by evidentně nebylo nutno považovat za axióm);
2. úplná (tzn., že axiómů je dostatečně mnoho k tomu, abychom mohli každé tvrzení této teorie buďto dokázat nebo vyvrátit — tj. dokázat jeho negaci);
3. bezesporná (chceme mít zaručeno, že z axiómů nelze odvodit současně nějaké tvrzení i jeho negaci; víme, že takové teorie je bezcenná).
Nyní je přirozená otázka, zda lze axiomatický systém s uvedenými vlastnostmi sestrojit. (Původně o tom ovšem nenapadlo nikoho pochybovat.)
Relativně nejméně problémů působí nezávislost. Její případné porušení je de facto jen „kosmetickou vadou" dané teorie a její odstranění není obtížné. Není-li však teorie úplná, je to značně nepříjemné, neboť to značí, že v této teorii nutně existují tvrzení, která nelze ani dokázat, ani vyvrátit. (Zdálo by se ovšem, že tuto obtíž by mělo jít odstranit jednoduše přidáním dalších axiómů.) A není-li teorie bezesporná, je to pro ni naprostá katastrofa. Zatím však, co například pro eukleidovskou geometrii se podařilo úplnost a bezespornost prokázat ve výše uvedené Hilbertově monografii z r. 1899, dokázat úplnost a bezespornost budovaných axiomatických teorií množin se nikomu nepodařilo. To, že se podařilo objasnit, zda lze úplnou a bezespornou teorii množin (a další teorie) sestrojit, patří k největším úspěchům moderní matematiky. Skutečnost, že odpověď je záporná, byla jistě překvapující a nepříjemná. Značí totiž výrazné omezení možností axiomatických metod. Podrobněji však budeme o této problematice hovořit v §5.
První úspěšnou axiomatickou teorií množin byla teorie, kterou v letech 1904 -1908 vybudoval již zmíněný německý matematik Ernst Zermelo. Základní Zermelova idea spočívala v tom,
4. Východiska z. krize
141
že nelze předpokládat —jak to činil Cantor — že každý souhrn objektů tvoří množinu. Pomocí axiómů je nutno dosáhnout toho, aby množin bylo „dostatečně mnoho", nikoliv však tolik, aby mohlo docházet k antinomiím. Žermelův systém axiómů později částečně modifikoval a dalšími axiómy doplnil izraelský matematik Abraham A. Fraenkel. Zermelo-Fraenkelova teorie množin (nadáleji budeme značit ZF) je dnes nejrozšířenější axiomatizovanou množinovou teorií.
Skutečnost, že v rámci ZF nelze pracovat se všemi systémy, například se „systémem všech množin", „systémem všech grup" a podobně, je však v mnoha ohledech nepříjemná. V roce 1925 však publikoval americký matematik maďarského původu John von Neumann práci, v níž se mu podařilo tuto obtíž obejít. Jeho ideu využil švýcarský matematik Isaak Paul Bernays, který v letech 1937 - 1954 vypracoval vlastní axiomatiku teorie množin (přesněji řečeno „teorie tříd"). Taje základem tzv. Gódel-Bernaysovy teorie tříd (nadáleji značíme GB), která vznikla syntézou axiomatiky Bernaysovy a axiomatického systému Kurta Gódela, poprvé publikovaného v r. 1940. (O Gódelovi budeme podrobněji hovořit v §5.)
Zatímco v ZF jsou nedefinované pojmy „množina" a e, jsou to v GB pojmy „třída" a e. Některé axiómy ZF jsou současně i axiómy v GB. Proto lze řadu množinových pojmů na třídy převést. (Například „obvyklé" množinové operace apod.) Třídy, které jsou prvkem nějaké jiné třídy, se v GB nazývají „množinami". „Vlastní třídy" jsou pak ty třídy, které množinami nejsou. Lze dokázat, že množiny ve smyslu ZF jsou i množinami ve smyslu GB (takže GB je vlastně „rozšířením" ZF). Vlastní třídou je například „třída všech množin". Na rozdíl od množin nemají vlastní třídy například žádné kardinální číslo. (Tuto problematiku jsme probírali v 1. kapitole.)
Podrobnější rozbor role jednotlivých axiómů a přehled dalších axiomatických systémů nebudeme uvádět. Obojí lze nalézt například v již citované knize [5], kde je uveden i obsáhlý přehled další literatury. Pouze o jednom axiómu se pro jeho výjimečné postavení zmíníme podrobněji. Jak čtenář jistě tuší, máme nyní na mysli axióm výběru. Tento axióm, jak známo, nám zajišťuje, že k libovolnému systému neprázdných množin existuje množina, která má s každou z těchto množin jednoprvkový průnik.
První — a negativní — zmínku o principu zformulovaném v tomto axiómu lze nalézt v r. 1890 u známého italského matematika Giuseppe Peana v práci Démostration de ľintegrabilité des équations differentielles ordinaires, Math. Ann. 37, 182-228. V roce 1902 se
0 tomto principu zmiňuje další italský matematik Beppo Levi. Intuitivně tohoto axiómu užíval
1 Cantor, aniž si ovšem uvědomoval, že užívá principu dosud v matematice, respektive v logice neužívaného.
V této souvislosti je zajímavá jedna okolnost. Již v §2 jsme uvedli, jak těžce na Cantora již v r. 1884 doléhaly neúspěchy spojené s hypotézou kontinua. Cantor byl vždy pevně přesvědčen, že každá mohutnost je některým alefem, nikdy se mu však nepodařilo tuto skutečnost dokázat; dnes, po vyřešení hypotézy kontinua, je nám ovšem jasné, proč tomu tak bylo. Jak však v jednom dopise píše Cantorův žák Felix Bernstein — který v r. 1897 jako první dokázal
142
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
známou větu o ekvivalenci dvou množin, po něm pojmenovanou (věta III. 2.1.) — pokoušel se někdy v r. 1901 společně s Cantorem sestrojit bijekci mezi kontinuem a množinou Z(Ko), která má mohutnost Kj. Přitom však narazili na nepřekonatelné těžkosti, které právě Levi navrhoval odstranit pomocí uvedeného principu.
Axióm výběru poprvé explicitně zformuloval E. Zermelo v r. 1904 v práci Beweis, dass jede Menge wohlgeordnet werden kann, Math. Ann. 59, 514-516, kde ho užil, jak to ostatně název práce uvádí, k důkazu tvrzení, že každou množinu lze dobře uspořádat. (Tomuto tvrzení se dnes běžně říká Zermelova věta, axióm výběru pak bývá často nazýván Zermelovým axiómem.) Rada matematiků vznášela proti axiómu výběru od počátku četné výhrady. (Samozřejmě, že vzhledem ke své nekonstruktivnosti byl zcela nepřijatelný především pro intuicionisty.)
Tyto výhrady se ještě zostřily poté, co Felix Hausdorff pomocí axiómu výběru dokázal tvrzení o paradoxním rozdělení koule; odvodil totiž, že její polovina je kongruentní s její třetinou. (Důkaz tohoto tvrzení je uveden v knize [8], která je první monografií věnovanou teorii množin. Tato kniha měla nesmírný vliv na řadu matematiků a na vývoj těch matematických disciplín, které jsou na teorii množin založené.)
Později dokázali další autoři, především polští matematici Stefan Banach a Alfred Tarski i jiné paradoxní důsledky axiómu výběru. Jak se však záhy prokázalo, zamítnutí tohoto axiómu by na druhé straně způsobilo neskonalé problémy, neboť řadu „běžných" tvrzení v různých matematických teoriích nelze bez jeho užití prokázat. Poté, co A. Fraenkel v r. 1922 dokázal nezávislost axiómu výběru na ostatních axiómech v běžných teoriích množin a K. Gódel v r. 1938 odvodil jeho bezespornost, se situace víceméně ustálila ve stavu, který trvá dodnes. Axiómu výběru sice užíváme, ale jen tehdy, když je to nezbytné a jeho užití je většinou zdůrazněno.
Jak přívrženci axiomatické výstavby matematiky, tak matematici přiklánějící se k teorii typů, samozřejmě cítili nutnost dokázat, že jimi budované teorie jsou bezesporné. Klasické metody, použitelné ještě například pro důkaz bezespornosti eukleidovské, respektive neeuklei-dovské geometrie, však nebyly pro disciplíny operující s aktuálním nekonečnem použitelné. Bylo proto nutné vypracovat k těmto účelům metodu novou. Nejsystematičtěji se tímto úkolem zabýval již několikrát zmiňovaný David Hilbert, autor návrhu dnes všeobecně nazývaného hilbertovský program.
První nástin tohoto programu podal Hilbert již v r. 1904, aniž by se jím však dále zabýval. Až v roce 1917, kdy reagoval na neustálé výpady intuicionistů, se k této problematice vrátil a zabýval se jí pak prakticky do své smrti. Zvláště intenzívně se na tomto programu pracovalo v letech 1920 - 1930, kdy s Hilbertem spolupracovala celá řada mladých matematiků; kromě již zmíněných Bernayse a von Neumanna to byli především Wilhelm Ackermann a Jacques Herbrand.
Stručně popišme, jaká byla Hilbertova idea. Vycházel z toho, že je nutno dokázat, že užívané matematické důkazové metody jsou dostatečně silné k tomu, aby jimi bylo možno vybudovat
5. Gôdelovy výsledky
143
celou klasickou matematiku včetně teorie množin, vycházející přitom z vhodně zvolených axiómů, současně však nejsou natolik silné, aby jejich aplikací bylo možno dojít k antinomiím. (Jak vidět, Hilbert byl skálopevně přesvědčen o správnosti základů klasické matematiky.) Celý tento program měl být realizován ve dvou etapách.
V první etapě měla být matematika, především pak aritmetika, analýza a teorie množin, plně formalizována. Tato formalizace by spočívala v tom, že všechna pravdivá tvrzení, především samozřejmě axiómy, by byla převedena na posloupnosti symbolů zbavených jakéhokoliv obsahu. S těmito posloupnostmi by se pracovalo pomocí jistého počtu přesně definovaných od-vozovacích pravidel. Takto — ryze syntakticky — by byla vybudována klasická matematika, přičemž by k této práci nebylo zapotřebí prakticky žádné „intuice"; povolené transformace posloupností by vzhledem k fmitnosti všech procesů mohl teoreticky provádět i stroj.
Ve druhé etapě mělo být dokázáno, že výše uvedeným způsobem nelze nikdy dojít ke spornému tvrzení, například k formuli „1 = 2". Použité metody přitom musí být natolik jednoduché, aby o jejich správnosti nebylo nejmenších pochyb. Základním požadavkem samozřejmě byla fmitnost. (Tuto část, v níž měla být dokázána bezespornost matematiky, nazval Hilbert mctamatcmatikou.)
Na uvedeném programu vykonal Hilbert se svými žáky obrovský kus práce. V době, kdy se již zdálo, že celý program by mohl být zdárně ukončen, však výsledky A. Tarského, Alonza Churche a především K. Gódela prokázaly, že hilbertovský program je nerealizovatelný. Jak uvidíme v dalším paragrafu, plyne z Gódelových výsledků nerealizovatelnost 1. i 2. etapy. Hilbert, který byl ještě po objevení antinomií v Cantorově teorii množin tak pevně přesvědčen o správnosti základů matematiky, že prohlásil: Předpoklad existence objektivních rozporů ve vnějším světě je klasickým případem nesmyslu, nesl velmi těžce toto zhroucení svých idejí. Nedlouho před svou smrtí prohlásil: Kde máme hledat naději a jistotu, když, dokonce matematické myšlení selhalo.
Dnes si sice nemyslíme, že selhalo matematické myšlení, avšak vyrovnat se s Gódelovými výsledky znamenalo podstatně revidovat představy o možnostech formální výstavby matematiky — a nejen matematiky.
5   Gôdelovy výsledky
Zákonitě musí jednou nastat ta nejhorší možná situace. Druhý Soddův zákon
Kurt Gódel, jeden z nej větších matematiků a logiků moderní éry, se narodil v r. 1906 v Brně, kde absolvoval střední školu. Studoval na univerzitě ve Vídni, kde promoval v r. 1930. V r. 1940 emigroval do USA a až do své smrti v r. 1978 působil v Princetonu (což bylo mimo jiné působiště
144
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
A. Einsteina). Dostalo se mu řady poct a uznání; jmenujme za všechny alespoň Einsteinovu cenu za rok 1951, což je nejvyšší americké ocenění vědecké práce. Svými výsledky ovlivnil tvář moderní matematiky jako málokdo jiný.
V poslední době se stalo jistou módou citovat Gódelovy výsledky, zejména proslulou větu o neúplnosti z r. 1931 ([9]) i mimo matematiku (většinou samozřejmě nepřesně nebo zcela překroucené). Vzhledem k mimořádné závažnosti této věty se o ní zmíníme podrobněji. (Mohli bychom samozřejmě uvést původní Gódelovu práci, ale čtenář bez hlubší logické přípravy by pravděpodobně měl s jejím studiem nepřekonatelné potíže. V dalším se proto pokusíme alespoň popsat ideu důkazu, mimochodem geniální a elegantní.)
Předpokládejme, že zkoumáme nějakou axiomatickou teorii T zahrnující aritmetiku (tj. axiómy aritmetiky jsou tvrzeními v T). Víme, že takovou teorií je například teorie množin.
Jak dobře víme z kapitoly I, výstavba takové formalizovane teorie začíná zadáním abecedy. Označme abecedu teorie symbolem A. Vzhledem k tomu, že A je konečná nebo spočetná množina (což jistě můžeme bez újmy na obecnosti předpokládat), existuje jistě prosté zobrazení množiny A do množiny N všech přirozených čísel. Definujme speciálně toto zobrazení tak, že pro každé a e A je g (a) prvočíslo eventuálně číslo 1.
Nechťje například toto zobrazení definováno takto:
a:     va=^«»-(     )     V    3    =    e    X    Y    Z ... g(a):    1    2    3     5    7    11   13   17   19   23   29   31   37   41 ... Víme, že „slovo" nad danou abecedou je konečná posloupnost prvků množiny A. Protože je A nejvýše spočetná množina (a samozřejmě neprázdná), je množina S všech slov nad A spočetná. Existuje tedy prosté zobrazení h S -> N. Sestrojení této injekce nazýváme „gódelizací" dané množiny slov.
Abychom ze znalosti čísla h(<p) — tzv. „malého Gódelova čísla" slova <p — mohli snadno zjistit slovo <p, zadáme zobrazení h takto:
A(qíi«2 ... or„) = 28(ai)38(a2)... p8n(a"}'    kde pn je n-té prvočíslo.
Tak například malé Gódelovo číslo slova X e Y je 231329 537; obráceně, protože 9000 = 233253, je 9000 malé Gódelovo číslo slova =>• a =>•.
Označíme-li G množinu všech malých Gódelových čísel, je zřejmě G vlastní podmnožinou v N. I když je většina těchto čísel nesmírně veliká, lze pro každé přirozené číslo rozhodnout, zda platí x e G nebo x ^ G. Pro dané přirozené číslo x je tedy „x e G" aritmetické tvrzení.
Víme však, že v teorii T se nepracuje se všemi slovy, ale jen s tzv. „formulemi", což jsou slova utvořená podle zadaných pravidel. Například X e Y je formule v teorii množin, =>• a =>• samozřejmě formule není. Označíme-li F množinu všech formulí, je F vlastní podmnožina množiny S.
Množina všech konečných posloupností formulí je spočetná, protože F je nejvýše spočetná. Některé z těchto posloupností — vytvořené podle přesně stanovených pravidel — se nazývají „důkazy". Označme D množinu všech důkazů.
5. Gôdelovy výsledky
145
Je-li q>i,q>2, ... ,(pn důkaz, říkáme, že je to důkaz formule (pn a o formuli (pn říkáme, že je dokazatelná. (Dokazatelné formule jsou tedy poslední formule v důkazech.)
Je zřejmé, že dokazatelná formule může mít i více důkazů (i když nalezení alespoň některého z nich může být nesmírně obtížné.) Je-li <p libovolná formule, je však zřejmě pravdivé právě jedno z následujících dvou tvrzení: „(p je dokazatelná", respektive „(p není dokazatelná". (Samozřejmě přitom nemusíme vědět, které z těchto tvrzení je pravdivé.)
Je-li <pi, (p2, ..., (p„ důkaz, nazveme jeho „velkým Gôdelovým číslem" číslo
^h(ip\)nh(ip2) „h(<p„) z.        J ■ ■ ■ ťn
Označme H množinu všech velkých Gôdelových čísel. Podobně jako u množiny G je zřejmé, že H je vlastní podmnožina v N a tvrzení „x e H" je pro dané přirozené číslo x aritmetické tvrzení.
Je-li y e H velké Gôdelovo číslo důkazu formule <p, jejíž malé Gôdelovo číslo g(<p) je číslo x e G, řekneme, že „y má konec x". Je zřejmé, že
„y má konec x"
je aritmetické tvrzení a tudíž ho lze zapsat nějakou formulí v teorii T. Přitom si uvědomme, že pro dané číslo x e G je tvrzení „3y & H y má konec x" pravdivé právě tehdy, když je formule s malým Gôdelovým číslem x dokazatelná.
Procesem popsané „gôdelizace" dané teorie T jsme tedy dosáhli toho, že tvrzení o dokaza-telnosti formule <p v teorii T jsme převedli na pravdivost, respektive nepravdivost aritmetického tvrzení „3y & H y má konec h((p)".
Buď nyní x e G libovolné. Víme, že je buďto pravdivé tvrzení „Formule s malým Gôdelovým číslem x je dokazatelná" nebo tvrzení „Formule s malým Gôdelovým číslem x není dokazatelná".
Je-li například
h((p) = 2113315297371113 1 33 1 7111937232929313113,
je (p formule
(Xeľ)4(ľeX);
protože tato formule evidentně nemůže být v „rozumné" teorii množin dokazatelná, je aritmetické tvrzení „3y & H y má konec h((p)" v tomto případě nepravdivé.
K. Gôdel nyní dokázal následující pozoruhodnou skutečnost: existuje číslo k e G, které má následující vlastnost. Utvoříme-li formuli <p odpovídající tvrzení „Formule s malým Gôdelovým číslem k není dokazatelná", tj. formuli popisující aritmetické tvrzení
„—•(3y & H y má konec k)" ,
146
IV. HISTORICKÝ VÝVOJ TEORIE MNOŽIN
pak platí h ((p) = k (tj. malé Gôdelovo číslo takto zkonstruované formule je právě ono číslo k).
Nyní dokážeme, že v teorii T, pokud je bezesporná — a takové teorie samozřejmě chceme budovat — není dokazatelná ani formule <p ani její negace —><p.
(1) Připusťme, že formule <p je dokazatelná. To však znamená, že formuli jejíž malé Gôdelovo číslo je k, nelze dokázat. Touto formulí je však právě formule <p. Obdrželi jsme tedy spor.
(2) Připusťme, že lze dokázat formuli —><p. To však znamená, že lze dokázat skutečnost, že formule s malým Gódelovým číslem k, což je právě <p, je dokazatelná. Opět jsme tedy obdrželi spor.
Je-li tedy T bezesporná, musí být formule <p v T „nerozhodnutelná"; nelze dokázat ani <p ani -•y.
Odvodili jsme takto právě Gôdelovu větu o neúplnosti:
Je-li dána libovolná bezesporná teorie obsahující aritmetiku, pak v této teorii existuje nerozhodnutelné tvrzení.
Na dovršení podivnosti tohoto výsledku si navíc uvědomme, že výše zkonstruovaná nerozhodnutelná formule <p je zjevně pravdivá! Uvedli jsme totiž před chvílí, že každé tvrzení o dokazatelnosti nějaké formule v T je nutně pravdivé nebo nepravdivé. Protože předpoklad, že (p je nepravdivá formule vede okamžitě ke sporu, je <p — i když je nerozhodnutelná — nutně pravdivá.
Jaké jsou důsledky věty o neúplnosti? Protože v každé „dostatečně bohaté" teorii při jakékoliv volbě axiómů, pokud je jen tato volba bezesporná, existují nutně nerozhodnutelná tvrzení (a situaci nelze spravit přidáním dalších axiómů!), je neuskutečnitelná již 1. etapa hilbertovského programu. Z žádného systému axiómů, pokud je bezesporný, nelze uvažovanými metodami odvodit „celou" matematiku. (Prvním konkrétním příkladem v teorii množin nerozhodnutelného tvrzení se stala hypotéza kontinua; jak jsme uvedli již v poznámce III.6.23, její nerozhodnutel-nost v ZF dokázal v r. 1963 Paul Cohen, nezávisle na něm dokázal totéž v GB v r. 1964 Petr Vopěnka.)
Z Gódelových výsledků však plyne nerealizovatelnost i 2. etapy hilbertovského programu. Z věty o neúplnosti lze totiž snadno odvodit, že v teorii s výše uvedenými vlastnostmi nikdy není moz.no dokázat formuli tvrdící bezespornost této teorie.
Co odtud plyne pro axiomatické teorie množin (nebo pro axiomatizaci samotné aritmetiky)?
Tyto teorie byly budovány proto, že antinomie prokázaly neudržitelnost cantorovského „intuitivního" přístupu. Jsou tedy axiomatické teorie bezesporné? Můžeme si být jisti, že v nich nejsou na nějaké jiné úrovni také nějaké antinomie? V to můžeme jen doufat. Jak odvodil K. Gódel, dokázat to nemůžeme. Můžeme odvodit jen relativní tvrzení typu „Je-li GB bezesporná, je i ZF bezesporná" a podobně. Je však GB bezesporná? Otázka se vrací jako bumerang; v rámci GB to nelze dokázat. Jen v rámci nějaké jiné, „bohatší" teorie by bylo možno eventuelně dokázat,... atd.
5. Gôdelovy výsledky
147
Že to není příliš optimistické? Alespoň si uvědomíme, že reálny svět je nesrovnatelně složitější, než svět i těch nejlépe vymyšlených formulí. (I když nám jejich vymýšlení — a učení — přináší tolik starostí i potěšení.)
Dodatek
148
149
Relace mezi množinami
Symbolem [x, y] značíme uspořádanou dvojici prvků x, y. Platí tedy
[x, y] = [u, v] <í=í> x = u A y = v. Kartézským součinem množin A, B nazýváme množinu
A x B := {[x, j]; x e A, j e B}.
Je zřejmé, že operace x není komutativní. Nerozlišujeme-li však součiny (A x B) x C a A x (B x C), můžeme operaci x považovat za asociativní. Zejména je tak zřejmé, co rozumíme množinou A"+1 := A" x A pro každé přirozené n. (A1 = A).
Relací mezi množinami A, B (v tomto pořadí) rozumíme každou podmnožinu q součinu A x B.
Je-li g> relace mezi množinami A, B, nazýváme jejím definičním oborem množinu
Domg> := {x e A; By e 5 tak, že [x, y] e £>}.
Oborem hodnot této relace g> rozumíme množinu
Sg> := {y e B; 3x e A tak, že [x, y] e g}.
Je-li gCAxí relace, pak relace g>_1 k ní inverzní je relace mezi B, A definovaná takto:
q'1 := {[x,y]; [y,x] £ g}.
Je-li gCAxBaffCfixC, pak jejich složením rozumíme relaci a o q c A x C definovanou takto:
cr o £ := {[x, z]; x e A, z, £ C, 3y e 5 tak, že [x, y] £ g, [y, z] e a}.
Buď g> c A x B. Říkáme, že q je zobrazení z A do B, jestliže ke každému prvku x e A existuje nejvýše jeden prvek z & B takový, že [x, y] £ q. Místo [x, y] & q pak obvykle píšeme y = £>(x).
Je-li g> zobrazení z A do 5 a platí Domg> = A, říkáme, že g> je zobrazení A do B. Tuto skutečnost symbolicky označíme q: A —> B.
Zobrazení /: A -> 5 se nazývá surjektivní (též surjekce nebo zobrazení raa), jestliže 3/ = B.
Zobrazení /: A -> 5 se nazývá injektivní (též injekce nebo prosté zobrazení), jestliže x, y e A, x ^y =» /(x) ^/(y).
Zobrazení, které je současně injekcí i surjekcí, se nazývá bijekce.
150
Dodatek
Je-li /: A -> B zobrazení, je relace / zobrazení z B do A zřejmě právě tehdy, když je / injektivní.
Symbolem id^ rozumíme identické zobrazení na množině A (tj. zobrazení A do A definované tak, že id^(x) = x pro každý prvek x e A).
Jsou-li A, B množiny, pak AB značí množinu všech zobrazení B do A.
Buď /: A —> B, C c A. Restrikcí f\C zobrazení / na množinu C rozumíme zobrazení g.C—>B definované takto: g(x) = f(x) pro každý prvek x e C.
Relace na množině
Relací na množině A rozumíme každou podmnožinu g množiny A2. Označíme-li P(x) množinu všech podmnožin množiny X, je množina 9Í(A) všech relací na A rovna množině P (A2).
Diagonální relací na A rozumíme relaci      := {[x, x]; x e A}.
Je-li g> relace na A, píšeme místo [x, y] e g> obvykle xgy a místo [x, y] ^ g píšeme xgy. Některé často se vyskytující vlastnosti relací mají speciální pojmenování. Zejména řekneme, že relace g na A je:
(a) reflexivní, jestliže pro každý prvek x e A platí xqx ;
(b) areflexivní, jestliže pro každý prvek x e A platí xqx ;
(c) symetrická, jestliže x, y e A, xgy =>• ygx ;
(d) asymetrická, jestliže x, y e A, xg>y =>• ygx;
(e) antisymetrická, jestliže x, y e A, xg>y A yg>x =>• x = y;
(f) tranzitivní, jestliže x, y, z e A, xg>y A ygz, =>• xg>z;
(g) úplná, jestliže pro každé x, y e A platí xgy nebo yg>x nebo x = y.
Poněvadž relace na A jsou množiny, má smysl hovořit o průniku relací, sjednocení relací, rozdílu relací a podobně.
Je například zřejmé, že když g, a jsou tranzitivní relace na A, pak g Ha je rovněž tranzitivní relace na A, avšak g U a je relace na A, která nemusí být tranzitivní.
Uspořádané množiny
Uspořádáním na množině A nazýváme každou relaci na A, která je současně reflexivní, antisymetrická i tranzitivní.
Je-li A množina, g uspořádání na A, nazývá se dvojice (A,g) uspořádaná množina. Nemůže-li však dojít k nedorozumění, hovoříme často o uspořádané množině A (a nikoliv (A,g)).
Je-li uspořádání g úplné, tj. pro každé dva prvky x, y e A platí xgy nebo ygx, nazývá se (A, g) řetězec.
151
Relaci uspořádání nejčastěji značíme symbolem <.
Prvky x, y v uspořádané množině (A, <) se nazývají srovnatelné, platí-li x < y nebo y < x. V opačném případě se nazývají nesrovnatelné. Je-li x < y avšak x ¥ y, píšeme x < y. Jestliže platí x < y a neexistuje z tak, že x < z < y, říkáme, že prvek y pokrýva prvek x (nebo prvek x je pokryt prvkem y).
Uspořádaná množina se nazývá protiřetězec, když jsou každé dva její různé prvky nesrovnatelné. (Uspořádáním na této množině je pak zřejmě diagonální relace.) V řetězci jsou naopak každé dva prvky srovnatelné.
Je-li A nějaký systém množin, pak je zřejmě inkluze c uspořádáním na A. Máme-li nějaký systém množin uspořádat, pak to právě nejčastěji uděláme inkluzí. Pro libovolnou množinu A jsou tedy (P(A), c) i (9t(A), c) uspořádané množiny.
Konečné uspořádané množiny obvykle znázorňujeme tzv. hasseovským diagramem. Prvky uspořádané množiny A při tom znázorníme jako body v rovině, větší prvky umístíme „výše" než menší prvky a dva různé prvky spojíme úsečkou právě tehdy, když jeden pokrývá druhý.
Na následujícím obrázku je hasseovský diagram množiny (P(A), c), kde A = {a, b, c}.
{b,c}
Je-li (A, <) uspořádaná množina, značí Ä množinu A s duálním uspořádáním, tj. množinu (A, >). Místo Ä se často píše též A*.
Buďte A, B uspořádané množiny. Zobrazení f:A—> B se nazývá izotonní, jestliže pro každé dva prvky x, y e A platí: x < y =3- f (x) < f (y). Zobrazení /: A -> B se nazývá izomorfismus, když:
(i) / je bijekce,
(ii) / je izotonní,
(iii) f^1 je izotonní.
Uspořádané množiny A, B se nazývají izomorfní (což značíme A = B), jestliže existuje alespoň jeden izomorfismus f: A—> B.
Buď A uspořádaná množina, 0 ¥ B c A. Prvek a e A se nazývá horní závora množiny B, když pro každý prvek x e B platí x < a. B se nazývá shora ohraničená (v A), jestliže v A existuje alespoň jedna horní závora množiny B. Analogicky se definuje dolní závora a zdola ohraničená množina. Řekneme, že B je v A ohraničená, je-li v A ohraničená shora i zdola.
152
Dodatek
Buď A uspořádaná množina. Prvek a e A se nazývá největší prvek množiny A, když pro každý prvek x e A platí x < a. Prvek a e A se nazývá maximální prvek množiny A, jestliže v A neexistuje prvek x > a. Analogicky je definován nejmenší a minimální prvek uspořádané množiny.
Je zřejmé, že největší prvek v A je maximálním prvkem a nejmenší prvek minimálním prvkem. Největší (respektive nejmenší) prvek v A — pokud existuje —je určen jednoznačně, zatím co maximálních (respektive minimálních) prvků může v A existovat víc.
Buď A uspořádaná množina, 0 / 8 c A. Nejmenší horní závora množiny B v A (pokud existuje) se nazývá suprémum množiny B v A; značíme ji sup^5. Z výše uvedeného plyne, že suprémum množiny — pokud existuje — je určeno jednoznačně.
Duálně je definováno infimum množiny B v A (inf AB).
Uspořádaná množina A se nazývá svaz, existuje-li pro každé dva prvky x, j e A jejich suprémum i infimum v A. A se nazývá úplný svaz, má-li každá 0^5 c A v A suprémum i infimum.
Je zřejmé, že pro každou množinu A je (P(A), c) úplný svaz. (Protože 9t(A) = P (A2), plyne odtud, že systém všech relací na libovolné množině tvoří vzhledem k množinové inkluzi úplný svaz.)
Ekvivalence a rozklady
Relace q na množině A se nazývá ekvivalence, je-li reflexivní, symetrická a tranzitivní. Symbolem 8(A) označme množinu všech ekvivalencí na množině A.
Snadno lze dokázat, že (S (A), c) je úplný svaz s nejmenším prvkem 0 a největším prvkem A2. Infimum neprázdné množiny relací je přitom jejich průnik, suprémum však obecně není jejich sjednocení (vzhledem k tomu, že sjednocení nezachovává tranzitivitu).
Buď A ý 0 množina. Systém A po dvou disjunktních neprázdných podmnožin množiny A se nazývá rozklad na A, když U X = A.
XčÄ
Prvky rozkladu A nazýváme třídy rozkladu A. Každý prvek tak podle definice leží právě v jedné třídě daného rozkladu A.
Označme JC(A) množinu všech rozkladů na množině A. Definujme na JC(A) relaci < takto:
Pro A, B e X (A) je A < B právě tehdy, když ke každé třídě X e A existuje třída Y e B, tak, že X c y.
Pak je < uspořádání na X (A).
Je-li A < 5, říkáme, že A je zjemnení rozkladu B a B je zákryt rozkladu A.
153
Buď A ý 0 libovolná množina. Pak ke každé ekvivalenci g na A existuje právě jeden rozklad A na A a ke každému rozkladu A na A existuje právě jedna ekvivalence g na A tak, že pro každé prvky x, y e A platí
xgy právě tehdy když x, y patří do téže třídy rozkladu A.
Ve výše uvedeném smyslu každá ekvivalence g e 8(A) určuje právě jeden rozklad na A. Tento rozklad nazýváme faktormnozinou množiny A podle g; značíme jej A/g.
Zobrazení F: S (A) —»- X(A) definované vztahem F(g) = A/g je nejen bijekce, ale dokonce izomorfismus (8(A), c) na (X(A), <). Platí tedy
(g(A),Q = (X(A),<).
Zejména odtud plyne, že (JC(A), <) je úplný svaz.
Literatura
[1] kuratowski K., mostowski A.: Set Theory, Amsterdam, 1967.
[2] TARSKI A.: Introduction to Logic and to the Methodology of Deductive Sciences, New York, 1965, český překlad: Úvod do logiky a metodologie deduktivních ve<i,Praha 1966.
[3] BLAŽEK J., KUSSOVÁ B.: Množiny a přirozená čísla, Praha, 1977.
[4] WANG HAU, McNAUGHTON R.: Les systémes axiomatiques de la théorie des ensembles, Paris, 1953.
[5] Fraenkel A. A.,Y. Bar-Hillel: Foundations of Set Theory, Amsterdam, 1958. [6] Kleene, S. C, Introduction to Metamathematics, New York-Toronto, 1952. [7] kuroš, A. g.: Lekcijipo obščej algebře, Moskva, 1962. [8] hausdorff F.: Grundzüge der Mengenlehre, Leipzig, 1914.
[9] gödel K.: Uber formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I, Monatsch. Math. Ph., 38 (1931), 173-198.
154
Rejstřík
1. krize matematiky, 134
2. krize matematiky, 110, 134
3. krize matematiky, 134
abeceda, 8, 28, 144
abeceda predikátového kalkulu, 28
abeceda teorie tříd, 43
abeceda výrokového kalkulu, 13
aktuální nekonečno, 109
algebraické číslo, 77
algoritmizovatelná funkce, 11
antinomie, 134
antisymetrická relace, 150
aporie Achilleus a želva, 109
areflexivní relace, 150
aritmetizace matematiky, 138
asymetrická relace, 150
axióm, 7
axióm invariance, 46 axióm výběru, 66, 141 axiomatická teorie, 38 axiomatická výstavba, 138
Berryho antinomie, 135 bezesporná teorie, 40 bezespornost axiómů, 139 bijekce, 149
Cantor-Bernsteinova věta, 78 Cantorova diagonální metoda, 81, 124
de Morganovo pravidlo, 20
definiční obor relace, 149
diagonální realce, 150
disjunktní množiny, 52
dobře uspořádaná množina, 56
dokazatelná formule, 35, 145
dokazatelná formule v teorii, 38
dolní třída řezu, 69
dolní závora, 151
doplňující pravidlo, 35
duálně uspořádaná množina, 93
duální uspořádání, 151
důkaz formule, 35
důkaz v predikátovém kalkulu, 35
důkaz v teorii, 38
ekvivalentní množiny, 73 elementární tautologie, 35 existenční axióm, 44
faktormnožina, 153 formalistický přístup, 137 formule, 43 funkce, 10
Gôdel-Bernaysova teorie množin, 42, 141 Gôdelova věta o neúplnosti, 146
hasseovský diagram, 151 Hausdorffova věta, 68 horní třída řezu, 69 horní závora, 151 hypotéza kontinua, 92
155
156
Dodatek
identické zobrazení, 150 indexová množina, 52 infimum, 152 injekce, 149
injektivní zobrazení, 149 intuicionistický přístup, 137 intuitivní teorie množin, 7 inverzní relace, 149 iregulární kardinální číslo, 107 izolované ordinální číslo, 98 izomorfismus uspořádaných množin, 151 izomorfní uspořádané množiny, 151 izotonní zobrazení, 151
jednoprvková třída, 48
kalkul, 13
kardinální číslo, 77, 112 kartézský součin, 149 kartézský součin množin, 54 kvantifikátory, 28
lemma, 38
limitní ordinální číslo, 98
logicismus, 138
logická spojka, 13, 28
logicky ekvivalentní výrokové formule, 25
matematická indukce, 59 maximální prvek, 152 maximální řetězec, 68 mechanická počitatelnost, 11 mechanicky počitatelná funkce, 12, 25 měřitelné kardinální číslo, 107 metaabeceda, 9 metaj azyk, 9 metamatematika, 9 metateorie, 9 metavěta, 39 metaznak, 9, 10
minimální prvek, 152 množina, 44, 48 množinová proměnná, 49 množiny po dvou disjunktní, 52 model axiomatické teorie, 7 model Zermelo-Fraenkelovy teorie
množin, 42 mohutnost kontinua, 90 mohutnost množiny, 77
naivní teorie množin, 7 následovník množiny, 69 nedosažitelné kardinální číslo, 107 nejmenší nespočetné ordinální číslo, 100 nej menší prvek, 152 nej větší prvek, 152 nejvýše spočetná množina, 75 neměřitelné kardinální číslo, 107 nerovnost ordinálních čísel, 96 nerozhodnutelná teorie, 41 nespočetná množina, 80 nesrovnatelné prvky, 151 neuspořádaná dvojice, 48 nezávislost axiómů, 139 normální množina, 70 normální prvek, 59
obor hodnot relace, 149 oddělující znak, 9 ohraničená množina, 151 ordinální číslo, 96 ordinální typ, 93
Peirceův zákon, 20
počáteční ordinální číslo dané mohutnosti, 101
podslovo slova, 10 podstatně volná proměnná, 29 pohlcovací zákon, 103
157
pohlcovací zákony, 88 pokrývání prvků, 151 posloupnost slov, 9 potenciální nekonečno, 109, 116 potenční třída, 48 pravdivostní hodnota, 17 pravdivostní hodnota slova, 17 pravý distributivní zákon, 65 prázdná třída, 47 prázdné slovo, 9 predikátová formule, 28, 30 primitivní pojem, 7, 42 primitivní predikát, 30 primitivní predikát teorie tříd, 43 princip transfinitní indukce, 59 princip vyloučeného třetího, 137 proměnné pro objekty, 28 proměnné pro výroky, 13 prosté zobrazení, 149 protiřetězec, 151 průnik množin, 52 přímka, 109 připojený prvek, 69 připsání znaku zleva, 12 připsání znaku zprava, 12
reálné číslo, 111 reflexivní relace, 150 regulární kardinální číslo, 107 relace ekvivalence, 152 relace mezi množinami, 149 relace na množině, 150 restrikce zobrazení, 150 Richardova antinomie, 135 rovnost tříd, 45 rozklad množiny, 152 Russellova antinomie, 7 Russellův paradox, 49
řetěz, 70 řetězec, 70, 150 řez v množině, 69
sémantické hledisko, 9 Shefferova spojka, 27 shora ohraničená množina, 151 sjednocení množin, 52 skládání relací, 149 slovo, 8, 9
slovo obsahuje znak, 10
složené slovo, 10
slučitelná slova, 29
slučitelné formule, 40
součet kardinálních čísel, 84
součet ordinálních typů, 94
součet uspořádaných množin, 60, 62
součin kardinálních čísel, 86
součin uspořádaných množin, 63
specifické znaky, 28
spočetná množina, 75
sporná teorie, 40
srovnatelné prvky, 151
substituce, 12
suprémum, 152
surjekce, 149
surjektivní zobrazení, 149
svaz, 152
symetrická relace, 150 syntaktické hledisko, 9
tautologie, 19, 28, 31 teorém, 38 teorie typů, 138 tertium non datur, 137 transcendentní číslo, 77 transfinitní ordinální číslo, 133 tranzitivní relace, 150 třída, 43
158
Dodatek
třída rozkladu, 152 třída všech množin, 47
univerzální třída, 47 úplná indukce, 59 úplná relace, 150 úplná teorie, 41 úplnost axiómů, 139 úplný svaz, 152 uspořádaná dvojice, 149 uspořádaná množina, 150 uspořádání, 150
uzavřená predikátová formule, 31
vázaná proměnná, 29
věta, 8, 38
vlastní třída, 49
vlastní začátek množiny, 58
volná proměnná, 29
výrok, 16
výrok je nepravdivý, 17 výrok je pravdivý, 17 výroková formule, 13 výrokové proměnné, 13 výskyt znaku, 10 vyznačený prvek, 69
začátek množiny, 58
základní abeceda teorie tříd, 43
zákon Claviův, 20
zákon Dunse Scota, 20
zákon dvojí negace, 20
zákon hypotetického sylogismu, 20
zákon totožnosti, 20
zákon vyloučeného třetího, 20
zákony výrokového počtu, 19
zákryt rozkladu, 152
zdola ohraničená množina, 151
Zénónovy aporie, 109
Zermelo-Fraenkelova teorie množin, 8, 42, 141
Zermelova věta, 68, 142 Zermelův axióm, 66, 142 zjemnění rozkladu, 152 znak, 9
zobecněná hypotéza kontinua, 106 zobrazení množiny do množiny, 149 zobrazení na, 149
zobrazení z množiny do množiny, 149 Zornovo lemma, 68