VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH Jaromír Šimša 1. Úvod. Podle učebních osnov jsou reálná čísla patrně nejsložitějším matematickým objektem, se kterým by se měli, byť jen velmi letmo, seznámit všichni žáci základních škol. Pro tento požadavek je pádný (i když jediný) důvod. Jakmile se žáci naučí Pythagorovu větu a začnou ji využívat k výpočtům délek stran pravoúhlých trojúhelníků, dočkají se nemilého překvapení: Naprostá většina přirozených čísel má velmi „složité odmocniny, jejichž zápisy v desítkové soustavě „nikde nekončí . To však žáky ani dospělé příliš netrápí. Při praktických výpočtech jsou totiž situace, kdy je nutné počítat na více než šest platných cifer, spíše kuriózní. A tak lidé po celý život pracují se zaokrouhlenými čísly, aniž přemýšlejí o podstatě „ideálně přesných čísel. Dnes se přitom už téměř neobejdou bez počítačů a kalkulaček, což přispívá k tomu, že čísla v myslích lidí více a více splývají se svými zápisy v desítkové soustavě. (Zeptejte se někoho, jak si představuje například přirozené číslo 791, většině dotázaných se vybaví spíše tvar oněch tří arabských cifer 7, 9 a 1, než jejich funkce ve vztahu k číslu 791.) Snadná proveditelnost aritmetických operací na kalkulačce a její displejový kontakt s uživatelem utvrzují mnohé laiky v názoru, že do „říše nepraktických výmyslů , určených toliko k trápení žactva, patří nejen iracionální čísla (pokud jim ten termín vůbec něco říká), ale i počítání se zlomky. Naznačený pragmatický postoj většiny současné populace k číslům, který lze vyjádřit heslem „praktické výpočty jsou kalkulem desetinných čísel , by nás neměl příliš rmoutit. Úvahy o podstatě čísel a jejich různých modelech patří do té části „teoretické matematiky, se kterou by se měli seznámit až na vysoké škole pouze budoucí matematikové-profesionálové a středoškolští učitelé matematiky. Domnívám se, že je zcela přijatelné, když absolventi středních škol i inženýři vymezují iracionální čísla negativním způsobem, tedy jako čísla, která nejsou racionální, dají se však s libovolnou přesností racionálními čísly přiblížit, jak je to nejčastěji zachyceno jejich (nekonečnými a neperiodickými) zápisy v desítkové soustavě. Jak by středoškoláci měli rozumět například „nekonečnému 1 zápisu π = 3,141592653 . . . ? Odpověď, že jde o nekonečný součet 3 + 1 10 + 4 102 + 1 103 + 5 104 + 9 105 + . . . , 1Zde jsou uvozovky opravdu na místě: provést nekonečný zápis je nad lidské síly i prostředky. 1 2 JAROMÍR ŠIMŠA je při posuzování podstaty reálných čísel nepostačující, neboť aritmeticky lze interpretovat pouze součty konečného počtu sčítanců. Uspokojivěji vyznívá odpověď, že daným zápisem je určeno to jediné číslo, které je mezi (uspořádaná) racionální čísla „vloženo tak, že platí nerovnosti (∗) 3 < π < 4, 3,1 < π < 3,2, 3,14 < π < 3,15, 3,141 < π < 3,142, . . . Přibližujeme-li žákům poprvé iracionální čísla, nezmiňujeme se pochopitelně o potřebě budovat číselné obory na pevných teoretických základech. Lapidárně řečeno: racionální a iracionální čísla tady prostě jsou, přitom pouze ta první dokážeme vyjádřit v desítkové soustavě konečnými zápisy.2 I když je od představy založené na odhadech (∗) již velmi blízko ke skutečné konstrukci reálných čísel (jakožto tříd jistých nekonečných posloupností čísel racionálních), neměli bychom na střední škole žáky touto abstrakcí zatěžovat. Mnohem důležitější je, aby žáci dobře rozuměli také geometrické interpretaci reálných čísel, při které čísla ztotožňujeme s body na přímce (číselné ose). Toto (historicky prvotní) pojetí reálných čísel je velmi názorné, nemůže však být východiskem pro teorii reálných čísel té míry formálnosti, jakou dnes v matematice vyžadujeme. Vysvětleme to podrobněji v následujícím odstavci. Žáci vidí přímé čáry téměř ve všem, čím se lidé obklopují (obrysy budov a stěn místností, napjaté šňůry nebo dráty, hrany různých předmětů apod.). Stěží odhadneme, kolikrát jsme v hodinách geometrie narýsovali podle pravítka úsečku. Asi nikdo z nás tehdy nezapochyboval o tom, že dokonalou přímku sice nikdo z lidí narýsovat nedovede, přesto tato „ideální čára se nám jeví jako součást objektivní reality. Iluze o tom, že vlastnosti přímky lze bez výjimky nacházet, vyvracet či potvrzovat experimenty a výpočty podobně jako teoretické zákonitosti v jiných přírodních vědách, je posilována tím, že vzájemnou polohu zobrazených bodů a jejich vzdálenosti vidíme, tedy vnímáme tím smyslem, který nám poskytuje o okolním světě nejvíce informací. Tato „vizuální podpora nám při práci v matematice umožňuje intuitivně předvídat výsledky a orientovat rozbory geometrických situací správným směrem, ovšem s podstatným omezením: vidíme vždy jen konečný (nepříliš velký) počet jednotlivých bodů. Důrazněji řečeno: úsečku či jinou spojitou čáru nevnímáme jako nekonečnou množinu bodů, ale pouze jako určitý tvar. A tak je naše vidění geometrického světa poněkud vzdáleno od současného pojetí školské matematiky, podle kterého je úsečka chápána jako nekonečná množina bodů.3 Našim vizuálním zkušenostem a schopnostem lépe odpovídá starořecká koncepce geometrie, podle které je úsečka pouhé místo pro body: 2I kdybychom vyvinuli jiný způsob zapisování čísel, než jsou obvyklé poziční číselné soustavy, s pomocí konečného počtu znaků sestavíme vždy jen spočetně mnoho různých konečných zápisů; množina reálných čísel je však nespočetná. Proto „většinu reálných čísel nelze popsat například ani konečnými výrazy, ve kterých kromě čísel zapsaných v desítkové soustavě vystupují znaménka aritmetických operací a odmocnítka či jiné symboly pro řešení algebraických rovnic. 3Tím nijak ono množinové pojetí geometrických útvarů nekritizuji; naopak dnešní učebnici geometrie, která by se obešla bez množinového jazyka (a tedy i symbolických zápisů typu A ∈ p ∩ q), bych snad ani nebyl schopen číst. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 3 pro Eukleida4 bod úsečky neexistuje, dokud není vybrán nebo sestrojen (například jako průsečík daného místa-úsečky s druhým místem-úsečkou). To pak znamená, že po libovolném počtu konstrukčních kroků je „ve hře vždy pouze konečný počet bodů. Jistá bezstarostnost, se kterou předkládáme žákům základních škol prohlášení, že přímka je nekonečná množina bodů, je v kontrastu s poznávací bariérou, kterou tím překračujeme: vlastnosti nekonečných množin bodů nedokážeme ani posoudit praktickým modelováním, ani myšlenkovým experimentem založeným na naší vizuální představivosti. I když na tento kontrast žáky z pochopitelných důvodů neupozorňujeme, zmíněná bariéra se může projevit, jakmile s žáky začneme posuzovat přechod od racionálních čísel k číslům iracionálním. Jak přesvědčit žáky o tom, že na „racionální číselné ose jsou „díry a že „reálná číselná osa je již „úplná ?5 Učitelé raději se žáky o těchto faktech nediskutují; obávám se, že někteří z nich sami nemají v těchto věcech příliš jasno. Zdůrazněme nyní jen to, co je z hlediska současného pojetí matematiky v tomto ohledu zásadní (věcnému posuzování tématu se budeme věnovat v dalších oddílech): I když pojmu přímka rozumíme na základě praktických zkušeností snad všichni „stejně , rozhodovat na tomto základě můžeme pouze o takových vlastnostech přímky, které se týkají konečných množin jejích bodů. Žádná „přímka jako taková s objektivními vlastnostmi neexistuje, záleží do jisté míry na nás, jakým obsahem pojem přímky jakožto nekonečné množiny bodů naplníme a jakou teorii to přinese. Úspěšným způsobem se tohoto úkolu zhostili někteří významní matematikové 19. století. Výsledek jejich přístupu k základům aritmetiky přinesl celé matematice tak grandiózní užitek, že se reálná čísla zařadila mezi nejpoužívanější matematické pojmy s pevně ustáleným významem. Pokusme se v dalším textu upozornit na nejdůležitější milníky dlouhé cesty, která k tomuto „stavu dospělosti reálných čísel vedla. 2. Čísla a množství. Zatímco původ přirozených čísel v historii lidského myšlení spojujeme s určováním počtu diskrétních objektů, tedy navzájem samostatných, izolovaných, dále nedělitelných jednotek, potřeba jiných čísel se v myslích lidí začala formovat při určování množství takových „spojitých geometrických a fyzikálních veličin, jako jsou délka, obsah, objem, hmotnost nebo čas. Dnes jim souhrnně říkáme skalární veličiny a místo o „množství dané veličiny mluvíme o její hodnotě. Můžeme se jen dohadovat o dávných primitivních způsobech, jakými byly hodnoty zmíněných veličin posuzovány; původně byly různé hodnoty téže veličiny patrně pouze porovnávány slovy „menší , „stejný a „větší , mnohem později se začalo prosazovat jejich 4Eukleides z Alexandrie (asi 340–278 př. n. l.), nejvýznamnější antický geometr, autor slavných Základů, matematického díla, jež po dvě tisíciletí ovlivňovalo vývoj matematiky a její výuku. 5V závěrečném oddíle 9 vysvětlíme, že i jednotlivá reálná čísla lze „obklopit novými (tzv. hyperreálnými) čísly, která se od příslušného reálného čísla liší vždy o „nekonečně malé hodnoty a která s původními reálnými čísly a „nekonečně velkými hyperreálnými čísly vytvářejí neobvykle bohatou „číselnou osu , mající vlastnosti uspořádaného pole. V tomto poli však přestává platit Archimédův princip (viz oddíl 3), což lze výhodně využít k výkladu limitních procesů (včetně derivování a integrování) bez obvyklého ε-δ jazyka. 4 JAROMÍR ŠIMŠA skutečné měření, jehož výsledky byly zachycovány přirozenými i „novými (samozřejmě kladnými) čísly, společnými pro všechny druhy skalárních veličin. Abychom této proceduře a výsledným číslům dobře porozuměli, zamysleme se nejdříve nad tím, jaké vlastnosti mají všechny druhy skalárních veličin společné. Různé hodnoty každé skalární veličiny6 (délky, objemu, hmotnosti apod.) jsou vyjádřením určitého srovnání jejích nositelů, které se prakticky realizuje určitou manipulací. Tak například délky úseček porovnáváme kladením jedné úsečky na druhou, hmotnosti těles účinkem jejich tíhy na miskách vah, časové intervaly poměřujeme rovnoměrným pohybem ručiček hodin. Pomocí nejjednodušší z těchto manipulací, kterou je bezesporu kladení úseček, popíšeme nyní jednu relaci a jednu operaci, kterými je „vybavena množina hodnot každé jednotlivé skalární veličiny. Položme dvě úsečky AB a CD na stejnou přímku tak, aby splynuly body A a C. Leží-li body B a D na stejnou stranu od bodu A = C, zjistíme podle pořadí bodů A = C, B a D, která z úseček AB a CD má větší délku, či zda se (v případě B = D) jejich délky rovnají; výsledek zapíšeme pomocí znaku < respektive = (jako bychom místo dvou délek porovnávali dvě čísla). Pokud body B, D leží na různých stranách od bodu A = C, bude mít úsečka BD délku, kterou nazýváme součtem délek úseček AB a CD a kterou zapíšeme pomocí znaku + (jako bychom místo délek sčítali čísla). D BA = C C D A B y x x + y y x x < y Popsané kladení úseček je natolik jednoduché a názorné, že následující vlastnosti délek x, y, z, . . . libovolných úseček nám připadají samozřejmé7 : (1) x = x, x = y ⇒ y = x, x = y ∧ y = z ⇒ x = z (2) x = y ∧ u = v ⇒ x + u = y + v (3) Platí právě jeden ze vztahů x = y, x < y, y < x. (4) x < y ∧ y < z ⇒ x < z (5) x + y = y + x, (x + y) + z = x + (y + z) (6) x < x + y (7) x < y ⇒ x + z = y pro jediné z (závislé na x, y a zvané rozdílem y − x) Písmena x, y, z, . . . nezastupují čísla, nýbrž délky úseček. Ze samotných zápisů (1)–(7) to však poznat není, stejné vlastnosti totiž mají i přirozená čísla (jakožto počty prvků konečných množin). Mají je ostatně také obsahy rovinných útvarů a všechny další druhy skalárních veličin. Toho si všimli již starořečtí učenci, kteří zřejmě jako první „extrahovali podstatné vlastnosti různých 6Zdůrazněme ještě jednou, že uvažujeme jen veličiny s kladnými hodnotami. Číslo 0 a fenomén záporných čísel by určitě patřily k hlavním námětům obdobného příspěvku o historii celých čísel. 7Není snadné říci, co vůbec délky úseček jsou; bylo by zhola nemožné říci, co je délka jedné úsečky (bez porovnání s délkami jiných úseček). VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 5 geometrických a fyzikálních veličin8 a vytvořili tak první axiomatickou teorii obecné veličiny, jak ji známe z první knihy Eukleidových Základů. Její podstatu jsme již vyložili: hodnoty téže veličiny lze porovnávat a slučovat (tj. sčítat), přitom výsledky těchto úkonů splňují pravidla (1)–(7). Tato obecná teorie skalární veličiny je základem, na kterém je v páté knize Základů vybudována teorie proporcí, kterou posoudíme později podrobně, neboť sehrála v historii reálných čísel jednu z hlavních rolí. Poznamenejme, že teorie veličiny stejně jako teorie proporcí nejsou dílem samotného Eukleida. Připisujeme je Eudoxovi z Knidu (asi 408–355 před n. l.), matematiku a hvězdáři, který byl blízkým přítelem a spolupracovníkem filosofa Platóna. Vysvětlíme nyní, jak do rozdílných „světů jednotlivých skalárních veličin vstupují „univerzální přirozená čísla. Že byl tento způsob znám lidem velmi dávno, je zcela nepochybné. Pro úsečky ho můžeme popsat významnou manipulací: kratší úsečku klademe na delší několikrát za sebe, dokud větší úsečku „nevyčerpáme .9 Opakovaným kladením úsečky dané délky x za sebe (do přímky) vytváříme násobky původní délky x, které značíme 2·x, 3·x, 4·x, . . . Zapišme to pomocí sčítání pro hodnotu x libovolné skalární veličiny (nemusí jít o délku): x + x = 2 · x, 2 · x + x = 3 · x, 3 · x + x = 4 · x, 4 · x + x = 5 · x, . . . . Proč mluvíme o m-násobcích původní hodnoty x a proč v zápisech m · x používáme znak násobení, je zřejmé. Z výše uvedených vlastností (1)–(7) (kterých konkrétně?) totiž plynou oba distributivní zákony: Pro libovolná přirozená čísla m, n a pro libovolné hodnoty x, y téže skalární veličiny platí rovnosti x x x x x x x x x x(m + n) · x = m · x + n · x a m · (x + y) = m · x + m · y , které použití termínu násobení ospravedlňují.10 Připomněli jsme si známý poznatek, že přirozeným číslem lze vyjádřit vztah dvou hodnot téže veličiny v případě, kdy je jedna hodnota (celým) násobkem druhé. V případě, kdy tomu tak není, vyjadřovali lidé zmíněné vztahy již v dobách Starého Řecka dvěma zcela odlišnými způsoby. Popíšeme je v následujících dvou oddílech. Předtím ještě dodejme, že k vyjadřování poměrů veličin jsou lidé odedávna motivováni jak různými praktickými úlohami (jako je míchání směsí), tak i teoretickým studiem podobností geometrických útvarů, úměr ve fyzikálních zákonech apod. 8Bylo to období, ve kterém se mezi matematikou a fyzikou nestavěly žádné metodologické ani jiné hranice. Fascinujícím příkladem tehdejší propojenosti matematických a fyzikálních ideí je geniální dílo Archiméda, největšího matematika, fyzika a inženýra starověku. 9Nevím, proč si tak živě pamatuji způsob, kterým paní prodavačka pomocí dřevěného metru zjišťovala, kolik je v balíku látky, když jsem kdysi dávno s maminkou navštívil obchod s metráží; třeba se mi ten obraz v hlavě propojil s genovým poselstvím některého mého prapředka-kupce, kterýž začasté rovněž takto zboží ve svém krámě měřil. 10Uvědomte si, že původ násobení přirozených čísel je stejný: součin m · n vzniká jako „zkratka pro součet m stejných sčítanců rovných číslu n. 6 JAROMÍR ŠIMŠA 3. Procedura neúplných podílů. Vyložíme nyní metodu, kterou patrně ve 4. století před Kristem rozvinuli starořečtí učenci (pro toto tvrzení však nemáme žádné důkazy, pouze jejich náznaky v knihách středověkých arabských matematiků). Tento raný pokus o teorii proporcí (někdy označovaný jako „předeudoxovský ) upadl na dlouhá století do zapomnění, jeho spjatost s řetězovými zlomky mu však v minulém století navrátila význam a zajistila trvalé místo v monografiích o aproximacích čísel. Málokdo dnes tuší, že známý Eukleidův algoritmus pro výpočet největšího společného dělitele dvou přirozených čísel má patrně geometrický původ. Předpokládejme, že pro dvě hodnoty x, y dané veličiny (například délky) platí y < x. Není-li x násobkem y, zjistíme, mezi kterými dvěma sousedními násobky k·y a (k+1)·y hodnota x leží (na obrázku je případ k = 3). Pak pro hodnotu z = x−k·y zřejmě platí z < y; není-li y násobkem z, předchozí proceduru opakujeme: zjistíme, mezi kterými sousedními násobky · z a ( + 1) · z hodnota y leží atd. x y y y z V průběhu tohoto algoritmu dostáváme postupně jednak klesající hodnoty dané veličiny, jež (spolu s dvěma výchozími hodnotami) označíme u1 = x, u2 = = y, u3 = z, . . . , jednak přirozená čísla k1 = k, k2 = . . . , která jsou výslednou číselně vyjádřenou informací o vzájemném vztahu hodnot x, y. Zdůrazněme, že oba výstupy algoritmu jsou jednoznačně určeny hodnotami u1, u2 a vztahy (3.1) ui = ki · ui+1 + ui+2 a ui+2 < ui+1 (i = 1, 2, 3, . . . ). Odložme na okamžik dvě otázky, které tento algoritmus vyvolává (jedna z nich je velmi nutkavá, druhá, neméně důležitá, nás kvůli našim praktickým zkušenostem nejspíše ani nenapadne), a pro lepší představu zapišme konkrétní průběh algoritmu v případě, kdy výchozí hodnoty x, y jsou danými násobky téže hodnoty w, kupříkladu11 x = 43w a y = 19w: (3.2) 43w = 2 · 19w + 5w, 19w = 3 · 5w + 4w, 5w = 1 · 4w + w, 4w = 4 · w. (Ve čtvrtém „kroku jsme porovnávali délku 4w s délkou w, protože je mezi nimi „vztah násobku , celý algoritmus jsme tímto zjištěním ukončili). Vztah délek 43w a 19w je tedy popsán (uspořádanou) čtveřicí čísel [2, 3, 1, 4], kterým říkáme podle aritmetické analogie neúplné podíly.12 Uvedený výpočet je totiž totožný s výpočtem nejmenšího společného dělitele čísel 43 a 19 podle Eukleidova algoritmu (stačí jen ze zápisů v (3.2) vynechat délku w). Při něm je ovšem význam neúplných podílů poněkud potlačen (zajímáme se spíše o zbytky při jednotlivých děleních), zdůrazníme ho nyní tím, že všechna dělení zachytíme 11Ze zřejmých důvodů budeme v některých zápisech typu m·x vynechávat znak násobení. 12Věta o dělení se zbytkem: Jsou-li x > y dvě hodnoty dané veličiny a není-li x násobkem y, pak x = m · y + z, kde neúplný podíl m je přirozené číslo, zatímco zbytek z (z < y) je veličina téhož druhu jako x a y. Ve škole stručněji píšeme x : y = m (zbytek z). VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 7 jednou rovností se složeným (tzv. řetězovým) zlomkem: 43 19 = 2 + 1 3 + 1 1 + 1 4 (všimněte si, jakým způsobem jsou na pravé straně čísla ze čtveřice [2, 3, 1, 4] rozmístěna). Od této číselné analogie se teď vrátíme k původnímu poměřování dvou hodnot x, y téže skalární veličiny a poprvé naplníme obsahem pojem poměru. Formálně řekneme, že poměr x : y je posloupnost přirozených čísel [k1, k2, k3, . . . ], která je výsledkem algoritmu (3.1) a kterou (stejně jako poměr x : y) obvykle zapisujeme pomocí zlomků: (3.3) x y = k1 + 1 k2 + 1 k3 + . . . . Zlomek na levé straně (3.3) pro nás v této chvíli nemá žádný číselný význam, jde jen o jiný zápis poměru x : y, který právě definujeme. Naproti tomu pravá část (3.3) v některých případech číselný význam má; jsou to právě ty případy, kdy je posloupnost [k1, k2, k3, . . . ] konečná.13 Naznačili jsme již dříve, že s algoritmem (3.1) jsou spojeny dvě důležité otázky. Ta první souvisí s každým jednotlivým krokem: pokládáme za samozřejmé, že jakmile pro dvě hodnoty u, v téže veličiny začneme vytvářet násobky menší z nich (tedy v případě u < v násobky u, 2u, 3u, . . . ) dostaneme po určitém počtu kroků hodnotu, která převýší původní větší hodnotu (v našem případě hodnotu v).14 Jen tak je zaručena existence přirozených čísel ki ze vztahů (3.1). Zmíněnou vlastnost každé jednotlivé skalární veličiny, kterou nelze odvodit z dříve vypsaných axiomů (1)–(7), si začneme uvědomovat, když se například pokusíme porovnat délku úsečky s obsahem čtverce: opakovaným kladením úsečky nikdy celý čtverec nepokryjeme. Někdy poněkud expresivně říkáme, že délka úsečky je (ve srovnání s obsahem čtverce) „nekonečně malá . Je možné srovnání takových veličin „zakázat , v historii matematiky však právě odpovídající nepovolené procedury (kterým dnes říkáme infinitezimální výpočty) byly úspěšným prostředkem, který umožnil vyřešit mnoho matematických i fyzikálních úloh dávno předtím, než byl přísně logicky formalizován. O nekonečně malých veličinách uvažovali i staří Řekové: byly to pro ně úhly mezi křivkami a jejich tečnami ve srovnání s obyčejnými úhly (mezi dvěma různými 13O významu konečného řetězového zlomku [k1, k2, . . . , kt] z (3.3) můžeme samozřejmě mluvit, až máme vybudovánu teorii (kladných) racionálních čísel (podílů přirozených čísel). 14Možnost, že násobky menší hodnoty lze „vyčerpat libovolnou větší hodnotu téhož druhu, lidé rádi vyjadřují paradoxními příklady, jakým je přelití moře na jiné území pomocí krejčovského náprstku. 8 JAROMÍR ŠIMŠA polopřímkami se společným počátkem). Patrně proto také Eukleides v Základech uvádí (jako nutný předpoklad pro obecnou teorii proporcí) vlastnost, kterou dnes spojujeme se jménem Archiméda ze Syrakus15 : Archimédův princip. Pro dvě libovolné hodnoty x < y téže skalární veličiny existuje přirozené číslo n, pro které platí nerovnost n · x > y. Posuďme nyní otázku konečnosti algoritmu (3.1). Jak víme, jeho průběh skončí tehdy, když (poprvé) dostaneme takovou dvojici hodnot ut > ut+1, že ut je (úplným) násobkem ut+1, tedy v našem označení ut = kt · ut+1. Z toho se indukcí ověří, že i všechny předchozí hodnoty ut−1, ut−2, ut−3, . . . (a tedy i výchozí hodnoty x = u1 a y = u2) jsou násobky „poslední hodnoty ut+1, kterou pro jednoduchost přeznačíme jako w. Pokud tedy algoritmus (3.1) po konečném počtu kroku skončí, existují přirozená čísla m, n a hodnota w dané veličiny takové, že pro výchozí hodnoty x a y platí (3.4) x = m · w a y = n · w . Jako při rozboru Eukleidova algoritmu se dokáže i obrácené tvrzení: Pokud platí (3.4) pro vhodnou hodnotu w a pro nesoudělná16 čísla m a n, skončí algoritmus (3.1) pro výchozí hodnoty u1 = x a u2 = y po konečném počtu t kroků na hodnotě ut+1 = w. V této situaci se hodnota w nazývá (největší) společnou mírou hodnot x, y, jimž pak říkáme souměřitelné hodnoty. Dodejme, že právě za předpokladu (3.4) je rozvoj na pravé straně (3.3) konečný a jeho aritmetická hodnota je rovna zlomku m n , který lze z rovností (3.4) dostat i formálním krácením: x y = m · w n · w = m n . (Teprve v následujícím oddíle zdůvodníme toto přiřazení jednodušeji, pomocí obvyklé konstrukce zlomků na základě dělení veličiny na stejné části.) Ani podmínka (3.4) však nedává faktickou odpověď na otázku, zda pro některé dvojice hodnot veličiny téhož druhu není algoritmus výpočtu neúplných podílů nekonečný. Neexistují žádné praktické zkušenosti lidí, které by svědčily pro existenci dvojic nesouměřitelných délek (obsahů, objemů apod.). Teprve logické dedukce spojené s Pythagorovou větou překvapivě ukázaly, že takové dvojice délek existují. Nejznámějším příkladem je nesouměřitelnost strany čtverce a jeho úhlopříčky, kterou v oddíle 4 posoudíme poněkud netradičním způsobem. Poznamenejme, že staří Řekové se od způsobu vyjadřování poměrů pomocí neúplných podílů postupem doby odvrátili. Důvod byl patrně ten, že neexistují jednoduchá pravidla pro počítání s řetězovými rozvoji. Těžkopádnost výpočtů s čísly vyjádřenými řetězovými zlomky je na druhé straně vyvážena významnou rolí, které tyto zlomky hrají v různých aproximačních úlohách. Praktický význam jedné z nich si uvědomíme, když se vžijeme do role středověkého konstruktéra, který zamýšlí sestrojit mechanický orloj, znázorňující mimo jiné i oběhy 15Sám Archimédes v úvodu ke knize Kvadratura paraboly přiznává, že tento princip bohatě využívali jeho předchůdci, a oceňuje jeho místo v Eudoxově teorii proporcí. 16Jsou-li čísla m, n soudělná, lze v (3.4) nahradit hodnotu w větší hodnotou w = d · w, kde d = NSD(m, n); po záměně w za w budou nová čísla m, n v (3.4) nesoudělná. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 9 planet po kruhových drahách. Podle (již tehdy poměrně přesných) astronomických tabulek sice známe poměr m : n oběžných dob dvou planet, přirozená čísla m a n jsou však natolik velká, že ozubená kola s m resp. n zuby nedokážeme vyrobit. Proto místo nich pro náš orloj použijeme kola s p resp. q zuby vybranými tak, aby rozdíl m n − p q byl co nejmenší (a aby čísla p, q nepřevyšovala technologicky danou hranici N maximálního počtu zubů na jednom ozubeném kole). I když lze tuto úlohu řešit probráním všech možností (například tak, že nejdříve pro každý jmenovatel q ≤ N najdeme ten čitatel p, při kterém je roz- díl m n − p q nejmenší), existuje elegantnější postup řešení vycházející z toho, že k danému „složitému poměru m : n nejprve sestavíme (pomocí procedury neúplných podílů) odpovídající řetězový zlomek.17 Pro zajímavost uveďme, že z (nekonečného) řetězového zlomku pro Ludolfovo číslo π = 3 + 1 7 + 1 15 + 1 1 + 1 292 + . . . plynou postupně tato přiblížení (podtržena jsou platná desetinná místa): π . = 3 + 1 7 = 22 7 = 3,1428 . . . , π . = 3 + 1 7 + 1 15 = 333 106 = 3,141509 . . . , π . = 3 + 1 7 + 1 15 + 1 1 = 355 113 = 3,14159292 . . . , π . = 3 + 1 7 + 1 15 + 1 1 + 1 292 = 103993 33102 = 3,1415926530 . . . . Vypsaným zlomkům se nevyhne žádný přehled o historii čísla π, zájemcům o její širší kulturně-společenské souvislosti doporučuji poutavé vyprávění [Be]. 17Podrobnosti o tom najdete v brožuře [V] nebo knížce [Ch], kde jsou rovněž uvedeny další (značně hluboké) věty o aproximacích racionálními čísly. 10 JAROMÍR ŠIMŠA 4. Zlomky a číselné poměry. V předchozím textu jsme se ještě nezmínili o tom, že skalární veličiny se od přirozených čísel odlišují jednou velice významnou vlastností. Vyslovme ji nejprve spíše filosoficky: Geometrické veličiny (jako jsou délka, obsah či objem) se neskládají z „atomů (nedělitelných částí), lze je bez jakéhokoliv omezení dělit na menší a menší části (například opakovaně půlit), aniž se mění „kvalita dělené veličiny.18 Tímto závěrem již starořecký učenec Aristoteles (384–322 před n. l.) vystihl podstatný rozdíl mezi spojitými a diskrétními veličinami. Vyjádřeme nyní Aristotelovu myšlenku matematicky jako další, v pořadí osmou vlastnost obecné skalární veličiny. Bude vyjadřovat poznatek, že jakékoliv „množství lze rozdělit na předepsaný počet rovných dílů: (8) Pro libovolnou hodnotu x skalární veličiny a každé přirozené číslo n existuje hodnota y téže veličiny, pro kterou platí x = n · y. Zdůrazněme, že procedura dělení na rovné části je právě tím postupem, kterým žákům vysvětlujeme pojem zlomku; po úvodních příkladech typu čtvrtina koláče nebo dvě třetiny kruhu abstrahujeme od povahy „nosičů konkrétních jednotek (ve zmíněných příkladech koláč resp. kruh) a pracujeme se zlomky „jako takovými , tedy s univerzálními čísly.19 Protože je tento postup všeobecně znám, popišme ho zde velmi stručně. Místo rovnosti x = n · y z vlastnosti (8) píšeme y = 1 n · x a říkáme, že hodnota y je n-tý díl (neboli jedna n-tina) hodnoty x. Pro libovolná přirozená čísla m, n pak definujeme hodnotu m n ·x jako m-násobek hodnoty 1 n ·x. Snadno se ověří, že platí tvrzení: rovnost y = m n ·x nastane, právě když zároveň y = m·w a x = n·w pro vhodnou hodnotu w (která se pak, jak již víme, nazývá společnou mírou hodnot x, y). Vysvětlili jsme, že zlomky (kladná racionální čísla) jsou prostředkem srovnání souměřitelných hodnot téže skalární veličiny. Prakticky se toto srovnání uskutečňuje známou procedurou měření. Spočívá v tom, že v množině všech hodnot dané skalární veličiny vybereme jednu hodnotu e (nazveme ji jednot- kou20 ) a s její pomocí na základě určité manipulace popíšeme velikost každé jiné hodnoty x porovnáním (4.1) x = m n · e pro vhodná přirozená čísla m, n. 18Máme samozřejmě na mysli pouze dělení na konečný počet částí. 19Nezneužíváme někdy heslo „V hodinách matematiky počítáme bez jednotek ? Chápu, že to usnadňuje nácvik počtářských dovedností i výklad mnohého nového učiva. Nevadí mi, že žáci vidí v číslech často pouze jejich ciferné zápisy. Kolik z nich však tuší, co všechno se může stát, když do algebraických výrazů začneme za proměnné dosazovat nikoliv čísla, ale geometrické veličiny? Proč při geometrických výpočtech nejsou žáci příliš zvyklí provádět „rozměrové zkoušky vzorců, ke kterým dospějí? Jsou středoškoláci opravdu dobře připraveni na to, abychom jim v zadáních úloh uváděli délky, obsahy a objemy jako čísla bez jednotek? 20Neexistuje bohužel žádná „výjimečná hodnota, která by se odlišovala některou vlastností od ostatních hodnot téže skalární veličiny. Proto výběr jednotek a „uchování jejich etalonů přinášely lidem vždy řadu potíží. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 11 Výsledkem měření hodnoty x je tedy zlomek m n ; s ohledem na omezenou přesnost každé fyzické manipulace nejsou čísla m, n obvykle příliš velká (jmenovatel n je nejčastěji mocninou čísla 10 s celočíselným exponentem). Nikdy přitom nedostaneme varovný signál, že jsme „narazili na hodnotu x, pro kterou vyjádření (4.1) neexistuje (a která tedy není s hodnotou e souměřitelná). Zmíněná procedura měření odedávna v lidech vyvolávala alespoň naivní představy o „spojité škále čísel, společné pro všechny druhy skalárních veličin. Upozorněme na tomto místě, že starořečtí matematikové nazývali čísly pouze celá čísla větší než 1, neboť čísla pro ně byla soubory nedělitelných jednotek.21 Takové omezení pojmu čísla mělo zřejmě filosofické opodstatnění (jednotka nemůže být rozdělena na části, jinak by totiž přestala být jednotkou). Proto Řekové tehdy nepracovali se zlomky jako s čísly, ale pouze jako s číselnými poměry22 ; podmínku (4.1) by tudíž zapsali rovností x:e = m:n, úměrou, která znamená, že hodnota x je složena z m dílů a hodnota e z n dílů, přičemž všechny tyto díly jsou stejné (tj. x = m · w a e = n · w). Dodejme, že číslům a jejich poměrům přisuzoval Pythagoras ze Samu (asi 570–500 před n. l.) a jeho žáci (zvaní pythagorejci) mystický význam: čísla (kvantitativně omezující principy) jsou počátkem všeho, pomocí čísel a jejich poměrů lze vyložit harmonii celého světa.23 Paradoxně samotní pythagorejci tuto svou teorii vyvrátili, když objevili, že strana čtverce a jeho úhlopříčka mají nesouměřitelné délky. Podle [Bou] není příliš jasné, jak pythagorejci toto tvrzení poprvé dokázali. Protože aritmetický důkaz iracionality čísla √ 2 je z učebnic matematiky dobře znám, uvedeme nyní geometrický důkaz zmíněné nesouměřitelnosti, a to na základě procedury neúplných podílů z oddílu 3. Na obrázku vidíte čtverec ABCD. Kružnice o středu C a poloměru rovném délce strany čtverce protne úhlopříčku AC v bodě E a její prodloužení za vrcholem C v bodě F. Pomocí rovnoramenných trojúhelníků BCE a BCF se snadno zjistí, že úhly ABE a BFC mají velikost 22,5◦ ; protože i úhly BAE a ACB jsou shodné (měří 45◦ ), jsou trojúhelníky ABE a AFB podobné podle věty uu. Proto pro jejich strany platí |AB| : |AE| = |AF| : |AB|, odkud plyne, že procedura neúplných podílů pro úsečky AC a AB má následující průběh24 : A B CD E F 21Nejde pouze o terminologickou poznámku, neboť čísla byla vždy spojována s dvěma operacemi: sčítáním a násobením. V duchu svého pojetí čísel tak Řekové „odmítli i počítání se zlomky, dříve pěstované Egypťany a Babylóňany s dobrými praktickými výsledky. 22V (zejména starší) české literatuře se poměru často říká proporce; ve shodě s jinými jazyky bychom proporcí měli spíše nazývat úměru, tedy rovnost dvou poměrů. V celém příspěvku preferuji české termíny poměr a úměra; jedinou výjimku činím v ustáleném názvu teorie proporcí. 23Podrobnosti o pythagorejské filosofické škole najdete v [B1]. 24Místo toho, abychom v druhém kroku ( a, jak se ukáže, i všech dalších krocích) procedury 12 JAROMÍR ŠIMŠA |AC| |AB| = 1 + |AE| |AB| , |AB| |AE| = |AF| |AB| = 2 + |AE| |AB| , |AB| |AE| = 2 + |AE| |AB| , . . . Je to tedy nekonečný „zacyklený proces, jehož výsledek vypadá takto: |AC| |AB| = 1 + 1 2 + 1 2 + 1 2 + · · · Tak jsme geometrickou cestou (bez jakékoliv úvahy o dělitelnosti čísel, potřebné při obvyklém důkazu sporem) ukázali, že délky úseček AB a AC jsou nesouměřitelné. Protože, jak dobře víme, platí rovnost |AC| : |AB| = √ 2, našli jsme (i když to nebyl náš bezprostřední cíl) rozvoj iracionálního čísla √ 2 do tvaru nekonečného řetězového zlomku. Zjištění pythagorejců, že některé dvojice úseček mají nesouměřitelné délky, bylo nejen silným otřesem, který narušil základy tehdejší matematiky budované výlučně na aritmetických základech, ale zároveň i velkou výzvou pro další generace matematiků, aby zkoumali konkrétní druhy „číselně nevyjádřitelných poměrů a hledali způsoby, jak tyto poměry alespoň přibližně vyjadřovat (což v důsledku vedlo k rozšíření pojmu čísla).25 Tento obrat ve vývoji matematiky se již plně projevuje v Eukleidových Základech z třetího století před Kristem, v nichž jsou výchozími objekty exaktního výkladu nikoliv čísla, ale geometrické veličiny. Právě jejich obecná teorie (viz oddíl 2 výše) je vyložena v první knize Základů. V dalších knihách se pak čísla zobrazují pomocí úseček, jejich součiny pomocí obdélníků, základní algebraická pravidla a vzorce se dokazují názornými geometrickými obrázky, lineární a kvadratické rovnice se interpretují jako úlohy o obsazích čtverců a obdélníků a řeší se konstrukcemi pravítkem a kružítkem (detailní popis této pozoruhodné řecké geometrické algebry najdete v [B1]).26 Co rozhodlo o tom, že dnes tuto koncepci „matematiky na geometrických základech vnímáme spíše jako historickou zajímavost (při vědomí toho, jak hlubokým způsobem Eukleidovy Základy ovlivňovaly vývoj matematiky více než 2000 let)? Jistě k tomu přispěla skutečnost, že je mnohem nesnadnější operovat s geometrickými veličinami nežli s čísly. Tato nevýhoda geometrie se postupem staletí projevovala stále výrazněji, zejména poté, co se prosadily poziční číselné soustavy, které neobyčejně zjednodušily zápisy čísel i praktické výpočty s nimi. porovnávali dvojici úseček AB, AE, porovnáme „proporcionální dvojici úseček AF, AB. Tím se vyhneme dokreslování dalších (menších a menších) úseček do našeho obrázku. 25Zhroucení představ pythagorejců o vzájemném vztahu přirozených čísel a geometrických veličin se často nazývá první krizí matematiky. 26Škoda jen, že v dnešní škole nevěnujeme „geometrickému vidění algebraických pravidel a výsledků více pozornosti. Viz podnětnou publikaci [Ku]. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 13 5. Eudoxova teorie proporcí. Z celých Eukleidových Základů je pro naše téma nejdůležitější pátá kniha, v níž je rozpracována nápaditá teorie poměrů a úměr geometrických veličin, která v určitém smyslu předjímá moderní pojetí reálných čísel (přesněji jejich model tzv. Dedekindových řezů). Protože úplný přehled všech definic a vět páté knihy Základů je možné nalézt v [B2] (s citacemi původních formulací českého překladu F. Servíta a zasvěceným komentářem J. Bečváře), omezíme se v tomto oddíle pouze na výklad základní myšlenky a významu Eudoxovy teorie. Vyjádřeme nejprve výchozí nápad celé teorie proporcí: zachytit poměr x : y (kvantitativní vztah dvou hodnot x, y téže skalární veličiny) tím způsobem, že srovnáme velikost každého jednotlivého násobku x, 2x, 3x, . . . s velikostí každého jednotlivého násobku y, 2y, 3y, . . . Poznamenejme, že pokud se v obou skupinách násobků najde stejná hodnota, řekněme n · x = m · y, jsou výchozí hodnoty x, y souměřitelné a platí úměra x : y = m : n, která (sama o sobě) již podává úplnou informaci o poměru x : y. V opačném případě platí pro každou dvojici přirozených čísel m, n právě jedna z nerovností (5.1) n · x < m · y respektive n · x > m · y. Poměr x : y je pak úplně popsán tím, která ze dvou posledních nerovností (pro libovolná čísla m a n) platí.27 Toto tvrzení lépe pochopíme, když si uvědomíme, že první (resp. druhá) nerovnost v (5.1) znamená právě to, že hodnota poměru x : y je menší (resp. větší) než hodnota poměru m : n. Proto je „testování (5.1) vlastně „zařazováním hodnoty poměru x : y do uspořádané škály hodnot všech číselných poměrů m : n, tedy do škály zlomků m n . Poměrem x : y dvou nesouměřitelných hodnot x, y se tak všechny zlomky m n rozdělí do dvou tříd, podle toho, která z nerovností x : y < m n resp. x : y > m n platí. Vidíme, že teorie proporcí je založena na stejném nápadu jako Dedekindova teorie řezů (viz oddíl 7). Staří Řekové však k chápání čísel jako hodnot poměrů nikdy nedospěli. V teorii proporcí „pouze definují úměru (rovnost dvou poměrů) x : y = u : v jako situaci, kdy pro libovolná přirozená čísla m, n platí ekvivalence n · x < m · y ⇐⇒ n · u < m · v, n · x = m · y ⇐⇒ n · u = m · v, n · x > m · y ⇐⇒ n · u > m · v. Testování nerovnostmi (5.1) umožňuje v teorii proporcí srovnávat i dva poměry, které netvoří úměru; nerovnost x : y < u : v podle definice znamená existenci přirozených čísel m, n takových, že n · x < m · y a zároveň n · u ≥ m · v 27Aby byla informace o poměru x : y úplná, je bohužel nutné (v případě nesouměřitelných hodnot x, y) udat nekonečně mnoho platných nerovností (5.1). 14 JAROMÍR ŠIMŠA (tedy v důsledku x : y < m : n ≤ u : v).28 Uvědomte si, že oběma uvedenými definicemi je možné porovnávat poměry x : y a u : v i v případě, kdy x, y jsou hodnoty jedné veličiny a u, v hodnoty jiné veličiny. Hlavní přínos teorie proporcí jsme právě vyložili: pomocí testování (5.1) lze množinu všech možných poměrů x : y (souměřitelných i nesouměřitelných dvojic hodnot x, y) lineárně uspořádat. Mohlo by se zdát, že chyběl jen krůček, aby Eukleides došel k pojmu (kladného) reálného čísla: stačilo dodat, že číslo je třída rovných poměrů. To je však klamný dojem, neboť ani s číselnými poměry m : n staří Řekové neoperovali jako s čísly.29 S poměry geometrických veličin se v Eudoxově teorii proporcí operuje na naše zvyklosti velmi „střídmě : omezeně se uvažuje pouze jediná binární operace kompozice (použijeme pro ni znak ◦), která se přirozeně objevuje v různých geometrických situacích a která odpovídá dnešnímu násobení hodnot poměrů. Kompozici dvou poměrů a : b a c : d lze v teorii proporcí bez problémů „vypočítat pouze ve speciálním případě c = b, kdy se výsledek (a : b) ◦ (b : d) definuje jako poměr a : d. V případě c = b uvažuje Eukleides kompozici (a : b) ◦ (c : d) pouze tehdy, kdy a, b, c, d jsou délky úseček a kdy poměr c : d můžeme nahradit jemu rovným poměrem b : x (známé pravidlo čtvrté úměrné): c : d = b : x ⇒ (a : b) ◦ (c : d) = (a : b) ◦ (b : x) = a : x . Dodejme, že v šesté knize Základů je posouzená kompozice poměrů délek úseček dána do souvislosti s poměrem obsahů, vzniklých násobením příslušných délek: (a : b) ◦ (c : d) = (a · c) : (b · d). Pro jiné skalární veličiny a, b, c, d však toto pravidlo nelze prohlásit za definici kompozice, neboť „součiny a · c a b · d obecně nemají význam. Tuto aritmetickou „nedostatečnost Eudoxovy teorie lze odstranit pouze hlubokými koncepčními změnami, které matematikové složitými cestami nacházeli a prosazovali v průběhu dvou tisíciletí. I když je teorie proporcí vyjádřením snahy starořeckých matematiků o dokonalost základů a ujasněnost pojmů matematické vědy, aritmeticko-početní význam teorie proporcí v antické době nebyl (a podle předchozího odstavce ani nemohl být) příliš veliký. Při vší úctě k vnitřní logické propracovanosti byla Eudoxova teorie z hlediska výpočtů málo „pružná . Proto ještě v antickém Řecku pozorujeme odklon učenců od této abstraktní teorie k pragmatičtějším náhledům na základy matematiky: tak například průkopník algebraického značení neznámých hodnot, Diofantos z Alexandrie (3. stol. n.l.), chápal číslo jako řešení rovnice.30 28Je to vyjádření toho poznatku, že mezi každými dvěma různými reálnými čísly leží aspoň jedno racionální číslo. 29Prohlásit některé objekty za čísla, aniž je můžeme sčítat a násobit, by bylo v rozporu s tím, co se od pojmu čísla všeobecně očekává. 30Zní to poněkud naivně, ale zvažte: Nejsou racionální čísla (zlomky m n ) „stvořena právě jako řešení lineárních rovnic n · x = m? Není iracionální číslo √ 2 určeno jako kladný kořen kvadratické rovnice x2 = 2? O jiných než algebraických číslech neměli lidé až do 19. století ani potuchy. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 15 6. Co přinesl středověk. Z hodin dějepisu víme, že první staletí po zániku antického světa byla pro Evropu obdobím všeobecného kulturního úpadku. Myšlenky starořeckých matematiků na dlouhá staletí upadly do zapomnění, originály jejich děl byly nenávratně zničeny. Naštěstí se nám dochovaly alespoň jejich arabské překlady, pořízené učenci islámské říše, která se koncem prvního tisíciletí našeho letopočtu stala rozlehlou euroasijskou mocností se všemi hlavními centry tehdejší vzdělanosti. Narozdíl od antických Řeků, kteří usilovali o dokonalé propracování logických základů matematiky, byli arabští matematikové zaměřeni pragmatičtěji: místo „planého teoretizování dávali přednost „praktickému kalkulu . Jejich překlady Eukleidových Základů jsou spíše svéráznými „přepisy : mnohé původní pasáže (často právě Eudoxova teorie proporcí) jsou těmito překladateli (či spíše vykladači) vynechány či chybně pozměněny, kriticky přepracovány nebo alespoň doplněny komentáři či jinými výklady. Odlišnost středověké arabské matematiky od matematiky antického Řecka výrazně ovlivnila budoucí početní praxi v Evropě, a tím i samotné představy o číslech v myslích Evropanů. Arabští matematikové se svým zaměřením zasloužili o vznik a rozvoj numerické matematiky. Velké úsilí totiž věnovali praktickým výpočtům, například při sestavování stále přesnějších astronomických tabulek a s tím souvisejících výpočtech poměrů délek tětiv a poloměrů kružnic v závislosti na středovém úhlu. Tyto poměry byly vyjadřovány (s jistou chybou) nejdříve šedesátinnými, později desetinnými zlomky.31 Těmito úspěchy se posilovalo vědomí, že čím lépe předem aproximujeme vstupní čísla, tím blíže se výpočty dostaneme k přesnému výsledku. Tento „počtářský optimismus by nikdy v myslích lidí nezvítězil, kdyby se při zapisování čísel neprosadily poziční číselné soustavy, které jednak umožňují systematicky vypisovat libovolně blízké aproximace „nevyjádřitelných (dnes říkáme iracionálních) čísel, jednak usnadňují provádění aritmetických operací s čísly (a tak vnáší do numerického počítání tolik potřebnou přehlednost a jistotu). Kvadratické iracionality, podané v desáté knize Základů v geometrickém pojetí pomocí úseček, čtverců a obdélníků, byly ve středověku stále častěji interpretovány aritmeticky a objasňovány numerickými příklady. Tak se postupně stíral rozdíl mezi poměry nesouměřitelných hodnot geometrických veličin a numerickými iracionalitami. Doložme nové představy o číslech názory tří matematiků tehdejší epochy (podle [J]): Omar Chajjám (1048–1131, střední Asie): „Místo otázky o vztahu poměru a čísla, kterou považuji spíše za filosofickou, pokládám za nutné zavést v matematice dělitelnou jednotku a nový druh čísel, která odpovídají poměrům hodnot veličiny k této zvolené jednotce. To už nejsou ani čáry, ani plochy, ani tělesa, ale od toho všeho rozumem oddělené veličiny patřící mezi čísla. Raffaele Bombelli (asi 1530–1572, Bologna): „Vybereme-li jednotku dané veličiny, pak se nám hodnoty veličiny a jejich poměry ztotožní. S takovými hodnotami pak můžeme volně počítat (sčítat a násobit), jako by šlo o čísla. Isaac Barrow (1630–1677, Cambridge): „Čísla označují poměry veličin a mají známé aritmetické vlastnosti, lze je tedy sčítat, násobit a porovnávat. 31Tak se poměry délek začaly zvolna považovat za jakási „obecná čísla. 16 JAROMÍR ŠIMŠA Završení etapy ve vývoji představ o číslech, kdy se prosadil názor, že čísla jsou hodnotami poměrů skalárních veličin, spojujeme se jménem slavného fyzika Isaaca Newtona (1643–1727), který viděl v čísle „míru veličiny při zvolené jednotce . Právě newtonovským pohledem by na reálná čísla měli pohlížet naši dnešní středoškoláci, proto se mu chvíli věnujme podrobněji. Vybereme nejobvyklejší veličinu – délku, zvolíme její jednotku a označíme ji písmenem e. Pak každá délka x je určité množství (číslo, jež označíme α) jednotek e; vyjádříme to rovností (6.1) x = α · e . Délku x jsme zapsali jako α-násobek jednotky e. Je toto násobení pouze formálním zápisem, nebo popisuje určitou manipulaci s úsečkami, „nosiči příslušných délek? Zdůrazněme, že pojem α-násobku délky e měl původně význam pro přirozená čísla α (výsledek opakovaného kladení úsečky délky e za sebe). Jak dobře víme, také pro zlomky α = m n mají α-násobky délky e význam spojený s určitou konečnou manipulací (rozdělení úsečky délky e na n stejných dílů a sloučení m jejich exemplářů). Jakým obsahem však lze naplnit rovnost (6.1) v případě, kdy jsou délky x, e nesouměřitelné? Číslo α je tehdy sice označením hodnoty poměru x : e, žádná (konečná) manipulace objasňující jeho „velikost však neexistuje. Nicméně takové iracionální číslo α je „pevně ukotveno ve škále zlomků (racionálních čísel) pomocí porovnání příslušných délek: m1 n1 · e < α · e < m2 n2 · e =⇒ m1 n1 < α < m2 n2 (nerovnosti mezi délkami přenášíme na nerovnosti mezi čísly, které tyto délky vyjadřují). Velikost čísla α je tak určena zprostředkovaně , totiž tím, které zlomky m n jsou větší (a které menší) než číslo α. Přiblížení čísla α těmito zlomky má zásadní význam při aritmetických operacích, kdy obecná čísla nahrazujeme (obvykle desetinnými) zlomky. V této souvislosti upozorněme, že díky používání stále přesnějších logaritmických tabulek se koncem 16. století v Evropě rodí nová (aritmetická) představa o iracionálních číslech jako o desetinných číslech s neukončeným neperiodickým zápisem, která zdařile (z hlediska praktických výpočtů) doplňuje právě popsaný (geometrický) pohled32 na čísla jako na poměry délek. Geometrický model reálných čísel těsně souvisí s filozofickými základy newtonovské fyziky: náš materiální svět a veškeré jeho procesy se odehrávají v třírozměrném eukleidovském prostoru (éteru), jehož vlastnosti nezáleží na hmotě, která je v něm „rozmístěna . Neměnnost a dokonalá homogenita prostoru, 32Připomeňme jeho obvyklou interpretaci pomocí číselné osy. Pokud zvolíme úsečku OE délky e a každému vnitřnímu bodu A polopřímky OE přiřadíme číslo |OA| : |OE|, dostaneme vzájemně jednoznačné zobrazení (bijekci) mezi polopřímkou OE (bez počátku O) a množinou kladných reálných čísel, ve kterém je bod E vzorem čísla 1. Z této poloosy dostaneme celou číselnou osu, když bod O prohlásíme za vzor čísla 0 a vnitřní body polopřímky opačné k OA za vzory záporných čísel. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 17 a tedy i přímek a rovin, z nich dělají vhodné výchozí objekty pro budování té matematiky, která by měla dobře sloužit fyzice a dalším přírodním vědám.33 7. Čísla a infinitezimální výpočty. Jak jsme vysvětlili v předchozím oddíle, na počátku novověku se zdálo, že koncepce čísel jako objektů, které slouží k označování poměrů veličin, které lze libovolně přibližovat desetinnými rozvoji a se kterými lze volně aritmeticky operovat, brzy dosáhne podoby konečné exaktní teorie. Takový vývoj však byl pozdržen v důsledku bouřlivého rozvoje nových směrů matematického výzkumu. Zejména teorie nekonečných řad a diferenciální a integrální počet, které rychle začaly přinášet užitek fyzice i samotné matematice, vnesly do budovaného světa čísel nejistotu (hlavně tím, že zpochybnily univerzálnost Archimédova principu). Virtuózní výpočty s nekonečně malými a nekonečně velkými veličinami takových výjimečných matematiků, jakými byli Leonhard Euler, bratři Bernoulliové nebo Gottfried Leibniz, vyvolávaly ostré polemiky o korektnosti jejich postupů, které v té době nebylo možné přísně logicky zdůvodnit. (Zajímavé ukázky těchto postupů naleznete v [SchŠ] a [Ve].) Jedním z prvních, kdo upozornil na potřebu podrobit infinitezimální výpočty kritické analýze a převést je do teorie operující s přesnými pojmy na korektních základech, byl německý matematik Carl Friedrich Gauss (1777–1855). Ještě v dětském věku, při úvahách o aritmeticko-geometrických průměrech34 , Gauss patrně mnoho přemýšlel o „infinitních vlastnostech číselné osy. Výsledek jeho geniálních úvah dozrál kolem roku 1805, kdy Gauss novátorsky zavedl pojmy supréma a infima číselné množiny. Připomeňme, že číslo h ∈ R se nazývá horní závora množiny X ⊂ R, pokud pro každé x ∈ X platí x ≤ h. Nejmenší horní závoře množiny X se říká supremum X a značí se sup X; podobně se definuje infimum množiny X (inf X) jako její největší dolní závora. Následující princip považoval Gauss za samozřejmou vlastnost, ze které odvozoval vše další, co v matematické analýze o „úplnosti číselné osy potřeboval. Gaussův princip. Každá neprázdná shora omezená množina reálných čísel má supremum. Ukažme pro zajímavost, že z Gaussova principu plyne důležitá vlastnost reálných čísel, kterou jsme v oddíle 3 nazvali Archimédovým principem: pro libovolná čísla x > 0 a y > 0 existuje přirozené číslo n takové, že nx > y. Připusťme, že existují kladná čísla x, y taková, že číslo y je horní závorou množiny X = {x, 2x, 3x, . . . }. Množina X je neprázdná a shora omezená (číslem y), označme y = sup X. Protože x > 0, platí y − x < y , takže číslo y −x není horní závorou množiny X. Existuje tudíž prvek nx množiny X takový, že nx > y − x, neboli (n + 1)x > y . Prvek (n + 1)x množiny X je tedy větší než její suprémum, a to je spor. Upozorněme, že obrácené tvrzení neplatí: Gaussův princip nelze odvodit z Archimédova principu. Potvrzuje to příklad uspořádaného pole Q všech racionálních čísel. 33Dobře víme, jak se za posledních 120 let názory fyziků na hmotu, prostor a čas změnily. 34Aritmeticko-geometrickým průměrem dvou kladných čísel x0 a y0 se nazývá (společná) limita dvou posloupností {xn}∞ n=1 a {yn}∞ n=1, jejichž členy jsou z výchozích čísel x0 a y0 určeny rekurentními rovnicemi xn+1 = 1 2 (xn + yn) a yn+1 = √ xnyn pro každé n ≥ 0. 18 JAROMÍR ŠIMŠA Prvním matematikem, který vytvořil korektní teorii nekonečných součtů, byl Francouz Augustin Louis Cauchy (1789–1859). S ohledem na naše téma je významné, že ve svém kurzu analýzy z roku 1821 definoval limitu posloupnosti reálných čísel způsobem, jakým se limity definují dodnes. Definice. Číslo se nazývá limitou posloupnosti {xn}∞ n=1, pokud pro každé reálné číslo ε > 0 existuje číslo N ∈ N takové, že nerovnost |xm − | < ε platí pro každé m > N. Cauchy rovněž objevil, jakou podmínkou můžeme charakterizovat existenci limity , aniž se na číslo odvoláme. Je to velmi elegantní obrat: v předchozí definici odchylku |xm − | nahradíme odchylkou |xm −xn| pro libovolné n > N. Takto dostaneme další princip vyjadřující „úplnost množiny R: Cauchyův princip. Limitu má každá C-posloupnost reálných čísel, tj. každá posloupnost {xn}∞ n=1 s touto vlastností: Pro každé reálné číslo ε > 0 existuje číslo N ∈ N takové, že nerovnost |xm − xn| < ε platí pro libovolná čísla m, n > N. O stejném principu uvažoval (o pět let dříve než Cauchy) český matematik, logik, filozof a kněz Bernard Bolzano (1781–1848), který se pokoušel Cauchyův princip dokázat při úvahách spojených s tvrzením o mezihodnotách spojité funkce (které dnes nazýváme Bolzanovou větou).35 Uvedeme nyní další dvě formy vyjádření úplnosti číselné osy. První princip patří Karlu Weierstrassovi (1815–1897), matematikovi, který dobudoval dnes již klasický ε-δ jazyk matematické analýzy; druhý princip náleží Georgu Cantorovi (1845–1918), tvůrci novodobé teorie množin. Weierstrassův princip. Každá neklesající shora omezená posloupnost reálných čísel má limitu. Cantorův princip. Každá posloupnost uzavřených intervalů číselné osy, které jsou do sebe „vloženy následujícím způsobem a1, b1 ⊃ a2, b2 ⊃ a3, b3 ⊃ · · · , má neprázdný průnik, tedy existuje takové r ∈ R, že ak ≤ r ≤ bk pro každé k. Náš přehled způsobů, jakými lze vyjádřit úplnost číselné osy, uzavřeme principem, který objevil Richard Dedekind (1831–1916), když si na podzim roku 1858 rozmýšlel exaktní budování teorie reálných čísel v souvislosti se svými univerzitními přednáškami v Curychu.36 35Protože Bolzano nedisponoval žádnou aritmetickou definicí reálného čísla, dostal se při zmíněném dokazování do „bludného kruhu . Později se Bolzano ještě pokusil exaktní teorii reálných čísel vytvořit. Tento svůj (ne zcela zdařilý) pokus založil na myšlence definovat čísla (reálná, nekonečně malá i nekonečně velká) pomocí všech „nekonečných algebraických výrazů , zapsaných spočetným počtem aritmetických operací s celými čísly, viz [R]. 36V úvodu k práci Spojitost a iracionální čísla Dedekind píše: „Když jsem r. 1858 začal přednášet základy diferenciálního počtu, pocítil jsem naléhavěji než dříve nedostatky ve vědeckých základech aritmetiky. Při důkazu toho, že proměnná veličina, která roste, ale je omezena fixní hranicí, musí se blížit jisté limitě, jsem používal geometrickou intuici. Takovou názornost při přednášce didakticky schvaluji. Nedá se však hodnotit jako vědecký postup. Přemýšlel jsem proto, jak čistě aritmeticky a přísně logicky zdůvodnit základy diferenciálního počtu. To se mi podařilo 24. listopadu 1858. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 19 Dedekindův princip. Je-li množina R všech reálných čísel jakkoliv rozdělena na dvě (neprázdné) části X a Y tak, že nerovnost x < y platí pro libovolná čísla x ∈ X a y ∈ Y , pak existuje takové číslo r ∈ R, že x ≤ r pro každé x ∈ X a r ≤ y pro každé y ∈ Y . Jaké jsou logické závislosti mezi pěti uvedenými principy úplnosti množiny R všech reálných čísel? (Připojme k nim ještě Archimédův princip z oddílu 3.) Je možné dokázat, že v libovolném uspořádaném poli (viz oddíl 8) platí: (i) Gaussův princip, Weierstrassův princip a Dedekindův princip jsou navzájem ekvivalentní. (ii) Cauchyův princip je ekvivalentní s Cantorovým principem. (iii) Cauchyův princip plyne z Gaussova principu, opačná implikace neplatí. (iv) Archimédův princip plyne z Gaussova principu, opačná implikace neplatí.37 (v) Gaussův princip platí, pokud platí Cauchyův princip zároveň s Archimédovým principem. Posouzené principy umožnily ve druhé polovině 19. století vybudovat exaktní teorii reálných čísel na aritmetických základech (popíšeme ji v následujícím oddíle). Završil se tak proces, kterému říkáme aritmetizace matematické analýzy a matematiky vůbec. 8. Axiomy a aritmetické modely. Při axiomatickém zavádění daného matematického objektu nepopisujeme způsob, jak je daný objekt sestaven, nýbrž uvádíme (co nejkratší) výčet jeho základních vlastností (axiomů), které ve svém souhrnu již daný objekt jednoznačně určují. V tomto pojetí lze množinu všech reálných čísel zavést jako množinu R s dvěma binárními operacemi + a ·, dvěma vyčleněnými prvky 0, 1 a jednou binární relací <, která splňuje tyto axiomy (x, y, z jsou libovolné prvky R): (A1) x + y = y + x (A2) (x + y) + z = x + (y + z) (A3) x + 0 = x (A4) ∃(−x): x + (−x) = 0 (A5) x · y = y · x (A6) (x · y) · z = x · (y · z) (A7) x · 1 = x (A8) x = 0 ⇒ ∃x−1 : x · x−1 = 1 (A9) (x + y) · z = (x · z) + (y · z) (A10) Platí právě jeden ze vztahů x = y, x < y, y < x. (A11) x < y ∧ y < z ⇒ x < z (A12) x < y ⇒ x + z < y + z (A13) x < y ∧ z > 0 ⇒ x · z < y · z (A14) Každá neprázdná shora omezená podmnožina R má supremum. V algebraické terminologii axiomy (A1)–(A9) určují strukturu zvanou pole, struktuře s axiomy (A1)–(A13) říkáme uspořádané pole. Axiom (A14), zvaný 37Tvrzení (iv) jsme po formulaci Gaussova principu ihned dokázali. 20 JAROMÍR ŠIMŠA axiom úplnosti nebo axiom spojitosti, je uveden v jedné z podob, které jsme posuzovali v oddíle 7, totiž jako Gaussův princip. Není obtížné dokázat, že každé dvě struktury R = R1 a R = R2, které splňují axiomy (A1)–(A14), jsou „stejné (v matematice říkáme isomorfní). Poslední znamená, že existuje bijekce f : R1 → R2, která „zachovává vše, co s danou strukturou souvisí: pro libovolné prvky x, y ∈ R1 platí f(x + y) = f(x) + f(y), f(x · y) = f(x) · f(y) a x < y ⇒ f(x) < f(y) (odtud již plyne, že obrazy prvků 0, 1 pole R1 při zobrazení f jsou po řadě prvky 0, 1 pole R2, že f(−x) = −f(x) a že f(x−1 ) = (f(x))−1 , kdykoli x = 0). Věnujme se nyní otázce, zda reálná čísla vůbec existují, tedy zda na některé množině R lze definovat dvě binární operace (sčítání a násobení) a jednu binární relaci (uspořádání) takovým způsobem, aby byly splněny vlastnosti vyjádřené axiomy (A1)–(A14) (taková množina R se pak stává modelem reálných čísel). Žádný čtenář těchto řádků o existenci reálných čísel patrně nepochybuje. Tento postoj je (z „fundamentalistického pohledu matematické logiky) podmíněn tím, že připouštíme existenci množiny N všech přirozených čísel i dalších nekonečných objektů, potřebných ke konstrukci reálných čísel (například Cposloupností racionálních čísel nebo neukončených dekadických rozvojů).38 Při konstrukci modelů R se obvykle předpokládá, že je již sestrojen určitý model Q uspořádaného pole všech racionálních čísel (nejčastěji jako tříd ekvivalentních zlomků). Prvním modelem R, který posoudíme, bude Dedekindův model řezů, založený na stejné výchozí myšlence, jako Eudoxova teorie proporcí: každé reálné číslo r určuje rozklad množiny Q na dvě (neprázdné) skupiny (8.1) A = {x ∈ Q : x ≤ r}, B = {x ∈ Q : x > r}, přičemž tzv. horní skupina B zřejmě nemá nejmenší prvek (zatímco tzv. dolní skupina A má největší prvek, právě když r ∈ Q). Dedekind si uvědomil (a v tom je snad nejvýznamnější posun jeho teorie oproti původní Eudoxově teorii), že naopak každý řez (A, B) na množině Q (kterým míníme rozdělení množiny Q na dvě neprázdné skupiny A, B takové, že B nemá nejmenší prvek a že nerovnost x < y platí pro každé x ∈ A a každé y ∈ B) vznikne konstrukcí (8.1) pro vhodné reálné číslo r. Proto můžeme množinu R sestrojit jako množinu všech řezů na množině Q. Při takové konstrukci modelu R je nutné definovat, kdy pro dva řezy (A, B) a (C, D) platí (A, B) < (C, D) a kterým řezům se rovnají výsledky operací (A, B) + (C, D) a (A, B) · (C, D). Poté je zapotřebí ověřit, že definované operace mají vlastnosti (A1)–(A14). Aritmetické operování s řezy (A, B) se pochopitelně převádí na operování s libovolnými prvky obou skupin A a B (což vede k určení horních a dolních skupin výsledných řezů). V tom spočívá další podstatný rozdíl mezi Dedekindovou teorií řezů a Eudoxovou teorii proporcí, v níž se prvky skupin A a B interpretovaly pouze jako číselné 38Snad čtenáře nepřekvapí, že v některých matematických výstavbách žádné nekonečné množiny neexistují. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 21 poměry, nikoliv jako čísla, která přibližují zdola resp. shora tu hodnotu r, která je řezem (A, B) podle (8.1) určena. Věnujme se nyní druhému modelu R, jehož konstrukce je založena na myšlence, že každé reálné číslo je limitou vhodné posloupnosti čísel racionálních. V poli Q, které je částí pole R, totiž nekonvergují některé C-posloupnosti {xn}∞ n=1, tedy posloupnosti racionálních čísel xn s vlastností ∀ε ∈ Q+ ∃N ∈ N ∀m, n > N : |xm − xn| < ε (viz Cauchyův princip v oddíle 7).39 Definujme proto reálné číslo jako třídu těch C-posloupností z Q, které jsou ekvivalentní v následujícím smyslu: {xn}∞ n=1 ∼ {yn}∞ n=1 def ⇐⇒ ∀ε ∈ Q+ ∃N ∈ N ∀m > N : |xm − ym| < ε. Nebudeme zde popisovat, jak se v množině všech takových tříd definuje sčítání, násobení a uspořádání. Výsledek konstrukce (která nalézá obecnější uplatnění při zúplňování metrických prostorů) se nazývá Cantorův model reálných čísel. Poslední model R, o kterém se zde letmo zmíníme, je zajímavý tím, že k jeho konstrukci nepotřebujeme jako „výchozí surovinu racionální čísla, ale pouze deset cifer 0, 1, . . . , 9. Jde o Weierstrassův model, v němž je každé reálné číslo definováno jako (zpočátku formální) nekonečný zápis (8.2) ±cncn−1 . . . c1c0, c−1c−2c−3 . . . , kde {cn−k}∞ k=0 je libovolná posloupnost cifer (v průběhu konstrukce se samozřejmě „zjistí , že jde o zápis příslušného čísla v desítkové soustavě). Není příliš zajímavé ani popisovat, jak se definují součty, součiny a uspořádání zápisů (8.2), ani poté dokazovat vlastnosti (A1)–(A14), přesto taková „aritmetizace nejvyššího stupně měla v historii matematiky svůj význam. I když s reálnými čísly pracujeme po celý život, na jejich modely po absolvování kurzu z teoretické aritmetiky postupně zapomínáme. Příčina je nasnadě: ať používáme reálná čísla v jakékoli oblasti samotné matematiky nebo jejích aplikací, nepotřebujeme nic než vlastnosti reálných čísel, vyjádřené axiomy (A1)–(A14) a jejich důsledky. Existence modelů nám však dává jistotu, že mezi těmito vlastnostmi nejsou takové, které by si navzájem odporovaly. 9. Co bylo dále? Jak jsme již vysvětlili, budování exaktní teorie reálných čísel bylo završeno ve druhé polovině 19. století. Proto výzkum v právě končícím století (jehož šíři i intenzitu si v plné míře sotva uvědomujeme) již nemohl představy matematiků o reálných číslech příliš pozměnit. Přesto si zaslouží zmínku dvě skutečnosti. První z nich spočívá v tom, že se překvapivě objevila řada nových modelů reálných čísel, někdy nečekaně i v oblastech, jež jsou velmi vzdáleny od teoretické aritmetiky, matematické analýzy či topologie. 39Všimněte si, že jsme výběr čísla ε omezili na hodnoty z Q+ (místo obvyklého R+), abychom definici C-posloupností mohli podat ještě před samotnou konstrukcí modelu R. 22 JAROMÍR ŠIMŠA Zajímavým příkladem je konstrukce reálných čísel jako jistých her dvou osob, popsaná v knize [C]. Druhým významným počinem matematiků 20. století „na poli reálných čísel byla „legalizace přístupu k nekonečně malým a nekonečně velkým veličinám jako k číslům (připomeňme, že v klasické analýze se k těmto veličinám přistupuje jako k funkcím s limitou 0 resp. ∞).40 Věnujme této problematice závěr našeho příspěvku. K rozšiřování obvyklé reálné číselné osy R o další body (obrazy tzv. hyperreálných čísel) můžeme přistupovat bez obav, že se zhroutí naše představy o spojitosti a úplnosti přímky. Výsledkem této konstrukce bude jistá množina R∗ hyperreálných čísel, která není „o nic méně reálná než množina R. (Obě množiny jsou pouze produkty abstraktního lidského myšlení, existují tedy jen jako objekty matematické teorie. Od toho je třeba odlišit náš návyk, že si „ideální objekty nějaký názorným způsobem, například pomocí vhodného obrázku, představujeme.) Budeme-li chtít z našich představ o číselné ose R odvinout představy o nové číselné ose R∗ , můžeme to provést tak, že každý bod na ose R (obraz některého čísla a0) budeme považovat za „místo , kam umístíme obrazy všech hyperčísel a, které jsou k číslu a0 nekonečně blízké (bude to znamenat, že |a−a0| < ε pro každé ε ∈ R+ ). Číslo a0 pak nazveme standardní částí každého takového hyperčísla a. Základní (kladnou) jednotku nekonečně malého čísla označíme λ; její mocniny λ2 , λ3 , λ4 , . . . tvoří celou (klesající škálu) jednotek nekonečně malých čísel. Nyní konečně definujeme, z čeho se (konečné) hyperčíslo a skládá: kromě standardní části a0 je to určitý a1-násobek jednotky λ, dále určitý a2-násobek jednotky λ2 , a3-násobek jednotky λ3 , atd., přitom {ai}∞ i=0 je libovolná posloupnost reálných čísel. Zapíšeme to rovností (9.1) a = a0 + a1 · λ + a2 · λ2 + a3 · λ3 + a4 · λ4 + · · · = ∞ i=0 aiλi , která je prozatím formalismem: vypsané operace sčítání, násobení a umocnění nemají žádný aritmetický význam.41 S hyperčísly definovanými zápisy (9.1) budeme nyní operovat: součet a součin dvou hyperčísel definujeme rovnostmi (9.2) ∞ i=0 aiλi + ∞ i=0 biλi def = ∞ i=0 (ai + bi)λi , ∞ i=0 aiλi · ∞ i=0 biλi def = ∞ i=0 ciλi , kde ci = i j=0 ajbj−i. (Jsou to přirozené definice, které odpovídají operacím s mocninnými řadami proměnné λ). Uspořádání hyperčísel (9.1) zavedeme takto: řekneme, že hyper- číslo ∞ i=0 aiλi je menší než hyperčíslo ∞ i=0 biλi , je-li první nenulový člen 40Máme na mysli především práce Abrahama Robinsona (1918–1974), všeobecně považovaného za zakladatele nestandardní analýzy. 41Připomíná to postup při budování Weierstrassova modelu reálných čísel jako nekonečných dekadických zápisů, o kterém jsme se zmínili v oddíle 8. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 23 posloupnosti rozdílů {bi − ai}∞ i=0 kladný. Je zřejmé, že na speciálních hyperčíslech a0 + 0λ + 0λ2 + · · · jsou právě zavedené operace a uspořádání totožné s obvyklými operacemi a uspořádáním na příslušných reálných číslech a0. Proto každé reálné číslo a0 ztotožníme s hyperčíslem a0 + 0λ + 0λ2 + · · · . K definicím (9.2) pak připojíme obvyklou úmluvu, že v zápisech hyperčísel (9.1) můžeme členy aiλi s nulovými koeficienty ai vynechávat; formální operace v zápisech (9.1) tak získají faktický význam z definic (9.2). Příklad násobení (1 + λ)(1 − λ + λ2 − λ3 + λ4 − λ5 + · · · ) = 1 ukazuje, proč při zavedení nového druhu čísel nevystačíme s konečnými součty (9.1), chceme-li zajistit, aby k (nenulovému) hyperčíslu a = 1 + λ existovalo hyperčíslo převrácené. Situace je komplikovanější: v množině (9.1) prvek a−1 neexistuje pro žádné nenulové hyperčíslo a se zápisem (9.1) s nulovou standardní částí a0, tedy pro a tvaru amλm + am+1λm+1 + am+2λm+2 + · · · , kde am = 0 a m ≥ 1. Takové a se nazývá nekonečně malé hyperčíslo, snadno se vysvětlí, proč odpovídající nekonečně velké hyperčíslo a−1 by mělo mít zápis (9.3) b0λ−m + b1λ−m+1 + b2λ−m+2 + · · · (b0 = 0), kde {bi}∞ i=0 je vhodná posloupnost reálných čísel.42 Tak jsme se „propracovali k modelu R∗ jednoho způsobu rozšíření pole R. Jeho prvky (hyperčísla) jsou všechny zápisy (9.3), kde {bi}∞ i=0 je libovolná posloupnost reálných čísel a m je libovolné celé číslo (pro m = 0, m > 0, m < 0 jde o konečné, nekonečně velké resp. nekonečně malé hyperčíslo – nezapomeňte, že b0 = 0); sčítání, násobení a uspořádání hyperčísel (9.3) se definují analogickým způsobem, jako se dříve definovaly tyto operace s konečnými hyperčísly (9.1). Jistě sami vysvětlíte, proč například platí −4λ−1 < −5+λ < −3λ8 < 0 < 2λ−πλ5 < 2λ−3λ5 < 2− 1 2 λ2 < 1 10 λ−2 −9−λ. Není těžké ověřit, že sestrojená struktura R∗ je uspořádané pole, tzn. splňuje axiomy (A1)–(A13) z oddílu 8. Axiom (A14) však pochopitelně splněn není: například množina hyperčísel {λ, 2λ, 3λ, . . . } má za horní závory (kromě kladných nekonečně velkých hyperčísel) právě ta hyperčísla, která mají kladnou standardní část; nejmenší z takových hyperčísel zřejmě neexistuje. Sestrojené pole R∗ dokonce ani nesplňuje Archimédův princip z oddílu 3: nerovnost nλ < 1 platí pro každé přirozené n, přestože λ > 0. Dá se však poměrně snadno ukázat, že ve výše popsaném poli R∗ platí Cantorův princip o neprázdném průniku vložených intervalů a Cauchův princip o konvergenci všech C-posloupností (viz oddíl 7). Jak jsme již naznačili, existují různá uspořádaná pole R∗ (je jich dokonce nekonečně mnoho), která jsou rozšířením standardního pole R. V předchozím 42Nová hyperčísla λ−1 < λ−2 < λ−3 < . . . se stávají škálou (kladných) nekonečně velkých jednotek. 24 JAROMÍR ŠIMŠA odstavci jsme popsali příklad pole R∗ , který je z hlediska konstrukce patrně nejjednodušší; jeho nevýhody (ve srovnání s jinými modely hyperčísel) by se projevily, až bychom na jeho základě chtěli budovat nestandardní diferenciální a integrální počet: v jeho úvodu je vždy zapotřebí popsat konstrukci hyperreálných rozšíření funkcí z R do R na funkce z R∗ do R∗ . Tato konstrukce je přirozenější pro jiná, univerzálněji sestrojená pole R∗ , nežli byl náš model rozvojů (9.3). Jeden takový výhodnější model R∗ je popsán v [NNR]: každé hyperreálné číslo je v něm definováno třídou posloupností reálných čísel (k definování těchto tříd je vybrán jistý systém „významných množin indexů, tvořící strukturu zvanou filtr). Výchozí nápad celé konstrukce lze vyjádřit takto: každá posloupnost reálných čísel {xi}∞ i=1, která v R konverguje k číslu a0, je reprezentantem určitého hyperčísla a, jehož standardní část se rovná číslu a0; přitom |a − a0| je „tím menší nekonečně malé hyperčíslo, čím je konvergence xi → a0 „rychlejší . Více podrobností této teorie zde uvádět nebudeme (kromě té cenné vlastnosti, že každá posloupnost reálných čísel je v tomto modelu reprezentantem některého hyperčísla43 ), přístupnou formou je najdete vyloženy (spolu s výkladem základů příslušné nestandardní analýzy) ve zmíněné publikaci [NNR]. Na úplný závěr dodejme, že se nesplnily (a patrně nikdy nesplní) naděje některých nadšených propagátorů nestandardní analýzy z období 60. let, kteří doufali v to, že tato exaktní teorie infinitezimálních veličin vytlačí klasický výklad analýzy v ε-δ jazyce, a to alespoň z univerzitních kurzů pro budoucí matematiky-profesionály. Domnívám se, že to „zavinila nikoliv domnělá nechuť „klasicky odchovaných docentů a profesorů matematické analýzy, ale spíše obtížnost (vysoký stupeň abstrakce) teorie hyperreálných čísel: dobře zvládnout a pochopit ji může jen člověk, který práci s abstraktnějšími matematickými strukturami již přivykl (dosvědčuje to i zmínka o axiomu výběru v poslední poznámce pod čarou). Takových posluchačů v prvních ročnících fakult mnoho nemáme; je těch, co dobře rozumí reálným číslům, podstatně více? Literatura [Be] Beckman P., Historie čísla π, Academia, Praha, 1998. [B1] Bečvář J., Hrdinský věk řecké matematiky, Historie matematiky I, Sborník z 1. semináře pro vyučující na středních školách (Jevíčko, 1993), str. 20–107, JČMF, Brno, 1994. [B2] Bečvář J., Hrdinský věk řecké matematiky II, Historie matematiky II, Sborník z 2. semináře pro vyučující na středních školách (Jevíčko, 1995), str. 7–28, Prometheus, Praha, 1997. [Bou] Bourbaki N., Obščaja topologia, historické poznámky na str. 225–235 ke kapitole „Reálná čísla , Nauka, Moskva, 1969. [C] Conway J. H., On numbers and games, Academic Press, London, New York, San Francisco, 1976. [Ch] Chinčin A. J., Řetězové zlomky, Přírodovědecké nakladatelství, Praha, 1952. 43Zda je posloupnost {(−1)i}∞ i=1 reprezentantem čísla 1, nebo čísla −1, závisí při konkrétní realizaci modelu od toho, která ze dvou indexových množin {1, 3, 5, . . . } nebo {2, 4, 6, . . . } patří do zvoleného systému „významných množin, kterému říkáme filtr na množině N všech indexů. Existenci takových filtrů je možné dokázat jen s pomocí axiomu výběru. VÝVOJ PŘEDSTAV O REÁLNÝCH ČÍSLECH 25 [J] Juškevič A. P., Istorija matematiki s drevnějšich vremen do načala 19. stoletija, díl I až III, Nauka, Moskva, 1970–1972. [Kl] Klein F., Elementarmathematik vom h¨oheren Standpunkte aus erster Band, ruský překlad: Elementarnaja matematika s točki zrenija vysšej, díl 1, Nauka, Moskva, 1987. [Ku] Kuřina F., Umění vidět v matematice, SPN, Praha, 1990. [M] Matvievskaja G. I., Razvitije učenija o čisle v Evrope do 17. věka, Izdatelstvo FAN UzSSR, Taškent, 1971. [NRR] Neubrunn T., Riečan B., Riečanová Z., O nekonečne malých veličinách, Alfa, Bratislava, 1987. [R] Rychlík K., Theorie der Reellen Zahlen in Bolzano’s Handschriftlichen Nachlasse, Czechoslovak Math. J. 7 (1957), 553–567. [SchŠ] Schwabik Š., Šarmanová P., Malý průvodce historií integrálu, 6. svazek edice Dějiny matematiky, Prometheus, Praha, 1996. [Ve] Veselý J., Matematická analýza pro učitele, první a druhý díl, Matfyzpress, vydavatelství MFF UK, Praha, 1997. [V] Vít P., Řetězové zlomky, Mladá fronta, edice Škola mladých matematiků, Praha, 1982.