Fakulta Informatiky Masarykova Univerzita Matematické Základy Informatiky (FI: IBOOO) Prof. RNDr. Petr Hliněný, Ph.D. hlineny@f i.muni.cz 12. září 2016 Obsažný a dobře přístupný úvod do nezbytných formálních matematických základů moderní informatiky, doplněný řadou interaktivních cvičení v IS MU. Výukový text pro předmět IBOOO na FI MU od roku 2012, navazující zčásti na puvodní výukové texty Úvodu do Informatiky z minulých let. Verze 2.11 (2016) © 2006-2016 Petr Hliněný, FI MU. 0.1 O tomto textu a jeho studiu Vážení čtenáři, dostává se vám do rukou výukový text Matematické Základy Informatiky, který je primárně určený pro studenty stejnojmenného předmětu na FI MU Brno. Seznamuje čtenáře s několika formálními matematickými oblastmi důležitými pro úspěšné studium moderní informatiky. Náš text svým obsahem volně navazuje na původní slidy předmětu IB000 sepsané A. Kučerou do roku 2005 a rozšířené autorem v letech 2006-11 o volný text a komentáře. Od roku 2012 však byl obsah některých pasáží podstatně změněn či přímo vyměněn za nový - nejzřetelnější změnou je zahrnutí úvodu do teorie grafů. Mimo textu samotného (jak jej zde vidíte) jsou z téhož zdoje vytvářeny i přednáškové slidy předmětu, které najdete například v IS MU. Slidy však pochopitelně obsahují jen část textu a jsou jinak formátovány. Učební text je psán strukturovaným matematickým přístupem, s velkým důrazem na přesnost a formalitu vyjadřování v nutných partiích. Na druhou stranu jsou strohá matematická vyjádření pokud možno doplněna obsáhlými neformálními komentáři, které mají studentům ulehčit pochopení látky. V žádném případě však čtenáři nemají zaměňovat neformální komentáře za matematické definice - v případě nejasností vždy platí to, co přesně říká formální definice. Interaktivní osnova http://is.muni.cz/el/1433/podzim2016/IB000/index.qwarp Nedílnou součástí celého výukového textu jsou interaktivní osnova předmětu IB000 v IS MU a z ní odkazované online odpovědníky sloužící k procvičování probrané látky na jednoduchých i složitějších příkladech. To je také důvod, proč tento text obsahuje jen poskrovnu řešených příkladů k probírané látce; od každého studenta očekáváme, že si látku bude procvičovat online na zmíněných odpovědnících, obsahujících až tisíce příkladů desítek typů. K praktickému pochopení přednesených znalostí i k jejich budoucím aplikacím je takové procvičení nezbytné(l). V návaznosti na tyto odpovědníky doporučujeme studentům diskutovat o probírané látce a svých (ne)úspěších s cvičícími předmětu i na předmětovém diskuzním fóru v IS. ii Obsah 0.1 O tomto textu a jeho studiu......................... ii 1 Základní formalismy matematiky 1 1.1 Úvod do matematického dokazovaní..................... 1 1.2 Význam matematických tvrzení....................... 3 1.3 Tvoření matematických důkazů....................... 4 1.4 Výroky a základ logiky............................ 6 1.5 Střípky matematické logiky ......................... 7 2 Důkazové techniky, Indukce 14 2.1 Přehled základních důkazových technik................... 14 2.2 Věty typu „tehdy a jen tehdy"........................ 16 2.3 Matematická indukce............................. 17 2.4 Komentáře k matematické indukci...................... 19 3 Množiny a množinové operace 22 3.1 Pojem množiny................................ 22 3.2 Množinové operace.............................. 23 3.3 Porovnávání a určení množin ........................ 26 3.4 Posloupnosti a rekurentní vztahy...................... 28 4 Relace a jejich použití 30 4.1 Relace a funkce nad množinami....................... 30 4.2 Reprezentace konečných relací........................ 32 4.3 Vlastnosti binárních relací.......................... 33 4.4 Inverzní relace a skládání relací....................... 35 4.5 Skládání relací „v praxi''........................... 36 5 Ekvivalence, Uspořádané množiny 39 5.1 Relace ekvivalence .............................. 39 5.2 Rozklady a jejich vztah k ekvivalencím................... 40 5.3 Uspořádání a uspořádané množiny ..................... 41 5.4 Další pojmy uspořádaných množin ..................... 44 5.5 Relace předuspořádání............................ 46 6 Funkce a skládání, Induktivní definice 49 6.1 Vlastnosti funkcí............................... 49 6.2 Skládání funkcí, permutace.......................... 51 6.3 Induktivní definice množin a funkcí..................... 53 6.4 Uzávěry relací................................. 57 7 Pojem grafu 60 7.1 Definice grafu................................. 60 7.2 Podgrafy a Isomorfismus........................... 63 7.3 Souvislost grafů, komponenty........................ 67 7.4 Stromy - grafy bez kružnic.......................... 69 7.5 Dodatek: 7 mostů jedním taliem....................... 70 iii 7.6 Příklady použití grafů ............................ 72 8 Procházení a zpracování grafů 75 8.1 Jak obecně projít souvislý graf........................ 75 8.2 Vzdálenost v grafu.............................. 78 8.3 Hledání nejkratší cesty............................ 79 8.4 Problém minimální kostry.......................... 82 9 Orientované grafy, Toky v sítích 86 9.1 Základní pojmy orientovaných grafů..................... 86 9.2 Definice sítě a toku.............................. 89 9.3 Nalezení maximálního toku ......................... 90 9.4 Zobecněné použití sítí ............................ 94 10 Formalizace a důkazy pro algoritmy 98 10.1 Formální popis algoritmu........................... 98 10.2 O „správnosti" a dokazování programů................... 100 10.3 Rekurzivní algoritmy............................. 102 10.4 Přehled technik důkazu indukcí....................... 103 10.5 Dodatek: Zajímavé algoritmy aritmetiky.................. 106 11 Nekonečné množiny, Zastavení algoritmu 109 11.1 O nekonečných množinách a kardinalitě................... 109 11.2 „Naivní" množinové paradoxy........................ 111 11.3 Algoritmická neřešitelnost problému zastavení............... 113 iv 1 Základní formalismy matematiky Úvod Začneme nejprve několika obecnými poznámkami ke smyslu a směřování celého našeho předmětu: Jak sami poznáte, studium informatiky neznamená jen „naučit se nějaký programovací jazyk", nýbrž zahrnuje celý soubor dalších relevantních předmětů, mezi nimiž najdeme i matematicko-teoretické (formální) základy moderní informatiky Právě odborný nadhled nad celou informatikou včetně nezbytné formální teorie nejspíše odliší „řadového programátora", kterých jsou dnes spousty i bez VS vzdělání, od skutečného a mnohem lépe placeného iformatického experta. A na tomto místě přichází náš odborný předmět Matematické Základy Informatiky, který vás právě na studium formálních základů moderní informatiky připraví. Výklad začínáme poněkud zostra - zdůrazněním přesného matematického vyjadřování, výrokovou logikou a principy logických úsudků a matematických důkazů. Nelekejte se však hned a s chutí se dejte do studia, po překonání prvotního šoku to nebude až tak obtížné. .. Cíle Prvním cílem této lekce je rozebrat struktury matematických tvrzení (vět) a jejich formálních důkazů. V druhé řadě se naučíte chápat smysl matematických vyjádření formálním pohledem výrokové logiky a pracovat s touto formalizací, včetně základního pochopení významu kvantifikace. 1.1 Uvod do matematického dokazování Matematika (a tudíž i teoretická informatika jako její součást) se vyznačuje velmi přísnými formálními požadavky na korektnost argumentace. Takto korektně postavená argumentace vede od přijatých předpokladů v elementárních krocích směrem k požadovanému závěru (a nikdy ne naopak!). Definice 1.1. Matematický důkaz . Uvažme matematickou větu (neboli tvrzení) tvaru „Jestliže platí předpoklady, pak platí závěr". Důkaz této věty je konečná posloupnost tvrzení, kde • každé tvrzení je buď * předpoklad, nebo * obecně přijatá „pravda" - axiom, nebo * plyne z předchozích a dříve dokázaných tvrzení podle nějakého „akceptovaného" logického principu - odvozovacího pravidla; • poslední tvrzení je závěr. Komentář: O potřebné úrovni formality matematických důkazů a o běžných důkazových technikách se dozvíme dále v této a příští lekci. Pro úplný začátek si jen celou problematiku uvedeme názornými ukázkami. Ctěte si tyto ukázky pečlivě, i pokud jste se již s matematickým dokazováním setkali a (či nebo) vám následující příklady připadají zcela primitivní. Později, u složitějších důkazů, se právě k takovým jednoduchým ukázkám můžete vracet a lépe na nich pochopit, jak to správně v matematice „chodí". 1 Příklad 1.2. Uvažujme následující matematické tvrzení (které jistě už znáte). Věta. Jestliže x je součtem dvou lichých čísel, pak x je sudé. Poznámka pro připomenutí: - Sudé číslo je celé číslo dělitelné 2, tj. tvaru 2k. - Liché číslo je celé číslo nedělitelné 2, tj. tvaru 2k + 1. Důkaz postupuje v následujících formálních krocích: tvrzení zdůvodnění 1) a = 2k-\ - 1, k celé předpoklad 2) b = 21 + 1, / celé předpoklad 3) X = a + b = 2k + 21 + H h 1 z 1,2) a komutativity sčítání (axiom) 4) X = 2(k + 0 + 2-1 ze 3) a distributivnosti násobení (axiom 5) X = 2(k + / + 1) ze 4) a opět distributivnosti násobení 6) X = 2m, m celé z5)am = fc + í+ lje celé číslo (axiom Příklad 1.3. Dokažte následující tvrzení: Věta. Jestliže x a y jsou racionální čísla pro která platí x < y, pak existuje racionální číslo z pro které platí x < z < y. Důkaz po krocích (s již trochu méně formálním zápisem) zní: 1) Nechť z = ^=x + ^=y-^. 2) Číslo z je racionální, neboť x a, y jsou racionální. 3) Platí z > x, neboť ^ > 0. 4) Dále platí z < y, neboť opět > 0. 5) Celkem x < z < y. Jak čtenář asi sám vidí, tento strohý formální zápis (i když matematicky kompletní) si zaslouží alespoň krátký vysvětlující komentář. Takový komentář, ať už se objeví před nebo hned po formálních argumentech, sice není součástí důkazu samotného, velmi však napomáhá správnému pochopení a má své nezastupitelné místo. Nezapomínejte na to ve svých vlastních budoucích matematických důkazech. Konkrétně v tomto příkladě je velmi vhodné poznamenat, že klíčový krok (1) popisuje námi vymyšlenou (prostě uhodnutou) algebraickou konstrukci, která vede k požadovanému číslu z. Zbylé kroky (2-5) pak jen snadno zdůvodňují, že nalezené z má všechny požadované vlastnosti. □ Poznámka. Alternativní matematické formulace Věty z Příkladu 1.3 mohou znít: - Pro každé x, y G Q, kde x < y, existuje z G Q takové, že x < z < y. - Množina racionálních čísel je hustá. 2 1.2 Význam matematických tvrzení První krok formálního důkazu je uvědomit si, co tvrdí věta, která se má dokázat; tedy co je předpoklad a co závěr dokazovaného tvrzení. Pravdivost takového tvrzení pak je třeba chápat v následujícím významu: Pro každou situaci, ve které jsou splněny všechny předpoklady, (*) je platný i závěr tvrzení. Komentář: Příklady běžné formulace matematických vět: * Konečná množina má konečně mnoho podmnožin. * sin2(a) + cos2(a) = 1. * Graf je rovinný, jestliže neobsahuje podrozdělení K5 nebo K^^. Co přesně nám uvedené matematické věty říkají? Všimněme si, že mnohdy jsou některé „samozřejmé" předpoklady vět vynechány, například, že a ve druhém bodě je úhel, nebo se tvrzení implicitně odvolávají na obecně známé definice, například, co je to graf K5 ve třetím bodě. Často nám k lepšímu pochopení toho, co je tvrzeno a je třeba dokázat, pomůže pouhé rozepsání definic pojmů, které se v dané větě vyskytují. O pravdivosti implikace Matematická tvrzení jsou často tzv. složená („platí ... a/nebo ... ") a v tom případě je třeba umět správně vyvodit celkovou platnost z platnosti jednotlivých elementů. Tomuto se budeme věnovat přesněji v Oddíle 1.5, ale již nyní je potřeba se zamyslet a správně pochopit, jaký je logický význam matematického tvrzení vysloveného typicky formou implikace („jestliže ..., pak ... "). Z předchozího (*) totiž vyplývá, že pokud předpoklady nejsou splněny nebo jsou sporné, tak celé tvrzení je platné bez ohledu na pravdivost závěru! Příklad 1.4. Je pravdivé následující matematické tvrzení? Věta. Mějme dvě kuličky, červenou a modrou. Jestliže červená kulička je těžší než modrá a zároveň je modrá kulička těžší než ta červená, tak jsou obě kuličky ve skutečnosti zelené. „ To přece nemůže být pravda, jak může být jedna kulička těžší než druhá a naopak zároveň? Jak mohou být nakonec obě zelené? To je celé nějaká blbost... " Ano, výše uvedené jsou typické laické reakce na uvedenou větu. Přesto však tato věta pravdivá je! Stačí se vrátit o kousek výše ke kritériu - Pro každou situaci, ve které jsou splněny všechny předpoklady je platný i závěr tvrzení - které je zjevně naplněno. Nenaleznete totiž situaci, ve které by byly splněny oba předpoklady zároveň, a tudíž ve všech takových neexistujících situacích si můžete říkat cokoliv, třeba že kuličky jsou zelené. □ Příklad 1.5. Anna a Klára přišly na přednášku a usadily se do lavic. Proč je pravdivé toto matematické tvrzení? Věta. Jestliže Anna sedí v první řadě lavic a zároveň Anna sedí v poslední řadě lavic, tak Klára nesedí ve druhé řadě lavic. 3 Opět je třeba se hluboce zamyslet nad významem předpokladů a závěru, ale tentokrát není situace předpokladů tak triviálně sporná, jako v Příkladu 1.4. Kdy tedy nastávají oba předpoklady zároveň? Když první řada lavic je zároveň řadou poslední. Neboli posluchárna má jen (nejvýše) jednu řadu lavic a Klára tudíž v druhé řadě nemůže sedět. Důkaz je hotov. □ 1.3 Tvoření matematických důkazů V předchozím jsme viděli několik různorodých ukázek matematických důkazů, od zcela formálního přístupu po velmi uvolněný text. Přirozenou otázkou teď je, jak „moc formální" mají správné matematické důkazy vlastně být? • Záleží, komu je důkaz určen — konzument musí být schopen „snadno" ověřit korektnost každého tvrzení v důkazu a plně pochopit, z čeho vyplývá. • Je tedy hlavně na vás zvolit tu správnou úroveň formálnosti zápisu vět i důkazů podle situace. • Avšak vůbec neplatí, že čím více formálních matematických symbolů v důkaze použijete místo běžného jazyka, tím by byl důkaz přesnější - často bývá výsledek právě opačný. A jak na ten správný matematický důkaz máme přijít? • No..., nalézání matematických důkazů je tvůrčí činnost, která není vůbec snadná a jako taková vyžaduje tvůrčí (přímo „umělecké") matematické vlohy. Přesto se jí alespoň trochu musíte přiučit. Dokazovat či vyvracet tvrzení? Představme si, že našim úkolem je rozhodnout platnost matematického tvrzení. Neboli nám není řečeno, že tvrzení platí, ale mohou nastat obě možnosti platí / neplatí. Jak pak matematicky správně zdůvodníme nalezenou odpověď? • Záleží na odpovědi samotné... Pokud je to ANO (platí), prostě podáme důkaz tvrzení podle výše uvedených zvyklostí. Pokud je odpověď NE, tak naopak podáme důkaz negace daného tvrzení. Poměrně častým případem je matematická věta T, která tvrdí nějaký závěr pro širokou oblast vstupních možností. Potom je postup následující: • Pokud T platí, nezbývá než podat vyčerpávající důkaz platnosti pro všechny vstupy. • Avšak pokud T je nepravdivá, stačí uhodnout vhodný vstupní protipříklad a jen pro něj dokázat, že závěr tvrzení není platný. Komentář: Již podruhé (po Příkladu 1.3) se dostáváme k fenoménu „uhodnutí" některé součásti důkazu. Jak se k němu máme stavět (je to vůbec dovoleno udělat)? Ale ano, pokud váš důkaz bude matematicky správný, nikdo nebude namítat, že jste v něm něco jen šťastně uhodli. V takovém správném „uhodnutí" věcí právě spočívá ta zmíněná tvůrčí stránka vytváření matematických důkazů. A nyní se znovu vraťte na začátek Oddílu 1.2 a srovnejte si výše uvedené se základními poznatky o významu matematických vět... 4 Příklad 1.6. Rozhodněte platnost následujícího tvrzení: Pro všechna reálná x platí x2 + 3x + 2 > O . Důkaz: Standardními algebraickými postupy si můžeme upravit vztah na x2 + 3x + 2 = (x + 1) • {x + 2) > 0. Co nám z něj vyplývá? Například to, že k porušení daného tvrzení stačí volit x tak, aby jedna ze závorek byla kladná a druhá záporná. To nastane třeba pro x = — |. Pro vyvrácení tvrzení nám tedy stačí začít volbou protipříkladu x = — | (není nutno zdůvodňovat, jak jsme jej „uhodli"!) a následně dokázat úpravou x2 + 3;r + 2 = (;r + 1).(;r + 2) = (_3 + 1).(_3+2) = (_l)_(+l) = _l 0. v-v-' 2n_1 n2 Jelikož je toto číslo (pravděpodobnost) pro n > 7 menší než 1, bude existovat obarvení bez jednobarevných zvolených podmnožin. □ Komentář: Zkuste si sami v obou posledních příkladech přijít s konstruktivním důkazem, tj. takovým, který hledané řešení sestrojí. Pokud se vám to povede, budete skutečně dobří (a možná také bohatí)... 1.4 Výroky a základ logiky Důležitým „pevným mostem" mezi běžnou mluvou a přesným matematickým formalismem je následující pojem výroku. Jeho správné uchopení nám pomůže při chápání významu matematických výroků a v práci s nimi (mimo bezprostřední ukázky se třeba podívejte na mechanický postup negace složeného výroku v závěru lekce). To je úkolem tohoto oddílu. Definice 1.9. Výrok v přirozené mluvě: V běžné mluvě za výrok považujeme (každé) tvrzení, o kterém má smysl platně prohlásit, že je buď pravdivé nebo nepravdivé. Komentář: Ukážeme si několik příkladů - které z nich jsou výroky? * Dnes už v Brně pršelo. * Předmět FI: IB000 se vyučuje v prvním ročníku. * Platí 2 + 3 = 6. * To je bez problémů. (Co?) * Platí x > 3. * Pro každé celé číslo x platí, že x > 3. Všimněte si, že pravdivost výroku by mělo být možné rozhodnout bez skrytých souvislostí (kontextu), a proto čtvrtý a pátý příklad za výroky nepovažujeme. Poslední příklad již zase výrokem je, neboť obor hodnot x je jednoznačně vymezen tzv. kvantifikací. Z více jednoduchých výroků vytváříme výroky složitější pomocí tzv. logických spojek. Komentář: Následuje několik dalších příkladů. * Množina {a, b} má více než jeden prvek a není nekonečná. * Jestliže Karel váží přes 90 kg, nejedu s ním výtahem. * Jestliže má tato kráva 10 nohou, pak mají všechny domy modrou střechu. Zastavme se na chvíli nad posledním výrokem. Co nám říká? Je pravdivý? Skutečně mají všechny domy modrou střechu a před námi stojí kráva s 10 nohama? (Ano, výrok je pravdivý, viz definice či pravdivostní tabulka implikace.) Schopnost porozumět podobným větám je součást lidského způsobu uvažování a z tohoto hlediska nemá přímou souvislost s matematikou (je to „přirozená logika"). Formálni (matematická) logika pak v podobném duchu definuje jazyk matematiky a přitom odstraňuje nejednoznačnosti přirozeného jazyka. 6 Ukázka formální práce s výroky Jako příklad užitečnosti matematické formalizace slovních výroků si rozebereme následující logickou „hádanku", navazující na téma Příkladu 1.5. Příklad 1.10. Mějme trojici studentů X,Y,Z sedících v posluchárně na přednášce IB000 takových, že pro ně platí: a) X sedí v první řadě, b) Y sedí v řadě hned za X, c) Z sedí ve stejné řadě jako Y, d) Z sedí ve druhé řadě. Věta. Jestliže zároveň platí (a),(b),(c),(d), pak student Z sedí ve druhé řadě. Tvrzení je samozřejmě triviální díky předpokladu (d), avšak úkolem je zjistit, jaké všechny minimální výběry z předpokladů (a),(b),(c),(d) ještě zajistí platnost uvedeného tvrzení. Pro začátek osvětlíme (blíže viz Oddíl 5.4) význam slova minimální, kdy je myšlen výběr předpokladů takový, že odebráním libovolného z nich již platnost uvedeného tvrzení „Z sedí ve druhé řadě" bude porušena. Okamžitou odpovědí je samotný předpoklad (d), který je zřejmě minimální (bez předpokladů si může Z sednout i do první řady) a dostačující. Je to však úplná odpověď, nebo lze vybrat i jiné minimální předpoklady? Ano, ještě lze vybírat jinak - po vynechání (d) stále postačuje kombinace předpokladů (a),(b),(c) k vyslovení závěru „Z sedí ve druhé řadě" (je to jasné?). Na druhou stranu, pokud kterýkoliv z (a),(b),(c) vynecháme, rozebráním těchto tří možností najdeme platná rozesazení, při kterých Z v druhé řadě nebude, takže se opět jedná o výběr minimální. Například pokud vynecháme (b), může Y sedět v první řadě spolu s X a stejně tak Z. Dořešte si sami zbylé dvě možnosti. Pozor, ještě k úplnému vyřešení úlohy zbývá poslední důležitý krok - zdůvodnit, proč žádný jiný minimální výběr předpokladů úloze nevyhovuje. Zde je třeba rozebrat možnosti: Pokud náš hypotetický jiný výběr předpokladů obsahuje (d), pak nebude minimální, neboť lze odebrat cokoliv jiného, pokud (d) zůstane. Naopak výběr neobsahující (d) musí podle výše uvedeného obsahovat všechny (a),(b),(c), neboť jinak není dostačující. A tím jsme hotovi; všechny minimální výběry řešící úlohu jsou dva, (a),(b),(c) a samotné (d). □ 1.5 Střípky matematické logiky Všimněte si, že podle Definice 1.9 každému výroku běžné mluvy prostě můžeme přiřadit logickou hodnotu 0 (falše) nebo 1 (true) a dále se nestarat o jazykový význam... Proto jazykové výroky v matematice můžeme nahradit výrokovými proměnnými, které značíme velkými písmeny A, B, C,... a přiřadíme jim hodnotu 0 nebo 1. Definice: Výroková formule (značíme ip, o, ip,...) vzniká z výrokových proměnných pomocí závorek a logických spojek -i negace a =^ implikace. Zároveň používáme v zápise následujících zkratek * y? V ip (disjunkce/„nebo") je jiný zápis formule ~np =^ ip, * íp A ip (konjunkce/„a") je jiný zápis formule ~l(~"f V -- ip) A (ip =^ B) => C nebo A => (B => C)l Matematický význam logickým formulím pak dodává následující definice. Definice 1.11. Sémantika (význam) výrokové logiky. Nechť valuace (ohodnocení) je funkce v : Prom —> {0,1} na všech (dotčených) výrokových proměnných. Pro každou valuaci v definujeme funkci Sv(o), vyhodnocení^formule o", induktivně (tj. po krocích) takto: * SV(A) = v(A) pro každé A G Prom. Poznámka: Tento předpis (Def. 1.11) podává nejen deňnici funkce Sv, ale také návod na to, jak ji pro daný argument vypočítat. Pro odvozené logické spojky disjunkce, konjunkce a ekvivalence dostaneme následující zcela přirozený výsledek (což potvrzuje, že jsme definici sémantiky zvolili správně). Tvrzení 1.12. Přímým důsledkem Definice 1.11 a zkratek V 7 za ~np =^ ip, 7\ 7 za -i(-iy?V -iip) a '-^7 za (ip =^ ip) A (ip =^ íp), je následovné: * Sv(ip V ip) = 1 právě když Sv(ip) = 1 nebo Sv(ip) = 1. * Sv(íp A ip) = 1 právě když Sv(íp) = 1 a současně Su(ip) = 1. * Sv(íp <=ř ip) = 1 právě když platí jedna z následujících podmínek - Sv(ip) = 1 a současně Su(i(j) = 1, - Sv(ip) = 0 a současně Su(i(j) = 0. Pravdivostní tabulky V praxi často vyhodnocení Sv logické výrokové formule zapisujeme do tzv. pravdivostní tabulky. Tato tabulka typicky má sloupce pro jednotlivé proměnné, případné „mezifor-mule" (pomůcka pro snazší vyplnění) a výslednou formuli. Řádků je 2P (počet valuaci), kde p je počet použitých proměnných. Pro naše účely postačí uvést pravdivostní tabulku instruktážním příkladem. Čtenáři nechť si vyplní podle Definice 1.11 vlastní pravdivostní tabulky dalších výrokových formulí, viz také příslušné cvičné odpovědníky v IS MU. Správně A, (A)=>(B), A^B, ^A^B, AVBV^C 0 jestliže Sv(ip) = 1 a Sv(ip) = 0; 8 Příklad 1.13. Jaká je pravdivostní tabulka pro formuli (A=^ B)\J B \J C? A B c A ^5 (yl^5)V5VC 0 0 0 1 1 0 1 0 1 1 1 0 0 0 0 1 1 0 1 1 0 0 1 1 1 0 1 1 1 1 1 0 1 0 1 1 1 1 1 1 Splnitelnost formulí a tautologie Definice: Formule ip G $ je splnitelná, pokud pro některou valuaci v platí, že Sv(íp) = 1. Formule je nesplnitelná (říká se také kontradikce), pokud není splnitelnáFormule 9? G $ je vždy pravdivá, neboli výroková tautologie, psáno |= ip, pokud pro každou valuaci v platí, že Sv{ip) = 1. Řekneme, že dvě formule íp,i(j G $ jsou ekvivalentní, právě když |= 99 ■0. Tvrzení 1.14. Následující formule jsou tautologiemi: AV ^A (A A (A 4- 5)) 5 (-.£ ^ (A ^ 5) (-.A 4 (BA -.£)) A Komentář: Jak poznáme tautologii v pravdivostní tabulce? Snadno, v posledním sloupci jsou samé hodnoty 1. Kvantifikace a predikátová logika Výše popsaná výroková logika je velmi omezená faktem, že každý výrok musí být (tzv. absolutně) vyhodnocen jako pravda nebo nepravda. Co když však chceme zpracovat tvrzení typu „den D v Brně pršelo"? Jeho pravdivostní hodnota přece závisí na tom, co dosadíme za den D, a tudíž jej nelze považovat za výrok výrokové logiky. • Predikátová logika pracuje s predikáty. Predikáty jsou „parametrizované výroky", které jsou buď pravdivé nebo nepravdivé pro každou konkrétní volbu parametrů. Výrokové proměnné lze chápat jako predikáty bez parametrů. • Predikátová logika je tak obecnější než logika výroková; každá formule výrokové logiky je i formulí predikátové logiky, ale ne obráceně. Komentář: Pro neformální přiblížení si uvedeme několik ukázek predikátů: * x > 3 (parametrem je zde iěR), * čísla x a y jsou nesoudělná (parametry x, y E N), 9 * obecně jsou predikáty psány P(x,y), kde x,y jsou libovolné parametry. Definice: Z predikátů lze vytvářet predikátové formule pomocí už známých (viz Definice 1.11) výrokových spojek a následujících tzv. kvantifikátorů: • \/x. ip „pro každou volbu parametru x platí formule 9?" nebo jinak řečeno „pro všechna/kterékoliv x platí formule 99", • 3x . ip „existuje alespoň jedna volba parametru x, pro kterou platí 9?" nebo jinak řečeno „pro nějaké x platí formule 99". Komentář: Pozorného čtenáře napadne, ze které množiny že „volíme parametr x"? To je v matematické logice obvykle implicitní (řečeno mimo samotnou formuli) a platí pro všechny kvantifikátory formule stejně. Může to být možná trochu v rozporu s tím, co jste se učili dříve, ale má to své dobré formální důvody. Čtenář by měl v tomto místě vzít na vědomí, že naše definice vztahující se k predikátové logice jsou velmi velmi zjednodušené a nenahrazují kurz matematické logiky! Přesto poskytnou alespoň základní povědomí o této problematice (a hlavně o použití kvantifikace v tvrzeních) pro potřeby matematické formalizace v našem kurzu. Jedním z nej důležitějších poznatků k pochopení je, kdy lze určit pravdivostní hodnotu predikátové formule: Fakt: Je-li každá proměnná - parametr predikátu - v dané formuli kvantifikovaná (tj. formule je uzavřená), pak je celá formule buď pravdivá nebo nepravdivá. Příklad 1.15. Ukažme si vyjádření následujících slovních výroků uzavřenými formulemi v predikátové logice: • Každé prvočíslo větší než 2 je liché; VneN. [(Pr(n)An>2) Li(n)], přičemž lze rozepsat Li(n) = 3k G N. n = 2k + 1. Predikát Pr(n) vyjadřuje fakt, že n je prvočíslem. • Každé celé číslo n > 1, které není prvočíslem, je dělitelné nějakým celým číslem y kde n Ý y a y > 1; VnGZ. (n > 1 A -iPr(n)) 3y E Z(y\n A n^y A y>l). Poznámka: V tomto předmětu počítáme 0 za přirozené číslo. Jak na kvantifikátory Používání kvantifikátorů si neformálně přiblížíme pár příklady. Na jednu stranu je (asi) význam použití jednotlivého všeobecného či existenčního kvantifikátoru zřejmý z výše uvedeného popisu, na druhou stranu už tak jednoduché není kombinování více kvantifikátorů v jednom tvrzení. Podívejme se třeba na následující ukázku: 10 Příklad 1.16. Proč na pořadí kvantifíkátorů velmi záleží: • Pro každého studenta A v posluchárně platí, že existuje student B v posluchárně takový, že A je kamarád B. • Existuje student B v posluchárně, že pro každého studenta A v posluchárně platí, že A je kamarád B. Vidíte ten propastný rozdíl ve významech uvedených dvou uzavřených predikátových formulí? Přitom jsme jen syntakticky zaměnili pořadí kvantifikace A a B. □ Druhý, již složitější příklad, nám ukazuje, že kvantifikátory potkáme (skrytě) i v situacích, kde na první syntaktický pohled žádná kvantifikace není. Příklad 1.17. Pepíček si přinesl ze školy domácí úkol z matematiky: Pro dané a = 3, b = 4, c = 5 vypočtěte hodnotu výrazu (a + c — 5)(G + 3) — b. Bohužel, jak vidíte, udělal do zadání kaňku # a teď neví, zda pod kaňkou bylo písmeno a, b nebo c. „To je ale smůla", řekl si Pepíček, „můj příklad teď nemohu jednoznačně vypočítat. Přitom by stačilo změnit v zadání jen jednu z hodnot a, b nebo c a ten příklad by už měl jednoznačné řešení i s tou mou nešťastnou kaňkou!". Vysvětlete a zdůvodněte, co tímto Pepíček myslel. V příkladě jsou dvě roviny, ve kterých musíme argumentovat. Za prvé, že pro uvedené zadání domácího úkolu existují dvě (alespoň) přiřazení symbolu z a, b, c kaňce taková, že výsledné hodnoty budou různé. To je snadno vidět, třeba pro b na místě kaňky vypočítáme hodnotu 17, kdežto pro c na místě kaňky vypočítáme 20. Takže Pepíček opravdu nemohl zadaný úkol jednoznačně vyřešit. Ve druhé rovině je našim úkolem najít a ověřit, že existuje změna hodnoty jednoho z a,b,c taková, že pro každé přiřazení symbolu z a,b,c kaňce v domácím úkolu vyjde výsledná hodnota výrazu stejně. Potom jednoznačné řešení existuje i s kaňkou a chytrý Pepíček jej najde. Takových vhodných změn je dokonce více, například „c = 5" změníme liti yjC 2 Cl hodnota výrazu vyjde 0 • (© + 3) — 4 = —4 bez ohledu na to, co se skrývá pod kaňkou. Vidíte, jak důležité bylo v našem řešení pochopit a explicitně vyjádřit skryté kvantifikátory Pepíčkových úvah? Zbytek pak už šel docela snadno. □ Normální tvar formulí s negací Závěrem lekce se dostáváme k jednomu specifickému úskalí chápání přirozené logiky, totiž že přesný význam tvrzení se zanořenými negacemi (není pravda, že ...) je někdy skutečně obtížné pochopit.Co například říká následující? „Není pravda, že nemohu neříct, že není pravda, že tě nemám nerad." Výrokové formule se proto pro lepší pochopení obvykle prezentují v tzv. normálním tvaru, ve kterém se negace zanořených podformulí nevyskytují, formálně: Definice: Formule ip G $ je v normálním tvaru, pokud se v ní operátor negace aplikuje pouze na výrokové proměnné. 11 Komentář: Pro ilustraci, k formuli -<(A =4> B) je ekvivalentní A A -((A B) =4> C) je ekvivalentní (A =4> B) A _,C). Co však můžeme tvrdit v obecnosti pro libovolnou formuli? Tvrzení 1.18. Každou výrokovou formuli lze převést do normálního tvaru, pokud k =^ povolíme i užívání odvozených spojek A a V. Komentář: Například, pokud přijmeme přirozené pravidlo dvojí negace (|= -i —*A 4^ A), tak výše napsanou větu si převedeme na lépe srozumitelný tvar: „Nemusím říct, že tě mám nerad." Podobné převody složitých tvrzení tvaru „není pravda, že ..." na normální tvar je ale velmi obtížné dělat z hlavy, a proto je výhodné si ukázat čistě mechanický formální postup, který bez velké duševní námahy funguje vždy. Důkaz Tvrzení 1.18 pak přímo vyplývá z jednoduchého mechanického postupu převodu formulí do normálního tvaru popsaného v Metodě 1.19, která tvoří závěr našeho oddílu o matematické logice. Metoda 1.19. Převod formule ip do normálního tvaru F(íp). Pro převod použijeme funktory T a Q s neformálním významem F(X) jako „je pravda, že X" a Q(X) jako „nenípravda, že X". Tyto funktory definujeme induktivními předpisy následovně: F{A) = A Q (A) = ->A Fhv) = G{v) <7(->y?) = Hv) j^v ~^(B V -|(C => —iA))). Užitím uvedeného postupu Metody 1.19 získáme: F(->(A => ->(B V -i(C => - -"A))) = A A F(B V -i(C => -*A)) AA(J(5)VJHC^nA))) = AA{Bvg{C^^A)) A A(B V (F(C) A g(-iA))) = A A {B V {C A F{A))) A A {B V (C A A)) Formuli A A (B V (C A A)) lze dále zjednodušit na ekvivalentní formuli A A (B V C). To ale je již z našeho pohledu matematicky neformální (heuristický) postup. Navazující studium Látka této úvodní lekce má velmi široký záběr. S potřebou formálního zápisu tvrzení a důkazů se setkáte nejen v tomto, ale i ve všech dalších matematických předmětech, které 12 zároveň studujete či budete studovat, a principy budou stále stejné. Proto se je snažte pochopit a zažít už na zde uvedených jednoduchých příkladech a vše si procvičte. A pokud vám stále „jde hlava kolem" z logického matematického vyjadřování, můžete se také zkusit podívat na hezkou úvodní (středoškolskou) knížku Antonína Sochora - Logika pro všechny ochotné myslet, Karolinum 2011. Na druhou stranu je matematická logika v této lekci uvedena jen velmi omezeně na nejlehčí akceptovatelné intuitivní úrovni a její další rozvoj je ponechán samostatným kurzům. Na FI MU to bude navazující předmět IB101 Úvod do logiky. Zájemce o studium matematických hlubin logiky a třeba slavných Gódelových poznatků můžeme později odkázat na předmět MA007 Matematická logika. 13 2 Důkazové techniky, Indukce Úvod Náš hlubší úvod do matematických formalismů pro informatiku pokračujeme základním přehledem technik matematických důkazů. Pro vysvětlení, z Lekce 1 sice víme, že matematický důkaz má jednotnou formu Defínice 1.1, ale nyní se budeme věnovat takříkajíc šablonám, podle nichž můžeme (snadněji) korektní důkaz sestavit. Třebaže matematické dokazování a příslušné techniky mohou někomu připadat neprůhledné (a zpočátku možná zbytečné), jejich pochopení a zvládnutí není samoúčelné, neboť nám pomáhá si mnoho uvědomit o studovaných problémech samotných. Konečně, jak si můžeme být jisti svými poznatky, když bychom pro ně nebyli schopni poskytnout důkazy? Během studia tohoto předmětu poznáte (a ti méně šťastní až s překvapením u zkoušky), že podstata toho, k čemu naším výkladem směřujeme, se dá neformálně shrnout slovy „ naučit se přesně vyjadřovat a být si svými tvrzeními naprosto jisti" a analogicky později „naučit se navrhovat správné algoritmy a být si i svými programy naprosto jisti". Z důkazových postupů je pro informatiky asi nejdůležitější technika důkazů matematickou indukcí, která je svou podstatou velmi blízká počítačovým programům (coby iterace cyklů). V dalším výkladu budeme indukci hojně využívat, především v Lekcích 6 a 10. Cíle Cílem této lekce je popsat základní techniky matematických důkazů, z nichž největší důraz klademe na matematickou indukci. Každý student by se měl alespoň naučit formálně psané důkazy číst a pochopit, nejlépe i sám dokázat jednoduché důkazy tvořit. 2.1 Přehled základních důkazových technik V matematice je často používaných několik následujících způsobů - technik, jak k danému tvrzení sestavit korektní formální důkaz. (Uvědomme si, že jedno tvrzení mívá mnoho různých, stejně korektních důkazů; ty se však mohou výrazně lišit svou složitostí a čitelností. Uváděné techniky nám pomohou najít důkaz co nejjednodušší.) Tyto techniky si v bodech shrneme zde: • Přímé odvození. To je způsob, o kterém jsme se dosud bavili. Komentář: Postupujeme přímo od předpokladů k závěru, což vypadá nejpřirozeněji, ale sami poznáte, že taková „přímá" cesta bývá obtížně k nalezení. • Kontmpozíce (také obrácením či nepřímý důkaz). Místo věty „Jestliže platí předpoklady, pak platí závěr." budeme dokazovat ekvivalentní větu „Jestliže neplatí závěr, pak neplatí alespoň jeden z předpokladům Komentář: Na rozdíl od přímého odvození se obvykle lépe hledá cesta „pozpátku", určitě toto znáte například z hledání cest v dětských bludištích. • Důkaz sporem. Místo věty „Jestliže platí předpoklady, pak platí závěr." budeme dokazovat větu „Jestliže platí předpoklady a platí opak závěru, pak platí... " 14 - nějaké zjevně nepravdivé tvrzení, nebo případně - závěr (tj. opak jeho opaku) či opak jednoho z předpokladů. Komentář: Třebaže tato šablona vypadá trochu složitě, stará dobrá matematická moudrost praví: „Nevíte-li, jak nějakou větu dokázat, zkuste důkaz sporem... " • Matematická indukce. Pokročilá technika, kterou popíšeme později... Tyto techniky asi nejlépe ilustrujeme následujícími příklady důkazů. Příklad důkazu kontrapozicí Definice: Prvočíslo je celé číslo p > 1, které nemá jiné dělitele než lap. Příklad 2.1. Na důkaz kontrapozicí (obrácením). Věta. Jestliže p je prvočíslo větší než 2, pak p je liché. Důkaz obráceného tvrzení: Budeme místo uvedeného znění věty dokazovat, že je-li p sudé, pak p není větší než 2 nebo p není prvočíslo. Připomínáme, že podle definice je p sudé, právě když lze psát p = 2 ■ k, kde k je celé. Jsou jen dvě snadno řešitelné možnosti: • k < 1. Pak p = 2k není větší než 2. • k > 1. Pak p = 2 ■ k není prvočíslo podle definice. □ Poznámka: Důkazy kontrapozicí pracují s negací (opakem) předpokladů a závěru. Je-li např. závěrem komplikované tvrzení tvaru „z toho, že z A a B plyne C, vyplývá, že z A nebo C plyne A a Bíl, není pouhou intuicí snadné zjistit, co je vlastně jeho negací. Proto se nebojte využívat snadného mechanického postupu Metody 1.19 ke správnému „znegovaní" do normálního tvaru. Příklady důkazu sporem Příklad 2.2. Jiný, kratší přístup k Důkazu 2.1. Věta. Jestliže p je prvočíslo větší než 2, pak p je liché. Důkaz sporem: Nechť tedy p je prvočíslo větší než 2, které je sudé. Pak p = 2 ■ k pro nějaké k > 1, tedy p není prvočíslo, spor (s předpokladem, že p je prvočíslo). ^ Důkaz sporem je natolik specifický a důležitý v matematice, že si zaslouží širší vysvětlení. Co je vlastně jeho podstatou? Je to (zcela přirozený) předpoklad, že v konzistentní teorii nelze zároveň odvodit tvrzení i jeho negaci. Jestliže tedy ve schématu „Jestliže platí předpoklady a platí opak závěru, pak platí závěr nebo opak jednoho z předpokladů, nebo platí jiné zjevně nepravdivé tvrzení.^ odvodíme k některému předpokladu jeho opak, nebo případně jiné tvrzení, které odporuje všeobecně přijatým faktům (přesněji axiomům, například 0 = 1), pak něco musí být „špatně". Co však v našem tvrzení může (nezapomeňte předpoklad konzistence) být chybné? Původní předpoklady byly dány, takže zbývá jedině náš dodatečný předpoklad, 15 že platí opak závěru. Tudíž opak závěru nemůže nikdy platit a dvojí negací odvodíme, že platí původní závěr. Příklad 2.3. Opět sporem. Věta. Číslo V2 není racionální. Důkaz sporem: Nechť tedy y/2 je racionální, tj. nechť existují nesoudělná celá kladná - Pak 2 = r2/s2, tedy r2 = 2 • s2, proto r2 je dělitelné dvěma. Z toho plyne, že i r je dělitelné dvěma (proč? opět na to můžete jít sporem...). - Jelikož r je dělitelné dvěma, je r2 dělitelné dokonce čtyřmi, tedy r2 = 4 • m pro nějaké m. Pak ale také 4 • m = 2 • s2, tedy 2 • m = s2 a proto s2 je dělitelné dvěma. - Z toho plyne, že s je také dělitelné dvěma. Celkem dostáváme, že r i s jsou dělitelné dvěma, jsou tedy soudělná a to je spor (se základní vlastností racionálního čísla). □ 2.2 Věty typu „tehdy a jen tehdy" Uvažujme nyní (v matematice poměrně hojné) věty tvaru „Nechť platí předpoklady P. Pak tvrzení A platí tehdy a jen tehdy, platí-li tvrzení B." Příklady jiných jazykových formulací téže věty jsou: * Za předpokladů P je tvrzení B nutnou a postačujícípodmínkou pro platnost tvrzení A. * Za předpokladů P je tvrzení A nutnou a postačující podmínkou pro platnost tvrzení B. * Nechť platí předpoklady P. Pak tvrzení A platí právě tehdy když platí tvrzení B. Fakt: Plný důkaz vět tohoto tvaru má vždy dvě části(!). Je třeba dokázat: * Jestliže platí předpoklady P a tvrzení A, pak platí tvrzení B. * Jestliže platí předpoklady P a tvrzení B, pak platí tvrzení A. Příklad 2.4. Na důkaz typu „tehdy a jen tehdy". Věta. Pro každá dvě celá čísla a, b platí, že a < b právě tehdy když 2a < 2b. Důkaz: Nezapomínáme, že našim úkolem je dokázat oba směry tvrzení (implikace zleva doprava a zprava doleva). Začneme s prvním: Předpoklad a < b je definičně ekvivalentní tomu, že b = a + k pro nějaké přirozené k > 0. Potom 2b = 2a+k = 2a ■ 2k = £ ■ 2a pro nějaké přirozené í = 2k > 2, a tudíž 2h — 2a = (í — 1) • 2a > 1 • 2a > 0. Tím je první část důkazu hotova. V opačném směru postupujeme z předpokladu 2a < 2b. Vydělením obou stran nerovnosti kladným číslem 2a získáme 26/2a = 2b~a > 1. Dále postupujeme sporem. Nechť tedy a > b, neboli a — b = m > 0. Potom máme 2a~b = 2 ■ .. .2 > 1. Avšak celkově 1 = 2° = 2" b ■ 2b a>l-l = lje sporné. Proto zbývá jen požadovaný závěr a < b. □ Komentář: Je možno se někdy oddělenému zpracování obou směrů takového tvrzení vyhnout? Ano, stačí dělat pouze tzv. ekvivalentní úpravy, ale je to velmi nebezpečné. Co čísla r, s taková, že \[2 = r/s. 16 například tvrzení „a = b právě když ax = bxíl? To přece dokážeme vynásobením obou stran rovnosti stejným číslem x... Je to sice téměř pravda, ale(!) musíme si všimnout, že násobení obou stran rovnosti je ekvivalentní úpravou jen pro i / 0; jinak nazpět dělíme nulou (což na světě dokáže pouze Chuck Norris). Zapamatujte si, že nejlepší cestou, jak se takovým chybám a problémům vyhnout, je skutečně poctivě dokazovat každý směr ekvivalence zvlášť. 2.3 Matematická indukce Pokud se souhrnně podíváme na důkazové techniky v matematice, všimneme si, že matematickou indukci lze považovat za „dvorní" důkazovou technikou diskrétní matematiky. To proto, že umožňuje pohodlně dokazovat i složitá tvrzení po jednotlivých (malých a diskrétních) krocích od jednoduchých počátků. Uvažme tedy větu ve tvaru: „Pro každé přirozené (celé) n > ko platí T(n)." Zde k0 je nějaké pevné přirozené číslo a T(n) je tvrzení parametrizované číslem n. Příkladem je třeba tvrzení: Pro každé n>0 platí, že n přímek dělí rovinu nejvýše na ^n(n + 1) + 1 oblastí. Definice 2.5. Princip matematické indukce říká, že k důkazu věty „Pro každé přirozené (celé) n > k0 platí T(n)." stačí ověřit platnost těchto dvou tvrzení: • T(ko) (tzv. báze neboli základ indukce) • Pro každé n > k0; jestliže platí T(n), (indukční předpoklady pak platí také T(n + 1). (indukční krok) Formálně řečeno, matematická indukce je axiomem aritmetiky přirozených čísel. Opět jako v předešlém si tuto techniku ilustrujeme množstvím názorných příkladů. Příklady důkazů indukcí Příklad 2.6. Velmi jednoduchá a přímočará indukce. Věta. Pro každé přirozené, n > 1 je stejná pravděpodobnost, že při současném hodu n kostkami bude výsledný součet sudý, jako, že bude lichý. Důkaz: Základ indukce je zde zřejmý: Na jedné kostce (poctivé!) jsou tři lichá a tři sudá čísla, takže obě skupiny padají se stejnou pravděpodobností. Indukční krok pro n > 1: Nechť psn pravděpodobnost, že při hodu n kostkami bude výsledný součet sudý, a pln je pravděpodobnost lichého. Podle indukčního předpokladu je Pn = pln = \- Hoďme navíc (n + l)-ní kostkou. Podle toho, zda na ní padne liché nebo sudé číslo, je pravděpodobnost celkového sudého součtu rovna 3 z 3 s 1 ~6Pn + ěP" = 2 a stejně pro pravděpodobnost celkového lichého součtu. □ 17 Příklad 2.7. Ukázka skutečné důkazové „síly" principu matematické indukce. Věta. Pro každé n > O platí, že n přímek dělí rovinu nejvýše na 1 -n(n + 1) + 1 oblastí. Důkaz: Pro bázi indukce stačí, že 0 přímek dělí rovinu na jednu část. (Všimněte si také, že 1 přímka dělí rovinu na dvě části, jen pro lepší pochopení důkazu.) Mějme nyní rovinu rozdělenou n přímkami na nejvýše |n(n+l) + l částí. Další, (n+1)-ní přímka je rozdělena průsečíky s předchozími přímkami na nejvýše n + 1 úseků a každý z nich oddělí novou část roviny. Celkem tedy bude rovina rozdělena našimi přímkami na nejvýše tento počet oblastí: 1 111 -n(n + l) + l + (n + l) = -n(n + 1) + - • 2(n + 1) + 1 = -(n + l)(n + 2) + 1 □ Příklad 2.8. Další indukční důkaz rozepsaný v podrobných krocích. Věta. Pro každé n > 0 plat/ Xľ/=o.?' = ^±±). Důkaz indukcí vzhledem k n. • Báze: Zde musíme dokázat ,,T(0)", což je v tomto případě rovnost Y^j=oí — 2 Tato rovnost (zjevně) platí. • Indukční krok: Musíme dokázat, že pro každé n > 0 platí „z T(n) vyplývá T(n + 1)" což je konkrétně následující tvrzení: Jestliže platí Y^j=o J = n^n2+1^, paií plat/ Y7j=o J = (-n+1')(-^+1+1'>. Předpokládejme tedy, že Y^j=q3 = n^1^ a pokusme se dokázat, že pak také (n + l)(n + l + l) (n + l)(n + 2) n+l i=0 To už plyne úpravou: n+l n V- v- / ,x n(n + l) . 1N n(n+l)+2(n + l) (n+l)(n + 2) 2 2 2 3=0 j=0 Podle principu matematické indukce je celý důkaz hotov. □ 18 Poznámka: Výsledek Příkladu 2.8 je ukázkou tzv. sumačního vzorce pro posloupnost přirozených čísel. Jinou ukázkou je třeba vztah 1 + 3 H-----h (2ra - 3) + (2ra - 1) = 1 + (2ra - 1) + 3 + (2ra - 3) H----= 2ra • ^ = ra2, nebo 12+22H-----hra2 = |ra(ra + l)(2ra + l) a 13+23H-----hra3 = (1 + 2H-----hra)2 = ±ra2(ra + l)2. Odvozování a práce s jednoduchými sumačními vzorci by také měla náležet do výbavy schopného informatika, princip matematické indukce je zde klíčový. 2.4 Komentáře k matematické indukci Pro správné a úspěšné použití indukce v dokazování je vhodné si zapamatovat několik cenných rad: * Základní trik všech důkazů matematickou indukcí je vhodná reformulace tvrzení T(n + 1) tak, aby se „odvolávalo" na tvrzení T(n). - Dobře se vždy podívejte, v čem se liší tvrzení T(n + 1) od tvrzení T(n). Tento „rozdíl" budete muset v důkaze zdůvodnit. * Pozor, občas je potřeba „zesílit" tvrzení T(n), aby indukční krok správně „fungoval". - Velkým problémem bohužel je, že není možno podat návod, jak vhodné zesílení nalézt (ani kdy jej vůbec hledat). Jedná se vlastně o pokusy a „hádání z křišťálové koule". Viz Příklad 2.9. * Často se chybuje v důkazu indukčního kroku, neboť ten bývá většinou výrazně obtížnější než báze, ale o to zrádnější jsou chyby v samotné zdánlivě snadné bázi! - Dejte si dobrý pozor, od které hodnoty n > k0 je indukční krok univerzálně platný a jestli případně báze nezahrnuje více než jednu hodnotu... Zesílení tvrzení v indukčním kroku Potřebu nahrazení, v některých případech, daného tvrzení něčím „silnějším" pro hladký průběh matematické indukce si ukážeme v Příkladu 2.9. Jaké zesílení však máme na mysli? V prvé řadě to musí být nějaké tvrzení T'(n), ze kterého původní tvrzení T(n) jednoduše vyplývá. Jak si tím ale v indukčním kroku pomůžeme? Je na jedné straně pravdou, že nově musíme dokazovat silnější závěr T'(n + 1), ale zároveň mám k dispozici silnější indukční předpoklad T(n + 1) a to právě může být klíčovou pomocí. Příklad 2.9. Kdy je vhodné (a v zásadě také nutné) indukční krok zesílit... Věta. Pro každé n > 1 platí ,,111 1 s(n) =--1---1---1-----1--;-- < 1. K J 1-22-33-4 n(n + l) Důkaz: Báze indukce je zřejmá, neboť < 1. Co však indukční krok"? Předpoklad s(n) < 1 je sám o sobě „příliš slabý" na to, aby bylo možno tvrdit s(n + 1) = s(n) + , ,, w »x < 1. \ 1 / v / (n+l)(n+2) Neznamená to ještě, že by tvrzení nebylo platné, jen je potřeba náš indukční předpoklad zesílit. Budeme dokazovat 19 Tvrzení. Pro každé přirozené n > 1 platí s(n) < 1 — ^-j-j- < 1. To platí pro n = 1 (nezapomeňte ověřit!) a dále už úpravou jen dokončíme zesílený indukční krok: s(n + l) = s(n) + ------ < 1 (n + l)(n + 2) ~ n + 1 (n + l)(n + 2) = -(n + 2) + l = 1 (n + l)(n + 2) n + 2 D Rozšíření báze a předpokladu Mimo zesilování tvrzení indukčního kroku jsme někdy okolnostmi nuceni i k rozšiřováni samotné báze indukce a s ní indukčního předpokladu na více než jednu hodnotu parametru n. - Můžeme například předpokládat platnost (parametrizovaných) tvrzení T(n) iT(n + l) zároveň, a pak odvozovat platnost T(n+2). Toto lze samozřejmě zobecnit na jakýkoliv počet předpokládaných parametrů. - Můžeme dokonce předpokládat platnost tvrzení T(j) pro všechna j = ko, ko + 1,..., n najednou a dokazovat T(n + 1). Toto typicky využijeme v případech, kdy indukční krok „rozdělí" problém T(n + 1) na dvě menší části a z nich pak odvodí platnost T(n + 1). Fakt: Obě prezentovaná „rozšíření" jsou v konečném důsledku jen speciálními instancemi základní matematické indukce; použité rozšířené možnosti pouze zjednodušují formální zápis důkazu. Příklad 2.10. Když je nutno rozšířit bázi a indukční předpoklad... Věta. Nechť funkce f pro každé n > 0 splňuje vztah /(n + 2) = 2/(n + l)-/(n). Pokud platí /(O) = 1 a zároveň /(l) = 2, tak platí f(n) = n + 1 pro všechna přirozená n > 0. Důkaz: Už samotný pohled na daný vztah f(n + 2) = 2f(n + 1) — f(n) naznačuje, že bychom měli rozšířit indukční předpoklad (a krok) zhruba takto: Pro každé n > 0; jestliže platí T (n); neboli f(n) = n + 1, a zároveň platí T (n + 1); f(n + 1) = n + 2, pak platí také T(n + 2); f(n + 2) = n + 3. Báze indukce - pozor, zde už musíme ověřit dvě hodnoty /(O) = 0 + 1 = 1, /(l) = 1 + 1 = 2. Náš indukční krok tak nyní může využít celého rozšířeného předpokladu, znalosti hodnot f(n) i f{n + 1), pro ověření f(n + 2) = 2f(n + 1) - f(n) = 2-(n + l + l)-(n + l)=n + 3 = n + 2 + l. Komentář: Jak by tento důkaz měl být formulován v tradiční indukci? („Substitucí" nového tvrzení.) 20 Závěrem malý „problém" Příklad 2.11. Aneb jak snadno lze v matematické indukci udělat chybu. Věta. („nevěta") V každém stádu o n > 1 koních mají všichni koně stejnou barvu. Důkaz indukcí vzhledem k n. Báze: Ve stádu o jednom koni mají všichni koně stejnou barvu. Indukční krok: Nechť S = \K\,..., Kn+i} je stádo o n + 1 koních. Dokážeme, že všichni koně mají stejnou barvu. Uvažme dvě - S> = {K1,K1,...,Kn} - S" = {K2,..., Kn, Kn+i] Podle indukčního předpokladu mají všichni koně ve stádu S' stejnou barvu B'. Podobně všichni koně ve stádu S" mají podle indukčního předpokladu stejnou barvu B". Dokážeme, že B' = B", tedy že všichni koně ve stádu S mají stejnou barvu. To ale plyne z toho, že koně K2,..., Kn patří jak do stáda S', tak i do stáda S". □ Komentář: Ale to už je podvod! Vidíte, kde? Navazující studium Jak jsme již řekli, matematické důkazy a jejich chápání jsou samozřejmě nezbytné ke studiu vysokoškolských matematických předmětů. Bez schopnosti přesného vyjadřování a chápání defínic a vět se ale informatik neobejde, ani pokud se zaměřuje čistě aplikovaným směrem; příkladem je třeba správné pochopení různých norem a specifíkací. Na druhou stranu umění "tvořit" nové matematické důkazy je dosti obtížné a nedá se jemu jen tak snadno naučit - vyžaduje to mnoho pokročilých matematických zkušeností. Jelikož je schopnost formálního matematického dokazování nezbytná (převážně jen) v teoretických informatických disciplínách, není tato část kritická v celém rozsahu našeho předmětu (a u zkoušek se objeví s menším důrazem), ale to neznamená, že byste se jí mohli zcela vyhýbat. Obzvláště techniku matematické indukce by měl každý informatik aspoň trochu ovládat, neboť s jejím použitím se zajisté ještě mnohokrát setkáte v budoucím studiu. 21 3 Množiny a množinové operace Úvod V přehledu matematických formalismů informatiky se v této a příští lekci zaměříme na základní datové typy matematiky, tj. na množiny, relace a funkce. Netradiční sousloví „datové typy" matematiky zde volíme záměrně, abychom zdůraznili jejich fundamentálnost pro výstavbu navazující teorie v analogii k programování. O množinách jste sice zajisté slyšeli už na základní škole, ale podstatou našeho předmětu je uvést povětšinou neformálně známé pojmy na patřičnou formální úroveň nutnou pro teoretické základy informatiky. V případě konečné teorie množin si zde vystačíme s tzv. „naivním" pohledem, který dostatečně matematicky přesně vystihuje všechny jejich konečné aspekty (o komplikacích nekonečných množin se krátce zmíníme až v Lekci 11). Cíle V této lekci si ukážeme první krok k seriózně vybudované matematické teorii množin -tzv. naivní teorii množin, která nám velmi dobře poslouží ve všech konečných případech. Na to navážeme zavedením základního množinového kalkulu a shrnutím běžných vlastností množin. Závěrem si uvedeme příklady rekurzivně definovaných posloupností. 3.1 Pojem množiny Položme si hned na úvod tu nej důležitější otázku: Co je vlastně množina? Na tuto otázku bohužel není zcela jednoduchá odpověď... Abychom se vůbec někam v našem úvodu dostali, spokojíme se zatím jen s přirozeným „naivním pohledem". Definice naivní teorie množin: „Množina je soubor prvků a je svými prvky plně určena. " Komentář: Příklady zápisu množin výčtem prvků 0, {a,b}, {b, a}, {a,b,a}, {{a, b}}, {0, {0}, {{0}}}, {x \ x je liché přirozené číslo}. Co je ale pak prvek? Tady pozor, pojem prvku sám o sobě nemá matematický význam, svého významu totiž nabývá pouze ve spojení „být prvkem množiny". Prvky množiny tak může být cokoliv, mimo jiné i další množiny. Komentář: Relativitu významu vztahu „prvek-množina" si můžeme přiblížit třeba na vztahu „podřízený—nadřízený" z běžného pracovního života. Tam také nemá smysl jen říkat, že je někdo podřízeným, aniž řekneme také jeho nadřízeného. Přitom i vedoucí je někomu ještě podřízený a naopak i ten poslední podřízený pracovník může být pánem třeba svého psa. Podobně je tomu s množinou jako „nadřízenou" svých prvků. Ale přece jenom... v dobře definovaném kontextu lze (omezeně) mluvit o prvcích jako samostatných entitách. Formálně se například jedná o prvky pevně dané nosné množiny. Značení množin a jejich prvků: • x G M „x je prvkem množiny M", • 0 je prázdná množina {}. Komentář: Některé vlastnosti vztahu „být prvkem" jsou *at{a,b}, afÉ{{a,b}}, {a, b} G {{a, &}}, a G* 0, 0 G {0}, 0 0 0, * rovnost množin dle svých prvků {a, b} = {b, a} = {a, b, a}, {a, b} 7^ {{a, b}}. Značení: Počet prvků (mohutnost) množiny A zapisujeme \A\. Komentář: Například |0| = 0, |{0}| = 1, \{a,b,c}\=3, \{{a, b}, c}\ = 2. 22 Jednoduché srovnání množin Vztah „být prvkem množiny" nám přirozeně podává i způsob porovnávání množin mezi sebou. Jedná se o klíčovou část, čili hlavní nástroj teorie množin. Definice: Množina A je podmnožinou množiny B, právě když každý prvek A je prvkem B. Píšeme A C B nebo obráceně B D A. Říkáme také, že se jedná o inkluzi. * Platí {a} C {a} C {a, b} £ {{a, b}}, 0 C {0}, * A C B právě když A C B a A ^ B (A je vlastni podmnožinou B). Z naivní definice množiny pak přímo vyplývá následující: Definice: Dvě množiny jsou si rovny A = B právě když A C B & B C A. * Podle naivní definice jsou totiž množiny A a, B stejné, mají-li stejné prvky. * Důkaz rovnosti množin A = B má obvykle dvě části: Odděleně se dokáží inkluze A C B a B C A. Ukázky nekonečných množin Značení: Běžné číselné množiny v matematice jsou následující * N = {0,1, 2, 3,... } je množina přirozených čísel, * Z = {..., —2, — 1, 0,1, 2, 3,... } je množina celých čísel, * Z+ = {1, 2, 3,... } je množina celých kladných čísel, * Q je množina racionálních čísel (zlomků). * R je množina reálných čísel. Komentář: Tyto uvedené číselné množiny jsou vesměs nekonečné, na rozdíl od konečných množin uvažovaných v předchozím „naivním" pohledu. Pojem nekonečné množiny se přímo v matematice objevil až teprve v 19. století a bylo s ním spojeno několik paradoxů ukazujících, že naivní pohled na teorii množin pro nekonečné množiny nedostačuje. My se k problematice nekonečných množin, Kantorově větě a Russelovu paradoxu vrátíme v závěru našeho předmětu v Lekci 11. 3.2 Množinové operace Začněme se základními operacemi množinového kalkulu, které zajisté na intuitivní úrovni již ovládáte ze školy. Pro formální úplnost podáme jejich přesné definice, na které se můžete odvolávat v důkazech. Sjednocení a průnik Definice 3.1. Sjednocení U a průnik H dvou množin A, B definujeme AU B = {x \ x e A nebo x G B} , A H B = {x \ x E A a současně x G B} . Komentář: Pro neformální pochopení věci je velmi užitečné si množinové operace a vztahy zobrazovat tzv. Vennovými diagramy, které zobrazují jednotlivé množiny a v nich „oblasti" prvků s daným vztahem k zobrazeným množinám. V našem případě to je takto: 23 AU B AnB * Příklady {a, b, c} U {a, d} = {a, b, c, d}, {a, b, c} H {a, d} = {a}. * Vždy platí „distributivita" A H (B U C) = (A f] B) U (A f] C) a A U (B D C) = (AU B) n (AU C) * a také „asociativita" Ar\(BC\C) = (Ar\B)C\C (stejně pro U) a „komutativita" AílB = B H A (stejně pro U). Komentář: Asociativita a komutativita operací sjednocení a průniku je na jednu stranu zcela přirozená, na druhou stranu však velmi důležitá například pro platnost následující definice. Definice: Pro libovolný počet množin indexovaných pomocí I rozšířeně definujeme ^ Ai = {x | x G Ai pro nějaké i G /} , [I Ai = {x | x G Ai pro každé i E 1} . Komentář: Nechť Ai = {2 • i} pro každé i G N. Pak U«eN ^* Je mn°žina všech sudých přirozených čísel. Nechť Bi = {x \ x G N, x > i} pro každé i G N. Pak HíeN Bi = 0. Množinový rozdíl Definice 3.2. Rozdíl \ a symetrický rozdíl A dvou množin A, B definujeme A\B = {x \ x £ A &, současně x 0 B} , AAB = (A\B) U (B\ A) . A\B * Příklady {a, b, c} \ {a, b, d} = {c}, {a, b, c}A{a, b, d} = {c, d}. * Vždy platí například A \ (B n C) = (A \ B) U (A \ C) apod. Definice: Pro libovolný počet množin indexovaných pomocí konečné I rozšířeně definujeme * l\iei Ai = {x | x G Ai pro lichý počet i G /} . Komentář: Povšimněte si, že operace rozdílu není asociativní ani komutativní (ostatně stejně je tomu u aritmetického rozdílu). Symetrický rozdíl už asociativní i komutativní je, není to však na první pohled vidět. Uměli byste toto dokázat? Definice: Nechť A C M. Doplňkem A vzhledem k M je množina A = M \ A. 24 Komentář: Jedná se o poněkud specifickou operaci, která musí být vztažena vzhledem k nosné množině M ! Je-li M = {a, b, c}, pak {a, b} = {c}. Je-li M = {a, b}, pak {a, b} = 0. * Vždy pro ACM platí A = A („dvojí" doplněk). * Vždy pro A, B C M platí A U B =In5a A H B = ÄUB. (Viz Věta 3.6.) Uspořádané dvojice a kartézský součin Zatímco prvky v množinách jsou zcela neuspořádané, jsou mnohé situace, kdy musíme pracovat se „seřazenými" výčty prvků. V teorii množin lze takovéto seřazení definovat oklikou následovně: Definice: Uspořádaná dvojíce (a,b) je zadána množinou {{a}, {a, b}}. Fakt: Platí (a, b) = (c, d) právě když a = c a současně b = d. Uměli byste toto sami dokázat přímo z podané definice? * Co je podle definice (a, a)? Je to (a, a) = {{a}, {a, a}} = {{a}, {a}} = {{a}}- Definice 3.3. Kartézský součin dvou množin A, B definujeme jako množinu všech uspořádaných dvojic ze složek z A a B A x B = {(a, b) | a G A, b G B} . * Příklady {a, b} x {a} = {(a, a), (6, a)}, {c, d} x {a, 6} = {(c, a), (c, 6), (cř, a), (cř, 6)}. * Platí 0xX = 0 = Xx0 pro každou množinu X. * Jednoduchá mnemotechnická pomůcka říká |Ax5| = |A|-|5|. Definice: Pro každé k G N, k > 0 definujeme uspořádanou k-tící (a\, ■ ■ ■ , a^) induktivně - (ai) = ai, - (a1; a2)''' j aí, ai+i) = ((aij a2,''' j a«)) a«+i)- Všimněte si, že tato definice používá tzv. rekurentní vztah, blíže viz Oddíl 3.4. Fakt: Platí (a\, ■ ■ ■ , a^) = (b\, ■ ■ ■ ,bk) právě když a« = 6« pro každé i G N kde 1 < i < k. Definice kartézského součinu více množin: Pro každé A; G N definujeme Ai x A2 x • • • x Ak = {{dl-, «2)''' j ak) | Oj G pro každé 1 < i < k} . Navíc pokud jsou množiny Ai indexovány přes libovolnou konečnou množinu I 3 i, tak jejich kartézský součin krátce píšeme jako X iejAi. * Například Z3 = ZxZxZ = k) \ i,j, k G Z}. * Co je A°l {0}, neboť jediná uspořádaná 0-tice je právě prázdná 0. Poznámka: Podle uvedené definice není kartézský součin asociativní, tj. obecně nemusí platit, že A x (B x C) = (A x B) x C. V matematické praxi je někdy výhodnější uvažovat upravenou definici, podle níž součin asociativní je. Pro účely této přednášky není podstatné, k jaké definici se přikloníme. Prezentované definice a věty „fungují" pro obě varianty. 25 Potenční množina Definice 3.4. Potenční množina množiny A, neboli množina všech podmnožin, je definovaná vztahem 2A = {B | B C A} . * Platí například 2^ = {0, {a}, {b}, {a, b}}, * 20 = {0}, 2W0» = {0,{0},{{0}},{0,{0}}}, * 2Wx{o,6} = {0; {(a> a)}; {(a> 6)}> {(a> a); (a> Věta 3.5. Počet prvků potenční množiny splňuje \2A\ = 2'^'. Důkaz: Stručně indukcí podle \A\: Pro A = 0 platí |2A| = |{0}| = 1 = 2°. Pro \A\ > 0 nechť b E A a položme A' = A \ {b}. Podle předpokladu platí \2A'\ = 2'A''. Všechny podmnožiny A rozdělíme „napolovic" jako 2^ = 2^ U {B | b E B C A}, přičemž zjevně v 2 | = \{B \ b E B C A}\, jak lze vidět po odebrání prvku b ze všech podmnožin druhém případě. Tudíž \2A\ = \2A'\ + \{B \ b E B C A}\ = 2 ■ \2A'\ = 2^+1 = 2^ . n 3.3 Porovnávání a určení množin Pro obecnou ilustraci formálního množinového kalkulu si ukažme dva důkazy rovností mezi množinovými výrazy. Podobně lze (rozepsáním příslušných definic) rutinně dokazovat další množinové vztahy. Věta 3.6. Pro každé dvě množiny A, B C M platí AU B = A U B. Důkaz v obou směrech rovnosti (viz ilustrační obrázek). A U B C A n B: Pro x E M platí x E A U B, právě když x AU B, neboli když zároveň x ^ A a x ^ B. To znamená x E A a zároveň x E B, z čehož vyplývá požadované x E A H B. • AU B D A í) B: Pro x E M platí x E A í) B, právě když x E A a zároveň x E B, neboli když zároveň x A a x B. To znamená x ^ AU B, z čehož vyplývá požadované x E A U B. ^ Věta 3.7. Pro každé tři množiny A, B, C platí A\(BUC) = (A\B) U(A\C). Důkaz (viz ilustrační obrázek). 26 . A \ (B n C) C (A\B) U (A \ C): Je-li x G A \ (B H C), pak x G A a zároveň x ^ (5 H C), neboli x ^ B nebo x ^ C. Pro první možnost máme iG(A\ B), pro druhou x G (A \ C). . Naopak A \ (B íl C) D (A \ 5) U (A \ C): Je-li x G (A \ 5) U (A \ C), pak x G (A \ B) nebo x G (A \ C). Pro první možnost máme x E A a, zároveň x ^ B, z čehož plyne x E A a, zároveň i ^ (B íl C), a tudíž x G A \ (B H C). Druhá možnost je analogická. ^ Charakteristický vektor (pod)množiny V případech, kdy všechny uvažované množiny jsou podmnožinami nějaké konečné nosné množiny X, což není neobvyklé v programátorských aplikacích, s výhodou využijeme následující reprezentaci množin. Definice: Mějme nosnou množinu X = {x1}x2,... ,xn}. Pro A c X definujeme charakteristický vektor xa jako Xa = (cij c2j • • • j cn)? kde q = 1 pro x,i G A a q = 0 jinak. Užitečnost této reprezentace je ilustrována také následnými fakty. • Platí A = B právě když x a = Xb- • Množinové operace jsou realizovány „bitovými funkcemi" sjednocení ~ OR, průnik ~ AND, symetrický rozdíl ~ XOR. Princip inkluze a exkluze Tento důležitý a zajímavý kombinatorický princip je někdy také nazýván „princip zapojeni a vypojenŕ. Používá se ke zjišťování počtů prvků množin s neprázdnými průniky. Věta 3.8. Počet prvků ve sjednocení dvou či tří množin spočítáme: \AUB\ = \A\ + \B\ - \AC\B\ \AUBUC\ = \A\ + \B\ + \C\ -\Ar\B\ - \AnC\ - \BnC\ + \AnBnC\ Důkaz: Uvedeme si podrobný důkaz prvního vztahu |A U 5| = \A\ + \B\ — \AC\ B\, přičemž druhá část je analogická (viz obrázková ilustrace). Nechť x G A U B. Pokud x (jL B, tak je x G A a prvek x je započítán na pravé straně \A\ + \B\ — \AV\B\ právě jednou v \A\. Obdobně je to v případě x ^ A. Nakonec pro x G A H B je ve vztahu \A\ + \B\ — \AV\B\ tento prvek x započítán také 1 + 1 — 1 = 1 krát. □ 27 Komentář: Všimněte si, že Větu 3.8 lze stejně tak využít k výpočtu počtu prvků v průniku množin... Příklad 3.9. Z 1000 televizí jich při první kontrole na výrobní lince má 5 vadnou obrazovku, 10 je poškrábaných a 12 má jinou vadu. Přitom 3 televize mají současně všechny tři vady a 4 jiné jsou poškrábané a mají jinou vadu. Kolik televizí je celkem vadných ? Řešení: Dosazením \A\ = 5, \B\ = 10, \C\ = 12, \A H B H C\ = 3, (zde pozor) Af]B\ = 3 + 0, \A n C\ = 3 + 0, \B n C\ = 3 + 4 do Věty 3.8 zjistíme výsledek 17. □ Poznámka. Jen stručně, bez důkazu a bližšího vysvětlení, si uvedeme obecnou formu principu inkluze a exkluze: U 4 0^/C{l,...,n} (Jeho znalost nebude v předmětu vyžadována.) 3.4 Posloupnosti a rekurentní vztahy Uspořádané fc-tice (Oddíl 3.2) jsou také nazývány konečnými posloupnostmi délky k, neboli seřazeními prvků z dané neprázdné množiny hodnot (opakování prvků je povoleno). Tento pohled lze přirozeně zobecnit na nekonečné posloupnosti, avšak musíme sáhnout k trochu složitějším pojmům: Definice: Nekonečná posloupnost p je zobrazením z N do svého oboru hodnot H, neboli p : N —y H (viz také Oddíl 4.1 o funkcích). Mimo „funkčního" zápisu p (n) často používáme „indexovou" formu zápisu funkční hodnoty jako pn. Poznámka: Oborem hodnot posloupnosti obvykle bývá nějaká číselná množina, ale může to být i jakákoliv jiná množina. Také definiční obor posloupnosti (tj. indexy) může začínat od nuly nebo i od jedničky, jak je v aplikacích potřeba. • Příklady posloupností: * Po = 0, pi = 2,... ,pi = 2i,... je posloupnost sudých nezáporných čísel. * 3, 3.1, 3.14, 3.141,... je posloupnost postupných dekadických rozvojů 7r. * 1, —1, 1, —1,... je posloupnost určená vztahem pi = (—1)*, i > 0. * Pokud chceme stejnou posloupnost 1, —1, 1, —1,... zadat jako g^, i > 1, tak ji určíme vzorcem qt = (—l)í_1. • Posloupnost je rostoucí (či klesající), pokud pn+i > Pn (Pn+i < Pn) pro všechna n. Rekurentní definice posloupnosti Slovem rekurentní označujeme takové definice (či popisy), které se v jistých bodech odvolávají samy na sebe. (Už jste se setkali s „rekurzí" při programování? A víte, co znamená?) Místo nepřehledných formálních definic si rekurentní vztahy uvedeme několika názornými ukázkami. 28 • Zadáme-li posloupnost pn vztahy p0 = 1 a pn = 2pn_i pro n > 0, pak platí pn = 2n pro všechna n. • Obdobně můžeme zadat posloupnost qn vztahy gx = 1 a qn = qn-\ + n pro n > 1. Potom platí qn = ^n(n + 1) pro všechna n. Uměli byste toto dokázat indukcí? Viz Příklad 2.8. • Známá Fibonacciho posloupnost je zadaná vztahy f\ = f2 = 1 a fn = fn-\ + fn-2 Pro n > 2. Příklad 3.10. Posloupnost f je zadaná rekurentní defínicí /(O) = 3 a /(n + l) = 2-/(n) + l pro všechna přirozená n. Určete hodnotu f(n) explicitním vzorcem v závislosti na n. Řešení: V první fázi řešení takového příkladu musíme nějak „uhodnout" hledaný vzorec pro f(n). Jak? Zkusíme vypočítat několik prvních hodnot a uvidíme... /(I) = 2-/(0) + l=2-3 + l = 7 f (2) = 2-/(l) + l =2-7+1 = 15 /(3) = 2 • f (2) + 1 = 2 • 15 + 1 = 31 /(4) = 2-/(3) + l =2-31 + 1 =63 Nepřipomínají nám tato čísla něco? Co třeba posloupnost 8 — 1, 16 — 1, 32 — 1, 64 — 1... ? Bystrému čtenáři se již asi podařilo uhodnout, že půjde o mocniny dvou snížené o 1. Přesněji, f(n) = 2n+2 — 1 (proč je exponent n + 2? inu proto, aby správně vyšlo /(O)). Ve druhé nesmíme ale zapomenout správnost našeho „věštění" dokázat, nejlépe matematickou indukcí podle n. . Báze: /(O) = 20+2 -1 = 4-1 = 3 platí. • Indukční krok: za využití indukčního předpokladu f(n + 1) = 2 • f(n) + 1 = 2- (2n+2 - 1) + 1 = 2 • 2n+2 - 2 + 1 = 2(n+1)+2 - 1, což také platí. Podle principu matematické indukce je nyní dokázáno, že pro zadanou rekurentní posloupnost / platí f(n) = 2n+2 — 1 pro všechna přirozená n. □ Navazující studium I když jste se s "množinami" setkávali už od základní školy, do formálně matematické teorie množin asi nahlédnete na VS poprvé. Nezalekněte se na úvod formality vyjadřování, která je bohužel nezbytná, a naučte se s množinami a relacemi dobře pracovat aspoň na zde ukázané naivní úrovni konečné teorie množin. Ostane, jak již bylo psáno, množiny jsou základním stavebním kamenem celé matematiky. Mimo naší naivní teorie množin si lehký náhled na obecně nekonečné množiny a jejich zdánlivé paradoxy i informatické aplikace ukážeme později v Lekci 11...) V dalším si porovnejte pojem posloupnosti s pojmem funkce v Oddílu 4.1 a také si později povšimněte blízké koncepční podobnosti rekurentních defínic s induktivními defínicemi množin a funkcí v Oddíle 6.3. 29 4 Relace a jejich použití Úvod V návaznosti na předchozí lekci si podrobně rozebereme matematické formalismy relací a funkcí coby jejich speciálního případu. Na rozdíl od množin, které se v jisté velmi naivní formě objevují už na základní škole, se relacím v jejich abstraktní podobě mnoho pozornosti v základní výuce nevěnuje. Stejně tak jste se již setkali na nižších stupních škol s pojmem funkce, ale povětšinou jen ve spojení s aritmetickými a analytickými funkcemi („ vzorečky") typu x + 1, x2 — y, či sinx, 1 + cosx2, atd. Jak uvidíte v této lekci, pojmy relace i funkce jsou zcela abstraktní a nemusí se k nim vázat žádný analytický vzorec výpočtu či podobné. Přitom na pojem (zcela obecné) relace velmi brzo narazí každý informatik při studiu dat a databází, které nad těmito pojmy staví. Není to však jen oblast relačních databází, ale i jiná místa informatiky, kde se obecné funkce a relace skrývají či přímo explicitně objevují. Nejčastěji se tak setkáte s binárními relacemi nad množinami, na něž se v textu hlouběji zaměříme. Cíle Úkolem této a příští lekce je vybudovat matematický aparát konečných relací, s primárním zaměřením na funkce a binární relace typu ekvivalence a uspořádání nad množinou. Ve vztahu k binárním relacím je zavedeno množství pojmů, které jsou později užitečné v různých oblastech matematiky i informatiky. V obecnosti jsou také vysvětleny inverze relací a jejich skládání. Látka pak plynule pokračuje Lekcí 5. 4.1 Relace a funkce nad množinami Vedle množin jsou dalším důležitým základním „datovým typem" matematiky relace, kterým vzhledem k jejich mnohotvárnému použití v informatice věnujeme významnou pozornost v této i příští lekci. Definice 4.1. Relace mezi množinami A\,A2, ■ ■ ■ ,A^, pro k G N, je libovolná podmnožina kartézského součinu R C Ai x A2 x • • • x Ak. Pokud A\ = A2 = ■ ■ ■ = Ak = A, hovoříme o k-ární relaci R na A. Speciálně tak mluvíme třeba o binární {k = 2), ternární {k = 3) nebo unární {k = 1) relaci. Komentář: Příklady relací. * {(1, a), (2, a), (2, b)} je relace mezi {1, 2, 3} a {a, b}. * {(i, 2 • i) | i G N} je binární relace na N. * + j) \i,j G N} je ternární relace na N. * {3 • i | i G N} je unární relace na N. * Jaký význam vlastně mají unární a nulární relace na A? Uvědomme si, jak obecně je relace definována - její definice umožňuje podchytit skutečně libovolné „vztahy" mezi prvky téže i různých množin. V praxi se relace velmi široce využívají třeba v relačních databázích... 30 Funkce mezi množinami První školní setkání s instancemi relací povětšinou proběhne u pojmu funkce. Ovšem tradiční školní pojetí funkce ji obvykle identifikuje s nějakým výpočetním (analytickým) předpisem či vzorcem. Pojem funkce je však daleko obecnější a zcela abstraktní, což si v tomto oddíle bohatě ilustrujeme a poslouží nám to i pro lepší pochopení obecnějšího pojmu relace. Definice 4.2. (Totální) funkce z množiny A do množiny B je relace / mezi A a, B taková, že pro každé x E A existuje právě jedno y E B takové, že (x, y) E /. Množina A se nazývá definiční obor a množina B obor hodnot funkce /. Komentář: Neformálně řečeno, ve funkci / je každé „vstupní" hodnotě x přiřazena jednoznačně „výstupní" hodnota y. (V obecné relaci počty „přiřazených" dvojic neomezujeme. ..) Na druhou stranu si všimněte, že definiční obor i obor hodnot jsou součástí definice konkrétní funkce, neboli například v ukázce je oborem hodnot B = {a, b, c, d}, přestože samotné c není hodnotou pro žádný vstup. Značení: Místo (x,y) G / píšeme obvykle f(x) = y. Zápis / : A —>• B říká, že / je funkce s definičním oborem A a oborem hodnot B. Funkcím se také říká zobrazení Komentář: Příklady funkcí jsou třeba následující. * Definujeme funkci / : N —> N předpisem f (x) = x + 8. Pak / = {(x, x + 8) | x G N}. * Definujeme funkci plus :NxN-íN předpisem plus (i, j) = i + j. Pak plus = {(i, j, i + j) \i,j G N}. Definice: Pokud naši Definici 4.2 upravíme tak, že požadujeme pro každé x E A nejvýše jedno y E B takové, že (x, y) E f, obdržíme definici parciální funkce z A do B. Komentář: V parciální funkci / nemusí být pro některé „vstupní" hodnoty x funkční hodnota definována (viz například f (2) v uvedeném obrázku). Pro nedefinovanou hodnotu používáme znak _L. Komentář: Následuje několik příkladů parciálních funkcí. 31 * Definujeme parciální funkci / : tl —> N předpisem , . í 3 + x jestliže x > O, ^x>=\ j_ jinak. Tj. / = {(x,3 + x) | x G N}. * Také funkce / : R —> R daná běžným analytickým předpisem f{x) = log x je jen parciální - není definována pro x < 0. * Co je relace, přiřazující lidem v CR jejich (česká) rodná čísla? 4.2 Reprezentace konečných relací Oblastí, kde informatici nejčastěji potkají obecné relace, je bezesporu ukládání dat. To proto, že shromažďovaná data, stejně jako relace, především sledují vztahy mezi objekty. Na druhou stranu je relační databáze zcela obecnou ukázkou reprezentace jakékoliv relace, kterou si ilustrujeme příkladem. Příklad 4.3. Tabulka relační databáze prezentuje obecnou relaci. Definujme následující množiny („elementární typy") * ZNAK = {a, ■ ■ ■ ,z,A,--- , Z, mezera}, * ČÍSLICE = {0,1, 2, 3,4, 5, 6, 7, 8, 9}. Dále definujeme tyto množiny („odvozené typy") * JMÉNO = ZNAK15, PŘÍJMENÍ = ZNAK20, VEK = ČÍSLICE3, * ZAMESTNANEC „G" JMÉNO x PŘÍJMENÍ x VEK. Relaci „typu" ZAMESTNANEC pak lze reprezentovat tabulkou: jméno příjmení vek Jan Novák 42 Petr Vichr 28 Pavel Zima 26 Stanislav Novotný 52 □ Reprezentace binárních relací na množině Jistě čtenáři uznají, že zadání relace výčtem jejích složek není pro člověka (na rozdíl od počítače) tím nej příjemnějším způsobem. Je tedy přirozené se ptát, jak co nejnázorněji takovou relaci, alespoň v její nejčastější binární podobě, ukázat. Značení: Binární relaci i? C M x M lze jednoznačně znázornit jejím grafem: • Prvky M znázorníme jako body v rovině. • Prvek (a,b) G R znázorníme jako orientovanou hranu („šipku") z a do b. Je-li a = b, pak je touto hranou „smyčka" na a. 32 Komentář: Například mějme M = {a,b,c,d,e, /} a R = {(a,a), (a,b), (b,c), (b,d), (b, e), (b, /), (d, c), (e, c), (/, c), (e, <í> <í> Příklad 4.5. Několik příkladů relací defínovaných v přirozeném jazyce. Nechť M je množina všech studentů 1. ročníku FI. Uvažme postupně relace R C M x M definované takto * (x, y) G R právě když x a y mají stejné rodné číslo; * (x, y) G R právě když x má stejnou výšku jako y (dejme tomu na celé mm); * (x, y) E R právě když výška x a y se neliší více jak o 2 mm; * (x, y) E R právě když x má alespoň takovou výšku jako y; * (x, y) E R právě když x má jinou výšku než y (dejme tomu na celé mm); * (x, y) E R právě když x je zamilován(a) do y. Zamyslete se podrobně, které z definovaných vlastností tyto jednotlivé relace mají. Které z nich tedy jsou ekvivalencí nebo uspořádáním? □ Příklad 4.6. Jaké vlastnosti mají následující relace? * Buď f? C N x N definovaná takto (x, y) E R právě když x dělí y. (Částečné uspořádání, ale ne každá dvě čísla jsou porovnatelná.) * Buď i?CNxN definovaná takto {x, y) E R právě když x a, y mají stejný zbytek po dělení číslem 5. {Ekvivalence.) * Nechť F = {f \ f : ¥1 —^N}je množina funkcí. Buď R C F x F definovaná takto (f, g) E R právě když f (x) < g (x) pro všechna x. (Ireňexivní, antisymetrická a tranzitivní, ale ne reflexivní - striktně řečeno není uspořádáním.) □ 34 Komentář: Co v případě, že naše relace některou z poptávaných vlastností nemá, ale nám by se ta vlastnost hodila? To řeší tzv. uzávěry relací: • Reflexivní uzávěr jednoduše přidá do relace všechny dvojice (x, x) nad nosnou množinou. • Symetrický uzávěr zahrne do relace všechny obrácené dvojice k existujícím dvojicím, neboli všechna chybějící (x, y) pokud (y, x) E R. • Tranzitivní uzávěr nelze popsat až tak jednoduše, ale stručně řečeno přidává do relace všechny ty dvojice (x,y), pro které se lze (v grafu relace) dostat z x do y „po šipečkách". Formálně se této problematice uzávěrů relací bude věnovat Oddíl 6.4. 4.4 Inverzní relace a skládání relací Ve výkladu se nyní vrátíme k obecnému pojetí relací mezi (třeba různými) množinami. K použitelné práci s relacemi v aplikacích se dostaneme, pokud budeme umět relace správně „převracet" a „skládat". To nám umožní následující definice. Definice: Nechť R C A x B je binární relace mezi A a B. Inverzní relace k relaci R se značí R~ľ a je definována takto: R-1 = {(b,a) | (a, b) G R} R 1 je tedy relace mezi B a A. Následuje klíčová definice, pro jejíž bližší ilustraci odkazujeme také na Příklad 4.9. Definice 4.7. Složení (kompozice) relací R a S. Nechť RCAxB&SCBxC jsou binární relace. Složení relací R a S (v tomto pořadí!) je relace S o R G A x C definovaná takto: S o R = {(a, c) I existuje b E B takové, že (a, b) G R, (b, c) G S} Složení relací čteme „R složeno s SĹÍ nebo (pozor na pořadí!) „S po RĹÍ. Komentář: Několik matematických příkladů skládání relací následuje zde. * j6"h -A = {a,b}, B = {1,2}, C = {X,Y}, 35 - R = {(a, 1), (6,1), (b, 2)}, S = {(1,X)}, pak složením vznikne relace - S o R = {(a, X), (b, X)}. * Složením funkcí h(x) = x2 a /(x) = x + 1 na R vznikne funkce (foh)(x)=f(h(x)) = x2 + l. * Složením těchže funkcí „naopak" ale vznikne funkce (h o /) (x) = h(f(x)) = (x + l)2. Poznámka: Nepříjemné je, že v některých oblastech matematiky (například v algebře při skládání zobrazení) se setkáme s právě opačným zápisem skládání, kdy se místo S o R píše R ■ S nebo jen RS. Proto je si vždy dobré slovně ujasnit, které pořadí skládaných relací máme na mysli. My zde zásadně budeme používat pořadí S o R. Tvrzení 4.8. Nechť R c A x B a S C B x C jsou binárni relace. Pak inverzí složené relace S o R je relace (S o R)~ľ = R~ľ o S~ľ. Důkaz: Zopakujme si, co nám říkají výše uvedené definice: R-1 = {(b,a) | (a, b) e R} S-1 = {{c,b)\(b,c)eS} (S o R)~ľ = {(c, a) | existuje b E B takové, že (a, b) E R, (b, c) E S} Dosazením z prvních dvou vztahů do třetího vzniká (S o R)~ľ = {(c, a) | existuje b E B takové, že (b, a) E R1, (c, b) E S~ľ} a to již podle Definice 4.7 ihned implikuje požadovaný závěr (SoR)-1 = R^oS-1. □ 4.5 Skládání relací „v praxi" Podívejme se nyní, jak se skládání relací přirozeně objevuje v práci s relačními databázemi. (Dá se zjednodušeně říci, že právě v operátoru skládání tabulkových relací tkví hlavní smysl relačních databází...) Příklad 4.9. Skládání v relační databázi studentů, jejich předmětů a fakult. Mějme dvě binární relace - jednu R přiřazující studentům MU kódy jejich zapsaných předmětů, druhou S přiřazující kódy předmětů jejich mateřským fakultám. Malý výsek z těchto relací může v tabulkové reprezentaci vypadat třeba následovně. R : student (učo) předmět (kód) předmět (kód) fakulta MU 121334 MA010 MA010 FI 133935 M4135 S : IB000 FI 133935 IA102 IA102 FI 155878 M1050 M1050 PřF 155878 IB000 M4135 PřF 36 Jak z těchto „tabulkových" relací zjistíme, kteří studenti mají zapsané předměty na kterých fakultách (třeba na FI)? Jedná se jednoduše o složení relací S o R. V našem příkladě tabulkové reprezentace vyjde výsledek: SoR: student (učo) fakulta MU 121334 FI 133935 FI 133935 PřF 155878 FI 155878 PřF □ Zobecněné skládání relací V praktických použitích relačních tabulek povětšinou nevystačíme jen s binárními relacemi, takže je přirozené se ptát, jestli lze podobně skládat i více-ární relace. Odpověď je snadná - lze to a ani nepotřebujeme novou definici, vystačíme s tou, kterou už máme výše uvedenou. Definice: (skládání relací vyšší arity): Mějme relace T C K\ x K B je * injektivní (nebo také prostá) právě když pro každé x,y e A, x ^ y platí f(x) ý f{v)'i •- * surjektivní (nebo také „na") právě když pro každé y e B existuje x e A takové, že f (x) = y, "V—i Pi Y * bijektivní (vzáj. jednoznačná) právě když je injektivní a současně surjektivní. —• -í=- 49 Komentář: Následují jednoduché ukázky vlastností funkcí. * Funkce plus : N x N —> N je surjektivní, ale není prostá. 2x 2x — 1 jestliže x < 0, c jinak je bijektivní. * Funkce 0 : 0 —> 0 je bijektivní. * Funkce 0 : 0 —?► {a, b} je injektivní, ale není surjektivní. Příklad 6.2. Dokázali byste nalézt jednoduše (tj. „hezky") vypočitatelnou bijektivní funkci N->Nx Nľ V řešení si problém nejprve zkusíme představit vhodným geometrickým modelem (není to nutné, ale velmi dobré pro pochopení). Množina N x N nechť je představována všemi jednotkovými čtverečky v prvním kvadrantu roviny. Celý tento kvadrant postupně vyplňujeme po krocích většími čtverci z levého dolní rohu, tj. postupně o rozměrech lxl, 2 x 2, 3 x 3, atd. Co nám v každém kroku i přibude (postupujeme od i = 0)? Bude to pásek 2i + l jednotkových čtverečků ve tvaru H. Pokud tyto pásky narovnáme a seřadíme za sebou, dostaneme jednostranně nekonečný pás jednotkových čtverečků, což znamená pro nás množinu N. Kýžená bijekce je na světě! Nyní zbývá formální stránka věci - zapsat tuto bijekci předpisem, čili vzorcem. K tomu si připomeneme, že N = {0,1, 2, 3,... }. Jak si sami můžete snadno ověřit, předpis výpočtu hodnoty f(n), kde / : N -} N x N je výše geometricky popsaná bijekce, je následující: * Nalezneme největší k takové, že k2 < n (k := Lv^J)- * Pro n — k2 < k máme f (n) := (k,n — k2), kdežto pro n — k2 > k je f (n) := (k2 + 2k — n, k). □ Příklad 6.3. Pro jaké hodnoty parametrů a, b je funkce f (x) = ax3 + 3x2 + bx z R do R injektivní či surjektivní? Nejprve rozebereme případ a = 0, kdy platí /(O) = f (—b/3) = 1. Pro b ^ 0 je —b/3 ý 0? kdežto pro 6 = 0 zase platí f(l) = /(—1) = 4. Tudíž pro a = 0 funkce / nemůže být nikdy injektivní. Zároveň pro a = 0 nemůže být ani surjektivní, neboť pro každé x platí, že f(x) = 3x2 + bx > —b2/12. Nechť tedy a > 0. Potom linx^-oo f(x) = — oo a linx^oo f(x) = oo a vzhledem ke spojitosti funkce / musí nabývat všech reálných hodnot a je surjektivní. Totéž platí pro a < 0. Zodpovězení otázky, kdy je / injektivní, již vyžaduje některé základní poznatky matematické analýzy. Ze školní znalosti průběhu polynomické funkce plyne, že taje prostá právě tehdy, když nemá žádný lokální extrém. V případě kubického polynomu to konkrétně znamená, že první derivace nesmí být nulová ve dvou různých reálných bodech. Vyjádřeno příslušnou kvadratickou rovnicí, f'(x) = 3ax2 + Qx + b = 0, dostáváme z jejího determinantu podmínku 36 — \2ab < 0. Závěr: Funkce / je surjektivní, právě když a / 0. Funkce / je injektivní, právě když a ý 0 a 36 - 12a6 < 0. □ 50 Inverze funkce Inverze funkce je dána definicí inverze relace z Oddílu 4.4. Komentář: Příklady inverzí pro běžné funkce: * Inverzí bijektivní funkce f(x) = x + 1 na TL je funkce f^1(x) = x — 1. * Inverzí prosté funkce f(x) = ex na R je parciální funkce f^1(x) = lnx. * Funkce g(x) = x mod 3 není prostá na N, a proto její inverzí je „jen" relace g^1 = {(a, 6) | a = 6 mod 3}. Konkrétně f^1 ={(0,0), (0,3), (0, 6),..., (1,1), (1,4), ...,(2, 2), (2, 5),... }. K pojmu inverze funkce se vztahují následující základní a jednoduché poznatky: Tvrzení 6.4. Mějme funkcí f : A —>• B. Pak její inverzní relace f~ľ je a) parciální funkce právě když f je prostá, b) funkce právě když f je bijektivní. Důkaz vyplývá přímo z definic funkce a inverze relace. □ Tvrzení 6.5. Je-li inverzní relace f~ľ funkce f taktéž parciální funkcí, tak platí f^1(f(x)) = x pro všechna x z definičního oboru. Důkaz vyplývá přímo z definic funkce a inverze relace. □ 6.2 Skládání funkcí, permutace Obdobně jako u inverze, i skládání funkcí je dáno definicí skládání relací z Oddílu 4.4. Jelikož však definice skládání relací je poměrně složitá, je vhodné si uvést alternativní jednoduchou definici skládání pouze pro funkce. Fakt: Mějme funkce (zobrazení) f: A^tB&g: B^tC. Pak jejich složením coby relací v tomto pořadí vznikne zobrazení (g o /) : A —> C definované (9° f)(x) ■= g(f(x))- Komentář: * Jak například na běžné kalkulačce vypočteme hodnotu funkce sin2 x ? Složíme (v tomto pořadí) „elementární" funkce f(x) = sin x a g(x) = x2. * Jak bychom na „elementární" funkce rozložili aritmetický výraz 21og(x2 + 1)? Ve správném pořadí složíme funkce f\(x) = x2, f'2{x) = x + 1, fs(x) = logx a f$(x) = 2x. * A jak bychom obdobně vyjádřili složením funkcí aritmetický výraz sin x + cos x? Opět je odpověď přímočará, vezmeme „elementární" funkce g\(x) = sin x a g2Íx) = cosx, a pak je „složíme" další funkcí h(x, y) = x + y. Vidíme však, že takto pojaté „skládání" už nezapadá hladce do našeho zjednodušeného formalismu skládání relací. Pro nedostatek prostoru si skládání funkcí s více parametry nedefinujeme, ale sami vidíte, že obdobné skládání se v programátorské praxi vyskytuje doslova „na každém rohu" a ani se nad tím nepozastavujeme. 51 Skládání permutací Po zbytek tohoto oddílu se zaměříme na permutace coby speciální případ (bijektivních) zobrazení, neboť dobře ilustrují problematiku skládání bez zbytečných technických komplikací a zároveň se jedná o užitečnou oblast diskrétní matematiky. Definice: Nechť permutace 7r množiny {1,2,... ,n} je určena seřazením jejích prvků (pi,... ,pn)- Pak 7T je zároveň bijektivním zobrazením {1,... ,n} —> {1,... ,n} definovaným předpisem tt(í) = p,i. Tudíž lze permutace skládat jako relace podle Definice 4.7. Poznámka: Všechny permutace množiny {1,2,... ,n} spolu s operací skládání tvoří grupu, zvanou symetrická grupa Sn. Permutační grupy (podgrupy symetrické grupy) jsou velice důležité v algebře, neboť každá konečná grupa je vlastně isomorfní některé permutační grupě. Komentář: Příkladem permutace vyskytujícím se v programátorské praxi je třeba zobrazení i i—> (i + 1) mod n ("inkrement"). Často se třeba lze setkat (aniž si to mnohdy uvědomujeme) s permutacemi při indexaci prvků polí. Pro formální úplnost výkladu o permutacích si ještě uvedeme jednoduché: Tvrzení 6.6. Mějme permutace n a o množiny {1,2,... ,n}. Pak jejich složení a on je opět permutací množiny {1,2,... ,n}. Důkaz vyplývá snadno aplikací definice bijektivní funkce. □ V kontextu pohledu na funkce a jejich skládání coby relací si zavedeme jiný, názornější, způsob zápisu permutací - pomocí jejich cyklů. Definice: Nechť 7r je permutace na množině A. Cyklem v 7r rozumíme posloupnost (ai, a,2, ■ ■ ■, Ofc) různých prvků A takovou, že 7r(<2j) = aj+i pro i = 1,2,..., k — 1 a 7r(afc) = a\. Jak název napovídá, v zápise cyklu (a1; a2,..., a^) není důležité, kterým prvkem začneme, ale jen dodržení cyklického pořadí. Cyklus v permutaci může mít i jen jeden prvek (zobrazený na sebe). Komentář: Nakreslete si (vámi zvolenou) permutaci tv obrázkem, ve kterém vedete šipku vždy od prvku i k prvku tt(í). Pak uvidíte, že cykly dle naší definice jsou právě cykly tvořené šipkami ve vašem obrázku. S tímto grafickým zobrazením pro vás nebude problém pochopit následující látku. Například permutaci (5, 3,4, 8, 6,1, 7, 2) si lze obrázkem nakreslit takto: Reprezentace permutací jejich cykly Věta 6.7. Každou permutaci tt na konečné množině A lze zapsat jako složení cyklů na disjunktních podmnožinách (rozkladu) A. 52 Důkaz: Vezmeme libovolný prvek aľ G A a iterujeme zobrazení a2 = 7r(<2i), 03 = 7r(a2), atd., až se dostaneme „zpět" k a^+i = 7r(afc) = aľ. Proč tento proces skončí? Protože A je konečná a tudíž ke zopakování některého prvku a^+i musí dojít. Nadto je 7r prostá, a proto nemůže nastat ir(ak) = clj pro j > 1. Takto získáme první cyklus (ai,..., a^). Induktivně pokračujeme s hledáním dalších cyklů ve zbylé množině A' = A \ {ai,..., afc}, dokud nezůstane prázdná. V tomto indukčním kroku si musíme uvědomit, že 7T omezené na nosnou množinu A' je stále permutací podle definice (neboli žádná prvek z A' se nezobrazí do {a1;..., a^}). □ Značení permutace jejími cykly: Nechť se permutace 7r podle Věty 6.7 skládá z cyklů (ai,..., <2fc), (61,..., 6/) až třeba (zi,..., zm). Pak zapíšeme 7T = ((ai,..., ak) (61,..., 6Z) ... {zu ...,zm)). Komentář: Primitivní pseudonáhodné generátory v počítačích iterují z náhodného počátku permutaci danou vztahem i 1—> (i + p) mod q. Je pochopitelné, že tato permutace nesmí obsahovat krátké cykly, lépe řečeno, měla by se skládat z jediného (dlouhého) cyklu. (Pro úplnost, jedná se o permutaci množiny {0,1,... , q — 1}). Příklad 6.8. Ukázka skládání permutací daných svými cykly. Vezměme 7-prvkovou permutaci 7r = (3,4, 5, 6, 7,1, 2). Ta se skládá z jediného cyklu (1, 3, 5, 7, 2,4, 6). Jiná permutace a = (5, 3,4, 2, 6,1, 7) se rozkládá na tři cykly (1, 5, 6), (2, 3,4) a (7). Nyní určíme složení a on těchto dvou permutací (už přímo v zápisu cykly): ((1, 5, 6)(2, 3,4)(7)) o ((1, 3, 5, 7, 2,4, 6)) = ((1,4)(2)(3, 6, 5, 7)) (Nezapomínejme, že první se ve složení aplikuje pravá permutace!) Postup skládání jsme použili následovný: 1 se zobrazí v permutaci vpravo na 3 a pak vlevo na 4. Následně 4 se zobrazí na 6 a pak na 1. Tím „uzavřeme" první cyklus (1,4). Dále se 2 zobrazí na 4 a pak hned zpět na 2, tj. má samostatný cyklus. Zbylý cyklus (3, 6, 5, 7) určíme analogicky. □ 6.3 Induktivní definice množin a funkcí Dalším výkladem se vracíme k podstatě množin a funkcí a k jejich popisu. Vzpomeňme si na definici posloupnosti rekurentním vztahem z Oddílu 3.4. Přímým zobecněním dřívějších rekurentních definic je následující koncept. Definice 6.9. Induktivní definice množiny. Jedná se obecně o popis (nějaké) množiny M v následujícím tvaru: • Je dáno několik pevných (bazických) prvků a1; a2,..., ak G M. • Je dán soubor induktivních pravidel typu Jsou-li (libovolné prvky) x1}..., G M, pak také y G M. V tomto případě je y typicky funkcí y = fi(xi,..., xe). Pak naše induktivně definovaná množina M je určena jako nejmenší (inkluzí) množina vyhovující těmto pravidlům. 53 Komentář: Několik ukázek... • Pro nejbližší příklad induktivní definice se obrátíme na množinu všech přirozených čísel, která je formálně zavedena následovně. - OéN - Je-li i G N, pak také j + leN. • Pro každé y G N můžeme definovat jinou množinu My C N induktivně takto: - y e My - Jestliže x G My a x + 1 je liché, pak x + 2 G M^. Pak například M3 = {3}, nebo M4 = {4 + 2i | i G N}. • Dalším příkladem induktivní definice je už známé zavedení výrokových formulí z Oddílu 1.5. Uměli byste teď přesně říci, co tam byly bázické prvky a jaká byla induktivní pravidla? A jaká byla v definici formulí role přítomných závorek? K tomu se blíže vyjádříme v Definici 6.10. Jednoznačnost induktivních definic Definice: Řekneme, že daná induktivní definice množiny M je jednoznačná, právě když každý prvek M lze odvodit z bázických prvků pomocí induktivních pravidel právě jedním způsobem. Komentář: Definujme například množinu M C N induktivně takto: - 2,3 G M - Jestliže x, y G M a x < y, pak také x2 + y2 a x ■ y jsou prvky M. Proč tato induktivní definice není jednoznačná? Například číslo 8 G M lze odvodit způsobem 8 = 2 • (2 • 2), ale zároveň zcela jinak 8 = 22 + 22. V čem tedy spočívá důležitost jednoznačných induktivních definic množin? Je to především v dalším možném využití induktivní definice množiny jako „základny" pro odvozené vyšší definice, viz následující Definice 6.10 a třeba doplňková Věta 6.13. Stručně a neformálně řečeno, hlavní role jednoznačnosti induktivní definice je v možnosti pak přiřadit prvkům této induktivní množiny nějaký „jednoznačný význam". Induktivně definovaná množina povětšinou nemá valný význam sama o sobě, avšak poskytuje defíniční obor pro následnou induktivně definovanou funkci: Definice 6.10. Induktivní definice funkce z induktivní množiny. Nechť množina M je dána jednoznačnou induktivní definicí. Pak říkáme, že funkce ÍF : M —> X je definována induktivně (vzhledem k induktivní definici M), pokud je řečeno: • Pro každý z bázických prvků a\,a2,... G M je určeno Tia^) = q, kde q je konstanta. • Pro každé induktivní pravidlo typu "Jsou-li (libovolné prvky) x\,..., x i G M, pak také f{x\,..., x i) G M" je definováno j(x\,..., Xf) ) na základě hodnot T(x\),..., T(xg). 54 Komentář: Ilustrujme si induktivní definici funkce dětskou hrou na „tichou poštu". Definičním oborem je řada sedících hráčů, kde ten první je bazickým prvkem a každý následující (mimo posledního) odvozuje hráče sedícího hned za ním jako další prvek hry. Hodnotou bazického prvku je první (vymyšlené) posílané slovo. Induktivní pravidlo pak následujícímu hráči přiřazuje slovo, které je odvozeno („zkomolením") ze slova předchozího hráče. Výsledkem hry pak je hodnota-slovo posledního hráče. Pro další příklad se podívejme třeba do manuálových stránek unixového příkazu test EXPRESSION: EXPRESSION is true or false and sets exit status. It is one of: ( EXPRESSION ) EXPRESSION is true ! EXPRESSION EXPRESSION is false EXPRESSI0N1 -a EXPRESSI0N2 both EXPRESSI0N1 and EXPRESSI0N2 are true EXPRESSI0N1 -o EXPRESSI0N2 either EXPRESSI0N1 or EXPRESSI0N2 is true [-n] STRING the length of STRING is nonzero STRING1 = STRING2 the strings are equal Vidíte, jak tato ukázka krásně koresponduje s Definicí 6.10? No, ne úplně, poněkud problematická je otázka jednoznačnosti této definice - jednoznačnost není vynucena (jen umožněna) syntaktickými pravidly, jinak je pak dána nepsanými konvencemi implementace příkazu. To je pochopitelně z matematického hlediska špatně, ale přesto jde o pěknou ukázku z praktického života informatika. Induktivní definice se „strukturální" indukcí Závěrem ještě doplňkově zařazujeme malou ukázku, kterak přirozeně zkombinovat induktivní definice s pokročilou formou matematické indukce v dokazování, s tzv. strukturální indukcí Příklad 6.11. Jednoduché aritmetické výrazy a jejich význam. Nechť je dána abeceda E = {0,1, 2, 3,4, 5, 6, 7, 8, 9, 0, ©, (,)}. Definujme množinu jednoduchých výrazů SExp C S* induktivně takto: - Dekadický zápis každého přirozeného čísla n je prvek SExp. - Jestliže x, y G SExp, pak také (x) 0 (y) a (x) © (y) jsou prvky SExp. - Jak vidíme, díky nucenému závorkování je tato induktivní definice jednoduchých výrazů (nikoliv jejich „hodnot") jednoznačná. Tímto jsme aritmetickým výrazům přiřadili jejich „formu", tedy syntaxi. Pro přiřazení „významu", tj. sémantiky aritmetického výrazu, následně definujme funkci Val: SExp —> N induktivně takto: - Bázické prvky: Val(n) = n, kde n je dekadický zápis přirozeného čísla n. - První induktivní pravidlo: Val((x) © (y)) = Val(x) + Val(y). - Druhé induktivní pravidlo: Val((x) 0 (y)) = Val(x) ■ Val(y). Co je pak „správným významem" (hodnotou) uvedených jednoduchých aritmetických výrazů? (Příklad 6.12) □ Příklad 6.12. Důkaz správnosti přiřazeného „významu" Val: SExp —> N. Věta. Pro každý výraz o G SExp je hodnota Val(a) z Příkladu 6.11 číselně rovna výsledku vyhodnocení výrazu o podle běžných zvyklostí aritmetiky. 55 Jelikož pojednáváme o induktivně definované funkci Val, je přirozené pro důkaz jejích vlastností aplikovat matematickou indukci. Na rozdíl od dříve probíraných příkladů zde nevidíme žádný celočíselný „parametr n", a proto si jej budeme muset nejprve definovat. Naši indukci tedy povedeme podle „délky l odvození výrazu a" definované jako počet aplikací induktivních pravidel potřebných k odvození o G SExp. Důkaz: V bázi indukce ověříme vyhodnocení bázických prvků, kteréžto jsou zde dekadické zápisy přirozených čísel. Platí Val(n) = n, což skutečně odpovídá zvyklostem aritmetiky. V indukčním kroku se podíváme na vyhodnocení Val((x) © (y)) = Val(x) + Val(y). Podle běžných zvyklostí aritmetiky by hodnota Val((x) © (y)) měla být rovna součtu vyhodnocení výrazu x, což je podle indukčního předpokladu rovno Val(x) (x má zřejmě kratší délku odvození), a vyhodnocení výrazu y, což je podle indukčního předpokladu rovno Val(y). Takže skutečně Val((x) © (y)) = Val(x) + Val(y). Druhé pravidlo Val((x) 0 (y)) se dořeší analogicky. □ Dodatek: důkaz pro normální tvar formule V Oddíle 1.5 jsme stručně zavedli výrokovou matematickou logiku a výrokové formule. Nyní si snadno můžeme všimnout, že jak definice syntaxe, tak i definice sémantiky výrokové logiky jsou induktivní ve smyslu (po řadě) Definic 6.9 a 6.10. Také Metoda 1.19 pro převod formule do normálního tvaru je induktivní, a proto je na místě následující ilustrativní ukázka důkazu strukturální indukcí: Věta 6.13. Pro libovolnou výrokovou formuli ip platí (viz Metoda 1.19), že a) ÍF(íp) je ekvivalentní formule k ip v normálním tvaru b) a Q(íp) je formule v normálním tvaru ekvivalentní negaci ~np. Důkaz povedeme indukcí ke struktuře formule, neboli indukci povedeme podle „délky" l - počtu aplikací induktivních pravidel při sestavování formule ip. • Báze indukce [l = 0): Pro všechny atomy, tj. výrokové proměnné, zřejmě platí, že ÍF(A) = A je ekvivalentní A a Q (A) = ->A je ekvivalentní -• ip2) = ÍF(ípi) =>• ÍF((p2). Podle indukčního předpokladu jsou Ffyi) i -^(^2) formule v normálním tvaru ekvivalentní • -^(^2) Je v normálním tvaru dle definice a podle sémantiky =^ je ta ekvivalentní formuli 56 Obdobně rozepíšeme G ď) = G(• ¥2) = F(tpi) A G (^2)- Jelikož A je pro nás jen zkratka, výraz dále rozepíšeme G (ý) = ^{^{^1) =^ ~^G{lf2))- Podle indukčního předpokladu (a dvojí negace) jsou ÍF((pi) a -- íf2, což jsme zde měli dokázat. * ip = (• ^(^2) je ekvivalentní formuli (-k/?i =>• ^2) = ■0, což bylo třeba dokázat. Stejně tak G (ý) = G(~"fi =>• ^2) = ^ľ(_,Vi) A (^2) je podle předchozích případů důkazu ekvivalentní (—upi A —1(^2) = -ľ0- * i(j = (—•-Ž>—•-5>—• Například buď fíCNxN definovaná takto: R = {(i, i + | i €= N}. Pak tranzitivní uzávěr R+ je běžné ostré lineární uspořádání < přirozených čísel. A jak bylo dříve řečeno, antisymetrický uzávěr relace prostě nedává smysl. Příklad 6.16. Studenti předmětu IB000 sedí v lavicích v obdélníkové posluchárně (však to dobře znáte). Ne všechny sedačky jsou nutně obsazené. Defínujeme relaci R tak, že dvojice studentů (a, 6) náleží do R, právě když b sedí ve stejné řadě vlevo od a nebo b sedí ve stejném sloupci před a. a) Dokažte, že tranzitivní uzávěr R je antisymtrická relace. b) Kolik nejméně a nejvíce tříd ekvivalence může defínovat reůexivní, symetrický a tranzitivní uzávěr relace R ? Část (a) dokážeme sporem; nechť tedy platí (a, 6), (6, a) G R+ kde a ^ b. Proč by toto nemělo nastat? Pro důkaz si pomůžeme jednoduchým trikem: pro studenta x definujeme hodnotu s(x) := i + j, kde i je řada a j sloupec, ve kterých x sedí, číslováno zleva a zepředu. Pak podle popisu relace R zřejmě platí s(x) > s(y) pokud (x,y) G R. Podle definice tranzitivního uzávěru pak s(a) > s(6) jakmile (a, 6) G R+ a a ^ b, avšak také s(a) < s(6) jelikož (b,a) G R+. To je zřejmě spor. Nyní přejdeme k části (b). Označme S reflexivní, symetrický a tranzitivní uzávěr relace R. Nejméně tříd, jednu, získáme při plném obsazení posluchárny, ať už má jakékoliv rozměry. Vezměme kterékoliv dva různé studenty a, b. Podle definice reflexivního a symetrického uzávěru existuje student c sedící ve stejné řadě jako a a ve stejném sloupci jako 6 (může to být i jeden z a,b), přičemž platí (a, c), (c, 6) G S. Podle definice tranzitivního uzávěru pak (a, 6) G S, a proto a, b leží ve stejné jedné třídě podle Věty 5.7. Naopak nejvíce tříd získáme, pokud žádní dva studenti nesedí ve stejné řadě nebo stejném sloupci (třeba sedí jen na jedné úhlopříčce). Počet tříd pak zřejmě je l rovno minimu z počtu řad a sloupců posluchárny. Předpokládejme pro spor, že by mohlo existovat více než l tříd ekvivalence uzávěru S. Zvolme z každé třídy jednoho studenta jako reprezentanta. Podle Dirichletova principu někteří dva a, b z vybraných studentů sedí ve stejné řadě či sloupci. Podle definice naší relace R a symetrického uzávěru platí (a, 6) G S. Avšak a, b pochází z různých tříd ekvivalence a to je ve sporu s Větou 5.7. □ 58 Příklad 6.17. Proč při výpočtu tranzitivního uzávěru relace na konečné množině podle vzorce R+ = \Jt*L1T"t(R) vždy stačí uvažovat konečně mnoho členů tohoto sjednocení? Pro odpověď si uvědomme zásadní fakt — pokud 7~í+1 = T\ tak už platí 7~í+fc = T% pro všechna přirozená k. Neboli je potřeba sjednotit jen tolik prvních členů, dokud se ony „zvětšují", což může nastat jen konečně krát nad konečnou množinou. Mimo jiné tak vidíme, že uvedený popis tranzitivního uzávěru je konstruktivní. □ Rozšiřující studium S formalizací pojmu funkce a jejími vlastnostmi se setkáváte především v matematice, avšak například na bijektivní funkce narazíte hned při zpracování dat při volbě klíče apod. Našim cílem bylo ukázat práci s funkcemi v jejich abstraktní podobě, tj. bez vazby na nějaký konkrétní analytické vzoreček jako v matematice. Takové abstraktní pojetí je bližší tomu, jak relace a funkce využívá informatika. Poslední částí látky o množinách a relacích je problematika induktivních definic, které ač ve formálním podání mohou nejprve vypadat nepochopitelně, jsou ve skutečnosti zcela přirozenou popisnou metodou v mnoha aplikačních sférách informatiky a jejich alespoň intuitivní ovládání pro vás bude v dalším studiu informatiky nezbytné. Schválně, zkuste se podívat do kterékoliv vaší oblíbené oblasti informatiky, kde všude induktivní dennice (tj. ty odvolávající se rekurzivně samy na sebe pro „menšípřípady"), najdete. Ať už přímo či nepřímo. V Lekci uvedený příklad příkazu 'test EXPRESSIDN' je jen vybraným zrníčkem písku v hromadě dalších použití. 59 7 Pojem grafu Úvod Po relacích se náš výklad upře směrem k další základní struktuře diskrétní matematiky. Třebaže grafy (pozor, nepleťte si s grafem funkce) jsou jen jedním z mnoha objektů zkoumání v matematice a vlastně pouze speciálním případem binárních relací, vydobyly si svou užitečností a názorností (a to především ve vztahu k informatice) důležité místo na slunci. Dá se tak bez nadsázky říci, že teorie grafů je asi nejvýznamnější součástí soudobé diskrétní matematiky, a proto se jí budeme věnovat po tři následující lekce. Neformálně řečeno, graf se skládá z vrcholů, které si představíme jako nakreslené „puntíky", a z hran, které spojují dvojice vrcholů mezi sebou. Své důležité místo si grafy získaly dobře vyváženou kombinací vlastností - snadno pochopitelným názorným nakreslením a zároveň jednoduchým zpracováním na počítačích. Díky těmto vlastnostem se grafy prosadily jako vhodný matematický model pro popis různých vztahů mezi daty a objekty. Cíle Defínujeme, co je graf a jaké jsou nejzákladnější grafové pojmy (třeba hrany a stupně, podgrafy, souvislost). Klademe důraz na to, aby se čtenář naučil grafy uchopit a účelně s nimi pracovat a také aby správně viděl „stejnost" (isomorfísmus) grafů. Poté se věnujeme nej jednoduššímu druhu grafů, totiž stromům. Jedná se vesměs o pojmy, které se hojně vyskytují v informatických aplikacích grafů a především pak ve většině základních algoritmů, které se student informatiky učí. 7.1 Definice grafu Hned na úvod přistoupíme k formální definici grafu. Bude se jednat o definici tzv. jednoduchého neorientovaného grafu, který budeme považovat za základní, pokud neřekneme jinak. Svým způsobem navazujeme na reprezentace relací v Oddíle 4.2. Definice 7.1. Graf je uspořádaná dvojice g = (v, e), kde v je konečná množina vrcholů a e ]e množina hran - množina vybraných dvouprvkových podmnožin množiny vrcholů; tj. e C . Značení: Hranu mezi vrcholy uati píšeme jako {u, v}, nebo zkráceně uv. Vrcholy spojené hranou jsou sousední a hrana uv vychází z vrcholů u a. v. Na množinu vrcholů známého grafu g odkazujeme jako na v(g), na množinu hran e(g). Komentář: Grafy se často zadávají přímo názorným obrázkem, jinak je lze formálně zadat výčtem vrcholů a výčtem hran. Například: 1 2 3 4 ^ = {1,2,3,4}, e = {{1,2}, {1,3}, {1,4}, {3,4}} Na graf se lze dívat také jako na symetrickou ireflexivní relaci, kde hrany tvoří právě dvojice prvků z této relace. Pro další výklad je žádoucí si uvědomit, že v základním podání jsou vrcholy grafu vždy „bezejmenné" (neformálně máme jen ty puntíky, které žádné jméno nemusí mít přiřazené). Jména vrcholům grafu přiřazujeme jen pro účely zápisu či popisu tohoto grafu a můžeme je volit libovolně. 60 Stupně vrcholů v grafu Máme-li graf, často nás zajímá, kolik z kterého vrcholu vychází hran-spojnic, neboli kolik má vrchol „sousedů". Proto jedním z prvních definovaným pojmů bude stupeň vrcholu v grafu. Definice 7.2. Stupněm vrcholu v v grafu G rozumíme počet hran vycházejících z v. Stupeň v v grafu G značíme de (v). Komentář: Slovo „vycházející" zde nenaznačuje žádný směr; je totiž obecnou konvencí u neorientovaných grafů říkat, že hrana vychází z obou svých konců zároveň. Například v nakreslené ukázce jsou stupně přímo zapsány u vrcholů. Definice: Graf je d-regulární, pokud všechny jeho vrcholy mají stejný stupeň d. Značení: Nejvyššístupeň v grafu G značíme A(G) a nejnižší b~(G). Věta 7.3. Součet stupňů v grafu je vždy sudý, roven dvojnásobku počtu hran. Důkaz. Při sčítání stupňů vrcholů v grafu započítáme každou hranu dvakrát - jednou za každý její konec. Proto také výsledek vyjde sudý. □ Příklad 7.4. Zodpovězme následující otázky: a) Kolik hran má graf se 17 vrcholy stupňů 4ľ b) Existují dva „různé" grafy se 6 vrcholy stupňů 2? V otázce (a) je součet stupňů 17 • 4 = 68 a podle Věty 7.3 je počet hran 68/2 = 34. V (b) existují dva velmi odlišné grafy uvedené vlastnosti, snadno je nakreslíme takto: V dalším textu si zavedeme některé základní názvy, které nám umožní podobně jednoduché grafy snadno a stejně názorně popisovat slovy místo obrázků. □ Běžné typy grafů Pro snadnější vyjadřování je zvykem některé běžné typy grafů nazývat popisnými jmény. Jde čistě o věc konvence a autoři se mohou v některých názvech lišit (i přicházet s novými názvy), avšak následujících pět názvů patří k všeobecným základům teorie grafů. 61 Kružnice délky n má n > 3 různých vrcholů spojených „do jednoho cyklu" n hranami: 3 c n Cesta délky n > 0 má n + 1 různých vrcholů spojených „za sebou" n hranami: 12 3 4 n n + 1 Úplný graf na n > 1 vrcholech má n různých vrcholů spojených po všech dvojicích (tj. celkem (™) hran): 3 Kr Úplný bipartitní graf na m > 1 a n > 1 vrcholech má m+n vrcholů ve dvou skupinách (partitách), přičemž hranami jsou spojeny všechny m ■ n dvojice z různých skupin: 12 3 4 m V 2' 3' • • • rí Hvězda s n > 1 rameny je zvláštní název pro úplný bipartitní graf K\^n: 3 Definice: Formálně nechť kružnice délky n > 3 je graf Cn, kde V(Cn) = {1, 2,..., n} a E(Cn) = {{i,i + 1} : 1 < i < n) U {{n, 1}}. Nechť cesto délky n > 0 je graf Pn, kde V(Pn) = {1,2,... ,n + l} aE(Pn) = {{i,i + l} : 1 < i < n+l}. Nechť úplný graf na n > 1 vrcholech je ií^, kde V(Kn) = {1, 2,..., n} a £(Ä„) = {{i, j} : 1 < i < j < n}. Nechť 62 úplný bipartitní grafna m > 1 a n > 1 vrcholech je Km,n, kde V(Km,n) = {1,2,... ,m, m+ 1,..., m + n} a E(Km^n) = {{i, j} : 1 < i < m, m + 1 < j < m + n}. Příklad 7.5. Zodpovězte si sami následující snadné otázky: * Pro jakou hodnotu n je úplný graf Kn zároveň cestou? * Pro jakou hodnotu n je úplný graf Kn zároveň kružnici? * Pro jaké hodnoty m,n > 0 je úplný bipartitní graf Km,n zároveň kružnici? * Kolik hran musíte přidat do kružnice délky 6, aby vznikl úplný graf na 6 vrcholech? * Pro jaké hodnoty m,n > 0 úplný bipartitní graf Km,n neobsahuje žádnou kružnici?□ Zmínka o zobecněných grafech Komentář: Všimněme si, že v definici grafu (Def. 7.1) vůbec neuvažujeme možnosti vícenásobných hran (mezi stejnou dvojicí vrcholů) a tzv. „smyček" (hrana se stejným jedním koncem)—takovému zobecnění by se říkalo multigraf; ani zatím nepřisuzujeme hranám žádný směr. V Lekci 9 si však ještě zavedeme orientované grafy, které každé hraně přiřazují jistý směr. Orientované grafy budou mít množinu orientovaných hran A C V{G) x V{G) a zobrazíme je třeba takto... 7.2 Podgrafy a Isomorfismus Dva základní nástroje pro práci s grafy jsou následující; možnost popisovat „část grafu" (podobně jako podmnožinu množiny, avšak je nutno se vyvarovat nekorektních situací) a poznávat „stejnost" dvou grafů. Definice: Podgrafem grafu G rozumíme libovolný graf H na podmnožině vrcholů V(H) C V (G), který má za hrany libovolnou podmnožinu hran grafu G majících oba vrcholy ve V(H). Píšeme H C G, tj. stejně jako množinová inkluze (ale význam je trochu jiný). Komentář: Na následujícím obrázku vidíme zvýrazněné podmnožiny vrcholů hran. Proč se vlevo nejedná o podgraf? Obrázek vpravo už podgrafem je. 63 Definice: Indukovaným podgrafem je podgraf H C G takový, který obsahuje všechny hrany grafu G mezi dvojicemi vrcholů z V(H). „Stejnost" grafů Pozorný čtenář si možná již při čtení předchozího oddílu položil otázku: Co když vezmeme jeden graf (třeba kružnici délky 4) a nakreslíme nebo zapíšeme jej jednou tak, podruhé zase jinak - je to stále tentýž graf nebo ne? Viz obrázky dole. Přísně formálně řečeno, každé další nakreslení jistého grafu, třeba této kružnice C4, je jiným grafem, ale přitom bychom rádi řekli, že různá nakreslení téhož grafu jsou „stále stejná". Pro tuto stejnost grafů se vžil pojem isomorfní grafy. Definice 7.6. Isomorfismus ~ grafů G a, H je bijektivní {vzájemně jednoznačné) zobrazení / : V(G) —> V(H), pro které platí, že každá dvojice vrcholů u,v G V (G) je spojená hranou v G právě tehdy, když je dvojice f(u),f(v) spojená hranou v H. Grafy G a H jsou isomorfní, pokud mezi nimi existuje isomorfismus. Píšeme G ~ H. Fakt: Mějme isomorfismus / grafů G a H. Pak platí následující * G a H mají stejný počet hran, * / zobrazuje na sebe vrcholy stejných stupňů, tj. dc{v) = du{f{v)). Komentář: U výše zakreslených dvou grafů objevíme isomorfismus velmi snadno - podíváme se, jak si odpovídají vrcholy stejných stupňů. m m ^ Naopak v této trojici grafů (se stejnými počty vrcholů i hran) žádné dva nejsou isomorfní. Proč? Ten vlevo má vrchol stupně 4, čímž se od obou zbylých liší. Prostřední graf pak má 64 jediné dva vrcholy stupně 2 spojené hranou, kdežto v pravém takové dva vrcholy spojené nejsou (isomorfismus by je však i s hranou musel zachovat). Příklad 7.7. Jsou následující dva grafy isomorfní? Pokud mezi nakreslenými dvěma grafy hledáme isomorfismus, nejprve se podíváme, zda mají stejný počet vrcholů a hran. Mají. Pak se podíváme na stupně vrcholů a zjistíme, že oba mají stejnou posloupnost stupňů 2, 2, 2, 2, 3, 3. Takže ani takto jsme mezi nimi nerozlíšili a mohou (nemusejí!) být isomorfní. Dále tedy nezbývá, než zkoušet všechny přípustné možnosti zobrazení isomorfismu z levého grafu do pravého. Na levém grafu si pro ulehčení všimněme, že oba vrcholy stupně tři jsou si symetrické, proto si bez újmy na obecnosti můžeme vybrat, že nejlevější vrchol prvního grafu, označme jej 1, se zobrazí na nejlevější vrchol ľ v druhém grafu (taky stupně tři). Očíslujme zbylé vrcholy prvního grafu 2,... ,6 v kladném smyslu, jak je ukázáno na následujícím obrázku. Druhý vrchol stupně tři, označený 4, se musí zobrazit na analogický vrchol druhého grafu (pravý spodní). Pak je již jasně vidět, že další sousedé 2, 6 vrcholu 1 se zobrazí na analogické sousedy 2', 6' vrcholu ľ v druhém grafu, a stejně je to i se zbylými vrcholy 3, 5. Výsledný isomorfismus vypadá v odpovídajícím značení vrcholů takto: Abychom mohli s isomorfismem grafů přirozeně pracovat, je potřeba následující fakt: Věta 7.8. Relace „být isomorfní" ~ na třídě všech grafů je ekvivalencí. Důkaz. Relace ~ je reflexivní, protože graf je isomorfní sám sobě identickým zobrazením. Relace je také symetrická, neboť bijektivní zobrazení lze jednoznačně obrátit. Tranzitivita ~ se snadno dokáže skládáním zobrazení-isomorfismů. □ Důsledkem je, že všechny možné grafy se rozpadnou na třídy isomorfismu. V praxi pak, pokud mluvíme o grafu, myslíme tím obvykle jeho celou třídu isomorfísmu, tj. nezáleží nám na konkrétní prezentaci grafu. Komentář: Je uvedený přístup, tj. zaměňování konkrétního grafu za celou jeho třídu isomorfismu, v matematice neobvyklý? Ne, například už v geometrii jste říkali „čtverec o straně 2" či „jednotkový kruh" a podobně, aniž jste měli na mysli konkrétní obrázek, nýbrž celou třídu všech těchto shodných objektů. 65 Další grafové pojmy Definice: Mějme libovolný graf G. * Podgrafu H C G, který je isomorfní nějaké kružnici, říkáme kružnice v G. * Speciálně říkáme trojúhelník kružnici délky 3. * Podgrafu H C G, který je isomorfní nějaké cestě, říkáme cesta v G. * Podgrafu H C G, který je isomorfní nějakému úplnému grafu, říkáme klika v G. (Někdy se za kliku považuje pouze takový úplný podgraf, který je maximální vzhledem k uspořádání inkluzí.) * Podmnožině vrcholů X C V (G), mezi kterými nevedou v G vůbec žádné hrany, říkáme nezávislá množina X v G. * Indukovanému podgrafu H C G, který je isomorfní nějaké kružnici, říkáme indukovaná kružnice v G. Komentář: Uvažujme následující ukázky grafů: 6 j-* 5 1 První z ukázaných grafů například neobsahuje žádný trojúhelník, ale obsahuje kružnici délky 4, dokonce indukovanou. Druhý graf trojúhelník obsahuje a kružnici délky 4 taktéž. První graf obsahuje cestu délky 4 na vrcholech 1, 2, 3,4, 5, ale ta není indukovaná. Indukovaná cesta délky 4 v něm je třeba 2,3,4,5,6. Druhý graf tyto cesty také obsahuje, ale naopak žádná z nich není indukovaná. První graf má největší kliku velikosti 2 - jedinou hranu, kdežto druhý graf má větší kliku na vrcholech 3,4, 5. Největší nezávislá množina u obou grafů má 3 vrcholy 2,4, 6. Fakt: Mějme isomorfismus / grafů G a H. Pokud G obsahuje podgraf F, pak H také musí obsahovat podgraf isomorfní F. Obecněji lze tvrdit, že počet podgrafu v grafu G isomorfních zvolenému F je vždy roven takovému počtu v grafu H. Příklad 7.9. Jsou následující dva grafy isomorfní? Postupovat budeme jako v Příkladě 7.7, nejprve ověříme, že oba grafy mají stejně mnoho vrcholů i stejnou posloupnost stupňů 2, 2, 2, 2, 3, 3. Pokud se však budeme snažit najít mezi nimi isomorfismus, něco stále nebude vycházet, že? Co nám tedy v nalezení isomorfismu brání? Podívejme se, že v druhém grafu oba vrcholy stupně tři mají svého společného souseda, tvoří s ním trojúhelník. V prvním grafu tomu tak není, první graf dokonce nemá žádný trojúhelník. Proto zadané dva grafy nejsou isomorfní. □ 66 Příklad 7.10. Najděte všechny isomorfní dvojice grafů v následujících obrázcích tří 10-vrcholových grafů. Isomorfní dvojice odpovídajícím způsobem očíslujte, u neisomorfních toto zdůvodněte. Postupujme systematicky: Všechny tři grafy mají po 10 vrcholech a všechny vrcholy stupňů 3. Takto jsme je tedy nijak nerozlíšili. Podívejme se třeba na trojúhelníky v grafech - opět si nepomůžeme, neboť žádný z nich trojúhelníky neobsahuje. Co se tedy podívat na obsažené kružnice délky 4? Graf C jich jasně obsahuje pět, graf A po chvíli zkoumání také, ale v grafu B najdeme i při vší snaze jen tři kružnice délky 4. (Obdobného rozdílu si můžeme všimnout, pokud se zaměříme na kružnice C5, zkuste si to sami.) Takže co z dosavadního zkoumání plyne? Graf B nemůže být isomorfní žádnému z A,C. Nyní tedy zbývá najít (očekávaný) isomorfismus mezi grafy A a C. To se nám skutečně podaří poměrně snadno - stačí „prohozením" prostředních dvou vrcholů u grafu A získat lepší obrázek 8 A 9 \ < ( D \ 8 C 9 j 0^ a odpovídající bijekce je na pohled zřejmá. Pro větší názornost jsme bijekci potvrzující isomorfismus zakreslených grafů explicitně vyznačili odpovídajícím číslováním vrcholů. □ Poznámka: Výše uvedené příklady nám ukazují některé cesty, jak poznat (tj. najít nebo vyloučit) isomorfismus dvou grafů. Ty však ne vždy musí fungovat. Čtenář se může ptát, kde tedy najde nějaký univerzální postup pro nalezení isomorfismu? Bohužel vás musíme zklamat, žádný rozumný univerzální postup není znám a zatím platí, že jediná vždy fungující cesta pro nalezení či nenalezení isomorfismu mezi dvěma grafy je ve stylu vyzkoušejte všechny možnosti bijekci mezi vrcholy těchto grafů. (Těch je, jak známo, až n\.) Avšak heuristické algoritmické přístupy pracující se stupni vrcholů samotných a jejich sousedů a případně s malými podgrafy jsou v praxi velmi efektivní pro rozhodování isomorfismu. 7.3 Souvislost grafů, komponenty Důležitou globální vlastností grafů je souvislost, tedy možnost se v nich pohybovat odkudkoliv kamkoliv podél jeho hran, neboli po cestách v grafu. Tuto vlastnost si nyní upřesníme. Tvrzení 7.11. Mějme relací ~ na množině vrcholů V(G) libovolného grafu G takovou, že pro dva vrcholy x ~ y právě když existuje v G cesta začínající v x a končící v y. Pak ~ je relací ekvivalence. 67 Důkaz. Relace ~ je reflexivní, neboť každý vrchol je spojený sám se sebou cestou délky 0. Symetrická je také, protože cestu z x do y snadno v neorientovaném grafu obrátíme na cestu z y do x. Důkaz tranzitivity však není takto triviální—pokud vezmeme cestu z x do y a cestu z y do z, tak se tyto dvě cesty mohou protínat i jinde než v y a nelze je prostě „navázat" na sebe. Pro důkaz tranzitivity si označme P cestu z x do y a Q cestu z y do z. Pokud označíme P' C P tu část první cesty z x do prvního vrcholu p v průniku s Q (tj. p G V (P) H V'(Q)) a označíme Q' ^ Q zbytek druhé cesty od p do z, tak P' U Q' vždy je cestou z x do z. □ Dennice 7.12. Komponentami souvislosti grafu G nazveme třídy ekvivalence výše popsané (Tvrz. 7.11) relace ~ na V(G). Jinak se také komponentami souvislosti myslí podgrafy indukované na těchto třídách ekvivalence. Komentář: Podívejte se, kolik komponent souvislosti má tento graf: Vidíte v obrázku všechny tři komponenty? Jedna z nich je izolovaným vrcholem, druhá hranou (tj. grafem isomorfním K2) a třetí je to zbývající. Definice 7.13. Graf G je souvislý pokud je G tvořený nejvýše jednou komponentou souvislosti, tj. pokud každé dva vrcholy G jsou spojené cestou. Poznámka: Prázdný graf je souvislý a má 0 komponent. Komentář: Který z těchto dvou grafů je souvislý? Příklad 7.14. Dokažme si, že každý souvislý jednoduchý 2-regulární graf G je kružnicí (tj. isomorfní některé kružnici Cn z Oddílu 7.1). Nechť e je hranou mezi vrcholy u,v grafu G a vezměme graf G' = G — e vzniklý odebráním hrany e. Pokud by u a v náležely v G' různým komponentám souvislosti, tyto komponenty by každá měla lichý součet stupňů, což nelze podle Věty 7.3. Proto u a, v jsou spojeny cestou v G', nechť vrcholy této cesty jsou po řadě značeny u\ = u, U2,... ,uk = v. Toto značení nám nyní udává isomorfismus zobrazující vrchol Ui na vrchol i z definice kružnice Ck- Nyní už zbývá jen drobnost; dokázat, že jiné vrcholy než U\,..., uk v grafu G nejsou. Pokud bychom měli další vrchol x, pak x je spojen cestou Qdoua první vrchol z V(Q) H {ui,..., uk} by měl stupeň větší než 2, spor. □ 68 7.4 Stromy — grafy bez kružnic Podrobnější studium některých užitečných aspektů grafů začneme u toho nej jednoduššího typu grafu - na stromech, jež jsou mimo jiné základem mnoha datových typů používaných v informatice. Zároveň se zde dostaneme k prvním poctivě dokázaným a netriviálním poznatkům o grafech. Komentář: Příklady obrázků stromů následují. Zajímavostí k povšimnutí je, že v informat- Charakteristickými znaky stromů je absence kružnic a souvislost. Definice 7.15. Strom je jednoduchý souvislý graf T bez kružnic. Komentář: Obecněji les je jednoduchý graf bez kružnic (nemusí být souvislý). Komponenty souvislosti lesa jsou stromy. Jeden vrchol bez hran a prázdný graf jsou také stromy. Grafy bez kružnic také obecně nazýváme acyklické. Vlastnosti stromů Přehled základních vlastností stromů je pro nás zároveň příležitostí si ukázat několik nových hezkých matematických důkazů a naučit se správně zdůvodňovat v oblasti grafů. Tvrzení 7.16. Strom s více než jedním vrcholem obsahuje vrchol stupně 1. Důkaz: Souvislý graf s více než jedním vrcholem nemůže mít vrchol stupně 0. Proto vezmeme libovolný strom Tav něm libovolný vrchol v. Sestrojíme nyní co nejdelší cestu S v T začínající ve v: S začne libovolnou hranou vycházející z v; v každém dalším vrcholu u, do kterého se dostaneme a má stupeň větší než 1, lze pak pokračovat cestu S další novou hranou. ^ Pokud by se v S poprvé zopakoval některý vrchol, získali bychom kružnici, což ve stromě nelze. Proto cesta S musí jednou skončit v nějakém vrcholu stupně 1 v T. □ Komentář: Zamyslete se, proč v každém stromě s více než jedním vrcholem jsou alespoň dva vrcholy stupně 1 (odpověď je skrytá už v předchozím důkaze). Zároveň si odpovězte, jestli lze tvrdit, že každý strom s více než jedním vrcholem obsahuje tři vrcholy stupně 1. Věta 7.17. Strom na n vrcholech má přesně n — 1 hran pro n > 1. 69 Důkaz: Toto tvrzení dokážeme indukcí podle n. Strom s jedním vrcholem má n—1 = 0 hran. Nechť T je strom na n > 1 vrcholech. Podle Tvrzení 7.16 má T vrchol v stupně 1. Označme T' = T — v graf vzniklý z T odebráním vrcholu v. Pak T' je také souvislý bez kružnic, tudíž strom na n — 1 vrcholech. Dle indukčního předpokladu T' má n — 1 — 1 hran, a proto T má n — 1 — 1 + 1 = n — 1 hran. □ Příklad 7.18. Les G má 2015 vrcholů a 4 souvislé komponenty. Kolik má hran? Pokud počty vrcholů jednotlivých komponent lesa G po řadě označíme n1; n2, n3, n4, tak máme n\ + n2 + n3 + n4 = 2015. Každá komponenta G je strom podle definice lesa. Zároveň podle Věty 7.17 má i-tá komponenta přesně n,i — 1 hran. V součtu má G celkem (ni - 1) + (n2 - 1) + (n3 - 1) + (n4 - 1) = 2015 - 4 = 2011 hran. □ Věta 7.19. Mezi každými dvěma vrcholy stromu vede právě jediná cesta. Důkaz: Pi u ®---- ® v Jelikož strom T je souvislý dle definice, mezi libovolnými dvěma vrcholy u,v vede nějaká cesta. Pokud by existovaly dvě různé cesty P±,P2 mezi u,v, tak bychom vzali jejich symetrický rozdíl, podgraf H = P±AP2 s neprázdnou množinou hran, kde H zřejmě má všechny stupně sudé. Na druhou stranu se však podgraf stromu musí opět skládat z komponent stromů, a tudíž obsahovat vrchol stupně 1 podle Tvrzení 7.16, což je spor. Proto cesta mezi u a v existuje jen jedna. □ Důsledek 7.20. Přidáním jedné nové hrany do stromu vznikne právě jedna kružnice. Důkaz: Nechť mezi vrcholy u,v ve stromu T není hrana. Přidáním hrany e = uv vznikne právě jedna kružnice z e a jediné cesty mezi u,v v T podle Věty 7.19. □ Alternativní charakterizace stromů Z předchozích tvrzení vyplývá následující alternativní charakterizace stromů, která ukazuje důležitost jich samotných i jako tzv. koster obecných grafů (viz Oddíl 8.4). Na dané množině vrcholů je (vzhledem k inkluzi množin hran) strom • minimální souvislý graf (plyne z Věty 7.19) • a zároveň maximální acyklický graf (plyne z Důsledku 7.20). Jen tak mimochodem, kolik dokážete nalézt neisomorfních stromů na 4 nebo 5 vrcholech? Vidíte, že jich není mnoho? Nakreslete si je všechny. 7.5 Dodatek: 7 mostů jedním tahem Pravděpodobně nejstarší zaznamenaný výsledek teorie grafů pochází od Leonharda Eu-lera - jedná se o slavný problém 7-mi mostů v Královci /Kônigsbergu / dnešním Kalin-ingradě. Tento problém, či spíše matematickou hříčku, o kreslení grafů „jedním tahem" zařazujeme na závěr lekce především z důvodů historických. Eulerovo jednoduché řešení 70 má některé zajímavé a užitečné důsledky v jiných oblastech kombinatoriky, ty však přesahují rámec našeho úvodního textu. O jaký problém se 7-mi mosty se tehdy v Kônigsbergu 18-tého století jednalo? Příklad 7.21. Je možné při jedné procházce suchou nohou přejít po každém ze sedmi vyznačených mostů v Kônigsbergu právě jednou? Geniálně jednoduché řešení otázky představíme ve zbytku tohoto oddílu. □ Sled a tah v grafu Pro přesnou formulaci řešení uvedeného příkladu využijeme následující nové pojmy. Definice: Sledem délky n v grafu G rozumíme posloupnost vrcholů a hran (v0,e1,v1,e2, v2, ■ ■ .,en,vn), ve které vždy hrana e« má koncové vrcholy Ví-i,Ví. Komentář: Všimněte si, že sled je vlastně jakákoliv procházka po hranách grafu z u do v. Příkladem sledu může být průchod IP paketu internetem (včetně cyklem). Definice: Ta/z je sled v grafu bez opakování hran. Uzavřený tah]e tahem, který končí ve vrcholu, ve kterém začal. Otevřený tah je tahem, který končí v jiném vrcholu, než ve kterém začal. Komentář: Jistě znáte dětskou hříčku s „kreslením domečku jedním tahem"... Ano, to je v podstatě totéž, co tah v grafu (kterým „kreslíme" hrany našeho grafu). Fakt: Cesta je přesně otevřený tah bez opakování vrcholů. Kružnice je přesně uzavřený tah bez opakování vrcholů. (Srovnejte si toto s definicemi Oddílu 7.1.) Eulerovské grafy Slibované řešení Příkladu 7.21 od Leonharda Eulera zní takto: Věta 7.22. Graf G lze pokrýt (nakreslit) jedním uzavřeným tahem právě když G je souvislý a všechny vrcholy v G jsou sudého stupně. Komentář: Znění této věty lze velmi názorně ilustrovat následujícím obrázkem grafu a příslušného uzavřeného tahu pokrývajícího všechny hrany. 71 A jak je tomu v Příkladu 7.21? Zde nejprve nakreslíme příslušný (multi)graf, ve kterém vrcholy jsou jednotlivé kusy země oddělené vodou (tj. dva říční ostrovy a dva břehy): Jaké jsou stupně vrcholů tohoto grafy? Je to 3, 3, 3, 5, neboli všech 7 hran-mostů města Kónigsbergu nelze dle Věty 7.22 pokrýt jedním uzavřeným tahem (ani otevřeným tahem, viz Důsledek 7.23). Důsledek 7.23. Graf G lze pokrýt (nakreslit) jedním otevřeným tahem právě když G je souvislý a všechny vrcholy v G až na dva jsou sudého stupně. Důkaz: Dokazujeme oba směry ekvivalence Věty 7.22. Pokud lze G pokrýt jedním uzavřeným tahem, tak je zřejmě G souvislý a navíc má každý stupeň sudý, neboť uzavřený tah každým průchodem vrcholem pokryje dvě hrany. Naopak zvolíme mezi všemi uzavřenými tahy T obsaženými v G ten (jeden z) nejdelší. Tvrdíme, že T obsahuje všechny hrany grafu G. - Pro spor vezměme graf G' = G — E (T), o kterém předpokládejme, že je neprázdný. Jelikož G' má taktéž všechny stupně sudé, je (z indukčního předpokladu) libovolná jeho hranově-neprázdná komponenta CCG' pokrytá jedním uzavřeným tahem Tq. - Vzhledem k souvislosti grafu G každá komponenta C C G' protíná náš tah T v některém vrchole w, a tudíž lze oba tahy Tc a T „propojit přes wlí. To je spor s naším předpokladem nejdelšího možného T, neboť T U Tc je delším tahem v G. □ Důkaz důsledku: Nechť u,v jsou dva vrcholy grafu G mající lichý stupeň, neboli dva (předpokládané) konce otevřeného tahu pro G. Do G nyní přidáme nový vrchol w spojený hranami siiaw. Tím jsme náš případ převedli na předchozí případ grafu se všemi sudými stupni. □ 7.6 Příklady použití grafů Závěrem si v našem studijním textu nastíníme některé základní motivace pro zavedení a použití grafů při popisu a řešení problémů například v informatice. Příklad 7.24. Ukázky některých problémů „ze života" popsatelných grafy. Podotýkáme, že tyto ukázky jsou často velmi zjednodušené (pro jejich lepší přístupnost širokému okruhu čtenářů), ale to neubírá jejich motivačnímu potenciálu. • Vyjádření mezilidských vztahů - „mají se rádi", „kamarádí se", „nesnesou jeden druhého", apod: Zde jednotlivé osoby tvoří vrcholy grafu a vztahy jsou hranami (často neorientované, ale i orientace je přípustná). Všimněme si coby zajímavosti, jak tento model přirozeně 72 preferuje „párový" pohled na vztahy - hrany přece spojují jen dvojice vrcholů. Třebaže například vztah „kamarádí se" může být obecně platný pro větší skupinky lidí než dvojice, stejně se obvykle vyjadřuje klikou v grafu (každí dva v našem družstvu jsou dobří kamarádi...). Tato obecně pojímaná tendence vyjadřovat i složitější vztahy těmi párovými je vodou na mlýn použití teorie grafů jako téměř univerzálního vyjadřovacího prostředku v podobných případech. Na druhou stranu i teorie grafů disponuje pojmem tzv. hypergmfu umožňujícího použití hran libovolné arity (počtu koncových vrcholů), ale rozsah výskytu hypergrafů v teorii i aplikacích je oproti grafům vskutku zanedbatelný. • Vyjádření závislostí mezi objekty nebo procesy: Představme si situace, ve kterých jednotlivé entity (modelované jako vrcholy) závisí na výstupech jiných entit a naopak poskytují výstupy další entitám. Typickým příkladem mohou být závislosti jednotlivých kroků výrobního nebo rozhodovacího procesu. Ty pak vedou k definici orientovaného grafu na dané množině vrcholů/entit, tj. použití hran „se šipkami". Všimněme si, že závislosti často bývají časového charakteru (přičemž směr závislosti je implicitně jasný) a pak je nezbytnou doplňkovou podmínkou vyloučení výskytu orientovaných cyklů v modelovém grafu. Na druhou stranu existují i situace, kdy cyklické závislosti jsou dovoleny a mají svůj význam. Pro ještě jednu ukázku závislostí z běžného života informatika se podíváme na správu balíčků softwaru například v Linuxových distribucích. V tom případě jsou jednotlivé balíčky vrcholy grafu, jejich vyžadované závislosti popisují odchozí hrany a jejich poskytované vlastnosti jsou příchozími hranami grafu závislostí. Korektní instalace zvoleného balíčku pak řeší problém zahrnutí všech dalších vrcholů „dosažitelných" ze zvoleného. Vše je navíc komplikováno správou verzí balíčků, ale to už je mimo rámec našeho úvodního slova. • Modelování technických či dopravních sítí grafy: V takových případech bývají vrcholy grafu jednotlivá technická zařízení jako třeba rozvodny, routery, křižovatky a podobně, kdežto hrany jsou tvořeny spojnicemi/vedením mezi vrcholy. Často se zde setkáváme s orientovanými grafy a obecně multigrafy. K této problematice se blíže vyjadřuje Lekce 9. • Vizualizace vztahů a závislostí pro lidského pozorovatele: Nejen při řešení cvičných příkladů v naší učebnici, ale i v mnoha reálných aplikacích využívajících grafy jako modely, je velmi potřebné tyto grafy vizualizovat (tj. hezky nakreslit) pro lidského pozorovatele. Jedná se obecně o poměrně obtížný úkol, který přesahuje hranice našeho textu. □ Zpracování grafu počítačem Mějme jednoduchý graf G na n vrcholech a značme vrcholy jednoduše čísly V(G) = {0,1,..., n — 1}. Pro počítačovou implementaci grafu G se nabízejí dva základní způsoby, které budeme implicitně využívat i v některých algoritmech následujících lekcí. • Implementace maticí sousednosti G, tj. dvourozměrným polem, ve kterém hodnota G[i,j] = 1 reprezentuje hranu mezi vrcholy i a j. 73 • Implementace výčtem sousedů, tj. systémem množin, který každému vrcholu i grafu udává seznam jeho sousedů. Všimněte si, že pořadí sousedů může být jakékoliv. Poznámka: Dávejte si pozor na symetrii hran v implementaci! To znamená, že pokud uložíte hranu G[i,j] = 1, tak musíte zároveň uložit i hranu G[j, i] = 1, jinak se dočkáte v algoritmech nepříjemných překvapení. Totéž se týká i seznamů sousedů. Komentář: Implementace maticí sousednosti je hezká svou jednoduchostí. Druhá možnost se však mnohem lépe hodí pro grafy s malým počtem hran, což nastává ve většině praktických aplikací. (Navíc je implementace výčtem sousedů vhodná i pro multigrafy.) Pochopitelně je pak vhodnější místo polí používat různé spojové seznamy. Ke grafům lze do zvláštních složek přidat také ohodnocení vrcholů a hran libovolnými čísly či značkami... Rozšiřující studium Grafy můžeme v informatice potkat doslova na každém kroku, mimo jiné hojně už v základních kurzech algoritmizace. Nejen že grafy (především stromy) jsou základem mnoha programátorských datových struktur, ale představují i vhodný model pro mnoho praktických problémů, z nichž některé ochutnáte již v příští lekci. Celkově je zdejších pár lekcí teorie grafů jen lehkým úvodem do celé rozsáhlé oblasti, přičemž na FI MU lze pokračovat v jejím cíleném studiu v předmětech MA010 a MA015. Rozsáhlý matematický úvod do teorie grafů je zahrnut ve skvělé knize Kapitoly z diskrétní matematiky autorů Jiřího Matouška a Jaroslava Nešetřila. Vřele ji doporučujeme jako doplňkový studijní zdroj všem, kteří chtějí lépe pochopit grafy z jejich matematické stránky. 74 8 Procházení a zpracování grafů Úvod JVa rozdíl od předchozí lekce, která se stručně řečeno zabývala grafy z pohledu matematika, tedy podáním defínic, obrázků a vlastností, nyní se blíže budeme zabývat grafy z algoritmické či programátorské perspektivy Proto se v prvé řadě podíváme na obecné schéma procházení grafu, které je společným základem mnoha užitečných algoritmů pro zpracování grafů. Poté se hlouběji zaměříme na dvě určité grafové úlohy - hledání nejkratší cesty a minimální kostry, hojně se vyskytující v mnoha praktických obměnách. Na základě uvedeného obecného schématu si ukážeme pro ně jednoduché a velmi efektivní algoritmy. Cíle Čtenáři se, s mírným zjednodušením, seznámí s obecným algoritmickým schématem procházení a zpracování grafu. Poté pro ukázky schématu defínujeme dvě konkrétní grafové úlohy, hledání nejkratší cesty mezi dvěma vrcholy a hledání nej menší kostry, a ukážeme, jak algoritmy pro jejich řešení zapadají do vysvětleného schématu procházení. Konkrétně tak vysvětlíme Dijkstrův algoritmus pro nejkratší cesty a Kruskalův a Jarníkův algoritmus pro minimální kostru. 8.1 Jak obecně projít souvislý graf S úlohou procházení grafu se svým způsobem setkávají už děti, když hledají cestu z bludiště (jejich naivní postup se dá přirovnat k procházení grafu „do hloubky"). Z našeho pohledu základní prohledání grafu „najde" jeho komponenty souvislosti, čili určí, které hrany a vrcholy jsou ve které komponentě. Celá problematika má ale mnohem širší záběr a s vhodnou implementací dodatečných lokálních funkcí lze pouhým rutinním prohledáním grafu zpracovat odpovědi na jiné zajímavé otázky, jako najít nejkratší cestu, minimální kostru, komponenty vyšší souvislosti, apod. Navíc se procházení grafu vyskytuje jako podúloha v jiných algoritmech. Metoda 8.1. Schéma algoritmu pro procházení grafem Pro vytvoření co nejobecnějšího schématu si pomůžeme následujícími datovými stavy a pomocnou strukturou: • Vrchol grafu: má jeden ze stavů ... * počáteční (iniciační) - ten dostane na začátku, * nalezený - implicitní stav poté, co jsme jej přes některou hranu nalezli (a odložili ke zpracování později), * zpracovaný - poté, co jsme už probrali všechny hrany z něj vycházející, * (případně ještě stav „post-zpracovaný", po dokončení všech jeho následníků). • Úschovna: je pomocná datová struktura (množina s dodatečnými atributy), * udržuje odložené, tj. nalezené a ještě nezpracované vrcholy, volitelně spolu s dodatečnou specifickou informací. • Způsob, kterým se vybírají vrcholy z úschovny ke zpracování, určuje variantu algoritmu procházení grafu. • V prohledávaných vrcholech a hranách se volitelně provádějí dodatečné programové akce pro zpracování našeho grafu. 75 Samotný algoritmus pak popíšeme v následujících obecných bodech. (V této souvislosti dodáváme, že podrobněji se budeme způsobu formálního matematického zápisu algoritmů věnovat v Lekci 10, ale zde si vystačíme s běžným jazykem.) Algoritmus 8.2. Generické procházení souvislé komponenty G grafu • Vstup: Souvislý graf G, daný seznamem vrcholů a seznamy vycházejících hran z každého vrcholu, plus případné ohodnocení vrcholů a hran. • Vybereme libovolný počátek prohledávání u G V (G); úschovna U dG(u, w) . Důkaz. Postupujeme podobně jako v důkaze Tvrzení 7.11 - pokud máme cesty P,P' mezi u,v a mezi v,w, tak existuje cesta Q C P U P' mezi u,w, jež má zřejmě délku nejvýše dG(u,v) + dG(v,w). Skutečná vzdálenost mezi u,w pak už může být jen menší. □ Příklad 8.6. Proč každý 3-regulární graf na 12 vrcholech musí obsahovat dvojici vrcholů se vzdáleností 3? Dokažme požadované tvrzení sporem. Nechť v je libovolný vrchol našeho grafu G. Pak v má tři sousedy a, b, c (tj. ve vzdálenosti 1 od v). Podle definice vzdálenosti je každý 78 vrchol ve vzdálenosti 2 od v sousedem některého z a, b, c. Avšak a má za jednoho souseda v a mimo něj má už jen dva další sousedy. Stejně tak b, c. Tudíž v G existuje nejvýše šest vrcholů mimo v, kteří jsou sousedé jednoho z a, b, c. Celkem tak napočítáme (od v) jen 1 + 3 + 6 = 10 vrcholů a některý z 12 vrcholů grafu G musí být ve větší vzdálenosti než 2, spor. Zakreslete si sami tuto úvahu obrázkem. □ BFS a zjištění vzdálenosti Jak nejsnadněji určíme vzdálenost v grafu? Stačí si povšimnout hezkých vlastností procházení grafu do šířky. Věta 8.7. Algoritmus procházeni grafu do šířky lze přímo použít pro výpočet grafové vzdálenosti z daného vrcholu u. Toto je poměrně jednoduchá aplikace, kdy počátečnímu vrcholu u přiřadíme vzdálenost 0, a pak vždy každému dalšímu nalezenému vrcholu v přiřadíme vzdálenost o 1 větší než byla vzdálenost vrcholu, ze kterého byl nalezen. Důkaz se opírá o následující tvrzení: * Nechť u,v,w jsou vrcholy souvislého grafu G takové, že dG(u,v) < dc(u,w). Pak při algoritmu procházení grafu G do šířky z vrcholu u je vrchol v nalezen dříve než vrchol w. V důkaze postupujeme indukcí podle vzdálenosti dc(u,v): Pro dG{u,v) = 0, tj. u = v je tvrzení jasné - vrchol u jako počátek prohledávání byl nalezen první. Proto nechť dG(u,v) = d > 0 a označme v' souseda vrcholu v bližšího k u, tedy dc(u,v') = d — 1. Obdobně uvažme libovolného souseda w' vrcholu w. Pak dG{u,w') > dG(u,w) - 1 > dG(u,v) - 1 = dG(u,v'), a tudíž vrchol v' byl nalezen v prohledávání do šířky dříve než vrchol w' podle indukčního předpokladu. To znamená, že v' se dostal do fronty úschovny dříve než w'. Proto sousedé v' (mezi nimiž je v, ale ne w neboť v'w není hranou) jsou při pokračujícím prohledávání také nalezeni dříve, než w coby soused w'. □ 8.3 Hledání nejkratší cesty V dalším textu se již budeme věnovat grafům s „obecně dlouhými" hranami. Zároveň předesíláme, že přednášená látka stejně dobře může stavět na orientovaných grafech. Definice: Vážený graf je graf G spolu s ohodnocením w hran reálnými čísly w : E(G) —> R. Kladně vážený graf (G,w) je takový, že w(e) > 0 pro všechny hrany e. Definice 8.8. (vážená vzdálenost) Mějme (kladně) vážený graf (G,w). Váženou délkou cesty P je dG(P) = V w(e). Váženou vzdáleností v (G,w) mezi dvěma vrcholy u,v pak je dG(u,v) = min{cř^(P) : P je cesta s konci u,v} . Lema 8.9. Vážená vzdálenost v nezáporně vážených grafech (i orientovaných grafech) splňuje trojúhelníkovou nerovnost. 79 Příklad 8.10. Podívejme se na následující ohodnocený graf (čísla u hran udávají jejich váhy-délky.) Vzdálenost mezi vrcholy a, c je 3, stejně tak mezi b, c. Co ale mezi a, b! Je jejich vzdálenost 6? Kdepak, vzdálenost a, b je 5, její cesta vede po „horních" vrcholech, jak je vyznačeno. Povšimněte si, že tento příklad zároveň ukazuje, že postup prohledáváním do šířky není korektní pro hledání vzdáleností ve váženém grafu. □ Problém nejkratší cesty Problém nejkratší cesty mezi dvojicí vrcholů prostě hledá váženou vzdálenost vrcholů a příslušnou cestu. Jedná se patrně o nejznámější „grafový" problém v praktických aplikacích, jenž nalezneme od vyhledávání dopravních spojení, GPS navigací, plánování pohybů robota, až po třeba rozhodovací systémy. Tento problém se nejčastěji řeší implementací klasického Díjkstrova algoritmu, který je vhodnou úpravou procházení grafu do šířky - vybírá vždy vrchol s nejmenší vzdáleností mezi uschovanými vrcholy. Dijkstrův algoritmus Algoritmus 8.11. Hledání nejkratší cesty mezi u a v v kladně váženém grafu. Tento algoritmus využívá proměnnou hodnotu (pole) d(x) k ukládání nalezených vzdáleností do každého vrcholu x, vedle samotného vrcholu, přičemž tuto hodnotu postupně „vylepšuje" až do finálního zpracování vrcholu. • Vstup: Souvislý graf G, daný seznamem vrcholů a seznamy vycházejících hran z každého vrcholu, plus váhy w hran. Počáteční vrchol u a koncový v. • Úschovna U d'(y), odložíme U oo 1 1 oo *' \/ oo 2 \0/ \ / 2 ®-----M u i oo Jednotlivé iterace algoritmu jsou zakresleny níže. Čísla u vrcholů v obrázcích udávají průběžně aktualizovanou dočasnou vzdálenost z u. oo 2 Ač 1 oo v A 2 1 7 oo 5 oo 1 1 / 3 oo 2 □ 81 Důkaz správnosti Věta 8.13. Díjkstrův Algoritmus 8.11 pro kladně vážený graf (G,w) vždy správně najde nejkratší cestu mezi danými vrcholy u,v. Důkaz vede přes následující zesílené tvrzení indukcí: • V každé iteraci Algoritmu 8.11 hodnota d(x) udává nejkratší vzdálenost z vrcholu u do x při cestě pouze po už zpracovaných vnitřních vrcholech. V bázi indukce dovolujeme pouze cesty používající u a x, tj. jen hrany vycházející z u. Ty jsou v první iteraci algoritmu probrány a jejich délky uloženy do U. V každém dalším kroku je vybrán jako vrchol x ke zpracování ten, který má ze všech nezpracovaných vrcholů nejkratší nalezenou vzdálenost od počátku u. V tom okamžiku je d(x) platnou vzdáleností do x, neboť jakákoliv cesta přes jiný nezpracovaný vrchol nemůže být kratší díky nezápornosti vah w. Z toho pak vyplývá, že zpracování vrcholu x správně upraví dočasné vzdálenosti odložené do U. Důkaz indukcí je hotov. □ 8.4 Problém minimální kostry Na závěr této lekce se zaměříme ještě na jednu tradiční úlohu, která se koncepčně podobá problému nejkratší cesty. V tomto případě nebudeme hledat nejkratší spojení mezi dvojicí vrcholů, ale mezi všemi vrcholy najednou - této úloze se říká minimální kostra neboli MST („minimum spanning tree"). V návaznosti na Oddíl 7.4 definujeme toto: Definice: Podgraf T C G souvislého grafu G se nazývá kostrou, pokud * T je stromem a * V(T) = V(G), neboli T propojuje všechny vrcholy G. Váhou (délkou) kostry T C G váženého souvislého grafu (G, w) rozumíme Definice 8.14. Problém minimální kostry (MST) ve váženém souv. grafu (G,w) hledá kostru T C G s nejmenší možnou vahou (přes všechny kostry grafu G). Komentář: Problém minimálni kostry je ve skutečnosti historicky úzce svázán s jižní Moravou a Brnem, konkrétně s elektrifikací jihomoravských vesnic ve dvacátých letech! Právě na základě tohoto praktického optimalizačního problému brněnský matematik Otakar Borůvka jako první v matematické literatuře zformuloval a podal řešení problému minimální kostry v roce 1926. První ne-českou publikací na toto téma je až Kruskalův hladový algoritmus z roku 1956. Hladové řešení minimální kostry Následující postup tzv. hladového nalezení minimální kostry pochází od Kruskala. Metoda 8.15. Hladový postup pro minimální kostru grafu (G,w). Mějme dán souvislý vážený graf G s ohodnocením hran w. • Seřadíme všechny hrany G jako E(G) = (e1; e2,..., em) tak, že w(ei) < w(e2) < • • • < w(em). 82 Inicializujeme prázdnou kostru T = (V(G),0). Po řadě pro i = 1,2,... , m provedeme následující: * Pokud T + Ci nevytváří kružnici, tak E(T) +- E(T) U {ej}. (Neboli pokud e,i spojuje různé komponenty souvislosti dosavadního T.) Na konci T obsahuje minimální kostru grafu G (případně jednu z několika takových). Komentář: Pro ilustraci si ukážeme postup hladového algoritmu pro vyhledání kostry následujícího grafu: Hrany si nejprve seřadíme podle jejich vah 1,1,1,1, 2, 2, 2, 2, 3, 3, 3,4,4. V obrázku průběhu algoritmu používáme tlusté čáry pro vybrané hrany kostry a tečkované čáry pro zahozené hrany. Hrany teď postupně přidáváme do kostry / zahazujeme. .. J O a O O a O co #»* M, 1 3 4 2 4 3 Získáme tak minimální kostru velikosti 1 + 2 + 2 + 3 + 1 + 1 + 2 = 12, která je v tomto případě (náhodou) cestou, na posledním obrázku vpravo. Poznamenáváme, že při jiném seřazení hran stejné váhy by kostra mohla vyjít jinak, ale vždy bude mít stejnou velikost 12. Věta 8.16. Hladový postup korektně spočítá minimální kostru váženého grafu (G,w). Důkaz (náznak): Pro spor předpokládejme, že T\ je kostra spočítaná Metodou 8.15 a T2 nějaká minimální kostra, kde i. Potom však T3 = (T2 + e^) \ {e,-} je další kostrou mající váhu cř^(T2) + w(ei) — w(cj) > (1q(T2), a proto w(ei) = w(cj). Tudíž T3 je minimální kostra „bližší" T\ ve smyslu symetrického rozdílu, což je spor s volbou T2. □ 83 Jarníkův (Primův) algoritmus Ač koncepčně velmi jednoduchá, má Metoda 8.15 některé problematické implementační detaily, pro které je mnohem častěji používán následující algoritmus (často připisován Američanu Primovi, ale mnohem dříve publikován Vojtěchem Jarníkem v 1930), založený na běžném procházení grafu. Algoritmus 8.17. Hledání minimální kostry ve váženém grafu (G,w). Opět mějme dán souvislý vážený graf G s ohodnocením hran w. Níže uvedená specifická implementace procházení grafu využívá úschovnu rozšířeným způsobem, kdy ukládá i příchozí hranu do vrcholu. • Vstup: Souvislý graf G, daný seznamem vrcholů a seznamy vycházejících hran z každého vrcholu, plus váhy w hran. • Vybereme libovolný počátek prohledávání u G V (G). Úschovna U G- |(it, 0)} a počáteční kostra T G- (V(G),0). • Dokud U Ý 0? opakujeme: * Zvolíme (x, e) G U takové, že w[e) je minimální (kde w(0) = 0). Odebereme U G- U \ {(x, e)}. * Přidáme E(T) G- E(T) U {e} (nová hrana do budoucí kostry). * Pro všechny hrany / G E (G) vycházející z x provedeme: - Nechť y je druhý konec hrany / = xy a nechť /' je takové, že {y, /') G U. - Pokud takové /' neexistuje nebo w(f) > w(f), odložíme U 0 je následujícím grafem na n + 1 vrcholech a orientovaná kružnice (také cyklus) délky n > 1 vypadá takto: 4^3 2 6 ... n Definice: Počet hran začínajících ve vrcholu u orientovaného grafu D nazveme výstupním stupněm d^u) a počet hran končících v u nazveme vstupním stupněm d^u). Komentář: Součet všech výstupních stupňů je přirozeně roven součtu všech vstupních stupňů orientovaného grafu. Důkaz viz Věta 7.3. Všimněte si, že některá literatura používá opačná znaménka ( —/+) při značení výstupních a vstupních stupňů, ale s tím nic nenaděláme a čtenář se prostě vždy musí zorientovat a zjistit aktuální situaci. Definice: Symetrizací orientovaného grafu D rozumíme neorientovaný graf G vzniklý „zapomenutím směru hran" v D, přesněji V(G) = V(D) a uv G E(G) právě když {(u,v),(v,u)}nE(D)r®- Souvislost na orientovaných grafech Pojem orientované souvislosti grafu D je natolik fundamentálně odlišný od neorientovaného případu (což je dáno právě jeho „směrovostí"), že si zaslouží samostatnou diskusi i v našem zběžném pohledu na orientované grafy. Uvedeme si odstupňovaně tři základní pohledy na orientovanou souvislost: • Slabá souvislost. Jedná se o tradiční souvislost na symetrizaci grafu D Komentář: Zjednodušeně a názorně se dá říci, že při cestování grafem „zapomeneme" směr šipek. Na obrázku: ®--3>-»- R+ je kladné ohodnocení hran, zvané kapacita hran. Na obrázku je zakreslena síť s vyznačeným zdrojem z a stokem s, jejíž kapacity hran jsou zapsány čísly u hran. Šipky udávají směr hran, tedy směr proudění uvažované substance po spojnicích. Pokud směr proudění není důležitý, vedeme mezi vrcholy dvojici opačně orientovaných hran se stejnou kapacitou. Kapacity hran pak omezují maximální množství přenášené substance. Poznámka: V praxi může být zdrojů a stoků více, ale v definici stačí pouze jeden zdroj a stok, z něhož / do nějž vedou hrany do ostatních zdrojů / stoků. (Dokonce pak různé zdroje a stoky mohou mít své kapacity.) Velikost toku v síti V souladu s praktickými aspekty nás u toku v síti zajímá především to, jaké „množství" substance (velikost toku) se skutečně přenese od zdroje ke stoku. Značení: Pro jednoduchost píšeme ve výrazech značku e —y v pro hranu e končící ve vrcholu v a e v pro hranu e začínající z v. Definice 9.5. Tok v síti s = (D,z,s,w) je funkce / : e(D) —> splňující * Ve G e (D) : 0 < f (e) < w(e), * Vv(=V(D),vŕz,s: E/(e)= E /(e)- e—>v e<—v Velikost toku / je dána výrazem ||/|| = E f(e) ~ E f(e)- e<—z e—>z Značení: Tok a kapacitu hran v obrázku sítě budeme zjednodušeně zapisovat ve formátu F/C, kde F je hodnota toku na hraně a C je její kapacita. 89 Komentář: Neformálně tok znamená, kolik substance je každou hranou zrovna přenášeno (ve směru této hrany, proto hrany musí být orientované). Tok je pochopitelně nezáporný a dosahuje nejvýše dané kapacity hrany. Navíc je nutno v každém vrcholu mimo z, s splnit podmínku „zachování substance" ^2e^v /(e) = ^2e^v f(e). Ve vyobrazeném příkladě vede ze zdroje vlevo do stoku vpravo tok o celkové velikosti 5. Poznámka: Obdobně se dá velikost toku definovat u stoku (či i na obecném řezu v síti, viz dále), neboť platí následující identita odvozená z vlastnosti zachování substance v definici toku o = E (/(«) - /(«)) = E í E - E m) = E í E ^ - E m edE u£V \e<—v e—>v / v=z,s \e-i-v e—>v Proto velikost toku počítaná u zdroje je rovna opačné velikosti toku počítaného u stoku ÍE/(e)-E/(e)) = ÍE/(e)-E/(e) \e<—z e—>z / \e—>s e-(—s 9.3 Nalezení maximálního toku Naším úkolem je nalézt co největší přípustný tok v dané síti. Pro jeho nalezení existují jednoduché i velmi rychlé algoritmy. Navíc tyto algoritmy mají zajímavé teoretické souvislosti a důsledky uvedené později. Definice 9.6. Úloha hledání maximálního toku v síti S = (D,z,s,w). Úkolem je v síti S najít tok / ze zdroje z do stoku s podle Definice 9.5 takový, který maximalizuje velikost ||/||. Komentář: Tok velikosti 5 uvedený v ukázce v předchozí části nebyl optimální, neboť v této síti najdeme i tok velikosti 6: Jak však poznáme, že větší tok již v dané síti neexistuje? V této konkrétní ukázce to není obtížné, vidíme totiž, že obě dvě hrany přicházející do stoku mají součet kapacit 2+4 + 6, takže více než 6 do stoku ani přitéct nemůže. V obecnosti lze použít obdobnou úvahu, kdy najdeme podmnožinu hran, které nelze tokem „obejít" a které v součtu kapacit dají velikost našeho toku. Existuje však taková množina hran vždy? Odpověď nám dá následující definice a věta. 90 Pojem řezu v síti Definice 9.7. Rez v síti S = (D, z, s, w) je podmnožina hran X C E (D) taková, že v podgrafu D — X (tj. po odebrání hran X z D) nezbude žádná orientovaná cesta ze z do s. Velikostí řezu X rozumíme součet kapacit hran z X, tj. ||X|| = X^eex w(e)- Zcela klíčovým poznatkem síťových úloh je následující velmi hezká charakterizace jejich optimálního řešení Věta 9.8. Maximální velikost přípustného toku v síti je vždy rovna minimální velikosti řezu v ní. Komentář: Na následujícím obrázku vidíme trochu jinou síť s ukázkou netriviálního minimálního řezu velikosti 5, naznačeného svislou čárkovanou čarou. Všimněte si dobře, že definice řezu mluví o přerušení všech orientovaných cest ze z do s, takže do řezu stačí započítat hrany jdoucí přes svislou čáru od z do s, ale ne hranu jdoucí zpět. Proto je velikost vyznačeného řezu 1+4 = 5. Důkaz Věty 9.8 bude proveden následujícím Algoritmem 9.10. Nenasycené cesty v síti Definice: Mějme síť S a v ní tok /. Nenasycená cesta P (v S vzhledem k /) je neorientovaná cesta v D mezi určenými vrcholy (obvykle ze z do s), tj. posloupnost navazujících libovolně orientovaných hran ei, e2,..., em, kde /(e^) < w(ei) pro e« ve směru ze z do s a f(cj) > 0 pro e j v opačném směru. Hodnotám w(e,i) — /(e^) > 0 pro hrany ve směru ze z do s a f(cj) > 0 pro hrany e j v opačném směru říkáme rezerva kapacity hran. Nenasycená cesta je tudíž cesta s kladnými rezervami kapacit všech hran. Komentář: Zde vidíme příklad nenasycené cesty ze zdroje do stoku s minimální rezervou kapacity +1. rezerva kapacity: 1/2 1/1 +1 +1 +1 2/3 +2 +2 > o Všimněte si dobře, že cesta není orientovaná, takže hrany na ní jsou v obou směrech. Metoda 9.9. Maximální tok vylepšováním nenasycených cest. Základní myšlenkou této jednoduché metody hledání maximálního toku v dané síti je prostě opakovaně vylepšovat tok podél nalezených nenasycených cest. 91 Komentář: Ve výše zakresleném obrázku nenasycené cesty byla minimální rezerva kapacity ve výši +1, a tudíž nasycením této cesty o velikost toku 1 vzniká následující fragment přípustného toku v síti: Zajímavé je se podívat, co se stalo s prostředními zpětně orientovanými hranami - fakticky byl jejich zpětný tok o 1 snížen/zastaven, přičemž toto množství nyní „teče doprava" (velmi neformálně řečeno). Fakt: Je-li minimální rezerva kapacity hran nenasycené cesty P ze z do s ve výši r > 0, tok ze z do s zvýšíme o hodnotu r následovně; * pro hrany G E (P) ve směru ze z do s zvýšíme tok na /'(e^) = f(eí) + r> * pro hrany Cj G E (P) ve směru ze s do z snížíme tok na /'(e^-) = /(e,) — r. Výsledný tok /' pak bude opět přípustný. Základní algoritmus nenasycených cest Rámcové implementační podrobnosti Metody 9.9 následují v popise konkrétního původního algoritmu pro náš problém. Algoritmus 9.10. Ford-Fulkersonův pro tok v síti. * Vstup: Síť S = (D,z,s,w) podle Definice 9.4. • Dále opakujeme následující: * Prohledáváním grafu najdeme množinu U vrcholů D, do kterých se dostaneme ze z po nenasycených cestách. * Pokud s G U, nechť P značí nalezenou nenasycenou cestu v S ze z do s. - Zvětšíme tok / o minimální rezervu kapacity hran v P. • Opakujeme kroky výše, dokud nenastane s G7 U. • Výstup: Vypíšeme maximální tok / a také minimální řez jako množinu všech hran vedoucích z U do V(D) — U. Příklad 9.11. Ukázka průběhu Algoritmu 9.10 Následují obrázky jednotlivých kroků algoritmu, kde vždy levý obrázek zvýrazní nenasycenou cestu a vpravo se nasycením zvýší celkový tok. . Tok f U (přicházející do U) tok /(e) = 0, takže E /(e) - E /(e) = E /(e) = E»(e) = 11*11 • sex Na druhou stranu, když v sumě uvažujeme všechny hrany grafu indukované na naší množině U, tj. e G E1 (Z) f U), analogicky dostaneme požadované E (m - m) = E ÍE m - E /(*)) - í E - E /(< E(Dfŕ7) «£1/ \e-f-i; e^u / \e-f-r7 e^í/ 0 = eeE(D\U) (E/w-E/w)-ÍE/w-E/(« \e^z e—>z / \.e<—C e—>Í7 l^ll , tj. ii/ii = ||X||. □ Z důkazu Algoritmu 9.10 odvodíme několik zajímavých faktů: Fakt: Pokud zajistíme, že Algoritmus 9.10 vždy skončí, zároveň tím dokážeme i platnost Věty 9.8. Fakt: Pro celočíselné kapacity hran sítě S Algoritmus 9.10 vždy skončí. Fakt: Existují snadná vylepšení Algoritmu 9.10 (jako Edmonds-Karp či Dinitz), u kterých je zaručeno, že výpočet vždy skončí. Obecně k dosažení tohoto cíle postačí vždy uvažovat pouze nejkratší nenasycené cesty, což je ale látka mimo omezený rozsah našeho kurzu. Pro další využití v teorii grafů je asi nej důležitější tento poznatek: Důsledek 9.12. Pokud jsou kapacity hran sítě S celočíselné, optimální tok v Algoritmu 9.10 také vyjde celočíselně. Důkaz: Postupujeme jednoduchou indukcí podle iterací Algoritmu 9.10: Algoritmus začíná s celočíselným tokem 0. V každé další iteraci bude na počátku tok všemi hranami celočíselný, tudíž i rezervy kapacit hran vyjdou (rozdílem od celočíselné kapacity) celočíselně. Proto i hodnoty toku budou změněny jen celočíselně, což zakončuje indukční krok. □ 9.4 Zobecněné použití sítí Pojmy sítě a toků v ní lze v kombinatorické optimalizaci zobecnit a využít několika směry. My si zde stručně uvedeme následující možnosti. • Sítě s kapacitami vrcholů: U sítě můžeme zadat kapacity vrcholů, neboli kapacitní váhová funkce je dána jako w : E(D) U V (D) —> R+. Takovou síť „zdvojením" vrcholů snadno převedeme na běžnou síť, ve které kapacity původních vrcholů budou uvedeny u nových hran spojujících 94 zdvojené vrcholy. Viz neformální schéma: 5 • Sítě s dolními kapacitami: Pro hrany sítě lze zadat také jejich minimální kapacity, tedy dolní meze přípustného toku, jako váhovou funkci l : E(D) —> Rq". Přípustný tok pak musí splňovat l(e) < /(e) < w(e) pro všechny hrany e. V této modifikaci úlohy již přípustný tok nemusí vůbec existovat, takže postup řešení musí zavést počáteční fázi, ve které se nějaký tok splňující minimální kapacity nalezne vhodnou úpravou zadané sítě. Poté se pokračuje metodou nenasycených cest. Bipartitní párování Bípartítní grafy jsou grafy, jejichž vrcholy lze rozdělit do dvou množin tak, že všechny hrany vedou jen mezi těmito množinami, neboli podgrafy úplných bipartitních grafů. Definice: Párovánív (nyní bipartitním) grafu G je podmnožina hran M C E (G) taková, že žádné dvě hrany z M nesdílejí koncový vrchol. Komentář: Úlohu nalézt v daném bipartitním grafu co největší párování lze poměrně snadno vyřešit pomocí toků ve vhodně definované síti. Uvedená metoda použití toků v síti na řešení problému párování přitom hezky ilustruje obecný přístup, jakým toky v sítích pomohou řešit i úlohy, které na první pohled se sítěmi nemají nic společného. Metoda 9.13. Nalezení bipartitního párování Pro daný bípartítní graf G s vrcholy rozdělenými do množín A, B sestrojíme síť S následovně: 1 • Všechny hrany sítě S orientujeme od zdroje do stoku a přiřadíme jim kapacity 1. • Nyní najdeme (celočíselný) maximální tok v S Algoritmem 9.10. Do párování vložíme ty hrany grafu G, které mají nenulový tok. 95 Důkaz správnosti Metody 9.13: Podle Důsledku 9.12 bude maximální tok celočíselný, a proto každou hranou poteče buď 0 nebo 1. Jelikož však do každého vrcholu v A může ze zdroje přitéct jen tok 1, bude z každého vrcholu A vybrána do párování nejvýše jedna hrana. Stejně tak odvodíme, že z každého vrcholu B bude vybrána nejvýše jedna hrana, a proto vybraná množina skutečně bude párováním. Zároveň to bude největší možné párování, protože z každého párování lze naopak vytvořit tok příslušné velikosti a větší než nalezený tok v S neexistuje. □ Poznámka: Popsaná metoda je základem tzv. Maďarského algoritmu pro párování v bipartitních grafech. Úlohu nalezení maximálního párování lze definovat i pro obecné grafy a také ji efektivně algoritmicky vyřešit, ale příslušný algoritmus [Edmondsův] není jednoduchý. Výběr různých reprezentantů Definice: Nechť M1,M2,...,Mk jsou neprázdné množiny. Systémem různých reprezentantů množin M . M2......Mi, nazýváme takovou posloupnost různých prvků (x1,x2,... ,xk), že Xi G Mi pro i = 1, 2,..., k. Důležitým a dobře známým výsledkem v této oblasti je Hallova věta plně popisující, kdy lze systém různých reprezentantů daných množin nalézt. Věta 9.14. Nechť M\, M2,..., Mk jsou neprázdné množiny. Pro tyto množiny existuje systém různých reprezentantů, právě když platí V J C {l,2,...,k} : |(J Mj >|J|, neboli pokud sjednocení libovolné skupiny z těchto množin má alespoň tolik prvků, kolik množin je sjednoceno. Důkaz: Označme x\, x2,..., xm po řadě všechny prvky ve sjednocení M\VJM2\J- ■ -UM^. Definujeme si bipartitní graf G na množině vrcholů {1,2,..., k}U{x\, x2,..., xm}U{u, v}, ve kterém jsou hrany {u, i} pro i = 1, 2,..., k, hrany {v, Xj} pro j = 1, 2,..., m a hrany {i,Xj} pro všechny dvojice pro které x j G Mj. Komentář: Konstrukce našeho grafu G je obdobná konstrukci sítě v Metodě 9.13: Vrcholy u a v odpovídají zdroji a stoku, ostatní hrany přicházející do vrcholu x j znázorňují všechny z daných množin, které obsahují prvek Xj. Cesta mezi u a v má tvar u, i, Xj,v, a tudíž ukazuje na reprezentanta x j G Mj. Systém různých reprezentantů tak odpovídá k disjunktním cestám mezi u a v. Nechť X je nyní libovolná minimální množina vrcholů v G, neobsahující samotné u a v, po jejímž odebrání z grafu nezbude žádná cesta mezi u a v. Podle této úvahy mají naše množiny systém různých reprezentantů, právě když každá taková oddělující množina X má aspoň k prvků. Položme J = {1, 2,..., k} \ X. Pak každá hrana z J (mimo u) vede do vrcholů z X H {xi,..., xm} (aby nevznikla cesta mezi u,v), a proto |l I Mj =\XC\{x1,...,xm}\ = \X\-\XC\{l,...,k}\ = \X\-k+\J\. První rovnost vyplývá z minimality množiny X. Vidíme tedy, že \X\ > k pro všechny (minimální) volby oddělující X, právě když \J-eJMj > \J\ pro všechny volby J, což je dokazovaná podmínka naší věty. □ 96 Poznámka: Tento důkaz nám také dává návod, jak systém různých reprezentantů pro dané množiny nalézt - stačí použít Algoritmus 9.10 na vhodně odvozenou síť. Rozšiřující studium Orientované grafy obvykle v učebnicích teorie grafů mnoho místa nezabírají a speciálně v češtině je málo zdrojů věnujících se přímo orientovaným grafům. Mnohé aspekty grafů (včetně některých grafových algoritmů) však zůstávají stejné i v orientovaném podání, jak můžeme vidět třeba v otázkách isomorfísmu či hledání nejkratší cesty. Otázky síťových toků a silné souvislosti studované v této lekci však dostávají na orientovaných grafech „nový rozměr" nemající v neorientovaných grafech rozumné obdoby - pro ně je směr hran podstatný. My se zde hlouběji orientovanými grafy nezabýváme, ale zájemce odkazujeme především na algoritmické zdroje a kurzy, neboť úloha síťových toků je jednou ze základních praktických úloh kombinatorické optimalizace. 97 10 Formalizace a důkazy pro algoritmy Úvod Po předchozí převážně matematické látce se náš výklad obrací bezprostředně k informatice. Mnozí z vás si asi již všimli, že umění programovat není zdaleka jen o tom naučit se syntaxi programovacího jazyka, ale především o schopnosti vytvářet a správně formálně zapisovat algoritmy. Přitom třeba situace, kdy programátorem zapsaný kód ve skutečnosti počítá něco trochu jiného, než si autor představuje, je snad nejčastější programátorskou chybou - o to zákeřnější, že ji žádný „chytrý" překladač nemůže odhalit. Proto již na počátku studia informatiky je žádoucí klást důraz na správné chápání zápisu algoritmů i na přesné důkazy jejich vlastností a správnosti. Tyto poznatky by měly základem toho, aby si čtenář jako programátor uměl po sobě své algoritmy „přečíst" a ověřit jejich skutečnou správnost na lokální úrovni. Cíle Bude zaveden způsob formálního zápisu algoritmů pro potřeby dalšího výkladu, nezávisle na konkrétních programovacích jazycích. Na tomto formalismu pak bude ukazováno správné chápání chování algoritmů a příklady důkazů na konkrétních „malých" algoritmech. Nejdůležitější technikou důkazů bude matematická indukce. Na druhou stranu je třeba dodat, že uváděné algoritmy jsou pouze bezvýznamné ilustrativní ukázky pro cvičení důkazů a není úkolem tohoto textu učit čtenáře návrhu algoritmů. 10.1 Formální popis algoritmu Před samotným závěrem našeho matematického kurzu si položme klíčovou otázku, co je vlastně algoritmus? Když se na tím zamyslíte, asi zjistíte, že to není tak jednoduché přesně říci. Neformálně je algoritmus něčím jako kuchařským receptem, podle kterého ze surovin (vstupů) uvaříme chutné jídlo (očekávaný výstup/výsledek). Říci toto matematicky přesně je však natolik obtížný úkol, že si zde můžeme podat jen docela zjednodušenou (či naivní?) odpověď, přesto však dostatečnou pro zamýšlenou demonstraci matematických důkazů pro běžné algoritmy. Poznámka: Za definici algoritmu je obecně přijímána tzv. Church-Turingova teze tvrdící, že všechny algoritmy lze „simulovat" na Turingově stroji. Jedná se sice o přesnou, ale značně nepraktickou definici. Mimo Turingova stroje existují i jiné matematické modely výpočtů, jako třeba stroj RAM, který je abstrakcí skutečného strojového kódu, nebo také třeba tzv. neprocedurální (neimperativní) modely zahrnující funkcionální a logické programování. Konvence 10.1. Zjednodušeně zde algoritmem rozumíme konečnou posloupnost elementárních výpočetních kroků, ve které každý další krok vhodné1 využívá (neboli závisí na) vstupní údaje či hodnoty vypočtené v předchozích krocích. Tuto závislost přitom pojímáme zcela obecně nejen na operandy, ale i na vykonávané instrukce v krocích. Pro zápis algoritmu a jeho zpřehlednění a zkrácení využíváme řídící konstrukce -podmíněná větvení a cykly. Při jejich použití však je třeba dát dobrý pozor, aby byla naplněna podmínka skončení algoritmu. zvídaví studenti si mohou na tomto místě uvědomit, že ve slůvku „vhodně" se skrývá celá hloubka Church-Turingovy teze. V žádném případě tak nelze mechanicky bez zamyšlení obracet, že by každá posloupnost kroků atd ... byla algoritmem ve smyslu této teze (viz také Lekce 11). 98 Komentář: Vidíte, jak blízké si jsou konstruktivní matematické důkazy a algoritmy v našem pojetí? Jedná se nakonec o jeden ze záměrů našeho přístupu... Příklad 10.2. Zápis algoritmu pro výpočet průměru daného pole a[] s n prvky. Algoritmus. • Inicializujeme sum 0 ; • postupně pro i=0,l,2, . . . ,n-l provedeme * sum sum+a[i] ; • vypíšeme podíl (sum/n) . □ Ve „vyšší úrovni" formálnosti (s jasnějším vyznačením elementárních kroků a řídících struktur algoritmu) se totéž dá zapsat jako: Algoritmus 10.3. Průměr z daného pole a[] s n prvky. input pole a [] délky n > 1; sum 0; foreach i 0,1,2,...,n-l do sum sum+a[i] ; done res sum/n; output res . Symbolický zápis algoritmů Značení. Pro potřeby symbolického formálního zápisu algoritmů v předmětu FI: IB000 si zavedeme následující pravidla: * Proměnné nebudeme deklarovat ani typovat, pole odlišíme závorkami p[]. * Přiřazení hodnoty zapisujeme a^—b, případně a := b, ale nikdy ne a=b. * Jako elementární operace je možné použít jakékoliv aritmetické výrazy v běžném matematickém zápise. Rozsahem a přesností čísel se zde nezabýváme. * Podmíněné větvení uvedeme klíčovými slovy if ... then . . . else ... f i , kde else větev lze vynechat (a někdy, na jednom řádku, i f i). * Pevný cyklus uvedeme klíčovými slovy foreach ... do ... done, kde část za foreach musí obsahovat předem danou množinu hodnot pro přiřazování do řídící proměnné. * Podmíněný cyklus uvedeme klíčovými slovy while ... do ... done . Zde se může za while vyskytovat jakákoliv logická podmínka. * V zápise používáme jasné odsazování (zleva) podle úrovně zanoření řídících struktur (což jsou if , foreach, while). * Pokud je to dostatečně jasné, elementární operace nebo podmínky můžeme i ve formálním zápise popsat běžným jazykem. 99 Poznámka: Známá informatická poučka (a zároveň název klasické učebnice programování od N. Wirtha) praví „Algoritmy + Datové struktury = Programy". Jelikož však náš text neaspiruje být učebnicí programování ani algoritmizace, druhý sčítanec uvedené poučky záměrně pomíjíme a aspekty použití vhodných datových struktur pro uváděné algoritmy ponecháváme pro jiné kurzy studia informatiky Vyzbrojeni těmito pravidly symbolického zápisu a matematickým aparátem dokazování si nyní můžeme dovolit se podívat na mnohé základní (a jednoduché) algoritmy novým kritickým pohledem. Co počítá následující algoritmus? Příklad 10.4. Je dán následující symbolicky zapsaný algoritmus. Co je jeho výstupem v závislosti na vstupech a,b? Algoritmus 10.5. input a, b; res 0 vypočítáme x-té Fibonacciho číslo následovně: function fibonacci(x): if x < 2 then t+-x; else t +- íibonacci(x-l)+íibonacci(x-2); return t . 102 Komentář: Správnost Algoritmu 10.11 je víceméně zřejmá z jeho přímé podoby s rekurentním vzorcem v definici Fibonacciho čísel. Zamyslete se však, jak je to s praktickou „proveditelností" takového algoritmu... Vidíte (případně si zkuste naprogramovat), že čas výpočtu roste velmi rychle? Třebaže hodnotu fibonacci(30) tímto algoritmem spočítáte poměrně rychle, s výpočtem fibonacci(40) už budete mít větší problémy a fibonacci(50) asi bude mimo vaše možnosti. To skutečně není dobrý algoritmus! Proto si v dalším Příkladu 10.12 uvedeme poněkud (ve skutečnosti velmi výrazně) lepší algoritmus výpočtu, podobající se přirozenému lidskému postupu psaní členů posloupnosti „do řádku na papír". Doporučujeme si oba algoritmy zkusit implementovat a mezi sebou porovnat. Příklad 10.12. Nerekurzivní algoritmus pro Fibonacciho čísla. Dokažte, že následující algoritmus pro každé přirozené n počítá tutéž hodnotu jako rekurentní funkce f ibonacci(n) v Algoritmu 10.11 (ale mnohem mnohem rychleji). Algoritmus . input n; b[0] <- 0; b[l] <- 1; foreach i ^—2,3,..., n do b [i] 2 předpokládáme platnost indukčního předpokladu b[j] = fibonacci(j) pro j G {i — 1, i — 2}. V i-té iteraci cyklu pak nastane b[i] b[i — 1] + b[i — 2] = fibonacci(i — 1) + fibonacci(i — 2) = fibonacci(i) podle definice. Tím je důkaz hotov pro hodnotu i = n. □ 10.4 Přehled technik důkazu indukcí Doposud v našem textu byla matematická indukce představována ve své přímočaré formě, kdy dokazované tvrzení obvykle přímo nabízelo celočíselný parametr, podle nějž bylo potřebné indukci vést. Indukční krok pak prostě zpracoval přechod „n = i —> n = i +1". To však u dokazování správnosti algoritmů typicky neplatí a našim cílem zde je ukázat možné techniky, jak správně indukci na dokazování algoritmů aplikovat. Uvidíme, jak si z nabízejících se parametrů správně vybrat a jak je případně kombinovat. Technika fixace parametru První technika důkazu prostě dopředu za některé parametry dosazuje (obecně zvolené) konstanty. Tato technika je vhodná pro případy, kdy je sice v algoritmu více parametrů, ale „zjevně" dochází ke změně jen jednoho (nebo části) z nich a chování algoritmu ke zbylým „neměnným" parametrům je dobře předvídatelné. Příklad 10.13. Mějme následující algoritmus. Co je jeho výsledkem výpočtu? Algoritmus . input x, y; 103 res 0; while x>0 do res res + y; x x-1; done output res . Sledováním algoritmu zjistíme, že hodnota proměnné res bude narůstat jako součet y + • • • + y, dokud se x nesníží na nulu. Poté odhadneme: Věta. Pro každé i,i/GN Algoritmus 10.13 vypočítá hodnotu součinu res = x■ y. Jaký je vhodný postup k důkazu tohoto tvrzení indukcí? Je snadno vidět, že na hodnotě vstupu y vlastně nijak podstatně nezáleží (lze y fíxovat) a důležité je sledovat x. Tato úvaha nás dovede k následujícímu: Důkaz: Budiž hy G N libovolné ale pro další úvahy pevné. Dokážeme, že pro každý vstup x G N je výsledkem výpočtu hodnota r•$ + x ■ hy, kde hy byla hodnota vstupu y a r0 byla hodnota v pracovní proměnné res na začátku uvažovaného výpočtu (pro potřeby indukce, r0 = 0 na úplném začátku). Podle principu matematické indukce uplatněné na parametr x dostáváme snadno: * Báze x = 0 znamená, že tělo cyklu ve výpočtu ani jednou neproběhne a výsledkem bude počáteční vq. * Indukční krok. Nechť je tvrzení známo pro x = i a uvažujme nyní vstup x = i + 1 > 0. Prvním průchodem cyklem se uloží res res + y = r o + hy = r± a x ^r- x — 1 = i. Počáteční hodnota pracovní proměnné res nyní (pro naše indukční úvahy) tudíž je f o + hy = ri a podle indukčního předpokladu je pak výsledkem výpočtu hodnota r\ + i ■ hy = (r0 + hy) + i ■ hy = r0 + (i + 1) • hy = r0 + x ■ hy . Důkaz matematickou indukcí je tímto ukončen. □ Komentář: Všimněte si, že techniku fixace parametru jsme mlčky použili již v Příkladě 10.8. Indukce k součtu parametrů Druhou techniku je vhodné použít především v případech, kdy se v průběhu algoritmu vždy některý parametr zmenšuje, ale pokaždé je to některý jiný parametr, takže v indukci se nelze zaměřit jen na jeden z nich. Jedná se spíše o situaci u rekurzivních algoritmů. Příklad 10.14. Co je výsledkem následujícího rekurzivního výpočtu? Algoritmus . function kombinační( m,n) : res <— 1; if m>0 A n>0 then res ^— .kombinační(m-l,n) + iombinacni(m,n-l) ; fi return res . 104 Výše uvedený vzorec (a ostatně i název funkce) naznačuje, že funkce má co společného s kombinačními čísly a Pascalovým trojúhelníkem Věta. Pro každé parametry m,n G N je výsledkem výpočtu funkce prvkových podmnožin (m + n)-prvkové množiny. Důkaz indukcí vzhledem k součtu parametrů i = m + n: * Báze i = m + n = 0 pro m, n G N znamená, že m = n = 0. Zde však s výhodou využijeme tzv. „rozšíření bázeĹÍ na všechny hraniční případy m = 0 nebo n = 0 zvlášť. V obou rozšířených případech daná podmínka algoritmu není splněna, a proto výsledek výpočtu bude iniciální res = 1. Je toto platná odpověď? Kolik je prázdných podmnožin (m = 0) jakékoliv množiny? Jedna, 0. Kolik je m-prvkových podmnožin (n = 0) m-prvkové množiny? Zase jedna, ta množina samotná. Tím je důkaz rozšířené báze indukce dokončen. * Indukční krok přechází na součet i + 1 = m + n pro m, n > 0. Nyní je podmínka algoritmu splněna a vykonají se rekurentní volání Rekurentní volání se vztahují k výběru podmnožin m — l+n = m + n — 1 = i-prvkové množiny, například M = {1,2,...,«}. Výsledkem tedy je, podle indukčního předpokladu pro součet i, počet (m — l)-prvkových plus m-prvkových podmnožin množiny M. Kolik nyní je m-prvkových podmnožin (i + l)-prvkové množiny M' = M U {i + 1}? Pokud ze všech podmnožin odebereme prvek i + 1, dostaneme právě m-prvkové podmnožiny (z těch neobsahujících i + 1) plus (m — l)-prvkové podmnožiny (z těch původně obsahujících i + 1). A to je v součtu rovno kombinační(m-l,n) + kombinační (m,n-l), jak jsme měli dokázat. □ Zesílení dokazovaného tvrzení Velmi častou situací při dokazování algoritmu je, že se zajímáme o hodnoty některých proměnných nebo „výstupy" některé funkce, ale ke správnému matematickému důkazu musíme „postihnout" i chování jiných funkcí a proměnných v algoritmu. Taková situace pak typicky vede na potřebu zesílení požadovaného tvrzení v matematické indukci. Příklad 10.15. Zjistěte, kolik znaků 'z' v závislosti na celočíselné hodnotě n vstupního parametru n vypíše následující algoritmus. Algoritmus 10.16. st <-"z"; foreach i«—1,2,3,...,n-l,n do vytiskni řetězec st; st 0 A q>0 do if p>q then p p-q; else q q-p; done output p+q . Věta. Pro každé p,q G N na vstupu algoritmus vrátí hodnotu největšího společného dělitele čísel pag, nebo 0 pro p = q = 0. Důkaz povedeme indukcí podle součtu i = p + q vstupních hodnot. (Jak jsme psali, je to přirozená volba v situaci, kdy každý průchod cyklem algoritmu sníží jedno z p,q, avšak není jasné, které z nich.) • Báze indukce pro i=p + q = 0]e zřejmá; cyklus algoritmu neproběhne a výsledek ihned bude 0. • Ve skutečnosti je zase výhodné uvažovat rozšířenou bázi, která zahrnuje i případy, kdy jen jedno z p, q je nulové (Proč? Jedná se o všechny případy, kdy průchod cyklem neproběhne, neboli touto indukcí sledujeme počet průchodů cyklem.) Pak výsledek 106 p + q bude roven tomu nenulovému z obou sčítanců, což jev tomto případě zároveň jejich největší společný dělitel. * Indukční krok. Mějme nyní vstupní hodnoty p = hp>0&q = hq>0- tehdy dojde k prvnímu průchodu tělem cyklu našeho algoritmu, přičemž hp + hq = i + 1. Předpokládejme hp > hq; poté po prvním průchodu tělem cyklu budou hodnoty p = hp — hq a q = hq, přičemž nyní p + q = hp < hp + hq — 1 = i. Podle indukčního předpokladu (jelikož nyní p + q < i) tudíž výsledkem algoritmu pro vstupy p = hp — hq a q = hq bude největší společný dělitel NSD(hp — hq, hq). Symetricky pro hp < hq algoritmus vrátí NSD(hp, hq — hp). (Kde NSDQ krátce označuje největšího společného dělitele.) Důkaz proto bude dokončen následujícím Lematem 10.18. □ Lema 10.18. Pro každá přirozená a, b platí N SD(a, b) = N SD(a — b, b) = NSD(a, b—a). Komentář: Všimněte si, že dělitelnost je dobře definována i na záporných celých číslech. Důkaz: Ověříme, že c = NSD(a — b,b) je také největší společný dělitel čísel a a b (druhá část je pak symetrická). * Jelikož číslo c dělí čísla a — b a b, dělí i jejich součet (a — b) + b = a. Potom c je společným dělitelem a a b. * Naopak nechť d nějaký společný dělitel čísel a a b. Pak d dělí také rozdíl a — b. Tedy d je společný dělitel čísel a — b a b. Jelikož c je největší společný dělitel těchto dvou čísel, nutně d dělí c a závěr platí. □ Modulární umocňování Dále například „zbytkové" umocňování na velmi vysoké exponenty je podkladem známé RSA šifry. Pokud bychom takovou mocninu zkoušeli počítat hrubou silou jen opakovaným násobením základu, výsledku bychom se nikdy v rozumném čase nedočkali. Algoritmus 10.19. Binární postup umocňování. Pro daná čísla a, b vypočteme jejich celočíselnou mocninu (omezenou na zbytkové třídy modulo m pro prevenci přetečení rozsahu celých čísel v počítači), tj. hodnotu ab mod m, následujícím postupem. input a,b, m ; res <— 1; while b > 0 do if b mod 2 > 0 then res 1 a uvažme l = £0 + 1. Pak zřejmě b > 2 a vykonají se alespoň dvě iterace cyklu. Po první iteraci budou hodnoty proměnných po řadě ai = a2, &! = [b/2\ a res = n = (ab mod 2) mod m . Tudíž délka binárního zápisu bi bude jen £0 a podle indukčního předpokladu zbylé iterace algoritmu skončí s výsledkem res = ri • a-f1 mod m = (ab mod 2 • a2'-6/2') mod m = ab mod m. v ' □ Poznámka: Zamysleli jste se, jaký mají algoritmy v tomto oddíle vlastně význam? Vždyť stejné úlohy jistě sami vyřešíte každou jednou jednoduchou smyčkou. Podívejte se však (alespoň velmi zhruba) na počet kroků, které zde uvedené algoritmy potřebují vykonat k získání výsledku, a srovnejte si to s počty kroků oněch „jednoduchých" algoritmů. Pro skutečně velká vstupní čísla zjistíte propastný rozdíl - s takovým zdánlivě jednoduchým algoritmem pro umocňování, třeba 'foreach i <— l,...b do res-í— res-a mod m; done', se pro obrovské hodnoty b výsledku nikdy nedočkáte, kdežto Algoritmus 10.19 stále poběží velmi rychle. (Spočítáte, jak rychle?) Obdobně tomu bude u Algoritmu 10.20. Relativně rychlé odmocnění Na závěr oddílu si ukážeme jeden netradiční krátký algoritmus a jeho analýzu a důkaz zde ponecháme otevřené. Dokážete popsat, na čem je algoritmus založen? Algoritmus 10.20. Celočíselná odmocnina. Pro dané přirozené číslo x vypočteme dolní celou část jeho odmocniny \_y/x\: input x; p ^— x; res 0; while p > 0 do while (res F p)2 < x do res ^— res + p; p <- Lp/2J ; done output res . Rozšiřující studium JVáš výklad pohlíží na algoritmy a programování tzv. procedurálním neboli imperativním paradigmatem. Vedle toho existují i jiné přístupy k programování, jako zmíněné funkcionální nebo logické. JVa FI se s jinými přístupy studenti seznámí třeba v předmětu IB015 Neim-perativní programování. Pro náš matematický výklad není výběr výpočetního paradigmatu to nejdůležitější. Smyslem této lekce bylo především ukázat, že u jednoduchých algoritmů lze (a je vhodné) je matematicky formálně zapisovat i dokazovat jejich správnost. Samozřejmě je iluzorní předpokládat, že obdobné důkazy správnosti podáme i pro velké softwarové projekty čítající až miliony řádků, ale postupy a techniky naučené při ověřování jednoduchých algoritmů s úspěchem využijete i při kontrole a ladění jednotlivých kousků velkých projektů. Mnohé další ukázky dokazování základních algoritmů najdete hned v kurzech základní algoritmizace (jako již zmíněný kurz IB002) a o mnoha různých pokročilých technikách formální verifikace programů se v případě zájmu dozvíte v pokračujícím studiu. 108 11 Nekonečné množiny, Zastavení algoritmu Úvod Hloubavého čtenáře může snadno napadnout kacířská myšlenka, proč se vlastně zabýváme dokazováním správnosti algoritmů a programů, když by to přece (snad?) mohl za nás dělat automaticky počítač samotný. Bohužel to však nejde a je hlavním cílem této lekce ukázat matematické důvody proč tomu tak je. Konkrétně si dokážeme, že nelze algoritmicky rozhodnout, ani zda se daný algoritmus na svém vstupu zastaví nebo ne. Hlavními nástroji, které použijeme, budou nekonečné množiny a důkazová technika tzv. Cantorovy diagonály, která se ve velké míře používá právě v teoretické informatice. Touto lekcí se tak krátce vymaníme ze zajetí naivní teorie množin, která v této oblasti má své nepřekonatelné limity. (Pro zvídavé - obdobně, ale mnohem složitěji, lze dokázat že ani matematické důkazy nelze obecně algoritmicky konstruovat...) Cíle Zavedeme si ve zjednodušeném (a stále „poněkud naivním") pohledu nekonečné množiny a na nich techniku důkazu Cantorovou diagonálou. Pak tuto klíčovou důkazovou techniku teoretické informatiky využijeme k důkazu algoritmické neřešitelnosti problému zastavení. 11.1 O nekonečných množinách a kardinalitě Zatímco v naivní teorii jsme si velikost konečné množiny definovali jednoduše jako počet jejích prvků vyjádřený přirozeným číslem, pro nekonečné množiny je situace obtížná a mnohem méně intuitivní. Co nám třeba brání zavést pro velikost nekonečné množiny symbol oo? Ponejvíce závažný fakt, že není „nekonečno" jako „nekonečno" (Věta 11.2)! Právě proto si pro určení mohutnosti nekonečných množin musíme vypomoci následujícím příměrem: Velikosti dvou hromádek jablek dokážeme i bez počítání porovnat tak, že budeme z obou hromádek po řadě odebírat dvojice jablek (z každé jedno), až dokud první hromádka nezůstane prázdná - druhá hromádka pak je větší (nebo nejvýše rovna) té první. Definice: Množina A je „nejvýše tak velká" jako množina B, právě když existuje injek-tivní funkce / : A —>• B. Množiny A a, B jsou „stejně velké" právě když mezi nimi existuje bijekce. V případech nekonečných množin pak místo "velikosti" mluvíme formálně o jejich w Z, Zj ZJ Komentář: Uvedená definice kardinality množin funguje korektně i pro nekonečné množiny: * Například N a TL mají stejnou kardinalitu (jsou „stejně velké", tzv. spočetně nekonečné). * Lze snadno ukázat, že i Q je spočetně nekonečná, tj. existuje bijekce / : N —> (Q, stejně 109 jako bijekce h : N —> N2. * Existují ale i nekonečné množiny, které jsou „striktně větší" než libovolná spočetná množina (příkladem je R ve Větě 11.2). * Později dokážeme, že existuje nekonečná posloupnost nekonečných množin, z nichž každá je striktně větší než všechny předchozí. Pro porovnávání velikostí množin někdy s výhodou využijeme následující přirozené, ale nelehké tvrzení (bez důkazu): Věta 11.1. Pro libovolné dvě množiny A, B (i nekonečné) platí, že pokud existuje injekce A —>• B a zároveň i injekce B —>• A, pak existuje bijekce mezi A a B. Cantorova diagonála, aneb kolik je reálných čísel Prvním klíčovým poznatkem ukazujícím na neintuitivní chování nekonečných množin je následující důkaz, který dal historicky vzniknout metodě tzv. Cantorovy diagonály. Věta 11.2. Neexistuje žádné surjektivní zobrazení g : N —y R. Důsledek 11.3. Neexistuje žádné injektivní (tudíž ani bijektivní) zobrazení h : R —y N. Neformálně řečeno, reálnych čísel je striktně více než všech přirozených. Důkaz (Věty 11.2 sporem): Nechť takové g existuje a pro zjednodušení se omezme jen na funkční hodnoty v intervalu [0,1) tj. ponechme z každé funkční hodnoty jen její nezápornou necelou část. Podle hodnot zobrazení g si takto můžeme „uspořádat" A B 110 dekadické zápisy všech reálných čísel v intervalu [0,1) po řádcích do tabulky: 9(0) 9(1) 9(2) 9(3) í? (4) 0. 15427578325 0. 4 0. 1 0. 3 0. 9 Nyní sestrojíme číslo a E [0,1) následovně; jeho i-tá číslice za desetinnou čárkou bude I, pokud v i-tém řádku tabulky na diagonále není 1, jinak to bude 2. V našem příkladě a = 0.21211... Kde se naše číslo a v tabulce nachází? (Nezapomeňme, g byla surjektivní, takže a někde musí být.) Konstrukce však ukazuje, že a se od každého čísla v tabulce liší na aspoň jednom desetinném místě, a to je spor. (Až na drobný technický detail s rozvojem ... 9.) □ II. 2 „Naivní" množinové paradoxy Analogickým způsobem k Větě 11.2 lze dokázat následovné zobecnění vyjadřující se o jakékoliv množině a jí přiřazené striktně větší množině. Věta 11.4. Nechť M je libovolná množina. Pak existuje injektivní zobrazení f : M —y 2M, ale neexistuje žádné bijektivní zobrazení g : M —y 2M. Důkaz: Dokážeme nejprve existenci /. Stačí ale položit f(x) = {x} pro každé x G M. Pak / : M —y 2M je zjevně injektivní. Neexistenci g dokážeme sporem. Předpokládejme tedy naopak, že existuje bijekce g : M —>• 2M. Uvažme množinu K c M definovanou takto: Jelikož g je bijektivní a, K E 2M, musí existovat y E M takové, že g (y) = K. Nyní rozlišíme dvě možnosti: - y E g(y). Tj. y E K. Pak ale y ^ g (y) z definice K, což je spor. - y (jL g(y)- To podle definice K znamená, že y E K, tj. y E g (y), spor. ^ Komentář: Dvě navazující poznámky. • Technika použitá v důkazech Vět 11.2 a 11.4 se nazýva Cantorova diagonální metoda, nebo také zkráceně diagonalizace. Konstrukci množiny K lze znázornit pomocí následující tabulky: K = {x E M \ x E~ g(x)}. a b c d g(a). g(b) 9(c) g(d) 111 Symbol y7 resp. — říká, že prvek uvedený v záhlaví sloupce patří resp. nepatří do množiny uvedené v záhlaví řádku. Tedy např. d G g (b) a a 0 g (d). Množina K poté obsahuje ty diagonálni prvky označené —, tj. „převrací" význam diagonály. • Z toho, že nekonečna mohou být „různě velká", lze lehce odvodit řadu dalších faktů. V jistém smyslu je např. množina všech problémů větší než množina všech algoritmů (obě množiny jsou nekonečné), a proto nutně existují problémy, které nejsou algoritmicky řešitelné. Cantorův paradox Naivní teorie množin, jak jsme si ji uvedli i v tomto předmětu, trpí mnoha neduhy a nepřesnostmi, které vyplynou na povrch především při „neopatrné manipulaci" s nekonečnými množinami. Abychom se těmto „neopatrnostem" vyhnuli bez přílišné formalizace, dva základní z těchto paradoxů si nyní ukážeme. Příklad 11.5. Uvážíme-li nyní nekonečnou posloupnost množin A1,A2,A3,A4,--- kde A\ = N a Ai+1 = 2Ai pro každé i G N, je vidět, že všechny množiny jsou nekonečné a každá je striktně větší než libovolná předchozí. Kde však v tomto řazení kardinalit bude „množina všech množin"! Na tuto otázku, jak sami asi cítíte, nelze podat odpověď. Co to však znamená? □ * Takto se koncem 19. století objevil první Cantorův paradox nově vznikající teorie množin. * Dnešní moderní vysvětlení paradoxu je jednoduché, prostě „množinu všech množin" nelze definovat, taková v matematice neexistuje. Brzy se však ukázalo, že je ještě mnohem hůř... Russelův paradox Fakt: Není pravda, že každý soubor prvků lze považovat za množinu. * Nechť X = {M | M je množina taková, že M £ M}. Platí X G X ? - Ano. Tj. X G X. Pak ale X splňuje X g X. - Ne. Pak X splňuje vlastnost X ^ X, tedy X je prvkem X, tj., X E X. * Obě možné odpovědi vedou ke sporu. X tedy nelze prohlásit za množinu. Jak je ale něco takového vůbec možné? Komentář: Vidíte u Russelova paradoxu podobnost přístupu s Cantorovou diagonalizací? Russelův paradox se objevil začátkem 20. století a jeho „jednoduchost" zasahující úplné základy matematiky (teorie množin) si vynutila hledání seriózního rozřešení a rozvoj formální matematické logiky. Pro ilustraci tohoto paradoxu, slyšeli jste už, že „v malém městečku žije holič, který holí právě ty muže městečka, kteří se sami neholí"? Zmíněné paradoxy naivní teorie množin zatím v tomto kurzu nerozřešíme, ale zapamatujeme si, že většina matematických a informatických disciplín vystačí s „intuitivně bezpečnými" množinami. 112 11.3 Algoritmická neřešitelnost problému zastavení Výše vysvětlené myšlenky diagonalizace a principů základních paradoxů naivní teorie množin sice vypadají „velmi matematicky". Přesto je však téměř beze změny lze aplikovat i na bytostně informatickou otázku, zda lze algoritmicky poznat, pro které vstupy se daný program vůbec zastaví. Negativní odpověď na tuto otázku je jedním z fundamentálních výsledků informatiky a přitom má překvapivě krátký a čistý důkaz diagonalizací. Fakt: Uvědomme si (velmi neformálně) několik základních myšlenek. * Program v každém programovacím jazyce je konečná posloupnost složená z konečně mnoha symbolů (písmena, číslice, mezery, speciální znaky, apod.) Nechť E je množina všech těchto symbolů. Množina všech programů je tedy jistě podmnožinou množiny UieN^1' která je spočetně nekonečná. Existuje tedy bijekce / mezi množinou N a množinou všech programů. Pro každé j G N označme symbolem Pj program f(j). Pro každý program P tedy existuje i G N takové, že P = Pí. * Každý možný vstup každého možného programu lze zapsat jako konečnou posloupnost symbolů z konečné množiny T. Množina všech možných vstupů je tedy spočetně nekonečná a existuje bijekce g mezi množinou N a množinou všech vstupů. Pro každé j G N označme symbolem Vj vstup g(j). * Předpokládejme, že existuje program H alt, který pro dané i, j G N zastaví s výstupem ano/ne podle toho, zda Pí pro vstup Vj zastaví, nebo ne. * Tento předpoklad dále dovedeme ke sporu dokazujícímu, že problém zastavení nemá algoritmické řešení. Věta 11.6. Neexistuje program Halt, který by pro vstup (Pi} Vj) správně rozhodl, zda se program Pí zastaví na vstupu Vj. Důkaz: Sporem uvažme program Diag s následujícím kódem: input k; if iJa/r(k,k) =ano then while true do ; done (Program Diag(k) má na rozdíl od Halt jen jeden vstup k, což bude důležité.) Fungování programu Diag lze znázornit za pomocí následující tabulky: ^Po Pi p2 p3 ... - v ••• v1 - v ••• v2 — ^{ V3 Symbol y/ resp. — říká, že program uvedený v záhlaví sloupce zastaví resp. nezastaví pro vstup uvedený v záhlaví řádku. Program Diag „zneguje" diagonálu této tabulky. Podle našeho předpokladu (Diag je program a posloupnost Pí zahrnuje všechny programy) existuje j G N takové, že Diag = Pj. Zastaví Diag pro vstup Vj? - Ano. Podle kódu Diag pak ale tento program vstoupí do nekonečné smyčky, tedy nezastaví. 113 - Ne. Podle kódu Díag pak ale if test neuspěje, a tento program tedy zastaví. Předpoklad existence programu Halt tedy vede ke sporu. □ Komentář: Otázkami algoritmické (ne)řešitelnosti problémů se zabývá teorie vyčíslitelnosti. Metoda diagonalizace se také často využívá v teorii složitosti k důkazu toho, že dané dvě složitostní třídy jsou různé. Rozšiřující studium Látka této lekce zabrousila až do teoretických hlubin matematické logiky a teorie množin. Další studium v těchto oblastech se dá očekávat hlavně u studentů specifícky zaměřených teoretickým směrem (a mířících spíše do akademické než aplikační sféry), zajímajících se o matematiku samotnou nebo o teorii vyčíslitelnosti. Proto také uvedené pokročilé poznatky Lekce 11 nebudou vyžadovány u zkoušky tohoto předmětu. 114 Závěrem Gratulujeme všem, kteří se naším nelehkým učebním textem „prokousali" až sem, a přejeme mnoho úspěchů v dalším studiu informatiky. Konečně znovu připomínáme, že nedílnou součástí našeho studijního textu je Interaktivní osnova předmětu IB000 v IS MU a v ní přiložené online odpovědníky určené k procvičování přednesené látky. http://is.muni.cz/el/1433/podzim2016/IB000/index.qwarp 115