*5 Stromy - grafy bez kružnic Jednou ze základních podtříd všech grafů jsou tzv. stromy. Jedná se o minimální souvislé grafy, neboli souvislé grafy bez kružnic. Na druhou stranu lze stromy vnímat jako vhodné zobecnění cest, zachovávající mnoho ze „snadnosti" v zacházení se stromy. Důležitost stromů - jak v matematice, tak i v informatických aplikacích - úzce souvisíš absencí kružnic a z ní vyplývající snadnosti jejich popisu a zpracování. Stručný přehled lekce • Definice a základní vlastnosti stromů. • Kořenové a uspořádané stromy. • Efektivní určení isomorfismu stromů. • Kostry grafů a jejich enumerace. Petr Hliněný, Fl MU Brno, 2013 1/16 Fl: MA010: Stí 5.1 Základní vlastnosti stromů Definice 5.1. Strom je jednoduchý souvislý graf T bez kružnic. Lema 5.2. Strom s více než jedním vrcholem obsahuje vrchol stupně 1. □ Důkaz: Souvislý graf s více než jedním vrcholem nemůže mít vrchol stupně 0. Proto vezmeme strom Tav něm libovolný vrchol v. Sestrojíme nyní co nejdelší sled S v T začínající ve v: S začne libovolnou hranou vycházející z v. V každém dalším vrchole u, do kterého se dostaneme a má stupeň větší než 1, lze pak pokračovat sled S další novou hranou. Uvědomme si, že pokud by se ve sledu S poprvé zopakoval některý vrchol, získali bychom kružnici, což ve stromě nelze. Proto sled S musí jednou skončit v nějakém vrcholu stupně 1 v T. □ C Věta 5.3. Strom na n vrcholech má přesně n — 1 hran pro n > 1. □ Důkaz: Toto tvrzení dokážeme indukcí podle n. Strom s jedním vrcholem má n — 1 — 0 hran. Nechť T je strom na n > 1 vrcholech. Podle Lematu 5.2 má T vrchol v stupně 1. Označme T' — T — v graf vzniklý z T odebráním vrcholu v. Pak T' je také souvislý bez kružnic, tudíž strom na n — 1 vrcholech. Dle indukčního předpokladu T' má n — 1 — 1 hran, a proto Tmán — 1 — 1 + 1 = n — 1 hran. C Petr Hliněný, Fl MU Brno, 2013 2/16 Fl: MA010: Stí Věta 5.4. Mezi každými dvěma vrcholy stromu vede právě jediná cesta. □ Důkaz: Jelikož strom T je souvislý dle definice, mezi libovolnými dvěma vrcholy u,v vede nějaká cesta. Pokud by existovaly dvě různé cesty Pi,P2 mezi u,v, tak bychom vzali jejich symetrický rozdíl, podgraf H — P1ÁP2 s neprázdnou množinou hran, kde H zřejmě má všechny stupně sudé. Na druhou stranu se však podgraf stromu musí opět skládat z komponent stromů, a tudíž obsahovat vrchol stupně 1 podle Lematu 5.2, spor. Proto cesta mezi u a v existuje jen jedna. □ C Důsledek 5.5. Přidáním jedné nové hrany do stromu vznikne právě jedna kružnice. Důkaz: Nechť mezi vrcholy u, v ve stromu T není hrana. Přidáním hrany e — uv vznikne právě jedna kružnice z e a jediné cesty mezi u,v v T podle Věty 5.4. □ C Věta 5.6. Strom je minimální souvislý graf (na daných vrcholech). □ Důkaz: Strom je souvislý podle definice. Pokud by ale vypuštěním hrany e — uv ze stromu T vznikl opět souvislý graf, pak by mezi u,v v T existovaly dvě cesty (dohromady kružnice) - hrana e a jiná cesta v T—e. To je ve sporu s Větou 5.4. Naopak, pokud by souvislý graf měl kružnici, zůstal by souvislý i po vypuštění některé hrany té kružnice. Proto každý minimální souvislý graf (na daných vrcholech) je stromem. Tudíž strom je právě minimálním souvislým grafem na daných vrcholech. C Petr Hliněný, Fl MU Brno, 2013 3/16 Fl: MA010: Stí Příklad 5.7. Kolik nejvýše kružnic vznikne v grafu, který vytvoříme ze stromu přidáním dvou hran?u Přidáním jedné hrany do stromu T vznikne jedna kružnice dle Důsledku 5.5. Druhá hrana vytvoří nejméně ještě jednu kružnici ze stejných důvodů, ale může vytvořit i dvě další kružnice, jako třeba v následujícím grafu, kde strom T je vyznačen plnými čarami a dvě přidané hrany čárkovaně. Každá z přidaných dvou hran vytvoří vlastní trojúhelník a navíc ještě vznikne kružnice délky 4 procházející oběma z přidaných hran. □ Na druhou stranu chceme ukázat, že více než 3 kružnice po přidání dvou hran e, / do stromu T vzniknout nemohou: Podle Důsledku 5.5 vznikne jen jedna kružnice procházející hranou e a neobsahující/, stejně tak jedna kružnice procházející / a neobsahující e. Nakonec stačí nahlédnout, že je nejvýše jedna možná kružnice procházející oběma hranami e, /: Pokud by takové byly dvě různé C\, C*2, podívali bychom se na jejich symetrický rozdíl, podgrafií — C1AC2, který má všechny stupně sudé, neprázdnou množinu hran a je navíc pografem stromu T. Takže stejně jako ve Větě 5.4 dostáváme spor s faktem, že podgrafy stromů s hranami musí obsahovat vrchol stupně 1. C Petr Hliněný, Fl MU Brno, 2013 4/ 16 Fl: MA010: Stí 5.2 Kořenové stromy Při mnoha aplikacích stromových struktur se ke stromu jako grafu samotnému ještě váží dodatečné informace, jako třeba vyznačený jeden vrchol, tzv. kořen stromu, ze kterého celý strom „vyrůstá". Typickým příkladem jsou různé (acyklické) datové struktury, ve kterých je vyznačený vrchol - kořen, referován jako „začátek" uložených dat. i Kořenové stromy mají také tradiční motivaci v rodokmenech a z toho vychází jejich běžná terminologie. Definice 5.8. Kořenovým stromem je strom T spolu s vyznačeným kořenem r e V (T), zkráceně dvojice (T,r). Příklad kořenového stromu je na následujícím obrázku: r Zajímavostí je, že v informatice stromy většinou rostou od kořene směrem dolů. (Však také nejsme v biologii. . .) Petr Hliněný, Fl MU Brno, 2013 5/16 Fl: MA010: Stí Definice: Mějme kořenový strom T, r a v něm vrchol v. Označme u souseda v na cestě směrem ke kořeni r. Pak je u nazýván rodičem f a f je nazýván potomkem u. □ Kořen nemá žádného rodiče. kořen potomci Často se také setkáte v kořenových stromech s označováním „otec-syn" místo rodič-potomek. Definice: Vrchol stupně 1 v libovolném stromu nazýváme listem. Pozor, i kořen stromu může být listem, pokud má stupeň 1, ale obvykle se to tak neříká. List kořenového stromu, který není kořenem, nemá potomky. Petr Hliněný, Fl MU Brno, 2013 6/16 Fl: MA010: Stí Centrum stromu Definice: Centrem stromu T rozumíme buď vrchol nebo hranu nalezenou v T následujícím postupem: • Pokud má strom T jeden vrchol, je to jeho centrum. Pokud má strom T dva vrcholy, je jeho centrem hrana spojující tyto dva vrcholy. □ • Jinak vytvoříme menší strom T' C T vypuštěním všech listů T najednou. Je zřejmé, že T' je neprázdný, a vracíme se na předchozí bod. Rekurzivně získané centrum T' je zároveň centrem T. □ Příklad 5.9. Ilustrací definice centra jsou následující dvě ukázky jeho nalezení: ® □ Z Pokud chceme danému (abstraktnímu) stromu přiřadit jednoznačně kořen, je nejlepší jej přiřadit centru stromu. Speciálně, pokud je centrem hrana, bude kořenem nový vrchol „rozdělující" tuto hranu na dvě. Tvrzení 5.10. Centrum stromu podle předchozí definice přesně odpovídá „ vzdálenostnímu" centru danému Definicí 3.5. Uspořádání na stromu Definice: Kořenový strom T,r je uspořádaný, pokud je pro každý jeho vrchol jednoznačně dáno pořadí jeho potomků (zleva doprava). Uspořádaný kořenový strom se také nazývá pěstovaný strom. □ Uspořádaný kořenový strom si jinak také můžeme představit jako strom s vyznačeným kořenem a pevně zvoleným nakreslením v rovině bez křížení hran. Nakreslení hran potomků vzhledem k hraně rodiče pak udává (ve zvolené orientaci) pořadí potomků. potomci: 12 3 4 Petr Hliněný, Fl MU Brno, 2013 9/16 Fl: MA010: Stí 5.3 Isomorfismus stromů Jelikož stromy jsou speciálním případem grafů, je isomorfismus stromů totéž co isomorfismus grafů. Avšak na rozdíl od obecných grafů, kdy je určení isomorfismu těžký problém, pro isomorfismus stromů existuje efektivní postup, který si ukážeme dále. □ Definice: Dva kořenové stromy T,r a T', r' jsou isomorfní pokud existuje isomorfismus mezi stromy T a T", který kořen r zobrazuje na kořen r'. Definice: Dva uspořádané kořenové stromy jsou isomorfní pokud je mezi nimi isomorfismus kořenových stromů, který navíc zachovává pořadí potomků všech vrcholů. Kódování uspořádaných kořenových stromů („závorkování" stromů) Definice: ( ((()()())()) (()(())) ) Kód uspořádaného kořenového stromu se spočítá rekurzivně z kódů všech podstromů kořene, seřazených v daném pořadí a uzavřených do páru závorek. □ Poznámka: Místo znaků '(' a ')' lze použít i jiné symboly, třeba '0' a '1'. Lema 5.11. Dva uspořádané kořenové (pěstované) stromy jsou isomorfní právě když jejich kódy získané podle předchozího popisu jsou shodné řetězce. Příklad 5.12. Nakreslete jako pěstovaný strom ten odpovídající závorkovému kódu ((()(()()()()))(()()))■ Je-li dán kód s uspořádaného kořenového stromu, snadno z definice nahlédneme, že příslušný strom nakreslíme následujícím postupem: - Při přečtení znaku '(' na začátku spustíme pero na papír, do kořene. □ - Při každém dalším přečtení znaku '(' nakreslíme hranu do následujícího potomka současného vrcholu. □ - Při každém přečtení znaku ')' se perem vrátíme do rodiče současného vrcholu, případně zvedneme pero, pokud už jsme v kořeni. Z Při určování isomorfismu obecných stromů použijeme závorkový kód, pro který kořen volíme v centru a potomky seřadíme podle jejich kódů vzestupně abecedně. Algoritmus 5.13. Určení isomorfismu dvou stromů. vstup < stromy T a U; if (\V(T)\\=\V(U)\) return 'Nejsou isomorfní.'; (T,r) = korenove_centrum(T); (U,s) = korenove_centrum(U); k = minimalni_kod(T,r) ; m = minimalni_kod(U, s) ; if (k==m coby řetězce) výstup 'Jsou isomorfní.'; else výstup 'Nejsou isomorfní.'; c Funkce minimalni_kod(strom X, vrchol r) { if (\V(X)\==Í) return "O"; d = počet komponent grafu X-r, tj. podstromů kořene r; for (i = l, . . . ,d) { Y[i] = i-tá souvislá komponenta grafu X-r; s [i] = í-tý soused r, tj. kořen podstromu Y [i]; k[i] = minimalni_kod(Y[i],s[i]); } sort k[1] <=k[2] <=. . . <=k[d] lexikograficky (abecedně); return "("+k[l]+...+k[d]+")"; } Důkaz správnosti Algoritmu 5.13 je podán v následujícím tvrzení. Věta 5.14. Mějme dva stromy T,U o stejném počtu vrcholů a nechí (T", r) a (U', s) jsou po řadě jejich kořenové stromy získané v první části Algoritmu 5.13 (kde r, s jsou centra T, U). Pak platí: a) T a U jsou isomorfní, právě když (T", r) je isomorfní (U', s). b) (T',r) je isomorfní (U',s), právě když minimalni_kod(T', r) — minimalni_kod(U', s). Důkaz: Tvrzení (a) ihned plyne z jednoznačnosti definice centra stromu. Za druhé (b) dokazujeme indukcí podle hloubky našich kořenových stromů T', r a U', s. (Zřejmě pokud mají různé hloubky, isomorfní nejsou.) Dva kořenové stromy hloubky 0 jsou vždy isomorfní a mají shodný kód „()". Dále vezmeme T', r a U', s hloubky l > 0. Pokud jejich kódy vyjdou shodné, jsou isomorfní. Naopak pro isomorfní T',r a U',s existuje bijekce mezi vzájemně isomorfními podstromy jejich kořenů, tudíž podle indukčního předpokladu kódy těchto podstromů jsou po dvojicích shodné. Jelikož se v obou případech setřídí kódy podstromů stejně, vyjde minimalni_kod(T', r) — minimalni_kod(U', s). C 5.4 Kostry grafů Definice 5.15. Kostrou souvislého grafu G je podgraf v G, který je sám stromem a obsahuje všechny vrcholy grafu G. □ Příklad 5.16. Kolik různých koster má tento graf? Podívejme se na kostru grafu takto - jaké hrany z grafu vymažeme, aby zbyl strom? Zajisté musíme vymazat některou hranu z první kružnice (5 možností) a některou hranu z druhé kružnice (6 možností). Na druhou stranu to v tomto jednoduchém příkladě už stačí, vždy pak zbude strom. Výběr vymazané hrany z první kružnice je nezávislý na druhé kružnici (jsou disjunktní), a proto dle principu nezávislých výběrů máme 5-6 — 30 možností vybrat dvě hrany k vymazání. Celkem tedy vyjde 30 koster. C Následující výsledek Cayleye patří ke „krásným drahokamům" teorie grafů. Věta 5.17. Úplný graf Kn pro n > 0 má přesně nn~2 koster. □ Definice. Laplaceova matice Q — (qij)™j=1 grafu G o n vrcholech je definována: - qu — dc(i) (stupeň vrcholu), _ qij — 0 pro vrcholy í ^ j nespojené hranou, - — —1 pro vrcholy í ^ j spojené hranou. □ Věta 5.18. Necht Q je Laplaceova matice grafu G a matice Q' vznikne vyškrtnutím jejího prvního řádku a sloupce. Pak počet koster grafu G je roven determinantu \Q'\. Důkaz této překvapivé věty je mimo dosah naši přednášky (využívá silné nástroje lineární algebry). Uvědomte si, proč samotná matice Q je singulární (determinantu 0) - neboť součet prvků v každém řádku je 0. Je také možno vyškrtá vat jiné řádky a sloupce, ale může se tím změnit znaménko determinantu.