Dynamické systémy a systémová dynamika Úvod V podzimním semestru 2006 byl předmět M8115 Seminář z matematického modelování inovován -- byla do něj začleněna témata vztahující se k aktuální problematiky udržitelného rozvoje. Jedním z důležitých aspektů udržitelnosti je schopnost komunikace přes hranice oborů. (Budování Babylonské věže se ukázalo jako neudržitelné po zmatení jazyků, tj. v okamžiku, kdy se pracovníci nebyli schopni mezi sebou domluvit.) Ekologie je přírodní věda pevně stojící na matematickém základě (viz např. [4]); tomu ale většinou nerozumí ekologičtí (snad výstižněji řečeno environmentalističtí) aktivisté, kteří se snaží podle svého nejlepšího vědomí a svědomí pro udržitelný život něco dělat, ani pracovníci státní nebo obecní správy, kteří pod tlakem všemožných, často ekonomických, omezení o životě rozhodují. Řídícím a organizačním pracovníkům může být bližší manažerský způsob myšlení než přírodovědecký nebo dokonce matematický. Pro tyto lidi je nutné (nebo by aspoň mělo být), aby byli schopni posuzovat důsledky svých rozhodnutí; posouzení metodou pokus-omyl je však velice nákladné, v horším -- ale vysoce pravděpodobném -- případě může mít omyl destruktivní a nevratné následky. Potřebnou úlohu jakéhosi ,,manažerského trenažéru může hrát systémová dynamika, disciplína rozvíjející se v posledních letech (viz např. [7]) se svými simulačními modely. Tyto modely jsou vyjádřeny obrázky, jejich výstupy grafy a tabulkami, tedy způsobem, kterému i manažeři mohou rozumět. Právě systémová dynamika se může stát společným jazykem tvůrců rozhodnutí, aktivistů i vědců. Následující text představuje inovované lekce v kursu M8115. Po obecném úvodu o (matematickém) modelování se věnuje modelům zapsaným diferenciálními nebo diferenčními rovnicemi, a potom stejným modelům vyjádřeným prostředky systémové dynamiky. Tím může být návodem k překladu dynamických systémů do systémové dynamiky nebo naopak. Jistá ,,upovídanost textu je důsledkem snahy o její čitelnost nejen pro studenty matematiky, ale i jiných oborů, případně pro zájemce z dalších oborů i mimo akademickou sféru. K této ,,obecné čitelnosti a snad i zajímavosti by měly přispět i dva v textu uvedené exkursy. i Obsah 1 Modely a modelování 1 1.1 Úvodní pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Třídění modelů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Exkurs: Co je lineární? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 Vlastnosti matematického modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.4 Proces modelování . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.5 Sestavení dynamického modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2 Dynamické rovnice 19 2.1 Deterministické dynamické modely zapsané dynamickými rovnicemi . . . . . . . . 19 Exkurs: Jak plyne čas? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.2 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3 Modely vyjádřené piktogramy 30 3.1 Akumulace, toky a dynamické rovnice . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.2 Příklad -- válka s terorismem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 Literatura 35 ii Kapitola 1 Modely a modelování O modelování se často říká, že je více uměním než vědou. Jistým způsobem se však ještě více podobá řemeslu, třeba tesařině. Každý modelář přistupuje k problému nějak jinak; podle druhu svého vzdělání, zkušeností a v neposlední řadě i vkusu nebo převládající módy. Ale pokud je problém specifikován -- o co jde, k čemu má model sloužit, jaké údaje jsou k dispozici a podobně --, pak dva zkušení modeláři pravděpodobně vytvoří funkčně velice podobné modely. 1.1 Úvodní pojmy Systém je cokoliv, co lze nějak, přinejmenším v myšlení, vydělit z reality, něco, co se nějakým způsobem liší od svého komplementu. Abychom něco vnímali a mohli o tom přemýšlet, musíme ,,to nejdříve rozpoznat, odlišit od okolí, od ostatních jevů. A abychom ,,to vnímali jako systém, nejen jako jednoduchý jev, musí ,,to být nějak strukturováno, skládat se z nějakých částí. A tyto části jsou spolu provázány nějak těsněji, než s jevy mimo systém. Jinak by složky systému souvisely se světem ,,vně více než ,,uvnitř systému a ten by se rozpadl a na součásti, které by splynuly s okolím. Systém existující v reálném světě můžeme (nebo chceme) nějak representovat, nahradit nějakým systémem jiným, jednodušším, srozumitelnějším, zvládnutelnějším. Zkoumanou skutečnost (systém) budeme nazývat originálem, jeho representaci, což je také nějaký systém, nazveme modelem. Každý model je vytvářen za nějakým účelem, při procesu modelování zachováváme jen ty složky, vlastnosti, vztahy systému, které jsou pro tento účel podstatné, od ostatních odhlížíme. Trochu přesněji lze říci, že systém je nějaká množina, na níž jsou definovány nějaké relace. Originál O a model M musí být takové, že existuje morfismus : O M. Zobrazení samozřejmě nemusí být prosté. Každý model je postaven na nějakých předpokladech, které často nejsou úplně realistické. Jakou cenu tedy má jeho analýza, na jaké otázky může odpovědět? V této situaci se ukazuje jako užitečné rozlišit projekci a predikci (nebo předpověď). Predikce říká, co se stane; projekce popisuje, co by se za jistých předpokladů mohlo stát. S použitím gramatických termínů lze říci, že predikce je indikativ a projekce konjunktiv. Například ze struktury nějaké soustavy rovnic plyne, jaké jsou meze nebo trendy vývoje modelovaného ekosystému nebo společenstva, případně kdy celý systém zkolabuje. Tyto výsledky lze ale snadno zpochybnit poukazem na to, že podmínky vývoje se mohou změnit. Tato kritika je však oprávněná pouze v případě použití modelu k predikci, při projekci je bezvýznamná. Projekce totiž nemluví o budoucnosti, pouze odpovídá na otázku, jak by se daný systém choval, pokud by okolnosti nebo podmínky byly neměnné. Projekce ukazuje něco o současnosti systému (přesněji řečeno o vztahu současných podmínek a systému, který se v nich vyvíjí), neodhaluje jeho budoucnost. Vyšetřování důsledků současného stavu pro budoucnost, pokud by se neměnily okolnosti, je velice silným nástrojem k porozumění současnému stavu. Stejným způsobem funguje tachometr. Ukazuje-li 90 kilometrů za hodinu, lze učinit předpověď, že automobil bude za hodinu ve vzdálenosti 90 kilometrů od současné polohy. Tato predikce je téměř 1 jistě špatně. Ale jako projekce říká, že pokud by automobil zůstal na přímé silnici dlouhé alespoň 90 km a pohyboval se stále stejně rychle, tak by za hodinu byl ve vzdálenosti 90 km od současné polohy. Nikdo snad nezpochybňuje, že údaj 90 km/hod poskytuje cennou informaci o aktuálním stavu automobilu. 1.2 Třídění modelů Modely lze klasifikovat podle různých hledisek. První z nich vychází z povahy modelu; podle ní rozlišujeme modely * materiální a * ideální. Materiální jsou všechny modely, které lze, přinejmenším principiálně, uchopit do ruky nebo alespoň ohmatat -- modely lodí, letadel, staveb, vodních cest (a nezáleží na tom, zda pouštíme elektrický proud do vhodným způsobem pospojovaných drátů, nebo do rýh v nějaké podložce napouštíme vodu), modelem člověka může být krejčovská panna nebo terč pro nácvik ostré střelby a podobně. Za modely tohoto druhu lze považovat i analogové počítače. Materiálními modely se v tomto textu zabývat nebudeme. Ideální modely lze rozdělit na schematické (různá schémata elektrických obvodů, dopravních sítí, vztahů osob vystupujících v telenovele ap., matematické (jsou zapsány pomocí matematických symbolů) a počítačové (jsou tvořeny nějakým počítačovým programem). Je jasné, že mezi matematickými a počítačovými modely nevede ostrá hranice -- samotný program může být zapsán na papíře jako posloupnost nějakých symbolů, částmi programů jsou i matematické formule; z matematického modelu lze vytvořit počítačový, pokud existují efektivní algoritmy pro řešení použitých rovnic, pro výpočet hodnot příslušných funkcí, pro vyhodnocení logických výrazů a podobně. Navíc programové systémy pro symbolické výpočty (Maple, Mathematica, . . . ) umožňují zapsat a analyzovat matematický model nejen tužkou na papíře, ale i ve ,,virtuálním zápisníku . Ani rozlišení schematického a matematického modelu nemusí být jasné. Např. schéma linek MHD lze považovat za matematický model založený na teorii grafů. Toto dělení je tedy spíše pomocné, vyjadřujeme jím pouze to, zda je větší důraz kladen na vyjádření struktury modelovaného děje nebo jevu, na matematické analyzování modelu a odvozování důsledků z něho plynoucích, nebo na jeho počítačovou realizaci. Základním kriteriem pro třídění matematických/počítačových modelů je jejich chování čase. Z tohoto hlediska dělíme modely na * statické nebo deskriptivní (v čase se nemění) a * dynamické (vyvíjí se v čase). V případě ,,ryze matematických modelů je toto třídění poněkud problematické. V matematice (nebo přinejmenším v její množinové podobě) čas ve vlastním smyslu neexistuje. I pohyb nebo směřování se vyjadřuje pomocí ,,strnulé formulace: ,,ke každému existuje , že . . . . Přesněji je tedy dynamický model takový, v němž existuje jedna ,,privilegovaná skalární veličina modelující čas. Mezi dynamickými modely lze dále rozlišit modely -- bez paměti a -- s pamětí. U modelů s pamětí závisí jejich stav ,,v následujícím časovém okamžiku 1 na současném (aktuálním) stavu i na stavu v nějakém minulém okamžiku, případně na vývoji modelu v minulosti; u modelů bez paměti pouze na stavu aktuálním. Matematické/počítačové modely lze také dělit podle charakteru veličin a proměnných v něm vystupujících. Jedna možnost je rozlišit modely na 1Co toto sousloví přesně znamená, bude specifikováno později: na str. 20 v exkursu kapitoly 2. 2 ˇ stochastické (v modelu se vyskytuje alespoň jedna náhodná veličina) a * deterministické (v modelu náhodná veličina není). Přitom náhodnou veličinou u dynamických modelů není čas. Toto dělení je opět jenom pomocné -- každou veličinu lze totiž považovat za náhodnou; distribuční funkce těch ,,nenáhodných nabývá pouze dvou hodnot, konkrétně 0 a 1. Matematické modely lze také dělit na * diskrétní (veličiny nabývají nejvýše spočetně mnoha hodnot) * spojité (veličiny nabývají hodnot z nějakého kontinua) a * smíšené (v modelu se vyskytují proměnné obou typů). V případě dynamických modelů můžeme mít modely, v nichž je čas diskrétní a ostatní veličiny spojité, modely se spojitým časem a ostatními veličinami diskrétními, modely se všemi veličinami spojitými a podobně. Je tedy potřeba rozlišovat, zda při této klasifikaci mluvíme o čase (privilegované proměnné) nebo o veličinách ostatních. Vzhledem k tomu, že každý digitální počítač se může nacházet jen v konečném počtu stavů -- a nezáleží na tom, že jich je nepředstavitelně mnoho --, je každý počítačový model diskrétní. Ovšem toto rozlišení je opět zrelativizováno existencí programů pro symbolické výpočty. Jiná možnost klasifikace matematických/počítačových modelů vychází z jejich vztahu k ,,okolí , tj. k veličinám, které nejsou součástí modelu. V tomto případě lze modely dělit na * autonomní (nezávislé na ,,okolí ) a * neautonomní (explicitně závislé na nějaké ,,vnější proměnné). U dynamických modelů je nejdůležitější závislost na čase; příslušné systémy dynamických rovnic se dělí na autonomní a neautonomní podle toho, zda je v jejich pravých stranách explicitně uveden čas, či nikoli. Modely autonomní v čase i ostatních proměnných vyjadřují fundamentální přírodní zákony; např. rozpad částic probíhá stejně ve čtvrtek jako v pátek, na Zemi nebo na Marsu. Většinu přírodních procesů modelujeme modely autonomními v čase a neautonomními v jiných proměnných; např. model závislosti bodu varu vody na teplotě je jiný při tlaku vzduchu 1, 013 105 Pa nebo tlaku nižším než tento normální, ovšem model je stejný dnes jako byl v 19. století; v modelu závislosti kvality (cukernatosti) moštu na výnosu vinné révy je třeba uvažovat rok, ve kterém se děj odehrává -- množství cukru totiž podstatně závisí na teplotě v období zrání hroznů. Dělení modelů na autonomní a neautonomní je opět poněkud umělé. ,,Vnější proměnné lze zahrnout do modelu: např. ,,model varu vody může obsahovat jako své proměnné teplotu i tlak, součástí modelu kvality révy může být nějaký autonomní submodel vývoje počasí2 a podobně. Dosud uvedené způsoby klasifikace vycházely z charakteru modelů, nikoliv z matematických metod použitých při jejich tvorbě. Při takovém přístupu bychom mohli mluvit o modelech založených na teorii množin nebo relačních struktur, na maticové algebře, na diferenciálních nebo diferenčních rovnicích a to obyčejných nebo parciálních a podobně. V tomto pojetí by modely byly součástí příslušné matematické disciplíny, přesněji řečeno, vystupovaly by jako příklady ilustrující použitelnost teorie pro řešení reálných problémů. Ještě jiný způsob klasifikace může být založen na vztahu modelu a originálu. z tohoto hlediska lze rozlišit modely * demonstrativní a * explikativní. Demonstrativní modely příslušný jev nebo děj pouze popisují, ukazují jak vypadá nebo probíhá, nikoliv proč tomu tak je. Např. Keplerovy zákony popisují pohyb planet kolem slunce. Explikativní modely se snaží odpovědět na otázku proč; jsou založeny na přesně formulovaných předpokladech a jasně vymezených pojmech, které označují pozorovatelné (a v lepším případě i kvantifikovatelné) 2V současnosti samozřejmě žádný takový model, který by byl dostatečně spolehlivý, není znám. 3 jevy. Např. Newtonovy pohybové zákony spolu s jeho zákonem gravitačním vysvětlují, proč se planety pohybují konstantní plošnou rychlostí po kuželosečkách s ohniskem ve Slunci. Explikativní model tedy redukuje nějaký reálný proces na procesy nebo jevy jiné ,,úrovně . Ty mohou být ,,jednodušší nebo ,,prvotnější , poněvadž jsou konkrétnější, snadněji nahlédnutelné (např. vývoj populace popíšeme pomocí počtu jedinců, počtu plodných mezi nimi, počtu narozených a zemřelých za nějakou jednotku času) nebo naopak abstraktnější (barvu tónu vyjádříme pomocí kinetické energie jednotlivých svrchních tónů). Odpověď na otázku, zda skutečně jev na nějaké úrovni lze zredukovat na jevy úrovně jiné, zda ,,celek není nic než souhrn částí , nebo ne, podstatně závisí na filosofických východiscích. Pro potřeby modelování reálných procesů však na odpovědi nezáleží; model je vždy zjednodušením reality a důležité je pouze to, zda se při zjednodušení nějaká, z hlediska účelu modelu podstatná, vlastnost neztratí. Pokud myslíme na účel modelu, můžeme uvést ještě jedno klasifikační kriterium. Modely lze dělit na * teoretické a * praktické. Teoretické modely slouží k porozumění, jak se nějaký systém za určitých podmínek chová, případně proč. Praktický model má predikovat, jak se konkrétní systém bude chovat, případně pomoci při rozhodnutí pro nějaký zásah do systému. Teoretický model by měl být dostatečně jednoduchý, aby z něho bylo vidět, proč se děje to, co se děje. Vztah mezi hypothesami (předpoklady modelu) a závěry (vlastnostmi řešení modelu) zprostředkuje porozumění modelovanému systému. Nahrazení komplexního systému komplexním modelem, kterému nerozumíme, neprohloubí poznání. Teoretické modely jsou často vyjádřeny několika rovnicemi, které představují ty nejrelevantnější procesy podílející se na několika jevech, jež jsou předmětem zvláštního zájmu. Praktický model obětuje jednoduchost, aby získal co nejpřesnější predikce chování konkrétního systému. Může obsahovat mnoho rovnic odvozených z množství pozorovaných údajů. Takový model je obvykle příliš komplikovaný, aby ho bylo možno nějak matematicky analyzovat; lze ho však simulovat na počítači. Dělení modelů na teoretické a praktické je opět jenom pomocné. Čistě teoretické a praktické modely představují jakési extrémy, skutečné modely leží někde mezi nimi. Množství času a vynaloženého úsilí, nedostatek vstupních údajů a potřeba komunikovat se spolupracovníky omezují komplexnost praktických modelů. Na druhé straně, teoretické modely jsou často vystaveny konfrontaci s pozorovanými daty. Pak zůstanou teoretickými pouze v tom smyslu, že zahrnují jen několik ,,podstatných procesů, ale použité rovnice lze zkomplikovat tak, aby model se správnou základní strukturou přežil i kvantitativní srovnání s daty. V popularizační literatuře bývají modely a dokonce i systémy děleny na lineární a nelineární. Přitom však není jasné, co tyto pojmy označují; proto je jim věnován následující exkurs. Exkurs: Co je lineární? Obvyklou frází je, že základní vlastností složitých systémů je jejich nelinearita, která se projevuje tak, že malé změny nějakých hodnot vyvolají velké (skokové, nepředvídatelné apod.) změny hodnot jiných. Z nelineárních závislostí nebo vazeb pak plyne chaotické chování systému a podobně. Nelinearita se stala jakýmsi zaklínadlem. Tento exkurs je pokusem provést alespoň částečný ,,sémantický úklid . Slovo ,,linearita má totiž přinejmenším tři různé významy. O jakou nelinearitu jde, vystihuje příslušné opozitum.3 3Do uvedené ,,tříprvkové klasifikace linearity/nelinearity však nezapadá rozšířené používání pojmu ,,nelineární dynamika . Ta bývá vymezena nějak takto: ,,. . . v lineární dynamice je `odezva' systému na popud na jeho změnu úměrná tomuto popudu (`jak se do lesa volá, tak se z lesa ozývá'), ale v případě nelineární dynamiky je odezva často i mnohokrát větší, než v případě lineární dynamiky. Systém se stává mnohem `citlivějším' na pokusy o změnu jeho kvalitativního stavu. [Krempaský, J. Veda verzus viera? Bratislava: Veda, 2006. 253 p. ISBN 80-224-0896-4. str. 59] Linearita nebo nelinearita v takovém pojetí není vlastností systému, ale jeho chování. Formulace je však dosti nejasná (odezva, která je tisícinásobkem popudu, je přece stejně jako odezva, která je dvojnásobkem popudu, 4 Výsledkem vyjasnění pojmů bývá zjednodušení problému nebo alespoň jeho snazší myšlenková uchopitelnost. Vpřípadě ,,linearity však dojdeme k tomu, že věci jsou komplikovanější, než se na začátku zdálo. 1. Plynutí času Čas můžeme vnímat jako neustále se vracející (stále se opakují vegetační sezóny, dějiny se opakují, ,,nic nového pod sluncem a podobně) nebo plynoucí odněkud někam (od minulosti přes přítomnost do budoucnosti). Ve druhém případě lze mluvit o čase lineárním, v prvním o čase cyklickém. Cyklické vnímání času odpovídá mythologickému přístupu ke skutečnosti: veškeré dění není nic než opakování mythických pravzorů, které je třeba připomínat nebo zpřítomňovat nějakým rituálem (vegetační sezóny opakují umírání božstva a jeho návrat z podsvětí; na začátku vegetační sezóny je potřeba provést orgiastický obřad, aby božstva v povětří oplodnila matku Zemi; na Silvestra je potřebné prožít prvotní chaos, jaký byl před stvořením světa, aby mohl povstat nový rok; každého 7. listopadu je nutné uspořádat mohutné oslavy říjnové revoluce s vzýváním věčně živého Lenina a podobně). Cyklů může být více, ,,velký cyklus může být sestaven z cyklů ,,malých (v průběhu založení, rozvoje a úpadku říší se odehraje mnoho zrození, dospělostí, stárnutí a smrtí jednotlivých lidských bytostí). Lineární vnímání času se objevilo v helénské době, odpovídá jednak zájmu o historii, ale také o eschatologii. S lineárním vnímáním času souvisí i idea pokroku (objevuje se něco podstatně nového, které je překonáním starého; evoluce směřuje ke zvyšování komplexity a podobně) nebo úpadku (vývoj Vesmíru směřuje k jeho tepelné smrti; lidstvo je čím dál méně morální; ztracený ráj již nenalezneme a podobně). Přechod od cyklického k lineárnímu času lze výstižně ilustrovat na Starém zákoně. Hebrejský Starý zákon měl tři částí -- Zákon (Tóra), proroci (nikoliv věštci!) a spisy, jeho překlad do řečtiny (Septuaginta) se dělí na tři části -- knihy historické (minulost), knihy mudroslovné (přítomnost) a knihy prorocké (budoucnost). V realitě se nejčastěji vyskytuje nějaká kombinace chápání času cyklického a lineárního. Směřování času ,,od stvoření po eschaton -- tedy lineární čas -- může být vlastně cyklem, návratem k počátku (na počátku byla beztřídní prvobytně pospolná společnost, na konci dějin bude beztřídní komunistická společnost; Vesmír začal nekonečnou hustotou a teplotou velkého třesku, skončí nekonečnou hustotou a nekonečnou teplotou velkého krachu a podobně). V lineárním čase probíhají nějaké cykly (,,spirála vývoje ). Mythologický přístup ke skutečnosti patrně dobře odpovídá lidskému způsobu myšlení. Fyzikální čas je lineární, tj. jednorozměrný a plyne jedním směrem; Gödelovo řešení Einsteinových rovnic s časovými smyčkami patrně není fyzikálně realistické. Asi z tohoto důvodu se v přírodních vědách (i ve společenských?) o jiném než lineárním čase neuvažuje. Netroufám si ale říci, že lineární chápání času je správné a cyklické špatné. Otázkou je, zda vnesení nějakých ,,cyklických prvků (nelinearity?!) do lineárního času neprohlubuje porozumění skutečnosti. Souvisí mythické pravzory s jungovskými archetypy a ty s archetypy systémovými? Pokud ano, jak? 2. Vazby Představme si nějaký systém tvořený několika prvky (například nějaké činnosti; součástky elektrického obvodu a podobně), které jsou spojeny vazbou, tj. vzájemně na sobě závisí, ovlivňují se (například následnost činností; vodič mezi prvky obvodu a podobně). Tyto vazby mohou být lineární (po první činnosti následuje druhá, po ní třetí, pak čtvrtá atd.; všechny součástky jsou zapojeny sériově) nebo nějaká vazba může být zpětná (například po čtvrté činnosti se vrátíme k druhé; některé součástky nemají jen jeden vstup a jeden výstup). Zpětné vazby lze dále klasifikovat na pozitivní (to je většinou vazba špatná, vede k nějakému kolapsu nebo explozi) a negativní (ty jsou lepší, často vedou k nějaké rovnováze); to je však další, poměrně složitá otázka. přímo úměrná tomuto popudu, pouze s jiným koeficientem úměrnosti), navíc je nepochopitelné, proč se mluví o (ne)linearitě; kde je jaká linea recta, rovná čára? V této (bezpochyby významné) souvislosti by bylo vhodnější mluvit o ,,nerovnovážné dynamice jako I. Prigogine, o ,,synergetice jako H. Haken, nebo i o ,,teorii katastrof jako R. Thom. 5 c c c c c c c c c E E E E E E E E E E. . . . . . . . . . . . ss zpětné vazby lineární vazby Pojem ,,zpětná vazba se používá i v poněkud (ale zdaleka ne úplně) jiném významu -- jednorázová odezva na nějakou akci nebo činnost (,,studenti mi poskytli zpětnou vazbu ). Z tohoto důvodu může být vhodné místo pojmu ,,zpětná vazba u trvale vzájemně se ovlivňujících prvků (tedy v systémovém pojetí) používat pojem ,,smyčka nebo ,,systémová smyčka . 3. Funkční závislost Závislost nějaké veličiny (tzv. závisle proměnné) na nějaké jiné (tzv. nezávisle proměnné) graficky znázorňujeme kartézským grafem; na vodorovné ose bývají hodnoty nezávisle proměnné, na svislé hodnoty závisle proměnné. O závislosti řekneme, že je lineární, pokud výsledným grafem je přímka; ve všech ostatních případech ji nazveme nelineární. Toto vymezení je však příliš vágní. Například není nic řečeno o stupnici na osách. Závislost v obrázku 1.1 a) bychom asi prohlásili za nelineární. Pokud však stupnice na svislé ose bude logaritmická, dostaneme obrázek 1.1 b); závislost je tedy zobrazena přímkou a tudíž ji lze prohlásit za lineární. První zpřesnění definice linearity spočívá v nahrazení obrázku formulí (vzorečkem). Situaci znázorněnou na obr. 1.2, tj. závislost závisle proměnné y na nezávisle proměnné x, jejímž grafem je přímka, můžeme zapsat rovností y = 2x + 1, tedy jako násobek (v našem případě dvojnásobek) nezávisle proměnné k němuž je přičtena nějaká hodnota (v našem případě 1). Obecný zápis lineární závislosti je y = ax + b. Závislost z obrázku 1.1 a) je zapsána rovností y = 2x , tedy formulí jiného tvaru. Rovnost y = 2x však můžeme ,,zlogaritmovat , tj. upravit ji na tvar log y = x log 2. Označíme-li nyní a = log 2 a z = log y, dostaneme z = ax, 0 1 2 3 4 5 0 5 10 15 20 25 30 x y 0 1 2 3 4 5 1 2 5 10 20 x y a) rovnoměrná stupnice b) logaritmická stupnice Obrázek 1.1: Stejná závislost vyjádřená pomocí rovnoměrné a logaritmické stupnice na ose závisle proměnné 6 0 5 10 15 20 25 30 0 10 20 30 40 50 60 x y Obrázek 1.2: Graf závislosti y = 2x + 1 tedy lineární závislost proměnné z na proměnné x. Závislost na základě obrázku považovaná za nelineární je vyjádřena ve tvaru závislosti lineární. Zobecněním této úvahy je zjištění, že lineární závislost nějakých veličin není nějakou jejich ,,vnitřní vlastností, ale je důsledkem označení. Jinak řečeno, záleží na tom, co za proměnné veličiny prohlásíme. Obecně neexistuje nějaké pravidlo, které by umožnilo rozhodnout, co je ,,ta pravá proměnná -- je to něco, co jsme spočítali nebo změřili, logaritmus měřené hodnoty nebo něco jiného? (To není umělé vytváření problémů tam, kde nejsou -- například tak jednoduchá veličina jako je hlasitost tónu je logaritmem energie vlnícího se vzduchu; a kdo teď rozhodne, zda ,,základní veličinou vyjadřující, zda hrajeme piano nebo fortissimo, je hlasitost nebo energie?) Mluvíme-li tedy o lineární závislosti, je třeba pečlivě specifikovat, o jaké veličiny jde. Veličiny, jimiž jsme se dosud zabývali, lze považovat za ,,statické , jednou dané, existující. Zajímavější a důležitější jsou veličiny ,,dynamické , vznikající jako výsledek nějakého procesu probíhajícího v čase. (Upozorňuji, že se nejedná o matematické pojmy, ale o intuitivní popis. ,,Čistá matematika se zabývá ,,věčnými pravdami , nikoliv vznikáním a zanikáním. Pokud přece jen nějak popisuje pohyb, kinésis, používá k tomu objekty věčně a nehybně existující; kde a jakým způsobem matematické objekty existují je ovšem -- zatím? -- nezodpovězená otázka filosofie matematiky.) Pohyb, vznikání, zanikání, změna bývá projevem nějaké zákonitosti. Veličina ,,ve stavu zrodu nebo ,,ve stavu změny závisí na nějaké jiné veličině, na nějakém vlivu. A tato závislost zase může být lineární nebo nelineární. Rozhodnout, o jaký typ závislosti jde, je opět otázka úhlu pohledu. (Zase na intuitivní, nikoliv matematické úrovni. Matematicky je dynamická rovnice lineární, pokud splňuje princip superpozice.) Pokusím se tuto myšlenku ilustrovat jednoduchým až stupidním příkladem (psychologům se omlouvám). Sestavíme matematický model učení se. Základní proměnnou (v terminologii dynamických systémů ,,stavovou nebo ,,fázovou proměnnou , v terminologii systémové dynamiky ,,akumulací ) bude množství vědomostí; označíme ji x. Ponechme stranou otázku, jak je možné množství vědomostí kvantifikovat (např. počet pojmů, které znám; počet vztahů mezi pojmy, kterým rozumím; počet megabytů stažených z Internetu; počet a aktivita spojů mezi neurony v mozku; něco úplně jiného), hledání odpovědi by nás zavedlo příliš daleko od tématu, jímž se zabýváme. Množství vědomostí se bude v závislosti na učení v průběhu času měnit; to že veličina x závisí na čase t, zapisujeme symbolicky x = x(t). Symbol x(t) tedy označuje množství vědomostí v čase t. Proces učení zapíšeme jako vyjádření množství vědomostí v následujícím časovém okamžiku, tj. vyjádření veličiny x(t + 1). Nejjednodušší představou je, že v každém časovém okamžiku nebo jednotkovém časovém intervalu se něco naučím, tj. získám množství vědomostí d, které přibudou k vědomostem, které mám. Zapsáno rovností x(t + 1) = x(t) + d. (1.1) 7 0 5 10 15 20 25 30 0 5 10 15 20 25 30 x(t) x(t+1) 0 5 10 15 20 25 30 0 5 10 15 20 25 30 t x(t) a) b) Obrázek 1.3: a) Graf lineární závislosti (1.1) členu posloupnosti na členu předchozím; b) graf této posloupnosti. Tato formule je vlastně zápisem lineární závislosti veličiny x(t + 1) na veličině x(t); tato závislost s d = 1 je znázorněna na obr. 1.3 a). Grafem je opět přímka. Pokud v nějakém počátečním čase, v okamžiku t = 0, je množství mých vědomostí x(0), bude jejich množství v čase t dáno výrazem x(t) = x(0) + td; (1.2) tento výsledek lze snadno ověřit úplnou indukcí nebo si vzpomenout na vyjádření obecného členu aritmetické posloupnosti. Opět jsme dostali lineární závislost, tentokrát veličiny x(t) na veličině t; tato závislost je znázorněna na obr. 1.3 b), kde d = 1 a x(0) = 1. Lineární závislost popisující ,,vznikání posloupnosti se projevila v lineární závislosti vznikající posloupnosti na čase. Obrázky 1.3 a) a b) jsou až na označení os úplně stejné. To by mohlo vést k (unáhlené!) úvaze, že ,,vývojový zákon , ,,podstata (obr. 1.3 a)) a ,,pozorovaný vývoj , ,,jev (obr. 1.3 b)) jsou na jisté úrovni popisu totožné. Model poněkud přiblížíme realitě rozdělením procesu učení na procesy dva -- získávání nových vědomostí a zapomínání vědomostí starších. Symbol x(t) bude opět označovat množství vědomostí v čase t. Pravidlo, podle něhož určíme množství vědomostí v každém následujícím okamžiku, tentokrát bude x(t + 1) = x(t) + množství nových vědomostí - množství zapomenutých vědomostí. Asi je rozumné předpokládat, že čím víc toho vím, tím víc toho mohu zapomenout. Jinak řečeno, množství zapomenutých vědomostí lze považovat za přímo úměrné množství vědomostí, které jsem měl. Koeficient úměrnosti označíme c, tedy množství zapomenutých vědomostí = cx(t). Veličina c vyjadřuje relativní množství vědomostí zapomenutých za jednotku času, tedy jakousi rychlost zapomínání. Na druhé straně, čím víc toho vím, tím snadněji nové vědomosti přijímám -- například mohu nové poznatky zasazovat do kontextu vědomostí, znám nějaké obecné principy, takže si snadněji zapamatuji poznatky logicky vyplývající z dosavadních vědomostí a podobně. Opět tedy budeme množství nově naučených vědomostí považovat za přímo úměrné stávajícímu množství vědomostí. Označíme-li konstantu úměrnosti b, máme množství nových vědomostí = bx(t). Veličina b vyjadřuje relativní množství nově přijatých vědomostí za jednotku času, tedy jakousi rychlost přijímání nových poznatků. 8 0 50 100 150 200 0 100 200 300 400 x(t) x(t+1) Obrázek 1.4: Graf lineární závislosti členu posloupnosti na členu předchozím; x(t + 1) = 2x(t) 0 5 10 15 0 50 100 150 200 250 300 t x(t) 0 5 10 15 1e-02 1e-01 1e+00 1e+01 1e+02 t x(t) a) b) Obrázek 1.5: Graf ,,nelineární posloupnosti x(t) = 0, 012t ; a) měřítko na svislé ose je stejnoměrné, b) měřítko na logaritmické ose je logaritmické Pravidlo popisující množství vědomostí v následujícím okamžiku tedy bude tvaru x(t + 1) = x(t) + bx(t) - cx(t), nebo, po úpravě (vytknutí výrazu x(t) na pravé straně rovnosti), x(t + 1) = (1 + b - c)x(t). Při označení r = 1 + b - c dostaneme x(t + 1) = rx(t), (1.3) tedy opět lineární závislost veličiny x(t + 1) na veličině x(t); závislost s r = 2 je znázorněna na obr. 1.4. V tomto případě bude množství vědomostí v čase t dáno výrazem x(t) = x(0)rt ; (1.4) výsledek lze opět ověřit indukcí nebo si vzpomenout na vyjádření obecného členu geometrické posloupnosti. Závislost x(t) = x(0)rt s x(0) = 0, 01 a r = 2 je znázorněna na obrázcích 1.5 a) a b); na obrázku b) je přitom na svislé ose logaritmická stupnice. Závislost množství vědomostí na čase lze tedy prohlásit za nelineární (pokud za ,,základní proměnnou bereme veličinu x(t)), nebo za lineární (pokud za ,,základní proměnnou vezmeme logaritmus veličiny x(t)). 9 Vytváření, vývoj, změnu veličiny x jsme vyjadřovali pomocí její hodnoty v následujícím časovém okamžiku, tj. x(t + 1) jsme vyjádřili pomocí x(t). Jinou možností, jak vyjádřit změnu nějaké veličiny, je pomocí tzv. přírůstku této veličiny: změnu veličiny x v čase t vyjadřuje její přírůstek x(t) = x(t + 1) - x(t). Model (1.1) tedy můžeme zapsat ve tvaru x(t) = d a model (1.3) x(t) = (r - 1)x(t) neboli x(t) = (b - c)x(t). První závislost s d = 1 je znázorněna na obr. 1.6 a), druhá s r = 2 je na obr. 1.6 b). Opět se jedná o závislosti lineární. Jiný možný způsob vyjádření změny veličiny x je pomocí jejího relativního přírůstku x(t) = x(t) x(t) . Tímto způsobem vyjádříme první model vývoje vědomostí ve tvaru x(t) = d x(t) a druhý ve tvaru x(t) = r - 1 neboli x(t) = b - c. První z těchto závislostí s d = 1 je znázorněna na obr. 1.7 a), druhá s r = 2 je na obr. 1.7 b). Tentokrát se v prvním případě jedná o závislost nelineární, která generuje lineární posloupnost (1.2); ve druhém o závislost lineární, která generuje posloupnost nelineární (1.4). A jak je tomu nyní s linearitou? V obou uvedených příkladech vyšlo, že při jisté volbě parametru d nebo r bude množství vědomostí v mé hlavě růst nade všechny meze. To samozřejmě není možné a je nutné model přiblížit realitě ještě více. Tím se dostaneme poněkud za hranice vyjasňování ,,co je to lineární závislost k problematice tvorby matematického modelu. Vyjdeme z posledního vyjádření x(t) = b-c, relativní přírůstek vědomostí je rozdílem rychlosti přijímání nových poznatků a rychlosti zapomínání poznatků starých. Tento rozdíl lze chápat jako rychlost nabývání vědomostí; označme ho v = b - c. Model bude tvaru x(t) = v, 0 5 10 15 0.6 0.8 1.0 1.2 1.4 x(t) x(t+1)-x(t) 0 5 10 15 0 5 10 15 x(t) x(t+1)-x(t) a) b) Obrázek 1.6: Graf závislosti absolutního přírůstku x(t) = x(t + 1) - x(t) na hodnotě x(t); a) x(t) = 1, tj. x(t + 1) = x(t) + 1, b) x(t) = x(t), tj. x(t + 1) = 2x(t) 10 0 5 10 15 0.2 0.4 0.6 0.8 x(t) [x(t+1)-x(t)]/x(t) 0 5 10 15 0.6 0.8 1.0 1.2 1.4 x(t) [x(t+1)-x(t)]/x(t) a) b) Obrázek 1.7: Graf závislosti relativního přírůstku x(t) = x(t + 1) - x(t) /x(t) na hodnotě x(t); a) x(t) = 1/x(t), tj. x(t + 1) = x(t) + 1, b) x(t) = 1, tj. x(t + 1) = 2x(t) tedy relativní přírůstek vědomostí je roven rychlosti nabývání vědomostí (to zní skoro jako tautologie) a tato rychlost je konstantní. Rychlost nabývání vědomostí v ale ve skutečnosti asi nebude konstanta nezávislá na čemkoliv. Tato rychlost by mohla záviset na aktuálním množství vědomostí: čím více mám vědomostí, tím obtížněji přijímám nové, neboť je komplikovanější zasazovat nové poznatky do rozsáhlé sítě předchozích, nebo prostě již mám ,,přecpanou hlavu . Tedy čím více mám poznatků, tím menší je rychlost b přijímání nových poznatků a v důsledku toho je menší rychlost učení v. Nebo jinak: čím více mám vědomostí, tím jsem asi starší, což znamená, že se blížím ke stařecké demenci a tím více zapomínám, tedy rychlost zapomínání c je větší; opět je důsledkem nižší rychlost učení v. Oběma úvahami dostáváme, že veličina v závisí na veličině x(t) a to tak, že čím je větší x(t), tím je menší hodnota v. Opět budeme předpokládat, že tato závislost je lineární, v = -ax(t) + V, kde a a V jsou kladné konstanty; veličina V vyjadřuje maximální možnou rychlost nabývání vědomostí, tj. rychlost nabývání vědomostí myslí nezatíženou, koeficient a představuje zpomalení této rychlosti vlivem již přijatých vědomostí. Výsledný model tedy bude tvaru x(t) = -ax(t) + V ; (1.5) relativní přírůstek vědomostí závisí lineárně na aktuálním stavu vědomostí. Rozepsáním relativního přírůstku x(t) a jednoduchou úpravou tento model můžeme přepsat na tvar x(t + 1) = x(t) 1 + V - ax(t) , tedy jako nelineární závislost množství vědomostí v následujícím časovém okamžiku na aktuálním množství vědomostí. Množství vědomostí v čase t již obecně nelze vyjádřit nějakou formulí (přesněji řečeno, nelze je pro libovolné hodnoty V a a vyjádřit formulí, v níž se vyskytuje pouze konečně mnoho aritmetických operací, elementární funkce a jejich superpozice v konečném počtu). Ale ze znalosti počáteční hodnoty x(0) lze vypočítat hodnotu x(1), z té pak hodnotu x(2) atd. Závislost množství vědomostí na čase (časový průběh množství vědomostí) je pro hodnoty V = 0, 5, a = 1 a x(0) = 0, 001 znázorněn na obr. 1.8. Vidíme, že při tomto zobrazení se jedná o závislost nelineární. Tato závislost je však alespoň monotonní; množství vědomostí s časem roste. Proto lze najít stupnici na svislé ose (taková stupnice bývá nazývána logistická ve významu ,,něco jako logaritmická ; s logistikou jako metodou ukládání vojáků do ubikací to nemá nic společného), která závislost znázorní jako lineární. Zajímavější výsledky dostaneme například při volbě a = 1 a V = 3. Časový průběh veličiny x(t) s x(0) = 0, 001 je znázorněn na obr. 1.9 a), průběh s x(0) = 0, 001001 na obr. 1.9 b). 11 0 5 10 15 20 25 30 0.0 0.1 0.2 0.3 0.4 0.5 t x(t) Obrázek 1.8: Graf posloupnosti x(t) generované modelem x(t + 1) = x(t) 1, 5 + x(t) s počáteční hodnotou x(0) = 0, 001 0 10 20 30 40 50 0 1 2 3 4 t x(t) 0 10 20 30 40 50 0 1 2 3 4 t x(t) a) b) Obrázek 1.9: Graf posloupnosti x(t) generované modelem x(t + 1) = x(t) 4 + x(t) s počáteční hodnotou a) x(0) = 0, 001 a b) x(0) = 0, 001001 Především vidíme, že závislost na čase je nelineární, a to tak, že v grafu jsou ,,skoky nahoru a dolů (matematicky řečeno, závislost na čase není monotonní). V takovém případě žádná volba stupnice na žádné ose nezobrazí závislost jako lineární. Máme tedy první případ jakési ,,podstatné nelinearity . Jinou vlastností časového průběhu je naprostá nepravidelnost skoků -- jen z pohledu na začátek vývoje (například prvních milion hodnot) nelze odhadovat, jak bude vývoj pokračovat. Další vlastnost hodná pozoru je to, že při změně počáteční hodnoty x(0) z 0,001 na 0,001001, tedy o jedno promile, se obrázek naprosto změnil, pravá polovina obr. 1.9 a) je úplně jiná, než pravá polovina obr. b). Malá změna počáteční hodnoty vyvolala velkou změnu průběhu veličiny. Veličina x(t), která je generována jednoduchým lineárním modelem (1.5) v konkrétním tvaru x(t) = -x(t) + 3 má všechny vlastnosti, které charakterizují chaos. Veličina generovaná tímtéž modelem s trochu jiným parametrem V , tedy modelem x(t) = -x(t) + 1 má všechny ,,hezké vlastnosti -- malá změna nezávisle proměnné vyvolává malou změnu závisle proměnné, z jednoho pohledu na graf víme o průběhu vše: x(t) naroste k jisté hodnotě (přesně k hodnotě 0,5, obecně vyjádřeno k hodnotě V/a), která představuje jakousi kapacitu mysli. 12 1.3 Vlastnosti matematického modelu Statický model bývá převážně zapsán nějakým systémem rovností, které vyjadřují strukturu (v širokém smyslu tohoto slova) modelovaného jevu. Pro dynamický model je typické, že je tvořen nějakým systémem dynamických rovnic4 . Jejich řešení popisuje chování modelovaného procesu v čase. Proto bývá požadováno, aby model, tj. příslušné rovnice, měl následující vlastnosti: 1. existence řešení, 2. jednoznačnost řešení, 3. spojitá závislost na vstupních údajích modelu. První vlastnost je naprosto nezbytná. Model, který by neměl řešení, nemůže nic modelovat -- buď by modelovaný děj nemohl probíhat, nebo by rovnice byly špatně. Požadavek, aby existovalo řešení, však neznamená, že toto řešení musíme znát, nebo být schopni ho nalézt. Pro projekce z modelu často plně dostačuje matematická analýza příslušných rovnic (např. s využitím metod kvalitativní teorie diferenciálních rovnic) nebo přibližné řešení nalezené numericky (což je další důvod, proč neexistuje ostrá hranice mezi modely matematickými a počítačovými). Pokud by model nebyl jednoznačně řešitelný, nebyl by vhodný pro projekci procesu; nebylo by totiž jasné, které z jeho více řešení se bude realizovat. Nemá-li model jednoznačné řešení, neznamená to však, že je špatný. Nejednoznačný totiž může být i modelovaný děj. (Pokud ovšem netrváme na tom, že Laplaceův determinismus5 je pravdivým vyjádřením veškeré skutečnosti.) V případě stochastických modelů je řešením nějaká náhodná funkce, zobrazení času do množiny náhodných veličin. V takovém případě požadujeme, aby byla jednoznačně určena časově závislá distribuční funkce příslušné náhodné veličiny. Spojitá závislost na vstupních datech modelu je podmínkou pro praktickou použitelnost modelu. Pokud malá změna vstupů vyvolá velkou změnu výstupů, nemůžeme nic projektovat. Veškeré údaje totiž známe jen s jistou omezenou přesností a při nespojité závislosti řešení bychom dostali výsledky s chybou větší než je nějaká přijatelná; přesněji řečeno, mohli bychom takové výsledky dostat, což je ještě horší, neboť se objevuje další nejistota. Pokud řešení nezávisí na vstupních údajích spojitě a máme jistotu, že model je správný (nebo máme alespoň dobré důvody si myslet, že tomu tak je), víme pouze to, že nic o možné budoucnosti nevíme. Populární interpretace, že ,,mávnutí motýlích křídel nad Tokiem vyvolá hurikán na Floridě , nic nevysvětluje; naopak předstírá znalost, která principiálně není možná. Typický příklad nespojité závislosti na počátečních podmínkách je na obrázcích 1.9. Je vidět, že projektovaný průběh děje se v obou obrázcích shoduje zhruba po prvních čtrnáct časových jednotek. Toto pozorování ukazuje potřebnost další analýzy modelů; určit nebo odhadnout čas, po jaký je při známé přesnosti znalosti vstupních údajů řešení ještě přijatelně přesné. V každém případě nejsou modely, u nichž řešení závisí na vstupních datech nespojitě, použitelné pro asymptotickou analýzu procesů, tj. pro určení dlouhodobých trendů, ale pouze pro analýzu tranzientní, tj. pro popis dynamiky v krátkém časovém intervalu. 1.4 Proces modelování Na obrázku 1.10 jsou schematicky znázorněny kroky, z nichž sestává sestavení, testování a případné modifikace modelu. 4Význam pojmu ,,dynamická rovnice bude specifikován později. Zhruba řečeno, jedná se o diferenciální nebo diferenční rovnici. 5,,Inteligentní bytost, která v určitý okamžik znala všechny síly, které v přírodě působí, a mimoto vzájemnou polohu všech částic, z nichž je příroda složena, a která by přitom měla schopnost, aby tyto údaje mohla podrobit matematické analýze, mohla by zahrnout do jednoho vzorce pohyb velkých těles i nejlehčích atomů a nic by pro ni nebylo neurčité; jak budoucnost tak minulost by ležely jasně před jejíma očima. Citováno dle: Struik, D. J. Dějiny matematiky. Orbis, Praha 1963, str. 138. 13 Přijetí modelu Zamítnutí modelu a nový začátek Modifikace modelu Vyhodnocení modelu Sestavení modelu Je cíl dosažitelný? Určení cíle modelu c c c c r rr rr rrj ¨ ¨¨ ¨¨ ¨¨% ' E E Obrázek 1.10: Schéma procesu modelování Ten první je podstatný; přesto bývá často opominut. Spočívá v rozhodnutí, k čemu přesně je model určen. Po modelu nemůžeme chtít, aby byl správný do nejmenších detailů. Ale můžeme trvat na tom, aby byl užitečný. A užitečnost modelu je určena jeho cílem a hodnotou tohoto cíle. Důležitým aspektem při stanovení cíle je rozhodnutí, na jakém místě škály mezi teoretickými a praktickými modely má být model vytvářený. Tedy: chceme použít model k porozumění systému a k jeho interpretaci, nebo k předpovědi jeho chování, ať se již bude vyvíjet sám nebo pod vlivem nějakých vnějších zásahů? Dalším důležitým rozhodnutím je, jakou numerickou přesnost budeme potřebovat. Přesná předpověď nebo projekce bývá často cílem praktických aplikací. Ale pokud je hlavním cílem teoretické porozumění, může stačit, když model poskytne správné znaménko nebo nějakou jinou rozumnou kvalitativní odpověď; např. lék A je skutečně účinnější než lék B, systém se neustálí v nějaké rovnováze, ale bude oscilovat a podobně. Dalším krokem je posouzení dosažitelnosti cíle. Nejobvyklejší překážkou je čas nebo dostupnost údajů. Pokud jde o odhad potřebného času, je na místě pesimismus, zejména pro začátečníky v modelování. Z tohoto důvodu je dobré začít s malým projektem, který případně může být v budoucnu rozšířen na nějaký komplexnější, nebo s jednoduchým modelem, k němuž mohou později být přidány doplňující nebo rozšiřující podrobnosti. Naproti tomu odhad, zda jsou dostupná všechna potřebná data, může být optimistický. Začátečníci často dojdou k závěru, že projekt je neřešitelný, neboť chybí nějaké ,,kruciální údaje . Ale modely mívají několik parametrů nebo předpokladů, které mají pouze malý nebo žádný vliv na relevantní aspekty chování modelu. Jediný způsob jak poznat, zda nějaké údaje jsou skutečně potřebné, je provést analýzu sensitivity nebo elasticity (kvantifikaci vlivů jednotlivých složek modelu na výsledné chování). Sestavení dynamického modelu bude věnován následující oddíl, vyhodnocení modelu závisí na tom, o jaký model se jedná. Posledním krokem je rozhodnutí, zda model přijmeme či nikoliv. Ve druhém případě je třeba posoudit, zda celou práci zahodíme a začneme znovu, nebo zda se model ke stanovenému cíli přiblížil a stačí ho jen nějak modifikovat. Na tomto místě je dobré upozornit, že matematický model nemusí být ,,správný (ale může být špatný, pokud zanedbává 14 Počítačový program Model Diagram, předmodel Pojmový model Mentální model c c c c Obrázek 1.11: Etapy sestavování modelu nějaký důležitý jev nebo děj). Jeden model však může být lepší než jiný v tom smyslu, že lépe dosahuje svého cíle, např. přesněji projektuje možný vývoj, nebo dává lepší vhled do problému. Model lepší z jednoho hlediska může být horší z jiného. A nezanedbatelné je přitom hledisko jednoduchosti. Například Ptolemaiův model sluneční soustavy poskytoval přesnější předpovědi postavení planet na ,,nebeské sféře než Koperníkův; ten však byl jednodušší, umožnil nově sluneční soustavu pochopit a v důsledku toho po konfrontaci s pozorovanými údaji mohl být Keplerem zpřesněn. ,,Vlastní Koperníkovou . . . zásluhou nebylo objevení pravdivé teorie, ale nového plodného aspektu. 6 ,,. . . za vhodných okolností v mnoha hierarchiích vědeckých modelů převáží ctnosti jednodušší teorie její neřesti. 7 Poznamenejme ještě, že není nutné se snažit hned sestavit nějaký nejlepší (vzhledem ke stanovenému cíli) model. Užitečnější může být sestavení jednoduchého modelu a teprve po vyjasnění, co mu chybí, nebo v čem nevyhovuje účelu, ho modifikovat. Taková posloupnost ,,lepších a lepších modelů může být užitečným a poučným vedlejším výsledkem tohoto procesu. 1.5 Sestavení dynamického modelu Obrázek 1.11 shrnuje výsledky základních etap při tvorbě modelu. Skutečnost, že něco rozpoznáváme jako systém, je vyjádřena pojmem převzatým z kognitivní vědy -- máme v mysli mentální model tohoto systému. Mentální model je tvořen názorem systému (souhrnem všech vjemů, které nám zprostředkovávají naše smysly) zasazeným do souvislostí informací uložených v paměti. Již z tohoto vymezení je patrné, že mentální model jednoho systému se liší od člověka k člověku. I kdyby všichni ,,nazírali stejně, v paměti mají různé vzpomínky a vědomosti. Vlastní vytváření matematického modelu začíná rozmyšlením, z jakých složek se studovaný systém skládá, tj. jaké veličiny (tedy pojmy, jež lze kvantifikovat) a procesy jsou v něm nejdůležitější. Ty mohou vyplynout z výsledků pokusu nebo pozorování a naměřených dat, nebo mohou vyjadřovat předpoklady, které si o systému vytváříme a odvozujeme z nich výsledky. Složky systém je užitečné rozlišit na 6Wittgenstein, L. Rozličné poznámky. Mladá fronta a Vyšehrad, 1993. 159 p. ISBN 80-204-0360-4. Str. 34. 7Lee, R. L. ­ Fraser, A. B. The Rainbow Bridge: Rainbows in Art, Myth, and Science. Pensylvania State University Press, 2001. Citováno dle [1], str. 9. 15 cena tržba ? (+ nebo -) c špatně cena tržba + c prodej- E + T správně Obrázek 1.12: Příklad: polarita vlivu ceny na tržbu 1. veličiny ,,uvnitř systému (endogenní), které se v průběhu času mohou měnit, 2. veličiny ,,vně systému (exogenní), které však systém ovlivňují a mohou se v čase měnit, 3. veličiny, které se v době studovaného vývoje systému nemění. Jinou důležitou otázkou je výběr úrovně rozlišení podrobností. Například za složku systému můžeme vzít skupinu obyvatel stejného věku (a pak si představujeme, že jedinci uvnitř této skupiny jsou identičtí, i když ve skutečnosti nejsou), jednotlivé obyvatele, nebo naopak skupiny ještě větší (například lidi produktivní a ty ostatní). Tomuto procesu se říká agregace. Příliš vysoký stupeň agregace vede k tomu, že agregovaná složka nic nevypovídá o skutečném stavu systému; na druhé straně, malá agregace s sebou nese nebezpečí, že výsledný model bude příliš komplexní v rozporu s cílem modelování. Podobným problémem jako agregace je rozpoznání proměnných, jejichž změna ovlivňuje systém málo. Pak lze proměnné, které se mění v průběhu času, považovat za konstantní. Při výběru složek modelu je třeba si také rozmyslet, které složky systému na sebe vzájemně působí, nebo mohou působit. Výsledkem tohoto rozmýšlení, první etapy tvorby modelu, je pojmový model, seznam pojmů, které se v modelu mají vyskytovat. Užitečným krokem je tyto pojmy vyjádřit grafickou formou. Nějakým způsobem zobrazit složky systému a vazby mezi nimi, tj. znázornit, která složka ovlivňuje složky jiné. Výsledkem této etapy je nějaké schéma systému, diagram jeho struktury. Schéma je úrovní abstrakce někde mezi systémem a matematickým modelem; nelze ho dále nějak přesně analyzovat nebo z něho vyvozovat závěry (struktura systému ještě negeneruje ani nedeterminuje jeho chování). Proto se mu někdy říká předmodel. Užívaným způsobem grafické representace systému je tzv. příčinný smyčkový diagram (CLD -- casual loop diagram). Jedná se o hranově ohodnocený orientovaný graf. Jeho vrcholy zastupují složky systému, orientovaná hrana vedoucí ze složky do složky vyjadřuje vazbu takovou, že složka složku ovlivňuje. Hrany jsou ohodnoceny symboly ,,+ a ,,- vyjadřujícími jejich polaritu; ohodnocení ,,+ hrany vedoucí ze složky do složky vyjadřuje, že složka zvětšuje, zesiluje, zintenzivňuje složku , její ohodnocení ,,- naopak, že zeslabuje . Graf samozřejmě může obsahovat smyčky (to ale nejsou ,,smyčky z názvu CLD8 ). Cyklus v grafu vyjadřuje zpětnou vazbu v systému. Její polarita je určena počtem hran s polaritou ,,- v tomto cyklu; je-li tento počet sudý, považujeme zpětnou vazbu za pozitivní (zesilující), je-li lichý, považujeme ji za negativní (vyrovnávající, cíl hledající). Pokud se nedaří určit polaritu vazby, je to signálem, že patrně chybí nějaká důležitá složka systému. Například: cena určitě ovlivňuje tržbu; lze ale zdůvodnit jak to, že ji zvětšuje, tak i to, že ji zmenšuje. Je tedy potřeba zahrnout další složku systému -- prodej. Cena ovlivňuje prodej negativně (vyšší cena prodej zmenšuje), prodej spolu s cenou ovlivňuje tržbu pozitivně (zvětšení prodeje při pevné ceně tržbu zvýší, zvýšení ceny při nezměněném prodeji tržbu také zvýší). Správný diagram tohoto jednoduchého systému je tedy na obr. 1.12 vpravo, nikoliv vlevo. Další -- tou nejdůležitější -- etapou je vytvoření vlastního matematického nebo počítačového modelu. Zde závisí na tom, v jakém tvaru model chceme mít, zda jako systém dynamických rovnic (tomu bude věnována kapitola 2), soustavu piktogramů (jako v kapitole 3), či něco jiného. 8Terminologie používaná např. v [8] neodpovídá terminologii teorie grafů. Orientovaná cesta je nazývána ,,otevřená smyčka (!), orientovaný cyklus ,,smyčka se zpětnou vazbou . 16 Podle schématu na obr. 1.10 má po sestavení modelu následovat jeho vyhodnocení. To je možné provést v případě, že máme model matematický a dostatečně jednoduchý, že ho lze analyzovat matematicky. To samozřejmě nenastává vždy; můžeme mít třeba komplikovaný praktický model pro přesné predikce. Pak jedinou cestou k vyhodnocení modelu je jeho počítačová representace, nějaký program, který numericky řeší příslušné rovnice a podobně. K tomuto účelu lze často využít existující programové prostředky; nejjednodušší dynamické modely lze simulovat i v prostředí tabulkových kalkulátorů kancelářských programů (KOffice, OpenOffice ap.), pro simulaci a grafickou representaci řešení těch složitějších lze využít prostředí pro numerické (Octave, R-language ap.) nebo symbolické výpočty (Maple, Mathematica; nekomerční programy tohoto druhu mi nejsou známy). Pro modely ve formě piktogramů jsou přímo určeny komerční programy Vensim, Stella nebo její nástupce Powersim. 1.5.1 Příklad: válka s terorismem Terorismus je beze sporu jedním z nejzávažnějších problémů současnosti. Pokusme se modelovat jeho dynamiku (a přitom nezapomínejme, že se jedná o příklad z učebního textu, který má ilustrovat proces sestavení dynamického modelu, nejde o snahu radit OSN nebo nějaké vládě, co má dělat). Cíl modelu je ryze teoretický; snažíme se zjistit zda -- a pokud ano, tak za jakých podmínek -- může být válka proti terorismu úspěšná. Nejprve budeme identifikovat pojmy, které se v modelu objeví. Za příčinu terorismu bývá označována chudoba obyvatelstva některých zemí. Nemusí se jednat o chudobu absolutní (vyjádřenou třeba v HDP na hlavu), častěji jde o chudobu relativní, kontrast chudoby a bohatství nějaké jiné země. (Relativní chudoba roste s poklesem chudoby absolutní; mám-li jen jednu motyku a moji sousedé jsou na tom podobně, chudobu si neuvědomuji. Je-li ovšem ve vesnici televize, mohu vidět, že jinde na světě žijí lidé v luxusu.) Tuto složku systému -- chudobu -- nazveme ,,frustrace obyvatelstva . Další složkou jsou určitě lidé, schopní a ochotní teroristické činy (v jiné terminologii hrdinské činy, osvobozovací boj, mučednictví ap.) provádět. Nazveme ji ,,množství teroristů . Teroristé ovšem v chudých zemích nevznikají sami od sebe, nejsou ,,generováni jenom chudobou. Je nutné, aby člověk byl informován o možnosti dát svému životu smysl ničením a případnou smrtí; navíc k tomu potřebuje jisté specifické dovednosti, které lze získat výcvikem. Této složce systému budeme říkat ,,nábor . Na druhé straně stojí vlastní válka s terorismem -- bojové nebo zpravodajské akce s účelem eliminovat terorismus; nazvěme je ,,likvidační akce . Pojmový model je tedy zatím tvořen čtyřmi složkami -- ,,množstvím teroristů , ,,frustrací obyvatelstva , ,,náborem a ,,likvidačními akcemi . Základní veličinou charakterizující systém je ,,množství teroristů ; bez nich by žádná válka s terorismem ani nemohla existovat. ,,Množství teroristů také určuje pozorovatelné chování systému; počet teroristů se projevuje teroristickými akty. Druhou veličinou určující stav systému je ,,frustrace obyvatelstva ; vyjadřuje jeho vnitřní stav. Ostatní složky lze považovat za exogenní nebo dokonce v čase neproměnné. Nábor nových teroristů může být součástí kultury daného státu, národa nebo náboženství, likvidační akce mohou být bez ohledu na okolnosti součástí vojenské doktríny nebo vnitřní politiky státu bojujícího proti terorismu. Podívejme se nyní na vazby mezi jednotlivými složkami. ,,Nábor asi ,,množství teroristů ovlivňuje kladně, zvětšuje je. Naopak ,,likvidační akce ,,množství teroristů zmenšují (nebo se nábor množství teroristů likvidační akce jestřábí politika frustrace obyvatelstva T + E + ' - ' + + E+ Obrázek 1.13: Příklad příčinného smyčkového diagramu: ,,válka s terorismem 17 o to alespoň snaží, případně to deklarují); vazba je tedy negativní. Dále je asi rozumné předpokládat, že vazba ,,frustrace obyvatelstva na ,,nábor je pozitivní -- mezi frustrovanými lidmi lze snadněji nalézt někoho, kdo radikálně změní (nebo naplní) svůj život teroristickým aktem. ,,Likvidační akce však neovlivňují jen ,,množství teroristů , objevují se u nich také nějaké vedlejší efekty; i tzv. inteligentní raketa může zasáhnout venkovskou svatbu místo shromáždění teroristů -- tím zvětší ,,frustraci obyvatelstva . ,,Likvidační akce tedy ovlivňují ,,množství teroristů (negativně) a ,,frustraci obyvatelstva (pozitivně). Samy ovšem mohou být nejen projevem politiky, ideologie, zájmů zbrojařských koncernů nebo odborových organizací v těchto koncernech, ale mohou být odezvou na teroristické útoky. Může tedy existovat pozitivní vazba ,,množství teroristů na ,,likvidační akce . To, zda tato vazba existuje a jak je intenzívní, je (nebo může být) určeno právě vnitřní nebo zahraniční politikou, ekonomickými nebo ideologickými zájmy a podobně. V této chvíli se tedy ukazuje, že je užitečné zavést další složku systému, nazvěme ji zkusmo ,,politika . Můžeme ji považovat za neproměnnou v čase, za jakési relativně stálé ovlivnění ,,likvidačních akcí . Vazba ,,politiky na ,,likvidační akce je však ambivalentní; není totiž specifikováno, o jakou politiku jde. Podle svého vkusu můžeme ,,politiku nazvat podrobněji ,,politikou appeasementu , pak je její vazba na likvidační akce negativní, nebo ,,jestřábí politikou a pak je tato vazba pozitivní. Výsledný příčinný smyčkový diagram ,,války s terorismem je na obrázku 1.13. Vazba, která v systému může a nemusí být, je vyznačena čárkovaně. Pokud systém tuto vazbu obsahuje, pak má také jednu zesilující (,,množství teroristů -,,likvidační akce -,,frustrace obyvatelstva -,,nábor ,,množství teroristů ) a jednu vyrovnávající (,,množství teroristů -,,likvidační akce -,,množství teroristů ) zpětnou vazbu. 18 Kapitola 2 Dynamické rovnice Již od dob Isaaca Newtona je nejpoužívanějším prostředkem k vyjádření reálného děje (popisu, modelování, zápisu přírodního zákona) systém diferenciálních rovnic. Těm -- a jejich zobecnění -- je věnována tato kapitola. 2.1 Deterministické dynamické modely zapsané dynamickými rovnicemi Z úvah o sestavení modelu (sr. 1.5) vyplynulo, že základními složkami modelu jsou veličiny, které jsou vnitřními charakteristikami modelovaného systému a v čase se nějak vyvíjejí, tj veličiny, jež v každém časovém okamžiku vyjadřují stav systému. Takové veličiny lze chápat jako reálné funkce jedné reálné proměnné -- času; tyto funkce budeme nazývat stavové proměnné. Model může obsahovat i další proměnné (exogenní proměnné nebo vnitřní proměnné systému, jejichž změna není bezprostředně působena vazbami jednotlivých složek systému, nebo takové působení není cílem modelování) a konstanty. Tyto složky modelu se nazývají parametry. Parametry modelu mohou být mezi sebou nebo se stavovými proměnnými nějak vázány. Hodnota jednoho parametru může být určena (vynucena) hodnotami jiných parametrů nebo stavových proměnných. Tyto vazby zapíšeme vynucujícími funkcemi (forcing functions). Poněvadž v povaze stavových proměnných je v čase se měnit, je potřeba jejich změnu nějak vyjádřit. Označíme-li stavovou proměnnou symbolem x, nebo podrobněji pro zdůraznění její závislosti na čase symbolem x(t), je obecný tvar zápisu změna x(t) = f(t, vlivy), (2.1) kde f je nějaká reálná funkce, tzv. přechodová funkce (state transition function). ,,Vlivy jsou stavové proměnné (včetně proměnné x, v systému samozřejmě mohou být i bezprostřední zpětné vazby) a/nebo exogenní proměnné, případně další parametry. Přechodová funkce může, ale nemusí, explicitně záviset na čase t. Pokud žádná z přechodových funkcí v modelu na čase explicitně nezávisí, jedná se o model autonomní, v opačném případě neautonomní. Projekce chování systému pomocí modelu musí někdy a v nějakém stavu začít. Proto nezbytnou složkou dynamických modelů jsou počáteční podmínky, které udávají hodnoty stavových proměnných v určeném počátečním okamžiku t0. U autonomních modelů se obvykle volí t0 = 0. Rovnice tvaru (2.1) vyjadřují základní dynamiku modelu. Abychom tuto dynamiku mohli projektovat, je třeba ještě specifikovat, co přesně znamená ,,změna x(t) . To není vůbec jednoduchá otázka, souvisí s tím, jak lze matematicky vyjádřit plynutí času. Tomu je věnován následující exkurs. 19 Exkurs: Jak plyne čas? Nejprve si trochu zafilosofujme. Čas si můžeme představit přinejmenším třemi způsoby. Ten první by bylo možno nazvat ,,buddhistický . Čas a jeho plynutí vůbec neexistuje, vše je věčná přítomnost a vnímání času je jen představa, výplod ,,neosvobozené mysli lpící na své individuální existenci. Druhý způsob lze nazvat ,,platónský . Všechny časové okamžiky již existují (v nějaké říši idejí, v Boží nebo božské mysli a podobně) a naše vnímání plynutí času je opět pouze iluze ,,obyvatelů jeskyně . Třetí pojetí bych nazval ,,existencialistické . Čas stále vzniká (nebo je stále znovu tvořen), každý okamžik se však okamžitě propadá do minulosti. V matematice čas neexistuje; z tohoto pohledu je matematika ,,buddhistická . Fyzikální pojetí času -- čas jako jeden z geometrických rozměrů časoprostorového kontinua -- je v podstatě ,,platónské (jako ostatně celá fyzika s hledáním ,,teorie všeho ). Toto pojetí se ukazuje jako velice plodné. Vedlo k vytvoření infinitesimálního, tj. diferenciálního a integrálního, počtu v Newtonově pojetí, což je mocný nástroj k ,,uchopení pohybu a změny. (A na tom nic nemění ani skutečnost, že matematici -- za všechny jmenujme alespoň Weierstrasse -- infinitesimální počet zase ,,zmrazili do nehybnosti a bezčasí.) Fyzikální pochopení času vedlo k prudkému rozvoji techniky, tím ke zrychlujícímu se vznikání nových skutečností a následně, poněkud paradoxně, k rozvoji existenciální úzkosti. Ať již chápeme čas jakkoliv, může nás zajímat, jak lze jeho plynutí -- nebo to, co za plynutí času považujeme -- popsat. Je-li čas jen představou, je porozumění této představě prvním krokem k osvobození se od ní. Pokud čas již objektivně někde nebo nějak existuje, jeho myšlenkové uchopení nás k realitě přiblíží. A pokud čas teprve vzniká, dává nám porozumění jemu -- nebo alespoň jeho projevům -- šanci spolupodílet se na kvalitě budoucnosti. Základní vlastností času je to, že plyne, že existuje něco, čemu se říká šipka nebo šíp času. Plynutí času se projevuje jednak tím, že můžeme rozlišit minulost a budoucnost, nebo -- opatrněji řečeno -- poznat, že nějaký okamžik předcházel jinému. Pokud jsme totiž schopni dva časové okamžiky rozlišit, můžeme také poznat, který z nich byl dříve a který později. Navíc čas plyne jednosměrně, nelze se vracet v čase zpět; k minulosti se přes budoucnost nedostaneme. Dalším projevem plynutí času je to, že po každém okamžiku přijde nějaký následující, existuje jakési propojení minulosti a budoucnosti. Je ovšem možné, že běh času jednou skončí, že nastane okamžik, po kterém již žádný další nepřijde. Takový ,,konec času však může být nejvýše jeden. A třetím projevem plynutí času -- nebo našeho způsobu vnímání nebo představování si času -- je jakási míra času. Jsme schopni nějakým způsobem měřit nebo kvantifikovat časovou vzdálenost dvou okamžiků. Tyto tři vlastnosti času vyjádříme formálně. Skutečnost, že jeden časový okamžik, řekněme t1, předchází jiný okamžik, řekněme t2, vyjádříme formulkou t1 < t2. Větu ,,pokud jsme schopni dva časové okamžiky rozlišit, můžeme také poznat, který z nich byl dříve a který později přesněji vyjádříme výrokem ,,pro jakékoliv dva časové okamžiky t1 a t2 musí nastat právě jedna z možností: buď t1 < t2 nebo t2 < t1 a nebo t1 = t2. (Symbolem t1 = t2 je vyjádřena skutečnost, že okamžiky t1 a t2 splývají, jsou současné, nejsme je schopni od sebe rozlišit.) Jednosměrné plynutí času vyjadřuje podmínka: z toho, že jeden okamžik předchází druhému a ten předchází třetímu, plyne, že první okamžik předchází i třetímu. Formálně řečeno, z dvojice vztahů t1 < t2 a t2 < t3 vyplývá vztah t1 < t3. Bezprostřední následování časových okamžiků za sebou vyjádříme tak, že ke každému časovému okamžiku existuje takový, který ho následuje ,,nejtěsněji , tj. který ho nepředchází a který současně není předcházen žádným jiným časovým okamžikem v budoucnosti (budoucnosti vzhledem k okamžiku t). Formálněji řečeno: ke každému časovému okamžiku t existuje časový okamžik, který označíme (t) a který nepředchází žádný z okamžiků s takových, že t < s. Ještě přesněji řečeno, ke každému okamžiku t existuje okamžik (t), takový že t (t) a pokud t < s pro nějaký okamžik s, pak (t) s. (Přitom formule ,,t1 t2 je zkratka za ,,t1 < t2 nebo t1 = t2 .) Při ,,existencialistické interpretaci je (t) časový okamžik, který ,,vznikl z časového okamžiku t nebo který ,,byl stvořen bezprostředně po okamžiku t. Povšimněme si, že nepožadujeme, aby ke každému okamžiku t existoval nějaký okamžik s takový, že t < s. Výrok (implikace) ,,pokud t < s pro nějaký okamžik s, pak (t) s je pravdivá, i když žádný okamžik s, který by byl předcházen okamžikem t, neexistuje. V takovém případě by okamžik (t), který existovat musí, splýval 20 s okamžikem t, (t) = t. Nepostulujeme tedy, že po každém okamžiku nastane nový ,,bezprostředně budoucí okamžik (v ,,existencialistické interpretaci) nebo že čas je aktuálně nekonečný (v ,,platónské interpretaci). Konec času tedy nastat může. Na bezprostřední následování časových okamžiků se můžeme podívat i z druhé strany. Ke každému časovému okamžiku existuje takový, který ho ,,nejtěsněji předchází. Formálně řečeno, ke každému okamžiku t existuje okamžik (t), takový že (t) t a pokud s < t pro nějaký okamžik s, pak s (t). Samotné symboly a můžeme také považovat za objekty, nazývají se operátor kroku vpřed -- , a operátor kroku vzad -- . V ,,platónském pojetí se jedná o zobrazení, které každému okamžiku přiřadí ,,bezprostředně následující nebo ,,bezprostředně předcházející okamžik; v ,,existencialistickém pojetí je konstruktor, který z nějakého okamžiku vytvoří okamžik ,,bezprostředně následující , v nějakém okamžiku ,,vyvolá ze zapomnění okamžik ,,bezprostředně předcházející . Měření nebo kvantifikace délky časových intervalů spočívá v přiřazení nějakého reálného čísla tomuto časovému intervalu. Časový interval je jednoznačně určen okamžikem počátečním, řekněme t, a okamžikem koncovým, řekněme s, takže ono reálné číslo, vyjadřující délku časového intervalu, vlastně přiřazujeme dvojici čísel (s, t). Povšimněme si, že samotné časové okamžiky nemusí být vyjádřeny čísly (jak je běžné ve fyzice), nemusí tedy být možné časové okamžiky sčítat nebo odčítat. (Není ostatně jasné, jak by se případně interpretoval součet dvou okamžiků.) I ve fyzikálním vyjádření, např. ,,čas t = 5s , nejde ve skutečnosti o nějaký okamžik pojmenovaný ,,pět sekund , ale o okamžik, který je vzdálen od nějak zvoleného počátku o 5 s. Toto přiřazení míry -- délky časového intervalu -- dvěma okamžikům musí mít nějaké ,,rozumné vlastnosti. V případě, že počáteční okamžik t předchází koncový okamžik s, prohlásíme délku intervalu za kladnou. Pokud koncový okamžik jednoho intervalu splývá s počátečním bodem druhého intervalu, bude délka intervalu s počátečním okamžikem shodným s počátečním okamžikem prvního intervalu a s koncovým okamžikem v koncovém okamžiku druhého intervalu rovna součtu délek obou intervalů. Stroze matematicky můžeme vlastnosti času vyjádřit následovně. Čas je nějaká množina, označme ji T, spolu s binární relací < a zobrazením : T × T R (R označuje množinu reálných čísel) takovými, že jsou splněny tři axiomy: A1 Relace < je asymetrická, tj. z t1 < t2 plyne (t2 < t1), tranzitivní, tj. z t1 < t2 a t2 < t3 plyne t1 < t3, a úplná, tj. pro každá dvě t1, t2 z množiny T nastane právě jedna z možností t1 < t2, t2 < t1 nebo t1 = t2. A2 Pro každé t z množiny T existují (t) = inf{s : t < s} a (t) = sup{s : s < t} a (t) T a (t) T. A3 Zobrazení je spojité, silně izotonní, tj. z t1 < t2 plyne (t2, t1) > 0, a má vlastnost (t1, t3) = (t1, t2) + (t2, t3). Vlastnost spojitosti zobrazení nebyla v předchozím neformálním textu diskutována. Spojuje zobrazení s relací <, jedná se však o sofistikovanou matematickou záležitost. Intuitivně znamená, že pokud se okamžiky t1 a t2 ,,příliš neliší , pak se ,,příliš neliší hodnoty (s, t2) a (s, t2) pro libovolný okamžik s z množiny T. Poznamenejme, že hodnotu (t2, t1) interpretujeme jako délku časového intervalu od počátečního okamžiku t1 do koncového okamžiku t2. Uvedené axiomy postačují k tomu, aby mohla být formálně vytvořena teorie časových změn -- teorie dynamických rovnic. Nejprve zavedeme ještě několik pojmů. Definujme (t) = ((t), t). Veličina vyjadřuje vzdálenost nějakého časového okamžiku a okamžiku bezprostředně následujícího. Čím je tato veličina menší, tím čas plyne ,,hladčeji , čím je větší, tím ,,trhaněji . Proto se tato veličina nazývá zrnitost času v okamžiku t. S různými ,,časovými skoky , ,,nepravidelnostmi v plynutí času má určitě zkušenosti téměř každý. Čas plyne, jednotlivé okamžiky nejsme téměř schopni rozlišit a najednou se něco stane -- člověk se zamiluje, zemře někdo blízký, teroristé 11. září zaútočí, dojde ke kambrické explozi a podobně -- a najednou nic není jako dříve; čas začneme rozlišovat na ,,před a ,,po , v čase vznikla mezera. Jindy nebo pro jiné potřeby vnímáme čas přímo jako postupující v diskrétních krocích, pravidelných nebo nepravidelných -- čas je odměřován jednotlivými semestry, 21 vegetačními sezónami, parlamentními volbami, horotvornými pohyby a podobně. Zavedení zrnitosti času je současným (základní pojmy zformuloval S. Hilger roku 1988, teorie byla do uceleného tvaru dovedena roku 2001) nejúspěšnějším pokusem, jak se s časovými nepravidelnostmi vyrovnat. Pomocí zrnitosti a operátorů skoku a můžeme klasifikovat časové okamžiky. Pokud (t) > 0, tj. pokud (t) > t, okamžik t se nazývám zprava osamocený, pokud (t) = 0, tj. pokud nejsme schopni okamžik t odlišit od okamžiku bezprostředně následujícího, (t) = t, pak se okamžik t nazývá zprava hustý. Podobně pokud (t) < t, nazývá se okamžik t zleva osamocený a pokud (t) = t, nazývá se okamžik t zleva hustý. Okamžik t se nazývá hustý, pokud je hustý zleva i zprava, a nazývá se izolovaný, pokud je osamocený zleva i zprava. Na obrázku 2.1 je několik příkladů možného plynutí času. Dva extrémní případy jsou takové, že všechny časové okamžiky jsou husté, nebo že všechny okamžiky jsou izolované. Pokud jsou všechny okamžiky husté, jedná se o čas fyzikální nebo klasickou časovou osu. V takovém případě můžeme čas ztotožnit s množinou reálných čísel. Fyzikální čas je znázorněn na obrázku a). Pokud jsou všechny okamžiky izolované, může průběh času vypadat rozmanitěji. Existuje-li nějaký přirozený časový krok a zrnitost je konstantní -- tj. v každém okamžiku stejná -- a rovna tomuto kroku, jedná se diskrétní čas s pevnou (obvykle jednotkovou) délkou kroku; je znázorněn na obr. b). Takové pojetí času se často používá při modelování dynamiky systémů. Je však adekvátní pouze tehdy, když skutečně nějaká přirozená časová jednotka existuje a modelovaný systém se vyvíjí v postupných krocích. Jiná možnost diskrétního času je znázorněna na obr. c). Zrnitost času se postupně zmenšuje. V takovém případě může dokonce dojít k tomu, že existuje nějaký poslední časový okamžik, který je zleva hustý. Poslední okamžik je sice v konečné časové vzdálenosti, ale vede k němu nekonečně mnoho časových kroků. (Tato představa je jedním z možných východisek z klasické Zenonovy aporie ,,Achilles a želva . Za povšimnutí stojí, že podobným způsobem si většina lidí představuje čas zbývající do smrti. Sice uznáme, že naše smrt přijde za nějaký konečný časový úsek -- z hlediska času historického nebo dokonce geologického velice krátký -- ale máme pocit, že smrt je ještě vzdálena nekonečně mnoho nějakých časových kroků; k okamžiku smrti nevidíme. Tato představa je možná správná: Moje smrt se mě netýká; pokud jsem tady, není zde smrt a pokud je zde moje smrt, nejsem tu já. Ke smrti se přibližujeme, ale v uvedeném smyslu jí nikdy nedosáhneme.) Pro modelování nějakých procesů (např. takových, na něž mají vliv nepředvídatelné přírodní katastrofy nebo společenské otřesy) může být užitečné si čas představit jako složený z izolovaných okamžiků, které ale mají nepravidelné vzdálenosti; zrnitost je sice v každém okamžiku kladná, ale v každém okamžiku jiná. Takový průběh času je znázorněn na obr. d). Další způsob plynutí času je ten, že čas po nějakou dobu plyne spojitě, všechny okamžiky jsou husté. Pak ale nastane ,,časový skok , čas dospěje do nějakého zleva hustého okamžiku, za kterým bezprostředně následuje časový okamžik zleva osamocený a zprava hustý. Takto plynoucí čas si můžeme představit např. při procesu učení: během semestru se do studentovy hlavy souvisle dostávají vědomosti a pak nastane skok během prázdnin, po kterých následuje další souvislý čas přijímání vědomostí. Jiné přirozené použití takového času se souvislými úseky a skoky je při modelování zemědělských procesů -- vegetační sezóna je přerušována obdobím zimy. Na obr. e) je příklad takového plynutí času. Souvislé úseky jsou znázorněny jako stejně dlouhé, tak tomu ale nemusí vždycky být. Na tomto příkladu je také možné jednoduše ilustrovat, že časové skoky nelze zaměňovat. Krok do budoucnosti a návrat může být něco úplně jiného, než krok do minulosti a návrat. Uděláme-li krok do budoucnosti a pak se vrátíme o krok do minulosti, můžeme se dostat jinam, než jsme byli. (Matematicky řečeno, operátory skoku vpřed a vzad a nekomutují.) Představme si, že se nacházíme v prvním zleva osamoceném a zprava hustém okamžiku, tj. na začátku -- při ,,čtení obrázku zleva doprava -- druhé souvislé úsečky. Skokem vpřed zůstaneme ve stejném okamžiku, ,,bezprostředně následující okamžik nemůžeme rozlišit od okamžiku, v němž se nacházíme. Potom skokem vzad se dostaneme do prvního zprava osamoceného bodu. (Tento jev nenastává, pokud všechny okamžiky jsou izolované nebo všechny okamžiky jsou husté, tedy v modelech času běžně používaných. Model času ,,typu e) je tedy vhodný pro popis procesů, v nichž dochází k nevratným změnám.) Na závěr je na obr. e) znázorněna kombinace všech možností. Úvahy o plynutí času (nebo: o popisu [naší představy o] plynutí času) jsou vlastně přípravou na popis změny. Představme si nejprve pro jednoduchost, že stav nějakého systému, o nějž se zajímáme, lze vyjádřit jedním reálným číslem -- jednoduchá akumulace nebo něco podobného. 22 a) b) q q q q q q q q q q q q c) qqqqqqqqqqq d) q q qq q qq q q q qq q q q q q q q q q q q e) f) q q q q q q Obrázek 2.1: Stav systému, v nějakém časovém okamžiku t můžeme označit symbolem F(t). Systém se v průběhu času mění, v okamžiku bezprostředně následujícím po t, tedy v okamžiku (t), bude ve stavu F (t) , který se obecně od stavu F(t) může lišit. Za vyjádření změny můžeme považovat rozdíl těchto stavů, tedy F (t) - F(t). Tento rozdíl ale ještě není vhodnou ,,mírou změny ; tou by mohl být pouze v případě pravidelně plynoucího času se všemi okamžiky diskrétními a přirozenou časovou jednotkou, tedy času z obr. b) -- podstatnou charakteristikou změny je totiž i zrnitost času, velikost příslušného časového kroku. Proto je za míru změny vhodné vzít změnu stavu v ,,bezprostředně následujících okamžicích relativně k délce časového kroku, tj. k zrnitosti. Za míru změny stavu můžeme tedy považovat výraz F (t) = F (t) - F(t) (t) . Pokud zrnitost je konstantní a rovna ,,přirozené časové jednotce, (t) = 1, jedná se o obvyklou diferenci (tradičně značenou F(t)). Je-li však okamžik t zprava hustý, (t) = 0, pak je také (t) = t a v důsledku toho F (t) -F(t) = 0. Nastává tedy problém, že výraz F (t) je ,,neurčitý , je tvaru F (t) = 0/0. Tento problém je však řešitelný -- řešením je 300 let rozvoje infinitesimálního počtu. Mírou změny je pak derivace F (t). 2.2 Příklady 2.2.1 Model učení Jeden z modelů učení, kterým byl ilustrován exkurs o linearitě v první kapitole, byl tvaru x(t + 1) = x(t) 1 + V - ax(t) . (2.2) V tomto modelu je jediná stavová proměnná x (množství vědomostí), dva konstantní kladné parametry V (maximální možná rychlost učení) a a (zpomalení rychlosti učení). Rovnici (2.2) lze přepsat na tvar x(t) = x(t) V - ax(t) , (2.3) to znamená, že x = x. Jedná se tedy o diferenční rovnici, tj. dynamickou rovnici s diskrétním časem, který má v každém okamžiku jednotkovou zrnitost. Přechodová funkce na pravé straně je tedy funkcí tří proměnných, stavové x a dvou parametrů V , a. Počáteční podmínku lze zapsat ve tvaru x(0) = x0. 23 Přibyl tedy další kladný parametr x0 (počáteční množství vědomostí). Vynucující funkce v tomto modelu nejsou. Na tomto příkladu je možno ukázat ještě jednu vlastnost modelů, a to, že počet parametrů není nějakou vnitřní (essenciální, invariantní) vlastností modelu. Neexistuje nějaká ,,nutná nebo ,,přirozená jednotka pro změření množství vědomostí; můžeme ji tedy vybrat libovolně. Zavedeme proto novou stavovou proměnnou y jako množství vědomostí v nových jednotkách. Za ,,novou jednotku vezmeme takovou, která je a/V -krát menší než původní, tedy y(t) = a V x(t), neboli x(t) = V a y(t). Po dosazení do rovnice (2.3) dostaneme y(t) = y(t + 1) - y(t) = a V x(t + 1) - x(t) = a V x(t) = a V x(t) V - ax(t) = = a V V a y(t) V - a V a y(t) = V y(t) 1 - y(t) , takže model je tvaru y(t) = V y(t) 1 - y(t) , y(0) = a V x0. V jeho přechodové funkci je již pouze jeden parametr V , parametr a se ukázal jako nadbytečný. Tento příklad také ukazuje, že ,,komplexnost systému (zhruba řečeno, množství složek systému a vazeb mezi nimi) není, nebo nemusí být, vnitřní (podstatnou) vlastností systému. Může se jednat o vlastnost popisu nebo mentálního uchopení systému. 2.2.2 Formální shoda modelů různých systémů Pokusíme se sestavit rovnice popisující dynamiku dvousložkových systémů různé úrovně: z oblasti fyziky, chemie, biologie (ekologie) a sociologie. Stavové proměnné ve všech případech budou dvě, označíme je n1 a n2. Čas bude ve všech případech spojitý, tj. jeho zrnitost je v každém okamžiku nulová. Dynamika elektron-děrové plazmy v oblasti silového pole v polovodičích plyne z těchto předpokladů: přírůstek koncentrace elektronů (n1), resp. děr (n2) za jednotku času je přímo úměrný těmto koncentracím a jejich úbytek přímou rekombinací je přímo úměrný součinu těchto koncentrací. Do první složky těchto přírůstků je možno zahrnout i úbytek způsobený záchytem elektronů v ,,pastích . Z těchto faktů je již možno napsat příslušný systém rovnic dn1 dt = a1n1 - b1n1n2, dn2 dt = a2n2 - b2n1n2, kde a1, a2, b1, b2 jsou příslušné koeficienty úměrnosti, b1 a b2 jsou kladné. Pokud se z nějaké suroviny s koncentrací n0 autokatalyticky syntetizuje nějaká látka s koncentrací n1, z ní opět autokatalyticky jiná látka s koncentrací n2 a ta se může rozpadat na nějaké produkty, které odchází ze systému, můžeme bilanční rovnice těchto procesů zapsat ve tvaru dn1 dt = a0n0n1 - bn1n2, dn2 dt = -a2n2 + bn1n2. Při sestavení rovnic jsme respektovali skutečnost, že přírůstek druhé látky je úbytkem první látky. To však nic nemění na skutečnosti, že součin a0n0 je konstanta. Všechny parametry v tomto modelu jsou kladné. 24 V oblasti ekologie jsou známy systémy typu dravec-kořist, např. systém sestávající z rysů, kteří se živí zajíci, a zajíců, kteří se živí trávou. Přírůstek zajíců je tím větší, čím více jich je, přírůstek rysů závisí na na počtu jejich setkání se zajíci a ten je úměrný součinu počtů zajíců a rysů. V nepřítomnosti zajíců by se projevil úbytek rysů úměrný jejich počtu. Za těchto předpokladů dostaneme Lotkovy-Volterrovy rovnice (stavové proměnné mohou vyjadřovat populační hustoty, celkovou biomasu nebo přímo počty jedinců) dn1 dt = a1n1 - b1n1n2, dn2 dt = -a2n2 + b2n1n2. Parametry a1, a2, b1 a b2 jsou kladné. Nakonec sestavíme rovnice pro vzájemně soupeřící sociální skupiny (z oblasti sportu, politiky apod.). Přírůstek počtu přívrženců jedné skupiny (n1) je úměrný jejich počtu (vznikajícímu buď přirozeným růstem nebo agitací mezi nezainteresovanými) a počtu těch, které se podařilo získat přesvědčováním členů soupeřící strany. Druhá složka musí být úměrná součinu n1n2, protože závisí na počtu párových interakcí členů obou soupeřících skupin. Analogické tvrzení platí o příslušnících druhé skupiny, jen je potřeba uvážit, že přírůstek v řadách druhé skupiny vzniklý přesvědčováním členů první, je úbytkem ve skupině první. V hrubém přiblížení můžeme tedy dynamiku uvažovaných skupin popsat rovnicemi dn1 dt = a1n1 - bn1n2, dn2 dt = a2n2 + bn1n2. Uvážíme-li, že parametry a0, a1, a2, b, b1 a b2 mohou být obecně kladné nebo záporné, vidíme, že rovnice popisující procesy čtyř různých úrovní jsou totožné. Na jisté úrovni abstrakce tedy můžeme zapomenout na to, že zkoumáme procesy ve společnosti, v přírodě živé nebo neživé, a můžeme se pokusit o nějaké všeobecně platné dedukce. Ukazuje se, že ty nejsou triviální ani nezajímavé. Tento příklad je převzat z knihy [6]. 2.2.3 Válka s terorismem Pojmový model a základní schéma této problematiky je uvedeno v oddílu 1.5.1. Tam jsou také identifikovány dvě základní stavové proměnné. Označme je T . . . množství teroristů, F . . . frustrace obyvatelstva. Exogenní veličiny, které dále ovlivňují systém a mohou se v čase měnit, označíme N . . . nábor, L . . . likvidační akce. Politiku budeme považovat za stálou, tedy za parametr systému. Budeme uvažovat vývoj systému ve spojitém čase, takže změna stavových proměnných bude vyjádřena jejich derivací. Nejprve sestavíme model, v němž není vazba množství teroristů na likvidační akce. Ty jsou tedy ovlivněny konstantní politikou, takže se v čase nemění. Platí tedy L = p, kde p je parametr, vyjadřující politiku. Parametr p nemůže být záporný (likvidačních akcí nemůže být méně než žádná). Hodnota p = 0 vyjadřuje, že žádné zásahy neprobíhají, tedy že se provádí důsledně politika appeasementu; kladná hodnota vyjadřuje aktivní protiteroristickou politiku, tedy politiku ,,jestřábí . To, že připouštíme p = 0, umožňuje při konstrukci modelu (na rozdíl od vytváření příčinného smyčkového diagramu) mluvit o politice bez přívlastku. 25 Změna množství teroristů T je ovlivňována likvidačními akcemi L a náborem N, tedy dT dt = f(N, L). O funkční závislosti f víme pouze to, že v první proměnné N roste (vazba náboru na počet teroristů je pozitivní) a ve druhé proměnné L klesá (vazba likvidačních akcí na počet teroristů je negativní). Pokud funkční závislost neznáme, zvolíme tu nejjednodušší, což je přímá úměrnost, f(N, L) = N - L, kde , jsou kladné konstanty; vyjadřuje úspěšnost náboru, úspěšnost likvidačních akcí. Celkem dostáváme rovnici dT dt = N - L. Počáteční podmínku zapíšeme ve tvaru T (0) = T0; hodnota T0 je kladná (za počáteční okamžik bereme takový, v němž již nějaký problém s terorismem byl). Frustraci obyvatelstva F ovlivňují pouze likvidační akce L. Závislost zvolíme opět jednoduše jako přímou úměrnost, tedy dF dt = L, kde je kladná konstanta vyjadřující sílu vedlejších efektů protiteroristických akcí. Počáteční podmínku zapíšeme obecně jako F(0) = F0. Nezáporná hodnota F0 vyjadřuje počáteční frustraci, způsobenou například přírodními podmínkami, současnou vládnoucí stranou, bývalými kolonizátory a podobně. Poslední vazba v systému je pozitivní vliv frustrace obyvatelstva F na nábor N; ve tvaru přímé úměrnosti ho zapíšeme N = F, kde je kladný koeficient úměrnosti. Celkem dostáváme model sestávající ze dvou stavových proměnných T a F, příslušných přechodových rovnic dT dt = N - L, (2.4) dF dt = L (2.5) s počátečními podmínkami T (0) = T0, (2.6) F(0) = F0 (2.7) a vynucujícími funkcemi L = p, (2.8) N = F; (2.9) parametry , , , a T0 jsou kladné, p a F0 jsou nezáporné. Vyjádření (2.8) proměnné L dosadíme do rovnice (2.5) a dostaneme dF dt = p. Řešení této jednoduché diferenciální rovnice s počáteční podmínkou (2.7) je F(t) = pt + F0. Z rovnosti (2.9) nyní máme N(t) = pt + F0. (2.10) 26 T t T t T t a) b) c) Obrázek 2.2: Možný průběh funkce T = T (t) -- první složky řešení modelu (2.4)­(2.9) Dosazením výrazů (2.8) a (2.10) do rovnice (2.4) dostaneme diferenciální rovnici dT dt = pt + F0 - p, jejíž řešení s počáteční podmínkou (2.6) je T (t) = 1 2 pt2 + (F0 - p)t + T0. Pokud p = 0 (tj. při důsledné politice appeasementu), je funkce T konstantní, T T0. V takovém případě se žádná válka s terorismem nevede, teroristické útoky probíhají se stálou intenzitou. Za povšimnutí stojí i skutečnost, že pak podle rovnosti (2.10) je frustrace konstantní a v případě < 1 (tj. když nábor není příliš intenzívní), je dokonce menší než frustrace počáteční. To znamená, že terorismus je částečným řešením vnitřních problémů států nebo oblastí s frustrovaným obyvatelstvem. Je-li p > 0, je funkce T = T (t) kvadratická a její průběh snadno vyšetříme pomocí středoškolské matematiky. Grafem funkce T je parabola s vrcholem o souřadnicích p - F0 p , T0 (F0 - p)2 2p , jejíž osa je rovnoběžná s osou závisle proměnné a jež je otevřená do +. Samozřejmě, že interpretovatelný smysl má pouze její nezáporná část, T (t) 0. Možný průběh závislosti veličiny T na čase t je znázorněn na obr. 2.2. Pokud p F0, jedná se o funkci rostoucí na intervalu 0, ), obr. 2.2 a). Uvedenou podmínku lze vyjádřit také ve tvaru p F0 (2.11) a interpretovat ji tak, že je-li jestřábí politika slabá (nebo jinak, je-li silný vliv politiky appeasementu), terorismus bude narůstat. Nechť je tedy vliv politických jestřábů dostatečně silný, tj. platí nerovnost p > F0. (2.12) Je-li druhá souřadnice vrcholu paraboly (grafu funkce T ) kladná, je průběh funkce zobrazen na obr. 2.2 b). V takovém případě se válka s terorismem zpočátku jeví jako úspěšná, množství teroristů se zmenšuje. Po jisté době ale začne narůstat a bude větší než na začátku. Jedná se o typický příklad chování ,,fixes that backfire (zásahy, které se nevyplácí). Má-li být válka s terorismem vskutku úspěšná -- vést k eliminaci teroristů -- musí být druhá souřadnice vrcholu paraboly nekladná, tj. musí platit 2pT0 (F0 - p)2 . 27 Tuto podmínku lze přepsat na tvar 2 p2 - 2(F0 + T0)p + 2 2 F2 0 0. (2.13) Na levou stranu této nerovnosti se lze dívat jako na kvadratický polynom v proměnné p. Jeho diskriminant je D = 42 2 (F0 + T0)2 - 42 2 2 F2 0 = 42 2 (2F0T0 + 2 T 2 0 ) > 0, takže má kořeny p1,2 = 2(F0 + T0) D 22 = F0 + 2 T0 2F0T0 + 2T 2 0 . Z tohoto vyjádření je vidět, že p1 (menší kořen) je menší než kritická hodnota vyjádřená podmínkou (2.12). Podmínky (2.12) a (2.13) tedy mohou být současně splněny právě tehdy, když p F0 + 2 T0 + 2F0T0 + 2T 2 0 . (2.14) Dosud dosažené výsledky lze shrnout: Platí-li podmínka (2.11), je funkce T na intervalu 0, ) rostoucí; pokud současně platí podmínka (2.12) a neplatí podmínka (2.14), je funkce T zpočátku (tj. na intervalu 0, t1 pro jisté t1 > 0) klesající, ale poté začne růst; platí-li podmínka (2.14), funkce T v konečném čase klesne k nule. Jinak řečeno, intenzívní likvidační akce vedou k vymýcení teroristů; slabé nebo žádné likvidační akce vedou k nárůstu terorismu; silnější, ale ne dostatečně intenzívní likvidační akce se zpočátku jeví jako úspěšné, v konečném důsledku však vedou k nárůstu terorismu.1 Znovu zdůrazněme, že model nebyl sestaven proto, aby řešil globální problémy lidstva. Měl ilustrovat proces tvorby a analýzy modelu. Zajímavým ,,vedlejším výsledkem je to, že kvalitativní vlastnosti řešení jednoho modelu jsou různé při různých přípustných volbách jednoho parametru. Tento fakt dokládá skutečnost, že chování není determinováno jenom strukturou systému, ale může podstatně záviset i na kvantitativních charakteristikách jeho složek. Věnujme se nyní modelu, v němž je pozitivní vazba počtu teroristů na likvidační akce, tj. protiteroristické akce jsou odezvou na teroristické činy (které jsou viditelným projevem existence množství teroristů). K závislosti (2.8) exogenní proměnné L na politice přibude její závislost na stavové proměnné T ; za závislost opět vezmeme přímou úměrnost. Místa rovnosti (2.8) tedy budeme mít rovnost L = p + T, (2.15) kde je kladný koeficient úměrnosti. Do rovnic (2.4) a (2.5) dosadíme vyjádření (2.9) a (2.15). Dostaneme systém obyčejných diferenciálních rovnic dT dt = -T + F - p, (2.16) dF dt = T + p. (2.17) K nim přísluší počáteční podmínky (2.6) a (2.7). Jedná se o nehomogenní lineární rovnice s konstantními koeficienty, lze ho tedy explicitně vyřešit. Nezajímá nás ovšem přesné řešení, ale jeho 1Komu se tento ,,pravicový závěr nelíbí, může oprávněně namítnout, že v modelu nejsou nijak zahrnuty náklady na likvidační akce a cena za jejich úspěšnost -- zničení ,,oblastí rodících terorismus při dostatečně intenzívních likvidačních akcích může být taková, že se celá Země stane neobyvatelnou. A ,,zprava opět lze namítnout, že při neomezeném terorismu by se Země stala neobyvatelnou tak jak tak. A v diskusi lze pokračovat. Model nedává odpověď; ale může diskusi stimulovat a usměrňovat. 28 F T p F T I III II a) b) Obrázek 2.3: ,,Fázový portrét a trajektorie systému (2.16), (2.17) kvalitativní vlastnosti (model je teoretický). Proto nebudeme explicitní řešení vypisovat, ale provedeme standardní analýzu systému (2.16), (2.17) ve fázové rovině. Nejprve poznamenejme, že interpretovatelný význam mají pouze trajektorie ležící v uzavřeném prvním kvadrantu, tj. T 0, F 0. Zde je časová derivace stavové proměnné F podle rovnice (2.17) kladná. Z levé strany rovnice rovnice (2.16) vidíme, že T -nulklina má rovnici F = T + p , je to tedy přímka. ,,Nad touto přímkou (v kladném směru osy F) je časová derivace stavové proměnné T kladná, ,,pod ní záporná. ,,Fázový portrét systému (2.16), (2.17) je na obr. 2.3 a). Z něho plyne, že možné trajektorie jsou takové, jak jsou znázorněny na obr. 2.3 b). Vidíme, že opět jsou možné tři způsoby chování -- růst množství teroristů (trajektorie I), počáteční pokles tohoto množství následovaný nárůstem (trajektorie II) a eliminace teroristů v konečném čase (trajektorie III). Na obr. 2.3 b) je čárkovaně znázorněna křivka, která odděluje trajektorie řešení rostoucích nade všechny meze (typ I a II) a trajektorie řešení takových, pro něž existuje čas t1, že T (t1) = 0 a F(t1) < . Je zřejmé, že řešení typu III mohou existovat pouze tehdy, když p > 0. Začlenění další vazby -- ovlivnění likvidačních akcí množstvím teroristů, které se projevuje počtem nebo intenzitou teroristických akcí -- nemá žádný vliv na kvalitativní výsledky modelu. Jeden možný závěr plynoucí z této skutečnosti je, že eliminace terorismu je možná pouze preventivními údery, nikoliv policejními akcemi po teroristických aktech. Alternativním závěrem může být odmítnutí modelu; například odmítnutí základního předpokladu, že příčinou terorismu je chudoba v některých částech světa. 29 Kapitola 3 Modely vyjádřené piktogramy Uživatelé nebo zadavatelé modelů, zejména z oblasti společenských věd nebo ekonomiky, lidé v rozhodovacích funkcích (,,decision makers ) a podobně většinou dynamickým rovnicím nerozumějí. Přesto i s takovými je někdy potřebné nebo dokonce nutné komunikovat a při této komunikaci jim vycházet vstříc. Pro tento účel byl vyvinut (nejprve v programovém systému Stella) jednoduchý systém piktogramů, kterými je možné dynamický model representovat. Používané obrázky jednoduše vyjadřují vztahy (vazby, nikoliv funkční závislosti) mezi složkami modelu. To mají společné s příčinnými smyčkovými diagramy (sr. 1.5), navíc ale umožňují rozlišovat stavové proměnné od ostatních proměnných nebo konstant, vazby ovlivňující změnu proměnných od vazeb mezi proměnnými. Největší výhoda grafického prostředí (nejen programu Stella ale také Powersim, ithink nebo Vensim) však spočívá v tom, že z grafické representace modelu s doplněnými formulemi vyjadřujícími závislosti mezi složkami přímo generuje příslušné dynamické rovnice a jejich numerické řešení. Cenou za výhody piktogramů (a programů typu Powersim) je jisté nebezpečí, které spočívá ve spoléhání se na technologii, přičemž do techniky řešení není příliš vidět. Proto v této kapitole bude ukázána souvislost mezi pojmy používanými při modelování pomocí dynamických rovnic a pojmy nebo obrázky systémové dynamiky. 3.1 Akumulace, toky a dynamické rovnice Základní veličiny systému -- stavové proměnné -- si lze představit jako jakési rezervoáry, v nichž množství kapaliny odpovídá aktuální velikosti příslušné stavové proměnné. Z a do těchto rezervoárů vedou trubky, kterými kapalina přitéká nebo odtéká a tak způsobuje změnu stavové proměnné. Přítok a odtok se musí dít předepsaným způsobem, je proto regulován jakýmisi kohouty na potrubí. Tento přístup k modelování je tedy jinak formulovanou klasickou metodou vytváření (multi)kompartmentových modelů (viz např. [3, sec. 1.4]). Používané piktogramy složek systému jsou na obr. 3.1. Popsané rezervoáry se nazývají akumulace a bývají znázorněny obdélníčkem, trubky s kohouty se nazývají toky a bývají znázorněny dvojitou čárou s připojeným trojúhelníčkem a kolečkem. Tok může začínat a/nebo končit v nějaké akumulaci, nebo mimo modelovaný systém, někde v jeho ,,okolí . Toto okolí se znázorňuje obláčkem. Každá akumulace odpovídá stavové proměnné, tok vedoucí od ní (odtok) odpovídá záporné části pravé strany příslušné dynamické rovnice, tok vedoucí do ní (přítok) její kladné části. Dalšími složkami systému jsou pomocné proměnné, které se znázorňují kolečky; odpovídají současně exogenním proměnným i vynucujícím funkcím. Ke každému kolečku přísluší formule vyjadřující hodnotu příslušné proměnné v závislosti na ostatních, které na ni mají vazbu; pomocí piktogramů tedy není možné modelovat systémy, v nichž nelze z vynucujících funkcí pomocí elementárních prostředků explicitně vyjádřit každou proměnnou. Ze znázornění je také patrné, že i ,,kohouty na tocích představují jakési funkce a proměnné -- kladnou nebo zápornou část pravé strany uvažované dynamické rovnice. Kladné a záporné části přechodových funkcí jsou v tomto 30 Obrázek 3.1: Piktogramy složek dynamického modelu pojetí chápány jako další proměnné. To je další doklad toho, že komplexita systému je vlastnost representace tohoto systému; modely systémové dynamiky jsou svým způsobem komplexnější než modelovaná skutečnost. Konstantní parametry systému jsou znázorněné čtverečkem stojícím na špičce a nazývané konstanty. Vazby, v této souvislosti nazývané spoje, jsou znázorněny šipkami. Formule definující pomocné proměnné mohou obsahovat pouze ty pomocné proměnné nebo konstanty, od nich přichází do definované proměnné spoj. Co vyjadřuje změnu stavové proměnné (akumulace), není z piktogramů vidět. V programu Powersim je změnu možno vyjádřit buď diferencí (tj. je používán diskrétní čas s jednotkovou zrnitostí v každém okamžiku) nebo derivací (tj. je používán spojitý čas, v němž je každý okamžik hustý). Powersim však na své nejvyšší (uživatelské) úrovni nerozlišuje mezi diferenční a diferenciální rovnicí; diferenční rovnice je pro něho diferenciální rovnice numericky řešená Eulerovou metodou. Při řešení příslušné diferenciální rovnice je používána metoda Rungeho-Kutty druhého nebo čtvrtého řádu. 3.2 Příklad -- válka s terorismem Modely ,,války s terorismem zapsané systémy diferenciálních rovnic v příkladu 2.2.3 vyjádříme pomocí systémově dynamických piktogramů v programovém systému Powersim. Na obr. 3.2 je model, v němž není vazba množství teroristů na likvidační akce. Formule vyjadřující hodnoty jednotlivých pomocných proměnných jsou: Likvidační akce: 'Politika' Nábor: 'delta'*'Frustrace' Rate_1: 'beta'*'Likvidační akce' Rate_2: 'alpha'*'Nábor' Rate_3: 'gamma'*'Likvidační akce' K vlastnímu modelu jsou přidány i informace o hodnotách jednotlivých konstant a pomocných proměnných. Poněvadž není jasné, v jakých jednotkách by měla být měřena frustrace obyvatelstva nebo množství teroristů (chápané jako intenzita teroristických aktů) -- a vzhledem k tomu, že se jedná o teoretický model, není to ani potřebné vědět --, byla zvolena fiktivní jednotka X. Časový průběh akumulací je vyjádřen graficky -- obrázkem nad akumulací Množství teroristů 31 a obrázkem pod akumulací Frustrace. Je vidět, že výsledek odpovídá analýze provedené v 2.2.3: při zvolených hodnotách konstant = 1, = 1, = 1, = 1, p = 10, F0 = 0, 01 a T0 = 10 platí 10 = p > F0 = 0, 01, 10 = p < F0 + 2 T0 + 2F0T0 + 2T 2 0 . = 20, 02, takže je splněna podmínka (2.12), není splněna podmínka (2.14) a průběh Množství teroristů je skutečně zpočátku klesající, pak ale začne růst a překročí počáteční hodnotu. K modelu lze snadno přidat vazbu Množství teroristů na Likvidační akce a příslušný koeficient úměrnosti -- konstantu lambda. Formule definující pomocnou proměnnou Likvidační akce pak bude Likvidační akce: 'Politika'+'lambda'*'Množství teroristů' a zbytek modelu zůstane beze změny. Je uveden na obr. 3.3. Modely v programovém prostředí Powersim v tomto případě nedaly žádné nové výsledky oproti modelům matematickým a jejich analýze; naopak, z matematických modelů bylo možné odvodit kompletní informaci o vývoji systému -- tři možné způsoby chování. Tyto způsoby chování můžeme ze simulačního modelu vidět také, při simulacích ale nemáme jistotu, že jsme vyzkoušeli všechny možné volby konstant, tedy že jsme viděli i všechny možné způsoby chování. Z této úvahy však neplyne, že by modely vyjádřené piktogramy byly zbytečné, a to dokonce ani v tomto velice umělém příkladu. Na obrázcích 3.2 a 3.3 je vidět jistá nesymetrie akumulací: Množství teroristů má přítok i odtok, Frustrace jen přítok. Toto pozorování by mohlo napovědět, že něco důležitého bylo při modelování zanedbáno -- zmenšování frustrace obyvatelstva a v důsledku toho i nějaká složka systému, která by je mohla ovlivňovat. Co by to ale mohlo být, netuším. 32 Obrázek 3.2: Model ,,války s terorismem bez vazby Množství teroristů na Likvidační akce 33 Obrázek 3.3: Model ,,války s terorismem s vazbou Množství teroristů na Likvidační akce 34 Literatura [1] Adam, J. A. Mathematics in Nature: Modeling Patterns in the Natural World. Princeton: Princeton University Press, 2003. 360 p. ISBN 0-691-1142-9. [2] Bohner, M. ­ Peterson, A. Dynamic Equations on Time Scales. An Introduction with Applications. Boston­Basel­Berlin: Birkhauser, 2001. 358 p. ISBN 0-8176-4225-0. [3] Ellner, S. P. ­ Guckenheimer, J. Dynamic Models in Biology. Princeton: Princeton University Press, 2006. 329 p. ISBN 978-0-691-12589-3. [4] Kot, M. Elements of Mathematical Ecology. Cambridge: The Press Syndicate of the University of Cambridge, 2001. 453 p. ISBN 0-521-00150-1. [5] Kreith, K. ­ Chakerian, D. Iterative Algebra and Dynamic Modeling: A Curriculum for the Third Millenium. New York: Springer, 1999. 325 p. ISBN 0-387-98758-4. [6] Krempaský, J. a kol. Synergetika. Bratislava: Vydavatel'stvo Slovenskej Akadémie vied, 1988. 264 p. 071-016-88 SYN. [7] Sterman, J. D. Business Dynamics: Systems Thinking and Modeling for a Complex World. McGraw-Hill, 2000. 982 p. ISBN 0-07-231135-5. [8] Šusta, M. ­ Neumaierová, I. Cvičení ze systémové dynamiky. Praha: Oeconomica, 2004. 94 p. ISBN 80-245-0780-3. Obecný úvod do dynamických modelů (s matematikou na středoškolské úrovni) představuje kniha [5]. Jsou v ní studovány modely zapsané pomocí diferenčních rovnic a piktogramů ,,typu Stella , řešení diferenčních rovnic je realizováno v prostředí tabulkových procesorů (konkrétně je používán MS Excel). Důkladné poučení o systémové dynamice poskytuje již klasická monografie [7], stručný český výtah z ní je shrnut ve skriptech [8]. Učebnice [2] je prvním zpracováním teorie časových škál (teorie času stručně představené v exkursu v kapitole 2). Knihy [1], [3] a [4] jsou věnovány dynamickým modelům v biologii, každá z nich (nejvýrazněji [3]) však obsahuje i obecnější pojednání o matematickém modelování. Sborník [6] byl v našich krajích první dostupnou publikací o dynamických modelech, zpětných vazbách, ,,nelineární dynamice , chaosu a podobných jevech. Příklad o terorismu (1.5.1, 2.2.3, 3.2) byl vytvořen speciálně pro tento text. Pokud na jiných místech není uveden explicitní odkaz na zdroj, znamená to, že představovanou látku považuji za tolikrát tradovanou v literatuře, že ji lze chápat jako matematický folklor. V žádném případě si v takovém případě nedělám nárok na autorství. 35