1 Hra s elektronickou poštou V tomto kurzu často studujeme chování lidí, které závisí na tom, jaké informace mají k dispozici. Někdy je potřeba, aby určité informace byly všeobecně známé (common knowledge), což znamená, že každý danou informaci ví, ale také ví, že všichni ostatní ji ví, a že všichni ostatní ví, že všichni ostatní ví, že ji ví atd. Následující příklad ukazuje, že existuje podstatný rozdíl mezi tím, když tento řetězec je nekonečný, a situací, kdy je dlouhý, ale konečný. Představme si situaci, kdy příroda rozhoduje o tom, jakou hru dva hráči hrají. Pokud je stav světa a, hraje se hra Ga, pokud je stav světa 6, hraje se hra Gf,. Stav světa a nastane s pravděpodobností 1 — p > ^, stav b s pravděpodobností p. Gb A B A M,M 1,-L B -L, 1 0,0 Ga A B A M,M 1,-L B -L, 1 0,0 První hráč se vždy dozví, jaký je stav světa, tedy i jaká hra se hraje. Všimněte si, že hráči by rádi hráli strategii odpovídající stavu světa (tj. A v Ga a B v G^). Ovšem pokud si daný hráč není jistý tím, že ve stavu světa b i protihráč zahraje B, je pro něj riskantní to udělat. Optimální akce tedy záleží na stavu světa. První hráč má tedy motivaci informovat druhého hráče o stavu světa. Pokud by existoval dokonalý komunikační prostředek, tak by hráči hráli vždy totéž a správně. Předpokládejme, že dokonalá komunikace ale není možné a že přenos informace je zprostředkován následujícím přístrojem. Jakmile je stav světa odhalen prvnímu hráči, jeho počítač zcela automaticky odešle email prvnímu hráči, pokud je stav světa b. Ve stavu světa a nic posláno není. Existuje malá pravděpodobnost e > 0, že odeslaná zpráva nebude doručena (ztratí se). Počítač druhého hráče, pokud zpráva dojde, odešle automaticky potvrzení prvnímu hráči. Ten opět pošle potvrzení zpět, pokud zprávu dostane. Každá zpráva má stejnou pravděpodobnost ztráty (e). Takto se vyměňují potvrzení až do okamžiku, kdy se zpráva ztratí. Pak se každý hráč dozví, kolik zpráv (původní zpráva + potvrzení u prvního hráče, počet potvrzení u druhého hráče) jeho počítač odeslal. Protože po přijetí zprávy se vždy další zpráva odešle, je to i počet přijatých zpráv. Zprávy se ztrácejí jedině na cestě mezi počítači, takže počet odeslaných zpráv počítačem jednoho hráče se liší od počtu zpráv přijatých druhých počítačem. Poté, co se hráči dozví počet zpráv odeslaných jeho počítačem, zvolí akci (A nebo B). Tato volba je současná. Všimněte si, že až do okamžiku volby akce, která následuje po ukončení komunikace, hráči nic nevolí - hraje příroda. Označme {( 1, q' > 1), oba hráči ví, jaký je stav světa. Nejsou si samozřejmě jistí, zda druhý hráč ví, že první hráč ví (a tak dále). p 1 —e 1 —e 1—e • ----------------------------------------3» • -------------------------------------------3» • -------------------------------------------3» • ---------------------------3» 1—p e e e (0,0) (1,0) ......................................... (1, 1) (2, 1) (M, M) (l,-£) (-£, 1) (0,0) (0,0) (1,-L) (-L,l) (M, M) Zásadní pro rozhodování hráčů v této poziční hře jsou očekávání. Například pokud druhý hráč nedostane žádnou zprávu, jaká je pravděpodobnost, že stav světa je a a tedy že žádná zpráva nebyla odeslána? Jaká je pravděpodobnost, že stav světa je 6 a zpráva byla odeslána z počítače prvního hráče, ale ztratila se po cestě? Toto očekávání přirozeně ovlivňuje to, co druhý hráč bude hrát. V pozičních hrách jsou očekávání založena na tom, jak hrají (všichni) hráči a také jak volí příroda. V této hře to je ale jen a jen příroda (náhoda), co určuje, s jakou pravděpodobností se daný hráč nachází v příslušné části informační množiny. Protože volba akcí obou hráčů je současná (obrázek toto zobrazuje jen nedokonale), klíčové očekávání je pro prvního hráče zda je stav světa 1 (q, q — 1) nebo (q, q). Pro druhého hráče to jsou možnosti (q, q), (q + 1, q). Tato očekávání jsou kompletně určena chováním přírody, tedy pravděpodobnostmi, se kterými je náhodně určen stav světa a doručení zpráv. Všimněte si, že všechny informační množiny jsou dosaženy, byť s velmi nízkou pravděpodobností. Pravděpodobnosti, že stav světa je ( 0 Z těchto pravděpodobností lze snadno odvodit očekávání v jednotlivých informačních množinách. Klíčový výsledek je, že existuje jediná Nashova rovnováha, a tou je zahrát A pro oba hráče a pro všechny stavy světa (tedy bez ohledu na to, kolik zpráv bylo posláno). Důkaz provedeme matematickou indukcí. Pokud je stav světa (0,0), pak je pro prvního hráče striktně dominantní hrát A. To znamená, že v každé Nashově rovnováze musí první hráč hrát A. Druhý hráč se rozhoduje v informační množině {(0, 0), (1,0)}. První hráč v případě, že stav světa je (0,0) hraje A. Pro druhého hráče musíme porovnat výnosy z jeho hry A a B. To samozřejmě obecně závisí na strategii prvního hráče ve stavu světa (1,0), ale lze snadno spočítat, že tentokrát tomu tak není. Druhý hráč vyhraje vždy více hraním A než hraním B. S pravděpodobností (1 —p)/[(í — p) +pe] nastane stav světa a, kdy první hráč hraje A. S pravděpodobností ep/[(l — p) + pe\ je stav světa (1,0). Kdyby první hráč zvolil A ve stavu světa (1,0), pak by oba vyhráli 0, kdyby první hráč zvolil B, by ve stavu světa (1,0) druhý hráč prohrál L, s pravděpodobností pe/[(l — p) +ř>e]-Vyhraje tedy j:;(1-p) +o, g:MM(1rp) +n p\ (l-p)+pe (l—p)+pe (l-p)+pe což je více než kdyby druhý hráč hrál B: A (-L)(í-p) | (-L)pe (-L)(í-p) | peM '(í-p)+pe {l-p)+pe' (í-p)+pe (1 - p) + pe' kde X : označuje případ, kdy první hráč hraje X při stavu světa (1,0).1 Porovnáním obou výrazů pro A : i B : vidíme, že výrazy v prvním řádku jsou větší a proto je výhodnější pro druhého hráče hrát A. Srovnání takto platí, protože 1— p > ^ > pe a, M < L. Takže bez ohledu na to, co hraje první hráč v informační množině {(1,0), (1,1)}, pro druhého hráče je optimální hrát A. Takto lze postupovat dále indukcí. Vyřešme ale nejprve ještě na ukázku rozhodnutí prvního hráče právě v informační množině {(1, 0), (1,1)}. Očekávání, že stav světa je (1, 0) pokud se hráč nachází v dané informační množině, je ^(l-e)0 1 pe(í -e)°+pe(í -e)1 > 2' Z předchozí části víme, že v takovém případě (při stavu světa (1,0)) druhý hráč hraje A. Kdyby první hráč hrál B, pak by získal nejvýše z(—L) + (1 — z)M, zatímco hrou A získá nejméně 0. Protože L > M a, z > ^,je lepší hrát A i pro prvního hráče v této informační množině. Analogicky lze postupovat pro druhého hráče v informační množině {(1,1), 2,1)}, pak pro prvního hráče v množině {(2,1), 2, 2)}. Příklad 1.0.1 (Lehký) Sami proveďte indukční krok, tj, ukažte, že pokud pro stavy světa (q,q'),q+ q' < 2ť je optimálni pro oba hráče A, pak je optimálni pro prvniho hráče volit A ve informačni množině příslušné stavu světa (ŕ,ŕ). Podobně pro druhého hráče. Argument je v podstatě identický poslednímu argumentu předcházejícímu tomuto příkladu. Jak vidíme, tak tímto postupem dokážeme, že v Nashově rovnováze musí každý hráč hrát A, bez ohledu na to, jak malá pravděpodobnost selhání e je. Některé klíčové předpoklady jsou pro tento výsledek potřeba. Zejména z > ^, ale také , zejména to, že hrát B je riskantní, i když stav světa je B, pokud tak nehraje i protihráč. Kdyby totiž — L byl trest pro hráče hrajícího špatnou akci (různou od stavu světa), tak by model nefungoval. Ovšem to neznamená, že taková situace nemůže reálně nastat. Na druhou stranu je samozřejmě obtížné představit si, že po shlédnutí vysokého čísla na obrazovce by někdo přesto zahrál A. Podobný rozpor mezi teoretickou predikcí a experimentálně pozorovatelnou zkušeností ale lze pozorovat i u dalších her—konečněkrat opakovaného Vězňova dilematu, hře ve které si hráči dělí určitou částku a první navrhuje rozdělení a druhý jej schvaluje (Ultimatum game). Výsledek je přesto jistě zajímavý, byť primárně z teoretického hlediska. 1 Zcela formálně, X je strategie prvního hráče v informační množině {(1,0), (1,1)}, protože první hráč neví, zda druhý hráč zprávu dostal a potvrzení se ztratilo, či zda se ztratila samotná zpráva. 2