1 Teorie bezplatné komunikace (Cheap talk) V této kapitole se budeme zabývat situacemi, kdy jeden z hráčů má k dispozici určitou informaci, kterou může sdělit druhému hráči, který následně volí akci. Například prodejce může sdělit potenciálnímu zákazníkovy informaci o složení výrobu či jeho kvalitě. V situaci, kdy zákazník nemá možnost si danou informaci jinak ověřit, může takové informaci důvěřovat? Teorie bezplatné komunikace (Cheap talk) vycházející z článku V. Crawforda a J. Sobela (Econometrica, 1982) charakterizuje situace, ve kterých je alespoň částečná důvěra možná a tak dochází k efektivní komunikaci informací a kdy tomu tak není. Model předpokládá existenci dvou hráčů - odesílatel O a příjemce P. Odesílatel obdrží signál m, který je distribuován na intervalu [0, 1] podle funkce f(m). Užitkové funkce hráčů jsou US (y, m, b) a UR (y, m), kde y je akce zvolena hráčem P, opět z intervalu [0, 1], m je signál a b je parametr, který charakterizuje rozdílnost preferencí obou hráčů. Hráč O obdrží signál m (stav světa) a na jeho základě zvolí zprávu n z množiny N.1 Označme q(n|m) pravděpodobnost,2 že hráč O odešle zprávu poté, co obdržel signál m. Samozřejmě požadujeme, aby hráč O odeslal nějaký signál N q(n|m)dn = 1 Na základě zprávy n zvolí akci y(n). Hráč O maximalizující svoji užitkovou funkci volí zprávu n tak, aby hráč P zvolil akci, která mu bude vyhovovat. To znamená, že s pozitivní pravděpodobností jsou zvoleny zprávy, které řeší následující problém maxnN US (y(n), m, b) Hráč P na základě signálu n a strategie hráče O (tj. q(n|m)) odhaduje, jaký signál m pravděpodobně nastal pomocí Bayesova odhadu p(m|n) = q(n|m)f(m) 1 0 q(n|t)f(t)dt Na základě tohoto odhadu pak volí strategii y(n) tak, aby maximalizoval svůj užitek maxy 1 0 UR (y, m)p(m|n)dm. Tato struktura hry odpovídá tzv. racionálním očekáváním. To znamená, že hráč P tvoří očekávání o signálu m takovým způsobem, že v průměru tato očekávání odpovídají realitě. To v podstatě znamená, že hráč O jej nemůže systematicky podvádět a že hráč P interpretuje zprávy n korektním způsobem. Tento předpoklad je v ekonomii poměrně běžný, přesto se musíme zmínit o jeho omezeních. Pokud hráči hru hrají opakovaně a jsou schopni se učit z minulých chyb, lze očekávat konvergenci k racionálním očekáváním. Pokud však hru hrají krátce, mají omezené schopnosti učit se, pak jejich interpretace zpráv může být systematicky nekorektní a odesílatel může tohoto omezení příjemce využít k vlastnímu prospěchu. My se ale zabýváme složitějším a také zajímavějším problémem. Jak může odesílat manipulovat informace soupeři, který je racionální a měl dostatek příležitostí učit se? Jednoduchou úvahou lze odhalit, že pokud se preference odesílatele a příjemce liší, tak optimální strategie odesílatele vyžaduje, aby pro několik různých signálů byla zaslána stejná zpráva. Pokud by tomu totiž tak nebylo, tak by příjemce byl schopen ze zprávy jasně identifikovat signál a zvolit pro něj optimální akci y. To ale není, dle předpokladu, v zájmu odesílatele. Ukážeme, že optimální strategie odesílatele bude vyžadovat rozdělení (partition) signálů na několik skupin (intervalů) a zaslání stejné zprávy pro každý signál z daného intervalu. Tím příjemce není schopen přesně identifikovat signál, který odesílatel obdržel. Na druhou stranu ale dochází k (neúplnému) přenosu informace o signálů, což je lepší než přenos žádný. 1Předpokládáme, že množina N je dostatečně velká, například nespočetná. Jak dále ale uvidíme, ve skutečnosti bude stačit dostatečně velká, ale konečná, množina možných zpráv. 2Protože N je obecně nespočetná, q(|m) je hustota pravděpodobnosti. Mluvíme-li dále o pozitivní pravděpodobnosti, máme na mysli pozitivní hustotu q(n|m) > 0. 1 Aniž bychom zatím předpokládali konkrétní strukturu dělení množiny zpráv N, analyzujme vlastnosti strategií obou hráčů. Označme N množinu všech zpráv, které vedou příjemce P k akci y, tedy N = {n : y(n) = y}. Dále řekneme, že zpráva m indukuje akci y, jestliže pravděpodobnost akce y je po zaslání zprávy m pozitivní N q(n| m)dn > 0. Označme Y množinu všech akcí, které jsou indukovány nějakou zprávou. Pro odesílatele musí platit, že pokud m indukuje akci y, pak akce y musí být při signálu m nejlepší pro odesílatele, ze všech možných akcí z množiny Y . Pokud by tomu tak nebylo, tak by existovala zpráva indukující lepší akci a odesílatel by tento signál zvolil (v rovnováze). Tedy odesílatel nemá možnost výběru ze všech možných akcí, ale v rovnováze musí každému signálu odpovídat nejlepší akce z těch, co jsou v rovnováze používány s pozitivní pravděpodobností.3 Budeme dále předpokládat, že US 11 < 0. To znamená, že jakákoliv zpráva m může vyvolat nanejvýš dvě akce, neboť hodnota užitkové funkce US (y, m, b) může nabývat dané hodnoty pro nejvýše dvě různé hodnoty y. Dodatečný předpoklad Ui 12 > 0, i = R, S, který znamená, že hráči preferují vyšší akci (y) při vyšším signálu (m), ceteris paribus , nám umožňuje definovat yS (m, b) = arg max US (y, m, b) (1) yR (m) = arg max UR (y, m) (2) Lze ukázat, že obě takto definované funkce jsou spojité v m. Tyto funkce nám umožňují charakterizovat odlišnost preferencí. Pokud yS (m, b) = yR (m) pro všechna možná m, pak příjemce a odesílatel preferují každý jinou akci. Nyní ukážeme, že pokud tomu tak je, tak pak existuje minimální vzdálenost > 0 taková, že žádné dvě akce indukované v rovnováze nejsou blíže než . Lemma 1.0.1 Pokud yS (m, b) = yR (m) pro všechna m, pak existuje > 0 takové, že pro každé akce u, v indukované v rovnováze platí |u - v| > . Důsledkem tohoto tvrzení je, že množina indukovaných akcí je konečná. Důkaz 1.0.2 Nechť u, v jsou dvě akce indukované v rovnováze, a u < v bez újmy na obecnosti. Odesílatel musí pro určitý signál mu (slabě) preferovat akci u a pro nějaké mv akci v. Protože funkce US (u, , b)-US (v, , b) je spojitá a nabývá nekladných i nezáporných hodnot, musí existovat m [0, 1] takové, že US (u, m, b) = US (v, m, b). Protože US 11 < 0, US 12 > 0, maximum funkce US (, m, b) je mezi u, v a tedy u < yS ( m, b) < v. Dále je zřejmé, že v je striktně preferováno před u (pro odesílatele) pro m > m a tedy u není indukováno pro m > m. Podobně v není indukováno pro m < m. Pro příjemce pak musí platit, že u yR ( m) v, neboť UR 12 > 0. Protože yS (m, b) = yR (m) pro m [0, 1], tedy na kompaktní množině, existuje > 0 takové, že |yS (m, b)-yR (m)| . Protože yS ( m, b) a yR ( m) jsou od sebe vzdáleny alespoň , tak i u a v musí být vzdáleny alespoň . Konečně, z předpokladu, že UR 12 > 0, vyplývá, že množina všech akcí indukovaných v rovnováze je ohraničena yR (0) a yR (1). Z minimální vzdálenosti > 0 mezi prvky množiny indukovaných akcí vyplývá její konečnost. I když jsme ukázali, že pouze konečný počet akcí je indukován v rovnováze, není zatím jasné jakou formu budou mít signály zasílané odesílatelem. Protože budeme chtít ukázat, že v rovnováze dochází rozdělení na segmenty (partitioning), zavedeme následující označení. Hranice intervalu budeme značit ai(N), a0(N) = 0 a aN (N) = 1, kde N je počet intervalů, na které je interval [0, 1] rozdělen. Dále značíme a(N) = (a0, . . . , aN ). Definujme y(a, a) = arg max y a a UR (y, m)f(m)dm (3) 3Z formálního hlediska je nutné předpokládat, že pokud se příjemce setká se zprávou, která není součástí rovnováhy (tedy neexistuje m takové, aby q(n|m) > 0), stejně zvolí nějakou akci z množiny Y . Tento předpoklad je bez újmy na obecnosti. 2 if a < a and yR (a) if a = a. Tedy y označuje optimální akci příjemce, který ví, že signál m leží mezi a a a. Nyní jsme připraveni formulovat hlavní výsledek teorie, který říká, že rovnováha má formu rozdělení intervalu na segmenty a že existuje horní hranice na jemnost tohoto dělení, závisející na parametru b charakterizující rozdílnost preferencí hráčů. Věta 1.0.3 Nechť b je takové, že yS (m, b) = yR (m) pro všechna m. Pak existuje přirozené číslo N(b) 1 takové, že pro všechna 1 N N(b) existuje alespoň jedna rovnováha (equilibrium) (y(n), q(n|m)), kde q(n|m) je uniformě rozdělená na intervalu [ai , ai+1] pokud m [ai , ai+1]. Dále platí, že US (y(ai, ai+1), ai, b) - US (y(ai-1, ai), ai, b) = 0 (4) y(n) = y(ai, ai+1), , n (ai, ai+1) (5) a0 = 0, a1 = 1 (6) Důkaz 1.0.4 Nejprve si všimněte, že z definice (3) a z předpokladu UR 12 > 0 vyplývá, že y(a, a) je rostoucí v obou argumentech. Indukcí zkonstruujeme dělení splňující (4) a počáteční a koncovou podmínku. Označme ai zatím zkonstruované částečné dělení a0 < . . . < ai splňující (4). Protože US 11 < 0 a y() je monotóní, existuje nanejvýše jedno ai+1 > a splňující (4). Tuto konstrukci můžeme zopakovat pro každé i, i když příslušné ai+1 nemusí existovat. Označme proto K(a) = max{i : 0 < a < a2 < < ai 1, splňující 4} (7) Z lemmatu (1.0.1) víme, že vzdálenost každých dvou akcí je zdola ohraničená, a tedy i y(ai, ai+1)y(ai-1, ai) pro nějaké > 0. Proto i vzdálenost ai+2 a ai je zdola omezená kladným číslem a tedy K(a) musí být konečné, dobře definované číslo pro 0 < a 1. Dále platí, že existuje c > 0 takové, že K(a) < c pro všechna a (0, 1]. Označme a takovou hodnotu z intervalu (0, 1], která maximalizuje K(a) a položme N(b) = K(a. Toto konečné číslo ohraničuje jemnost dělení intervalu možných signálů. Nyní musíme ukázat, že skutečně pro každé přirozené číslo N, 1 N N(b) existuje příslušné dělení. Lze ukázat, že pokud poslední člen dělení příslušné danému a, tedy člen a K(a) K(a), je menší než 1, pak K(a) je spojitá. Pokud a K(a) K(a) = 1, pak K(a) je nespojitá a velikost nespojitosti je 1.4 Dále platí, že K(1) = 1 a tedy K() nabývá všech hodnot mezi 1 a N(b). Tímto jsme zkonstruovali požadovaná dělení pro všechna N, 1 N N(b). Nyní musíme ukázat, že odesílatel je indiferentní mezi všemi zprávami z intervalu (ai, ai+1, pokud sám obdrží signál m z tohoto intervalu a příjemce reaguje na zprávy podle funkce y(n). Aby tomu tak bylo, musí platit, že indukovaná akce danou zprávou, tj. y((ai, ai+1) musí maximalizovat užitek odesílatele (mezi všemi indukovanými akcemi) pro všechny možné signály z daného intervalu. Formálně US (y((ai, ai+1), m, b) = max j US (y(aj, aj+1), m, b), m [ai, ai+1] (8) Pro hraniční signál m = ai pozorování vyplývá z předpokladu US 11 < 0, (4) a faktu, že y((ai, ai+1) > y((ai-1, ai).5 Pro m (ai, ai+1) využijeme předpokladu US 12 < 0 a dostaneme US (y((ai, ai+1), m, b) - US (y((ak, ak+1), m, b) US (y((ai, ai+1), ai, b) - US (y((ak, ak+1), ai, b) 0, (9) US (y((ai, ai+1), m, b) - US (y((aj, aj+1), m, b) US (y((ai, ai+1), ai+1, b) - US (y((aj, aj+1), ai+1, b) 0, (10) kde 1 k i j N a m [ai, ai+1]. Dále je potřeba ukázat, že pro danou strategii odesilatele je příjemcovou chování optimální. Příjemce obdrží zprávu od odesílatele a na jejím základě aktualizuje očekávání o tom, jaký signál příjemce obdržel. Protože odesílatel volí zprávu rovnoměrně z intervalu [ai, ai+1], platí p(m|n) = q(n|m)f(m) ai+1 ai q(n|t)f(t)dt = f(m) ai+1 ai f(t)dt (11) 4Protože K(a) nabývá pouze přirozených čísel, je zřejmé, že velikost nespojitosti musí být alespoň 1. Protože ale a K(a) K(a)-1 < 1 když a K(a) K(a)-1 = 1, nespojitost nemůže ani být větší než 1. 5Předpoklad na užitkovou funkci implikuje, že funkce má jediné maximum a je konkávní. Pokud nabývá stejné funkční hodnoty ve dvou různých bodech, maximum funkce musí ležet mezi těmito body. 3 Podmíněný očekávaný užitek je tedy ai+1 ai UR (y, m)p(m|n)dm = ai+1 ai UR (y, m)f(m)dm ai+1 ai f(t)dt (12) Z definice (3) vyplývá, že takto definovaná akce y je nejlepší odpovědí (best response) na strategii odesílatele. Lze dokázat, že všechny rovnováhy v dané hře jsou ekonomicky ekvivalentní některé rovnováze z předcházející věty. Příklad 1.0.5 Předpokládejme, že užitkové funkce hráčů O a P mají následující podobu US (y, m, b) = -(y - (m + b))2 , UR (y, m) = -(y - m)2 (13) Dále nechť f(m) = 1. Předpokládejte, že odesílatel volí následující strategii. Rozděl interval [0, 1] na N 1 navazujících úseků,6 jejichž hranice označíme a0, . . . , aN . Pokud signál m náleží to intervalu [ai, ai+1], pak hráč O pošle signál i. Jaká je optimální strategie příjemce? Jakým způsobem je optimální pro hráče P rozdělit interval [0, 1]? Řešení 1.0.6 Nejprve ukážeme, že y(a, a) = (a + a)/2. Z definice y(x, y) = arg max y a a UR (y, m)f(m)dm = arg max y a a -(y - m)2 dm (14) = arg max y -y2 (a - a) + 2 a a ymdm - a a m2 dm = (15) = arg max y -y2 (a - a) + y(a2 - a2 ) , (16) vyplývá, že řešení je právě y(a, a) = (a + a)/2. K dalšímu kroku použijeme rovnici (4).Označíme-li dělení intervalu na signály [0 = a0, a1] (a1, a2] , pak tato rovnice říká, že odesílatel který obdrží signál a1 musí být indiferentní mezi tím, když první hráč zvolí akci příslušnou intervalu [0 = a0, a1], tedy y(a0, a1) a akci příslušnou intervalu [a1, a2]. Rovnice (4) a aN = 1 takto definuje příslušnou posloupnost dělení. V tomto konkrétním případě ai + ai+1 2 - (ai + b) 2 = ai + ai-1 2 - (ai + b) 2 To vede na diferenciální rovnici ai+1 = 2ai - ai-1 + 4b. K jejímu řešení použijeme charakteristickou rovnici homogenizované rovnice t2 - 2t + 1 = 0, která má jediný dvojnásobný kořen t = 1. Obecné řešení je a(i) = C + Di. Partikulární řešení odhadneme ve tvaru x(i) = Ei2 (lineární řešení by bylo shodné s obecným), kde dopočítáme E = b. Počáteční podmínka a0 = 0 upřesňuje C = 0. Z podmínky a(N) = 1 lze dopočítat i koeficient D. Je ale jednodušší tento koeficient neupřesňovat a vyjádřit obecné řešení pomocí a1. To je ve tvaru ai = a1i + 2i(i - 1)b, Abychom určili nejjemnější možné dělení, vezmeme nejmenší přirozené číslo i takové, aby 2i(i - 1)b < 1. Pak lze najít hodnotu a1 > 0 tak, aby aN = 1. Nejvyšší takové i označujeme N(b): N(b) = 1 2 + 1 2 1 + 2 b 1 2 , kde x označuje dolní celou část čísla x. Všimněte si, že jak N(b) roste s tím, jak b klesá k nule, maximální možná jemnost dělení roste. 6Formálně, [0, 1] = [a0, a1) [a1, a2) [aN-1, aN ] 4