Teorie her Monika Kroupová Obsah Teorie her Statické hry Hra v normálním tvaru Dominované strategie Nashova rovnováha Pravděpodobnostní rozšíření a Nashova věta Dynamické hry Zpětná indukce Opakované hry Modely duopolu a příklady aplikací v ekonomii Statické (strategické) hry s úplnou informací hráči (jednotlivci) se rozhodují ve stejný okamžik (např. kámen, nůžky, papír) hráči mají úplné informace, tzn. vědí, jaké mají ostatní strategie a výplaty statická hra se skládá z: množiny hráčů (seznam účastníků hry) množiny akcí (dostupných strategií) každého hráče výplatní funkce jednotlivých hráčů pro každou kombinaci strategií (výplata = užitek z výsledku hry) Definice Hra v normálním tvaru pro n hráčů je tvořena prostorem strategií jednotlivých hráčů S1, S2, . . . , Sn a výplatními funkcemi u1, u2, . . . , un, kde každé ui zobrazuje S1 × S2 × · · · × Sn do R. Takovou hru ozn. H = {S1, S2, . . . , Sn; u1, u2, . . . , un}. Vězňovo dilema Dva zločinci jsou obviněni ze spáchání závažného trestného činu. Odsouzeni, ale mohou být, pokud se alespoň jeden z nich přizná. Jestliže se přizná právě jeden z nich, bude osvobozen, zatímco druhý dostane 10 let vězení. Pokud se přiznají oba, dostanou oba 9 let vězení. Pokud se ani jeden nepřizná, půjdou každý na 1 rok do vězení pouze za drobnější přestupek. Za výplaty budeme brát roky strávené na svobodě v následujících 10 letech. 2P 2N 1P 1,1 10,0 1N 0,10 9,9 1P – 1. hráč se přizná, 1N – první hráč se nepřizná na 1. místě jsou výplaty prvního, na 2. výplaty druhého hráče Dominované strategie Striktně dominovaná strategie je strategie, která ve všech možných situacích dává horší výsledek („je vždy horší ), než jiná pevně daná strategie Definice Nechť H = {S1, S2, . . . , Sn; u1, u2, . . . , un} je hra v normálním tvaru. Nechť si a si jsou 2 různé strategie i-tého hráče. Řekneme, že strategie si je striktně dominovaná strategií si , jestliže pro každou kombinaci strategií ostatních hráčů je výplata i-tého hráče při strategii si menší než při strategii si , tedy ui (s1, . . . , si−1, si , si+1, . . . , sn) < ui (s1, . . . , si−1, si , si+1, . . . , sn) pro každou volbu s1, . . . , si−1, si+1, . . . , sn z množiny S1 × · · · × Si−1 × Si+1 × · · · × Sn. Redukce dominovaných strategií předpoklad racionality: oba hráči jsou racionální oba hráči vědí o druhém, že je racionální a vědí, že on to ví o nich racionální hráč nehraje striktně dominované strategie za předpokladu racionality, striktně dominované strategie ve statických hrách ignorujeme → postupně je eliminujeme (škrtáme) → hra se redukuje na jednodušší 2P 2N 1P 1,1 10,0 1N 0,10 9,9 Vězňovo dilema: strategie N je striktně dominovaná strategií P výsledek vězňova dilematu je (P,P) (přesto, že (N,N) dává oběma lepší výsledek) Redukce dominovaných strategií Příklad strategie 1. hráče: A,B strategie 2. hráče: C,D,E C D E A 2,1 2,3 1,2 B 1,4 1,2 3,1 → E je striktně dominovaná D (škrtneme E) C D A 2,1 2,3 B 1,4 1,2 → B je striktně dominovaná A (škrtneme B) C D A 2,1 2,3 → C je striktně dominovaná D (škrtneme C) Výsledek hry: první hraje A a druhý hraje D. Nashova rovnováha Nashova rovnováha nastává, pokud se nikomu nevyplatí odchýlit od jeho strategie při daných strategiích ostatních hráčů. (jinak: zafixuji strategie ostatních a ptám se, jestli si polepším, když se odchýlím od své strategie) Definice Nechť H = {S1, S2, . . . , Sn; u1, u2, . . . , un} je hra v normálním tvaru. Pak n-tice strategií s∗ 1 , s∗ 2 , . . . , s∗ n dává Nashovu rovnováhu, jestliže pro každého hráče je s∗ i nejlepší odpověď (příp. jednou z nejlepších odpovědí, pokud je jich více) na strategii určenou pro ostatních n − 1 hráčů s∗ 1 , . . . , s∗ i−1, s∗ i+1, . . . , s∗ n . Tedy ui (s∗ 1 , . . . , s∗ i−1, s∗ i , s∗ i+1, . . . , s∗ n ) ≥ ui (s∗ 1 , . . . , s∗ i−1, si , s∗ i+1, . . . , s∗ n ) pro každé si ∈ Si . Jinými slovy, si je řešením maximalizační úlohy max si ∈Si ui (s∗ 1 , . . . , s∗ i−1, si , s∗ i+1, . . . , s∗ n ) Využití Nashovy rovnováhy všechny hry nemají striktně dominované strategie → některé hry nemůžeme analyzovat redukcí striktně dominovaných strategií a musíme použít Nashovu rovnováhu Příklad Souboj pohlaví – dva hráči (1. muž,2. žena) se rozhodují, co budou odpoledne dělat, jestli půjdou na koncert (K), nebo na fotbal (F), raději by oba byli spolu než sami, muž preferuje F a žena K. 2K 2F 1K 2,3 0,0 1F 0,0 3,2 Postup hledání NR: pro každý řádek hledáme nejlepší odpověď ženy (2. hráče) a příslušnou výplatu podtrhneme, potom pro každý sloupec hledáme nejlepší odpověď muže (1. hráče) a výplatu opět podtrhneme. NR je ta kombinace, ve které jsou podtrženy obě výplaty. V našem případě (K,K) a (F,F) Vztah Nash. rovnováhy a redukce dominovaných strategií pokud redukce dominovaných strategií vede k jednoznačnému výsledku hry (s∗ 1 , s∗ 2 . . . , s∗ n ) → pak tato kombinace je jedinou Nashovou rovnováhou této hry Pravděpodobnostní rozšíření a Nashova věta Smíšené strategie hráči volí své akce podle určitého pstního rozdělení někdy se hráč snaží zabránit tomu, aby protivník byl schopen odhadnout jeho strategii, a proto volí strategii náhodně Definice Nechť H = {S1, S2, . . . , Sn; u1, u2, . . . , un} je hra v normálním tvaru, kde Si = (si1, . . . , sik). Pak smíšenou strategií i-tého hráče rozumíme pravděpodobnostní rozdělení na Si , pi = (pi1, . . . , pik), kde pij udává s jakou pravděpodobností bude i-tý hráč hrát j-tou strategii. Ryzí strategie můžeme zřejmě chápat jako speciální případ smíšených strategií, kde pravděpodobnostní funkce degeneruje a přiřazuje pravděpodobnost jedna této strategii a pravděpodobnost nula všem ostatním strategiím. Definice Uvažujme hru 2 hráčů a jejich strategie S1 = (s11, . . . , s1J) a S2 = (s21, . . . , s2K ). Jejich smíšené strategie jsou dány pravděpodobnostními rozděleními p1 = (p11, . . . , p1J) a p2 = (p21, . . . , p2K ). Pak očekávané výplaty hráčů při použití těchto strategií budou v1(p1, p2) = J j=1 p1j K i=1 p2i u1(s1j , s2i ) v2(p1, p2) = K i=1 p2i J i=1 p1j u2(s1j , s2i ). Pravděpodobnostní rozšíření a Nashova věta Nashova rovnováha ve smíšených hrách Uvažujme hru 2 hráčů v normálním tvaru H = {S1, S2, u1, u2}. Dvojice smíšených strategií (p∗ 1, p∗ 2) je Nashova rovnováha, jestliže platí v1(p∗ 1, p∗ 2) ≥ v1(p1, p∗ 2) pro ∀ smíšené strategie 1. hráče p1 v2(p∗ 1, p∗ 2) ≥ v2(p∗ 1, p2) pro ∀ smíšené strategie 2. hráče p2 . Analogicky pro více hráčů. Nashova věta Nechť H = {S1, S2, . . . , Sn; u1, u2, . . . , un} je hra v normálním tvaru pro konečný počet hráčů s konečným počtem strategií. Pak existuje alespoň jedna Nashova rovnováha v prostoru smíšených strategií. Nashova věta zaručuje existenci NR ve smíšených strategiích pro libovolně konečnou hru. Důkaz je založen na větách o pevném bodu. Hlava nebo orel Smíšené strategie - příklad oba zvolí to samé → vyhrává 1. hráč oba zvolí různě → vyhrává 2. hráč 2 Orel 2 Hlava 1 Orel 1, −1 −1, 1 1 Hlava −1, 1 1, −1 Hra nemá NR v čistých (ryzích) strategiích. Zkusíme ji najít ve smíšených strategiích. Hlava nebo orel Řešení příkladu 2 Orel (p) 2 Hlava (1 − p) 1 Orel (q) 1, −1 −1, 1 1 Hlava(1 − q) −1, 1 1, −1 „užitek z orla = užitek z hlavy pro oba hráče u1(O) = u1(H) 1 · p + (−1) · (1 − p) = −1 · p + 1 · (1 − p) → p = 1 2 u2(O) = u2(H) −1 · q + 1 · (1 − q) = 1 · q + (−1) · (1 − q) → q = 1 2 NR (p∗, q∗) = 1 2, 1 2 , tzn. oba volí orla s pstí 0,5 a hlava s pstí 0,5 Dynamické (extenzivní) hry s úplnou informací hráči se rozhodují jeden po druhém (např. piškvorky) hru je lepší zapsat v extenzivním tvaru místo normálního tvaru, v normálním tvaru se zadávají celkové strategie hráčů, v extenzivním tvaru se zadávají jednotlivé tahy hra se skládá: seznam hráčů kdy je kdo na tahu, možnosti hráče na tahu, informace hráče na tahu výplata každého hráče při všech možných kombinacích tahů, které mohli hráči zvolit extenzivní hru většinou znázorňujeme pomocí herního stromu hlavní metoda řešení – zpětná indukce je nutné určit i akce v iracionálních situacích Dynamické (extenzivní) hry s úplnou informací Strategie hráče je úplný plán jeho akcí, který určuje, kterou z možných akcí hráč zvolí v každé situaci, která může ve hře nastat a v níž je tento hráč na tahu. Informační množina = soubor rozhodovacích bodů s následujícími vlastnostmi: 1. hráč je na tahu v každém bodě dané informační množiny 2. když se hra dostane do některého bodu informační množiny, hráč neví, ve kterém jejím bodě se hra nachází. Podhra = hra, která začíná v rozhodovacím bodu B, který má následující vlastnosti. Je jednoprvkovou informační množinou, obsahuje všechny rozhodovací body, které v herním schématu následují za B, a nerozděluje žádnou informační množinu. Každou podhru tedy můžeme analyzovat jako samostatnou hru. Dynamické (extenzivní) hry s úplnou informací extenzivní tvar (herní strom) Uzly – kdo je na tahu (kdo hraje) Hrany – akce normální tvar (C,E) (C,F) (D,E) (D,F) A 5,1 5,1 1,2 1,2 B 2,1 0,0 2,1 0,0 Zpětná indukce Hru v extenzivním tvaru neřešíme běžným způsobem od počátku stromu (kořene) ke koncovým uzlům, ale naopak. Vycházíme z koncového uzlu a snažíme se najít optimální řešení podhry. Když jej nalezneme, stává se koncovým uzlem toto řešení a přecházíme do další podhry, kde porovnáváme toto řešení s dalšími koncovými uzly. Tímto způsobem projdeme všechny podhry, nalezneme jejich nejlepší řešení a postupně se dostaneme až k výchozímu uzlu – kořenu stromu. Tím nalezneme řešení celé hry. Vycházíme z předpokladu, že racionální hráč volí při svém rozhodování pro něj nejlepší možnou strategii. Při hledání optimálního řešení podhry hledáme tzv. dokonalou rovnováhu podhry pro všechny rozhodovací situace. Výsledek nalezený pomocí zpětné indukce je dokonalá Nashova rovnováha vzhledem k podhrám. Definice Nashova rovnováha je dokonalá (perfektní) vzhledem k podhrám, jestliže strategie hráčů dávají Nashovu rovnováhu v každé podhře. Zpětná indukce hru rozdělíme na podhry a postupujeme od konce, tzn. nejdříve řešíme, co bude hrát hráč 2 a potom hráč 1 1 pokud 1 hraje A, pak 2 hraje D (dostane lepší výplatu než z C) pokud 1 hraje B, pak 2 hraje E (dostane lepší výplatu než z F) 2 1 hraje B, protože ví, že 2 zahraje E (má výplatu 2), kdyby 1 hrál A, 2 by hrál D a 1 by měl výplatu 1, tzn. horší Výsledek hry: (B,(D,E)) → dokonalá NR vzhledem k podhrám Normální tvar a hledání NR (C,E) (C,F) (D,E) (D,F) A 5,1 5,1 1,2 1,2 B 2,1 0,0 2,1 0,0 1 pokud 1 hraje A, nejlepší odpověď 2 je hrát (D,E) nebo (D,F) 2 pokud 1 hraje B, nejlepší odpověď 2 je hrát (C,E) nebo (D,E) 3 pokud 2 hraje (C,E), nejlepší odpověď 1 je hrát A 4 pokud 2 hraje (C,F), nejlepší odpověď 1 je hrát A 5 pokud 2 hraje (D,E), nejlepší odpověď 1 je hrát B 6 pokud 2 hraje (D,F), nejlepší odpověď 1 je hrát A Výsledek hry: (B,(D,E)),(A,(D,F))→ 2 (klasické) NR Opakované hry 1 základní hra se opakuje konečně nebo nekonečně mnohokrát 1) Konečně opakované hry Definice Nechť je daná základní statická hra H. Pak H(T) bude označovat hru, ve které se základní hra hraje T-krát. Přitom hráči pozorují výsledky všech předchozích her před tím, než začne další hra. Výplaty v opakované hře jsou součtem výplat v jednotlivých kolech základní hry. Věta Pokud základní hra má jedinou NR, pak opakovaná hra H(T) má jedinou rovnováhu perfektní vzhledem k podhrám. Tou je opakování NR v každém kole hry. 2-krát opakované vězňovo dilema Konečně opakované hry řešíme od zadu (zpětná indukce) ve 2. hře hledáme NR → víme, že NR je (P,P) s výplatou (1,1) 2P 2N 1P 1,1 10,0 1N 0,10 9,9 v 1. hře - ke každému prvku přičteme výsledek druhé hry (tzn. +1 pro oba hráče) a hledáme NR 2P 2N 1P 2,2 11,1 1N 1,11 10,10 → NR je opět (P,P) Diskontování výplat Konečně i nekonečně opakované hry při celkové výplatě jednotlivých hráčů ze všech her obvykle diskontujeme výplaty diskontním faktorem δ ∈ 0, 1 , protože hráči preferují výplatu v současnosti před stejně velkou výplatou v budoucnosti důvody: časová hodnota peněz (pokud jsou výplaty v penězích, δ představuje bezrizikovou úrok. míru) pst, že hra bude v následujícím kole ukončena (př. smrt hráče) psychologická netrpělivost hráčů označme pi příjem (výplata) z i-té hry, potom současná hodnota příjmu ze všech her je pro konečně opakované hry: PV (p, δ) = p1 + δp2 + · · · + δT pT = T t=1 δt−1 pt pro nekonečně opakované hry: PV (p, δ) = p1 + δp2 + · · · + δt pt + · · · = ∞ t=1 δt−1 pt 2) Nekonečně opakované hry používáme průměrnou hodnotu výplat → (1 − δ) · PV (p, δ) – pokud jsou výplaty shodné a všechny rovny p, pak je průměrná hodnota přímo rovna výplatě z jedné základní hry. (1 − δ) · PV (p, δ) = (1 − δ) · ∞ t=1 δt−1 p = (1 − δ) · p 1 − δ = p Strategie v nekonečně opakovaných hrách 1 Grim trigger strategie (spouštěcí strategie) – „neodpouštět 2 Tit for tat strategie – „zub za zub „udělej to, co udělal hráč v předchozím období Grim trigger strategie Vězňovo dilema hráči v prvním kole spolupracují (tzn. hrají N – nepřiznají se) hráč spolupracuje tak dlouho, dokud ho druhý nepodrazí po podražení už nikdy nespolupracuje (tzn. hraje do nekonečna P – přiznat se) pro jaké δ mají motivaci hráči spolupracovat? Kdy se jim vyplatí zradit? 2P 2N 1P 1,1 10,0 1N 0,10 9,9 Grim trigger strategie Vězňovo dilema výplata, když oba celou dobu spolupracují 9 + 9δ + 9δ2 + · · · = 9 1 − δ výplata (druhého hráče), když druhý zradí hned v prvním kole 10 + 1δ + 1δ2 + · · · = 10 + δ 1 − δ spolupráce bude optimální (NR) při této strategii, pokud: 9 1 − δ ≥ 10 + δ 1 − δ tzn. hráči se vyplatí spolupracovat pokud δ ≥ 1 9 Modely duopolu 1 Cournotův duopol 2 Bertrandův duopol budeme modelovat situaci, kdy na trhu jsou dvě firmy (→ duopol), pokud bychom uvažovali 1 firmu → monopol n firem → oligopol n → ∞ firem → dok. konkurence Cournotův duopol dvě firmy vyrábí stejný výrobek firmy se rozhodují současně, jaké množství vyrobí (q1 a q2) → prostor strategií hráčů je tvořen vyráběným množstvím firmy prodávají za stejnou cenu, která je dána průsečíkem poptávky a celkové tržní nabídky předpokládáme lineární poptávku P(Q) = α − Q, kde Q = q1 + q2 (pro Q ≥ α je P(Q) = 0) mezní náklady c jsou konstantní → nákladová funkce Ci (qi ) = cqi zisky firem jsou π1 a π2 (zisk=tržby-náklady) π1(q1, q2) = q1 · (α − q1 − q2) − cq1 π2(q1, q2) = q2 · (α − q1 − q2) − cq2 řešíme maximalizační úlohy (z definice NR) max 0≤q1<∞ π1(q1, q∗ 2) a max 0≤q2<∞ π2(q∗ 1, q2) Cournotův duopol jinak řečeno firmy chtějí maximalizovat zisk ∂π1(q1, q∗ 2) ∂q1 = α − 2q1 − q∗ 2 − c = 0 → q∗ 1 = 1 2 (α − c − q∗ 2) ∂π2(q∗ 1, q2) ∂q2 = α − 2q2 − q∗ 1 − c = 0 → q∗ 2 = 1 2 (α − c − q∗ 1) řešíme soustavu 2 rovnic o 2 neznámých q∗ 1 a q∗ 2: α − 2q∗ 1 − q∗ 2 − c = 0 α − 2q∗ 2 − q∗ 1 − c = 0 řešením je NR: q∗ 1 = q∗ 2 = α−c 3 celkové vyrobené množství: Q = q∗ 1 + q∗ 2 = 2 3(α − c) cena: P(Q) = α − Q = 1 3(α + 2c) zisky: π1 = π2 = α−c 3 · (α − α−c 3 − α−c 3 ) − c α−c 3 = (α−c)2 9 Bertrandův duopol firmy vyrábějí podobné, ne úplně stejné výrobky firmy určují cenu p1 a p2 → prostor strategií je tvořen možnými cenami výrobků poptávková funkce je funkcí cen q1(p1, p2) = α − p1 + b · p2 q2(p1, p2) = α − p2 + b · p1 kde b > 0 je míra s jakou je výrobek firmy 1 náhražkou za výrobek firmy 2 zisky firem (tržby-náklady) π1(p1, p2) = q1(p1, p2) · p1 − cq1(p1, p2) π1(p1, p2) = (α − p1 + bp2) · p1 − c(α − p1 + bp2) π2(p1, p2) = q2(p1, p2) · p2 − cq2(p1, p2) π2(p1, p2) = (α − p2 + bp1) · p2 − c(α − p2 + bp1) Bertrandův duopol firmy chtějí maximalizovat zisk ∂π1(p1, p∗ 2) ∂p1 = α − 2p1 + bp∗ 2 + c = 0 → p∗ 1 = 1 2 (α + bp∗ 2 + c) ∂π2(p∗ 1, p2) ∂p2 = α − 2p2 + bp∗ 1 + c = 0 → p∗ 2 = 1 2 (α + bp∗ 1 + c) řešíme soustavu 2 rovnic o 2 neznámých p1 a p2: α − 2p∗ 1 + bp∗ 2 + c = 0 α − 2p∗ 2 + bp∗ 1 + c = 0 řešením je NR: p∗ 1 = p∗ 2 = α+c 2−b smysl jen pro b < 2 (jinak p < 0) čím bližší substituty jsou výrobky (↑ b), tím poroste jejich cena rovnovážné množství je q∗ 1 = q∗ 2 = α+c(b−1) 2−b Příklady aplikací v ekonomii 1 Problém volební kampaně 2 Kupování hlasů 3 Vstup do monopolního odvětví 4 Teorie obecní pastviny Problém volební kampaně zvolení ideální kampaně vedoucí k vítězství ve volbách strana vybírá, kam se zařadí na pravolevém politickém spektru a jejím cílem je přilákat více voličů než 2. strana a vyhrát tak volby (x = 0 je levice a x = 1 je pravice ) x1 . . . pozice 1. strany, x2 . . . pozice 2. strany, kandidáti nezávisle na sobě zvolí kampaň xi ∈ [0, 1] volič zvolí tu stranu, která je nejblíž jeho preferencím volby vyhraje ten, kdo má nejvíc hlasů (v případě remízy je vítěz vybrán náhodně) předp., že kandidátům jde jen o vítězství (nerespektují vlastní přesvědčení) NR budeme hledat pomocí optimálních odpovědí Problém volební kampaně Jak bude reagovat 1 na pozici strany 2? Pokud: x2 < 1 2, pak kandidát 1 zvolí x2 < x1 < 1 − x2, aby získal nadpoloviční většinu hlasů a vyhrál tak volby x2 = 1 2, pak kandidát 1 zvolí x1 = 1 2, bude to remíza a tedy má 50 % šanci na vítězství x2 > 1 2, pak kandidát 1 zvolí 1 − x2 < x1 < x2, aby získal nadpoloviční většinu hlasů a vyhrál tak volby stejně bude uvažovat i 2. kandidát (dostaneme to samé jen s opačnými indexy) a průnikem nejlepších odpovědí bude NR → (x1, x2) = 1 2, 1 2 Kupování hlasů 2 lobbistické skupiny (X, Y ) uplácí k zákonodárců (k je liché) každá skupina lobuje za jiný protichůdný zákon a může dát každému z k zákonodárců určitou částku (xi a yi ) každý zákonodárce volí návrh, za který dostal víc peněz ocenění skupiny X svého zákonu je Vx a pro Y je ocenění Vy hru budeme řešit jako extenzivní (první se rozhodne X a potom Y ) → zpětná indukce ozn. seznam plateb skupiny X zákonodárcům x = (x1, . . . , xk) seznam plateb skupiny Y zákonodárcům y = (y1, . . . , yk) zákon skupiny Y je přijat, pokud yi ≥ xi alespoň v 1 2(k + 1) zákonodárců užitková funkce skupiny X (skupina Y analogicky) ux (x, y) = Vx − (x1 + · · · + xn) pokud je přijat zákon X −(x1 + · · · + xn) pokud je přijat zákon Y Kupování hlasů Řešení - zpětná indukce postupujeme od konce, tzn. hledáme nejlepší odpověď skupiny Y na jakoukoliv strategii skupiny X většinu zákonodárců označíme jako µ → µ = 1 2(k + 1) mx bude součet µ nejmenších složek vektoru x → mx je nejmenší částka, kterou skupina X vyplatila nadpoloviční většině zákonodárcům aby sk. Y vyhrála, musí u µ zákonodárců vyrovnat částku, kterou dostali od sk.X (tzn. musí zaplatit celkově aspoň mx ) nejlepší odpověď Y : mx < Vy → vyrovná platbu sk. X u µ zákonodárců mx > Vy → neplatí nic mx = Vy → vyrovná platbu sk. X u µ zákonodárců, nebo neplatí nic Kupování hlasů Řešení - zpětná indukce sk. X chce dosáhnout toho, aby se sk. Y nevyplatilo zákonodárce přeplatit (tzn. mx ≥ Vy ) → musí každému zákonodárci zaplatit alespoň Vy µ sk. X zaplatí k · Vy µ jen pokud nakonec dostane kladnou výplatu, tzn. pokud Vx > k Vy µ optimální odpověď sk. X: x = (0, . . . , 0), pokud Vx < k Vy µ x = ( Vy µ , . . . , Vy µ ), pokud Vx > k Vy µ Vstup do monopolního odvětví máme odvětví, ve kterém je 1 firma (monopolista - 1) a druhá firma (vyzyvatel - 2) zvažuje vstup, který je spojen s náklady f pokud vyzyvatel nevstoupí, pak je jeho zisk 0 pokud vyzyvatel vstoupí, firmy se současně rozhodují o q1 a q2 (tzn. hrají Cournotův duopol) hru budeme řešit zpětnou indukcí 2 nevstup vstup 1 1,2 q1 q1 q2 π 1 = q1⋅P (q1) − cq1 π 1 = q1⋅P (q1, q2) − cq1 π 2 = q2⋅P (q1, q2) − cq2 − f Vstup do monopolního odvětví Řešení 1 Rovnováha podhry po VSTUP firmy se rozhodují o q1 a q2 → Cournotův duopol (řešili jsme dříve) → q1 = q2 = α−c 3 zisk monopolu π1 = (α−c)2 9 zisk vyzyvatele π2 = (α−c)2 9 − f 2 Rovnováha podhry po NEVSTUP monopol se rozhoduje, kolik vyrobí monopol chce maximalizovat zisk π1 = q1 · (α − q1) − cq1 ∂π ∂q1 = α − 2q1 − c = 0 → q1 = α−c 2 zisk monopolu π1 = α−c 2 · (α − α−c 2 ) − c α−c 2 = (α−c)2 4 3 Jak se rozhodne vyzyvatel na začátku? když vstoupí π2 = (α−c)2 9 − f , když ne tak π2 = 0 to bude záviset na f (chce mít kladný zisk) (α−c)2 9 > f – vstoupí a oba budou vyrábět α−c 3 (α−c)2 9 < f – nevstoupí a v odvětví bude jen 1 firma (α−c)2 9 = f – vstoupí nebo ne (obojí je dokonalá rovnováha vzhledem k podhrám) Tragédie obecní pastviny společný zdroj není vylučitelný (nemůžeme někomu zakázat ho využívat) je rivalitní (spotřeba jedním subjektem snižuje spotřebu jiného) je dostupný zdarma ponechání společného zdroje k volnému užívání povede k nadměrnému, neefektivnímu využívání může dojít k vyčerpání příklad pastevectví koz Tragédie obecní pastviny Pastevectví koz je n farmářů, kteří se nezávisle na sobě rozhodují, kolik koz ki budou chovat (celkový počet koz je pak K = k1 + · · · + kn) na společné pastvině → statická hra s úplnou informací náklady na nákup a chov kozy c nezávisí na počtu chovaných koz - jsou tedy konstantní (pastvina je zdarma, platíme jen za kozu při nákupu) hodnota h(K), kterou farmáři přinese 1 koza závisí na celkovém počtu koz a platí h (K) < 0 a h (K) < 0 → funkce h(K) je klesající a konkávní → s rostoucím počtem koz bude na každou kozu připadat méně trávy maximální počet, koz které by na daném pozemku dokázaly přežít je pak Kmax přičemž h(Kmax ) = 0 předp., že kozy jsou libovolně dělitelné → prostor strategií můžeme označit Si = [0; Kmax ) Tragédie obecní pastviny Pastevectví koz - soukromá rovnováha výplatní funkce i-tého farmáře ki h(k1 + · · · + kn) − cki každý farmář bude chtít svoji výplatní funkci maximalizovat max ki ki h(ki + k∗ −i ) − cki kde k∗ −i = k∗ 1 + · · · + k∗ i−1 + k∗ i−1 + · · · + k∗ n dostaneme tak soustavu n rovnic: h(ki + k∗ −i ) + ki h (ki + k∗ −i ) − c = 0 ki nahradíme k∗ i , rovnice sečteme a vydělíme n: h(K∗ ) + K∗ n h (K∗ ) − c = 0 vyřešením dostaneme K∗ = k∗ 1 + · · · + k∗ n , tzn. celkový počet koz v rovnovážné situaci Tragédie obecní pastviny Pastevectví koz - společenská rovnováha pokud budeme hledat společensky optimální počet koz K∗∗ (maximalizujeme celkový užitek) max K [Kh(K) − cK] dostaneme rovnici h(K∗∗ ) + K∗∗ h (K∗∗ ) − c = 0 Tragédie obecní pastviny Pastevectví koz - porovnání rovnováh z předpokladů h (K) < 0 a h (K) < 0 a porovnání rovnic h(K∗ ) + K∗ n h (K∗ ) − c = 0 h(K∗∗ ) + K∗∗ h (K∗∗ ) − c = 0 vyplývá, že K∗ > K∗∗ , tedy pokud budou na společné pastvině kozy chovány soukromými farmáři, pak bude pozemek využit nad společenské optimum. To je způsobeno tím, že každý sedlák bude zvyšovat počet koz tak dlouho, dokud přírůstek hodnoty jeho stáda zvýšením počtu koz o jednu se přesně vyrovná se ztrátou, která je způsobena snížením produkce všech jeho koz naopak u společenského optima je přírůstek produkce poměřován snížením produkce všech koz Literatura 1 STANĚK, Rostislav. Základy teorie her. ESF MU, 2013. 2 BIL, Jaroslav. Modely trhu v teorii her [online]. 2008 [cit. 2015-03-30]. Bakalářská práce. Masarykova univerzita, Přírodovědecká fakulta. Vedoucí práce Martin Kolář. Dostupné z: http://is.muni.cz/th/175203/prif_b. 3 výukový materiál od doc. Koláře (zájemcům pošlu na mail)