Lenka Otipková Obsah  Úvod do teorie her  Statické hry  Nashova rovnováha  Cournotův model  Bertrnadův model  Smíšené strategie Teorie her  neboli Teorie interaktivního rozhodování  John von NEUMANN; Oskar MORGENSTERN. Theory of Games and Economic Behavior. (1944)  Teorie her = ekonomická vědní disciplína, která zkoumá široké spektrum rozhodovacích situací s větším počtem účastníků pomocí modelů. ZÁKLADNÍ POJMY HRA Rozhodovací situace, konflikt HRÁČ Účastník konfliktu STRATEGIE Konkrétní alternativa, kterou může hráč zvolit OPTIMÁLNÍ STRATEGIE Hráčem zvolená strategie, která je pro něj nejvýhodnější PROSTOR STRATEGIÍ Seznam všech možných alternativ, které jsou hráči dostupné VÝPLATNÍ FUNKCE Výsledek hry (užitek), výhra či zisk hráče v závislosti na zvolených strategiích  ANTAGONICKÝ KONFLIKT Dva inteligentní hráči a každý se rozhoduje tak, aby si zabezpečil co největší výhru, přičemž výhra jednoho účastníka jde na úkor druhého účastníka (např . vojenský konflikt)  NEANTAGONICKÝ KONFLIKT Minimálně dva účastníci, kteří volí rozhodnutí, které maximalizuje jejich výhru. Výhra jednoho nejde na úkor jiného. Rozlišují se dva případy: • kooperativní (koaliční) teorie = možnost závazných smluv hráčů • nekooperativní (strategické) teorie  Simultánní  Hráči se rozhodují zároveň  Sekvenční  Hráči se rozhodují v daném pořadí  Čistá strategie  Strategie, kterou si hráč volí s jistotou  Smíšená strategie  Pravděpodobnost rozdělení nad strategiemi hráče Výplatní funkce  Výsledek zvolené strategie  Užitek = stupeň uspokojení ze spotřeby /situace  Zachycuje individuální preference, které není možné mezi jednotlivci porovnávat a sčítat  Užitková funkce u popisuje hráčovu soustavu preferencí u(a) > u(b) jestliže preferuje a před b Statické hry s úplnou informací (hra v normálním tvaru)  Hráči se rozhodují ve stejný okamžik – neznají rozhodnutí soupeře (simultánní hra), ale znají výplatní funkce pro všechny možné kombinace rozhodnutí  Předpokládáme:  hráči jsou racionální (v každé situaci si vyberou tu nejlepší možnou strategii z množiny strategií podle svých preferencí)  hráči mají dokonalé informace (tj. znají všechny 3 množiny) Statické hry s úplnou informací (hra v normálním tvaru) II  Hra je určena třemi množinami:  Množina hráčů {1, 2, …, n}  Množina prostorů strategií {S1, S2, …, Sn}  Množina výplatních funkcí {u1(s1, ..., sn), u2(s1, ..., sn), …, un(s1, ..., sn)} Vězňovo dilema  Dva vězni podezřelí ze zločinu jsou zadrženi v cele. Policie má pár důkazů, ale chybí jim poslední důkaz pro usvědčení.  Jestliže budou oba shodně mlčet, dostanou 1 rok  Jestliže promluví pouze jeden, bude volný a druhý dostane 10 let  Jestliže promluví oba, dostanou po 5 letech Vězňovo dilema II  Každý z hráčů má jiné preference H1: u(P,M) > u(M,M) > u(P,P) > u(M,P) (3,2,1,0) H2: u(M,P) > u(M,M) > u(P,P) > u(P,M) HRÁČ 2 HRÁČ 1 Promluví Mlčí Promluví 1,1 (5,5) (10) 3,0 Mlčí 0,3 (10) 2,2 (1,1)  Optimální strategie: Strategie prvního hráče x0 X, ke které existuje optimální strategie druhého hráče y0 Y tak, že platí u1(x, y0) ≤ u1(x0, y0) u2(x0, y) ≤ u2(x0, y0) je optimální strategií. (Jiná pak snižuje výhru) – tyto strategie se nazývají rovnovážné.  Rovnovážná situace = ani jednomu hráči se nevyplatí změnit strategii.   Dominování  Předpoklady: racionalita hráčů, maximalizace zisku  V případě existence dvou strategií, ze kterých jedna je horší než druhá bez ohledu na to, co bude hrát protihráč si tuto strategii hráč nikdy nevybere. Pak hovoříme o dominované strategii.  Pokud jsou ŝi a s̃i dvě možné strategie i-tého hráče ve hře H = {S1, ..., Sn; u1, …, un}, potom strategie ŝi je striktně dominovaná strategií s̃i , pokud platí: ui(s1,…, si-1,ŝi,si+1, …, sn) < ui(s1,…, si-1,s̃i,si+1, …, sn)  Hráči jsou přesvědčeni, že nikdo z nich nezvolí dominovanou strategii  Dominované strategie ze hry odstraníme  Po odstranění některých strategií, se může stát, že se dominovanou stane strategie, která před tím dominovanou nebyla – ITEROVANÁ DOMINANCE  Postupným odstraněním dominovaných strategií můžeme získat jediný profil, který lze považovat za optimální, jelikož právě tento profil strategií budou hráči hrát. Nashova rovnováha  Jde o řešení, ve kterém platí, že pokud se některý z hráčů nebude držet optimální strategie, přičemž soupeři ano, jeho výplata se sníží.  Optimální strategii hráčů v konfliktní situaci najdeme pomocí Nashovy rovnováhy.  Máme hru v normálním tvaru H = {S1, …, Sn; u1, …, un} n-tice strategií (s̃1 ,…, s̃n ) tvoří Nashovu rovnováhu, jestliže pro každého hráče je s̃i nejlepší odpověď na strategie specifikované pro ostatní hráče s̃1 ,…, s̃i-1, s̃i+1 ,..., s̃n.  Tedy ui(s̃1, …, s̃i-1, s̃i, s̃i+1, …, s̃n) ≥ ui(s̃1, …, s̃i-1, si, s̃i+1, …, s̃n), pro každé si Si  Souvislost dominování a Nashovy rovnováhy  Pokud ve hře H = {S1, …, Sn; u1, ..., un} dostaneme postupnou eliminací dominovaných strategií strategie (s̃1, …, s̃n), potom jsou tyto strategie jedinou Nashovou rovnováhou.  Nashovy rovnováhy vždycky „přežijí“ eliminaci striktně dominovaných strategií. Cournotův model  Simultánní hra, ve které:  Hráči jsou firmy  Strategie = množství produkce  Výplatní funkce = snaha o maximalizaci zisku  Nashova (Cournotova) rovnováha – kombinace produkce firem, při které každá firma reaguje optimálně na produkci ostatních firem  Cournotova rovnováha – při množství produkce, které zvolí ostatní firmy, volí každá firma množství produkce, které maximalizuje její zisk Cournotův duopol  Máme 2 firmy, výplatní funkcí je maximalizace zisku a strategií je zvolené množství .  Celkové množství: q = q1 + q2  Tržní cena: P (q) = α – bq = α – b(q1 + q2)  Celkové náklady firmy: C1(q1) = cq1, C2(q2) = cq2  Zisk: π1 = q1( α – b(q1 + q2)) – cq1 π2 = q2( α – b(q1 + q2)) – cq2 Cournotův duopol II  Maximalizujeme zisk:  Množství první firmy  Množství druhé firmy 02 21 1 1    cbqbq q   b bqc q 2 2 1    b bqc q 2 1 2    Bertrandův model  Simultánní hra, ve které:  Hráči jsou firmy  Strategií je volba ceny  Preference jsou zisky  Nashova (Bertrandova ) rovnováha – kombinace cen firem, při které každá firma reaguje optimálně na ceny ostatních firem  Bertrandova rovnováha – při cenách produkce, které zvolily ostatní firmy, volí každá firma cenu produkce, která maximalizuje její zisk Bertrandův duopol  Máme 2 firmy, které vyrábějí identické produkty.  Mají stejné konstantní mezní náklady MC1 = MC2 = c  Množství závislé na zvolených cenách qi(pi,pj)= a – pi + bpj  Zisk πi(pi,pj) = qi(pi,pj)(pi-c) = (a – pi + bpj) (pi-c)  Maximalizujeme- li zisk dostaneme: pi = ½ (a + bpj +c) Řešením soustavy rovnic je p1 = p2 = (a + c)/(2 - b) Bertrandův duopol II  Zisk: πi(pi,pj) = qi(pi,pj)(pi-c)  Uvažujeme- li, že rovnovážná cena se rovná nákladům p1* = p2* = c  ṕ1 > c π1(ṕ1,c) = 0(ṕ1-c) = 0  ṗ1 < c π1(ṗ1,c) = q1(ṗ1)(ṗ1-c) < 0 Smíšené strategie  Některé hry nemají Nashovu rovnováhu (hlavně takové, kde se snažíme uhádnout strategii protihráče např. kámen, nůžky, papír). Smíšená strategie vyjadřuje nejistotu hráče o tom, jakou strategii zvolí soupeř.  Prostory strategií vyjadřují vektory pravděpodobností s jakou hráči zvolí jednotlivé strategie (jde tedy o pravděpodobnostní rozdělení jednotlivých strategií) Si = {pi; pi´= [pi1, pi2, …, pim], ∑pij= 1, 0 ≤ pij ≤ 1}, kde j = 1, …, m.  Smíšenou strategií pro 3 strategie je vektor pravděpodobností (q, r, 1-q-r), kde q je pst první strategie, r pst druhé a 1- q- r je pst třetí strategie.  Hodnota výplatní funkce udává očekávanou střední hodnotu výhry: u(s1,s2)= ∑ ∑ p1iaijp2j = pi´Apj Kámen, nůžky, papír  Antagonistická hra s nulovým součtem, kde 1 = výhra, 0 = remíza, -1 = prohra. 1. HRÁČ Kámen Nůžky Papír Kámen 0 1 -1 Nůžky -1 0 1 Papír 1 -1 0 2. HRÁČ Kámen Nůžky Papír Kámen 0 -1 1 Nůžky 1 0 -1 Papír -1 1 0 Nashova rovnováha ve smíšených strategiích  V normální hře je smíšená strategie (p̃1, p̃2) Nashovou rovnováhou, pokud je tato strategie nejlepší odpovědí na smíšené strategie ostatních hráčů, tj. platí: u1(p̃1, p̃2) ≥ u1(p1, p̃2) u2(p̃1, p̃2) ≥ u2(p̃1, p2) VĚTA: Každá maticová hra má Nashovu rovnováhu (ve smíšených strategiích). Smíšená strategie, která má pi=1 a ostatní pst jsou nulové, je čistou strategií pro statické hry. Děkuji za pozornost