Smíšené strategie Rostislav Staněk February 24, 2014 Motivace T H T 1,-1 -1,1 H -1,1 1,-1 Table: Hlava nebo orel Hra nemá Nashovu rovnováhu, pokud hráči mohou hrát deterministicky jednu akci. Co když jim dovolíme, aby hráli různé akce s různou pravděpodobností? Rostislav Staněk strategie Strategická hra se smíšenými strategiemi Smíšenou strategií hráče ve strategické hřeje pravděpodobnostní rozdělení nad množinou jeho akcí. Značíme jej a,, af(af) je pravděpodobnost jakou připisuje strategie hráče / akci a,-. Strategická hra s vNM preferencemi se skládá z • množiny hráčů • množiny akcí každého hráče • preferencí každého hráče definovaných nad množinou loterií složených z profilů akcí takových, že mohou být reprezentovaný očekávanou (střední) hodnotou Bernoulliho výplatní funkce Rostislav Staněk strategie von Neumann-Morgensternovi preference • Při smíšených strategiích nemusí být výsledkem hry jeden profil akcí, ale různé výsledky mohou nastat s různou pravděpodobností. Takovou situaci nazýváme loterie. • Předpokládáme, že hráči mají preference ohledně loterií (vNM preference) složených z výsledků hry. Jakým způsobem můžeme takové preference reprezentovat? • Pokud se hráči chovají konzistentně (nepodléhají Dutch book), pak můžeme jednotlivé deterministické výsledky reprezentovat takovou výplatní funkcí (Bernoulliho), že hráči hodnotí loterie podle očekávané výplaty Rostislav Staněk strategie von Neumann-Morgensternovi preference • Bernoulliho výplatní funkce nejsou zcela ordinální • Bernoulliho výplatní funkce u(a) a v(a) reprezentují stejné preference, pokud platí, že u(a) = a + (3v(a), Va < □ ► < si ► Rostislav Staněk Nashova rovnováha ve smíšených strategiích Profil smíšených strategií a* ve strategické hře s vNM preferencemi je Nashovou rovnováhou, pokud pro každou smíšenou strategii a, každého hráče / platí U;{a*) ^ U;(a;, «!_,■), kde U;{a) představuje očekávanou výplatu hráče i ze smíšeného profilu akcí a. Každá strategická hra s konečným počtem akcí má Nashovu rovnováhu ve smíšených strategiích. Jak ji ale najít? Rostislav Staněk strategie Nashova rovnováha ve smíšených strategiích: Optimální odpovědi ve hře hlava nebo orel 1 B2 Bi 1 Rostislav Staněk strategie Základní vlastnost smíšených strategií L(q) R(l-q) T(p) pq p(i - q) B(l-P) (i-p)g (í-p)(í-q) Table: Očekávanou výplatu hráče 1 tak můžeme zapsat jako pqUl(T, L)+p(l-q)Ul(T, R)+q{l-p)u1{B, L)+(l-p)(l-q)Ul(B, R) = = p[qUl(T, L)+{l-q)u1{T, /?)] + (l-p)[<7í/i(fi, L)+{l-q)u1{B, R)] = = pE1(7,a2) + (l-p)E1(e,a2)) Rostislav Staněk strategie Základní vlastnost smíšených strategií Zobecnění: U j (a) = a;{aj)E;{aj,a^;) a* je Nashovou rovnováhou právě tehdy, když • očekávaná výplata každé akce, které připisuje strategie a* kladnou pravděpodobnost, je pří daných strategiích a*_i stejná • očekávaná výplata každé akce, které připisuje strategie a* nulovou pravděpodobnost, není pří daných strategiích a* (. vyšší než očekávaná výplata akce, které je připsána kladná pravděpodobnost. Rostislav Staněk strategie Vyškrtání Dominovaných akcí Ve strategické hře s vNM preferencemi hráčova strategie a, ostře dominuje jeho akci a'-, pokud pro všechny akce ostatních hráčů a_,-platí Uj{a-n a_f) > u,-(a'-, a_f). Akce a'- je ostře dominovaná. L R T 3,1 0,1 C 0,3 3,2 B 1,1 1,0 Table: Hlava nebo orel Rostislav Staněk strategie Nashova rovnováha ve smíšených strategiích: interpretace • Lidé se rozhodují náhodně. Proč? Ukázka • Zastoupení jednotlivých strategií v populaci (tzv. purifiacation) • Odrážejí faktory ovlivňující chování, které nejsou zahrnuty v modelu Rostislav Staněk strategie Ilustrace: Volání policie neboli Samaritán • Hráči: n lidí • Akce: a, = {volat,nevolat} • Preference: 0 nikdo nevolá, v — c já volám, v někdo jiný volá v > c Smíšená rovnováha: výplaty z akcí se musí rovnat, p značí pravděpodobnost s níž každý zavolá. Pravděpodobnost, že nikdo jiný nezavolá je (1 — p)"-1. v-c = (i-py^o + (i - (i -prV (i -p)"-1 = c- 1 Rostislav Staněk Ilustrace: Volání policie neboli Samaritán Každý člověk volá s pravděpodobností p = 1 — (^)" 1 ■ S rostoucím n se snižuje pravděpodobnost, že člověk zavolá. Jak se mění pravděpodobnost, že alespoň někdo zavolá. Prjnikdo nezavolá} = Pr{\ nezavolá}Pr{nikdo jiný nezavolá} c i c Prjnikdo nezavolá} = (—)" 1 — S rostoucím počtem, lidí klesá pravděpodobnost, že kdokoliv zavolá policii. Rostislav Staněk strategie Ilustrace: Expertní hra 7r...zisk experta při pravdivém reportu; ir1... prodá velkou opravu při existenci malé; r...pravděpodobnost existence velkého problému; E...platba za velkou opravu; /...platba za malou opravu; E',/'...stejná platba u druhého experta; platí E > l,E' > E,ľ > / Přijme velkou opravu(q) Odmítne velkou opravu(l-q) Pravda(p) Lež(l-p) 7T, — rE r?r + (l (1-r)/ (1 0, - />', —E Table: Expertní odhad - r)7T, -rE' - (1 ■rE' - (1 - r)ľ r)l Rostislav Staněk strategie Ilustrace: Expertní hra: rovnováha o Pokud E < rE' + (1 — r)ľ, pak je (Lži,Příjmy velkou opravu) Nashovou rovnováhou @ Pokud E > rE' + (1 — r)ľ pak je Nashovou rovnováhou (pw), kde p, E-(rE' + (l-r)ľ) ^ r(E - E') (l-r)(E-/') (l-r)(E-/') 7T Jak se mění chování se změnou r? - -OQ.O Rostislav Staněk