PREREKVIZITY KLASICKÉ TEORIE HER. ROZHODOVÁNÍ A UŽITEK. HRY VE STRATEGICKÉ A EXTENZIVNÍ FORMĚ Všechny blondýny a brunety v životě Johna Nashe POLb 1123 9.3. 2021 http://svprojectmanagement.com/wp-content/uploads/2011/11/game-theory-8.gif Seminární úkol ¨ ¨DEMOCRACY 3 ¨Úkoly laboratorní práce: Popište svou cestu hrou. Nakolik reálně zobrazuje Democracy 3 politický proces? Dají se v rámci hry uplatnit některé koncepty teorie her? Jaké? + speciální POL a BSS úkol. turn based strategy http://www.positech.co.uk/democracy3/_assets/images/content/s2.jpg Obsah přednášky ¨ ¨Co je teorie her ¨Racionalita v teorii her ¨Teorie užitku ¨Příklad rozhodovací situace ¨Reprezentace her: extenzivní a strategický model ¨ ¨ Teorie her ¨ ¨zabývá se zkoumáním toho, jak hráči volí v závislosti na akcích dalších hráčů své strategie, aby maximalizovali svůj užitek ¨ ¨analyzuje tyto situace „jakoby šlo o hry“ (mají pravidla, zisky a hráči se je snaží „vyhrát“) Koncept racionality ¨TH je jednou z oblastí sociálních věd, která používá koncept racionality. V sociálních vědách neexistuje jednotný koncept racionality a konsensus o podobě racionality neexistuje často ani uvnitř jednotlivých disciplín v sociálních věd. ¨ Základem konceptu racionality, který používá teorie her, je přesvědčení, že lidé mají cíle a že se tyto cíle snaží realizovat svými akcemi. Teorie her se věnuje otázce, jak je snaha jednotlivců o dosažení jejich cílů ovlivňována (podporována nebo narušována) akcemi druhých a pravidly celé hry. Základní charakteristiky konceptu racionality v TH ¨Aktéři mají cíle, jichž se snaží dosáhnout, morální hodnota těchto cílů není v rámci teorie her a teorie racionální volby nijak posuzována. ¨Existuje určitá svoboda volby mezi alternativami (akcemi). ¨Jednotlivci volí takové akce, u nichž se domnívají, že s jejich pomocí nejlépe dosáhnou své cíle. ¨Herní modely dobrovolně zjednodušují realitu a abstrahují z ní pouze herní elementy. Typické otázky teorie her ¨Co v TH znamená racionální výběr strategie? ¨Pokud hra slibuje všem hráčům zisk, je pro ně racionální spolupracovat nebo soutěžit? Co podporuje spolupráci? ¨Liší se nějak opakované a jednorázové interakce? ¨Mohou se při opakovaných interakcích ustavit „morální normy“? ¨Liší se v reálném světě nějak tyto normy od předpokladů teorie her? ¨ ¨ ¨Rozhodují se lidé „rádi“? ¨ ¨http://www.youtube.com/watch?v=NxCY3IHYjnU https://upload.wikimedia.org/wikipedia/en/7/70/Paradox_of_Choice_cover.jpg Jiný přístup: Bruce de Mesquita ¨Klíčové předpoklady teorie her: ¨ ¨„Dívat se na svět očima druhých“ ¨ ¨„Budoucnost může ovlivnit přítomnost“ ¨ ¨ Aktéři a důsledky ¨Rozhodnutí ústí do důsledků (výsledků) Aktéři mají ve věci důsledků své preference. ¨ ¨Př.: Nechť C je soubor všech důsledků. Preference jsou vyjádřeny vztahy mezi jednotlivými důsledky. Možné vztahy mezi důsledky Ci a Cj : ¨Ci RCj ( tzv. slabý preferenční vztah, důsledek Ci je minimálně tak dobrý jako Cj). ¨Ci ICj (každý z výsledků je stejně dobrý jako ten druhý, pro aktéra jsou stejně žádoucí, stav indiference) ¨Ci P Cj (Ci je lepší výsledek než Cj , silný preferenční vztah) . ¨ Předpokládá se, že sada preferencí mezi důsledky je kompletní (pro každou dvojici důsledku existuje některý z preferenčních vztahů) a tranzitivní (pokud je výsledek Ci stejně dobrý nebo lepší než výsledek Cj a výsledek Cj lepší nebo stejně dobrý jako Ck, pak výsledek Ci je lepší než výsledek Ck). ¨Bez kompletní sady preferencí nejsou aktéři schopní racionálně volit mezi výsledky. Obvykle proto modely zahrnuje takové sady důsledků, které jsou vzájemně srovnatelné (výhoda toho, že při modelování lze důsledky volit). ¨Koncept racionality, používaný v teorii her, předpokládá, že preference aktérů ohledně konečných výsledků se v průběhu zkoumání daného rozhodnutí nemění. Výsledek je závěrečným stavem učiněného rozhodnutí. V průběhu analyzovaných situací se ovšem mohou měnit preference aktérů ohledně akcí (jednání, strategií), vedoucích ke konečnému výsledku. Racionalita aktérů v TH ¨Racionální chování je orientováno na dosahování cílů, aktéři se snaží dosáhnout spíše lepších výsledků než horších. Cíle aktérů obvykle dedukujeme z jejich předchozího jednání nebo experimentálním způsobem. Cíle aktérů jsou formalizovaným způsobem reprezentovány pomocí důsledků (případně výsledků. consequences, outcomes). ¨Důsledek je možný závěrečný výsledek aktérovy akce, který v sobě obsahuje všechny pro něj relevantní efekty. Sada důsledků je vyčerpávající (exhaustive, obsahuje všechny možné důsledky) a zároveň exkluzivní (exclusive, dojde k jednomu a právě jednomu důsledku). Racionalita a rozhodovací situace ¨Každý rozhodovací problém má z formálního hlediska více elementů: ¨Sadu možných akcí, A, z nichž jednu a právě jednu lze v rámci rozhodnutí vybrat ¨Sadu možných stavů světa, S, z nichž jeden a právě jeden nastane (oblast mimo rozhodování aktéra). ¨Sadu výsledků či důsledků, C, s jedním výsledkem pro každou kombinaci akcí a stavů světa ¨Seřazení preferencí mezi možnými výsledky, P, které je kompletní, tranzitivní a pevné. ¨ ¨Aktéři většinou mají nepřesné a neúplné informace o S, nejsou proto schopni přesně určit C, musí odhadovat, která A vede k nejlepšímu C a brát v úvahu, že zpravidla každá z A může vést k žádoucím i nežádoucím C. Podobný rozbor situace vyžaduje úvahu o pravděpodobnosti jednotlivých S a často i podrobnější škálu P než pouze ordinální. ¨ [Coke] Příklad rozhodovací situace: Nápojový automat ¨ Elementy rozhodovací situace ¨A= 3 tlačítka ¨P= Cola P Cola Light P Sprite ¨S=? ¨C= Cola nebo Cola Light nebo Sprite Možné řešení situace (závisí na tom, jaké jsou vstupní parametry modelu) ¨u (Cola) = 1 u(Cola Light)= 0.4 u (Sprite)= 0 ¨4 možné S: ¨p (C, CL, C) = 0.15 ¨p (C, CL, S) = 0.30 ¨p (S, CL, C) = 0.2 ¨p (S, CL, S) = 0.35 ¨Očekávaný užitek ze stisknutí každého ze tří tlačítek= ? (řešení C= 0.45, CL=0.4, S= 0.35) Příklad aplikace teorie užitku na politiku: Rozhodnutí volit ¨Jednotlivec se rozhoduje, zda volit a pokud ano, kterého ze dvou kandidátů (C1, C2) zvolit. Volič preferuje C1 před C2, jeho čistý zisk z volby je C1 je B a z volby C2 je 0. Akt volby znamená pro voliče náklady C, které jsou nenulové. Volba kandidáta C1 zvyšuje jeho šanci na vítězství, oproti možnostem zdržení se hlasování či volby kandidáta C2. Paradox voleb ¨Volba kandidáta C1 je vždy lepší než volba kandidáta C2, je ale otázkou, za jakých podmínek by měl volič volit a ne se zdržet hlasování. ¨Volení by mělo být preferováno v případě, kdy: ¨u (volby C1) > u (zdržení se hlasování) ¨neboli ¨p (C1 vyhraje při volbě C1)- (C1 vyhraje při zdržení se hlasování)] B > C ¨Náklady volby jsou nenulové, rozdíl mezi volbou a zdržením se hlasování je velmi malý (v ČR v parlamentních volbách cca 0,0000003), i pokud je B poměrně velký, zdá se, že C jsou větší. ¨Nejrůznější vysvětlení Jistota, nejistota a risk ¨Jistota, nejistota a risk ¨Pravděpodobnosti S vyjadřují přesvědčení aktéra o tom, jaké akce povedou k jakým výsledkům. Tato přesvědčení vycházejí z informací aktérů o S. Rozhodování je možné činit za tří odlišných podmínek: ¨jistota- S je znám před rozhodnutím, akce, jejíž důsledek je nejvíce žádoucí, je vybrána. ¨risk- je známa pravděpodobnost každého z S, který může nastat (může přesně být vypočítána, př. ruleta) ¨nejistota- pravděpodobnosti každého z S, který může nastat, nejsou známy nebo nejsou relevantní z hlediska dlouhodobé tendence. ¨Většina rozhodnutí probíhá v podmínkách nejistoty, aktéři ovšem disponují předběžnými informacemi, které jim umožňují vytvářet si představy o tom, jaké výsledky lze předpokládat (subjektivní pravděpodobnosti). Co hraje roli v rozhodování různých aktérů ve stejné situaci? ¨ 1. typy preferencí vzhledem k risku: ¨Odmítání risku- preference her s menším rozpětím výsledků. ¨Neutrální- oceňování her čistě na základu výsledků těchto loterií. ¨Přijímání risku- preference her s větším rozpětím výsledků. ¨ ¨ ¨2) v preferencích v delším časovém období- aktéři často preferují v případech, kdy se rozhodovací situace opakují v pravidelných intervalech, žádoucí výsledky dříve. (discount factor δ) ¨ ¨Oběma tématy se více zabývá behaviorální než klasická TH! Loterie ¨Rozhodnutí, které z možností zvolit, je spojen s konceptem loterií (lotteries, gambles). ¨Loterie reprezentují akce prostřednictvím pravděpodobností zisku určité „ceny“ (např. u původní verze „Nápojového automatu“ hraje zmáčknutím tlačítka Cola hráč loterii „0.45Cola, 0.55Sprite“- celkový součet pravděpodobností loterie je vždy 1) ¨Loterie mohou být jednoduché (pokud obsahují jen ceny) a složené, pokud mezi výsledky obsahují i další loterie. Např. u „Nápojového automatu“ hraje hráč, který bezpodmínečně potřebuje coke, stiskem tlačítka s Colou loterii „0.45Cola, 0.55Nová loterie“). ¨ Výzvy klasické teorii her: Výběr mezi loteriemi: Allaisův příklad ¨Úkol: vyberte z následujících dvou párů loterií vždy tu, kterou budete hrát radši: ¨Loterie 1A: 1x1milion ¨Loterie 1B: 0.89x1milion, 0.01xnic,0.1x5mil ¨ ¨Loterie 2A: 0.89xnic, 0.11x1mil. ¨Loterie 2B: 0.90xnic, 0.1x5mil. ¨ Obě loterie je ale možné prezentovat i následovně ¨Loterie 1A: 0.89 x 1mil., 0.11 x 1 mil. ¨Loterie 1B: 0.89x1mil., 0.01xnic,0.1x5mil ¨ ¨Loterie 2A: 0.89xnic, 0.11x1mil. ¨Loterie 2B: 0.89xnic, 0.01xnic, 0.1x5mil. ¨ Podstata Allaisova paradoxu ¨Allaisův paradox (porušující tzv. axiom nezávislosti) naznačuje, že lidé se rozhodují inkonzistentně s teorií užitku zejména v případech, kdy jsou konfrontováni s kombinací vysoce pravděpodobných a vysoce nepravděpodobných událostí s „extrémními“ cenami. ¨Jiným problémem z hlediska teorie užitku jsou referenční body Volby 1 Volby2 Úkol (Morrow 47-48): na základě prognóz ekonomů vyberte o vývoji HDP, koho budete volit ve volbách 1 a 2 ¨ Volby 1 Svět Babiš Bartoš Ekonom 1 43.000 65.000 51.000 Ekonom 2 45.000 43.000 53.000 Volby 2 Svět Babiš Bartoš Ekonom 1 63.000 65.000 51.000 Ekonom 2 65.000 43.000 53.000 Referenční body a „mentalita hráčů“ ¨ ¨ ¨Referenční body se mohou měnit a tím měnit i mentalitu hráčů vzhledem k risku (v politice je často referenčním bodem status quo, který může být při masových volbách různě upravován prostřednictvím propagandy). Herní modely v extenzivní a strategické formě ¨Extenzivní formální model popisuje možnosti aktérů, pořadí výběru těchto možností, jejich důsledky, způsob, kterým oceňují možnosti výběru a informace, které mají v jednotlivých krocích rozhodování k dispozici. ¨Strategický formální model se vyznačuje tím, že zavádí do analýzy strategie hráčů (kompletní plán, jak postupovat v jednotlivých situacích). Ve strategickém modelu volí hráči svá rozhodnutí simultánně. Výsledek je určen interakcí těchto strategií. Image:Cubacrisis 17 Oct 1962.jpg Příklad formálního modelování: Karibská krize (kubánská raketová krize, říjnová krize) ¨Obvykle tři centrální otázky: 1. Proč se SSSR snažil na Kubě rozmístit útočné jaderné zbraně? 2. Proč se USA rozhodly reagovat na rozmisťování raket blokádou Kuby? Proč SSSR ustoupil a rakety stáhnul? ¨ Formální model teorie her se snaží zachytit základní momenty situace, definuje krizi jako souboj mezi dvěma aktéry, „vyzyvatelem“ (challenger) a „obráncem“ (defender). Snaží se zjistit, proč vyzyvatel narušuje status quo, proč obránce reaguje na výzvu hrozbou (tyto dva kroky tvoří nezbytnou součást každé mezinárodní krize). Následně analyzuje, proč jedna ze stran ustoupí a/nebo proč dojde k válce. Karibská krize (popis hry) ¨SSSR (vyzyvatel) provádí první akci s cílem maximalizovat svůj užitek- rozhoduje se rozmístit na Kubě jaderné rakety, vůči tomuto rozhodnutí existují alternativy (např. rozmístit tyto rakety jinde nebo nerozmístit vůbec), jejichž základní dělení spočívá v rozhodnutí, zda zachovat či porušit status quo („challenge“ or „not challenge“). „Not challenge“ nenarušuje stávající situaci a znamená konec jedné větve modelu, „challenge“ přenáší rozhodnutí na obránce, který musí přijmout rozhodnutí vzhledem k prvnímu tahu vyzyvatele. Základem je, zda se tomuto tahu snažit odolávat („resist“) nebo neodolávat („not resist“). V případě, že se obránce rozhodne tahu vyzyvatele nebránit, znamená to, že akce vyzyvatele končí úspěchem, neboť donutila obránce k ústupkům (concessions). V případě, že se obránce (USA) rozhodne bránit akci vyzyvatele, činí tak prostřednictvím hrozby (threat), která zároveň přesouvá rozhodování zpět k vyzyvateli. Vyzyvatel se musí rozhodnout, zda bude pokračovat v uskutečňování svého původního rozhodnutí (pravděpodobný výsledek- válka- war) nebo zda se stáhne (backing down). Celá herní situace má tedy 4 možné výsledky: status quo, ústupky obránce, stažení vyzyvatele a válku, mezi nimiž mají oba hráči- vyzyvatel i obránce- kompletní preference. Vyzyvatel má preference:C PSQ PBD , zatímco obránce BD PSQ PC, přičemž není jasné, jaké jsou preference obou aktérů ohledně války ¨ Extenzivní herní model ¨Strom, skládající se z uzlů a větví (uzly jsou buďto tahy nebo konec hry, větve je spojují) ¨Rozdělení tahů mezi hráče (a náhodu) ¨Pravděpodobnost tahů náhody ¨Vyznačení informačních sad ¨Označení zisků hráčů ¨Všechny tyto elementy tvoří společné znalosti (common knowledge) hráčů o hře. Všichni hráči je znají, vědí, že je znají i ostatní hráči a vědí, že ostatní hráči vědí, že oni je znají. Důležité je, že i nejistota může být takto reprodukována prostřednictvím hry. ¨Podle rozsahu společných znalostí se hry dělí na hry s úplnou informací (nejsou informační sady s více než jedním uzlem), kompletní informací (jsou přesně známy všechny zisky hráčů) a nekompletní informací (zisky některých hráčů jsou jejich privátní informací). ¨ Strategický herní model ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨https://www.youtube.com/watch?v=L_yo1KCg6Oo http://images.indianexpress.com/2015/06/johnnash_letter.jpg http://www.princeton.edu/main/images/news/2015/05/Marson.Nash__0_324.jpg John Nash: „if we all go for the blonde“ Hráč 2 Blondýna Brunety Hráč 1 Blondýna (0,0) (3,2) Brunety (2,3) (2,2) “If everyone competes for the blonde, we block each other and no one gets her. So then we all go for her friends. But they give us the cold shoulder, because no one likes to be second choice. Again, no winner. But what if none of us go for the blonde! We don’t get in each other’s way, we don’t insult the other girls. That’s the only way we win.” http://t2.gstatic.com/images?q=tbn:ANd9GcSMZqgNO6hVKLBWkWgRAx3Xw6pp89A2b-2WS8u3dFsSdsg3tmkWLMOhv2ly Sg https://plus.maths.org/content/if-we-all-go-blonde https://www.youtube.com/watch?v=L_yo1KCg6Oo