知识安排: 个体理性决策(已学习) 博弈的表示理论(在学习) 博弈的解的理论(solution)
博弈的表示理论 1、展开型(extensive form)——强调过程 组成:(1)博弈者-即博弈者的行动顺序 (2)自然的行为选择-由局部行动集作出行为选择 (3)信息集(信息完美,信息完全) (4)自然的行动-考虑到参与者赋予自然的先验概率 (5)Pay off function-即utinity function 流程:自然行动-结果-评价-Pay off function For example: 终节点- 结果-效用评价
贿赂 ————被告 不贿赂————70 0 原告 贿赂————0 70 不贿赂————被告 不贿赂 ————60 40 决策节点—自然选择 ,节点前的虚线代表被告不知道前面发生了什么,这是一种信息不完美
是一种,理论动态(按顺序行动),经验静态(行动者只做一次行为选择,相当于同时行动)的博弈。
2.策略性(strategic form)-对一个策略互动博弈的最基本描述(用符号G代替) G的组成: I :博弈者的集合——原告和被告 A i € I: 纯策略集合,行动集——原告的贿赂和不贿赂,被告的贿赂和不贿赂 F i € I: ×A i (i€I )→R:一个pay off function 建立 在所有Ai集合的笛卡尔积。此处的笛卡尔积是所有可能结果的配对。 (笛卡儿积即笛卡尔乘积是指在数学中,两个集合 X和Y的笛卡尓积(Cartesian product),又称直积 ,表示为X × Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对 的其中一个成员)
3.经验意义上的静态博弈——同时行动的博弈——games of simultaneous moves (1)首先,没有完全静态的博弈 (2)定义:只做一次行动,不知道对方行动,前不知后,后不知前,可以看作同时行动
原告 相当于 被告
(3)静态博弈一般是信息完全的
4.信息完美与信息完全 (1)从展开型看信息完美: 接上面例子:只要你行动的时候,对过去发生的事情都了解(被告知道了原告是否贿赂) (2)从经典博弈论看信息完全: 在经典博弈论中,假设参与者是理性而又智能的人(即了解信息多,明白整个博弈的表示,会有不完美的信息,但他知道他不懂的地方是哪里) 认为,博弈结构表示(比赛规则)是博弈者之间的commom konwledge,这就是信息完全的假设。所以在理论上,经典博弈论研究的都是信息完全。虽然有信息不完美,但是可以信息完全。 (3)经验意义上的信息不完全: 在G : I A F 中存在三种情况 I : 知人知面不知心。A:在给与不给朋友抄袭中,他选择了告诉老师。明枪暗箭。F:面对同样结果,对于对方的效用不了解。
(4)信息不完全导致了效u的信息不完全,对于不同的博弈者会有不同的类型。经验意义上的信息不完全会转化为理论上的信息不完美博弈。——日后深入学习(本人没有听懂)
5.策略间的两种关系: 知识准备: G: I ——A(行动集)——Si(策略集)(Si>A) : 其中 Si=Δ(Ai) 即 行动所有概率分布集,分为混合策略(mixed)和纯策略(pure)。
例如:在原告中:贿赂、不贿赂,找大官二叔,这就是一个混合策略,以正的概率使用两个或两个以上的行动,“0.1、0.5”——在博弈者的plan of action中,即一个人在具体的情况下,有一个可欲的行动集,在选择规则作用下,在可欲行动集中以一个概率选择某一行动。贿赂就是一种纯策略。 保持策略的模糊性、不确定性意味着混合策略。
(1)同一个博弈者的不同策略间的优超关系-dominance 符号引入:i 即 myself. Si Si'€Si,Si、Si'即同一个博弈者的不同策略 当Si dominates Si', 则∀S-i.€S-i. (-i除了i外的其他人,即对于对手的所有策略) Fi(Si.S-i)>Fi(Si'.S-i)(Si应付对手S-i所带来的支付函数) 混合策略: 举例:2/3贿赂+1/3不贿赂——S-i. 1/4贿赂+3/4不贿赂——Si. 则:2/3x1/4x30(贿赂,贿赂)+2/3x3/4x70(贿赂,不贿赂)+1/3x1/4x0(不贿赂,贿赂)+1/3x3/4x60(不贿赂,不贿赂) 加起来,就是原告应付被告所得到的期望效用
或者: =∑Si(am)xS-i(ak)xFi(amxak)——Si(am)即am出现的概率,S-i(ak)即ak出现的概率。 (am,ak)€(Ai,A-i) 以上,将期望效用 用函数建立在策略组合之下 所以:Si' dominated str——被优超或者劣次优超 如果这个对手的策略是一个无限多集合,那么这个定义可以简化为: Fi(Si.S-i)>Fi(Si'.S-i)
纯策略: 检验一个纯策略优超于另外一个纯策略,利用期望效用的函数的线性关系。
举例:论证贿赂优超于不贿赂 1.应对对方贿赂时,(贿赂,贿赂)>(不贿赂,贿赂) 应对对方不贿赂时,(贿赂,不贿赂)>(不贿赂,不贿赂) 2.对方采取混合策略,我方采取纯策略: 1/4(贿赂,贿赂)>1/4(不贿赂,贿赂) 3/4(贿赂,不贿赂)>3/4(不贿赂,不贿赂) 推广开来: 比较同一博弈者的不同策略 (贿赂,q贿赂+(1-q)不贿赂)>(1/2贿赂+1/2不贿赂,q贿赂+(1-q)不贿赂) 根本在于期望值的计算 注意:优超只定义在对手的行动组合上
劣策略: 以正的概率使用一个劣策略,这个混合策略是一个劣策略 举例:买饺子可能买到少盐或多盐的,我喜欢面条 我以1/2的概率买饺子(以正的概率使用一个劣策略),我以1/2的概率买面条,这是一个劣策略 举例:
中不会被上下超越,只是一个劣策略,中会被一个混合策略(1/2上,1/2下超过
F(中,左)=1 > F(1/2上,1/2下,左)=1/2x3+1/2x0=3/2,此时,用中应付左不如以1/2上和1/2下应付左好。 当数值改变,会发生不同后果。 占优策略-dominant stragedy 一个博弈者只有一个纯策略,这个纯策略优于所有行动纯策略,这就是一个占优策略。 例如:原告贿赂就是一个占优策略。 在此角度下看,个体理性决策 根据效用最大化,一个理性的博弈者,有劣策略,是不会使用劣策略的;有占优策略,他应该使用占优策略。 下集预告: 劣策略的删除 最优反应关系的纳什均衡 |
|
来自: 昵称55050614 > 《博弈论》