博弈论Lecture7

昵称55050614 2018-11-21

展开全文

知识安排：

个体理性决策（已学习）

博弈的表示理论（在学习）

博弈的解的理论（solution)

博弈的表示理论

1、展开型（extensive form)——强调过程

组成：（1）博弈者-即博弈者的行动顺序

（2）自然的行为选择-由局部行动集作出行为选择

（3）信息集（信息完美，信息完全）

（4）自然的行动-考虑到参与者赋予自然的先验概率

（5）Pay off function-即utinity function

流程：自然行动-结果-评价-Pay off function

For example:

终节点- 结果-效用评价

贿赂 ————被告

不贿赂————70 0

原告

贿赂————0 70

不贿赂————被告

不贿赂 ————60 40

决策节点—自然选择，节点前的虚线代表被告不知道前面发生了什么，这是一种信息不完美

		被告
		贿	不
原告	贿	30，10	70，0
	不	0，70	60，40

是一种，理论动态（按顺序行动），经验静态（行动者只做一次行为选择，相当于同时行动）的博弈。

2.策略性（strategic form）-对一个策略互动博弈的最基本描述（用符号G代替）

G的组成：

I :博弈者的集合——原告和被告

A i € I: 纯策略集合，行动集——原告的贿赂和不贿赂，被告的贿赂和不贿赂

F i € I: ×A i (i€I )→R：一个pay off function 建立在所有Ai集合的笛卡尔积。此处的笛卡尔积是所有可能结果的配对。

（笛卡儿积即笛卡尔乘积是指在数学中，两个集合 X和Y的笛卡尓积（Cartesian product），又称直积，表示为X × Y，第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员）

3.经验意义上的静态博弈——同时行动的博弈——games of simultaneous moves

（1）首先，没有完全静态的博弈

（2）定义：只做一次行动，不知道对方行动，前不知后，后不知前，可以看作同时行动

原告相当于被告

（3）静态博弈一般是信息完全的

4.信息完美与信息完全

（1）从展开型看信息完美：

接上面例子：只要你行动的时候，对过去发生的事情都了解（被告知道了原告是否贿赂）

（2）从经典博弈论看信息完全：

在经典博弈论中，假设参与者是理性而又智能的人（即了解信息多，明白整个博弈的表示，会有不完美的信息，但他知道他不懂的地方是哪里）

认为，博弈结构表示（比赛规则）是博弈者之间的commom konwledge，这就是信息完全的假设。所以在理论上，经典博弈论研究的都是信息完全。虽然有信息不完美，但是可以信息完全。

（3）经验意义上的信息不完全：

在G : I A F 中存在三种情况

I : 知人知面不知心。A:在给与不给朋友抄袭中，他选择了告诉老师。明枪暗箭。F:面对同样结果，对于对方的效用不了解。

（4）信息不完全导致了效u的信息不完全，对于不同的博弈者会有不同的类型。经验意义上的信息不完全会转化为理论上的信息不完美博弈。——日后深入学习（本人没有听懂）

5.策略间的两种关系：

知识准备：

G: I ——A(行动集）——Si（策略集）(Si>A) : 其中 Si=Δ（Ai) 即行动所有概率分布集，分为混合策略（mixed)和纯策略（pure)。

例如：在原告中：贿赂、不贿赂，找大官二叔，这就是一个混合策略，以正的概率使用两个或两个以上的行动，“0.1、0.5”——在博弈者的plan of action中，即一个人在具体的情况下，有一个可欲的行动集，在选择规则作用下，在可欲行动集中以一个概率选择某一行动。贿赂就是一种纯策略。

保持策略的模糊性、不确定性意味着混合策略。

（1）同一个博弈者的不同策略间的优超关系-dominance

符号引入：i 即 myself. Si Si'€Si，Si、Si'即同一个博弈者的不同策略

当Si dominates Si'，

则∀S-i.€S-i. (-i除了i外的其他人，即对于对手的所有策略） Fi(Si.S-i)>Fi(Si'.S-i)（Si应付对手S-i所带来的支付函数）

混合策略：

举例：2/3贿赂+1/3不贿赂——S-i.

1/4贿赂+3/4不贿赂——Si.

则：2/3x1/4x30（贿赂，贿赂）+2/3x3/4x70（贿赂，不贿赂）+1/3x1/4x0（不贿赂，贿赂）+1/3x3/4x60（不贿赂，不贿赂）

加起来，就是原告应付被告所得到的期望效用

或者：

=∑Si(am)xS-i(ak)xFi(amxak)——Si(am)即am出现的概率，S-i(ak)即ak出现的概率。

（am，ak）€（Ai,A-i)

以上，将期望效用用函数建立在策略组合之下

所以：Si' dominated str——被优超或者劣次优超

如果这个对手的策略是一个无限多集合，那么这个定义可以简化为： Fi(Si.S-i)>Fi(Si'.S-i)

纯策略：

检验一个纯策略优超于另外一个纯策略，利用期望效用的函数的线性关系。

举例：论证贿赂优超于不贿赂

1.应对对方贿赂时，（贿赂，贿赂）>（不贿赂，贿赂）

应对对方不贿赂时，（贿赂，不贿赂）>（不贿赂，不贿赂）

2.对方采取混合策略，我方采取纯策略：

1/4（贿赂，贿赂）>1/4（不贿赂，贿赂）

3/4（贿赂，不贿赂）>3/4（不贿赂，不贿赂）

推广开来：

比较同一博弈者的不同策略

（贿赂，q贿赂+(1-q)不贿赂）>（1/2贿赂+1/2不贿赂，q贿赂+(1-q)不贿赂）

根本在于期望值的计算

注意：优超只定义在对手的行动组合上

劣策略：

以正的概率使用一个劣策略，这个混合策略是一个劣策略

举例：买饺子可能买到少盐或多盐的，我喜欢面条

我以1/2的概率买饺子（以正的概率使用一个劣策略），我以1/2的概率买面条，这是一个劣策略

举例：

		乙
		左	右
甲	上	3，-	0，-
	下	0，-	3，-
	中	1，-	1，-

中不会被上下超越，只是一个劣策略，中会被一个混合策略（1/2上，1/2下超过

F（中，左）=1 > F(1/2上，1/2下，左）=1/2x3+1/2x0=3/2,此时，用中应付左不如以1/2上和1/2下应付左好。

当数值改变，会发生不同后果。

占优策略-dominant stragedy

一个博弈者只有一个纯策略，这个纯策略优于所有行动纯策略，这就是一个占优策略。

例如：原告贿赂就是一个占优策略。

在此角度下看，个体理性决策

根据效用最大化，一个理性的博弈者，有劣策略，是不会使用劣策略的；有占优策略，他应该使用占优策略。

下集预告：

劣策略的删除

最优反应关系的纳什均衡

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：昵称55050614 > 《博弈论》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

昵称55050614

关注对话

TA的最新馆藏

回忆杀！2018年中大军训，高校的军训原来是这样！
泡末丨YOUNG 18 四院迎新
让学生轻松赴考，这位班主任满满“少女心”！
巫溪中学毕业照大集合，赶紧瞅瞅有没有你~
宪法的效力和作用
18级笔记 | 法理学Lecture18、 Lecture11-14

喜欢该文的人也喜欢更多

热门阅读换一换