分享

博弈论Lecture7

 昵称55050614 2018-11-21

知识安排:

个体理性决策(已学习)

博弈的表示理论(在学习)

博弈的解的理论(solution)

 

博弈的表示理论

1、展开型(extensive form)——强调过程

组成:(1)博弈者-即博弈者的行动顺序

         (2)自然的行为选择-由局部行动集作出行为选择

         (3)信息集(信息完美,信息完全)

         (4)自然的行动-考虑到参与者赋予自然的先验概率

         (5)Pay off function-即utinity function

流程:自然行动-结果-评价-Pay off function

For example:

                                      终节点- 结果-效用评价

         

       贿赂  ————被告

                                     不贿赂————70   0                  

原告

                                       贿赂————0  70

       不贿赂————被告

                                      不贿赂 ————60 40

       决策节点—自然选择  ,节点前的虚线代表被告不知道前面发生了什么,这是一种信息不完美

 

 

被告

 

 

 

贿

原告

贿

30,10

70,0

 

0,70

60,40

 

是一种,理论动态(按顺序行动),经验静态(行动者只做一次行为选择,相当于同时行动)的博弈。

 

2.策略性(strategic form)-对一个策略互动博弈的最基本描述(用符号G代替)

G的组成:

 I :博弈者的集合——原告和被告

 A i € I: 纯策略集合,行动集——原告的贿赂和不贿赂,被告的贿赂和不贿赂

 F  i € I: ×A i (i€I )R:一个pay off function 建立 在所有Ai集合的笛卡尔积。此处的笛卡尔积是所有可能结果的配对。

(笛卡儿积即笛卡尔乘积是指在数学中,两个集合 XY的笛卡尓积(Cartesian product),又称直积 ,表示为X × Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对 的其中一个成员)

 

3.经验意义上的静态博弈——同时行动的博弈——games of simultaneous moves

(1)首先,没有完全静态的博弈

(2)定义:只做一次行动,不知道对方行动,前不知后,后不知前,可以看作同时行动

 

原告                     相当于         被告

                        

(3)静态博弈一般是信息完全的

 

4.信息完美与信息完全

(1)从展开型看信息完美:

     接上面例子:只要你行动的时候,对过去发生的事情都了解(被告知道了原告是否贿赂)

(2)从经典博弈论看信息完全:

      在经典博弈论中,假设参与者是理性而又智能的人(即了解信息多,明白整个博弈的表示,会有不完美的信息,但他知道他不懂的地方是哪里)

      认为,博弈结构表示(比赛规则)是博弈者之间的commom konwledge,这就是信息完全的假设。所以在理论上,经典博弈论研究的都是信息完全。虽然有信息不完美,但是可以信息完全。

(3)经验意义上的信息不完全:

      在G : I A F 中存在三种情况

I : 知人知面不知心。A:在给与不给朋友抄袭中,他选择了告诉老师。明枪暗箭。F:面对同样结果,对于对方的效用不了解。  

 

(4)信息不完全导致了效u的信息不完全,对于不同的博弈者会有不同的类型。经验意义上的信息不完全会转化为理论上的信息不完美博弈。——日后深入学习(本人没有听懂)

 

5.策略间的两种关系:

知识准备:

G: I ——A(行动集)——Si(策略集)(Si>A) : 其中 Si=Δ(Ai) 即 行动所有概率分布集,分为混合策略(mixed)和纯策略(pure)。

 

例如:在原告中:贿赂、不贿赂,找大官二叔,这就是一个混合策略,以正的概率使用两个或两个以上的行动,“0.1、0.5”——在博弈者的plan of action中,即一个人在具体的情况下,有一个可欲的行动集,在选择规则作用下,在可欲行动集中以一个概率选择某一行动。贿赂就是一种纯策略。

保持策略的模糊性、不确定性意味着混合策略。

 

(1)同一个博弈者的不同策略间的优超关系-dominance

符号引入:i 即  myself.     Si Si'€Si,Si、Si'即同一个博弈者的不同策略

当Si dominates Si',

S-i.€S-i. (-i除了i外的其他人,即对于对手的所有策略)  Fi(Si.S-i)>Fi(Si'.S-i)(Si应付对手S-i所带来的支付函数)

混合策略:

举例:2/3贿赂+1/3不贿赂——S-i.

         1/4贿赂+3/4不贿赂——Si.

则:2/3x1/4x30(贿赂,贿赂)+2/3x3/4x70(贿赂,不贿赂)+1/3x1/4x0(不贿赂,贿赂)+1/3x3/4x60(不贿赂,不贿赂)

加起来,就是原告应付被告所得到的期望效用

 

或者:

=∑Si(am)xS-i(ak)xFi(amxak)——Si(am)即am出现的概率,S-i(ak)即ak出现的概率。

am,ak)€(Ai,A-i)

以上,将期望效用 用函数建立在策略组合之下

所以:Si' dominated str——被优超或者劣次优超

如果这个对手的策略是一个无限多集合,那么这个定义可以简化为: Fi(Si.S-i)>Fi(Si'.S-i)

 

纯策略:

检验一个纯策略优超于另外一个纯策略,利用期望效用的函数的线性关系。

 

举例:论证贿赂优超于不贿赂

1.应对对方贿赂时,(贿赂,贿赂)>(不贿赂,贿赂)

 应对对方不贿赂时,(贿赂,不贿赂)>(不贿赂,不贿赂)

2.对方采取混合策略,我方采取纯策略:

1/4(贿赂,贿赂)>1/4(不贿赂,贿赂)

3/4(贿赂,不贿赂)>3/4(不贿赂,不贿赂)

推广开来:

比较同一博弈者的不同策略

(贿赂,q贿赂+(1-q)不贿赂)>(1/2贿赂+1/2不贿赂,q贿赂+(1-q)不贿赂)

根本在于期望值的计算

注意:优超只定义在对手的行动组合上

 

劣策略:

以正的概率使用一个劣策略,这个混合策略是一个劣策略

举例:买饺子可能买到少盐或多盐的,我喜欢面条

我以1/2的概率买饺子(以正的概率使用一个劣策略),我以1/2的概率买面条,这是一个劣策略

举例:

 

 

 

 

 

3,-

0,-

 

0,-

3,-

 

1,-

1,-

中不会被上下超越,只是一个劣策略,中会被一个混合策略(1/2上,1/2下超过

 

F(中,左)=1 > F(1/2上,1/2下,左)=1/2x3+1/2x0=3/2,此时,用中应付左不如以1/2上和1/2下应付左好。

当数值改变,会发生不同后果。

占优策略-dominant stragedy

一个博弈者只有一个纯策略,这个纯策略优于所有行动纯策略,这就是一个占优策略。

例如:原告贿赂就是一个占优策略。

在此角度下看,个体理性决策

根据效用最大化,一个理性的博弈者,有劣策略,是不会使用劣策略的;有占优策略,他应该使用占优策略。

下集预告:

劣策略的删除

最优反应关系的纳什均衡

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多