《博弈论教程（第三版）》1第一章引论

来自：src862tektokae > 馆藏分类

配色：

字号：大中小

《博弈论教程（第三版）》1第一章引论

2023-05-24 | 阅：转： | 分享

博弈论基础第一章引论1-1 策略博弈，从故事开始1-2 博弈三要素和囚徒困境等1-3 “抓钱博弈”1-4 利益是交易的前提1-5博弈的基
本分类1-1 策略博弈，从故事开始我方2个师的兵力，敌方3个师的兵力，只能整师调动。有两条进攻路线。我方兵力超过敌方，则获胜；我方
兵力小于或等于敌方兵力，则我方负。问如何决策？敌方有四种方案：A，三个师都驻守甲方向；B，两个师驻守甲方向，一个师驻守乙方向；C，
一个师驻守甲方向，两个师驻守乙方向；D，三个师都驻守乙方向。我方有三种方案：x，集中全部两个师的兵力从甲方向攻击；y，兵分两路，一
师从甲方向，另一师从乙方向，同时发起攻击；z，集中全部两个师的兵力从乙方向攻击。结论：敌军必取B或C那样的二一布防，而我军必集中兵
力于某一路实施攻击，即a或c。这样，若攻在敌军的薄弱处，就获胜，若攻在敌人兵力较多的地方，就失败。敌我双方获胜的可能性是一样大。
1-2 博弈三要素和囚徒困境等表达一个博弈，最要紧的是讲清楚一下三个元素：一、谁参与这个博弈。参与这个博弈的，叫做这个博弈
的参与人或者局中人(player)。n个参与人的博弈，叫做n人博弈(n—person game)。二、可供参与人选择的行动(act
ion)或者策略(strategy)。对局(strategy profile)策略组合(strategy combination)
。三、在博弈的各种对局下各参与人的赢利或者得益，叫做参与人的支付(payoff)。博弈的支付矩阵(payoff matrix)也叫
做博弈矩阵(game matrix)博弈的矩阵型表示(matrix-form representation of games)博弈
的正规型表示(nomal—form representation of games)博弈的策略型表示(strategic—form
representation of games)，矩阵型博弈(games in matrix form)，简称矩阵博弈正规型博弈
(games in normal form)策略型博弈(gamesin strategicform)。高等代数、线性代数里面的矩阵
,每个位置一个数。上述二人博弈的支付矩阵,却是每个格子一对数,左下角的是在相应对局下 “左方”参与人盟军的得益,右上角的是在相应对
局下 “上方”参与人德军的得益。为了与代数里面的矩阵相区别,现在这种每个格子里面一对数的表格,叫作双矩阵 (bi-matrix)。
左方参与人就是行参与人,上方参与人就是列参与人。囚徒困境
囚徒A囚徒 B坦白抵赖坦白抵赖-3大于-50大于-1（坦白，坦白）是纳什均衡思考：三人博弈的矩阵如何表示？
智猪博弈等待小猪大猪按等待按4大于10大于-1纳什均衡：大猪按，小猪等待各得四个单位（4，4）多劳者不多得大猪
小猪博弈股份公司中大股东小股东监督纳什均衡：大股东担当监督经理的责任村中的
富人穷人修路纳什均衡：大户修路股市的大户小户炒股纳什均
衡：大户搜集信息，小户跟大户智猪博弈的例子情侣博弈芭蕾女男足球芭蕾足球纳什均衡：足球，足球；芭蕾，芭蕾先动优势斗鸡博弈退BA进退
进独木桥纳什均衡：A进，B退；A退，B进斗鸡博弈的例子村子里有两户富户，有两种可能：一家修，另一家就不修；一家不修，另一家就得修。
冷战期间美苏抢占地盘：一方抢占一块地盘，另一方就占另一块。夫妻吵架，一方厉害，另一方就出去躲躲。田忌赛马取胜关键：不让对方猜到自己
策略，尽可能猜出对方策略猜硬币博弈石头、剪子、布1-3“抓钱博弈” 假如甲乙两个人参加一个“抓钱”游戏，他们在各自的托盘前面坐定。
托盘上面将会长出钞票，这是老天爷的恩赐。一开始时刻1，甲面前的托盘上有1元钱，乙面前的托盘上也有1元钱，甲处于决策的位置。他有两
种选择，把钱拿走或者不把钱拿走。如果他选择把钱拿走，即他把自己面前托盘上的1元钱拿走，乙也可以把自己面前托盘上的1元钱拿走，游戏结
束；如果他选择不把钱拿走，游戏进入时刻2。时刻2：这时候托老天爷的福，甲面前的托盘上变得有2元钱，乙面前的托盘上也变得有2元钱，轮
到乙处于决策的位置。他同样有两种选择，把钱拿走或者不把钱拿走。如果他选择把钱拿走，即他把自己面前托盘上的2元钱拿走，甲也可以把自己
面前托盘上的2元钱拿走，游戏结束；如果他选择不把钱拿走，游戏进入时刻3。时刻3：甲面前的托盘上变得有3元钱，乙面前的托盘上也变得有
3元钱，甲再次处于决策的位置。他仍然有两种选择，把钱拿走或者不把钱拿走。如果他选择把钱拿走，即他把自己面前托盘上的3元钱拿走，乙也
可以把自己面前托盘上的3元钱拿走，游戏结束；如果他选择不把钱拿走，游戏进入时刻4。时刻4：这时候甲面前的托盘上变得有4元钱。乙面前
的托盘上也变得有4元钱．又轮到乙处于决策的位置。他还是有两种选择，把钱拿走或者不把钱拿走。如果他选择把钱拿走，即他把自己面前托盘上
的4元钱拿走．甲也可以把自己面前托盘上的4元钱拿走，游戏结束；如果他选择不把钱拿走，老天爷被他们不为金钱所动的精神感动，决定奖励他
们每人5元钱，游戏结束。静态博弈和动态博弈同时决策博弈(simultaneous-move games)，是静态博弈(static
game)；决策有先有后是序贯决策博弈(sequential-move games)，是动态博弈(dynamic game)
。只要参与人的决策不是同时的决策，就是序贯决策博弈，而不必非得是轮流决策的不可。序贯决策博弈采用“树型”表示方法。根和分枝点是决策
节点(decision nodes)，树梢即各枝梢是末端节点(terminal nodes)。每个末端节点标示出博弈如果走到这里每
个参与人的得益。在每个树型博弈中，末端节点的括号，按照明确约定或者默认约定的顺序，给出各参与人的支付。如果不另外申明，就采取博弈参
与人在博弈中首次出场决策的自然顺序，来排列各参与人的支付。每一博弈树都有一个根(root)，并且只有一个根。博弈树正式的称谓：博弈
的展开型表示(extensive—form representation of games)展开型博弈(games in exte
nsive form)。非正式的称谓：博弈的树形表示树型博弈在两个博弈中，老天爷在相同时刻惠予两位参与人的金钱数额
是一样的。可是“制度安排”不同，结果就大相径庭。以上是“你好我好”或者“利益一致”的抓钱博弈，现在考虑下述“你死我活”
的抓钱博弈。如果我们把原来的抓钱博弈的数据修改成下面的样子,那就出现 “温和对抗”的抓钱博弈。命题：在交易的当时,交
易各方都不会真的吃亏。证明：若不然,只要有一方真的吃亏,他就没有道理参与和实施这笔交易。为什么却有那么多人感觉因为交易而吃亏了呢?
一是人们混淆了事实需求和心理期望,二是人们混淆了当时需求和事后检讨。1-4 利益是交易的前提在实际经济生活中,在交易的当时通常各方
都得到交易利益 (tradebenefit)。经济成本 (economiccost)不是会计成本 (accountingcost)
,经济成本通常比会计成本高。经济学讲究买卖双方对交易标的物的评价 (valuation),即交易标的物对于买卖双方各值多少。人们对
于同一标的物的评价是私有信息，出于追求更大交易利益的考虑,买卖双方都有隐蔽自己对交易标的物的真实评价的动机。设x为
交易标的物,记卖方对交易标的物的评价为vs(x),买方对交易标的物的评价为vb(x),那么,双方就标的物x达成交易的前提条件可以表
述为： vb(x)>vs(x) 买卖双方交易这个标的物所实现的交易利益,一共是vb(x)-vs(
x) 竞争市场上，价格是P，保留价格是vb(x)的买者，交易利益是vb(x)-P，对于保留价格是vs(x)的卖者,托
竞争市场的福他实现了P 这个价钱,从而他出售一件商品享受的交易利益是P -vs(x)。考虑经济人 A 和经济人
B交换x和y 两种商品,如下面的埃奇沃思盒 (Edgeworthbox)所示,在初始时刻,A 对商品x和y 的持有量是XA 和YA
,B对商品x 和y 的持有量是XB 和YB，存量的初始持有点为E。交易互利区域无差异曲线主体人的提供曲线,是通过初始持
有点 E的每一条直线和该主体人的无差异曲线的切点的轨迹。竞争均衡最终可以由两位主体人的
提供曲线 (offer curve)的交点确定,交点就是竞争均衡点。两位主体人的提供曲线的交点 M,就是该纯交换经济
的竞争均衡埃奇沃思盒的垄断均衡主体人 A 处于垄断的交易位置：总的来说,利益是交易的前提,在理性人的条件之下,自愿的交
易总是互利的。需要注意,虽然交易总是互利的,但是互利的交易未必公平。1-5 博弈的基本分类最基本的分类：按照博弈各方
是否同时决策，分为静态博弈和动态博弈。按照大家是否都清楚各种对局情况下每个局中人的得益，分为完全信息博弈和不完全信息博弈。完全信息
：各种对局情况下每个局中人的得益多少是所有局中人的共同知识(common knowledge)。完全信息静态博弈（static g
ames of complete information）完全信息动态博弈（dynamic games of incomplete
information）不完全信息静态博弈（static games of complete information）不完全信息
动态博弈（dynamic games of incomplete information）完美信息博弈(games with pe
rfect information)和不完美信息博弈(games with imperfect information) 。完美性
：是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻画。如果在博弈进行过程的每一时刻，面临决
策或者行动的参与人，对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚，这样的博弈叫做完美信息博弈。完全且完美信息
博弈(games of complete and perfect information)完全但不完美信息博弈(games of
complete but imperfect information)不完全但完美信息博弈(games of incomplete
but perfect information)不完全且不完美信息博弈(games of incomplete and impe
rfect information)只有动态博弈才考虑完美或不完美信息。零和博弈，常和博弈如果一个博弈在所有各种对局下全体参与人之
得益的总和总是保持为0，博弈就叫做零和博弈(zero-sum game)，也称“严格竞争博弈”。
—猜硬币，田忌赛马，石头-剪刀-布零和博弈是利益对抗程度最高的博弈。常和博弈：博弈方之间利益的总和为常数。博弈方之间的利益是
对立的且是竞争关系。 —分配固定数额的奖金、利润，遗产官司非常和博弈（变和博弈）：零和博弈和常和博弈以外的所有
博弈。合作利益存在，博弈效率问题的重要性。 —囚徒困境、产量博弈等合作博弈和非合作博弈两者的区别
在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能，则称非合作博弈。合作博弈强调的是集体主义，团体理性，是效率、公
平、公正；非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果是有时
有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益最大化，最后达到力量均衡。回顾1-1 策略博弈：诺曼底登陆1-2 博弈三要素和囚徒困境等局中人，行动或策略，支付矩阵型博弈，正规型博弈，策略型博弈支付矩阵，博弈矩阵，双矩阵囚徒博弈，智猪博弈，情侣博弈，斗鸡博弈1-3 抓钱博弈树型博弈，展开型博弈博弈树，决策节点，末端节点，根1-4 利益是交易的前提利益是交易的前提,在理性人的条件之下,自愿的交易总是互利的1-5 博弈的基本分类静态博弈和动态博弈；完全信息博弈和不完全信息博弈；完美信息博弈和不完美信息博弈；零和博弈和非零和博弈；常和博弈和变和博弈；合作博弈和非合作博弈博弈的分类及对应的均衡

献花(0)

(本文系src862tekto...首藏)

类似文章 更多

发表评论：