博弈论四种类型之完全信息静态博弈

精诚至_金石开 2018-12-09

展开全文

决策需要信息，几乎所有需要决策的场合我们都掌握着有限信息，这使得现实中往往是有限信息博弈。完全信息在这里指的是每个参与人对其他参与人的支付函数有着完全的了解。而静态指的是同时行动的博弈，或者不同时但后行动者不知道之前行动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。最典型的例子是囚徒困境与智猪博弈。下面就由这两个例子展开，并将在博弈论中的一些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下：
这里写图片描述

【注】博弈中参与人只拥有有限个离散性的纯战略供其选择称为离散型策略。而在另外一些博弈中，每个参与者的纯策略可以是来自连续范围的一个数，如厂商定价，称为连续型策略。离散型策略静态博弈可以用支付表来表示，如上图。
对于囚徒A与B来说，无论对方采取什么策略，自己的策略是“坦白”时总是比“抵赖”要好些，在两人无法通信的情况下，两人都会选择“坦白”。
【优势战略均衡】在这里，无论对方选择什么，“坦白”的收益是严格大于“抵赖”，所以“坦白”是一个严格优势策略，对应的“抵赖”则是一个劣势策略。所有人都有自己的优势策略，由此产生的优势策略组合是一个优势战略均衡。
但是这里需要注意的是，双方各自的优势策略却导致了集体的利益最差，如果两人都选择“抵赖”收益将是各自-1，但是优势策略下的收益却是-8.囚徒困境反映了个人理性与集体理性的冲突。个人的最优选择从社会角度看并不是最优的。社会生活中有很多例子：公共品的给予，商家的价格战，团队生产中的偷懒（三个和尚没水喝），小学生减负越减越重，各国军备竞赛等。
【如何走出囚徒困境】如果有可信的承诺或者是惩罚（第三方实施），会使两人合作，促进集体利益最高。
【智猪博弈】智猪博弈的收益矩阵模型如下：
这里写图片描述

在此处，小猪有优势与劣势策略，但大猪没有，只能根据小猪的策略做出最佳应对，而小猪不会选择劣势策略，因此剔除小猪“按”的策略，此时，大猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与人怎样选择呢策略，参与人选择策略A时的收益严格小于策略B时的收益。因此严格劣势策略不会被选取，不断剔除严格劣势策略简化博弈，直到没有劣势策略为止。如果剩下唯一的策略组合，那么该策略称为重复剔除劣势战略均衡。
【弱优势策略】若对某些参与者而言，不管其他参与者做何种决策，如果A策略至少与B策略一样好，或者某些时候严格好于B策略，那么A策略就叫做弱优势策略，相对的，B为弱劣势策略。逐次剔除弱劣势策略可能会去掉某些纳什均衡。
【优势战略均衡与重复剔除劣势战略均衡】前者是选择法，要求每个参与人是理性的；后者是排除法，要求“共同知识”。
【纳什均衡】在其他人保持自己的策略不变的情况下，没有人可以通过改变自己的策略获得更高的收益。
【注】每个优势战略均衡或者重复剔除劣势战略均衡一定是纳什均衡，但反之不然；纳什均衡一定是在重复剔除劣势策略中未被剔除的战略组合，反之不然，除非是唯一组合了。
【多重均衡与协调】一般来说，博弈不一定只有一个均衡。具有多重均衡的博弈被称为协调博弈。