周口店人 / 韩德强 / 韩德强:博弈、均衡与囚徒困境

分享

   

韩德强:博弈、均衡与囚徒困境

2013-09-07  周口店人
编者按:本文选自韩德强老师著作《萨缪尔森<经济学>批判》的第17部分。本文标题及文中字体为编者所加。


  二十五、博弈论、纳什均衡与囚徒困境

  博弈论又称对策论,其实直译是“游戏理论”(game theory),研究的是在对抗性活动中双方或各方战略的相互影响。我们在第一节中已经指出,在每个人追逐自身利益最大化的前提下,冲突、对抗是经济活动的本质,而妥协、平衡则是其表象。因此,研究各双如何制定使自身利益最大化的战略及其相互影响,本来应该是经济学研究的主题。萨缪尔森实际上也承认:“博弈,博弈,无处不在……对博弈论的深刻领悟已遍及经济学、社会科学、工商业活动以及日常的生活之中。”(P166)遗憾的是,由于这一主题不利于占统治地位的利益集团掩盖自己巧取豪夺的本质,在经历了长达数百年的市场经济实践后,才终于有一个所谓“博弈论”来羞羞答答地处理这一主题。

  令人惊奇的是,博弈论并不是军事战略家提出来的,而据说是一个叫约翰·冯·纽曼的数学家所开创和发展的。“博弈论的指导思想是:假设你的对手在研究你的策略并追求自己最大利益行动的时候,你如何选择最有效的策略。”(P161)然而,这恰恰就是军事战略本质。任何有效的一个军事策略都是建立在掌握对方的兵力部署,判断对方将领的战略战术基础的之上。这就是所谓“知己知彼,百战不殆。”于是,“兵者,诡道也。能而示之不能,用而示之不用,近而示之远,远而示之近。”具体来说,有侦察、间谍,有用间之道,有反间之计;有声东击西术,有调虎离山术等等。目的只有一个,即千方百计隐蔽自己的真实力量和意图,使对手发生错觉,而自己则尽可能刺探对方情报,正确判断对方的作战意图,据此来部署兵力,战胜对手。在作战时,则尽可能使己方兵力数倍于敌,在局部战场上占据绝对优势,从而击败对手。军事对手之间的博弈之复杂,绝不是数学公式可以归纳、推导的,需要从大量的情报中辨别真伪,做出决策。不仅如此,在实际经济和军事博弈中,决策是连续的,一次决策的结果成为下一次决策的起点,双方在连续的博弈中判断对手的意志、能力、耐心以及士气、装备、情报等各作战要素。

  事实上,在企业间的竞争也是这样,追求自身利益最大化的各方就进行着这种连续的、复杂的博弈,博弈的结果同样是弱肉强食。有时候,强者能够不战而屈人之兵,弱者自动投降,如被兼并或收购,双方不发生激烈冲突。有时候,双方势均力量,于是就价格战,直至分出高下。有时候,弱势方拼死反抗,强弱双方激烈较量。即使最终弱者战败,但强者也可能会伤元气,以至被第三方所获。也有可能弱势方神机妙算,或凭借地利优势,总是在造成局部优势,总是攻击强者的弱处,于是就有以弱胜强的战绩。

  可以说,孙子兵法是博弈理论和博弈实践相统一的最高水平。孙子兵法以后的军事理论的发展,无非是孙子兵法原则在不同装备条件下的应用和展开而己,克劳塞维茨的《战争论》在战略原则的表述上其实远逊于孙子兵法。因此,博弈论的真正大师是中国春秋末期的孙武。

  放在这一视野下,纽曼的博弈论又是什么呢?纽曼无非是建立了单因素、一次性博弈的数学模型。当这种数学模型被用于解释多因素、复杂的企业竞争时,就显得非常苍白可笑。例如,我们来看看萨缪尔森是怎样用博弈论来解释“双寡头垄断的价格战”的:“当双方都运用正常价格战略时,每个企业各赚10美元。而在另一个极端,就是双方都采用削价战略时都会遭受最大损失。”如果其中一家“SAX坚持正常的价格战略,而BERNEY却采取降价战略。BERNEY拥有了市场,可它却损失了大笔金钱。因为它的售价低于成本。SAX一直以正常价格销售而不是对BERNEY的策略作出反响,处境反倒好一些。”(第161页)“因此,一个企业无论采用什么战略,与之博弈的企业的最佳战略就是仍按正常价格销售,正常价格在价格博弈中,对两个企业来说都是一种占优战略。”(第162页)此论意味着,双寡头垄断企业间的价格战是不可能发生的。

  但是,这与事实相去何止十万八千里!双寡头垄断的企业间也会打价格战。如果说双寡头间的价格战发生得比众多企业间的价格战少,那并不是因为博弈的结果,而是双寡头之间的合谋比众多企业间的合谋容易。为什么双寡头间也会发生价格战?难道它们不知道价格战的最终结果是双方两败俱伤吗?

  假如这两个寡头的一切条件——技术、资金、质量、成本、规模、运输条件、顾客对商品的认同程度、员工的激励水平等等——都相同,那么价格战的结果的确会指向零,导致两个企业都毁灭。问题在于,两个寡头间的这一切条件常常都不相同,其中一个可能自认为成本更低、质量更好、品牌更有影响、有更强大的资金作后盾、管理水平更高等,这个寡头就会发动价格战,以夺取更大的市场份额,直至把对手挤出市场,形成单寡头垄断。当一个寡头发动价格战时,另一个寡头可以保持正常价格吗?实际上不可以。如果另一个寡头还保持正常价格,则其销售量会急剧下降,虽然单件利润仍较高,但利润总量则会急剧下降,直到无法支付固定成本为止。这才是价格战,其结果是一方获胜,占领全部市场,而另一方则被淘汰。形成单寡头垄断后,垄断企业再提高价格,不但可以收回在价格战期间的利润损失,而且还可以获得超额垄断利润。价格战的激烈程度取决于参战企业对各自实力的判断及应战意愿。双方或多方势均力敌,互不服气,则价格战将十分激烈;如果双方相互承认对方的实力,则可能形成价格默契甚至市场分割;双方或多方实力悬殊,则弱势方接受强势方的购并,或接受强势方的定价,可能会迅速形成垄断局面。

  实际上,在双方实力接近的情况下,价格战的胜负常常取决于备战、后援、士气、谋略等因素,先发制人,后发制于人。例如,长虹在发动价格战前,廉价囤积了一批显像管,造成显像管市场供应紧张,价格上扬,然后突然降价,使竞争对手陷于困境。当然,长虹还没有最终取胜。因为竞争对手实力相当,又各自有政府或银行支持,虽然利润越来越薄,但由于退出成本很高,价格战仍然会持续下去,直至一方宣告失败或投降求和。尽管各方直接利益在价格战中都受损失,但战争还是会持续下去,暂时来看,形成双输局面,长远来看,则是一输一赢。即使一时没人发动价格战,由于有此类先例,商业竞争对手还是会双方相互保密,又相互刺探对手情报,造成经营成本也就不断上升。当然,价格战必须在性能、质量、品牌知名度相近的情况下才能激烈展开。如果经营同一类商品的不同企业各自占居高、中、低不同档次的商品,则他们之间很可能不是价格战,而是分档垄断。

  由此可见,在双寡头垄断情形下,如果双方力量不平衡,则两个寡头各自追求利益最大化的正常结果并不是双方保持正常价格,而是陷入“双输局面”,套用纽曼的博弈论模型,即所谓“囚徒困境”;如果双方力量平衡,则在双方追求各自利益最大化时,各自将保持正常价格,形成所谓“纳什均衡”,即非合作均衡,在不合作的情况下双方利益都能最大化。

  显而易见,双方力量完全平衡是不可能的。由于企业的人、财、物、供、产、销各要素都处于不断的变动之中,即使有某个瞬间双方力量曾经平衡,下一个瞬间也会不平衡。因此,对双寡头垄断竞争的理论分析必须立足于力量不平衡,从而“纳什均衡”就成为虚构。

  然而这一虚构对于斯密开创的经济学具有重大意义。“纳什均衡”实际上是从博弈论的角度对“看不见的手”的逻辑进行的论证。如果说“纳什均衡”为虚构,则“看不见的手”就不适用于双方策略互动情景,从而不适用于一切经济活动。萨缪尔森毫不隐瞒这两者之间的关系:“竞争性均衡是纳什均衡或非合作均衡。注意,当每个企业都采取非合作行为时,总社会效用会最大化。这一点让我们想起了亚当·斯密关于看不见的手的学说。”(第163页)所以,毫不奇怪,提出这一子虚乌有的“纳什均衡”的数学家约翰·纳什因为博弈论方面的贡献而获得了诺贝尔经济学奖。

  实际上,符合市场交易的博弈模型还是囚徒困境。所谓囚徒困境者,是这样一个故事:甲乙双方为同案嫌疑犯,一同被警方逮捕。审讯者将甲乙双方单独监禁,并告诉他们,如果双方都不供出对方,自己也不承认有罪,则双方都可获释;如果一方招供,另一方拒供,则招供方可获释,拒供方判刑;如果双方都招供,则双方都判刑。甲乙双方各自独立判断,各自根据利益最大化做出决策,则双方都选择招供,结果是双方利益最小化。

  囚徒困境刻划出市场交易的本质性困境。近来经济学界热衷的所谓“逆向选择”和“道德风险”问题是无非是囚徒困境的又一个典型情景而已。在讨论保险市场时,萨缪尔森承认,“由于市场不灵活,会出现许多不确定性和风险。市场不灵活的两个重要因素为‘逆向选择’和‘道德风险’。当这些因素存在时,市场可能会给出错误的信号,破坏激励机制,甚至有时会不存在市场。”(第159页)

  什么是道德风险呢?如果受保人减少避免风险的动力,甚至增加风险,则风险发生的概率就会增加,承保人利益就会损失。最极端的例子是,某人受保房产火险,高估房产价值,然后故意制造火灾,索取赔偿金;一般情况则是,由于受保,减少了防止火灾的动力,使火灾发生机率增加。由于存在道德风险,保险公司就会提高保费,从而使受保人数量减少;由于受保人少,保险费就得更高,如此恶性循环,可导致相应的险种消失,即不存在市场。

  什么是逆向选择呢?如果高风险者参加保险,而低风险者不参加保险,则受保人的风险发生概率将大大高于平均风险发生概率,从而使保费上升,受保人进一步减少,直至该类险种消失。例如医疗保险,多病者愿意投保,而健康者则不愿投保。

  这两种情形都可以归结为受保和承保(即买与卖)双方信息不对称,而且是有利于买方的信息不对称。由此,人们不禁会替保险公司担忧起来。其实,大可不必,因为还有有利于卖方的信息不对称,可称卖方道德风险和卖方逆向选择。

  所谓卖方道德风险是指,保险公司在设计保险条款和理赔时,设下很多障碍和陷阱,在受保人看来可以得到的赔偿,实际上得不到或比预期少得多。

  所谓卖方逆向选择是指,保险公司选择低风险者作为受保对象,而回避高风险者。例如给在校学生医疗保险,而不给退休职工承保。

  把买卖双方的道德风险和逆向选择合起来看,则是双方自各利用信息不对称进行博弈,而博弈的结果则是双方落入囚徒困境,若干信息不对称比较严重的保险市场将不能存在。例如失业保险,医疗保险等。中国目前的保险覆盖率还很低,根本原因就在于人们对卖方道德风险和逆向选择问题的估计。

  当然,保险公司之所以出现并发展,是利用了一个根本的信息不对称,即风险发生概率的估计。例如,设20元钱购买民航保险,保额20万元,飞机的事故率为百万分之一,平均每架飞机座150人,则可以计算,保费收入为20×1000000×150=300000万,而理赔支出则为200000×150=3000万。这就是保险公司的赚钱奥秘。

  保险公司之所以出现并发展,是利用了一个根本的信息不对称,即风险发生概率的估计。

  实际上,一旦把信息不对称引入,则每一次交易都成为博弈,因而保险市场上的所谓道德风险和逆向选择问题是一个普遍性问题。而且,只要这个问题被提出,“看不见的手”就无法成立。

  有意思的是,在“看不见的手”的思维屏障下,道德风险和逆向选择这一交易信息不对称所产生的最简单的问题,居然被作为经济学研究的高级领域看待。当然,作为折衷主义大师的萨缪尔森也承认:“在许多情况下,非合作的行为导致经济无效或社会不幸。”(第164页)如污染博弈,军备竞赛等,萨氏甚至承认经济生活正在慢慢变成类似平民的军备竞赛,赢家通吃,导致最大的不平等。他至少比那些新自由主义者客观一些,还愿意面对一些事实。

  二十六、收入和财富如何分布?

  在论述“市场如何决定收入”时,萨缪尔森首先承认:

  “美国是一个收入和财富两极分化的国家。如果你是最富的400个美国人中的一员,那么你可能是一位63岁的白人男子,拥有常春藤学校的学位,净资产达7.5亿美元。你很可能是从制造业或房地产发家致富的。你能够达到顶层与你的出身和头脑都有关。或许你家族的生意至少就有几百万美元,这当然给了你一个很好的先决机会和相对优势。你的成功还可能是由于你在计算机软件或小镇优惠商店的经营中是一位开路先锋。

  另一端是那些从来名不见于《福布斯》或《人物》杂志封面的、被遗忘了的人们。让我们听一听无家可归的失业者罗伯特·克拉克的故事。他是一个越南战争老兵,在1992年从底特律来到迈阿密找工作。他睡在街上的一张硬纸板上,盖的是一条偷来的床单。每天他和其他无家可归的人从地下水道里爬出来,为那些临时雇用他的公司做工。这些公司对向其寻求临时工的客户每小时收取8-10美元,但付给像克拉克这些人的工资都很低,然后将剩余的大部分钱用于自己的交通和各种工具。克拉克的工资单表明他工作31小时所得到的报酬仅为31.28美元。”

  问题在于,

  “我们怎样才能理解这些收入和财富的两极分化呢?为什么有些人一年收入100万美元,而别的人1小时只挣1美元?为什么东京或曼哈顿的房地产每平方英尺值几千美元,而沙漠中的土地每英亩只卖几美元?像爱立信或丰田这样的巨型企业,它们数以十亿美元计的利润又从何而来?”

  他认为,理解这些问题的关键在于懂得收入的边际生产率理论及供求关系。即某人得到的收入,一方面取决于,在其他要素不变的情况下,他作为投入品能带来的增加的产出,边际产出越大,则对他的需要越高,价格就会越高;另一方面取决于像他这样的投入品的供给多少,供给数量越多,价格就会越低。如果此人拥有资本或土地,则他的收入还取决于资本或土地作为投入品能带来的增加的产出的多少,以及可替代的资本和土地的供给量的大小。

  用这些理论解释比尔·盖茨的收入,就意味着,盖茨作为投入品其边际产出很高,而且不可替代。于是,盖茨每增加一天工作能增加10万美元的产出,在不可替代的条件下,这些产出的大部分都能成为他的收入,而产出又可以转化为资本。有了资本,就会有相应的资本收入;有了资本收入,可支配的物质能量变换体系扩大,则每增加一天工作能增加15万美元的产出。如此循环,则盖茨成为美国巨富。而克拉克作为投入品每工作一小时的边际产出只有20美元,但类似克拉克的人很多,供给过剩,结果能得到的实际小时收入就只有1美元。这中间还有一个环节是临时雇用公司。需要临时工的客户不敢或不能直接雇用克拉克,因为他们对克拉克这样的无家可归者不相信,怕他们偷东西,怕他们损坏工具等等;同时,他们又缺乏和克拉克这样人的方便的联系,因为克拉克没有住所,没有电话。而作为中介的临时雇用公司则具备和克拉克们打交道的丰富经验,可以向客户保证用工的安全性、可靠性。很可能,在迈阿密某区,这样的临时雇用公司只有一家(他们常常与黑社会有密切关联)。在客户面前,他们享有垄断供应临时劳工的权力;在克拉克们面前,他们又是唯一的雇主。因此,克拉克每小时的边际产出绝大部分被客户和临时雇用公司分享。每小时1美元的收入仅能供克拉克填充肚子,而不能转化为资本;不仅如此,克拉克甚至还会因病需要借钱,形成负资产,逐渐走入要吃饭就不能治病,要治病就不能吃饭的恶性循环,最后在某一个风雨或拳脚交加之夜陈尸街头。

  因此,看上去边际生产率和供求关系的确决定着一个人的收入多少。问题在于,边际生产率和供求关系恰好是交易中力量对比的两个关键因素。边际生产率高者,力量强;反之则力量弱;供不应求者,力量强;反之,则力量弱。因此,上述经济学语言又可以归结为弱肉强食规则决定着一个人收入的多少。然而我们又知道,弱肉强食还有其他情形,例如信息不对称。拥有相关交易的充分信息者,在交易中就能占据优势,从而拥有较高的收入,而信息缺乏者,则只能有较低的收入。农民的收入不如粮商的收入,关键因素之一是因为粮商掌握较广泛的粮食供求信息,了解消费者的消费特点(品种、价格承受力、购买习惯等)。

  在实际经济活动中,边际生产率、供求关系和信息不对称全都复杂地交织在一起,并且每一项都随时处于变动之中。如果一方能展示于己有利的因素,而另一方则不善展示;一方能将未来的变化考虑在内,而另一方则只顾当前情况;更进一步,如果一方向另一方展示虚假信息,“能而示之不能,用而示之不用”,则交易结果还会发生巨大差别。最后,正如我们以前所揭示的,收入将是交易双方战争(博弈)的结果。

  当争夺利益的经济战争在全社会的每一个角落、每一个环节展开时,一个复杂的弱肉强食的食物链就出现了。居于食物链顶端者,可以支配庞大的财富,可以有无数人为之服务,可以为一次感冒而花费上万美元;居于食物链底层者,则只能在朝不保夕的生存压力下从事繁重的体力劳动,在硬纸板上睡觉,靠面包屑度日,在风雨交加的夜晚悄无声息地死去。

  让我们来看一看福特汽车公司构成的食物链体系吧。居于食物链顶端的,是福特汽车公司的大股东,他们每年靠股权可以获得数千万美元的分红,并且可以决定福特公司的发展战略、人事政策和主要经理人员的任免。位于食物链第二层的,是福特汽车公司的执行总裁,他可能同时是大股东之一,也可能不是。总裁负责贯彻落实董事会的决策,但享有相当大的投资、用人、工资政策的自主空间,对公司的兴衰、股东的利润举足轻重,并掌握着副总裁及以下人员的生杀大权,因此,其年收入可高达千万美元。在总裁之下的是副总裁,有的负责营销,有的负责生产,有的负责科研,有的负责采购。以营销副总裁为例,他控制着一个遍布全球各地的福特汽车公司的销售网络,并管理着庞大的广告开支,其目标是在一定的价格政策下使福特汽车的销售收入和份额不断增长。为此,他必须注意考察各地销售形势,并鉴别其中主客观因素的作用,决定各地区销售总部负责人的任免,并针对不同地区的汽车市场竞争形势决定不同销售策略。这位营销副总裁可能年薪数万百美元。以此类推,其下的地区销售经理年薪为数十万美元,经验丰富的销售人员的年薪为十万美元左右,新招收的销售人员可能只有三、五万美元的薪水。新销售员的薪水必须用于,一、偿还多年受教育的投资;二、酬谢其招募者或领导;三、购房的分期付款;四、一应日常消费品的开支;五、社会交往开支;六、准备结婚的开支。

  所有这些开支又衍生出不同的食物链。由于这些年薪三、五万美元的白领人员的消费,形成由超市、便利店、夫妻店组成的商业网络,其中夫妻店是食物链的最低层。然而夫妻店本身又形成一个食物链,围绕着夫妻店的是烟酒及日用百货的批发商,送货员,顾客,房东,以及像克拉克这样的流浪汉和临时工雇用公司。

  福特汽车公司食物链还不止于此。由于和通用汽车公司、克莱斯勒汽车公司以及日本和德国的汽车公司竞争,福特还必须有一个社会关系网,包括媒体和政客。于是福特的利润一部分就流入媒体和政界,成为媒体食物链和政治食物链的营养源。广告是其中最常见的方式之一。由于巨额广告投入的存在,一个庞大的由记者、通讯社、电视、广播、报纸、杂志、户外广告、画家、音乐家、制片人、演员、导演、替身演员、球队、体育明星组成的食物链变得越来越庞大复杂。这个食物链的共同目标是吸引读者、观众的目光,从而打开他们的钱包,让他们把辛苦赚来的钱花到可能是毫无必要的商品上,并且为了得到这些商品而更加拼命地去赚钱。至于政治食物链就更复杂,不同党派都有各自的政纲,吸引各类食物链不同层次的对象。围绕着政纲和政治权力的角逐,又形成与福特汽车公司营销体系相似的组织结构,或食物链。

  当然,食物链内不同等级间有一定的流动性。夫妻店经营得好,可能扩大规模,成为便利店,甚至成为超市。反之,超市经营得不好,也可能店主会破产,被逼债,甚至进监狱,出狱后则由于精神错乱而与克拉克们为伍。但是食物链的等级是一定存在的,而且高低等级乃至同等级间都充满了斗争。高收入者一定是居于或接近食物链顶端者,而低收入者则是处于或接近食物链底层者。随着新自由主义的推广,各种保护弱者措施的取消,食物链顶端占有的财富比例越来越大,而食物链底层则越来越赤贫化。

  但是,这一趋势还是可能被逆转,如果弱者越来越团结起来,则强弱力量对比就会发生变化,而收入分布也就相应会变化。如果我们以社会保护弱者的程度来衡量其文明程度,则完全自由竞争、自由贸易的社会将是野蛮社会,那里只有弱者强食,没有伦理道德;而由尊重人的生命为第一原则所构成的社会,一个由利他合作原则构成的社会将是完全的文明社会。介于两者之间的当是半文明、半野蛮社会。由于文明和野蛮两种趋势之间存在着激烈的冲突和斗争,收入分布也就会不断的变动,而没有定式可以遵循。就世界整体而言,这个由少数发达国家和发展中国家构成的完整的食物链体系并无文明可言,因此才有三位世界首富的财产等于48个国家的国民生产总值之和的两极分化。就国别比较,则北欧国家的弱肉强食力量得到最充分地抑制,而伦理道德的力量则比较强大,因此文明程度较高;法、德、日其次,英、美再次。发展中国家除少数外,国内的贫富分化更加严重,因此文明程度更次。考虑到发达国家的财富来自对发展中国家的不平等交换或称掠夺,则发达国家对外的野蛮程度最高。这可以从美国、欧洲、日本巨大的军事力量得到印证,事实上这些国家在是经常对外进行殖民侵略的国度。

  由此可见,世界收入和财富的分布的本质乃是力量及道义的分布。在以“看不见的手”为原则的无道义世界上,收入和财富的分布就是力量的分布。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多
    喜欢该文的人也喜欢 更多

    ×
    ×

    ¥.00

    微信或支付宝扫码支付:

    开通即同意《个图VIP服务协议》

    全部>>