博弈论是研究互动决策的方法论。既然是互动决策,博弈便不是一个人的决策。每个人的身边都是和他一样的决策者。甲的决策对乙的决策产生影响,同样乙的决策也影响着甲的决策。乙的决策是对甲的决策的回应,同样甲的决策是对乙的决策做出的反应。人们往往没有意识到在决策时考虑了别人可能的反应,然而在现实生活中,人们的决策很可能是本能地,但又不经意地对别人的决策做出的反应。人们常说,出招的时候要先考虑对方会怎么回招,这个思考方法便是博弈思维。
人们的决策相互影响的例子很多。比如:恋爱中的情侣,他们之间的约会、示爱的行为存在着相互影响的决策关系;冷战时期的美苏核平衡是一种互动决策关系;寡头市场上,寡头企业关于产量和价格的决策是双方在考虑对方决策的基础上做出的回应;税务局与纳税企业之间,税收稽查与逃税行为之间存在互动决策关系;道路上行驶的汽车驾驶员在做“驾驶博弈”的互动;企业与工会之间的工资谈判是劳资谈判博弈。
一个博弈由三个要素构成。一是参与人,在一场博弈中,参与该博弈并有决策权的人就是参与人。二是策略,策略是实际可行的行动方案和行动规则,这个行动规则不是参与人某一个或者几个行动的规则,而是贯穿整个博弈过程和全局的行动方案和规则。三是得失或收益,参与人参与博弈必然有其利益在其中,人们之所以参与博弈是受到利益的吸引,对未来所获得利益的大小的预期直接关系到参与人的策略和博弈结果。得失或收益就是指参与人在博弈中能够获得什么样的利益,这个利益不是纯粹的经济利益,而是参与人使自己的各种需求、欲望得到的满足。博弈参与人在博弈中追求的是自身收益的最大化,而最大化的收益需要参与人寻找最佳策略(行动规则)来实现。
例如,驾驶博弈中,博弈的参与人是在路上驾驶的驾驶员。驾驶员的策略有:当别人靠右行驶时,我也靠右行驶;当别人靠右行驶时,我靠左行驶;当别人靠左行驶时,我也靠左行驶;当别人靠左行驶时,我靠右行驶。我们可以假设如果驾驶员都在同一个方向行驶,大家都得益,每人收益为1;大家都逆向行驶,行车不便,甚至撞车,每个驾驶员收益为-1。这个博弈的最优策略是当别人靠右行驶时,我也靠右行驶,或者当别人靠左行驶时,我也靠左行驶。博弈的结果是大家都靠一边行驶,要么像我国一样靠右行驶,要么像英国一样靠左行驶,每个驾驶员的收益是1。
博弈论的基本思维方法是向前展望,往回推理。向前展望就是在决策的时候要先考虑自己的决策可能引起对手的后续反应,以及后续反应之后的反应,依此推断对手在博弈中一步步接下来的反应,看清自己的行动将会导致怎样的后果,以及在对手做出反应后,双方的行动会出现什么结果。往回推理就是在向前展望的基础上,将展望的结果作为最初决策的相关因素加以考虑,从最后一步的结果开始,逐步往回倒推,只到博弈开始的第一步,找出自己在每一步的最优选择。例如,博弈中带有一个“弈”字就是因为下棋叫作对弈。下棋的思考过程就是典型的博弈思维过程。下棋的时候,棋手要向前盘算几步,并且考虑自己每一步的出招对方会怎么回招,自己再怎么接这个回招,以及这一个回合对下一个回合的后续影响,这是向前展望。在考虑好了后,再往回推理自己当前应该选择走出哪一步棋在后续的对弈回合中对自己最有利。