第10章 期望效用值理论本章主要讨论决策的准则问题。首先分析应用期望收益值作为决策准则存在的一些问题,从合理行为假设与偏好关系出发,引入效用函数的概念,从而把期望收益值推广到期望效用值。最后引入主观概率的概念,把决策准则进一步推广到主观期望效用值。这部分内容是决策分析的基础。 10.1 期望收益值10.1.1 期望收益值准则一般来讲,求解任何类型的决策问题,最后都归结为对各被选方案进行选择。而对方案的选择,我们可从两个方面来考虑:后果值、自然状态出现的概率。 由于方案后果在许多情况下,特别是经营管理决策中都用盈利、亏损这类指标,所以期望收益值成为决策分析发展过程中提出最早和应用最广泛的一种准则。收益值往往采用货币单位。当然,也可采用货币以外的定量单位。 期望收益值准则如下。 设 从统计学的角度出发,用数学期望来权衡方案的各种可能结果,希望从多次决策中取得的平均收益最大。 方案 若方案 则决策者选择 10.1.2 应用期望收益值作为决策准则存在的一些问题1.后果的多样性 后果可能反映直接经济效益、间接经济效益,也可能是生态效益、社会效益。当后果值是盈利、支出等可量化的指标时,采用期望收益值的方法是可行的,但当评价指标是一些不容易量化的软指标,如在例9.3中,如何确定期望收益值将是一个难以解决的问题,或者说期望收益值将变得没有意义。 2.决策往往是一次性的,采用期望后果值是否合理? 从概率论中我们知道,概率是频率的极限。也就是说,事件发生的概率是大量重复多次试验体现出的统计学意义上的规律。这有两层含义:其一,试验必须是可在完全相同的情况下重复进行的;其二,试验必须多次进行。而决策问题,特别是战略性的决策问题,往往不满足这样的要求。比如我们说:航天飞机的发射,其可靠性是99.7%, 是指通过理论上的计算得出,多次发射中成功发射出现的次数占99.7%。而对于一次发射而言,结果只能是要么失败要么成功。 下面我们来介绍数学史中的一个著名悖论。 例10.1 圣.彼得堡悖论(St. Petersberg Paradox) 1 正面 2 2 反面 22 3 23 n 2n 图10.1 圣.彼得堡悖论 现在问:为使赌徒有权参加这样的赌博,它应该先交多少钱才能使这样的赌博成为“公平的赌博”?所谓公平的赌博,是指参加赌博的任何一方输赢数额和机会是相等的。比如这样的猜硬币的赌局,所谓公平,是指赌徒和赌局的设立者应该有相同的机会获得相同的回报。用概率论的语言来讲,设X是一个随机变量,指赌徒在一局赌博中赢得的钱,则X的数学期望就是赌徒为参加这样的赌博应该先交的钱,因为在多次赌博之后,赌局的设立者获得的收入,应等于赌徒赚得的收入。用公式表示如下: 上式表示,不管赌徒应先交多少钱,他都是有利可图的,因为他不管每局交多少钱,都小于它可能得到的回报。然而,如果真有这样的赌局,又有哪个赌徒真地会这样做呢?这就产生一个悖论:理论上平等的赌博,在现实上是不可能有人敢于参加的,实际上也是无法实现的。 让我们考虑可猜的次数是有限的情况,设赌徒可猜10次,那么它的盈利的数学期望是10元,即交10元就有权参加这样的赌博,这样的赌博使参加的人不会感觉有多么大的风险,因为只有0.5的概率输8元,而最多可赢1024元,会有很多人愿意参加。然而,若赌徒可猜的次数是10000次,那么赌徒须交10000元才有权参加这样的赌博,同时,有1/2的是可能性输9998元,最多可赢 问题在于数学期望是建立在大样本基础上的,人们在参加次数较少的情况下,当然会更在意概率较大的事件。另外一方面,人们对同样理论上都是平等的赌博,在可能输的数额不大的情况下,愿意参加的人较多;而在可能输的数额巨大的情况下,就没有人愿意参加了。这实际上也是一个人们行为动机的心理的问题,人们对风险的认识并不一定与理论结果相符。 伯努利提出了精神价值即效用值的概念。人们在拥有不同财富的条件下,增加等量财富所感受到的效用值是不一样的。随着财富的增加,其效用值总是在增加,但效用值的增长速度是递减的。他建议用对数函数来衡量效用值。 其中,w表示现有财富,A表示愿意支付的最大可能赌金。和货币期望值不同的是,该式的和不是无穷大而是有限的。 尽管伯努利的解释并不完善,但他所发现的这一悖论和提出的效用值概念,却是决策理论的奠基石。 3.实际决策与理性决策是有差异的。 例10.2 巴斯葛“赌注”(Pascal’s Wager) 彼得堡悖论中人们不认可小概率收益,Pascal赌注则恰好相反,对小概率收益寄以厚望。 数学家巴斯葛置身于宗教生活之中,他酷信永恒安乐的价值是无穷的。即使获得这种永恒安乐的概率甚微,但其期望值仍然是无穷大,为这类极小概率事件而愿意花费极大的代价。这类现象在实际生活中也并不鲜见。如绝症患者只要有一线治愈希望就往往不惜代价去求医问药;某市领导当年决定上了一个工业园区的项目,随着时间的推移,其负面作用越来越明显。但作为其“政绩工程”,如果关闭势必影响到自己的威信和地位,因此只要有可能,总是试图继续维持。 彼得堡悖论对小概率事件不以为然,而巴斯葛“赌注”则相反,对小概率收益寄予厚望,满怀信心。然而,两者都能说明实际决策行为和理性决策的差异。 4.负效应 以货币为单位的期望收益值作为决策准则还有负效应引起的弊端。如掷硬币,方案A:若为正面,则赢5元,反面则输5元。方案B:若为正面赢5万元,反面则输5万元。E(A)=E(B)。但此时人们心目中已不采用期望收益值准则行事。依人们的价值观,损失5万元要比赢得5万元的效用值大,称为“负效用”。这样的例子有很多,如一个人工资涨了100元,他可能觉得没什么;但如减薪100元,那他肯定要问个明白,且感觉不舒服。 5.决策者的主观因素(价值观) 经济学中的边际效用递减规律是指随着某种物品消费量的增加,心理满足程度会以越来越缓慢的速度增加。在这里,这个规律在决策者的决策中当然会体现,即期望收益值的增加程度,并不一定等价于决策者心理上满足感的增加程度。从另一个方面讲,对于不同的决策者,同样的收益,不一定带来同样的心理上的满足。比如买衬衣。某甲原来的衬衣都已破旧,买了一件新的。某乙原有十几件新衬衣,再买一件。同样一件衬衣,在甲看来这件新衬衣比乙心目中的价值要高得多。 而且,不同决策者,对同样数额收益或损失的心理上的反应,会随着其个人经历、知识背景、性格特点及其他主观因素的不同而不同。经历过新中国成立初期困难时期的人,与改革开放后在较好的经济条件下成长的新一代,他们对同样物质生活水平的满足感是显然不同的。前者更能感受经济发展带来的生活水平的提高;而后者会认为这样的生活水平是理所应当的,并不觉得有什么太好。 综合以上五点,我们得出以下两点结论: 1) 需要一种能表述人们主观价值的衡量指标,而且它能综合衡量各种定量和定性的结果; 2) 这样的指标没有统一的客观评定尺度,因人而异,视各人的经济、社会和心理条件而定。 因此,需要探求一种较期望收益值更为完善的决策准则,使其能体现实际决策中决策者对方案的衡量指标,更适合于为决策者提供更加合理、有效,也更加体现决策者意图,更加人性化的决策分析中对方案的评价指标。这既是理论上的完善,也是决策理论向实际应用迈进的重要一步。 本章的目的,就是介绍这样一种合理的评价准则,即将后果值转换为效用值,以期望效用值作为方案选择的判别准则。为此,我们在下一节中先讨论行为假设与偏好的关系。 10.2 行为假设与偏好关系对于一个决策问题来说,每一种方案下对应于不同的自然状态都有一个后果值,于是每一方案的后果值可用一个向量来表示,但要评价各方案的优劣,我们必须将每一方案下的这个向量合并成一个数来反映方案的优劣。在此基础上,我们才能来对各方案进行优劣评价。因此,决策分析的首要问题在于建立一种有效的方法或模型来评价备选方案,而这种方法或模型必须要有可靠的理论基础,这就是下面将要介绍的关于决策的合理行为的假设以及由此引出的结论。 考虑风险型决策问题,即各自然状态的出现概率已知的情形。首先我们引入一些新的概念,以用来描述一个方案的结果,以及方案之间的关系和运算。 定义10.1 把具有两种或两种以上的可能结果的方案(行为)称为事态体,其中的各种可能结果为依一定概率出现的随机事件。如用记号 其中 全体事态体的集合F,称为事态体空间。F中所有可能后果的集合 称为后果集。 在单目标、多目标风险型决策问题中,每一个备选方案均可用一事态体表示。如果各自然状态的顺序已定,则 例10.3 有奖发票鼓励消费者索要发票,促使商家依法纳税。假设一消费者消费99元,商家此时有两种选择: 1) 给99元的发票(共6张,5面额分别为:50×1+20×2+5×1+2×2) 2) 给100元发票(一张100元面额) 设有两种可能的结果:中奖,不中奖。这两种选择下不同的可能结果分别用 假设每张发票的中奖概率为p,奖金10元,发票的税率为1%。为了分析的方便,我们设定顾客最多中奖一次。则这两种撕票的方案可用下面两个事态体表示 其中后果值为当天营业额的减少量: 我们通过下面三个步骤建立一种合理的公理化的评价准则。 第一步 一个概念——偏好关系 对于后果集 这种偏好关系“ 1)自反性 2)传递性 3)完备性 任何两个结果都可以比较优劣,即 在此基础上我们定义: 若 若 若 所以, 例如在例10.3中,显然有 下面我们基于偏好关系提出三条假设,将偏好关系推广到一般事态体的比较,由此得出一般事态体间的比较、运算法则。 第二步 三个假设――把后果集J中结果的比较推广到标准事态体间的比较。 假设10.1 设 其中 1)当p=q时,事态体 2)当p>q时,事态体 例10.4 两组有奖储蓄,均发行储蓄券1万张,两组中奖者均获得同样数目奖金(400元)。所不同的是,第一组拥有可中奖彩券150张,而第二组中只拥有可中奖彩券100张,试问你愿参加哪一个组? 设 于是,当 当 假设10.2 (连续性)设有两个事态体 这一假设同样可以用储蓄的例子来解释。 例10.5 如同例10.4,若两组中奖数额不同。设 具体解释请读者自己完成。 假设10.3 (无差关系、优越关系的传递性)设 1) 当 2) 当 这三条假设将后果的偏好关系推广到了事态体间的偏好关系。 从上述三条假设出发,我们可以推出下面两条重要结论。这两条结论实质上是以后内容的基础。 第三步 两个定理――决策分析的理论基础 定理10.1 设 证明: 如若 例10.6 (掷硬币事件)掷一枚硬币,假设掷出正面H(正)和掷出方面T(反)的概率均为0.5,A1(500,0;0.5),A2(200,200;0.5)。A1为风险型事件,A2为确定型事件。二者何为优先? 此时,A2-200元。若A2-500元,肯定不接受A1。若A2-0元,什么机会也没有,接受A1。 是否参与A1取决于另一个收益为确定值的方案,此确定值在0与500之间。可以推断,从肯定不参与到参与之间,此确定值相应有个转折点。这个转折点就是和事态体方案 如若 定理10.1的重要性是显然的,它在必然事件与简单事态体这样两种表面性质完全不同的事物之间建立了无差别类比的运算关系,体现了人对于不确定事件的“把握”与“判断”。前者是确定的结局,后者则具有多种可能的结果。这种将随机性的情形化成等价的确定性情形的过程,实际上成了基于效用函数理论的决策分析方法的理论基础。下面的定理进一步说明任一有n种可能结果的事态体还可化为一个无差别的简单事态体,从而也可无差别于一个必然事件。 定理10.2 (简化性)任一有n种可能结果的事态体 其中, 证明: 对 因为 定理得证。 ~ T ~ ~ ~ 这个定理告诉我们,任意一个标准事态体都可以转化成一个简单事态体,从而任意两个有多种可能结果的标准事态体之间的比较可以转化成与之无差的两个简单事态体的比较,且这两个事态体具有相同的结果,即可由假设10.1得出比较结果。基于无差关系和偏好关系的传递性,对于多个事态体的排序,也可由此方法完成。 上述三个假设和两个定理作为决策分析的理论基础具有十分重要的意义。在求解含有不确定因素的决策问题中,每个方案因不确定的自然状态都有若干种可能的结果。因此可被看成一个个的事态体,当它们满足前面三个假设时,由上面的两个定理可知,这些事态体都是可以进行比较的,因而这类决策问题的备选方案都可以排出优劣顺序。也就是说,对于理性的决策者,决策总可由这样一个结构化的过程完成,具体的说,对于方案集 其中 比较 由此可以看出,对于方案集中各个备选方案 式(10.2.5)反映了 10.3 效用函数及其确定10.3.1 效用函数的定义
在给出效用函数的定义之前必须说明,由于效用概念出自于经济学,决策理论及其它一些学科按照自身需要引入了这一概念,所以对它的定义是不可能都一样的。本书只是从决策分析的角度,利用效用这一概念来表示决策分析中的价值形态观念。如果它与其它学科或论著中的定义有所不同,也不妨碍我们的讨论。 定义10.2 对于一个决策问题中同一目标准则下的n个可能结果所构成的后果集 若定义在集 1) 单调性: 2) 3) 若 其中 特别,若取 效用函数定义中的条件3)亦可换成: 3)‘ 定义了效用函数,要比较m个方案 的优劣,由上节定理10.2, 我们看到,效用函数的定义并没有限制其唯一性。也就是说,同一事态体空间可以有不同的效用函数。这是因为效用函数体现的是方案的后果值对决策主体所能提供的作用或价值,强调决策主体主观的满意程度,因此,同样的后果对不同的决策者自然可以有不同的效用。即使是同一决策者,在不同的环境下对同一结果的主观体验也可能不同。这种与决策者主观的统一,使得决策的结果更加有效,但也使得效用函数的确定变得困难。 10.3.2 效用函数的确定我们知道效用函数的定义没有限制其唯一性,效用函数没有正误之分,只体现决策者的主观偏好;但是,在具体的环境下,方案后果的效用值是可以确定的,而且效用值的大小最终取决于决策者的估算。但若对每一个结果的效用值都由决策者估算,显然是繁琐甚至是不可能的。根据经验我们发现,决策者对效用值的估计,主要决定于其对风险的态度,并且有一定的模式和类型。 确定效用函数的思路是:对于方案空间,首先找到决策者最满意和最不满意的后果值 例10.7 为设计鲜花,考虑某人对一束鲜花中花的数目的效用函数,我们的后果值空间是[0,100],该决策者对其定义的偏序关系 第一步,确定最优及最差的后果值。 显然, 第二步,确定0枝与100枝之间的若干个点的效用值,并对决策者进行问答,以测定决策者对不同方案的反应。 1)假设有两个方案:① 决策者可获赠一束50枝的鲜花;② 以0.5概率获得一束100枝的鲜花,或没有;简写为(100,0;0.5)。供决策者选择。 回答:选择方案① 得出50枝的鲜花的效用优于方案(100,0;0.5)的效用,即 2)将方案①变为可获赠一束30枝的鲜花。 回答:选择方案② 得出30枝的鲜花的效用差于方案(100,0;0.5)的效用,即 3)方案①变为可获赠一束40枝的鲜花。 回答:选择方案① 得出40枝的鲜花的效用优于方案(100,0;0.5)的效用,即 4)方案①变为可获赠一束35枝的鲜花。 回答:无所谓,两种方案均可。 此时我们认为方案①无差于方案②。根据效用函数定义的性质2,得出 记 5)将方案②变为(100,35;0.5),问与之无差的确定性获赠的枝数。 依上述方法反复提问,得到当可获赠60枝时,与新的方案②难以取舍,所以 即 此时我们已得到效用曲线上4个点: 如此反复进行,可找到点 图10.2 鲜花的效用曲线 10.3.3 L-A模拟法
图10.3 三种类型的效用曲线 1) 风险中性型:曲线斜率为常数。表明决策者在每增加1单位产出时所得到的满足感都是相同的,而每减少1单位产出时的失望也是相同的。如图10.3中C2所示。 2) 风险规避型:曲线的斜率在差的产出水平比好的产出水平大。说明摆脱差的产出带给决策者的欢乐程度比放弃好的产出带给决策者的痛苦程度大。如图10.3中C1所示。 3) 风险偏好型:曲线的斜率在好的产出水平比差的产出水平大。说明决策者更关心方案的结果较好时其结果的变化。如图10.3中C3所示。 还有一些由基本类型组合而成的类型,如S形曲线。 L-A模拟法就是根据上面的假设,即假设决策者的效用函数符合某种特殊类型的曲线,得出的一种简便的得到决策者效用曲线的方法。其基本思想是:根据假设的效用函数类型,通过得到几个效用函数点,确定其函数的参数。 图10.4 S型效用曲线 此外还有其他一些类型的效用函数,如 幂函数表达式: 对数函数表达式: 图10.5 火灾保保险问题的决策树 某企业欲将价值为A元的厂房设备申报火灾保险。如保险,明年要付保险金i元,明年内如发生火灾,所有损失将全部赔偿;如不保险,一旦发生火灾,则损失B元(B<A)。试决定是否参加投保。 事态体 即,只有火灾出现的概率大于保险金和火灾损失之比,以参加保险为优。如500万元财产,保险金1万元, 但事实并非如此,即使概率小于此数人们还是愿意保险。人们总是力求万无一失,而愿意付出比期望收益值准则算出的保险金要高得多的费用。这可以用效用函数来得到明确解释。如图10.6所示,依期望效用值, 图10.6 火灾保险的效用曲线 图10.7 新产品开发的效用曲线 例10.9 某公司计划开发某种新产品,现有三种设计方案,市场的未来预测有好、中、差三种可能,在每种自然状态下各方案的收益如表10.1所示。求依期望效用最大的原则所作出的决策。 表10.1 开发新产品的三种方案的收益值
求解步骤如下: 首先,我们将各收益值归一化,令 各收益值所对应的效用值如表10.2所示。 表10.2 各收益值所对应的效用值
根据表中数据及期望效用值的定义 所以,方案B为最优。从本案例我们看出,该决策者属于风险规避型,其决策较为保守,对损失更加敏感,倾向于稳妥的方案。 10.4 主观期望效用值关于概率的处理,是期望效用值理论中一个引起争论的问题。这主要涉及到主观概率与客观概率。 10.4.1 主观概率与客观概率
概率的定义可分为两类:主观概率和客观概率。客观概率是指建立在等可能性基础上的古典概率和建立在大量重复试验基础上的统计概率。古典概率建立在“等可能性”这个比较原始概念的基础之上,如果一个事件A可以划分为M个后果而这些都属于n个两两互不相容且等可能的事件所构成的完备事件组,则事件A的概率等于 客观概率在自然科学和工程技术领域应用非常广泛,但也有它的一些缺陷: 1) 古典定义在考虑复杂问题时会遇到困难。许多场合能否符合等可能性就成问题。 2) 对于统计定义, l 概率是频率的“极限”,很难估计一个精确值。 l 所采用的样本常不清楚。如开车出现车祸的概率,指哪一时间段?哪一地域?哪种类型的车? l 精确重复的概念有问题。如掷硬币真正是完全重复,那么它应产生同样的结果。这就引出了不确定源的问题。到底是来自内部世界还是外部世界,答案和每个人的世界观密切相关。有人认为存在不可避免的不确定性,有人则排斥真正的随机性。 拉姆斯、菲拉迪、萨维奇等提出了和客观概率相对应的主观概率的概念,认为概率所反映的是主观心理对事件发生所抱有的“信念程度”(degree of beliefs),它既适应于重复事件,也适应于像台海战争是否爆发这样一类单一事件。大量的研究成果说明,概率主观估算不仅有效,而且比没有这种估算要更可取得多。因此,主观概率应同客观概率一样被应用,尤其在经济决策、项目决策等问题上,主观概率有其用武之地。 主观概率和人们对此不确定事件的认识(知识)有关,概率的确定相当于其知识状态的反映。如甲乙两人做游戏,拿一长一短两根火柴,甲每次出一根,乙猜这根火柴是长还是短。如已进行过6次,第一次为短,其余均为长,第七次出短的概率为多少?尽管第七次出长出短理应独立于前六次的结果,但乙会根据对甲性格的了解以及前五次甲出长的结果估计下一次出短的概率应大于0.5。在这种场合,人们对事件实际发生的概率作出符合它们对事件发生可能性认识的直觉判断,称为主观概率。 人们常常根据长期积累的经验以及对预测与决策事件的了解,从而对事件发生的可能性大小作主观估计。不同的人员对同一事件发生的可能性有不同的相信程度,因此,主观概率出现的答案可能会多种多样。 主观概率与客观概率一样,必须满足概率的三条基本公理,设 (1) 0≤ (2) (3) 若 主观概率与客观概率的主要区别是,主观概率无法用试验或统计的方法来检验它的正确性。例如,在某项投标中,一个投标者认为他提出的报价中标的可能性是90%,失标的可能性为10%;而另一个投标者,在完全相同的情况下,则认为中标的可能性为70%,失标的可能性为30%。对于这两种主观概率估计是无法断言哪个正确的,即使中标了也如此。尽管二者的含义不同,但在实用中两者仍有密切联系。按古典概率和统计概率定义求得的客观概率可以作为判定主观概率的基础。如根据统计数据,4000次火警中有1000次错报,则消防人员判断火警错报的主观概率可能就据此定为0.25,即使上述猜火柴长短的情况,判断第7次出长的可能性较大,但仍然考虑到客观概率为0.5这个“等可能性”的情况。如果有两根长火柴,一根短火柴,则可能作出另一种判断。可以说,客观概率是判断主观概率所依据的重要知识。 主观概率虽不具有客观概率那样的可检验性,但在许多经济项目的预测和决策中,又是不可缺少的一种常用方法,特别是在历史资料既不齐全又不适用的条件下,常常采用主观概率法进行预测和决策。 10.4.2 主观概率的判断
为了使主观概率的概念能够实用,萨维奇提出了参考事态体的概念以判断事件的主观概率。以例说明: 问题:产品A下季度销售量大于3000台的概率是多少? 设计两个事态体: 图10.8 主观概率分布曲线 在本例中,如选定的参考事态体由70只红球,30只白球组成,则表示判断者认为下季度产品A的销量大于3000台的概率为0.7。这个过程可以继续下去,以判断销售量超出其他数量的概率,如按同样步骤得出销量超过1000台、2000台、4000台、5000台的主观概率分别为0.9,0.85,0.45,0.25,则可给出图10.8的概率分布曲线。 求估主观概率,除上述方法外,还有一种方法,称为专家咨询法。这种方法类似于Delphi法,即把要估计的概率和相关资料,聘请有经验的专家进行评估,填写有关表格。待专家评估后,再作适当的数据处理,即可得到主观概率的估计值。 此时,主观期望效用值表达式为 这样,我们把决策准则从期望收益值推广到期望效用值,再推广到了主观期望效用值。 思考与练习: 1. 概念题: 1) 无差关系;2)偏好关系;3)效用函数;4)事件的事态体表示 2. 期望收益值作为决策的准则有什么不足?试以例说明。 3. 什么是效用函数?试叙述如何确定效用函数。 4. 试以有奖储蓄为例对假设2(连续性)作以说明。 5. 某零售商准备外出组织货源,有关资料经预测列于下表。通过对该零售商的提问得:u (3250)=1, u (2050)=0,u (2200)=0.5,并基本确定其效用函数为 1)用期望收益值准则求行动方案; 2)求解该零售商对此决策问题的效用函数; 3)用期望效用值准则求行动方案; 4)对两种准则的决策结果进行对比分析。
|
|