分享

关于概率思维的一个思想和一个工具

 九把叉 2022-12-16 发布于上海


我猜你大概玩过这样一个游戏:一个人在脑海里想一个人名,其他人通过问问题来猜出这个人名,每个问题都只能回答是或者不是。于是,猜的人通常都会问“是不是男的?”“是不是中国人?”等等,一点点缩小范围,最后得出答案。这个游戏看起来简单,但是却跟一个听起来很厉害的名词有关,那就是贝叶斯推理。

01

一个思想

什么是“贝叶斯推理”?就是先对某件事的可能性给出一个初始概率,也被称之为“先验概率”,然后根据后期得到的新的条件,对先验概率进行调整,得出更新之后的概率的过程。所以,贝叶斯推理强调的是动态调整,也就是能够根据新的数据不断的调整原有的结论。我们常常会说一个人要有一个“贝叶斯脑”,意思就是说一个人应该保持开放的心态,对固有的理念能够根据新的信息不断更新,而不是一直抱成守见,形成低水平的闭环。

贝叶斯推理听起来很高深,其实日常生活中我们很多情况下在不自觉的使用。比如判断一个面试者是否合适,你会根据TA的简历、衣着、谈吐等等一点点调整自己的判断;判断一家餐厅是否好吃,你会根据它的网评分数、餐厅环境和菜谱设计等等来调整自己的评估;在打麻将的时候,你也会根据自己手里的牌,以及每一圈别人打出来的牌来判断哪些牌更容易摸到。这些,其实都是一个贝叶斯推理的过程。

02

一个工具

那么具体如何根据新的条件来计算新的概率呢?贝叶斯公式是这样表达的:

是不是觉得有点晕?别担心,我不是想要教你理解这个公式的。除非你想从事专门的统计学研究,否则没必要去跟这个公式较劲。但是,我们可以用一个更为直观的方法来计算概率的变化,我把这种方法称之为“矩形面积计算法”

具体怎么算呢?我们来通过一个例子来学习一下。

假设有一家癌症检测机构,它的检测准确率是95%。大柱子在这里做了一次检测,结果是阳性。请问:大柱子真的得了癌症的概率是多少呢?

有人可能会说,那就是95%呗。当然不是。为什么呢?让我们首先来拆解一下,所谓“准确率为95%”是个什么意思?

假如一个已经得了癌症的人来这里检测,那么95%的准确率意味着:TA有95%的可能性被检测为阳性,也有5%的可能性被检测为阴性。而对于一个健康的人来这里检测,则95%的可能性被检测为阴性,但是也有5%的可能性被误诊为阳性。这就是“准确率为95%”的准确含义。

(图一)

那么,大柱子得癌症的概率到底有多大呢?

这里,我们首先要引入一个“先验概率”——假设这种癌症在人群中的整体得病概率为千分之一。如果用一个边长为1的正方形来表示,那么得癌症的人群所在的这块矩形,面积是0.001*1=0.1%,而没得癌症的人群所在矩形的面积是0.999*1=99.9%。

然后,我们加上后验概率,也就是大柱子被检测为阳性的准确率为95%。根据图一的表格,会出现4种情况:得了癌症确诊为阳性,得了癌症误诊为阴性,没得癌症确诊为阴性,没得癌症误诊为阳性。4种情况分别对应4个矩形。由于大柱子的检测结果为阳性,因为我们可以把结果为阴性的矩形去掉,剩下得了癌症确诊为阳性和没得癌症误诊为阳性两个矩形,其面积分别为0.001*0.95=0.095%,和0.999*0.05=4.995%。

那么,大柱子真的得了癌症的概率,应该是用第一个矩形,也就是得了癌症确诊为阳性的面积,除以这两个矩形的面积之和,结果是0.095%/(0.095%+4.995%)=1.86%。

是不是并没有95%看起来那么可怕?当然,这个概率比原来的千分之一上升了一个数量级,已经非常严重了,但是也还没有到绝望的地步。这,就是理性计算的作用。

这就是“矩形面积计算法”,用这样一个可视化的直观工具来帮助计算概率的叠加,是不是相对清晰简单很多?

03

三个收获

掌握了计算概率的方法,那么培养“贝叶斯脑”的关键,就在于善于把一些模糊的概念,转化为具体可衡量的数字。比如“得癌症的概率很高”转化为“得癌症的概率为1.86%”,这样就有了更为清晰的衡量标准。而在把模糊的概念数字化的过程中,你至少还会有三个收获:

首先,数字化的过程就是一个深度思考的过程。因为当我们在考虑应该给这个模糊的概念多大数值的时候,我们就需要全面的进行分析和比较,就等于对这件事进行了一次全方位的审视。比如,我们在跟踪一个项目的时候,经常需要计算项目的成功率,而不是简单的用成功希望“很大”或者“很小”来描述。那么,如何来给出一个恰当的数值呢?你就必须针对不同的进展赋予不同的数值,比如是否见到关键人,是否参与了方案设计,是否成为入围品牌,每一个答案都会成为一个“后验概率”,从而改变整体的成功率数值。

然后,数字化也有助于目标的可视化。当我们针对一件事有了一个明确的数值,那么就有了一个更为清晰的目标,因为对于人脑的理解方式来讲,对于形容词的理解永远千差万别,但是对于数字的理解则更为清晰和统一。

最后, 数字化也有助于我们对一件事进行管理和改善,因为“你无法管理你不能衡量的东西”。比如说我们说要减肥,就首先要了解自己的体重和体脂率,然后才能知道该如何“减肥”。否则,你可能忙活了半天都没什么变化,自己却无从知道。

如果你想提高自己的数字化思维能力,得到APP里有很多很好的课程可以帮助你建立相关的思路和方法,比如刘嘉老师的《概率论》、老喻的《人生算法》、宣明栋老师的《数据思维》等等。当然还有很多书,比如这本《统计学关我什么事》,前面介绍的“矩形面积计算法”就是我从这本书里读到的。

04

一个提醒

当然,虽然我讲了很多很多数字化的好处,最后的最后,我还想要强调一句:不是所有的事情都可以进行数字化转换的。比如说感情,就不是一种可以数字化的东西。爱因斯坦曾经说过:“不是每一件算得出来的事,都有意义;也不是每一件有意义的事,都能够被算出来。”因此,一定要掌握好数字化的度,不要拿着锤子看所有东西都是钉子。刘擎老师在他的课程——《西方思想40讲》中曾经说过一句话:“人类因为理性而伟大,因为知道理性的局限而成熟。”我想,对于每个具体的人来说,伟大可能称不上,但成长是一定的,所以我斗胆把刘擎老师的话改动几个字,供你我共勉:

人们因为理性而成长,因为知道理性的局限而成熟。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多