分享

根据结果倒推原因——贝叶斯定理

 黄元章553333 2019-04-01

这是《机器学习中的数学基础》系列的第18篇,也是概率与统计的第2篇。

在我们的日常生活中,有些事件的原因不好观察或者推测,我们往往会通过结果来倒推原因。常见的应用比如根据收到的邮件内容来判断该邮件是否为垃圾邮件;根据收到的图像数据来判断手写的数字等等。而在这种过程中,贝叶斯定理就会发挥它的作用。

  • 贝叶斯定理的由来

首先要说的是,贝叶斯定理就是由贝叶斯本人提出的。贝叶斯是个牧师,也是个数学家。他为统计学和概率论领域做出了巨大的贡献。

根据结果倒推原因——贝叶斯定理

贝叶斯本人(来源:网络)

  • 全概率公式

接下来,我们看什么叫做全概率公式。现在假设有一个事件B,它在很多个互斥事件A1、A2...An之后才发生。那么p(B)=p(A1)p(B丨A1)+p(A2)p(B丨A2)+...+p(An)p(B丨An)。我们就把这个式子叫做全概率公式。它有什么用呢?如果事件B的概率不好计算,我们可以把它切分成在不同互斥事件下分别发生的概率之和。

  • 贝叶斯定理

那么我们的贝叶斯定理就可以表示为:

根据结果倒推原因——贝叶斯定理

我们就把要求的p(A1丨B)叫做后验概率,而p(A1)叫做先验概率。我们经常做的就是通过先验概率来求解后验概率。

  • 应用

我们还是举个例子来说明下贝叶斯定理的应用。

假设X星球上有100万人,其中仅有10个超能力者。我们现在有一个超能力检测仪,它可以检测出一个人是否具有超能力。但是,它并不是很准确,有1%的错误率。也就是说,它有1%的可能把正常人检测为超能力者,也有1%的可能把超能力者检测为正常人。

现在我们想知道,如果这个仪器检测出一个人是超能力者,那么他确实就是超能力人的概率是多大呢?

我们把仪器检测出超能力者的概率记为p(B),把一个人是超能力者的概率记为p(A1),那么我们要求的就是p(A1丨B)。根据贝叶斯公式,我们可以得出:

根据结果倒推原因——贝叶斯定理

我们一个一个来看。p(A1)就是先验概率,代表一个人是超能力者的概率,我们有p(A1)=10/1000000=1/100000。

p(B丨A1)表示如果你是超能力者,那么把你检测为超能力者的概率。根据题目,我们有p(B丨A1)=1-1%=99%=0.99。

那么p(A2)是啥?注意到p(A1)和p(A2)互斥,也就是说p(A2)代表一个人不是超能力者的概率,它等于1-p(A1)=1-1/100000=99999/100000。

p(B丨A2)就表示如果一个人是正常人,那么把他检测为超能力者的概率,我们有p(B丨A2)=1%=0.01。

把上述结果代入到公式中,我们就可以得到:

根据结果倒推原因——贝叶斯定理

可以看到,最后的结果仅为0.1%。即使我们的检测仪器的精度达到了99%,但因为先验概率极低,因此最后得到的后验概率也是很低的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多