贝叶斯定理：我们几乎每天都在使用的数学工具

dinghj 2018-02-24

展开全文

我们的世界观和因其导致的行为往往是由一个简单的定理促成的，在150多年前，这个定理由一位性格内向的英国数学家和神学家托马斯·贝叶斯（Thomas Bayes）悄悄设计，直到他去世后才将其发表。

贝叶斯定理最著名的运用之一是在二战期间被用来破解纳粹的恩尼格码密码。如今，该定理更是广泛深入的被运用在科学、技术、医学等领域。

但什么是贝叶斯定理？它又是如何运作的呢？

贝叶斯定理

托马斯·贝叶斯的洞察力非常简明。一个假设是真实的概率取决于两个标准：

根据当前的知识（“先验”），判断它的合理程度；
评估它与新的证据的契合程度。

然而，在贝叶斯去世后的100多年里，科学家通常仅通过对新的证据来评估他们提出的假设。这是我们大多数人在科学课上受到的传统的假设-检验(频率论者)方法的教育。当一个不合理的解释与一个新的证据完美契合时，贝叶斯定理和频率论者的方法之间的区别尤为明显。

让我们先来制造一个假设：

“月亮是用奶酪做的！”

△一个不合理的假设。（图片来源：Mike Lee)

接着，我们仰望星空，并收集相关的新证据，并发现月亮的颜色是奶酪黄。在传统的假设-检验框架中，我们会得出新的证据与我们天马行空的假设相符的结论，从而增加了我们对该假设的信心。

△传统的假设-检验方法（频繁方法）只考虑一个假设与新证据的适合程度。(图片来源：Mike Lee)

但如果使用贝叶斯定理，就会得到更加谨慎的结论。我们会意识到虽然这个假设符合新的证据，但这个想法从一开始便极其荒唐，它违背了我们对宇宙学和矿物学所熟识的一切知识。因此，月球是奶酪的综合概率（即这两项评估的乘积）依旧是很低的。

△贝叶斯推理考虑了假设符合现有知识的程度以及它符合新证据的程度。为了简单起见，公式中省略了归一化常数。(图片来源：Mike Lee)

当然，这只是一个极端的例子。没有哪位正经科学家会试图检验这样一个荒诞的假设。但是，全球科学家们总在不断评估大量的假设，而其中一些假设是相当牵强的。

例如，2010年有一项研究最初表明：

“持有温和政治观点的人可以看到更多的灰色。”

后来这个假设在进一步检验后被驳回，研究人员认识到这是不可信的。然而几乎可以肯定的是，有许多类似的研究已被草率的接受。

生活中的贝叶斯方法

运用先前的经验和记忆中积累的知识、和意识中提炼出的新证据，我们对日常事物的概率进行分配和生活进行管理。

举一个生活中的简单事件：接听手机。通常在工作时你将它放在办公桌上，而在家里时把它放在在充电器上。现在你在家里的小花园里浇花，听到屋内电话声响起。新的数据会告诉你它处于室内任何地方，但你仍会直接走向充电器。因为你将的先前对手机位置的认知（通常在办公桌上或家中的充电器上）与新的证据（房屋的某处）相结合，从而确定了它的位置。

如果手机不在充电器上，那么你会唤起先前你在某些放置过手机的位置的认知来缩小搜索范围。你会忽略房子里大部分的地方，如冰箱、袜子抽屉等等，因为这些地方在你先前所积累的认知中被认定为极不可能的位置，你会在最终找到电话之前思考最可能的地方。

而在这个找电话的过程中，你便正在使用贝叶斯定理。

认知和证据

贝叶斯推理的一个特征是：当数据较弱时，那么先前对事物的认知是最重要的。这个原则一直被我们直觉性地使用。

例如，你在酒吧玩飞镖，附近的陌生人说他(她)是专业的飞镖选手，那么一开始你很可能会假设这个人在开玩笑。

你对这个陌生人一无所知，但你知道遇到一个真正的专业飞镖选手的几率很小。比如在澳大利亚，专业的飞镖选手只有大约15名。假如他扔了一只飞镖正中靶心，你可能还是不会相信他的说法，因为这可能只是走运的成分。但如果他连续十次都击中靶心，你会更倾向于接受他是专业人士的说法。因为随着新证据的积累，你之前的认知被超越。贝叶斯定理再次起到作用。

一个统管它们的理论

现在，贝叶斯推理支撑着广泛的人类调查领域，从癌症筛查到全球变暖，从遗传学到货币政策等等等等。

例如，贝叶斯推理是风险评估和保险行业的基础。每次飓风或洪水袭击一个地区时，保险费都会飞涨。为什么？