图文详解：泊松分布公式推导

东秋元图书馆 2024-05-10 发布于河北

展开全文

全文2708字，读完约需10分钟。

此文先简要回顾泊松分布有关的背景知识，然后以图的形式呈现公式推导过程，希望帮助初学者更好地理解和掌握这一知识。

如读者已掌握伯努利分布、二项分布的背景知识，可考虑直接跳至 03 泊松分布的推导过程。

（图片来自电影《决胜21点》）

01 泊松分布概览

泊松分布是用来描述小概率事件分布的方法。它是指随机事件A发生的概率很小，但试验次数n很大的分布情况。

在书本上，泊松分布是这样定义的：

用X代表随机事件发生的次数，如果随机事件A发生的概率是p，进行n次独立试验，恰巧发生了k次，则相应的概率可以用以下公式计算：

（1.1）

小贴士：当p趋于0，n趋于无穷大时，n·p会是一个常数，即λ，表示为λ=n·p。

泊松分布会涉及到极限、伯努利分布和二项分布的知识，在介绍泊松分布的推导公式之前，我想先简单介绍必要的知识。

02 泊松分布背景知识

极限思想

极限，一言以蔽之，就是无限逼近的意思。

简单来说，e是增长的极限。即用很大的数字代入（2.1），仍可以得到e的近似值。这一过程用数学公式表示如下：

（2.1）

不知道应用情景也没关系，后面我们会用到，这里先跟大家提一下~

小贴士：极限的符号为lim，它出自拉丁文limit（界限）的前三个字母。无穷，又称无限大，其数学符号为∞。“x趋于∞”在数学语言中，用“x→∞”表示。

公式中的e是增长的极限，以瑞士数学家欧拉命名，被称为欧拉数（Euler number），是一个无限不循环小数，值约为2.718281828459045（不用记忆，了解就好~）。

泊松分布的基础：从伯努利分布到二项分布

泊松分布是二项分布的极端情况，而二项分布又源于伯努利分布。因此，为了更好地理解泊松分布，我想先简单介绍伯努利分布和二项分布。

（1）伯努利分布

数学家伯努利想了解事件发生的规律，因此选择从最简单、可重复的试验入手研究，这一试验被称为“伯努利试验”。由于努伯利试验只有两个结果，即“发生”或“不发生”，因此得到的概率分布也被称为两点分布（或伯努利分布）。

伯努利试验简单到只有两种结果，A或，没有第三种状态。若只进行一次伯努利试验，则为事件A或出现，事件的概率为 p（A）=p，p（）=q（p≥0，q≥0，且p+q=1）。用图表示如下：

伯努利试验中，当试验次数很大时，事件发生的频率趋近于它的概率。换句话说，在试验不变的条件下，重复试验多次，随机事件的频率近似于它的概率。

举个经典的抛硬币的例子你就明白了。掷一枚均匀的硬币，正面或反面朝上的概率均为50%（硬币如立起来，则不计入次数，重新抛），但在我们的实际抛掷中，可能出现掷10次硬币，正面朝上7次，反面朝上3次，甚至会出现0次反面朝上的情况。

造成试验结果和理论不一致的原因，并不是硬币或我们抛掷手法有问题，而在于随机性本身，具体来说，是因为抛10次太少。当我们继续增加试验次数，比如增加到10,000次，就会发现正面朝上的频率近似于它的概率，即50%。如下图：

伯努利分布是二项分布的一种特殊情况，可以看作是只进行一次试验的二项分布。当试验次数n=1时，二项分布就退化为伯努利分布。换句话说，伯努利分布是二项分布在试验次数为1时的特例。

（2）二项分布

二项分布描述了在固定次数的独立伯努利试验中，成功次数的概率。

在二项分布中，实验需要满足三个条件：

1）只能有两个结果，A或；

2）独立，即事件与事件之间不会相互影响；

3）重复，包含两种情况，一是一个人重复多次，二是多人重复一次。

具体来说，假设有一个伯努利试验，成功事件（A）的概率为p，失败事件（）的概率为1-p，这个试验被独立重复n次，那么成功的次数X就服从二项分布。它可以用以下公式表示：

P（X=k）=（2.2）

小贴士：从n个物品中挑选出k个的组合数，还可以表示为。需注意，在两种表示方法中，和的字母顺序是倒过来的。

=，这里主要用到的是排列组合的知识，（对排列组合不了解的小伙伴可以看我的往期文章：《从加、乘原理到排列组合》）。

举一个打篮球的简单例子，来展示二项分布的应用。假设投篮只有“中”和“不中”两种可能，小刘投篮命中的概率为0.8，她投了7次。若x代表恰投中的次数，若x=5，则小刘投7次中5次事件的发生概率是多少？

因为是二项分布，所以事件概率之和为1，因此未命中的概率为1-0.8=0.2。

假设第1、2次没有投中，后面3到7次均投中，那么这一种情况的概率为：p1=0.2x0.2x0.8x0.8x0.8x0.8x0.8。

每一种情况发生的概率都是相同的，因此我们侧重点应该放在有多少种情况。用排列组合的知识简化单个计算的过程，可得式子：

（2.3）

拆分上式，排列式展开计算为：

（2.4）

将（2.4）的结果带入式子计算，p（x=5）=21x0.33x0.04=0.2772，用百分数表示为p（x=5）=0.2772x100%=27.72%。

因此，小刘投7次中5次事件的发生概率是27.72%。

热身结束。

恭喜你，耐心看完了背景知识，后面的知识理解起来会变容易。

下面，让我们正式进入泊松分布吧~

二项分布的极端情况：泊松分布

泊松分布是二项分布的极端情况，它是指在p很小，但n趋近于无穷大的情况时，事情发生的概率。

在泊松分布中，X代表随机事件发生的次数，如果随机事件A发生的概率是p，进行n次独立试验，恰巧发生了k次，则相应的概率可用以下公式表示：

（1.1）

泊松分布的推导建立在二项式分布的公式（2.2）之上，它是二项分布的极端情况。

当p→0，n→∞时，n·p会是一个常数，即λ，表示为n·p=λ。

现在，让我们再来回顾下二项分布的公式：

P（X=k）=（2.2）

遵循用已知求未知的化简思路，公式推导的关键在于用代入二项式分布的公式（2.2），逐步推导，就可以得到泊松分布的公式。

推导会涉及到一些技巧，为了让思考过程更清楚，我用图来展示。

03 泊松分布推导过程

接上文，用代入二项式分布的公式（2.2），逐步推导，可得泊松分布的公式。推导思路和过程如下：

挖掘隐藏信息，为后续的化简提供更多条件：

代入化简：

调换分子分母，得到新式子，继续化简：

观察式子，进一步拆解：

继续观察式子，尝试用已知解决未知：

怎么样？泊松分布是不是没有想象中的难？有疑惑也没关系，说明你在积极地思考，尝试挖掘更多信息~

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：东秋元图书馆 > 《高数》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

东秋元图书馆

关注对话

TA的最新馆藏

掌握牲猪生长规律，在短时间内育成肥猪，才能获得较高的养殖回报
猪涨肚是什么原因引起的？养猪人一定要重视
快看！猪脑炎型链球菌的最佳预防治疗方法
母猪跛行是什么原因造成的？如何预防？
猪场顽固性咳喘开始爆发，如何去治疗？
我们是怎样把母猪产力一步步搞没的？

喜欢该文的人也喜欢更多

热门阅读换一换