分享

图文详解:泊松分布公式推导

 东秋元图书馆 2024-05-10 发布于河北
全文2708字,读完约需10分钟。
此文先简要回顾泊松分布有关的背景知识,然后以图的形式呈现公式推导过程,希望帮助初学者更好地理解和掌握这一知识
如读者已掌握伯努利分布、二项分布的背景知识,可考虑直接跳至 03 泊松分布的推导过程。

图片(图片来自电影《决胜21点》)

01 泊松分布概览

泊松分布是用来描述小概率事件分布的方法。它是指随机事件A发生的概率很小,但试验次数n很大的分布情况。
在书本上,泊松分布是这样定义的:
X代表随机事件发生的次数,如果随机事件A发生的概率是p,进行n次独立试验,恰巧发生了k次,则相应的概率可以用以下公式计算:
图片(1.1)

小贴士:当p趋于0,n趋于无穷大时,n·p会是一个常数,即λ,表示为λ=n·p

泊松分布会涉及到极限、伯努利分布和二项分布的知识,在介绍泊松分布的推导公式之前,我想先简单介绍必要的知识
02 泊松分布背景知识
  • 极限思想

极限,一言以蔽之,就是无限逼近的意思。

简单来说,e是增长的极限。即用很大的数字代入(2.1),仍可以得到e的近似值。这一过程用数学公式表示如下:

图片(2.1)
不知道应用情景也没关系,后面我们会用到,这里先跟大家提一下~

小贴士:极限的符号为lim,它出自拉丁文limit(界限)的前三个字母。无穷,又称无限大,其数学符号为∞。x趋于”在数学语言中,用“x”表示。

公式中的e是增长的极限,以瑞士数学家欧拉命名,被称为欧拉数(Euler number),是一个无限不循环小数,值约为2.718281828459045(不用记忆,了解就好~)。
  • 泊松分布的基础:从伯努利分布到二项分布

泊松分布是二项分布的极端情况,而二项分布又源于伯努利分布。因此,为了更好地理解泊松分布,我想先简单介绍伯努利分布二项分布

(1)伯努利分布

数学家伯努利想了解事件发生的规律,因此选择从最简单、可重复的试验入手研究,这一试验被称为“伯努利试验”由于努伯利试验只有两个结果,即“发生”或“不发生”,因此得到的概率分布也被称为两点分布(或伯努利分布)。

伯努利试验简单到只有两种结果,A或图片,没有第三种状态。若只进行一次伯努利试验,则为事件A或图片出现,事件的概率为 p(A)=p,p(图片)=q(p≥0,q≥0,且p+q=1)。用图表示如下:

图片

伯努利试验中,当试验次数很大时,事件发生的频率趋近于它的概率。换句话说,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。

举个经典的抛硬币的例子你就明白了。掷一枚均匀的硬币,正面或反面朝上的概率均为50%(硬币如立起来,则不计入次数,重新抛),但在我们的实际抛掷中,可能出现掷10次硬币,正面朝上7次,反面朝上3次,甚至会出现0次反面朝上的情况。

造成试验结果和理论不一致的原因,并不是硬币或我们抛掷手法有问题,而在于随机性本身,具体来说,是因为抛10次太少。当我们继续增加试验次数,比如增加到10,000次,就会发现正面朝上的频率近似于它的概率,即50%。如下图:

图片

伯努利分布是二项分布的一种特殊情况,可以看作是只进行一次试验的二项分布。当试验次数n=1时,二项分布就退化为伯努利分布。换句话说,伯努利分布是二项分布在试验次数为1时的特例。

(2)二项分布

二项分布描述了在固定次数的独立伯努利试验中,成功次数的概率。

在二项分布中,实验需要满足三个条件:

1)只能有两个结果,A或图片

2)独立,即事件与事件之间不会相互影响;

3)重复,包含两种情况,一是一个人重复多次,二是多人重复一次。

具体来说,假设有一个伯努利试验,成功事件(A)的概率为p,失败事件(图片)的概率为1-p,这个试验被独立重复n次,那么成功的次数X就服从二项分布。它可以用以下公式表示:

P(X=k)=图片(2.2)

小贴士:从n个物品中挑选出k个的组合数,还可以表示为图片需注意,在两种表示方法中,图片图片的字母顺序是倒过来的。

图片=图片这里主要用到的是排列组合的知识,(对排列组合不了解的小伙伴可以看我的往期文章:从加、乘原理到排列组合)。

举一个打篮球的简单例子,来展示二项分布的应用。假设投篮只有“中”和“不中”两种可能,小刘投篮命中的概率为0.8,她投了7次。若x代表恰投中的次数,若x=5,则小刘投7次中5次事件的发生概率是多少?

因为是二项分布,所以事件概率之和为1,因此未命中的概率为1-0.8=0.2。

假设第1、2次没有投中,后面3到7次均投中,那么这一种情况的概率为:p1=0.2x0.2x0.8x0.8x0.8x0.8x0.8。

每一种情况发生的概率都是相同的,因此我们侧重点应该放在有多少种情况。用排列组合的知识简化单个计算的过程,可得式子:         

图片(2.3)

拆分上式,排列式展开计算为:

图片(2.4)

将(2.4)的结果带入式子计算,p(x=5)=21x0.33x0.04=0.2772,用百分数表示为p(x=5)=0.2772x100%=27.72%。

因此,小刘投7次中5次事件的发生概率是27.72%。

热身结束。

恭喜你,耐心看完了背景知识,后面的知识理解起来会变容易。

下面,让我们正式进入泊松分布吧~
  • 二项分布的极端情况:泊松分布

泊松分布是二项分布的极端情况,它是指在p很小,但n趋近于无穷大的情况时,事情发生的概率。

在泊松分布中,X代表随机事件发生的次数,如果随机事件A发生的概率是p,进行n次独立试验,恰巧发生了k次,则相应的概率可用以下公式表示:

图片(1.1)

泊松分布的推导建立在二项式分布的公式(2.2)之上,它是二项分布的极端情况。

当p0,n∞时,n·p会是一个常数,即λ,表示为n·p=λ

现在,让我们再来回顾下二项分布的公式:

P(X=k)=图片(2.2)

遵循用已知求未知的化简思路,公式推导的关键在于用 图片 代入二项式分布的公式(2.2),逐步推导,就可以得到泊松分布的公式。

推导会涉及到一些技巧,为了让思考过程更清楚,我用图来展示。
03 泊松分布推导过程

接上文,用 图片 代入二项式分布的公式(2.2),逐步推导,可得泊松分布的公式。推导思路和过程如下:

图片

挖掘隐藏信息,为后续的化简提供更多条件:

图片

代入化简:
图片
调换分子分母,得到新式子,继续化简:
图片

观察式子,进一步拆解:

图片

继续观察式子,尝试用已知解决未知:

图片

怎么样?泊松分布是不是没有想象中的难?有疑惑也没关系,说明你在积极地思考,尝试挖掘更多信息~

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多