(图片来自电影《决胜21点》) 01 泊松分布概览 小贴士:当p趋于0,n趋于无穷大时,n·p会是一个常数,即λ,表示为λ=n·p。
极限,一言以蔽之,就是无限逼近的意思。 简单来说,e是增长的极限。即用很大的数字代入(2.1),仍可以得到e的近似值。这一过程用数学公式表示如下: 小贴士:极限的符号为lim,它出自拉丁文limit(界限)的前三个字母。无穷,又称无限大,其数学符号为∞。“x趋于∞”在数学语言中,用“x→∞”表示。
泊松分布是二项分布的极端情况,而二项分布又源于伯努利分布。因此,为了更好地理解泊松分布,我想先简单介绍伯努利分布和二项分布。 (1)伯努利分布 数学家伯努利想了解事件发生的规律,因此选择从最简单、可重复的试验入手研究,这一试验被称为“伯努利试验”。由于努伯利试验只有两个结果,即“发生”或“不发生”,因此得到的概率分布也被称为两点分布(或伯努利分布)。 伯努利试验简单到只有两种结果,A或,没有第三种状态。若只进行一次伯努利试验,则为事件A或出现,事件的概率为 p(A)=p,p()=q(p≥0,q≥0,且p+q=1)。用图表示如下: 伯努利试验中,当试验次数很大时,事件发生的频率趋近于它的概率。换句话说,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。 举个经典的抛硬币的例子你就明白了。掷一枚均匀的硬币,正面或反面朝上的概率均为50%(硬币如立起来,则不计入次数,重新抛),但在我们的实际抛掷中,可能出现掷10次硬币,正面朝上7次,反面朝上3次,甚至会出现0次反面朝上的情况。 造成试验结果和理论不一致的原因,并不是硬币或我们抛掷手法有问题,而在于随机性本身,具体来说,是因为抛10次太少。当我们继续增加试验次数,比如增加到10,000次,就会发现正面朝上的频率近似于它的概率,即50%。如下图: 伯努利分布是二项分布的一种特殊情况,可以看作是只进行一次试验的二项分布。当试验次数n=1时,二项分布就退化为伯努利分布。换句话说,伯努利分布是二项分布在试验次数为1时的特例。 (2)二项分布 二项分布描述了在固定次数的独立伯努利试验中,成功次数的概率。 在二项分布中,实验需要满足三个条件: 1)只能有两个结果,A或; 2)独立,即事件与事件之间不会相互影响; 具体来说,假设有一个伯努利试验,成功事件(A)的概率为p,失败事件()的概率为1-p,这个试验被独立重复n次,那么成功的次数X就服从二项分布。它可以用以下公式表示: P(X=k)=(2.2) 小贴士:从n个物品中挑选出k个的组合数,还可以表示为。需注意,在两种表示方法中,和的字母顺序是倒过来的。 =,这里主要用到的是排列组合的知识,(对排列组合不了解的小伙伴可以看我的往期文章:《从加、乘原理到排列组合》)。 举一个打篮球的简单例子,来展示二项分布的应用。假设投篮只有“中”和“不中”两种可能,小刘投篮命中的概率为0.8,她投了7次。若x代表恰投中的次数,若x=5,则小刘投7次中5次事件的发生概率是多少? 因为是二项分布,所以事件概率之和为1,因此未命中的概率为1-0.8=0.2。 假设第1、2次没有投中,后面3到7次均投中,那么这一种情况的概率为:p1=0.2x0.2x0.8x0.8x0.8x0.8x0.8。 每一种情况发生的概率都是相同的,因此我们侧重点应该放在有多少种情况。用排列组合的知识简化单个计算的过程,可得式子: (2.3) (2.4) 将(2.4)的结果带入式子计算,p(x=5)=21x0.33x0.04=0.2772,用百分数表示为p(x=5)=0.2772x100%=27.72%。 因此,小刘投7次中5次事件的发生概率是27.72%。 热身结束。 恭喜你,耐心看完了背景知识,后面的知识理解起来会变容易。
泊松分布是二项分布的极端情况,它是指在p很小,但n趋近于无穷大的情况时,事情发生的概率。 在泊松分布中,X代表随机事件发生的次数,如果随机事件A发生的概率是p,进行n次独立试验,恰巧发生了k次,则相应的概率可用以下公式表示: (1.1) 泊松分布的推导建立在二项式分布的公式(2.2)之上,它是二项分布的极端情况。 当p→0,n→∞时,n·p会是一个常数,即λ,表示为n·p=λ。 现在,让我们再来回顾下二项分布的公式: P(X=k)=(2.2) 遵循用已知求未知的化简思路,公式推导的关键在于用 代入二项式分布的公式(2.2),逐步推导,就可以得到泊松分布的公式。 接上文,用 代入二项式分布的公式(2.2),逐步推导,可得泊松分布的公式。推导思路和过程如下: 挖掘隐藏信息,为后续的化简提供更多条件: 观察式子,进一步拆解: 继续观察式子,尝试用已知解决未知: 怎么样?泊松分布是不是没有想象中的难?有疑惑也没关系,说明你在积极地思考,尝试挖掘更多信息~ |
|