分享

十分钟学习泊松分布

 好易学 2019-02-22

前言

本文简述了离散型分布,阐明了泊松分布的来源,推导出泊松分布的公式,列举了泊松分布常用的情况,总结了泊松分布相关数值。

离散型分布概述

离散型分布包括几何分布、超几何分布、二项分布和泊松分布。其中二项分布和泊松分布最重要。

伯努利试验

对于一个试验(事件),如果重复发生的概率是独立地(上一次的结果不影响这次),那么它是独立试验。特别地,如果这个试验只存在两种结果,则称其为伯努利试验。

随机变量

对于有现实世界意义的数,我们根据意义的不同,将其划分为不同的类,而对于同一类的数,都使用同一个随机变量来称呼。比如,x年x月x日下雨量,我们就可以使用“随机变量X”来称呼;x年x月x日下雨可能性,我们就用“随机变量Y”来称呼。

需要明确的是:

  • 随机变量是一类有相同意义的数,而不是某个数

  • 当使用随机变量作为一个数时,我们需要指定这个随机变量。比如“2017年1月25日下雨量”在数学上才是一个具体的值。

  • 随机变量不一定能用除一一映射以外的方式拟合

几何分布

对于重复n次的伯努利试验,我们可以计算“首次为1是出现在第K次试验”:
如果一个随机变量X取值1, 2, …, k时对应的值满足上式,则称X服从参数为P的几何分布,记作

超几何分布

袋中有N个球,其中m个为红球,余下的是白球。从袋中一次取n个球,“恰有k个红球”的概率:


对于满足上式的随机变量X,称X服从超几何分布,记作

二项分布

对于重复n次的伯努利试验,我们可以计算“成功k次”的概率:
对于满足上式的随机变量X,称X满足二项分布,即为

01分布

特别地,当n=1,即只重复一次伯努利试验时,我们将其称为01分布。(随机变量X只有两个结果)

泊松分布的直观理解

泊松分布是用来描述某段时间内事件的发生概率。
poisson distribution 2

我们先假设是从某一时刻起(X=x)的t个单位时间内。我们已知的是单位时间内事件发生的概率p。
那么在t个单位时间时事件发生k次的可能性(比如前来看病的人数为k),是满足二项分布的:

通过二项分布,我们可以计算单位时间的整数倍时刻,事件发生k次的可能性。
而为了得到第1.2t个单位时间内事件发生的次数,我们需要缩小单位时间,并同等缩小事件发生概率p,比如

故当t取无限小时,可以计算出泊松分布公式:
,为在时间段内事件发生次数的期望。

越大,时间段内事件的平均发生次数会增加。

泊松分布的公式推导

泊松分布公式:
Poisson Distribution

泊松分布的用途

  1. 泊松分布可以作为二项分布的近似

  2. 许多随机变量服从泊松分布,如某医院一天内的就诊人数,一段时间内一个网站的登陆人数,某路口一段时间内通过的车辆数

泊松分布的相关数值

期望:
方差:
具体推导见参考文献“泊松分布的期望和方差推导”

变异系数:
极大似然估计值:
具体推导见参考文献“最大似然估计法”

泊松分布和正态分布的关系

泊松分布和正态分布(高斯分布)都是由二项分布推导出,但基本没什么关系…

参考文献

I. 《概率论与数理统计(第二版)》 陈鸿建著
II. 泊松分布和指数分布:10分钟教程
III. 泊松分布的来源—公式推导—应用
IV. 泊松分布(Poisson distribution)的简单认识
V. 泊松分布的期望和方差推导
VI. 最大似然估计法
VII. 二项分布, 泊松分布和正态分布之间的关系

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多