概率分布

复杂网络621 2015-11-26

展开全文

期望

介绍各个分布之前先给出期望的定义。如果∫∞?∞|x|f(x)dx<∞，那么E(x)=∫∞?∞xf(x)dx；如果积分发散，则期望不存在（无意义）。

函数的期望。如果Y=g(X)，对于离散变量E(Y)=∑xg(x)p(x)，对于连续变量E(Y)=∫∞?∞g(x)f(x)dx。注意函数的期望不一定等于期望的函数，即E[g(x)]≠g[E(x)]。如果X和Y是相互独立的随机变量，g和h是固定的函数，那么

E[g(X)h(Y)]=E[g(X)]E[h(Y)],ifg(X)和h(Y)的期望存在(1)

作为公式(1)的特例，E(XY)=E(X)E(Y)。

方差是一种特殊的期望

Var(X)=E[X?E(X)]2=E(X2)?[E(X)]2(2)

伯努利分布

伯努利随机变量的取值只有两个：0和1。

p(1)=p(3)

二项分布

令x1,x2,...,xn是相互独立的伯努得随机变量，那么

y=x1+x2+...+xn(4)

是一个二项随机变量。

p(y=k)=(nk)pk(1?p)n?k(5)

其中p就是公式(3)中的p，所以公式(3)表示一次试验成功的概率，而公式(5)表示k次试验成功的概率。

多项分布

二项分布每次实验结果只有2种，如果有多种那就变成了多项分布。设一共有r种结果，每种结果出现的概率依次是p1,p2,...pr，进行发n次实验，第i种结果出现的次数为ni，这样的概率是

p(n1,n2,?nr)=n!n1!n2!?nr!pn11pn22?pnrr(6)

n个对象分成r个类别，第i类有ni个对象，这种分类方式共有

n!n1!n2!?nr!(7)

种，这个式子正是多项系数

(X1+X2+?+Xr)n=∑(n!n1!n2!?nr!)Xn11Xn22?Xnrr(8)

几何分布

连续若干次相互独立的伯努利试验，第g次才成功。则

p(g=k)=(1?p)k?1p(9)

期望是1p

负二项分布

负二项分布是几何分布的一般化。连续若干次相互独立的伯努利试验，直到成功了r次为止，共进行了k次试验。

p(n=k)=(k?1r?1)pr?1(1?p)k?rp(10)

负二项分布也可以看成是r次独立的几何随机变量的和：第1次成功时经历的试验次数g1加上第1次成功后第2次成功又经历的试验次数g2加上……所以

n=g1+g2+...+gr(11)

超几何分布

共有n个球，其中黑球r个，白球n-r个。从中取出m个球，X表示抽到黑球的个数。

p(X=k)=(rk)(n?rm?k)(nm)(12)

在估计野生动物数量时经常采用标记重捕法：捕获r只动物，将它们作上标记后释放。这之后再捕获m个动物，发现其中有k个带有标记，请估计动物的总数n。这里我们采用极大似然估计法，它将使观测结果出现可能性最大的n作为其估计值。根据超几何分布我们知道出现观测结果的概率为

Ln=(rk)(n?rm?k)(nm)

"显然易见”，该似然函数随着n的增长先单调上长再单调下降，为求得似然函数的极大值点很容易想到的是令一阶导数为0。然而一阶导数并不好求，我们转把似然函数转换成对数函数后再来求一阶导数，不幸的是这种方法仍然不便于计算。我们考虑似然函数的连续项比值

LnLn?1=(n?m)(n?r)n(n+k?m?r)

该比值项为1时似然函数取得最大值，得

n=rmk

自然常数e

下面的几种概率密度函数中都包含e，所以我们先来剖析一下e到底是什么。

自然常数e和圆周率π是常见的超越数。

来看几个跟e有关的公式。

e=limx→∞(1+1x)x(13)

e=∑x=0∞1x!(14)

(ax)′=axlna(15)

(logax)′=logaex(16)

利用公式(13)我们来具体说下e到底是什么。假设一个细胞经过1个单位时间分裂成两个细胞。即经过1个单位时间后细胞数目比原先多了1倍，经过1/2个单位时间后细胞数目比原先多了1/2倍，经过1/3个单位时间后细胞数目比原先多了1/3倍，经过1/n个单位时间后细胞数目比原先多了1/n倍。则我们用下面的公式计算单位时间后的细胞数目是当前的几倍：

(1+11)1

现在假设一个细胞还是需要1个单位时间才能分裂成两个细胞，只是经过1/2单位时间后，正在分裂中的细胞又开始新的分裂过程。1个单位时间可以分成前后两个阶段，每个阶段末的细胞数目都是阶段初的1+12倍。我们用下面的公式计算单位时间后的细胞数目是当前的几倍：

(1+12)2

如果经过1/n个单位时间后细胞就具有分裂能力，则我们用下面的公式计算单位时间后的细胞数目是当前的几倍：

(1+1n)n(17)

当细胞具有分裂能力的时间间隔足够短，即n→∞时，公式(17)就等于e。由此得出：e是单位时间内持续的翻番增长所能达到的极限值。

泊松分布

当满足以下前提条件时，泊松变量表示单位时间内发生的次数。

不同子区间内了生与否相互独立
每个子区间发生的概率相同
事件不会同时发生

P(X=k)=λkk!e?λ,k=0,1,2......(18)

注意到

eλ=∑k=0∞λkk!(19)

泊松分布的期望和方差都是λ。

泊松过程：S1,S2,...SN是S的互不相交的子集，这些子集上发生的事件数N1,N2,...N3是相互独立的随机变量，且服从参数为λ|S1|,λ|S2|...λ|SN|的泊松分布，即期望与区间大小成正比例。

如果X服从参数为λ的泊松分布，Y服从参数为μ的泊松分布，且X和Y相互独立，那么X+Y服从参数为λ+μ的泊松分布。

Poisson(λ)分布可以看成是二项分布B(n,p)在np=λ,n→∞条件下的极限分布。

指数分布

指数分布常用来描述生命周期或等待时间，变量一般用t表示。

密度函数f(t)={λe?λt,0,ift≥0ift<0

λ越大，密度函数下降得越快。

密度积累函数F(t)=P(T<t)=1?e?λt，即

P(T>t)=e?λt(20)

一般地，泊松过程两次事件发生的时间间隔是独立同分布的指数随机变量。这里我们可以简单推导一下，令泊松过程两次事件发生的时间间隔是T，P(T>t)=P((t0,t0+t)内没有事件发生)，因为在长度为(t0,t0+t)的时长内事件发生的个数服从参数为λt的泊松分布，由公式(18)发生次数为0的概率是e?λt，即P(T>t)=e?λt，这和公式(20)是吻合的。

指数分布的期望是1λ。