分享

概率分布

 好易学 2019-02-22

概率分布(德语:Wahrscheinlichkeitsverteilung,英语:probability distribution)或简称分布,是概率论的一个概念。使用时可以有以下两种含义:

广义地,它指称随机变量的概率性质--当我们说概率空间IMG_256中的两个随机变量XY具有同样的分布(或同分布)时,我们是无法用概率IMG_257来区别他们的。换言之:

XY为同分布的随机变量,当且仅当对任意事件IMG_258,有IMG_259成立。

但是,不能认为同分布的随机变量是相同的随机变量。

狭义地,它是指随机变量的概率分布函数。设X样本空间IMG_260上的随机变量,IMG_261概率测度,则称如下定义的函数是X的分布函数,或称累积分布函数(简称CDF):

IMG_262,对任意实数IMG_263定义。

具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数pdf)。

在常用的文献中,分布一词可指其广义和狭义,而累计分布函数分布函数一词只能指称后者。为了不致混淆,下文中谈及上述的广义时使用分布一词;狭义时使用分布函数一词。




·        1分布函数的性质刻划

·        2随机变量的分布

·        3离散分布

·        二项分布

·        超几何分布

·        泊松近似

·        4连续分布

1分布函数的性质刻划

对于特定的随机变量 IMG_264,其分布函数IMG_265是单调不减及右连续,而且IMG_266IMG_267。这些性质反过来也描述了所有可能成为分布函数的函数:

 IMG_268且单调不减、右连续,则存在概率空间IMG_269及其上的随机变量X ,使得F X 的分布函数,即 IMG_270

2随机变量的分布

IMG_271概率测度IMG_272为随机变量,则函数IMG_273     (IMG_274)称为IMG_275概率分布函数。如果将IMG_276看成是数轴上的随机点的坐标,那么,分布函数IMG_277IMG_278处的函数值就表示IMG_279落在区间IMG_280上的概率。

例如,设随机变量IMG_281为掷两次骰子所得的点数差,而整个样本空间36个元素组成。

数量

( i , j )∈ S

IMG_282

IMG_283

IMG_284

6

( 1,1 )( 2,2 )( 3,3 )

( 4,4 )( 5,5 )( 6,6 )

0

6/36

6/36

10

( 1,2 )( 2,3 )

( 3,4 )( 4,5 )( 5,6 )

( 2,1 )( 3,2 )( 4,3 )

( 5,4 )( 6,5 )

1

10/36

16/36

8

( 1,3 )( 2,4 )( 3,5 )

( 4,6 )( 3,1 )( 4,2 )

( 5,3 )( 6,4 )

2

8/36

24/36

6

( 1,4 )( 2,5 )( 3,6 )

( 4,1 )( 5,2 )( 6,3 )

3

6/36

30/36

4

( 1,5 )( 2,6 )

( 5,1 )( 6,2 )

4

4/36

34/36

2

( 1,6 )( 6,1 )

5

2/36

36/36

其分布函数是:

IMG_285

3离散分布

上面所列举的例子属于离散分布,即分布函数的值域是离散的,比如只取整数值的随机变量就是属于离散分布的。IMG_286表示随机变量IMG_287的概率值。如果X的取值只有IMG_288,则:

IMG_289

IMG_290

二项分布

二项分布是最重要的离散概率分布之一,由瑞士数学家雅各布·伯努利(Jakob Bernoulli)所发展,一般用二项分布来计算概率的前提是,每次抽出样品后再放回去,并且只能有两种试验结果,比如黑球或红球,正品或次品等。二项分布指出,随机一次试验出现的概率如果为IMG_291,那么在IMG_292次试验中出现IMG_293次的概率为:

IMG_294

例如,在掷3次骰子中,不出现6点的概率是:IMG_295

在连续两次的轮盘游戏中,至少出现一次红色的概率为:IMG_296

IMG_297

二项分布在IMG_298时表现出图像的对称性,而在IMG_299取其它值时是非对称的。另外二项分布的期望值IMG_300,以及方差IMG_301

超几何分布

作为离散概率分布的超几何分布尤其指在抽样试验时抽出的样品不再放回去的分布情况。在一个容器中一共有IMG_302个球,其中IMG_303个黑球,IMG_304个红球,通过下面的超几何分布公式可以计算出,从容器中抽出的IMG_305个球中(抽出的球不放回去)有IMG_306个黑球的概率是多少:

IMG_307

例如,容器中一共10个球,其中6个黑色,4个白色,一共抽5次(抽出的球不放回去),在这5个球中有3个黑球的概率是:IMG_308

超几何分布和二项分布的关系

和二项分布不同的是,在超几何分布中,特别强调的是抽出的样品在下一次抽取前不再放回去,但是如果抽取的次数IMG_309和总共样品数IMG_310相比很小(大约IMG_311),这时在计算上二项分布和超几何分布相互间则没有主要的区别,此时人们更愿意采用二项分布的方法,因为在数学计算上二项分布要简单一些。

泊松近似

泊松近似是二项分布的一种极限形式。其强调如下的试验前提:一次抽样的概率值IMG_312相对很小,而抽取次数IMG_313值又相对很大。因此泊松分布又被称之为罕有事件分布。泊松分布指出,如果随机一次试验出现的概率为IMG_314,那么在IMG_315次试验中出现IMG_316次的概率按照泊松分布应该为:

IMG_317

其中数学常数IMG_318(自然对数的底数)

例如,某工厂在生产零件时,每200个成品中会有1个次品,那么在100个零件中最多出现2个次品的概率按照泊松分布应该是:IMG_319

在实践中如果遇到IMG_320值很大导致二项分布难于计算时,可以考虑使用泊松分布,但前提是IMG_321必须趋于一个有限极限。采用泊松分布的一个不太严格的规则(通过展开二项分布,并在形式上化简为类似泊松分布后,利用极限化简即可得)是:

IMG_322

IMG_323

4连续分布

IMG_324是具有分布函数IMG_325连续随机变量,且F一阶导数处处存在,则其导函数

IMG_326

称为IMG_327概率密度函数

每个概率密度函数都有如下性质:

IMG_328

IMG_329

第一个性质表明,概率密度函数与IMG_330轴形成的区域的面积等于1,第二个性质表明,连续随机变量在区间IMG_331的概率值等于密度函数在区间IMG_332上的积分,也即是与IMG_333轴在IMG_334内形成的区域的面积。因为IMG_335,且IMG_336IMG_337的导数,因此按照积分原理不难推出上面两个公式。

正态分布、指数分布IMG_338-分布,IMG_339-分布以及IMG_340-分布都是连续分布。

正态分布

连续随机变量的概率密度函数如果是如下形式,

IMG_341

那么这个连续分布被称之为正态分布,或者高斯分布。其密度函数的曲线呈对称钟形,因此又被称之为钟形曲线,其中IMG_342是平均值,IMG_343标准差。正态分布是一种理想分布,许多典型的分布,比如成年人的身高,汽车轮胎的运转状态,人类的智商值(IQ),都属于或者说至少接近正态分布。同样按照连续分布的定义,正态概率密度函数具有和普通概率密度函数类似的性质:

IMG_344

IMG_345

如果给出一个正态分布的平均值IMG_346以及标准差IMG_347,可以根据上面的第二个公式计算出任一区间的概率分布情况。但是如上的计算量是相当庞大的,没有计算机的辅助基本是不可能的,解决这一问题的方法是借助IMG_348-变换以及标准正态分布表格(IMG_349-表格)。

中间值IMG_350以及标准差IMG_351的正态分布被称之为标准正态分布,其累积分布函数

IMG_352

IMG_353

将普通形式的正态分布变换到标准正态分布的方法是

IMG_354

例如,已知一正态分布的IMG_355IMG_356,求区间概率值IMG_357计算过程如下,

IMG_358

IMG_359

IMG_360

其中IMG_361值通过查IMG_362-表格获得。

正态分布和二项分布

在离散分布中如果试验次数IMG_363值非常大,而且单次试验的概率IMG_364值又不是很小的情况下,正态分布可以用来近似的代替二项分布。一个粗略的使用正态分布的近似规则是:IMG_365

从二项分布中获得IMG_366IMG_367值的方法是

期望值IMG_368

标准差IMG_369

如果IMG_370,则必须采用下面的近似修正方法:

IMG_371

( 注:IMG_372 , EF:二项分布,ZF:正态分布)

上(下)临界值分别增加(减少)修正值0.5的目的是在IMG_373值很大时获得更精确的近似值,只有IMG_374很小时,修正值0.5可以不被考虑。

例如,随机试验为连续64次掷硬币,获得的国徽数位于3242之间的概率是多少?用正态分布计算如下,

IMG_375

IMG_376

IMG_377,符合近似规则,应用IMG_378-变换:

IMG_379

IMG_380

IMG_381

在运用IMG_382-表格时注意到利用密度函数的对称性来求出IMG_383为负值时的区域面积。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多