分享

第二章第一节

 种韭菜的 2011-03-07
第一节 离散型随机变量及其分布

第二章  随机变量与分布函数

 

§离散型随机变量及其分布

一、随机变量的概念

二、离散型随机变量

常见的离散型随机变量

 

一、随机变量的概念

一个随机试验有很多种结果,怎样能方便地把这一系列结果及其相应的概率一起表达出来,并且应用现代数学的方法来研究呢?本章讨论的随机变量就是这样一种工具。

很多随机试验,其一系列结果可以用一数值变量取一系列值来表示。例如:

(1) 某段时间内某寻呼台接到的呼叫数可以用一变量取非负整数值表示: =012,…。“=2表示随机事件{这段时间内有2人要求传呼},“=0则表示事件{这段时间内没有人要求传呼}

(2) 对某物体的长度进行测量,一切可能的测量值构成一样本空间{:}。可以直接用一变量跟测量的结果联系起来:“”表示事件{测量值在1.5 2.5之间}

这些变量所取的值是由随机试验的结果决定的,因此可以说是样本点的函数,我们把它叫做随机变量,常用希腊字母等或用大写的英文字母等来表示。 也就是说,一个随机变量的函数:=R

我们不仅关心随机变量可取哪些值,更重要的是关心取某些值的概率。 由于随机变量本身取实数值,而对实数来说,我们通常感兴趣的是单点集或某个区间或若干个这种区间的并、交,因此希望:是事件,以便有概率可言。 更进一步,为了进行事件的运算与概率的运算,还要求这些区间的可列并、交、逆都代表事件。我们把直线上由左开右闭区间经过并、交、逆等运算得到的点集称为波雷尔集, 包括一切单点集,有限或无限的开区间,闭区间,半开半闭区间,以及它们的有限个或可列个的并、交。 波雷尔集的全体Β称为波雷尔域。 上述要求相当于把直线上的波雷尔集与事件相对应,把波雷尔域Β与事件域F相对应。

由上述说明,我们给出随机变量在数学上的严格定义:

定义1  是定义在概率空间{F }上的单值实函数,且对于R上的任一波雷尔集,有

F                     (1)

就称为随机变量(random variable),而称为随机变量的概率分布(probability distribution)

写出一个随机变量的概率分布是很复杂的问题,它是对一个随机变量的完整描述。 而在很多情况下,只需要对一系列特殊的波雷尔集求得(1)的概率就能决定整个概率分布了。下面先来介绍一类比较简单的情况。

 

二、离散型随机变量

定义2  若随机变量可能取的值至多可列个(有限个或可列无限个), 则称为离散型(discrete)随机变量。

对离散型随机变量,设{}为其可能取值的集合,关键问题是写出概率(简记作),=12,…。 称

                    (2)

的分布列(distribution sequence),有时也就称它为的概率分布。它包含两个方面: 可能取什么值; 取这些值的概率。

显然,分布列具有性质:

     0  =12,…;  

      =1                                          (3)

有了分布列(2),就可求得与有关的一切事件的概率。事实上,由概率的可列可加性,对直线上任一波雷尔集,有

                       (4)

例1    设随机变量ξ的分布列为

(1)求常数 

(2)

  (1)+0.1+ 0.2 + 0.2 =1解得=1, 故分布列为 

(2) =

= 0.1+ 0.2 + 0.2 = 0.5

2  在伯努里概型中,每次成功的概率为。 记直至得到第次成功时的试验次数为,求的分布列。

 

  ={‘前1次试验中有1次成功,次不成功’且‘第次成功’}

= =    

=+1+2,…,

它称为巴斯卡分布。

下面是一些常见的离散型随机变量,它们在实际工作中经常碰到,在理论研究中也有其特殊的重要性。

1.退化分布

设随机变量只取一个常数值, 即

(=)=1                              (5)

称它为退化(degenerate)分布,又称为单点分布。 事实上,{=}是一概率为1的事件,可以看作一个常数,但有时我们宁愿把它看作(退化的)随机变量。

2.两点分布

若一个随机试验只取两个可能值,则相应的概率分布为

  >0  =1              (6)

称为两点分布

在伯努里试验中,每次试验只有两个结果——事件A发生或不发生。 本来这结果与数值无关,但我们可以把它数量化,用一随机变量的取值与它相对应,就得到一个服从两点分布的随机变量。特别地,人们往往用A的示性函数表示随机变量,即令

=

其分布列为

      >0  =1                (7)

称为伯努里分布,也称01分布。 任一伯努里试验的结果 (电路‘断’与‘不断’, 产品‘合格’与‘不合格’,种子‘发芽’与‘不发芽’, 掷硬币得‘正面’ 与‘反面’,…),都可用伯努里分布描述。

3.二项分布

若一随机变量ξ的分布列为

=1,>0   

=012,…,                              (8)

服从二项分布(Binomial distribution),记作称为它的两个参数。 就是第一章讲到的伯努里概型中次成功的概率。它是二项式的展开式的各项,它是二项式的各项,其和恰好为1

二项分布是概率论中最重要的分布之一,应用很广,举例如下:

(1) 检查一人是否患某种非流行性疾病是一次伯努里试验。各人是否生这病可认为相互独立,并可近似认为患病的概率相等。因此考察某地个人是否患此病可作为重伯努里试验,其中患病的人数服从二项分布。

(2) 保险公司对某种灾害 (自行车被盗,火灾,…) 保险,各人发生此种灾害与否可认为相互独立,并假定概率相等。设一年间一人发生此种灾害的概率为, 则在参加此种保险的人中发生此种灾害的人数服从二项分布。

(3) 台同类机器,在一段时间内每台损坏的概率为, 则在这段时间内损坏的机器数服从二项分布。

下面介绍二项分布的重要性质。

                               (9)

这从(8)式以及立即可得。也可以这样理解:次试验中, 事件{次成功}{次不成功}是同样的,而{次不成功}的概率即为

很多情况下二项分布的计算很复杂,有时备有相应的计算表格,但只限于0.5的情况,当>0.5时就可利用 (9)式来计算。

 增减性以及最可能成功次数

对固定的, 由于

==1+

时,>1 单调增加;

时,<1单调减少;

是整数且时,达最大值,我们称

                  (10)

为最可能成功次数;

不是整数时,最可能成功次数

 (取整)                                 (11)

下面是一个二项分布表, 都是20分别为0.1 0.3 0.5,它们具体地显示了性质

b (k 20 p)

 k\ p

   0.1

   0.3

   0.5

 k\ p

 0.1

   0.3

   0.5

  0

  1

  2

  3

  4

  5

  6

  7

  8

  9

  10

0.1216

0.2702  0.2852

0.1901  0.0898  0.0319  0.0089  0.0020  0.0004  0.0001

---

  0.0008

  0.0068

  0.0278

  0.0716

  0.1304

  0.1789

  0.1916

  0.1643

  0.1144

  0.0654

  0.0308

  ---

  ---

  0.0002

  0.0011

  0.0046

  0.0148

  0.0370

  0.0739

  0.1201

  0.1602

  0.1762

  11

  12

  13

  14

  15

  16

  17

  18

  19

  20

 --

- -

 --

 0.0120

 0.0039

 0.0010

 0.0002

  --

  --

  --

  --

  --

    --

 

  0.1602

  0.1201

  0.0739

  0.0370

  0.0148

  0.0046

  0.0011

  0.0011

  0.0002

   --

   --

 

 ∞时的渐近性质

假定有关,记作。 考虑∞的情况,有下面的定理:

泊松(Poisson)定理  如果存在正常数,当∞时,有,则

      =  = 0 1 2,…。           (12)

  =, 则 = 

=()

=()(1)

=(1)/(1)

  (→∞)

此即所证。 上述定理称为‘二项分布的泊松逼近’。

通常,无关。但当很大(一般50)很小 (一般0.1),而不很大时,可近似地取=,且

=                 (13)

(13)式右边的计算比较容易,可供查阅的表也更多,这就解决了这种场合  的计算问题。

3  某人每次射击时击中目标的概率为0.001,射击5000次,求击中两弹或两弹以上的概率。

  为击中的弹数,=, =5000很大,而=0.001很小,=5,故,所求概率为

=1P(=0)P(=1) 150.9596

4.泊松分布

从上面的泊松定理可引入另一类重要的分布。

设随机变量ξ可取一切非负整数值,取这些值的概率为

P(=)=  (>0)  =012,…,           (14)

就称服从泊松分布,简记作, 其中称为它的参数,以后将会证明,它就是的平均值。

时,二项分布逼近泊松分布;当很大很小时,泊松分布可作为二项分布的近似。然而泊松分布的作用不尽于此。 近数十年来,人们发现很多随机现象都可利用泊松分布去描述,例如:

1) 在社会生活中,各种服务需求量,如一定时间内,某电话交换台接到的呼叫数,某公共汽车站来到的乘客数,某商场来到的顾客数或出售的某种货物数,…,它们都服从泊松分布,因此泊松分布在管理科学和运筹学中占很重要的地位。

2) 在生物学中,某区域内某种微生物的个数,某生物繁殖后代的数量等也服从泊松分布。

3) 放射性物质在一定时间内放射到指定地区的粒子数也是服从泊松分布的。

4  考察通过某交叉路口的汽车流。若在一分钟内没有汽车通过的概率为0.2,求在2分钟内有多于一辆汽车通过的概率。

为一分钟内通过的车辆数,假设。记为两分钟内通过的车辆数,则。 又== 0.2,故 , 所求为

 ==1= 12

        = 24/25(2 /25)0.831

5.几何分布

若随机变量ξ可能取的值是正整数,且相应的概率为

=  ,>0,=1=12,…,      (15)

则称服从几何(Geometric)分布

在伯努里概型中,若一次试验成功的概率为,则直到首次成功的试验次数就服从几何分布,也就是例2=1的特例。

几何分布有一个很有趣的性质——无记忆性。若伯努里试验中前m次失败,则从第+1次开始直到成功的次数也服从同样的几何分布(好像把前面次失败‘忘记’了)

这是因为若记=+,则=时,=+,显然, 服从参数为的几何分布,而所求为

P(=|次失败) =

== /=

反过来,若是取正整数的随机变量,且具有无记忆性,则服从几何分布 (证明从略)

6超几何(Hypergeometric)分布

这是如下的概率分布:

P(=)= 

 = 012,…,(,)                             (16)

在产品质量的不放回抽检中,若件产品中有件次品,则抽检件时所得次品数就服从超几何分布。

因为,所以我们证明了一个很有用的组合公式:

二项分布与超几何分布有密切的联系。在(16)式中,若,不变,→∞,, 则     

    (→∞)           (17)

因此,当很大时,超几何分布就可以用二项分布来近似计算。

上述超几何分布也可加以推广。例如,假设某件产品中包含一、二、三级产品各为件。 现从中抽查件,那么包含件一级产品,件二级产品,件三级产品的概率为

                   

其中,

    。 一套扑克52张,由四种花色组成,每种花色各13张。 那么一手13张扑克中有5张黑桃、4张红心、3张方片、1张梅花的概率为

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多