分享

每天一点统计学——随机变量与概率分布

 无悔大哥chen 2018-08-05

研究随机现象中存在的统计规律性,可以将随机现象的结果与实际数值对应起来,即将结果数量化。因为随机现象如果可以用数值来描述,那么就可以将数学分析的方法引入到随机现象的研究中。

有些实验结果是用数值表现的,我们可以直接用这些数值代表随机变量的数值,如掷骰子的点数。但有一些试验的结果并不是数值,而是各种态度,观点和属性,如记录顾客的性别,对于这样的试验结果,我们通常使用不同的数值来代表不同的结果,如令“男性=1”,“女性=0”,这样就可以用随机变量来描述试验的结果了。

随机变量的种类与描述

根据随机变量所代表数值的不同,随机变量分为两类:离散型随机变量和连续型随机变量。

  • 离散型随机变量。离散型随机变量是指它全部的取值是有限个或可列无限多个。例如,每月销售的电脑数量就是一个离散型随机变量,它的取值是0,1,2,…。这是有限个变量值。上例中掷骰子的点数,也是一个离散型随机变量。

  • 连续型随机变量。连续型随机变量是指在某一段区间上可以取无限多个数值的随机变量。也就是说连续性随机变量是个无间隔变量,他在一定区间内可以取任何值。例如,每天接到的前两个电话的时间间隔是个随机变量,这个随机变量的取值可以是任意X≥0。它可以是1min,2.34min,3.6547min等,因为在理论上任意两个时刻之间都可以有无数个时间段,所以时间间隔是一个连续型随机变量。

可以用“点”和“线”来类比理解这两种类型的随机变量。“点”(离散型)就是随机变量的取值是有限个或可列无限个。“线”(连续型)就是随机变量的取值在某一段区间上可以取无线多个。

概率分布

概率分布是指随机变量的取值与其概率所构成的分布。在二维坐标中,通常横轴是随机变量的取值,纵轴是不同取值对应的概率。根据随机变量的分类,概率分布也分为离散型概率分布和连续型概率分布。

离散型概率分布的主要有二项分布、多项分布、超几何分布、泊松分布。

二项分布

在生活中,许多行为(试验)的结果只有两个:“成功”和“失败”。例如:检查产品的质量,其结果只有两个:合格与不合格;如果试验的结果多于两个,但只关心其中一个结果,也可以视为只有两个结果,这些行为(试验)称为伯努利试验;检查n个产品的质量,称为n重伯努利试验,将“成功”或“失败”的次数看做一个随机变量,其概率分布称为二项分布。

二项分布有以下性质:

  1. 一次试验有且仅有两种可能结果:“成功”和“失败”,两个结果是随机决定且互斥的。

  2. 每次试验中,成功的概率是P,失败的概率是1-P,并且成功和失败的概率是常数或近似于不变

  3. 各次试验之间相互独立,每次试验结果不受其它各次试验结果的影响。

多项分布

多项分布是二项分布的推广。二项分布试验的结果只有两个,多项分布的试验结果有多个,例如,调查教育程度时,结果有文盲、小学、初中、高中、大学等5种结果。

多项分布有以下性质:

  1. 一次试验有k种可能的结果,k个结果是随机决定且互斥的。

  2. 在每次试验中,每种结果都有各自发生的概率且概率保持不变,所有概率之和为100%。

  3. 各次试验之间相互独立,每次试验结果不受其它各次试验结果的影响。

超几何分布

在二项分布试验和多项分布试验中,每次试验结果的发生概率是不变的,而超几何分布试验结果的概率会随着每一次试验发生变化。

例如,在抽样试验中,二项分布试验和多项分布试验是有放回抽样(总量不变)或无限总体无放回抽样(总量近似不变,一般抽样比例低于5%);超几何分布就是有限总体无放回抽样(总量变化)

泊松分布

泊松概率分布是考虑在连续时间和空间单位上发生的随机事件的概率。通俗解释:基于过去的经验,预测该随机事件在新的同样长的时间或同样大的空间中发生N次的概率。

泊松分布经常用于商业中的库存控制。诸如,一家海鲜餐厅过去一个月顾客平均订购7只龙虾,如果该餐厅希望今后能有95%的把握满足顾客需求,需要储存龙虾的数量。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多