每天一点统计学——随机变量与概率分布

昵称11935121 2018-08-05

展开全文

研究随机现象中存在的统计规律性，可以将随机现象的结果与实际数值对应起来，即将结果数量化。因为随机现象如果可以用数值来描述，那么就可以将数学分析的方法引入到随机现象的研究中。

有些实验结果是用数值表现的，我们可以直接用这些数值代表随机变量的数值，如掷骰子的点数。但有一些试验的结果并不是数值，而是各种态度，观点和属性，如记录顾客的性别，对于这样的试验结果，我们通常使用不同的数值来代表不同的结果，如令“男性＝1”，“女性＝0”，这样就可以用随机变量来描述试验的结果了。

随机变量的种类与描述

根据随机变量所代表数值的不同，随机变量分为两类：离散型随机变量和连续型随机变量。

离散型随机变量。离散型随机变量是指它全部的取值是有限个或可列无限多个。例如，每月销售的电脑数量就是一个离散型随机变量，它的取值是0，1，2，…。这是有限个变量值。上例中掷骰子的点数，也是一个离散型随机变量。
连续型随机变量。连续型随机变量是指在某一段区间上可以取无限多个数值的随机变量。也就是说连续性随机变量是个无间隔变量，他在一定区间内可以取任何值。例如，每天接到的前两个电话的时间间隔是个随机变量，这个随机变量的取值可以是任意X≥0。它可以是1min，2.34min，3.6547min等，因为在理论上任意两个时刻之间都可以有无数个时间段，所以时间间隔是一个连续型随机变量。

可以用“点”和“线”来类比理解这两种类型的随机变量。“点”（离散型）就是随机变量的取值是有限个或可列无限个。“线”（连续型）就是随机变量的取值在某一段区间上可以取无线多个。

概率分布

概率分布是指随机变量的取值与其概率所构成的分布。在二维坐标中，通常横轴是随机变量的取值，纵轴是不同取值对应的概率。根据随机变量的分类，概率分布也分为离散型概率分布和连续型概率分布。

离散型概率分布的主要有二项分布、多项分布、超几何分布、泊松分布。

二项分布

在生活中，许多行为（试验）的结果只有两个：“成功”和“失败”。例如：检查产品的质量，其结果只有两个：合格与不合格；如果试验的结果多于两个，但只关心其中一个结果，也可以视为只有两个结果，这些行为（试验）称为伯努利试验；检查n个产品的质量，称为n重伯努利试验，将“成功”或“失败”的次数看做一个随机变量，其概率分布称为二项分布。

二项分布有以下性质：