通信-随机过程系列第2篇 尽管随机实验结果的意义是明确的,但这种结果往往是不利于进行数学分析的。例如,随机实验结果是硬币的正面或反面,这并不是一个方便的数学表示。
为何要引入随机变量在这些情况下,如果我们为随机实验的结果分配一个数字或一系列值,通常会更方便。例如,硬币的正面可以对应1,反面可以对应于0。为随机实验的结果分配一个数字的过程,我们叫做用随机变量表达。 图1 抛掷硬币的结果与随机变量 一个随机试验的样本空间为S,随机实验的结果是s,s是S中的元素,s∈S,定义一个函数X(s),其中定义域为S,值域为实数的子集,这个函数叫叫作随机变量。 图2表述了随机变量的概念。在概率与样本空间之间,添加一个随机变量,这样更有利于数学计算。 图2 随机变量的概念 使用随机变量的好处是,无论随机实验潜在事件的形式如何,现在都可以根据实际值的数量来进行概率分析。随机变量可能是离散的,并且只接受有限的数值,例如在抛硬币实验中。或者,随机变量可以是连续的,并接受一系列的实数。 举例1:抛3个硬币会得到几个正面? X='正面的个数' 是随机变量。可以有0个正面(如果所有硬币都是反面向上)、1个正面、2个正面或3个正面。所以样本空间={0, 1, 2, 3}。 但现在结果的概率不再完全是相等的了。 三个硬币可以抛出八个结果: 图3 抛3次硬币,H代表正面头像,T代表反面 在图3里我们可以看到只有1个结果有三个正面,但有 3个结果有两个正面,3个结果有一个正面,和 1个结果没有正面。所以:
举例2:2个骰子Dice的点数之和 现在我们同时抛掷2个骰子Dice,并定义随机变量X='两个骰子点数之和'. 图4 抛掷2个骰子的试验 那么一共会有6×6 =36个可能的结果,见图4所示,样本空间S是{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; 我们可以数一数样本空间中每个值发生的频率,并计算它们的概率:
两个骰子的点数的和是5、6、7或8的概率是多少? 就是:P(5≤X≤8) 是多少? 由于随机变量取值是离散的,P(5≤X≤8)=P( X=5)+P(X=6)+P(X=7)+P(X=8)=(4+5+6+5)/36=20/36=5/9 同样的,在表示特定时刻噪声电压幅值的随机变量是一个连续的随机变量,因为理论上,它可能具有正负无穷大之间的任意值。随机变量也可能是复值的,但复值随机变量总是被视为两个实值随机变量的向量。 对于硬币抛掷试验 ,我们可以这样描述: 图5 硬币抛掷试验 x=0对应结果为硬币的反面,x=1对应结果为硬币的正面,P[X=x]表示出现事件x的概率。图5中有2个delta函数,权重为1/2,表示了抛掷硬币的2种结果。 连续随机变量随机变量可以是离散或连续的:
离散的随机变量如举例1和2所示,在这里,我们重点说一下连续随机变量。 均匀分布(也称为矩形分布) 在均匀分布中,a和b之间所有的随机变量的概率是相等的。不像取值是离散的随机变量,这里a和b之间有无数个取值,是连续的。但不管怎样,所有概率之和一定为1。 图6 均与分布 因为所有概率的和一定是1,所以矩形的面积=1,p×(b−a)=1,所以p=1/(b−a); 还可以写成:若a≤x≤b,P(X=x)=1/(b−a) ,否则P(X=x)=0 再看开篇喷泉的问题。 答案很容易,91分之20是:p=20/91=0.22; 你是随机到达喷泉,如果你等91分钟,那么你便一定会(p=1)看到它喷发。 所以你到达喷泉处,要么能立马看到喷发,或者在91分钟里的任何时间看到。 图7 91分钟内的均匀 累积均匀分布 我们也可以有累积均匀分布,如图8所示。 图8 累积均匀分布 这种分布叫 '累积分布函数',英语是 'cumulative distribution function',简称 'CDF' 现在用以上均匀分布的 'CDF' 来计算概率: 图9 CDF计算概率 在a+20,概率累积到大约0.22。 概率密度函数如图9所示,分布函数可以表示为Fx(x),随机变量X取小于或等于x的任何值的概率。公式见图10-1。 图10 概率分布函数 概率分布函数Fx(x)有3个基本的属性:
除了CDF,还有一个英语叫作 'probability density function'的函数,简称 'pdf' 图11 PDF 概率密度函数PDF具有如下4个基本属性: 图12 PDF的4个基本属性 我们考察一个随机变量X位于x1和x2之间的概率,由定义可以得到 正态分布 最重要的连续分布是标准正态分布。它非常重要,连它的随机变量也有独特的名字: Z. Z的图形是个对称的钟形曲线,图13: 图13 正态分布曲线 通常我们需要求Z在两个数值之间的概率。如 P(0<Z<0.45)(Z在0与0.45 之间的概率是多少) 用标准正态分布表来求答案。从0开始,向右去到0.45,答案是 0.1736。 P(0<Z<0.45)=0.1736。 图14 计算概率 随机变量的统计量随机变量的取值是随机的,让人琢磨不定。但是我们总是要抽取一些确定的数值,才能掌握随机变量的特征。这些确定的数值,就是随机变量的统计量。 一般地,随机变量的N阶矩定义为 一阶矩是随机变量的均值MEAN,二阶矩是功率。 如果把随机变量的均值减掉,再求N阶矩,得到的是N阶中心矩。 一阶中心矩一定是零,二阶中心矩叫作方差。 方差是非常重要的统计量,它反映的是随机变量偏离均值的程度。 对于零均值信号,方差也等于信号的功率。对于非零均值信号,方差=功率-均值的平方。 |
|
来自: taotao_2016 > 《概率》