第一章概率论的基本概念
一、事件的关系与运算
(2)
可以推广到多个事件的运算:
二、概率的统计定义,古典概型概率的性质
频率
古典概型的特征:(1)有限性;(2)等可能性
几何概型:(1)特征:样本空间中样本点无限构成一个几何区域,且每个样本点发生是等可能的;(2)公式:,分别表示和的几何测度,其中测度为长度或面积等。
概率的性质:(1)
(2),,反之不成立
(3)
三个任意事件的加法公式,有
当互不相容时,
一般n个事件的加法公式:
当两两互斥(互不相容),则
(4),
三、条件概率、乘法公式、条件概率;
乘法公式
推广
乘法公式用于计算两个或两个以上事件同时发生的概率。
设为一个完备事件组(或者是的一个划分),即,;且均有正概率,对任意事件,有
全概率公式:
贝叶斯(Bayes)公式(逆概公式):
全概率公式是概率的加法公式和乘法公式的应用;贝叶斯公式是条件概率、乘法公式和全概率公式的应用。
四、事件的独立性若与互相不产生影响,则称与相互独立。
与独立条件概率等于无条件概率。
三个事件独立的公式
缺一不可
个事件独立的公式
个事件是独立的要满足的条件:个关系式。
与,与,与,与四对事件中,只要有一对独立,则另外三对都是独立的。这个结论的意义是:如果一组事件是独立的,则把它们当中的一部分或全部换成各自的对立事件得到的事件组仍然是独立的。
独立的条件下:
独立试验序列概型
贝努里试验,重贝努里试验
,称为贝努里公式
第二章随机变量及其分布
一、随机变量
分布函数的性质
二、离散型随机变量
如果随机变量的所有可能取值为有限个或至多可列个,则称为离散型随机变量。,
… … … … 满足条件:①;②
的分布函数:
离散型随机变量分布函数的特征描述:离散型随机变量的分布函数是一个单调不减的跳跃函数,它在的所有可能取值点跳跃,跳跃度恰好等于在该点取值的概率。0—1分布
二项分布
Poission分布,;
当很大,又很小,,则二项分布以泊松分布为极限,即
,
三、连续型随机变量
满足条件:①;②。
区间上均匀分布(UniformDistribution),,
分布函数
指数分布(ExponentialDistribution),,又称为负指数分布。分布函数
正态分布(NormalDistribution)
,,为任意常数,.分布函数
特别当时,称为标准正态分布(StandardNormalDistribution),标准正态分布的密度函数为:
对于标准正态分布
满足或
那么
四、随机变量的函数的分布
是随机变量,是随机变量的函数,它的分布称为随机变量函数的分布。
离散型比较容易;连续型主要掌握分布函数法。特别是:是某个连续型随机变量的分布函数,一定服从(0,1)上的均匀分布。(非常重要)
第三章多维随机变量及其分布
一、联合分布、边缘分布条件分布与独立性
①;②
;
条件概率分布
对于给定的,如果,则称
为在条件下的条件概率分布。
对于给定的,如果,则称
为在条件下的条件概率分布。
与相互独立
即对任何都成立;
称为的联合分布函数。
的联合分布函数有以下性质:
①;
②分别是的单调不减函数;
③,,,
④
的边缘分布函数:
的边缘分布函数:
与相互独立对任意都成立。联合概率密度的性质:
①
②
在的连续点,有
的边缘分布:;
的边缘分布:
若对任意的,则称
为在条件之下的条件概率密度。
若对任意的,则称
为在条件之下的条件概率密度。
与相互独立对任意都成立。
二维均匀分布:为平面上的有界闭区域,为的面积,服从上的均匀分布,则有:
等它们的边缘分布、独立性
二维正态分布
要懂得5个参数的概率意义。
,,;
,,,,
二、随机向量函数的分布
离散型随机变量的函数的分布要具体问题具体分析,一般比较容易处理。
连续型随机变量函数的分布仍然用分布函数法来求,如,,等的分布。二维随机变量的联合密度函数为,则的分布密度函数为:
当与相互独立时,有,
则:这个公式称为卷积公式。
最大值与最小值的分布:独立同分布,分布函数为,密度函数为。求,的分布。,
,
卷积公式:
,且相互独立,则
,且相互独立,则
,且相互独立,则
第章随机变量的数字特征
、一维随机变量的数字特征
数学期望的概率意义:随机变量的数学期望反映了随机变量取值的平均值的大小。
数学期望的性质:,为任意常数。
随机变量函数的数学期望:,
方差:,离差平方的数学期望(它是随机变量函数的数学期望)
方差的性质:,为任意常数。
方差的概率意义:随机变量的方差反映了随机变量取值关于其数学期望的离散程度。
对任意随机变量,数学期望和方差都存在,并且方差,那么,标准化随机变量,有:
Chebyshev不等式:
切比雪夫不等式是用来估计随机变量在关于其数学期望对称的区间内(外)取值的概率的下界(上界);它虽然不能精确计算概率,但是在概率统计理论上有着重要的作用。、多维随机变量的
是二维随机变量,是的二元函数
等都是其特殊情况。
协方差:
相关系数:;相关系数的概率意义
几个等价的关系式:
与不相关
第五章中心极限定理
1.
2.大数定律
在概率论中,一系列相互独立的随机变量(具有有限方差),当时,其平均值几乎恒等于一个常数。其平均值依概率收敛于它的数学期望。
辛钦(Khinchine)大数定律:若独立同分布,,则对任意,
贝努利(Bernoulli)大数定律:在次独立重复试验中,是事件发生的次数,是每次试验中事件发生的概率,则对任意,。贝努利大数定律是概率统计定义的理论基础。
3.中心极限定理(CentralLimitTheoremC.L.T.)
在概率论中,一切论述“一系列相互独立的随机变量和的极限分布为正态分布”的定理都称为中心极限定理。
同分布的中心极限定理(列维—林德伯格(Levy—Lindberg)中心极限定理)设随机变量独立同分布。,则
当时,,当,
或当时,,当,
或
棣莫佛—拉普拉斯(DeMoivre—Laplace)定理:
当时,;当,
或当时,,当,
或
因为,二项分布可以表示成若干个相互独立的随机变量之和。应用中心极限定理的关键是构造“独立和”。中心极限定理是大样本统计的理论基础。
第六章及抽样分布
一、总体、样本、统计量
研究对象的全体称为总体,总体就是一个随机变量。
是取自总体的样本,它满足两个条件:相互独立;均与具有相同的分布。
样本的联合分布与经验分布函数似然函数
统计量是样本的函数,它不含任何未知参数
常见的统计量:样本均值
样本方差
样本标准差
样本的阶原点矩
样本的阶中心矩
次序统计量,
样本极差
样本中位数
上、下四分位数,
,,,,之间的关系,箱线图
二、数理统计的三大分布
正态分布与标准正态分布,独立同分布,()大样本
.分布
若相互独立,且均服从标准正态分布,则:服从自由度为的分布。卡方分布的数学期望与方差可加性
特例:,,且相互独立,那么服从自由度为2的分布,也就是)的指数分布。
.分布
,且相互独立,则。
.分布
,且相互独立,则,。,则
三、抽样分布(正态总体的抽样分布)
是来自正态总体的样本,、分别为样本均值与样本方差,则:
①
②
③
是来自正态总体的样本,分别为样本均值与样本方差;
是来自正态总体的样本,分别为样本均值与样本方差。
则:
④
⑤
;
第章参数估计
估计量、估计值、点估计、区间估计
一点估计的方法与评价估计量的标准
1矩估计用样本矩代替总体矩,用样本矩的函数代替总体矩的同一个函数,从而达到对总体参数估计的目的,这种方法称为矩估计法。
不论总体服从什么分布总体均值的矩估计为;总体方差的矩估计为
2.极大似然估计法
(1)似然函数,取对数,构造对数似然方程并求解
得出极大似然估计。
(2)不能通过求导得出的极大似然估计的方法
3估计量的评价标准
①无偏性;②有效性(最小方差性);③相合性(一致性)。
样本均值是总体均值的无偏估计量、相合估计量和最小方差线性无偏估计量。
样本方差是总体方差的无偏估计量
混合样本方差是总体方差的无偏估计量二区间估计
区间估计的基本概念,置信区间,置信上、下限,置信度,置信区间的概率意义,枢轴量
要弄清楚在什么条件下求正态总体哪个参数的区间估计?重要的是选择枢轴量。
1.正态总体,
(1)方差已知的条件下,的置信区间为枢轴量;
(2)方差未知的条件下,的置信区间为枢轴量;
(3)均值未知的条件下,的置信区间为枢轴量;
2.两个正态总体,,
(1)方差,已知的条件下,的置信区间为
(2)方差,未知但相等的条件下,的置信区间为
(3)均值未知的条件下,的置信区间为
第章假设检验
一、假设检验的基本原理与步骤
小概率原理,原假设与备择假设,检验统计量,显著性水平,拒绝域,两类错误
1.提出原假设与备择假设;
2.选择检验统计量(于区间估计中的枢轴量),并提出当原假设成立的条件下,检验统计量所服从的分布;
3.根据给定的显著性水平,确定拒绝域;
4.将样本数据代入统计量的值,作出结论。
二、正态总体参数的假设检验
1.检验(1)单总体检验均值方差已知
(2)两总体检验均值之差方差已知
2.检验(1)单总体检验均值方差未知成对数据的假设检验
()两总体检验均值之差方差未知但相等(具有方差齐性如果没有这个条件需要先用)
3.检验单总体检验方差一般来说均值未知
4.检验两总体检验方差之比一般来说均值未知。其中包括单边检验和双边检验
三、假设检验的值
假设检验的值是以样本观测值为边界设定拒绝域(单侧或双侧要根据假设),检验统计量在拒绝域内取值的概率。
四、拟合优度检验非参数检验
总体为离散型的包括不含未知参数和含有未知参数两种
总体为连续性的,带有未知参数的
第章方差分析与回归分析
一元线性回归分析
给定数据,(),散点图,呈线性相关关系,
一元线性回归模型为:,其中为普通变量,为随机变量。对于给定的样本,有,满足:
,
所以,且相互独立。
计算:,,,,,则用最小二乘法可得未知参数的估计:,。因此可得样本线性回归方程:。
平方和分解公式:
其中为回归平方和
为残差平方和
的无偏估计量
检验假设,备择假设;
选择统计量,当成立时,;对于显著性水平,拒绝域:;如果拒绝原假设,则与之间的线性相关关系是显著的,可以用所建立的样本线性回归方程进行预测;如果接受原假设,则与之间的线性相关关系是不显著的。点预测:
概率为的预测区间其中预测区间的半径
即)
29
|
|