数理统计课程
辅导提纲
军区空军自考办
抽样分布
一、内容提要
§1.1引言
§1.2基本概念
总体;样本;频率直方图;经验分布函数;统计量。
§1.3抽样分布
分布;分布;分布;正态总体样本均值和方差的分布;概率分布的分位数。
二、重点内容
总体、样本的概念;经验分布函数及其性质。
样本均值;样本方差;样本标准差。
分布、分布、分布及其性质。
正态总体样本均值和方差的分布。
三、典型例题
例1.试证,其中。
证:
例2.设和为的样本均值和方差。作变换:。试证:。其中和为的均值和方差。
证:
例3.设是来自正态总体的样本,,分别为样本均值和样本方差,试证明:。
证:由线性代数知:存在第一行为的阶正交矩阵,作正交变换:
则有:,即
且:
即:
由正态分布的不变性知:
且相互独立,故:
四、思考题,作业题:
参数估计
一、内容提要
§2.1引言
点估计;区间估计。
§2.2点估计量的求法
矩估计法;最大似然估计法。
§2.3估计量的评选标准
无偏性;
有效性;
充分性;
相合性(一致性)。
§2.4区间估计
单个正态总体的均值与方差的置信区间;
两个正态总体,均值差和方差比的置信区间。
非正态总体的均值和标准差的置信区间。
二、重点内容
1.用矩估计法求未知参数的估计量。
2.求未知参数的最大似然估计量。
3.判断某个估计量的“优劣”。即判断其是否具有无偏性,有效性,充分性或相合性。
4.单个正态总体的均值与方差的置信区间。
设是来自总体的样本。则有:
求的置信区间时:
(1)已知时,采用统计量;
(2)未知时,采用统计量:
(或)
求的置信区间时:
(1)当已知时,采用统计量:
(2)未知时,采用统计量:
三、典型例题
例1.设有容量为的样本,求密度函数:
中参数的矩估计。
解:
由得的矩估计为:
例2.设总体服从均匀分布,其密度函数为:
试求参数的矩估计量。
解:
从而有:
解得的矩估计量为:
例3.设总体服从负指数分布,其分布密度为:
试用来自的样本求的矩估计量。
解:
由得矩估计量为:
例4.设总体服从泊松分布:
试求参数的最大似然估计。
解:似然函数为:
于是令
解得
又
故知为的最大似然估计。
例5设随机变量的密度函数为:
为来自总体的一个样本,试求的最大似然估计量。
解似然函数为:
令:,得似然方程为:
解得的最大似然估计为:。
例6.设总体,试求和的最大似然估计量。
解:设为的样本,似然函数为:
令:
解得,的最大似然估计为:
例7.设是取自参数为的泊松分布的一个子样,试证明:是参数的无偏估计。
证:
故是的无偏估计。
例8.设为取自参数为的泊松分布的一个子样,试证明和都是的无偏估计,并且对任一值,也是的无偏估计。
证:
即,,均是的无偏估计。
例9.设总体,为样本,试证明是有效估计。
证:的密度函数为:
于是参数的无偏估计量的方差下界为:
但无偏估计量的方差:
达到了下界。故是的有效估计。
例10.设为独立同分布的随机变量,其分布为二点分布:
其中,证明为的充分统计量。
证:的联合分布函数为:
若取
则:
故由因子分解定理知为的充分统计量。
例11.设是独立同分布随机变量,都服从几何分布:
则是的充分统计量。
证:的联合分布密度为:
取:
则
故由因子分解定理知:是的充分统计量。
例12.设是的相合估计,为常数序列,满足:
证明也是的相合估计。
证:因,故对任意的,存在,使得当时,
令,则当时,于是:
,对一切
因而有:对一切
故也是的相合估计。
例13.设总体,未知,若已知样本容量,样本均值,样本方差,试求的置信区间(置信系数为)。
解:因未知,故采用统计量:
因,故。查表知:
故的置信区间为
例14设总体,未知。若已知样本容量为,样本方差,试求当时,的置信区间。
解因未知,故采用统计量
查表知:
故的置信区间为:
例15设总体。若使的置信系数为0.95的置信区间长度为5,试问样本容量最小应为多少?
解因已知,故采用统计量
因为,故
查表知:
故的置信系数为0.95的置信区间长度为:
即:
∴
故样本容量最小应为62。
四、思考题、作业题。
第三章假设检验
一、内容提要
§3.1引言
假设检验的理论根据;
假设检验的两类错误;
假设检验的实施步骤.
§3.2关于正态总体的参数假设检验
单个正态总体的均值检验;
单个正态总体的方差检验;
两个正态总体,的均值检验;
两个正态总体,的方差检验.
§3.3一致最优检验
奈曼—皮尔逊引理;
正态总体参数的UMP检验;
正态总体参数的UMPU检验.
§3.4非参数检验
皮尔逊检验法;
K—C检验法.
二、重点内容
1.单个正态总体的均值检验:
当已知时,采用统计量
当未知时,采用统计量
2.单个正态总体的方差检验:
当已知时,采用统计量
当未知时,采用统计量
3.两个正态总体,的均值检验:
当已知时,采用统计量
当未知时,采用统计量
其中:
三、典型例题
例1设某产品指标服从正态分布,它的根方差已知为150小时。今在一批产品中随机抽查了26个,测得指标的平均值为1637小时,问在的显著性水平下,能否认为这批产品的指标为1600小时?
解母体.按题意,需检验假设
因,故采用统计量
观察值为
当时,查表知
因,故接受.即认为这批产品的指标为1600小时。
例2下面是某工厂随机抽取的20只部件的装配时间(单位:分钟)
10.29.810.410.69.69.79.910.911.19.6
10.39.69.911.210.69.810.510.110.59.7
设装配时间的总体服从正态分布.是否可以认为装配时间的均值显著地大于10(取)?
解设装配时间的总体均值为.按题意,需检验
,
因总体方差未知,故采用统计量:
的拒绝域为
由所给数据得,,因而观察值为
因,故拒绝,即认为装配时间的均值显著地大于10.
例3某种导线,要求其电阻的标准差不得超过.今在生产的一批导线中取样品9根,测得,设总体为正态分布.问在水平下能否认为这批导线的标准差显著地偏大?
解按题意,需检验假设
,
因均值未知,故采用统计量:
其拒绝域为
由题得的观察值为
因为,故拒绝,即认为这批导线的标准差显著地偏大。
四、思考题、作业题
3-1,3-3,3-4,3-8.
第四章回归分析
一、内容提要
§4.1引言
§4.2一元线性回归
中参数的点估计;
估计量的分布及其性质;
的区间估计和假设检验;
预测.
§4.3一元曲线回归
双曲线型;
幂函数曲线型;
指数曲线型;
倒指数曲线型;
对数曲线型;
型曲线.
§4.4多元线性回归
多元线性回归中参数的估计及估计量的性质;
多元线性回归的假设检验;
最优回归方程的选择;
多项式回归;
预测.
二、重点内容
一元线性回归中参数的最小二乘估计;
一元线性回归中参数的区间估计和假设检验;
多元线性回归中参数的最小二乘估计;
多元线性回归中的假设检验.
三、典型例题
例1为研究温度对某个化学反应过程的生产量的影响,收集到如下数据(规范化形式):
x -5-4-3-2-1012345 y 1547108913141318 假定和之间满足关系:
(1)求的最小二乘估计;
(2)利用检验法检验由(1)得到的线性回归方程的效果是否显著()?
解由表中数据得:
(1)
(2)采用检验法,其观察值为:
当时,
由于3.2498<9.7789.故拒绝.即认为线性回归效果显著.
例2.设
各相互独立,且均服从.
写出系数矩阵X;
求的最小二乘估计;
证明当m=2n时,不相关.
解:(1)
(2)
记则:
从而的最小二乘估计为:
(3)当m=2n时,的非对角元为0,故知与不相关.
例3对某矿体的8个采样进行测定,得到该矿体含铜量与含银量的数据如下:
x 37 34 41 43 41 34 40 45 y 1.9 2.4 10 12 10 3.6 10 13
(1)建立对的回归直线方程;
(2)做线性相关性检验(,用检验)。
解由题设数据可得:
,
,
(1)因为:
因而对的回归直线方程为:
(2)线性相关性检验即检验假设:
因为
故由前计算可得:
故:
对,查表得:
由于,故拒绝假设,即认为与之间有显著的线性相关性。
四思考题作业题:
4-1,4-2,4-4.
方差分析
一内容提要
5.1引言
5.2单因子方差分析;
等重复试验的方差分析;
不等重复试验的方差分析;
双因子方差分析
双因子试验的数学模型;
非重复试验的方差分析;
等重复试验的方差分析.
二重点内容
等重复试验的单因子方差分析;
不等重复试验的单因子方差分析.
三典型例题
例1.某印刷厂为了考察染整工艺对缩水率的影响,对一批由同种原料织成的布,用六种不同的染工艺各自处理了四块布样,测得缩水率的分数如下:
工艺
试验
123456 1
2
3
4 4.82.23.23.05.04.7
4.43.94.23.62.44.3
5.71.64.32.12.73.6
3.93.34.12.04.85.0
试问染整工艺对缩水率有无显著影响()?
解:这是单因子等重复试验,重复数k=4,水平数p=6,因而n=kp=24.
用变换,对数据进行变换得:
工艺
试验
123456 1
2
3
4 8-18-8-10107
4-12-4-163
17-243-19-13-4
-1-71-20810 计算如下:;
;
.
从而
查表知:
因,故拒绝,即认为染整工艺对缩水率的影响是显著的.
例2设有三台同样规格的机器,用来生产厚度为的铝板。今要了解各台机器生产产品的平均厚度是否相同,取样测至千分之一厘米,得结果如下:
Ⅰ Ⅱ Ⅲ 0.236 0.257 0.258 0.238 0.253 0.264 0.248 0.255 0.259 0.245 0.254 0.267 0.243 0.261 0.262
试问这三台机器在水平下有无显著的差异?
解:分别以,,记三台机器生产的铝板总体均值。则我们要检验:
令,将数据简化如下:
Ⅰ Ⅱ Ⅲ -14 7 8 -12 3 14 -2 5 9 -5 4 17 -7 11 12
计算得方差分析表如下:
方差来源 平方和 自由度 均方 F值 机器之间 2 误差 12 总和 14
当时.查表得:
因为,故拒绝,即认为这三台机器在水平下的差异是显著的。
例3.某灯泡厂用四种不同材料的灯丝制成四批灯泡.今在每批灯泡中分别随机抽取若干只进行寿命试验(单位:小时),其结果如下:
灯
泡
种
类
,,,,,,
,,,,,
,,,,,,,
,,,,,
试问灯丝材料对灯泡寿命有无显著影响()?
解:这是单因子不等重复试验,水平数p=4,
.
因而,
利用不等重复试验的方差分析公式计算,其结果如下:
方差来源 离差平方和 自由度 均方离差 F值 组间 3 组内 22 总方差 25
当时.
因为.故接受,即认为灯丝材料对灯泡寿命无显著影响。
四.思考题,作业题
5-2,5-3,5-4.
时间序列分析
内容提要
引言
时间序列的线性模型;
平稳时间序列;
平稳时间序列常用数字特征;
三种线性模型AR(p),MA(q),ARMA(p,q);
平稳域和可逆域;
三种模型的自相关函数及其性质;
偏相关函数.
模型的识别与检验
样本自相关函数与样本偏相关函数;
模型识别;
模型的参数估计
AR(p),MA(q),ARMA(p,q)的参数估计;
时间序列的预报
AR(p),MA(q),ARMA(p,q)模型的预报.
重点内容.
平稳时间序列常用的数字特征;
三种线性模型及其平稳域,可逆域;
三种线性模型的识别;
三种线性模型的预报.
典型例题
例1.判断线性模型是否满足平稳条件?
解:模型的特征方程为:
解得:
由于,故知满足平稳条件.
例2.判断线性模型是否满足平稳条件、可逆条件?
解:模型的特征方程为:
解得:
由于,故知满足平稳条件。
又由特征方程:解得:。
由于,故知满足可逆条件.
例3.对AR(2)模型:
试求一步,二步和三步预报公式
解:一步预报公式:
二步预报公式:
三步预报公式:
例4.求MA(1)模型的预报.
解:将模型改写为:
由此得:
;
;
;
故其预报为:
例5求ARMA(p,q)模型的递推预报.
解:
故有:;
;
当L>2时,
以上的,由样本数据计算.
思考题作业题
6-1,6-6,6-7
|
|