配色: 字号:
《统计基础项目化教程》PPT 第8章
2022-10-26 | 阅:  转:  |  分享 
  
统计基础统计基础目录 contents认识统计相关与回归统计整理综合指标统计调查 抽样推断统计指数动态数列相关与回归
任务1 认识相关关系任务2 判断相关关系任务3 一元线性回归分析任务4 计算估计标准误差任务1
认识相关关系 函数关系——两个变量x,y, 当给定x一个
值时,另一个变量y有唯一确定值与之相对应, 我们称这种关系为确定性的函数关系。举例 (一
)相关关系与函数关系 现象之间的依存关系大致可以分成两种类型:一是函数关系另一是相关关系圆的面积:s=πR2则: y =
f (x)一、相关关系概述 相关关系——是反映现象之间确实存
在的,但关系数值不固定的相互依存关系。 一个人的身高和体重 施肥量与小麦产量 设备的使用年限与维修费用 广告费与销售收入
产品产量与生产费用 你的学习时间长短与你的学习成绩 物流总额与物流费用家庭中每个月的消费与收入举例 研究和解释现象彼此之
间依存度、关联度和因果关系,找出它们之间的变化规律,以便进行统计推算和对相关联的未知现象进行预测。 相关关系不等于因果关系注意:举
例相关关系的两个特点: 1. 现象之间确实存在着数量上的依存关系。 即,一个现象发生数量上的变化,另一个现象
也会 相应地发生数量上的变化。2. 现象间的数量依存关系值是不确定的。 即,一个现象发生数量上的变化,另
一个现象会有几个可能值与之对应,而不是唯一确定的值。例如:身高与体重之间,存在一定的依存关系, 并无严格的对应关系. 如: 身
高与体重之间,价格与销售量之间等 (二)相关关系的种类1. 按相关关系涉及的变量多少分类:单相关——复相关 ——又称一元相
关,是指两个变量之间的相关关系。例如:身高和体重、设备的使用年限与维修费用又称多元相关,是指三个或三个以上变量之间的相关关系。偏相
关 ——例如:粮食产量与施肥量、雨量、温度等是指在一个变量与两个或两个以上的变量相关的条件下,当假定其他变量不变时,其中两个变量的
相关关系称为偏相关。例如,在假定商品价格不变的条件下,该商品的需求量与消费者收入水平的相关关系即为偏相关。2. 按相关的表现形态分
类:直线相关——曲线相关——两个变量的对应取值在坐标图中大致是一条直线,也称线性相关。例如:施肥量在一定数量界限内,与亩产量表现为
线性相关;超过一定数量界限,亩产量会减 少,即非线性相关、两个变量的对应取值在坐标图中趋向于
一条曲线,也称非线性相关。现象表现为哪一种相关关系,我们就用哪一种分析方法去研究。例如:身高和体重、设备的使用年限与维修费用3.
按相关现象变化的方向分类:正相关——负相关——在直线相关中,两个变量的变动方向相同,即当一个变量的值增加或减少时,另一个变量的值也
随之增加或减少。在直线相关中,两个变量的变动方向相反,即当一个变量的值增加或减少时,另一个变量的值反而减少或增加。例如:身高和体重
、设备的使用年限与维修费用例如:商品价格与商品销售量;产量与单位成本4. 按相关的密切程度分类:完全相关——不完全相关——两个变量
之间有确定的函数关系。当一个变量变化时,另一个变量也随之发生变化,但不存在严格的函数关系,即相关关系。相关分析和回归分析研究的是不
完全相关的问题。不相关——两个变量之间各自独立,当一个变量变化时,另一个变量不变化,或呈不规则变化,则两者没有依存关系。 (
三) 相关分析的内容相关分析的目的主要是:研究现象与现象之间关系的紧密程度和变化规律,并获得具体
的数量上的认识,以便进行统计推算和预测。相关分析的基本内容:有2个1. 判断现象之间是否存在
相关关系这一点是相关分析的出发点,现象之间只有确实存在相关关系,才能进行相关分析。可以借助相关表和相关图来帮助我们做出判断,否则会
产生认识上的偏差。2. 测定现象之间相关关系的具体表现形式和密切程度线性相关关系一般通过计算相关系数来说明,非线性相关关系可以通过
相关指数来说明。这是相关分析的中心内容。 任务2 判断相关关系 定性分析是定量分析的基础,如果判明现象之间
没有什么关系,就不需要进行进一步的相关分析了。相关关系的定性判断主要包括绘制相关图一般判断编制相关表三个内容1. 相关关系的一般判
断 判明现象之间有没有相关关系,是现象之间质的规定性。需要依据研究者的有关理论知识、专业技能和实践经验等,对客观现象之
间是否存在相关关系、以及何种相关关系做出判断。一、相关关系定性判断2. 编制相关表 相关表是一种反映变量之间相关关系
的统计表。 在一般判断的基础上,把两个现象(或两个变量)的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互
关系,这种表就称相关表。根据资料,相关表有两种:简单相关表分组相关表(1)简单相关表例如:公司A产品的广告费用与销售收入数据资料如
表:根据资料看出,销售收入随着广告费用的增加而增长,两者之间存在着较明显的依存关系。公司A产品的广告费用与销售收入数据资料如表:(
2)分组相关表3. 绘制相关图 相关图又称散点图,它是用直角坐标系的横轴代表自变量 x,纵轴代表因变量 y,将两个
变量间相对应的变量值用坐标点的形式描绘出来。 用以表明相关点分布状况的图形,从相关图中可以粗略观察现象之间的相关程度
和相关状态。 广告费用销售收入 相关表和相关图可以反映两个变量之间的相互依存关系、相关形式及其相关方向,但无法确切地表
明两个变量之间相关的密切程度。 相关关系的定量判断主要通过对相关系数的计算及分析进行。 1. 相关系数的定义相关系数是用来说明两
个变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。相关系数通常用 r 表示,其定义公式为:式中:n 表示数据项
数, x 为现象的一个变量, y 为另一个变量二、相关关系定量判断2. 相关系数
的计算3. 相关系数的意义 | r | 的大小,表示两个变量 x 和 y 之间线性关系的密切程度; r 值介于 –1 与 +
1 之间,即 –1 ≤ r ≤+1; r = + 1,表示完全正相关; r = - 1 ,表示完全负相关;完全相关即函数关系;
r = 0,表明两个变量没有线性相关关系; r > 0,表明两个变量之间为正相关; r < 0,表明两个变量之间为负相关;
| r | 越接近 1,表明线性相关关系越密切,r 越接近0,表明线性相关关系越不密切; 当 0<| r |<1 时,表示两个变
量之间存在一定程度的线性相关。 相关系数 r 4. 判定线性相关关系密切程度的具体标准 0<| r |<0.3 为 弱线
性相关; 0.3≤| r |<0.5 为 低度线性相关; 0.5≤| r |<0.8 为 显著线性相关;
0.8≤ | r |<1 为 高度线性相关。 5. 相关系数的计算实例判断广告费用与销售收入之间是否具有相关关系。
公司A产品的广告费用与销售收入数据资料如表:练一练1. 搜集2013-2019年我国物流总额与物流总费用相关数据,判断两者之间是
否具有相关关系。2. 企业上半年产品产量与单位成本资料如表:要求:说明产品产量与单位成本之间是否具有相关关系。一、 回归分析的
概念与特点 回归分析是在相关分析的基础上,对具有相关关系的变量,通过一个合适的数学模型(或称回归方程)把变量之间不确定
、不规则的数量关系模型化、规范化,并据此进行估计和推算。 “回归分析”一词,是英国的生物学家高尔顿提出来的,他在研究人类的
身高时,发现了人类的身高保持基本的遗传趋势,即子女的身高向人类平均身高“回归”这一现象。 高尔顿的学生著名的统计学家皮
尔逊,则把“回归”的概念和数学方法联系起来,即把现象之间存在的某种数量关系(直线或曲线关系)的统计模型,称作回归直线或回归曲线。从
此,诞生了统计学中著名的“回归理论”。 后来“回归”一词,被用来泛指变量之间一般的数量关系,并被广泛应用到经济领域。1
. 回归分析的概念 任务3 一元线性回归分析2. 回归分析的特点本节主要介绍直线回归模式,直线回归有以下2个特点:(
1)两个变量之间不是对等关系,一个是自变量,一个是因变量。 在进行回归分析时,必须先根据研究的目的,确定哪一个是
自变量、哪一个是因变量;自 变量与因变量不同,得出的结果也不一样。(2)直线回归方程中,要求因变量是随机的,而自
变量不是随机的,是可控变量,是给定的值。 3. 回归分析的类型(1)按回归变量的个数不同(2)按回归变量的表现形式
不同一元回归分析多元回归分析线性回归分析非线性回归分析两种: 二、回归分析的内容 1. 通过对问题的分析判断,将
变量分为自变量和因变量,一般情况下,自变量表示原因, 因变量表示结果。 2. 设法找出合适的数学方
程式(即回归模型)描述变量间的关系。 3. 估计模型的参数,得出样本回归方程。 4. 应用回归模型进行推算
预测 5. 测定因变量的估计值与实际值之间的差异,反映因变量估计值的准确程度,从而将误差 控制在一定
范围内。回归分析就是通过一个变量的变化,来解释另一个变量的变化,主要内容: 三、一元线性回归分析 回归分析的任务
就是,对具有相关关系的两个变量,根据两个变量之间的表现形式,建立一个恰当的数学模型,从而对对变量之间的关系程度,进行一些计算和分析
。 这个回归模型称为回归方程。1. 一元线性回归模型一元线性回归模型,也称线性回归方程,是分析两个变量之间依存关系
的数学方程式。一般表达式为:或:或:是待定参数,通常采用最小平方法计算; a 的经济意义是:当 x 等于 0 时, y 的估
计值; b 的经济意义是:当自变量 x 每增加(或减少)一个单位时, 的平均增加值(或减少值)为 b 。
回归系数 b,表明因变量 y 对自变量 x 的回归关系;回归系数为正,表示两个变
量为正相关,直线呈上升趋势;回归系数为负,表示两个变量为负相关,直线呈下降趋势。或:2. 配合回归直线的前提条件(1)现象之间确
实存在数量上的相互依存关系。(2) 现象之间存在着直线相关关系。 (3)要有一定数量上的自变量与因变量的对应资料,且确定哪个是
自变量,哪个是因变量。满足以下三个条件:如果观测值太少,受随机因素的影响较大,现象之间的规律性很难测定,回归模型可能不准确。3.
最佳回归直线的判定标准或:高等数学证明:“符合离差平方和最小”这个条件的直线最合理。如何确定 a 、b 呢 ?即:用最小二乘法求
解两个参数 a 、b ,即: 根据“离差平方和最小”这个条件去求解最合理的直线,这个方法叫做“最小平方法”。或叫最小
二乘法。而 ∵ ∴ 令:要使函数有最小值,整理得标准方程组:则,必须满足函数对参数a 、b 的一阶偏导等于0。即:
解该方程组,求得参数a 、b 的计算公式为: 公司A产品的广告费用与销售收入数据资料如表:要求:根据广告费与销售收入之间的
相关关系, 用最小平方法配合一条回归方程。举例:5. 相关分析与回归分析的区别与联系判断现象之间是否存在相关关系,测定
相关关系的具体表现形式和密切程度。相关分析——回归分析——是在相关分析的基础上,对具有相关关系的变量,通过一个合适的数学模型(或称
回归方程)把变量之间不确定、不规则的数量关系模型化、规范化,并据此进行估计和推算。 相关分析只研究变量之间相关的方向和
程度,不能推断也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到
研究和分析的目的。(1)联系:5. 相关分析与回归分析的区别与联系(2)区别:5. 相关分析与回归分析的区别与联系练一练1.
搜集2013-2019年我国物流总额与物流总费用相关数据,用最小平方法配合一条直线回归方程。2. 企业上半年产品产量与单位成本
资料如表:要求:(1)用最小平方法配合一条一元线性回归方程。根据回归方程,两个变量之间的关系是
正相关还是负相关? (2)当月产量达到6千件时,单位成本的估计值是多少?
(3)当月产量每增加一个b(见回归方程)时,单位成本平均增加多少? 一、估计标准误差的概念 估计标准误差是用来说
明实际值与其估计值之间相对偏离程度的指标,或者说,是反映回归方程代表性大小的统计指标。 估计标准误差越小,表明回归
方程(或估计值)估计的准确程度就越高,估计值的代表性就越大; 若估计标准误差越大,表明回归方程(或估计值)估计的准确程
度就越低,估计值的代表性就越小。 估计标准误差的计算原理及经济意义与标准差基本相同。 任务4 计算估计标准误差 二
、估计标准误差的计算 1. 根据估计标准误差的定义计算2. 根据参数计算 估计标准误差 表示给
定自变量 x 一个值时,y 观测值分布的标准差;n-2为自由度,因在一元线性回归方程中,计算了两个参数,即失去了两个自由度。
三、利用估计标准误差进行预测 1. 点预测点预测不考虑估计标准误差,当广告费用达到8万元时,销售收入估计为:2. 区间预测
要求: 根据回归模型 ,在概率保证程度为95.45%的条件下,预测广告费用达到8万元时,销售收入的区间范围是多少?练一练1. 搜集2013-2019年我国物流总额与物流总费用相关数据,用最小平方法配合一条直线回归方程。2. 企业上半年产品产量与单位成本资料如表:要求:(1)用最小平方法配合一条一元线性回归方程。根据回归方程,两个变量之间的关系是 正相关还是负相关? (2)当月产量达到6千件时,单位成本的估计值是多少? (3)当月产量每增加一个b(见回归方程)时,单位成本平均增加多少? (4)计算估计标准误差;当概率保证程度为95%,单位成本估计值的区间范围是多少?
献花(0)
+1
(本文系籽油荃面原创)