配色: 字号:
07相关与回归分析
2022-04-15 | 阅:  转:  |  分享 
  
07相关与回归分析《统计与数据分析基础》目录/Contents5.15.2相关分析5.3回归分析课堂实训——分析研发与销售的关系7.1.1
相关关系与函数关系1.函数关系假设有两个变量x和y,函数关系就是指这两个变量一一对应的关系,即一个变量的数值完全由另外一
个变量的数值所决定。统计学上,如果变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,变量y按照确定
的关系取相应的值,则称y是x的函数,记为y=f(x),其中称x为自变量,y为因变量。以坐标系来表示,则所有观测点均落在
一条直线上,如图7-1所示。7.1.1相关关系与函数关系2.相关关系与函数关系相对应,相关关系是指变量之间存在一种不确定的数
量关系,即一个变量的发生变化时,另一个变量也会发生变化,但具体变化的数量不是确定的,只是在一定的范围内而已。日常生活中,相关关系是
非常普遍的,比如父母身高与子女身高的关系,商品消费量与居民收入的关系等,考察它们的关系时,由于其他因素的存在,二者之间的量化关系就
不是完全确定的,而是带有随机的成分。以坐标系来表示,则所有观测点会分布在一条直线的周围,如图7-2所示。7.1.2相关关系的类
型变量之间的相关关系可以从不同的角度进行分类,如图7-3所示。相关关系的类型7.1.3相关系数1.相关系数的计算公式相关系数
是度量变量之间关系程度和方向的统计量,对两个变量之间线性相关的度量称为简单相关系数。?样本相关系数的计算公式为:上式可以转化为以下
公式:简化为:7.1.3相关系数【实验室】分析产品产量与单位成本之间的关系TOP1:将相关数据整理到表TOP2:计算月份12
0007345329146230007295184216340007116504128443000739476121
954000691653292766500068254624340合计2100042679302681481月份产量
(件)单位成本(元/件)12000734532914623000729518421634000711650412844
3000739476121954000691653292766500068254624340合计2100042679
302681481?单位成本与产量的相关系数为:7.1.3相关系数2.相关系数的取值范围7.1.3相关系数【实验室】
使用Excel计算相关系数TOP2:计算销售收入平方数TOP1:计算广告费用平方数7.1.3相关系数TOP3:计算广告费用与销
售收入的乘积TOP4:合计各个项目的数据TOP6:输入计算公式的分母部分TOP5:输入计算公式的分子部分7.1.3相关系数TO
P7:计算相关系数TOP8:输入函数TOP9:设置函数参数TOP10:返回计算结果目录/Contents5.15.2相关分析5.3
回归分析课堂实训——分析研发与销售的关系7.2.1回归分析与相关分析的区别回归分析虽然与相关分析有一定的联系,但二者还是有明显
区别的,具体如下。(1)相关分析中,变量x与变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,变量
x称为自变量,用于预测因变量的变化。(2)相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量
,自变量x是非随机的确定变量。(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y
的影响大小,还可以由回归方程进行预测和控制。7.2.2一元线性回归分析?一元线性回归模型?2.一元线性回归方程?3.估计
的一元线性回归方程可转化为:7.2.2一元线性回归分析4.最小二乘估计最小二乘估计是指采用最小二乘法使因变量x的观察值与
估计值之间的离差平方和达到最小,以此来求得参数a和b的方法,即:??利用最小二乘法可以求得参数a和b,其计算方程组如下
。求解上述方程组,可得参数b和a的值分别如下。7.2.2一元线性回归分析【实验室】利用回归分析预测单位成本月份产量(
千件)单位成本(元/件)127341462372921634711628443739219546916276656825340合计
21426791481月份127341462372921634711628443739219546916276656825340
合计214267914817.2.2一元线性回归分析?由于产量与单位成本数据属于样本数据,因此利用估计的一元线性回归方程来
计算参数的值。该方程中因变量代表单位成本,自变量x代表产量。单位成本与产量的一元线性回归方程如下。其中,“-1.818”即回
归系数,它表示产量每增加1000件,单位成本平均会减少1.818元。如果需要预测6000件产量的单位成本,直接将其带入公式计算
,即:7.2.3一元线性回归检验1.拟合优度检验回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。如果观测点越靠近直
线,则说明回归直线对数据的拟合度越好;如果观测点越远离直线,则说明回归直线对数据的拟合度越差。(1)判定系数判定系数一般用表示,其
含义是通过因变量y的变差来解释的。对于某一个观察值来说,其变差的大小可以用实际观察值y与其均值的离差来表示;对于n
个观察值来说,其变差的总和应由这些变差的平方和来表示。?A?(2)估计标准误差估计标准误差反映的是实际观测值y与估计值之间
偏离程度的测量指标,是对回归方程误差项ε的方差的一个估计值,是残差平方和除以自由度n-k-1后的平方根,用表示,其计算公
式如下。B7.2.3一元线性回归检验【实验室】分析回归直线拟合程度和误差情况TOP1:输入计算公式TOP2:转换单元格地址的引
用方式TOP3:计算回归平方和TOP4:计算总变差平方和7.2.3一元线性回归检验TOP5:计算残差平方和TOP6:汇总表格项
目TOP7:带入到公式中计算结果?7.2.3一元线性回归检验2.显著性检验显著性检验可以分析自变量与因变量之间的线性关系是否
显著。一元线性回归方程的显著性检验包括回归方程的F检验和回归系数的t检验。(1)F检验检验是通过构建统计量,检验自变量和
因变量之间的线性关系是否显著,通过了检验则表明变量之间的线性关系显著。?A?(2)检验检验是通过构建统计量,检验自变量和因变量的影
响是否显著,通过了检验则表明自变量对因变量的影响显著,就可以用自变量来解释因变量的变化。B7.2.3一元线性回归检验【实验室】
通过显著性检验分析数学成绩TOP1:选择分析工具TOP2:设置回归分析参数TOP3:显示回归分析结果7.2.4多元线性回归分析
与检验1.多元线性回归模型2.多元线性回归方程该模型中,因变量是的线性函数与误差项的结果,称为模型的参数。?描述因变量的平均值
或期望值如何依赖于自变量的方程称为多元线性回归方程,其公式如下。?3.拟合优度检验4.显著性检验?(1)多元判定系数(2)估
计标准误差:?利用Excel的数据分析,直接对比显著性水平来判断因变量与自变量的关系。对于检验而言,如果Significance
F<,就表明个自变量和因变量之间有显著的线性关系;对于检验而言,如果P-value<,就表明自变量对因变量的影响是显著的。目录/
Contents5.15.2相关分析5.3回归分析课堂实训——分析研发与销售的关系7.3.1实训目标及思路某企业从其下研发中心
抽样20次商品的研发投入数据,并将商品的销售额数据进行汇总,希望找出二者之间存在的关系。下面将利用相关分析和回归分析找出销售额与研
发投入之间可能存在的关系,并预计在研发投入为15万元时,商品销售额的结果,具体操作思路如图7-28所示。7.3.2操作方法TO
P2:进行自变量与样本量的乘积TOP1:计算自变量的平方7.3.2操作方法TOP3:计算总变差的平方TOP4:计算回归变差的平
方7.3.2操作方法TOP5:计算残差的平方TOP6:汇总表格项目7.3.2操作方法TOP7:输入CORREL函数TOP8:设置函数参数7.3.2操作方法TOP9:计算一元线性回归方程参数TOP10:计算一元线性回归方程参数7.3.2操作方法TOP11:预测销售额TOP12:计算判定系数7.3.2操作方法TOP13:计算估计标准误差TOP14:使用回归工具7.3.2操作方法TOP15:设置回归分析参数TOP16:查看回归分析结果
献花(0)
+1
(本文系太好学原创)