来自:朗峥 > 馆藏分类
配色: 字号:
1.1回归分析的基本思想及其初步应用(一)(2)_8
2020-04-04 | 阅:  转:  |  分享 
  
制表78合计654321i所以回归方程是所以,对于身高为172cm的女大学生,由回归方程可
以预报其体重为探究问题4:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?例1从
某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。5943616454505748体重/kg170
155165175170157165165身高/cm87654321编号求根据一名女大学生的身
高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。探究问题4:身高为172cm的女大学生的体重一定是60
.316kg吗?如果不是,你能解析一下原因吗?答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体
重在60.316kg左右。60.136kg不是每个身高为172cm的女大学生的体重的预测值,而是所有身高为172cm的女大学生平
均体重的预测值。函数模型与回归模型之间的差别函数模型:回归模型:线性回归模型y=bx+a+e增加了随机误差项e
,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解释部分y的变化。在统计中,我们也把自变量x称为解释变
量,因变量y称为预报变量。1.用相关系数r来衡量2.公式:求出线性相关方程后,说明身高x
每增加一个单位,体重y就增加0.849个单位,这表明体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱呢?①、当
时,x与y为完全线性相关,它们之间存在确定的函数关系。②、当时,表示x与y存在着一定的线性相关,r
的绝对值越大,越接近于1,表示x与y直线相关程度越高,反之越低。3.性质:我们可以用相关指数R2来刻画回归的效果,其计算公式是
显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。在线性回归模型中,R2表示解释变
量对预报变量变化的贡献率。R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越
强)。如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这
组数据的模型。总的来说:相关指数R2是度量模型拟合效果的一种指标。在线性模型中,它代表自变量刻画预报变量的能力。1.1回归
分析的基本思想及其初步应用(一)高二(下)数学选修1-2a.比《数学3》中“回归”增加的内容数学3——统计画散点图
了解最小二乘法的思想求回归直线方程y=bx+a用回归直线方程解决应用问题选修1-2——统计案例引入线性回归模型y=bx
+a+e了解模型中随机误差项e产生的原因了解相关指数R2和模型拟合的效果之间的关系了解残差图的作用利用线性回归模型解决
一类非线性回归问题正确理解分析方法与结果我们回忆一下最小二乘法:样本点的中心:回归方程:问题1:正方形的面积y与正方形
的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否----
---有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:
施化肥量x15202530354045水稻产量y3303453654054454
50455复习:变量之间的两种关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义:
1):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2):2、现实生活中存在着大
量的相关关系。如:人的身高与年龄;产品的成本与生产数量;
商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何
规律?1020304050500450400350300·······
发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?xy
施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365
405445450455散点图我们回忆一下最小二乘法:样本点的中心:回归方程:例1从某大学中随机选取8名女大
学生,其身高和体重数据如表1-1所示。编号12345678身高/cm165165157170175
165155170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程
,并预报一名身高为172cm的女大学生的体重。案例1:女大学生的身高与体重解:1、选取身高为自变量x,体重为因变量y,作散点
图:2、由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。3、从散点图还看到,样本点
散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a描述它们关系。我们可以用下面的线性回归模型来
表示:y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差。思考问题3产生随机误差项e的原因是什么?思考产生
随机误差项e的原因是什么?随机误差e的来源(可以推广到一般):1、其它因素的影响:影响体重y的因素不只是身高x,可能还包括
遗传基因、饮食习惯、是否喜欢运动、生长环境、度量误差等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高x的观测误
差。例1从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。5943616454505748体重
/kg170155165175170157165165身高/cm87654321编号求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。根据最小二乘法估计和就是未知参数a和b的最好估计,
献花(0)
+1
(本文系朗峥首藏)