配色: 字号:
§119 回归分析(二)
2019-01-18 | 阅:  转:  |  分享 
  
从散点图中可以看出:这些样本点更像是集中在一条曲线附近x与y之间的关系用线性回归并非最佳选择(5)《选修2-3》P:86例2一只红铃虫的产卵数y与温度x有关,现收集了7组观测数据,试建立y与x之间的回归方程y=bx2+ay=bt+a选用y=bx2+a,还是y=bx2+cx+a?如何求a、b?二次函数模型令t=x2方案2选用y=bx2+a非线性回归线性回归换元法令t=x2,则温度的平方t44152962572984110241225产卵数y/个711212466115325作散点图,当x=28时,y=0.367×282-202.54≈85由计算器得y和t之间的线性回归方程?=0.367t-202.54即y和x之间的回归方程为?=0.367x2-202.54而x=29时,y=66而方案1中当x=28时,y≈93仍然有:85>66模型选取的仍然不好!指数函数模型1方案3选用如何求C1、C2?两端取对数得令,则z=bx+a非线性回归线性回归换元法xz令则z=lgy产卵数y/个0.851.041.321.381.822.062.51711212466115325作散点图,由计算器得z和x之间的线性回归方程即y和x之间的回归方程为?=0.022×100.118x当x=28时,y=……≈4444<66,符合正相关的规律了而x=29时,y=66较前两个方案中的直线或二次曲线好多了指数函数模型2方案4选用如何求C1、C2?两端取对数得令,则z=bx+a非线性回归线性回归换元法5.7844.7454.193.1783.0452.3981.946z35322927252321x令则作散点图,由计算器得z和x之间的线性回归方程?=0.021×e0.272x即y和x之间的回归方程为当x=28时,y=……≈43而方案1中当x=28时,y≈93而方案2中当x=28时,y≈66而方案3中当x=28时,y≈44如何评判:上述四种回归模型的拟合效果呢?一、线性回归:二、非线性回归:三、回归模型拟合效果的评判:1.散点图法:2.残差法:①残差图法:②残差平方和法:3.相关指数R2法:非线性回归线性回归换元法S1.画散点图或求出相关系数,判定是否相关S3.用回归方程作预报S2.求回归方程由散点图可以看出:①选用非线性回归模型,显然要比线性回归效果好②非线性回归模型中,二次与指数,哪个更佳?用散点图就不容易区分了散点图法1:③需另辟蹊径,但根据是:误差越小越好(5)《选修2-3》P:86例2一只红铃虫的产卵数y与温度x有关,现收集了7组观测数据,试建立y与x之间的回归方程误差e(Error):随机(整体)误差点(个体)误差残差偏差回归差=真实值-预报值=预报值-均值=真实值-均值①残差的定义:2.残差法:②残差分析:①°残差图法②°残差平方和法数据点和它在回归曲线上相应位置的差异即称为残差残差法2:方案4方案2①显然,仅仅有两个模型的残差还不能直观地判定其拟合效果②一般地,将其“加工”成、比较直观的:残差图或残差平方和……(5)《选修2-3》P:86例2一只红铃虫的产卵数y与温度x有关,现收集了7组观测数据,试建立y与x之间的回归方程①以残差为纵坐标以其他指定的量为横坐标的散点图②若残差点比较均匀地落在水平的带状区域中、说明选用的模型计较合适③若个别样本点的残差比较大即有异常点存在需确认是否数据的采集有错误残差图法这样的带状区域的宽度越窄说明模型拟合精度越高回归方程的预报精度越高几种常见的残差分布示意图③④①②①图说明具有较好的线性关系②图说明具有相关关系,但模型有待改进③图说明具有相关关系,需加入平方项④图说明具有相关关系,需引入变量三、回归模型拟合效果的评判:1.散点图法:2.残差法:①残差图法:②残差平方和法:<2>残差平方和越小,说明拟合效果越好<1>称为残差平方和(5)《选修2-3》P:86例2……方案4中选指数模型时,其残差平方和说明:方案4的拟合效果远远优于方案2方案2中选二次模型时,其残差平方和一、线性回归:二、非线性回归:三、回归模型拟合效果的评判:1.散点图法:2.残差法:①残差图法:②残差平方和法:3.相关指数R2法:非线性回归线性回归换元法3.相关指数(样本决定系数或判定系数)R2法:①计算公式:②作用:③°R2?1,说明回归方程拟合的越好R2?0,说明回归方程拟合的越差①°在线性回归中恰好有:相关指数R2=相关系数r2②°R2∈[0,1]解释变量对预报变量的贡献率(5)《选修2-3》P:86例2……①方案1中选线性模型时,相关指数R2≈0.7464②方案2中选二次模型时,相关指数R2≈0.802③方案3中选指数模型时,相关指数R2≈0.985即该模型中温度解释了80.2%产卵数的变化即该模型中温度解释了98.5%产卵数的变化即该模型中温度解释了74.64%产卵数的变化R2说明越大,说明回归方程的拟合效果越好(6)下列说法错误的是D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好其样本数据点(x1,y1),(x2,y2),……C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高【B】B.线性回归方程对应的直线至少经过(xn,yn)中的一个点A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系(7)《选修2-3》P:89Ex3如果发现散点图中所有的样本点都落在一条斜率为非0实数的直线上②相关指数R2是多少?①解释变量和预报变量的关系是什么?答:是线性函数关系答:R2=1③残差平方和是多少?答:残差平方和为0针对训练:预习:1.《新考案》P:147例12.《新考案》P:147变式训练23.《精炼案》P:97Ex1独立性检验§119回归分析(二)一、线性回归:二、非线性回归:三、回归模型拟合效果的评判:1.散点图法:2.残差法:①残差图法:②残差平方和法:3.相关指数R2法:非线性回归线性回归换元法S1.画散点图或求出相关系数,判定是否相关S3.用回归方程作预报S2.求回归方程分布列的求法一选二算三列表一选:根据题意,灵活准确地计算各随机变量相应的概率根据题意,灵活准确地选取随机变量所有可能的取值二算:三列表:Xx1x2x3x4…xi…pp1p2p3p4…pi…三大分布公式法概率与统计简述总体样本抽样估计推断回归分析相关分析分布列及期望概率计数定量变量分类(定性,属性)变量变量的分类定量变量:如长度、重量、速度、温度……定性变量:如某种产品分为一等品、二等品、三等品身份证的编号……②①解释变量预报(响应)变量不相关相关关系函数关系变量间的关系注:相关关系的分类①按相关的方向分为③按影响因素的数量可分为正相关(暂理解成回归曲线为增函数)负相关(暂理解成回归曲线为减函数)②按回归曲线分为线性相关(回归曲线为直线)非线性相关(回归曲线为曲线)④按关联的密切程度可分为单相关复相关偏相关完全相关不完全相关完全不相关(无关)法2:散点图法法1:经验法法3:相关系数r法(参《必修3》P:92~93)①如果散点图中样本点,从整体上看大致分布一曲线附近(该曲线称回归曲线),则称这两变量是相关关系②如果回归曲线是增函数,则称为正相关如果回归曲线是减函数,则称为负相关变量相关关系的判定法5:数表法:法4:关系式法:主要是利用回归方程……主要观察是否具有单调性……法3:相关系数r——衡量变量之间相关程度的指标(1)计算公式:(2)性质:不相关弱相关一般相关强相关完全相关?!①|r|≤1②0.2500.300.751|r|③正相关r>0增函数负相关r<0减函数误差e(Error)随机(整体)误差点(个体)误差残差偏差回归差=真实值-预报值=预报值-均值=真实值-均值①误差显然是“祸根”,但其存在是天然的,无法消除故“没有最好,只有更好”③最小二乘法或偏导法求的最小值②高中只研究(或)的最小值,只需误差最小化即可线性相关(线性回归)简介1.含义:2.步骤:回归分析的特例,回归曲线是直线①画散点图或求出相关系数,判定是否相关③用回归方程作预报②求回归方程画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算注:回归直线一定经过样本中心点§119回归分析(二)一、线性回归:二、非线性回归:三、回归模型拟合效果的评判:1.散点图法:2.残差法:①残差图法:②残差平方和法:3.相关指数R2法:非线性回归线性回归换元法S1.画散点图或求出相关系数,判定是否相关S3.用回归方程作预报S2.求回归方程S1:确定研究对象,明确解释变量和预报变量S4:利用公式,求出回归方程S2:判定它们是否存在相关关系S5:评价拟合效果,得出结论S3:确定回归方程类型回归分析的操作步骤线性回归是回归分析的特例回归曲线是直线一、线性回归:(1)(2013年广东)某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm,170cm和182cm.因儿子的身高与父亲的身高有关,该数学老师用线性回归分析的方法预测他孙子的身高为cm.S1:确定研究对象,明确解释变量和预报变量析:回归分析五大步①确定身高的因素是多方面的,饮食,运动,遗传……③父亲与儿子的身份,具有相对性……②父亲的身高是自变量x,儿子的身高是因变量yxy173170170176176182182?析:回归分析五大步①散点图法②相关系数r法S2:观察x与y是否存在相关关系ⅰ:只有3个样本点,讨论回归显然有一些勉强ⅱ:但重点在探究方法,故本题限定了:是线性回归的关系不相关弱相关一般相关强相关完全相关?!0.2500.300.751|r|S3:确定回归方程类型已明确:是线性回归的关系故所求回归方程为:,即他孙子的预测身高为185cmxy173170170176176182182?由题意得当x=182时,画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算S4:按一般规则估计回归方程中的参数S5:评价回归模型的拟合效果:……线性回归的运算技巧S2:将新数据得到的回归方程还原即可S1:旧数据新数据化大为小先将数据预处理如下:由预处理后的数据,易得父高-1730-3子高-1763-660另法:故所求回归方程是:化简得:令x=182得S1:确定研究对象,明确解释变量和预报变量S4:利用公式,求出回归方程S2:判定它们是否存在相关关系S5:评价拟合效果,得出结论S3:确定回归方程类型回归分析的操作步骤线性回归是回归分析的特例,回归曲线是直线一般的,线性回归的操作步骤,可简化成三步一、线性回归:S1.画散点图或求出相关系数,判定是否相关S2.求回归方程S3.用回归方程作预报一、线性回归:S1.画散点图或求出相关系数,判定是否相关1.相关系数r是衡量变量之间相关程度的指标相关系数r2.性质:不相关弱相关一般相关强相关完全相关?!①|r|≤1②0.2500.300.751|r|③正相关r>0增函数负相关r<0减函数一、线性回归:S1.画散点图或求出相关系数,判定是否相关S2.求回归方程画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算②①估计的回归方程:,③最小二乘法推得偏导法推得一、线性回归:S1.画散点图或求出相关系数,判定是否相关S3.用回归方程作预报S2.求回归方程画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算注:回归直线一定经过样本中心点177177176175175儿子身高y(cm)178176176176174父亲身高x(cm)则y对x的线性回归方程为(2).(2011年江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:177177176175175儿子身高y(cm)178176176176174父亲身高x(cm)法1:由题意得画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算176176故所求回归方程为:(2).(2011年江西)为了解儿子身高与其父亲身高的……177177176175175儿子身高y(cm)178176176176174父亲身高x(cm)法2:先将数据预处理如下:故所求回归方程为:(2).……110-1-1儿子身高y-1762000-2父亲身高x-176由预处理后的数据,易得即177177176175175儿子身高y(cm)178176176176174父亲身高x(cm)则y对x的线性回归方程为(2).(2011年江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:法3:由题意得画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算176176将样本中心点(176,176)逐个代入答案检验只有C成立故选【C】(Ⅰ)利用所给数据,求年需求量与年份之间的(3)(2011年安徽)某地最近十年粮食需求量逐年上升、下表是部分统计数据:回归方程(Ⅱ)利用(Ⅰ)中所求出的直线方程、预测该地2012年的粮食需求量S2:故求线性回归方程的书写格式S3:即所求回归方程为S1:由题意得S4:利用回归方程做出预报画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算(Ⅰ)利用所给数据求年需求量与年份之间的回归方程解:(Ⅰ)先将数据预处理如下:由处理后的数据,易得(3)(2011年安徽)某地最近十年粮食需求量逐年上升下表是部分统计数据:年份-20060-4需求量-2574-21190-22-1129故所求回归方程为即(Ⅰ)回归方程(Ⅱ)利用(Ⅰ)中所求出的直线方程预测该地2012年的粮食需求量(3)(2011年安徽)某地最近十年粮食需求量逐年上升下表是部分统计数据:解(Ⅱ):令x=2012代入得(万吨)故预测该地2012年的粮食需求量约为300万吨(4)(2014年湖北)根据如下样本数据得到的回归方程为,则x345678y42.5-0.50.5-2-3a>0,b>0B.a>0,b<0C.a<0,b>0D.a<0,b<0【B】法1:求出回归方程:法2:画出散点图:画图求数定相关二求方程三预报直线必过中心点先算中心再斜率代入求得纵截距小题形法可估算一、线性回归:二、非线性回归:非线性回归线性回归换元法S1.画散点图或求出相关系数,判定是否相关S3.用回归方程作预报S2.求回归方程(5)《选修2-3》P:86例27组观测数据,试建立y与x之间的回归方程方案1当x=28时,y=19.87×28-463.73≈93假设线性回归方程为:?=bx+a由计算器得……线性回归方程为?=19.87x-463.73<93?解:选取气温为解释变量x,产卵数预报变量y线性回归模型而x=29时,y=66模型选取的不好!一只红铃虫的产卵数y与温度x有关,现收集了A.=x-1B.=x+1

C.=88+xD.=176

A.=x-1B.=x+1C.=88+xD.=176

Sheet3

Sheet2

Sheet1

散点图

温度

产卵数

0.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

00.00

0.00

00.00

产卵数

温度

产卵数

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

Sheet3

Sheet2

Sheet1

图表1

最高气温

杯数

温度

产卵数y/个

温度的平方t

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

000.00

000.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

产卵数y/个

y=cxx+d

产卵数y/个

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

.00

.00

.00

.00

.00

.00

.00

.00

.00

0.00

0.00

0.00

杯数

产卵数y/个

00.00

00.00

00.00

00.00

00.00

000.00

000.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

Sheet3

Sheet2

Sheet1

散点图

温度

产卵数

0.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

00.00

0.00

00.00

产卵数

温度

产卵数

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

Sheet3

Sheet2

Sheet1

散点图

温度

产卵数

0.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

00.00

0.00

00.00

产卵数

温度

产卵数

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

Sheet7

Sheet6

Sheet5

Sheet4

Sheet3

Sheet2

Sheet1

Chart5

年份

GDP

年份

序号

残差

身高

体重

x

z

变换后样本数据表

t

y

编号

e(1)

e(2)







温度x

产卵数y







编号

.00

.00

.00

.00

.00

.00

.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

.00

-.00

.00

-.00

.00

-0.00

0.00

0.00

0.00

-.00

-0.00

-0.00

-0.00

0.00

变换后样本数据表

00.00

00.00

00.00

00.00

00.00

000.00

000.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

y

变换后样本数据表

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

.00

.00

z

温度x

0.00

0.00

0.00

0.00

0.00

0.00

0.00

产卵数y

.00

0.00

0.00

0.00

0.00

00.00

00.00

年份

序号

残差

000.00

.00

-00.00

000.00

.00

-000.00

000.00

.00

000.00

000.00

.00

000.00

000.00

.00

000.00

000.00

.00

000.00

000.00

.00

-000.00

000.00

.00

-000.00

000.00

.00

-000.00

000.00

0.00

-00.00

年份

000.00

0000.00

000.00

0000.00

000.00

0000.00

000.00

0000.00

000.00

0000.00

000.00

0000.00

000.00

0000.00

000.00

0000.00

000.00

0000.00

000.00

00000.00

身高

体重

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

体重

z

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

.00

.00

Sheet3

Sheet1

练习

Chart1

x(身高)

y(体重)

Ex4

X

Y

U

V

Ex8

Ex9

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

x(身高)

y(体重)

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

00.00

00.00

00.00

00.00

00.00

0.00

000.00

0.00

000.00

00.00

00.00

00.00

00.00

00.00

00.00

Sheet3

Sheet1

练习

Chart2

x(身高)

y(体重)

Ex4

X

Y

U

V

Ex8

Ex9

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

0.00

.00

x(身高)

y(体重)

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

00.00

0.00

0.00

000.00

0.00

000.00

0.00

000.00

0.00

000.00

0.00

000.00

00.00

00.00

00.00

00.00

00.00

00.00

.00

.00

.00

.00

.00

-.00

.00

.00

.00

-.00

.00

-.00

.00

.00

.00

.00

.00

.00

.00

.00

-.00

.00

-.00

-.00

Sheet3

Sheet2

Sheet1

图表2

最高气温

杯数

温度

产卵数y/个

温度的平方t

z=lny

温度

z=lgy

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

.00

.00

产卵数y/个

z=lgy

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

00.00

00.00

00.00

00.00

000.00

000.00

.00

0.00

0.00

0.00

0.00

00.00

00.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

.00

.00

产卵数y/个

产卵数y/个

z=lny

产卵数y/个

产卵数y/个

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

00.00

00.00

00.00

.00

.00

.00

.00

.00

.00

.00

.00

.00

0.00

0.00

0.00

-.00

.00

.00

0.00

0.00

0.00

0.00

0.00

00.00

0.00

0.00

0.00

0.00

.00

.00

.00

杯数

杯数

产卵数y/个

z=lgy

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

0.00

.00

.00

.00

.00

.00

.00

.00

献花(0)
+1
(本文系shidilin首藏)