Gothedistance
第1页共11页
学案58变量间的相关关系
导学目标:1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关
关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
自主梳理
1.两个变量的线性相关
(1)正相关
在散点图中,点散布在从__________到________的区域,对于两个变量的这种相关关系,
我们将它称为正相关.
(2)负相关
在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为负
相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有
线性相关关系,这条直线叫做回归直线.
2.回归方程
(1)最小二乘法
求回归直线使得样本数据的点到它的________________________的方法叫做最小二乘
法.
(2)回归方程
方程y
^
=b
^
x+a
^
是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,
yn)的回归方程,其中a
^
,b
^
是待定参数.
自我检测
1.下列有关线性回归的说法,不正确的是()
A.相关关系的两个变量不一定是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有回归直线方程
2.(2009·海南,宁夏)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);
对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
Gothedistance
第2页共11页
3.(2011·银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x1234
用水量y4.5432.5
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其回归直线方程是y
^
=
-0.7x+a
^
,则a
^
等于()
A.10.5B.5.15C.5.2D.5.25
4.(2010·广东)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单
位:万元)的统计资料如下表所示:
年份20052006200720082009
收入x11.512.11313.315
支出Y6.88.89.81012
根据统计资料,居民家庭年平均收入的中位数是_________________________________,
家庭年平均收入与年平均支出有______线性相关关系.
5.(2011·金陵中学模拟)已知三点(3,10),(7,20),(11,24)的横坐标x与纵坐标y具有线
性关系,则其回归方程是________________.
探究点一利用散点图判断两个变量的相关性
例1有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,
得到一个卖出热饮杯数与当天气温的对比表:
温度
(℃)-504712151923273136
热饮
杯数15615013212813011610489937654
(1)画出散点图;
(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗?
变式迁移1某班5个学生的数学和物理成绩如表:
学生
学科ABCDE
数学8075706560
物理7066686462
画出散点图,并判断它们是否有相关关系?
Gothedistance
第3页共11页
探究点二求回归直线方程
例2假设关于某设备的使用年限x和所支出的维修费用y(万元)有以下统计资料:
使用年限x23456
维修费用y2.23.85.56.57.0
若由资料知y对x呈线性相关关系.试求回归方程y
^
=b
^
x+a
^
.
变式迁移2已知变量x与变量y有下列对应数据:
x1234
y123223
且y对x呈线性相关关系,求y对x的回归直线方程.
探究点三利用回归方程对总体进行估计
例3下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应
的生产能耗y(吨标准煤)的几组对照数据.
x3456
y2.5344.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程y
^
=b
^
x+a
^
;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,
预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
Gothedistance
第4页共11页
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
变式迁移3(2011·盐城期末)某单位为了了解用电量y度与气温x℃之间的关系,随机
统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)181310-1
用电量(度)24343864
由表中数据得回归方程y
^
=b
^
x+a
^
中b
^
=-2,预测当气温为-4℃时,用电量的度数
约为________.
1.相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.而相关关
系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.函数关系是
一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个
点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:
y
^
=b
^
x+a
^
.其中
我们称这个方程为y对x的回归直线方程.其中x=1n∑
n
i=1xi,y=
1
n∑
n
i=1yi,(x,y)称
为样本点的中心.
3.求回归直线方程的步骤:(1)计算出x、y、∑
n
i=1x
2
i、∑
n
i=1xiyi的值;(2)计算回归系数a
^
、
b
^
;(3)写出回归直线方程y
^
=b
^
x+a
^
.
(满分:75分)
一、选择题(每小题5分,共25分)
1.下列命题:
①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过回归直线y
^
=b
^
x+a
^
及回归系数b
^
,可以估计和预测变量的取值和变化趋势.
其中正确的命题是()
A.①②B.①③C.②③D.①②③
2.设有一个回归直线方程为y
^
=2-1.5x,则变量x增加一个单位时()
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
Gothedistance
第5页共11页
D.y平均减少2个单位
3.(2011·陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l
是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(x,y)
4.(2011·山东)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)4235
销售额y(万元)49263954
根据上表可得线性回归方程y
^
=b
^
x+a
^
中的b
^
为9.4,据此模型预报广告费用为6万元
时销售额为()
A.63.6万元B.65.5万元
C.67.7万元D.72.0万元
5.(2011·青岛模拟)为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自
独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两
人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是s、t,那么下列说法中
正确的是()
A.直线l1和l2一定有公共点(s,t)
B.直线l1和l2相交,但交点不一定是(s,t)
C.必有l1∥l2
D.l1与l2必定重合
二、填空题(每小题4分,共12分)
6.下列关系中,是相关关系的为________.(填序号)
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
7.已知回归直线的斜率的估计值是0.73,样本点的中心为(12.5,8.25),则回归直线的回
归方程是______________.
8.(2011·茂名月考)在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,
得观测结果如下表:
温度(x)010205070
溶解度(y)66.776.085.0112.3128.0
则由此得到回归直线的斜率为________.
三、解答题(共38分)
9.(12分)(2011·威海模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,
为此做了四次试验,得到的数据如下:
零件的个数x(个)2345
加工的时间y(小时)2.5344.5
(1)在给定的坐标系中画出表中数据的散点图;
Gothedistance
第6页共11页
(2)求出y关于x的回归方程y
^
=b
^
x+a
^
,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
(注:b
^
=
∑
n
i=1xiyi-nxy
∑
n
i=1x
2
i-nx
2
,a
^
=y-b
^
x)
10.(12分)(2010·许昌模拟)某种产品的宣传费支出x与销售额y(单位:万元)之间有如
下对应数据:
x24568
y3040605070
(1)画出散点图;
(2)求回归直线方程;
(3)试预测宣传费支出为10万元时,销售额多大?
11.(14分)某企业上半年产品产量与单位成本资料如下:
月份产量(千件)单位成本(元)
1273
2372
3471
4373
5469
6568
(1)求出回归方程;
(2)指出产量每增加1000件时,单位成本平均变动多少?
(3)假定产量为6000件时,单位成本为多少元?
Gothedistance
第7页共11页
学案58变量间的相关关系
自主梳理
1.(1)左下角右上角(2)左上角右下角2.(1)距离的平方和最小
(2)
∑
n
i=1?xi-x??yi-y?
∑
n
i=1?xi-x?
2
∑
n
i=1xiyi-nxy
∑
n
i=1x
2
i-nx
2
y-b
^
x
自我检测
1.D2.C3.D
4.13正5.y
^
=74x+234
课堂活动区
例1解题导引判断变量间是否线性相关,一种常用的简便可行的方法就是作散点
图.
散点图是由大量数据点分布构成的,是定义在具有相关关系的两个变量基础之上的,对
于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度.
解(1)以x轴表示温度,以y轴表示热饮杯数,可作散点图,如图所示.
(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售
杯数之间是负相关关系,即气温越高,卖出去的热饮杯数越少.
从散点图可以看出,这些点大致分布在一条直线附近.
变式迁移1解以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下图
所示:
由散点图可见,两者之间具有相关关系.
例2解题导引根据题目给出的数据,利用公式求回归系数,然后获得回归方程.
解制表如下:
i12345合计
xi2345620
yi2.23.85.56.57.025
xiyi4.411.422.032.542.0112.3
x2i4916253690
Gothedistance
第8页共11页
x=4;y=5;∑
5
i=1x2i=90;∑
5
i=1xiyi=112.3
于是有b
^
=112.3-5×4×590-5×42=12.310=1.23;
a
^
=y-b
^
x=5-1.23×4=0.08.
∴回归直线方程为y
^
=1.23x+0.08.
变式迁移2解x=1+2+3+44=52,
y=
1
2+
3
2+2+3
4=
7
4,
∑
n
i=1x
2
i=1
2+22+32+42=30,
∑
n
i=1xiyi=1×
1
2+2×
3
2+3×2+4×3=
43
2,
∴b
^
=
∑
n
i=1xiyi-nxy
∑
n
i=1x
2
i-nx
2
=
43
2-4×
5
2×
7
4
30-4×254
=0.8,
a
^
=y-b
^
x=74-0.8×52=-0.25,
∴y
^
=0.8x-0.25.
例3解题导引利用描点法得到散点图,按求回归方程的步骤和公式,写出回归方
程,最后对总体进行估计.
利用回归方程可以进行预测,回归方程将部分观测值所反映的规律进行延伸,是我们对
有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量值的基础
和依据,有广泛的应用.
解(1)散点图:
(2)x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,
∑
4
i=1xiyi=3×2.5+4×3+5×4+6×4.5=66.5.
∑
4
i=1x
2
i=3
2+42+52+62=86,
∴b
^
=
∑
4
i=1xiyi-4xy
∑
4
i=1x
2
i-4x
2
=66.5-4×4.5×3.586-4×4.52=0.7,
a
^
=y-b
^
x=3.5-0.7×4.5=0.35.
∴所求的回归方程为y
^
=0.7x+0.35.
Gothedistance
第9页共11页
(3)现在生产100吨甲产品用煤
y
^
=0.7×100+0.35=70.35,
∴降低90-70.35=19.65(吨标准煤).
变式迁移368
解析x=10,y=40,回归方程过点(x,y),
∴40=-2×10+a
^
.∴a
^
=60.
∴y
^
=-2x+60.
令x=-4,y
^
=(-2)×(-4)+60=68.
课后练习区
1.D[根据线性回归的含义、方法、作用分析这三个命题都是正确的.]
2.C[设(x1,y1),(x2,y2)在直线上,若x2=x1+1,则y2-y1=(2-1.5x2)-(2-1.5x1)
=1.5(x1-x2)=-1.5,y平均减少1.5个单位.]
3.D[因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越
接近1,两个变量的线性相关程度越强,所以A、B错误.C中n为偶数时,分布在l两侧
的样本点的个数可以不相同,所以C错误.根据线性回归方程一定经过样本中心点可知D
正确.所以选D.]
4.B[∵x=4+2+3+54=72,y=49+26+39+544=42,
又y
^
=b
^
x+a
^
必过(x,y),∴42=72×9.4+a
^
,∴a
^
=9.1.
∴线性回归方程为y
^
=9.4x+9.1.
∴当x=6时,y
^
=9.4×6+9.1=65.5(万元).]
5.A[回归直线方程为y
^
=b
^
x+a
^
.而a
^
=y-b
^
x,
即a
^
=t-b
^
s,t=b
^
s+a
^
.∴(s,t)在回归直线上.
∴直线l1和l2一定有公共点(s,t).]
6.①②
解析①中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关
系.②教师的执教水平与学生的学习成绩之间的关系是相关关系.③④都不具备相关关系.
7.y
^
=0.73x-0.875
解析a
^
=y-b
^
x=8.25-0.73×12.5=-0.875.
8.0.8809
解析x=30,y=93.6,
∑
5
i=1x
2
i=7900,∑
5
i=1xiyi=17035,
∴回归直线的斜率为
b
^
=
∑
5
i=1xiyi-5xy
∑
5
i=1x
2
i-5x
2
=17035-5×30×93.67900-4500≈0.8809.
9.解
Gothedistance
第10页共11页
(1)散点图如图所示.(4分)
(2)由表中数据得∑
4
i=1xiyi=52.5,
x=3.5,y=3.5,∑
4
i=1x
2
i=54,
∴b
^
=0.7.∴a
^
=y-b
^
x=1.05.
∴y
^
=0.7x+1.05.回归直线如图中所示.(10分)
(3)将x=10代入回归直线方程,
得y=0.7×10+1.05=8.05(小时),
∴预测加工10个零件需要8.05小时.(12分)
10.解(1)根据表中所列数据可得散点图如图所示:
(4分)
(2)计算得:x=255=5,y=2505=50,
∑
5
i=1x
2
i=145,∑
5
i=1xiyi=1380.
于是可得b
^
=
∑
5
i=1xiyi-5xy
∑
5
i=1x
2
i-5x
2
=1380-5×5×50145-5×52=6.5,
a
^
=y-b
^
x=50-6.5×5=17.5,
因此,所求回归直线方程是y
^
=6.5x+17.5.(10分)
(3)由上面求得的回归直线方程可知,当宣传费支出为10万元时,y
^
=6.5×10+17.5=
82.5(万元),
即这种产品的销售大约为82.5万元.(12分)
11.解(1)n=6,∑
6
i=1xi=21,∑
6
i=1yi=426,x=3.5,y=71,
∑
6
i=1x
2
i=79,∑
6
i=1xiyi=1481,
b
^
=
∑
6
i=1xiyi-6xy
∑
6
i=1x
2
i-6x
2
=1481-6×3.5×7179-6×3.52≈-1.82.
(3分)
a
^
=y-b
^
x=71+1.82×3.5=77.37.(5分)
∴回归方程为y
^
=a
^
+b
^
x=77.37-1.82x.(6分)
(2)因为单位成本平均变动b
^
=-1.82<0,且产量x的计量单位是千件,所以根据回归系
Gothedistance
第11页共11页
数b的意义有:
产量每增加一个单位即1000件时,单位成本平均减少1.82元.(10分)
(3)当产量为6000件时,即x=6,代入回归方程:
y
^
=77.37-1.82×6=66.45(元).
∴当产量为6000件时,单位成本为66.45元.
(14分)
|
|