分享

12.4线性回归方程

 昵称3826483 2013-12-08

12.4线性回归方程

 

一、知识导学

 

1.  变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达

2.  能用直线方程近似表示的相关关系叫做线性相关关系

3.  一般地,设有(x,y)的n对观察数据如下:

……

……

a,b使

取得最小值时,就称为拟合这n对数据的线性回归方程,将该方程所表示的直线称为回归直线.

4.线性回归方程中的系数满足:

由此二元一次方程组便可依次求出的值:

          *

5.一般地,用回归直线进行拟合的一般步骤为:

1)作出散点图,判断散点是否在一条直线附近;

2)如果散点在一条直线附近,用公式(*)求出,并写出线性回归方程.

 

二、疑难知识导析

 

1.现实世界中两个变量的关系中更多的是相关关系而不是确定性关系,许多物理学中公式看起来是确定性关系,实际上由于公式的使用范围,测量误差等的影响,试验得到的数据之间是相关关系.

2.用最小二乘估计方法计算得到的使函数达到最小

3.还有其他寻找较好的回归直线的原则(如使y方向的偏差和最小,使各点到回归直线的距离之和最小等)

4.  比较相关关系绝对值的大小可以比较一组变量之间哪两个变量有更强的(线性)相关关系.

5.  “最好的”直线方程中“最好”可以有多种解释,也就有不同的求解方法,现在广泛采用的最小二乘法所用的思想是找到使散点到直线在垂直方向上的距离的平方和最小的直线,用这个方法,的求解最简单

 

三、经典例题导讲

 

[1]有如下一组yx的数据

3

2

1

0

1

2

3

y

9

4

1

0

1

4

9

 

yx(样本)相关系数r是多少?这是否说明yx没有关系?

错解

所以相关系数r=0,yx没有关系.

错因:相关系数r=0并不是说明yx没有关系,而是说明yx没有线性相关关系,但有可能有非线性相关关系.

正解

所以相关系数r=0,yx没有线性相关关系,但有可能有非线性相关关系.

此题中yx之间存在着的二次相关关系的.

[2]某工厂在2004年的各月中,一产品的月总成本y(万元)与月产量x(吨)之间有如下数据:

x

4.16

4.24

4.38

4.56

4.72

4.96

5.18

5.36

5.6

5.74

5.96

6.14

y

4.38

4.56

4.6

4.83

4.96

5.13

5.38

5.55

5.71

5.89

6.04

6.25

20051月份该产品的计划产量是6吨,试估计该产品1月份的总成本.

分析:可将此问题转化为下面三个问题:

1)画出散点图,根据散点图,大致判断月总成本y与月产量之间是否有线性相关关系;

2)求出月总成本y与月产量x之间的线性回归方程;

(4)       20051月份该产品的计划产量是6吨,试估计该产品1月份的总成本.

错解:省去第一步,即把判断判断月总成本y与月产量之间是否有线性相关关系的过程舍去,想当然其具有线性相关关系,直接代入公式,求出线性回归方程.

错因:此题的月总成本y与月产量x之间确实是有线性相关关系,若不具有则会导致错误.因此判断的过程不可少.

正解:(1)散点图见下面,从图中可以看到,各点大致在一条直线附近,说明xy有较强的线性相关关系.

2)代入公式(*)得:a=0.9100,b=0.6477,线性回归方程是:y=0.9100x+0.6477.

3)当x=6.0时,y=0.9100(万元),即该产品1月份的总成本的估计值为6.11万元.

[3]变量有线性回归方程,现在将的单位由变为的单位由       变为,则在新的回归方程.          .

错解:0.1

错因:由     的值变为原来的 的值变为原来的可得的值应为原来的.

正解0.01

[4]假定一个物体由不同的高度落下,并测量它落下的时间,几个测量结果如下表所示:

高度s(cm)

40

60

100

130

150

180

200

220

240

时间t(ms)

353

387

505

552

579

648

659

700

725

高度(距离)与时间之间的关系由公式给出,这里g是重力加速度的值.

1)画出s关于t的散点图,这些点在一条直线附近吗?

2)设,画出s关于x的散点图,这些点在一条直线附近吗?

3)求出s关于x的线性回归方程.

:(1)高度s关于时间t的散点图见下面,从图中可以看到这些点似乎在一条直线附近,也好像在一条抛物线附近

2)高度s关于x的散点图见下面,从图中可以看到这些散点大致在一条直线附近

3)可以求得s关于x的线性回归方程是s=0.0004901x18.8458

[5]测得某国10对父子身高(单位:英寸)如下:

父亲身高(x

60

62

64

65

66

67

68

70

72

74

儿子身高(y

63.5

65.2

66

65.5

66.9

67.1

67.4

68.3

70.1

70

1)画出散点图;

2)求出yx之间的线性回归方程;

3)如果父亲的身高为73英寸,估计儿子的身高.

解:(1)散点图见下面:

2)从散点图可以看出,这些点都分布在一条直线附近,可求得线性回归方程为

3)当时,

所以当父亲的身高为73英寸时,估计儿子的身高约为69.9英寸.

 

四、典型习题导练

 

1.回归直线方程的系数a,b的最小二乘估计使函数最小,函数指(  .

A  B.    C   D.

2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论在儿子的身高y与父亲的身高x的线性回归方程中,b  .

A.在(-10)内      B.等于0   C.在(01)内       D.[1+]

3.在研究硝酸钠的可溶性程度时,对不同的温度观测它在水中的溶解度,得到观测结果如下:

温度x

0

10

20

50

70

溶解度 y

66.7

76.0

85.0

112.3

128.0

则由此得到的回归直线的斜率是                 (保留4位有效数字)

4.下面的数据是年龄在4060岁的男子中随机抽取的6个样本,分别测定了心脏功能水平y(满分100),以及每天画在看电视上的平均时间x(小时)

看电视平均时间x

4.4

4.6

2.7

5.8

0.2

4.6

心脏功能水平y

52

53

69

57

89

65

xy的样本相关系数为                       .

5.某地区近年来冬季的降雨量x(cm)与次年夏季空气中碳氢化合物的最高平均浓度yppm),的观测数据如下表:

年份 n

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

x

28

22

31

23

58

33

21

20

45

31

23

16

14

y

4.5

4.1

4.8

4.2

4.6

3.6

3.1

2.8

3.4

2.6

2.3

2.2

2.0

你认为yx是什么关系?yn是什么关系?

6.每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的托压强度(单位:kg/cm)的关系有如下数据:

x

150

160

170

180

190

200

210

220

230

240

250

260

Y

56.9

58.3

61.6

64.6

68.1

71.3

74.1

77.4

80.2

82.6

86.4

89.7

1yx是否具有线性相关关系?

2)如果yx具有线性相关关系,求线性回归方程.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多