配色: 字号:
第3节 数据的分布与波动水平的量
2015-08-07 | 阅:  转:  |  分享 
  
第3节数据的分布与波动水平的量

知识要点

1.方差与标准差.

①“数据的平均水平”研究的是数据数值的大小状况.“数据的波动水平”研究的则是数据数值的变化状况.

②衡量数据波动程度的量是方差和标准差.

方差;

标准差S=

可以看出,方差和标准差都用来衡量数据偏离平均数的程度.标准差是方差的非负平方根.

③从方差的定义可以看出,当且仅当x1=x2==x3=时,S2=0.也就是说只有各个数据的值都相等,方差和标准差的值才为零.

2.频数分布直方图和频率分布直方图.

①将数据从小到大排列。数值按等距离分为若干间隔,在每一间隔内的数据个数称为该组的组频数,频数与总个数的比称为组频率;显然,各个组频数的和等于数据的总数,各个组频率的和等于1.

②在频数分布直方图中,小长方形的高等于组频数;在频率分布直方图中,小长方形的

高等于组频率/组距.小长方形的面积等于组频率.

③在频数分布直方图和频率分布直方图中,横坐标上每个间隔都只含最小值,不含最大值;即在每个间隔内,若设数据的值为x,则“a≤x
④频数分布直方图各小长方形的高之和为数据总数,频率分布直方图各小长方形的面积之和等于1.

一、方差与标准差

a例题精解

例1计算下列各组数据的平均数、方差S2和标准差S.

(1){1,2,3,4,5};

(2){101,102,103,104,105};

(3){3,6,9,12,15};

(4){21,23,25,27,29}.



























点评已知一组数据{x1,x2,x3,…,xn}的平均数是,方差是S2,标;隹差是S,设另一组数据{ax1+b,ax2+b,ax3+b,…,axn+b}的平均数为,方差为,标准差为,则



.



举一反三

1—1甲乙两名铅球运动员近期5次测试情况如图2—3—1所示.

(1)分别求出两运动员得分的平均数与方差;

(2)根据图2—3—1和第(1)小题算得的结果,对两运动员的测试情况作出评价.



























点评本题要求能读懂图,根据所给信恩作计算,并对计算结果作出评价,故对读图能力要求高.

1—2小明和小亮是校田径队员,在几次百米跑训练中,两人所测成绩如图2—3—2所

示,请根据图中提供的信息回答以下问题:

















(1)补齐下面的表格:









(2)分别计算他们这几次成绩的平均数和方差,并对两人的成绩加以比较.













1—3解答下列各题.

(1)数据x1,x2,x3的平均数是3.方差是2.求数据x1,x2,x3,3的平均数以及方差.

(2)已知数据3,6,a,8的平均数是a的2倍.求这组数据的方差.

(3)已知数据x1,x2,x3,x4的平均数是3,方差为0.75.求数据2x1、2x2、2x3、2x4、6、6的标准差.















点评这里的一组三道题目涉及较多概念和公式.必须透彻理解和熟记这些公式,并且计算正确.才能稳操胜卷.

二、频数分布直方图和频率分布直方图

例题精解

例2某班同学进行数学测验,将所得成绩(得分取整数)进行整理后分成五组.并绘制成频数分布直方图(图2—3—3).请结合直方图提供的信息,回答下列问题:

(1)该班共有多少名学生?

(2)这次成绩中的中位数落在哪个分数段?

(3)求这次测验的及格率和优良率.(60分以上为及格,80分以以上为优良)

(4)将该频数分布直方图改画成频率分布直方图.































点评①注意频数分布直方图与频率分布直方图之间的区别和联系;②横轴上的数据间隔不取整数而取分数.可以省略“每组数据只含最小值不含最大值”的说明.

举一反三

2—1有关部门想了解本区20000名初中生对世博知识掌握情况,对全区初中生进行

世博知识统一测试.在测试结果中随机抽取了400名学生的成绩进行分析,并将分析结果

(分数取整数)绘制了如下的频数分布表和频数分布直方图(图2—3—5).























根据以上提供的信息,解答下列问题:

(1)补全频数分布表;

(2)补全频数分布直方图;

(3)样本中学生成绩的中位数位于频数分布表中分数段内;

(4)若90分及以上为优秀,则估计该区有名学生测试成绩为优秀







点评第(4)小题中若回答优秀人数为400×o.25—100(人)就错了,这是样本中的优秀人数,而不是总体中的优秀人数.

2—2某校九年级260名学生进行了一次数学测验,随机抽取部分学生的成绩进行分析,这些成绩整理后分成五组,绘制成频率分布直方图(如图2—3—7),从左到右前四个小组的频率分别为0.1、0.2、0.3、0.25,最后一组的频数为6.根据所给的信息回答下列问题:

(1)共抽取了多少名学生的成绩?

(2)估计这次数学测验成绩超过80分的学生人数约有多少名?

(3)如果从左到右五个组的平均分分别为55分、68分、74分、86分、95分,那么估计这次数学测验成绩的平均分约为多少分?



















2—3某中学对九年级准备选考1分钟跳绳的学生进行测试,测试结果如下表:



请回答下列问题:

(1)此次测试成绩的中位数落在第组中.

(2)如果成绩达到或超过180次/分的学生可获满分,那么本次测

试中获得满分的人数占参加测试人数的.

(3)已知该校九年级参加体育测试的总人数为200人,若要绘制一

张统计该校各项目选考人数分布的扇形图,图2—3—8中A所在的扇形

表示参加选考1分钟跳绳的人数占测试总人数的百分比,则该扇形的圆

心角应为.

(4)如果此次测试的平均成绩为171次/分,那么这个成绩是否可用来估计该校九年级

学毕跳绢的平均水平?为什么?





三、应用实例

例题精解

例3在一次科技知识竞赛中,甲乙两个班级学生成绩统计如下表所示:



(其中,90分及其以上即为优秀水平)

已经算得甲乙两个班级的平均分都是80分.

(1)请你根据所学过的统计知识,进一步判断这两个班级的竞赛成绩谁优谁次,并说明理由.

(2)如果由一个班级的学生组成一个15人的代表团代表学校参加区里的科技知识竞赛,你认为应当选择哪个班级组团参赛?



















点评虽然比较众数、80分以上人数和方差,甲班的平均水平和稳定性都优于乙班.但是如果选择少数人参赛,还是应当选择乙班,原因恰恰也正是缘于乙班成绩的波动性较大,两极分化”较严重.

举一反三

3一l甲乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋。测得其实际质量分别如下:(单位:克)



(1)分别计算两个样本的平均数与方差.

(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近200克?哪台包装机包装的10袋糖果的质量比较稳定?















点评本题利用样本的平均数与方差解决一个实际问题。在第(1)小题计算的基础上.第(2)小题要求学生能运用所学知识从不同角度进行评价,方差越大,说明这组数据对平均数的偏离程度越大.

3—2经市场调查,某种质量为(5±0.25)kg的优质西瓜最为畅销.为了控制西瓜的质量,农科所采用A、B两种种植技术进行试验.现从这两种技术种植的西瓜中各随机抽取20颗,记录它们的质量如下(单位:kg):

A:4.14.85.44.94.75.04.94.85.85.2

5.04.85.24.95.25.04.85.25.15.0

B:4.54.94.84.55.25.15.04.54.74.9

5.45.54.65.34.85.05.25.35.05.3

(1)若质量为(5±0.25)kg的为优等品,根据以上信息完成下表:

优等品数量(个) 平均数 方差 A 4.990 0.103 B 4.975 0.093 (2)请分别从优等品数量、平均数与方差三方面的A、B两种技术作出评价;从市场销售的角度看,你认为推广哪种种植技术较好?















点评B种植技术种植的西瓜平均数离标;隹值较远,方差又较小,说明在“低水平上保持稳定”.这种稳定性未必是好事.

3—3某风景区对5个旅游景点的门票价格进行了调整,据统计.调价前后各景点的游

客人数基本不变,有关数据如下表所示:

景点 A B C D E 原价(元) 10 10 15 20 25 现价(元) 5 5 15 25 25 平均日人数(千人) 1 1 2 3 2 (1)该风景区称调整前后5个景点门票的平均收费不变,平均日收入持平,问风景区是

怎样计算的.

(2)另一方面.游客认为调整收费后风景区的平均日总收入相对于调价前,实际上增加

了9.4%,问游客是怎样计算的.

(3)你认为风景区和游客哪一个说法较能反映整体实际?



















点评风景区的理由显然有点以偏概全,游客的说法则比较全面公正.不过,这里有个条件:“调价前后各景点的游客人数基本不变”,也可能实际情况是由于有的景点人数过分拥挤,风景区出于保护自然资源的考虑,适当提高“热门”景点的票价,同时降低其他景点的票价.达到分散游客、保护资源的目的,还是必要的.

内容提炼

1.本节内容可以概括为“两频”、“两差”和“两图”.

①两频:频数和频率.

频数——每个数据出现的次数;

频率——频数与数据总数的比(常表示为小数或百分数),反映了该数据在总体中的分量.

②两差:方差和标准差.

方差——可以简单地理解为“差方的平均数”,即各数据与平均数之差的平方的平均数.计算方差时不要忘了除以数据个数n.

标准差——方差的非负平方根.

③两图——频数分布直方图和频率分布直方图,用来显示数据的分布情况.两图的区别仅在于纵轴的意义不同:频数分布直方图的纵轴表示频数,频率分布直方图的纵轴表示

2.几个有待明确的问题.

①既然提出了方差,为什么还要提出标准差?

首先是因为方差计算的是平方数,它把数据偏离平均数的程度从一次“夸大”为二次,

通过开方运算再使它“变回”一次;其次,方差的单位是数据单位的平方(例如k92),往往不好理解,而标准差的单位就是数据单位,便于理解.

②利用直方图可以获得哪些信息?

直方图最重要的作用是可以形象地感知在从小到大、长度相等的每个间隔内各组数据的大致分布情况,数据分散还是集中,大部分数据集中在什么范围内,等等.

此外利用直方图:可以求出中位数在哪一组范围内,该组两端的平均值(称为“中值”)可以当作中位数的近似值;各组中值分别乘以该组的频率,再把这些乘积相加,可以作为平均数的近似值.

习题精练

1.下列说法中,错误的是()

(A)数据1,1,1,2,2的中位数是1;

(B)一1,0,1,2的方差是1.25;

(C)在频率分布表中,各组的频率之和等于1;

(D)频率分布直方图中,小长方形的高表示频率.

2.甲、乙、丙、丁四人进行射击测试,每人10次射击成绩的平均数均是9.2环,若方差分别为,,,,则成绩最稳定的是()

(A)甲;(B)乙;(C)丙;(D)丁.

3.小明调查了本班同学的身高情况,画出了频数分布图,下列结论中,不正确的是()

(A)全班总人数37人;

(B)身高155厘米~160厘米的人数最多;

(C)学生身高的众数是14;

(D)体重在165厘米~170厘米的人数占全班总人数的兰.





4.一组数据3,4,5,5,8的方差是.

5.某校篮球队的五名主力队员的身高如下表所示:(单位:cm)



该队主力队员身高的标准差是cm.

6.若l,x,2,3的平均数是5,则这组数据的方差是.

7.甲乙两人比赛飞镖,甲5次成绩平均环数为8环,方差是3,乙5次所得环数为:8,8,5,9,10.的成绩较稳定(填“甲”或“乙”).

8.某校有300名学生参加民防考试,随机抽取20人的考试成绩为样本.如果样本数据落在80分~85分之间的频率是0.25,那么可以估计这次考试成绩落在80分~85分之间的该校学生人数约为人.

9.为了画全班40名学生体重的频率分布直方图,了解到40名学生的体重在39kg~65kg之间.如果确定组距为4kg。那么共分为个组;如果第一组的取值范围是38.5kg~42.5kg,那么最后一组的取值范围是.

10.为了了解中学生的身高情况,对某中学同年龄的若干名女生的身高进行了测量,将所得数据整理后,画出如下的频率分布直方图,已知图中从左到右五个小组的频率分别是0.017,0.050,0.100,0.133,0.300,第三小组的频数为6.



























(1)参加这次测试的学生数是多少?

(2)身高在哪个范围内的学生人数最多?这一范围内的人数是多少?

(3)如果本次测试身高在155cm以上的为良好,那么该校学生身高良好率是多少?















11.某校九年级学生共900人,为了解这个年级学生的体能,从中随机抽取部分学生进行1分钟的跳绳测试,并指定甲、乙、丙、丁四名学生对这次测试结果的数据作出整理.下面是这四名学生提供的部分信息:

甲:将全体测试数据分成6组绘成如下的直方图;

乙:跳绳次数不少于l05次的学生占96%;

丙:第①、②两组频率之和为0.12.且第②组与第⑥组频数都是12;

丁:第②、③、④组的频数之比为4:17:15.

根据这四名学生提供的材料,请解答如下问题:

(1)这次跳绳测试共抽取多少名学生?各组有多少人?

(2)如果跳绳次数不少于135次为优秀,根据这次抽查的结果,估计全年级达到跳绳优秀的人数为多少?

(3)以每组的组中值(每组的中点对应的数据)作为这组跳绳次数的代表,估计这批学生1分钟跳绳次数的平均值.























12.如图是以某校部分学生的体重为样本绘制的频数分布直方图,已知从左至右前四组的频率依次为0.05、0.10、0.25、0.35,结合该图提供的信息回答下列问题:

(1)参加测量体重的学生共名;

(2)体重不低于58k的学生有人;

(3)如果将该图改为频率分布直方图,那么

第3组对应的纵坐标的数值为

(即替换35的那个数值);

(4)如果这批数据的中位数是53kg,那么这

些学生中体重为53kg的至少有人。至多有人.







互动探究

(1)已知一组数据的平均数是;,每个数据平方的平均数是,用和来表示方差S2.

(2)利用第(1)小题得到的汁算方法解决以下问题.

有甲乙两台车床一起加工设计规格为152.0nmm的零件,随机抽查了每台机床加工的各5个零件,测得尺寸如下:

机床甲:151.7,151.8,152.0,152.1,152.4.

机床乙:151.7,151.9,152.0,152.2,152.4.

试比较甲乙两名机床的加工精度与稳定性.



















2015/8/7



第1页共10页71-83







献花(0)
+1
(本文系guqy2008首藏)