配色: 字号:
【步步高】2015届高三数学北师大版(通用,理)总复习学案:学案57 用样本估计总体
2015-09-28 | 阅:  转:  |  分享 
  
Gothedistance

第1页共11页

学案57用样本估计总体



导学目标:1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率

折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标

准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用

样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用

样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实

际问题.



自主梳理

1.在频率分布直方图中,纵轴表示__________________,数据落在各小组内的频率用

________________表示,所有长方形面积之和________.

2.作频率分布直方图的步骤

(1)求极差(即一组数据中________与________的差);

(2)决定________与________;

(3)将数据________;

(4)列________________;

(5)画________________.

3.频率分布折线图和总体密度曲线

(1)频率分布折线图:连接频率分布直方图中各小长方形上端的________,就得频率分

布折线图.

(2)总体密度曲线:随着__________的增加,作图时____________增加,组距减小,相

应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

4.当样本数据较少时,茎叶图表示数据的效果较好,一是统计图上没有原始数据丢失,

二是方便记录与表示,但茎叶图一般只便于表示两位有效数字的数据.

5.众数、中位数、平均数

(1)在一组数据中,出现次数________的数据叫做这组数据的众数.

(2)将一组数据按大小依次排列,把处在________位置的一个数据(或中间两个数据的平

均数)叫做这组数据的中位数.

(3)如果有n个数x1,x2,……,xn,那么x=____________叫做这n个数的平均数.

6.标准差和方差

(1)标准差是样本数据到平均数的一种____________.

(2)标准差:s=________________________.

(3)方差:s2=________________________________(xn是样本数据,n是样本容量,x是

样本平均数).

自我检测

1.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的

个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|等于()

A.hmB.hmC.mhD.h+m

2.(2010·福建)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据

的中位数和平均数分别是()



Gothedistance

第2页共11页

A.91.5和91.5B.91.5和92

C.91和91.5D.92和92

3.(2011·滨州模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个小长

方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为

()

A.32B.0.2C.40D.0.25

4.(2010·山东)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则

样本方差为()

A.65B.65C.2D.2

5.(2010·江苏)某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长

度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方

图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20mm.



探究点一频率分布直方图

例1(2011·福州调研)如图是某市有关部门根据该市干部的月收入情况,作抽样调查

后画出的样本频率分布直方图,已知图中第一组的频数为4000,请根据该图提供的信息解

答下列问题:(图中每组包括左端点,不包括右端点,如第一组表示收入在[1000,1500))



(1)求样本中月收入在[2500,3500)的人数;

(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入再

用分层抽样方法抽出100人作进一步分析,则月收入在[1500,2000)的这段应抽多少人?

(3)试估计样本数据的中位数.

















变式迁移1为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视

力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组频数成等比数

列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,

Gothedistance

第3页共11页

b值分别为()



A.0.27,78B.0.27,83

C.2.7,78D.2.7,83

探究点二用样本数字特征估计总体数字特征

例2甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如表所

示:



甲的成绩

环数78910

频数5555



乙的成绩

环数78910

频数6446



丙的成绩

环数78910

频数4664

s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有()

A.s3>s1>s2B.s2>s1>s3

C.s1>s2>s3D.s2>s3>s1

变式迁移2甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,

成绩如下表(单位:环):



甲108999

乙1010799

如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.

探究点三用茎叶图分析数据

例3随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身

高数据的茎叶图如图.



(1)根据茎叶图判断哪个班的平均身高较高;

(2)计算甲班的样本方差;

(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm

的同学被抽中的概率.









Gothedistance

第4页共11页

















变式迁移3(2011·汉沽模拟)某班甲、乙两学生的高考备考成绩如下:

甲:512554528549536556534541522538

乙:515558521543532559536548527531

(1)用茎叶图表示两学生的成绩;

(2)分别求两学生成绩的中位数和平均分.

















1.几种表示频率分布的方法的优点与不足:

(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势

不太方便.

(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们

能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也

就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.

(3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组

的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.

(4)用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多

或数据位数较多时,茎叶图就显得不太方便了.

2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的

离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位

不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散

程度上是一样的,但在解决实际问题时,一般多采用标准差.



(满分:75分)



一、选择题(每小题5分,共25分)

1.(2010·陕西)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为

xA和xB,样本标准差分别为sA和sB,则()



Gothedistance

第5页共11页

A.xA>xB,sA>sBB.xAsB

C.xA>xB,sA
2.(2011·宁波期末)10名工人某天生产同一种零件,生产的件数分别是

15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()

A.a>b>cB.b>c>aC.c>a>bD.c>b>a

3.(2011·金华十校模拟)为了了解某校高三学生的视力情况,随机地抽查了该校100名

高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后五组

频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()



A.64B.54C.48D.27

4.下图是某学校举行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图,

去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()



A.84,4.84B.84,1.6

C.85,1.6D.85,4

5.(2011·四川)有一个容量为66的样本,数据的分组及各组的频数如下:

[11.5,15.5)2[15.5,19.5)4[19.5,23.5)9

[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12

[35.5,39.5)7[39.5,43.5)3

根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是()

A.16B.13

C.12D.23



二、填空题(每小题4分,共12分)

6.(2010·天津)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一

列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两

人日加工零件的平均数分别为______和_________________________.



7.(2010·福建)将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组

至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等

于________.

8.(2011·江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的

方差s2=________.

三、解答题(共38分)

9.(12分)甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.

Gothedistance

第6页共11页



(1)分别求出两人得分的平均数与方差;

(2)根据图和上面算得的结果,对两人的训练成绩作出评价.























10.(12分)(2010·湖北)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个

不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分

布直方图(如图所示).



(1)在下面表格中填写相应的频率;



分组频率

[)1.00,1.05

[)1.05,1.10

[)1.10,1.15

[)1.15,1.20

[)1.20,1.25

[)1.25,1.30

(2)估计数据落在[)1.15,1.30中的概率为多少;

(3)将上面捕捞的100条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位

置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.











Gothedistance

第7页共11页













11.(14分)(2010·安徽)某市2010年4月1日-4月30日对空气污染指数的监测数据如

下(主要污染物为可吸入颗粒物):

61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,

91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.

(1)完成频率分布表.

(2)作出频率分布直方图.

(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为

良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.

请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.



学案57用样本估计总体

自主梳理

1.频率与组距的比值小长方形的面积等于12.(1)最大值最小值(2)组距组

数(3)分组(4)频率分布表(5)频率分布直方图3.(1)中点(2)样本容量所分的组数

5.(1)最多(2)中间(3)x1+x2+…+xnn6.(1)平均距离

(2)1n[?x1-x?2+?x2-x?2+…+?xn-x?2]

(3)1n[(x1-x)2+(x2-x)2+…+(xn-x)2]

自我检测

1.C2.A3.A4.D

5.30

课堂活动区

例1解题导引(1)解关于图形信息题的关键是正确理解各种统计图表中各个量的含

义,灵活运用这些信息和数据去发现结论.

(2)在频率分布直方图中,最高矩形的中点对应值是众数;而中位数的左右两边的直方

图面积相等;平均数是直方图的“重心”.

解(1)∵月收入在[1000,1500)的概率为0.0008×500=0.4,且有4000人,

∴样本的容量n=40000.4=10000;

月收入在[1500,2000)的频率为0.0004×500=0.2;

月收入在[2000,2500)的频率为0.0003×500=0.15;

月收入在[3500,4000)的频率为0.0001×500=0.05.

∴月收入在[2500,3500)的频率为

1-(0.4+0.2+0.15+0.05)=0.2.

∴样本中月收入在[2500,3500)的人数为

0.2×10000=2000.

(2)∵月收入在[1500,2000)的人数为

0.2×10000=2000,

∴再从10000人中用分层抽样方法抽出100人,

则月收入在[1500,2000)的这段应抽取100×200010000=20(人).

Gothedistance

第8页共11页

(3)由(1)知月收入在[1000,2000)的频率为0.4+0.2=0.6>0.5,

∴样本数据的中位数为

1500+0.5-0.40.0004=1500+250=1750(元).

变式迁移1A[由频率分布直方图知组距为0.1.

4.3~4.4间的频数为100×0.1×0.1=1.

4.4~4.5间的频数为100×0.1×0.3=3.

又前4组的频数成等比数列,∴公比为3.

从而4.6~4.7间的频数最大,且为1×33=27.

∴a=0.27.

根据后6组频数成等差数列,且共有100-13=87(人).

设公差为d,则6×27+6×52d=87.

∴d=-5,从而b=4×27+4×32×(-5)=78.]

例2B[由已知可得甲、乙、丙的平均成绩均为8.5.

方法一∵s21=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],

∴s1=

1

20[5×?7-8.5?

2+5×?8-8.5?2+5×?9-8.5?2+5×?10-8.5?2]

=2520.

同理s2=2920,s3=2120,∴s2>s1>s3.

方法二∵s21=1n(x21+x22+…+x2n)-x2,

∴s21=120(5×72+5×82+5×92+5×102)-8.52=73.5-72.25=1.25=54,

∴s1=2520.同理s2=2920,s3=2120,

∴s2>s1>s3.]

变式迁移2甲

解析x甲=x乙=9,s2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,

s2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定,故选甲.

例3解题导引茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它

较好地保留了原始数据,所以可以帮助我们分析样本数据的大致频率分布,还可以用来分析

样本数据的一些数字特征.但当样本数据较多时,茎叶图就显得不太方便了.因为数据较多

时,枝叶就会很长,需要占据较多的空间.

解(1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180

之间.因此乙班平均身高高于甲班.

(2)x=158+162+163+168+168+170+171+179+179+18210

=170,

甲班的样本方差为

1

10[(158-170)

2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+

(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.

Gothedistance

第9页共11页

(3)设身高为176cm的同学被抽中的事件为A,

从乙班10名同学中抽中两名身高不低于173cm的同学有:(181,173),(181,176),

(181,178),(181,179),(179,173),(179,176),(179,178),(178,173),(178,176),(176,173)共

10个基本事件,而事件A含有4个基本事件,∴P(A)=410=25.

变式迁移3解(1)两学生成绩的茎叶图如图所示.



(2)将甲、乙两学生的成绩从小到大排列为:

甲:512522528534536538541549554556

乙:515521527531532536543548558559

从以上排列可知甲学生成绩的中位数为

536+538

2=537.

乙学生成绩的中位数为532+5362=534.

甲学生成绩的平均分为

500+12+22+28+34+36+38+41+49+54+5610=537,

乙学生成绩的平均分为

500+15+21+27+31+32+36+43+48+58+5910=537.

课后练习区

1.B[A中的数据都不大于B中的数据,所以xA
波动幅度大,所以sA>sB.]

2.D[平均数a=110(15+17+14+10+15+17+17+16+14+12)=14.7.

中位数b=15,众数c=17.∴c>b>a.]

3.B[前两组中的频数为100×(0.05+0.11)=16.

∵后五组频数和为62,∴前三组为38.

∴第三组为22.又最大频率为0.32的最大频数为0.32×100=32,∴a=22+32=54.]

4.C[去掉最高分93,最低分79,

平均数为15(84+84+86+84+87)=85,

方差s2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=85=1.6.]

5.B[由条件可知,落在[31.5,43.5)的数据有12+7+3=22(个),故所求概率约为2266=

1

3.]

6.2423

解析x甲=110(10×2+20×5+30×3+17+6+7)=24,

x乙=110(10×3+20×4+30×3+17+11+2)=23.

7.60

解析∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,∴前三组频数为

Gothedistance

第10页共11页

2+3+4

20·n=27,故n=60.

8.3.2

解析x=10+6+8+5+65=7,∴s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]

=165=3.2.

9.解(1)甲、乙两人五次测试的成绩分别为:

甲10分13分12分14分16分

乙13分14分12分12分14分

甲、乙两人的平均成绩x甲=x乙,都是13分,(4分)

s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,

s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.

(8分)

(2)由s2甲>s2乙,可知乙的成绩较稳定.

从折线图看,甲的成绩基本上呈上升状态,而乙的成绩在平均线上下波动,可知甲的成

绩在不断提高,而乙的成绩则无明显提高.(12分)

10.解(1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表:

分组频率

[)1.00,1.050.05

[)1.05,1.100.20

[)1.10,1.150.28

[)1.15,1.200.30

[)1.20,1.250.15

[)1.25,1.300.02

(6分)

(2)因为0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47.(9分)

(3)因为120×1006=2000,

所以水库中鱼的总条数约为2000.(12分)

11.解(1)频率分布表:

分组频数频率

[41,51)2230

[51,61)1130

[61,71)4430

[71,81)6630

[81,91)101030

[91,101)5530

[101,111)2230

(5分)

Gothedistance

第11页共11页

(2)频率分布直方图如图所示.



(10分)

(3)答对下述两条中的一条即可:

①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于

良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量

基本良好.

②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,

加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改

善.(14分)







献花(0)
+1
(本文系云师堂首藏)