随机抽样、用样本估计总体及线性相关关系
二、课标要求:
1、能从现实生活或其他学科中提出具有一定价值的统计问题;
2、结合具体的实际问题情境,理解随机抽样的必要性和重要性;
3、在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法;
4、能通过试验、查阅资料、设计调查问卷等方法收集数据.
5、用样本估计总体
①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;
②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差;
③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;
④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;
⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;
⑥形成对数据处理过程进行初步评价的意识.
6、变量的相关性
①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;
②经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
三、命题走向
统计是在初中数学统计初步的深化和扩展,本讲的主要内容是随机抽样的方法在总体中抽取样本,会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布.
预测高考对本讲的考查是:
(1)以基本题(中、低档题为主),多以选择题、填空题的形式出现,以实际问题为背景,综合考查学生学习基础的知识、应用基础知识、解决实际问题的能力;
(2)热点是随机抽样方法中的分层抽样、系统抽样方法、频率分布直方图和用样本的数字特征估计总体的数字特征.
四、教学过程
(一)基本知识要点回顾
三种常用抽样方法:
1、简单随机抽样:设一个总体的个数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.实现简单随机抽样,常用抽签法和随机数表法.
(1)抽签法
制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;
抽签:抽签时,每次从中抽出1个号签,连续抽取次;
成样:对应号签就得到一个容量为的样本.
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法.
(2)随机数表法
编号:对总体进行编号,保证位数一致;
数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等.在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码.
成样:对应号签就得到一个容量为的样本.
结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;
②基于此,简单随机抽样体现了抽样的客观性与公平性;
③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.
2、系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).
系统抽样的步骤可概括为:
(1)将总体中的个体编号.采用随机的方式将总体中的个体编号;
(2)将整个的编号进行分段.为将整个的编号进行分段,要确定分段的间隔.当是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的个体数N′能被整除,这时;
(3)确定起始的个体编号.在第1段用简单随机抽样确定起始的个体编号;
(4)抽取样本.按照先确定的规则(常将加上间隔)抽取样本:.
3、分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.
结论:
(1)分层抽样是等概率抽样,它也是公平的.用分层抽样从个体数为N的总体中抽取一个容量为的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于;
(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践中的应用更为广泛.
4、用样本的数字特征估计总体的数字特征
平均数与方差
如果这n个数据是,那么叫做这n个数据的平均数;
如果这n个数据是,那么叫做这n个数据的方差;同时叫做这n个数据的标准差.
5、频率分布直方图、折线图与茎叶图
样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示.
频率分布直方图:
具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
注:频率分布直方图中小正方形的面积=组距×=频率.
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图.
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线.
6、线性回归
回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系.
回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:.其中,.我们称这个方程为y对x的回归直线方程.
【典型例题】
例1、为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )
A、1000名运动员是总体 B、每个运动员是个体
C、抽取的100名运动员是样本 D、样本容量是100
解析:这个问题我们研究的是运动员的年龄情况,因此应选D.
答案:D
点评:该题属于易错题,一定要区分开总体与总体容量、样本与样本容量等概念.
例2、今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问:① 总体中的某一个体在第一次抽取时被抽到的概率是多少?②个体不是在第1次被抽到,而是在第2次被抽到的概率是多少?③在整个抽样过程中,个体被抽到的概率是多少?
解析:(1),(2),(3).
点评:由问题(1)的解答,出示简单随机抽样的定义,问题(2)是本讲难点.基于此,简单随机抽样体现了抽样的客观性与公平性.
例3、为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本.
解析:(1)随机地将这1003个个体编号为1,2,3,…,1003.
(2)利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数1000能被样本容量50整除,然后再按系统抽样的方法进行.
点评:总体中的每个个体被剔除的概率相等,也就是每个个体不被剔除的概率相等.采用系统抽样时每个个体被抽取的概率都是,所以在整个抽样过程中每个个体被抽取的概率仍然相等,都是.
例4、(2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________.
解析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.
∵m=6,k=7,m+k=13,∴在第7小组中抽取的号码是63.
答案:63
点评:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.
例5、(2006湖北文,19)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定
(I)游泳组中,青年人、中年人、老年人分别所占的比例;
(II)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(I)设登山组人数为,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有,解得b=50%,c=10%.
故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.
(II)游泳组中,抽取的青年人数为(人);
抽取的中年人数为50%=75(人);
抽取的老年人数为10%=15(人).
点评:本小题主要考查分层抽样的概念和运算,以及运用统计知识解决实际问题的能力.
例6、(2006四川文,5)甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )
A、30人,30人,30人 B、30人,45人,15人
C、20人,30人,10人 D、30人,50人,10人
解:B;
点评:根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.
例7、(1)(2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是
A、分层抽样法,系统抽样法 B、分层抽样法,简单随机抽样法
C、系统抽样法,分层抽样法 D、简单随机抽样法,分层抽样法
解析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.
依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.
答案:B
(2)(2005湖北卷理第11题,文第12题)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270;
关于上述样本的下列结论中,正确的是 ( )
A、②、③都不能为系统抽样 B、②、④都不能为分层抽样
C、①、④都可能为系统抽样 D、①、③都可能为分层抽样
解析:D.
点评:采用什么样的抽样方法要依据研究的总体中的个体情况来定.
例8、为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:
(1)在这个问题中,总体、个体、样本和样本容量各是什么?
(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径、
解:(1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20.
(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米).
20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是(9+10)=9.5(米).
样本平均数(米)
所以,估计这批手榴弹的平均杀伤半径约为9.4米.
点评:根据总体、个体、样本、样本容量的概念答题、要注意:总体、个体和样本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径.
例9、(2002年全国高考天津文科卷(15))甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t / hm2)
品种 |
第1年 |
第2年 |
第3年 |
第4年 |
第5年 |
甲 |
9.8 |
9.9 |
10.1 |
10 |
10.2 |
乙 |
9.4 |
10.3 |
10.8 |
9.7 |
9.8 |
其中产量比较稳定的小麦品种是 .
解:ˉ甲 =(9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,
ˉ乙 =(9.4 + 10.3 + 10.8 + 9.7 + 9.8) = 10.0;
s 2甲 =[(9.8-10)2 + … + (10.2-10)2] = 0.02,
=[(9.4-10)2 + … +( 9.8-10)2] = 0.244 > 0.02 .
点评:方差与平均数在反映样本的特征上一定要区分开.
例10、(2005江苏7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为
A、9.4,0.484 B、9.4,0.016 C、9.5,0.04 D、9.5,0.016
解析:7个数据中去掉一个最高分和一个最低分后,余下的5个数为:9.4,9.4,9.6,9.4,9.5.
则平均数为:,即.
方差为:
即,故选D.
点评:一定要根据实际的题意解决问题,并还原实际情景.
例11、(2006重庆理,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是
A、20 B、30
C、40 D、50
解析:根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕的学生人数为0.4×100=40.选C.
点评:熟悉频率、频数、组距间的关系式.
例12、某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)
分组 |
[140,145) |
[145,150) |
[150,155) |
[155,160) |
[160,165) |
[165,170) |
[170,175) |
[175,180) |
合计 |
人数 |
1 |
2 |
5 |
9 |
13 |
6 |
3 |
1 |
40 |
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计数据落在[150,170]范围内的概率.
解:(1)根据题意可列出频率分布表:
分 值 |
频 数 |
频 率 |
[140,145] |
1 |
0.025 |
[145,150] |
2 |
0.050 |
[150,155] |
5 |
0.125 |
[155,160] |
9 |
0.225 |
[160,165] |
13 |
0.325 |
[165,170] |
6 |
0.15 |
[170,175] |
3 |
0.075 |
[175,180] |
1 |
0.025 |
合 计 |
40 |
1.00 |
(2)频率分布直方图如下:
(3)数据落在[150,170]范围内的概率约为0.825.
例13、由施肥量x与水稻产量y试验数据的关系,画出散点图,并指明相关性.
施化肥量x |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
水稻产量y |
330 |
345 |
365 |
405 |
445 |
450 |
455 |
解:散点图为:
再同时给出各对数据在平面直角坐标系中表示的点.
通过图象可知是正相关.
例14、把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.
答案:16
解析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意=21,a1(1+q+q2)=21.∴a1=1,q=4.∴后三组频数最高的一组的频数为16.此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?
思维小结:
常用的抽样方法及它们之间的联系和区别:
类别 |
共同点 |
各自特点 |
相互联系 |
适用范围 |
简单随机抽样 |
抽样过程中每个个体被抽取的概率是相同的 |
从总体中逐个抽取 |
|
总体中的个数比较少 |
系统抽样 |
将总体均匀分成几个部分,按照事先确定的规则在各部分抽取 |
在起始部分抽样时采用简单随机抽样 |
总体中的个数比较多 |
分层抽样 |
将总体分成几层,分层进行抽取 |
各层抽样时采用简单抽样或者相同抽样 |
总体由差异明显的几部分组成 |
不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.
随机抽样、系统抽样、分层抽样都是不放回抽样.
1、统计是为了从数据中提取信息,学习时根据实际问题的需求选择不同的方法合理地选取样本,并从样本数据中提取需要的数字特征.不应把统计处理成数字运算和画图表.对统计中的概念(如“总体”、“样本”等)应结合具体问题进行描述性说明,不应追求严格的形式化定义.
2、当总体中个体取不同值很少时,我们常用样本的频率分布表及频率分布条形图去估计总体分布.总体分布排除了抽样造成的错误,精确反映了总体取值的概率分布规律.对于所取不同数值较多或可以在实数区间范围内取值的总体,需用频率分布直方图来表示相应的频率分布.当样本容量无限增大,分组的组距无限缩小时,频率分布直方图无限接近一条光滑曲线——总体密度曲线、由于总体分布通常不易知道,往往是用样本的频率分布估计总体分布.样本容量越大,估计就越精确.
3、相关关系
研究两个变量间的相关关系是学习本节的目的.对于相关关系我们可从以下三个方面加以认识:
(1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的关系就是函数关系.即对于边长x的每一个确定的值,都有面积S的惟一确定的值与之对应.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如人的身高与年龄;商品的销售额与广告费等等都是相关关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系.然而学会新词并不能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些.
(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.
相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还可使我们对函数关系的认识上升到一个新的高度.
【模拟试题】
一、选择题
1(07陕西文)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是
A、4 B、5 C、6 D、7
2下列说法错误的是 ( )
A、在统计里,把所需考察对象的全体叫作总体
B、一组数据的平均数一定大于这组数据中的每个数据
C、平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D、一组数据的方差越大,说明这组数据的波动越大
3某同学使用计算器求个数据的平均数时,错将其中一个数据输入为,那么由此求出的平均数与实际平均数的差是( )
A、 B、 C、 D、
4要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )
A、平均数 B、方差
C、众数 D、频率分布
5要从已编号(1~60)的枚最新研制的某型导弹中随机抽取枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是( )
A、 B、
C、 D、
6容量为的样本数据,按从小到大的顺序分为组,如下表:
组号 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
频数 |
10 |
13 |
x |
14 |
15 |
13 |
12 |
9 |
第三组的频数和频率分别是 ( )
A、和 B、和 C、和 D、和
7. (07山东文)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可分析出和分别为( )
A、0.9,35 B、0.9,45 C、0.1,35 D、0.1,45
二、填空题
1、为了了解参加运动会的名运动员的年龄情况,从中抽取名运动员;就这个问题,下列说法中正确的有 ;
①名运动员是总体;②每个运动员是个体;③所抽取的名运动员是一个样本;④样本容量为;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等.
2、经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出2位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 人.
3、数据的标准差是______________.
4、数据的方差为,平均数为,则
(1)数据的标准差为 ,平均数为 .
(2)数据的标准差为 ,平均数为 .
5、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在的频率为 .
6、(07天津文)从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:
则这堆苹果中,质量不小于120克的苹果数约占苹果总数的 %.
7、(07浙江文)某校有学生2000人,其中高三学生500人、为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本、则样本中高三学生的人数为___________.
8、(07全国II文)一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .
三、解答题
1、对某校初二男生抽取体育项目俯卧撑,被抽到的名学生的成绩如下:
成绩(次) |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
人数 |
8 |
6 |
5 |
16 |
4 |
7 |
3 |
1 |
试求全校初二男生俯卧撑的平均成绩.
2、为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:
组 别 |
频数 |
频率 |
145 5~149 5 |
1 |
0 02 |
149 5~153 5 |
4 |
0 08 |
153 5~157 5 |
20 |
0 40 |
157 5~161 5 |
15 |
0 30 |
161 5~165 5 |
8 |
0 16 |
165 5~169 5 |
m |
n |
合 计 |
M |
N |
(1)求出表中所表示的数分别是多少?
(2)画出频率分布直方图.
(3)全体女生中身高在哪组范围内的人数最多?
3、某校高中部有三个年级,其中高三有学生人,现采用分层抽样法抽取一个容量为的样本,已知在高一年级抽取了人,高二年级抽取了人,则高中部共有多少学生?
4、从两个班中各随机的抽取名学生,他们的数学成绩如下:
甲班 |
76 |
74 |
82 |
96 |
66 |
76 |
78 |
72 |
52 |
68 |
乙班 |
86 |
84 |
62 |
76 |
78 |
92 |
82 |
74 |
88 |
85 |
画出茎叶图并分析两个班学生的数学学习情况.
【试题答案】
一、选择题
1、C
2、B 平均数不大于最大值,不小于最小值
3、B 少输入平均数少,求出的平均数减去实际的平均数等于
4、D
5、B ,间隔应为
6、A 频数为;频率为
7、A
二、填空题
1、④,⑤,⑥ 名运动员的年龄情况是总体;每个运动员的年龄是个体;
2、 位执“一般”对应位“不喜欢”,即“一般”是“不喜欢”的倍,而他们的差为人,即“一般”有人,“不喜欢”的有人,且“喜欢”是“不喜欢”的倍,即人,全班有人,
3、
4、(1),(2),
解:(1)
(2)
5、 频率/组距=0.001,组距=300,频率=0.001×300=0.3
6、70
7、50
8、
三、解答题
1、解:
2、解:(1)
(2)略
(3)在153.5~157.5范围内的人数最多.
3、解:从高三年级抽取的学生人数为
而抽取的比例为,高中部共有的学生为
4、解:图略
乙班总体成绩优于甲班.