新课程改革实施以来,各地中考数学试题中有关统计知识的试题,问题情景琳琅满目,内容丰富多变,题型不断翻新,无论是教师教还是学习统计知识,均感“形散”难以把握统计知识的“灵魂”。 新课程标准要求学生掌握初步的统计知识。统计知识教学的“灵魂”是什么呢?统计知识教学的“灵魂”是用样本估计总体。 一、用样本估计总体的基本思想、合理性与关键 1、用样本估计总体的基本思想 用样本估计总体是指根据样本情况对总体情况做出一种推断,包括用“形”与用“数”两个方面来估计。用“形”估计就是用样本数据,列出频数(频率)分布表,画出频数分布直方图、频率分布直方图和频数(率)折线图,这“一表三图”是同一组数据分布的不同表现形式;用“数”估计就是用样本数据的特征数字来估计总体的特征数字,最常用的特征数字是平均数、中位数、众数、方差(标准差)。平均数表示一组数据的平均水平,中位数表示一组数据的中等水平,众数表示一组数据的多数水平。借助平均数、中位数、众数、方差(标准差)来估计一组数据的平均水平、中等水平、多数水平和估计一组数据离散性、波动性、稳定性。这就是用样本估计总体基本思想,它是研究数理统计问题的一个核心思想。 2、用样本估计总体的合理性 样本的信息与总体的信息总还存在着一定的差异,样本所提供的信息只是总体的部分信息,在一定程度上反映了总体的有关特征,但不完全确定。也就是说,即使按照同一个规则进行抽样,抽取的样本容量相同,也不能保证每次抽样所获取的信息都是完全一样的。虽然不同的人根据不同的样本数据,最后得到的结果互不相同,但是由于随机事件频率具有规律性、稳定性,故许多问题的最终结果差别一般也不会太大,因此可以用样本的特性来估计总体的特性,即用样本估计总体具有合理性,通过对表面随机的样本数据进行统计分析,实现对随机性事件的规律性的研究,从而揭示出事物内在的规律。 3、用样本估计总体的关键 根据具体问题,合理选取样本是统计决策的一个基本前提。只有合理地选取样本,才能对决策提供可靠的依据。怎样的方法才是既科学、合理又可靠的呢?随机抽样调查的方法是既科学、合理而又可靠的。抽样是手段,是前提,对总体进行估计是目的,是结果。抽样时所抽取的样本容量越大,样本的特性就越接近于总体的特性,用样本估计总体就越接近真实,越有意义。用随机抽样方法,确定合适的样本容量进行抽样调查,用样本的特征数字估计总体的特征数字,用样本的分布规律来估计总体的分布规律,是用样本估计总体的关键。 二、用样本估计总体的适用范围及方法举例 (一)、估计平均水平、中等水平、多数水平 平均数、中位数、众数是反映数据集中程度的统计量。在利用平均数、中位数、众数参与决策时,如果依据不同,结果可能也不同,而且三个统计量不总是合适的,它们都有各自的适用范围,在解决实际问题时应合理选用平均数、中位数和众数解决问题,用样本平均数、样本中位数和样本众数,来估计总体平均数、总体中位数和总体众数,参与决策。 1、用样本平均数估计总体平均数 例1:重庆市是一座美丽的城市,为增强市民的环保意识,某校家住缙云花园小区的30名九年级学生调查了某一天各自家庭丢弃废塑料袋的情况,统计结果如下:
根据以上数据,若缙云花园小区有500户居民,则该小区所有家庭每天丢弃的废塑料袋总数约为____万个. 解:小区30户居民平均每户每天丢弃的废塑料袋的只数,即样本平均数 ,估计小区500户居民平均每户每天丢弃的废塑料袋的只数的平均数 ,则小区所有家庭每天丢弃的废塑料袋总数约为: 只,即0.15万个。 2、用样本中位数估计总体中位数 例2:在一次马拉松长跑比赛中,抽得12名选手得成绩如下(单位:分) 136,140,129,180,124,154,146,145,158,175,165,148 假如你的成绩是142分,你的成绩如何? 解:对样本数排序:124,129,136,140,145,146,148,154,158,165,175,180 则中位数为147,估计总体中位数也是147分,故若我的成绩是142分,则处于马拉松长跑比赛中所有参赛者的成绩的中等偏下水平。 3、用样本众数估计总体众数 例3:一家鞋店在一段时间内销售了某种运动鞋30双,各种尺码的鞋的销售量如下:
假如你是老板,你最关心哪一个统计量?你会如何进货? 解:样本众数是23.5,在众数两侧与众数最近的两数是23、24,假如我是老板,我最关心众数23.5,若把一次进货数量x视作一个总体,则在进货时,可用样本众数当作总体众数,尺码23.5厘米鞋进货数量约为 双,尺码23厘米鞋进货量约为 双,尺码24厘米鞋进货量约为 双,其余类推计算确定。 (二)、估计频数分布或频率分布 用随机抽样方法,选取样本容量合适的数据,制作频数分布表(频率分布表)、频数分布直方图(频率分布直方图)或频数(率)分布折线图等“一表三图”,来描述样本的频数分布或频率分布情况,从而估计总体的频数分布(频率分布)情况。 4、用样本频数分布估计总体频数分布 例4:2009年中考结束后,某市从参加中考的12000名学生中抽取200名学生的数学成绩(考生得分均为整数,满分120分)进行统计,评估数学考试情况,经过整理得到如下频数分布直方图, 请回答下列问题: (1)此次抽样调查的样本容量是_____ (2)补全频数分布直方图 (3)若成绩在72分以上(含72分)为及格, 请你评估该市考生数学成绩的及格率与数学考试及格人数。 解:(1)此次抽样调查的样本容量是200。 (2)由样本容量和样本频数分布直方图可知,样本中 分数在84~95分之间的直方图高度是40,即有40人。 (3)由样本频数分布直方图知,样本中及格人数是 样本及格率是 =0.71,即71﹪,估计总体及格率也是71﹪,故该市考生数学成绩的及格率为71﹪,数学考试及格人数为12000×71﹪=8520(人)。 频数分布直方图的特点:①能够显示各组频数的分布情况。②易于显示各组间的频数的差别。③各小长方形的高与该组的频数成正比。④各组频数之和等于样本容量。 5、用样本频率分布估计总体频率分布 例5:某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需要定期对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的100件钢管进行检测,把这100件钢管的质量分布情况作为总体的质量分布情况来看待。根据规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们特别希望知道所有生产的钢管中优等品所占的比例,这时就可以用样本的分布情况估计总体的分布情况。 下面的数据是一次抽样中的100件钢管的内径尺寸:
解:上面的100个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据加以整理。列出这组样本数据的频率分布表、绘制频率分布直方图。
结论:从样本频率分布表或频率分布直方图容易看出,优等品所占的比例等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。 频率分布直方图的特点:①小长方形的面积=组距×频率/组距=频率。②各小长方形的面积等于相应各组的频率, 即各个长方形面积的大小反映该组数据出现的频率的大小。③各组的频率之和等于1,故各小长方形的面积之和等于1。 (三)、估计离散程度、波动性或稳定性 方差或标准差是反映一组数据的离散程度的统计量。用随机抽样方法,取得样本数据,通过计算样本方差或标准差,来估计总体方差或标准差,进而估计总体的离散程度、波动性或稳定性。 6、用样本方差(标准差)估计总体方差(标准差) 例6:甲、乙、丙三台机床生产直径为60mm的螺丝,为了检验产品质量,从三台机床生产的螺丝中各抽查了20个测量其直径,进行数据处理后,发现这三组数据的平均数都是60mm,它们的方差依次为 =0.162, =0.058, =0.149.根据以上提供的信息,你认为生产螺丝质量最好的是____机床. 解:方差表示一组数据的稳定性程度,方差越小,一组数据的稳定性越好。从甲、乙、丙三台机床生产的零件中,每台机床分别抽查的20个零件的直径分别是三个样本,甲、乙、丙三台机床每台机床生产的全部零件的直径分别是三个总体。本题有三个样本方差 、 、 ,三个总体方差。∵ =0.162, =0.058, =0.149,∴ < < ,表明机床乙生产的零件的样本方差最小,零件质量稳定性最好。由此推断机床乙生产的全部零件质量(总体)稳定性最好。 (四)、估计概率 用随机抽样方法,统计样本频率估计总体频率,进而用总体频率来估计总体的概率。 7、用样本频率估计总体频率(概率) 例7:某养鱼场为了要估计鱼塘中鱼的总数量,第一次从中网出100条,把这100条带有标志后全部放回.过1~2天,估计这群带标志的鱼已完全混杂到塘中,再从中网出200条,假定在第二次网出的200条中,带有第一次做标志的20条,估计鱼塘中有鱼多少条? 解:设鱼塘中鱼的总数量是x条,带标志的鱼的数量是100条,总体频率是 ,样本是200条,样本中带标志的鱼的数量是20条,样本频率是 ,用样本估计总体,得方程式: 解方程得,x=1000(条) 答:估计鱼塘中有鱼1000条。 例8:某水果公司以 元/千克的成本新进了10000千克的柑橘,如果公司希望这种柑橘能够获得利润5000元,那么在出售柑橘(已经去掉损坏的柑橘)时,每千克大约定价为多少元比较合适? 销售人员首先从所有的柑橘总随机地抽取若干柑橘,进行了“柑橘损坏表”统计,并把获得的数据记录在下表中,请你帮忙完成下表。
解:填表:
填完表格,计算出10个样本频率的平均数 ,估计柑橘损坏的频率为 ,则柑橘完好的频率为 ,因此柑橘完好的概率为 ,因此:在10000千克柑橘中完好柑橘的质量为 千克。完好柑橘的实际成本为: (元/千克) 因此,出售柑橘时每千克大约定价为2.8元可获利润5000元。 结论:一次抽样得到一个样本频率,可用这个样本频率估计总体频率;多次抽样得到多个样本频率,可用这多个样本频率的平均值估计总体频率,后者比前者更接近实际。 曹玉平 (江苏省海门市三星初级中学 226114) 中国教育学会中学数学教学专业委员会2等奖 |
|