yeez / 我的图书馆 / 例谈数学统计知识

0 0

   

例谈数学统计知识

2010-10-22  yeez
新课程改革实施以来,各地中考数学试题中有关统计知识的试题,问题情景琳琅满目,内容丰富多变,题型不断翻新,无论是教师教还是学习统计知识,均感“形散”难以把握统计知识的“灵魂”。 新课程标准要求学生掌握初步的统计知识。统计知识教学的“灵魂”是什么呢?统计知识教学的“灵魂”是用样本估计总体。
一、用样本估计总体的基本思想、合理性与关键
1、用样本估计总体的基本思想
用样本估计总体是指根据样本情况对总体情况做出一种推断,包括用“形”与用“数”两个方面来估计。用“形”估计就是用样本数据,列出频数(频率)分布表,画出频数分布直方图、频率分布直方图和频数(率)折线图,这“一表三图”是同一组数据分布的不同表现形式;用“数”估计就是用样本数据的特征数字来估计总体的特征数字,最常用的特征数字是平均数、中位数、众数、方差(标准差)。平均数表示一组数据的平均水平,中位数表示一组数据的中等水平,众数表示一组数据的多数水平。借助平均数、中位数、众数、方差(标准差)来估计一组数据的平均水平、中等水平、多数水平和估计一组数据离散性、波动性、稳定性。这就是用样本估计总体基本思想,它是研究数理统计问题的一个核心思想。
2、用样本估计总体的合理性
样本的信息与总体的信息总还存在着一定的差异,样本所提供的信息只是总体的部分信息,在一定程度上反映了总体的有关特征,但不完全确定。也就是说,即使按照同一个规则进行抽样,抽取的样本容量相同,也不能保证每次抽样所获取的信息都是完全一样的。虽然不同的人根据不同的样本数据,最后得到的结果互不相同,但是由于随机事件频率具有规律性、稳定性,故许多问题的最终结果差别一般也不会太大,因此可以用样本的特性来估计总体的特性,即用样本估计总体具有合理性,通过对表面随机的样本数据进行统计分析,实现对随机性事件的规律性的研究,从而揭示出事物内在的规律。
3、用样本估计总体的关键
根据具体问题,合理选取样本是统计决策的一个基本前提。只有合理地选取样本,才能对决策提供可靠的依据。怎样的方法才是既科学、合理又可靠的呢?随机抽样调查的方法是既科学、合理而又可靠的。抽样是手段,是前提,对总体进行估计是目的,是结果。抽样时所抽取的样本容量越大,样本的特性就越接近于总体的特性,用样本估计总体就越接近真实,越有意义。用随机抽样方法,确定合适的样本容量进行抽样调查,用样本的特征数字估计总体的特征数字,用样本的分布规律来估计总体的分布规律,是用样本估计总体的关键。
二、用样本估计总体的适用范围及方法举例
(一)、估计平均水平、中等水平、多数水平
平均数、中位数、众数是反映数据集中程度的统计量。在利用平均数、中位数、众数参与决策时,如果依据不同,结果可能也不同,而且三个统计量不总是合适的,它们都有各自的适用范围,在解决实际问题时应合理选用平均数、中位数和众数解决问题,用样本平均数、样本中位数和样本众数,来估计总体平均数、总体中位数和总体众数,参与决策。
1、用样本平均数估计总体平均数
例1:重庆市是一座美丽的城市,为增强市民的环保意识,某校家住缙云花园小区的30名九年级学生调查了某一天各自家庭丢弃废塑料袋的情况,统计结果如下:
每户居民丢弃废塑料袋的个数
1
2
3
4
5
户数
3
6
15
4
2
根据以上数据,若缙云花园小区有500户居民,则该小区所有家庭每天丢弃的废塑料袋总数约为____万个.
解:小区30户居民平均每户每天丢弃的废塑料袋的只数,即样本平均数 ,估计小区500户居民平均每户每天丢弃的废塑料袋的只数的平均数 ,则小区所有家庭每天丢弃的废塑料袋总数约为:  只,即0.15万个。
2、用样本中位数估计总体中位数
例2:在一次马拉松长跑比赛中,抽得12名选手得成绩如下(单位:分)
136,140,129,180,124,154,146,145,158,175,165,148
假如你的成绩是142分,你的成绩如何?
解:对样本数排序:124,129,136,140,145,146,148,154,158,165,175,180
则中位数为147,估计总体中位数也是147分,故若我的成绩是142分,则处于马拉松长跑比赛中所有参赛者的成绩的中等偏下水平。
3、用样本众数估计总体众数
例3:一家鞋店在一段时间内销售了某种运动鞋30双,各种尺码的鞋的销售量如下:
鞋的尺码/厘米
22
22.5
23
23.5
24
24.5
25
销售量/双
1
2
5
11
7
3
1
假如你是老板,你最关心哪一个统计量?你会如何进货?
解:样本众数是23.5,在众数两侧与众数最近的两数是23、24,假如我是老板,我最关心众数23.5,若把一次进货数量x视作一个总体,则在进货时,可用样本众数当作总体众数,尺码23.5厘米鞋进货数量约为 双,尺码23厘米鞋进货量约为 双,尺码24厘米鞋进货量约为 双,其余类推计算确定。
(二)、估计频数分布或频率分布
用随机抽样方法,选取样本容量合适的数据,制作频数分布表(频率分布表)、频数分布直方图(频率分布直方图)或频数(率)分布折线图等“一表三图”,来描述样本的频数分布或频率分布情况,从而估计总体的频数分布(频率分布)情况。
4、用样本频数分布估计总体频数分布
例4:2009年中考结束后,某市从参加中考的12000名学生中抽取200名学生的数学成绩(考生得分均为整数,满分120分)进行统计,评估数学考试情况,经过整理得到如下频数分布直方图,
请回答下列问题:
(1)此次抽样调查的样本容量是_____
(2)补全频数分布直方图
(3)若成绩在72分以上(含72分)为及格,
请你评估该市考生数学成绩的及格率与数学考试及格人数。
解:(1)此次抽样调查的样本容量是200。
(2)由样本容量和样本频数分布直方图可知,样本中
分数在84~95分之间的直方图高度是40,即有40人。
(3)由样本频数分布直方图知,样本中及格人数是
样本及格率是 =0.71,即71﹪,估计总体及格率也是71﹪,故该市考生数学成绩的及格率为71﹪,数学考试及格人数为12000×71﹪=8520(人)。
频数分布直方图的特点:①能够显示各组频数的分布情况。②易于显示各组间的频数的差别。③各小长方形的高与该组的频数成正比。④各组频数之和等于样本容量。
5、用样本频率分布估计总体频率分布
例5:某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需要定期对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的100件钢管进行检测,把这100件钢管的质量分布情况作为总体的质量分布情况来看待。根据规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们特别希望知道所有生产的钢管中优等品所占的比例,这时就可以用样本的分布情况估计总体的分布情况。
下面的数据是一次抽样中的100件钢管的内径尺寸:
25.39,25.36,25.34,25.42,25.45,25.38,25.39,25.42,25.47,25.35
25.41,25.43,25.44,25.48,25.45,25.43,25.46,25.40,25.51,25.45
25.40,25.39,25.41,25.36,25.38,25.31,25.56,25.43,25.40,25.38
25.37,25.44,25.33,25.46,25.40,25.49,25.34,25.42,25.50,25.37
25.35,25.32,25.45,25.40,25.27,25.43,25.54,25.39,25.45,25.43
25.40,25.43,25.44,25.41,25.53,25.37,25.38,25.24,25.44,25.40
25.36,25.42,25.39,25.46,25.38,25.35,25.31,25.34,25.40,25.36
25.41,25.32,25.38,25.42,25.40,25.33,25.37,25.41,25.49,25.35
25.47,25.34,25.30,25.39,25.36,25.46,25.29,25.40,25.37,25.33
25.40,25.35,25.41,25.37,25.47,25.39,25.42,25.47,25.38,25.39
解:上面的100个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据加以整理。列出这组样本数据的频率分布表、绘制频率分布直方图。
分组
个数累计
频数
频率
25.235~25.265
1
1
0.01
25.265~25.295
2
2
0.02
25.295~25.325
5
5
0.05
25.325~25.355
12
12
0.12
25.355~25.385
18
18
0.18
25.385~25.415
25
25
0.25
25.415~25.445
16
16
0.16
25.445~25.475
13
13
0.13
25.475~25.505
4
4
0.04
25.505~25.535
2
2
0.02
25.535~25.565
2
2
0.02
合计
100
100
1.00
 
结论:从样本频率分布表或频率分布直方图容易看出,优等品所占的比例等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。
频率分布直方图的特点:①小长方形的面积=组距×频率/组距=频率。②各小长方形的面积等于相应各组的频率, 即各个长方形面积的大小反映该组数据出现的频率的大小。③各组的频率之和等于1,故各小长方形的面积之和等于1。
(三)、估计离散程度、波动性或稳定性
方差或标准差是反映一组数据的离散程度的统计量。用随机抽样方法,取得样本数据,通过计算样本方差或标准差,来估计总体方差或标准差,进而估计总体的离散程度、波动性或稳定性。
6、用样本方差(标准差)估计总体方差(标准差)
例6:甲、乙、丙三台机床生产直径为60mm的螺丝,为了检验产品质量,从三台机床生产的螺丝中各抽查了20个测量其直径,进行数据处理后,发现这三组数据的平均数都是60mm,它们的方差依次为 =0.162,
=0.058, =0.149.根据以上提供的信息,你认为生产螺丝质量最好的是____机床.
解:方差表示一组数据的稳定性程度,方差越小,一组数据的稳定性越好。从甲、乙、丙三台机床生产的零件中,每台机床分别抽查的20个零件的直径分别是三个样本,甲、乙、丙三台机床每台机床生产的全部零件的直径分别是三个总体。本题有三个样本方差 、 、 ,三个总体方差。∵ =0.162, =0.058, =0.149,∴ < < ,表明机床乙生产的零件的样本方差最小,零件质量稳定性最好。由此推断机床乙生产的全部零件质量(总体)稳定性最好。
(四)、估计概率
用随机抽样方法,统计样本频率估计总体频率,进而用总体频率来估计总体的概率。
7、用样本频率估计总体频率(概率)
例7:某养鱼场为了要估计鱼塘中鱼的总数量,第一次从中网出100条,把这100条带有标志后全部放回.过1~2天,估计这群带标志的鱼已完全混杂到塘中,再从中网出200条,假定在第二次网出的200条中,带有第一次做标志的20条,估计鱼塘中有鱼多少条?
解:设鱼塘中鱼的总数量是x条,带标志的鱼的数量是100条,总体频率是 ,样本是200条,样本中带标志的鱼的数量是20条,样本频率是 ,用样本估计总体,得方程式:
解方程得,x=1000(条)
答:估计鱼塘中有鱼1000条。
例8:某水果公司以 元/千克的成本新进了10000千克的柑橘,如果公司希望这种柑橘能够获得利润5000元,那么在出售柑橘(已经去掉损坏的柑橘)时,每千克大约定价为多少元比较合适?
销售人员首先从所有的柑橘总随机地抽取若干柑橘,进行了“柑橘损坏表”统计,并把获得的数据记录在下表中,请你帮忙完成下表。
柑橘总质量( )/千克
损坏柑橘质量( )/千克
柑橘损坏的频率( )
50
5.50
0.110
100
10.50
0.105
150
15.50
_______
200
19.42
_______
250
24.45
_______
300
30.93
_______
350
35.32
_______
400
39.24
_______
450
44.57
_______
500
54.54
________
解:填表:
柑橘总质量( )/千克
损坏柑橘质量( )/千克
柑橘损坏的频率( )
50
5.50
0.110
100
10.50
0.105
150
15.50
0.103
200
19.42
0.097
250
24.45
0.082
300
30.93
0.103
350
35.32
0.101
400
39.24
0.098
450
44.57
0.099
500
54.54
0.109
填完表格,计算出10个样本频率的平均数 ,估计柑橘损坏的频率为 ,则柑橘完好的频率为 ,因此柑橘完好的概率为 ,因此:在10000千克柑橘中完好柑橘的质量为 千克。完好柑橘的实际成本为: (元/千克)
设每千克柑橘的销售价为 元,则应有: ,解得:
因此,出售柑橘时每千克大约定价为2.8元可获利润5000元。
结论:一次抽样得到一个样本频率,可用这个样本频率估计总体频率;多次抽样得到多个样本频率,可用这多个样本频率的平均值估计总体频率,后者比前者更接近实际。

曹玉平
(江苏省海门市三星初级中学     226114)
中国教育学会中学数学教学专业委员会2等奖

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。如发现有害或侵权内容,请点击这里 或 拨打24小时举报电话:4000070609 与我们联系。

    猜你喜欢

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多
    喜欢该文的人也喜欢 更多