CBC112工人编号年龄工人编号年龄工人编号年龄工人编号年龄140103619272834244113120432939340123821413043441133922373138533144323343242640154524423353745163925373437842173826443549943183627423639本部分内容讲解结束按ESC键退出全屏播放栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步第2讲用样本估计总体第十章统计、统计案例及算法初步最大值最小值组距组数分组频率分布表频率分布直方图中点所分组数组距出现次数最多最中间2.众数、中位数和平均数的异同众数中位数平均数相同点不同点都是描述一组数据集中趋势的量与这组数据中的部分数据有关,出现在这些数据中不一定在这些数据中出现.奇数个时,在这组数据中出现;偶数个时,为中间两数的平均值不一定在这些数据中出现ABB50乙3600041224302550.040.120.240.300.250.05D栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步栏目导引知能训练轻松闯关名师讲坛素养提升典例剖析考点突破教材回顾夯实基础第十章统计、统计案例及算法初步
1.统计图表
(1)频率分布直方图的画法步骤
求极差(即一组数据中________与________的差);
决定________与________;
将数据________;
列____________;
画________________.
(2)频率分布折线图和总体密度曲线
频率分布折线图:连接频率分布直方图中各小长方形上端的________,就得到频率分布折线图.
总体密度曲线:随着样本容量的增加,作图时________增加,________减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(3)茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
2.样本的数字特征
(1)众数:一组数据中____________的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把____________称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s=
s2=[(x1-)2+(x2-)2+…+(xn-)2]
1.辨明两个易误点
(1)易忽视频率分布直方图中纵轴表示的应为.
(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.
3.标准差和方差的异同
相同点:标准差和方差描述了一组数据围绕平均数波动的大小.
不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()
A.总体B.个体
C.样本的容量D.从总体中抽取的一个样本
解析:调查的目的是“了解某地5000名居民某天的阅读时间”所以“5000名居民的阅读时间的全体”是调查的总体.
2.(2015·高考重庆卷)重庆市2013年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()
A.19B.20
C.21.5D.23
解析:8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为=20.
3.如图是一容量为100的样本的质量的频率分布直方图,样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()
A.10
B.20
C.30D.40
解析:由题意得组距为5故样本质量在[5),[10,15)内的频率分别为0.3和0.5所以样本质量在[15]内的频率为1-0.3-0.5=频数为100×0.2=20.
4.(2016·郑州第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.
解析:依题意得成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3所以该班的学生人数是15÷0.3=50.
5.(必修382习题2.2组6改编)甲乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲0102203124
乙2311021101
则机床性能较好的为________.
解析:因为甲=1.5乙=1.2=1.65=0.76所以甲>乙 考点一频率分布直方图(高频考点)
频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.
高考对频率分布直方图的考查主要有以下四个命题角度:
(1)完善频率分布直方图;
(2)利用频率分布直方图求样本容量;
(3)求样本平均数、众数、中位数;
(4)与概率结合考查某区间内的个体被选中的概率.
(2015·高考安徽卷)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工.根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].
(1)求频率分布直方图中a的值;
(2)估计该企业的职工对该部门评分不低于80的概率;
(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.
[解(1)因为(0.004+a+0.018+0.022×2+0.028)×10=1a=0.006.(2)由所给频率分布直方图知名受访职工评分不低于80的频率为(0.022+0.018)×10=所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[5060)的有:50×0.006×10=(人)记为A;受访职工中评分在[40)的有:50×0.004×10=2(人)记为B
从这5名受访职工中随机抽取2人所有可能的结果共有10种它们是{A},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}.又因为所抽取2人的评分都在[40)的结果有1种即{B故所求的概率为
解决频率分布直方图问题的要点
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总体数.
1.(1)(2015·高考湖北卷)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
直方图中的a=________;
在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
(2)(2016·山西省考前质量检测)某市为了节约能源,拟出台“阶梯电价”制度,即制定住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:1863431196577
299752100.
组别 月用电量 频数统计 频数 频率 [0,20) ② [20,40) 正 [40,60) 正正正 [60,80) 正正正正 [80,100) 正正正 [100,120]
①完成频率分布表并绘制频率分布直方图;
②根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);
若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.
解:(1)①0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1解得a=3.故填3.区间[0.3)内的频率为0.1×1.5+0.1×2.5=0.4故[0.5]内的频率为1-0.4=0.6.因此消费金额在区间[0.5]内的购物者的人数为0.6×10000=6000.故填6000.
(2)①
组别 月用电量 频数统计 频数 频率 ① [0) 4 0.04 ② [20,40) 正正[40,60) 正正正正[60,80) 正正正正正正 30 0.30[80,100) 正正正正正 25 0.25[100,120] 正 5 0.05
②由题意用每小组的中点值代表该小组的平均月用电量则100户住户组成的样10×0.04+30×+50×0.24+70×0.30+90×0.25+110×0.05=65度.用样本估计总体可知全市居民的平均月用电量约为65度.
③计算累计频率可得下表:
分组 [0) [20,40) [40,60) [60,80) [80,100) [100,120] 频率 0.04 0.12 0.24 0.30 0.25 0.05 累计频率 0.04 0.16 0.40 0.70 0.95 1.00由此可知临界值a应在区间[80)内且频率分布直方图中在临界值a左侧的总面积(频率)为0.75故有0.7+(a-80)×0.0125=0.75解得a=84由样本估计总体可得临界值a为84.
考点二茎叶图
(2016·西安地区八校联考)
如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x,y的值为()
A.2,4B.4,4
C.5,6D.6,4
[解析甲==85解得x=6由图可知y=4故选
茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
2.(1)(2016·唐山统一考试)某品牌空调在元旦期间举行促销活动,如图所示的茎叶图表示某专卖店记录的每天销售量情况(单位:台),则销售量的中位数是()
A.13B.14
C.15D.16
(2)为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为()
A.100B.160
C.200D.280
解析:(1)由茎叶图可知这些数分别为5所以中位数为=15.(2)由茎叶图可知在20名教师中上学期使用多媒体16,30)内的人数为8据此可以估计400名教师中使用多媒体进行教学的次数在[16)内的人数为400×=160.
考点三样本的数字特征
(2015·高考安徽卷)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()
A.8B.15
C.16D.32
[解析已知样本数据x的标准差为s=8则s=64数据2x-1-1-1的方差为22=2所以其标准差为=2×8=16故选
样本数字特征及公式推广
(1)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.
(2)平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
3.(1)(2015·高考广东卷)已知样本数据x1,x2,…,xn的均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________.
(2)(2016·南昌第一次模拟)若1,2,3,4,m这五个数的平均数为3,则这五个数的方差为________.
解析:(1)由条件知==5则所求均值===2+1=2×5+1=11.(2)由=3得m=5所以这五个数的方差为[(1-3)+(2-3)+(3-3)+(4-3)+(5-3)]=2.
规范解答——用样本的数字特征估计总体数字特征
(本题满分12分)(2015·高考广东卷)某工厂36名工人的年龄数据如下表.
(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(2)计算(1)中样本的均值和方差s2;
(3)36名工人中年龄在-s与+s之间有多少人?所占的百分比是多少(精确到0.01%)?
(1)―→
(2)―→―→
(3)―→―→―→―→
(1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,
所以所有样本数据的编号为4n-2(n=1,2,…,9),
其年龄数据为:44,40,36,43,36,37,44,43,37.(4分)
(2)由均值公式知:==40,(5分)
由方差公式知:s2=[(44-40)2+(40-40)2+…+(37-40)2]=.(8分)
(3)因为s2=,s=,
所以36名工人中年龄在-s和+s之间的人数等于年龄在区间[37,43]上的人数,
即40,40,41,…,39,共23人.(10分)
所以36名工人中年龄在-s和+s之间的人数所占的百分比为×100%≈63.89%.(12分)
(1)解决此类问题要注意审题,理清题中数据,如本例中样本总量是36,而抽取容量是9.解答步骤要规范.
(2)解决平均数与方差的问题,不要盲目求解,要先观察数据的特征,寻找运算的捷径,做到事半功倍.
|
|