Gothedistance
创新题目技能练——统计、统计案例
A组专项基础训练
(时间:40分钟)
一、选择题
1.从2012名学生中选取50名学生参加数学竞赛,若采用下面的方法选取:先用简单随机
抽样从2012人中剔除12人,剩下的2000人再按系统抽样的方法抽取50人,则在2012
人中,每人入选的概率()
A.不全相等
B.均不相等
C.都相等,且为251006
D.都相等,且为140
答案C
解析在各种抽样中,不管是否剔除个体,也不管抽取的先后顺序,每个个体被抽到的
可能性都是相等的,这是各种抽样的一个特点,也说明了抽样的公平性.故本题包括被
剔除的12人在内,每人入选的概率是相等的,都是502012=251006.
2.右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中
左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的
数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中
位数是()
A.161cmB.162cmC.163cmD.164cm
答案B
解析由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162(cm).
3.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程y=bx+a,则“(x0,y0)满
足线性回归方程y=bx+a”是“x0=x1+x2+…+x1010,y0=y1+y2+…+y1010”的()
A.充分不必要条件B.必要不充分条件
C.充要条件D.既不充分也不必要条件
答案B
解析x0,y0为这10组数据的平均值,
Gothedistance
根据公式计算线性回归方程y=bx+a的b以后,
再根据a=y-bx(x,y为样本平均值)求得a.
因此(x,y)一定满足线性回归方程,但满足线性回归方程的除了(x,y)外,可能还
有其他样本点.
4.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他
10个小长方形面积和的14,且样本容量为160,则中间一组的频数为()
A.32B.0.2
C.40D.0.25
答案A
解析由频率分布直方图的性质,可设中间一组的频率为x,则x+4x=1,
∴x=0.2,故中间一组的频数为160×0.2=32,选A.
5.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组
数据的中位数和平均数分别是()
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
答案A
解析中位数为12×(91+92)=91.5.
平均数为18×(87+89+90+91+92+93+94+96)
=91.5.
二、填空题
6.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作
品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一
个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法
看清,若记分员计算无误,则数字x应该是________.
答案1
解析当x≥4时,
89+89+92+93+92+91+94
7=
640
7≠91,∴x<4,
则89+89+92+93+92+91+x+907=91,∴x=1.
7.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零
件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件
Gothedistance
的平均数分别为________和________.
答案2423
解析x甲=110×(19+18+20+21+23+22+20+31+31+35)=24.
x乙=110×(19+17+11+21+24+22+24+30+32+30)=23.
8.如图所示是某公司(员工总人数300人)2012年员工年薪情况的频率分布直方图,由此可
知,员工中年薪在2.4万元~2.6万元之间的共有________人.
答案72
解析由所给图形,可知员工中年薪在2.4万元~2.6万元之间的频率为1-(0.02+0.08
+0.08+0.10+0.10)×2=0.24,所以员工中年薪在2.4万元~2.6万元之间的共有
300×0.24=72(人).
三、解答题
9.某个体服装店经营某种服装,一周内获纯利y(元)与该周每天销售这种服装的件数x之间
的一组数据如下:
x3456789
y66697381899091
已知:∑
7
i=1x
2
i=280,∑
7
i=1y
2
i=45309,∑
7
i=1xiyi=3487.
(1)求x,y;
(2)判断纯利润y与每天销售件数x之间是否线性相关,如果线性相关,求出线性回归方
程.
解(1)x=17(3+4+5+6+7+8+9)=6,
y=17(66+69+73+81+89+90+91)≈79.86.
Gothedistance
(2)根据已知∑
7
i=1x
2
i=280,∑
7
i=1y
2
i=45309,
∑
7
i=1xiyi=3487,得相关系数
r=3487-7×6×79.86?280-7×62??45309-7×79.862?≈0.973.
所以纯利润y与每天销售件数x之间具有较强的线性相关关系.
利用已知数据可求得线性回归方程为y=4.75x+51.36.
10.某初级中学共有学生2000名,各年级男、女生人数如表:
初一年级初二年级初三年级
女生373xy
男生377370z
已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.
(1)求x的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?
(3)已知y≥245,z≥245,求初三年级中女生比男生多的概率.
解(1)因为x2000=0.19,所以x=380.
(2)初三年级人数为y+z=2000-(373+377+380+370)=500,
现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为500×482000=12.
(3)设“初三年级中女生比男生多”的事件为A,初三年级中女生、男生人数记为(y,z);
由(2),知y+z=500,且y,z∈N,基本事件空间包含的基本事件有
(245,255)、(246,254)、(247,253)、…、(255,245)共11个,
事件A包含的基本事件有(251,249)、(252,248)、(253,247)、(254,246)、(255,245)共5个,
所以P(A)=511.
B组专项能力提升
(时间:25分钟)
1.某地区选出600名消防官兵参与灾区救援,将其编号为001,002,…,600.为打通生命通
道,先采用系统抽样方法抽出50名为先遣部队,且随机抽得的号码为003.这600名官兵
来源于不同的县市,从001到300来自A市,从301到495来自B市,从496到600来
自C市,则三个市被抽中的人数依次为()
A.26,16,8B.25,17,8C.25,16,9D.24,17,9
答案B
解析依题意可知,在随机抽样中,首次抽到003号,以后每隔12个号抽到一个人,则
Gothedistance
分别是003、015、027、039、051、063、075、…,容易知道抽到的编号构成以3为首
项,12为公差的等差数列,故被抽到的第n名消防官兵的编号为an=3+(n-1)×12=12n
-9,由1≤12nA-9≤300,则1≤nA≤25,因此抽取到的A市的人数为25人.
同理可知其他两市的人数为17和8.故选B.
2.在2012年3月15日那天,南昌市物价部门对本市5家商场某商品的一天销售量及其价
格进行了调查,5家商场的售价x元和销售量y件之间的一组数据如表所示:
价格x99.51010.511
销售量y1110865
通过散点图,可知销售量y与价格x之间有较好的线性相关关系,其回归直线的方程是
y=-3.2x+a,则a等于()
A.-24B.35.6C.40.5D.40
答案D
解析由题意,得x=15×(9+9.5+10+10.5+11)=10,
y=15×(11+10+8+6+5)=8,
且回归直线必经过点(x,y)即点(10,8),
则有8=-3.2×10+a
^
,解得a
^
=40.
3.已知某商场新进3000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从
中抽取150袋进行检查,若第一组抽出的号码是11,则第六十一组抽出的号码为______.
答案1211
解析每组袋数d=3000150=20,由题意知抽出的这些号码是以11为首项,20为公差的
等差数列,故第六十一组抽出的号码为11+60×20=1211.
4.有同学在用电子邮件时发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,
而外国人邮箱名称里含有数字的比较少.为了研究国籍与邮箱名称是否含有数字有关,于
是我们共收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中
有43个含数字,外国人的邮箱中有27个含数字.那么认为“国籍和邮箱名称里是否含有
数字有关”的把握性为________.(用百分数表示)
χ2=n?ad-bc?
2
?a+b??c+d??a+c??b+d?
P(χ2≥k0)0.250.150.100.050.0250.010
k01.3232.0722.7063.8415.0246.635
答案97.5%
Gothedistance
解析
中国人外国人总计
有数字432770
无数字213354
总计6460124
由表中数据,得χ2=124×?43×33-27×21?
2
70×54×64×60≈6.201,
∵χ2≥5.024,∴有97.5%的把握认为“国籍和邮箱名称里是否含有数字有关”.
5.某校高三数学竞赛初赛后,对考生成绩进行统计(考生成绩均不低于90分,满分150分),
将成绩按如下方式分成六组,第一组[90,100),第二组[100,110),……,第六组[140,150].如
图所示为其频率分布直方图的一部分,第四组,第五组,第六组的人数依次成等差数列,
且第六组有4人.
(1)请补充完整频率分布直方图,并估计这组数据的平均数M;(计算时可以用组中值代
替各组数据的平均值)
(2)现根据初赛成绩从第四组和第六组中任意选2人,记他们的成绩分别为x,y,若|x-
y|≥10,则称此2人为“黄金帮扶组”,试求选出的2人为“黄金帮扶组”的概率.
解(1)设第四组,第五组的频率分别为m,n,
则2n=m+0.005×10,①
m+n=1-(0.005+0.015+0.020+0.035)×10,②
由①②解得m=0.15,n=0.1,
从而得出频率分布直方图(如图所示).
M=95×0.2+105×0.15+115×0.35+125×0.15+135×0.1+145×0.05=114.5.
Gothedistance
(2)依题意,知第四组人数为4×0.0150.005=12,而第六组有4人,所以第四组和第六组一共
有16人,从中任选2人,一共有C216=120(种)选法,若满足|x-y|≥10,则一定是分别
从两个小组中各选1人,因此有C112C14=48(种)选法,
所以选出的2人为“黄金帮扶组”的概率P=48120=25.
|
|