必刷大题20 概率与统计1.已知条件①采用无放回抽取;②采用有放回抽取,请在上述两个条件中任选一个,补充在下面问题中横线上并作答,选两个条件作答的以条件①评分. 问题:在一个口袋中装有3个红球和4个白球,这些球除颜色外完全相同,若________,从这7个球中随机抽取3个球,记取出的3个球中红球的个数为X,求随机变量X的分布列和均值. 解 若选①,由题意得,随机变量X的所有可能取值为0,1,2,3, P(X=0)==, P(X=1)==, P(X=2)==, P(X=3)==. 所以X的分布列为
E(X)=0×+1×+2×+3×=. 若选②,由题意得,随机变量X的所有可能取值为0,1,2,3,且X~B, 所以P(X=0)=C×3=, P(X=1)=C××2=, P(X=2)=C×2×=, P(X=3)=C×3=, 所以X的分布列为
E(X)=3×=. 2.(2023·毕节模拟)某市全体高中学生参加某项测试,从中抽取部分学生的测试分数绘制成茎叶图和频率分布直方图如图所示,后来茎叶图受到了污损,可见部分信息如图所示. (1)求频率分布直方图中a的值,并根据频率分布直方图估计该市全体高中学生的测试分数的中位数和平均数(同一组中的数据以这组数据所在区间的中点值作代表,结果保留一位小数); (2)用频率代替概率,若从该市全体高中学生中抽取4人,记这4人中测试分数不低于90分的人数为X,求X的分布列及均值. 解 (1)∵测试分数位于[50,60)的频数为4,频率为0.01×10=0.1, ∴抽取学生数为=40, ∴测试分数位于[80,90)的人数为40-(4+10+14+4)=8, ∴a=÷10=0.02. 由题意知,测试分数位于[60,70)的频率为=0.25,位于[70,80)的频率为=0.35, 设由频率分布直方图估计分数的中位数为t, 则有(t-70)×0.035=0.5-0.1-0.25,解得t≈74.3, 估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5. (2)由题意知,测试分数不低于90分的频率为0.1,人数为4, ∴X的所有可能取值为0,1,2,3,4,X~B(4,0.1), 即P(X=k)=C(0.1)k(0.9)4-k(k=0,1,2,3,4), ∴X的分布列为
E(X)=4×0.1=0.4. 3.根据统计发现,疑似病例核酸检测呈阳性的概率为p(0<p<1).现有4例疑似病例,分别对其取样、检测,既可以逐个化验,也可以将若干个样本混合在一起化验,混合样本中只要有病毒,则化验结果呈阳性.若混合样本呈阳性,则需将该组中备用的样本再逐个化验;若混合样本呈阴性,则判定该组各个样本均为阴性,无需再化验.现有以下三种方案: 方案一:4个样本逐个化验; 方案二:4个样本混合在一起化验; 方案三:4个样本均分为两组,分别混合在一起化验. 由于检测能力不足,化验次数的均值越小,则方案越“优”. (1)若p=,按方案一,求4例疑似病例中恰有2例呈阳性的概率; (2)若p=,现将该4例疑似病例样本进行化验,试比较以上三个方案中哪个最“优”,并说明理由. 解 (1)p=,按方案一,4例疑似病例中恰有2例呈阳性的概率P=C×2×2=. (2)方案一:逐个检测,检验次数为4×1=4; 方案二:设检测次数为X,X的所有可能取值为1,5, P(X=1)=4=, P(X=5)=1-=, 则X的分布列为
方案二的均值E(X)=1×+5×=2.375 6; 方案三:每组2个样本检测时, 若呈阴性,则检测次数为1,概率为, 若呈阳性,则检测次数为3,概率为1-=, 设方案三的检测次数记为Y,Y的所有可能取值为2,4,6, P(Y=2)=, P(Y=4)=2××=, P(Y=6)=2=, 则Y的分布列为
方案三的均值E(Y)=2×+4×+6×=2.76, ∵E(X)<E(Y)<4,∴方案一、二、三中,方案二最“优”. 4.为评估设备M生产某种零件的性能,从设备M生产零件的流水线上随机抽取100个零件作为样本,测量其直径(单位:mm)后,整理得到下表:
经计算,样本直径的平均值μ=65,标准差σ=2.2,以频率值作为概率的估计值. (1)为评判一台设备的性能,从该设备加工的零件中任意抽取一个,记其直径为X,并根据以下不等式进行评判(P表示相应事件的概率):①P(μ-σ≤X≤μ+σ)≥0.682 7;②P(μ-2σ≤X≤μ+2σ)≥0.954 5;③P(μ-3σ≤X≤μ+3σ)≥0.997 3.评判规则为:若同时满足上述三个不等式,则设备等级为甲;若仅满足其中两个不等式,则设备等级为乙;若仅满足其中一个不等式,则设备等级为丙;若全部都不满足,则设备等级为丁,试判断设备M的性能等级; (2)将直径小于μ-2σ或直径大于μ+2σ的零件认为是次品. ①从设备M的生产流水线上随机抽取2个零件,计算其中次品个数Y的均值E(Y); ②从样本中随机抽取2个零件,计算其中次品个数Z的分布列和均值E(Z). 解 (1)由题意可得,P(μ-σ≤X≤μ+σ)=P(62.8≤X≤67.2)=0.8>0.682 7, P(μ-2σ≤X≤μ+2σ)=P(60.6≤X≤69.4)=0.94<0.954 5, P(μ-3σ≤X≤μ+3σ)=P(58.4≤X≤71.6)=0.98<0.997 3, 因为设备M的数据仅满足一个不等式,故其性能等级为丙. (2)样本中次品共有6个,可估计设备M生产零件的次品率约为0.06. ①由题意可得,Y~B,所以E(Y)=2×=. ②由题意可知,Z的分布列为
所以E(Z)=0×+1×+2×=. 5.(2022·唐山模拟)两会期间,国家对学生学业与未来发展以及身体素质重要性的阐述引起了全社会的共鸣.某中学体育组对高三的800名男生做了单次引体向上的测试,得到了如图所示的频率分布直方图(引体向上个数只记整数).体育组为进一步了解情况,组织了两个研究小组. (1)第一小组决定从单次完成1~15个引体向上的男生中,采用比例分配的分层随机抽样的方法抽取22人进行全面的体能测试. ①在单次完成6~10个引体向上的所有男生中,男生甲被抽到的概率是多少? ②该小组又从这22人中抽取3人进行个别访谈,记抽到“单次完成引体向上1~5个”的人数为随机变量X,求X的分布列和均值; (2)第二小组从学校学生的成绩与体育锻炼相关性角度进行研究,得到了这800人的学业成绩与体育成绩之间的2×2列联表.
根据小概率值α=0.005的独立性检验,分析体育锻炼是否与学业成绩有关? 参考公式:独立性检验统计量χ2=,其中n=a+b+c+d. 临界值表:
解 (1)①单次完成1~5个引体向上的有0.020×5×800=80(人), 单次完成6~10个引体向上的有0.030×5×800=120(人), 单次完成11~15个引体向上的有0.060×5×800=240(人), 则单次完成1~15个引体向上的男生共440人, 采用比例分配的分层随机抽样的方法抽取22人,则有===, 所以a=4,b=6,c=12, 即从单次完成1~5个的人中选4人,6~10个的人中选6人,11~15个的人中选12人, 又因为单次完成6~10个引体向上的共有120人, 记“单次完成6~10个引体向上的学生中,男生甲被抽中”为事件A, 则P(A)==. ②X的所有可能取值为0,1,2,3, P(X=0)==, P(X=1)==, P(X=2)==, P(X=3)==, 所以X的分布列为
所以E(X)=0×+1×+2×+3×==. (2)零假设为H0:体育锻炼与学业成绩无关, 由列联表中数据得,χ2=≈17.778>7.879=x0.005, 所以根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为体育锻炼与学业成绩有关. 6.随着人们生活水平的不断提高,肥胖人数不断增多.世界卫生组织(WHO)常用身体质量指数(BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是BMI=.成人的BMI数值标准为:BMI≤18.4为偏瘦;18.5≤BMI≤23.9为正常;24≤BMI≤27.9为偏胖;BMI≥28为肥胖. 某研究机构为了解某快递公司员工的身体质量指数,研究人员从公司员工体检数据中,抽取了8名员工(编号1~8)的身高x(单位:cm)和体重y(单位:kg)的数据,并计算得到他们的BMI(精确到0.1)如表所示.
(1)现从这8名员工中选取3人进行复检,记抽取到BMI值为“正常”员工的人数为X,求X的分布列及均值; (2)研究机构分析发现公司员工的身高x(cm)和体重y(kg)之间的线性相关程度较高,在编号为6的体检数据丢失之前,调查员甲已进行相关的数据分析,并计算得出该组数据的经验回归方程为=0.5x+,且根据经验回归方程预估一名身高为180 cm的员工体重为71 kg,计算得到的其它数据如下:=170,xiyi=89 920. ①求的值及表格中8名员工体重的平均值; ②在数据处理时,调查员乙发现编号为8的员工体重数据有误,应为63 kg,身高数据无误,请你根据调查员乙更正的数据重新计算经验回归方程,并据此预估一名身高为180 cm的员工的体重. 附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线=x+的斜率和截距的最小二乘估计分别为=,=-. 解 (1)8名员工中BMI数值为“正常”的员工有5人,记抽到BMI值为“正常”的人数为X,则X的所有可能取值为0,1,2,3,则P(X=0)==, P(X=1)==, P(X=2)===, P(X=3)===. 故X的分布列为
则E(X)=0×+1×+2×+3×=. (2)①调查员甲由经验回归方程=0.5x+预估一名身高为180 cm的员工的体重为71 kg, 由此计算=71-180×0.5=-19, 故=+=0.5×170-19=66. ②由①知更正前的数据=170, =66.由=0.5=, 得x-82=2×(xiyi-8)=2×(89 920-8×170×66)=320, 更正后的数据′==170, ′==67,x′iy′i=xiyi+x8×8=xiyi+182×8, 8′·′=8·′=8(+1) =8+8×170, 则= = =0.5+=0.5+0.3=0.8, 故=′-′=67-0.8×170 =-69. 更正后该组数据的经验回归方程为 =0.8x-69. 当x=180时, =0.8×180-69=75, 所以重新预估一名身高为180 cm的员工的体重约75 kg. |
|