概率与统计
二. 教学目标: 概率是高考的重点内容之一,尤其是新增的随机变量这部分内容。要充分注意一些重要概念的实际意义,理解概率处理问题的基本思想方法。 重难点归纳: 本章内容分为概率初步和随机变量两部分。第一部分包括等可能事件的概率、互斥事件有一个发生的概率、相互独立事件同时发生的概率和独立重复实验 涉及的思维方法:观察与试验、分析与综合、一般化与特殊化。 主要思维形式有:逻辑思维、聚合思维、形象思维和创造性思维。
三. 知识要点: (一)统计 1. 抽样方法有 简单随机抽样 ; 系统抽样 ; 分层抽样 。 2. 简单随机抽样 抽签法 ; 随机数表法 。 用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤为: (1)将总体中的所有个体编号(号码可以从1到N); (2)将1到N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作); (3)将号签放在同一箱中,并搅拌均匀; (4)从箱中每次抽出1个号签,并记录其编号,连续抽取k次; (5)从总体中将与抽到的签的编号相一致的个体取出. 用随机数表法抽取样本的步骤是: (1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止; (4)根据选定的号码抽取样本. 3. 将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方法称为系统抽样(systematicsampling). 系统抽样, 又叫 等距 抽样。 4. 系统抽样的步骤为: (1)采用随机的方式将总体中的个体编号; (2)将整个的编号按一定的间隔(设为k)分段,当Nn(N为总体中的个体数,n为样本容量)是整数时,k=Nn;当Nn不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时k=N′n,并将剩下的总体重新编号; (3)在第一段中用简单随机抽样确定起始的个体编号l; (4)将编号为1,1+k,1+2k,…,1+(n-1)k的个体抽出. 5. 当总体由 差异明显 的几个部分组成时,常常将总体中的 个体 按不同的特点分成 比较分明 的几部分,然后按各部分在总体中 所占的比例 实施抽样,这种抽样方法叫分层抽样;其中所分成的各个部分称为 “层” . 6. 分层抽样的步骤是: (1)将总体按一定标准分层;若按比例计算所得的个体数不是整数,可作适当的近似处理。 (2)计算各层的个体数与总体的个体数的比; (3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量; (4)在每一层进行抽样(可用简单随机抽样或系统抽样)。 7. 三种抽样的关系:
8. 反映总体频率分布的表格称为频率分布表 9. 将整个取值区间的长度称为 全距,分成的区间的长度称为组距。 10. 直观地体现数据的分布规律的方法———绘制频数条形图或频率直方图。 11. 如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图 12. 频率折线图的优点是它反映了数据的变化趋势. 如果将样本容量取得足够大,分组的组距取得足够小,则这条折线将趋于一条曲线,我们称这一曲线为总体分布的密度曲线 13. 将这些数据有条理地列出来,从中观察得分的分布情况. 这种方法就是画出该运动员得分的茎叶图 14. 回归分析 一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。 对于线性回归分析,我们要注意以下几个方面: (1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。 (2)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。 (3)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。 15. 散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度。粗略地看,散点分布具有一定的规律。 16. 回归直线 设所求的直线方程为
相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 17. 相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把
叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 18. 相关系数的性质: 19. 显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。它必须在每一次统计检验之前确定。 20. 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数。在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0.05或r0.01;例如n=7时,r0.05=0.754,r0.01=0.874。求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当 讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到。
(二)概率 1. 一般地,如果随机事件A在n次试验中发生了m次,当试验的次数n很大时,我们可以将事件A发生的频率 2. 在一次试验中可能出现的每一个基本结果称为基本事件 3. 等可能基本事件的两个特点: (1)所有的基本事件只有有限个; (2)每个基本事件的发生都是等可能的。 将满足上述条件的随机试验的概率模型称为古典概型 4. 概率计算公式:如果一次试验的等可能基本事件共有n个,那么每一个等可能基本事件发生的概率都是 5. 一年按365天计算,2名同学在同一天过生日的概率为 6. 一只口袋装有形状、大小都相同的6只小球,其中有2只白球、2只红球和2只黄球。从中一次随机摸出2只球,试求: (1)2只球都是红球的概率; (2)2只球同色的概率; (3)“恰有1只球是白球的概率”是“2只球都是白球的概率”的多少倍? 解:(1)
(三) 几何概型 1. 对于一个随机试验,我们将每个基本事件理解为从某个特定的几何区域内随机地取一点,该区域中每一点被取到的机会都一样;而一个随机事件的发生则理解为恰好取到上述区域内的某个指定区域中的点。这里的区域可以是线段、平面图形、立体图形等。用这种方法处理随机试验,称为几何概型。 一般地,在几何区域D中随机地取一点,记事件“该点落在其内部一个区域d内”为事件A,则事件A发生的概率P(A)= 2. 即事件A与B是不可能同时发生的。不能同时发生的两个事件称为互斥事件,如果事件A1,A2,…,An中的任何两个都是互斥事件,就说事件A1,A2,…,An彼此互斥。 3. 设A,B为互斥事件,当事件A,B有一个发生,我们把这个事件记作A+B。 4. 如果事件A,B互斥,那么事件A+B发生的概率,等于事件A,B分别发生的概率的和,即P(A+B)=P(A)+P(B)。 5. 如果事件A1,A2,…,An两两互斥,则P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)。 6. 两个互斥事件必有一个发生,则称这两个事件为对立事件。事件A的对立事件记为
【典型例题】 例1. 有一容量为50的样本,数据的分组及各组的频率数如下:
(1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图和累积频率的分布图。 命题意图:本题主要考查频率分布表,频率分布直方图和累积频率的分布图的画法。 知识依托:频率、累积频率的概念以及频率分布表、直方图和累积频率分布图的画法。 错解分析:解答本题时,计算容易出现失误,且要注意频率分布与累积频率分布的区别。 技巧与方法: 本题关键在于掌握三种表格的区别与联系。 解:(1)由所给数据,计算得如下频率分布表:
(2)频率分布直方图与累积频率分布图如下:
例2. 袋子A和B中装有若干个均匀的红球和白球,从A中摸出一个红球的概率是 (Ⅰ)从A中有放回地摸球,每次摸出一个,有3次摸到红球即停止。 (i)求恰好摸5次停止的概率; (ii)记5次之内(含5次)摸到红球的次数为 (Ⅱ) 若A、B两个袋子中的球数之比为12,将A、B中的球装在一起后,从中摸出一个红球的概率是 命题意图:本题考查利用概率知识和期望的计算方法。 知识依托:概率的计算及期望的概念的有关知识。 错解分析:在本题中,随机变量的确定,稍有不慎,就将产生失误。 技巧与方法:可借助n次独立重复试验概率公式计算概率。 解:(Ⅰ)(i) (ii)随机变量 由n次独立重复试验概率公式
(或 随机变量
(Ⅱ)设袋子A中有m个球,则袋子B中有2m个球。 由
例3. 一个口袋里共有2个红球和8个黄球,从中随机地接连取3个球,每次取一个。设{恰有一个红球}=A,{第三个球是红球}=B (1)不返回抽样; (2)返回抽样。 解:(1)不返回抽样, P(A)= (2)返回抽样, P(A)=C
例4. 在袋中装20个小球,其中彩球有n个红色、5个蓝色、10个黄色,其余为白球。 求:(1)如果从袋中取出3个都是相同颜色彩球(无白色)的概率是 (2)根据(1)的结论,计算从袋中任取3个小球至少有一个是红球的概率。 解:(1)取3个球的种数为C 设“3个球全为红色”为事件A,“3个球全为蓝色”为事件B,“3个球全为黄色”为事件C。 P(B)= ∵A、B、C为互斥事件, ∴P(A+B+C)=P(A)+P(B)+P(C), 即
又∵n≥2,故n=2。 (2)记“3个球中至少有一个是红球”为事件D P(D)=1-P( P(D)=
例5. 甲乙两船驶向一个不能同时停泊两艘船的码头,它们在一昼夜内到达该码头的时刻是等可能的。如果甲船停泊的时间为4小时,乙船停泊的时间为2小时,求它们中的任意一艘船都不需要等待码头空出的概率。 解:设甲乙两船到达该码头的时刻分别是x,y时刻.则 则x,y满足的可行域为如图所示的阴影部分。 故所求的概率为:
例6. 将长为3的棒随机折成3段,(1)求3段能构成三角形的概率; (2)求3段不能构成三角形的概率。 解:设被分成的三段为x,y,3-x-y,则 x,y对应的区域是如上图所示的三角形。 (1)记3段能构成三角形为事件A,则P(A)= (2) 记3段不能构成三角形为事件B,则P(B)
例7. 已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:
(1)求x与y之间的相关系数,并检验是否线性相关; (2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。 分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界 解:(1)列出下表,并用科学计算器进行有关计算:
故蔬菜产量与放用氮肥量的相关系数 由于n=15,故自由度15-2=13。 由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值 从而说明蔬菜产量与氮肥量之间存在着线性相关关系。 (2)设所求的回归直线方程为 ∴回归直线方程为 点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。如果会使用含统计的科学计算器,能简单得到
例8. 假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
若由资料可知y对x呈线性相关关系。试求: (1)线性回归方程; (2)估计使用年限为10年时,维修费用是多少? 分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。 解:(1)列表如下:
于是 ∴线性回归方程为: (2)当x=10时, 即估计使用10年时维修费用是12.38万元。 点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。
【模拟试题】 1. 为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:
现要使销售额达到6万元,则需广告费用为_____(保留两位有效数字) 2. 某校高三年级举行的一次演讲比赛共有10位同学参加,其中一班有3位,二班有2位,其他班有5位 A. 3. 甲、乙两人下棋,甲获胜的概率是40%,甲不输的概率为90%,则甲、乙二人下成和棋的概率为 A. 60% B. 30% C. 10% D. 50% 4. 从装有2个红球和2个白球的口袋内任取2个球,那么互斥而不对立的两个事件是 A. 至少有1个白球,都是红球 B. 至少有1个白球,至多有1个红球 C. 恰有1个白球,恰有2个白球 D. 至多有1个白球,都是红球 5. 一批产品共10件,其中有两件次品,现随机地抽取5件,则所取5件中至多有一件次品的概率为 A. 6. 在某段时间内,甲地不下雨的概率为0.3,乙地不下雨的概率为0.4,假设在这段时间内两地是否下雨相互无影响,则这段时间内两地都下雨的概率是 A. 0.12 B. 0.88 C. 0.28 D. 0.42 7. 一道数学竞赛试题,甲生解出它的概率为 8. 一出租车司机从饭店到火车站途中有六个交通岗,假设他在各交通岗遇到红灯这一事件是相互独立的,并且概率都是 9. 某学生参加一次选拔考试,有5道题,每题10分。已知他解题的正确率为 10. 某单位订阅大众日报的概率为0.6,订阅齐鲁晚报的概率为0.3,则至少订阅其中一种报纸的概率为________。 11. 在未来3天中,某气象台预报每天天气的准确率为0 (1)至少有2天预报准确的概率是多少? (2)至少有一个连续2天预报都准确的概率是多少? 12. 一个通讯小组有两套设备,只要其中有一套设备能正常工作,就能进行通讯 (1)恰有一套设备能正常工作的概率; (2)能进行通讯的概率。 13. 已知甲袋中有3个白球和4个黑球,乙袋中有5个白球和4个黑球
【试题答案】 1. 解析:先求出回归方程 答案:1.5万元 2. 解析:10位同学总参赛次序A ∴所求概率为 答案:B 3. 甲不输即为甲获胜或甲、乙二人下成和棋,90%=40%+p,∴p=50%。 答案:D 4. C 5. 解析:P= 答案:B 6. 解析:P=(1-0.3)(1-0.4)=0.42。 答案:D 7. 解析:P= 答案: 8. 因为这位司机在第一、二个交通岗未遇到红灯,在第三个交通岗遇到红灯,所以P=(1- 答案: 9. 解析:要使该生被选中,则必须他解对5题或4题。 ∴P=( 答案: 答案:0.72。 11. 解:(1)至少有2天预报准确的概率即为恰有2天和恰有3天预报准确的概率,即 C ∴至少有2天预报准确的概率为0.896。 (2)至少有一个连续2天预报都准确,即为恰有一个连续2天预报准确或3天预报准确的概率为 2·0.82·0.2+0.83=0.768。 ∴至少有一个连续2天预报都准确的概率为0.768。 12. 解:记“第一套通讯设备能正常工作”为事件A,“第二套通讯设备能正常工作”为事件B。 由题意知P(A)=p3,P(B)=p3, P( (1)恰有一套设备能正常工作的概率为 P(A· =p3(1-p3)+(1-p3)p3=2p3-2p6。 (2)方法一:两套设备都能正常工作的概率为 P(A·B)=P(A)·P(B)=p6。 至少有一套设备能正常工作的概率,即能进行通讯的概率为 P(A· 方法二:两套设备都不能正常工作的概率为 P( 至少有一套设备能正常工作的概率, 即能进行通讯的概率为 1-P( 答:恰有一套设备能正常工作的概率为2p3-2p6,能进行通讯的概率为2p3-p6。 13. 解:从甲袋中取2个白球,从乙袋中取1个黑球和1个白球的概率为
从甲袋中取1个黑球和1个白球,从乙袋中取2个白球的概率为
所以,取得的4个球中有3个白球和1个黑球的概率为
|
|