2022年高考数学全国卷I的下面这道概率题,相关知识掌握了,解起来就特别容易。如果相关知识没有掌握,就几乎没有办法解决。不过就算能够轻易解决,想真正理解题目的数学内涵,还真不容易呢。 一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异? (2)从该地的人群中任选一人,A表示事件“选到的人卫生惯不够良好”?B表示事件“选到的人有该疾病”,P(B|A)/P(B逆|A)与P(B|A逆)/P(B逆|A逆)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R. (I)证明: R=(P(A|B)/P(A逆|B))·(P(A逆|A逆)/P(A|B逆)); (II)利用该调查数据,给出P(A|B), P(A|B逆)的估计值,并利用(I)的结果给出R的估计值. 附:K^2=n(ad-bc)^2/((a+b)(c+d)(a+c)(b+d)),
这次老黄先给解题过程,再来深挖问题中有趣的东西。 (1)解:K^2=200×(40×90-60×10)^2/((40+60)(10+90)(40+10)(60+90))=24>10.828,【注意a是主表中第一个数据,a,d必须在对角线上,b,c也必须在对角线上】 ∴有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异. 【对照附表中,10.828以上表示的,不仅有99%的把握,甚至有99.9%以上的把握,简直可以说是绝对的了】 (2)(I)证明:P(B|A)=a/(a+c), P(B逆|A)=c/(a+c); P(B|A逆)=b/(b+d), P(B逆|A逆)=d/(b+d), R=(P(B|A)/P(B逆|A))/(P(B|A逆)/P(B逆|A逆))=(a/c)/(b/d)=ad/(bc). 又P(A|B)=a/(a+b), P(A逆|B)=b/(a+b); P(A逆|B逆)=d/(c+d), P(A|B逆)=c/(c+d); ∴(P(A|B)/P(A逆|B))·(P(A逆|B逆)/P(A|B逆))=(a/b)·(d/c)=ad/(bc)=R, 得证! 【第二个小题的第一个问题,肯定有人直接把各个概率都求出来,然后比较大小,从而得证。那样也未尝不可,因为那样做的话,连第二个问题的答案也都求出来了】 (II)解: P(A|B)=40%, P(A|B逆)=10%. R=(40%/60%)×(90%/10%)=6. 【或R=40×90/(60×10)=6. 用了第一个问中求R的两个不同公式】 这道题想解决容易,想要理解就难了!它可能涉及到大学统计学的知识,偏偏这正是老黄当年读书的最弱项。不过老黄是一个不轻言放弃的人,老黄决定用自己的方式进行理解,不懂的小伙伴不要被老黄误导,懂的朋友欢迎讨论批评。要知道知识多数是从讨论之中得到的! 首先,明确K^2的意义。它是对事件独立性的检验,谁的独立性?就是“患病概率”和“卫生习惯”之间的独立性。数值越小,独立性越强,相关性越弱;数值越大,独立性越弱,相关性越强。所以您要是想把它叫做“事件相关性检验”,老黄看也行! 至于这个K^2是怎么来的,那就说来话长了,其实老黄也不知道。只是感觉分子中的ad表示“没有卫生习惯就犯病”和“有卫生习惯就不犯病”这两件事情给相关起来了,而bc则表示“有卫生习惯就犯病”和“没有卫生习惯就不犯病”这两件事情给相关起来了,这不扯犊子吗?因此用ad减去bc,想必很好理解了吧。 分母a+b表示犯病的病例组样本总数,c+d表示对照组不犯病的样本总数,a+c表示有卫生习惯的总数,b+d表示没有卫生习惯的总数。这明显就是没有卫生习惯的犯病相关性乘以有卫生习惯与不犯病的相关性,表示整个研究对象和研究事件总体的相关性。 这么一理解,就可以看出,分子比分母表示的是正相关在总相关性中所占的比例。再乘以两个样本的总量,就能得到事件的相关性了。 您看老黄扯得合不合理。虽然老黄是瞎扯的,不过老黄有很多知识,都是通过这么瞎扯来的。接下来,老黄只要在实践中慢慢检验自己的猜想,并与相关知识做比较,校正老黄的认知,就能把这个知识理解得比一般人深刻了。 其实老黄这里讲的是一种学习的方法,不知道您看出来了没有。 现在老黄要分析第(2)小题中的“R”到底是个什么玩意。 其中,P(B|A)表示不讲究卫生得病的概率;P(B逆|A)表示不讲究卫生不得病的概率。它们的比值,就是不讲究卫生的情况下,得病和不得病的概率比;P(B|A逆)则表示讲究卫生得病的概率;P(B逆|A逆)表示讲究卫生不得病的概率。它们的比表示讲究卫生的情况下,得病和不得病的概率比。两个概率比的商,化成积的形式,就变成了,“不讲究卫生的情况下,得病和不得病的概率比”与“讲究卫生的情况下,不得病和得病的概率比”的积。这是啥玩意? 我们假设一下,这两个概率比正好是互为倒数的,那么它们的积的结果正好等于1. 说明得不得病,和讲不讲究卫生,根本没有什么关系。但如果前者变大,就说明不讲究卫生得病的概率更高;后者变大,则表示讲究卫生不得病的概率更高。两个同时变大,就得到“不讲究卫生得病的概率变大;讲究卫生不得病的概率变大”的结论。即R越大,两者相关性越强。反之就扯蛋了。如果得到“不讲究卫生不得病的概率变大;讲究卫生得病的概率变大”,就不合理了。 最后来看(2)(I)中要证明相等的另一个表达式的含义,看看和上面分析的R的含义是否相同。 首先,P(A|B)表示生病的人不讲卫生的概率;P(A逆|B)表示生病的人讲卫生的概率。它们的比值,就是在生病的情况下,不讲卫生和讲卫生的概率比。另一方面,P(A逆|B逆)表示不生病的人讲卫生的概率;P(A|B逆)表示不生病的人不讲卫生的概率。它们的比值,就是在不生病的情况下,讲卫生还是不讲卫生的概率比。两个概率比的积是“生病的情况下,是不讲卫生还是讲卫生的概率比”与“不生病的情况下,是讲卫生还是不卫生的概率比”的积。这又是个啥玩意呢? 假如两个概率比正好互为倒数,那么它们的积的结果正好等于1. 说明讲不讲卫生,根本不会影响到生不生病的问题。但如果前者变大,就得到“生病的人不讲卫生的概率更大”;如果后者变大,就得到“不生病的人讲卫生的概率更大”。两个同时变大,就得到“生病的人不讲卫生概率变大;不生病的人讲卫生的概率变大”的结论。即R越大,两者相关性越强。反之就扯蛋了。如果得到“得病讲究卫生概率更大;不得病不讲究卫生概率更大”,就不合理了。 两相一比较,它们讲的不就是同一回事吗?所以第(2)小题的证明题得证。可见老黄也不是纯瞎扯的哦。 所以说,这道题想解决容易,想理解难,您怎么看呢? |
|
来自: 老黄的图书馆 > 《高考数学真题分析》