分享

2024年高考数学一轮复习(新高考版) 第9章 §9-4 列联表与独立性检验

 中小学知识学堂 2023-06-29 发布于云南

§9.4 列联表与独立性检验

考试要求 1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用.

知识梳理

1.分类变量

为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.

2.列联表与独立性检验

(1)关于分类变量XY的抽样数据的2×2列联表:

X

Y

合计

Y0

Y1

X0

a

b

ab

X1

c

d

cd

合计

ac

bd

nabcd

(2)计算随机变量χ2=,利用χ2的取值推断分类变量XY是否独立的方法称为χ2独立性检验.

如表为5个常用的小概率值和相应的临界值.

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

思考辨析

判断下列结论是否正确(请在括号中打“√”或“×”)

(1)2×2列联表中的数据是两个分类变量的频数.(  )

(2)事件AB的独立性检验无关,即两个事件互不影响.( × )

(3)χ2的大小是判断事件AB是否相关的统计量.(  )

(4)2×2列联表中,若|adbc|越小,则说明两个分类变量之间关系越强.( × )

教材改编题

1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是(  )

A.均值                                          B.方差

C.独立性检验                                D.回归分析

答案 C

解析 由题意可知,爱玩网游性别是两类变量,其是否有关,应用独立性检验判断.

2.如表是2×2列联表,则表中ab的值分别为(  )

y1

y2

合计

x1

a

8

35

x2

11

34

45

合计

b

42

80

A.27,38                                            B28,38

C27,37                                          D28,37

答案 A

解析 a35827ba11271138.

3.已知P(χ26.635)0.01P(χ210.828)0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ27.235,则根据小概率值α________χ2独立性检验,分析喜欢该项体育运动与性别有关.

答案 0.01

解析 因为6.635<7.235<10.828,所以根据小概率值α0.01χ2独立性检验,分析喜欢该项体育运动与性别有关.

题型一 列联表与χ2的计算

1 (1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:

合计

喜欢

a

b

73

不喜欢

c

25

合计

74

abc等于(  )

A7  B8  C9  D10

答案 C

解析 根据题意,可得c120732522a742252b735221

补充完整2×2列联表为:

合计

喜欢

52

21

73

不喜欢

22

25

47

合计

74

46

120

abc5221229.

(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如表:

体育课不及格

体育课及格

合计

文化课及格

57

221

278

文化课不及格

16

43

59

合计

73

264

337

在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到χ2的值为(  )

A1.255                                         B38.214

C0.003 7                                       D2.058

答案 A

解析 χ2

1.255.

思维升华 2×2列联表是44列,计算时要准确无误,关键是对涉及的变量分清类别.

跟踪训练1 某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中,abd________.

会外语

不会外语

合计

a

b

20

6

d

合计

18

50

答案 44

解析 由题意得abd650

所以abd50644.

题型二 列联表与独立性检验

2 (2022·全国甲卷改编)甲、乙两城之间的长途客车均由AB两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数

未准点班次数

A

240

20

B

210

30

(1)根据上表,分别估计这两家公司在甲、乙两城之间长途客车准点的概率;

(2)能否根据小概率值α0.1的独立性检验,分析甲、乙两城之间的长途客车是否准点与客车所属公司有关?

附:χ2nabcd.

α

0.1

0.05

0.01

xα

2.706

3.841

6.635

解 (1)根据表中数据,A家公司共有班次260个,准点班次有240个,

A家公司长途客车准点事件为M

P(M)

B家公司共有班次240个,准点班次有210个,

B家公司长途客车准点事件为N

P(N).

所以A家公司长途客车准点的概率为

B家公司长途客车准点的概率为.

(2)列联表如下:

准点班次数

未准点班次数

合计

A

240

20

260

B

210

30

240

合计

450

50

500

零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关.

χ2

3.205>2.706x0.1

根据小概率值α0.1的独立性检验,推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.

思维升华 独立性检验的一般步骤

(1)根据样本数据制成2×2列联表.

(2)根据公式χ2计算.

(3)比较χ2与临界值的大小关系,作统计推断.

跟踪训练2 为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从AB两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:

单位:人

年龄段

认知情况

合计

知晓

不知晓

A(90后与00)

75

25

100

B(70后与80)

45

55

100

合计

120

80

200

附:χ2nabcd.

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问应在A组、B组中各抽取多少人?

(2)能否依据小概率值α0.001的独立性检验,分析对绿色消费意义的认知情况与年龄有关?

解 (1)由题意知,在A组中抽取的人数为16×10.B组中抽取的人数为16×6.

(2)零假设为H0:对绿色消费意义的认知情况与年龄无关.

由题意,得χ218.75>10.828x0.001

故依据小概率值α0.001的独立性检验,推断H0不成立,即认为对绿色消费意义的认知情况与年龄有关.

题型三 独立性检验的综合应用

3 体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(20202030)(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1 000名学生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,得到如表数据:

数学成绩()

[3050)

[5070)

[7090)

[90110)

[110130)

[130150]

人数()

25

125

350

300

150

50

运动达标

的人数()

10

45

145

200

107

43

约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前50%以内(50%)的为“数学成绩达标”.

(1)求该中学高三年级本次月考数学成绩的65%分位数;

(2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值作代表)

(3)请根据已知数据完成下列列联表,并根据小概率值α0.001的独立性检验,分析“数学成绩达标”是否与“运动达标”相关.

数学成绩达标人数

数学成绩不达标人数

合计

运动达标人数

运动不达标人数

合计

附:χ2(nabcd)

α

0.010

0.005

0.001

xα

6.635

7.879

10.828

解 (1)每组的频率依次为0.025,0.125,0.350,0.300,0.150,0.050

0.0250.1250.3500.500<0.65,0.0250.1250.3500.3000.800>0.65

0.65

高三年级本次月考数学成绩的65%分位数位于[90,110)内,且为[90,110)的中点100

该中学高三年级本次月考数学成绩的65%分位数为100.

(2)该中学高三年级本次月考数学成绩的平均分

0.025×400.125×600.350×800.300×1000.150×1200.050×14091.50

估计该中学高三年级本次月考数学成绩的平均分为91.50分.

(3)列联表如表所示:

数学成绩达标人数

数学成绩不达标人数

合计

运动达标人数

350

200

550

运动不达标人数

150

300

450

合计

500

500

1 000

零假设为H0数学成绩达标运动达标无关,

χ290.9>10.828x0.001

根据小概率值α0.001的独立性检验,推断H0不成立,即认为数学成绩达标运动达标有关.

思维升华 独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往用小题的形式,而且χ2的公式一般会在原题中给出.

跟踪训练3 某网红奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.

x()

2

3

4

5

6

y(十万元)

2.5

3

4

4.5

6

(1)该公司经过初步判断,可用经验回归模型拟合yx的关系,求y关于x的经验回归方程;

(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值α0.1的独立性检验,分析两个店的顾客下单率有无差异.

参考公式:χ2x0.12.706.

解 (1)由题意可得,4

4

iyi2×2.53×34×45×4.56×688.5

223242526290

y关于x的经验回归方程为x

0.85

40.85×40.6

y关于x的经验回归方程为0.85x0.6.

(2)零假设为H0:两个店的顾客下单率无差异,则

由题意可知2×2列联表如表所示:

不下单

下单

合计

分店一

25

5

30

分店二

60

20

80

合计

85

25

110

χ20.863<2.706x0.1

根据小概率值α0.1的独立性检验,没有充分证据推断H0不成立,即两个店的顾客下单率没有差异.

课时精练

1.观察下列各图,其中两个分类变量xy之间关系最强的是(  )

答案 D

解析 观察等高堆积条形图易知D选项两个分类变量之间关系最强.

2.下列关于独立性检验的说法正确的是(  )

A.独立性检验是对两个变量是否具有线性相关关系的一种检验

B.独立性检验可以100%确定两个变量之间是否具有某种关系

C.利用χ2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病

D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误的概率越大

答案 D

解析 对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,

并非检验二者是否是线性相关,故错误;

对于B,独立性检验并不能100%确定两个变量相关,故错误;

对于C,99%是指抽烟患肺病存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;

对于D,根据卡方计算的定义可知该选项正确.

3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:

药物

流感

患流感

未患流感

服用

2

18

未服用

8

12

下表是χ2独立性检验中几个常用的小概率值和相应的临界值:

α

0.1

0.05

0.01

0.005

xα

2.706

3.841

6.635

7.879

根据表中数据,计算χ2=,若由此认为“该药物预防流感有效果”,则该结论出错的概率不超过(  )

A0.05  B0.1  C0.01  D0.005

答案 A

解析 由题意知,χ24.8>3.841x0.05

由临界值表可知,认为该药物预防流感有效果,则该结论出错的概率不超过0.05.

4(多选)(2022·郑州模拟)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的2×2列联表中,由列联表中的数据计算得χ29.616.参照附表,下列结论正确的是(  )

附表:

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

A.根据小概率值α0.001的独立性检验,分析认为“药物有效”

B.根据小概率值α0.001的独立性检验,分析认为“药物无效”

C.根据小概率值α0.005的独立性检验,分析认为“药物有效”

D.根据小概率值α0.005的独立性检验,分析认为“药物无效”

答案 BC

解析 因为χ29.616,所以7.879<χ2<10.828,所以根据小概率值α0.001的独立性检验,分析认为药物无效”.

根据小概率值α0.005的独立性检验,分析认为药物有效”.

5(多选)(2023·南通模拟)根据分类变量xy的观察数据,计算得到χ22.974,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是(  )

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

A.根据小概率值α0.05的独立性检验,分析变量xy相互独立

B.根据小概率值α0.05的独立性检验,分析变量xy不相互独立

C.变量xy相互独立,这个结论犯错误的概率不超过0.1

D.变量xy不相互独立,这个结论犯错误的概率不超过0.1

答案 AD

解析 因为χ22.974>2.706,所以变量xy不相互独立,这个结论犯错误的概率不超过0.1.

6.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是(  )

营养品

身高

合计

有明显增长

无明显增长

食用

a

10

50

未食用

b

30

50

合计

60

40

100

参考公式:χ2,其中nabcd.

参考数据:

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

A.ab30

Bχ212.667

C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是

D.根据小概率值α0.001的独立性检验,可以认为该营养品对儿童身高增长有影响

答案 D

解析 由题可知a501040b503020,所以A错误;

χ216.667 >10.828x0.001

所以根据小概率值α0.001的独立性检验,

可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;

从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是,所以C错误.

7.如表是对于“喜欢运动”与性别是否有关的2×2列联表,依据表中的数据,得到χ2________(结果保留到小数点后3)

喜欢运动

不喜欢运动

合计

40

28

68

5

12

17

合计

45

40

85

答案 4.722

解析 χ24.722.

8.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:

注意力稳定

注意力不稳定

男生

29

7

女生

33

5

χ2________(精确到小数点后三位),依据概率值α0.05的独立性检验,该实验________该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持)

答案 0.538 支持

解析 由表中数据可知a29b7c33d5nabcd74

根据χ2

计算可知χ20.538<3.841x0.05

所以没有充分证据认为学生在注意力的稳定性上与性别有关,

即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.

9(2021·全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:

一级品

二级品

合计

甲机床

150

50

200

乙机床

120

80

200

合计

270

130

400

(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)依据小概率值α0.01的独立性检验能否认为甲机床的产品质量与乙机床的产品质量有差异?

附:χ2nabcd.

α

0.05

0.01

0.001

xα

3.841

6.635

10.828

解 (1)根据题表中数据知,甲机床生产的产品中一级品的频率是0.75,乙机床生产的产品中一级品的频率是0.6.

(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异,

根据题表中的数据可得

χ2

10.256>6.635x0.01

所以依据小概率值α0.01的独立性检验,推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.

10.某花圃为提高某品种花苗质量,开展技术创新活动,AB在实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80 及以上的花苗为优质花苗.

(1)求图中a的值,并求综合评分的中位数;

(2)填写下面的2×2列联表,并根据小概率值α0.01的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.

优质花苗

非优质花苗

合计

甲培育法

20

乙培育法

10

合计

附:χ2,其中nabcd.

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

解 (1)由直方图的性质可知,0.005×100.010×100.025×1010a0.020×101

解得a0.040

因为(0.020.04)×100.6>0.5,所以中位数位于[80,90)内,

设中位数为x,则有0.020×100.040×(90x)0.5,解得x82.5.

故综合评分的中位数为82.5.

(2)(1)得优质花苗的频率为0.6

所以样本中优质花苗的数量为60

得如下列联表:

优质花苗

非优质花苗

合计

甲培育法

20

30

50

乙培育法

40

10

50

合计

60

40

100

零假设为H0:优质花苗与培育方法无关,

χ216.667>6.635x0.01

所以根据小概率值α0.01的独立性检验,推断H0不成立,即认为优质花苗与培育方法有关.

11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失)

被某病毒感染

未被某病毒感染

合计

注射疫苗

10

50

未注射疫苗

30

50

合计

30

100

计算可知,根据小概率值α________的独立性检验,分析 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”(  )

附:χ2nabcd.

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

A.0.001                                            B0.05

C0.01                                           D0.005

答案 B

解析 完善2×2列联表如下:

被某病毒感染

未被某病毒感染

合计

注射疫苗

10

40

50

未注射疫苗

20

30

50

合计

30

70

100

零假设为H0给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.

因为χ24.7623.841<4.762<6.635

所以根据小概率值α0.05的独立性检验,推断H0不成立,

即认为给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.

12(多选)有两个分类变量XY,其列联表如表所示.

X

Y

合计

Y1

Y2

X1

a

20a

20

X2

15a

30a

45

合计

15

50

65

其中a,15a均为大于5的整数,若依据α0.05的独立性检验可以认为XY有关,则a的可能取值为(  )

A6  B7  C8  D9

答案 CD

解析 根据a>515a>5aZ,知a可取6,7,8,9.由表中数据及题意,得

χ23.841x0.05,结合选项,知a的可能取值为8,9.

13(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则(  )

性别

晕机

合计

晕机者

未晕机者

a

15

c

6

b

d

合计

e

28

46

A.<

Bχ2<2.706

C.依据小概率值α0.1的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别有关

D.依据小概率值α0.1的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别无关

答案 BD

解析 由题中列联表数据,知

解得

所以得到如下列联表:

性别

晕机

合计

晕机者

未晕机者

12

15

27

6

13

19

合计

18

28

46

所以>,即A错误;

零假设为H0:在恶劣天气的飞行航程中,是否晕机与性别无关,

由列联表中的数据,得χ20.775<2.706x0.1

依据小概率值α0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,

即在恶劣天气的飞行航程中,是否晕机与性别无关,所以BD正确,C错误.

14.为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:

药物

疾病

合计

未患病

患病

服用

a

50a

50

未服用

80a

a30

50

合计

80

20

100

若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为________(其中a40aN*)(参考数据:2.583.29)

附:χ2nabcd.

α

0.1

0.05

0.01

0.005

0.001

xα

2.706

3.841

6.635

7.879

10.828

答案 46

解析 由题意可得χ26.635

整理得(100a4 000)2502×42×6.635

所以100a4 000200×≈200×2.58516100a4 000200×≈200

×2.58=-516

解得a45.16a34.84

又因为a40aN*

所以a46

所以a的最小值为46.

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多