12独立性检验的基本思想及其应用54.docx
- 文档编号:7956899
- 上传时间:2023-01-27
- 格式:DOCX
- 页数:30
- 大小:106.63KB
12独立性检验的基本思想及其应用54.docx
《12独立性检验的基本思想及其应用54.docx》由会员分享,可在线阅读,更多相关《12独立性检验的基本思想及其应用54.docx(30页珍藏版)》请在冰豆网上搜索。
12独立性检验的基本思想及其应用54
※高二文科班数学课堂学习单54※
班级姓名小组
1.2独立性检验的基本思想及其应用54
一,学习目标:
1、理解独立性检验的基本思想及实施步骤。
2、了解随机变量K2的含义
二,自学导航:
p10-p15
问题一:
为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示,那么,50岁以上的人患慢性气管炎与吸烟有关系吗?
患慢性气管炎
未患慢性气管炎
总计
吸烟
43
162
205
不吸烟
13
134
总计
56
283
339
[自主解答] 2×2列联表中可知:
a=,b=,c=,d=,a+b=,
c+d=,a+c=,b+d=,n=,代入公式得K2的观测值
为k=≈.
由于>6.635,所以在犯错概率不超过的前提下认为50岁以上的人患慢性气管炎与吸烟有关系.
小结:
解决一般的独立性检验问题,首先由所给2×2列联表确定a,b,c,d,n的值,然后代入随机变量的计算公式求出观测值k,将k与临界值k0进行对比,确定有多大把握认为两个分类变量有关系.
3.独立性检验
定义
利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验
公式
K2=
,其中n=a+b+c+d
具体步骤
①认真读题,取出相关数据,作出2×2列联表;
②根据2×2列联表中的数据,计算K2的观测
③通过观测值k与临界值k0比较,得出事件有关的可能性大小
4,我生成的问题:
三,我的收获:
本节课的知识结构、学到的方法、易错点
四,课堂检测:
1.下面是2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
则表中a、b的值分别为,。
2.在2×2列联表中,数值
和
相差越大,则两个变量有关系的可能性就( )
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
A.越大B.越小C.无法判断D.以上均不对
3.考察棉花种子经过处理跟生病之间的关系得到如下表数据:
根据以上数据,则( )
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
A.没有充分的理由说明种子经过处理跟是否生病有关;B.种子经过处理跟是否生病有关
C.种子是否经过处理决定是否生病;D.以上都是错误的
解析:
由公式得K2的观测值为k=
≈0.164
4.若由一个2×2列联表中的数据计算得K2的观测值k≈4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.
5.某高校统计初步课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男生
13
10
女生
7
20
为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K2的观测值为
k=
≈4.844.
因k>3.841,故确认“主修统计专业与性别有关系”,判断出错的可能性为________.
6.如图是对用药与不用药,感冒已好与未好进行统计的等高条形图.若此次统计中,用药的患者是70人,不用药的患者是40人,试问:
能否在犯错误的概率不超过0.01的前提下认为“感冒已好与用药有关”?
解:
根据题中的等高条形图,由于用药的患者是70人,不用药的患者是40人,因此,在用药的患者中感冒已好的人数为 ;在不用药的患者中感冒已好的人数为 . 2×2列联表如下:
感冒已好
感冒未好
总计
用药
70
不用药
40
总计
68
42
110
根据2×2列联表中的数据,得到
k= ≈ > ,
所以在犯错误的概率不超过0.01的前提下认为“感冒已好与用药有关”.
五,作业
1.如果在犯错误的概率不超过0.05的前提下认为事件A和B有关,那么具体算出的数据满足( )
A.K2>3.841 B.K2<3.841C.K2>6.635D.K2<6.635
2.(湖南高考)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=
算得,K2=
≈7.8.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若K2=6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关,是指有1%的可能性使得推断出现错误
D.以上三种说法都不正确
4.下列关于等高条形图的叙述正确的是( )
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
5.班级与成绩2×2列联表:
表中数据m,n,p,q的值应分别为________.
优秀
不优秀
总计
甲班
10
35
45
乙班
7
38
p
总计
m
n
q
6.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
总计
男性患者
15
35
50
女性患者
6
44
50
总计
21
79
100
设H0:
服用此药的效果与患者性别无关,则K2的观测值k≈________,从而得出结论:
服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
7.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:
“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查对临界表知P(K2≥3.841)≈0.05,对此,四名同学作出以下的判断:
①有95%的把握认为:
“这种血清能起到预防感冒的作用”
②若某人未使用该血清,则一年内他有95%的可能得感冒
③这种血清预防感冒的有效率为95%
④这种血清预防感冒的有效率为5%.
其中正确的判断是________.
8.为了调查某生产线上某质量监督员甲在与不在对产品质量好坏有无影响,现统计数据如下:
质量监督员甲在现场时,990件产品中合格品982件,次品8件;甲不在现场时,510件产品中合格品493件,次品17件.试用列联表、独立性检验的方法对数据进行分析,并指出你所得出的结论在什么范围内有效.
解:
根据题目所给的数据作出如下的列联表:
产品正品数
次品数
总计
甲在现场
982
8
990
甲不在现场
493
17
510
总计
1475
25
1500
根据列联表中的数据,可得K2观测值为:
k=
= ≈ .
由于k= > ,所以在犯错误的概率不超过 的前提下,认为质量监督员甲在不在现场与产品质量有关系.但这个结论只对统计的这1500件产品有效.
10.下表是某地区的一种传染病与饮用水的调查表:
得病
不得病
总计
干净水
52
466
518
不干净水
94
218
312
总计
146
684
830
(1)这种传染病是否与饮用不干净水有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人,试按此样本数据分析这种疾病是否与饮用不干净水有关,并比较两种样本在反映总体时的差异.
解:
(1)由公式得K2的观测值为
k=
≈54.212.
因为54.212>10.828,
所以在犯错误的概率不超过0.001的前提下认为这种传染病与饮用不干净水有关.
(2)依题意得2×2列联表如下:
得病
不得病
总计
干净水
5
50
55
不干净水
9
22
31
总计
14
72
86
此时,K2的观测值k=
≈5.785.
由于5.785>5.024,
所以我们在犯错误的概率不超过0.025的前提下认为这种传染病与饮用不干净水有关.
两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但
(1)中我们在犯错误的概率不超过0.001的前提下肯定结论的正确性,
(2)中我们在犯错误的概率不超过0.025的前提下肯定结论的正确性.
1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:
积极支持企业改革
不太支持企业改革
总计
工作积极
54
40
94
工作一般
32
63
95
总计
86
103
189
根据列联表的独立性检验,能否在犯错误的概率不超过0.005的前提下认为工作态度与支持企业改革之间有关系?
解:
由列联表中的数据,得K2的观测值为
k=
≈10.759>7.879,
∴在犯错误的概率不超过0.005的前提下,认为工作态度与支持企业改革之间有关系.
考点二
有关“无关”的检验
为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:
理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?
[自主解答] 根据题目所给的数据得到如下列联表:
理科
文科
总计
有兴趣
138
73
211
无兴趣
98
52
150
总计
236
125
361
根据列联表中数据由公式计算得K2的观测值为
k=
≈1.871×10-4.
因为1.871×10-4<2.706,所以据目前的数据不能认为学生选报文、理科与对外语的兴趣有关,即可以认为学生选报文、理科与对外语的兴趣无关.
—————
—————————————
(1)给出的随机变量K2的值k,其值越大,说明“X与Y有关系”成立的可能性越大,其值越小,说明“X与Y有关系”成立的可能性越小.
(2)若k≤2.076,则认为没有充分的证据显示两个分类变量有关系.
2.在从烟台——大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如表所示:
晕船
不晕船
总计
男人
32
51
83
女人
8
24
32
总计
40
75
115
据此资料,你是否认为在恶劣气候中航行,男人比女人更容易晕船?
解:
由公式得K2的观测值为k=
≈1.870.
因为1.870<2.706,所以我们没有理由说晕船跟性别有关.
考点三
独立性检验的综合应用
为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:
mm2)
表1:
注射药物A后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
频数
30
40
20
10
表2:
注射药物B后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
频数
10
25
20
30
15
完成下面2×2列联表(表3),并回答能否在犯错误的概率不超过0.001的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3:
疱疹面积小于70mm2
疱疹面积不小于70mm2
总计
注射药物A
注射药物B
总计
[自主解答]
疱疹面积小于70mm2
疱疹面积不小于70mm2
总计
注射药物A
70
30
100
注射药物B
35
65
100
总计
105
95
200
由列联表中的数据,得K2的观测值为
k=
≈24.56>10.828.
因此,能在犯错误的概率不超过0.001的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
—————
—————————————
在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中各行、各列中数据的意义及书写格式.
3.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:
mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
分组
频数
[29.86,29.90)
12
[29.90,29.94)
63
[29.94,29.98)
86
[29.98,30.02)
182
[30.02,30.06)
92
[30.06,30.10)
61
[30.10,30.14)
4
乙厂:
分组
频数
[29.86,29.90)
29
[29.90,29.94)
71
[29.94,29.98)
85
[29.98,30.02)
159
[30.02,30.06)
76
[30.06,30.10)
62
[30.10,30.14)
18
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据建立2×2列联表,并回答是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
甲厂
乙厂
总计
优质品
非优质品
总计
解:
(1)甲厂抽查的产品中有86+182+92=360件优质品,从而甲厂生产的零件的优质品率估计为
=72%;
乙厂抽查的产品中有85+159+76=320件优质品,从而乙厂生产的零件的优质品率估计为
=64%.
(2)由已知表中数据,可得下列2×2列联表:
甲厂
乙厂
总计
优质品
360
320
680
非优质品
140
180
320
总计
500
500
1000
由列联表的数据可得K2的观测值
k=
≈7.35>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
【解题高手】【易错题】
调查者通过询问男女大学生在购买食品时是否看营养说明得到的数据如下表所示.请估计看营养说明是否与性别有关系?
看营养说明
不看营养说明
总计
男大学生
10
45
55
女大学生
8
27
35
总计
18
72
90
[错解] 由表中数据可知,55名男大学生中有10名看营养说明,而35名女大学生中有8名看营养说明,显然男性看营养说明的比例
比女性的
要低,因此看营养说明与性别有关.
[错因] 上述解法只能说明看营养说明与性别有关成立的可能性比较大,但并不能肯定的说二者有关,若判定看营养说明是否与性别有关需进行独立性检验.
[正解] 由表中数据得K2的观测值为:
k=
≈0.292<0.455,
所以我们没有充分的证据认为看营养说明与男女性别有关.
1.2独立性检验的基本思想及其初步应用
1.分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:
列出的两个分类变量的频数表,称为列联表.
②2×2列联表:
一般地,假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
2.等高条形图
(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.
(2)观察等高条形图发现
和
相差很大,就判断两个分类变量之间有关系.
1.分类变量中的“变量”和“值”与函数中的变量和值有什么不同?
提示:
分类变量中所说的“变量”和“值”不一定取具体的数值.例如:
对于性别变量,取值有男和女两种情况,那么这里的变量指的是性别,同样这里的值是“男”或“女”.在现实生活中,分类变量是大量存在的.
2.利用K2进行独立性检验,估计值的准确度与样本容量有关吗?
提示:
利用K2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用K2进行独立性检验的结果就不具有可靠性.
3.在K2运算后,得到K2的值为29.78,在判断变量相关时,P(K2≥6.635)≈0.01和P(K2≥7.879)≈0.005,哪种说法是正确的?
提示:
两种说法均正确.P(K2≥6.635)≈0.01的含义是在犯错的概率不超过0.01的前提下认为两个变量相关;而P(K2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两变量相关.
※高二文科班数学课堂学习单54※
班级姓名小组
1.2独立性检验的基本思想及其应用54
一,学习目标:
2、理解独立性检验的基本思想及实施步骤。
2、了解随机变量K2的含义
二,自学导航:
p10-p15
问题一:
为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:
患慢性气管炎
未患慢性气管炎
总计
吸烟
43
162
205
不吸烟
13
121
134
总计
56
283
339
50岁以上的人患慢性气管炎与吸烟有关系吗?
[自主解答] 2×2列联表中可知:
a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,b+d=283,n=a+b+c+d=339,代入公式得K2的观测值为
k=
≈7.469.
由于7.469>6.635,所以在犯错概率不超过1%的前提下认为50岁以上的人患慢性气管炎与吸烟有关系.
小结:
解决一般的独立性检验问题,首先由所给2×2列联表确定a,b,c,d,n的值,然后代入随机变量的计算公式求出观测值k,将k与临界值k0进行对比,确定有多大把握认为两个分类变量有关系.
3.独立性检验
定义
利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验
公式
K2=
,其中n=a+b+c+d
具体步骤
①认真读题,取出相关数据,作出2×2列联表;
②根据2×2列联表中的数据,计算K2的观测
③通过观测值k与临界值k0比较,得出事件有关的可能性大小
4,我生成的问题:
三,我的收获:
本节课的知识结构、学到的方法、易错点
四,课堂检测:
1.下面是2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
则表中a、b的值分别为( )
A.94、96 B.52、50C.52、54D.54、52
解析:
∵a+21=73,∴a=52.又∵a+2=b,∴b=54.
答案:
C
2.在2×2列联表中
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
数值
和
相差越大,则两个变量有关系的可能性就( )
A.越大B.越小C.无法判断D.以上均不对
答案:
A
3.考察棉花种子经过处理跟生病之间的关系得到如下表数据:
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
根据以上数据,则( )
A.没有充分的理由说明种子经过处理跟是否生病有关
B.种子经过处理跟是否生病有关
C.种子是否经过处理决定是否生病
D.以上都是错误的
解析:
由公式得K2的观测值为
k=
≈0.164<0.455.
答案:
A
4.若由一个2×2列联表中的数据计算得K2的观测值k≈4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.
解析:
因为4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.
答案:
0.05
5.某高校统计初步课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男生
13
10
女生
7
20
为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K2的观测值为
k=
≈4.844.
因为k>3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.
解析:
因为随机变量K2的观测值k>3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.
答案:
5%
6.如图是对用药与不用药,感冒已好与未好进行统计的等高条形图.若此次统计中,用药的患者是70人,不用药的患者是40人,试问:
能否在犯错误的概率不超过0.01的前提下认为“感冒已好与用药有关”?
解:
根据题中的等高条形图,由于用药的患者是70人,不用药的患者是40人,因此,在用药的患者中感冒已好的人数为70×
=56;在不用药的患者中感冒已好的人数为40×
=12.
2×2列联表如下:
感冒已好
感冒未好
总计
用药
56
14
70
不用药
12
28
40
总计
68
42
110
根据2×2列联表中的数据,得到
k=
≈26.96>
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 12 独立性 检验 基本 思想 及其 应用 54