第3章 31 独立性检验Word文档格式.docx
- 文档编号:13218863
- 上传时间:2022-10-08
- 格式:DOCX
- 页数:12
- 大小:112.45KB
第3章 31 独立性检验Word文档格式.docx
《第3章 31 独立性检验Word文档格式.docx》由会员分享,可在线阅读,更多相关《第3章 31 独立性检验Word文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
a+b+c+d
形如上表的表格称为2×
2列联表,2×
2列联表经常用来判断Ⅰ和Ⅱ之间是否有关系.
下面是一个2×
2列联表:
y1
y2
x1
21
73
x2
8
25
33
46
则表中a,b处的值分别为________.
【解析】 ∵a+21=73,∴a=52.
又b=a+8=52+8=60.
【答案】 52,60
教材整理2 独立性检验
阅读教材P93~P94“例1”以上部分完成下列各题.
1.独立性检验
2×
2列联表中的数据是样本数据,它只是总体的代表,具有随机性,结果并不唯一.因此,由某个样本得到的推断有可能正确,也有可能错误.为了使不同样本量的数据有统一的评判标准,统计学中引入下面的量(称为卡方统计量):
χ2=
(*),
其中n=a+b+c+d为样本容量.
用
统计量研究这类问题的方法称为独立性检验(testofindependence).
2.独立性检验的基本步骤
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0:
Ⅰ与Ⅱ没有关系;
(2)根据2×
2列联表与公式(*)计算χ2的值;
(3)查对临界值(如下表),作出判断.
P(χ2≥x0)
0.50
0.40
0.25
0.15
0.10
x0
0.455
0.708
1.323
2.072
2.706
0.05
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
1.关于分类变量x与y的随机变量χ2的观测值k,下列说法正确的是________.(填序号)
(1)k的值越大,“X和Y有关系”可信程度越小;
(2)k的值越小,“X和Y有关系”可信程度越小;
(3)k的值越接近于0,“X和Y无关”程度越小;
(4)k的值越大,“X和Y无关”程度越大.
【解析】 k的值越大,X和Y有关系的可能性就越大,也就意味着X和Y无关系的可能性就越小.
【答案】
(2)
2.式子|ad-bc|越大,χ2的值就越________.(填“大”或“小”)
【解析】 由χ2的表达式知|ad-bc|越大,(ad-bc)2就越大,χ2就越大.
【答案】 大
[质疑·
手记]
预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:
疑问1:
解惑:
疑问2:
疑问3:
[小组合作型]
绘制2×
2列联表
在一项有关医疗保健的社会调查中,调查的男性为530人,女性为670人,发现其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
【精彩点拨】 分成两类,找出不同类情况下的两个数据再列表.
【自主解答】 作2×
2列联表如下:
喜欢甜食
不喜欢甜食
男
117
413
530
女
492
178
670
609
591
1200
1.分清类别是作列联表的关键.
2.表中排成两行两列的数据是调查得来的结果.
3.选取数据时,要求表中的四个数据a,b,c,d都要不小于5,以保证检验结果的可信度.
[再练一题]
1.某电视公司为了研究体育迷是否与性别有关,在调查的100人中,体育迷75人,其中女生30人,非体育迷25人,其中男生15人,请作出性别与体育迷的列联表.
【解】
体育迷
非体育迷
45
15
60
30
10
40
75
100
利用χ2值进行独立性检验
某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:
阳性例数
阴性例数
新防护服
5
70
旧防护服
18
28
88
103
问这种新防护服对预防工人患职业性皮肤炎是否有效?
并说明你的理由.
【精彩点拨】 通过有关数据的计算,作出相应的判断.
【自主解答】 提出假设H0:
新防护服对预防皮肤炎没有明显效果.
根据列联表中的数据可求得
≈13.826.
因为H0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈13.826>
10.828,所以我们有99.9%的把握说新防护服比旧防护服对预防工人患职业性皮肤炎有效.
根据2×
2列联表,利用公式
计算χ2的值,再与临界值比较,作出判断.
2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;
而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.根据以上数据判断男性病人的秃顶与患心脏病是否有关系?
【解】 提出假设H0:
男性病人的秃顶与患心脏病没有关系.
根据题中所给数据得到如下2×
患心脏病
未患心脏病
秃顶
214
175
389
不秃顶
451
597
1048
665
772
1437
根据列联表中的数据可以求得
≈16.373.
因为当H0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈16.373>
10.828,所以有99.9%的把握认为,男性病人的秃顶与患心脏病有关系.
[探究共研型]
独立性检验的综合应用
探究1 利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?
【提示】 利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.
探究2 在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪种说法是正确的?
【提示】 两种说法均正确.P(χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;
而P(χ2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.
为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:
甲在生产现场时,990件产品中有合格品982件,次品8件;
甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?
【精彩点拨】 解答本题可先列出2×
2列联表,然后具体分析.
【自主解答】
(1)2×
合格品数
次品数
甲在生产现场
982
990
甲不在生产现场
493
17
510
1475
1500
由列联表可得|ad-bc|=|982×
17-493×
8|=12750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
(2)由2×
2列联表中数据,计算得到χ2的观测值为
≈13.097>
10.828,
因此在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关.
判断两个变量是否有关的三种方法
3.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:
出生时间在晚上的男婴为24人,女婴为8人;
出生时间在白天的男婴为31人,女婴为26人.
(1)将下面的2×
2列联表补充完整;
晚上
白天
男婴
女婴
(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?
【解】
(1)
24
31
55
26
34
32
57
89
(2)由所给数据计算χ2的观测值
≈3.689>
2.706.
根据临界值表知P(χ2≥2.706)≈0.10.
因此在犯错误的概率不超过0.10的前提下认为婴儿的性别与出生时间有关系.
[构建·
体系]
1.在2×
2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的________倍.
【解析】 由公式χ2=
中所有值变为原来的2倍,
得(χ2)′=
=2χ2,
故χ2也变为原来的2倍.
【答案】 2
2.下列说法正确的是________.(填序号)
①对事件A与B的检验无关,即两个事件互不影响;
②事件A与B关系越密切,χ2就越大;
③χ2的大小是判断事件A与B是否相关的唯一数据;
④若判定两事件A与B有关,则A发生B一定发生.
【解析】 对于①,事件A与B的检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故①错.②是正确的.对于③,判断A与B是否相关的方式很多,可以用列联表,也可以借助于概率运算,故③错.对于④,两事件A与B有关,说明两者同时发生的可能性相对来说较大,但并不是A发生B一定发生,故④错.
【答案】 ②
3.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×
理科
文科
13
23
7
20
27
50
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025,根据表中数据得到χ2=
≈4.844.
则有__________的把握认为选修文科与性别有关.
【答案】 95%
4.在2×
2列联表中,两个比值
与________相差越大,两个分类变量有关系的可能性越大.【导学号:
29440066】
【解析】 根据2×
2列联表可知,比值
与
相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.
【答案】
5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品
不喜欢甜品
南方学生
80
北方学生
根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
【解】 将2×
2列联表中的数据代入公式计算,得
=
≈4.762.
因为4.7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 31 独立性检验 独立性 检验