1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx
- 文档编号:5608584
- 上传时间:2022-12-29
- 格式:DOCX
- 页数:11
- 大小:90.67KB
1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx
《1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx》由会员分享,可在线阅读,更多相关《1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx(11页珍藏版)》请在冰豆网上搜索。
1920第1章222独立性检验23独立性检验的基本思想24独立性检验的应用
2.2 独立性检验
2.3 独立性检验的基本思想
2.4 独立性检验的应用
学习目标
核心素养
1.了解独立性检验的基本思想方法.(重点)
2.了解独立性检验的初步应用.(难点)
1.借助了解独立性检验的思想,提升学生数学抽象的核心素养.
2.通过独立性检验的分析应用,培养学生数据分析的核心素养.
1.独立性检验
设A,B为两个变量,每一个变量都可以取两个值,变量A:
A1,A2=
1;变量B:
B1,B2=
1,有下面2×2列联表:
A
B
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
n=a+b+c+d
其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.
2.独立性检验的基本思想
在2×2列联表中,令χ2=
,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:
(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;
(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;
(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;
(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.
1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差 B.回归分析
C.独立性检验D.概率
C [判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.]
2.在2×2列联表中,两个比值
与________相差越大,两个分类变量有关系的可能性越大.
[根据2×2列联表可知,比值
与
相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.]
3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关:
________(填“是”或“否”).
是 [因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即
=
,
=
,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.]
2×2列联表
【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用
与
判断二者是否有关系.
思路点拨:
→
→
→
[解] 2×2列联表如下:
年龄在六十岁以上
年龄在六十岁以下
总计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
总计
70
54
124
将表中数据代入公式得
=
=0.671875.
=
=0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
利用2×2列联表的关键及注意事项
1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.
2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将
与
的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
1.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
[解] 作列联表如下:
喜欢甜食情况
性别
喜欢甜食
不喜欢甜食
总计
男
117
413
530
女
492
178
670
总计
609
591
1200
独立性检验
【例2】 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:
能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.
未感冒
感冒
总计
使用血清
258
242
500
未使用血清
216
284
500
总计
474
526
1000
思路点拨:
独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.
[解] 假设感冒与是否使用该种血清没有关系.
由列联表中的数据,求得χ2的值为
χ2=
≈7.075.
χ2≈7.075>6.635,
查表得P(χ2>6.635)=0.01,
故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.
独立性检验的一般步骤
1.根据样本数据列2×2列联表.
2.计算χ2=
的值.
3.将χ2的值与临界值进行比较,若χ2大于临界值,则认为X与Y有关,否则没有充分的理由说明这个假设不成立.
2.“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:
本地
外地
总计
去年
1407
2842
4249
今年
1331
2065
3396
总计
2738
4907
7645
能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?
[解] 按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.
因为χ2=
≈30.35>6.635.
所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系.
独立性检验的综合应用
[探究问题]
1.当χ2>3.841时,我们有多大的把握认为事件A与B有关?
[提示] 由临界值表可知当χ2>3.841时,我们有95%的把握认为事件A与B有关.
2.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.我们是否可以判定100个心脏病患者中一定有打鼾的人?
[提示] 这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有.
【例3】 为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为
.是否有充足的证据说明,学生对创建工作的满意情况与性别有关?
思路点拨:
解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出2×2列联表,最后根据2×2列联表计算χ2,并进行判断.
[解] 由题意得2×2列联表如下:
满意
不满意
总计
男生
50
5
55
女生
30
15
45
总计
80
20
100
χ2=
≈9.091>6.635,
所以我们有99%的把握认为学生对创建工作的满意情况与性别有关.
独立性检验应用时的关键要点
1.解决此类问题的关键是正确列出2×2列联表,并代入公式求出χ2的值,然后判断得出结论,由于数据较多,在计算上容易出错应引起注意.
2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握说事件A与B有关,则推断结论为错误的可能性仅为5%(或1%).
3.有两个变量x与y,其一组观测值如下2×2列联表所示:
y
x
y1
y2
x1
a
20-a
x2
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,有95%的把握认为x与y之间有关系?
[解] 由题意χ2=
=
=
.
∵有95%的把握认为x与y之间有关系,
∴χ2>3.841,
∴
>3.841,a>7.7或a<1.5.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 1920 第1章 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用 独立性 检验 基本 思想 应用