教学设计《 数学人教A版高中选修23第三章 统计案例3.docx
- 文档编号:3696421
- 上传时间:2022-11-24
- 格式:DOCX
- 页数:46
- 大小:117.35KB
教学设计《 数学人教A版高中选修23第三章 统计案例3.docx
《教学设计《 数学人教A版高中选修23第三章 统计案例3.docx》由会员分享,可在线阅读,更多相关《教学设计《 数学人教A版高中选修23第三章 统计案例3.docx(46页珍藏版)》请在冰豆网上搜索。
教学设计《数学人教A版高中选修23第三章统计案例3
《独立性检验的基本思想及其初步应用》
本节课是人教A版(选修)2—3第三章第二单元第二课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。
本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。
在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。
在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。
独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。
因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。
学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。
这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。
【知识与能力目标】
通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。
【过程与方法目标】
通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。
利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。
这一直觉来自于观测数据,即样本。
问题是这种来自于样本的印象能够在多大程度上代表总体。
这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。
【情感态度价值观目标】
通过本节课的学习,加强数学与现实生活的联系。
以科学的态度评价两个分类变量有关系的可能性。
培养学生运用所学知识,解决实际问题的能力。
教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。
【教学重点】
理解独立性检验的基本思想及实施步骤。
【教学难点】
1了解独立性检验的基本思想;②了解随机变量K2的含义,K2的观测值很大,就认为两个分类变量是有关系的。
预习任务:
任务1,任务2;预习自测
(一)课前设计
1.预习任务
任务1
阅读教材P10-P12,思考什么是分类变量,列联表如何画?
阅读教材P12-P14,思考独立性检验与反证法有何区别?
阅读教材P10-P15,回顾本节主要知识点有哪些?
任务2
有哪些方法可以直观判断两个分类变量是否有关系?
独立性检验的基本思想是什么?
利用独立性检验判断两个分类变量相关关系的一般步骤是什么?
2.预习自测
1.下列不是分类变量的是 ( )
A.近视 B.身高 C.血压 D.药物反应
解:
B.判断一个量是否是分类变量,只需看变量的不同值是否表示个体的不同类别,A,C,D选项的不同值都可以表示个体的不同类别,只有B选项的不同值不表示个体的不同类别.
2.下面是一个列联表
不健康
健 康
总计
不优秀
a
21
73
优 秀
2
25
27
总 计
b
46
100
则表中a,b的之分别是()
A.94,96B.52,50C.52,54D.54,52
解:
C
3.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们( )
A.在犯错误的概率不超过0.05的前提下可认为A与B有关
B.在犯错误的概率不超过0.05的前提下可认为A与B无关
C.在犯错误的概率不超过0.01的前提下可认为A与B有关
D.没有充分理由说明事件A与B有关系
解:
A
4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
计算得到的观测值约为7.822.下列说法正确的是()
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
解:
C由随机变量的值,查表知,有以上的把握认为“爱好该项运动与性别有关”.故本题答案选C.
5.与表格相比,能更直观地反映出相关数据总体状况的是( )
A.列联表B.散点图
C.残差图D.等高条形图
解:
D
6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()
A.若的观测值为,我们有的把握认为吸烟与患肺病有关系,那么在个吸烟的人中必有人患有肺病.
B.从独立性检验可知有的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有的可能患有肺病.
C.若从统计量中求出有的把握认为吸烟与患肺病有关系,是指有的可能性使得推判出现错误.
D.以上三种说法都不正确.
解:
C
(二)课堂设计
1.知识回顾
(1)线性回归方程:
,
其中:
,
(2)回归分析:
是对具有相关关系的两个变量进行的统计分析的一种常用方法.
(3)线性回归模型:
其中和为模型的未知参数,称为随机误差.
(4)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量.
(5)列出两个分类变量的频数表,称为列联表.
(6)等高条形图是用来分析两个分类变量之间是否具有相关关系,可以形象、直观地反映两个分类变量之间的总体状态和差异大小,进而判断它们之间是否具有相关关系的图形.
(7)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量.
(8)列出两个分类变量的频数表,称为列联表.
(9)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即
:
两个分类变量没有关系
成立,在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理,即断言不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据拒绝.
2.问题探究
问题探究一什么是分类变量?
●活动一理论研究,概念学习—分类变量
在现实生活中,会遇到各种各样的变量,如果要研究它们之间的关系,观察下面两组变量,分析在取不同的值时表示的个体有何差异?
变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量.
(1)分类变量也称为属性变量或定性变量,它的不同值表示个体所属的不同类别.
(2)分类变量的取值一定是离散的,如性别只取男、女两个值.
(3)可以把分类变量的不同取值用数字表示,如用0表示男,1表示女,这是性别变量就成了取值为0和1的随机变量,但这些数字的大小没有意义.
分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍等
问题探究二如何研究两个分类变量之间是否有关系?
重点、难点知识★▲
在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?
性别是否对喜欢数学课程有影响?
●活动一实例探究,引出问题
例1为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:
表格1
那么吸烟是否对患肺癌有影响?
估计吸烟者与不吸烟者患病的可能性差异?
●活动二实例探究,引出概念
1.列联表
类似于上面的表格这样列出两个分类变量的频数表,称为列联表.即
列联表是两个或者两个以上分类变量的频数表,书中仅限于研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表成为2×2列联表.一般的,假设有两个分类变量和,它们的取值分别为和,其样本频数列联表为:
总计
总计
其中是样本容量.
●活动三利用旧知,研究问题
利用频率分布表判断;
由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响;
●活动四学习新知,对比研究
与表格相比,图形更能直观的反映出两个分类变量间是否相互影响,我们常用等高条形图展示列联表数据的频率特征.
2.等高条形图
利用等高条形图来分析两个分类变量之间是否具有相关关系,可以形象、直观地反映两个分类变量之间的总体状态和差异大小,进而判断它们之间是否具有相关关系.
(1)绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两行的数据对应不同的颜色.
(2)等高条形图中由两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显,就判断两个分类变量之间有关系.
下图是吸烟与是否患肺癌的等高条形图
由条形图可以发现,在吸烟样本中,患肺癌的频率要高些,因此直观上可以认为吸烟更容易引发肺癌.
例2在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?
【知识点:
分类变量,等高条形图】
详解 根据题目给出的数据作出如下的列联表:
色盲
不色盲
总计
男
38
442
480
女
6
514
520
总计
44
956
1000
根据列联表作出相应的等高条形图:
从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的.
点拨:
利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,
与
相差越大,两个分类变量有关系的可能性就越大.
问题探究三如何从统计学方面研究两个分类变量之间是否有关系?
重点、难点知识★▲
通过数据和图形分析,我们得到的直观判断是“吸烟和患肺癌有关”那么这种判断是否可靠?
我们通过统计分析回答这个问题.
为研究的一般性,在列联表中用字母代替数字
为了回答上述问题,我们先假设:
吸烟与患肺癌没有关系,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,即:
,即.
因此,越小,说明吸烟与患肺癌之间关系越弱;越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判标准,构造一个随机变量
(1)
(其中为样本容量.)
若成立,即“吸烟与患肺癌没有关系”,则应该很小.
根据表1中的数据,利用公式
(1)计算得到的观测值为
这个值到底能告诉我们什么呢?
统计学家经过研究后发现,在成立的情况下,
(2)
在成立的情况下,的观测值大于6.635的概率非常小,近似为0.010,是个小概率事件.
现在的观测值,远远大于,所以有理由断定不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过.
上面这种利用随机变量来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.
问题探究四我们主要从几个方面来研究两个分类变量之间有无关系?
●活动一回归旧知,忆分类变量间关系的判断
例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?
你所得的结论在什么范围内有效?
【知识点:
分类变量,独立性检验,变量间的关系】
详解:
根据题中所给数据列出列联表
相应的等高条形图如图所示:
比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.
●活动二对比学习,提炼优缺点
根据数据有多大把握判断秃顶与患心脏病是否有关系?
在假设的前提下,,所以有99%的把握认为“秃顶与患心脏病有关”.
这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.
点拨:
(1)列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.
(2)独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认.
问题探究五什么是独立性检验?
利用独立性检验判断两个分类变量的是否有关系的一般过程是什么?
重点、难点知识★▲
●活动一理论学习,提升高度
1.定义:
利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.
●活动二对比学习,提炼方法
通过反思例1的解答过程中,你能总结出利用独立性检验判断两个分类变量的是否有关系的一般过程吗?
一般地,假设有两个分类变量和,它们的取值分别为和,其2×2列联表为下表:
总计
总计
我们构造一个变量:
,其中.
利用随机变量来确定在多大程度上可以认为两个分类变量有关系:
利用上述公式求出的观测值为
,其中.
再得出与有关系的程度:
如果k>10.828,就有99.9%的把握认为与有关系;
如果k>7.879,就有99.5%的把握认为与有关系;
如果k>6.635,就有99%的把握认为与有关系;
如果k>5.024,就有97.5%的把握认为与有关系;
如果k>3.841,就有95%的把握认为与有关系;
如果k>2.706,就有90%的把握认为与有关系;
如果k≤2.706,就认为没有充分的证据证明与有关系.
问题探究六独立性检验的基本思想是什么?
难点知识▲
●活动一深层思考,得出基本思想
通过上述问题,我们可以利用独立性检验来说明两个分类变量是否有关系,相关性有多强.那么为什么可以用独立性检验来判断两个分类变量的相关性呢?
其基本思想是什么?
独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即:
:
两个分类变量没有关系
成立,在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理,即断言不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据拒绝.
如何判断的观测值的大小?
确定一个正数,当时认为的观测值大.此时相应于的判断规则为:
如果,则认为“两个分类变量有关系”;否则认为“两个分类变量没有关系”.我们称这样的为一个判断规则的临界值.
按照上述规则,把“两个分类变量没有关系”错误判断为“两个分类变量有关系”的概率为
根据随机变量的含义,可以通过来评价假设的不合理程度,又实际计算出,说明假设不合理的程度约为,级两个变量是由关系这一结论成立的可信度为.
●活动二对比提升,区分不同
独立性检验的原理与反证法的原理是否一样呢?
我们对比可以发现:
(1)反证法原理是在假设下,如果推出一个矛盾,就证明了不成立.
(2)独立性检验原理是在假设下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.
例2某高校为研究学生的身体素质与课外体育锻炼时间的关系,对该校一年级200名学生的课外体育锻炼平均每天运动的时间进行调查,如下表:
(平均每天锻炼的时间单位:
分钟)
平均每天锻炼的时间(分钟)
总人数
20
36
44
50
40
10
将学生日均课外体育运动时间在上的学生评价为“课外体育达标”.请根据上述表格中的统计数据填写下面列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?
课外体育不达标
课外体育达标
合计
男
女
20
110
合计
参考公式:
,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【知识点:
分类变量,独立性检验,变量间的关系】
详解:
其列联表如下
课外体育不达标
课外体育达标
合计
男
60
30
90
女
90
20
110
合计
150
50
200
计算,
故所以在犯错误的概率不超过0.01的前提下不能判断“课外体育达标”与性别有关;
点拨:
独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论.在分析问题时一定要注意这一点,不可对某个问题下确定性结论否则就可能对统计计算得结果作出错误的解释.
问题探究七我们主要从几个方面来研究两个分类变量之间有无关系?
●活动一回归旧知,巩固复习重点知识
例1.为了调查某生产线上,某质量监督员甲对产品质量好坏有无影响,现统计数据如下:
质量监督员甲在现场时,990件产品中合格品982件,次品87件;甲不在现场时,510件产品中合格品493件,次品17件.试分别用列联表,等高条形图,独立性检验的方法对数据进行分析.
【知识点:
分类变量,独立性检验,变量间的关系】
详解:
(1)2×2列联表如下:
产品正品数
次品数
总 数
甲在现场
982
8
990
甲不在现场
493
17
510
总 数
1475
25
1500
由列联表看出|ac-bd|=|982×17-493×8|=12750,即可在某种程度上认为“甲在不在场与产品质量有关”.
相应的等高条形图如图所示:
●活动二对比学习,巩固重点
由2×2列联表中数据,计算.
所以约有99%的把握认为“质量监督员甲在不在现场与产品质量有关系”.
点拨:
(1)在现在等高条形图中,与相差越大,两个分类变量有关系的可能性越大.
(2)在解答独立性检验题目过程中.数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,同时计算不能失误.
问题探究八利用独立性检验判断两个分类变量是否有关系的一般步骤是什么?
重点、难点知识★▲
●活动一实际操作
例2.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:
服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.
(1)根据所给样本数据完成下面2×2列联表;
(2)请问能有多大把握认为药物有效?
不得禽流感
得禽流感
总计
服药
不服药
总计
【知识点:
分类变量,独立性检验,变量间的关系】
详解:
(1)
不得禽流感
得禽流感
总计
服药
40
20
60
不服药
20
20
40
总计
60
40
100
(2)由列联表得:
所以大概90%认为药物有效.
●活动二深层思考,得出一般步骤
通过上述解答过程,利用独立性检验判断两个分类变量是否有关系的一般步骤是什么?
1.独立性检验的基本步骤
根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查临界值表确定临界值.
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
利用公式计算随机变量的观测值.
如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
2.独立性检验的基本思想
(1)利用进行独立性检验,可以对推断的正确性的概率作出估计,样本容量越大,这个估计值越准确,如果抽取的样本容量很小,那么利用进行独立性检验的结果就不具有可靠性.
(2)独立性检验的思想就是在假设成立的条件下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.
3.课堂总结
【知识梳理】
(1)变量的不用“值”表示个体所属的不同类别,像这样的变量成为分类变量.
(2)列出两个分类变量的频数表,称为列联表.
(3)设:
吸烟与患肺癌没有关系,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,即:
,即.
因此,越小,说明吸烟与患肺癌之间关系越弱;越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判标准,构造一个随机变量
(1)
(其中为样本容量.)
若成立,即“吸烟与患肺癌没有关系”,则应该很小.
(4)利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.
(5)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量应该很小,如果由观测数据计算得到的观测值很大,则在一定程度上说明假设不合理.
(6)独立性检验的原理与反证法的原理比较:
反证法原理是在假设下,如果推出一个矛盾,就证明了不成立;独立性检验原理是在假设下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.
(7).独立性检验的基本步骤
根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查临界值表确定临界值.
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
利用公式计算随机变量的观测值.
如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”,或者在样本数据中没有发现足够证据支持结论“与有关系”.
(8).独立性检验的基本思想
(1)利用进行独立性检验,可以对推断的正确性的概率作出估计,样本容量越大,这个估计值越准确,如果抽取的样本容量很小,那么利用进行独立性检验的结果就不具有可靠性.
(2)独立性检验的思想就是在假设成立的条件下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.
【重难点突破】
(1)列联表与等高条形图
列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.一般地,在等高条形图中,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学设计 数学人教A版高中选修23第三章 统计案例3 教学 设计 学人 高中 选修 23 第三 统计 案例