人教版高中数学选修2331《回归分析基本思想及其初步应用第2课时》教学设计.docx
- 文档编号:1657449
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:23
- 大小:329.36KB
人教版高中数学选修2331《回归分析基本思想及其初步应用第2课时》教学设计.docx
《人教版高中数学选修2331《回归分析基本思想及其初步应用第2课时》教学设计.docx》由会员分享,可在线阅读,更多相关《人教版高中数学选修2331《回归分析基本思想及其初步应用第2课时》教学设计.docx(23页珍藏版)》请在冰豆网上搜索。
人教版高中数学选修2331《回归分析基本思想及其初步应用第2课时》教学设计
选修1-2
3.1回归分析基本思想及其初步应用第二课时(谷杨华)
一、教学目标
1.核心素养:
通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力.
2.学习目标
(1)1.1.2.1理解相关系数概念
(2)1.1.2.2判断刻画模型拟合效果的方法—相关指数和残差分析
(3)1.1.2.3能用回归分析的方法对简单的案例进行分析.
3.学习重点
判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析
4.学习难点
判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析
二、教学设计
(一)课前设计
1.预习任务
任务1
阅读教材P4-P6,思考在回归分析中,分析残差能够帮助我们解决那些问题?
任务2
刻画模型拟合效果的方法有哪些?
2.预习自测
1.下列说法正确的是()
A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法
B.线性回归方程对应的直线至少经过其样本数据点中的一个点
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,相关指数为的模型比相关指数为的模型拟合的效果差
【知识点:
回归分析】
解:
CA.回归分析反映两个变量相关关系的数学方法,由建立回归方程来预报变量的情况.错误;B.线性回归方程对应的直线,过其样本数据平均数点,错误;
D.相关指数越大,则相关性越强,模型的拟合效果越好.错误;
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高.正确.
2.两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数如下,其中拟合效果最好的模型是()
A.模型1的相关指数为0.99
B.模型2的相关指数为0.88
C.模型3的相关指数为0.50
D.模型4的相关指数为0.20
【知识点:
回归分析】
解:
A由相关指数的意义知,越大说明相关性越强,故选A.
(二)课堂设计
1.知识回顾
⑴对于一组具有线性相关关系的数据,
则称点为样本点的中心.
(2)线性回归方程:
,其中.,
(3)线性回归模型:
y=bx+a+e其中a和b为模型的未知参数,e称为随机误差.
2.问题探究
问题探究一什么是相关系数?
相关系数可以用来解释什么?
●活动一理论研究,概念学习—相关系数
我们知道,两个变量x和y正(负)相关时,它们就有相同(反)的变化趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题:
如何描述x和y之间种线性关系的强弱?
在统计中用相关系数r来衡量两个变量之间线性关系的强弱.若相应于变量x的取值,变量y的观测值为(),则两个变量的相关系数r的计算公式为
对于相关系数r,当为正时,表明变量x和y正相关,当r为负时,表明变量x和y负相关.
统计学认为,对于变量x,y,如果,那么负相关很强;如果,那么正相关很强;如果或,那么相关性一般;若,那么相关性较弱.
●活动二学以致用,相关系数的应用
例1对下列各图中两个变量间的线性相关程度作出分析
【知识点:
相关系数】
详解:
图1,r=0.97相关性很强,而且是正相关;图2,r=-0.85相关性很强,而且是负相关
图3,r=0.24,不能用线性回归模型描述两个变量的关系;图4,r=-0.05乎没有什么关系,不能用线性回归模型描述两个变量的关系.
点拨:
当相关系数越接近1时,两个变量的线性相关程度越高,当相关系数越接近0时,两个变量的线性相关程度越低.
问题探究二什么是残差、及残差平方和、如何用残差判断拟合效果?
重点、难点知识★▲
●活动一残差的定义
在线性回归模型中,e是用bx+a报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?
在实际应用中,我们用回归方程中的估计回归模型y=bx+a+e中的bx+a.由于随机误差e=y-(bx+a),所以是e的估计值.对于样本点
而言,它们的随机误差为
其估计值为
称是相对于点的残差.
●活动二学以致用,残差的应用
如何发现数据中的错误,如何衡量模型的拟合效果?
通过残差可以发现原始数据中的可疑数据,判断所建立模型的拟合效果.下表是女大学生身高和体重的原始数据以及相应的残差数据.
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
yi
54.373
54.373
47.581
58.618
62.863
54.373
45.883
58.618
ei
-6.373
2.627
2.419
-4.618
1.137
6.627
-2.883
0.382
我们可以利用图形来分析残差.作图时纵坐标为残差,横坐标可以选为样本的编号或者解释变量的数值,这样作出的图形称为残差图.下表是以女大学生编号为横坐标的残差图
从残差图中可以看到第1个样本点和第6个样本点的残差较大,需要确认是否出现人为的错误.
残差所能说明的情况:
1样本点的残差比较大,确认采集数据时是否出现人为的错误或其他原因;
②残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.
●活动三多角度刻画拟合效果
从残差图中我们可以大致判断模型的拟合效果,能否定性分析模型的拟合效果呢?
我们可以用是刻画回归效果的量,除了表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系(在线性回归模型中).其计算公式是
对于已获取的样本数据,表达式中的为确定的数.因此越大,说明残差平方和越小,模型的拟合效果越好;越小,说明残差平方和越大,模型的拟合效果越差.在线性回归模型中,越接近于1,回归的效果越好(因为越接近于1,表示解释变量和预报变量的线性相关性越强).在线性回归模型中,同时也表示解释变量对预报变量变化的贡献率.
,即解释变量对预报变量变化约贡献了64%,而随机误差贡献了剩余的36%.
问题探究三
●活动一学以致用
例2.某运动员训练次数与运动成绩之间的数据关系如下:
次数/x
30
33
35
37
39
44
46
50
成绩/y
30
34
37
39
42
46
48
51
根据数据分别计算相关系数、残差、相关指数,判断能否用线性回归模型,若能求出回归方程并试预测该运动员训练47次以及55次的成绩,若不能说明理由.
【知识点:
线性回归,线性相关关系】
详解:
(1)作出该运动员训练次数x与成绩y之间的散点图,如图1所示,由散点图可知,它们之间具有线性相关关系.
(2)列表计算:
次数
成绩
30
30
900
900
900
33
34
1089
1156
1122
35
37
1225
1369
1295
37
39
1369
1521
1443
39
42
1521
1764
1638
44
46
1936
2116
2024
46
48
2116
2304
2208
50
51
2500
2601
2550
由上表可求得,,,,
所以
,所以回归直线方程为
(3)计算相关系数
将上述数据代入,查表可知,而,故y与x之间存在显著的相关关系.
(4)残差分析:
作残差图如图2,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.
计算残差的方差得,说明预报的精度较高.
(5)计算相关指数
计算相关指数=0.9855.说明该运动员的成绩的差异有98.55%是由训练次数引起的.
(6)做出预报
由上述分析可知,我们可用回归方程作为该运动员成绩的预报值.
将x=47和x=55分别代入该方程可得y=49和y=57,
故预测运动员训练47次和55次的成绩分别为49和57.
点拨:
1.解答本类题目应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
2.在使用回归方程进行预报时要注意:
(1)回归方程只适用于我们所研究的样本的总体;
(2)我们所建立的回归方程一般都有时间性;
(3)样本取值的范围会影响回归方程的适用范围;
(4)不能期望回归方程得到的预报值就是预报变量的精确值.
3.课堂总结
【知识梳理】
(1)在统计中用相关系数r来衡量两个变量之间线性关系的强弱.若相应于变量x的取值,变量y的观测值为(),则两个变量的相关系数r的计算公式为
(2)数据点和它在回归直线上相应位置的差异是随机误差的效应,称为残差.由得.
【重难点突破】
(1)残差图分析:
若残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度就越高.若残差点分布在其他形状的区域,则说明所选用的回归模型不是最好的,有改进的空间.
(2)越大,说明残差平方和越小,模型的拟合效果越好;越小,说明残差平方和越大,模型的拟合效果越差.在线性回归模型中,越接近于1,回归的效果越好(因为越接近于1,表示解释变量和预报变量的线性相关性越强).在线性回归模型中,同时也表示解释变量对预报变量变化的贡献率.
4.随堂检测
1.下列各组变量之间具有线性相关关系的是()
A.出租车费与行驶的里程
B.学习成绩与学生身高
C.身高与体重
D.铁的体积与质量
【知识点:
线性回归,线性相关关系】
解:
C
2.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是()
A.>b′,>a′
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归分析基本思想及其初步应用第2课时 人教版 高中数学 选修 2331 回归 分析 基本 思想 及其 初步 应用 课时 教学 设计