高中数学选修23优质学案1231 回归分析的基本思想及其初步应用.docx
- 文档编号:2259517
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:15
- 大小:102.05KB
高中数学选修23优质学案1231 回归分析的基本思想及其初步应用.docx
《高中数学选修23优质学案1231 回归分析的基本思想及其初步应用.docx》由会员分享,可在线阅读,更多相关《高中数学选修23优质学案1231 回归分析的基本思想及其初步应用.docx(15页珍藏版)》请在冰豆网上搜索。
高中数学选修23优质学案1231回归分析的基本思想及其初步应用
§3.1回归分析的基本思想及其初步应用
知识导学
知识点一 线性回归模型
(1)函数关系是一种关系,而相关关系是一种关系.
(2)回归分析是对具有关系的两个变量进行统计分析的一种常用方法.
(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归直线=x+的斜率和截距的最小二乘估计公式分别为==,=-,其中(,)称为样本点的中心.
(4)线性回归模型y=bx+a+e,其中a和b是模型的未知参数,e称为,自变量x称为,因变量y称为.
知识点二 线性回归分析
1.残差平方和法
(1)i==(i=1,2,…,n)称为相应于点(xi,yi)的.
(2)残差平方和(yi-i)2越小,模型拟合效果越好.
2.残差图法
残差点落在水平的带状区域内,说明选用的模型比较合适,其中这样的带状区域宽度,说明模型的精确度越高.
3.利用相关指数R2刻画回归效果
其计算公式为:
R2=1-.其几何意义:
,表示回归效果越好.
知识拓展
1.建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性相关关系等).
(3)由经验确定回归方程的类型(如观察到数据呈线性相关关系,则选用线性回归方程=x+).
(4)按一定规则估计回归方程中的参数(如最小二乘法).
(5)得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误或模型是否合适等.
2.线性回归模型中随机误差的主要来源
(1)用线性回归模型作为真实模型的近似所引起的误差.可能存在非线性的函数能够更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差.
(2)忽略了某些因素的影响.影响变量y的因素不仅有变量x,可能还包括其他许多因素,例如,在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响.
(3)观测误差.由于测量工具等原因,导致y的观测值产生误差.
3.残差分析的结果
(1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
(2)若是有个别样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.
4.对R2的理解
(1)预报变量的变化与解释变量和随机误差的关系
预报变量的变化程度可以分解为解释变量引起的变化程度与残差变量的变化程度之和,其中这个变化与解释变量和随机误差(即残差平方和)有关的程度是由相关指数R2的值决定的.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率.R2越接近于1,表示解释变量和预报变量的线性相关性越强;反之,R2越小,说明随机误差对预报变量的效应越大.
(2)R2与r的关系
①相关系数可较好地反映变量的相关性及正相关或负相关,而R2反映了回归模型拟合数据的效果;
②R2是相关系数的平方,其变化范围为[0,1],而相关系数的变化范围为[-1,1];
③当相关系数|r|接近于1时说明两变量的相关性较强,当|r|接近于0时说明两变量的相关性较弱,而当R2接近于1时,说明线性回归方程的拟合效果较好.
自诊小测
1.判一判(正确的打“√”,错误的打“×”)
(1)残差平方和越小,线性回归方程的拟合效果越好.( )
(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上.( )
(3)R2越接近于1,线性回归方程的拟合效果越好.( )
2.做一做
(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.
(2)在残差分析中,残差图的纵坐标为________.
(3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________,解释变量和预报变量之间的相关系数等于________.
课堂互动探究
探究 求线性回归方程
例1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据
x
6
8
10
12
y
2
3
5
6
(1)请画出上表数据的散点图;(要求:
点要描粗)
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.(相关公式:
=,=-)
拓展提升
求线性回归方程的步骤
(1)列出散点图.从直观上分析数据间是否存在线性相关关系.
(2)计算,,x,y,xiyi.
(3)代入公式求出=x+中参数,的值.
(4)写出回归方程并对实际问题作出估计.
跟踪训练1 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程,=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
注:
=,=-.
探究 线性回归分析
例2 已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.
拓展提升
这类题目的数据运算繁琐,通常采用分步计算的方法,由R2可以看出回归模型的拟合效果,也可以计算相关系数r,看两个变量的相关关系是否很强.
跟踪训练2 为研究重量x(单位:
克)对弹簧长度y(单位:
厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:
x
5
10
15
20
25
30
y
7.25
8.12
8.95
9.90
10.9
11.8
(1)作出散点图并求线性回归方程;
(2)求出R2;
(3)进行残差分析.
探究 非线性回归分析
例3 为了研究某种细菌随时间x变化繁殖的个数,收集数据如下:
天数x/天
1
2
3
4
5
6
繁殖个数y/个
6
12
25
49
95
190
(1)将天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)描述解释变量与预报变量之间的关系;
(3)计算残差、相关指数R2.
拓展提升
非线性回归方程的求法
(1)根据原始数据(x,y)作出散点图;
(2)根据散点图,选择恰当的拟合函数;
(3)作恰当的变换,将其转化成线性函数,求线性回归方程;
(4)在(3)的基础上通过相应的变换,即可得非线性回归方程.
跟踪训练3 某电容器充电后,电压达到100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
t/s
0
1
2
3
4
5
6
7
8
9
10
U/V
100
75
55
40
30
20
15
10
10
5
5
试求:
电压U对时间t的回归方程.(提示:
对公式两边取自然对数,把问题转化为线性回归分析问题)
随堂自测
1.关于回归分析,下列说法错误的是( )
A.回归分析是研究两个具有相关关系的变量的方法
B.散点图中,解释变量在x轴,预报变量在y轴
C.回归模型中一定存在随机误差
D.散点图能明确反映变量间的关系
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好?
( )
A.甲B.乙
C.丙D.丁
3.设某大学的女生体重y(单位:
kg)与身高x(单位:
cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
4.某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得线性回归方程=bx+a中b=-2,预测当气温为-4℃时,用电量的度数约为________.
5.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
(1)以x为解释变量,y为预报变量,作出散点图;
(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;
(3)计算各组残差,并计算残差平方和;
(4)求相关指数R2,并说明残差变量对有效穗的影响占百分之几?
——★参考答案★——
知识导学
知识点一 线性回归模型
(1)确定性非确定性
(2)相关
(4)随机误差解释变量预报变量
知识点二 线性回归分析
1.
(1)残差
2.比较均匀地越窄
3.R2越接近于1
自诊小测
1.[[答案]]
(1)√
(2)× (3)√
2.[[答案]]
(1)正相关
(2)残差 (3)0 1或-1
[[解析]]
(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关.
(2)由残差图的定义知道,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.
(3)设样本点为(xi,yi),i=1,2,3,…,n,回归直线为=x+;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有yi=i;残差平方和(yi-i)2=0;解释变量和预报变量之间的相关系数R满足R2=1-=1,
所以R=±1.
课堂互动探究
探究 求线性回归方程
例1 解:
(1)如图:
(2)xiyi=6×2+8×3+10×5+12×6=158,
==9,
==4,
x=62+82+102+122=344,
===0.7,
=-=4-0.7×9=-2.3,
故线性回归方程为=0.7x-2.3.
(3)由
(2)中线性回归方程当x=9时,=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.
跟踪训练1 解:
(1)散点图如图.
(2)由表中数据得iyi=52.5,
=3.5,=3.5,=54,
所以==0.7.
所以=-=1.05.
所以=0.7x+1.05.
回归直线如图中所示.
(3)将x=10代入回归直线方程,得=0.7×10+1.05=8.05(小时),
所以预测加工10个零件大约需要8.05小时.
探究 线性回归分析
例2 解:
=(14+16+18+20+22)=18,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学选修23优质学案1231 回归分析的基本思想及其初步应用 高中数学 选修 23 优质 1231 回归 分析 基本 思想 及其 初步 应用