高中数学第一章统计案例学案新人教A版选修12.docx
- 文档编号:761156
- 上传时间:2022-10-12
- 格式:DOCX
- 页数:58
- 大小:455.84KB
高中数学第一章统计案例学案新人教A版选修12.docx
《高中数学第一章统计案例学案新人教A版选修12.docx》由会员分享,可在线阅读,更多相关《高中数学第一章统计案例学案新人教A版选修12.docx(58页珍藏版)》请在冰豆网上搜索。
高中数学第一章统计案例学案新人教A版选修12
【三维设计】2015-2016学年高中数学第一章统计案例学案新人教A版选修1-2
_1.1回归分析的基本思想及其初步应用
线性回归方程
[导入新知]
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,即自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报.
2.线性回归模型
(1)线性回归模型y=bx+a+e,其中a和b是模型的未知参数,e称为随机误差.自变量x称为解释变量,因变量y称为预报变量.
(2)在回归方程
=
x+
中,
=
=
,
=
-
.
其中
=
i,
=
i,(
,
)称为样本点的中心.
[化解疑难]
线性回归方程中系数
的含义
(1)
是回归直线的斜率的估计值,表示x每增加一个单位,y的平均增加单位数,而不是增加单位数.
(2)当
>0时,变量y与x具有正的线性相关关系;当
<0时,变量y与x具有负的线性相关关系.
线性回归分析
[导入新知]
1.残差分析
(1)残差:
样本点(xn,yn)的随机误差ei=yi-bxi-a,其估计值为
i=yi-
i=yi-
xi-
,
i称为相应于点(xi,yi)的残差(residual).(以上i=1,2,…,n)
(2)残差图:
作图时,纵坐标为残差,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图.
(3)残差分析:
残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:
计算残差——画残差图——在残差图中分析残差特性.
残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
2.相关指数
我们可以用相关指数R2来刻画回归的效果,其计算公式是:
R2=1-
.
R2越大,残差平方和
(yi-
i)2越小,即模型的拟合效果越好;R2越小,残差平方和
(yi-
i)2越大,即模型的拟合效果越差.在线性回归模型中,R2的取值范围为[0,1],R2表示解释变量对于预报变量变化的贡献率,1-R2表示随机误差对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好.
[化解疑难]
残差分析的注意点
在残差图中,可疑数据的特征表现为:
(1)个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区域过于明显,需要确认在采集这些样本点的过程中是否有人为的错误,如果采集数据有错误,那么需要纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,那么需要寻找其他原因.
(2)残差图有异常,即残差呈现不随机的规律性,此时需要考虑所采用的线性回归模型是否合适.
线性回归分析
[例1] 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:
x(0.01%)
104
180
190
177
147
134
150
191
204
121
y(min)
100
200
210
185
155
135
170
205
235
125
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟?
[解]
(1)以x轴表示含碳量,y轴表示冶炼时间,作散点图如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性相关.
(2)列出下表,并用科学计算器进行计算:
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10400
36000
39900
32745
22785
18090
25500
39155
47940
15125
=159.8,
=172,
=265448,
iyi=287640
设所求的回归方程为
=
x+
,
=
≈1.267,
=
-
≈-30.47.
所以所求的回归方程为
=1.267x-30.47.
(3)当x=160时,
=1.267×160-30.47≈173(min),即冶炼时间大约为173min.
[类题通法]
求线性回归方程的步骤
(1)列表表示xi,yi,xiyi;
(2)计算
,
,
iyi;
(3)代入公式计算
,
的值;
(4)写出回归直线方程.
[活学活用]
某种产品的广告费支出x(单位:
百万元)与销售额y(单位:
百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)试根据数据预报广告费支出1000万元的销售额;
(2)若广告费支出1000万元的实际销售额为8500万元,求误差.
解:
(1)从画出的散点图(图略)可看出,这些点在一条直线附近,可以建立销售额y对广告费支出x的线性回归方程.由题中数据计算可得
=5,
=50,由公式计算得
=6.5,
=17.5,所以y对x的线性回归方程为
=6.5x+17.5.
因此,对于广告费支出为1000万元(即10百万元),由线性回归方程可以预报销售额为
=6.5×10+17.5=82.5(百万元).
(2)8500万元即85百万元,实际数据与预报值的误差为85-82.5=2.5(百万元).
残差分析
[例2] 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:
编号
1
2
3
4
5
6
7
8
9
10
零件数x/个
10
20
30
40
50
60
70
80
90
100
加工时间y/分
62
68
75
81
89
95
102
108
115
122
(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;
(2)你认为这个模型能较好地刻画零件数和加工时间的关系吗?
[解]
(1)根据表中数据画出散点图,如图所示.
由图可看出,这些点在一条直线附近,可以用线性回归模型来拟合数据.计算得加工时间对零件数的线性回归方程为
=0.668x+54.93.
残差数据如下表:
编号
1
2
3
4
5
残差
0.39
-0.29
0.03
-0.65
0.67
编号
6
7
8
9
10
残差
-0.01
0.31
-0.37
-0.05
0.27
(2)以零件数为横坐标,残差为纵坐标画出残差图如图所示.
由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.
[类题通法]
残差分析应注意的问题
利用残差分析研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后通过图形来分析残差特性,用残差
1,
2,…,
n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果.
[活学活用]
已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求y关于x的回归直线方程,并说明回归模型拟合效果的好坏.
解:
=
(14+16+18+20+22)=18,
=
(12+10+7+5+3)=7.4,
=142+162+182+202+222=1660,
iyi=14×12+16×10+18×7+20×5+22×3=620,
所以
=
=
=-1.15,
=7.4+1.15×18=28.1,
所以所求回归直线方程是
=-1.15x+28.1.列出残差表:
yi-
i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以
(yi-
i)2=0.3,
(yi-
)2=53.2,
R2=1-
≈0.994,
所以回归模型的拟合效果很好.
非线性回归分析
[例3] 在一次抽样调查中测得样本的5个样本点,数值如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
[解] 作出变量y与x之间的散点图如图所示.
由图可知变量y与x近似地呈反比例函数关系.
设y=
,令t=
,则y=kt.由y与x的数据表可得y与t的数据表:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
作出y与t的散点图如图所示.
由图可知y与t呈近似的线性相关关系.
又
=1.55,
=7.2,
iyi=94.25,
=21.3125,
=
=
≈4.1344,
=
-
=7.2-4.1344×1.55≈0.8,
∴
=4.1344t+0.8.
所以y与x的回归方程是
=
+0.8.
[类题通法]
非线性回归分析的步骤
非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
[活学活用]
某电容器充电后,电压达到100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
t/s
0
1
2
3
4
5
6
7
8
9
10
U/V
100
75
55
40
30
20
15
10
10
5
5
试求:
电压U对时间t的回归方程.(提示:
对公式两边取自然对数,把问题转化为线性回归分析问题)
解:
对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,y与x的数据如下表:
x
0
1
2
3
4
5
6
7
8
9
10
y
4.6
4.3
4.0
3.7
3.4
3.0
2.7
2.3
2.3
1.6
1.6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学 第一章 统计 案例 新人 选修 12
![提示](https://static.bdocx.com/images/bang_tan.gif)