北师大版选修12第一章《统计案例》word教案Word格式.docx
- 文档编号:14326499
- 上传时间:2022-10-22
- 格式:DOCX
- 页数:44
- 大小:407.02KB
北师大版选修12第一章《统计案例》word教案Word格式.docx
《北师大版选修12第一章《统计案例》word教案Word格式.docx》由会员分享,可在线阅读,更多相关《北师大版选修12第一章《统计案例》word教案Word格式.docx(44页珍藏版)》请在冰豆网上搜索。
2.线性回是模型
(
为 ),因变量
的值是自变量
和随机误差
共同确定的,即自变量
只能解释部分
的变化,在统计中,我们把自变量
称为 ,因变量
称为 。
3.模型中的参数
和
用 估计,其计算公式如下:
,
,其中
称为 ,回归直线一定经过样本中心点。
4.用 来描述线性相关关系的强弱。
当
时,表明两个变量 ;
,表示两个变量 ;
的绝对值越接近于1,表明两个变量的线性相关性越 ;
的绝对值越接近于0,表明两个变量的线性相关性越 。
通常而言,当
大于 时,认为两个变量具有很强的线性相关关系。
5.我们也可以用相关指数
来刻划回归效果,其计算公式为:
的值越大,说明残差平方和越小,也就是说模型的拟合效果越 。
在线性回归模型中,
表示解释变量对预报变量的 ,
越接近于1,说明回归效果越好。
[特别提醒]
1.对于相关关系的理解应注意:
相关关系与函数关系不同,函数关系是一种确定的关系,而相关关系是一种非确定的关系,它包括了两种情况:
(1)两个变量中,一个为可控制变量,另一个为随机变量,例如化肥的施肥量与农作物的产量之间的关系就是相关关系,其中施肥量是可控变量,而农作物的产量是随机变量;
(2)两个变量均为随机变量。
而函数关系可以看成两个随机变量之间的关系,是一种确定性的关系。
不能把相关关系等同于函数关系。
对于相关性性检验中相关系数的取值范围及其对相关关系的影响需熟记。
2.本章内容为新课程标准中新添加的知识点.回归分析的侧重点应先求回归直线方程,并进行相应的估计预测,但这类的题数据的处理与计算量可能很大,学习中应谨慎把握.对于独立新检验问题,应以K²
的计算与临界值的比较来判断分类变量的相关与无关为主.
3.线性回归分析是统计中额定一个重要内容,随着新课标的实施和新课程高考改革的不断深入,这部分的内容也将回越来越受到重视.非线性回归问题有时并不给出经验公式,这时候我们可以画出已时数据的散点图,把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象比较,挑选一种跟这些点拟合最好成的函数,然后采取适当的置换,把问题化为线性回归问题,使其得到解决。
4.回归直线方程求解需要复杂的运算,随着新课程标准的继续实施和新课程高考改革的不断深入,考查同学们数据处理能力,特别是运用计算器等现代技术工具对进行数据处理的能力,将是改革的方向之一.有关理论要求同学们理解,但公式也不需要死记硬背.
[基础闯关]
1.下列说法正确的是( )
A.任何两个变量都具有相关关系;
B.球的体积与该球的半径具有相关关系;
C.农作物的产量与施化肥量之间是一种确定性关系;
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系。
2.在画两个变量的散点图时,下面哪个叙述是正确的()
(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上
(C)可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上
3.由一组样本数据
,得到回归直线方程
,那么下面说法不正确的是( )
A.直线
必经过
;
B.直线
至少经过
中的一个点;
C.直线
的斜率为
D.直线
的纵截距为
4.对四对变量
进行相关性检验,已知
是观测值组数,且已知
(已知
时,
)
则有95%的把握说变量
与
具有线性相关关系的是( )
A.
B.
C.
D.
5.已知一个回归直线方程为
,则当变量
增加一个单位时,变量
的变化情况是 。
6.同一资料,如果将
作自变量,
作为因变量,得到回归系数
若将
作为变量,
则相关系数
的关系是 。
[典例精析]
例1.(2006年广东佛山)19世纪未,德国统计学家恩格尔根据统计资料,对消费结构变化得出一个规律:
一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出会下降。
推而广之,一个国家越穷,每个国民的平均收入中(或平均支出中)用于购买食物的支出所占的比例就越大,随着国家的富裕,这个比例呈下降趋势。
恩格尔系数是根据恩格尔定律得出的比例系数,是表示生活水平高低的一个指标,其计算公式为:
。
在我国,判定生活发展阶段的标准是:
贫困>60%,温饱
,小康
,富裕<40%.根据国家统计局统计显示,随着中国经济的不断增长,城镇居民家庭的恩格尔系数不断下降,居民消费已从温饱型向享受型、发展型转变。
如下表所示:
恩格尔系数(%)
57.5
54.2
53.8
50.0
48.8
44.7
39.4
37.7
37.1
年 份
1978
1990
1992
1994
1996
1998
2000
2002
2003
求:
(1)根据年份预报恩格尔系数的回归方程;
(2)预报2007年的恩格尔系数;
(3)求相关指数;
(4)作出残差图。
[剖析]由于问题中要求根据年份预报恩格尔系数,因此选取年份为自变量
,恩格尔系数为因变量
,作出散点图,并根据散点判断是否
是否具有相关关系,从而利用最小二乘法求出回归直线方程。
[解]
(1)散点图如下图所示:
并由最小二乘法求得线性回归方程为:
(2)由线性回归方程可知,2007年的恩格尔系数为:
(3)
(4)列出编与残差图表如下:
编 号
1
2
3
4
5
6
7
8
9
残 差
-4.6
2.9
4.3
2.3
0.6
-2.9
-2.8
-2.5
由上表可得残差图如下图所示:
[警示]作残差图是残差分析的一种重要方法,在作图时,横坐标可以选用样本编号,或有关数据,这样作出的图形称为残差图。
如果残差点比较均匀地分布在水平带状区域风,说明选用的模型比较适合,这样的带状区域越窄,说明所选用的模型的拟合精度越高,因归方程的预报精度也越高。
如果残差分布不均匀,应首先确认采集的样本点是否有误,如果有误,就予以纠正,然后再重新利用线性回归模型来拟合数据,如果数据采集没有错误,则需要寻找其它原因。
[变式训练]:
1.某地大气中氰化物测定结果如下:
污染源距离
50
100
150
200
250
300
400
500
氰化物浓度
0.687
0.396
0.200
0.121
0.09
0.05
0.02
0.01
(1)试建立氰化物浓度与距离之间的回归方程;
(2)求出相关指数;
(3)作出残差图,并求出残差平方和。
例2.为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天
1
2
3
5
繁殖个数y/个
6
12
25
49
95
190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图
(2)描述解释变量与预报变量之间的关系,计算残差、相关指数R2.
[剖析]由题间知先作出散点图,判断采用哪种函数模型对样本数据进行拟合,再计算残差与相关指数进行回归分析。
[解]
(1)散点图如下图:
(2)由散点图看出样本点分布在一条指数函数y=
的周围,于是令Z=lny,则
x
Z
1.79
2.48
3.22
3.89
4.55
5.25
由计数器算得
则有
6.06
12.09
24.09
48.04
95.77
190.9
y
12
25
49
95
=
=3.1643
=25553.3
R2=1-
=0.9999.
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
[警示]从散点图中我们可以看到,样本点分布在某一直线的附近,而不是在一条直线上,所以不能用一次函数来描述它们之间的关系,这时我们把天数与繁殖个数的关系用下面的线性回归模型来表示:
y=bx+a+e,其中a,b为待定的未知参数,e称为随机误差.在回归分析中,通过模型由解释变量计算预报变量时,应注意:
(1)回归模型只适用于所研究的总体。
(2)回归方程具有时效性。
(3)样本的取值范围影响回归方程的适用范围。
(4)预报值是预报变量可能取值的平均值。
在线性回归模型中,R2表示解析变量对预报变量的贡献率,R2越接近1时,表示线性回归的效果越好;
R2越接近0时,线性效果越差.
[变式训练]
2.某城市理论预测2000年到2005年人口总数与年份的关系如下表所示
年份x
2001
2004
2005
人口数y万
69
88
110
350
(1)画出散点图,试建立y与x之间的回归方程.
(2)据此估计2006年人口总数.
(3)计算相关指数
、残差、残差平方和.
例3.10名同学在高一和高二的数学如下表;
74
71
68
76
73
67
70
65
72
75
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计案例 北师大 选修 12 第一章 统计 案例 word 教案