人教A版数学选修23培优教程讲义第三章 统计案例 章末复习.docx
- 文档编号:9417393
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:13
- 大小:218.97KB
人教A版数学选修23培优教程讲义第三章 统计案例 章末复习.docx
《人教A版数学选修23培优教程讲义第三章 统计案例 章末复习.docx》由会员分享,可在线阅读,更多相关《人教A版数学选修23培优教程讲义第三章 统计案例 章末复习.docx(13页珍藏版)》请在冰豆网上搜索。
人教A版数学选修23培优教程讲义第三章统计案例章末复习
知识系统整合
规律方法收藏
1.两个基本思想
(1)回归分析的基本思想
回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想.
注意理解以下几点:
①确定线性相关关系
线性相关关系有两层含义:
一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系.
判断是否线性相关的依据是样本点的散点图.
②引起预报误差的因素
对于线性回归模型y=bx+a+e,引起预报变量y的误差的因素有两个:
一个是解释变量x,另一个是随机误差e.
③回归方程的预报精度
判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高.
简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.
④回归模型的拟合效果
判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R2的大小判断.
(2)独立性检验的基本思想
独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值很大在一定程度上说明两个分类变量有关系.
进行独立性检验要注意理解以下三个问题:
①独立性检验适用于两个分类变量.
②两个分类变量是否有关系的直观判断:
一是根据2×2列联表计算|ad-bc|,值越大关系越强;
二是观察等高条形图,两个深色条的高度相差越大关系越强.
③独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.
2.两个重要参数
(1)相关指数R2
相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好.
(2)随机变量K2
随机变量K2是用来判断两个分类变量在多大程度上相关的变量.独立性检验就是通过计算K2的观测值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关.
3.两种重要图形
(1)散点图
散点图是进行线性回归分析的主要手段,其作用如下:
一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,那么可以断定两个变量有较好的线性相关关系;
二是判断样本中是否存在异常.
(2)残差图
残差图可以用来判断模型的拟合效果,其作用如下:
一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.
二是确认样本点在采集过程中是否有人为的错误.
学科思想培优
一 线性回归分析
对所抽取的样本的数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.回归分析的过程就是建立回归模型的过程.具体步骤是:
①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画出散点图,观察它们是线性相关的,还是符合哪一种函数模型;③由经验确定回归方程的类型(如线性回归方程,反比例函数模型,指数函数模型,对数函数模型等);④用最小二乘法求回归方程的参数;⑤检查回归模型的拟合程度,如分析残差图,求相关指数R2等.
例1 一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:
零件数x/个
10
20
30
40
50
60
70
80
90
100
加工时间y/min
62
72
75
81
85
95
103
108
112
127
(1)画出散点图,并初步判断是否线性相关;
(2)若线性相关,求回归直线方程;
(3)求出相关指数;
(4)作出残差图;
(5)进行残差分析.
[解]
(1)散点图,如图所示.
由图可知,x,y线性相关.
(2)x与y的关系可以用线性回归模型来拟合,不妨设回归模型为
=
+
x.
将数据代入相应公式可得数据表:
∴
=55,
=92,
∴
=
=
=
≈0.670,
=
-
=92-
×55=
≈55.133,
∴回归直线方程为
=0.670x+55.133.
(3)利用所求回归方程求出下列数据.
∴R2=1-
≈0.983.
(4)∵
i=yi-
i,利用上表中数据作出残差图,如图所示.
(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出回归效果很好.
由残差图也可观察到,第2,5,9,10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.
拓展提升
作残差分析时,一般从以下几个方面予以说明:
(1)散点图;
(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄.
二 独立性检验
独立性检验的基本思想:
独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,与有关的临界值相比较,以确定可信程度.
例2 随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:
常饮酒
不常饮酒
合计
患肝病
2
不患肝病
18
合计
30
已知在全部30人中随机抽取1人,抽到肝病患者的概率为
.
(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?
说明你的理由;
(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?
参考数据:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
[解]
(1)设患肝病中常饮酒的人有x人,
=
,x=6.
常饮酒
不常饮酒
合计
患肝病
6
2
8
不患肝病
4
18
22
合计
10
20
30
由已知数据可求得
K2=
≈8.523>7.879,
因此有99.5%的把握认为患肝病与常饮酒有关.
(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15种,且每种发生的概率是相等的.其中一男一女有(A,E),(A,F),(B,E),(B,F),(C,E),(C,F),(D,E),(D,F),共8种.故抽出一男一女的概率是P=
.
拓展提升
近几年高考中独立性检验与统计知识的综合考查已出现了多次,一般需要根据统计知识完成2×2列联表,然后考查利用独立性检验的方法解决问题,题目难度不大,但有一定的综合性.
三 数形结合思想在独立性检验中的应用
例3 某机构为了了解患色盲是否与性别有关,随机抽取了1000名成年人进行调查.在调查的480名男人中有38名患色盲,520名女人中有6名患色盲,分别利用图形和独立性检验的方法来判断患色盲与性别是否有关.
[解] 根据题目所给的数据作出如下的列联表:
患色盲
未患色盲
总计
男
38
442
480
女
6
514
520
总计
44
956
1000
根据列联表作出相应的等高条形图,如图所示:
图中两个深色条的高分别表示男人和女人中患色盲的频率.从图中可以看出,男人中患色盲的频率明显高于女人中患色盲的频率.
因此我们可以认为患色盲与性别有关.
根据列联表中所给的数据,
得K2的观测值
k=
≈27.139.
因为27.139>10.828,所以我们有99.9%的把握认为患色盲与性别有关系.
拓展提升
“数缺形时少直观,形缺数时难入微”恰当地应用数形是提高解题速度、优化解题过程的一种重要方法.
四 化归与转化思想在非线性回归分析中的应用
例4 下表为收集到的一组数据:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
(1)作出x与y的散点图,并猜测x与y之间的关系;
(2)建立x与y的关系,预报回归模型并计算残差;
(3)利用所得模型,预报x=40时y的值.
[解]
(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.
(2)对两边取对数把指数关系变为线性关系,令z=lny,则有变换后的样本点应分布在直线z=bx+a,a=lnc1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程,数据可以转化为:
x
21
23
25
27
29
32
35
z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
求得回归直线方程为
=0.272x-3.849,
∴
=e0.272x-3.849.
残差列表如下:
yi
7
11
21
24
66
115
325
i
6.443
11.101
19.125
32.950
56.770
128.381
290.325
i
0.557
-0.101
1.875
-8.950
9.23
-13.381
34.675
(3)当x=40时,
=e0.272x-3.849≈1131.
拓展提升
通过取对数的方法把非线性回归问题转化成线性回归问题,起到化难为易的效果.
由Ruize收集整理。
感谢您的支持!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人教A版数学选修23培优教程讲义第三章 统计案例 章末复习 人教 数学 选修 23 教程 讲义 第三 统计 案例 复习