必修三--2.3.1变量之间的相关关系PPT文档格式.ppt
- 文档编号:15633689
- 上传时间:2022-11-09
- 格式:PPT
- 页数:43
- 大小:1.31MB
必修三--2.3.1变量之间的相关关系PPT文档格式.ppt
《必修三--2.3.1变量之间的相关关系PPT文档格式.ppt》由会员分享,可在线阅读,更多相关《必修三--2.3.1变量之间的相关关系PPT文档格式.ppt(43页珍藏版)》请在冰豆网上搜索。
作文水平与课外阅读量之间的关系;
人的身高与体重之间的关系;
人的身高与视力之间的关系;
商品销售收入与广告支出经费之间的关系;
粮食产量与施肥量之间的关系;
匀速行驶的车辆的行驶距离与时间在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?
探究思考:
对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性.观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?
年龄年龄2323272739394141454549495050脂肪脂肪9.59.517.817.821.221.225.925.927.527.526.326.328.228.2年龄年龄5353545456565757585860606161脂肪脂肪29.629.630.230.231.431.430.830.833.533.535.235.234.634.6为了确定人体脂肪含量和年龄之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
O45505560652025303540年龄年龄脂肪含量脂肪含量510152025303540在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.观察散点图的大致趋势,两个变量的散点图中点的分布的位置是从左下角到右上角的区域,我们称这种相关关系为正相关。
O45505560652025303540年龄年龄脂肪含量脂肪含量510152025303540O思考:
如果两个变量成负相关,其散点图有什么特点?
结论:
散点图中的点散布在从左上角到右下角的区域.注:
若两个变量散点图呈上图,则不具有相关关系。
例1、以下是2000年某地搜集到的新房屋的销售价格和房屋的面积的数据:
房屋面积(平方米)617011511080135105销售价格(万元)12.215.324.821.618.429.222画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.房屋面积(平方米)617011511080135105销售价格(万元)12.215.324.821.618.429.222结论:
销售价格与房屋面积这两个变量是正相关的.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线。
这条回归直线的方程,简称为回归方程。
二、回归直线O45505560652025303540年龄脂肪含量5101520253035401.如果所有的样本点都落在某一函数曲线上,变量之间具有函数关系2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系3.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系有关说明三、如何具体的求出这个回归方程呢?
O45505560652025303540年龄脂肪含量510152025303540求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小”。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线。
思考:
对一组具有线性相关关系的样本数据:
(x1,y1),(x2,y2),(xn,yn),设其回归方程为可以用哪些数量关系来刻画各样本点与回归直线的接近程度?
.方案1:
先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小时,测出它的斜率和截距,得回归方程。
20253035404550556065年龄脂肪含量0510152025303540如图:
.方案2:
在图中选两点作直线,使直线两侧的点的个数基本相同。
20253035404550556065年龄脂肪含量0510152025303540方案3:
如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距。
而得回归方程。
如图我们还可以找到更多的方法,但这些方法都可行吗?
科学吗?
准确吗?
怎样的方法是最好的?
20253035404550556065年龄脂肪含量0510152025303540我们把由一个变量的变化去推测另一个变量的方法称为回归方法。
设已经得到具有线性相关关系的变量的一组数据:
(设已经得到具有线性相关关系的变量的一组数据:
(xx11,yy11),(),(xx22,yy22),),(,(xxnn,yynn)设所求的回归直线方程为设所求的回归直线方程为其中其中aa,bb是待定的是待定的系数。
当变量系数。
当变量xx取取xx11,xx22,xxnn时,可以得到时,可以得到(i=1i=1,22,nn)它与实际收集得到的它与实际收集得到的之间偏差是之间偏差是(i=1i=1,22,nn)探索过程如下:
探索过程如下:
这样,用这这样,用这nn个偏差的和来个偏差的和来刻画刻画“各点与此直线的整体各点与此直线的整体偏差偏差”是比较合适的。
是比较合适的。
(x1,y1)(x2,y2)(xi,yi)(xn,yn)根据有关数学原理分析,当根据有关数学原理分析,当时,总体偏差时,总体偏差为最小,这样为最小,这样就得到了回归方程,这种求回归方程的方法叫做就得到了回归方程,这种求回归方程的方法叫做最小二乘法最小二乘法.(其中,(其中,b是回归方程的斜率,是回归方程的斜率,a是截距)是截距)0.57765-0.448=37.1利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为由此我们可以根据一个人的年龄预测其体内脂肪含量的百分比的回归值.若某人65岁,则其体内脂肪含量的百分比约为多少?
能不能说他体内脂肪含量一定是37.1?
若某人65岁,可预测他体内脂肪含量在37.1(0.57765-0.448=37.1)附近的可能性比较大。
但不能说他体内脂肪含量一定是37.1原因:
线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差,即使截距斜率没有误差,也不可能百分百地保证对应于x,预报值能等于实际值y例:
有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
11、画出散点图;
、画出散点图;
22、从散点图中发现气温与热饮、从散点图中发现气温与热饮销售杯数之间关系的一般规律;
销售杯数之间关系的一般规律;
33、求回归方程;
、求回归方程;
44、如果某天的气温是、如果某天的气温是22摄氏度,摄氏度,预测这天卖出的热饮杯数。
预测这天卖出的热饮杯数。
1、散点图、散点图22、从图、从图3-13-1看到,各点散布在从左上角到由下角的看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。
即气温越高,卖出去的热饮杯数越少。
33、从散点图可以看出,这些点大致分布在一条直、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式线的附近,因此利用公式11求出回归方程的系数。
求出回归方程的系数。
Y=-2.352x+147.767Y=-2.352x+147.76744、当、当x=2x=2时,时,Y=143.063Y=143.063因此,某天的气温为因此,某天的气温为22摄氏度时,这天大约可以卖出摄氏度时,这天大约可以卖出143143杯热饮。
杯热饮。
例2、(07广东)下表提供了某厂节油降耗技术发行后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据.X3456y2.5344.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据
(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:
32.5+43+54+64.566.5)所求的回归方程为
(2)解:
(3)预测生产100吨甲产品的生产能耗比技改前降低(吨)本节重点知识回顾1、相关关系
(1)概念:
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。
(2)相关关系与函数关系的异同点。
两者均是指两个变量间的关系。
不同点:
函数关系是一种确定关系,是一种因果系;
相关关系是一种非确定的关系,也不一定是因果关系(但可能是伴随关系)。
(3)相关关系的分析方向。
在收集大量数据的基础上,利用统计分析,发现规律,对它们的关系作出判断。
2、两个变量的线性相关
(1)回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析。
通俗地讲,回归分析是寻找相关关系中非确定关系的某种确定性。
(2)散点图A、定义;
B、正相关、负相关。
3、回归直线方程注:
如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不具有相关关系.3、回归直线方程
(1)回归直线:
观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线。
(2)最小二乘法(3)利用回归直线对总体进行估计练习练习2-12-1、观察两相关量得如下数据观察两相关量得如下数据:
xx-1-1-2-2-3-3-4-4-5-55533442211yy-9-9-7-7-5-5-3-3-1-11155337799求两变量间的回归方程求两变量间的回归方程.解:
列表:
解:
ii1122334455667788991010xx-1-1-2-2-3-3-4-4-5-55533442211yy-9-9-7-7-5-5-3-3-1-11155337799xxiyiiyi99141415151212555515151212141499计算得:
计算得:
所求回归直线方程为所求回归直线方程为注意:
求回归直线方程的步骤:
注意:
第一步:
列表第一步:
列表第二步:
计算:
第二步:
第三步:
代入公式计算第三步:
代入公式计算bb,aa的值的值第四步:
列出直线方程。
第四步:
练习2-2、:
给出施化肥量出施化肥量对水稻水稻产量量影响的影响的试验数据:
数据:
施化肥施化肥量量x15202530354045水稻水稻产量量y330345365405445450455
(1)
(1)画出上表的散点画出上表的散点图;
(2)
(2)求出回求出回归直直线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 必修 2.3 变量 之间 相关 关系