线性回归方程Word文档格式.docx
- 文档编号:14076349
- 上传时间:2022-10-18
- 格式:DOCX
- 页数:17
- 大小:134.32KB
线性回归方程Word文档格式.docx
《线性回归方程Word文档格式.docx》由会员分享,可在线阅读,更多相关《线性回归方程Word文档格式.docx(17页珍藏版)》请在冰豆网上搜索。
2、知识点梳理
1.线性回归方程
①变量之间的两类关系:
函数关系与相关关系
②制作散点图,判断线性相关关系
③线性回归方程:
(最小二乘法)
最小二乘法:
求回归直线,使得样本数据的点到它的距离的平方最小的方法
注意:
线性回归直线经过定点
2.相关系数(判定两个变量线性相关性):
注:
⑴>
0时,变量正相关;
<
0时,变量负相关;
⑵①越接近于1,两个变量的线性相关性越强;
②接近于0时,两个变量之间几乎不存在线性相关关系。
3.线形回归模型:
⑴随机误差:
我们把线性回归模型,其中为模型的未知参数,称为随机误差。
随机误差
⑵残差:
我们用回归方程中的估计,随机误差,所以是的估计量,故,称为相应于点的残差。
⑶回归效果判定-----相关指数(解释变量对于预报变量的贡献率)
(的表达式中确定)
①得知越大,说明残差平方和越小,则模型拟合效果越好;
②越接近于1,,则回归效果越好。
4.独立性检验(分类变量关系):
(1)分类变量:
这种变量的不同“值”表示个体所属的不同类别的变量。
(2)列联表:
列出两个分类变量的频数表,称为列联表。
(3)对于列联表:
的观测值。
(4)临界值表:
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
如果,就推断“有关系”,这种推断犯错误的概率不超过;
否则,在样本数据中没有发现足够证据支持结论“有关系”。
(5)反证法与独立性检验原理的比较:
反证法原理
在假设下,如果推出矛盾,就证明了不成立。
独立性检
验原理
在假设下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率。
典型例题
1.(2011·
山东)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元
4
2
5
销售额y/万元
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( ).
A.63.6万元B.65.5万元
C.67.7万元D.72.0万元
解析 ∵==,==42,
又=x+必过(,),∴42=×
9.4+,∴=9.1.
∴线性回归方程为=9.4x+9.1.
∴当x=6时,=9.4×
6+9.1=65.5(万元).
答案 B
2.(2011·
江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x/cm
174
176
178
儿子身高y/cm
175
177
则y对x的线性回归方程为( ).
A.=x-1B.=x+1
C.=88+xD.=176
解析 因为==176,
==176,
又y对x的线性回归方程表示的直线恒过点(,),
所以将(176,176)代入A、B、C、D中检验知选C.
答案 C
3.(2011·
陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ).
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(,)
解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的
绝对值越接近1,两个变量的线性相关程度越强,所以A、B错误.C中n
为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误.根据回
归直线方程一定经过样本中心点可知D正确,所以选D.
答案 D
4.(2011·
广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:
小时)与当天投篮命中率y之间的关系:
时间x
1
命中率y
0.4
0.5
0.6
小李这5天的平均投篮命中率为________;
用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.
解析 小李这5天的平均投篮命中率
==0.5,
可求得小李这5天的平均打篮球时间=3.根据表中数据可求得=0.01,=
0.47,故回归直线方程为=0.47+0.01x,将x=6代入得6号打6小时篮球的
投篮命中率约为0.53.
答案 0.5 0.53
5.(2011·
辽宁)调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:
万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:
=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析 由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.
答案 0.254
6.(2011·
安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
2002
2004
2006
2008
2010
需求量(万吨)
236
246
257
276
286
(1)利用所给数据求年需求量与年份之间的回归直线方程=x+;
(2)利用
(1)中所求出的直线方程预测该地2012年的粮食需求量.
解
(1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求回归直线方程.为此对数据预处理如下:
年份-2006
-4
-2
需求量-257
-21
-11
19
29
对预处理后的数据,容易算得=0,=3.2.
=
==6.5,=-b=3.
由上述计算结果,知所求回归直线方程为
-257=(x-2006)+=6.5(x-2006)+3.2,
即=6.5(x-2006)+260.2.①
(2)利用直线方程①,可预测2012年的粮食需求量为
6.5×
(2012-2006)+260.2=6.5×
6+260.2=299.2(万吨).
课堂练习
1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( )
A.=x+1 B.=x+2C.=2x+1D.=x-1
2.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是( )
A.甲B.乙C.甲、乙相同D.不确定
3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得xi=52,yi=228,x=478,xiyi=1849,则其线性回归方程为( )
A.=11.47+2.62xB.=-11.47+2.62x
C.=2.62+11.47xD.=11.47-2.62x
4.下表是某厂1~4月份用水量(单位:
百吨)的一组数据:
月份x
用水量y
4.5
2.5
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是=-0.7x+a,则a等于______.
5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
加工的时间y(小时)
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=bx+a,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?
课后练习
一、选择题
A.=x+1 B.=x+2
C.=2x+1D.=x-1
答案 A
解析 画出散点图,四点都在直线=x+1.
2.下列有关样本相关系数的说法不正确的是( )
A.相关系数用来衡量变量x与y之间的线性相关程度
B.|r|≤1,且|r|越接近于1,相关程度越大
C.|r|≤1,且|r|越接近0,相关程度越小
D.|r|≥1,且|r|越接近1,相关程度越小
3.由一组样本(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程=a+bx,下面有四种关于回归直线方程的论述:
(1)直线=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;
(2)直线=a+bx的斜率是;
(3)直线=a+bx必过(,)点;
(4)直线=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差(yi-a-bxi)2是该坐标平面上所有的直线与这些点的偏差中最小的直线.
其中正确的论述有( )
A.0个B.1个
C.2个D.3个
解析 线性回归直线不一定过点(x1,y1),(x2,y2),…,(xn,yn)中的任何一点;
b=就是线性回归直线的斜率,也就是回归系数;
线性回归直线过点(,);
线性回归直线是平面上所有直线中偏差(yi-a-bxi)2取得最小的那一条.故有三种论述是正确的,选D.
4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有( )
A.b与r的符号相同 B.a与r的符号相同
C.b与r的符号相反D.a与r的符号相反
5.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是( )
A.甲B.乙
C.甲、乙相同D.不确定
6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得xi=52,yi=228,x=478,xiyi=1849,则其线性回归方程为( )
解析 利用回归系数公式计算可得a=11.47,b=2.62,故=11.47+2.62x.
二、填空题
7.下表是某厂1~4月份用水量(单位:
解析 =2.5,=3.5,∵回归直线方程过定点(,),∴3.5=-0.7×
2.5+a.
∴a=5.25.
8.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 方程