回归分析的概念和分析报告Word格式.docx
- 文档编号:13428267
- 上传时间:2022-10-10
- 格式:DOCX
- 页数:20
- 大小:254.97KB
回归分析的概念和分析报告Word格式.docx
《回归分析的概念和分析报告Word格式.docx》由会员分享,可在线阅读,更多相关《回归分析的概念和分析报告Word格式.docx(20页珍藏版)》请在冰豆网上搜索。
出来呢?
这就是回归问题要解决的问题,且判断
是否真存在此线性关系.
一.经验公式与最小二乘法:
[例1]纤维的强度与拉伸倍数有关.下表给出的是24个纤维样品的强度与拉伸倍数的实测记录.我们希望通过这表能找出强度y与拉伸倍数x之间的关系式
们将观察值
作为24个点,将它们画在平面上,这图称为散点图,这散点图启示我们,这些点虽然是散乱的,但大体上散布在一条直线的周围.也就是说,拉伸倍数与强度之间大致成线性关系.我们用
(*)
确定,是线性的,要完全确定经验公式,
就要确定(*)中的系数
和
,这里
通常称为
回归系数,关系式
叫做回归方程.
从散点图来看,要找出
是不困难的,在图上划一条直线,使该直线总的来看最“接近”这24个点.于是,这直线在y轴上的截距就是所求的
,它的斜率就是所求的
.几何方法虽然简单,但是太祖糙,而对非线性形式的问题,就几乎无法实行.然
而,它的基本思想,即“使该直线总的说来最接近这24个点”,却是很可取的,问题是把这基本思想精确化,数量化.下面介绍一种方法,求一条直线使其“总的来看最接近这24个点”,这就是最小二乘法.
给定的
个点
那么,对于平面上任意一条直线
:
我们用数量
来刻画点
到直线
的远近程度,于是二元函数
就定量的描述了直线
跟这
个点的总的远近程度,这个量是随不同的直线而变化,或者说是随不同的
而变化的,于是要找一条直线,使得该直线总的来看最“接近”这n个点的问题就转化为:
要找两个数
使得二元函数
在
处达到最小,
即
由于
是
个量平方之和,所以“使
最小”的原则称为平方和最小原则,习惯上称为最小二乘原则.由最小二乘原则求
估计值的方法称为最小二乘法.
按照最小二乘原则,具体求
的问题就是利用极值原理,求解二元一次联立
方程组有唯一解:
于是,对于给定的
,先算出
,再算出
,就得到了所求的回归方程:
可计算[例1]的
因此所求经验公式,即回归方程为
[例2]P.236――― 例1.2
对任意两个相关变量,即使它们不存在线性关系,都可以通过它们的一组观测值用最小二乘法,在形式上求得
的回归直线方程.实际上,如果
没有线性相关关系,所求的回归直线方程是没有意义的.因此建立了回归直线方程之后,还需要判断
间是否真有线性相关关系,这就是回归效果的检验问题.称为回归效果的显著性检验.首先介绍“平方和分解公式”.
二.平方和分解公式与线性相关关系:
对于任意的
组数据
恒有:
+
’
其中
现记
则平方和分解公式是:
证明:
因为
, 并且
=0
所以
即
是回归直线上,
其横坐标为
点的纵坐标,
的平均值也等于
.
我们还可以通过
的均值,进一步说明它们之间的关系.
有了上面这些对于
的分析表明:
(1)
的离差平方和由两部分组成:
回归平方和
和残差平方和
其中
完全由随机因素引起,
(2)
中虽然也有随机因素,但是当
时,主要是由
线性相关关系决定.因而
之比的比值反映了这种线性相关关系与随机因素对
的影响的大小.比值越大,线性相关关系越强.大到什么程度才能说明有线性相关关系,还要进行检验,因而应寻找检验的统计量.
则
.
(参看P.244+3,注意:
这是常用的计算公式)
三.相关性检验:
(1)提出原假设:
(2)选择统计量:
(3)求出在假设
成立的条件下,
(4)选择检验水平
,查第一自由度为
与第二自由度为
.的,
分布表(附表4),得临界值
,使得
(5)根据样本值计算统计量的观察值
,给出拒绝或接受H。
的判断:
当
时,则拒绝H。
;
当
时,则接受H。
如果
值相当大则表明
线性影响较大,就可以认为
间有线性相关关系;
反之,如果
值较小,则没有理由认为
间有线性相关关系.
衡量回归效果的好坏,除了采用回归问题的方差分析外,还可以用统计量
来描述两个变量线性关系的密切程度,当
接近
之间的线性相关程度愈小,反之,当
接近愈大,愈接近1,
之间的线性相关就愈为密切.对一个具体问题,只有当相关系数
的绝对值大到一定程度时才可用回归直线来近似地表示
之间的关系.
对于假设
,由
提供的两钟形式上不同的检验方法,实质上是一回事。
(参看P.243---P.244)
[例3]P.244 ―――例1.4
【例4】钢的含碳量与抗拉强度之间具有相关关系。
抽查某种钢材12根,测得含碳量(%)和抗拉强度(kg/mm
)的观测值如下:
根据这组数据,求
对
的线性回归方程,
解:
(1)计算
与回归系数:
编号
1
1.3
41
1.69
53.3
1681
2
1.4
44
1.96
61.6
1936
3
45
63
2025
4
1.5
43
2.25
64.5
1849
5
1.6
46
2.56
73.6
2116
6
47
75.2
2209
7
1.7
2.89
79.9
8
1.8
3.24
82.8
9
1.9
3.61
87.4
10
2.0
49
4.00
98
2401
11
2.1
4.41
102.9
12
2.2
51
4.84
112.2
2601
总和
20.5
554
35.97
954.4
25660
的线性回归方程:
(2)检验
线性相关性:
取统计量:
,
在假设
,得
计算:
则拒绝H。
即抗拉强度与钢的含碳量之间是真有显著的线性相关关系,
【例5】为了确定老鼠血镕的减少量和注射胰岛素A的剂量之间的关系,将在同样条件下繁殖的7只老鼠注射了不同剂量的胰岛素A,所得数据如下:
计算回归系数:
四.习题:
P.254----1,2
附表相关系数临界值表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 概念 报告