生物医学统计分析实验7报告汇总.docx
- 文档编号:6127185
- 上传时间:2023-01-04
- 格式:DOCX
- 页数:20
- 大小:90.54KB
生物医学统计分析实验7报告汇总.docx
《生物医学统计分析实验7报告汇总.docx》由会员分享,可在线阅读,更多相关《生物医学统计分析实验7报告汇总.docx(20页珍藏版)》请在冰豆网上搜索。
生物医学统计分析实验7报告汇总
评分
大理大学实验报告
2015—2016学年度第2学期
课程名称生物医学统计分析
实验名称回归分析
专业班级2013级生物医学工程
姓名朱广能马凯
学号4424
实验日期2015年12月31日
实验地点工科楼503
一、实验目的
1.熟悉数据管理的相关操作。
2.学会数据的一些基本统计分析方法及操作。
二、实验环境
1.硬件配置:
处理器(Intel(R)Pentium(R)4cpu2.80GHz)、CD-ROM驱动器、鼠标、内存1GB(1024MB)、32位操作系统
2.软件环境:
IBMSPSS_Statistics_19_win32
三、实验内容
(一)回归分析
回归分析通过“回归”过程来实现,该模块主要包括以下几个命令:
自动线性建模;线性(线性回归分析);曲线估计(曲线回归分析);二元Logistic(二元Logistic回归分析);非线性回归分析等。
(二)回归分析的一般方法
1.确定回归方程中的因变量和自变量
2.确定回归模型
3.建立回归方程
4.对回归方程进行各种检验
5.利用回归方程进行检验
(三)一元线性回归分析[Eg8.1]
其分析的任务是根据若干个观测值(xi,yi)i=1,2,…,n找出描述两个变量x与y
之间关系的线性回归方程:
(四)多元线性回归分析(linear过程)[Eg8.2]、[习题1]
在生物医学领域的许多实际问题中,常常需要研究一个因变量与多个自变量间的相关关系。
比如动物的体重同时受体长、身高、胸围等性状的影响。
因此需要进行一个因变量与对个自变量间的回归分析,即多元回归分析。
在多元线性回归分析中,用户可以根据需要,选用不同删选自变量的方法(如:
逐步法、向前法、向后法等)
(五)曲线回归分析(CurveEstimation过程)[Eg8.3]、[习题2]
在实际生产中,因变量x与自变量y间的相关关系并非一定是线性关系,更多的是
各种各样的曲线关系。
在许多情况下,曲线回归可以通过变量转运转换成线性形式
来解决。
曲线回归的基本分析过程是:
先通过变量替换的方法把不满足线性关系的
数据转换为符合线性回归模型的数据,再利用线性回归分析方法建立线性回归方程
并进行显著性检验,然后再转换成曲线回归方程。
(六)生长曲线的方程拟合[Eg8.4]
在生物生长过程中,初始阶段的生物量增长较缓慢,继之速度加快进入快速期,而
后又转入缓慢期,直至停止生长,呈“S”型,称为生长曲线,属于非线性回归。
1.Logistic曲线方程的拟合
2.Gompertz和VonBertalanffy曲线方程的拟合
四、实验结果与分析
[例8.1]建立饲料消耗量对体重的回归方程并对回归关系、回归系数进行检验
表8.1-1饲料消耗和体重的描述性统计量
均值
标准偏差
N
饲料消耗
93.560
3.8816
10
体重
4.980
.4131
10
表8.1-2饲料消耗和体重的相关性分析表
饲料消耗
体重
Pearson相关性
饲料消耗
1.000
.818
体重
.818
1.000
Sig.(单侧)
饲料消耗
.
.002
体重
.002
.
N
饲料消耗
10
10
体重
10
10
表8.1-3饲料消耗和体重回归分析的相关模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.818a
.670
.629
2.3656
a.预测变量:
(常量),体重。
表8.1-4饲料消耗和体重回归分析的Anovab
模型
平方和
df
均方
F
Sig.
1
回归
90.836
1
90.836
16.232
.004a
残差
44.768
8
5.596
总计
135.604
9
a.预测变量:
(常量),体重。
b.因变量:
饲料消耗
表8.1-5饲料消耗和体重的回归系数a及t检验
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
55.263
9.535
5.796
.000
体重X
7.690
1.909
.818
4.029
.004
a.因变量:
饲料消耗
分析:
表8.1-1给出了饲料消耗和体重的描述性统计量;
表8.1-2可见,相关系数r=0.818,显著概率(Sig.)P=0.002<0.01,即体重和饲料消耗之间是极显著正相关关系;
表8.1-3是有关线性回归模型的参数,“R”相当于两个变量的简单相关系数r;“R方”即相关系数的平方值,也称为决定系数r2或拟合度R2,其值为0.670,表示因变量饲料消耗量的变异中有67.0%是由自变量体重的不同造成;“调整R方”是修正的决定系数,为0.629.“标准估计的误差”是估计值的标准误差,记为Syx。
即:
表8.1-4为回归关系的显著性检验的方差分析结果。
可见F=16.232,P=0.004<0.01
表明体重对饲料消耗量存在极显著的线性回归关系,所建立的回归方程是有意义的。
表8.1-5为回归系数表,可见回归系数,可见回归系数b=7.690,截距(常数项)
a=55.263,因此可建立以下回归方程:
截距的标准误差为9.535。
回归系数b的标准误差Sb为1.909,其公式为:
表8-6还给出了回归系数显著性检验结果:
回归系数b检验的统计量t值为4.029,
P=0.004<0.01,截距a检验的统计量t值为5.796,P=0.000<0.01,即体重与饲消
耗量的回归系数均极显著,表明体重与饲料消耗量间存在极显著地线性关系,可用
所建立的回归方程来进行预测和控制。
[例8.2]根据某猪场25头育肥猪4个胴体性状的数据资料,然后进行廋肉量y对其眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的多元线性回归分析
表8.2-1廋肉量y、眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的相关性分析
瘦肉量
眼肌面积
腿肉量
腰肉量
Pearson相关性
瘦肉量
1.000
.279
.851
.606
眼肌面积
.279
1.000
.220
.183
腿肉量
.851
.220
1.000
.340
腰肉量
.606
.183
.340
1.000
Sig.(单侧)
瘦肉量
.
.088
.000
.001
眼肌面积
.088
.
.146
.190
腿肉量
.000
.146
.
.048
腰肉量
.001
.190
.048
.
N
瘦肉量
25
25
25
25
眼肌面积
25
25
25
25
腿肉量
25
25
25
25
腰肉量
25
25
25
25
表8.2-2四变量中输入/移去的变量a
模型
输入的变量
移去的变量
方法
1
腿肉量
.
步进(准则:
F-to-enter的概率<=.050,F-to-remove的概率>=.100)。
2
腰肉量
.
步进(准则:
F-to-enter的概率<=.050,F-to-remove的概率>=.100)。
a.因变量:
瘦肉量
模表8.2-3四变量分析的模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.851a
.725
.713
.58237
2
.916b
.838
.824
.45636
a.预测变量:
(常量),腿肉量。
b.预测变量:
(常量),腿肉量,腰肉量。
表8.2-4廋肉量y、眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的方差分析表
模型
平方和
df
均方
F
Sig.
1
回归
20.561
1
20.561
60.624
.000a
残差
7.800
23
.339
总计
28.361
24
2
回归
23.779
2
11.890
57.089
.000b
残差
4.582
22
.208
总计
28.361
24
a.预测变量:
(常量),腿肉量。
b.预测变量:
(常量),腿肉量,腰肉量。
c.因变量:
瘦肉量
表8.2-5偏回归系数及其t检验
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
2.595
1.586
1.636
.115
腿肉量
2.453
.315
.851
7.786
.000
2
(常量)
1.128
1.298
.870
.394
腿肉量
2.102
.263
.730
8.006
.000
腰肉量
1.976
.503
.358
3.931
.001
表8.2-6已排除的变量c情况
模型
BetaIn
t
Sig.
偏相关
共线性统计量
容差
1
眼肌面积
.097a
.858
.400
.180
.952
腰肉量
.358a
3.931
.001
.642
.884
2
眼肌面积
.057b
.632
.534
.137
.938
a.模型中的预测变量:
(常量),腿肉量。
b.模型中的预测变量:
(常量),腿肉量,腰肉量。
c.因变量:
瘦肉量
分析:
首先,将作用最显著的变量引进模型,在此基础上引进对模型作用最显著的第二个变量,引进变量后立即对原来引进的变量进行显著性检验,及时剔除不显著的变量,然后在考虑引进新变量,依次重复,直至既不能再引进变量又不能从模型中踢出变量为止,最后得到最优回归方程。
表8.2-1为各变量相关分析结果,给出了各变量的两两相关系数及其相对应的显著概率值此处不做详解;
表8.2-2表明整个逐步回归过程中引进变量和剔除变量的情况。
表中第一列“模型”表示过程的次序,第二列“输入的变量”表示引进的变量,第三列“移去的变量”表示剔除的变量,第四列“方法”说明引进变量或剔除变量的标准。
表中显示第一次引进的变量是腿肉量x2,建立了模型1,第二次引进的变量是腰肉量x3,建立了模型2,引进的变量没有有被剔除,所以模型2中包含了两个变量:
腿肉量和腰肉量;
表8.2-3说明对回归方程影响最大的变量依次引入回归方程后,复相关系数(R)的
变化。
复相关系数(R)表示自变量与因变量的密切程度。
“标准估计的误差”表示
自变量的影响因素被扣除后,因变量本身的变异(误差),由表8.2-3可见,当“腿
肉量x2”被引入回归方程时,复相关系数R为0.851,估计标准误差为0.58237,当“腰
肉量x3”被引入回归方程时,其R值为0.916,估计标准误差为0.45636,可见自变量
被依次引入回归方程后,其复相关系数(R)逐渐变大,估计标准误差逐渐变小;
表8.2-4给出了回归过程中每一步引入影响最大的变量后,回归关系显著检验的方差分析结果。
在模型1,变量“腿肉量x2”引入回归方程后,F=60.624,P(sig.)≈0,P<0.01;在模型2,变量“腿肉量x2”和“腰肉量x3”引入回归方程后,其F=57.089,P(sig.)≈0,P<0.01,表明两个模型的回归关系的检验均具有非常高的显著性。
表8.2-5给出了两个模型的偏回归系数及相应的t检验结果。
由表8.2-5可知,第一次引入变量的是“腿肉量x2”,所得的第一回归方程为:
y=2.595+2.453x2
第二次引入变量是“腰肉量x3”所得第二回归方程为:
y=1.128+2.102x2+1.976x3
经t检验,腿肉量和腰肉量的P值分别为0.000,0.001,均小于0.01,他们的回归检验均具有非常高的显著性。
表8.2-5还列出各变量的偏回归系数的标准误差、标准系数(标准化回归系数);
表8.2-6给出了已排除变量的统计信息。
由表可见,在模型1中腰肉量x3的t=3.931,P=0.001<0.01,故腰肉量x3被引入方程;没有引入方程的变量“眼肌面积x1”在模型1和模型2中其P(sig.)分别为0.400和0.534均大于0.05,无显著统计学意义,故为不重要变量。
综上所述,模型2的回归方程y=1.128+2.102x2+1.976x3是最优的回归模型。
[例8.3]测定了8尾雌性鲟鱼的体长和体重,试对鲟鱼体重与体长进行回归分析
表8.3-1鲟鱼体重与体长回归分析的模型汇总和参数估计值
因变量:
体重y
方程
模型汇总
参数估计值
R方
F
df1
df2
Sig.
常数
b1
b2
b3
线性
.914
63.423
1
6
.000
-18.221
.237
对数
.847
33.100
1
6
.001
-110.782
25.481
倒数
.759
18.868
1
6
.005
33.063
-2523.610
二次
.969
78.193
2
5
.000
9.416
-.266
.002
三次
.970
81.565
2
5
.000
.216
.000
.000
7.083E-6
复合
.950
114.098
1
6
.000
.149
1.033
幂
.984
366.517
1
6
.000
2.071E-7
3.649
S
.989
546.101
1
6
.000
5.392
-382.771
增长
.950
114.098
1
6
.000
-1.903
.032
指数
.950
114.098
1
6
.000
.149
.032
自变量为体长x。
图8.3-2体重和体长的S型曲线的拟合效果图
分析:
表8.3-1列出所选择的10种曲线方程的回归系数b0(常数项)、b1、b2、b3,拟合度R2,自由度(df),回归方程显著性检验的F值,显著性概率P(sig.)。
10中曲线拟合结果为:
(1)线性方程:
y=-18.221+0.2373x
(2)对数曲线方程:
y=-110.782+25.4810lnx
(3)逆函数曲线方程:
y=33.0626+(-2523.610/x)
(4)二次曲线方程:
y=9.4158-0.2658x+0.0021x2
(5)三次曲线方程:
y=0.2157+0.000x-0.0003x2+7.08*10-6x3
(6)复合曲线方程:
y=0.1491(1.0327)x
(7)幂函数曲线方程:
y=2.07*107x3.6492
(8)S曲线方程:
y=e(5.3920-382.771)/x
(9)生长曲线方方程:
y=e(-1.9034+0.0322)*x
(10)指数曲线方程:
y=0.149le0.0322x
从表8.3-1中可见,10个曲线模型的F检验的P(sig.)值都远小于0.01,说明模型成立的统计学意义都非常显著,这可能与样本含量太少有关。
拟合度R2的大小表示了回归曲线方程估测的可靠程度的高低,本例拟合度R2最大的是S曲线方程R2=0.989,故相对而言S曲线方程为描述体重与体长关系的最优方程。
图8.3-2是10种曲线方程的拟合效果图。
[例8.4]拟合猪的生长曲线
表8.4-1Logistic模型迭代历史记录b
迭代数a
残差平方和
参数
A
B
K
1.0
15551.156
100.000
1.000
1.000
1.1
23290.473
90.124
2.529
-.963
1.2
4423.098
92.385
1.582
.347
2.0
4423.098
92.385
1.582
.347
2.1
2141.362
94.626
3.475
.568
3.0
2141.362
94.626
3.475
.568
3.1
1108.793
100.961
5.484
.558
4.0
1108.793
100.961
5.484
.558
4.1
467.920
111.217
9.487
.675
5.0
467.920
111.217
9.487
.675
5.1
163.151
119.415
13.647
.688
6.0
163.151
119.415
13.647
.688
6.1
65.375
109.469
21.730
.878
7.0
65.375
109.469
21.730
.878
7.1
31.491
111.826
26.322
.891
8.0
31.491
111.826
26.322
.891
8.1
30.700
112.240
26.873
.889
9.0
30.700
112.240
26.873
.889
9.1
30.699
112.308
26.852
.888
10.0
30.699
112.308
26.852
.888
10.1
30.699
112.307
26.855
.888
11.0
30.699
112.307
26.855
.888
11.1
30.699
112.308
26.855
.888
a.主迭代数在小数左侧显示,次迭代数在小数右侧显示。
b.由于连续残差平方和之间的相对减少量最多为SSCON=1.00E-008,因此在23模型评估和11导数评估之后,系统停止运行。
表8.4-2猪的Logistic生长曲线模型参数估计值
参数
估计
标准误
95%置信区间
下限
上限
A
112.308
6.547
94.131
130.484
B
26.855
5.822
10.689
43.021
K
.888
.087
.647
1.130
表8.4-3猪的Logistic生长曲线模型的方差分析表
源
平方和
df
均方
回归
23224.421
3
7741.474
残差
30.699
4
7.675
未更正的总计
23255.120
7
已更正的总计
8772.469
6
因变量:
体重
a.R方=1-(残差平方和)/(已更正的平方和)=.997。
表8.4-4猪的Gompertz生长曲线模型参数估计值
参数
估计
标准误
95%置信区间
下限
上限
A
141.763
13.146
105.263
178.262
B
4.471
0.370
3.443
5.499
K
0.427
0.050
0.288
0.566
表8.4-5VonBertalanffy生长曲线模型参数估计值
参数
估计
标准误
95%置信区间
下限
上限
A
176.764
29.733
94.211
259.316
B
0.861
0.055
0.708
1.014
K
0.270
0.051
0.129
0.411
分析:
表8.4-1列出子模型迭代过程的记录,可见经11次迭代运算后,模型达到收敛标准,得到最优解;
表8.4-2为logistic生长曲线模型参数的估计值,各参数的标准误差及参数95%置信区间的上、下限。
可见logistic模型中A、B和k分别为112.308/26.855和0.888,将A、B和k的值带入方程,得logistic曲线方程:
y=112.308/(1+26.855e-0.888t)
表8.4-3为logistic生长曲线模型的显著性检验的方差分析结果,此外只给出了各变异来源的平方和、均方和自由度。
若需要可自行计算F值,因为是非线性回归,它们只有参考意义。
表下方给出了模型的拟合度R2=0.997,可见拟合优度达到了令人非常满意的程度;
表8.4-4是Gompertz曲线方程模型参数的估计值,可见Gompertz模型中A、B和k分别为141.763、4.471和0.427,将A、B和k值代入方程,得模型的拟合度R2=0.998,Gompertz的曲线方程:
表8.4-5是VonBertalanffy曲线方程模型参数的估计值,参数A、B和k分别为176.764、0.861和0.270,将A、B和k值代入方程,得模型的拟合优度R2=0.997,
VonBertalanffy曲线方程:
y=176.764(1-0.861e-0.270t)3
拟合结果表明3个生长曲线方程的拟合度均高达0.997以上,都可很好地描述生长规律,其中Gompertz模型的拟合度(R2=0.998)最高。
[习题1]试用多元回归方法确定以身高、体重为自变量,体表面积为因变量的回归方程
表1-1描述性统计量
均值
标准偏差
N
体表面积
5.73650
.403441
10
身高
89.130
1.2641
10
体重
13.440
1.6635
10
表1-2身高、体重与体表面积的相关性分析
体表面积
身高
体重
Pearson相关性
体表面积
1.000
.869
.943
身高
.869
1.000
.863
体重
.943
.863
1.000
Sig.(单侧)
体表面积
.
.001
.000
身高
.001
.
.001
体重
.000
.001
.
N
体表面积
10
10
10
身高
10
10
10
体重
10
10
10
表1-3输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
体重,身高a
.
输入
a.已输入所有请求的变量。
b.因变量:
体表面积
表1-4身高、体重、体表面积回归分析的模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.950a
.902
.874
.143346
a.预测变量:
(常量),体重,身高。
表1-5身高、体重
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物医学 统计分析 实验 报告 汇总