书签分享收藏举报版权申诉 / 20

立即下载加入VIP,免费下载

当前位置：首页 > 自然科学 > 生物医学统计分析实验7报告汇总.docx

生物医学统计分析实验7报告汇总.docx

文档编号：6127185
上传时间：2023-01-04
格式：DOCX
页数：20
大小：90.54KB

《生物医学统计分析实验7报告汇总.docx》由会员分享，可在线阅读，更多相关《生物医学统计分析实验7报告汇总.docx（20页珍藏版）》请在冰豆网上搜索。

生物医学统计分析实验7报告汇总.docx

生物医学统计分析实验7报告汇总

评分

大理大学实验报告

2015—2016学年度第2学期

课程名称生物医学统计分析

实验名称回归分析

专业班级2013级生物医学工程

姓名朱广能马凯

学号4424

实验日期2015年12月31日

实验地点工科楼503

一、实验目的

1.熟悉数据管理的相关操作。

2.学会数据的一些基本统计分析方法及操作。

二、实验环境

1.硬件配置：

处理器（Intel（R）Pentium（R）4cpu2.80GHz）、CD-ROM驱动器、鼠标、内存1GB（1024MB）、32位操作系统

2.软件环境：

IBMSPSS_Statistics_19_win32

三、实验内容

（一）回归分析

回归分析通过“回归”过程来实现，该模块主要包括以下几个命令：

自动线性建模；线性（线性回归分析）；曲线估计（曲线回归分析）；二元Logistic（二元Logistic回归分析）；非线性回归分析等。

（二）回归分析的一般方法

1.确定回归方程中的因变量和自变量

2.确定回归模型

3.建立回归方程

4.对回归方程进行各种检验

5.利用回归方程进行检验

（三）一元线性回归分析[Eg8.1]

其分析的任务是根据若干个观测值（xi，yi）i=1，2，…，n找出描述两个变量x与y

之间关系的线性回归方程：

（四）多元线性回归分析（linear过程）[Eg8.2]、[习题1]

在生物医学领域的许多实际问题中，常常需要研究一个因变量与多个自变量间的相关关系。

比如动物的体重同时受体长、身高、胸围等性状的影响。

因此需要进行一个因变量与对个自变量间的回归分析，即多元回归分析。

在多元线性回归分析中，用户可以根据需要，选用不同删选自变量的方法（如：

逐步法、向前法、向后法等）

（五）曲线回归分析（CurveEstimation过程）[Eg8.3]、[习题2]

在实际生产中，因变量x与自变量y间的相关关系并非一定是线性关系，更多的是

各种各样的曲线关系。

在许多情况下，曲线回归可以通过变量转运转换成线性形式

来解决。

曲线回归的基本分析过程是：

先通过变量替换的方法把不满足线性关系的

数据转换为符合线性回归模型的数据，再利用线性回归分析方法建立线性回归方程

并进行显著性检验，然后再转换成曲线回归方程。

（六）生长曲线的方程拟合[Eg8.4]

在生物生长过程中，初始阶段的生物量增长较缓慢，继之速度加快进入快速期，而

后又转入缓慢期，直至停止生长，呈“S”型，称为生长曲线，属于非线性回归。

1.Logistic曲线方程的拟合

2.Gompertz和VonBertalanffy曲线方程的拟合

四、实验结果与分析

[例8.1]建立饲料消耗量对体重的回归方程并对回归关系、回归系数进行检验

表8.1-1饲料消耗和体重的描述性统计量

均值

标准偏差

N

饲料消耗

93.560

3.8816

10

体重

4.980

.4131

10

表8.1-2饲料消耗和体重的相关性分析表

饲料消耗

体重

Pearson相关性

饲料消耗

1.000

.818

体重

.818

1.000

Sig.（单侧）

饲料消耗

.

.002

体重

.002

.

N

饲料消耗

10

体重

10

表8.1-3饲料消耗和体重回归分析的相关模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.818a

.670

.629

2.3656

a.预测变量:

（常量）,体重。

表8.1-4饲料消耗和体重回归分析的Anovab

模型

平方和

df

均方

F

Sig.

1

回归

90.836

1

90.836

16.232

.004a

残差

44.768

8

5.596

总计

135.604

9

a.预测变量:

（常量）,体重。

b.因变量:

饲料消耗

表8.1-5饲料消耗和体重的回归系数a及t检验

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

（常量）

55.263

9.535

5.796

.000

体重X

7.690

1.909

.818

4.029

.004

a.因变量:

饲料消耗

分析：

表8.1-1给出了饲料消耗和体重的描述性统计量；

表8.1-2可见，相关系数r=0.818，显著概率（Sig.）P=0.002<0.01,即体重和饲料消耗之间是极显著正相关关系；

表8.1-3是有关线性回归模型的参数，“R”相当于两个变量的简单相关系数r；“R方”即相关系数的平方值，也称为决定系数r2或拟合度R2，其值为0.670，表示因变量饲料消耗量的变异中有67.0%是由自变量体重的不同造成；“调整R方”是修正的决定系数，为0.629.“标准估计的误差”是估计值的标准误差，记为Syx。

即：

表8.1-4为回归关系的显著性检验的方差分析结果。

可见F=16.232，P=0.004<0.01

表明体重对饲料消耗量存在极显著的线性回归关系，所建立的回归方程是有意义的。

表8.1-5为回归系数表，可见回归系数，可见回归系数b=7.690，截距（常数项）

a=55.263，因此可建立以下回归方程：

截距的标准误差为9.535。

回归系数b的标准误差Sb为1.909，其公式为：

表8-6还给出了回归系数显著性检验结果：

回归系数b检验的统计量t值为4.029，

P=0.004<0.01，截距a检验的统计量t值为5.796，P=0.000<0.01，即体重与饲消

耗量的回归系数均极显著，表明体重与饲料消耗量间存在极显著地线性关系，可用

所建立的回归方程来进行预测和控制。

[例8.2]根据某猪场25头育肥猪4个胴体性状的数据资料，然后进行廋肉量y对其眼肌面积（x1）、腿肉量（x2）、腰肉量（x3）的多元线性回归分析

表8.2-1廋肉量y、眼肌面积（x1）、腿肉量（x2）、腰肉量（x3）的相关性分析

瘦肉量

眼肌面积

腿肉量

腰肉量

Pearson相关性

瘦肉量

1.000

.279

.851

.606

眼肌面积

.279

1.000

.220

.183

腿肉量

.851

.220

1.000

.340

腰肉量

.606

.183

.340

1.000

Sig.（单侧）

瘦肉量

.

.088

.000

.001

眼肌面积

.088

.

.146

.190

腿肉量

.000

.146

.

.048

腰肉量

.001

.190

.048

.

N

瘦肉量

25

眼肌面积

25

腿肉量

25

腰肉量

25

表8.2-2四变量中输入／移去的变量a

模型

输入的变量

移去的变量

方法

1

腿肉量

.

步进（准则:

F-to-enter的概率<=.050，F-to-remove的概率>=.100）。

2

腰肉量

.

步进（准则:

F-to-enter的概率<=.050，F-to-remove的概率>=.100）。

a.因变量:

瘦肉量

模表8.2-3四变量分析的模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.851a

.725

.713

.58237

2

.916b

.838

.824

.45636

a.预测变量:

（常量）,腿肉量。

b.预测变量:

（常量）,腿肉量,腰肉量。

表8.2-4廋肉量y、眼肌面积（x1）、腿肉量（x2）、腰肉量（x3）的方差分析表

模型

平方和

df

均方

F

Sig.

1

回归

20.561

1

20.561

60.624

.000a

残差

7.800

23

.339

总计

28.361

24

2

回归

23.779

2

11.890

57.089

.000b

残差

4.582

22

.208

总计

28.361

24

a.预测变量:

（常量）,腿肉量。

b.预测变量:

（常量）,腿肉量,腰肉量。

c.因变量:

瘦肉量

表8.2-5偏回归系数及其t检验

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

（常量）

2.595

1.586

1.636

.115

腿肉量

2.453

.315

.851

7.786

.000

2

（常量）

1.128

1.298

.870

.394

腿肉量

2.102

.263

.730

8.006

.000

腰肉量

1.976

.503

.358

3.931

.001

表8.2-6已排除的变量c情况

模型

BetaIn

t

Sig.

偏相关

共线性统计量

容差

1

眼肌面积

.097a

.858

.400

.180

.952

腰肉量

.358a

3.931

.001

.642

.884

2

眼肌面积

.057b

.632

.534

.137

.938

a.模型中的预测变量:

（常量）,腿肉量。

b.模型中的预测变量:

（常量）,腿肉量,腰肉量。

c.因变量:

瘦肉量

分析：

首先，将作用最显著的变量引进模型，在此基础上引进对模型作用最显著的第二个变量，引进变量后立即对原来引进的变量进行显著性检验，及时剔除不显著的变量，然后在考虑引进新变量，依次重复，直至既不能再引进变量又不能从模型中踢出变量为止，最后得到最优回归方程。

表8.2-1为各变量相关分析结果，给出了各变量的两两相关系数及其相对应的显著概率值此处不做详解；

表8.2-2表明整个逐步回归过程中引进变量和剔除变量的情况。

表中第一列“模型”表示过程的次序，第二列“输入的变量”表示引进的变量，第三列“移去的变量”表示剔除的变量，第四列“方法”说明引进变量或剔除变量的标准。

表中显示第一次引进的变量是腿肉量x2，建立了模型1，第二次引进的变量是腰肉量x3，建立了模型2，引进的变量没有有被剔除，所以模型2中包含了两个变量：

腿肉量和腰肉量；

表8.2-3说明对回归方程影响最大的变量依次引入回归方程后，复相关系数（R）的

变化。

复相关系数（R）表示自变量与因变量的密切程度。

“标准估计的误差”表示

自变量的影响因素被扣除后，因变量本身的变异（误差），由表8.2-3可见，当“腿

肉量x2”被引入回归方程时，复相关系数R为0.851，估计标准误差为0.58237，当“腰

肉量x3”被引入回归方程时，其R值为0.916，估计标准误差为0.45636，可见自变量

被依次引入回归方程后，其复相关系数（R）逐渐变大，估计标准误差逐渐变小；

表8.2-4给出了回归过程中每一步引入影响最大的变量后，回归关系显著检验的方差分析结果。

在模型1，变量“腿肉量x2”引入回归方程后，F=60.624，P（sig.）≈0，P<0.01;在模型2，变量“腿肉量x2”和“腰肉量x3”引入回归方程后，其F=57.089，P（sig.）≈0，P<0.01，表明两个模型的回归关系的检验均具有非常高的显著性。

表8.2-5给出了两个模型的偏回归系数及相应的t检验结果。

由表8.2-5可知，第一次引入变量的是“腿肉量x2”，所得的第一回归方程为：

y=2.595+2.453x2

第二次引入变量是“腰肉量x3”所得第二回归方程为：

y=1.128+2.102x2+1.976x3

经t检验，腿肉量和腰肉量的P值分别为0.000,0.001，均小于0.01，他们的回归检验均具有非常高的显著性。

表8.2-5还列出各变量的偏回归系数的标准误差、标准系数（标准化回归系数）；

表8.2-6给出了已排除变量的统计信息。

由表可见，在模型1中腰肉量x3的t=3.931，P=0.001<0.01，故腰肉量x3被引入方程；没有引入方程的变量“眼肌面积x1”在模型1和模型2中其P（sig.）分别为0.400和0.534均大于0.05，无显著统计学意义，故为不重要变量。

综上所述，模型2的回归方程y=1.128+2.102x2+1.976x3是最优的回归模型。

[例8.3]测定了8尾雌性鲟鱼的体长和体重，试对鲟鱼体重与体长进行回归分析

表8.3-1鲟鱼体重与体长回归分析的模型汇总和参数估计值

因变量:

体重y

方程

模型汇总

参数估计值

R方

F

df1

df2

Sig.

常数

b1

b2

b3

线性

.914

63.423

1

6

.000

-18.221

.237

对数

.847

33.100

1

6

.001

-110.782

25.481

倒数

.759

18.868

1

6

.005

33.063

-2523.610

二次

.969

78.193

2

5

.000

9.416

-.266

.002

三次

.970

81.565

2

5

.000

.216

.000

7.083E-6

复合

.950

114.098

1

6

.000

.149

1.033

幂

.984

366.517

1

6

.000

2.071E-7

3.649

S

.989

546.101

1

6

.000

5.392

-382.771

增长

.950

114.098

1

6

.000

-1.903

.032

指数

.950

114.098

1

6

.000

.149

.032

自变量为体长x。

图8.3-2体重和体长的S型曲线的拟合效果图

分析：

表8.3-1列出所选择的10种曲线方程的回归系数b0（常数项）、b1、b2、b3，拟合度R2，自由度（df），回归方程显著性检验的F值，显著性概率P（sig.）。

10中曲线拟合结果为：

（1）线性方程：

y=-18.221+0.2373x

（2）对数曲线方程：

y=-110.782+25.4810lnx

（3）逆函数曲线方程：

y=33.0626+（-2523.610/x）

（4）二次曲线方程：

y=9.4158-0.2658x+0.0021x2

（5）三次曲线方程：

y=0.2157+0.000x-0.0003x2+7.08*10-6x3

（6）复合曲线方程：

y=0.1491（1.0327）x

（7）幂函数曲线方程：

y=2.07*107x3.6492

（8）S曲线方程：

y=e（5.3920-382.771）/x

（9）生长曲线方方程：

y=e（-1.9034+0.0322）*x

（10）指数曲线方程：

y=0.149le0.0322x

从表8.3-1中可见，10个曲线模型的F检验的P（sig.）值都远小于0.01，说明模型成立的统计学意义都非常显著，这可能与样本含量太少有关。

拟合度R2的大小表示了回归曲线方程估测的可靠程度的高低，本例拟合度R2最大的是S曲线方程R2=0.989，故相对而言S曲线方程为描述体重与体长关系的最优方程。

图8.3-2是10种曲线方程的拟合效果图。

[例8.4]拟合猪的生长曲线

表8.4-1Logistic模型迭代历史记录b

迭代数a

残差平方和

参数

A

B

K

1.0

15551.156

100.000

1.000

1.1

23290.473

90.124

2.529

-.963

1.2

4423.098

92.385

1.582

.347

2.0

4423.098

92.385

1.582

.347

2.1

2141.362

94.626

3.475

.568

3.0

2141.362

94.626

3.475

.568

3.1

1108.793

100.961

5.484

.558

4.0

1108.793

100.961

5.484

.558

4.1

467.920

111.217

9.487

.675

5.0

467.920

111.217

9.487

.675

5.1

163.151

119.415

13.647

.688

6.0

163.151

119.415

13.647

.688

6.1

65.375

109.469

21.730

.878

7.0

65.375

109.469

21.730

.878

7.1

31.491

111.826

26.322

.891

8.0

31.491

111.826

26.322

.891

8.1

30.700

112.240

26.873

.889

9.0

30.700

112.240

26.873

.889

9.1

30.699

112.308

26.852

.888

10.0

30.699

112.308

26.852

.888

10.1

30.699

112.307

26.855

.888

11.0

30.699

112.307

26.855

.888

11.1

30.699

112.308

26.855

.888

a.主迭代数在小数左侧显示，次迭代数在小数右侧显示。

b.由于连续残差平方和之间的相对减少量最多为SSCON=1.00E-008，因此在23模型评估和11导数评估之后，系统停止运行。

表8.4-2猪的Logistic生长曲线模型参数估计值

参数

估计

标准误

95%置信区间

下限

上限

A

112.308

6.547

94.131

130.484

B

26.855

5.822

10.689

43.021

K

.888

.087

.647

1.130

表8.4-3猪的Logistic生长曲线模型的方差分析表

源

平方和

df

均方

回归

23224.421

3

7741.474

残差

30.699

4

7.675

未更正的总计

23255.120

7

已更正的总计

8772.469

6

因变量:

体重

a.R方=1-（残差平方和）/（已更正的平方和）=.997。

表8.4-4猪的Gompertz生长曲线模型参数估计值

参数

估计

标准误

95%置信区间

下限

上限

A

141.763

13.146

105.263

178.262

B

4.471

0.370

3.443

5.499

K

0.427

0.050

0.288

0.566

表8.4-5VonBertalanffy生长曲线模型参数估计值

参数

估计

标准误

95%置信区间

下限

上限

A

176.764

29.733

94.211

259.316

B

0.861

0.055

0.708

1.014

K

0.270

0.051

0.129

0.411

分析：

表8.4-1列出子模型迭代过程的记录，可见经11次迭代运算后，模型达到收敛标准，得到最优解；

表8.4-2为logistic生长曲线模型参数的估计值，各参数的标准误差及参数95%置信区间的上、下限。

可见logistic模型中A、B和k分别为112.308/26.855和0.888，将A、B和k的值带入方程，得logistic曲线方程：

y=112.308/（1+26.855e-0.888t）

表8.4-3为logistic生长曲线模型的显著性检验的方差分析结果，此外只给出了各变异来源的平方和、均方和自由度。

若需要可自行计算F值，因为是非线性回归，它们只有参考意义。

表下方给出了模型的拟合度R2=0.997，可见拟合优度达到了令人非常满意的程度；

表8.4-4是Gompertz曲线方程模型参数的估计值，可见Gompertz模型中A、B和k分别为141.763、4.471和0.427，将A、B和k值代入方程，得模型的拟合度R2=0.998，Gompertz的曲线方程：

表8.4-5是VonBertalanffy曲线方程模型参数的估计值，参数A、B和k分别为176.764、0.861和0.270，将A、B和k值代入方程，得模型的拟合优度R2=0.997，

VonBertalanffy曲线方程：

y=176.764（1-0.861e-0.270t）3

拟合结果表明3个生长曲线方程的拟合度均高达0.997以上，都可很好地描述生长规律，其中Gompertz模型的拟合度（R2=0.998）最高。

[习题1]试用多元回归方法确定以身高、体重为自变量，体表面积为因变量的回归方程

表1-1描述性统计量

均值

标准偏差

N

体表面积

5.73650

.403441

10

身高

89.130

1.2641

10

体重

13.440

1.6635

10

表1-2身高、体重与体表面积的相关性分析

体表面积

身高

体重

Pearson相关性

体表面积

1.000

.869

.943

身高

.869

1.000

.863

体重

.943

.863

1.000

Sig.（单侧）

体表面积

.

.001

.000

身高

.001

.

.001

体重

.000

.001

.

N

体表面积

10

身高

10

体重

10

表1-3输入／移去的变量b

模型

输入的变量

移去的变量

方法

1

体重,身高a

.

输入

a.已输入所有请求的变量。

b.因变量:

体表面积

表1-4身高、体重、体表面积回归分析的模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.950a

.902

.874

.143346

a.预测变量:

（常量）,体重,身高。

表1-5身高、体重

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 生物医学统计分析实验报告汇总

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：生物医学统计分析实验7报告汇总.docx
链接地址：https://www.bdocx.com/doc/6127185.html

生物医学统计分析实验7报告汇总.docx

热门标签