第八章回归分析.docx
- 文档编号:5499835
- 上传时间:2022-12-17
- 格式:DOCX
- 页数:22
- 大小:25.53KB
第八章回归分析.docx
《第八章回归分析.docx》由会员分享,可在线阅读,更多相关《第八章回归分析.docx(22页珍藏版)》请在冰豆网上搜索。
第八章回归分析
第八章回归分析
回归分析是处置两个及两个以上变量间线性依存关系的统计方式。
在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。
回归分析确实是用于说明这种依存转变的数学关系。
第一节Linear进程
要紧功能
挪用此进程可完成二元或多元的线性回归分析。
在多元线性回归分析中,用户还可依照需要,选用不同挑选自变量的方式(如:
慢慢法、向前法、向后法,等)。
实例操作
[例]某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。
试用多元回归方式确信以身高、体重为自变量,体表面积为应变量的回归方程。
儿童编号
体表面积(Y)
身高(X1)
体重(X2)
1
2
3
4
5
6
7
8
9
10
数据预备
激活数据治理窗口,概念变量名:
体表面积为Y,保留3位小数;身高、体重别离为X1、X2,1位小数。
输入原始数据,结果如图所示。
图原始数据的输入
统计分析
激活Statistics菜单项选择Regression中的Linear...项,弹出LinearRegression对话框(如图示)。
从对话框左侧的变量列表当选y,点击Ø钮使之进入Dependent框,选x1、x2,点击Ø钮使之进入Indepentdent(s)框;在Method处下拉菜单,共有5个选项:
Enter(全数入选法)、Stepwise(慢慢法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。
本例选用Enter法。
点击OK钮即完成份析。
图线性回归分析对话框
用户还可点击Statistics...钮选择是不是作变量的描述性统计、回归方程应变量的可信区间估量等分析;点击Plots...钮选择是不是作变量散布图(本例要求对标准化Y预测值作变量散布图);点击Save...钮选择对回归分析的有关结果是不是作保留(本例要求对依照所确信的回归方程求得的未校正Y预测值和标准化Y预测值作保留);点击Options...钮选择变量入选与剔除的α、β值和缺失值的处置方式。
结果说明
在结果输出窗口中将看到如下统计数据:
****MULTIPLEREGRESSION****
ListwiseDeletionofMissingData
EquationNumber1DependentVariable..Y
BlockNumber1.Method:
EnterX1X2
Variable(s)EnteredonStepNumber
1..X2
2..X1
MultipleR.94964
RSquare.90181
AdjustedRSquare.87376
StandardError.14335
AnalysisofVariance
DFSumofSquaresMeanSquare
Regression2.66052
Residual7.14384.02055
F=SignifF=.0003
------------------VariablesintheEquation------------------
VariableBSEBBetaTSigT
X1.068701.074768.215256.919.3887
X2.183756.056816.757660.0144
(Constant).6495
EndBlockNumber1Allrequestedvariablesentered.
结果显示,本例以X1、X2为自变量,Y为应变量,采纳全数入选法成立回归方程。
回归方程的复相关系数为,决定系数(即r2)为,经方差分析,F=,P=,回归方程有效。
回归方程为Y=+。
本例要求按所成立的回归方程计算Y预测值和标准化Y预测值(所谓标准化Y预测值是指将依照回归方程求得的Y预测值转化成按均数为0、标准差为1的标准正态散布的Y值)并将计算结果保留入原数据库。
系统将原始的X1、X2值代入方程求Y值预测值(即库中pre_1栏)和标准化Y预测值(即库中zpr_1栏),详见图。
图计算结果的保存
本例还要求对标准化Y预测值作变量散布图,系统将绘制的统计图送向ChartCarousel窗口,双击该窗口可见以下图显示结果。
图对标准化Y预测值所作的正态分布图
第二节CurveEstimation进程
要紧功能
挪用此进程可完成以下有关曲线拟合的功能:
一、Linear:
拟合直线方程(事实上与Linear进程的二元直线回归相同,即Y=b0+b1X);
二、Quadratic:
拟合二次方程(Y=b0+b1X+b2X2);
3、Compound:
拟合复合曲线模型(Y=b0×b1X);
4、Growth:
拟合等比级数曲线模型(Y=e(b0+b1X));
五、Logarithmic:
拟合对数方程(Y=b0+b1lnX)
六、Cubic:
拟合三次方程(Y=b0+b1X+b2X2+b3X3);
7、S:
拟合S形曲线(Y=e(b0+b1/X));
八、Exponential:
拟合指数方程(Y=b0eb1X);
九、Inverse:
数据按Y=b0+b1/X进行变换;
10、Power:
拟合乘幂曲线模型(Y=b0Xb1);
1一、Logistic:
拟合Logistic曲线模型(Y=1/(1/u+b0×b1X)。
实例操作
[例]某地1963年调查得儿童年龄(岁)X与锡克实验阴性率(%)Y的资料如下,试拟合对数曲线。
年龄(岁)
X
锡克试验阴性率(%)
Y
1
2
3
4
5
6
7
数据预备
激活数据治理窗口,概念变量名:
锡克实验阴性率为Y,年龄为X,输入原始数据。
统计分析
激活Statistics菜单项选择Regression中的CurveEstimation...项,弹出CurveEstimation对话框(如图示)。
从对话框左侧的变量列表当选y,点击Ø钮使之进入Dependent框,选x,点击Ø钮使之进入Indepentdent(s)框;在Model框内选择所需的曲线模型,本例选择Logarithmic模型(即对数曲线);选Plotmodels项要求绘制曲线拟合图;点击Save...钮,弹出CurveEstimation:
Save对话框,选择Predictedvalue项,要求在原始数据库中保留依照对数方程求出的Y预测值,点击Continue钮返回CurveEstimation对话框,再点击OK钮即可。
图曲线拟合对话框
结果说明
在结果输出窗口中将看到如下统计数据:
ndependent:
X
DependentMthRsq.FSigfb0b1
YLOG.9135.001
在以X为自变量、Y为应变量,采纳对数曲线拟合方式成立的方程,决定系数R2=(接近于1),作拟合优度查验,方差分析说明:
F=,P=,拟合度专门好,对数方程为:
Y=+。
本例要求绘制曲线拟合图,结果如下图。
图对数曲线拟合情形
依照方程Y=+,将原始数据X值代入,求得Y预测值(变量名为fit_1)存入数据库中,参见图。
图计算结果的保存
第三节Logistic进程
要紧功能
挪用此进程可完成Logistic回归的运算。
所谓Logistic回归,是指应变量为二级计分或二类评定的回归分析,这在医学研究中常常碰到,如:
死亡与否(即生、死二类评定)的概率跟病人自身生理状况和所患疾病的严峻程度有关;对某种疾病的易感性的概率(患病、不患病二类评定)与个体性别、年龄、免疫水平等有关。
此类问题的解决都可借助逻辑回归来完成。
专门指出,本节介绍的Logistic进程,应与日常所说的Logistic曲线模型(即S或倒S形曲线)相区别。
用户若是要拟合Logistic曲线模型,可挪用本章第二节CurveEstimation进程,系统提供11种曲线模型,其中含有Logistic曲线模型(参见上节)。
在一样的多元回归中,假设以P(概率)为应变量,那么方程为P=b0+b1X1+b2X2+…+bkXk,
但用该方程计算时,常会显现P>1或P<0的不合理情形。
为此,对P作对数单位转换,即logitP=ln(P/1-P),于是,可取得Logistic回归方程为:
eb0+b1X1+b2X2+…+bkXk
P=———————————
1+eb0+b1X1+b2X2+…+bkXk
实例操作
[例]某医师研究男性胃癌患者发生术后院内感染的阻碍因素,资料如下表,请通过Logistic回归统计方式对要紧阻碍因素进行分析。
术后感染
(有无)
Y
年龄
(岁)
X1
手术创伤程度
(5等级)
X2
营养状态
(3等级)
X3
术前预防性抗菌
(有无)
X4
白细胞数
(×109/L)
X5
癌肿病理分度
(TNM得分总和)
X6
有
有
无
无
无
有
无
有
有
无
无
无
无
无
无
69
72
57
41
32
65
58
54
55
59
64
36
42
48
50
4
5
3
1
1
3
3
4
2
1
2
1
3
4
1
2
3
2
1
1
3
2
2
2
1
2
1
1
2
2
无
无
无
有
有
有
有
无
有
有
无
有
有
有
有
9
6
4
5
5
5
6
6
7
4
6
8
6
5
4
数据预备
激活数据治理窗口,概念变量名:
术后感染为Y(字符变量,有输入Y、无输入N),年龄为X1,手术创伤程度为X2,营养状态为X3,术前预防性抗菌为X4(字符变量,有输入Y、无输入N),白细胞数为X5,癌肿病理分度为X6。
按要求输入原始数据。
统计分析
激活Statistics菜单项选择Regression中的Logistic...项,弹出LogisticRegression对话框(如图示)。
从对话框左侧的变量列表当选y,点击Ø钮使之进入Dependent框,选x1、x2、x3、x4、x5和x6,点击Ø钮使之进入Covariates框;点击Method处的下拉按钮,系统提供7种方式:
图逻辑回归对话框
1、Enter:
所有自变量强制进入回归方程;
2、Forward:
Conditional:
以假定参数为基础作似然比概率查验,向前慢慢选择自变量;
3、Forward:
LR:
以最大局部似然为基础作似然比概率查验,向前慢慢选择自变量;
4、Forward:
Wald:
作Wald概率统计法,向前慢慢选择自变量;
5、Backward:
Conditional:
以假定参数为基础作似然比概率查验,向后慢慢选择自变量;
6、Backward:
LR:
以最大局部似然为基础作似然比概率查验,向后慢慢选择自变量;
7、Backward:
Wald:
作Wald概率统计法,向后慢慢选择自变量。
本例选用Forward:
Conditional法,以便选择有要紧作用的阻碍因素;点击Options...钮,弹出LogisticRegression:
Options对话框,在Display框当选取Atlaststep项,要求只显示最终计算结果,点击Continue钮返回LogisticRegression对话框,再点击OK钮即可。
结果说明
在结果输出窗口中将看到如下统计数据:
DependentVariableEncoding:
OriginalInternal
ValueValue
y0
n1
Parameter
ValueFreqCoding
(1)
X4n5
y10
系统先对字符变量进行从头赋值,关于应变量Y,回答是(Y)的赋值为0,回答否(X)的赋值为1;关于应变量X4,回答是(Y)的赋值为-1,回答否(X)的赋值为1。
DependentVariable..Y
BeginningBlockNumber0.InitialLogLikelihoodFunction
-2LogLikelihood
*Constantisincludedinthemodel.
BeginningBlockNumber1.Method:
ForwardStepwise(COND)
Improv.ModelCorrect
StepChi-Sq.dfsigChi-Sq.dfsigClass%Variable
11.0041.004IN:
X3
21.0092.000IN:
X6
Nomorevariablescanbedeletedoradded.
EndBlockNumber1PIN=.0500Limitsreached.
FinalEquationforBlock1
Estimationterminatedatiterationnumber12because
LogLikelihooddecreasedbylessthan.01percent.
-2LogLikelihood
GoodnessofFit
Chi-SquaredfSignificance
ModelChi-Square2.0005
Improvement1.0093
ClassificationTableforY
Predicted
ynPercentCorrect
y|n
Observed+———+———+
yy|4|1|%
+———+———+
nn|0|10|%
+———+———+
Overall%
----------------------VariablesintheEquation-----------------------
VariableB.WalddfSigRExp(B)
X3.01051.9184.0000.0000
X6.00911.9241.0000.0000
Constant.01141.9149
结果说明,第一步自变量X3入选,方程分类能力达%;第二步自变量X6入选,方程分类能力达%(参见结果中的分类分析表);方程有效性经χ2查验,χ2=,P=。
Logistic回归的分类概率方程为:
P=——————————————
1+依照该方程,假设一胃癌患者营养状态评分(X3)为3,癌肿病理分度(X6)为9,那么其P=×10-27≈0,这意味着术后将发生院内感染;另一胃癌患者营养状态评分(X3)为1,癌肿病理分度(X6)为4,那么其P=≈1,这意味着术后将可不能发生院内感染。
第四节Probit进程
要紧功能
挪用此进程可完成剂量-效应关系的分析。
通过概率单位使剂量-效应的S型曲线关系转化成直线,从而利用回归方程推算各效应水平的相应剂量值。
实例操作
[例]研究抗疟药环氯胍对小白鼠的毒性,实验结果如下表所示。
试计算环氯胍的半数致死剂量。
剂量(mg/kg)
动物数
死亡数
12
9
7
6
5
4
3
5
7
19
34
38
12
5
5
6
11
17
12
2
0
数据预备
激活数据治理窗口,概念变量名:
剂量为DOSE、实验动物数为OBSERVE、死亡动物数为DEATH。
然后输入原始数据。
统计分析
激活Statistics菜单项选择Regression中的Probit...项,弹出ProbitAnalysis对话框(如图示)。
从对话框左侧的变量列表当选death,点击Ø钮使之进入ResponseFrequency框;选observe,点击Ø钮使之进入TotalObserved框;选dose,点击Ø钮使之进入Covariate(s)框,并下拉Transform菜单,选Logbase10项(即要求对剂量进行以10为底的对数转换)。
图剂量-效应关系分析对话框
系统在Model栏中提供两种模型,一是概率单位模型(Probit),另一是比数比自然对数模型(Logit)。
本例选用概率单位模型。
点击Options...钮,弹出ProbitAnalysis:
Options对话框,在NaturalResponseRate栏选Calculatefromdata项,要求计算各剂量组的实际反映率。
以后点击Continue钮返回ProbitAnalysis对话框,再点击OK钮即可。
结果说明
在结果输出窗口中将看到如下统计数据:
系统第一显示,共有7组原始数据采概率单位模型进行分析。
回归方程的各参数在通过14次叠代运算后确信,即PROBIT=-。
该方程拟合优度χ2查验结果,χ2=,P=,拟合良好。
DATAInformation
7unweightedcasesaccepted.
0casesrejectedbecauseofmissingdata.
0casesareinthecontrolgroup.
0casesrejectedbecauseLOG-transformcan'tbedone.
MODELInformation
ONLYNormalSigmoidisrequested.
NaturalResponseratetobeestimated
CONTROLgroupisnotprovided.
Parameterestimatesconvergedafter14iterations.
Optimalsolutionfound.
ParameterEstimates(PROBITmodel:
(PROBIT(p))=Intercept+BX):
RegressionCoeff.StandardErrorCoeff./.
DOSE
InterceptStandardErrorIntercept/.
EstimateofNaturalResponseRate=.000000with.=.26448
PearsonGoodness-of-FitChiSquare=.833DF=4P=.934
SinceGoodness-of-FitChisquareisNOTsignificant,noheterogeneity
factorisusedinthecalculationofconfidencelimits.
Covariance(below)andCorrelation(above)MatricesofParameterEstimates
DOSENATRESP
DOSE.82927
NATRESP.52601.06995
接着,系统显示剂量对数值(DOSE)、实际观看例数(NumberofSubjects)、实验动物反映数(ObservedResponses)、预期反映数(ExpectedResponses)、残差(Residual)和效应的概率(Prob)。
以后,显示各效应概率水平的剂量值及其95%可信区间值,按本例要求,环氯胍的半数致死剂量(即Prob=时)为,其95%可信区间为—。
ObservedandExpectedFrequencies
NumberofObservedExpected
DOSESubjectsResponsesResponsesResidualProb
.196.96082
.95.083.84534
.85.64320
.78.427.48745
.70.312.30757
.60.318.14016
.48.0.171.03413
ConfidenceLimitsforEffectiveDOSE
95%ConfidenceLimits
ProbDOSELowerUpper
.01.02752
.02.04534
.03.06223
.04.07895
.05.09580
.06.11294
.07.13047
.08.14845
.09.16694
.10.18597
.15.29060
.20.41395
.25.56021
.30.73436
.35.94261
.40
.45
.50
.55
.60
.65
.70
.75
.80
.85
.90
.91
.92
.93
.94
.95
.96
.97
.98
.99
最后,系统输出以剂量对数值为自变量X、以概率单位为应变量Y的回归直线散点图,从图中各点的散布状态亦可看出,回归直线的拟合程度是专门好的。
图剂量-效应关系回归直线散点图
第五节Nonlinear进程
要紧功能
挪用此进程可完成非线性回归的运算。
所谓非线性回归,即为曲线型的回归分析,一些曲线模型咱们已在本章第二节中述及。
但在医学研究中经,还常常会碰到除本章第二节中述及的曲线模型,对此,SPSS提供Nonlinear进程让用户依如实际需要,成立各类曲线模型以用于研究变量间的彼此关系。
在医学中,如细菌繁衍与培育时刻关系的研究即可借助Nonlinear进程完成。
下面一些曲线模型是在论文中较常
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 章回 分析