广义线性模型论文.docx
- 文档编号:8368966
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:9
- 大小:26.70KB
广义线性模型论文.docx
《广义线性模型论文.docx》由会员分享,可在线阅读,更多相关《广义线性模型论文.docx(9页珍藏版)》请在冰豆网上搜索。
广义线性模型论文
广义线性模型的
拟似然法
论文题目:
用SAS实现因变量为两值变量的多重logistic回归分析
班级:
学号:
姓名:
用SAS实现因变量为两值变量的多重logistic回归分析
摘要:
Logistic回归分析属于概率型回归分析,适用于因变量为定性变量的数据分析和建模,但对自变量的数目和性质没有特殊要求。
因变量为二值变量的多重logistic回归分析适用于因变量编码为0或1(代表阳性或者阴性)的多重logistic回归分析。
从整体上理解Logistic回归分析,可根据操作过程依次总结为以下几个方面:
自变量筛选、建立回归模型、进行假设检验(包括对回归系数的检验、整体模型检验以及模型拟合优度检验)。
近年来,logistic回归分析在众多临床医学研究,本文重点介绍如何正确实施多重logistic回归分析及其SAS实现及结果分析。
关键词:
logistic两值变量
一、数据:
年龄
复治与否
治疗方案
有效
无效
>50
是
多西他赛联合奥沙利铂
76
4
多西他赛联合顺铂
68
20
否
多西他赛联合奥沙利铂
28
12
多西他赛联合顺铂
20
20
50
是
多西他赛联合奥沙利铂
68
12
多西他赛联合顺铂
48
32
否
多西他赛联合奥沙利铂
8
20
多西他赛联合顺铂
12
16
二、变量解释:
a表示年龄分层,a=0表示年龄>50岁,a=1表示年龄
50岁;
b表示复治与否,b=0表示复治,b=1表示初治;
c表示用药方案,c=0表示使用多西他赛联合奥沙利铂,c=1表示使用多西他赛联合顺铂;
Y=0表示有效,Y=1表示无效
三、程序:
Datals;
doa=0to1;
dob=0to1;
doc=0to1;
doy=0to1;
inputf@@;
output;
end;end;end;end;
cards;
764682028122020
681248328201216
;
proclogistic;
freqf;
modely=abc/selection=stepwise;
run;
四、程序说明:
自变量a、b、c均为两值变量,因变量Y也是两值变量,程序中变量赋值均以0和1来代表每个变量的两种状态。
变量f表示频数,数据分析使用logistic过程,在model语句中一次列出年龄、复治情况和用药方案。
Model语句后面的“selection=stepwise”表示使用逐步回归法法筛选变量。
五、结果及结果分析:
SAS系统
TheLOGISTICProcedure
ModelInformation
DataSet
WORK.LS
ResponseVariable
y
NumberofResponseLevels
2
FrequencyVariable
f
Model
binarylogit
OptimizationTechnique
Fisher'sscoring
NumberofObservationsRead
16
NumberofObservationsUsed
16
SumofFrequenciesRead
464
SumofFrequenciesUsed
464
ResponseProfile
Ordered
Value
y
Total
Frequency
1
0
328
2
1
136
Probabilitymodeledisy=0.
第一部分:
logistic过程产生的第一部分结果主要是模型的信息和关于自变量的说明,因变量为Y,因变量有两个水平,使用的模型是两值的Logic模型,参数估计时的优化方法是Fisher’sscoring法。
读入观测数和使用观测数都是16。
在logistic过程中,默认状态下是以因变量取值小的那个水平的发生概率为基础建模。
在本文中Y=0表示治疗有效,所以是以治疗有效为基础建立概率模型。
StepwiseSelectionProcedure
Step0.Interceptentered:
ModelConvergenceStatus
Convergencecriterion(GCONV=1E-8)satisfied.
-2LogL
=
561.354
ResidualChi-SquareTest
Chi-Square
DF
Pr > ChiSq
70.4581
3
<.0001
Step1.Effectbentered:
ModelConvergenceStatus
Convergencecriterion(GCONV=1E-8)satisfied.
ModelFitStatistics
Criterion
Intercept
Only
Intercept
and
Covariates
AIC
563.354
527.345
SC
567.494
535.625
-2LogL
561.354
523.345
TestingGlobalNullHypothesis:
BETA=0
Test
Chi-Square
DF
Pr > ChiSq
LikelihoodRatio
38.0083
1
<.0001
Score
39.7478
1
<.0001
Wald
37.5022
1
<.0001
ResidualChi-SquareTest
Chi-Square
DF
Pr > ChiSq
33.5589
2
<.0001
Note:
NoeffectsforthemodelinStep1areremoved.
Step2.Effectcentered:
ModelConvergenceStatus
Convergencecriterion(GCONV=1E-8)satisfied.
ModelFitStatistics
Criterion
Intercept
Only
Intercept
and
Covariates
AIC
563.354
512.346
SC
567.494
524.765
-2LogL
561.354
506.346
TestingGlobalNullHypothesis:
BETA=0
Test
Chi-Square
DF
Pr > ChiSq
LikelihoodRatio
55.0081
2
<.0001
Score
55.0454
2
<.0001
Wald
49.1026
2
<.0001
ResidualChi-SquareTest
Chi-Square
DF
Pr > ChiSq
17.4858
1
<.0001
Note:
NoeffectsforthemodelinStep2areremoved.
Step3.Effectaentered:
ModelConvergenceStatus
Convergencecriterion(GCONV=1E-8)satisfied.
ModelFitStatistics
Criterion
Intercept
Only
Intercept
and
Covariates
AIC
563.354
496.640
SC
567.494
513.199
-2LogL
561.354
488.640
TestingGlobalNullHypothesis:
BETA=0
Test
Chi-Square
DF
Pr > ChiSq
LikelihoodRatio
72.7141
3
<.0001
Score
70.4581
3
<.0001
Wald
59.9027
3
<.0001
Note:
NoeffectsforthemodelinStep3areremoved.
第二部分:
模型拟合优度进行检验。
模型拟合统计量包括AIC和SBC和-2倍的对数似然值,应该遵循AIC统计量和SBC统计量最小原则,这三个统计量取值越小,说明模型的拟合优度越好。
由检验结果可见,三种方法统计量均比较小,说明模型拟合的较好。
对回归模型的整体进行假设检验
H0:
回归模型的系数都为零
H1:
至少有一个回归系数不为零
分别用似然比检验、计分检验和Wald检验三种方法。
检验结果给出了
值,自由度和P值,三种方法的p值均小于0.05,说明模型显著成立。
Note:
Alleffectshavebeenenteredintothemodel.
SummaryofStepwiseSelection
Step
Effect
DF
Number
In
Score
Chi-Square
Wald
Chi-Square
Pr > ChiSq
Entered
Removed
1
b
1
1
39.7478
<.0001
2
c
1
2
16.7300
<.0001
3
a
1
3
17.4858
<.0001
AnalysisofMaximumLikelihoodEstimates
Parameter
DF
Estimate
Standard
Error
Wald
Chi-Square
Pr > ChiSq
Intercept
1
2.4097
0.2539
90.0504
<.0001
a
1
-0.9397
0.2282
16.9513
<.0001
b
1
-1.5497
0.2364
42.9609
<.0001
c
1
-0.9511
0.2285
17.3229
<.0001
OddsRatioEstimates
Effect
PointEstimate
95%Wald
ConfidenceLimits
a
0.391
0.250
0.611
b
0.212
0.134
0.337
c
0.386
0.247
0.605
AssociationofPredictedProbabilitiesand
ObservedResponses
PercentConcordant
68.9
Somers'D
0.493
PercentDiscordant
19.6
Gamma
0.557
PercentTied
11.4
Tau-a
0.205
Pairs
44608
c
0.747
第三部分:
在对拟合多重logistic回归分析方程过程中的变量进行筛选时,一般只保留对因变量。
有统计学意义的变量。
这部分结果是回归系数以及优势比的估计结果。
逐步回归发筛选的结果显示a、b、c都是有统计学意义的变量(P<0.0001),均保留在回归方程中。
由此可以写出治疗有效的概率表达式为:
计算优势比估计值发现,>55岁的患者接受治疗后有效的可能性是≤55岁者的0.391倍(95%CI为0.250~o.611);复治的患者接受治疗后有效的可能性是初治患者的o.212倍(95%CI为o.134~o.337);接受多西他赛联合奥沙利铂治疗有效的可能性是多西他赛联合顺铂者的o.386倍(95%CI为o.247~o.605),即多西他赛联合顺铂的疗效优于多西他赛联合奥沙利铂。
六、总结:
本文采用logistic回归分析对患者(分层因素,年龄,是否复发)接受多西他赛联合奥沙利铂治疗和多西他赛联合顺铂治疗的疗效进行了分析,结果显示年龄、复制情况和用药方案都是对疗效有统计学意义的影响因素,根据这三个因素建立的模型预测有效。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广义 线性 模型 论文