SAS练习题及程序.docx
- 文档编号:12052949
- 上传时间:2023-04-16
- 格式:DOCX
- 页数:24
- 大小:23.08KB
SAS练习题及程序.docx
《SAS练习题及程序.docx》由会员分享,可在线阅读,更多相关《SAS练习题及程序.docx(24页珍藏版)》请在冰豆网上搜索。
SAS练习题及程序
回归分析:
两个变量之间:
1直线多重现性回归(一个岁多个变量)2曲线
样本的代表性数据:
1准确测量(测量方法仪器技术水平)2调查(询问发调查表)过失误差(调查或记录错误)数据本身(异常点)
回归分析中的诊断:
1数据本身(异常点)2贡献性诊断
筛选变量(8):
前进后退逐步回归(多重线性多重LOGISTIC)
多重线性回归结果变量是定量的最好是否合正太分布不管二值还是多重都用多重LOGISTIC
一:
考虑药物种类就是单因素非单组设计
线性回归简单回归(样本量为30的单组二元)
设有30例某病患者,将他们随机均分为两组,第1组用A药治疗,第2组用B药治
疗,对每一位患者均观测性别、年龄、体重、CD34+和微核细胞数(MNC),资料见表2。
表3-29两种药物治疗同一种疾病患者的部分原因和指标的观测结果
药物
编号
性别
年龄(岁)
体重(kg)
MNC(x108/kg)
CD34+(x106/kg)
A
1
男
31
60
4.42
7.07
2
女
43
58
2.67
1.39
3
男
55
58
4.14
2.15
4
男
55
58
3.23
1.58
5
女
35
60
2.54
1.09
6
男
24
58
2.37
1.42
7
男
37
60
2.38
0.48
8
男
37
60
2.58
1.55
9
女
43
60
4.54
2.95
10
男
26
60
1.24
0.31
11
女
38
68
2.43
3.43
12
女
29
73
2.16
1.19
13
男
46
73
3.49
4.36
14
男
43
85
3.06
5.51
15
男
46
85
2.65
2.41
B
1
女
38
55
3.86
4.98
2
男
16
46
6.00
5.88
3
女
28
58
4.57
3.66
4
女
30
60
3.02
1.96
5
女
32
60
3.75
2.66
6
女
38
60
5.41
9.20
7
男
38
68
2.68
3.64
8
男
38
68
2.73
3.06
9
男
46
56
3.99
3.83
10
男
46
56
3.84
1.15
11
男
20
60
5.79
6.54
12
男
20
60
5.23
3.14
13
女
49
57
3.42
2.33
14
男
36
67
4.38
1.93
15
女
43
75
7.60
8.36
请按要求实现如下的统计分析,并给出统计和专业结论。
(1)假定不考虑药物种类、性别、年龄的影响,仅考察CD34+与MNC之间的相互关系和依赖关系(其中MNC是不便观测的定量指标),请选择合适的统计分析方法去处理资料
datalist;
inputzusex1$ageweightcd34mnc@@;
ifsex1='male'thensex=0;
elsesex=1;
cards;
1male31607.074.42
1female43581.392.67
1male55582.154.14
1male55581.583.23
1female35601.092.54
1male24581.422.37
1male37600.482.38
1male37601.552.58
1female43602.954.54
1male26600.311.24
1female38683.432.43
1female29731.192.16
1male46734.363.49
1male43855.513.06
1male46852.412.65
2female38554.983.86
2male16465.886
2female28583.664.57
2female30601.963.02
2female32602.663.75
2female38609.25.41
2male38683.642.68
2male38683.062.73
2male46563.833.99
2male46561.153.84
2male20606.545.79
2male20603.145.23
2female49572.333.42
2male36671.934.38
2female43758.367.6
;
run;
symbol1cv=redv=diamond绘图的点地表示ci=yellowi=rlclm95co=cyan;*SYMBOL语句:
图形符号及线条控制语句,可定义点的颜色、形状与插值方法;symbol1定义绘图1
PROCGPLOTDATA=LIST;绘图数据来源于LIST
PLOTmnc*cd34;mnc纵坐标变量cd横坐标可以写mnc*cd34=’*’指定绘图符号
run;结束一个一般的SAS过程步还在运行
ODSHTML;
PROCCORRDATA=LIST;*FISHER(alpha=0.05biasadj=no)PEARSON;去掉;*就开始运行
VARcd34mnc;VAR指明运行的变量
quit;彻底结束某些过程步某些特定的SAS过程
ODSHTMLCLOSE;
ODSHTML;
optionsls=200;输出的结果中每行可写200个字符在回归分析之前加回归分析中加上参差结果比较多每行通常默认70个PS=500即每页可打500行
PROCREGDATA=LIST;
MODELmnc=cd34/R;R参差分析为了发现数据中的异常点或者异常点的诊断
run;
ODSHTMLCLOSE;
dataddd;*去除异常点后再作一遍;
setlist;
if_n_=30thendelete;
run;
symbolcv=redv=diamondci=yellowi=rlclm95co=black;
PROCGPLOTDATA=ddd;
PLOTmnc*cd34;
run;
ODSHTML;
PROCCORRDATA=dddFISHER(alpha=0.05biasadj=no)PEARSON;
VARcd34mnc;
RUN;
ODSHTMLCLOSE;
ODSHTML;
PROCREGDATA=ddd;
MODELmnc=cd34/RCLICLM;*alpha=0.01;CLI个体值给出置信限单个数值的置信限CL置信限CLM总体均数置信限所有特定X下的Y总体的平均数alpha=0.01按@=0.99算
plotr.*p.;(r.*p)纵轴变量参差P横轴上是Y的估计值在纵轴上找到一个0点划平行于X轴的线其他上下波动则比较直观看出拟合效果上下分布均匀比较好
quit;
ODSHTMLCLOSE;
CoeffVar变异系数一般小于20即写成20%R-Square决定系数Pr > |t|表示俩个截据是0的可能性RootMSE是Error的开方
参差图黄色线Y=Y的估计值参差为0的线没有表现出规律随机的分布
2)研究者希望根据此类疾病患者的“药物种类、性别、年龄、体重、CD34+”的信息,去预测MNC的数值大小,请选择合适的统计分析方法处理资料;
【SAS程序】:
练习2
(1),练习2
(2)
多重线性回归模型优劣的评价标准:
其一,拟合的多重回归方程在整体上有统计学意义;
其二,多重回归方程中各回归参数的估计值的假设检验结果都有统计学意义;
其三,多重回归方程中各回归参数的估计值的正负号与其后的变量在专业上的含义相吻合;
其四,根据多重回归方程计算出因变量的所有预测值在专业上都有意义;
其五,若有多个较好的多重回归方程时,残差平方和较小且多重回归方程中所含的自变量的个数又较少者为最佳。
*做逐步回归;
ODSHTML;
PROCREGdata=list;
MODELmnc=zusexageweightcd34/mnc作为结果变量
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;SLE进入方程水平数SLS剔除水平数STB标准化回归系数那些贡献大那些小针对定量变量(有单位)
quit;
ODSHTMLCLOSE;
dataLIST1;*去除异常点后再作一遍;
setlist;
if_n_=30thendelete;
run;
ODSHTML;
PROCREGdata=list1;
MODELmnc=zusexageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
plotr.*p.;
quit;
ODSHTMLCLOSE;
dataLIST2;*去除异常点后再作一遍;
setlist1;
if_n_=29thendelete;
run;
ODSHTML;
PROCREGdata=list2;
MODELmnc=zusexageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
plotr.*p.;
quit;
ODSHTMLCLOSE;
dataLIST3;*去除异常点后再作一遍;
setlist2;
if_n_=27thendelete;
run;
ODSHTML;
PROCREGdata=list3;
MODELmnc=zusexageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
plotr.*p.;
quit;
ODSHTMLCLOSE;
dataLIST4;*去除异常点后再作一遍;
setlist3;
if_n_=10thendelete;
run;
ODSHTML;
PROCREGdata=list4;
MODELmnc=zusexageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
plotr.*p.;
quit;
ODSHTMLCLOSE;
*前进法;
ODSHTML;
PROCREGdata=list4;
MODELmnc=zusexageweightcd34/
SELECTION=forwardSLE=0.05RSTB;
plotr.*p.;
quit;
ODSHTMLCLOSE;
*做后退法;
ODSHTML;
PROCREGdata=list4;
MODELmnc=zusexageweightcd34/
SELECTION=backwardSLS=0.05RSTB;
plotr.*p.;
quit;
ODSHTMLCLOSE;
*作共线性诊断;
ODSHTML;
PROCREGdata=list4;
MODELmnc=weightcd34/COLLINCOLLINOINT;方差比例法估计共线性方法一方差比方法二方差膨胀因子VIFTOL
quit;
ODSHTMLCLOSE;
datalist;
inputzusex1$ageweightcd34mnc@@;
ifsex1='male'thensex=0;
elsesex=1;
cards;
1male31607.074.42
1female43581.392.67
1male55582.154.14
1male55581.583.23
1female35601.092.54
1male24581.422.37
1male37600.482.38
1male37601.552.58
1female43602.954.54
1male26600.311.24
1female38683.432.43
1female29731.192.16
1male46734.363.49
1male43855.513.06
1male46852.412.65
2female38554.983.86
2male16465.886
2female28583.664.57
2female30601.963.02
2female32602.663.75
2female38609.25.41
2male38683.642.68
2male38683.062.73
2male46563.833.99
2male46561.153.84
2male20606.545.79
2male20603.145.23
2female49572.333.42
2male36671.934.38
2female43758.367.6
;
run;
*下面三个是最优回归子集法;
*R平方选择法(RSQUARE):
;
ODSHTML;
PROCREGdata=list;
MODELmnc=zusexageweightcd34/
SELECTION=RSQUARE;
quit;
ODSHTMLCLOSE;
*修正R平方选择法(ADJRSQ):
;
ODSHTML;
PROCREGdata=list;
MODELmnc=zusexageweightcd34/
SELECTION=ADJRSQ;
quit;
ODSHTMLCLOSE;
*CP法:
;
ODSHTML;
PROCREGdata=list;
MODELmnc=zusexageweightcd34/
SELECTION=CP;
quit;
ODSHTMLCLOSE;
*对选出的组合再作变量筛选;
*做逐步回归;
ODSHTML;
PROCREGdata=list;
MODELmnc=zucd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=weightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST1;*去除异常点后再作一遍;
setlist;
if_n_=30thendelete;
run;
ODSHTML;
PROCREGdata=list1;
MODELmnc=zucd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=weightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST2;*去除异常点后再作一遍;
setlist1;
if_n_=29thendelete;
run;
ODSHTML;
PROCREGdata=list2;
MODELmnc=weightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST3;*去除异常点后再作一遍;
setlist2;
if_n_=27thendelete;
run;
ODSHTML;
PROCREGdata=list3;
MODELmnc=weightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST4;*去除异常点后再作一遍;
setlist3;
if_n_=10thendelete;
run;
ODSHTML;
PROCREGdata=list4;
MODELmnc=weightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=STEPWISESLE=0.3SLS=0.05RSTB;
quit;
ODSHTMLCLOSE;
*前进法;
ODSHTML;
PROCREGdata=list;
MODELmnc=zucd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=weightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=forwardSLE=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST1;*去除异常点后再作一遍;
setlist;
if_n_=30thendelete;
run;
ODSHTML;
PROCREGdata=list1;
MODELmnc=zucd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=weightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=forwardSLE=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST2;*去除异常点后再作一遍;
setlist1;
if_n_=29thendelete;
run;
ODSHTML;
PROCREGdata=list2;
MODELmnc=weightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=forwardSLE=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST3;*去除异常点后再作一遍;
setlist2;
if_n_=27thendelete;
run;
ODSHTML;
PROCREGdata=list3;
MODELmnc=weightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zuageweightcd34/
SELECTION=forwardSLE=0.05RSTB;
MODELmnc=zusexweightcd34/
SELECTION=forwardSLE=0.05RSTB;
quit;
ODSHTMLCLOSE;
dataLIST4;*去除异常点后再作一遍;
setlist3;
if_n_=10thendelete
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 练习题 程序