硕士SAS实验指导书Word文档下载推荐.docx
- 文档编号:22048155
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:20
- 大小:116.41KB
硕士SAS实验指导书Word文档下载推荐.docx
《硕士SAS实验指导书Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《硕士SAS实验指导书Word文档下载推荐.docx(20页珍藏版)》请在冰豆网上搜索。
交互式方式
操作:
鼠标右击SAS浏览器中的图标“逻辑库”,出现如图的“新建逻
辑库”窗口。
实验二编写程序构造SAS数据集
学会根据所给数据构造符合要求的SAS数据集。
1、分析题目。
2、编写程序。
3、输出结果分析。
4、将实验内容写成word文件以邮件形式发到老师指定的邮箱。
一、题目。
处理
田块测量值
I
11.9802.1002.0901.8302.060
1.0801.1661.1340.8901.155
22.1501.8401.9802.2002.160
1.1960.9801.2101.2651.173
32.2602.2002.0502.1002.200
1.3441.2881.2191.3501.173
II
12.2102.4002.0002.1702.180
1.1441.1551.2761.3441.265
22.4402.4102.6902.2302.400
1.3921.3252.3461.3201.560
31.9902.3702.0402.2702.280
1.2391.3571.3441.1441.232
III
11.9402.0701.9102.0002.100
1.2421.1001.1961.1221.431
22.1601.9001.9801.9202.200
1.1221.1960.9601.0291.288
32.1002.0802.0002.2002.200
1.3441.2721.4001.0001.288
根据以上数据构造出合适的SAS数据集。
二、编程。
三、输出结果分析。
四、交作业
作业格式:
1、写成word文件
2、作业包括四部分内容
作业题目:
程序代码:
输出结果:
结果分析:
实验三excel表与SAS数据集相互转换
实验目的
掌握SAS9.0系统下的“导入数据”命令与“导出数据”命令。
实验内容
1、建立一个excel表
2、用“导入数据”命令将excel文件导入,转换为SAS数据集文件
3、产生一个SAS数据集
4、用“导出数据”命令将SAS数据集文件导出为excel文件
5、将实验内容写成word文件以邮件形式发到老师的邮箱。
实验步骤
一、建立一个excel表
表的内容自己定。
二、用“导入数据”命令将excel文件导入,转换为SAS数据集文件
“文件”→“导入数据”,将第一步中建立的数据集文件转换为SAS数据集文件。
三、编程产生一个SAS数据集文件
四、将刚产生的数据集文件转换为excel文件
使用“导出数据”命令。
五、交作业
把建立的excel文件以及通过转换得到的SAS数据集文件发给老师。
实验四编程计算相关
掌握相关分析过程。
1、分析题目
2、编写程序
3、用交互式方法进行相关分析
4、分析运行结果
5、将实验内容写成word文件以邮件形式发到老师邮箱。
一、分析题目
【例3】为了分析四川绵阳地区1983年生中山柏逐日生长量y(㎝)与4个气候因素:
平均气温x1(℃)、月降雨量x2(㎜)、月平均日照时数x3和月平均湿度x4的关系,对如下原始数据,进行相关分析。
数据取自袁嘉祖编著《灰色系统理论及其应用》,1991年,科学出版社。
月份x1x2x3x4y
14.217.054.581.00.01
27.410.873.879.00.50
310.017.484.775.01.50
416.119.7137.075.010.80
521.1248.7149.677.013.00
623.972.2109.579.016.30
724.796.9101.683.018.00
824.5269.5164.686.019.30
922.0194.881.683.014.80
1018.058.184.082.010.30
1113.14.979.381.08.00
126.812.666.582.01.00
由上面的实验数据不难得出n个变量的相关表如下:
x1x2x3x4y
x11.0000000.7148210.6904900.2919830.983387
x21.0000000.7018420.3843260.709370
x31.000000-0.0509380.704429
x41.0000000.373573
二、编写程序
相关过程corr
三、交互式方式实现相关分析
1.建立SAS数据集
2.菜单项:
“分析”→“分析家”→“相关分析”
四、输出结果分析
五、交作业
实验五编程构造复杂SAS数据集
掌握SAS语言的基本编程。
3、查看运行结果
4、将实验内容写成word文件以邮件形式发到老师邮箱。
根据下表所给数据,
经验分类
样本号
x1
x2
G1
1
2
3
4
5
6
7
8
9
10
11
261.01
185.39
249.58
137.13
231.34
231.38
260.25
259.51
273.84
303.59
231.03
7.36
5.99
6.11
4.35
8.79
8.53
10.02
9.79
6.15
G2
308.90
258.69
355.54
476.69
316.12
274.57
409.42
8.49
7.16
9.43
11.32
8.17
9.67
10.49
G3
330.34
331.47
352.50
347.31
189.56
9.61
13.72
11.00
11.19
6.94
编写SAS程序,在输出窗口产生如下所示的SAS数据集:
Obsijx1x2
111261.017.36
212185.395.99
313249.586.11
414137.134.35
515231.348.79
616231.388.53
717260.2510.02
818259.519.79
919273.848.79
10110303.598.53
11111231.036.15
1221308.908.49
1322258.697.16
1423355.549.43
1524476.6911.32
1625316.128.17
1726274.579.67
1827409.4210.49
1931330.349.61
2032331.4713.72
2133352.5011.00
2234347.3111.19
2335189.566.94
三、查看运行结果
实验六方差分析
掌握方差分析的过程,包括平衡实验设计的方差分析过程(ANOVA)、嵌套随机模型的方差分析的过程(NESTED)、不平衡试验设计一版模型的方差分析过程(GLM)。
2、编写程序
3、交互式方式实现方差分析
4、输出结果分析
5、将实验内容写成word文件以邮件形式发到老师邮箱。
一、题目
1、用二氧化硅(SiO2,原著中译为二氧化矽)50mg对大鼠染尘后,不同时期全肺湿重的变化如表8-1。
试比较染尘后1月、3月、6月,三个时期的全肺湿重有无差别(单因素三个水平,完全随机平衡设计的方差分析)?
(杨树勤,卫生统计学,第2版,人民卫生出版社,1989,41)
表10-1不同时期全肺湿重
1月
3月
6月
3.3
4.4
3.6
4.3
3.4
5.1
4.1
4.2
5.0
4.7
5.5
(选做)2、已知3组贫血患者,其血红蛋白浓度(X1,%)及红细血胞计数(X2,
/m
)的数据如表8-1。
试做多因素方差分析。
(史秉璋,医用多元分析,人民卫生出版社,1990,13)
表8-13组贫血病患者的观察值
a组
b组
c组
X1X2
3.9210
4.8270
4.4250
4.2190
4.7180
3.7305
3.7240
5.4230
2.9240
4.0170
4.5330
4.4220
4.6270
3.3230
5.2230
4.5195
2.7160
5.9290
3.8275
2.4260
5.5220
3.7310
3.6240
4.3290
5.5180
5.1290
2.9200
3.3300
二、编写程序
1、数据步
创建SAS数据集。
2、过程步
使用ANOVA分析过程与GLM分析过程。
三、交互式方式实现方差分析
1、创建SAS数据集
2、菜单项:
“分析”→“分析家”→“方差分析”→“因素方差分析”
四、分析输出结果
比较那组的作用最显著
实验七一元线性回归分析、二次回归曲面分析
掌握一元线性回归分析过程REG、多项式回归分析过程RSREG。
1、分析题目
3、分析输出结果
4、实验内容写成word文件以邮件形式发到老师邮箱。
一、题目
1、某地一年级12名女大学生的体重愈肺活量数据如表7-1。
试作肺活量
(L)对体重(kg)的直线回归分析。
(杨树勤,卫生统计学,人民卫生出版社,第3版,1999,99)
表7-1女大学生的体重遇肺活量数据
体重(kg),X
42
46
50
52
58
肺活量(L),Y
2.55
2.20
2.75
2.40
2.80
2.81
3.41
3.10
3.46
2.85
3.50
3.00
(选做)2、在林木生物量生产率研究中,为了了解林地施肥量(x1,kg)、灌水量(x2,10
)与生物量(Y,kg)的关系,在同一林区共进行了20次试验,观察值见表5.1,试建立Y关于x1,x2的线性回归方程。
(袁志发,周静芋,多元统计分析,科学出版社,P112)
表7-2
观察值
N
12
13
14
15
16
17
18
19
20
X1
54
61
70
63
79
68
65
76
71
82
75
92
96
91
85
106
90
X2
29
39
26
48
64
45
30
51
44
36
60
62
47
72
Y
53
59
67
73
74
78
80
87
84
88
(选做)3、经原始数据计算x1,x2,x3,x4与Y的增广相关阵为
=
试用逐步回归法建立Y关于x1,x2,x3,x4的最优回归方程(原始数据n=13)。
(袁志发,周静芋,多元统计分析,科学出版社,P139)
(选做)4、某医科大学生物教研室用已知浓度的免疫球蛋白(IgA,
g)作火箭电泳,测得火箭的高度(Y,mm)如表7-4。
试求免疫球蛋白(X)与火箭高度(Y)的回归(标准)曲线。
(金丕焕,应用统计方法,上海医科大学出版社,1993,130)
表7-4免疫球蛋白与火箭高度数据
IgA(
g),x
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
火箭高度,Y
7.6
12.3
15.7
18.2
18.7
21.4
22.6
23.8
1、数据步:
产生数据集。
2、过程步:
使用REG分析过程
三、分析输出结果
1、误差均方根,确定系数,因变量均值,校正,变异系数
2、直线回归方程
四、交作业
实验八做聚类分析
掌握聚类分析过程CLUSTER。
1、利用最短距离法对我国几个良种黄牛品种进行聚类。
选定7个良种黄牛品种为:
秦川牛品种为:
秦川牛、晋南牛、南阳牛、延边牛、复州牛、鲁西牛、郏县红牛。
指标选为血红蛋白(Hb)多态型(有4个等位基因;
用淀粉凝胶电泳法测定),后摆蛋白(Pa),运铁蛋白(Tf)及碱性磷酸酶(TIP)的多态型(后面三个指标分别有4,5,2个等位基因,皆用聚丙烯酰胺凝胶垂直平板电泳法测定)。
(袁志发,周静芋,多元统计分析,科学出版社,P248)
表8-1中国7个黄牛品种血液蛋白质位点基因频率
秦川牛
晋南牛
南阳牛
延边牛
复州牛
鲁西牛
郏县红牛
HbA
0.8375
0.7931
0.6625
0.9114
0.7015
0.8125
0.8500
HbB
0.100
0.1379
0.0500
0.0886
0.2463
0.0833
HbC
0.0625
0.069
0.2878
0.0522
0.0938
0.1000
HbY
0.0104
P2A
0.5500
0.5667
0.5250
0.5942
0.7891
0.7128
0.6667
P2B
0.4500
0.4333
0.4750
0.3841
0.2110
0.2447
0.3205
P2C
0.0217
P2X
0.0426
0.0123
TfA
0.1396
0.1380
0.0732
0.3223
0.1791
0.1023
0.07692
TfD
0.5466
0.7241
0.7195
0.4079
0.6172
0.3750
0.3589
TfD2
0.0060
0.0078
0.3525
0.2821
TfF
0.0233
0.0345
0.0122
TfE
0.2907
0.1035
0.1951
0.1842
0.1953
0.1705
FA
0.1938
0.1982
0.1736
0.6784
0.0157
0.0774
0.05132
Fo
0.8062
0.8264
0.9216
0.9843
0.9226
0.9487
聚类结果
实验九做多变量统计分析
掌握主成分分析过程PRINCOMP与因子分析过程FACTOR。
1、分析题目
2、编写程序
3、分析输出结果
4、实验内容写成word文件以邮件形式发到老师邮箱。
1、测得10名幼儿的体重(X1,kg)、身高(X2,cm)如表23-1。
试做主成分分析。
表9-110名幼儿的体重、身高数据
体重(X1,kg)
16.3
13.0
18.3
15.0
11.9
14.4
13.5
12.1
13.3
身高(X2,cm)
108
111
95
94
93
(选做)2.某医学院对MEFV(最大呼气流速-容量)曲线进行研究,测定了103例50~79岁正常男性的MEFV曲线资料,其中的6个指标是:
用力肺活量(X1,L),第1秒用力肺活量(X2,L);
最大呼气中期流速(X3,升/s),用力呼气后期流速(X4,L/s),呼出50%肺容量时最大流速(X5,L/s)和呼出75%肺容量是最大流速(X6,L/s)。
其相关系统矩阵如表9-2。
试做MEFV曲线这6个指标的因子分析。
(黄正男,医用多因素分析及计算机程序,浑那科学技术出版社,1986,145)
表9-2正常男性的MEFV曲线资料相关系统矩阵
X3
X4
X5
X6
1.000
0.8491
0.5106
0.2497
0.5285
0.3019
0.5438
0.7887
0.6064
1.0000
0.7833
0.9284
0.8364
0.6457
0.9051
0.7097
1、输出简单统计量,相关系数构成的相关矩阵,相关矩阵的特征值,前5个主成分的特征值都大于1,他们的累积贡献率
2、主成分分析
1、写成word文件
2、作业包括四部分内容
作业题目:
程序代码:
输出结果:
结果分析:
实验十做判别分析
掌握贝叶斯判别分析过程DISCRIM和逐步判别分析过程STEPDISC。
1、从心电图的5个不同指标中对健康人(C=1)、硬化症患者(C=2)和冠心病患者(C=3)的数据如表10-1。
试做不筛选变量的贝叶斯判别分析与逐步判别分析。
表10-123人的心电图数据
No
X1
C
8.11
251.01
13.23
5.46
7.31
9.36
9.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 硕士 SAS 实验 指导书
![提示](https://static.bdocx.com/images/bang_tan.gif)