实验报告6SAS方差分析.docx
- 文档编号:3775718
- 上传时间:2022-11-25
- 格式:DOCX
- 页数:16
- 大小:500.79KB
实验报告6SAS方差分析.docx
《实验报告6SAS方差分析.docx》由会员分享,可在线阅读,更多相关《实验报告6SAS方差分析.docx(16页珍藏版)》请在冰豆网上搜索。
实验报告6SAS方差分析
实验报告
实验项目名称方差分析
所属课程名称现代统计软件
实验类型验证性实验
实验日期2014-10-11
班级
学号
姓名
成绩
实验概述:
【实验目的及要求】
掌握使用SAS进行单因素方差分析和双(多)因素方差分析的方法。
【实验原理】
SAS软件的操作方法及原理
【实验环境】(使用的软件)
SAS9.1
实验内容:
【实验方案设计】
一、用INSIGHT作方差分析
二、用“分析家”作方差分析
三、用ANOVA过程和GLM过程进行方差分析
【实验过程】(实验步骤、记录、数据、分析)
【练习6-1】某公司研制出了A、B、C、D四种新型生产设备,让6个工人分别操作相同的时间,统计他们生产的零件的数量如表6-3(lx6_1.xls)所示。
试在0.01的显著水平下检验这四种设备在单位时间生产的零件数量是否存在显著差异。
表6-3四种新型生产设备生产的零件的数量
A
75
46
50
56
73
48
B
47
50
65
72
46
49
C
48
50
52
46
49
65
D
68
48
49
63
51
70
结果中显示了不同生产设备的盒形图。
可以看出,B和D标准差的差异不显著(菱形的高度差异不大),A和C标准差的差异显著,四者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。
拟合模型的一般信息
列名型变量信息,即type为列名型的,有4个水平,
提供参数信息,并且约定,P_2、P_3、P_4、P_5分别为A、B、C、D的标识变量(也称哑变量)。
给出响应变量均值关于自变量不同水平的模型方程,
其中,标识变量取值:
根据标识变量的取值,容易求出各农田的平均产量:
给出模型拟合的汇总信息,其中:
(1)响应变量type的均值=55.6667;
(2)根均方误差=10.3755;
(3)判定系数R2=0.0733,较小。
其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。
方差分析表
从方差分析表可以看出,p值大于0.05(显著水平),所以不能拒绝原假设,即不同设备的产量无显著差异,也即四种新型设备的产量无显著差异。
II型检验,它是方差分析表的细化,因为本例是单因素的,所以这一行与上图的“Model”一行相同。
参数估计表,其中有关于不同设备产量差异的估计和检验:
(1)根据标识变量规定的方法,Intercept后的估计58.1667是对应设备D的产量的样本均值,其后的t检验是检验总体均值是否为0。
这里p值<0.0001<0.01=α,故总体均值显著非0。
(2)设备A后的估计-0.1667是设备A与设备D的产量均值之差的估计值,其后的t检验也是检验这三个产量均值之差是否为0。
由于p值的绝对值为0.9781>0.01,所以设备A与设备D的产量没有显著差异,即设备A与设备D的产量无显著差异。
(3)设备B后的估计-3.3333是设备B与设备D的产量均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。
由于p值的绝对值为0.5841>0.01,所以设备B与设备D的产量没有显著差异,即设备B与设备D的产量无显著差异。
(3)设备C后的估计-6.5000是设备C与设备D的产量均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。
由于p值的绝对值为0.2908>0.01,所以设备V与设备D的产量没有显著差异,即设备C与设备D的产量无显著差异。
残差和预测值的散点图,这个图可以帮助校验模型的假定。
从图中看出,残差有大体相同的散布,它表明等方差的假设没有问题。
p值大于0.01,不能拒绝原假设,表明可以认为残差是正态分布的
【练习6-2】某学校对大一到大四的学生身高进行调查,分别在各系取男生和女生各8人,调查结果如表6-4所示(lx6_2.xls)所示。
年级和性别之间无交互作用,试在0.01的显著水平下判断:
(1)不同年级的学生平均身高是否有显著差异;
(2)男生和女生的平均身高是否有显著差异.
表6-4学生身高数据
年级
性别
身高
大一
男生
175
169
173
182
165
172
175
176
女生
165
164
160
167
158
172
162
165
大二
男生
168
175
179
185
169
172
174
176
女生
163
156
162
173
180
163
168
164
大三
男生
172
183
172
170
169
167
173
168
女生
162
165
158
156
163
170
162
166
大四
男生
182
175
168
173
175
172
168
180
女生
156
158
165
164
168
173
167
162
(1)
结果中显示了不同年纪的盒形图。
可以看出,大三、大四和大一标准差的差异不显著(菱形的高度差异不大),四者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。
拟合模型的一般信息
列名型变量信息,即grade为列名型的,有4个水平,
提供参数信息,并且约定,P_2、P_3、P_4、P_5分别为大二、大三、大四、大一的标识变量(也称哑变量)。
给出响应变量均值关于自变量不同水平的模型方程,
其中,标识变量取值:
根据标识变量的取值,容易求出各年纪的平均身高:
给出模型拟合的汇总信息,其中:
(1)响应变量grade的均值=168.8906;
(2)根均方误差=7.0400;
(3)判定系数R2=0.0270,较小。
其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。
方差分析表
从方差分析表可以看出,p值大于0.01(显著水平),所以不能拒绝原假设,即不同年纪的身高无显著差异,也即四个年纪的学生身高无显著差异。
II型检验,它是方差分析表的细化,因为本例是单因素的,所以这一行与上图的“Model”一行相同。
参数估计表,其中有关于不同农田产量差异的估计和检验:
(1)根据标识变量规定的方法,Intercept后的估计168.7500是对应大一的身高的样本均值,其后的t检验是检验总体均值是否为0。
这里p值<0.0001<0.01=α,故总体均值显著非0。
(2)大二后的估计1.6875是大二与大一的身高均值之差的估计值,其后的t检验也是检验这三个产量均值之差是否为0。
由于p值的绝对值为0.5004>0.01,所以大二与大一的产量没有显著差异,即大二与大一的学生身高无显著差异。
(3)大三后的估计-1.5000是大三与大一的身高均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。
由于p值的绝对值为0.5490>0.01,所以大三与大一的身高没有显著差异,即大三与大一的身高无显著差异。
(3)大四后的估计0.3750是大四与大一的身高均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。
由于p值的绝对值为0.8807>0.01,所以大四与大一的身高没有显著差异,即大四与大一的身高无显著差异。
残差和预测值的散点图,这个图可以帮助校验模型的假定。
从图中看出,残差有大体相同的散布,它表明等方差的假设没有问题。
p值大于0.01,不能拒绝原假设,表明可以认为残差是正态分布的
(2)
结果中显示了不同年纪的盒形图。
可以看出,男生和女生标准差的差异不显著(菱形的高度差异不大),两者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。
拟合模型的一般信息
列名型变量信息,即sex为列名型的,有2个水平,
提供参数信息,并且约定,P_2、P_3分别为男生和女生的标识变量(也称哑变量)。
给出响应变量均值关于自变量不同水平的模型方程,
其中,标识变量取值:
根据标识变量的取值,容易求出各性别的平均身高:
给出模型拟合的汇总信息,其中:
(1)响应变量sex的均值=168.8906;
(2)根均方误差=5.2309;
(3)判定系数R2=0.44494,较小。
其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。
方差分析表
从方差分析表可以看出,p值小于0.01(显著水平),所以拒绝原假设,即不同性别的身高有显著差异
II型检验,它是方差分析表的细化,因为本例是单因素的,所以这一行与上图的“Model”一行相同。
参数估计表,其中有关于不同性别身高差异的估计和检验:
(1)根据标识变量规定的方法,Intercept后的估计164.2813是对应女生的身高的样本均值,其后的t检验是检验总体均值是否为0。
这里p值<0.0001<0.01=α,故总体均值显著非0。
(2)男生后的估计1.6875是男生与女生的身高均值之差的估计值,其后的t检验也是检验这三个产量均值之差是否为0。
由于p值的绝对值为<0.01,所以男生与女生的身高有显著差异
残差和预测值的散点图,这个图可以帮助校验模型的假定。
从图中看出,残差有大体相同的散布,它表明等方差的假设没有问题。
p值大于0.01,不能拒绝原假设,表明可以认为残差是正态分布的
【练习6-3】某家上市公司有若干下属子公司,公司主要经营三种业务。
公司总裁为了解下属公司的经营状况,从下属公司中随机抽出了四家公司,并调查了每家公司在这三种主营业务上的连续两个季度的利润率,调查结果如表6-5(lx6_3.xls)所示。
表6-5四家子公司的主营业务利润率(%)
公司1
公司2
公司3
公司4
主营业务1
季度1
10.35
-2.89
-5.04
5.29
季度2
4.47
0.30
2.61
-3.44
主营业务2
季度1
11.25
4.85
1.82
9.76
季度2
7.92
5.12
0.56
1.93
主营业务3
季度1
-6.55
-9.06
-9.67
-2.81
季度2
-4.32
-3.48
-12.43
-4.08
试进行用双因素方差分析并回答以下问题:
(1)各子公司的利润率是否有显著的差异?
(2)各主营业务的利润率是否有显著的差异?
(3)不同子公司在各主营业务上的利润率是否有所差别?
datazy3;
keepWorkComponyProfit;
doWork='主营业务1','主营业务2','主营业务3';
doCompony='公司1','公司2','公司3','公司4';
doC='1','2';
inputProfit@;
output;
end;
end;
end;
cards;
10.354.47-2.890.30-5.042.615.29-3.44
11.257.924.855.121.820.569.761.93
-6.55-4.32-9.06-3.48-9.67-12.43-2.81-4.08
;
run;
进行有交互作用的双因子方差分析:
procglmdata=zy3;
classWorkCompony;
modelProfit=WorkComponyWork*Compony;
run;
(1)
由上图可知,因素Work的p值<0.0001<0.05,因此有显著性差异,所以各子公司的利润率有显著的差异
(2)
因素Compony的p值<0.05,因此有显著性差异。
所以各主营业务的利润率有显著的差异。
(3)
因素A与B的交互作用(Work*Compony)的p值>0.05,因此没有显著性差异,所以不同子公司在各主营业务上的利润率没有差别
【小结】
了解使用SAS进行单因素方差分析和双(多)因素方差分析的方法。
主要包括用INSIGHT作方差分析、用“分析家”作方差分析、用ANOVA过程和GLM过程进行方差分析。
指导教师评语及成绩:
评语:
成绩:
指导教师签名:
批阅日期:
实验报告说明
1.实验项目名称:
要用最简练的语言反映实验的内容。
要求与实验指导书中相一致。
2.实验类型:
一般需说明是验证型实验还是设计型实验,是创新型实验还是综合型实验。
3.实验目的与要求:
目的要明确,要抓住重点,符合实验指导书中的要求。
4.实验原理:
简要说明本实验项目所涉及的理论知识。
5.实验环境:
实验用的软硬件环境(配置)。
6.实验方案设计(思路、步骤和方法等):
这是实验报告极其重要的内容。
概括整个实验过程。
对于操作型实验,要写明依据何种原理、操作方法进行实验,要写明需要经过哪几个步骤来实现其操作。
对于设计型和综合型实验,在上述内容基础上还应该画出流程图、设计思路和设计方法,再配以相应的文字说明。
对于创新型实验,还应注明其创新点、特色。
7.实验过程(实验中涉及的记录、数据、分析):
写明上述实验方案的具体实施,包括实验过程中的记录、数据和相应的分析(原程序、程序运行结果、结果分析解释)。
8.结论(结果):
即根据实验过程中所见到的现象和测得的数据,做出结论。
9.小结:
对本次实验的心得体会、思考和建议。
10.指导教师评语及成绩:
指导教师依据学生的实际报告内容,用简练语言给出本次实验报告的评价和价值。
注意:
∙每次实验开始时,交上一次的实验报告。
∙实验报告文档命名规则:
“实验序号”+“_”+“班级”+“_”+“学号”+“姓名”+“_”+“.doc”例如:
管信11班的张军同学学号为:
2011312299本次实验为第2次实验即:
实验二、SAS编程基础;则实验报告文件名应为:
实验二_管信11_2011312299_张军.doc。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 报告 SAS 方差分析