SPSS170在生物统计学中的应用实验指导.docx
- 文档编号:23827765
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:18
- 大小:316.38KB
SPSS170在生物统计学中的应用实验指导.docx
《SPSS170在生物统计学中的应用实验指导.docx》由会员分享,可在线阅读,更多相关《SPSS170在生物统计学中的应用实验指导.docx(18页珍藏版)》请在冰豆网上搜索。
SPSS170在生物统计学中的应用实验指导
SPSS在生物统计学中的应用
——实验指导手册
实验三:
参数估计
一、实验目的与要求
1.理解参数估计的概念
2.熟悉区间估计的概念与操作方法
二、实验原理
1.参数估计的定义
●参数估计(parameterestimation)是根据从总体中抽取的样本估计总体分布中的未知参数的方法。
它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。
●点估计(pointestimation):
又称定值估计,就是用实际样本指标数值作为总体参数的估计值。
当总体的性质不清楚时,我们须利用某一量数(样本统计量)作为估计数,以帮助了解总体的性质,如:
样本平均数乃是总体平均数μ的估计数,当我们只用一个特定的值,亦即数线上的一个点,作为估计值以估计总体参数时,就叫做点估计。
✧点估计的数学方法很多,常见的有“矩估计法”、“最大似然估计法”、“最小二乘估计法”、“顺序统计量法”等。
✧点估计的精确程度用置信区间表示。
●区间估计(intervalestimation)是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间。
其中这个给定的概率值称为置信度或置信水平(confidencelevel),这个建立起来的包含待估计函数的区间称为置信区间,指总体参数值落在样本统计值某一区内的概率
●置信区间(confidenceinterval)是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
划定置信区间的两个数值分别称为置信下限(lowerconfidencelimit,lcl)和置信上限(upperconfidencelimit,ucl)
2.参数估计的基本原理
统计分析的目的就是由样本推断总体,参数估计即是实现这一目的的方法之一。
3.参数估计的方法
参数估计的结果,常用点估计值(样本均值)+置信区间(置信下限、置信上限)来表示。
三、实验内容与步骤
1.单个总体均值的区间估计
打开数据文件“描述性统计(100名女大学生的血清蛋白含量).sav”
选择菜单【分析】—>【描述统计】—>【探索】”,打开图3.1探索(Explore)对话框。
♦从源变量清单中将“血清蛋白含量”变量移入因变量列表(DependentList)框中。
图3.1Explore对话框
♦单击上图右方的“统计量”按钮打开“探索:
统计量”对话框。
在设置均值的置信水平,如键入95%,完成后单击“继续”按钮回到主窗口。
图3.2探索统计量设置窗口
♦返回主窗口点击“确定”运行操作。
♦分析结果简单说明:
表3.1描述统计量
Descriptive
♦如上表显示。
从上表“95%ConfidenceIntervalforMean”中可以得出,女大学生区间估计(置信度为95%)为:
(72.4932,74.0848),其中lowerBound表示置信区间的下限,UpperBound表示置信区间的上限。
点估计是:
73.2890。
说明女大学生血清蛋白含量总体水有平百分之九十五的机率落72.4932g/L和74.0848g/L之间,低于72.4932g/L和高于74.0848g/L的可能性小于百分之五。
2.两个总体均值之差的区间估计
【课本例14-2】现有两组饲料喂猪的料重比数据如下。
饲料A
3.08
2.73
3.03
2.95
2.21
3.03
2.86
3.13
2.59
2.89
饲料B
3.43
3.04
3.37
3.29
2.46
3.37
3.19
2.89
3.49
要求对饲料A喂猪的平均料重比与饲料B喂猪的平均料重比之差进行区间估计,预设的置信度为95%。
♦打开SPSS,打开数据文件:
“两组饲料喂猪的料重比数据.xls”。
♦计算两总体均值之差的区间估计,采用“独立样本T检验”方法。
选择菜单“【分析】→【比较均值】→【独立样本T检验】”,
图3.3“独立样本T检验”菜单选择
打开“独立样本T检验”对话框。
♦变量选择
(1)从源变量清单中将“料重比”变量移入检验变量框中。
表示要求该变量的均值的区间估计。
从源变量清单中将“饲料”变量移入分组变量框中。
表示总体的分类变量。
图3.4独立样本T检验对话框
♦定义分组单击定义组按钮,打开DefineGroups对话框。
在Group1中输入A,在Group2中输入B(A表示饲料A,B表示饲料B)。
图3.5定义组definegroups设置窗口
完成后单击“继续”按钮返回到“独立样本T检验”对话框。
♦确定置信水平
单击“独立样本T检验”对话框右上方的“选项”按钮,弹出“独立样本T检验:
选项”对话框,
图3.6“独立样本T检验:
选项”对话框
确定置信区间为95%,单击“继续”按钮返回到“独立样本T检验”对话框。
♦计算结果单击“确定”按钮,输出结果如下图所示。
(1)GroupStatistics(分组统计量)表
分别给出不同总体下的样本容量、均值、标准差和平均标准误。
从该表中可以看出,A饲料的平均增重为2.8500,B饲料的平均增重为3.1700。
表3.2分组统计量
GroupStatistics
饲料
N
Mean
Std.Deviation
Std.ErrorMean
料重比
A
10
2.8500
.27877
.08815
B
9
3.1700
.32867
.10956
(2)IndependentSampleTest(独立样本T检验)表
表3.3独立样本T检验结果
IndependentSamplesTest
Levene'sTestforEqualityofVariances
方差齐性检验
t-testforEqualityofMeans
检验总体均值是否相等的t检验
95%ConfidenceIntervaloftheDifference
F
Sig.
t
df
Sig.(2-tailed)
MeanDifference
Std.ErrorDifference
Lower
Upper
料重比
Equalvariancesassumed
等方差假设
.275
.607
-2.296
17
.035
-.32000
.13935
-.61399
-.02601
Equalvariancesnotassumed
不等方差假设
-2.276
15.818
.037
-.32000
.14062
-.61838
-.02162
结果说明,在当前抽样方式下,由样本均数差值-.32000(A饲料的平均增重2.8500与B饲料的平均增重3.1700之差。
)估计两种饲料喂猪的总体增重水平差值有95%的可能性在-.61399与-.02601之间。
T检验结果:
⑴方差同质性检验:
F值为0.275,其概率P=0.670>0.05,表明两未知总体方差差异不显著,可按照等方差假设进行检验。
⑵检验:
t值为-2.296,其概率P=0.035<0.05,表明B饲料增重效果显著地好于A饲料。
⑶置信区间为-.61399与-.02601,推断总体参数的差异为0的可能性很小。
实验四:
t检验
一、实验目的与要求
1.理解t检验的基本原理和用途
2.熟练掌握T检验的SPSS操作
3.学会利用T检验方法解决身边的实际问题
二、实验原理
●有三类t检验可用:
✧独立样本t检验(双样本t检验)。
利用成组设计获取样本数据,比较一个变量中两组个案的均值,以推断两组个案所在总体的差异是否显著。
提供了每组的描述统计和Levene方差相等性检验,以及相等和不等方差t值和均值差分的95%置信区间。
✧配对样本t检验(相关t检验)。
利用配对设计获取成对样本数据,比较单个组的两个变量的均值。
此检验还用于匹配对或个案控制研究设计。
输出包括检验变量的描述统计、变量之间的相关性、配对差分的描述统计、t检验和95%置信区间。
✧单样本t检验。
将一个变量的均值与已知值或假设值进行比较。
检验变量的描述统计随t检验一起显示。
检验变量的均值和假设的检验值之间差的95%置信区间是缺省输出的一部分。
三、实验演示内容与步骤
㈠独立样本t检验
在“实验三”内容里“2.两个总体均值之差的区间估计”中,已完成独立样本t检验的操作,大家可重复其操作步骤,以熟练操作步骤。
应记住独立样本t检验的数据结构,可在SPSS中创建数据文件,也可以在EXCEL中创建数据文件。
独立样本t检验的重点在于先根据方差齐性检验的结果,确定方差的同质性,再选择t检验的结果。
㈡配对样本t检验
【课本例5.7】在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如下表,试检验两组饲料对试验动物肝脏中维生素A含量的作用是否有显著差异。
正常饲料组
3550
2000
3000
3950
3800
3750
3450
3050
维生素E缺乏组
2450
2400
1800
3200
3250
2700
2500
1750
♦打开SPSS,打开数据文件:
“课本5.7配对设计资料.xls”。
♦选择菜单“【分析】→【比较均值】→【配对样本T检验】”,弹出“配对样本T检验”对话框,
图4.1“配对样本T检验”菜单选择
图4.2“配对样本T检验”对话框
Paired-SamplesTTes
如图4.2所示,将两个配对变量移入右边的成对变量PairVariables列表框中。
移动的方法是先选择其中的一个配对变量,再选择第二个配对变量,接着单击中间的箭头按钮。
♦选项按钮的用于设置置信度选项,这里保持系统默认的95%
♦在主对话框中单击ok按钮,执行操作。
♦在输出视图中看分析结果
表4.1两组饲料饲养后样本肝中的维生素A的含量的描述统计量
PairedSamplesStatistics
Mean
N
Std.Deviation
Std.ErrorMean
Pair1
正常饲料组
3318.75
8
632.420
223.594
维生素E缺乏组
2506.25
8
555.130
196.268
表3.4给出了两组饲料饲养后样本肝中的维生素A的含量的均值、标准差、均值标准误差。
表4.2培训前后成绩的相关系数
PairedSamplesCorrelations
N
Correlation
Sig.
Pair1
正常饲料组&维生素E缺乏组
8
.584
.129
表3.5给出了两组饲料饲养后样本肝中的维生素A的含量的相关系数。
表4.3配对样本t检验结果
PairedSamplesTest
PairedDifferences
t
df
Sig.(2-tailed)
Mean
Std.Deviation
Std.ErrorMean
95%ConfidenceIntervaloftheDifference
Lower
Upper
Pair1
正常饲料组-维生素E缺乏组
812.500
546.253
193.130
355.821
1269.179
4.207
7
.004
表4.3给出了配对样本t检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的95%置信度下的区间估计。
当然也给出了最为重要的t统计量和p值。
✧结果显示p=0.004<0.01,表明,维生素E缺乏组肝中的维生素A的含量极显著地低于正常饲料组,造成肝中的维生素A的含量低的原因是饲料中缺乏维生素E。
✧置信区间为355.821与1269.179,推断总体参数的差异为0的可能性极小。
㈢单样本t检验(单个总体均值的假设检验)
【课本例5.1】按照规定,100g罐头番茄汁中的平均维生素C含量不得少于21mg/g,现从工厂的产品中随机抽取17个罐头,其100g番茄汁中的维生素C含量记录如下:
维生素c含量
16
25
21
20
23
21
19
15
13
23
17
20
29
18
22
16
22
,问这批罐头是否符合规定要求。
♦打开SPSS,打开数据文件:
“课本例题5.1单样本t检验资料.xls”。
♦判断检验类型该例属于“小样本、总体标准差σ未知。
假设形式为:
H0:
μ=μ0,H1:
μ≠μ0
♦判断分布类型因不知道番茄汁中的平均维生素C含量是否服从正态分布,先按照“实验二描述性统计:
频率”的方法,对数据进行描述性统计。
选择菜单“【分析】—>【描述统计】—>【频率】”。
弹出如图2.7所示“频率”对话框,在“频率:
统计量”、“频率:
图表”、“频率:
格式”三个对话框中选择“均值”、“标准差”、“方差”、“均值的标准误”、“偏度”、“峰度”、“直方图-带正态曲线”后,点击【继续】继续返回“频率”对话框,点击【确定】后,在弹出的“结果输出”视图中显示上述各项选择的对应结果如下:
表4.4描述统计:
频率
Statistics
维生素c含量
N
Valid
17
Missing
0
Mean
20.00
Std.ErrorofMean
.966
Std.Deviation
3.984
Variance
15.875
Skewness
.329
Std.ErrorofSkewness
.550
Kurtosis
.324
Std.ErrorofKurtosis
1.063
图4.3描述统计-频率-直方图
从表4.4和图4.3可知,茄汁中的平均维生素C含量是基本服从正态分布的,可以采用基于正态分布的T检验进行分析。
♦软件程序操作选择菜单“【分析】→【比较均值】→单样本T检验”,
图4.4“单样本T检验”菜单选择
弹出One-SampleTTest对话框。
从源变量清单中将“维生素C含量”向右移入“检验变量TestVariables”框中。
图4.5“单样本T检验”对话框
one-sampleTtest
在“检验值TestValue”框里输入一个指定值(即假设检验值,本例中假设为21),T检验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设。
♦“One-SampleTTest”窗口中“确定”按钮,输出结果如下表所示。
(1)“One-SampleStatistics”(单个样本的统计量)表分别给出样本的容量、均值、标准差和平均标准误。
本例中,产品数量均值为20.00。
表4.5单样本统计量
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
维生素c含量
17
20.00
3.984
.966
(2)“One-SampleTest”(单个样本的检验)表
表4.6单样本T检验结果
One-SampleTest
TestValue=21
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
维生素c含量
-1.035
16
.316
-1.000
-3.05
1.05
表中的t表示所计算的T检验统计量的数值,本例中为-1.035。
表中的“df”,表示自由度,本例中为16。
表中的“Sig”(双尾T检验),表示统计量的P-值,并与双尾T检验的显著性的大小进行比较:
Sig.=0.316>0.05,说明这批样本的平均维生素C含量与21无显著差异。
表中的“MeanDifference”,表示均值差,即样本均值与检验值21之差,本例中为-1.000。
表中的“95%ConfidenceInternaloftheDifference”,样本均值与检验值偏差的95%置信区间为(-3.05,1.05),置信区间包括数值0,推断总体参数的偏差接近于0,产品符合要求。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS170 生物 统计学 中的 应用 实验 指导