样本均数比较的假设检验.docx
- 文档编号:1174843
- 上传时间:2022-10-18
- 格式:DOCX
- 页数:12
- 大小:559.82KB
样本均数比较的假设检验.docx
《样本均数比较的假设检验.docx》由会员分享,可在线阅读,更多相关《样本均数比较的假设检验.docx(12页珍藏版)》请在冰豆网上搜索。
样本均数比较的假设检验
《实用卫生统计学》教案
任课教师:
毛绍泽
教学目标:
了解:
统计工作基本步骤,频率表的编制12频数分布特征,标准正态分布概念。
熟悉:
标准正态变换。
掌握:
各种平均数指标,离散指标使用条件及计算,标准正态曲线下面积分布规律和正态分布资料95%和99%的个体观察值所在范围。
教学重点、难点:
各种均数和标准差的计算
教学资源:
实用卫生统计学教材(北京大学医学出版社、康晓平主编)挂图、计算器等。
课后记:
重点辅导,举例计算、学员自学,使学员们掌握各种均数,标准差的计算方法。
一、统计工作的基本步骤
基本步骤
内容
计划与设计
是开展医学研究的前提和依据。
调查设计和实验设计均包括专业设计和统计学设计两个方面,主要内容有资料的收集、整理和分析
收集资料
概括为经常性资料和一时性资料两大类。
收集的资料要求①完整、正确和及时;②要有足够的数量;③资料的代表性和可比性
整理资料
原始资料的检查与核对①数据的取值范围检错;②数据间的逻辑关系检错。
以及资料的分组设计与归纳汇总①质量分组或数量分组;②编制频数分布表
分析资料
①统计描述:
用一些统计指标,统计图表等方法对资料的数量特征和分布规律进行测定和描述,不涉及由样本推论总体问题。
②统计推断:
对样本统计指标作参数估计和假设检验,结合专业知识解释分析结果,目的是用样本信息推断总体特征。
第一节计量资料的频数表
一、频数表编制的步骤
表2.1频数表编制的步骤
步骤
具体操作
注意事项
1
极差R一最大值一最小值
根据观察单位的多少酌情增减组数
2
①组数:
一般8~15组
②组距t=极差/组数
③组段:
指每组的下限~上限
组距一般取整数,可等组距,也可不等组距,一般多采用等组距。
一般只写下限,不用写上限。
第一组段要包括最小观察值,最后一个组段包括最大观察值。
3
列表划记:
采用划记法或计算机汇总将原始数据归人各组
二、频数分布的类型
1.对称分布:
是指集中位置在正中,左右两侧频数分布大体对称的分布。
2.偏态分布:
偏态分布是指集中位置偏向一侧,两侧频数分布不对称。
3.对数正态分布:
有些偏态分布的资料,其原始数据经过对数转换后(如用原始数据的对数值lgX代替X)服从正态分布,称为对数正态分布。
三、频数表的用途
1.便于观察资料的分布类型和分布特征。
根据分布类型可以选择合适的统计指标进行计算和分析。
2.常作为大样本资料的陈述形式。
3.当数据不是用计算机处理分析时,大样本资料常整理成频数表的形式,计算相应的描述指标,并进行统计分析等。
4.便于发现某些特大或特小的异常值,必要时经检查、核实后决定取舍。
第二节描述集中趋势的指标
表2.2常用描述集中趋势的指标
[附]百分位数
百分位数(percentik)是一个位置指标。
将由小到大顺序排列的观察值分成100等份,对应于第x%位的观察值即为第x百分位数,用Px表示。
百分位数常用于描述偏态分布资料在某百分位置上的水平及确定偏态分布资料医学参考值范围,其计算公式
(2.1)
公式中L、i、fx分别为Px所在组段的下限、组距和频数,∑fL为小于L的各组段的累计频数。
第三节描述离散趋势的指标
这种变换叫标准正态变换(或ц变换)。
ц称为标准正态变量,它服从均数为O,标准差为1的标准正态分布,即ц~N(0,1)。
通过标准正态变换,可将原来的正态分布变换为标准正态分布。
为了应用的方便,可以通过查标准正态分布表(也称ц值表),得到标准正态曲线下,横轴上—∞到ц的面积。
二、正态曲线下面积的分布规律
正态曲线在横轴上方均数处最高,即以均数为中心,曲线下面积左右对称。
正态曲线下的面积分布有一定的规律:
①标准正态曲线下横轴上的总面积为100%;②横轴上从ц=一1.64到ц=l-64的区间所对应的曲线下面积为90%;从ц=一1.96到ц=1.96的区间所对应的曲线下面积为95%;从u=-2.58到u=2.58的区间所对应的曲线下面积为99%,这三种情况在统计上用的最多。
实际工作中,也常利用正态曲线下的面积分布规律来估计正态曲线下横轴上任一区间的面积占总面积的百分数,以估计该区间的观察例数占总例数的百分数。
三、正态分布的应用
1.估计个体观察值所在范围
医学领域或卫生事业管理中有许多数据服从正态分布或近似正态分布,因此可利用正态曲线下的面积分布规律来估计某个变量的测量值所在范围,即估计部分测量值占全部的百分数,如某变量服从正态分布,且已知其总体均数μ和总体标准差δ,可以用算是μ±1.96δ来估计95%的个体观察值所在范围,或用算式μ±2.58δ估计99%的个体观察值所在范围。
在实际工作中,很多情况是不知道总体均数μ和总体标准差δ的,我们只能得到样本均数和样本差s,此时可用算式±1.96s来估计95%的个体观察值所在范围,或用算式±2.58s估计99%的个体观察值所在范围。
估计个体观察值范围的算式列于表2.4。
2.医学参考值的估计
参考值范围又称正常值范围。
医学上常包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
医学参考值的估计方法实际上就是个体观察值所在范围的估计。
根据资料的分布特点,选用正态分布和百分位数法,具体计算参阅表2.4。
3.质量控制
控制实验误差,常以±2s作为上、下警戒值,以作为±3s上、下控制值,这里的2s、3s分别是1.96s和2.58s的近似值。
实用卫生统计学教案
(2)
任课教师:
毛绍泽
课题:
样本均数比较的假设检验教学时数:
教学班级:
教学目标:
了解:
两个独立样本的方差齐性检验,LSD法和SNK法。
熟悉:
假设检验的基本原理、步骤、注意事项,单因方差分析计算。
掌握:
方差分析的基本思想
教学重点、难点:
t检验和μ检验的计算
教学资源:
实用卫生统计学教材(北京大学医学出版社·康晓平主编)挂图、计算器等
课后记:
重点辅导、举例计算、学员自学、使学员们掌握t检验μ检验的计算。
样本均数比较的假设检验
第一节假设检验的基本原理和基本步骤
一、假设检验的基本原理
以样本均数与已知总体均数x比较的t检验为例(设样本所代表的未知总体均数为μ),假设检验的基本原理为:
当所要检验的x≠μ0时,考虑造成它们之间的差别有两种可能性:
(1)这个样本所代表的未知总体均数与已知总体均数相等,即μ=μ0,则x≠μ0仅仅由于抽样误差造成。
(2)这个样本所代表的未知总体均数与已知总体均数不相等,即μ=μ0,则x≠μ0主要由于两个总体均数不相等造成。
假设检验的目的为:
判断两个总体均数是否相等。
二、假设检验的基本步骤
(一)建立检验假设,确定检验水准
1.首先要明确指标的类别,是均数的比较还是率的比较。
然后应该根据专业知识来确定选择单侧检验或双侧检验。
①如果从专业知识的角度,判断一种方法的结果不可能低于或高于另一种方法的结果,则可以采用单侧检验。
②在不能根据专业知识判断两种结果谁高谁低时,则用双侧检验。
2.建立检验假设。
检验假设有两种:
①无效假设,又称为零假设,用符号H0表示。
②备择假设,用符号H1表示。
现在以样本均数(该样本所代表的未知总体均数为μ)与已知总体均数μ0的比较为例,用符号表示相应的检验假设,见表6.1。
表6.1样本均数与已知总体均数比较的检验假设
3.确定检验水准。
检验水准,也称为显著性水准,符号位a。
通常a取0.05。
(二)选定检验方法,计算检验统计量
要根据统计推断的目的、研究设计的类型和样本量的大小等适用条件,选用不同的检验方法和计算相应的统计量。
例如:
两个小样本均数比较的完全随机设计类型和配对设计类型应该使用不同的t检验方法,并计算相应的t统计量值;多个样本均数比较可以采用方差分析的F检验,并计算相应的F统计量值。
(三)确定P值,作出推断结论
P值的含义:
是指从H0所规定的总体中作随机抽样,获得等于及大于(或等于及小于)现有样本的检验统计量值(如t值或μ值)的概率。
根据P值作出推断结论:
当P≤a时,按所取检验水准a,拒绝H0,接受H1,可以认为差别有统计学意义,两总体均数不相等;当P>a时,按所取的检验水准a,不拒绝H0,差别无统计学意义,尚不能认为两总体均数不相等。
第二节t检验和μ检验
t检验的使用条件;当总体标准差δ未知,样本含量n较小时,理论上要求样本来自正态分布的总体。
完全随机设计的两个小样本均数比较时还要求两总体方差相等。
习惯规定样本含小于或等于50(n≤50)为小样本、
u检验的使用条件:
当总体标准差δ未知,但样本含量n较大(一般μ<50)或总体标准差δ已知(该情况不常见)时,选用μ检验。
常用的μ界值为,双侧u0.05/2=1.96,单侧u0.05=1.64。
一、t检验
(一)样本均数与已知总体均数比较的t检验
又称为单样式t检验。
令已知总体均数为μ0,样本均数所代表的未知总体均数为μ,假设检验的目的:
推断样本均数所代表的未知总体均数μ与已知总体均数μ0是否相等(双侧检验)。
检验统计量t值的计算及结果判断见表6.2。
(二)完全随机设计的两样本t检验
又称为成组t检验或两个独立样本t检验。
完全随机设计的两样本无数比较,目的是推断这两个独立样本所代表的未知总体均数μ1与μ2是否相等。
在对两样本方差作齐性检验,认为两总体方差相等之后,则可以进行完全随机设计样本均数比较的t检验。
t检验的公式及结果判断见表6.2。
(三)配对t检验
配对t检验的目的是检验差值的总体均数μd是否为0。
由于配对设计资料可以有效地控制个体差异对结果的影响,故检验效率比完全随机设计的资料要高。
配对t检验的检验统计量t值的计算及结果判断见表6.2。
二、μ检验
(一)样本均数与已知总体均数比较的u检验。
与单样本t检验的设计类型一样,不同的是样本含量较大。
检验目的也是推断样本均数所代表的未知总体均数μ与已知总体均数μ0是否相等。
检验统计量μ值的计算及结果判断见表6.2。
(二)完全随机设计的两样本μ检验
常用于总体标准差δ未知且两样本含量较大时的两样本均数比较,目的是推断两总体均数是否不同。
检验统计量μ值的计算及结果判断见表6.2。
表6.2t检验和u检验的使用条件、计算公式及结果判断
第三节I型错误和II型错误
了解I型错误和II型错误的目的是指假设检验的结论不能绝对化,无论拒绝H0或不拒绝H0,假设检验的结论都有犯错误的可能。
这是因为假设检验是根据概率的大小作出结论。
统计上常称I型错误为a错误,犯II型错误的概率是β。
对两个样本均数作检验,当检验结果是P≤0.05,拒绝H0时,如果下结论太绝对,将有可能犯a错误,当检验结果是P>0.05,不拒绝H0时,如果下结论太绝对,就有可能犯β错误。
检验效能的含义:
1-β称为检验效能,又称为把握度。
是指当两总体确实有差别时,按规定的检验水准α,能够发现两总体间差别的能力。
实际工作中,要保证比较高的检验效能,很重要的条件是具有足够的样本含量。
第四节假设检验的注意事项
一、假设检验的前提——可比性
组间比较时应具备可比性,即除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。
二、选用的假设检验方法应符合其应用条件
t检验和u检验都是用于比较两个平均数差别的假设检验方式。
尽管同是两个计量资料的平均指标进行比较,而样本含量的大小不同,所用假设检验方式也就不同。
当总体标准差未知时,t检验用于两个小样本均数的比较,也可用于两个大样本均数的比较;u检验只能用于两个大样本均数的比较,而不能用于两个小样本均数的比较。
同是两个小样本均数的比较,配对资料和成组资料的设计类型不同,t检验的方法也不同。
三、正确理解假设检验过程中样本均数与总体均数间的关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 比较 假设检验