医学统计学总复习江大京江版For医学检验.docx
- 文档编号:4967958
- 上传时间:2022-12-12
- 格式:DOCX
- 页数:14
- 大小:23.84KB
医学统计学总复习江大京江版For医学检验.docx
《医学统计学总复习江大京江版For医学检验.docx》由会员分享,可在线阅读,更多相关《医学统计学总复习江大京江版For医学检验.docx(14页珍藏版)》请在冰豆网上搜索。
医学统计学总复习江大京江版For医学检验
目录:
①在研究设计与资料分析中统计方法选择
1) 统计方法的流程图
2) 统计方法选择的思路
3) 教学中各类统计方法的应用条件
②几个容易混淆的基本概念
一、 统计方法的流程图
二、统计方法选择的思路
1) 统计方法选择的四级思维
资料类型→分布类型→设计类型→具体条件
2) 统计分析的两个方面
统计描述(统计指标与图表)→统计推断
三、教学中各类统计方法的应用条件
1) 集中趋势与离散趋势的统计指标
2) t检验与u检验
3) 率的u检验
4) c2检验
5) 方差分析
6) 秩和检验
7) 线性相关与回归
PS:
思 考 题
1) 完全随机设计实验资料如何作假设检验?
2) 配对试验设计资料如何进行假设检验?
1、t检验与u检验的应用条件
1) 两组数值变量资料比较;
2) 小样本时用t检验,要求资料为随机样本并服从正态分布;
3) 大样本时用u检验,仍要求资料为随机样本,但正态性条件可以放宽;
4) 在两样本均数比较的t和u检验中,要求两组总体方差相等,即方差齐性;
5) 组间要求具有均衡可比性。
2、率的u检验的应用条件
1) 样本例数n较大(是一个不确定的数值,与率的大小有关);
2) 率p 或(1-p)不接近于0,也不接近于100%;
3) np和 n(1-p)均大于5;
4) 在两样本率比较时,两率均应达到上述要求。
3、c2检验的适用资料
1) 两组样本率的比较;
2) 多组样本率的比较;
3) 两组或多组构成比的比较;
4) 两个事物关联性的检验
5) 配对设计下两分类或多分类资料检验。
4、线性相关与回归的应用条件
1) 散点图有线性趋势;
2) 专业上要求分析两变量间关系密切程度 和变化方向,通过一个变量预测或控制另一变量;
3) 两变量服从双变量正态分布,或X可以精确测量的,Y服从正态分布。
5、秩和检验和适用范围
1) 极度偏态分布
2) 未知分布或分布不规则
3) 等级分组资料
4) 一端或两端无界资料
5) 两组或多组资料离散度不同—方差不齐
6、集中趋势与离散趋势统计指标
集中趋势 离散趋势
正态分布 均数 方差、标准差
对数正态 几何均数 几何均数标准差
偏态等 中位数 四分位数间距
变异系数:
在两组或多组资料变异度比较
组间单位不同
组间均数相差较大
几个容易混淆的基本概念
1) 样本与总体
2) 资料(变量)类型
3) 相对数指标:
构成比、率、相对比
4) 统计图类型
5) 统计图的适用条件
6) 统计表
1、抽样误差与标准误
1) 抽样研究才有抽样误差
2) 抽样误差的概念
3) 标准误是衡量抽样误差大小的指标
2、标准差与标准误关系
联系:
离散度指标,计算上的联系
区别:
描述对象不同,意义与应用不同,与n的关系不同
3、参考值范围与可信区间关系
联系:
均为一个数值范围
区别:
意义不同,与,同一资料两范围的不同
4、假设检验的意义
是通过两组或多组间有差别的样本(均数或率),或样本与总体(均数或率)推断他们的总体(均数或率)是否相同。
5、检验假设与检验结论
1) 无效假设与备择假设(单双侧);
2) 是对总体所作,H0假设总体相同或两者无关,检验方法建立于此;
3) 对检验方法的H0与H1作总的;
4) 检验结论有统计结论与专业结论;
5) 是针对检验假设(总体)而作的;
6、检验水准a与P值
1) a是预先确定的表示在拒绝H0,可能犯错误的最大概率,属于第一类错误;
2) P值是指由H0规定的总体中进行随机抽样,所观察到的等于及大于(或等于及小于)现有样本统计量(如u值)的概率,也可表示为在拒绝H0时可能犯错误的实际概率大小;
3) a与P值间的关系:
P> a,接受H0,差异无统计学意义;P≤ a ,拒绝H0,接受H1,差异有统计学意义
7、自由度确定
1) 能够自由选择其数值的变量个数;
2) 总结各类统计方法的自由度计算;
8、单侧与双侧
1) 正常值范围估计中单双侧的选取;
2) 组间比较的假设检验中单双侧选取;
3) 线性相关与回归系数检验单双侧选取。
9、多组比较问题
1) 卡方检验与秩和检验中有多组比较问题
2) 检验思路是先作总的比较,再作两两组间比较;注意H1。
10、u 检验与c2检验的关系
1) 两法均用于两个率比较
2) u检验是有条件的,u 检验可用资料c2一定可用,u检验不能用,一般c2也可用。
3) u2=c2
11、线性相关与线性相关系数
1) 前提是散点图有线性趋势;
2) 两变量线性关系密切程度和变化方向;
3) 检验的意义与 r值的意义;
12、线性回归与线性回归系数
1) 前提是散点图有线性趋势;
2) 配线求直线回归方程;
3) 线性回归系数b意义;
13、调查与实验研究
实验研究 调查研究
研究因素 研究者给予 研究对象客观存在
误差控制 控制较好 影响因素较多
随机性 对象随机接受处理 因素与对象是固定的,抽样是随机的
14、三个基本要素与基本原则
研究因素、研究对象、实验效应
重复原则、对照原则、随机化原则
15、完全随机设计与配对设计
1) 完全随机设计是将研究对象随机在分为两组或多组;
2) 配对设计是将研究对象按一定条件配成对子,再随机分到两组,随机区组设计为多组;
3) 组间均衡性与统计方法不同;
4) 应用上不同;
30道精要问答题
1、正态分布有什么基本特征?
有哪几个参数?
如何判断一组数据是否服从正态分布?
基本特征:
①正态分布只有一个高峰,高峰位置在X=μ;
②正态分布以均数为中心,左右对称
参数:
均数、标准差(μ是随机变量X的总体均数,σ为标准差)
①X轴与正态曲线所夹面积恒等于1或100%
②区间μ±σ的面积为68.27%
③区间μ±1.96σ的面积为95.00%
④区间μ±2.58σ的面积为99.00%
判断:
频数分布图,前人经验,偏度系数和峰度系数的检验。
2、如何把正态分布数据转换成标准正态分布数据?
对任何服从正态分布N(μ,σ2)的随机变量X作线性变换 都变换成均数为0,方差为1的正态分布,称为标准正态分布,简记为μ~N(0,1)
3、什么叫标准正态分布?
正态分布、标准正态分布和t分布有什么联系和区别?
均数为0,方差为1的正态分布都称为标准正态分布,简记为μ~N(0,1)
联系:
都是对称的连续型分布;正态分布可以通过线性转换转化成标准正态分布;t分布在自由度较大时趋向标准正态分布。
区别:
曲线图形不同;功能不同(正态分布和标准正态分布可用于u检验、参考值范围制定,质量控制等,而t分布主要用于t检验或总体均数的可信区间。
)
4、什么是正常值范围?
制定正常范围的基本步骤是什么?
正态分布法与百分位数法制定正常值范围各有什么特点?
正常值范围:
又称参考值范围,指绝大多数正常人的某指标范围
基本步骤:
①抽取足够例数的正常人样本
②对选定的正常人进行准确而统一的测定
③决定取单侧范围值还是双侧范围值
④选定适当的百分范围
⑤估计界值
特点:
①正态分布法:
应用本法的条件是资料服从正态分布,样本均数和标准差趋于稳定,样本含量不少于50例为宜,亦可用于经变量变换后服从正态分布的资料,如对数正态分布
②百分位数法:
应用本法的条件是样本含量较多,分布趋于稳定,样本含量不少于150例,适用于偏态分布资料
4、总体均数的可信区间中的可信度和区间的宽度各说明什么?
总体均数的可信区间中的可信度说明可信区间的准确度,可信区间的宽度则说明了精密度。
可信度越高,准确度越高;区间越短,精密度越高。
5、两样本均数比较时为什么要作统计检验?
样本均数之间的差异是客观存在的,这种表面的差异不能直接判断总体均数间一定有差别,为了判断总体间均数是否有差别,我们必须对现有的样本均数作统计上的假设检验。
我们班级全体男女同学的平均血压作比较,要不要作统计检验?
班级全体男女同学的平均血压已经是两个总体均数(这两个总体不是太大所以全面调查可行),总体均数已经知道的话,比较就不用分别抽样作假设检验了。
6、两样本均数的差别作统计检验,P>0.05,你对此结果如何解释?
若P<0.05,又有哪些具体解释?
P>0.05,P>α(α=0.05),接受H0(检验假设),总体均数相同
P<0.05,P<α(α=0.05),接受H1(备择假设),总体均数不全相同
7、两样本均数差别的t检验中,什么情况下作单侧检验?
什么情况下作双侧检验?
单侧检验时(专业角度能排除另外一侧可能性) H1:
μ>μ0或μ<μ0
双侧检验时 H1:
μ≠μ0
8、对样本均数与总体均数或对两样本均数的差别作统计检验,怎样使用可信区间做判断?
对样本均数与总体均数μ0比较(单样本t检验)对未知的总体均数μ求出可信区间,这个可信区间若包含μ0,者可以认为μ=μ0;未知的总体均数μ求出的可信区间若不包含μ0,则认为μ≠μ0。
两样本均数比较的统计检验分成配对样本和独立样本
配对样本的话,可以求出配对数据的一组差值d,然后求出这组差值的总体均数μd的可以信区间,这个可信区间若包含0,则认为总体均数相等;反之,不等。
两独立样本的话,可以通过两个样本分别求出两总体均数的可信区间,如果两个可信区间有交叉重叠部分,则可认为两总体均数相等,反之,不等。
9、t检验要求什么条件?
①正态性:
即样本来自正态总体,特别是n较小时
②方差齐性:
即样本代表的总体方差相等,特别是对于两样本均数比较的t检验(一般情况下,满足方差齐性,会认为同时满足正态性的要求)
③样本例数较小(n<50)
10、t检验基本步骤是什么?
①建立检验假设
②确定检验水准和单、双侧
③选定检验方法和计算统计量
④确定P值
⑤推断结论
11、实验设计的要素与原则?
要素:
处理因素、受试对象、实验效应
原则:
①对照原则:
设立对照组,除给予处理因素不同外,其他非处理因素尽量均衡一致
②随机化原则:
指总体中每个个体都有相等的机会被研究者抽取为样本
③重复原则:
要求有一定的样本含量
12、线性回归和线性相关分析的目的是什么?
线性回归的目的是要建立回归方程,了解自变量X与应变量Y之间的数量关系,以便于通过X去推算或预测Y.
线性相关是通过相关系数刻画两个变量之间的相互紧密程度和变化方向。
13、线性回归和线性相关分析对数据有什么要求?
线性回归(又叫直线回归):
要求自变量可精确测量和严格控制误差。
线性相关(直线相关):
要求两个变量服从双变量正态分布。
14、建立回归方程用的是什么原则?
最小二乘法:
各散点距离回归直线纵向距离平方和为最小而得到直线
15、为什么要对样本回归系数及样本相关系数作统计检验?
样本统计量都存在抽样误差,样本回归系数及样本相关系数都是用数学公式计算的,但是如果他们的对应总体参数本身为0的话,那么总体就没有线性相关或没有线性回归关系,所以必须对他们的总体参数作假设检验。
如果假设检验结果总体系数不为0, 样本回归系数及样本相关系数就有统计学意义,可以证明他们的回归或相关关系;如果总体系数为0,那么样本回归系数及样本相关系数就没有统计学意义。
16、同一批样品用两种方法测定结果的相关系数是0.95,能否说两方法测定结果相同?
不能,相关系数本身还需要假设检验,另外就算两个变量高度相关,也不能说明测量结果一致。
测定一致的两种结果一定高度相关,但是高度相关的两个结果未必相同。
17、行×列表资料作χ2检验的目的是什么?
推断两个或多个总体率或构成比是否相同
18、四格表的χ2检验对数据有什么要求?
哪些情况下要用四格表确切概率法检验?
⑴要求:
①T≥ 5,而且N ≥ 40 直接用χ2检验
②1 ≤ T< 5,而且N ≥ 40 校正χ2检验
③T < 1 或N < 40 不能用χ2检验,可用四格表概率法
⑵四格表确切概率法:
当T < 1 或N < 40时
19、什么叫非参数统计方法?
非参数统计方法有哪些优点和缺点?
非参数统计方法:
总体分布未知或者不清楚,不对对总体分布中的参数进行估计或检验的统计方法
①优点:
适用范围广;收集资料方便;计算相对简单
②缺点:
对于符合参数检验要求的资料,如果用非参数的方法,会降低统计效率
不能对总体参数进行估计,因此没有概括性的数字说明整体
20、表达中心位置(集中趋势)的指标有几个,各适用于什么情况,有什么优缺点?
①均数(μ):
又称算术均数,反映一组观察值在数量上的平均水平
应用:
单峰对称分布的资料,特别是正态分布或者近似正态分布
优点:
直观,容易理解,计算简单
缺点:
对等比级数资料、近似倍数关系的资料等集中趋势的代表性较差
②几何均数(G):
变量对数值的算术均数的反对值
应用:
等比级数资料、近似倍数关系的资料或者对数正态分布资料
优点:
回避了极大极小值的影响
缺点:
对呈明显偏态的资料,分布的一端或者两端无确定数值的资料(开口资料),分布不清的资料不能很好地反映平均水平
③中位数(M):
将一组观察值从小到大顺序排列,居于中间位置的数值
应用:
呈明显偏态的资料;分布的一端或者两端无确定数值的资料(开口资料);分布不清的资料
优点:
对极值不敏感
缺点:
并非考虑了每个观察值
④百分位数(PX):
一种位置指标(其余同中位数)
⑤众数:
是一群数据中出现次数(频数)最多的值
应用:
适用于大样本
优点:
无
缺点:
较粗糙,对于进一步的统计学计算与分析不具备应用价值
21、表示离散度的指标有哪几个,各适用于什么情况,有什么优缺点?
①极差(R):
又称全距、极距,是一组定量资料中最大值与最小值之差
应用:
疾病潜伏期等
优点:
应用简便
缺点:
只能反映最大值和最小值;样本含量越大,极差可能越大;抽样误差较大
②四分位数间距:
一组定量资料中,某两个百分位数之差(P75-P25)
应用:
偏态分布
优点:
比极差的稳定性好
缺点:
未考虑全部观察值的变异程度
③方差与标准差:
反映一组数据的平均离散水平
应用:
对称分布、正态分布
优点:
反映了全部观察值的离散情况;反映了均数的代表性
缺点:
无
④变异系数
应用:
常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度
优点:
可用于不同单位资料间的比较
缺点:
无
22、如何选择统计图?
①直条图:
用于比较相互独立的资料(间断性资料),有单式及复式直条图
②圆形图及百分直条图:
用于构成比的资料,比较各构成部分的比重
③线图:
用于比较连续性资料,表示某事物在时间上的发展变化,或某现象随另一现象变迁的情况。
分为普通线图及半对数线图,有单式及复式之分
④直方图:
用于表示连续性资料的频数分布,各矩形面积总和为总频数
⑤散点图:
用于双变量资料,表示两种现象之间的相互关系
⑥统计地图:
适用于有地区性分布的资料
⑦箱式图:
箱子上端为75%的百分位数,下端为25%百分位数,中间为中位数,箱子的上下两柄表示最大和最小值,箱式图多用于数值变量的描述比较
23、在作假设检验中,P值含义是什么?
α的意义是什么?
怎么利用P与α下统计结论。
⑴P值:
在无效假设成立的条件下,获得现有统计量以及更不利于H0的数值的概率
⑵α:
检验水准,由检验统计量的分布曲线与横轴中处于拒绝域的这些值上面的那部分面积
⑶下结论:
①P>0.05,P>α(α=0.05),接受H0(检验假设),多个比较相同
②P<0.05,P<α(α=0.05),接受H1(备择假设),多个比较不全相同
24、常用的相对数指标有哪些?
使用时要注意哪些问题?
⑴相对数:
指两个有联系的指标之比,常用指标有
①率:
又称频率指标,它说明某现象发生的频率或强度
②构成比:
说明一事物内部各组成部分所占的比重或分布
③比(相对比):
是两个有关指标之比
⑵使用相对数时的注意事项:
①计算相对数的分母不宜过小
②分析时不能以构成比代率
③不能直接相加求其平均率
④资料的对比应注意可比性
25、可信区间的含义是什么?
可信区间的准确度和精密度指的是什么?
医学正常值范围与可信区间有何区别?
①可信度1-α(准确度)愈接近1愈好,如99%的可信度比95%的可信度要好
②区间的宽度(精密度),区间愈窄愈好。
当样本含量为定值时,上述两者互相矛盾,在可信度确定的情况下,增加样本含量可减小区间宽度。
区别点
总体均数可信区间
参考值范围
含
义
按预先给定的概率,确定未知参数μ的可能范围。
实际上,一次抽样算得的可信区间要么包含了总体均数,要么不包含。
但可以说:
当α=0.05时,95%CI估计正确的概率为0.95,估计错误的概率小于或等于0.05,即有95%的可能性包含了总体均数。
“正常人”的解剖,生理,生化某项指标的波动范围。
总体均数的波动范围
个体值的波动范围
用途
总体均数的区间估计
绝大多数(如95%)观察对象某项指标的分布范围
26、假设检验的基本思想是什么?
采用单侧或双侧检验的依据是什么?
⑴假设检验,也称显著性检验,是统计推断的重要内容统计学上利用反证法的思想,首先针对研究的总体建立一个假设,如果在该假设成立的条件下,得出的结论与该假设一致,则原假设成立,否则,原假设不成立:
①这个假设称为无效假设或者检验假设,记为H0
②和其相对应的假设称为备择假设,记为H1
判断时利用小概率原理
⑵依据:
见问题7
27、在样本均数与某个已知总体均数比较的假设检验中,在什么情况下用t检验,又在什么情况下可以有u检验(又叫Z检验)?
⑴t检验的应用条件:
①数值变量
②近似正态分布
③两个样本成组设计要求方差要齐性
⑵u检验的应用条件:
①n较大.(n>100)
②n虽小而总体标准差已知
28、何谓假设检验中的第一类错误?
何谓第二类错误?
如何控制两类错误概率的大小?
⑴ 客观实际 拒绝H0 不拒绝H0
H0成立 第一类错误(α) 推断正确(1-α)
H0不成立 推断正确(1-β) 第二类错误( β)
①第一类错误(I型错误):
拒绝了实际上是成立的H0,这类“弃真”的错误称为第一类错误(假阳性)
②第二类错误(II型错误):
不拒绝实际上是不成立的H0,这类“存伪”的错误称为第二类错误(假阴性)
⑵控制:
样本含量一定的话可以设置较小的检验水平控制一类错误,适当放大检验水准则可以控制2类错误;如果要同时减小1类2类错误必须增大样本含量。
29、方差分析的主要用途是什么?
方差分析的基本原理是什么?
?
⑴用途:
①多个样本均数间的比较
②单因素和多因素的分析
⑵原理:
总变异与总自由度按照来源进行分割
30、直线回归和直线相关分析的联系与区别是什么?
应用时应注意哪些问题?
⑴区别:
①在资料要求上不同
回归:
要求Y服从正态分布,X是可以精确测量或严格控制的,此类回归一般称 I 型回归
相关:
要求X、Y均服从正态分布(双变量正态分布),此类资料进行回归分析,称II 型回归
②在应用上不同。
回归:
反映两变量间依存变化的数量关系;
相关:
反映两变量间相关的密切程度和方向。
⑵联系
①同一组资料,r 与 b符号(正负好)一致(注意:
两者大小有一定关系,但不绝对)
②同一组资料, r 与 b的假设检验是等价的,即tb =tr
③可用回归解释相关:
r2 称为确定系数,其意义为回归变异占总变异的比值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 复习 江大京江版 For 检验