硕士医学统计学知识点总结汇总Word格式文档下载.docx
- 文档编号:16763727
- 上传时间:2022-11-25
- 格式:DOCX
- 页数:25
- 大小:56.35KB
硕士医学统计学知识点总结汇总Word格式文档下载.docx
《硕士医学统计学知识点总结汇总Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《硕士医学统计学知识点总结汇总Word格式文档下载.docx(25页珍藏版)》请在冰豆网上搜索。
图形
适用资料
实施方法
条图
组间数量对比
用直条高度表示数量大小
直方图
定量资料的分布
用直条的面积表示各组段的频数或频率
百分条图
构成比
用直条分段的长度表示全体中各部分的构成比
饼图
用圆饼的扇形面积表示全体中各部分的构成比
线图
定量资料数值变动
线条位于横、纵坐标均为算术尺度的坐标系
半对数线图
定量资料发展速度
线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系
散点图
双变量间的关联
点的密集程度和形成的趋势,表示两现象间的相关关系
箱式图
定量资料取值范围
用箱体、线条标志四分位数间距及中位数、全距的位置
茎叶图
用茎表示组段的设置情形,叶片为个体值,叶长为频数
第3章概率分布
1.服从二项分布及Poisson分布的条件分别是什么?
二项分布成立的条件:
①每次试验只能是互斥的两个结果之一;
②每次试验的条件不变;
③各次试验独立。
Poisson分布成立的条件:
除二项分布成立的三个条件外,还要求试验次数
很大,而所关心的事件发生的概率
很小。
2.二项分布、Poisson分布分别有什么特征?
二项分布、Poisson分布都是离散型分布。
二项分布的形状取决于π与n的大小。
π=0.5时,不论n大小,对称分布。
π≠0.5时,图形呈偏态,随n增大而逐渐对称。
当n足够大,π或1-π不太小,二项分布近似正态。
Poisson分布μ越小,分布越偏。
μ越大,分布越对称。
当n足够大时,分布接近正态。
4、正态分布应用
①估计变量值的频数分布
②制定参考值范围
③质量控制
④正态分布是很多统计方法的基础
5.正态分布特征
①以均数为中心,左右对称
②正态曲线在横轴上方均数处取得最高点
③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)
④正态曲线下面积有一定规律
第4章参数估计
1.标准误与标准差的区别
(1)标准差反映个体值散布的程度;
标准误反映估计总体参数的精确程度。
(2)标准误小于标准差。
(3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,随着样本含量的增大,标准差有可能增大,也有可能减小。
(4)用途不同。
标准差的用途:
1反映一组资料的离散程度
2计算变异系数
3结合均数与正态分布的规律,估计参考值范围
标准误的用途:
4衡量样本均数的可靠性
5与样本均数结合,估计总体均数的置信区间
6可用于进行均数的假设检验
标准误与标准差的区别与联系
标准差
标准误
区别
含义
描述个体观察值的离散程度
反应总体参数被估计的精确程度
范畴
统计描述
统计推断
用途
估计参考值范围
估计置信区间
n
n越大,标准差越稳定
n越大,标准误越小
联系
1.标准误大小与标准差成正比;
2.n一定时,标准差越大,标准误也越大。
3.简述置信区间与医学参考值范围的区别。
置信区间
参考值范围
计算公式
总体参数的波动范围,即按事先给定的概率100(1α)%所确定的包含未知总体参数的一个波动范围
估计未知总体均数所在范围
未知:
已知或未知但n≥30,有
或
个体值的波动范围,即按事先给定的范围100(1α)%所确定的“正常人”的解剖、生理、生化指标的波动范围
供判断观察个体某项指标是否“正常”时参考(辅助诊断)
正态分布:
偏峰分布:
PX~P100X
4何谓置信区间准确度与精确度?
如何协调两者间的关系。
置信区间有准确度与精密度两个要素。
(1)准确度由置信度 (1-α)的大小确定,即由置信区间包含总体参数的可能性大小来反映。
从准确度的角度看,置信度愈接近于1愈好,
(2)精密度是置信区间宽度的一半,意指置信区间的两端点值离样本统计量(如
、p)的距离。
从精密度的角度看,置信区间宽度愈窄愈好。
(3)在抽样误差确定的情况下,两者是相互矛盾的。
为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量。
3、参考值范围估计的基本步骤
①从正常人的总体中进行随机抽样
②对选定的正常人进行准确的测定
③确定取单侧还是双侧范围
④确定范围常用95%。
⑤根据资料的分布类型选用恰当的界值估计方法
第5章假设检验
1.试述假设检验中α与P的联系与区别。
区别:
(1)值是事先确定的一个小的概率值。
为一次检验中,甘愿冒的风险。
(2)P值是在
成立的条件下,出现当前检验统计量以及更极端状况的概率。
为一次检验中,实际冒的风险。
联系:
以t检验为例,P、都可以用t分布尾部面积大小表示。
P≤时,拒绝
假设。
2.试述假设检验与置信区间的联系与区别。
区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;
假设检验用于推断质的不同,即判断两总体参数是否不等。
3.怎样正确运用单侧检验和双侧检验?
需要根据数据的特征及专业知识进行确定。
若比较甲、乙两种方法有无差异,则应选用双侧检验。
若需要区分何者为优,,则应选用单侧检验。
在没有特殊专业知识说明的情况下,一般采用双侧检验即可。
4.试述两类错误的意义及其关系。
Ⅰ类错误:
如果检验假设
实际是正确的,由样本数据计算获得的检验统计量得出拒绝
的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设
(弃真)的错误称为Ⅰ类错误。
Ⅰ类错误的概率用
表示。
Ⅱ类错误:
若检验假设
原本不正确(
正确),由样本数据计算获得的检验统计量得出不拒绝
(纳伪)的结论,此时就犯了Ⅱ类错误。
Ⅱ类错误的概率用表示。
在假设检验时,应兼顾犯Ⅰ类错误的概率(
)和犯Ⅱ类错误的概率(
)。
犯Ⅰ类错误的概率(
)成反比。
如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;
反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。
为了同时减小
和
,只有通过增加样本含量,减少抽样误差大小来实现。
5.试述检验功效的概念和主要影响因素。
拒绝不正确的
的概率,在统计学中称为检验功效(poweroftest),记为
。
检验功效的意义是:
当两个总体参数间存在差异时(如备择假设
:
成立时),所使用的统计检验能够发现这种差异(拒绝零假设
)的概率,一般情况下要求检验功效应在0.8以上。
影响检验功效的四要素为总体参数的差异
、总体标准差
、检验水准
及样本量n。
6.简述假设检验的基本思想。
假设检验是在H0成立的前提下,从样本数据中寻找证据来拒绝
、接受
的一种“反证”方法。
如果从样本数据中得到的证据不足,则只能不拒绝
,暂且认为
成立,即样本与总体间的差异仅仅是由于抽样误差所引起。
拒绝
是根据某个界值,即根据小概率事件确定的。
所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝
,即有足够证据推断差异具有统计学意义。
7.建设检验四步骤:
7建立检验假设H0和备择假设H1(判断是单侧检验还是双侧检验再作假设)
8确定检验水准
9选定检验方法和计算检验统计量
10确定P值和作出推断结论
8.参数及非参数检验优缺点
参数检验
非参数检验
适用条件
资料正态分布,方差齐性
1.分布未知或偏态分布资料2.总体方差不齐3.等级资料4.开口资料
检验方法
1.t检验2.u检验
3.方差分析
1.符号秩和检验(配对资料)
2.秩和检验3.K-W检验(多组资料)
优点:
充分利用原始数据信息,检验效能高
缺点:
受资料总体分布限定
不受资料总体分布限定
只利用秩次,损失原始数据,检验效能低。
第6章两样本定量资料的比较
1.对于完全随机设计两样本定量资料的比较,如何选择统计方法?
完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性(样本量较大时不必进行正态性检验)和方差齐性。
如果资料来自正态总体且总体方差齐,采用t检验;
如果满足正态性但总体方差不齐,采用t′检验;
当两者都不满足时,才考虑选用秩和检验。
当然,我们也可采用变量变换的方法使其满足t或t′检验的条件。
2.t检验有几种,适用条件是什么?
t检验是以t分布为理论基础。
小样本时,要求资料符合正态分布和方差齐性。
一般有以下三种:
11样本均数与总体均数的比较
12配对资料的比较
13两个样本均数的比较
此外,还有相关系数,回归系数的t检验。
3.两组定量独立样本的比较
(1)两独立样本的t检验(满足正态性和方差齐性)
(2)校正的t检验(正态但方差不齐)
(3)u检验(大样本,且方差齐)
(4)秩和检验(小样本,不正不齐){p值确定分为T值在范围内还是范围外}
4.配对定量资料的比较
(1)配对资料的t检验(差值服从正态)
(2)符号秩和检验(不正){p值确定类似于t检验}
第7章多组定量资料的比较
1.方差分析的基本思想和应用条件是什么?
基本思想
将处理间平均变异与误差平均变异比较。
根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。
应用条件
①各样本是相互独立的随机样本,均服从正态分布;
②各样本的总体方差相等,即方差齐性。
2.方差分析的步骤
①建立假设检验和检验水准(H0:
总体均数都相等)
②计算统计量F
③确定P值和作出推断结论
④作两两均数之间的比较(若P>
0.05,可省略此步)
3.多组定量资料比较时,统计处理的基本流程是什么?
多组定量资料比较时首先应考虑用方差分析。
(1)若方差齐性,且各样本均服从正态分布,选单因素方差分析。
(2)若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。
若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。
4.方差分析的应用?
①多组定量资料比较,即两个或两个以上均数的比较
②方差齐性检验
③两个或多个研究因素的交互作用
④回归方程的线性假设检验
第8章定性资料的比较
1.简述
检验适用的数据类型,基本思想,检验步骤。
卡方检验是应用较广的一种定性资料的假设检验方法,用于
检验两个或多个样本率(或构成比)之间有无差别,
交叉分类资料两属性间的关联性检验
频数分布的拟合优度
χ2检验的基本思想:
χ2值反映的是实际频数与理论频数的吻合程度,在检验假设H0成立的情况下,实际频数与理论频数差别仅由随机误差所致,其χ2值会比较小,反之亦然,χ2值越大,越有理由认为检验假设H0不成立。
检验步骤:
①建立假设检验和检验水准(H0:
总体分布/某情况/某率相等)
②计算统计量
③确定P值和做出推断结论
④作两两之间的比较(若P>
2.四格表资料χ2检验的条件有哪些?
(注意T为理论频数)
完全随机设计公式,χ2=(ad-bc)2.n/{(a+b)(c+d)(a+c)(b+d)}
①总例数n≥40,且T≥5,直接计算χ2不用校正
②n≥40,且1≤T<5,用连续性校正χ2检验
③n<40或T<1,不能用χ2检验,用直接计算概率的方法Fisher确切概率法。
配对设计公式χ2=(b-c)2/(b+c)
2b+c≥40,无需校正
②b+c≤40,用连续校正公式
3.两组二分类资料的设计类型有几类?
其相应的检验方法是什么?
两组二分类资料的设计类型主要有2类,即完全随机设计和配对设计。
完全随机设计和配对设计资料在假设检验方法上均采用卡方检验。
通用公式χ2=(A-T)2/T
完全随机设计公式χ2=(ad-bc)2.n/{(a+b)(c+d)(a+c)(b+d)}
4.什么资料适合用秩和检验进行检验?
简述秩和检验步骤。
适用于总体分布未知资料,偏态分布资料,开口资料,等级资料。
秩和检验步骤为:
①建立假设
,并确定检验水准
;
(H0总体分布相等/配对秩和:
中体中位数为0)
②根据不同的设计类型对资料进行编秩并计算秩和;
③根据计算的秩和直接查表或计算相应的统计量再查表,确定
值,作出统计推断。
6、行×
列表资料χ2检验的注意事项
①要求不能有1/5以上的格子理论频数小于5,或不能有任意一个格子的理论频数小于1,否则易致分析的偏性。
②若结果拒绝检验假设,只能认为各总体率或构成比之间总的来说有差别,并非彼此间都有差别
③单向有序的行×
列表资料,不宜作χ2检验。
6、两样本比较的秩和检验直接法基本思想
假定含量分别为N1和N2的两个样本,来自同一总体或分布相同的两个总体,则样本含量为N1的样本的T与平均秩和N1(N+1)/2一般相差不大,若相差悬殊,超出界值范围,表示随机抽得现有样本统计量T值的概率很小。
7.非参与参数检验的定义及两者区别
参数检验是总体的分布类型已知,对其中未知的参数进行估计和检验的统计方法。
特点:
依赖于特定的分布类型,比较的是参数。
非参数检验是不依赖于总体分布形式的统计方法。
不受总体参数的影响,比较的是分布或分布位置,而不是参数。
9.配对设计差值的秩和检验的编秩方法
①求差值
②将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。
③若差值绝对值相等,则取其平均秩次。
④编秩时若遇差值为0,则舍去不计。
10.两组比较的秩和检验的编秩方法
将两样本混合编秩次,若有“相同数据”,处于不同组,则取其平均秩次;
在同一组,则无需取平均秩次。
(数据0不舍去)
11.配对设计差值的秩和检验的检验步骤
建立假设检验,确定检验水准H0:
差值的总体中位数为零H1:
差值的总体中位数不为零
计算检验统计量T值
②编秩:
将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。
若差值绝对值相等,则取其平均秩次。
编秩时若遇差值为0,则舍去不计。
③求秩和确定统计量T
确定P值,作出统计学推断。
n<25,用查表法。
n>25,用正态近似法。
8.参数检验和非参数检验的优缺点比较
13.非参检验适用范围
①各种资料初步分析
②等级资料,如严重程度,优劣等级,成效大小等。
③资料分布类型不能确认或偏态分布。
④综合分析同质性较差的资料
组内个别数据偏离较大,或组内相差悬殊。
第9章关联性分析第10章简单线性回归分析
1.Pearson积距相关系数r的特点
①相关系数ρ是一个无量纲的数值,且-1≤ρ≤1
②ρ>0为正相关,ρ<0为负相关。
③|ρ|越接近1,说明相关性越好;
|ρ|越接近0,说明相关性越差。
2.线性回归分析的前提条件LINE
①线性指反应变量Y与自变量X呈线性变化趋势。
一般通过散点图来考察。
②独立性任意两个观察值相互独立。
一个个体的取值不受另外一个个体的影响。
③正态性指给定X值时,Y的取值服从正态分布。
等方差性指对应于不同的X值,Y值的总体变异相同。
Pearson秩相关(即等级相关)的应用条件
①双变量不服从正态分布的资料
②总体分布类型未知的资料
③数据本身有不确定值
等级资料
直线回归及其回归方程有何用途
①描述Y对X的依存关系
②预测。
由自变量X预测应变量Y。
③统计控制。
通过控制自变量X的取值,从而使Y在一定范围内波动。
简述做直线相关与回归分析时的注意事项
①回归方程要有实际意义
②分析前先绘散点图,观察是否存在直线趋势或异常点
③直线回归的适用范围一般以自变量X的取值范围为限,不能随便外延。
直线相关与直线回归的区别与联系
①资料要求不同。
相关分析要求X,Y均服从正态分布,而回归分析时,要求Y服从正态分布。
②应用不同。
相关是只说明两个变量间是否有关联。
回归是由一个变量推算另外一个变量,说明依存变化的数量关系。
③相关系数与回归系数r与b不同。
A.意义不同:
b表示X每增(减)一个单位,Y改变b个单位;
r说明具有直线关系的两个变量关系的密切程度和方向。
B.取值范围不同-∞<b<+∞,-1≤r≤+1
C.b有单位,r无单位。
①同一组资料相关系数和回归系数的符号相同。
②同一资料相关系数和回归系数的假设检验等价。
即tr=tb,P值相等。
③可以用回归解释相关。
简述简单线性回归分析的基本步骤。
①绘制散点图,考察是否有线性趋势及可疑的异常点;
②估计回归系数;
③对总体回归系数或回归方程进行假设检验;
④列出回归方程,绘制回归直线;
⑤统计应用。
回归分析中决定系数R²
①定义:
考察在Y的变异中,由X所引起的变异占多大的比重。
R2=SS回归/SS总
②取值在0-1之间(因SS回归<SS总)
③大小反映了自变量对回归效果的贡献,即在Y的总变异中回归关系所能解释的百分比。
④反映了回归模型的拟合效果,常作为拟合优度的指标。
⑤当X与Y均为随机变量时,决定系数R²
等于相关系数(r)的平方。
第11章多重线性回归分析
μ=β0+β1X1+β2X2+…+βpXp
β0:
当所有自变量为0时反应变量Y的平均取值
βi:
(偏回归系数)方程中其他自变量不变时,Xi每增加(或减少)一个计量单位,反应变量Y平均改变βi个单位。
确定系数R²
:
反映回归方程的效果好坏。
R²
=SS回归/SS总说明自变量组X可以解释反应变量Y总变异的百分比。
(增加自变量,R²
只增不减)
调整的确定系数R²
ab=1—MS残差/MS总(增加贡献很小的自变量,R²
ab可能减小)
复相关系数R=确定系数开平方,表示随机变量Y与一组随机变量X之间线性相关的程度。
1.多重线性回归分析的用途有哪些?
定量地建立一个反应变量与多个解释变量之间的线性关系,
筛选危险因素,
通过较易测量的变量估计不易测量的变量,
通过解释变量预测反应变量,
通过反应变量控制解释变量。
4.如何判断和处理多重共线性?
如果自变量之间存在较强的相关,则存在多重共线性。
通过分析自变量之间的相关系数>0.9、计算方差膨胀因子>10和容忍度<0.25等指标判断是否存在多重共线性。
最简单的处理办法是删除变量,即在相关性较强的变量中删除测量误差大的、缺失数据多的、从专业上看意义不是很重要的或者在其他方面不太满意的变量。
也可采用主成分回归方法。
5.如何判断、分析自变量间的交互作用?
基于专业背景知识,构造可能的交互作用项,并检验交互作用项是否有统计学意义。
6.多重线性回归模型的基本假定有哪些?
如何判断资料是否满足这些假定?
如果资料不满足假定条件,常用的处理方法有哪些?
多重线性回归的前提条件(基本假定)是线性、独立性、正态性和等方差性,可以借助残差分析等方法判断资料是否满足条件。
如果资料不满足前提条件,可以采用变量变换、引入交互作用项和更换回归方程等方法处理。
7、哑变量的设置:
将有序变量或无序多分类变量转换成为多个二分类变量的过程。
个数为变量类别数减1。
第12章实验设计
科研设计的四项基本原则及其意义
①对照原则通过对照鉴别处理因素与非处理因素的差异;
消除或减少实验误差
②均衡原则要求各处理组非实验因素的条件均衡一致,以消除非实验因素对实验的影响。
③随机原则抽样随机,分配随机,实验顺序随机,以减少系统误差。
④重复原则要求一定的样本量。
重复实验、重复取样、重复测量
实验设计三要素
①处理因素
②受试对象
③实验效应(客观性、精准性、灵敏度、特异性)
实验设计类型
①单因素设计(完全随机设计):
单组设计、成组设计、单因素多水平设计
配对设计、
②随机区组设计(配对设计的拓展)
③交叉设计(处理因素顺序)
析因设计(K个因素与各水平组合)
重复测量设计
第13章临床试验设计
1.临床试验通常分为哪四期,各期的主要目的分别是什么?
Ⅰ期临床试验:
初步的临床药理学及人体安全性评价试验。
观察人体对于新药的耐受程度和药代动力学,为制定给药方案提供依据。
Ⅱ期临床试验:
治疗作用初步评价阶段。
其目的是初步评价药物对目标适应证患者的治疗作用和安全性,也包括为Ⅲ期临床试验研究设计和给药剂量方案的确定提供依据。
此阶段的研究设计可以根据具体的研究目的采用多种形式,包括随机盲法对照临床试验。
治疗组不少于100例。
Ⅲ期临床试验:
治疗作用确证阶段。
其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 硕士 医学 统计学 知识点 总结 汇总