医学统计学重点Word文件下载.doc
- 文档编号:13071731
- 上传时间:2022-10-04
- 格式:DOC
- 页数:22
- 大小:336.50KB
医学统计学重点Word文件下载.doc
《医学统计学重点Word文件下载.doc》由会员分享,可在线阅读,更多相关《医学统计学重点Word文件下载.doc(22页珍藏版)》请在冰豆网上搜索。
2.样本特点:
足够的样本含量、可靠性、代表性。
3.资料类型:
(1)定量资料:
又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所
得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的
数值,有度量衡单位。
(2)分类资料:
包括无序分类资料(计数资料)和有序分类资料(等级资料)
①计数资料:
是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由
各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:
将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:
将观察对象按多种互斥的属性分类
②等级资料:
将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单
位的个数所得的资料。
4.统计工作基本步骤:
统计设计、资料收集、资料整理、统计分析。
第二章实验研究的三要素
1.实验设计三要素:
被试因素、受试对象、实验效应
2.误差分类:
随机误差(抽样误差、随机测量误差)、系统误差、过失误差。
3.实验设计的三个基本原则:
对照原则、随机化分组原则、重复原则。
4.实验设计方法
有析因设计正交试验设计均匀试验设计
交互作用两组:
异体配对设计同体配对设计交叉设计
无随机同期对照实验设计(单因素两水平)扩展
多组:
单因素多水平配伍组设计拉丁方设计
(两因素多水平)(三因素多水平)
配伍组设计:
也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。
析因设计:
考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。
一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。
优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。
拉丁方设计:
用于三因素等水平无交互。
第三章定量资料的统计描述、参考值范围
1.频数表编制过程(了解)
(1)找出样本数据的最大值和最小值,计算极差R;
(2)分组:
确定分组的组距d和组数k;
一般n<
50,5-6组;
n在100左右,7-10组;
n>
100,10-15组
(3)求频率密度:
统计频数,算出频率、频率密度和累积频率;
(4)画出直方图。
2.频数表和直方图的作用:
用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。
3.集中趋势、离散趋势的指标及适用范围
(1)集中趋势:
,G,M,Px,M0
算术均数:
适用于对称分布;
不适用于偏态分布和资料中出现极值的资料。
几何均数:
适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。
不适用与观察值中有0或正负数值同时出现的资料。
中位数:
适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。
百分位数的作用:
多个百分位数结合使用,全面描述数据分布的特征;
用于确定医学参考值范围(偏态或分布不明的资料)。
众数:
适用于大样本,较粗糙。
(2)离散趋势:
极差:
优点:
简单明了、容易使用。
缺点:
①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。
②样本容量越大,极差可能越大。
③极差的抽样误差大,不稳定。
四分位数间距:
适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。
缺点:
类似于极差,利用度低。
方差与标准差:
与均数一起描述对称分布,特别是正态分布的分布特征。
变异系数:
适用于:
①适用于比较度量衡单位不同资料的变异度。
②比较均数相差悬殊的资料的变异度。
③衡量实验精密度和稳定性的常用指标。
(3)频数分布特征
高峰在中间,左右大致对称,称为对称分布。
平均数=中位数=众数
高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。
平均数>
中位数>
众数
高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。
平均数<
中位数<
对称分布正(右)偏态分布负(左)偏态分布
4.正态分布图形的特点及意义
(1)特点:
①f(x)关于x=μ对称
②x=μ时取得最大值
③在x=μ±
σ处为拐点,且以x轴为水平渐近线
④f(x)大于0
⑤P(x=a)=0
⑥若f(x)在点x处连续,则F´
(x)=f(x)
(2)意义:
=1,f(x)在负无穷到正无穷的积分值为1,即曲线下方面积为1。
5.μ和σ2的意义
μ:
位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;
μ减小,曲线沿横轴向左移动。
σ2:
形状参数,当μ固定时,σ越大,曲线越矮胖;
σ越小,曲线越高瘦。
6.标准化变换
z=x~N(μ,σ2)z~N(0,1)
F(x)=Ф()=Ф(z)即P(X≤x)=Ф()=P(Z≤z)
P(a<
x<
b)=F(b)-F(a)=Ф()-Ф()P(<
<
)=P(<
Z<
)
7.标准正态分布界值
规定:
界值右侧曲线下方面积等于它的下角标。
下角标一致,x轴上方中间面积一致。
双侧界值:
P(|z|≤z)=1-αP(z<
z)=1-
P(|z|≥z)=αP(z>
z)=
单侧界值:
上限:
下限:
P(z>
zα)=αP(z>
z1-α)=1-α
P(z<
zα)=1-αP(z<
z1-α)=α
8.正常值范围及意义
概念:
医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研
究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者
的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参
考,又称医学参考值范围。
意义:
95%的参考值范围含义是指:
样本中有95%的个体测定值在所求范围之内。
以95%的置信区间来说,意义是:
该区间以95%的概率包含了待估计的参数,这种
估计的可信度是95%,会冒5%的风险。
公式:
双侧95%的界限值:
±
1.96s
单侧95%的上限值:
+1.645s
-1.645s
第四章总体均数的估计、假设检验
1.标准误
(1)概念:
每次样本计算出的不同,这些的标准差称为均数的标准误。
(2)意义:
是衡量样本统计量抽样误差大小的统计指标。
(3)与标准差的区别:
二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描
述统计量的变异。
(4)均数标准误的公式:
S=
2.置信区间
(1)定义:
设θ为总体的未知参数,若由样本确定的两个统计量θ1(x1、x2、…、xn)和θ2(x1、
x2、…、xn),且θ1<
θ2,对于预先给定的值α(0<
α<
1),若满足P(1<
2)=1-α,
则称随机区间(1,2)为θ的1-α置信区间,其中称为1置信下限,称为2
置信上限,1-α称置信度。
区间(1,2)包含有参数θ的概率为1-α,不能说θ在(1,2)的概率为
1-α。
例:
可以说(a,b)包含均数μ的概率为95%,不能说μ在(a,b)的概率为95%。
(3)公式:
单个正态总体均数μ的区间估计
①σ已知:
双侧:
即
z分布
单侧:
②σ未知:
双侧:
小样本(n≤50)t分布
单侧:
大样本(n>
50)z分布
(4)两要素:
准确度:
由1-α决定,1-α越大,准确度越高。
精确度:
由区间长度决定。
99%置信区间准确度高于95%置信区间。
95%置信区间精确度更高。
3.抽样分布
(1)t分布
①定义:
来自正态总体的一组样本,和s分别是样本的均数和标准差。
则t=~
t分布,自由度df=n-1,极限分布是标准正态分布。
②图形分布特征:
以0为中心,左右对称的单峰分布。
自由度越大,越高瘦
③界
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 重点