医学统计学 历年考题.docx
- 文档编号:1966142
- 上传时间:2022-10-25
- 格式:DOCX
- 页数:18
- 大小:181.11KB
医学统计学 历年考题.docx
《医学统计学 历年考题.docx》由会员分享,可在线阅读,更多相关《医学统计学 历年考题.docx(18页珍藏版)》请在冰豆网上搜索。
医学统计学历年考题
2001级七年制临床医学专业考试试题答案
一、解释以下概念:
1、同质:
对研究指标影响较大的、可以控制得主要因素尽可能相同。
变异:
同质基础上各观察单位的某变量值得差异称为变异。
2、均数的抽样误差:
由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差。
3、假设检验P值含义,以及与的关系:
P值是指从所规定得总体中随机抽样时,获得等于及大(负值时为等于及小于)现有样本统计量的概率。
若,按检验水准不拒绝,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。
若,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝,接受;可认为从已知总体抽到现有样本得可能性很小,该样本可能来自另一总体。
4、变量及其变量类型:
变量:
在搜集资料时,对每个观察单位得某项特征进行测量或观察,该特征称为变量。
变量类型:
1.数值变量其变量值是定量的,表现为数值得大小,通常用仪器或某种尺度测定出来,多有度量衡单位。
由数值变量的测定值组成的资料称为数值变量资料或计数资料。
如:
身高、体重、心律、住院天数、血压等。
2.分类变量亦称定性变量,表现为互不相容的类别或属性。
分类变量可分为无序与有序两类:
(1)无序分类分类是指所分类别或属性之间无程序或顺序上的差别。
分析无序分类变量时,应先按类别分组,计各组的观察单位数,所得资料称为无序分类变量资料或计数资料。
如:
性别(男、女),血型(O、A、B、AB)等。
(2)有序分类变量是指所分类别或属性之间无程序或顺序上的差别。
分析有序分类变量时,应先按等级顺序分组,计各组的观察单位数,所得资料称为有序分类变量资料或等级资料。
如:
尿糖化验结果按-、±、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。
二、简述标准差与标准误的异同与关系
标准差:
计算公式:
a)表示观察值的变异程度
b)计算变异系数
c)确定医学参考值范围
d)计算标准误
e)与样本含量没有关系
标准误:
计算公式:
(1)估计均数的抽样误差的大小
(2)估计总体均数可信区间:
(3)进行假设检验
(4)与样本含量成反比
三、常用得抽样分布及其参数的区间估计
1、t分布,均数的区间估计:
1)未知且n小:
2)未知,但n足够大时(n>100),t分布逼近u分布:
3)已知:
2、二项分布:
当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布,总体率的可信区间:
3、Poisson分布:
当样本阳性数X>50时,可按正态近似原理先求总体平均数的95%或99%可信区间:
四、方差分析的应用条件及其用途:
1)各样本是相互独立的随机样本;2)个样本来自正态分布总体;3)各总体方差相等,即方差齐。
应用:
1)两个或多个样本的均数间的比较;2)分析两个或多个因素间的交互作用;3)回归方程的线性假设检验;4)多元线性回归分析中偏回归系数的假设检验等。
五、某实验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙、丁四种药物对细胞进行抑制,每个试验条件下均重复4次实验(独立的4个样品),其观测指标为计量资料(数值变量资料)。
问该实验适于用何种实验设计,并写出设计方案
该设计是2*4析因设计
设计方案如下,如图所示,可将八个样品随机分为下面的八组:
A1
A2
A3
A4
B1
A1B1
A2B1
A3B1
A4B1
B2
A1B2
A2B2
A3B2
A4B2
先为八个样品按取样先后标上1、2、3、4、5、6、7、8,再用随机数字表将其标上随机数字,(随机数字表略去)将随机数字排秩,按秩次的1到8,分别取从A1B1、A1B2、A2B1、...、A4B2。
进行实验。
六、简述完全随机设计的两样本比较的分析思路,并写出相应统计量的计算公式
先将受试对象编号,再利用随机列表或随机数字表或计算机软件产生的随机数字,按某一行将受试对象编上随机数字,然后将其随机数字编秩,秩次为奇数的分为一组,秩次为偶数的分为一组进行实验。
这就是完全随机设计两样本比较的分析思路。
其检验统计量t值是:
,
七、分别写出非条件logistic回归和条件logistic回归模型的一般形式,并解释其中各符号的含义。
非条件logisti回归模型:
,
其中是常数项,为偏回归系数。
条件logistic回归模型:
(i=1,2,…n),
其中表示各层的效应,为待估计的参数。
2002级临床医学七年制《医学统计学》期末考试题(A卷)
一、试述标准差与标准误的联系与区别。
二、请以完全随机设计资料为例说明方差分析的基本思想。
三、在某次假设检验中,0.05,所得的概率为0.001,请就本例分别说明和的意义?
四、研究人员调查了2005年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些统计信息?
(10分)
表1某社区居民2005年死亡人口调查
年龄
人口数
全死因
死亡人数
恶性肿瘤
死亡人数
0
82920
138
4
20
46639
63
12
40
28161
172
42
60
9370
342
32
合计
167090
715
90
五、请解释多元线性回归分析中R2和的统计学意义。
六、什么是随访资料中的截尾值?
出现截尾值的原因有哪些?
七、中国人民解放军总后卫生部军需装备研究所研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?
需安排几个实验组?
请写出设计方案。
八、今测得101名30~49岁的正常成年男子的血清总胆固醇(表2)。
试根据此资料进行全面的统计分析。
(10分)
血清胆固醇(mmol/L)
频数
2.5~
1
3.0~
8
3.5~
9
4.0~
23
4.5~
25
5.0~
17
5.5~
9
6.0~
6
6.5~
2
7.0~7.5
1
合计
101
九、为了比较工人和农民的高血压患病率,随机调查了50~59岁的男性工人1281人,其中高血压患者386人;又随机调查了50~59岁的男性农民387人,其中高血压患者65人。
问工人与农民的高血压患病率是否相同?
十、今测得10名男20岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。
(10分)
表310名男20岁男青年的身高与前臂长
编号
1
2
3
4
5
6
7
8
9
10
身高(cm)
170
173
160
155
173
188
178
183
180
165
前臂长(cm)
45
42
44
41
47
50
47
46
49
43
可能用到的界值:
,,,。
2002级临床医学七年制《医学统计学》期末考试试题(A)参考答案
一、试述标准差与标准误的区别和联系
答:
区别:
⑴意义:
标准差是描述数据分布离散程度的指标;标准误是样本统计量的标准差。
⑵公式:
;(2分)
⑶用途:
标准差①用于表示数据离散程度的大小;②也可用于计算变异系数、估计频数分布、制定参考值范围、进行质量控制;③很多统计处理方法中要用到标准差。
标准误①用于反映抽样误差的大小;②计算总体均数的可信区间;③统计处理方法的基础,如t检验。
联系:
标准误与标准差成正比;若标准差固定不变,可通过增加样本含量来减少抽样误差。
二、请以完全随机设计为例说明方差分析的基本思想
答:
方差分析的基本思想就是把全部观察值间的变异----总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。
在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:
分解为和;分解为和,得组间变异和组内变异分别为=和=,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误差所致,=,F值()服从F分布,查F界值表得到相应的P值,然后根据所取的检验水准做出推断结论。
答案难以统一,只要基本意思表达正确,均应给分,阅卷时需灵活掌握,注意把握尺度。
三、在某次假设检验中,检验水准为0.05,所得的概率为0.001,请就本例分别说明和的意义?
答:
称检验水准,是预先给定的概率值,它确定了小概率事件的标准;P的含义是指从规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率,即抽样误差的概率。
将获得的概率P与检验水准进行比较可得出结论。
本例0.05,0.0010.05,拒绝,接受,结论具有统计学意义,可以认为不同或不等。
四、研究人员调查了2005年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些统计信息?
答:
可以得到以下统计信息:
各年龄组人口构成比、各年龄组全死因构成比、恶性肿瘤死因构成比和各年龄组恶性肿瘤死亡构成比、粗死亡率和年龄别死亡率、恶性肿瘤死亡率和年龄别恶性肿瘤死亡率。
(不要求:
肿瘤后的死亡人数占全死因死亡人数的比例、全死因寿命表死亡概率、全死因寿命表生存概率、去肿瘤死亡后的生存概率、去肿瘤死亡后的尚存人数、去肿瘤死亡后的死亡人数、去肿瘤死亡后的生存人年数、去肿瘤死亡后的生存总人年数、去肿瘤死亡后各年龄尚存者的平均预期寿命。
)
五、请解释多元线性回归分析中R2和的统计学意义。
答:
R2为决定系数,其意义是回归平方和占总离均差平方和的比例,用R2可定量评价在的总变异中,由变量组建立的线性回归方程所能解释的比例。
为剩余标准差,可以说明估计值的精确度,剩余标准差越小,表示回归方程的估计精度越高。
六、什么是随访资料中的截尾值?
出现的原因有哪些?
答:
由于某种原因使得部分病人不能随访到底,称之为截尾,从起点至截尾点所经历的时间称为截尾值。
出现截尾值的原因主要有随访对象失访、治疗措施改变、研究工作结束时事件尚未发生等情况。
七、研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?
需安排几个实验组?
请写出设计方案。
答:
应采用2×2析因设计,需安排4个实验组。
具体设计方案如下:
状态1
状态2
环境1
12345
12345
环境2
12345
12345
八、今测得101名30~49岁正常成年男子的血清总胆固醇(表2)。
据此资料进行全面的统计分析。
(10分)
答:
⑴由频数表可看出,资料近似服从正态分布,可用均数和标准差描述其集中趋势和离散趋势。
,
⑵制定95%参考值范围:
⑶估计总体均数的可信区间:
n=101>50
九、为了比较工人和农民的高血压患病率,随机调查了50~59岁的男性工人1281人,其中高血压患者386人;又随机调查了50~59岁的男性农民387人,其中高血压患者65人。
问工人与农民的高血压患病率是否相同?
答:
首先将资料整理成下表形式:
是否患高血压
是
否
合计
工人
386
895
1281
农民
65
322
387
合计
451
1217
1668
1.建立检验假设,确定检验水准
工人与农民的高血压患病率相同
工人与农民的高血压患病率不同
2.选定检验方法,计算检验统计量(可选用下列两种方法之一):
(1)检验:
(2)u检验:
⑶确定P值,作出推断结论
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学 历年考题 医学 统计学 历年 考题