《医学统计学》习题册.docx
- 文档编号:8291167
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:28
- 大小:149.42KB
《医学统计学》习题册.docx
《《医学统计学》习题册.docx》由会员分享,可在线阅读,更多相关《《医学统计学》习题册.docx(28页珍藏版)》请在冰豆网上搜索。
《医学统计学》习题册
上海交通大学网络教育学院医学院分院
医学统计学课程练习册
第一章绪论
一、单选题
1.小概率事件是指P()
?
B.P<0.05
2.从一个数值变量资料的总体中抽样,产生抽样误差的原因是?
A总体中个体值存在差别?
?
?
?
?
?
3.调查中国放射科医生接触射线情况,全国放射科医生的全部组成为
A.研究总体
4.若以舒张压90mmHg、收缩压130mmHg为高血压阳性临界点,调查3000人中有300名血压超过临界值,这份资料属于:
B.分类资料
5.下列属于统计量的指标是C样本标准差
6.调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是:
C定量资料
7.下列属于参数的指标是D总体标准差
8.用样本做统计推断,样本应是B.总体中有代表性一部分
9.统计推断的内容为?
D.A和B均是
10.随机调查社区2000人,得到平均体重为60公斤,则该资料属于
A.计量资料
二、名词解释
1.抽样误差:
由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。
样本指标与总体指标的差异称为抽样误差。
2.总体:
根据研究目的性质相同的观察单位的全体。
3.分类变量:
用定性方法测得,表现为互不相容的类别或属性,如性别等。
4.数值变量:
用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。
三、问答题
1.什么叫计量资料,它的统计分析方法有哪些(包括统计描述和统计推断)?
在科研中,用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这类资料一般有度量衡单位。
计量资料的统计分析包括统计描述和统计推断:
统计描述主要是统计图表、集中趋势和离散趋势的描述,集中趋势中可以计算算术均数、几何均数、中位数和众数,离散趋势可以计算极差、标准差、方差和变异系数。
统计推断包括点估计、区间估计和假设检验。
常用的假设检验方法包括:
t检验、u检验、方差分析(F检验)和秩和检验。
2.举例说明总体与样本的关系。
总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。
例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。
从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。
抽取样本的目的是用样本的信息推论总体特征。
第二章定量数据的统计描述
一、单选题
1.若资料为偏态分布,最好计算下列哪个指标来衡量集中程度D中位数
2.若资料为正态分布,最好计算下列哪个指标来衡量集中程度B算术均数
3.对数正态分布资料计算集中趋势应该用A几何均数
4.抗体滴度资料通常使用哪个集中趋势指标B几何均数
5.平均数指标体系中不包括A全距
6.抽样调查了10名居民体重资料,请问平均体重该用哪个指标计算C算术均数
7.样本标准差的的取值情况是A大于或等于零
8.若资料为正态分布,最好计算下列哪个指标来衡量离散程度C标准差
9.若资料为偏态分布,最好计算下列哪个指标来衡量离散程度()
B四分位间距
10.若资料末端没有截尾值,最好计算下列哪个指标来衡量离散程度()
D四分位间距
11.一组资料的例数等于25,方差等于16,标准差等于A4
12一组资料的标准差等于5,变异系数等于10%,样本均数等于B50
13.标准差与算术均数的使用条件()
B相同
14.比较两组正态分布数据离散度大小的指标,如果单位不同该用()
B变异系数
15可以反映个体离散程度的指标不包括()
C标准误
16.?
表示()
A总体方差
17.一组资料的例数等于25,均数为20,标准差等于5,则方差等于()
B25
18.四分位间距的使用条件与哪个指标是一致的()
A 中位数
19.四分位间距是指()
DP25-P75
二、名词解释
1.几何均数:
常用符号G表示,适用于原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料。
医学上的血清抗体滴度和血清凝集效价等适宜用几何均数描述其集中趋势。
2.中位数:
一组观察值由小到大顺序排列,位次居中的数值,适用于偏态分布和分布末端无确切值的资料。
3.变异系数:
变异系数(coefficientofvariance)为标准差与均数之比,用百分数表示,CV越大,表示观察值的离散程度越大;CV越小,表示观察值的离散程度越小。
4.四分位间距:
第75百分位数(P75)称为上四分位数QU,第25百分位数(P25)称为下四分位数QL,则四分位数间距(quartileinterval)Q=QU-QL。
四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距。
三、计算题
1.10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.0,122.5,140.0。
求平均数。
1.
2.6份血清抗体滴度为:
1:
2,1:
4,1:
8,1:
8,1:
16,1:
32,求平均数
2.
3.某医院调查30个乙肝表面抗原阳性患者抗体水平,求平均抗体水平
抗体水平分布
抗体水平1:
101:
1001:
10001:
100001:
100000
人数451092
3.
平均抗体水平为1:
1000
4.107名正常人尿铅含量分布,求平均尿铅含量
尿铅(mg/l)
例数f
累计频数ΣfL
累计频率(%)
0~
14
14
13.1
4~
22
36
33.6
8~
29
65
60.7
12~
18
83
77.6
16~
15
98
91.6
20~
6
104
97.1
24~
1
105
98.1
28~
2
107
100.0
4.
四、问答题
1.均数、几何均数和中位数的适用范围是什么?
(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;
(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。
2.标准差用于计量资料中正态或者近似正态分布的统计描述
标准差的应用有四个方面:
(1)表示个体变异的大小
(2)用来结合均数计算医学参考值范围(3)计算变异系数(4)计算标准误
3.变异系数与标准差的联系和区别是什么?
联系:
变异系数与标准差都是用于正态分布资料的离散程度的指标,变异系数等于标准差除以均数后乘以100%得到。
区别:
在比较离散程度大小时,用标准差一定要满足均数相近,单位一致的条件。
而变异系数可以用在以上两个条件任意一个不能满足的情况。
第三章正态分布与医学参考值范围
一、单选题
1.正态分布条件理论上()
D算术均数、中位数是一致的
2.中位数特别适用于()
D严重偏态分布资料
3.频数分布中,如果集中位置趋向于数据较小的一端,叫做()
C正偏态分布
4.一组数据呈正态分布,其中大于
的变量有:
()
D97.5%
5.一组数据呈正态分布,其中大于
的变量有:
()
B2.5%
6.一组数据呈偏态分布,其双侧95%的参考值范围为:
()
BP2..5-P97.5
7.正态分布曲线的形态参数应该是()
B方差
8.对于临床上计算尿铅的95%正常值可用哪个百分位数表示()
AP0—P95
9.标准正态分布曲线下(-1,1)之间的面积约为:
()
B68.27%
10.偏态资料的医学参考值范围估计方法是()
B百分位法
11.一组身高资料和一组体重资料比较其离散度大小应该用哪个指标()
D变异系数
12.标准差表示:
()
B个体变异
13.正态分布曲线下在均数加减一个标准差之间的面积大约占()
B68%
14.标准正态分布曲线的位置参数和形态参数分别是()
A0和1
15.评价一个个体指标是否正常可以用()
A医学参考值范围
二、名词解释
1.医学参考值范围:
医学参考值是指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。
由于个体指标的变异使其常数不仅因人而异,而且同一个体还会随机体内外环境的改变而改变,因此需要确定其波动的范围,即医学参考值范围。
三、问答题
1.正态分布的特征是什么?
正态分布有如下特征:
①正态分布曲线在在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布上有两个参数:
均数μ和标准差σ,均数μ是位置参数,决定正态曲线的中心位置,μ越大,曲线越向右移动;μ越小,曲线越向左移动,标准差σ是形状参数,决定正态分布曲线的陡峭或扁平程度,σ越小,表示数据越集中,曲线越陡峭,σ越大,表示数据越分散,曲线越扁平;④正态分布曲线下的面积分布有一定的规律。
2.四分位数间距、标准差、变异系数各有何特点?
(1)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度。
(2)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度.
(3)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。
3.制定医学参考值范围的一般原则是什么?
(1)抽取样本含量足够大的“正常人”。
一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。
(2)对抽取的正常人进行准确而统一的测定,控制测量误差。
(3)判断是否需要分组制定参考值范围。
(4)决定参考值范围的单侧或双侧界值。
(5)选择适当的百分界值。
(6)根据资料的分布类型选用恰当的方法估计参考值范围。
四、计算题
1.已知正常人的体温水平符合正态分布,在某地调查了100名成年女子测得其体温为36.8摄氏度,标准差为0.2摄氏度,问如果该地有一女子自述体温异常就医,测得其体温为37.5摄氏度,请问该女子的体温水平是否正常?
1.
2.调查某医院护士的年龄分布和收入状况,假设该人群的年龄和收入水平都呈正态分布。
共调查了100名护士,平均年龄为24.5岁,标准差为3.6岁,平均年收入为3.6万元,标准差为1.0万元。
(1)请比较该医院护士年龄和收入水平的离散程度。
(2)如某护士年收入为1.8万元,请评价该收入水平是否属于正常范围。
2.
(1)
故收入的变异大于年龄
(2)
3.某地20岁男子100人,其身高均数为166.06cm,标准差为4.95cm,其体
均数为53.72kg,标准差为4.96kg。
请比较何者变异度较大。
3.
4.调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。
4.
第四章定性数据的统计描述
一、单选题
1.已知男性的肝癌发病率高于女性,今欲比较甲、乙地的肝癌发病率,但甲地中女性多于男性,而乙地中男性多于女性,适当的比较方法是()
D对性别进行标准化后再比较
2.n足够大,样本率不接近于1或0,估计总体率95%的可信区间用()
Ap?
1.96Sp
3.若仅知道样本率,估计率的抽样误差用哪个指标表示。
()
DSp
4.反映某一事物发生强度的指标应选()
B率
5.发病率和患病率中会超过100%的是()
C发病率
6.甲地老年人口比重比乙地大,标准化后的食管癌死亡率甲、乙两地相等,
那么()
A原食管癌死亡率是甲地高于乙地
7.下列指标不属于相对数的是(?
?
)
?
D百分位数?
16.某医师用新药治疗一组高血压病人23例,21例好转,估计该疗法好转率95%的可信区间,用
Ap?
1.96Sp
9.比较两地某疾病的严重程度,可用哪个指标。
()
D发病率
二、名词解释
1.相对比:
相对比又称为对比指标,是指两个有关指标之比,通常以倍数或百分数表示。
2.率:
率又称为频率指标,它是用来说明某现象在一定条件下发生的频率大小或强度。
通常是某现象实际发生的例数与可能发生某现象的总数之比。
3.构成比:
构成比又称为构成指标,它表示事物内部某组成部分占其全部的比重或分布,通常以100%作为比例基数,以百分比的形式表示。
三、问答题
1.应用相对数的注意事项
应用相对数时应注意以下几个事项
(1)计算率和构成比时观察单位不宜过小;
(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化。
(5)两样本率比较时应进行假设检验
2.简述率的标准化法的基本思想
当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。
率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。
例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。
如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。
3.率的标准化应注意的问题
(1)当各比较组内部构成(如年龄、性别、职业、民族等)不同,并足以影响总率的比较时,应对率进行标准化,然后再作比较。
(2)率的标准化的目的是采用统一的标准,消除混杂因素的影响,使其具有可比性。
根据选用的标准不同,所计算的标准化率也不同。
标准化率只表明各标化组率的相对水平,而不代表其实际水平。
(3)各年龄组对应的率出现明显交叉,如低年龄组死亡率甲地高于乙地,而高年龄组则甲地低于乙地,此时宜分别比较各年龄组死亡率,而不用标准化进行比较。
(4)如是抽样研究,两样本标准化率的比较也应作假设检验。
四、计算题
1.请完成以下空白并进行描述性分析。
年龄(岁)
人口数
死亡总数
恶性肿瘤死亡数
恶性肿瘤死亡占总死亡的%
恶性肿瘤死亡率(1/10万)
年龄别死亡率(‰)
0-
82920
(138)
4
2.90
(4.8)
(?
1.66?
)
20-
(?
46638)
63
(?
12)
19.05
25.73
(?
1.35)
40-
28161
172
42
(?
24.42)
(?
149.4)
(6.11)
60-
(?
9371)
(?
342)
32
(?
9.36)
(?
341.5)
(?
36.5)
合计
167090
715
90
12.59
(?
53.86)
(?
4.28)
第五章统计表与统计图
一、单选题
1.某病随着事件推移疾病发病率的变化可以作()
?
B线图
2.比较某地两种疾病发病率差别可以作()?
C直条图?
?
?
?
?
?
3连续性频数分布资料该作()
A直方图?
?
?
4.散点图通常用于()
B双变量资料
5.统计表中线条要求只能有()
A横线
6.关于统计表中说法错误的是:
()
B一都要有备注
7.下列关于统计图表的说法,不正确的是:
()
D统计表均有备注附在表的下方
8.用统计图表示某地三种死因别死亡率,可选用()
C直条图
9.流行性乙型脑炎发病率的高低与年龄有关,据调查,3—8岁儿童是发病的高峰。
为反映患者年龄的频数分布规律,统计图应选用:
()
B直方图
10.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制
()
D半对数线图
11.拟以图示某市1990—1994年三种传染病发病率随时间的变化,宜采用()
A普通线图
二、问答题
1.统计表的基本结构要求是什么?
(1)标题标题是统计表的总名称,应简明扼要说明内容,必要时注明资料的时间、地点。
列在表的上端中央
(2)标目标目是表格内的项目,分为横标目和纵标目。
纵横标目的排列要得当,顺序应按时间顺序、事物的重要性、数字的大小等有规律地排列,并注明单位。
一般横标目列在表的左侧,表示表中研究对象,纵标目列在表的上端,说明研究对象的各个统计指标。
(3)线条力求简洁,主要有3条线:
上面的顶线,下面的底线以及隔开纵标目与数字的横线。
部分表格可用横线隔开合计,或用短横线分割多重纵标目。
其他竖线和斜线均可省去。
(4)数字表内数字必须准确,用阿拉伯数字表示。
位数对齐,小数的位数要一致,不留空格,是“0”则填“0”,暂缺或未记录可用“-”或“…”表示。
(5)说明文字不列入表内,特殊情况须用备注说明时,可用“*”号标出,写在表的下面。
2.统计图的制图通则是什么?
(1)根据资料性质和分析目的选用适当的图形。
(2)标题应扼要地说明图的内容,地点和时间,一般写在图的下端。
有多张图时要将编号写在标题前面。
(3)有坐标的图形(条图、散点图、线图及半对数线图、直方图),应有纵横两轴的标目和标目单位。
(4)横轴尺度自左至右,纵轴尺度自下而上,数值一律由小到大,纵横比例一般为5:
7(或7:
5)。
(5)图中用不同线条、颜色代表不同事物时,需用图例说明。
一般放在图的下方。
第六章参数估计与假设检验
一、单选题
1.
的含义是()
A标准误的理论值
2.
的含义是()
C标准误的估计值
3.t分布是()
A近似正态分布
4.一组100个样本的资料均数等于5,变异系数等于20%,则标准误等于()
C0.1
5.标准误反映()
C均数变异
6.t分布中,当自由度为无穷大,t分布逼近()
C标准正态分布
7.H0:
μ=μ0,H1:
μ≠μ0属于()
A双侧检验
8.下列属于单侧检验的是()
C已知A药疗效不会比B药差
9.检验水准的符号是()
D?
10.已知A药对某病有效。
现发明一种增效剂B,试图提高A药的疗效,想通过临床试验了解A+B的疗效是否显着地优于单用A药的疗效,应选用:
()
D双侧检验
11.下列哪个变量为标准正态变量()
D
12.以一定概率由样本均数估计总体均数,宜采用()
D区间估计
13.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大()
C标准误
二、名词解释
1.标准误:
为了与前面所述的一般变量值与均数的离散程度的指标-标准差相区别,我们把样本均数的标准差称为标准误,用
表示。
标准误愈大,样本均数的抽样误差愈大;标准误愈小,样本均数的抽样误差愈小。
2.统计推断:
在医学研究中,常常是采用抽样研究的方法,即从总体中用随机的方法抽取部分个体(样本)进行研究,目的是用样本的信息推论总体的特征,这在统计学上称为统计推断。
3.检验水准:
检验水准也称显着性水准,符号为α,是假设检验时发生第一类错误的概率
三、问答题
1.标准误的用途?
(1)可用于反映样本均数的可靠性。
标准误小表示样本均数与总体均数较接近,用样本均数代表总体均数的可靠程度较大;反之标准误大,则表示用样本均数代表总体均数的可靠程度较小。
(2)可用于估计总体均数的可信区间。
(3)可用于均数的假设检验。
2.t分布的特征是什么?
t分布有以下特征:
①以0为中心,左右对称;②t分布曲线形态与n(确切地说与自由度ν)大小有关。
与标准正态分布曲线相比,自由度ν愈小,t分布曲线愈平坦,曲线中间愈低,曲线两侧尾部翘得愈高;自由度ν愈大,t分布曲线愈接近正态分布曲线,当自由度ν=∞时,t分布曲线为标准正态分布曲线。
3.标准差与标准误有何区别和联系?
标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别:
①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同:
当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:
标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
4.何谓假设检验?
其一般步骤是什么?
所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。
假设检验一般分为以下步骤:
①建立假设:
包括:
H0,称无效假设;H1:
称备择假设;②确定检验水准:
检验水准用α表示,α一般取0.05;③计算检验统计量:
根据不同的检验方法,使用特定的公式计算;④确定P值:
通过统计量及相应的界值表来确定P值;⑤推断结论:
如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。
四、计算题
1.已知正常人的体温水平符合正态分布,在某地调查了100名成年女子测得其体温为36.8摄氏度,标准差为0.2摄氏度,请计算当地女子体温总体均数的95%可信区间。
?
1.当地女子体温总体均数的95%可信区为
2.某地100名3岁女孩平均身高为92.8cm,标准差为4.6cm,求其标准误。
2.
3.调查某地100名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白总体均数95%的可信区间。
3.该地健康女性血红蛋白总体均数95%的可信区间为
1389.总体均数的95%可信区间为:
即:
(92.1,93.5)即该地3岁女孩身高总体均数的95%可信区间为92.1~93.5cm。
第七章t检验
一、单选题
1.两样本比较作t检验,差别有显着性时,P值越小说明()
C越有理由认为两总体均数不同
2.两样本比较时,分别取以下检验水准,哪一个的犯Ⅱ类错
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学 医学 统计学 习题