卫生统计学赵耐青习题答案Word文档格式.docx
- 文档编号:17765305
- 上传时间:2022-12-09
- 格式:DOCX
- 页数:114
- 大小:83.83KB
卫生统计学赵耐青习题答案Word文档格式.docx
《卫生统计学赵耐青习题答案Word文档格式.docx》由会员分享,可在线阅读,更多相关《卫生统计学赵耐青习题答案Word文档格式.docx(114页珍藏版)》请在冰豆网上搜索。
下列说法是否正确,为什么
a)A药组的疗效高于B药组。
b)A药的疗效高于B药。
a)正确,因为就两组样本而言,的确A组疗效高于B组。
b)不正确,因为样本的结果存在抽样误差,因此有可能人群的A药疗效高于B药,也
可能人群的两药的疗效相同甚至人群B药的疗效高于A药,
2.某校同一年级的A班和B班用同一试卷进行一次数学测验。
经过盲态改卷后,公布成
绩:
A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为
什么
a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。
b)可以称A班的数学平均水平低于B班。
a)正确,因为此处将A班和B班作为研究总体,故不存在抽样误差。
b)不正确,因为这一次数学平均成绩只是两班数学成绩总体中的两个样本,样本的差异
可能仅仅由抽样误差造成。
3.在某个治疗儿童哮喘的激素喷雾剂新药的临床试验中,研究者收集了300名哮喘儿童患
者,随机分为试验组和对照组,试验组在哮喘缓解期内采用激素喷雾剂,在哮喘发作期
内采用激素喷雾剂+扩展气管药;
对照组在哮喘缓解期不使用任何药物,在哮喘发作期
内采用扩展气管药物。
通过治疗3个月,以肺功能检查中的第1秒用力呼吸率
(FEV1/FRC1)作为主要有效性评价指标,评价两种治疗方案的有效性和安全性。
请阐
述这个研究中的总体和总体均数是什么
试验组的研究总体是接受试验组治疗方案的全体哮喘儿童患者在治疗3个月时的
FEV1/FRC1值的全体。
对照组的研究总体是接受对照组治疗方案的全体哮喘儿童患者
在治疗3个月时的FEV1/FRC1值的全体。
试验组对应的总体均数是接受试验组治疗方案的全体哮喘儿童患者在治疗3个月时的
FEV1/FRC1的平均值;
对照组对应的总体均数是接受对照组治疗方案的全体哮喘儿童
患者在治疗3个月时的FEV1/FRC1的平均值。
4.请简述什么是小概率事件对于一次随机抽样,能否认为小概率事件是不可能发生的
在统计学中,如果随机事件发生的概率小于或等于,则通常可以认为是一个小
概率事件,表示该事件在大多数情况下不会发生,并且一般可以认为小概率事件在一次随机
抽样中不会发生,这就是小概率事件原理。
小概率事件原理是统计学检验的基础。
5.变量的类型有哪几种请举例说明,各有什么特点
(1)连续型变量,可以一个区间中任意取值的变量,即在忽略测量精度的情况下,
连续型变量在理论上可以取到区间中的任意一个值,并且通常含有测量单位。
观察连续型变
量所得到的数据资料称为计量资料(measurementdata)。
如例1-1中的身高变量就是连续型变
量,身高资料为计量资料。
.
(2)离散型变量,变量的取值范围是有限个值或者为一个数
列。
离散型变量的取值情况可以分为具有分类性质的资料和不具有分类性质的资料,表示分
类情况的离散型变量亦称分类变量(categoricalvariable)。
观察分类变量所得到的资料称为分
类资料(categoricaldata)。
分类资料可以分为二分类资料和多分类资料,而多分类资料又分成
无序分类资料和有序分类资料,二分类资料如症状指标分为感染或未感染,无序多分类资料
(nominaldata)如血型可以分为A、B、AB和O型,有序多分类资料(ordinaldata)如病情指
标分为无症状、轻度、中度和重度。
第二章
1.不论数据呈何种分布,都可以用算术均数和中位数表示其平均水平。
只有资料满足正态或近似正态分布时计算算术均数是比较有统计学意义的。
2.在一组变量值中少数几个变量值比大多数变量值大几百倍,一般不宜用算术均数表示其
平均水平。
对,可以采用中位数表示。
3.只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。
错,标准差S是绝对误差的一种度量,变异系数CV是相对误差的一种度量,对于两组
资料离散程度的比较,即使两组资料的度量单位相同,也完全有可能出现两个指标的结论是
不同的。
在实际应用时,选择离散程度的指标时,考虑其结果是否有研究背景意义。
例如:
一组资料为成人的身高观察值,另一组资料为2岁幼儿的身高观察值,虽然可以用标准差S
比较两组的离散程度,也不能认为这是错误的,但根本没有研究背景意义,相反选择变异系
数CV比较两组资料的相对变异程度,这就有一定的研究背景意义。
4.描述200人血压的分布,应绘制频数图。
5.算术均数与中位数均不容易受极值的影响。
算术均数比中位数容易受到极值的影响。
1.中位数是表示变量值A的指标。
A.平均水平
B.变化范围
C.频数分布
D.相互间差别大小
2.对于最小组段无确定下限值和(或)最大组段无确定上限值的频数分布表资料,宜用下
列哪些指标进行统计描述C____
A中位数,极差B中位数,四分位数间距
C中位数,四分位数范围D中位数,标准差
3.描述年龄(分8组)与疗效(有效率)的关系,应绘制A。
A.线图B.圆图C.直方图D.百分条图
4、为了描述资料分布概况,绘制直方图时,直方图的纵轴可以为D。
A频数B频率C频率密度(频率/组距)D都可以
三、简答与分析题
1.100名健康成年女子血清总蛋白含量(g/L)如表2-14,试描述之。
表2-12100名成年健康女子血清总蛋白含量(g/L)
制作频数表如下:
_____________________________________________________________________
组段频数百分比累积频数累积百分比
____________________________________________________________________
64~33
66~58
68~816
70~1127
72~2552
74~2476
76~1086
78~793
80~699
84~1100
变量例数均数标准差最小值最大值中位数25百分位数75百分位数
x100
2.某医师测得300名正常人尿汞值(ng/L)如表2-15,试描述资料。
表2-13300名正常人尿汞值(ng/L)
尿汞例数累计例数累计百分数(%)
0~4949
4~2776
8~58134
12~50184
16~45229
20~22251
24~16267
28~10277
32~7284
36~5289
40~5294
44~0294
48~3297
52~0297
56~2299
60~1300
合计300——
根据资料给出统计描述的指标如下:
例数均数标准差最小值最大值
16262
3.对于同一的非负样本资料,其算数均数一定大于等于几何均数。
根据初等数学中的不等式12
12
nn
n
aaaaaa
+++
≥,可以得到算数均数一定大于
等于几何均数。
4.常用的描述集中趋势的指标有哪些,并简述其适用条件。
(1)算术均数:
适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:
适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数
正态分布)的资料,以及等比数列资料。
(3)中位数:
适用各种类型的资料,尤其以下情况:
A资料分布呈明显偏态;
B资料一端或两端存在不确定数值(开口资料或无界资料);
C
资料分布不明。
第三章
一、是非题
1.二项分布越接近Poisson分布时,也越接近正态分布。
当二项分布的π不太接近0或者1,随着n的增大,nπ和n(1π)均较大时,
二项分布的X的逐渐近似正态分布;
n较大,π较小,二项分布的X近似总体均数为
μ=nπ的Poisson分布,只有n较大、π较小并且nπ较大时,二项分布的X既近似
Poisson分布又近似正态分布,其本质是当n较大、π较小时二项分布的X所近似的
Poisson分布在其总体均数μ=nπ较大时逼近正态分布。
2.从同一新生儿总体(无限总体)中随机抽样200人,其中新生儿窒息人数服从二项
分布。
因为可以假定每个新生发生窒息的概率π是相同的并且相互独立,对于随机抽
取200人,新生儿窒息人数X服从二项分布B(n,π)。
3.在n趋向无穷大、总体比例π趋向于0,且nπ保持常数时的二项分布的极限分布是
Poisson分布。
这是二项分布的性质。
4.某一放射物体,以一分钟为单位的放射性计数为50,40,30,30,10,如果以5分
钟为时间单位,其标准差为160
5。
设iX服从总体均数为μ的Poisson分布,i=1,2,3,4,5,并且相互独立。
根据
Poisson分布的可加性,12345X+X+X+X+X服从总体均数为5μ,___________其总体方差为
5μ,本题5分钟的总体方差5μ的估计值为50+40+30+30+10=160,所以其标准
差为160。
5.一个放射性物体一分钟脉冲数为20次,另一个放射性物体一分钟脉冲数为50次。
假定两种放射性物体的脉冲性质相同,并且两种放射性物体发生脉冲是相互独立的,
则这两种物体混合后,其一分钟脉冲数的总体均数估计值为70次。
根据Poisson分布的可加性,这两种物体混合后的发生的脉冲数为12X+X,混
合后一分钟脉冲数的总体均数估计值为20+50=70次。
6.一个放射性物体平均每分钟脉冲数为5次(可以认为服从Poisson分布),用X表示
连续观察20分钟的脉冲数,则X也服从Poisson分布。
对,这是Poisson分布的可加性。
7.一个放射性物体平均每分钟脉冲数为5次(可以认为服从Poisson分布),用X表示
连续观察20分钟的脉冲数,则X的总体均数和总体方差均为100次。
Poisson分布的可加性原理。
8.用X表示某个放射性物体的每分钟脉冲数,其平均每分钟脉冲数为5次(可以认为
服从Poisson分布),用Y表示连续观察20分钟的脉冲数,则可以认为Y近似服从正
态分布,但不能认为X近似服从正态分布。
因为Y的总体均数为100,当μ比较小的时候,Poisson分布是一个偏态的分布,
但是当μ增大时,Poisson分布会逐渐趋于对称。
二、选择题
1.理论上,二项分布是一种B。
A连续性分布B离散分布
C均匀分布D标准正态分布
2.在样本例数不变的情况下,下列何种情况时,二项分布越接近对称分布。
C
A总体率π越大B样本率P越大
C总体率π越接近D总体率π越小
3.医学上认为人的尿氟浓度以偏高为不正常,若正常人的尿氟浓度X呈对数正态分
布,Y=lgX,G为X的几何均数,尿氟浓度的95%参考值范围的界值计算公式是A。
Alg1()YY+SB+XGSC+XGSDlg1()YY+S
4.设1210X,X,,X均服从B(4,,并且1210X,X,,X相互独立。
令
1210Y=X+X++X,则D
AY近似服从二项分布BY近似服从Poisson分布
CY近似服从正态分布DY~B(40,
5.设1210X,X,,X均服从Poisson,并且1210X,X,,X相互独立。
令
1210Y=(X+X++X)/10,则C
AY近似服从B(10,BY服从Poisson(22)分布
CY近似服从正态分布DY服从Poisson分布
三、简答题
1.如果X的总体均数为μ,总体标准差为σ,令Y=a+bX,则可以证明:
Y的总体均
数为a+bμ,标准差为bσ。
如果X服从μ=40的Poisson分布,请问:
Y=X/2的总体
均数和标准差是多少
总体均数=20,总体标准差=40/2。
2.设X服从μ=40的Poisson分布,请问:
Y=X/2是否服从Poisson分布为什么
不是的。
因为Y=X/2的总体均数=20,不等于总体方差10。
3.设X服从μ=40的Poisson分布,可以认为X近似服从正态分布。
令Y=X/10,
试问:
是否可以认为Y也近似服从正态分布
正态分布的随机变量乘以一个非0常数仍服从正态分布,所以可以认为Y也近似
服从正态分布。
4.设X服从均数为μ的Poisson分布。
请利用两个概率之比:
P(X+1)/P(X),证明:
当x<
μ1时,概率P(X)随着X增大而增加;
当X>
μ时,概率P(X)随着X增大
而减小。
1
(1)/()()/[]/
(1)
(1)!
!
xx
PXxPXxeex
μμμμ
μ
+
=+===+
显然,当
x<
μ1时,对应x+1<
μ,由此得到1
x1
>
,所以P(X=x+1)/P(X=x)>
1,
说明概率P(X)随着X增大而增加;
当X>
μ时,则
(1)/()1
PXxPXx
μμ
=+==<
<
,说明当X>
μ时,概率P(X)随着X增大而减
小。
5.已知某饮用水的合格标准是每升水的大肠杆菌数≤2个,如果随机抽取1升饮用水,
检测出大肠杆菌数的95%参考值范围是多少(提示考虑合格标准的总体均数最大值
为2个/L,求95%参考值范围)。
由于合格标准的总体均数最大值为2个/L,对于正常而言,大肠杆菌数越少越好,
所以这是单侧参考值范围。
即求满足累计概率的不等式2
00
(|2)2
!
XXk
kk
Pke
k
μ
==
Σ==Σ≤
的最大X的解。
X0123456
P(X)
()
X
Pk
=Σ
根据上述计算得到X的95%参考值范围是X<
5个/L。
第四章
1、设X的总体均数为μ,则样本均数X的总体均数也为μ。
经随机抽样得到的样本均数X的总体均数也为μ。
2、设X的总体方差为σ2,则样本均数X的总体方差也为σ2。
经随机抽样后得到的样本均数X的总体方差为σ2/n。
3、设随机变量1,,nX…X均服从B(1,π),n很大时,则
1n
i
XX
n=
=Σ近似服从
N(π,π(1π)/n)
4、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了1000人,检测了每个人血
铅浓度。
虽然血铅检浓度一般呈非正态分布,但由于该研究样本量很大,可以认为这些
血铅浓度近似服从正态分布。
血铅浓度的分布与样本量是否很大无关,如果样本量充分大时,血铅浓度的样本均
数的分布近似正态分布。
5、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了1000人,检测了每个人血
铅浓度,计算这1000人的血铅平均浓度。
对于现有的1000人的血铅浓度资料,可以认
为该资料的样本均数近似服从正态分布。
错。
样本均数的概率分布是指随机抽样前将要随机抽取的样本,其样本均数近似服从
某个概率分布,样本量很大时,样本均数逼近正态分布。
对于这个资料而言,这是已经完成
随机抽样的资料,这个资料的样本均数只是一个数,不存在服从哪种分布的问题。
6、某研究者做了一个儿童血铅浓度的流行病学调查,已知血铅测量值非正态分布,计划调
查1000人,并将计算1000人的血铅浓度的样本均数,由于该研究样本量很大,可以认
为随机抽样所获得血铅浓度的样本均数将近似服从正态分布。
如果从某个均数为μ,标准差为σ的非正态分布的总体中抽样,只要样本量足够大,
则样本均数X的分布也将近似于正态分布N(μ,σ2/n)。
1、以下方法中唯一可行的减小抽样误差的方法是___B____。
A、减少个体变异B、增加样本量
C、设立对照D、严格贯彻随机抽样的原则
2、XS表示____C____。
A、总体均数的离散程度B、总体标准差的离散程度
C、样本均数的离散程度D、样本标准差的离散程度
3、设连续性随机变量X的总体均数为μ,从X总体中反复随机抽样,随样本量n增大,
S
将趋于____D____。
A、X的原始分布B、正态分布
C、均数的抽样分布D、标准正态分布
4、在均数为μ,标准差为σ的正态总体中随机抽样,理论上|Xμ|≥____B____的可能性
为5%。
A、σBXσC、2,vtSDXS
5、下面关于标准误的四种说法中,哪一种是不正确____C____。
A、标准误是样本统计量的标准差
B、标准误反映了样本统计量的变异
C、标准误反映了总体参数的变异
D、标准误反映了抽样误差的大小
6、变量X偏离正态分布,只要样本量足够大,样本均数___C_____。
A、偏离正态分布B、服从F分布
C、近似正态分布D、服从t分布
1、样本均数的抽样误差定义是什么
样本均数的抽样误差是指样本均数和总体均数间的差异,但同时可以表现为从同一总体
中多次随机抽样所得的样本均数间的差异,通常用样本均数的标准误度量平均的抽样误差大
2、估计样本均数的平均抽样误差的统计量是什么
是样本均数的标准差,即样本均数的标准误。
3、简述样本均数的抽样误差的规律。
样本均数的标准误的理论值为xn
σ
σ=,而其估计值为X
SS
=;
4、简述t分布、F分布,χ2分布曲线的特征与自由度的关系。
t分布是一簇以0为中心,左右对称的单峰曲线,随着自由度的增加,t分布曲线将越
来越接近于标准正态分布曲线,当自由度为无穷大时,t分布就是标准正态分布。
t分布的
曲线下两侧尾部的面积可以通过查对应自由度下的t分布界值表得到。
χ2分布的图形为一簇单峰正偏态分布曲线,且随着自由度的增加,正偏的程度越来越小。
χ2分布的曲线下右侧尾部的面积可通过查χ2界值表得到。
F分布的特征有:
(1)F分布有两个自由度,F的取值范围为0~∞。
(2)F分布为一
簇单峰正偏态分布曲线,与两个自由度有关。
(3)每一对自由度下的F分布曲线下面积,
见方差分析用F界值表(附表4),横标目为第一自由度,纵标目为第二自由度,表中分别给
出了概率为和时的F界值,记为
,Fανν。
t分布,χ2分布和F分布是三种没有未知参数,只有自由度的概率分布,常用于抽样研
究中,故称为三种常见的抽样分布。
5、简述正态分布、t分布、F分布、χ2分布之间的关系。
(1)若随机变量X服从于正态分布N(μ,σ2),那么从总体中随机抽取的样本,其样本
均数X将服从于正态分布(,2)XNμσ。
令Z为对X进行标准化变换的结果,Z将服从于标
准正态分布,即
X/
ZXX
σσ
==服从标准正态分布。
(2)自由度为1的χ2分布可以
通过将服从标准正态分布的变量平方得到。
(3)若随机变量X1和X2分别为服从自由度为v1
和v2的χ2分布,并且相互独立,则比值
2
111
222
χ/
χ
FX
νν
==
/
服从自由度为(v1,v2)的F分布(F-distribution)。
6、目前一般的统计软件(如SAS,SPSS和Stata)均能随机模拟产生服从均匀分布、正态
分布、二项分布的随机数。
利用这些程序,可以生成指定参数下的随机数据,这种产生
随机数的方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计学 赵耐青 习题 答案