医学统计学样题及答案.docx
- 文档编号:11069744
- 上传时间:2023-02-24
- 格式:DOCX
- 页数:29
- 大小:102.82KB
医学统计学样题及答案.docx
《医学统计学样题及答案.docx》由会员分享,可在线阅读,更多相关《医学统计学样题及答案.docx(29页珍藏版)》请在冰豆网上搜索。
医学统计学样题及答案
1、某市1974年为了解该地居民发汞的基础水平,调查了留住该第一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞含量如下:
发汞值~~~~~~~~~~(mol/kg):
人数2066604818166103
(1)说明此频数分布的特征。
(2)选用何种指标描述其集中趋势和离散趋势
(3)估计该地居民发汞值的95%参考值范围
答:
(1)偏态分布
(2)选用中位数描述集中趋势,四分位间距描述离散趋势
(3)
频数
相对频数
累积频数
累积相对频数
~
20
20
~
66
0.
86
~
60
0.
146
~
48
0.
194
~
18
212
~
16
228
~
6
234
~
1
235
~
0
0
235
~
3
238
1
合计
238
=+(238×%-0)×2/20=
=+(238×%-228)×2/6=
所以估计该地居民发汞值的95%参考值范围(,)
2、某市场出售一批番茄汁罐头,罐头内vc平均含量(mg/100g)是未知的。
今从中抽取16个罐头,经测定含量如下:
16,22,21,23,21,19,15,13,23,17,20,29,18,22,16,25
计算:
(1)试问这批罐头内vc平均含量及95%区间估计
(2)假如另一批罐头vc平均含量为22mg/100g,试问这两批罐头vc含量是否相同
答:
(1)样本平均值=20样本标准差=16开方=4
20-×4=
20+×4=
(2)22∈,
所以含量相同
3、某药厂为了解其生产的某药物(同一批)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为,标准差,试估计该批药物有效成分的平均含量
答:
该批药物有效成分的平均含量的95%可信区间为:
(样本均值标准误,样本均值+标准误)
即:
(,)
4、为了观察寒冷对动物鸟中17-KS排出量的影响,实验安排了营养正常组的大白鼠在寒冷前与寒冷后分别测定尿中17-KS排出量,请问这个实验设计的模型是什麽
答:
这个实验设计的模型是配对设计资料的t检验
5、男性四组人群营养实验中胡罗卜素春、夏、秋、冬四季之比较
春夏秋冬
∑X
N137179135123
∑X2
(1)试检验四季之间胡萝卜素存留量(毫克)有无显着差别
(2)如有显着差别,应如何确定
(一)
1.假设和和确定检验水准
H0:
四季之间胡萝卜素存留量的总体均数相等,1=2=3=4
H1:
四季之间胡萝卜素存留量总体均数不全相等
=
检验统计量F值
X=+++=
N=137+179+135+123=574
X2=
C=(X)2/N=2/574=
=-=
ν总=N-1=574-1=573
=()2/137+()2/179+()2/135+()2/123-=
ν组间=k-1=4-1=3
SS组内=
=S总-SS组间=组内=N-k=574-4=570
MS组间=SS组间/ν组间=3=
MS组内=SS组内/ν组内=570=
F=MS组间/MS组内==
方差分析结果表
变异来源
SS
ν
MS
F
P
总
573
组间
3
<
组内
570
3.确定P值和作出推断结论以ν1(ν组间)=3及ν2(ν组内)=570,查F界值表得P<,按=水准拒绝H0,接受H1,故可以认为四季之间胡萝卜素存留量(毫克)差别有统计学意义。
(二)
进行平均值之间的多重比较,未讲略
6、五只高血压狗口服萝芙木总碱(2-8mg/kg体重),其收缩压的变化如下:
狗号
给药前
给药期
停药后
1
162
130
170
2
230
170
212
3
159
129
140
4
199
145
168
5
162
118
174
试分析不同用药时间,动物间服药后收缩压的变化。
答:
做随机区组方差分析:
狗号
给药前
给药期
停药后
nj
ΣiYij
1
162
130
170
3
462
2
230
170
212
3
612
3
159
129
140
3
428
4
199
145
168
3
512
5
162
118
174
3
454
ni
5
5
5
15
ΣjYij
917
692
864
2468
Yi平均
ΣjY2ij
170270
97390
151944
419604
提出假设检验:
H0:
τi=0;H1:
τi≠0,至少有一个不等式成立。
H0:
βj=0;H1:
βj≠0,至少有一个不等式成立。
α=。
SS总=;v总=14
SS处理=;v处理=2
SS区组=;v区间=4
SS误差=;v误差=8
由此,列方差分析表得
方差分析表
变异来源
SS
ν
MS
F
P
处理
2
19.
<
区组
4
12.
<
误差
8
总计
14
注:
查表得(2,8)=,(2,8)=。
(4,8)=,(4,8)=
统计学结论:
(1)处理因素在α=水平上拒绝H0,接受H1。
(2)区组因素在α=水平上拒绝H0,接受H1。
因此,不同用药时间,收缩压差别极显着;而不同的狗,收缩压差别也极显着
7、每组6只动物(羊)给某种激素再不同时间抽血,观察其血浆磷脂含量变化
对照给雌激素
合计
上午下午上午下午
说明:
因原题目中数据不全,每组只按数据齐全的前4只进行计算;此外,原题目未说明希望分析的问题,故应用方差分析和t检验分析该问题。
1.方差分析
A给予雌激素i
B时间j
Ti
Si
1上午
2下午
1否(对照)
2是
ni
8
8
16
Tj
Sj
应用方差分析前,先做方差齐性检验:
S112=,S122=,S212=,S222=。
方差不齐,不能应用方差分析。
若此题方差齐,应用方差分析过程应为:
(1)给予雌激素的假设:
H0:
τi=0;H1:
τi≠0,至少有一个不等式成立。
α=。
(2)测量时间的假设:
H0:
βj=0;H1:
βj≠0,至少有一个不等式成立。
α=。
(3)交互作用的假设:
H0:
(τβ)ij=0;H1:
(τβ)ij≠0,至少对一种(ij)组合成立。
α=。
SS总=
ν总=16-1=15
SSA=+/(2×4)-16=
νA=2-1=1
SSB=+/(2×4)-16=
νB=2-1=1
SSAB=+++/4-+/(2×4)-+/(2×4)+16=
νAB=(2-1)×(2-1)=1
SS误差=SS总-SSA-SSB-SSAB=
ν误差=ν总-νA-νB-νAB=12
方差分析表
变异来源
SS
ν
MS
F
P
A雌激素
1
()
>
B测量时间
1
()
<
A*B交互
1
()
<
误差
12
总计
15
统计学结论:
(1)接受H0:
τi=0的无效假设;拒绝H1:
τi≠0,至少有一个不等式成立。
(2)拒绝H0:
βj=0的无效假设;接受H1:
βj≠0,至少有一个不等式成立。
(3)拒绝H0:
(τβ)ij=0的无效假设;接受H1:
(τβ)ij≠0,至少对一种(ij)组合成立。
尚不能认为使用雌激素对该激素水平具有影响;下午该激素水平高于上午;雌激素的使用与测量时间之间存在交互作用。
2.t检验(给予雌激素是否使该种激素上下午波动幅度减小)
对照组
给予雌激素
上午
下午
d
上午
下午
d
1
1
2
2
3
3
4
4
n1=4,d1=,Sd12=
n2=4,d2=,Sd22=
方差齐性检验:
F=Sd12/Sd22=,1=4-1=3,ν2=4-1=3。
F<(3,3)=,P>,方差齐。
H0:
d1=d2;H1:
d1>d2。
α=。
Sc2=[(4-1)×+(4-1)×]/(4+4-2)=
t=×(1/4+1/4)]=
ν=4+4-2=6
t>=(6)
拒绝H0:
d1=d2的无效假设;接受H1:
d1>d2。
给予雌激素可以使该种激素上下午波动幅度减小
说明:
若分析雌激素是否对该种激素上下午波动幅度有影响,H1:
d1≠d2,则应为双侧检验,t<=(6),接受H0:
d1=d2的无效假设;拒绝H1:
d1>d2,尚不能认为雌激素对该种激素上下午波动幅度有影响。
8、标准差和标准误有何区别和联系
标准差是反映数据变异程度的指标,其大小受每一个观察值的影响,变异程度大,标准差也大.常用于描述对称分布,尤其是正态分布资料的离散程度。
可以反映样本均数的代表性.
标准误是样本均数的标准差,反映了样本均数与总体均数之间的离散程度,即样本均数变异程度的指标,常用来表示抽样误差的大小。
标准误大反映样本均数抽样误差大,其对总体均数的代表性差。
标准误小,样本均数抽样误差就小,其对总体均数的代表性就好。
标准差随着样本量的增多,逐渐趋于稳定,如同地区、同年龄、同性别儿童的身高、体重的标准差,当样本含量达到约200以上时,基本趋于稳定。
标准误随着样本量的增多而减小,如均数的标准误,当标准差不变时,与样本量的平方根呈反比。
9、可信区间和参考值范围有何不同
可信区间是从总体中作随机抽样,每个样本可以算出一个可信区间,如95%可信区间,意味着100次抽样,95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。
参考值范围是指同质总体中大多数个体变量值的分布范围。
95%参考值范围指同质总体中95%的个体值分布在此范围内。
它与标准差有关,各个体值变异越大,该范围越宽,分布也越分散。
10、假设检验和区间估计的异同之处有哪些
同:
两者都是对总体特征进行推断的方法。
区间估计用以说明参数量的大小,如推断总体均数所在的范围,而假设经验用于推论质的差别,如推断总体均数是否不同。
异:
可信区间不仅可回答假设检验的问题,而且可以比假设检验提供更多的信息,可信区间在解决假设检验问题基础上,还可获得是否有专业意义的信息。
11、假设检验时,一般当P<则拒绝H0,理论依据是什么
假设检验时,先提出无效假设H0,然后在假设成立的前提下看实际抽到的样本是否属小概率事件(如果当一个事件发生的概率很小时,那么在一次试验时这个事件时“不会发生的”,一旦发生了,称其为小概率事件。
统计学中,将P<称为小概率事件。
)。
若属小概率事件,则拒绝该假设;若不属于小概率事件,则不拒绝该假设。
得出的结论是概率性的,不是绝对的肯定或者否定。
犯一类错误(拒绝了正确的无效假设)的概率是α=。
12.第一类错误和第二类错误有何区别和联系
两类错误的区别:
错误类型
第一类错误
第二类错误
意义
拒绝了正确的无效假设H0
即无效假设原本是正确的,但由于偶然因素的影响,随机抽样时,得到一个较大的检验统计量t值,故t值大于了t,,只能拒绝无效假设,错误地得出有差别的结论。
接受了错误的无效假设H0
即无效假设原本是不正确的,但所算得的统计量t没有超过t,水平从而接受了无效假设,错误地得出了无差别的结论。
假阳性错误
假阴性错误
相应概率
,即检验水准,一般取=或。
应按所犯第一类错误的危害性,紧密结合分析问题的具体情况,事先选定的取值。
β,我们称(1-β)为检验效能,β值的大小一般未知,只有在不同总体特征已知的基础上,按预定的和n才能做出估算。
β的取值,实际上也应根据第二类错误的危害性事先确定。
通常检验效能应该达到左右。
两类错误的联系:
在样本量固定的情况下,减小会引起β增大;减小β会引起增大。
若要同时减小和β,只有增大样本含量。
所以样本含量应尽可能大一些,同时正确的实验设计与严格规定实验操作方法,能够减少抽样误差,提高检验效果。
13.某地某年人口数58723人,脑卒中发病81人,脑卒中死亡45人,该地当年各种疾病死亡372人,试问上述数字能计算多少个有意义的相对数并说明都是些什么相对数
能算出五个有意义的相对数:
强度相对数:
该地当年的脑卒中发病率:
(81/58723)*1000‰=‰
该地当年的脑卒中死亡率:
(45/58723)*万分之万=万分之
该地当年的脑卒中病死率:
(45/81)*100%=%
该地当年的疾病总死亡率:
(372/58723)*1000‰=‰
结构相对数:
该地当年内脑卒中死亡人数占疾病总死亡人数的比例(构成比):
(45/372)*100%=%
相对数有三类:
率
构成比
相对比
1.率(rate):
某现象实际发生数于可能发生某现象的总数之比,用以反映某现象发生的频率或强度,又称为频率指标,具有概率意义。
计算公式为:
依据习惯选定,或使得所计算得的率保留一到两位整数。
常用的率包括发病率、患病率、死亡率、病死率等。
(1)发病率:
表示在观察期内,可能发生某种疾病的一定人群中新发生该病的频率。
某病发病率=×K
在通常情况下,发病率的分母泛指一般平均人口数。
意义:
发病率是反映某病在人群中发生频率大小的指标,常用于衡量疾病的发生,研究疾病发生的因果关系和评价预防措施的效果。
(2)患病率:
表示在某时点检查时可能发生某病的一定人群中患有某病的频率。
其中某病病例数包括新病例和旧病例,凡患该病的一律统计在内。
同一人不应同时成为同一疾病的两个病例。
意义:
这一指标最适用于病程较长的疾病的统计研究,用于衡量疾病的存在,反映某病在一定人群中的流行规模或水平,估计医疗设施的需求量。
(3)反映疾病防治效果的指标
治愈率
有效率
某病病死率=
2.构成比
说明某事物内部各组成部分所占的比重或比例。
常以百分数表示,计算公式为:
相对比,
比较两个指标时用以反映两个有关指标间数量上的比值,如A指标是B指标的若干倍,或A指标是B指标的百分之几,通常用倍数或分数表示。
计算公式为:
相对比=
相互比较的两个指标可以是相同性质的指标,也可以是性质不同的指标;两变量可以为数值变量、分类变量,可以是绝对数、相对数、平均数等。
不能以比代率
因为构成比说明的是事物内部各部分所占的比重或分布,不能说明某现象发生的强度和频率大小。
只有频率指标:
率才能说明事物的严重程度。
(如真正答题时,自己最好举一个例子来说明,书34页)
20、下表为变性卵蛋白在38oC与25oC时之凝固百分数:
时间(分钟)369121518
38oC1230445366
25oC30404958
试求出两个时间推算凝固百分数之回归方程式,并检验两个回归系数间差别的显著性。
(bymilanlan,老师说不要求第二问)
解:
n=6,∑Xi=63,Xi=,∑Xi2=819
∑Yi1=,Yi1=,∑Yi12=,∑XiYi1=3705
∑Yi2=,Yi2=,∑Yi22=,∑XiYi2=2661
lxy1=∑XiYi1-(∑Xi)(∑Yi1)/n=3705-63×6=
lxy2=∑XiYi2-(∑Xi)(∑Yi2)/n=2661-63×6=
lxx=∑Xi2-(∑Xi)2/n=819-632/6=
lyy1=∑Yi12-(∑Yi1)2/n=lxy1/lxx==,a1=Yi1-b1×Xi=即38oC时Y=+
b2=lxy2/lxx=,a2=即25oC时Y=+
21、.测定小鼠肾上腺中抗坏血酸含量时测半个腺和整个腺体所得数据如下:
半个371592464519470528580420563
整个381627485546500546595569595
解释:
这道题老师上课说了,用直线回归,因为如果以半个腺的抗坏血酸含量为自变量x,以整个腺的抗坏血酸含量为应变量Y,若能找到两者之间的线性关系则可以在以后的试验中由半个腺的测量值来预测该测量值对应的整个腺的Y值。
计算:
1.画散点图,看两者之间是否存在直线关系。
表一
半个(x)
371
592
464
519
470
528
580
420
563
整个(y)
381
627
485
546
500
546
595
569
595
对应拟和直线图
表二,因为第八组数据离直线太远,故舍去。
半个(x)
371
592
464
519
470
528
580
563
整个(y)
381
627
485
546
500
546
595
595
对应拟和直线图
2.求出方程(计算回归系数b和截距a)。
注意因为从以上作图可知舍去了第八组数据,所以计算时也不予考虑。
老师上课讲过异常值应该舍,但没有讲如何检验异常值。
本人在北大时好像学过,但已经忘记,且觉得不必要,大家谁要是觉得必要,请看以前的统计书,如果有人会,请上传21题补丁,谢谢了!
半个(x)
整个(y)
371
381
592
627
464
485
519
546
470
500
528
546
580
595
563
595
∑Xi=4087
∑Yi=4275
X平均=
Y平均=
∑Xi2=2125815
∑Yi2=2327797
∑Xi*Yi=2224322
因为公式比较繁,大家参照课本180页自己计算:
Lxy=
Lxx=
Lyy=
b==
a=-*=-
回归方程为:
y=-+(注意书上的写法,这里因为本人能力不能写出)。
3.对总体的回归系数β进行假设检验。
使用方差分析:
建立假设检验:
H0:
β=0,即半个腺和整个腺的抗坏血酸含量有关
H1:
β≠0,无关
计算统计量F值
df
SS
MS
F
P
回归分析
1
42954
42954
<
残差
6
总计
7
根据上表P值,认为不能拒绝H0
22、相关系数和回归系数的联系和区别
区别:
在资料要求上:
回归要求因变量Y服从正态分布;x是可以精确测量和严格控制的变量,一般称为一型回归。
相关要求两个变量x、y服从双变量正态分布。
这种资料若进行回归分析称为II型回归。
在应用上:
说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。
联系:
1、对同一组数据同时计算r和b,它们的正负号是一致的。
r为正号说明两变量间的相互关系是同向变化的。
b为正,说明X增(减)一个单位,Y平均增(减)b个单位。
2、r和b的假设检验是等价的,即对同一样本,两者的t值相等。
由于r的假设检验可直接查表,而b的假设检验计算较繁。
故在实际应用中常以前法代替后法。
3、r与b值可相互换算
4、用回归解释相关相关系数的平方r2称为决定系数(coefficientofdetermination):
此式说明当SS总不变时,回归平方和的大小取决于r2。
回归平方和是由于引入了相关变量而使总平方和减小的部分。
回归平方和越接近总平方和,则r2越接近1,说明引入相关的效果越好。
例如r=,n=100时,可按检验水准拒绝H0,接受H1,认为两变量有相关关系。
但r2=2=,表示回归平方和在总平和中仅占4%,说明两变量间的相关关系实际意义不大。
23、剩余标准差的意义和用途
SSY。
X为剩余标准差,是指将X固定为某一确定值以后,Y的标准差。
越小,说明用回归方程所作的估计的误差越小。
剩余标准差可由下式求得:
式中Sy为变量Y的标准差,r为相关系数,n为样本例数。
它直接反映观察值y对估计值的平均离差。
就回归直线来说,其平均离差值愈小,则所有观察点平均地愈靠近回归线,即关系程度愈密切;而当其平均离差值愈大,则所有观察点平均地离回归线愈远,即关系愈不密切。
可见这个指标是从另一侧反映关系密切程度的。
它是以回归直线为中心反映各观察值与估计值平均数之间离差程度的大小,从另一方面看,也就是反映着估计值平均数的代表性的可靠程度。
用途:
回归系数的t检验,uy的区间估计,个体Y值的容许区间
24、拟做动物实验,设实验和对照组的差别
1-
2=1.5克,标准差为2.5克,显著性水平为,实验的成功率为90%,试求出所需动物数
解:
见书P343。
本题属于两样本均数比较,所需样本量的计算公式是:
N1=N2=2×〔(tα/2+tβ)S/δ〕2
N1=N2=2×〔+×〕2=,取整59。
实验组合对照组各需59只动物,总共需118只。
25、用中药治疗慢性肾炎的近控率为30%,现试验新药的疗效,要求新药的近控率达到50%,才能推广使用,=,成功率为,问每组需多少人
解:
见书P343。
本题属于两组样本率比较,本题采用单侧检验(个人认为如此,大家说呢),所以公式为:
N1=N2=×〔(uα+uβ)/(sin-1√p1-sin-1√p2)〕2
N1=N2=×〔+/(sin-1√√)〕2=,取整102。
旧药和新药各需102人。
26、欲了解某地菜农钩虫感染率是否高于粮农,估计两总体率约20%及10%,今指定=,=,问需查多少人
两样本率的比较双侧检验:
p1=,p2=,双侧2=,单侧=
按照p343公式26-2计算可得:
n1=n2=
每组需要262例,两组共需524例。
27、几种基本的抽样方法的优缺点和适用场合是什么
老师的ppt上提到的是单纯随机抽样、系统抽样和整群抽样
我查到的是四种:
简单随机抽样、系统抽样、分层抽样和整群抽样(分层抽样很重要啊~老师应该是忘了讲吧)
(另注:
这几种方法都属于概率抽样,另外还有非概率抽样,应该不会考)
概率抽样的原则:
(随机性原则)
总体中的每一个样本被
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计 学样 答案