第六版医学统计学答案文档格式.docx
- 文档编号:21809443
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:10
- 大小:23.27KB
第六版医学统计学答案文档格式.docx
《第六版医学统计学答案文档格式.docx》由会员分享,可在线阅读,更多相关《第六版医学统计学答案文档格式.docx(10页珍藏版)》请在冰豆网上搜索。
(2)系统抽样优点是:
①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。
①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。
但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。
(3)分层抽样优点是:
①减少抽样误差:
分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。
当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。
(4)整群抽样优点是:
便于组织,节省经费,容易控制调查质量;
当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。
4.常用的非概率抽样方法有哪些?
有偶遇抽样、立意抽样、定额抽样、雪球抽样等。
5.简述调查问题的顺序安排。
第四章定量资料的统计描述
相同点是都用于描述定量资料的集中趋势。
不同点:
①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料③中位数用于不对称分布资料、两端无确切值的资料以及分布不明确的资料。
2.同一资料的标准差是否一定小于均数?
同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;
标准差小。
表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3.极差、四分位数间距、标准差、变异系数的适用范围有何异同?
相同点是都用于描述资料的离散程度。
①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度②四分位数间距可用于
描述偏态分布资料、两端无确切值或分布不明确的资料的离散程度③标准差用于描述正态分布或近似正态分布资料的离散程度④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4.正态分布有哪些基本特征?
5.制定医学参考值范围时,正态分布法和百分位数法分别适用于何种资料?
①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积的规律制定医学参考值范围,服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
第五章、定性资料的统计描述
1.应用相对数时需要注意哪些问题?
①应有足够的观察单位数;
②不能以构成比代替率;
③计算观察单位数不等的及格率的合计率和平均率时,不能简单的把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率和平均率;
④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;
⑤样品率或样品构成比的比较应作检验假设。
2.为什么不能以构成比代替率?
率是指某现象实际发生数和某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占比重,不能说明某现象发生的频率或强度大小。
3.标准化率计算的直接法和间接法的应用有何区别?
如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法;
当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。
4.常用动态数列分析指标有哪几种?
各有何用途?
绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
绝对增长量是指事物现象在一定时期增长的绝对值;
发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;
平均发展速度是指一定时期内个环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展速度;
与平均增长速度是说明事物在一定时间内逐年的平均增长速度。
5.率的标准化需要注意那些问题?
①仅用于相互间的比较,实际水平应采用未标化率来反映。
②样品的标化率是样品指标,存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。
③注意直接法和间接法的选用。
④各年龄组若出现明显交叉,或呈非平行变化趋势时,不适合采用标准化法,宜分层比较各年龄组率。
此外,对于因其他条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
第六章总体均数的估计
1、什么是均数的抽样误差?
决定均数的抽样误差大小的因素有哪些?
抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。
这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。
决定均数抽样误差大小的因素主要为样本含量和标准差。
2、样本均数的抽样分布有何特点?
样本均数的抽样分布特点有:
1、各样本均数未必等于总体均数;
2、样本均
【篇二:
医学统计学答案】
xt>
【习题解析】
一、思考题
1.均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。
①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;
②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;
③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2.同一资料的标准差不一定小于均数。
标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
3.极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;
②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;
③标准差用于描述正态分布或近似正态分布资料的离散程度;
④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4.正态分布的特征:
①正态曲线在横轴上方均数处最高;
②正态分布以均数为中心,左右对称;
③正态分布有两个参数,即位置参数?
和形态参数?
;
④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间
(?
?
2.58?
?
)内的面积为95.00%;
区间(?
)内的面积为
99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;
服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;
②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参
考值范围。
二、案例辨析题
统计描述时,常见错误是对定量资料的描述均采用均数、标准差。
正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。
本资料的血清胆固醇的频数分布图如下:
频数
图4-1血清甘油三酯(tg)的频数分布
可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:
?
集中趋势指标m?
x?
150?
/2?
(1.76?
1.75)/2?
1.755(mmol/l)
1?
2?
离散程度指标四分位数间距=p75?
p25?
2.10?
1.34?
0.76(mmol/l)
三、最佳选择题
1.b2.e3.b4.c5.d6.e7.a8.d9.d
四、综合分析题1.解:
输出结果
图4-4尿总砷的频数分布图
由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。
输出结果
图4-5尿总砷对数的频数分布图
由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。
(2)燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。
2.解:
(1)已知健康人的血清tc服从正态分布,故采用正态分布法制定95%的参考值范围。
下限:
1.96s?
4.84?
1.96?
0.96?
2.96(mmol/l)
上限:
6.72(mmol/l)
该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为2.96mmol/l~6.72mmol/l。
(2)45~55岁健康男性居民的血清总胆固醇分布为正态分布,需作标准化变换后,查表确定正态分布曲线下面积。
由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。
z1?
3.25?
4.84
1.66
0.96x?
5.25?
4.84z2?
0.43
0.96
x1?
查标准正态分布曲线下的面积表(附表2)得:
(z1)?
(?
1.66?
)
0.0485
(z2)?
0.43)?
0.3336?
0.6664
d?
0.6664?
0.0485?
0.6179?
61.79%
该市45~55岁健康男性居民中,血清总胆固醇在3.25mmol/l~5.25mmol/l范围内的比例为61.79%。
(3)作标准化变换
z?
x?
3.80?
1.08
0.96
(z)?
1.08)?
0.1401?
14.01%
该市45~55岁健康男性居民中,血清总胆固醇低于3.80mmol/l所占的比例为14.01%。
3.解:
5060708090100110120130140150
跟骨硬度指数
图4-8跟骨硬度指数的频数分布图
由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。
statistics
即该地区30~35岁健康女性的si的95%参考值范围为(58.02,143.66)。
第五章定性资料的统计描述
【篇三:
医学统计学练习题及答案】
...........1第二章集中趋势的统计描述............................3第三章离散程度的统计描述..............................7第四章抽样误差与假设检验...........................12第五章t检验..........................................14第六章方差分析.....................................20第七章相对数及其应用...............................26第八章?
2检验.......................................30第九章非参数检验...................................35第十章线性相关与回归................................45第十一章多元线性回归与多元逐步回归..................51第十二章统计表与统计图.............................56第十三章医学实验设计与诊断试验的评价...............60
练习题答案
第一章医学统计中的基本概念
练习题
一、单向选择题
1.医学统计学研究的对象是
a.医学中的小概率事件b.各种类型的数据c.动物和人的本质d.疾病的预防与治疗e.有变异的医学事件
2.用样本推论总体,具有代表性的样本指的是
a.总体中最容易获得的部分个体b.在总体中随意抽取任意个体c.挑选总体中的有代表性的部分个体d.用配对方法抽取的部分个体e.依照随机原则抽取总体中的部分个体3.下列观测结果属于等级资料的是
a.收缩压测量值b.脉搏数c.住院天数d.病情程度e.四种血型4.随机误差指的是
a.测量不准引起的误差b.由操作失误引起的误差c.选择样本不当引起的误差d.选择总体不当引起的误差e.由偶然因素引起的误差5.收集资料不可避免的误差是
a.随机误差b.系统误差c.过失误差d.记录误差e.仪器故障误差
答案:
eedea二、简答题
1.常见的三类误差是什么?
应采取什么措施和方法加以控制?
[参考答案]
常见的三类误差是:
(1)系统误差:
在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:
在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳
压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:
即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
2.抽样中要求每一个样本应该具有哪三性?
从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性:
就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性:
就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性:
即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3.什么是两个样本之间的可比性?
可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
(马斌荣)
第二章集中趋势的统计描述
练习题
一、单项选择题
1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是
a.中位数b.几何均数c.均数d.p95百分位数e.频数分布
2.算术均数与中位数相比,其特点是
a.不易受极端值的影响b.能充分利用数据的信息c.抽样误差较大d.更适用于偏态分布资料e.更适用于分布不明确资料
3.一组原始数据呈正偏态分布,其数据的特点是
a.数值离散度较小b.数值离散度较大c.数值分布偏向较大一侧d.数值分布偏向较小一侧e.数值分布不均匀
4.将一组计量资料整理成频数表的主要目的是
a.化为计数资料b.便于计算
c.形象描述数据的特点d.为了能够更精确地检验e.提供数据和描述数据的分布特征
5.6人接种流感疫苗一个月后测定抗体滴度为1:
20、1:
40、1:
80、1:
1:
320,求平均滴度应选用的指标是
a.均数b.几何均数c.中位数d.百分位数e.倒数的均数
abdeb二、计算与分析
1.现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/l)分别为
3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。
3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.25
10
4.26(mmol/l)
m?
4.28+4.43
2
4.36(mmol/l)2.某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:
202165199234200213155168189170188168184147219174130183178174228156171199185195230232191210195165178172124150211177184149159149160142210142185146223176241164197174172189174173205224221184177161192181175178172136222113161131170138248153165182
、160
234161169221147209207164147210182183206209201149174253252156
(1)编制频数分布表并画出直方图;
(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;
(3)计算百分位数p、p、p和p。
5257595
(1)编制频数表:
某地100例30-40岁健康男子血清总胆固醇值的频数表
甘油三脂(mg/dl)
(1)110~125~140~155~170~185~200~215~230~245~合计
频数
(2)24
11162712137
53100
累积频数(3)
617336072859297100
—
累积频率(4)2617336072859297100
画直方图:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 医学 统计学 答案