统计学知识竞赛题目及答案.docx
- 文档编号:4834053
- 上传时间:2022-12-10
- 格式:DOCX
- 页数:18
- 大小:43.16KB
统计学知识竞赛题目及答案.docx
《统计学知识竞赛题目及答案.docx》由会员分享,可在线阅读,更多相关《统计学知识竞赛题目及答案.docx(18页珍藏版)》请在冰豆网上搜索。
统计学知识竞赛题目及答案
必答题
1.欲研究广东省6岁儿童的身高情况,在广东省随机抽取了200名6岁儿童进行调查,以此为例说明同质、变异、总体与样本这几个概念。
答:
同质体现在同为广东省、同为6岁儿童,变异体现在200名儿童的身高不同。
总体是指所有广东省6岁儿童,样本为200名6岁儿童。
2.卫生统计工作中的统计资料主要的来源有哪些
答:
①统计报表。
②经常性工作记录。
③专题调查或实验。
3.简述统计工作全过程的四个步骤。
答:
研究设计、收集资料、整理资料、统计分析。
4.试举例说明常见的三种资料类型。
答:
(1).计量或测量或数值资料,如身高、体重等。
(2).计数或分类资料,如性别、血型等。
(3).等级资料,如尿蛋白含量-、+、++、+++、…。
5.统计学上的变异、变量、变量值是指什么
答:
变异:
每个观察个体之间的测量指标的差异称为变异。
变量:
表示个体某种变异特征的量为变量。
变量值:
对变量的测得值为变量值。
6.简述编制频数表的步骤与要点。
答:
(1)找出最大和最小值,计算极差。
(2)确定组距和列出分组计划:
第一组应包括最小值;最末组应包括最大值,并闭口。
(3)将原始数据整理后,得到各组频数。
7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况
答:
常用描述平均水平的平均数有算术均数、几何均数和中位数。
算术均数适合:
对称资料,最好是近似正态分布资料。
几何均数适合:
经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。
中位数适合:
数据非对称分布、分布不清楚或开口资料的情形。
8.描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况
答:
常见的几种描述离散程度的指标:
极差或全距,四分位数差距,方差与标准差,变异系数。
极差适合:
数据分布非对称的情形。
四分位数差距适合:
数据分布非对称的情形。
方差与标准差适合:
对称分布或近似正态分布资料,能充分利用全部个体的信息。
变异系数适用:
当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
9.统计描述的基本方法有哪些,各自有何特点
答:
统计描述的基本方法:
用表、图和数字的形式概括原始资料的主要信息。
表:
详细、精确。
图:
直观。
指标:
综合性好。
10.简述变异系数的适用条件。
答:
变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
11.怎样正确描述一组计量资料
答:
(1).根据分布类型选择指标。
(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料
选用中位数与四分位数间距。
12.正态分布的主要特征有哪些
答:
(1)正态曲线在横轴上方均数处最高。
(2)正态分布以均数为中心,左右对称。
(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。
(4)正态曲线下的面积分布有一定规律。
13.参考值范围是指什么
答:
参考值范围又称正常值范围,即大多数正常人某指标值的范围。
“正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。
14.简述估计参考值范围的步骤与要点。
答:
设计:
①样本:
“正常人”,大样本n≥100。
②单侧或双侧。
③指标分布类型。
计算:
①若直方图看来像正态分布,用正态分布法。
②若直方图看来不像正态分布,用百分位数法。
15.简述正态分布的用途。
答:
(1)估计频数分布。
(2)制定参考值范围。
(3)质量控制。
(4)统计检验的理论基础。
16.简述可信区间在假设检验问题中的作用。
答:
可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。
可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。
故将二者结合起来,才是对假设检验问题的完整分析。
17.假设检验时,当P≤0.05,则拒绝H0,理论依据是什么
答:
P值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。
当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。
下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于0.05,也就是说,有了概率保证。
18.假设检验中
与P的区别何在
答:
以t检验为例,
与P都可用t分布尾部面积大小表示,所不同的是:
值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。
P值是由实际样本获得的,是指在H0成立的前提下,出现大于或等于现有检验统计量的概率。
19.什么叫两型错误作统计学假设检验为什么要加以考虑
答:
如果H0正确,检验结果却拒绝H0,而接受H1,则犯I型错误,记为α;
如果H0错误,检验结果却不拒绝H0,未能接受H1,则犯II型错误,记为β。
一般情况下,α越大,β越小;α越小,β越大。
如果要同时减少两类错误,则需最大样本
含量。
因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论时,都要考虑到两型错误。
20.配对比较是不是就比成组比较好什么情况下用配对比较比较好
答:
配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。
但这并不是说凡是配对试验就一定比成组比较好。
实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的个体间相似程度更高。
21.t检验有几种各适用于哪些情况
答:
t检验以t分布为理论基础。
小样本时要求假定条件:
资料服从正态分布,方差齐同。
一般分为三种:
一是样本均数与总体均数比较的t检验。
即将一个样本均数X与一已知的总体均数作比较;
二是配对资料的t检验。
例如治疗前后的比较,或配成对子的实验动物之间的比较。
三是两个样本均数比较的t检验;两组的样本量可以不相同。
此外尚有相关系数、回归系数的t检验。
22.什么叫假设检验医学研究中常用的假设检验有哪些
答:
判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤是:
①提出检验假设0H,确定单双侧与检验水准α;②计算检验统计量;③确定概率P值;④判断结果。
在医学研究中常用的显着性检验有u检验、t检验、F检验、2?
检验及非参数秩和检验等多种,不论那种检验均以假设成立时得到的统计量的概率来判断。
23.通过实例说明为什么假设检验的结论不能绝对化
答:
统计的结论为概率性的结论。
拒绝H0时,可能犯Ⅰ型错误。
不拒绝H0时,可能犯Ⅱ型错误。
24.方差分析的检验假设(H0)是什么
答:
各总体均数相等
25.方差分析中,各离均差平方和之间有何联系各自由度之间又有何联系完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解?
答:
总的离均差平方和等于各部分离均差平方和之和.总的自由度等于各部分自由度之和.完全随机设计:
SS总=SS组内+SS组间V总=V组内+V组间
随机区组设计:
SS总=SS组内+SS处理组间+SS区组间
V总=V组内+V处理组间+V区组间
26.三组均数比较时,为什么不能直接作一般的两两均数比较的t检验
答:
增大犯第一类错误的可能性.
27.两组均数差别的假设检验能否作方差分析,为什么
答:
可以.方差分析与t检验关系:
k=2时,F=t2,P值相等,即两检验等价。
28.方差分析的基本思想是什么
答:
方差分析的基本思想:
就是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。
29.为什么不能以构成比代率
答:
二者说明的问题不同。
构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。
30.简述相对数标准化的基本思想。
答:
基本思想:
采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的标准化死亡率具有可比性。
计算题
1、
2.
3.
4.
5、
.某院收治了470例颅脑损伤后综合症患者,疗效如下表,请对此资料作统计分析并写出统计报告。
组别
治疗数
有效数
复方琥珀组
320
297
安定组
100
45
脑复康组
50
22
答案:
3×2表χ2检验。
⑴描述指标:
有效率复方琥珀组92.8%,安定组45.0%,脑复康组44.0%;(5分)
⑵χ2=135.553,p=0.000;(10分)
⑶实际推论:
三组有效率有显着差别。
(5分)
6、
7.
8、
对10例肺癌病人和12例矽肺病人用X线照片测量肺门横径右侧距R1值(cm),结果见下表:
问:
肺癌病人的R1值是否高于矽肺病人
肺癌病人和矽肺病人的R1值比较(cm)
肺癌病人
2.78
3.23
4.20
4.84
5.12
3.21
7.18
8.05
8.56
9.60
矽肺病人
3.23
3.50
4.04
4.15
4.28
4.34
4.47
4.64
4.75
4.82
4.95
5.10
答案:
正态性检验:
Normal0.831889Pr 方差齐性检验: F'=19.19DF=(9,11)Prob>F'=0.0000即p<0.1,方差不齐 秩和检验结果: GRPNScores A10129.500000 B12123.500000 Wilcoxon2-SampleTest(NormalApproximation): S=129.500Z=0.923393Prob>|Z|=0.3558 Kruskal-WallisTest(Chi-SquareApproximation): CHISQ=0.91465DF=1Prob>CHISQ=0.3389 P>0.05,可以认为病人组的R1值高于矽肺组。 抢答题(单选题): 1.对血清滴度资料表示平均水平的最常用统计量是: : A.均数B.中位数C.几何均数 D.全距E.标准差 答案(C) 2.描述一组偏态分布资料的变异程度时,适宜的统计量是: A.变异系数(CV)B.方差C.极差(R) D.标准差(S)E.四份位数间距 答案(E) 3.关于标准正态分布曲线下的面积,错误的是____ A.-1.96到1.96间曲线下面积是95% B.1.96到2.58间曲线下面积是2% C.大于1.645的曲线下面积是2.5% D.-1.96到-1.645间曲线下面积是2.5% E.大于1.96的曲线下面积为2.5% 答案(C) 4. 范围内占正态曲线下面积的____。 A.80%B.99%C.95%D.5%E.47.5% 答案(C) 5.正态曲线下总面积为____。 A.95%B.99%C.50%D.1%E.100% 答案(E) 6.抽样误差是由 A.计算引起B.测量引起C.抽样引起 D.采样结果不准引起E.试剂、仪器未经校正引起 答案(C) 7..在抽样研究中,均数的标准误。 A.比标准差大B.比标准差小C.与标准差无关 D.比均数大E.与标准差相等 答案(B) 8.配对设计t检验的统计假设为 A.两样本来自同一总体B.差数的均数来自 的总体 C.差数的均数来自 的总体D.差数的均数来自 的总体 E.差数的均数来自 的总体 答案(B) 9.假设检验的步骤是 A建立假设、选择和计算统计量、确定P值和判断结果 B建立无效假设、建立备择假设、确定检验水准 C确定单侧检验或双侧检验、选择t检验或u检验、估计I类错误和II类错误 D计算统计量、确定P值,做出推断结论 E以上都不对 答案(A) 10.在比较两样本均数的假设检验中,结果t=3.24,t0.05(v)=2.086,t0.01(v)=2.845。 正确的结论是 A两样本均数不同 B两样本均数差异很大 C两总体均数差异很大 D两样本均数来自同一总体 E两样本均数来自不同总体 答案(E) 11.区间 的含义是 A.99%的总体均数在此范围内B.样本均数的99%可信区间 C.99%的样本均数在此范围内D.总体均数的99%可信区间 答案(D) 12.通常可采用以下那种方法来减小抽样误差。 A.减小样本标准差B.减小样本含量 C.增大样本含量D.以上都不对 答案(C) 13.关于假设检验,下列那一项说法是正确的。 A.单侧检验优于双侧检验 B.采用配对t检验还是成组t检验是由实验设计方法决定的 C.检验结果若P值大于0.05,则接受H0犯错误的可能性很小 D.用u检验进行两样本总体均数比较时,要求方差齐性 答案(B) 14.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小 A. B. C. D. ? 答案(D) 15.甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得 ,则理论上 A. B.作两样本t检验,必然得出无差别的结论 C.作两方差齐性的F检验,必然方差齐 D.分别由甲、乙两样本求出的总体均数的95%可信区间,很可能有重叠 答案(D) 16.作两样本均数比较的t检验时,正确的理解是: A.统计量t越大,说明两总体均数差别越大。 B.统计量t越大,说明两总体均数差别越小。 C.统计量t越大,越有理由认为两总体均数不相等。 D.P值就是 ? E.P值不是 ,且总是比 小。 答案(C) 17.将90名高血压病人随机等分成三组后分别用A、B和C方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____。 A.作三个差值样本比较的t检验 B.作三个差值样本比较的方差分析 C.作配伍组设计资料的方差分析 D.作两两比较的t检验 E.以上都不对 答案(B) 18.当组数等于2时,对于同一资料,方差分析结果与t检验的结果: ____. A.完全等价且F=t. B.方差分析结果更准确 C.t检验结果更准确. D.完全等价且t= E.以上都不对 答案(D) 19.方差分析中 A.F值可能是负数 B.F值不可能是负数 C.组间离均差不会等于组内离均差 D.组间离均差不会小于组内离均差 E.组间离均差不会大于组内离均差 答案(B) 20.方差分析的目的: A、比较均分B、比较标准差C、比较均方 D、比较离均差平方和E、比较变异系数 答案(C) 观众题 1下面的变量中是分类变量的是 A.身高B.体重C.年龄D.血型E.血压 答案(D) 2下面的变量中是是数值变量的是 A.性别B.年龄C.血型D.职业E疗效 答案(B) 3.随机事件的概率P为 A.P=0B.P=1C.P=-0.5D.–0.5 答案(E) 4.用样本作推断,样本应是 A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中按比例分配的一部分 E.总体中信息明确的一部分 答案(C) 5.若以发汞含量大于2.6ug/kg为异常,调查某地1000人中多少人属于异常,这资料可看作 A.计量资料B.计数资料C.等级资料 D.实验资料E.以上均不对 答案(B) 6.统计工作的步骤是: A.作假设、计算统计量、查界值表和作结论 B.整理资料、分析资料、假设检验 C.统计设计、收集资料、整理和分析资料 D.设立对照组、估计样本、重复试验 E.统计描述、区间估计、假设检验 答案(C) 7.反映计量资料集中趋势的指标是____。 A.标准差B.标准误C.率D.全距E.均数 答案(E) 8.编制频数表中错误的做法是____。 A.找出最大值和最小值,计算极差 B.定组距,常用等组距,一般分8~15组为宜 C.写组段时组段可重叠,如“2~4,4~6,…” D.用划记法计频数 E.第一个组段应包括变量最小值,最后一个组段应包括变量最大值 答案(C) 9.在描述资料的变异程度时,最宽的范围是___。 A均数? 标准差B极差C四分位数间距 D95%的参考值范围EP5~P95间距 答案(B) 10.比较20头河马体重和20只小白鼠体重两组数据变异程度大小宜采用____ A.变异系数(CV)B.方差C.极差(R) D.标准差(S)E.四份位数间距 答案(A) 挑战题 第一组(每题10分) 1.欲研究广东省6岁儿童的身高情况,在广东省随机抽取了200名6岁儿童进行调查,以此为例说明同质、变异、总体与样本这几个概念。 答: 同质体现在同为广东省、同为6岁儿童,变异体现在200名儿童的身高不同。 总体是指所有广东省6岁儿童,样本为200名6岁儿童。 2.卫生统计工作中的统计资料主要的来源有哪些 答: ①统计报表。 ②经常性工作记录。 ③专题调查或实验。 3.简述统计工作全过程的四个步骤。 答: 研究设计、收集资料、整理资料、统计分析。 4.试举例说明常见的三种资料类型。 答: (1).计量或测量或数值资料,如身高、体重等。 (2).计数或分类资料,如性别、血型等。 (3).等级资料,如尿蛋白含量-、+、++、+++、…。 5.统计学上的变异、变量、变量值是指什么 答: 变异: 每个观察个体之间的测量指标的差异称为变异。 变量: 表示个体某种变异特征的量为变量。 变量值: 对变量的测得值为变量值。 6.简述编制频数表的步骤与要点。 答: (1)找出最大和最小值,计算极差。 (2)确定组距和列出分组计划: 第一组应包括最小值;最末组应包括最大值,并闭口。 (3)将原始数据整理后,得到各组频数。 7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况 答: 常用描述平均水平的平均数有算术均数、几何均数和中位数。 算术均数适合: 对称资料,最好是近似正态分布资料。 几何均数适合: 经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。 中位数适合: 数据非对称分布、分布不清楚或开口资料的情形。 8.描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况 答: 常见的几种描述离散程度的指标: 极差或全距,四分位数差距,方差与标准差,变异系数。 极差适合: 数据分布非对称的情形。 四分位数差距适合: 数据分布非对称的情形。 方差与标准差适合: 对称分布或近似正态分布资料,能充分利用全部个体的信息。 变异系数适用: 当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 第二组(每题20分) 1.统计描述的基本方法有哪些,各自有何特点 答: 统计描述的基本方法: 用表、图和数字的形式概括原始资料的主要信息。 表: 详细、精确。 图: 直观。 指标: 综合性好。 2.简述变异系数的实用时机。 答: 变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 3.怎样正确描述一组计量资料 答: (1).根据分布类型选择指标。 (2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料 选用中位数与四分位数间距。 4.正态分布的主要特征有哪些 答: (1)正态曲线在横轴上方均数处最高。 (2)正态分布以均数为中心,左右对称。 (3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。 (4)正态曲线下的面积分布有一定规律。 5.参考值范围是指什么 答: 参考值范围又称正常值范围,即大多数正常人某指标值的范围。 “正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。 6.简述估计参考值范围的步骤与要点。 答: 设计: ①样本: “正常人”,大样本n≥100。 ②单侧或双侧。 ③指标分布类型。 计算: ①若直方图看来像正态分布,用正态分布法。 ②若直方图看来不像正态分布,用百分位数法。 7.简述正态分布的用途。 答: (1)估计频数分布。 (2)制定参考值范围。 (3)质量控制。 (4)统计检验的理论基础。 8.简述可信区间在假设检验问题中的作用。 答: 可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。 可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。 故将二者结合起来,才是对假设检验问题的完整分析。 第三组(每题30分) 1.假设检验时,当P≤0.05,则拒绝H0,理论依据是什么 答: P值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。 当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。 下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于0.05,也就是说,有了概率保证。 2.假设检验中 与P的区别何在 答: 以t检验为例, 与P都可用t分布尾部面积大小表示,所不同的是: 值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。 P值是由实际样本获得的,是指在H0成立的前提下,出现大于或等于现有检验统计量的概率。 3.什么叫两型错误作统计学假设检验为什么要加以考虑 答: 如果H0正确,检验结果却拒绝H0,而接受H1,则犯I型错误,记为α; 如果H0错误,检验结果却不拒绝H0,未能接受H1,则犯II型错误,记为β。 一般情况下,α越大,β越小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 知识竞赛 题目 答案