东南大学统计试题重要.docx
- 文档编号:3991440
- 上传时间:2022-11-27
- 格式:DOCX
- 页数:23
- 大小:93.72KB
东南大学统计试题重要.docx
《东南大学统计试题重要.docx》由会员分享,可在线阅读,更多相关《东南大学统计试题重要.docx(23页珍藏版)》请在冰豆网上搜索。
东南大学统计试题重要
东南大学统计试题
第一章:
绪论
一、试区分以下资料属于哪种类型?
1.某地一批人的血红蛋白值资料
比色法测得的具体值(如135g/L),为何类资料?
根据测得值进行分类(如"贫血","正常"),为何类资料?
2.某疫苗皮下注射后免疫测试结果如下:
观察对象
抗体滴度
目测判断抗体水平
免疫效果观察
1
1:
40
++
无效
2
1:
60
++++
有效
...
...
...
...
...
...
...
...
3.数据类型在一定条件下是可以相互转换的,下面的资料是如何转换的:
年龄(岁)转换为"未成年、成人",再转换为"婴幼儿、青年、中年、老年",分别给予编码0,1,2,3。
第二章:
统计资料的整理与描述
一、名词解释
1、频数表2、算术均数3、几何均数4、中位数5、极差6、百分位7、四分位数间距8、方差9、标准差10、变异系数
二、选择题
1、某农村144名妇女生育情况如下:
生育胎次01234
妇女人数525703014
该资料的类型是:
A.有序资料B.计数资料C.计量资料D.等级资料
2、测得五人接种某疫苗后的抗体滴度为1:
20,1:
40,1:
80,1:
160,1:
320,求平均滴定度最好选用
A.均数B.几何均数C.算术平均数D.百分位数
3、为了直观比较一组乳腺癌患者化疗后同一时间点上血清肌酐和血液尿素氮两项指标观察值的变异程度的大小,可选用的变异指标是()。
A.标准差B.标准误C.变异系数D.极差
4、五名小细胞未分化型肺癌患者,其生存期(月)分别为6,10,14,23,41+,求生存期的平均水平宜选用
A.几何均数B.P50C.中位数D.均数
5、变异系数越大表示
A.相对离散程度越大B.标准差越小C.均数越大D.样本含量越小
6、数值变量的标准差与均数的关系:
A.不会大于均数B.不会小于均数
C.不会等于均数D.不决定于均数
7、正态分布的特点是
A.算术均数等于几何均数B.算术均数等于中位数
C.几何均数等于中位数D.算术均数与几何均数、中位数都相等
8、最小组段无下限或最大组段无上限的频数分布资料,可用()描述起集中趋势。
A、均数B、标准差C、中位数D、四分位数间距
9、数列40、48、50、52、60的标准差为()。
A、50B、根号50C、根号52D、52
10、一组变量的标准差将()。
A、随变量值n的个数的增大而增大B、随变量值n的个数的增加而减小
C、随变量值之间的变异增大而增大D、随系统误差的减小而减小
11、一组数据中20%为3,60%为2,10%为0,则平均数为()。
A、1.5B、1.9C、2.1
D、不知道数据的总个数,不能计算平均数
三、辨析题
1、当资料服从正态分布时,理论上均数和中位数相等。
2、计算样本的方差时,分母上为n-1,是由于历史错误的延续。
3、连续性数值变量的频数表资料直接法和间接法计算得到的算术均数相等。
4、只要单位相同,用S和CV比较两组资料的离散趋势结论相同。
5、对称分布的资料,在范围内理论上包含了95%的观察值.。
6、均数总是大于中位数。
7、均数总是比标准差大。
8、变异系数的量纲和原量纲相同。
9、样本均数大时,标准差也一定会大。
10、样本量增大时,极差会增大。
四、问答题
1.描述集中趋势的指标有哪些?
其适用范围有何异同?
2.描述离散趋势+的指标有哪些?
其适用范围有何异同?
3.常用相对数的指标有哪些?
它们的意义和计算上有何不同?
4.标准化的意义是什么?
答案:
(请看文本内容)
计算分析题
5.测得某工厂204名轧钢工人白细胞中大单核数如下,试计算其平均数。
大单核数(/100白细胞)
0~
2~
4~
6~
8~
10~
12~
14~
16~
18~
20~
人数
24
40
55
37
27
18
1
0
1
0
1
6、某卫生防疫站侧得大气中二氧化硫的浓度,用两种计量单位表示:
mg/m3:
12345
ug/m3:
10002000300040005000
分别计算几何均数及标准差,会发现两种不同单位的标准差相等,试解释其原因。
7、52名麻疹患者恢复期血清麻疹病毒特异性IgG荧光抗体滴度如下,试求平均滴度。
8、抽样调查某单位2839名职工高血压病,结果如表F2.2。
据此,某医生认为:
①该企业单位职工高血压发病率为8%,并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为100%;②高血压与性别有关,男性为10.2%,女性为4.5%,男性明显高于女性。
以上分析是否妥当?
表F2.2某单位男女职工各年龄组高血压病例分布
第三章
1.分布函数与密度函数有何区别与联系?
(答案参见内容)
2.正态分布与标准正态分布有何区别与联系?
(答案参见内容)
3.正态分布N(μ,σ2)中,小于μ-σ者占多大比例?
4.什么是参考值范围?
如何确定参考值范围?
5.双侧95%正常值范围与服从正态分布N(μ,σ2)总体的(μ-1.96σ,μ+1.96σ)范围有何区别与联系?
1.参看概率论基础
2.参看概率论基础
3.
对应标准正态变量u值为—1,查界值表得对应的概率值为0.1587,即小于
的观察值所占比例为15.87%.
4.答案参见内容4.2.5正态分布的应用
(2)
5.解:
前者为根据样本估计的包含了95%正常人的某项医学指标的观察值范围,后者为服从正态分布的总体包含了95%观察值的理论范围。
当资料服从正态分布时,前者是以后者为理论基础计算的。
第四章二项分布与piosson分布
1.设某病患者自然康复率为20%,分别求10个患者中自然康复1人以下及8人以上的概率。
解:
2.二项分布的应用条件是什么?
(答案参见内容)
3.二项分布与正态分布有何联系?
(答案参见内容⑷二项分布的正态近似)
第五章参数估计于假设检验
复习思考题
1
与
的关系为:
a
越大,
越大b
越大,
越小
c
越大,
代表性越好d
越小,
代表性越好
2在同一个总体中随机抽取多个样本,用样本均数估计总体均数的95%可信限,则估计的精密程度是:
a均数大的样本b均数小的样本
c标准误大的样本d标准误小的样本
3用样本推断总体均数的95%可信区间为:
a
±2.58
b
±t0.05,ν
c
±1.96sd
±t0.05,νs
4总体均数可信区间:
a随时总体均数而变化b不随总体均数而变化
c随样本不同而变化d不随样本变化
5统计推断的内容为:
a用样本指标估计相应的总体指标b检验统计上的:
“假设“
ca,b均是da,b均不是
6两样本均数比较用t检验,其检验假设:
a两样本均数不相同b两总体均数不相同
c两个总体均数相同d以上都不是
7两样本均数比较,经t检验,差别有显著性时,P值越小,说明:
a两样本均数差别越大b两总体均数差别越大
c越有理由认为两总体均数不同d越有理由认为两样本均数不同
8某医师用药物治疗两组同病患者,如果治愈率相等,但甲组收治的病人是乙组的10倍,比较两总体治愈率的95%可信区间:
a甲组的较乙组的准确b乙组的较甲组的准确
c甲组的较乙组的精密d乙组的较甲组的精密
1思考题
1参数估计有哪两种类型?
各有什么优缺点。
2为什么假设检验只回答差别有无统计学意义而不回答所比较事物的实际差别?
3两样本均数比较的假设检验有t检验和u检验,试述这两种检验分别在什么条件下用,这两种检验间有什么联系?
4检验水准α和P值,两者含义有什么不同?
5参考值范围能否用可信区间表示?
为什么?
6假设检验用于推断两总体均数有无差异;可信区间用于推断总体均数在哪一个范围;试讨论
(1)当检验水准α确定后,在配对设计和成组设计两种情况下,分别计算差值和两均数差值的总体均数可信区间表达公式。
(2)能否用可信区间回答假设检验的问题?
7试述两类错误的意义和两类错误间的关系。
计算题
1正常成年男人15人,经运动试验后测得血气分析指标之一PaO2值为:
75,80,80,74,84,78,89,72,76,83,75,87,78,79,88
试求PaO2总体均数的95%的可信区间。
2乳癌研究组收集了两种类型乳癌肿块大小资料为:
肿瘤类型
例数n
(cm)
S(cm)
A
21
3.85
1.95
B
16
2.80
1.70
试求:
(1)两种类型肿块大小差异是否显著
(2)两种类型肿块大小之差的总体均数的可信区间。
318名黑热病兼贫血患者被随机分成两组各9名,分别用葡萄糖锑钠(A)和复方葡萄酸锑钠(B)治疗,观察治疗前后血色素(%)的变化,测定结果如下
A药
病人号
1
2
3
4
5
6
7
8
9
治疗前
36
45
55
55
65
60
42
45
25
治疗后
45
65
66
85
70
55
70
45
50
B药
病人号
1
2
3
4
5
6
7
8
9
治疗前
55
50
65
60
70
40
45
35
30
治疗后
80
80
70
60
85
75
60
50
60
查看答案
选择题
1.D.2.D.3.B.4.C.5.C.6.C.7.C.8.C
思考题:
参数估计一般有点估计和区间估计两种。
点估计计算简便,但没有考虑抽样误差;区间估计考虑了抽样误差,但计算较为复杂。
两样本均数比较的t检验要求样本来自于正态总体,且方差齐性;u检验要求两样本例数较大。
两样本均数比较的t检验和u检验之间的关系在于:
当样本例数足够大时t界值等于u界值。
检验水准alpha和P值的含义有何不同?
答:
二者均为概率,检验水准指拒绝了实际上成立的H0所犯错误的概率,是进行统计推断时预先设定的一个小概率事件标准。
P值是有实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于或小于)现有样本获得的检验统计量值的概率。
在假设检验中通常是将P与对比来得出结论若P≦alpha,则拒绝H0,接受H1,有统计学意义,可以认为总体参数不同或不等;否则,若P>alpha,则不拒绝H0,无统计意义,还不能认为总体参数不同或不等。
参考值范围能否用可信区间表示,为什么?
参考值范围是对于个体观察值而言的包含了绝大多数正常人的某项生理生化指标的范围;可信区间是对于统计量而言的,是更具样本统计量计算得到的以一定的概率可能包含了总体参数在内的数值范围。
所以参考值范围不能用可信区间表示。
二者的区别体现在含义,计算公式和用途三个方面。
区别点
均数的可信区间
参考值范围
意义
按预先给定的概率,确定的未知参数的可能范围。
实际上一次抽样算得的可信区间要么包含了总体均数。
要么不包含。
但可以说,该可信区间有多大的可能性包含了总体均数。
正常人的解剖,生理生化某项指标的波动范围。
计算公式
σ未知:
σ已知
σ未知但n>50:
正态分布:
偏态分布:
PX~P100-X
用途
估计总体均数
判断观察对象的某项指标正常与否。
计算题
1.解:
样本例数较小且总体标准差未知更具,根据t分布的原理,总体均数的95%可信区间可以通过下式估计:
(
。
)
本例样本均数xbar=79.87,S=5.30,t0.05,4=2.145代入公式得可信区间为:
(76.93,82.80)
2.解:
(1)H0:
μ1=μ2两种类型的乳癌肿块大小总体均数相同
H1:
两种类型的乳癌肿块大小总体均数不同α=0.05
Sc2=
υ=35
t0.05(35)=2.030,现有t<2.030,P>0.05,不拒绝H0,故还不能认为两种类型的肿块大小差异有显著性。
(2)
当H0成立时,μ1=μ2,所以上式分子中后面一项可以省
略。
所以差值的总体均数的可信区间可通过是上式推导得到
t0.05(35)=2.03,
=1.05,
=0.613,代入得可信区间为(-0.19,2.29)
3.解:
问:
(1)A、B两药是否都有效?
(2)A、B两药的疗效有无差别?
解:
(1)分别计算两种药物治疗前后的差值d1,d2
H0:
服用A药前后的血色素差值总体均数μd1=0
H0:
服用A药前后的血色素差值总体均数μd1≠0α=0.05
=13.67
υ=8
t0.05(8)=2.306,现有统计量t>2.306,P<0.05,拒绝H0,接受H1,有理由认为该药治疗前后的血红蛋白差异有统计学意义,即A药治疗有效。
同理可以,得到B药治疗前后血红蛋白差异有统计学意义,即B药治疗有效。
(2)H0:
μd1=μd2两种药物治疗前后血红蛋白差值总体均数相等
H1:
μd1≠μd2α=0.05两种药物治疗前后血红蛋白差值总体均数不等
α=0.05
t0.05(16)=2.120,现有t<2.12,P>0.05.接受H0,还不能认为两种药物的疗效差别有统计学意义。
第六章方差分析
1.设某试验因素A有K(K
3)个水平,观测数据是连续性资料,且满足各种参数检验的前提条件。
用多次t检验取代方差分析和q检验,将会—————。
a.明显增大犯第I类错误的概率b.使结论更加具体
c.明显增大犯第II类错误的概率d.使计算更加简便
2.在完全随机设计的方差分析中,必然有——————。
a.SS组内 c.MS总=MS组间+MS组内d.SS总=SS组间+SS组内 3.在进行成组设计资料的t检验或进行方差分析之前,要注意两个前提条件。 一要考查各样本是否来自正态总体,二要————————。 a.核对数据b.作方差齐性检验 c.求 、S和 c.作变量代换 4.四个样本均数经方差分析后P<0.05,为进一步弄清四个均数间的差别,应进行————。 a. 检验b.t检验c.u检验d.q检验 5.四个均数比较,若方差分析结果F> 则————————。 a. b. c.可能至少有两个样本均数不等d.可能至少有两个总体均数不等 6.对样本率资料进行方差分析,可考虑进行: a.对数变换b.平方根变换 c.平方根反正弦变换d.倒数变换 7.对完全随机设计资料,若利用简便计算法计算F值,必须————————。 a.知道各组的原始数据b.知道 、 c.各组例数相等d.知道 、 和 8.检验两组定量资料的总体方差是否相等,要用的检验统计量是——————。 a.t统计量b.F统计量c. 统计量d.u统计量 9.检验三组以上定量资料的总体方差是否相等,可用的检验统计量是————。 a.F统计量b.t统计量 c.一般 统计量d.Bartlett 统计量 10.某单位研究棉布、府绸、的确良、尼龙4种衣料内棉花吸附十硼氢量(定量指标),每种衣料各做5次检验,得到5个定量数据,假定资料满足各种参数检验的前提条件,为回答“4种衣料内棉花吸附十硼氢量均值之间差别有无统计学意义”,应选用。 a.t检验b.F检验c.u检验d. 检验 11.用某种新降压药治疗15名高血压患者,测得每位患者治疗前,治疗后第3、6、9天的血压值,假定资料满足各种参数检验所要求的前提条件,且每位患者4次测定值写在了同一行上。 为排除个体差异的影响,在分析资料时,应选择————。 a.单因素4水平设计资料的方差分析 b.配对设计资料的t检验 c.配伍组设计资料的方差分析 d. 检验 12.u、t、F检验的共同前提条件是—————————。 a.方差齐性b.正态性c.可加性d.正态性和方差齐性 13.掌握方差分析的基本思想,即使记不住具体公式,一般也能作出结果,得出结论,其基本思想可简述为———————。 a.组间方差大于组内方差 b.误差的方差必然小于组间方差 c.总离均差平方和及其自由度可以分解成几种不同的来源 d.两方差之比服从F分布 思考题: 1.变量变换在本单元资料处理中的作用是什么? 2.完全随机设计资料与配伍组设计资料有何不同,哪一种试验效率更高? 3.试说明方差分析与t检验的应用条件和应用范围。 4.t检验可以用来作多组均数的多重比较吗? 为什么? 第七章卡方检验 复习思考题 选择题 1.四格表资料用基本公式作χ2检验,其条件是______。 a.总例数大于40b.理论频数大于5 c.两者都不是d.两者都是 2.四格表周边合计数不变时,实际频数如有改变,理论频数______。 a.增大b.减小c.不变d.不知道 3.χ2检验中自由度的计算公式是______。 a.行数×列数b.n-1c.n-kd.(行数-1)(列数-1) 4.四格表中,当a=20,b=60,c=40,d=30时,最小理论频数等于______。 a.60×90/150b.80×70/150C.70×90/150D.70×60/150E.60×80/150 5.配对四格表作χ2检验时的检验假设为________。 a.B=Cb.A=Cc.B=Dd.A=B 6.四格表资料确切概率法中所需组合的确定依据是______。 a.A大于实际组合Ab.|A-T|大于实际组合.|A-T| c.T大于实际组合Td.P≤实际组合P 7.n较大,p和(1-p)均不太小,且np或(n(1-p))≥5时,四格表资料除用χ2检验外,还可用______。 a.t检验b.u检验c.F检验d.q检验 8.四个样本率作比较,χ2>χ0.01(3)2,可认为______。 a.各总体率不同或不全相同b.各总体率均不相同 c.各样本率均不同d.各样本率不同或不全相同 问答题 1.四格表资料的u检验和χ2检验的应用条件有何异同? 2.四格表确切概率法为什么要求出多种组合下四格表出现的概率总和? 3.用哪些方法来解决理论频数过小的问题? 计算分析题 1.为了了解某乡钩虫感染情况,随机抽查男200人,感染40人;女150人,感染20人。 问该乡男性感染率是否高于女 性? 2.某医院肿瘤科3年来治疗乳腺癌病人131例,每例观察均满5年,求得5年生存率如表F7.1,试比较手术治疗和联合 治疗(手术+术后化疗)的效果。 表F7.1131例乳腺癌治疗后五年存活率比较 治疗方法 治疗数 存活数 存活率 手术治疗 47 39 83 联合治疗 84 57 67.9 合计 131 96 733 3.某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,资料如表F7.2,问两组波型的分布差别有无显著性? 表F7.2两组受检者肝炎波形的表现 分组 正常波 可疑波 较密波 合计 肝炎组 12 43 232 287 正常组 277 39 11 327 合计 299 82 243 614 4.有人用3种方法治疗钩端螺旋体病患者149例,结果如表F7.3,比较3组治愈率差别有无显著性。 表F7.3三种药物治愈率比较 药物组 治疗数 治愈数 治愈率(%) 土茯菱合计 36 28 77.8 大青叶合剂 48 36 75 银翘黄芩片 65 57 87.7 5.有人用两种方法治疗某病,结果如表F7.5,试比较两种方法效果差别有无显著性。 表F7.5两种方法治疗结果 治疗方法 有效例数 无效例数 合计 中医治疗 14 4 18 西医治疗 8 10 18 合计 22 14 36 6.比较两种检验方法(荧光抗体法与常规培养法)对某食品作沙门氏菌检验,结果如表F7.6,试比较两种方法的阳性结果有无差别。 表F7.6两种方法检验结果比较 荧光抗体法 常规培养法 合计 + - + 160 26 186 - 5 48 53 合计 165 74 239 查看答案 选择题 1.d2.c3.d4.d5.a6.b7.b8.a 思考题 2两样本率比较,当n1、n2较大,p1、p2或(1-p1)、(1-p2)不太小,且n1p1、n2p2或n1(1-p1),n2(1-p2)均大于5时,可用u检验。 而四格表卡方检验要求样本含量足够,至少40. 两样本率比较时,若对统一资料进行u检验和χ2检验,不校正的情况下,χ2=u2。 3 4确切概率的计算思想是在周边合计固定的情况下,H0假设成立时,四格表有各种组合,假设检验判断结论需要累积概率,即等于现有样本以及更极端的样本出现的概率,所以需要计算所需各种组合出现的概率。 5四格表资料可以通过连续性校正的卡方检验和确切概率法来解决;行列表资料可以①扩大样本含量;②合并理论频数小的行或列③删除理论频数小的行或列;④确切概率法 第九章直线与回归 简答题: 1.相关与回归的联系与区别? 2.应用直线回归和相关分析应注意哪些问题? 3.举例说明如何用直线回归方程进行预测和控制? 4.进行回归分析时怎样确定自变量和应变量? 5.剩余标准差的意义与用途? 6.某资料的x与y的相关系数r=0.8,可否认为X与Y有较密切的相关关系? 选择题: 1.|r|>r0.05(v)时,可认为两变量之间: A.有一定关系B.有正相关关系 C.有直线关系D.一定有直线关系 2.相关系数假设检验的无效假设为: A.r来自ρ=0的总体B.r有高度相关性 C.r来自ρ≠0的总体D.r来自ρ>0的总体 3.Syx和Sb分别表示: A.Y的离散程度和b的抽样误差B.Y对Y的离散程度和标准估计 C.Y和X的离散程度和b的抽样误差D.Y对Y的离散程度和b的抽样误差 4.下列式可出现负值。 A B C D 5. =14+4X是1-7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重换算成国际单位千克,则此方程式有:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 东南大学 统计 试题 重要
![提示](https://static.bdocx.com/images/bang_tan.gif)