统计学习题 第十三章 检验与方差分析文档格式.docx
- 文档编号:18937465
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:15
- 大小:61.23KB
统计学习题 第十三章 检验与方差分析文档格式.docx
《统计学习题 第十三章 检验与方差分析文档格式.docx》由会员分享,可在线阅读,更多相关《统计学习题 第十三章 检验与方差分析文档格式.docx(15页珍藏版)》请在冰豆网上搜索。
D实验数据总数n+变量X的取值种类数c
2.在
正态拟合优度检验中,对于选定的显著性水平α求临界值
,此时的自由度是()。
A数据的分组数B数据的分组数―l
C数据的分组数―2D数据的分组数―3
3.使用
检验法对n×
c列联表进行无关联性检验,与
这个检验统计量相联系的自由度()。
An―1Bc―lCn―cD(n—1)×
(c—1)
4.对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部分卡方
影响最大。
这是利用了卡方分布的()。
A恒正性B方差为期望值的2倍C可加性D前三者
5.在方差分析中,自变量是()。
A定类变量B定序变量C定距变量D定比变量
6.在直线回归分析中,相关比率PRC=0.750。
那么,积差系数r=()。
A0.750B0.5625C1.333D0.866
三、多项选择
1.可以用于拟和优度检验的方法有()。
A
检验BF检验
C累计频数检验D游程检验
2.方差分析法()。
A可以用于一个总体均值是否相等的检验
B可以用于两个总体均值是否相等的检验
C可以用于三个总体均值是否相等的检验
D可以用于多个总体均值是否相等的检验
3.对拟和优度推断结果,下列说法正确的是()。
A当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设
B数据少如果否定了零假设,这一否定的可靠性是很大的
C规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多大实际意义
D若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持
4.使用
检验拟和优度,下列说法正确的是()。
A相对频数相同的列联表,在统计检验中其显著性相同
B相对频数相同的列联表,在统计检验中其显著性并不相同
C相对频数相同的列联表,样本容量增加K倍,
不变
D相对频数相同的列联表,样本容量增加K倍,
变也扩大K倍
5.相关比率PRE度量的可以是()
A定类—定距变量之间的相关程度
B定距—定距变量之间的相关程度
C线性相关
D非线性相关
6.下列说法正确的是()。
A方差分析的优点在于,一个检验可以代替多个均值差检验
B方差分析总是优于一系列的均值差检验
C方差分析中的自变量X如果是二分变量,不论采用方差分析或均值差检验,其结果完全相同
D总变差分解的思想可以直接推广至多因素显著性检验
7.方差分析所包含的假定包括()。
A正态分布
B独立随机样本
C等方差性
D非负性
四、名词解释
1.拟和优度检验
2.列联表
3.理论频数
4.方差分析
5.方差分析表
6.总变差
7.组内变差
8.组间平方和
9.相关比率
10.估计标准误差
五、判断题
1.理论频数fe与观测频数fo越接近,经验分布与理论分布拟合程度越好。
()
2.对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不大。
()
3.规模极大的试验可把零假设有极细微的差别检测出来。
4.如何求得列联表中的理论频数就成了独立性检验的关键。
()
5.
检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点。
6.
检验不适用于定类变量和定序变量的相关统计。
7.在2×
2列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测方向的(Zα/2)2来找出
的近似值。
()
8.相对频数相同的列联表,在统计检验中其显著性也相同。
9.组内变差反映了数据的c个“中心”的散布程度。
10.组间平方和反映了数据围绕各“中心”的散布程度。
()
11.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量。
12.我们不可以从总平方和减去组间平方和来求组内平方和。
13.
只可用于一个定类变量与一个定距变量的相关程度的测定。
()
14.方差分析的优点在于,一个检验可以代替多个检验。
15.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。
16.拟合值Yc上下设置一个合适区间,那么Y被估计到的可能性便会大大增加。
六、计算题
1.一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。
为此,他在某校随机抽取了4500个本科生,这些学生的分布是:
一年级1200人,二年级1100人,三年级1150人,四年级1050人。
试问,在给定显著性水平α为0.05下,四个年级学生人数构成是否均匀?
2.一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规律两种粉色杂交后,后代将以白∶粉∶红=1∶2∶1的比例出现。
他做了一项杂交实验,植株了100株后代,结果发现:
21株白,61株粉,18株红。
试问,在给定显著性水平α为0.05下,是否植株后代以白:
粉:
红=1∶2∶1的比例出现?
3.某种动物的两个品种杂交后可能出现四种特征。
某种理论分析表明,可能出现的四种特征的数量将以9∶3∶3∶1的比例出现。
生物学家为此做了一项实验,检查了160个后代,结果发现具有着四种特征的后代的数量分别是72、38、32、18。
试问,在给定显著性水平α为0.05下,是否杂交后代以9∶3∶3∶1的比例出现?
4.某公司对电视机的可靠性进行了一次调查,使用100台电视机作样本,记录了在电视机出现故障之前所经历的月份。
根据经历的月份(按等级划分),下表给出了出现故障的实际分布月份和故障按照正态概率分布月份:
出现故障之前的月份(等级)
出现故障之前的实际月份
出现故障之前的期望月份
17以下
17—20
21—23
24—26
27—29
30以上
6
24
28
18
14
10
9
17
27
25
15
7
要求:
检验故障的实际分布与正态分布是否有明显差别(α取0.05)。
5.下表是三个年龄组的100名居民对生活质量要求的分布频数(按高、中、低分类):
年龄(岁)
生活质量要求
总计
高
中
低
17—30
11—35
45—65
12
11
8
13
40
35
20
31
38
100
试问,居民对生活质量的要求与年龄是否有明显的关系(α取0.05)。
6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。
小于5次
5—10次
5次以上
合计
10公里以内
10—20公里
20公里以上
42
32
19
23
30
5
103
60
37
93
61
46
200
试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?
(α取0.05)
7.为研究职业的代际流动问题,在某地随机抽取了160名职业区民进行调查,调查的结果如下表所示:
父辈职业
脑力劳动
体力劳动
农业劳动
子
辈
职
业
50
38
62
45
65
160
试问,子辈职业与父辈职业之间是否存在相关关系?
8.某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法。
研究者随机抽出来自农村和城市的两个家长样本,调查结果表明:
在来自城市的200位家长中,123人支持,36人反对,41人没有看法;
在来自农村的300位家长中,145人支持,85人反对,70人没有看法。
试问,家长对学生延长在校时间的看法是否与其居住在城市或农村有关?
(α取0.01)
9.某连锁商业企业在同城三个不同地点开设了三个分店,从这三家商店随机抽出5天的营业额的数据如下表所示:
单位:
万元
第一家分店
第二家分店
第三家分店
第一天
第二天
第三天
第四天
第五天
(1)求三家店每天的平均每天的营业额和5天的平均每天营业额;
(2)求总变差、组内变差和组间平方和;
(3)编制方差分析表;
(4)检验三个商店的地点不同对每天的营业额是否有显著的影响
(5)计算商店的地点不同对每天的营业额之间的相关比率。
10.为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调查三种职业家庭的子女数的资料如下:
工人:
1,3,4,4,6,2,3,4,3,5,2,4;
干部:
3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1;
知识分子:
6,4,2,2,3,0,5,3,1,2,1。
(1)求三种职业家庭户均子女数;
(4)检验不同职业的生育观是否有显著的不同。
(5)计算职业与子女数量之间的相关比率。
11.有关雇员初始年薪和他10年后的年薪之间的一项调查,共抽取了13名雇员。
数据表明,二者之间的积差系数是0.570。
现给定α=0.05,试检验此相关系数是否显著。
12.1992—2003年我国城镇居民人均消费性支出和人均可支配收入的数据见下表:
千元
年份
人均可支配收入
人均消费性支出
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2.027
2.577
3.496
4.283
4.839
5.160
5.425
5.854
6.280
6.860
7.703
8.472
1.672
2.111
2.851
3.538
3.919
4.186
4.332
4.616
4.998
5.309
6.030
6.511
(1)计算我国城镇居民人均消费性支出和人均可支配收入的积差系数;
(2)检验所计算的积差系数的显著性;
(3)建立我国居民人均消费支出依人均可支配收入的线性回归模型;
(4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与积差系数的数量关系;
(5)计算估计标准误差;
(6)已知某年我国居民人均年可支配收入为8000元,试以95%的置信度预测人均年消费性支出的估计区间。
13.某银行25家分行的不良贷款额与贷款余额调查数据如下(单位:
亿元):
分行编号
各项贷款余额
不良贷款额
1
67.3
0.9
2
111.3
1.1
3
173
4.8
4
80.8
3.2
199.7
7.8
16.2
2.7
107.4
1.6
185.4
12.5
96.1
72.8
2.6
64.2
0.3
132.2
58.6
0.8
174.6
3.5
263.5
10.2
16
79.3
14.8
0.2
73.5
0.4
24.7
139.4
6.8
21
368.2
11.6
22
95.7
109.6
1.2
196.2
7.2
102.2
(1)计算各项贷款余额和不良贷款额的积差系数;
(3)建立不良贷款额依各项贷款余额的线性回归模型;
(4)对回归模型进行F检验;
(6)求出贷款余额为100亿元时,不良贷款95%的置信区间.
七、问答题
1.对于拟合优度检验,解释统计推断的结果时,应注意些什么?
2.简述相关比率
、积差系数之平方r2和相关指数R之间的关系。
参考答案
1.均值2.品质3.
(c-1)(r-1)4.2×
25.频数6.均值差
7.4,1,58.相关比率9.回归系数B10.随机,因11.方差分析表
12.68.2613.95.4614.99.73
1.B2.D3.D4.C5.A6.D
1.AC2.BCD3.ABCD4.BD5.ABCD6.ACD7.ABC
1.拟和优度检验:
是有关检定总体是否具有正态或其他分布形式的非参数统计检验。
2.列联表:
是按品质标志把两个变量的频数进行交互分类的统计表格。
3.理论频数:
是按照理论分布计算出的样本各组频数。
4.方差分析:
研究多个总体均值是否存在差异的统计检验方法。
5.方差分析表:
用于表达方差分析结果的标准形式的表格。
其基本形式如下:
项目SS自由度MS检验统计量临界值显著性
组间SSB(c―1)MSBMSB/MSWFα(c―1,n―c)(待定)
组内SSW(n―c)MSW——————
总SST(n―1)————————
6.总变差:
记作SST,它表示
对于总均值
的偏差之平方和,即
SST=
7.组内变差:
记作SSW,它是各观测值
对其所属类别均值
的偏差的平方和,即
8.组间平方和:
记作SSB,是自变量因素所没有解释的
的变异,即
9.相关比率:
方差分析中把已解释的变差对总变差的比值称为相关比率,用符号
表示。
=1―
10.估计标准误差:
为回归剩余方差MSW的平方根,即SY/X=
1.(√)2.(×
)3.(√)4.(√)
5.(√)6.(×
)7.(√)8.(×
)
9.(×
)10.(×
)11.(√)12.(×
13.(×
)14.(√)15.(√)16.(√)
1.各年级理论频数均为1125人,
=11.111>
=7.81,接受H1:
四个年级的学生频数不构成均匀分布
2.白、粉、红三色花的理论频数分别是25、50和25,
=5.020>
=5.99,接受H0:
植株后代以白∶粉∶红=1∶2∶1的比例出现
3.四种特征后代的理论频数为:
90、30、30、10,
=12.267>
=781,接受H1:
杂交后代不是以9∶3∶3∶1的比例出现
4.
=11.71>
=7.23,接受H0:
检验故障的实际分布与正态分布没有明显差别
5.
=9.448>
=0.16,接受H0:
居民对生活质量的要求与年龄没有明显的关系
6.
=13.28>
=12.376,接受H0:
车祸事故的频数与司机单程驾车的路程相互独立
7.
=94.79>
=9.49,接受H1:
子辈职业与父辈职业之间是存在相关关系
8.
=9.61>
=9.21,拒绝H0:
家长对学生延长在校时间的看法与其居住在城市或农村无关
9.
(1)、
(2)略;
(3)见下表;
(4)由于Fo=0.4697<F0.05(2,12)=3.98,接受H0:
三个商店的地点不同对每天的营业额没有显著的影响;
(5)0.0726
SS自由度MS统计量临界值显著性
组间
组内
总
4.133322.06670.46973.89
52.800124.4000
56.93314
10.
(1)、
(2)略;
(4)由于Fo=0.72<F0.05(2,38)=3.24,接受H0:
不同职业的生育观没有显著的不同;
(5)0.0381
3.593421.79670.723.24
94.4066382.4843
98.00040
11.t=2.301>t0.025,11=2.201,拒绝H0:
ρ=0
12.
(1)r=0.9991;
(2)t=66.6>t0.025,8=2.306,拒绝H0:
ρ=0;
(3)
=0.2310+0.7511X;
(4)
=0.9982,r=
;
(5)SY/X=0.0638;
(6)
=6.2398,6.1148~6.3648
13.
(1)r=0.8436;
(2)t=7.5344>
,拒绝H0:
>
,则拒绝
两个变量间的线性关系不显著;
(5)SY/X=1.9799;
(6)2.11405~3.80585
1.答:
首先,当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设。
但是,数据少如果否定了零假设,这一否定的可靠性是很大的。
其次,当试验规模极大而得到否定零假设的结果时,需要进一步(使用区间估计等方法)考虑与零假设的偏离有多大,而不能只是宣布一下统计检验的结果就了事。
反之,若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持。
2.答:
当
被用于研究定距—定距变量之间的关系时,不仅可以作为线性相关的量度,也可以作为非线性相关的量度。
对线性相关,相关比率
与r2(积差系数之平方)有相同的PRE性质。
R2可以看做
的特例(定距—定距变量)。
对于定距—定距变量,曲线相关要用R来测量。
同一资料通过相关指数R与积差系数r计算的比较,可以判断确定两定距变量的关系是不是直线。
如果同时求出r与R,r等于或略大于R,可说明两变量关系是直线的,用r去测量是合适的;
如果r<R,则说明两变量关系可能是曲线的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学习题 第十三章 检验与方差分析 统计学 习题 第十三 检验 方差分析