统计学模拟试题及解答.docx
- 文档编号:28921110
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:16
- 大小:305.22KB
统计学模拟试题及解答.docx
《统计学模拟试题及解答.docx》由会员分享,可在线阅读,更多相关《统计学模拟试题及解答.docx(16页珍藏版)》请在冰豆网上搜索。
统计学模拟试题及解答
模拟试题一
.单项选择题(每小题2分,共20分)
1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在
网上购物的主要原因是
价格便宜”。
这里的参数是()
A.1000个消费者B.所有在网上购物的消费者
C.所有在网上购物的消费者的平均花费额D.1000个消费者的平均花费金额
2.为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种
抽样方法属于()
6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中,随机抽取120个新车主中有57人为女性,在二=0.05的显著性水平下,检验2005年新车主中女性的比例是否有显著增加,建立的原假设和备择假设为()
A.H0:
二-40%,比:
厂-40%B.H0:
二一40%,比:
二:
:
40%
C.H0:
一——40%,比:
二40%D.H0:
二:
:
40%,比:
一-40%
7.在回归分析中,
因变量的预测区间估计是指(
)
A.
对于自变量
X的一个给定值
x0,求出因变量
y的平均值的区间
B.
对于自变量
X的一个给定值
x0,求出因变量
y的个别值的区间
C.
对于因变量
y的一个给定值
y0,求出自变量
X的平均值的区间
D.
对于因变量
y的一个给定值
y0,求出自变量
X的平均值的区间
&在多元线性回归分析中,如果F检验表明线性关系显著,则意味着()
A.在多个自变量中至少有一个自变量与因变量之间的线性相关系著
B.所有的自变量与因变量之间的线性关系都显著
C.在多个自变量中至少有一个自变量与因变量之间的线性关系不显著
D.所有的自变量与因变量之间的线性关系都不显著
9.如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是()
A.移动平均模型B.指数平滑模型C.线性模型D.指数模型
送pg一
10.设p为商品价格,q销售量,则指数烂的实际意义是综合反映()
a.商品销售额的变动程度
c.商品销售量变动对销售额影响程度
工p°qo
B.商品价格变动对销售额影响程度
D.商品价格和销售量变动对销售额影响程度
.简要回答下列问题(每小题5分,共15分)
1.简述直方图和茎叶图的区别。
2.简述假设检验中P值的含义。
3.解释指数平滑法。
(15分)甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。
乙班考试
成绩的分布如下:
考试成绩(分)
学生人数(人)
60以下
2
60—70
7
70—80
9
80—90
7
90—100
5
合计
30
(1)画出乙班考试成绩的直方图。
(2)计算乙班考试成绩的平均数及标准差。
(3)比较甲乙两个班哪个班考试成绩的离散程度大
四.(25分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。
现从某天生产的一批产
品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:
每包重量(克)
包数
96-98
2
98-100
3
100-102
34
102-104
7
104-106
4
合计
50
假定食品包重服从正态分布,要求:
(1)确定该种食品平均重量95%的置信区间。
(2)如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置信区间。
(3)采用假设检验方法检验该批食品的重量是否符合标准要求?
(--0.05,写出检验的具体步骤)。
五.(25分)一家产品销售公司在30个地区设有销售分公司。
为研究产品销售量(y)与该公司的销售价格(xi)、
各地区的年人均收入(X2)、广告费用(X3)之间的关系,搜集到30个地区的有关数据。
利用Excel得到下面
的回归结果(•、-0.05):
方差分析表
变差来源
df
SS
MS
F
SignificaneeF
回归
4008924.7
8.88341E-13
残差
一
一
总计
29
13458586.7
一
一
一
参数估计表
Coefficients
标准误差
tStat
P-value
ntercept
7589.1025
2445.0213
3.1039
0.00457
XVariable1
-117.8861
31.8974
-3.6958
0.00103
XVariable2
80.6107
14.7676
5.4586
0.00001
XVariable3
0.5012
0.1259
3.9814
0.00049
(1)将方差分析表中的所缺数值补齐。
(2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。
(3)检验回归方程的线性关系是否显著?
2
(4)计算判定系数R,并解释它的实际意义。
(5)计算估计标准误差sy,并解释它的实际意义。
模拟试题一解答
一、单项选择题
1.A;2.D;3.C;4.B;5.D;6.C;7.B;8.A;9.D;10.B。
二、简要回答下列问题
1.
(1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横置的直方图,
与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。
(2)在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
2.如果原假设H。
是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值
P值是假设检验中的另一个决策工具,对于给定的显著性水平[,若P:
:
:
:
•,则拒绝原假设。
3.指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第t+1期的预测值等于t期的实际观察值与第t期预测值的加权平均值。
一次指数平滑法是适合于平稳序列的一种预测方法,其模型为
Ft1=7(1-:
)Ft。
三、
(1)乙班考试成绩的直方图如下:
由于v甲:
:
:
v乙,所以甲班考试成绩的离散程度小于乙班。
(1)
四、
已知:
n=50,z0.052=1.96。
k
样本均值为:
、Mifi
i4
X二
n
k2
[Z(Mi-X)2fii
样本标准差为:
s—=,130.88=1.634克。
\n—1V49
由于是大样本,所以食品平均重量95%的置信区间为:
乂亠匸仙.32)96「加仙.32』453
即(100.867,101.773)。
(2)提出假设:
H。
:
亠=100,出:
・、100
计算检验的统计量:
Z=x-%J01.32-100sn1.634.50
由于z=5.712>Z0.05,2=1.96,所以拒绝原假设,该批食品的重量不符合标准要求。
五、
(1)
方差分析表]
变差来源
df
SS
MS
F
SignificaneeF
回归
3
12026774.1
4008924.7
72.80
8.88341E-13
残差
26
1431812.6
55069.7
一
一
总计
29
13458586.7
一
一
一
(2)多元线性回归方程为:
$=7589.1025-117.8861疋80.6107X20.5012x3。
畀=-11B86表示:
在年人均收入和广告费用不变的情况下,销售价格每增加一个单位,销售量
平均下降117.8861个单位;?
2=80.6107表示:
在销售价格和广告费用不变的情况下,年人均收入每增加一个单位,销售量平均增加80.6107个单位;=0.5012表示:
在年销售价格和人均收入不变的
情况下,广告费用每增加一个单位,销售量平均增加0.5012个单位。
(3)由于SignificaneeF=8.88341E-13<-=0.05,表明回归方程的线性关系显著。
SSR120267741
(4)R289.36%,表明在销售量的总变差中,被估计的多元线性回归方
SST13458586.7
程所解释的比例为89.36%,说明回归方程的拟合程度较高。
(5)se〜SSEMSE「55069.7=234.67。
表明用销售价格、年人均收入和广告费用
Yn-k-1
来预测销售量时,平均的预测误差为234.67。
模拟试题二
C•在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为D•在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为在假设检验中,如果所计算出的P值越小,说明检验的结果()
A.越显著B.越不显著
C.越真实D.越不真实
7.
在下面的假定中,哪一个不属于方差分析中的假定(
A•每个总体都服从正态分布B.各总体的方差相等
C.观测值是独立的D.各总体的方差等于0
在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是(
A.一个样本观测值之间误差的大小B.全部观测值误差的大小
C.各个样本均值之间误差的大小D.各个样本方差之间误差的大小
9.
在多元线性回归分析中,t检验是用来检验()
A.总体线性关系的显著性B.各回归系数的显著性
C.样本线性关系的显著性D.H0:
-12k=0
10.下面的哪种方法不适合对平稳序列的预测()
D.线性模型法
A.简单平均法B.移动平均法C.指数平滑法
.简要回答下列问题(每小题5分,共20分)
1.简述直方图和条形图的区别。
2.简述中心极限定理。
3.回归分析主要解决以下几个方面的问题?
4.解释拉氏价格指数和帕氏价格指数。
(20分)一家物业公司需要购买大一批灯泡,你接受了采购灯泡的任务。
假如市场上有两种比较知名
品牌的灯泡,你希望从中选择一种。
为此,你从两个供应商处各随机抽取了60个灯泡的随机样本,进
行破坏性”试验,得到灯泡寿命数据经分组后如下:
灯泡寿命(小时)
供应商甲
供应商乙
700〜900
12
4
900〜1100
14
34
1100〜1300
1300〜1500
24
10
19
3
合计
60
60
(1)请用直方图直观地比较这两个样本,你能得到什么结论?
(2)你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平?
请简要说明理由。
(3)哪个供应商的灯泡具有更长的寿命?
(4)哪个供应商的灯泡寿命更稳定?
四.(20分)为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,
得样本均值为6.5小时,样本标准差为2.5小时。
(1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。
以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间?
(注:
Z0.025-1.96,Z0.05=1.645)
五.(20分)一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行使时
间(小时)行驶的里程(公里)之间的关系,为此随机调查了20个出租车司机,根据每天的收入(y)、行使时间(%)和行驶的里程(x2)的有关数据进行回归,得到下面的有关结果(:
-=0.05):
方程的截距児=42.38
截距的标准差s?
=36.59
回归平方和SSR=29882
回归系数弭=9.16
回归系数的标准差sg=4.78
残差平方和SSE=5205
回归系数罔=0.46
回归系数的标准差s?
=0.14
一
(1)写出每天的收入(y)与行使时间(xi)和行驶的里程(X2)的线性回归方程。
(2)解释各回归系数的实际意义。
(3)计算多重判定系数R2,并说明它的实际意义。
(4)计算估计标准误差Sy,并说明它的实际意义。
(5)若显著性水平:
■=0.05,回归方程的线性关系是否显著?
(注:
F0.05(2,17)=3.59)
模拟试题二解答
、单项选择题
1.A;2.A;3.C;4.A;5.C;6.A;7.D;8.C;9.B;10.D。
二、简要回答下列问题
1.
(1)条形图是用条形的长度或高度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
(2)直方图的各矩形通常是连续排列,而条形图则是分开排列。
(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
2.从均值为」、方差为匚2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n一30),
样本均值X的抽样分布近似服从均值为丄、方差为;「2.:
n的正态分布。
3.
2)对这些关系式的可信程度进行各种
(1)从一组样本数据出发,确定出变量之间的数学关系式;(
统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;(3)利
用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测
的可靠程度。
4.在计算一组商品价格的综合指数时,把作为权数的销售量固定在基期计算的指数称为拉氏价格指数。
在计算一组商品价格的综合指数时,把作为权数的销售量固定在报告期计算的指数称为帕氏价格指数。
(1)两个供应商灯泡使用寿命的直方图如下:
使用寿命
供应商甲
0
供应商乙
从集中程度来看,供应商甲的灯泡的使用寿命多数集中在
灯泡的使用寿命多数集中在900小时〜1100小时之间。
从离散程度来看,供应商甲的灯泡的使用的离散
程度大于供应商乙的离散程度。
(2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,命的分布基本上是对称分布的。
(3)计算两个供应商灯泡使用寿命的平均数如下:
k
Mifi
x甲二
1100小时〜1300小时之间,供应商乙的
因为两个供应商灯泡使用寿
n
k
Mifi
i1
x乙=
8001210001412002414001066400=1106.67小时。
60
60
二8004WOO34120019MOO3=64200=1070小时。
60
60
n
甲供应商灯泡使用寿命更长。
(4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
k2
、(Mi-x)2fi
s甲
n-1
199.89…
0.18
x甲1106.67
235733334=199.89小时。
59
k
、M-x)2fi
i好
二
n-1
136.92…
0.13
1070
1106000「36.92小时。
59
s乙
V乙二
x乙
由于V乙:
:
:
V甲,说明供应商乙的灯泡寿命更稳定。
四、
(1)已知:
n=225,x=6.5,s=2.5,z0.025=1.96。
网络用户每天平均上网时间的95%的置信区间为:
-S
X—Z2n
25
=6.5_1.966.5_0.33
225
即(6.17,6.83)。
90
(2)样本比例p0.4。
龄在20岁以下的网络用户比例的95%的置信区间为:
225
表明用行驶时间和行驶里程来预测每天的收入时,平均的预测误差为17.50元。
(5)提出假设:
H0:
“--2-0,H1:
-1?
-2至少有一个不等于0。
计算检验的统计量F:
于F=48.80■F0.05(2,17)=3.59,拒绝原假设H0。
这意味着每天收入与行驶时间和行驶里程之
间的线性关系是显著的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 模拟 试题 解答