统计学习题.docx
- 文档编号:7847464
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:20
- 大小:66.93KB
统计学习题.docx
《统计学习题.docx》由会员分享,可在线阅读,更多相关《统计学习题.docx(20页珍藏版)》请在冰豆网上搜索。
统计学习题
第一章绪论
一、填空
1、统计数据按测定层次分,可以分为、和;如果按时间状况分,可以分为和。
2、由一组频数2,5,6,7得到的一组频率依次是、、和,如果这组频数各增加20%,则所得到的频率。
3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为,其组中值为。
4、如果各组相应的累积频率依次为,,,,1,观察样本总数为100,则各组相应的观察频数为______。
5、中位数可反映总体的趋势,四分位差可反映总体的程度,数据组1,2,5,5,6,7,8,9中位数是,四分位差是,众数为。
6、假如各组变量值都扩大2倍,而频数都减少为原来的1/3,那么算术平均数。
二、选择
1、统计学的两大类基本内容是
A、统计资料的收集和分析B、理论统计和运用统计
C、统计预测和决策D、描述统计和推断统计
2、下列属于属性变量的是
A、教师年龄B、教师职称C、教师体重D、教师工资
3、已知分组数据各组组限为:
10~15,15~20,20~25,则第二组的组中值为
A、17B、16C、18D、
4、在分组时,身高164cm应归入下列哪一组
A、160~164cmB、164~168cm
C、160~164cm或164~168cmD、另立一组
5、分组数据各组的组限不变,每组的频数均增加40,则其加权算术平均数的值
A、增加40B、增加40%C、不变化D、无法判断
6、三个流水作业的生产车间的废品率分别为5%,2%,4%,则这三个
车间的平均废品率为
A、%B、%C、%D、%
7、以下数字特征不刻画分散程度的是
A、极差B、离散系数C、中位数D、标准差
8、已知总体平均数为200,离散系数为,则总体方差为
A、B、10C、100D、
9、两个总体的平均数不相等,标准差相等,则
A、平均数大,代表性大B、平均数小,代表性大
C、两个总体的平均数代表性相同D、无法判断
10、某单位的生产小组工人工资资料如下:
90元、100元、110元、120元、128元、148元、200元,计算结果均值为
元,标准差为
A、σ=33B、σ=34C、σ=D、σ=35
11、已知方差为100,算术平均数为4,则标准差系数为
A、10B、C、25D、无法计算
12、有甲乙两组数列,若
A、1<21>2,则乙数列平均数的代表性高
B、1<21>2,则乙数列平均数的代表性低
C、1=21>2,则甲数列平均数的代表性高
D、1=21<2,则甲数列平均数的代表性低
13、某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为岁,则该城市男性青年结婚的年龄分布为
A、右偏B、左偏
C、对称D、不能作出结论
14、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用
A、众数B、中位数C、四分位数D、均值
15、如果你的业务是提供足球运动鞋的号码,哪一种平均指标对你更有用
A、算术平均数B、几何平均数C、中位数D、众数
三、判断
1、已知分组数据的各组组限为:
10~15,15~20,20~25,取值为15的这个样本被分在第一组。
()
2、将收集到得的数据分组,组数越多,丧失的信息越多。
()
3、离散变量既可编制单项式变量数列,也可编制组距式变量数列。
()
4、从一个总体可以抽取多个样本,所以统计量的数值不是唯一确定的。
()
5、在给定资料中众数只有一个。
()
6、数字特征偏度、峰度、标准差都与数据的原量纲无关。
()
7、比较两个总体平均数的代表性,如果标准差系数越大则说明平均数的代表性越好。
()
8、中位数是处于任意数列中间位置的那个数。
()
9、算术平均数、调和平均数、几何平均数、众数均受极端两值影响。
()
10、权数对算术平均数的影响作用只表现为各组出现次数的多少,而与各组次数占总次数的比重无关。
()
四、计算题
1、某班的经济学成绩如下表所示:
43
55
56
56
59
60
67
69
73
75
77
77
78
79
80
81
82
83
83
83
84
86
87
88
88
89
90
90
95
97
(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数
(2)计算该班经济学成绩的众数、四分位差和离散系数。
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么
(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布
2、在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200~300元的家庭占24%,人均月收入在300~400元的家庭占26%,在400~500元的家庭占29%,在500~600元的家庭占10%,在600~700元的家庭占7%,在700元以上的占4%。
从此数据分布状况可以判断:
(1)该城市收入数据分布形状如何(左偏还是右偏)。
(2)你觉得用均值、中位数、众数中的哪个来描述该城市人均收入状况较好。
理由
(3)上四分位数和下四分位数所在区间
3、某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为%、%、%。
根据资料计算三道生产工序的平均合格率。
4、对成年组和青少年组共500人身高资料分组,分组资料列表如下:
成年组
青少年组
按身高分组(cm)
人数(人)
按身高分组(cm)
人数(人)
150~155
155~160
160~165
165~170
170以上
22
108
95
43
32
70~75
75~80
80~85
85~90
90以上
26
83
39
28
24
合计
300
合计
200
要求:
(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。
(2)说明成年组和青少年组平均身高的代表性哪个大为什么
5、有两个生产小组,都有5个工人,某天的日产量件数如下:
甲组:
810111315
乙组:
1012141516
要求:
计算各组的算术平均数、全距、标准差和标准差系数,并说明哪个组的平均数更具有代表性。
6、设甲、乙两单位职工的工资资料如下:
甲单位
乙单位
月工资(元)
职工人数(人)
月工资(元)
职工人数(人)
600以下
600-700
700-800
800-900
900-1000
1000-1100
2
4
10
7
6
4
600以下
600-700
700-800
800-900
900-1000
1000-1100
1
2
4
12
6
5
合计
30
合计
30
要求:
试比较哪个单位的职工工资差异程度小。
7、某一牧场主每年饲养600头牛。
现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。
饲养原品种牛和改良品种牛的利润如下:
净利润(元/头)
原品种牛
改良品种牛
频数
频率(%)
频率(%)
–200
36
6
1
0
12
2
2
200
185
31
57
400
367
61
40
合计
600
100
100
(1)牧场主应该选择哪一种品种为什么
(2)改良品种牛的利润和频率可能与上表的计算值有差异。
当饲养改良品种牛的利润有什么变化时,牧场主会改变他在
(1)中所做的选择
8、一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想
第二章统计量及其分布
一、填空题
1、简单随机抽样样本均值的方差取决于和_________,要使的标准差降低到原来的50%,则样本容量需要扩大到原来的倍。
2、设
是总体
的样本,是样本方差,若
,则____________。
(注:
)
3、若
,则服从_______分布。
4、已知
,则
等于___________。
5、中心极限定理是说:
如果总体存在有限的方差,那么,随着的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于。
二、选择题
1、中心极限定理可保证在大量观察下
A、样本平均数趋近于总体平均数的趋势B、样本方差趋近于总体方差的趋势
C、样本平均数分布趋近于正态分布的趋势D、样本比例趋近于总体比例的趋势
2、设随机变量
,则
服从
。
A、正态分布B、卡方分布C、t分布D、F分布
3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm,标准差为。
至少以的概率可确信4岁男孩平均身高在到之间。
A、%B、90%
C、%D、%
4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是()
A、样本容量为10B、抽样误差为2
C、样本平均每袋重量是统计量D、498是估计值
5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从
A、
B、
C、
D、
三、判断题
1、所有可能样本平均数的方差等于总体方差。
()
2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
()
3、设
,则对任何实数均有:
。
()
4、样本方差就是样本的二阶中心距。
()
5、设随机变量X与Y满足XN(0,1),Y
则
服从自由度为n的t分布。
()
四、计算题
1、从正态总体
中随机抽取容量为36的样本,要求:
(1)求样本均值的分布;
(2)求落在区间(,)内的概率;
(3)若要以99%的概率保证
,试问样本量至少应取多少
2、设随机变量
,计算
3、根据自由度为4的t分布的密度函数,求出该密度函数的峰值,以及该分布期望与方差。
第三章参数估计
一、填空题
1、、和是对估计量最基本的要求。
2、总体
,
是来自X的一个容量为3的样本,三个的无偏估计量
中,最有效的一个是。
3、在一批货物中,随机抽出100件发现有16件次品,这批货物次品率的置信水平为95%的置信区间为。
4、若总体X的一个样本观测值为0,0,1,1,0,1,则总体均值的矩估计值为,总体方差的矩估计值为。
5、小样本,方差未知,总体均值的区间估计为。
二、选择题
1、在其它条件不变的情况下,如果总体均值置信区间半径要缩小成原来的二分之一,则所需的样本容量()。
A、扩大为原来的4倍B、扩大为原来的2倍
C、缩小为原来的二分之一D、缩小为原来的四分之一
2、以下哪个不是用公式
构造置信区间所需的条件()。
A、总体均值已知B、总体服从正态分布
C、总体标准差未知D、样本容量小于30
3、某地区职工样本的平均工资450元,样本平均数的标准差是5元,该地区全部职工平均工资落在440—460元之间的估计置信度为()
A、2B、C、3D、
4、假设正态总体方差已知,欲对其均值进行区间估计。
从其中抽取较小样本后使用的统计量是()
A、正态统计量B、统计量C、t统计量D、F统计量
5、根据一个具体的样本求出的总体均值的95%的置信区间()
A、以95%的概率包含总体均值B、有5%的可能性包含总体均值
C、一定包含总体均值D、要么包含总体均值,要么不包含总体均值
三、判断题
1、两个正态总体
已知,两个总体均值之差的区间估计为:
。
()
2、E(X2)是样本二阶原点矩。
()
3、在其他条件相同的情况下,95%的置信区间比90%的置信区间宽。
()
4、比较参数的两个矩估计量的有效性时,必须保证它们是无偏估计。
()
5、F分布百分位点具有性质
。
()
四、计算题
1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为厘米。
请确定该苗圃中树苗平均高度的置信区间,置信水平95%。
2、从水平锻造机的一大批产品中随机抽取20件,测得其尺寸平均值=,样本方差=。
假定该产品的尺寸
,均未知。
试求的置信度为95%的置信区间。
3、从两个正态总体X,Y中分别抽取容量为16和10的两个样本,算得样本方差分别为
,试求总体方差比
的95%置信区间。
第四章假设检验
一、填空
1、在做假设检验时容易犯的两类错误是和
2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为
3、假设检验有两类错误,也叫第一类错误,它是指原假设H0是的,却由于样本缘故做出了H0的错误;叫第二类错误,它是指原假设H0是的,却由于样本缘故做出H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为。
5、假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为。
6、从一批零件中抽取100个测其直径,测得平均直径为,标准差为,想知道这批零件的直径是否服从标准直径5cm,在显着性水平α下,否定域为
7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为。
(用H0,H1表示)
8、一般在样本的容量被确定后,犯第一类错误的概率为,犯第二类错误的概率为,若减少,则
9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20个/小时,随机抽样36位职工进行调查,得到样本均值为19,样本标准差为6,试在显着水平为的要求下,问该工厂的职工的工作效率(有,没有)达到该标准。
二、选择
1、假设检验中,犯了原假设H0实际是不真实的,却由于样本的缘故而做出的接受H0的错误,此类错误是()
A、α类错误B、第一类错误C、取伪错误D、弃真错误
2、一种零件的标准长度5cm,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为()
A、
,
B、
,
C、
,
D、
,
3、一个95%的置信区间是指()
A、总体参数有95%的概率落在这一区间内
B、总体参数有5%的概率未落在这一区间内
C、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数
D、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数
4、假设检验中,如果增大样本容量,则犯两类错误的概率()
A、都增大B、都减小C、都不变D、一个增大一个减小
5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。
假定这位经销商要检验假设
,
,取显着水平为α=,并假设为大样本,则此项检验的拒绝域为()
A、
B、
C、
D、
6、某种感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。
从过去的生产数据得知,标准差为2克,质检员抽取25包冲剂称重检验,平均每包的重量为克。
假定产品重量服从正态分布。
假定产品重量服从正态分布。
取显着性水平,感冒冲剂的每包重量是否符合标准要求()
A、符合B、不符合C、无法判断D、不同情况下有不同结论
三、判断
1、如果拒绝原假设将会造成企业严重的经济损失时,那么α的值应取得小一些。
()
2、统计假设总是成对提出的,即既要有原假设,也要有备择假设。
()
3、犯第二类错误的概率与犯第一类错误的概率是密切相关的,在样本一定条件下,α小,β就增大;α大,β就减小。
为了同时减小α和β,只有增大样本容量,减小抽样分布的离散性,这样才能达到目的。
()
4、随着显着性水平α取值的减小,拒绝假设的理由将变得充分。
()
5、假设检验是一种决策方法,使用它不犯错误。
()
四、计算
1、下面是某个随机选取20只部件的装配时间(单位:
分)
设装配时间的总体服从正态分布,参数均未知
,可否认为装配时间的均值为10
2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。
一直这种原件的寿命服从正态分布,标准差为100小时。
试求在显着性水平为下,确定厂家的声明是否可信
3、测得两批电子器件的样品的电阻(单位:
)为:
A批(x)
B批(y)
设两批器材电阻总体分别服从分布
均未知,且两样本独立,问在
下,可否认为两批电子器件的电阻相等
4、在一批产品中抽40件进行调查,发现次品有6件,试按显着水平为来判断该批产品的次品率是否高于10%。
5、某网络公司欲了解甲居民区中的家庭(21户)每月上网的平均小时数是否比乙居民区中的家庭(16户)少。
从这两个独立样本中得出的数据为=(小时),=(小时),S1=(小时)S2=(小时)。
假设两个居民区家庭每月上网小时数服从正态分布(α=)
第六章回归分析
一、填空
1、现象之间普遍存在的相互关系可以概括为两类:
一类是,另一类是。
2、在简单回归分析中,因变量y的总离差可以分解为和。
3、若相关系数为r=,表示两变量之间呈关系。
4、线性回归方程
中,截矩的意义是。
5、线性回归方程
中,斜率的意义是。
二、单项选择题
1、当相关系数时,表明()
A、现象之间完全无关B、相关程度较小
C、现象之间完全相关D、无直线相关关系
2、下列回归方程中,肯定错误的是()
A、
B、
C、
D、
3、对于有线性相关关系的两变量建立的直线回归方程
中,回归系数()
A、可能为0B、可能小于0C、只能是正数D、只能是负数
4、回归估计中,自变量的取值越远离其平均值,求得到y的预测区间()
A、越宽B、越窄C、越准确D、越接近实际值
5、在回归分析中,F统计量主要是用来检验()
A、相关系数的显着性B、回归系数的显着性
C、线性关系的显着D、参数估计值的显着性
三、判断
1、在简单线性回归分析中,
是的无偏估计。
()
2、总离差平方和一定时,回归离差平方和越大,残差平方和就越小。
()
3、回归残差平方和
。
()
4、相关系数r有正负、有大小,因而它反映的是两现象之间具体的数量变动关系。
()
5、进行回归分析时,应注意对相关系数和回归直线方程的有效性进行检验。
()
四、计算
1、下表是一小卖部某6天卖出热珍珠奶茶的杯数与当天气温的对比表.
气温(℃)
26
18
13
10
4
-1
杯数
20
24
34
38
50
64
现在的问题是:
如果某天的气温是-5℃,这天小卖部大概要准备多少杯热珍珠奶茶比较好一些
2、某种商品的需求量y(斤)和商品价格x(元)有关,现取得10对观测数据经计算得如下数据:
,
要求:
(1)计算相关系数;
(2)求y对x的线性回归方程
(3)解释
的意义。
3、某地区某企业近8年产品产量与生产费用的相关情况如下表所示:
年份
产品产量
(千吨)
生产费用
(万元)
1997
1998
1999
2000
2001
2002
2003
2004
62
86
80
110
115
132
135
160
要求:
(1)分析产品产量与生产费用的相关关系;
(2)建立一元线性回归模型。
第七章时间序列分析
一、填空
1、下表为两个地区的财政收入数据:
年份
A地区财政收入(亿元)
B地区财政收入(亿元)
1997
40
7
1998
60
11
则A地区财政收入的增长速度是,B地区财政收入的增长速度是,A地区财政收入的增长1%的绝对值为,B地区财政收入的增长1%的绝对值为。
2、已知环比增长速度为%、%、%、%,则定基增长速度是。
3、年劳动生产率r(千元)和职工工资(元)之间的回归方程为,这意味着年劳动生产率每提高1千元时,职工工资平均。
4、拉氏价格或销售量指数的同度量因素都是选期,而派许指数的同度量因素则选期。
5、动态数列的变动一般可以分解为四部分,即趋势变动、变动、变动和不规则变动。
二、选择题
1、反映了经济现象在一个较长时间内的发展方向,它可以在一个相当长的时间内表现为一种近似直线的持续向上或持续向下或平稳的趋势。
A、长期趋势因素B、季节变动因素C、周期变动因素D、不规则变动因素
2、是经济现象受季节变动影响所形成的一种长度和幅度固定的周期波动。
A、长期趋势因素B、季节变动因素C、周期变动因素D、不规则变动因素
3、时间序列在一年内重复出现的周期性波动称为()
A、趋势B、季节性C、周期性D、随机性
4、在使用指数平滑法进行预测时,如果时间序列比较平稳,则平滑系数α的取值()
A、应该小些B、应该大些C、等于0D、等于1
5、某银行投资额2004年比2003年增长了10%,2005年比2003年增长了15%,2005年比2004年增长了()
A、15%÷10%B、115%÷110%
C、(110%×115%)+1D、(115%÷110%)-1
三、判断
1、若1998年的产值比1997年上涨10%,1999年比1998年下降10%,则1999年的产值比1997年的产值低。
()
2、若三期的环比增长速度分别为9%、8%、10%,则三期的平均增长速度为9%。
()
3、去年物价下降10%,今年物价上涨10%,今年的1元钱比前年更值钱。
()
4、若平均发展速度大于100%,则环比发展速度也大于100%。
()
5、定基发展速度和环比发展速度之间的关系是两个相邻时期的定基发展速度之积等于相应的环比发展速度。
()
四、计算题
1、以下为某高校某专业15年报考考生人数的历史数据:
年份
1991
1992
1993
1994
1995
1996
1997
1998
报考人数(人)
1111
1145
1146
1183
1213
1244
1282
1282
年份
1999
2000
2001
2002
2003
2004
2005
报考人数(人)
1290
1306
1323
1358
1388
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 习题