第五章数据分布特征习题.docx
- 文档编号:7247647
- 上传时间:2023-01-22
- 格式:DOCX
- 页数:12
- 大小:42.16KB
第五章数据分布特征习题.docx
《第五章数据分布特征习题.docx》由会员分享,可在线阅读,更多相关《第五章数据分布特征习题.docx(12页珍藏版)》请在冰豆网上搜索。
第五章数据分布特征习题
第五章数据分布特征的描述
练习题
一、填空题
1.常用的数值平均数有和以及。
2.权数对算术平均数的影响作用不决定于权数的大小,而决定于权数的的大小。
3.计算算术平均数的基本公式。
4.当标志值较大而次数较多时,平均数接近于标志值较的一方;当标志值较小而次数较多时,平均数靠近于标志值较的一方。
5.加权算术平均数等于简单算术平均数的前提条件是。
6.利用组距数列计算算术平均数,应首先计算各组的。
7.统计中的变量数列是以为中心而左右波动,所以平均数反映了总体分布的。
8.中位数是位于变量数列的那个标志值,众数是在总体中出现次数的那个标志值。
中位数和众数也可以称为平均数。
9.调和平均数是平均数的一种,它是的算术平均数的。
10.现象的是计算或应用平均数的原则。
11.当变量数列中算术平均数大于众数时,这种变量数列的分布呈分布;反之算术平均数小于众数时,变量数列的分布则呈分布。
12.较常使用的离中趋势指标有、、、、。
13.极差是总体单位的与之差,在组距分组资料中,其近似值是。
14.是非标志的平均数为、标准差为。
15.标准差系数是与之比。
16.已知某数列的平均数是200,标准差系数是30%,则该数列的方差是。
17.标准差用的方法解决了离差之和为0而不能求平均离差的问题,因此它在数学处理上优于,因此应用范围更为广泛。
18.对某村6户居民家庭共30人进行调查,所得的结果是,人均收入400元,其离差平方和为5100000,则标准差是,标准差系数是。
19.测定峰度,往往以为基础。
依据经验,当β=3时,次数分配曲线为;当β<3时,为曲线;当β>3时,为曲线。
20.在对称分配的情况下,平均数、中位数与众数是的。
在偏态分配的情况下,平均数、中位数与众数是的。
如果众数在左边、平均数在右边,称为偏态。
如果众数在右边、平均数在左边,则称为偏态。
二、单选题
1.下列属于平均指标的是()。
A某县平均每亩粮食产量B全员劳动生产率
C某县平均每人占有耕地D某县平均每户拥有小汽车的数量
2,平均数反映了()。
A总体分布的集中趋势B总体中总体单位分布的集中趋势
C总体分布的离散趋势D总体变动的趋势
3.在变量数列中,如果标志值较小的一组权数较大,则计算出来的算术平均数()。
A接近于标志值大的一方B接近于标志值小的一方C不受权数的影响D无法判断
4.由相对数计算平均数时,如果掌握的权数是相对数的子项数值时,则采用()。
A、加权算术平均数公式B、加权调和平均数公式
C、简单算术平均数公式B、简单几何平均数公式
5.已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用()。
A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法
6.已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价,应该采用()。
A简单算术平均法B加权算术平均法C加权调和平均法D几何平均
7.某厂有两个车间,1984年甲车间工人平均工资为120元,乙车间为130元;1985年,甲车间工人在全厂工人中的比重提高,乙车间的比重下降。
在两车间工人平均工资没有变化的情况下,1985年全厂总平均工资比1984年全场总平均工资()。
A、增加B、减少C、持平D、不能作结论
8,某公司下属5个企业,已知每个企业某月产值计划完成百分比和实际产值,要求计算该公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是()。
A计划产值B实际产值C工人数D企业数
9.中位数和众数是一种()。
A代表值B常见值C典型值D实际值
10.由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即()。
A各组的次数必须相等B各组标志值必须相等
C各组标志值在本组内呈均匀分布D各组必须是封闭组
11.四分位数实际上是一种()。
A算术平均数B几何平均数C位置平均数D数值平均数
12.离中趋势指标中,最容易受极端值影响的是()。
A极差B平均差C标准差D标准差系数
13.平均差与标准差的主要区别在于()。
A指标意义不同B计算条件不同C计算结果不同D数学处理方法不同
14.标准差指标数值越小,则反映变量值()。
A、越分散,平均数代表性越低B、越集中,平均数代表性越高
C、越分散,平均数代表性越高D、越集中,平均数代表性越低
15.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成数方差为()。
A25%B30%C40%D50%
16.当数据组高度偏态时,哪一种平均数更具有代表性?
()。
A算术平均数B中位数C众数D几何平均数
17.方差是数据中各变量值与其算术平均数的()。
A离差绝对值的平均数B离差平方的平均数
C离差平均数的平方D离差平均数的绝对值
18.一组数据的偏态系数为1.3,表明该组数据的分布是()。
AlE态分布B平顶分布C左偏分布D右偏分布
19.对于右偏态有下列结论正确的是()。
A、
B、
C、
D、
20.当
时,次数分布曲线为()。
A、正态峰度B、平顶峰度
C、尖顶峰度D、无法判断
三、多选题
1.正确选择权数是计算平均数的重要问题,选择权数时要考虑()。
A它应该是标志值的直接承担着
B它与标志值相乘具有实际的经济意义
C它应该是次数
D它应该是频率
E它可以是绝对数表示的次数,也可以是用相对数形式表示的频率
2.加权算术平均数的大小受哪些因素的影响()。
A受各组频数或频率的影响B受各组标志值大小的影响
C受各组标志值和权数的共同影响D只受各组标志值大小的影响
E只受权数大小的影响
3.平均数的作用是()。
A反映总体的一般水平
B对不同时间、不同地点、不同部门的同质总体平均数进行对1
C测定总体各单位的离散程度
D测定总体各单位分布的集中趋势
E反映总体的规模
4.众数是()。
A位置平均数B总体中出现次数最多的标志值
C不受极端值的影响D适用于总体单位数多,有明显集中趋势的情况E处于变量数列中点位置的那个标志值
5.在什么条件下,加权算术平均数等于简单算术平均数()。
A各组次数相等B各组标志值不等
C变量数列为组距变量数列D各组次数都为1
E各组次数占总次数的比重相等
6.加权算术平均数的计算公式有()。
A
B
C
D
E
7.计算和应用平均数的原则是()。
A现象的同质性B用组平均数补充说明总平均数
C用变量数列补充说明平均数D用时间变量数列补充说明平均数
E把平均数和典型事例结合起来
8.下列变量数列中可以计算算术平均数的有()。
A变量数列B等距变量数列C品质变量数列D时间变量数列E不等距变量数列
9.几何平均数主要适用于()。
A标志值的代数和等于标志值总量的情况B标志值的连乘积等于总比率的情况
C标志值的连乘积等于总速度的情况D具有等比关系的变量数列
E求平均比率时
10.中位数是()。
A由标志值在变量数列中所处的位置决定的
B根据标志值出现的次数决定的C总体单位水平的平均值
D总体一般水平的代表值E不受总体中极端数值的影响
11.有些离中趋势指标是用有名数表示的,它们是()。
A极差B平均差C标准差D平均差系数E四分位差
12.不同总体间的标准差不能简单进行对比,是因为()。
A平均数不一致B标准差不一致
C计量单位不一致D总体单位数不一致
E与平均数的离差之和不一致
13.不同数据组间各标志值的差异程度可以通过标准差系数进行比较,因为标准差系数()。
A消除了不同数据组各标志值的计量单位的影响
B消除了不同数列平均水平高低的影响
C消除了各标志值差异的影响
D数值的大小与数列的差异水平无关
E数值的大小与数列的平均数大小无关
14.下列指标中,反映数据分布的对称、尖峭程度的指标有()。
A标准差分位值B偏度系数C峰度系数D标准差系数E标准差
15.若一组数据的偏度系数是—0.25,则下列说法正确的有()。
A平均数、中位数与众数是分离的B众数在左边、平均数在右边
C数据的极端值在右边,数据分配曲线向右延伸D众数在右边、平均数在左边
E数据的极端值在左边、数据分配曲线向左延伸
16.若某个观察值的标准差分位值为—1.5,则下列说法正确的有()。
A该观察值低于平均数
B该观察值高于平均数
C该观察值比该数据组的平均数低1.5个标准差
D该观察值比该数据组的平均数高1.5个标准差
E该观察值比该数据组的平均数低1.5个单位
17.关于峰度系数,下列说法正确的有()。
A当β=3时,次数分配曲线为正态曲线
B当β<3时,为平顶曲线
C当β接近于1.8时,次数分配趋向一条水平线
D当β小于1.8时,次数分配曲线是“U”形分配
E如果β的数值越大于3,则次数分配曲线的顶端越尖峭。
18.关于极差,下列说法正确的有()。
A只能说明变量值变异的范围B不反映所有变量值差异的大小
C反映数据的分配状况D最大的缺点是受极端值的影响
E最大的优点是不受极端值的影响
19.下列指标中,反映数据组中所有数值变异大小的指标有()。
A四分位差B平均差C标准差D极差E离散系数
四、判断题
1.权数对算术平均数的影响作用取决于权数本身绝对值的大小。
()
2.算术平均数的大小,只受总体各单位标志值大小的影响。
()
3.在特定条件下,加权算术平均数可以等于简单算术平均数。
()
4.中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响。
()
5.分位数都属于数值平均数。
()
6.在资料已分组时,形成变量数列的条件下,计算算术平均数或调和平均数时,应采用简单式;反之,采用加权式。
()
7.当各标志值的连乘积等于总比率或总速度时,宜采用几何平均法计算平均数。
()
8.众数是总体中出现最多的次数。
()
9.未知计算平均数的基本公式中的分子资料时,应采用加权算术平均数方法计算。
()
10.按人口平均的粮食产量是一个平均数。
()
11.变量数列的分布呈右偏分布时,算术平均数的值最小。
()
12.若数据组的均值是450,标准差为20,那么,所有的观察值都在450±20的范围内.。
()
13.是非标志的标准差是总体中两个成数的几何平均数。
()
14.总体中各标志值之间的差异程度越大,标准差系数就越小。
()
15.同一数列,同时计算平均差,标准差,二者必然相等。
()
16.如果两个数列的极差相同,那么,它们的离中程度就相同。
()
17.离中趋势指标既反映了数据组中各标志值的共性,又反映了它们之间的差异性。
()
18.若两组数据的平均数与标准差均相同,则其分布也是相同的。
()
19.在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全部的离差之和一定等于0。
()
20.数据组中各个数值大小相当接近时,它们的离差就相对小,数据组的标准差就相对小。
()
21.偏态系数与峰度系数的取值范围都是—3与+3之间。
()
五、简答题
1.反映总体集中趋势的指标有哪几种?
集中趋势指标有什么特点和作用?
2.如何理解权数的意义?
在什么情况下,应用简单算术平均数和加权算术平均数计算的结果是一致的?
3.加权算术平均数和加权调和平均数有何区别与联系?
4.平均数的计算原则是什么?
5.简述算术平均数、中位数、众数三者之间的关系?
6.什么是离中趋势指标?
它有哪些作用?
7.离中趋势指标有哪些,它们之间有何区别?
8.如何对任意两个总体平均数的代表性进行比较?
9.什么是偏度?
它有几种测定方法?
10.什么是峰度?
它有几种类型?
六、计算分析题
1.某厂对三个车间一季度生产情况分析如下:
第一车间产际产量为190件,完成计划95%;第二车间实际产量250件,完成计划100%;第三车间实际产量609件,完成计划105%。
三个车间产品产量的平均计划完成程度为:
另外,一车间产品单位成本为18元/件,二车间产品单位成本为12元/件,三车间产品单位成本为15元/件,则:
个车间平均单位成本为:
元/件。
以上平均指标的计算是否正确?
如不正确请说明理由并改正。
2.2001年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:
品种
价格(元/斤)
甲市场成交额(万元)
乙市场成交量(万斤)
甲
乙
丙
1.2
1.4
1.5
1.2
2.8
1.5
2
1
1
合计
—
5.5
4
试问哪一个市场农产品的平均价格高?
并说明原因。
3.某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。
根据资料计算三道生产工序的平均合格率。
4.已知某企业有如下资料:
按计划完成百分比分组(%)
实际产值(万元)
80——90
90——100
100———110
110———120
986
1057
1860
1846
计算该企业按计划完成百分比。
5.某市场有三种不同的苹果,其每斤价格分别为2元,3元和4元,试计算:
(1)各买一斤,平均每斤多少钱?
(2)各买一元,平均每斤多少钱?
6.某高校某系学生的体重资料如下:
按体重分组(公斤)
学生人数(人)
52以下
52—55
55—58
58——61
61以上
28
39
68
53
24
合计
212
试根据所给资料计算学生体重的算术平均数、中位数、众数。
7.已知某公司职工的月工资收入为965元的人数最多,其中,位于全公司职工月工资收入中间位置的职工的月工资收入为932元,试根据资料计算出全公司职工的月平均工资。
并指出该公司职工月工资收入变量数列属于何种偏态?
8.两种不同水稻品种,分别在5个田块上试种,其产量如下:
甲品种
乙品种
田块面积(亩)
产量
(公斤)
田块面积(亩)
产量
(公斤)
1.2
600
1.5
840
1.1
495
1.4
770
1.0
445
1.2
540
0.9
540
1.0
520
0.8
420
0.9
450
要求:
⑴分别计算两品种的单位面积产量。
⑵计算两品种亩产量的标准差和标准差系数。
⑶假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广。
9.当每天生产线的每小时产量低于平均每小时产量,并落入大于2个标准差时,该生产线被认为是“失去控制”。
对该生产线来说,昨天平均每小时产量是370件,其标准差每小时为5件。
下面是该天头几个小时的产量,该生产线在什么时候失去了控制?
时间
8:
00
9:
00
10:
00
11:
00
12:
00
1:
00
2:
00
产量
369
367
365
363
361
359
357
10.你是定时器的购买者,定时器在新道路爆破中用来起爆炸药。
你必须在两个供应者之间选择,分别用A和B表示。
在各自的说明书中,你发现由A出售的导火线引爆的平均时间为30秒,其标准差为0.5秒;而由B出售的导火线引爆的平均时间为30秒,其标准差为6秒。
请你做出选择,并说明原因。
11.雇员要进行两项能力测试。
在A项测试中,其平均分为100分,标准差为15分;在B项测试中,其平均分为400分,标准差为50分。
李明在A项测试中得了115分,在B项测试中得了425分。
与平均数相比,李明的哪一项测试更为理想?
请通过计算李明的每项测试的标准差分位值来寻求答案。
12.假设有三组次数分布数列如下:
数值
1
2
3
4
5
6
7
8
9
合计
一组次数
0
0
3
4
4
4
3
0
0
18
二组次数
0
1
1
3
8
3
1
1
0
18
三组次数
1
0
0
0
16
0
0
0
1
18
试根据表中资料,用四阶动差法计算各组的峰度系数
然后对各组分布作出峰度的判断。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 数据 分布 特征 习题