数据统计方法.docx
- 文档编号:1166302
- 上传时间:2022-10-18
- 格式:DOCX
- 页数:23
- 大小:609.27KB
数据统计方法.docx
《数据统计方法.docx》由会员分享,可在线阅读,更多相关《数据统计方法.docx(23页珍藏版)》请在冰豆网上搜索。
数据统计方法
第一节统计数据的位置特征
统计数据的位置特征是对一组统计数据集中趋势和平均水平的度量,通常将位置特征的度量称为平均指标。
常用来表述统计数据位置特征的平均指标有两类:
数值平均数和位置平均数。
数值平均数主要有算数平均数、调和平均数和几何平均数。
位置平均数主要有中位数和众数。
分析、研究一组统计数据的集中趋势,就是寻找该组数据一般水平的代表值。
一、数值平均数
数值平均数是全部数据的平均值。
主要有三种形式:
算术平均数、调和平均数和几何平均数。
(一)算术平均数
算术平均数是对一组数据中心位置的度量。
可分为简单算术平均数和加权算术平均数两种。
1.简单算术平均数
适用未分组数据,计算公式为:
(3.1)
式中,(或)—简单算数平均数;
—第项的数据值;
—数据的项数。
例3.1假设某商场200名职工月销售额的统计资料如表3.1所示,试求该商场200名职工月平均销售额。
解根据表中资料,200名职工月平均销售额为:
2.加权算数平均数
适用未分组数据,计算公式为:
(3.2)
式中,(或)—加权算术平均数;
—第组的数据值或组中值;
—第组的数据值或组中值出现的次数;
—分组的组数。
例3.2将表3.1的某商场200名职工月销售额的统计资料编制成表3.2的分组资料形式。
表3.2200名职工月销售额的分组资料
单位:
万元
解根据表3.2中资料,按分组资料估计200名职工月平均销售额应采用加权算术平均数方法,计算过程列表如下:
单位:
万元
于是,200名职工月平均销售额为:
(二)调和平均数
调和平均数又称“倒数平均数”,它是数据倒数的算术平均数的倒数。
当在实际工作中所采集的数据不能直接应用算术平均数的计算公式时,可利用调和平均数来度量一组数据的中心位置。
1.简单调和平均数
适用未分组数据,计算公式为:
(3.3)
例3.3假设4个企业的每万元工业产值耗能源的统计资料如下:
试求:
4个企业的平均能耗。
解每万元工业产值耗能源是逆指标,在计算平均水平时应采用调和平均数方法。
2.加权调和平均数
适用分组数据,计算公式为:
(3.4)
例3.4假设某企业某月按工人劳动生产率分组的统计资料如表3.3所示,试求该企业工人平均劳动生产率。
表3.3按工人劳动生产率分组
按工人劳动生产率分组(件/人)
生产班组
各组产量(件)
50-60
10
82500
60-70
8
65000
70-80
5
52500
80-90
2
25500
90-100
1
15200
解首先求出各组的组中值,然后求出各组工人数,采用加权调和平均数方法计算平均水平。
计算过程列表如下:
注意,生产班组数虽然是不同的劳动生产率各个组的次数,但它和分组的组中值相乘无任何实际意义,因此它不能做权数。
(三)几何平均数
主要用于计算比率或者速度的平均,用表示。
1.简单几何平均数
适用未分组数据,计算公式为:
例3.5假设某工厂生产的产品要经过3道连续作业的工序,每道工序的合格率依次为95%、90%和98%,试求3道工序的平均合格率。
解因为产品的总合格率是各道工序合格率的连乘积,所以计算3道工序的平均合格率应采用几何平均数方法。
2.加权几何平均数
适用分组数据,计算公式为:
例4.6假设某投资银行10年期的投资年利率是按复利计算的,年利率的分配情况为:
第1、2年为3%,第3至第5年为5%,第6至第10年为8%。
求平均年利率。
解首先采用加权几何平均数方法计算平均年本利率。
于是,得平均年利率为。
二、位置平均数
位置平均数是根据其在全部数据中所处的位置确定的平均值。
主要有二种形式:
中位数和众数。
(一) 中位数
中位数是将全部数据项按从小到大顺序排列后,处于中间位置的数据值,用表示。
1.未分组数据
计算步骤为:
第一步,将一组数据,,…,按从小到大的顺序排列后,不妨表示为,,…,;
第二步,确定中位数的位次。
式中,为数据的项数;
第三步,确定中位数的数值,计算公式为
(3.7)
例3.7根据表3.1的未分组数据,计算200名职工月销售额的中位数。
解首先将全部数据项按从小到大顺序排列后,得表3.4。
表3.4200名职工月销售额按从小到大顺序排列
单位:
万元
56
98
126
140
154
168
175
189
210
238
56
98
126
140
154
168
175
189
210
238
63
101.5
126
140
157.5
171.5
175
192.5
210
241
66.5
101.5
126
140
157.5
171.5
175
192.5
210
241
70
105
126
140
157.5
171.5
175
196
210
241.5
70
105
129.5
140
161
171.5
175
196
210
245
70
105
133
140
161
175
182
196
210
245
70
105
133
140
161
175
182
196
210
245
77
105
133
140
161
175
182
196
210
245
80.5
105
133
140
164.5
175
182
196
217
245
81
105
133
143.5
168
175
182
203
217
252
84
112
133
147
168
175
182
203
217
259
84
112
136.5
147
168
175
182
203
217
273
87.5
112
136.5
147
168
175
182
203
224
273
87.5
112
136.5
147
168
175
182
206.5
224
273
91
112
136.5
154
168
175
182
206.5
224
280
91
119
136.5
154
168
175
182
206.5
224
280
98
119
136.5
154
168
175
185.5
206.5
224
280
98
122.5
140
154
168
175
189
210
224
308
98
122.5
140
154
168
175
189
210
231
315
因为n=200为偶数,根据公式(3.7),中位数为第100项和第101项数据的算数平均数,
2.分组数据
计算步骤为:
第一步,确定中位数的位次。
式中,各组次数总和;
第二步,确定中位数所在组。
从第一组开始计算累计次数,当累计次数大于时,该组即为中位数所在组;
第三步,确定中位数的数值,计算公式为
(3.8)
式中,—中位数所在组的下限值;
—中位数所在组的次数;
—各组次数总和;
—中位数所在组以前各组的次数之和;
—中位数所在组的组距。
例3.8根据表3.2的分组数据,计算200名职工月销售额的中位数。
解
从第一组开始累计到第4组时,累计职工人数为142人,所以第4组为中位数所在组。
于是中位数为
(二)众数
众数是一组数据中出现次数最多的数据值,用表示。
1.未分组数据
对于未分组数据,直接找出出现次数最多的数据值即可。
例3.9根据表3.1的未分组数据,计算200名职工月销售额的众数。
解首先将全部数据项按从小到大顺序排列后,得表3.4。
从表3.4可以看出,在200名职工中,有20名职工的月销售额为168万元,次数最多,因此这组数据的众数为:
(万元)。
2.分组数据
计算步骤为:
第一步,确定众数所在的组,即在分组数据中出现次数最多的一组为众数组;
第二步,确定众数的数值,计算公式为:
(3.9)
式中,—众数组的下限值;
—众数组的次数与下一组的次数之差;
—众数组的次数与上一组的次数之差;
—众数组的组距。
例3.10根据表3.2的分组数据,计算200名职工月销售额的众数。
解因为第4组的职工人数最多,为60人,所以第4组为众数组。
将有关数据代入公式
(3.9)中,得到众数为
第二节统计数据的散布特征
统计数据的散布特征是对一组数据变异程度和离散趋势的度量,它反映了各数据值远离其中心位置的程度,通常称散布特征的度量为标志变异指标。
常用来表述一组统计数据散布特征的变异指标有:
全距、平均差、方差、标准差和变异系数等。
分析、研究一组统计数据的离散趋势,是衡量一组数据平均指标代表性的重要方法。
一、全距
例3.11根据表3.4,计算200名职工月销售额的全距。
解因为表3.4是职工月销售额按从小到大顺序排列的数据,所以直接得全距为
(万元)。
二、平均差
平均差,也称平均离差,是各个数据值与其平均值的离差绝对值的平均数,用A.D.表示。
(一)未分组数据
计算公式为:
(3.11)
式中,—简单平均差;
—第项的数据值;
—全部数据的算数平均数;
—数据的项数。
例3.12根据表3.1的未分组数据,计算200名职工月销售额的平均差。
解由例3.1得知,
于是200名职工月销售额的平均差为:
(二)分组数据
计算公式为:
(3.12)
式中,—加权平均差;
—第组的数据值或组中值;
—全部数据的算数平均数;
—第组的数据值或组中值出现的次数;
—分组的组数。
例3.13根据表3.2的分组数据,计算200名职工月销售额的平均差。
解按分组数据估计200名职工月销售额的平均差,应采用加权平均差方法,计算过程列表如下:
于是,200名职工月销售额的平均差为:
三、方差和标准差
方差是各个数据值与其平均值离差的平方的平均数;用表示。
标准差是方差的平方根,用表示。
(一)未分组数据
对于未分组数据,方差、标准差的计算公式分别为:
(3.13)
和
(3.14)
式中,和—分别为方差和标准差;
—第项的数据值;
—全部数据的算数平均数;
—数据的项数。
方差的性质
(3.15)
即,方差等于数据平方的平均值减去数据平均值的平方,这一性质常用于简化方差的计算。
例3.14根据表3.1的未分组数据,计算200名职工月销售额的方差和标准差。
解由例3.1得知,,,于是200名职工月销售额的方差为:
标准差为:
(二)分组数据
对于分组数据,方差、标准差的计算公式分别为:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 统计 方法