统计学Word下载.docx
- 文档编号:15737736
- 上传时间:2022-11-15
- 格式:DOCX
- 页数:19
- 大小:149.15KB
统计学Word下载.docx
《统计学Word下载.docx》由会员分享,可在线阅读,更多相关《统计学Word下载.docx(19页珍藏版)》请在冰豆网上搜索。
又分为:
①单项式变量数列:
用一个数值代表一个组形成的数列。
②组距式变量数列:
用变量值变动的一定范围来代表一个组
所形成的数列。
3、组距式变量数列中的几个基本概念
(1)组限:
表示各组界限的变量值。
大的叫上限,小的叫下限。
(2)组距:
各组上下限之间的距离。
组距=上限-下限
(3)等距数列:
各组组距均相等的数列。
异距数列:
各组组距不完全相等的数列。
(4)组中值:
上下限之间中点的值。
组中值=(上限+下限)/2=上限-组距/2=下限+组距/2
“×
×
以上”、“×
以下”这样的组叫开口组。
一般假定开口组的组距与其相邻组的组距相等。
其组中值计算如下:
缺下限最小组的组中值=上限-相邻组组距/2
缺上限最大组的组中值=下限+相邻组组距/2
见第43页的表2.15、第33页的表2.12
注意:
在组距式变量数列中,由于不知道各组中具体有哪些变量值,所以通常用各组的组中值来代表该组中的各个变量值。
(5)全距:
全体数据中最大标志值与最小标志值之差。
(6)累计次数:
向上累计:
从表的下方向表的上方依次对各组次数累计相加。
向下累计:
从表的上方向表的下方依次对各组次数累计相加。
见第24页的表2.10
二、组距式变量数列的编制(以等距数列为例)
步骤:
(以第22页的【例2.1】为例)
1、排序2、确定组距
(1)组距最好是5、10的倍数。
(2)组距要不断地试,直到表现出次数分布特征为止。
3、确定组限注意:
(1)组限最好是5、10的倍数;
(2)最小组的下限应比最小的变量值略小;
最大组的上限应比最大的变量值略大。
(3)相邻组的组限应重合。
4、统计汇总
注意:
应坚持“上限不在组内”的原则。
四、次数分布曲线图的绘制
(一)直方图(等距数列)
第一、在横轴上描出各组组限;
在纵轴上描出各组频数(或频率);
第二,以各组组距为宽度,以各组频数(或频率)为高度绘出一组矩形。
(三)次数分布的类型
1、钟形分布。
越靠近变量值中点的变量值,其次数越多。
(1)对称分布:
以变量值的中点为对称轴的对称分布。
(2)偏态分布
①左偏分布;
②右偏分布
2、U形分布(又称生命曲线或浴盆曲线)
越靠近变量值中点的变量值,其次数越少。
3、J形分布
①正J形分布:
随着变量值的增加,次数不断地增加。
②反J形分布:
随着变量值的增加,次数不断地减少。
第1、20世纪初美国经济学家、统计学家洛伦茨(M.E.Lorentz)根据意大利经济学家巴雷特(V.Pareto)提出的收入分配公式绘制而成。
2、描述收入和财富分配性质
的曲线分析该国家或地区
分配的平均程度。
五节洛伦次曲线与基尼系数
基尼系数
1、20世纪初意大利经济学家基尼(G.Gini)根据洛伦茨曲线给出了衡量收入分配平均程度的指标。
2、A表示实际收入曲线与绝对平均线之间的面积。
3、B表示实际收入曲线与绝对不平均线之间的面积。
4、如果A=0,则基尼系数=0,表示收入绝对平均。
5、如果B=0,则基尼系数=1,表示收入绝对不平均。
6、基尼系数在0和1之间取值。
7、一般认为,基尼系数若小于0.2,表明分配平均;
基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;
基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。
第2章数据分布特征的描述
(2)
二、中位数(Me)
(一)概念
中位数是一组数据排序后,处于中间位置上的变量值。
如一组数:
x1、x2、x3、…、xn
(二)中位数的确定
(1)对于未分组数据
步骤:
第一,对数据排序。
第二,找出中位数所在的位置,该位置上的变量值就是中位数。
当n为奇数时,中位数就是第(n+1)/2位置上的变量值;
当n为偶数时,中位数就是中间位置上两个变量值相加除以2。
见第30页的例题
(2)对于单项式变量数列
标志值x
次数f
向下累计次数Z
x1
x2
x3
x4
.
.
xn
f1
f2
f3
f4
fn
Z1
Z2
Z3:
中位数所在组
Z4
Zn
合计
∑f
—
第一,计算出向下累计次数。
第二,在累计次数中找出所在的组,该组即为
中位数所在的组。
(累计次数表示一个范围)
第三,与该组相对应的变量值即为中位数。
3)对于组距式变量数列
分组
向下累计
向上累计
x1—x2
x2—x3
x3—x4
x4—x5
xn-1—xn
f3(fm)
Z2(Sm-1)
Z3
Tn
Tn-1
Tn-2
Tn-3
·
T1
第二,在累计次数中找出所在的组,该组即为中
位数所在的组。
(累计次数表示一个范围)
第三,采用公式进行计算。
见第31页的例题
众数和中位数是根据变量值在一组数中的位置来确定的,故称它们为位置平均数,它们不受极端值的影响。
四、均值(算术平均数,)
(一)简单算术平均数
当掌握的资料是未分组资料时,就计算简单算术平均数。
如一组数:
x1、x2、x3、…、xn。
则其算术平均数为;
二)加权算术平均数
当掌握的资料是分组资料时,就计算加权算术平均数。
1、
单项式变量数列
分析:
①f与之间的关系。
f越大,越靠近该组的变量值,f越小,越远离该组的变量值,说明f对起一个权衡轻重的作用,故f叫权数。
因为,所以就权数的实质而言,f是通过其相对数形式来起作用的,所以,叫权重系数。
标志值x
标志总量xf
比重f/∑f
x1f1
x2f2
x3f3
xnfn
f1/∑f
f2/∑f
f3/∑f
fn/∑f
∑xf
1
五几何平均数(G
1、概念
n个变量值(一般是比率值)连乘积的n次方根。
几何平均数的适用条件:
当各变量值的总量等于各变量的乘积,而不相加时,对这些变量值求平均数,就应采用几何平均法,如求平均发展速度、平均合格率等。
2、几何平均数的计算
(1)简单几何平均数(未分组的资料)
见第35页的例题
(2)加权几何平均数(分组资料)
七、几种平均数的关系
对称分布:
左偏分布:
右偏分布:
总结:
1、中位数在一般情况下,始终居于算术平均数和众数之间,算术平均数和众数分布在中位数两侧,众数以曲线最高点来定,算术平均数的位置根据极端值的种类来定。
2、可以根据三者之间的大小关系来判断该组数呈何种分布。
第二节数据分布离散程度的测度
三、方差和标准差
各变量值与其算术平均数离差平方的算术平均数叫方差;
方差的方根就是标准差。
由于标准差与变量值的单位相同,其实际意义要比方差清楚,因此在对社会经济现象进行分析时,更多使用标准差。
二)计算
1、总体方差(σ2)和总体标准差(σ)
(1)总体方差(σ2)
①对于未分组资料
②对于分组数据(组距式变量数列要先计算出各组组中值来作为各组的变量值X)
(2)总体标准差(σ)
①对于未分组资料②对于分组数据:
2、样本方差()和样本标准差()
(1)样本方差
①对于未分组资料:
②对于分组数据(组距式变量数列要先计算出各组组中值来作为各组的变量值X)
样本的方差和标准差为什么要除以样本次数减1,请见教材的解释。
2)样本标准差
①对于未分组资料:
②对于分组数据:
见第42页的例题
根据分组资料计算标准差的步骤:
第一、若是组距式变量数列,应先计算出各组组中值;
第二、计算算术平均数;
第三、计算各组标志值与其算术平均数的离差;
第四、取离差的平方;
第五、计算各组离差平方与该组次数的乘积;
第六、代入公式计算。
1、当样本的次数n很大(一般是大于等于30时),样本方差与总体方差的计算结果相差很小,这时样本方差也可以用总体方差来计算。
2、标准差(方差)是通过各变量值到其算术平均数的平均距离来反映该组中各数据之间的差异程度的。
四、离散系数
全距和标准差的共同特点:
1、它们都是有单位的数,其单位与变量值的单位相同。
2、它们都能较好地反映一组数的离散程度,但要比较多组数的离散程度时,要求这几组数的计量单位和平均数都必须相等。
要比较几组平均水平或计量单位不同的数据的离散程度时,不能通过计算以上各指标来比较,而应该计算各组的离散系数来比较。
离散系数:
某组数的标准差除以该组数的算术平均数。
计算出各组离散系数后,离散系数大的组差异程度大;
离散系数小的组差异程度小。
三)编制统计表时应注意的问题
总体上看:
科学、实用、简练、美观
具体来说:
1文字要简练,应使统计表的横竖长度比例适当(10:
7)。
2如果全表只有一个单位,就写在表的右上方。
若各指标的计量单位不同,则应放在每个指标后(纵栏标题的单位)或单独列出一列(横行标题的单位)标明。
3表的上下线要用粗线或双线画出,中间用细线。
左右两端不能画纵线封口。
列与列之间要用竖线画出,行与行之间尽可能不用横线。
4表中数据一般右对齐,有小数点的以小数点对齐,小数的位数应统一。
对于没有数据的用“—”表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学
![提示](https://static.bdocx.com/images/bang_tan.gif)