统计学总结汇编.docx
- 文档编号:29425323
- 上传时间:2023-07-23
- 格式:DOCX
- 页数:22
- 大小:308.52KB
统计学总结汇编.docx
《统计学总结汇编.docx》由会员分享,可在线阅读,更多相关《统计学总结汇编.docx(22页珍藏版)》请在冰豆网上搜索。
统计学总结汇编
二、两大学派的争论:
政治算术学派、国势学派
▪创始人:
威廉·配第(1623-1687年)(英国),他的代表作是《政治算术》(1671年写出,1690年正式出版)。
在这本书里,他用数字、重量和尺度来分析英国、法国、荷兰三国的国情国力,提出了英国社会经济发展的方向。
▪政治算术学派被认为是无统计学之名而有统计学之实。
这是统计学的正统。
▪创始人:
海门尔·康令(1606-1681)(德国)
▪继承者:
阿亨瓦尔(1719-1772)(德国)、斯廖采尔(1735-1809)(德国)
▪他们在德国的大学开设了一门新课程“国势学”,主要讲述有关国情国力的系统知识,包括土地、人口、政治、军事、财政、货币、科学、艺术和宗教等。
但这个学派始终没有把数量对比分析作为这门科学的基本特征。
▪阿亨瓦尔在1749年首先将“国势学”正式命名为“统计学”。
▪“国势学派”有“统计学”之名而无“统计学”之实。
一、统计的涵义
▪2010届大学毕业生截至4月底的签约率为49%,签约月薪平均为2283元。
而签约率较高的主要为工科类专业,包括本科的测绘类、能源动力类、工程力学类,以及高职高专的水利工程与管理类、测绘类等。
从行业来看,当前四成以上的2010届毕业生签约于制造业、电信及电子信息服务业、建筑业三大行业,其中近半就业于上述行业的民企。
▪统计工作:
统计实践(感性的认识)。
统计工作是对社会、经济以及自然现象的总体数量方面进行搜集、整理和分析过程的总称;
▪统计资料:
统计工作的结果。
统计资料是统计工作的成果,即是通过统计工作所取得的各种数字资料及与之相关的其它资料的总称;统计资料也即统计信息,包括人口信息、基本单位信息、固定资产信息、宏观经济信息等,是国家和地区的最基础、最重要的信息资源。
▪统计学:
统计理论(理性的认识)。
统计学是一门系统地论述统计理论和方法的科学;
它们既有区别又有联系:
统计学与统计工作是理论与实践的关系,而统计工作的成果便是统计资料。
三者之间的关系:
统计工作是人们的统计实践,是主观反映客观的认识过程;统计资料是统计工作的结果。
统计工作与统计资料是过程与成果的关系。
统计学是统计工作经验的总结和概括;反之,统计学所阐述的理论和方法又是指导统计工作的原则和方法。
因此,统计学和统计工作之间存在着理论和实践的辨证关系。
三者关系
三、统计的特点
1、数量性
统计学的特点是用大量数字资料说明事物的规模、水平、结构、比例关系、差别程度、普遍程度、发展速度、平均规模和水平、平均发展速度等。
统计研究是密切联系现象的质来研究它的量,并通过量反映现象的质。
所以统计数据总是客观的、具体的、也是最具有说服力的。
2、总体性
统计研究的结论是在对现象进行了大量观察和综合分析之后得出的。
结论只对总体有效,而对个体则不一定是有效的。
统计研究现象总体的数量特征,主要是加强对现象规律的认识.
3、具体性
统计学研究的数量方面是指社会现象的具体的数量方面,而不是抽象的数量关系。
这是统计不同于数学的重要特点。
4、社会性
社会经济统计所研究的数量不是单纯的数量研究,更不是抽象的数字,而是具体的活生生的社会现象。
计学的研究对象是人类社会活动的过程和结果,人类的社会活动都是人们有意识、有目的的活动,各种活动都贯穿着人与人之间的关系。
一、统计工作的基本任务
“统计的基本任务是对国民经济和社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实现统计监督。
”
统计工作的基本任务有两条:
一是服务,二是监督。
三、统计工作过程
就一次统计活动来讲,一个完整的认识过程可分为四个阶段:
▪统计设计:
即根据统计任务和统计对象的特点,对统计工作的各个方面和各个环节进行通盘考虑和安排;
▪统计调查:
即根据统计任务所确定的指标体系,拟订调查纲要,搜集被研究对象的准确材料;主要介绍调查方法
▪统计整理:
就是对调查资料加以汇总综合,使之系统化、条理化;主要介绍统计分组、分配数列、统计图、统计表等
▪统计分析:
就是将加工整理好的统计资料加以分析研究,采用各种分析方法,计算各种分析指标,揭示被研究对象的基本特征和发展的规律性,必要时还要对其未来的发展作出科学的预测,统计分析是统计工作的最后阶段,也是统计发挥信息、咨询和监督职能的关键阶段。
主要介绍综合指标、统计指数、相关与回归分析、动态数列等。
二、标志与指标
▪标志是说明总体单位特征的名称。
品质标志不变标志
标志的分类
数量标志可变标志
▪指标是说明总体的综合数量特征的范畴及其数值。
一个完整的统计指标包括指标名称和指标数值两个部分。
数量指标(总量指标)
指标的相对指标综合指标
分类质量指标平均指标
举例说明标志的概念:
▪概念:
(标志是统计研究的基础)
如全班同学组成一个总体,则每一个同学就是总体单位。
要想说明每一个同学有什么特征,就需要从性别、籍贯、爱好、专业、年龄、身高、体重、视力、学习成绩等方面进行。
那么性别、籍贯、爱好、专业、年龄、身高、体重、视力、学习成绩就是标志。
▪品质标志:
表明总体单位属性方面的特征。
如性别、籍贯、爱好、专业等。
品质标志只能用文字来表示。
▪数量标志:
表明总体单位数量方面的特征。
如年龄、身高、体重、学习成绩等。
数量标志只能用数值来表示。
▪不变标志:
如果一个标志在某个总体的各单位具体表现都是相同的。
则这个标志就是不变标志。
如全班同学的“专业”。
一个统计总体至少要有一个不变标志,不变标志体现统计总体的同质性。
▪可变标志:
在一个总体中,当一个标志在各单位的具体表现不完全相同时,这个标志就是可变标志。
如全班同学的“性别”、“年龄”、“籍贯”等。
一个统计总体必须同时存在可变标志,这种差异性体现总体的差异性。
统计指标的分类:
统计指标按其所反映的总体内容的不同,可分为数量指标与质量指标
数量指标:
反映现象总规模、总水平和工作总量的统计指标。
如:
人口总数、企业总数、工资总额等。
一般用绝对数表示。
质量指标:
反映现象相对水平和工作质量的统计指标。
如:
平均成绩、劳动生产率、出生率等。
一般用平均数或相对数表示。
标志与指标的区别:
名称
说明
对象
表示方式
数值的取得方式
使用的条件
标志
总体单位的属性特征或数量特征
文字或数值
数量标志不一定经过汇总
标志一般不具备时间、地点等条件
指标
总体的数量特征
数值
指标数值是经过一定的汇总取得的
作为一个完整的统计指标,一定要讲时间、地点、范围。
标志与指标的关系:
第一,有许多统计指标的数值是从总体单位的数量标志值汇总而来的。
如:
呼市每一个工业企业的增加值汇总就得到整个呼市工业增加值的数值。
第二,两者存在着一定的变换关系。
(一)、统计调查的意义和要求
●统计数据资料是通过统计调查来搜集的。
●统计调查是调查主体对被调查客体的一种认识活动,是统计工作的第二个阶段。
它是以搜集占有大量的数字资料为主体信息。
●统计调查所搜集的数据资料既包括原始资料又包括次级资料。
●统计调查在整个统计工作过程中担负着提供基础资料的任务,是统计整理和统计分析的基础和前提,所有的统计分析和统计研究都是在进行统计调查搜集原始资料的基础上进行的。
因此,统计调查取得的资料质量直接影响统计工作最终成果的质量。
统计调查的要求:
●准确性:
指统计资料符合实际情况,准确可靠,严格遵守《中华人民共和国统计法》,杜绝任何形式的弄虚作假,统计调查所收集资料的准确性是衡量统计工作质量的重要标志。
可以说准确性是统计工作的生命。
●及时性:
按照统计调查方案中规定的时间完成各项调查资料的收集和上报工作,及时满足各部门对统计资料的需求。
如果做不到及时,一方面会贻误统计整理的时间,使决策机关不能及时得到所需信息。
另一方面落后于事物发展的统计资料即便准确、完整也没有多大的现实价值。
●全面性:
根据统计调查的目的,对统计调查单位的资料,不重复不遗漏的进行搜集。
如果收集的资料残缺不全,就不能反映调查对象的全貌,就会给统计整理和统计分析带来困难,从而直接影响统计工作的质量。
●效益性:
整个统计工作都应注重效益,争取以最少的投入获得最大的产出。
在统计调查的各个环节都应该测算其成本费用。
在保证质量的前提下尽可能的降低成本费用
三种非全面调查的比较。
调查的种类
确定调查单位的方法
调查的目的
重点调查
重点单位在全部单位中只是很小一部分,但它们的标志值在标志总量中却占绝大的比重。
(客观性)
重点单位的标志值较大的全部单位的标志总量比重(定量调查)
只是要求掌握总体的基本情况。
典型调查
在对所研究的对象进行初步分析的基础上,有意识地确定最具有代表性的单位。
(主观性、定性调查)
了解新生事物的发展趋势和规律。
抽样调查
按照随机原则从调查对象中抽取一部分单位作为样本。
根据样本的数据对总体做出具有一定可靠程度的推算。
一、统计数据的分组
1、概念
根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把数据分别列入不同的组内。
☐“分”:
就是把同一总体中性质不同的总体单位分配到不同的组里,突出组与组之间的差异性。
☐“组”:
就是把同一总体中性质相同的总体单位归并到同一组里,突出组内的同质性。
2、原则:
尽原则互斥原则
☐穷尽原则:
就是使总体中的每一个单位都应有组可归。
☐互斥原则:
就是使总体中的任何一个单位只能归属于某一个组,而不能同时或可能归属于几个组。
统计分组的重要性和作用:
保证调查资料质量的前提下,统计分组的正确与否,是决定整个统计研究成败的关键。
分组标志的选择原则:
根据统计研究的目的和要求来选择分组标志在若干标志中选择最重要的标志作为分组标志根据社会经济现象所处的具体历史条件选择分组标志
3、种类
按分组标志的多少不同:
单分组\复合分组
按分组标志的性质不同:
质标志分组\数量标志分组
3、统计分组中的几个概念
Ø上限、下限、组距、组中值、全距、开口组、闭口组
☐组限上限:
一组中的较大值。
☐下限:
一组中的较小值
组距=本组上限-本组下限
组中值=(上限+下限)/2
☐全距(R)=数列中的最大值—最小值
☐组数=全距/组距
开口组与闭口组:
开口组:
缺少上限或下限的组。
如:
60分以下;60—70;…80—90;90分以上。
闭口组:
上、下限都齐备的组。
如:
70—80分;500—600公斤;90—100岁
1、组数的多少与组距的大小有关。
在全距一定时,组距大,组数就少;组距小,组数就多。
2、组距的确定要根据事物的数量特征来确定。
组距如果过大,就会使性质不同的单位归并到了同一组里(破坏了组内的同质性);组距过小,就会使同一性质的单位分到了不同的组里(破坏了组与组之间的差异性)。
3、决定组数的多少,并无规则可循,必须凭借经验和对研究对象的认识作出判断。
有一个经验公式可供大家参考:
【美国学者斯特杰斯创用】
n=1+3.3lgN
n:
组数N:
总体单位数
☐开口组如何计算组中值:
✓缺少上限:
1、计算假定上限:
假定上限=下限+相邻组的组距如:
假定上限=90+10=100(分);
2、计算组中值:
组中值=(90+100)÷2=95(分)
✓缺少下限:
1、计算假定下限:
假定下限=上限-相邻组的组距如:
假定下限=60-10=50(分);
2、计算组中值:
组中值=(50+60)÷2=55(分)
一、众数的特点
1.一组数据中出现次数最多的变量值
2.适合于数据量较多时使用
3.不受极端值的影响
4.一组数据可能没有众数或有几个众数
5.在组距数列中,当变量数列不等距分组时,众数的位置不好确定。
①只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。
若有两个次数相等的众数,则称复众数。
②在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。
众数(不惟一性)无众数一个众数多于一个众数
算术平均数的特点
算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中点不易确定,使的代表性也不很可靠。
调和平均数的特点
如果数列中有一标志值等于零,则无法计算;
它作为一种数值平均数,受所有标志值的影响,它受极小值的影响大于受极大值的影响,但较之算术平均数,受极端值的影响要小。
几何平均数的特点
如果数列中有一个标志值等于零或负值,就无法计算;受极端值的影响较和小,故比较稳健;几何平均数的适用范围较小,主要适用于比率平均和速度平均,即计算平均发展速度,进行时间数列分析等。
.中位数的特点
①中位数不受极端值及开口组的影响,具有稳健性。
②各单位标志值与中位数离差的绝对值之和是个最小值。
③对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般水平。
众数、中位数和均值的比较
众数、中位数和算术平均数之间有着一定的关系,这种关系决定于总体次数分布的状况。
当次数分布呈对称的钟形分布时,算术平均数位于次数分布曲线的对称点上,而该点又是曲线的最高点和中心点,因此众数、中位数和算术平均数三者相等。
当次数分布呈非对称的钟形分布时,由于这三种平均数受极端值影响程度的不同,因而它们的数值就存在一定的差别,但三者之间任然有一定的关系。
如下图所示:
众数、中位数、均值的特点和应用
1.众数:
极端值影响;不惟一性;据分布偏斜程度较大时应用
2.中位数:
不受极端值影响;据分布偏斜程度较大时应用
3.均值:
易受极端值影响;学性质优良;据对称分布或接近对称分布时应用
四分位差的特点
①四分位差不受两端各25%数值的影响,能对开口组数列的差异程度进行测定;
②用四分位差可以衡量中位数的代表性高低;
③四分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一半的离差,所以也是一个比较粗略的指标。
平均差的特点
1、均差是根据全部标志值与平均数离差而计算出的变异指标,能全面反映标志值的差异程度;
2、平均差计算有绝对值符号,不适合代数方法的演算使其应用受到限制。
3、利用平均差来判断哪一个更有代表性,在平均数相同的情况下,平均差越大,代表性则越小;平均差越小,说明代表性越强。
标准差的特点:
标准差也是根据全部变量值计算出来的,所以对整个变量值的离散趋势有充分的代表性。
用标准差来判断时,该方法是在平均数相同的情况下,标准差越大,代表性越小;标准差越小,代表性越强。
如果两者平均数不相同,就不能用标准差来衡量。
五、影响抽样误差大小的因素是:
Ø总体被研究标志的变异程度。
在其他条件不变的情况下,总体标志的变异程度愈小,则抽样误差也愈小;总体标志的变异程度愈大,则抽样误差也愈大。
Ø违反随机性原则。
在抽取样本单位时,由于违反随机性原则,致使所得到的样本的分布结构与总体不一致,从而导致样本指标与总体指标之间产生差异。
Ø抽样单位数的多少。
在其他条件不变的情况下,抽样单位数愈多,抽样误差愈小;抽样单位数愈少,抽样误差愈大。
Ø抽样的方法。
在其他条件不变的情况下,重复抽样的抽样误差大于不重复抽样。
Ø抽样的组织形式。
一、动态数列的概念
动态数列又称时间数列。
它是将某种统计指标,在不同时间上的不同数值,按时间先后顺序排列起来,以便于研究其发展变化的水平和速度,并以此来预测未来的一种统计方法。
①时间,即现象所属的时间;
②不同时间上的统计指标数值,即不同时间上该现象的发展水平。
二、动态数列的种类
动态数列按照所列入指标数值的不同可分为:
时期数列特点:
数列中各个指标值是可加的;数列中每个指标值的大小随着时期的长短而变动;数列中每个指标值通常是通过连续不断的登记而取得。
时点数列特点:
数列中各个指标值是不能相加的;数列中每个指标值的大小与时间间隔的长短没有直接关系;数列中每个指标值通常是按期登记一次取得的。
它是由一系列同类相对指标数值按时间顺序排列的时间数列,用来说明现象之间的数量对比关系或相互联系的发展变化过程。
相对数时间数列是由同一时间上的两个不同指标值相比得出。
在相对数时间数列中,各个指标数值不能直接相加。
例如,把各个时期的某一产品产量实际完成数与相应的计划数对比,得出计划完成进度的时间数列等。
平均指标时间数列:
又称平均数时间数列。
它是由一系列同类平均指标数值按时间顺序排列的时间数列。
它反映社会经济现象总体各单位某一标志一般水平的发展变动趋势。
三、动态数列的编制原则
基本原则是遵守其可比性。
具体说有以下几点:
注意时间的长短应统一;总体范围应该一致;指标的经济内容应该相同;指标的计算方法和计量单位应该一致。
一、相关关系的概念(注意相关关系与函数关系的区别)
(一)函数关系
它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。
例如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。
(二)相关关系
它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:
1.现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;
2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。
商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。
在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。
二、相关关系的种类
1.按相关关系涉及的因素多少来分,可分为:
单相关和复相关。
二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。
三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。
在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。
2.按相关关系的性质来分,可分为:
正相关和负相关
正相关是指两相关现象变化的方向是一致的。
负相关是指两相关现象变化的方向是相反的。
3.按相关关系的形式来分,可分为:
直线相关和曲线相关
直线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。
直线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。
曲线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。
4.按相关程度分,可分为:
完全相关、不完全相关和不相关
完全相关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。
不相关是指两现象之间在数量上的变化上各自独立,互不影响。
不完全相关就是介于完全相关和不相关之间的一种相关关系。
相关分析的对象主要是不完全相关关系。
二、相关系数
相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。
一般用符号r表示。
r的测定方法:
若相关系数是根据总体全部数据计算的,称为总体相关系数;若是根据样本数据计算的,则称为样本相关系数.样本相关系数的计算公式为:
为了根据原始数据计算样本相关系数,可将其简化得到下面的计算公式
第二节总指数的编制方法
计算
(1)各种商品的价格指数和销售量指数。
(2)全部商品的价格指数和销售量指数。
一、综合指数的编制原理
二、综合指数的主要形式
1、拉氏指数(同度量因素固定在基期)
2、帕式指数(同度量因素固定在报告期)
3、拉氏指数与帕氏指数的比较
(1)由于拉式指数和帕式指数各自选取的同度量因素不同,即使利用同样的资料编制指数,两者计算的结果一般也会存在差异。
(2)拉式指数和帕式指数具有不完全相同的经济分析意义。
如何选择,关键要看我们利用有关数据具体要说明什么样的问题。
通常的做法是,对质量指标指数采用帕式指数,对数量指标指数采用拉式指数。
4、综合指数的其他类型
(1)马歇尔—埃奇沃斯指数(马埃公式)
是对拉氏指数和帕氏指数的权数(同度量因素)进行平均(权交叉)的结果。
(2)理想公式(费雪公式)
是对拉氏指数和帕氏指数所求的几何平均数。
(3)鲍莱公式
是对拉氏指数和帕氏指数求简单算术平均数。
(4)扬格指数(固定加权综合指数)
三、平均指数的编制原理
1.以某一时期的总量为权数对个体指数加权平均
2.权数通常是两个变量的乘积
▪可以是价值总量:
如商品销售额、工业总产值
▪可以是其他总量:
•如农产品总产量(单位面积产量与收获面积的乘积)
3.基本形式
四、平均指数的主要形式
1、加权算术平均指数
——适用于数量指标综合指数的变形
2、加权调和平均指数
——适用于质量指标综合指数的变形
2、固定权数的平均指数
固定权数(可根据有关的普查、抽样调查或全面统计报表资料调整计算确定),∑w=100
固定权数的平均指数
特点
❑权数资料一经确定,可在相对较长时间内使用,能减少工作量;
❑在不同时期内采用同样权数,可比性强,有利于指数数列的编制。
应用
我国的商品零售价格指数、农副产品收购价格指数、职工生活费指数(居民消费指数)及西方的工业生产指数、消费品价格指数等等,均采用了固定权数的平均指数的编制方法。
三、平均指数的应用:
Ø消费者价格指数(CPI):
是综合反映各种消费品价格变动程度的重要经济指数。
是政府制定物价政策和工资政策的重要依据。
Ø农副产品收购价格指数:
是反映各种农副产品收购价格的综合变动程度,由此可以考察收购价格变化对农业生产者收入和商业部门支出的影响。
我国的消费者价格指数是采用固定加权算术平均指数方法编制:
Ø将各种居民消费划分为八大类,下面再划分为若干中类和小类;
Ø从各类消费品中选择325种代表品入编指数,计算个体价格指数;
Ø依据有关时期内各种商品的销售额构成确定代表品的比重权数;
Ø按从低到高的顺序,采用固定加权算术平均公式,依次编制小类、中类的消费价格指数和消费价格总指数:
Ip是个体价格指数;ω/∑ω是固定权数。
类别及品名
规格
等级
计量
单位
平均价格(元)
指数(%)
权数
指数×权数
基期
报告期
总指数
—
—
—
—
102.68
100
—
一、食品类
—
—
—
—
104.15
42
43.743
二、衣着类
—
—
—
—
95.46
15
14.319
三、家庭设备及用品
—
—
—
—
102.70
11
11.297
四、医疗保健
—
—
—
—
110.43
3
3.313
五、交通和通讯工具
—
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 总结 汇编