统计学原理复习提纲.docx
- 文档编号:29068610
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:20
- 大小:93.84KB
统计学原理复习提纲.docx
《统计学原理复习提纲.docx》由会员分享,可在线阅读,更多相关《统计学原理复习提纲.docx(20页珍藏版)》请在冰豆网上搜索。
统计学原理复习提纲
统计学原理复习提纲
(复习总要求:
结合每章节后客观题和作为作业布置的计算题)
第一章绪论
主要内容:
1、统计的三个含义及其之间的关系。
P5
三个含义:
统计工作(活动)、统计资料、统计学
三者关系:
统计工作(活动),即统计实践活动,是基础;
统计工作的成果是统计资料,统计资料是统计实践活动的产物。
统计学是统计实践经验的理论概括和科学总结,它来源于统计实践,又高于统计实践,反过来指导统计实践。
2、统计学研究的对象:
大量社会经济现象总体的数量方面(数量特征和数量关系)
统计学的特点:
1、数量性2、总体性3、具体性4、社会性
3、统计的作用(功能):
1、信息功能2、咨询功能3、监督功能
4、统计研究的理论基础、基本方法与工作过程。
统计研究的理论基础:
哲学唯物辩证法、社会经济学、数学
统计研究的基本方法:
大量观察法、分组法、综合指标法、归纳推断法及其他相关的方法
统计工作过程P10-11:
(统计任务、统计设计)统计调查、统计整理、统计分析(统计信息管理),三个阶段并不是孤立的、而是紧密联系的一个整体,其中各环节常常是交叉进行的。
重点掌握内容:
(能联系实际进行判断)
5、统计学的几个基本概念:
P11-16
(1)总体与总体单位。
统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并在某一相同性质基础上结合起来的许多个别单位的整体。
简称总体。
总体特点:
同质性、大量性、变异性(或差异性)
构成总体的这些个别单位称为总体单位。
总体可分为有限总体/无限总体
总体与总体单位具有相对性,随着研究任务的改变而改变
(2)标志与指标。
标志是说明总体单位特征的名称。
分为品质标志、数量标志。
指标(统计指标)是说明现象总体量的特征的概念。
特点:
数量性、综合性、具体性。
数量指标反映现象发展的总规模、总水平—总量指标
质量指标反映现象发展的相对水平、工作质量—相对指标、平均指标
指标和标志既有区别又有联系,两者的区别是:
第一,指标是说明总体特征的,而标志是说明总体单位特征的;第二,指标都是可量的,而标志不一定是可量的。
标志则有两种,一种是数量标志,另一种是品质标志,其表现是概念或文字说明。
两者的联系是:
第一,统计指标的数值来源于标志,没有标志就没有指标;第二,指标与标志如同总体与总体单位一样可以相互转化。
(3)变异、变量和变量值。
变异:
一般意义上为可变标志在总体各单位具体表现上的差别。
包括质(性质、属性)的变异和量(数值)的变异。
严格上仅指品质标志的不同具体表现。
变量:
可变的数量标志。
变量值:
变量的数值表现。
按变量值是否连续可分为连续变量和离散变量。
第二章统计调查
统计调查
主要内容:
1、统计调查的概念、重要性、两个基本要求。
P19-20
统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。
统计调查重要性:
认识社会的基本方式、是统计工作中的基础环节、统计调查理论和方法在统计学原理中占有重要地位。
统计调查两个基本要求:
准确性、及时性
2、统计调查方案设计:
六项基本内容P21-29
(1)确定调查目的
(2)确定调查对象和调查单位
调查对象:
需要进行研究的总体。
调查单位:
所要研究的总体单位,即所要登记的标志的承担者。
填报单位:
负责上报调查资料的单位。
(联系实际注意三者的区别)
(3)确定调查项目
调查表:
一览表、单一表
调查问卷:
结构(封面信、指导语、问题与答案—主体、编码等)
(4)确定调查时间和调查期限(注意二者区别)
调查时间:
调查资料所属时期或时点
调查期限:
调查工作开展的起止时间
(5)选择调查方法
(6)调查工作的组织实施计划
3、统计调查的组织形式P30-36
按调查对象范围不同,分为全面调查和非全面调查
按组织形式,分为统计报表制度和专门调查
按登记事物的连续性分类,分为经常调查和一次性调查
重点掌握以下具体调查方法:
(选取调查单位的方法不同)
(注意其区别,联系实际进行方法选择)
普查:
专门组织的一次性的全面调查。
人口普查经济普查
统计报表制度:
按照国家或上级部门统一规定的表式、统一的指标项目、统一的报送程序和报送时间,自上而下逐级提供基本统计资料的一种调查方式。
抽样调查:
按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。
为非全面调查。
其特点见“第五章抽样推断”,共4点
重点调查:
在调查总体中选择部分重点调查单位搜集统计资料的非全面调查。
重点单位指这些单位在全部总体中虽然数目不多,所占比重不大,但就调查的标志值来说却在总量中占很大的比重。
典型调查:
在调查对象中有意识地选取若干具有典型意义的或有代表性的单位进行非全面调查。
各种调查组织形式不是完全孤立的,是互为补充、相互交叉使用的。
第三章统计整理
主要内容P37-45
1、统计分组概念:
根据统计研究的需要,将统计总体按照一定的标志区分为若干个类型组的一种统计方法。
统计分组目的:
实现组内同质性、组间差异性
统计分组种类:
(1)按任务和作用不同分为类型分组、结构分组、分析分组
①划分社会经济现象的类型类型分组
②揭示现象总体内部的构成情况结构分组
③分析现象间的相互依存关系分析分组
类型分组与结构分组较难界定,三者之间不是彼此孤立的,而是相辅相成、相互补充的。
(2)按分组标志的性质分为:
品质分组
变量分组(单项式分组、组距式分组—等距分组/异距分组开口组/闭口组)
(离散型变量、连续型变量对应的分组)
(3)按分组标志的多少分为简单分组、复合分组、分组体系
以上第二类按分组标志性质分组能根据实际进行判断
(统计分组的关键:
分组标志选择、组距和组数、正确划分各组界限,
其中最关键:
分组标志选择)
分组标志的选择:
注意三点:
(1)根据研究问题的目的来选择
(2)要选择最能反映被研究现象本质特征的标志作为分组标志
(3)要结合现象所处的具体历史条件或经济条件来选择
遵循原则:
穷尽性互斥性
2、分配数列P46-57
概念:
在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布。
分配数列编制、频率计算、直方图绘制、组中值计算(重点掌握)
其中关键点:
(1)连续变量分组,“上限不在内原则”,如50~60,60~70,则60为60~70组)
(2)分配数列中,各组频率之和=1
(3)累计(次数)频率分布:
它表明总体在某一标志值的某一水平上下总共包含的次数和频率
向上累计(以下累计、较小制累计):
上限以下的单位数(比重)
向下累计(以上累计、较大制累计):
下限以上的单位数(比重)
(4)组中值计算:
3、统计表P57-62
(1)概念:
把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表。
注:
统计表既是调查整理的工具,又是分析研究的工具。
广义的统计表贯穿在统计工作的各个阶段中。
(2)统计表结构:
总标题、分标题(横行标题、纵栏标题)、纵横栏组成的本身及表中的数字
(3)统计表种类:
(从主词上分类)根据分组情况的不同,分简单表、分组表、复合表
(4)宾词指标的设计:
简单设计(平等配置一一排列);复合设计(层叠配置分层排列)
第四章综合指标
1、总量指标
总量指标是反映现象总体规模或水平的统计指标。
是计算相对指标、平均指标及各种分析指标的基础指标。
分类:
按说明总体内容不同,分总体单位总量和总体标志总量
按反映的时间状况不同,分为时期指标和时点指标
按其采用的计量单位不同,分为实物指标、价值指标和劳动指标
(能根据实例判断总量指标类型,特别是时期指标和时点指标):
如人口数、商品库存额、国内生产总值、商品销售额等)
2、相对指标(6类)(能联系实际进行判断)
结构相对指标定义、计算公式、作用P78总体部分数值/总体全部数值×100%
比例相对指标定义、计算公式、作用P79总体中某部分数值/总体中另一部分数值
比较相对指标定义、计算公式、作用P80
某条件下的某类指标数值/另一条件下的同类指标数值×100%
强度相对指标定义、计算公式、作用P81
某一总量指标数值/另一有联系而性质不同的总量指标数值
动态相对指标定义、计算公式、作用P82报告期水平/基期水平×100%
(注意:
强度相对指标与平均指标的区别)
计划完成程度相对指标定义、计算公式、P75实际完成数/计划数×100%
根据数量指标计算;根据相对指标计算(本年计划数比上年实际数提高或降低多少);根据平均指标计算P74例子
(了解)计划完成程度相对指标用来进行计划执行进度的考核;长期计划检查(水平法、累计法)
3、平均指标
定义:
P85说明同质总体内某一数量标志在一定条件下一般水平的综合指标。
特点:
P85
(1)将数量标志抽象化
(2)只能就同类现象计算
(3)能反映总体变量值的集中趋势
作用:
P85-86
计算:
(1)算术平均数简单算术平均数P87、加权算术平均数P89
(2)调和平均数简单调和平均数P93、加权调和平均数P93
(3)几何平均数简单几何平均数P96、加权几何平均数P98
(4)众数P100(只掌握单项数列):
出现次数最多的标志值
(5)中位数P103-104(只掌握未分组资料、单项数列):
各单位标志值按大小顺序排列,居于中间位置的标志值
奇数项:
偶数项:
(重点掌握以上平均指标的定义、计算公式及应用P87-106)
平均数、中位数、众数关系:
对称分布
左偏分布:
右偏分布:
4、变异指标(标志变动度)
概念:
是指总体中各单位标志值差别大小的程度,又称离散程度或离中程度。
作用:
(1)反映各单位标志值分布的离中趋势
(2)说明平均指标对总体的代表性程度
(3)说明现象变动的均匀性或稳定性程度
(1)全距:
P112
(2)四分位差:
P113
(3)平均差:
P115概念、计算公式
(4)(重点掌握)P117标准差:
是测度数据离散程度最重要和最常用的指标。
是各单位标志值与其算术平均数的离差平方的算术平均数的平方根,又称“均方差”。
计算公式:
简化公式:
(5)P121离散系数:
又称标志变动系数,反映总体各单位标志值的相对离散程度。
常用标准差与算术平均数对比的离散系数(标准差系数)
标准差系数的计算公式、代表意义
(结合作业、书P126三计算题:
第3、4、5、10、11题(判断计算),第8、13题(计算大题))
第五章抽样调查(抽样推断)
1、抽样调查概念、特点、作用P241-244
概念:
按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。
特点:
(1)只抽取总体中的一部分进行调查
(2)用一部分单位的指标数值去推断总体的指标数值
(3)抽选部分单位时要遵循随机原则
(4)抽样误差可以事先计算并控制
2、抽样调查的几个基本概念P244-247
(1)全及总体(总体)抽样总体(样本)
(2)指标(含义、计算公式)
平均数成数方差标准差
全及指标(参数):
抽样指标(统计量):
(全及总体唯一确定,其统计指标也是唯一确定的;样本是不确定的,其统计指标也是不确定的;)
(3)重复抽样和不重复抽样
(4)样本容量和样本个数(样本可能数目)
3、抽样误差
抽样误差(随机误差)概念:
指由于抽样的随机性而产生的那一部分代表性误差,不包括登记误差,也不包括可能发生的偏差。
误差分类:
(1)登记性误差
(2)代表性误差:
偏差
随机误差(实际误差、抽样平均误差)
4、抽样平均误差概念、影响其大小的因素、意义、计算公式P253-255:
概念:
抽样平均误差是指所有可能出现的样本指标的标准差,也可以说是所有可能出现的样本指标和总体指标的平均离差。
影响其大小的因素:
总体各单位标志值的变异程度、样本容量、抽样方法、抽样组织方式
抽样平均误差计算公式:
(常用公式,结合实际作判断)
平均数的抽样平均误差计算公式:
重复抽样情况下:
不重复抽样情况下:
成数的抽样平均误差计算公式:
重复抽样情况下:
不重复抽样情况下:
5、抽样极限误差(置信区间)
概念:
根据概率理论,以一定的可靠程度保证抽样误差不超过某一给定的范围。
(在进行抽样估计时,应该根据所研究对象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算是有效的。
它等于样本指标中允许变动的上限或下限与总体指标之差的绝对值。
)
6、抽样误差的概率度(可信程度、置信度)
基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。
概率度t即为抽样极限误差与抽样平均误差之比的倍数。
数理统计证明:
概率是概率度的函数P=F(t)(正态分布曲线\正态分布概率表)
7、抽样推断P264-266
抽样推断概念:
指按已经抽定的的样本指标(样本平均数或样本成数)来估计总体指标(总体平均数或总体成数),或其所在的区间范围。
优良估计的三个要求:
无偏性、一致性、有效性
抽样推断方法:
点估计区间估计(计算)
点估计:
直接换算法修正分数法
区间估计:
(1)根据给定的置信度要求推算抽样极限误差的可能范围
(2)根据给定的抽样误差范围,求概率保证程度。
(重在计算)
8、必要抽样单位数的确定-意义、原则、计算P300-304
计算(只针对简单随机抽样):
简单随机重复抽样平均指标:
简单随机重复抽样成数指标:
简单随机不重复抽样平均指标:
简单随机不重复抽样成数指标:
(7、8部分计算结合作业书P322-323第1、2、4题计算)
第六章相关分析
1、相关关系与函数关系,二者概念、区别与联系P333-334(联系实际进行判断)
2、相关关系的种类:
P334-335
从涉及因素多少划分:
单相关(两个变量的相关关系)、复相关
从表现形态来划分:
直线相关、曲线相关
从相关变化的方向来划分:
正相关、负相关
从相关的程度来划分:
完全相关、不完全相关和无相关
3、相关分析的主要内容:
P336-337
(1)确定现象之间有无关系,以及相关关系的表现形式
先作定性分析(相关分析的基础)
(2)确定相关关系的密切程度——相关分析
根据自变量、因变量数据资料编制成散布图或相关表,计算相关系数
(3)选择合适的数学模型——回归分析
确定了现象间确实有相关关系和密切程度后,就要选择合适的数学模型,对变量之间的联系给予近似描述
(4)测定变量估计值的可靠程度
运用配合的模型测定因变量的估计值,将估计值与实际值对比,如果差别小,说明估计得准确,反之,则不够准确。
可靠程度用估计标准误差来衡量。
(5)对计算出的相关系数,进行显著检验。
4、简单线性相关分析:
(相关系数的计算)
相关系数:
反映两个变量线性相关密切程度的指标。
它是由x与y之间协方差同x、y各自标准差之比来确定的。
相关系数计算公式:
P341-343(根据已有的资料选用适当的计算公式)
(重点掌握总量公式)
相关系数密切程度的判定:
P343(结合实例判断)
-1≤r≤1(正号表示正相关、负号表示负相关;越接近1表示相关关系越强、越接近0表示相关关系越弱。
)
0.3以下为无相关;0.3~0.5是低度相关;0.5~0.8是显著相关;0.8以上是高度相关
相关系数的显著性检验(了解):
P345-346
(1)T检验—设假设、确定并根据样本资料计算检验统计量临界值、查检验统计量临界值表确定临界值,二者对比做出结论。
(2)R检验:
直接查“相关系数临界值表”,比较确定。
5、简单直线回归分析:
回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。
回归分析种类:
自变量个数—一元、多元回归;回归形式:
线性回归、非线性回归
以简单直线回归(一元线性回归)为例来介绍其原理和计算。
(1)确定自变量、因变量
(2)简单直线回归数学表达式一般形式
(3)如何确定参数a、b
(4)最小平方法应用(即,∑(y-yc)=0;∑(y-yc)^2=min)
推导出参数b、a的计算公式:
P348-349
回归系数b的含义:
X每变动一个单位,Y的平均变动值。
反映变量间的数量变动关系。
对回归模型的评价:
(1)判定系数:
测定回归直线拟合优度的一个重要指标P351-352
(在简单直线回归模型中,判定系数即为单相关系数的平方。
)
(2)回归估计标准误差:
因变量的各个观察值与拟合值的平均离差,判断回归方程代表性的大小。
(1)根据因变量实际值和估计值的离差计算P353
(2)根据a、b参数值计算P354
(3)线性回归方程的显著性检验(即回归系数b是否显著)(了解P355)
因变量的估计、预测:
回归系数b与相关系数r之间的关系:
相关分析与回归分析的比较:
联系:
相关分析依靠回归分析表明现象间数量关系的具体形式;回归分析要以相关分析为基础。
区别:
(1)分析内容不同:
相关分析只研究变量间相关的方向和程度;回归分析研究变量间相关的具体形式
(2)变量的地位不同:
相关分析不必确定因变量和自变量,所有变量都可以是随机变量,改变变量的位置不影响相关分析的结果;回归分析必须先确定因变量与自变量,一般只有因变量是随机变量,自变量是非随机变量,交换变量的位置,回归方程不同,只能根据自变量推算因变量。
(重点掌握:
结合书P368计算题4、8题计算相关系数、进行回归分析等)
第七章动态数列
1、动态分析法概念:
P130
2、动态数列的概念、作用和种类:
P130
概念:
将某种现象在时间上变化发展的一系列同类的统计指标,按时间先后顺序排列。
动态数列由两个基本要素构成:
一是资料所属时间、另一个是各时间上的统计指标数值。
作用:
三个方面
种类:
按统计指标性质不同,分为绝对数动态数列、相对数动态数列、平均数动态数列,其中绝对数动态数列是基本(基础)数列,其他数列由绝对数动态数列派生而来。
按指标所反映的社会经济现象所属的时间不同,绝对数动态数列分为时期数列和时点数列。
时期数列与时点数列的区别:
时期数列:
在绝对数动态数列中,各项指标值反映现象在一段时期内发展过程的总量。
特点:
时期数列—时期指标—相加性、累加性—指标数值大小与时期长短有关—数值通过连续不断的登记而取得
时点数列:
在绝对数动态数列中,各项指标值反映现象在某一时点(瞬间)所处的数量水平。
特点:
时点数列—时点指标—不具相加性、累加性—指标数值大小与时期长短无直接相关—通过间断登记取得
3、编制动态数列的原则:
可比性P133-134四点原则
(1)指标时间统一
(2)总体范围统一(3)经济内容统一(4)计算口径统一
4、动态数列水平分析指标:
P134-145
发展水平:
就是在动态数列中,各项具体的指标数值。
可以是总量指标、相对指标、平均指标。
根据位置不同:
分为最初水平、最末水平、中间各项水平、基期水平、报告期水平
平均发展水平:
就是将不同时期的发展水平加以平均而得的平均数叫平均发展水平,又称为序时平均数或动态平均数。
与一般平均数的联系和区别:
P135
各种动态数列平均发展水平的计算公式:
绝对数动态数列:
时期数列:
时点数列:
连续时点:
{连续变动时点:
非连续变动时点:
(时间间隔为权数)
间断时点:
间隔相等(首尾折半法)P138
间隔不等(首尾折半法加权数)P139
增长量:
P144报告期水平-基期水平
平均增长量:
逐期增长量之和/逐期增长量个数或累计增长量/(动态数列项数-1)
年距增长量:
(年距增减水平)报告期发展水平-上年同期发展水平
5、动态数列速度分析指标:
P146-153
发展速度:
报告期水平/基期水平(又称总速度)分为:
定基、环比发展速度
(二者关系:
定基发展速度=环比发展速度的连乘积;
两个相邻时期的定基发展速度之比,等于它们的环比发展速度)
增长速度:
增长量/基期发展水平另:
增长速度=发展速度-1(定基、环比增长速度)
年距发展速度:
报告期水平/上年同期发展水平
平均发展速度:
是各期环比发展速度的序时平均数。
两种计算方法,运用于不同情况。
水平法制定长期计划,则为几何平均法
(不要求)长期计划,则为方程法结合平均增长速度查对表计算
具体见P149-151
平均增长速度:
平均发展速度-1
5、动态数列变动趋势和季节变动分析:
(不要求)
长期趋势测定方法:
间隔扩大法、移动平均法、最小平方法(满足条件:
)
(重点掌握最小平方法运用于直线方程的计算。
P160-163例题)
趋势线拟合为直线方程,则现象发展的逐期增长量大体相等;
趋势线拟合为抛物线方程,则现象发展的逐期增长量的增长量大体相等;
趋势线拟合为指数曲线方程,则现象发展的环比发展速度或环比增长速度大体相等。
季节变动分析:
移动平均法、移动平均趋势剔除法(计算季节比率季资料时季节比率之和为400%;月资料时1200%)
(重点掌握:
结合书P179计算题4、5题计算)
第八章统计指数
1、统计指数的概念、作用、种类P185-189
概念:
仅反映复杂现象总体数量变动或差异程度的相对数
种类:
按不同标准分类:
按说明现象的范围不同——总指数、个体指数
按指数化指标的性质不同——数量指标指数、质量指标指数
按指数的表现形式不同——综合指数、平均指标指数
按指数数列中基期的不同——定基指数、环比指数
按时间是否变化——静态指数、动态指数
按说明因素的多少——两因素指数、多因素指数
(注:
结合实际判断)
2、统计指数的编制方法(同度量因素):
同度量因素的概念和作用:
概念:
同度量因素,使得不同度量单位的现象总体转化为数量上可以加总的现象总体,并客观上体现为其在实际经济现象或过程中的份额或比重。
作用:
同度量作用、权数作用
同度量因素选择的一般原则是:
编制质量指标总指数时,以数量指标为同度量因素并固定在报告期。
编制数量指标总指数时,以质量指标为同度量因素并固定在基期。
(注:
结合实际判断。
如:
商品零售价格指数、工业产品产量指数)
总指数的编制方法:
(1)综合指数:
数量指标综合指数编制:
公式:
质量指标综合指数编制:
公式:
(2)平均指标指数:
P200-202——从个体指数出发来编制总指数
算术平均数指数公式:
调和平均数指数公式:
3、几种主要价格指数的编制:
居民消费价格指数(CPI)、农副产品收购价格指数、股票价格指数等。
(了解)
4、统计指数的因素分析方法——重点掌握其计算和分析
(1)总量指标的两因素分析。
(结合PPT上例题、作业计算题重点掌握)
指数体系:
总量动态指标=数量指标指数×质量指标指数(
)
相对数分析:
绝对数分析:
(2)总量指标的多因素分析(不要求)
(3)平均指标因素分析(不要求)
P215-219可变构成指数公式:
固定构成指数公式:
结构影响指数公式:
5、因素推断:
利用指数体系,根据已知因素推算未知因素
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 复习 提纲