统计学向书坚内容整理Word文档格式.docx
- 文档编号:14294594
- 上传时间:2022-10-21
- 格式:DOCX
- 页数:16
- 大小:32.02KB
统计学向书坚内容整理Word文档格式.docx
《统计学向书坚内容整理Word文档格式.docx》由会员分享,可在线阅读,更多相关《统计学向书坚内容整理Word文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
3、统计数据是指对客观现象的属性或数量表现进行测量的结果。
4、面板数据
指时间序列数据和截面数据相结合的数据。
如在调查中收集的对各个固定调查用户在不同时期的调查数据。
5、大数据
指在信息技术中,一些使用目前现有数据库管理工具或传统数据处理应用很难处理的大型而复杂的数据集。
6、统计指标
统计指标是指总体数量特征的概括性度量。
由指标名称和指标取值两基本要素组成,还包括时间状态、空间范围、计量单位、计量方法等限定。
分为数量指标和质量指标。
指标数值反映的是所研究现象在具体时间、地点、条件下的规模、水平、结构等特征,是具体的而不是抽象的数字。
第二章统计数据收集、整理与展示
1、间接数据和直接数据的来源?
间接数据:
公开出版的报纸、书籍及相关网站中的数据,也可以从调查公司或数据库等处购买,有些未公开的数据在获得数据所有者允许的情况下也可以使用。
直接数据:
专门组织的调查或观察,科学试验。
2、统计调查方式包括:
普查、抽样调查、统计报表调查、重点调查
3、普查定义:
指一个国家或一个地区为详细地了解某项重要的国情国力而专门组织的一次性、大规模的全面调查。
主要用来收集某些不能够或不适宜用定期的全面调查报表收集的信息资料,以搞清重要的国情、国力,为国家制定有关政策或措施提供依据。
特点:
①通常是周期性进行;
②需要规定统一的标准时间,避免调查数据重复与遗漏;
③相对于其他调查方式,所得资料更全面、更系统,可以为抽样调查或其他调查提供基本依据;
④涉及面广、工作量大、时间较长,而且需要大量人力物力、组织工作较为繁重,因此普查的适用范围较窄,主要用于调查一些关系国计民生的基本现象。
4、统计报表调查
定义:
指按照国家有关法规规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的统计调查方法。
分类:
按内容和实施范围不同,分为国家统计报表、部门统计报表和地方统计报表;
按报送周期长短不同,报表分为日报、旬报、季报、半年报和年报;
按填报单位不同,报表分为基层统计报表和综合统计报表。
5、重点调查
指在调查对象中选择一部分重点单位进行调查,用以反映总体基本情况的一种非全面调查方法。
适用:
当调查任务值要求掌握基本情况,而部分单位又能集中地反映所要研究的问题,采用重点调查较为适宜。
6、我国统计调查方法体系,就整个统计工作来说,应该以周期性普查为基础,以经常性的抽样调查为主体,辅之以其他调查方法。
7、调查方案结构
1调查目的;
2调查对象、调查单位和报告单位;
3调查项目与调查表;
4调查时间、调查期限、调查方式与调查方法;
5调查的组织实施计划
8、问卷设计
问卷结构:
问卷标题、问卷说明、填写要求、甄别部分、主体内容、编码、背景。
提问要求:
①提问内容尽可能短;
②用词通俗、准确;
③避免诱导性、否定式提问;
④避免敏感性问题;
⑤一项问题一般只包含一个问题
问题排序:
注意问题排序的逻辑性、兴趣性,应先易后难,开放性问题放最后。
回答项目设计:
开放性问题:
填空、自由回答;
封闭性问题:
两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法。
9、数据审核
间接数据:
适用性、时效性直接数据:
及时性、完整性、准确性
第三章数据分布特征描述
1、简单算术平均数与加权算术平均数
算术平均数:
指将一组数据相加后除以数据个数所得到的一个数值,也称均值。
简单算术平均数:
数值大小只与变量值大小有关,
加权算术平均数:
数值大小不仅受各组变量值(或组中值)大小影响,而且受频率的影响。
某组频率越大,改组数据大小对平均数的影响就越大。
权数起作用的两个条件:
①各变量值之间有差异;
②各变量值的权数有差异。
注意:
用各组组中值代表其实际数据计算算术平均值时,通常假定各组数据在组内是均匀分布的,相应的组中值近似等于各组的平均数。
如果实际数据与这一假定吻合,则计算结果比较准确,否则出现较大误差。
2、调和平均数:
指对变量值的倒数求平均,然后再取倒数而得到的平均数,也称倒数平均数,以Hm表示。
数学定义看与算术平均不同,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,唯一区别是计算时使用了不同的数据资料。
3、几何平均数:
指n个变量值乘积的n次方根,也称几何均值,以Gm表示。
是计算平均比率或平均发展速度最适用的一种方法。
分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法。
4、标准分数:
一组数据中单个变量值与其平均值的离差除以标准差的值,也称标准化值,记为乙可用来判断一组数据有否离群点(对称分布一一经验法则;
非对称分布——切比雪夫不等式)
第四章时间数列分析与预测
1、时间数列分类按生成时间数列影响因素,可分为平稳时间数列和非平稳时间数列。
按统计指标数值的表现形式不同,可分为绝对数时间数列、相对数时间数列和平均数时间数列。
绝对数时间数列又派生出时期数列和时点数列。
2、区分平稳数列与非平稳数列的意义在于数列的预测,平稳时间数列表明现象的未来与其历史过程具有高度相似性,因而可用其历史值预测其未来;
但对非平稳时间数列,则需先认识其变化规律,在此基础上,再利用事物发展的惯性预测其未来。
3、时间数列分析常用统计方法:
图形描述法(线图)、指标分析法、构成因素分析法和预测法
4、时间数列分解的统计分析中,将T、S、C、I之间关系作出三种假设:
1各构成因素相互独立,用加法模型表示:
yi=Ti+S+C+li;
2各构成因素非独立,用乘法模型表示:
yi=T*Si*Ci*li;
3各构成因素有独立也有非独立,表现为混合模型。
5、分离长期趋势方法
1修匀法:
在原时间数列的基础上生成一个新数列,借新数列来反映原数列长期趋势的方法,常见的如移动平均法、指数平滑法;
2模型拟合法:
观察原时间数列线图中现象变化轨迹的形态,拟合一条与该轨迹形态相适应的曲线,借此曲线来反映原数列长期趋势的方法,最常用的是最小二乘法。
6、采用移动平均法分离长期趋势应注意的问题
1合理选择步长k;
2注意新数列中各项观察值位置的排列(奇数一次平均,偶数两次平均);
3注意移动平均法的局限性。
奇数项移动首尾少(k-1)12,偶数项少k/2,步长越大修匀作用越大,原有数列的信息损失越多,当数据量不足时(nv50)不宜采用该方法。
7、相比移动平均,指数平滑法的优点
1平滑值的计算所用数据量和计算量都很少;
2a(1-a)i随i的增大而变小,说明滞后期越长的数据对未来的影响越小,即体现出“近大远小”的思想。
8、模型拟合法的操作步骤首先根据时间数列变动的形态特征,选择一条曲线(模型),然后估计参数,最后依此模型计算出的趋势值来构造新时间数列以反应原数列的长期趋势。
该方法的关键问题在于如何选择合适的模型以及用什么方法估计模型中的参数。
9、拟合模型的确定
可根据时间数列线图确定,此外可计算相关指标来确定。
⑴若时间数列观察值y的逐期增长量(一阶差分yi-yi-i=Ai)大体相等,则其趋势线近似于一条直线,即拟合模型为y=a+bt;
(2)若y的二阶差分(Ai-Ai-i)大体相等,则其趋势线近似于一条抛物线,拟合模型
为y=a+bt=ct2;
⑶若y的对数的一阶差分(lny-lny「i)大体相等,则其趋势线近似于一条指数曲线,等等。
10、季节变动基本特征:
周期性、重复性、相似性。
11、季节指数:
若干年同期观察值的均值与所有观察值的总均值之比值,称为该期的季节指数。
12、季节指数计算方法
1同期平均法:
直接将若干年同期观察值的均值与所有观察值的总均值对比,计
算出一个年度内各月或各季节的季节指数。
该方法在时间数列长期趋势不明显或者长期趋势不存在时使用。
2趋势剔除法:
是时间数列长期趋势较明显情况下分解季节变动的一种方法。
基本思想是先从时间数列中将长期趋势剔除掉,然后再应用“同期平均法”剔除循环变动和不规则变动,最后通过计算季节指数来表现季节变动。
趋势剔除法是长期趋势测定方法和上述同期平均法的结合运用。
13、时间数列预测
平稳时间数列:
简单平均法、移动平均法、指数平滑法
趋势非平稳时间数列:
趋势外推预测法季节非平稳时间数列:
回归模型
趋势-季节非平稳时间数列:
建立趋势季节模型
第五章统计指数
1、统计指数广义上说,指数是指一切用来测定社会经济现象数量变动或差异程度的相对数。
狭义上说,统计指数是指综合反映复杂总体数量变动方向和程度的特殊相对数。
2、分类
1按研究范围不同,分为个体指数和总体指数;
2按计算方法不同,分简单指数和加权指数;
3按所表明现象的属性特征不同,分数量指标指数和质量指标指数;
4按采用基期不同,分环比指数和定基指数
3、编制总指数的基本原理
首先,确定同度量因素,通过同度量因素将复杂现象同度量化,使各因素能直接相加。
其次,确定同度量因素的时期,即根据实际情况固定在某个时期,以单纯考察复杂现象中研究的那个因素的综合变动情况。
最后,将属于不同时期的两个总量指标对比,得出反映复杂总体综合变动的总指数。
编制总指数时,依据所选用的权数及加权形式的不同,计算方法主要有加权综合法和加权平均法。
4、加权综合法:
指对复杂总体通过引入同度量因素并将其固定在某一时期来编制总指数,以反映总体综合变动程度的指数编制方法。
分为基期加权综合法和报告期加权综合法。
5、为什么派氏价格指数应以报告期的实际销售量作为同度量因素?
编制物价指数的目的不仅要反映市场物价水平变动的方向和程度,还要反映这种变动对社会经济生活带来的实际影响,即物价变化对国家、企业、人民群众货币收支和生活水平的实际影响。
由于物价变化发生在报告期,国家、企业、居民因物价变动而得到的实惠或受到的损失也与报告期购买量有关,而不可能与物价变动以前的任何一个时期的购买量有关。
所以,从应用的角度来讲,用派氏指数编制物价总指数应当以报告期的实际销售量作为同度量因素,才具有现实的经济意义。
6、拉氏销售量总指数与派氏销售量总指数
拉氏销售量总指数是以基期物价作为权数,目的是说明在基期物价水平不变的前提下,销售量综合变动的程度。
不足之处在于使用基期水平作权数,与实际的经济运行结果脱节。
派氏销售量总指数以报告期物价作为权数,目的是说明在报告期物价水平不变的前提下,销售量综合变动的程度。
虽然考虑了现实的经济意义,但不足之处在于使用报告期的权数,资料不能迅速取得,工作量较大;
同时由于指数数列中各期权数不同,指数数值之间不能直接进行比较
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 内容 整理