统计学基础知识培训.pptx
- 文档编号:2698162
- 上传时间:2022-11-08
- 格式:PPTX
- 页数:33
- 大小:283.74KB
统计学基础知识培训.pptx
《统计学基础知识培训.pptx》由会员分享,可在线阅读,更多相关《统计学基础知识培训.pptx(33页珍藏版)》请在冰豆网上搜索。
统计学基础知识培训目录统计学基础知识1抽样调查简介2描述统计3推断统计4统计学(statistics)统计学是一门收集、处理、分析、解释数据并从数据中得出结论的科学什么是统计学?
统计是一门工具!
研究对象n总体(population)/样本(sample)总体:
根据研究目的确定的同质观察对象的全体。
有限总体、无限总体个体:
构成总体的基本单位样本:
从总体中随机抽取部分单位所构成的集合体调查总体:
对总体进行进一步限制,使对总体的调查具备可操作性总体样本数据类型定类数据定序数据定距数据定比数据定义它的取值只代表观测对象的不同类别。
最常用来综合定类数据的统计量是频数、比率或百分比它的取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量它的取值之间可以比较大小,可以用加减法计算出差异的大小,基本特点是两个相同间隔的数值的差异相等可以进行加减乘除运算,它与定距变量意义相近,细微差别在于有绝对“0”举例性别、职业学历温度收入分类排序间距比值参数与统计量(1/2)n参数描述总体特征的指标参数常用希腊字母表示,如:
、等如广州电信移动用户1000W,其中3G用户500W,3G用户比率=50%n统计量:
由样本计算的不含未知参数的函数一般情况下,总体中的个体数目往往较大或无限,因而总体指标(参数)往往是未知的,人们在实践过程中逐渐认识到,样本统计量与相应总体参数间有着某种联系,可以通过样本去了解总体情况,由样本信息来推断总体特征参数与统计量(1/2)平均数平均数标准差、方差标准差、方差成数成数参数参数、2p统计量统计量XS、S2P总体总体样本样本一统计学分类统计学学描述描述统计学学推断推断统计学学参数估参数估计假假设检验n描述统计(descriptivestatistics):
研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。
n推断统计(inferentialstatistics):
研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断目录统计学基础知识1抽样调查简介2描述统计3推断统计4调查方法n普查专门组织的,一般用来调查属于一定时点上的社会经济现象数量的全面调查。
句中三个关键词:
专门、时点、全面。
n抽样调查最常用的调查方式,从总体中随机抽取一部分单位(样本)进行调查,目的是为了推断总体特征n重点调查在总体中选择个别或部分重点单位进行调查,调查结果不能用于推断总体n典型调查从调查对象的全部单位中选择少数典型单位进行调查,目的是描述与揭示事物的本质特征和规律,调查结果不能用于精确推断总体抽样方法n抽样方法是指在总体中每个单位都具有同等可能性抽样中,每个单位被抽中的概率是已知的n误差非抽样误差:
在统计调查中,由于主客观原因而引起的诸如测量、登录、计算等误差。
该误差可以避免抽样误差:
在抽样调查中由于抽样的随机性而产生的样本指标对总体指标的代表性误差。
样本虽然是总体的缩影,但是还不足以完全代表总体,从而产生了误差。
抽样误差是随机抽样固有的,可以计算并加以控制,但是不可以避免抽样方法分类简单随机抽随机抽样系系统抽抽样分分层抽抽样整群整群抽抽样多多阶段抽段抽样抽抽样方法方法抽样方法组织形式(1/2)n简单随机抽样(纯随机抽样)方法:
将总体单位编成抽样框,而后用抽签或随机数表抽取样本单位适用:
总体规模不大;总体内部差异小n类型抽样(分层抽样)方法:
将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本n等距抽样(机械抽样)方法:
将总体单位按某一标志排序,而后按一定的间隔抽取样本单位(总体单位按某一标志排序)(总体单位按某一标志排序)抽样方法组织形式(2/2)n整群抽样方法:
将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查适用:
总体规模不大;总体内部差异小n多阶段抽样方法:
就是先从总体中抽出较大的范围的单位,再从中选的大单位中抽较小范围的单位,依次类推,最后从更小的范围抽出样本基本单位如:
广东省客户满意度调研的样本抽取不同抽样组织设计的比较n提高样本的代表性,增加抽样的效果。
抽样要满足随机性要求。
n抽样设计时,要充分考虑如何降低抽样的成本费用。
进行抽样设计时需要考虑的两个问题n在统计学上,一般的调查项目都是定在90的信心程度,不同的样本数产生的准确程度相应增加或减少。
置信度:
90的机会,样本数据是在可接受的误差范围内;有10的机会、样本数据是超出可接受的误差范围。
抽样误差:
样本统计量于相应总体参数的误差范围样本量和抽样误差之间的关系90%置信度下,样本量和抽样误差的对应关系置信度下,样本量和抽样误差的对应关系2%3%4%5%6%7%8%9%10%11%15%样本量168174742026918713710583675630目录统计学基础知识1抽样调查简介2描述统计3推断统计4描述统计学概念n描述统计学(descriptivestatistics):
指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。
反映总体数量特征的综合指标有哪些呢?
可以用哪些图标形式展示呢?
反映总体数量特征的综合指标有哪些呢?
n总体量数:
n集中量数:
平均数、中位数、众数n差异量数:
全距、方差、标准差、四分差n相对量数:
结构相对数(如:
比率)比例相对数(如:
比例)比较相对数(如:
同比、环比)强度相对数(如同业比)计划完成相对数1、集中量数n集中量数:
用来描述数据分布中心的统计量。
常用的有平均数、中位数、众数1.平均数:
一组数据的算术平均数2.中位数:
数轴上面使其左边和右边的数据个数相等的数据指标3.众数:
分布中出现频次最高的数据值n平均数、中位数、众数之间的关系(根据分布)2、差异量数n差异量数:
以数字形式计算出某分布中数据差异的程度,反映一组数据围绕数轴中心分布的离散情况。
常用的有全距、方差、标准差、四分位差1.全距:
数据在数轴上分布的距离2.方差:
指离均差平方后的平均数;标准差是指方差的平方根3.四分位差:
第一个四分位点和第三个四分位点的距离3、相对量数n相对量数:
结构相对数:
是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标(如:
比率)比例相对数:
是总体中不同部分数量对比的相对指标,用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况(如:
比例)比较相对数:
比较相对指标是不同单位的同类现象数量对比而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类实物在不同条件下的数量对比关系(如:
同业比)强度相对数:
是两个性质不同但有一定联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普遍程度计划完成相对数:
是用来检查、监督计划执行情况的相对指标。
它以现象在某一段时间内的实际完成数与计划数对比,来观察计划完成程度。
(如同比、环比;同比是指与历史同时期进行比较得到的数据,环比是指与前一统计期进行比较得到的数值)可以用哪些图表展示数据?
要表达的数据和信息饼图柱形图条形图折线图气泡图其他成分(整体的一部分)盒子图、饼图结合条形图排序(数据间比较)折线图结合条形图时间序列(走势、趋势)多重折线图频率分布(数据频次)相关性(数据间关系)散点图多重数据比较雷达图更多内容可以参照谁说菜鸟不会数据分析目录统计学基础知识1抽样调查简介2描述统计3推断统计4推断统计学n推断统计(inferentialstatistics):
研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断n常见分支为参数估计与假设检验1、参数估计n参数估计依据所获得的样本资料观察对所研究现象总体的水平,结构规模等数量特征进行估计。
n包括点估计与区间估计点估计:
指直接以样本指标来估计总体指标,也叫定值估计优点:
简单,具体明确缺点:
无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况2、假设检验基本思想:
小概率原理,指如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
总总体体(某种假设)(某种假设)抽样抽样样样本本(观察结果)观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未发发生生小概率事件小概率事件发发生生假设检验的意义所谓假设检验,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,作出“接受”的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出“拒绝”的结论。
举例:
某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年收入为71000元,这是否意味着职工生活水平下降呢?
我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。
降了升了原假设与备择假设原假设(又称虚无假设)是接受检验的假设,记作H0;备择假设(又称备选假设)是当原假设被否定时的另一种可成立的假设,记作H1;H0与H1两者是对立的,如H0真实,则H1不真实;如H0不真实,则H1为真实。
H0和H1在统计学中称为统计假设当原假设H0为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概率就是显著性水平。
用表示常用的统计检验n均值检验:
单样本T检验两个独立样本T检验配对样本T检验n比率检验:
卡方检验统计是一门艺术!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 基础知识 培训