完整应用统计学期末复习Word文件下载.docx
- 文档编号:15141249
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:15
- 大小:309.80KB
完整应用统计学期末复习Word文件下载.docx
《完整应用统计学期末复习Word文件下载.docx》由会员分享,可在线阅读,更多相关《完整应用统计学期末复习Word文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
按性质分为品质标志和数量标志,按变异情况分为不变标志和可变标志。
7.变量:
可变的数量标志。
变量值:
变量的具体表现。
分类:
按变量值是否具有连续性分为连续变量和离散变量,按性质分为确定性变量和随机变量.
8.统计指标:
反映统计总体数量特征的概念和数值。
统计指标六要素:
指标名称、计量单位、计量方法、时间状态、空间范围、指标具体数值。
统计指标特征:
数量性、综合性、具体性。
9.统计指标与标志的区别:
统计指标说明的是总体数量特征,而标志是说明总体单位特征的名称;
指标都可用数值表示,而标志有不能用数值表示的品质标志和能用数值表示的数量标志。
10.统计指标分类(第21页):
按反映总体的内容分为数量指标和质量指标,按作用分为总量指标、相对指标和平均指标.
11.总量指标分类:
按反映的内容分为总体单位总量和总体标志总量,按反映的时间状况分为时期指标和时点指标,按指标数值采用的计量单位分为实物指标、价值指标和劳动量指标。
12.相对指标(相对数)的表现形式分为无名数(系数、倍数、百分数)和复名数(人口密度)。
13.相对指标的种类:
(第23页)
计划完成程度指标(%)=
结构相对指标(%)=
比例相对指标=
动态相对指标动态相对数(%)=
强度相对指标=
第二章统计数据的搜集
1.数据的计量方法:
定类尺度、定序尺度、定距尺度、定比尺度。
2.数据的分类:
按计量层次分为名义级数据、顺序级数据和刻度级数据;
按收集方法分为观测数据和实验数据;
按时间状况分为截面数据和时序数据。
3.统计数据的来源:
直接来源(原始数据)、间接来源(二手数据).
4.统计调查是根据统计研究预定的目的、要求和任务,运用科学的调查方法,有组织、有计划地向客观实际搜集资料的过程。
5.统计调查方案应包括:
确定调查目的、确定调查对象和调查单位.调查对象是指调查研究总体或调查范围。
调查单位是构成调查对象的每一个具体单位.报告单位(填报单位)指负责回答或提交调查资料的单位。
6.统计调查方式
统计报表
普查:
一次性或周期性、需要规定统一的标准调查时间、数据比较准确、适用范围较窄。
重点调查:
在调查对象的全部单位中,只选择少数重点单位进行非全面调查。
典型调查:
初步分析全部研究对象,选择一个或几个具有代表性的单位进行详细深入的调查。
抽样调查特点:
客观性、经济性、时效性、适用性、准确性。
7.抽样调查组织形式:
简单随机抽样
类型随机抽样(分层抽样)
机械随机抽样(等距抽样、系统抽样):
它是将总体单位按某一标志排队,计算出抽样间隔,并在第一个抽样间隔内随机确定一个抽样起点,再按固定的顺序和间隔来抽取样本单位。
整群随机抽样:
它是先将总体中各个个体,按照某一标志分为若干群,然后以群为单位,按随机原则从中抽取一部分群体,抽中群体的所有个体构成样本。
阶段随机抽样(分级抽样):
如两阶段抽样是先将总体划分为R组,从R组中随机抽取r组,再从r组中分别随机抽取mi(i=1,2,,r)个个体,构成样本。
8.统计误差:
调查性误差有技术性误差、登记性误差、责任性误差;
代表性误差是指抽样调查而言,因抽样方式不当或存在随机性误差.
第三章统计数据的整理
1.统计数据整理的程序:
审核和订正原始资料;
分组和汇总;
编制各种统计图表;
积累和保管统计数据。
2.统计分组的种类:
按分组标志的多少分为简单分组和复合分组;
按分组标志的性质不同分为品质分组和数量分组;
按分组的作用和任务不同分为类型分组、结构分组和分析分组.
3.单项式变量数列:
每个组只有一个变量值的变量数列;
组距式变量数列:
将变量的取值范围划分为若干个区间,以一个变动区间为一个组的变量数列.
4.数据分组步骤:
排序,求全距(极差=最大值-最小值)
确定变量的数据形式
确定组数(四舍五入)
确定各组组距
根据分组整理成频数分布表
5.累计频数(频率)分布图分为向上累计和向下累计。
6.统计表的结构:
从表的形式上看有总标题、横行标题、纵栏标题和指标数值;
从表的内容上看有主词栏和宾词栏.
7.注意:
分组时一般为左闭右开。
第四章统计数据特征的描述
1.平均指标:
计算均值包括算术平均数、调和平均数、几何平均数;
位置均值包括中位数(Me)、众数(Mo)。
2.分位数是指按顺序排列的一组数据被划分为若干相等的部分的分割点的数值。
3.离中趋势的描述:
极差(R),方差
(2),标准差().
4.是非标志在总体标志间以是非两种形式出现,非此即彼。
总体中具有某种属性的单位数占全部单位数的比率称为成数(p)。
p+q=1
5.相对离中趋势:
相对变异指标包括极差系数和标准差系数.极差系数:
VR=100%;
标准差系数:
V=100%。
6.偏态系数SK==
或SK==
偏斜的方向:
当〉Me时,偏态系数为正值,是一种右偏的分布;
当〈Me时,偏态系数为负值,是一种左偏的分布。
7.峰度系数(K)用来度量次数分布曲线的扁平程度。
K=(m4、4),m4表示变量X的四阶中心矩.(第95页)
第五章参数估计
1.全及总体:
根据一定的研究目的和要求所确定的研究对象的全体,简称总体,总体所包含的单位数称为总体容量,用N表示。
抽样总体:
从全及总体中按随机原则抽取一部分单位所构成的集合体称为抽样总体,简称子样或样本,抽样总体所包含的单位数称为样本容量,用n表示。
一般情况下,当n30时,称为大样本;
当n〈30时,称为小样本;
n/N称为抽样比例.
2.总体指标(全及指标):
根据总体计算的综合指标.总体指标:
总体均值、总体成数、总体方差2和总体标准差。
样本指标(抽样指标):
根据抽样总体计算的综合指标。
样本指标:
样本均值、样本成数、样本方差S2和样本标准差s。
3.重复抽样每次抽取时总体单位数相同,不重复抽样每次抽取时总体单位数不相同.
4.设X1,X2,,Xn是总体X的样本,g(X1,X2,,Xn)是一个连续函数,若此函数中不含任何未知参数,则称函数g(X1,X2,,Xn)为一个统计量.样本均值、样本方差和样本成数是最为常用的几个统计量。
统计量的概率分布称为抽样分布。
5.大数定律(第107页),中心极限定理(第108页).
6.参数估计的方法:
点估计、区间估计。
7.根据样本X1,X2,,Xn构造一个统计量(X1,X2,,Xn)作为参数的估计,称为的估计量。
8.评级估计量的标准:
无偏性即点估计量的抽样分布的期望值等于总体参数;
有效性即一个无偏估计量与任意一个无偏估计量相比,其方差最小;
一致性即估计量与总体参数的绝对离差小于某一任意小的正数的极限概率等于1。
9.区间估计用两个估计量构成区间去估计总体参数。
设X1,X2,,Xn是来自总体X的一个简单随机样本,是总体参数,由样本确定的估计量为1=1(X1,X2,,Xn)和2=2(X1,X2,,Xn),对于给定的(0〈〈1),如果有P(12)=1-a,则称(1、2)为的置信区间。
其中,1称为置信区间的下限值,2称为置信区间的上限值,1-称为置信度或置信水平。
10.设X~N
(2),当已知时,求的置信区间。
一般地,若给定(0〈<
1),的置信区间为:
P{-Z/2+Z/2}=1-
11.设X~N
(2),当2未知时,求
P{-t/2(n—1)/2(n-1)}=1-a
12.非正态总体或总体分布未知时,求的置信区间。
根据中心极限定理,当n充分大时(一般认为n大于或等于30),若给定〈<
1),的置信区间同第十条.
总体方差未知,只要样本容量n30,可以用样本方差代替统计量Z中总体方差,这时的置信区间为:
P{-Z/2+Z/2}=1-
13.样本中某种特征的单位数占样本全部单位数的比例称为样本成数,记为p。
根据中心极限定理,在大样本条件下,样本成数的抽样分布可用正态分布来近似表示,通常用样本成数p来代替置信上下限中的总体成数P,这时总体成数P的置信区间为:
P{p—Z/2/2}=1-
14.总体方差的区间估计:
给定总体方差2的100(1-)%的置信区间为P{}=1—
15.测定平均数的样本单位数目:
当X~N(,2),2已知时,或非正态总体、总体分布未知时的大样本情形,
n=
第六章参数假设检验
1.原假设是要进行检验的假设,又称“零假设”;
备择假设是与原假设对立的假设,也称“替换假设”.关于一个总体参数的假设检验有三种基本形式:
双侧检验:
H0:
=0H1:
左侧检验:
H0:
0H1:
右侧检验:
2.假设检验的基本思想是基于小概率原理,即小概率事件在一次试验或观察中不会发生。
3.单个总体均值的假设检验
设总体X~N
(2),2已知,假设检验:
双侧检验建立假设:
H0:
0;
计算检验统计量的数值:
Z=;
给定显著性水平,查正态分布表,确定临界值,从而确定拒绝域为(-)和[,+,接受域为(-,+);
统计决策:
若,拒绝H0,否则接受H0。
H0:
0,拒绝域为[,+接受域为(-);
0,拒绝域为(-),接受域为(,+)。
设总体X~N
(2),2未知,假设检验:
当2未知时,用样本方差S2来替代,选择统计量T=,在双侧检验(H0:
0)中,当(n—1)时,拒绝H0,否则接受H0;
在右侧检验(H0:
0)中,当T(n—1)时,拒绝H0,否则接受H0;
在左侧检验(H0:
0H1:
0)中,当T(n—1)时,拒绝H0,否则接受H0.
非正态总体或总体分布未知时,假设检验:
当n充分大时,样本均值近似服从正态分布,选择检验统计量Z=,可以用样本标准差S代替统计量Z中总体标准差。
P值为拒绝H0的最低显著性水平。
判别规则:
当p〈时,拒绝H0,接受H1;
当p时,接受H0。
4.两个总体均值差异的假设检验
检验H0:
=H1:
当两个总体为正态分布,且已知总体方差和:
选择检验统计量:
Z=~N(0,1);
当,拒绝H0,说明两个总体均值和有显著差异;
当时,接受H0,说明两个总体均值和无显著差异。
当两个总体为正态分布,且未知总体方差和:
根据方差齐性检验的结果,选择不同的检验统计量T进行检验。
总体分布未知,对大样本情形:
n130和n230,已知总体方差和:
选择检验统计量:
Z=~N(0,1);
当,拒绝H0,说明两个总体均值和有显著差异;
当时,接受H0,说明两个总体均值和无显著差异。
5.配对样本的T检验
令:
i=xi-yi(i=1,2,,n),用单样本的T检验方法,检验i的均值与0是否有显著的差异,从而得出两个总体的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 应用 统计学 期末 复习