应用统计学复习重点Word文档下载推荐.docx
- 文档编号:13591153
- 上传时间:2022-10-11
- 格式:DOCX
- 页数:13
- 大小:90.72KB
应用统计学复习重点Word文档下载推荐.docx
《应用统计学复习重点Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《应用统计学复习重点Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。
按事物的某种属性对事物进行分类或分组基础
上,再将类别等级由大到小或由小到大排序。
取值可以进行分类且各类别具有等级差异的品质
型标志(变量)。
品质变量名:
类别名序号由大到小或由小到大排列。
例:
文化程度
(1)文盲
(2)小学(3)初中(4)高中以上
3间隔尺度intervalscale
选定一个测量单位,对数值变量在分类
排序基础上测量其间距(差距)。
测量出的数
值有加、减意义,无乘除意义。
可用数值记录其值而无比率意义的数值
型标志。
(3)记录形式:
数值变量名:
________
语文成绩:
________
**表述语:
甲(60分)比乙(30分)高30分
4比例尺度ratioscale
选定一个测量单位,对数值型标
志(变量)在测量间距基础上,测量其比率。
可用数值记录其值且有比率意义的数值
型变量。
_______
家庭人口数:
_______
甲家庭(6人)比乙家庭(3人)多3人,
甲家庭人口与乙家庭人口之比为2:
1
问卷结构:
表头、表体和表外附加3部分。
(一)表头:
调查表名称。
(二)表体:
说明词和调查项目。
1、说明词:
包括问候语、调查目的说明、填表说明
和问卷编号等。
2、调查项目:
分为品质型变量与数值变量。
(三)表外附加:
包括调查人签名、调查日期、被
调查人合作程度等。
统计数据的收集、整理与描述
描述统计学
内容包括:
数据收集、整理、显示与分布特征描述。
1、数据收集与整理:
(第二章1-4节)。
2、数据显示:
(第二章9节)
3、数据分布特征描述:
(第二章5—7节)
*以正态分布为例
一般水平(均值)————集中趋势
变异情况(标准差)————离散趋势
推断统计学
如果数据的获得是通过抽样法取得,就需要用样本数据对总体进行估计、假设检验、预测等分析,推断总体数量特征。
1、参数(抽样)估计:
(第四、五章)
用样本统计量指标值(均值、标准差、率等)推断总体(所有个体)统计指标值。
2、假设检验:
两组差异性分析(第六章)
3、方差分析:
多组差异性分析(第七章)
4、预测分析:
相关与回归分析(第八章)
描述统计与推断统计的关系:
由描述统计获得样本统计量指标值,在大概率条件下进行推断总体,推断统计的结果是研究问题的最终答案。
条形图(barcharts)适用资料类型:
(1)同一总体,不同测量指标值(标准分数)的比较;
同班同学不同课程考试成绩比较。
(2)不同总体,同质性测量指标值间的比较。
饼图(pie)适用资料类型:
(1)同一总体,不同部分所占比例的比较,用饼图;
(2)不同总体,同质性部分所占比例的比较,用环形图。
线图(line)适用资料类型:
随时间变化的数据,发展趋势分析。
散点图(scatterplots)适用资料类型:
两个变量相关关系趋势分析。
数据分布集中趋势测量
指计算一组数据的一般水平或中心值。
由最低组至最高组(向下)累积频数计算公式众数
d1
Mo=L+————×
i
d1+d2
公式中:
L—众数组下限
d1—众数组频数与其下限相邻一组频数之差
d2-众数组频数与其上限相邻一组频数之差
i—众数组组距
众数组:
指频数最大的组
公式中:
L为中位数所在组的下限
Sm-1为小于中位数所在组下限各组的累积频数
n为数据总和
fm为中位数所在组的频数
i为中位数组的组距
中位数组:
指由最低组向最高组累积,达到次数半值的组
众数、中位数和均值的关系及应用
正态分布数据——一般选用均值mean作为平均指标,表示平均水平
偏态分布数据——极差太大时,选用中位数median作为平均指标,
表示中等水平
偏态分布数据——极差较小时,选用众数Mode作为平均指标,
表示大多数个体的水平
20XX年,对某市500户居民家庭月收入抽样调查数据见下表。
求:
(1)本市居民家庭平均月收入
(2)本市大多数居民家庭月收入
(3)本市中等水平居民家庭月收入
解:
(1)=(350*40+650*90+950*110+1250*105+1550*70+1850*50+2150*35)/500
=984(元)
(2)Mo≈800+(110-90)/[(110-90)+(110-105)]*300
=1040(元)
(3)Me≈1100+(500/2-240)/105*300
=1128.57
数据分布离散趋势测量
即:
离散趋势测量是描述一组数据中,每个观察值偏离平均值的状况,即数据的变异性。
1极差(range)适用资料:
R=max(xi)-min(xi)
偏态分布数据,即一般水平用Mo、Me表示时,其离差状况用R表示。
2方差(总体用σ2表示,样本用s2表示)标准差(总体用σ表示,样本用s表示)
适用:
正态分布数据,即一般水平用均值表示时,其离差状况用S表示。
数据分布特点描述指标的综合选择
标准差的值越大,表明这组数据的离散程度越大
3离散系数适用:
(1)对同一总体不同测量指标的离散程度进行比较。
(2)对不同总体同一测量指标的离散程度进行比较。
离散系数越大,表明离散程度越大
检验数据的分布形态
检验数据分布的偏态——偏斜系数(skewness)
Σ(xi-)3fi
SK=———————
nS3
SK=0,正态分布
SK<
0,左偏分布
SK>
0,右偏分布
2、检验数据分布的峰态——峰度系数(kurtosis)
Σ(xi-)4fi
K=———————-3
nS4
K=0,正态分布
K<
0,平峰分布
K>
0,尖峰分布
在分别掌握了集中趋势(、Mo、Me)、离散趋势(R、S)、偏态(SK)及峰度(K)后,如何从计算机给出的多种指标值中选择适合研究者所取数据的分布特点值呢?
(1)当SK=0时,即正态分布时,选取、S分别作为集中与离散趋势指标,
表示为:
±
S
(2)当SK≠0,且K<
0,即偏态平峰分布时,选取Me、R分别作为集中与离散趋势指标,
MeR(或范围min~max)
(3)当SK≠0,且K>
0,即偏态尖峰分布时,选取Mo、R分别作为集中与离散趋势指标,
M0R(或范围min~max)
概率与概率分布
概率论与推断统计的关系
推断统计是研究如何用样本统计量推断总体参数值,原则是在已知样本、S、P取值概率分布形式的基础上,在大概率条件下进行推断。
、S、P的概率分布形式
又称为抽样分布。
经大量研究表明:
——大样本下服从正态分布
小样本下服从t分布
S——单个样本的S2服从x2分布,两个样本S12/S22服从F分布
P——大样本下近似服从正态分布
小样本下服从二项分布(大样本指大于30的)
2、大、小概率及临界值
(1)一般的,将概率值在95%以上为大概率事件,概率值小于5%的称为小概率事件。
(2)临界值指发生小概率事件的临界点值。
抽样分布
抽样分布(samplingdistribution):
根据所有可能的样本观察值计算出来的某一种统计量的观察值的概率分布。
抽样分布是参数估计与假设检验的理论基础
样本均值的抽样分布形式:
随总体分布形式、抽样方式以及样本量大小的不同而不同。
一般规律:
大样本下,样本均值服从正态分布,
小样本下服从t分布。
常用抽样分布及参数估计公式
通用公式:
样本统计量±
极限误差;
极限误差Δ=临界值*抽样误差;
抽样误差=样本标准差/SQR(n)
常用公式见课本
参数估计
Parameterestimation:
研究从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况。
置信度与显著性水平:
1-α:
称为置信概率或置信水平、置信系数,一般取95%、99%两个值。
α:
称为显著性水平(或小概率),一般取0.05和0.01两个水平。
一参数估计的一般公式
样本统计量±
极限误差Δ
(1)样本统计量包括样本均值、率、标准差
(2)Δ=大小概率的临界值×
抽样误差
(3)
抽取250名大学生,测得其平均IQ为115,已知人群中IQ标准差为15,试以95%的置信度推断中国大学生的平均IQ?
α=0.05临界值Zα/2=1.96样本均值为115
代入上式有:
下限115-1.96×
0.95=113.14
上限115+1.96×
0.95=116.86
即在95%置信度下,估计中国大学生的平均IQ为113.14~116.86
二常用区间估计公式及应用
三样本量计算公式
假设检验
本章应重点掌握:
1、假设检验的原理、三类假设及其H0成立的统计决策条件;
2、均值检验中三类检验(单样本、独立样本、配对样本)适用的研究问题;
3、均值检验中三类检验计算机输出结果的读取方法;
4、两类率检验适用的研究问题。
两类假设建立原则
1、H0与H1必须成对出现
2、通常先确定备择假设,再确定原假设
3、假设中的等号“=”总是放在原假设中
如何判断原假设H0是否成立呢?
原理
小概率事件在一次试验中基本上不会发生.如果在H0条件下发生了小概率事件,则认为H0不正确
过程说明实例分析
某生产工艺零件规格为长度4cm,标准差为0.1cm,从某天生产的零件中抽取9件,测得平均长度为3.94cm,试在95%概率下检验当天生产是否正常?
H0:
μ=4*正常
H1:
μ≠4*不正常(研究者要证实的观点)
由抽样分布知,正态总体方差已知时,
当H0成立时,
既在H0条件下发生了大概率事件,故H0成立,H1不成立。
常用的值有0.01,0.05,0.10
=0.05
称为“有显著性差异”
=0.01
称为“有极其显著性差异”
=0.10
称为“有明显的差异趋势”
当P≤α时,H0不成立;
P>
α时,H0成立
统计决策
(1)临界值比较法
双侧:
如果统计量值(Z)界于左、右临界值间,则H0成立;
如果大于右临界值或小于左临界值,H0不成立。
左尾:
如果统计量值(Z)界于大于左临界值,则H0成立;
如果小于左临界值,H0不成立。
右尾:
如果统计量值(Z)界于小于右临界值,则H0成立;
如果大于右临界值,H
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 复习 重点