统计学各章计算题公式及解题方法.docx
- 文档编号:11868730
- 上传时间:2023-04-06
- 格式:DOCX
- 页数:18
- 大小:317.59KB
统计学各章计算题公式及解题方法.docx
《统计学各章计算题公式及解题方法.docx》由会员分享,可在线阅读,更多相关《统计学各章计算题公式及解题方法.docx(18页珍藏版)》请在冰豆网上搜索。
统计学各章计算题公式及解题方法
统计学各章计算题公式及解题方法
第四章数据的概括性度量
组距式数值型数据众数的计算:
确定众数组后代入公式计算:
单变量数列的中位数:
先计算各组的累积次数(或累积频率)一根据位置公式确定中位数所在的组一对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)
组距式数列的中位数计算公式:
位数所在组的频数,
6.
一组的累积频数
四分位数位置的确定:
JI
r+r■++[
_r〒叫T…Tf:
L
x=
n
yMf.,
_晒斤+叫&—+出血自叭'ri
:
'
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
1.
几何均值(用于计算平均发展速度)
四分位差(用于衡量中位数的代表性)
异众比率(用于衡量众数的代表性)
2(策一三)£
zi=l
2f=1
样本方差:
未分组数据:
斥-1;分组数据:
Sa
n-1n-1
总体标准差:
未分组数据:
i=1
a=
N
;分组数据:
4
N
离散系数:
叫-丘
第七章参数估计
的估计值:
置信水平
90%
0.1
0.05
1.654
95%
0.05
0.025
1.96
99%0.010.0052.58
2.不同情况下总体均值的区间估计:
总体分布
样本量
b已知
b未知
正态分布
大样本(n>30)
云士囁
-S
小样本(n<30)
-(T
非正态分布
大样本(n>30)
-(T
其中,】查p448,查找时需查n-1的数值
bfl-p)
3.大样本总体比例的区间估计:
(n-1}s22(n-1)s2
4.总体方差■在--置信水平下的置信区间为:
5.估计总体均值的样本量:
■',其中,E为估计误差
(勺-刃
口=
6.重复抽样或无限总体抽样条件下的样本量:
,其中n为总体比例
第八章假设检验
1.总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的
用正态分布近似]
假设
双侧检验
左侧检验
右侧检验
假设形式
心:
2叫
//j:
p
统计量
口已知
口未知
z=
拒绝域
1创A為H
|1>z«
1’值决策
PJ,拒绝/
2.总体均值检验(未知,小样本,总体正态分布)
假设
双侧检验
左侧检验
右侧检验
假设形式
心p>pu
%:
咗弘
gp "i: 。 已知 X 序=— 统计量 。 未知 拒绝域 It]>-1) t<-t£r(n-1) t>tjn-1J 1’值决策 Pco|,拒绝 注: ■已知的拒绝域同大样本 3.一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似) 4. (其中卜』为 拒绝 假设的总体比例) 5.H统计量的参考数值 01 0.1 0.05 0.01 双侧检验 ±1.65 士1.96 ±2.58 单侧检验 ±1.28 +2.65 ±2.33 第九章列联分析 1.期望频数的分布(假定行变量和列变量是独立的) 一个实际频数5的期望频数%,是总频数的个数n乘以该实际频数5落入第(行和第 2. 统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的 实际频数,%为列联表中第i行第j列的期望频数 1)检验多个比例是否相等 检验的步骤 提出假设Hb: i=2=…=j;H: i,2,…,j不全相等;计算检验 2 的统计量;进行决策: 根据显著性水平和自由度(r-l)(c-1)查出临界值,若 22 2>,拒绝Ho;若2<,不拒绝H 2)利用样本数据检验总体比例是否等于某个数值 检验的步骤 提出假设Ho: i=,2=,•••;H: 原假设的等式中至少有一个不成立;计算检验的统计量;进行决: 根据显著性水平和自由度(r-1)(c-1)查出临界值2;若 22 2>,拒绝Ho;若2<,不拒绝H 3)检验列联表中的行变量与列变量之间是否独立 检验的步骤 提出假设H0: 行变量与列变量独立;H: 行变量与列变量不独立;计算检验的统计 2I2| 量;进行决策: 根据显著性水平和自由度(r-1)(c-1)查出临界值山,若2兀』,拒 2 绝Ho;若2<-,不拒绝“ 3.相关系数: 测度22列联表中数据相关程度;对于22列联表,系数的值在0〜1 之间 其中,n为实际频数总个数,即样本容量 4.列联相关系数(C系数)用于测度大于22列联表中数据的相关程度 M+冲,其中,C的取值范围是0^C<1;C=0表明列联表中的两个变量独立;C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大;根据不同行和列的列联表计算的列联系数不便于比较 5.V相关系数 v=I.~ ^nmin\{r-1).U-1)],其中,v的取值范围是0 列联系数不便于比较;当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V= 第十章方差分析 1.单因素方差分析的要点: 1)建立假设的表述方法: 坷: 旳二血二…=以,自变量对因变量没有显著影响 心旳斥不全相等,自变量对因变量有显著影响 2)决策: i.根据给定的显著性水平比在F分布表中查找与第一自由度=、第二自由 ii.若F>,则拒绝原假设丨弓,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响 iii.若,则不拒绝原假设no,不能认为所检验的因素对观察值有显著影响 3)单因素方差分析表的结构: 方罢甘忻 S5t平弓袍) KS(均方】 Fg) P-^Lu? (P佰》Fecit洁临雪即 1£-J S5A vu=— 常£1 差) ll-l MSA■卅] 旦丰r曲全袖池划值越并魁uk丸也去耿屮■5PTR勺t■姚 SSI=£SA+^E n-h 亠 2.方差分析中的多重比较(步骤): 采用Fisher提出的最小显著差异方法,简写为LSD 1)提出假设: "n;叭i: (第I个总体的均值等于第吻个总体的均值) 丿心;»严儿(第(个总体的均值不等于第个总体的均值) 2)计算检验统计量: In,n. 1)无交互作用的双因素方差分析表结构: 2)有交互作用的双因素方差分析表结构: 4. 关系强度测量: 变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和 J_n-2 t=Irli ~2 _*t(n-2) 2)计算检验统计量: J17 r Itl Itl 3)确定u并决策: 乙拒绝心 ; 至,不拒绝"d 3.一元回归模型: 「几十$广… 4.一元线性回归方程形式: "—5: 爼人,其中.是直线方程在y轴上的截距,是当’=0 时,y的期望值;是直线的斜率,称为回归系数,表示当阀每变动一个单位时y的平 均变动值 5.一元线性回归中,估计的回归方程: 卜: f%%其中•是估计的回归直线在y轴上的 截距,: 是直线的斜率,它表示对于一个给定的的值,是y的估计值,表示当•每变 动一个单位时y的平均变动值 6. 根据最小二乘法求以及的公式: 8. SST(总平方和)-SSR硒归平方和}+SSE〔残差平方和)判定系数(回归平方和占离差平方和的比例): 2SSRi■1ih1 R== 557' i=1 9. 估计标准误差(实际观察值与回归估计值离差平方和的均方根): 亠刃‘= /=1 n~2 1亿-刃 y0士匕/科-2)亏 1++n爪 』一】 14.回归分析表的结构: StmiRYOUTP-JT 回归统计 y MultipleRRSquareAdjustedRSquare初准罠差翊值 相关系数尺和定系数尸调壘的判定丟数n df SS MS F iiarLiticaruceF 回归分析 1 SSK : 3-— '-M5E pf>用于决策 nr2 SSE =——- TJ-2 - — 总计 ri-l 331 — - — Coeificients 怖盘误差 tStat F-value Lover95將Urpec3SW Tritercacrt 丈備i+疑 甬 截距射饌的歸信区间 KVari-able1 L斜率 七缩讣重 F值 粘李9畝的證信国闻 15.几点说明: 1)判定系数测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上, 残差平方和SSE=0R「=1,拟合是完全的 2)在一元线性回归中,相关系数r实际上是判定系数丿’的平方根 3)相关系数r与回归系数是同号的 第十三章时间序列预测和分析 1.环比增长率: 报告期增长率与前一期水平之比减1: q二厂-1(1=1.2.A.II) *i-1 2.定基增长率: 报告期水平与某一固定时期水平之比减1 Gt――(i=l+A,n) 5,其中,丫。 表示用于对比的固定基期的观察值 3.平均增长率: 序列中各逐期环比值(也称环比发展速度)的几何平均数减1后的结果(描 述现象在整个观察期内平均增长变化的程度) fFYY~ly- --1,百衣朮平均增长率・II为环比值的个数 rirn-1a 1)当时间序列中的观察值出现0或负数时,不宜计算增长率 2)在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对水平的结合分析 4.时间序列预测的步骤: 1)确定时间序列所包含的成分,也就是确定时间序列的类型 2)找出适合此类时间序列的预测方法 3)对可能的预测方法进行评估,以确定最佳预测方案 4)利用最佳预测方案进行预测 5.均方误差: 通过平方消去正负号后计算的平均误差,用MSE表示 MSE=.兀中岭为观測值.林为预测值 n1B 6.简单平均法: 根据过去已有的t期观察值来预测下一期数值。 设时间序列已有的其观察 值为;贝『•一i.期的预测值伍M为: f=l 有了1+】的实际值,则预测误差为: eln=Ytwrt^l Y(★十]+岭it十2+人+岭[+片 p—V +L厂k 谋晨平力和 MSE=-— 预测误差用均方误差表示: 谀签个妁 8.指数平滑法(一次): 以一段时期的预测值与观察值的线性组合作为t+1的预测值,其 预测模型为: ]=^+(1"^,其中口为平滑系数皿<。 <1),在开始计算时,没有第1个时期的预测值h,通常可以设儿等于1期的实际观察值,即F1=Yl 9.线性趋势预测: AaA 1)一般形式: ◎=«■+叫岭为时间序列趋势值,E为时间标号,□为趋势线在Y轴上 的截距,为趋势线的斜率,表示时间M变动一个单位时观察值的平均变动数量 2)由最小二乘法求得: —亍 a-Y-bl 如令°,则1G=y 3)预测误差可用估计标准误差来衡量: SY~E| ■\n~mm为趋势方程中未知常数的个数 10.指数曲线: 用于描述以几何级数递增或递减的现象 AI 1)一般形式: 二—;,a、b为未知常数,若b>1,增长率随着时间t的增加而增加,若b<1,增长率随着时间t的增加而降低,若a>0,b<1,趋势值逐渐降低到以0为极限 2)将一般形式转换为对数直线形式,由最小二乘法求得: ^tigr=lea^t+垠占y 3)求出瓦及: ’,取反对数 11.修正指数曲线: 描述初期增长迅速,随后增长率逐渐降低,最终则K为增长极限现象 1)一般形式: ,’一’,Ka、b为未知常数,K>0,0,0 2)趋势值K无法事先确定时采用;将时间序列观察值等分为三个部分,每部分有m 个时期;令趋势值的三个局部总和分别等于原序列观察值的三个局部总和 设观察值的三个局部总和分别为: 巧;%^, rrj t=1 ; 2ui t=nl+1 3rn 1=■+I ii.根据三和法求得: 、b—1 m—b(btn-1)if賦泸r)i 12.Gompertz曲线: 描述初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率又逐渐下降,最后接近一条水平线现象 *tl 1)一般形式:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 各章 算题 公式 解题 方法