统计学常用公式.docx
- 文档编号:27242227
- 上传时间:2023-06-28
- 格式:DOCX
- 页数:12
- 大小:152.18KB
统计学常用公式.docx
《统计学常用公式.docx》由会员分享,可在线阅读,更多相关《统计学常用公式.docx(12页珍藏版)》请在冰豆网上搜索。
统计学常用公式
公式一
1.众数[MODE]
(1)未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2)组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。
下限公式:
M-L+亠xz亠+亠
式中:
21。
表示众数;
L表示众数的下线;亠表示众数组次数与上一组次数之差;亠表示
众数组次数与下一组次数之差;i表示众数组的组距。
上限公式:
M0=U———xi
△2
式中:
U表示众数组的上限。
2・中位数[MEDIAN]
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。
设一组数据按从小到大排序后为X2,…,XN,中位数为则有:
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N/2确定中位数的位置,并确定中位数所在的组,然后釆用下面的公式计算中位数的近似值:
式中:
表示中位数;L表示中位数所在组的下限;S讪表示中位数所在组以下各组的累计次数;打表示中位数所在组的次数;〃表示中位数所在组的组距。
3・均值的计算【AVERAGE】
(1)未经分组均值的计算
未经分组数据均值的讣算公式为:
(2)
丁二召£+心/;+…+忑拆二召”
/-I
分组数据均值计算
分组数据均值的计算公式为:
4.几何平均数【GEOMEAN】
儿何平均数是N个变量值乘积的N次方根,计算公式为:
式中:
g表示儿何平均数;yi表示连乘符号。
5.调和平均数【HARMEAN】
调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。
式中:
H表示调和平均数。
6.极差[Range]
极差也称全距,是一组数据的最大值与最小值之差,即
R=max(x)・min(x)
式中:
R表示极差;max(x)和min(x)分别表示一组数据的最大值与最小值。
7.平均差【MeanDeviation】
平均差是各标志值与其平均数的绝对离差的算术平均。
n
工X■元
(1)根据未分组资料的计算公式:
AD=^^—
n
工X次fi
(2)根据分组资料的计算公式:
AD二一
r-l
式中:
AD表示平均差
8.方差【Variance】和标准差【StandardDeviation】
方差是各变量值与其均值离差平方的平均数。
要求掌握方差和标准差的讣算方法。
未分组数据方差的计算公式为:
卅=上
a
乞(叫-元)H
分组数据方差的计算公式为:
,=―
式中:
b「表示方差。
Ir-l
方差的平方根即为标准差,其相应的讣算公式为:
未分组数据:
分组数据:
式中:
CT表示标准差。
9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。
其计算公式为:
X
式中:
匕表示离散系数。
10.偏态[SKEW]
偏态是对分布偏斜方向及程度的测度。
利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。
显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。
11.峰值[KURT]
EXCEL中峰值系数的讣算公式为:
/—X
X-X
i
413(-1)2
(n-l)(7i-2)(n-3)tT
•
<$丿
\3)
式中:
s表示样本标准差。
公式二
1.均值估计
(1)样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,乂称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。
样本均值的抽样平均误差计算公式为:
通常情况下,当N很大时,(N-1)儿乎等于N,样本均值的抽样平均误差的计算公式也可简化为:
在公式中,"是总体标准差。
但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S代替。
(2)大样本均值的极限误差亠(可
(3)大样本下总体均值的区间估计
总体均值的置信度为(1-a)的置信区间:
元一知2”(元) (4)总体方差未知,小样本正态总体均值的区间估计 总体均值的置信度为(1-a)的置信区间: 无-环b(对<^ 2.比例估计 (1)样本比例的抽样平均误差 样本比例的抽样平均误差为: 重复抽样下: ={斗半 上式中,p应为总体比例,实际计算时通常用样本比例p代替。 不重复抽样下: .(,)=、辱吧可. Yn\N-1丿}InIN (2)样本比例的抽样极限误差 △p=Zgb(p) (3)总体比率的区间估计 总体比例P的置信度为(1-Q)的置信区间为: p-Ap + 即p-Zal2a(p) 3・总体均值检验 (1)单一总体均值检验 ①正态总体(总体方差已知)或大样本均值检验 ②正态总体(总体方差未知)小样本均值检验 检验统计量t为: 77T (2)两个总体的均值检验 ①两个正态总体均值检验—两个总体方差已知或大样本 Z检验统讣量为: 2_(召一石)-(“一“2) 大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。 ②两个正态总体均值检验(小样本)—两个总体方差未知但相等 T检验统计量为: 4.总体比例检验 (1)单一总体的比例检验 Z检验统计量: (2)两个总体比例的检验 八A 检验的统计量为: "(1-刃IQ(1-刃 Pl-Pl A入 其中: 厂卩厂也,力为当P]=P1时戸和小的联合佔计值。 5.总体方差假设检验 (1)单一正态总体方差的假设检验 检验统汁量为: -x)2 其中: 为/的估计量。 (2)两个正态总体的方差假设检验 检验统汁量为: 公式三 1•单因素方差分析 设总体共分为k种处理进行观察,第j种处理试验了容量为耳的样本。 (1)计算各项离差平方和 在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。 总离差平方和,用SST(SumofSquaresforTotal)代表: 式中: x表示全部样本观测值的总均值。 其计算公式为: 式中: 兀表示第j种水平的样本均值,兀=亠~ 水平项离差平方和。 为了后面叙述方便,可以把单因素方差分析中的因素称为Ao于是水平项离差平方和可以用SSA(SumofSquaresforFactorA)表示。 SSA的讣算公式为: (2)计算平均平方 用离差平方和除以自山度即可得到平均平方和(MeanSquaw)。 对SST来说,其自山度为(n-1);对SSA来说,其自由度为(「1),这里r表示水平的个数;对SSE来说,其自由度为(n-r)o与离差平方和一样,SST、SSA、SSE之间的自山度也存在着如下的关系: n-l=(r-1)+(n-r) 对于SSA,其平均平方MSA(组间均方差)为: F_MSA一MSE 对于SSE,其平均平方MSE(组内均方差)为: (3)检验统计量F 2.两因素方差分析 设两个因素A、B分别有k个水平和n个水平,共进行nk次试验。 (1)计算各项离差平方和 在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A、B项离差平方和。 总离差平方和,用SST(SumofSquaresforTotal)代表: SST=,,-兀) ==iJ? A: 式中: X表示全部样本观察值的总均值,其计算公式为: 戈=£工为勺 nkr-.i 水平项离差平方和可以分别用SSA(SumofSquaresforFactorA)和SSB(SumofSquaresforFactorB)表示。 误差离差平方和,用SSE(SumofSquaresforError)代表: (2)计算平均平方 用离差平方和除以自由度即可得到平均平方和(MeanSquare)。 对SST来说,其自由度为(nk-l);对SSA来说,其自由度为(k-1),这里k表示水平A的个数;对SSB来说,其自由度为(ml),这里n表示水平B的个数;对SSE来说,其自由度为(ml)(k・l)。 这样,把各项离差平方和除以各自的自山度,即得到平均的离差平方和,简称为均方: (3)检验统计量F 公式四 1.拟合优度的检验统计量: 式中: 表示类别i的观察频数;厶表示假设为真时,类别i的期望频数;k表示类别总数。 注意: 当所有种类的期望频数均大于或等于5时,检验统计量服从自山度为(k・l)的*分布。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 常用 公式