统计学常用公式.docx
- 文档编号:4551217
- 上传时间:2022-12-06
- 格式:DOCX
- 页数:21
- 大小:22KB
统计学常用公式.docx
《统计学常用公式.docx》由会员分享,可在线阅读,更多相关《统计学常用公式.docx(21页珍藏版)》请在冰豆网上搜索。
统计学常用公式
公式一
1.众数【MODE】
(1〕未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2〕组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面
的公式计算计算众数的近似值。
下限公式:
M
0=L+
1
i
1+
2
式中:
M0表示众数;L表示众数的下线;
1表示众数组次数与上一组次数之差;
2表示
众数组次数与下一组次数之差;
i表示众数组的组距。
2
上限公式:
M0=U-i
1+2
式中:
U表示众数组的上限。
2.中位数【MEDIAN】
(1〕未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。
设一组数
据按从小到大排序后为X1,X2,⋯,XN,中位数Me,为那么有:
Me=X〔N+1〕
当N为奇数
2
1
Me=X
N
+XN
当N为偶数
2
2
+1
〔2〕分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N/2确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
N
i=1
fi
-Sm-1
2
Me=L+
d
fm
式中:
Me表示中位数;L表示中位数所在组的下限;Sm-1表示中位数所在组以下各组的累
计次数;fm表示中位数所在组的次数;d表示中位数所在组的组距。
精品文库
3.均值的计算【AVERAGE】
〔1〕未分均的算
n
x1
+x2+⋯xn
xi
未分数据均的算公式:
i1
x=
=
n
n
〔2〕分数据均算
k
xf+xf+
+xf
xifi
分数据均的算公式:
k=
x=11
22
k
i
k
1
f1
f2+
+fk
fi
i1
4.几何平均数【GEOMEAN】
几何平均数是N个量乘的N次方根,算公式:
n
G=nx1x2⋯xn=nxi
i-1
式中:
G表示几何平均数;表示乘符号。
5.调和平均数【HARMEAN】
和平均数是量的倒数求平均,然后再取倒数而得到的平均数,它有和平均数与加和平均数两种算形式。
和平均数:
n
n
H=1
1
⋯
1=n
1
+
x
+
+
x
x
i1xi
1
2
n
n
m1+m2+⋯+mn
mi
加和平均数:
i
1
H=m1
m2
mn
=nmi
⋯
+
+
+
1xi
x1
x
2
xn
i
式中:
H表示和平均数。
欢送下载2
精品文库
6.极差【Range】
极差也称全距,是一组数据的最大值与最小值之差,即
R=maxx-mxin
ii
式中:
R表示极差;maxx和minx分别表示一组数据的最大值与最小值。
ii
7.平均差【MeanDeviation】
平均差是各标志值与其平均数的绝对离差的算术平均。
n
x-x
〔1〕根据未分组资料的计算公式:
i
AD=i1
n
n
x-xfi
〔2〕根据分组资料的计算公式:
AD=i1
i
n
fi
i1
式中:
AD表示平均差
8.方差【Variance】和标准差【StandardDeviation】
方差是各变量值与其均值离差平方的平均数。
要求掌握方差和标准差的计算方法。
未分组数据方差的计算公式为:
分组数据方差的计算公式为:
n
2
xx
2i1
n
n
2
2
xi
xif
i1
n
fi
i
1
欢送下载3
精品文库
式中:
2表示方差。
方差的平方根即为标准差,其相应的计算公式为:
n
2
xx
未分组数据:
i1
n
n
2
xi
xif
分组数据:
i1
n
fi
i
1
式中:
表示标准差。
9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。
其计算公式为:
V
x
式中:
V表示离散系数。
10.偏态【SKEW】
偏态是对分布偏斜方向及程度的测度。
利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。
显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。
n
3
n
xi-x
EXCEL中偏态系数的计算公式为:
s
n-1n-2i1
11.峰值【KURT】
EXCEL中峰值系数的计算公式为:
欢送下载4
精品文库
n
4
2
nn1
xi-x
3n1
n1n2n3i1
s
n1n3
式中:
s表示样本标准差。
公式二
1.均值估计
〔1〕样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样
误差水平。
样本均值的抽样平均误差计算公式为:
重复抽样方式:
x2nn
不重复抽样方式:
2
N
n
x
N
1
n
通常情况下,当N很大时,〔N-1〕几乎等于N,样本均值的抽样平均误差的计算公式也可简化为:
2
n
x
1
n
N
在公式中,是总体标准差。
但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S代替。
〔2〕大样本均值的极限误差xZ2x
(3〕大样本下总体均值的区间估计
总体均值的置信度为〔1〕的置信区间:
xz2xxz2x即xz2xz2
nn
欢送下载5
精品文库
(4〕总体方差未知,小样本正态总体均值的区间估计总体均值的置信度为〔1〕的置信区间:
xt2xxt2x
即
xt
s
xt
s
2
2
n
n
2.比例估计
(1〕样本比例的抽样平均误差样本比例的抽样平均误差为:
重复抽样下:
p
p1
p
n
上式中,p应为总体比例,实际计算时通常用样本比例
p代替。
不重复抽样下:
p1p
N
n
p1p
n
p
N
1
n
1
n
N
〔2〕样本比例的抽样极限误差
PZ2p
〔3〕总体比率的区间估计
总体比例P的置信度为〔1〕的置信区间为:
pPppP
即pZ2pppZ2p
3.总体均值检验
〔1〕单一总体均值检验
欢送下载6
精品文库
①正态总体〔总体方差〕或大样本均值检验
检验统计量Z为:
x
0
Z
n
②正态总体〔总体方差未知〕小样本均值检验
检验统计量t为:
x
0
t
n
s
(2〕两个总体的均值检验①两个正态总体均值检验——两个总体方差或大样本
Z检验统计量为:
x1x2-
1
2
Z
2
2
1
2
n1
n2
大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。
②两个正态总体均值检验〔小样本〕——两个总体方差未知但相等
T检验统计量为:
x1x2-
1
2
Z
11spn1n2
n11s12
n21s22
sp
n2
2
n1
2
2
其中:
s121
n1
1
n2
xix1;s22
xix2
n1
1i1
n2
1i1
4.总体比例检验
欢送下载7
精品文库
〔1〕单一总体的比例检验
Z检验统计量:
p
p0
Z
p0
1
p0
n
〔2〕两个总体比例的检验
?
?
检验的统计量为:
Z
p1
p2
?
1
?
?
1
?
p
p
p
p
n1
n2
?
?
?
n1p1
n2p2
其中:
?
,
p
为当
p1
p2时p1
和p2
的联合估计值。
p
n1
n2
5.总体方差假设检验
〔1〕单一正态总体方差的假设检验
检验统计量为:
2n1s2
2
0
n
2
x
x
2
i1
i
2
其中:
s
为
的估计量。
n1
(2〕两个正态总体的方差假设检验
检验统计量为:
Fs12s22
n1
2
n2
2
2i1
xi
x
2i1
xi
x
其中:
;
。
s1
n1
1
s2
n2
1
公式三
1.单因素方差分析
欢送下载8
精品文库
设总体共分为k种处理进行观察,第j种处理试验了容量为nj的样本。
〔1〕计算各项离差平方和
在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。
总离差平方和,用SST〔Sumof
SquaresforTotal〕代表:
nj
k
2
SST
xijx
i1
j
1
式中:
x表示全部样本观测值的总均值。
其计算公式为:
x
xij
n
误差离差平方和,用SSE〔SumofSquaresforError〕代表:
nj
2
k
SSE
xijxj
i1
j1
nj
xij
i1
式中:
xj表示第j种水平的样本均值,xj
nj
水平项离差平方和。
为了后面表达方便,可以把单因素方差分析中的因素称为A。
于是水平项离差平方和可以用SSA〔SumofSquaresforFactorA〕表示。
nj
2
k
SSA的计算公式为:
SSAxjx
i1j1
〔2〕计算平均平方
用离差平方和除以自由度即可得到平均平方和〔MeanSquare〕。
对SST来说,其自由度
为〔n-1〕;对SSA来说,其自由度为〔r-1〕,这里r表示水平的个数;对SSE来说,其自由度为〔n-r〕。
与离差平方和一样,SST、SSA、SSE之间的自由度也存在着如下的关系:
n-1=〔r-1〕+〔n-r〕
对于SSA,其平均平方MSA〔组间均方差〕为:
SSA
MSA
r1
欢送下载9
精品文库
对于SSE,其平均平方MSE〔组内均方差〕为:
SSE
MSE
nr
〔3〕检验统计量F
MSA
F
MSE
2.两因素方差分析
设两个因素A、B分别有k个水平和n个水平,共进行nk次试验。
〔1〕计算各项离差平方和
在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A、B项离差平方和。
2
总离差平方和,用SST〔SumofSquaresforTotal〕代表:
SSTxijx
nk
1
式中:
x表示全部样本观察值的总均值,其计算公式为:
xxij
nki1j1
水平项离差平方和可以分别用SSA〔SumofSquaresforFactorA〕和SSB〔SumofSquaresforFactorB〕表示。
n
k
2
SSA的计算公式为:
SSA
xjx
i1
j1
式中:
1
xj
n
n
xij
i1
n
k
2
SSB的计算公式为:
SSB
xix
i1
j
1
式中:
1
k
xij
xi
k
j
1
误差离差平方和,用SSE〔SumofSquaresforError〕代表:
n
k
2
SSE
xij
xixjx
i1
j1
〔2〕计算平均平方
用离差平方和除以自由度即可得到平均平方和
〔MeanSquare〕。
对SST来说,其自由度为
〔nk-1〕;对SSA来说,其自由度为〔k-1〕,这里k表示水平A的个数;对SSB来说,其自由
欢送下载10
精品文库
度为〔n-1〕,这里n表示水平B的个数;对SSE来说,其自由度为〔n-1〕〔k-1〕。
这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方:
SSASSBSSE
MSAMSBMSE
k1n1k1n1
〔3〕检验统计量F
MSAMSB
F(A)F(B)
MSEMSE
公式四
1.拟合优度的检验统计量:
k
2
fi
fe
2
i1
fe
式中:
fi表示类别i的观察频数;fe表示假设H0为真时,类别i的期望频数;k表示类别总数。
注意:
当所有种类的期望频数均大于或等于5时,检验统计量服从自由度为〔k-1〕的2分布。
欢送下载11
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 常用 公式