excel中的概率统计非常好的资料Word文档格式.docx
- 文档编号:22484393
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:62
- 大小:631.66KB
excel中的概率统计非常好的资料Word文档格式.docx
《excel中的概率统计非常好的资料Word文档格式.docx》由会员分享,可在线阅读,更多相关《excel中的概率统计非常好的资料Word文档格式.docx(62页珍藏版)》请在冰豆网上搜索。
函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号.如果函数以公式的形式出现,请在函数名称前面键入等号(=).当生成包含函数的公式时,公式选项板将会提供相关的帮助.
使用公式的步骤:
A.单击需要输入公式的单元格.
B.如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮.
C.单击“函数”下拉列表框右端的下拉箭头.
D.单击选定需要添加到公式中的函数.如果函数没有出现在列表中,请单击“其它函数”查看其它函数列表.
E.输入参数.
F.完成输入公式后,请按ENTER键.
1.2几种常见的统计函数
1.2.1均值
Excel计算平均数使用AVERAGE函数,其格式如下:
AVERAGE(参数1,参数2,…,参数30)
范例:
AVERAGE(12.6,13.4,11.9,12.8,13.0)=12.74
如果要计算单元格中A1到B20元素的平均数,可用AVERAGE(A1:
B20).
1.2.2标准差
计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果称作样本标准差,而依据总体计算的结果称作总体标准差.
(1)样本标准差
Excel计算样本标准差采用无偏估计式,STDEV函数格式如下:
STDEV(参数1,参数2,…,参数30)
范例:
STDEV(3,5,6,4,6,7,5)=1.35
如果要计算单元格中A1到B20元素的样本标准差,可用STDEV(A1:
(2)总体标准差
Excel计算总体标准差采用有偏估计式STDEVP函数,其格式如下:
STDEVP(参数1,参数2,…,参数30)
范例:
STDEVP(3,5,6,4,6,7,5)=1.25
1.2.3方差
方差为标准差的平方,在统计上亦分样本方差与总体方差.
(1)样本方差
S2=
Excel计算样本方差使用VAR函数,格式如下:
VAR(参数1,参数2,…,参数30)
如果要计算单元格中A1到B20元素的样本方差,可用VAR(A1:
VAR(3,5,6,4,6,7,5)=1.81
(2)总体方差
Excel计算总体方差使用VARP函数,格式如下:
VARP(参数1,参数2,…,参数30)
VAR(3,5,6,4,6,7,5)=1.55
1.2.4正态分布函数
Excel计算正态分布时,使用NORMDIST函数,其格式如下:
NORMDIST(变量,均值,标准差,累积)
其中:
变量(x):
为分布要计算的x值;
均值(μ):
分布的均值;
标准差(σ):
分布的标准差;
累积:
若为TRUE,则为分布函数;
若为FALSE,则为概率密度函数.
已知X服从正态分布,μ=600,σ=100,求P{X≤500}.输入公式
=NORMDIST(500,600,100,TRUE)
得到的结果为0.158655,即P{X≤500}=0.158655.
1.2.5正态分布函数的反函数
Excel计算正态分布函数的反函数使用NORMINV函数,格式如下:
NORMINV(下侧概率,均值,标准差)
已知概率P=0.841345,均值μ=360,标准差σ=40,求NORMINV函数的值.输入公式
=NORMINV(0.841345,360,40)
得到结果为400,即P{X≤400}=0.841345.
注意:
(1)NORMDIST函数的反函数NORMINV用于分布函数,而非概率密度函数,请务必注意;
(2)Excel提供了计算标准正态分布函数NORMSDIST(x),及标准正态分布的反函数NORMSINV(概率).
已知X~N(0,1),计算
=P{X<
2}.输入公式
=NORMSDIST
(2)
得到0.97725,即
=0.97725.
输入公式=NORMSINV(0.97725),得到数值2.
若求临界值uα(n),则使用公式=NORMSINV(1-α).
1.2.6t分布
Excel计算t分布的值(查表值)采用TDIST函数,格式如下:
TDIST(变量,自由度,侧数)
变量(t):
为判断分布的数值;
自由度(v):
以整数表明的自由度;
侧数:
指明分布为单侧或双侧:
若为1,为单侧;
若为2,为双侧.
设T服从t(n-1)分布,样本数为25,求P(T>
1.711).
已知t=1.711,n=25,采用单侧,则T分布的值:
=TDIST(1.711,24,1)
得到0.05,即P(T>
1.711)=0.05.
若采用双侧,则T分布的值:
=TDIST(1.711,24,2)
得到0.1,即
.
1.2.7t分布的反函数
Excel使用TINV函数得到t分布的反函数,格式如下:
TINV(双侧概率,自由度)
已知随机变量服从t(10)分布,置信度为0.05,求t
(10).输入公式
=TINV(0.05,10)
得到2.2281,即
若求临界值tα(n),则使用公式=TINV(2*α,n).
已知随机变量服从t(10)分布,置信度为0.05,求t0.05(10).输入公式
=TINV(0.1,10)
得到1.812462,即t0.05(10)=1.812462.
1.2.8F分布
Excel采用FDIST函数计算F分布的上侧概率
,格式如下:
FDIST(变量,自由度1,自由度2)
判断函数的变量值;
自由度1(
):
代表第1个样本的自由度;
自由度2(
代表第2个样本的自由度.
设X服从自由度
=5,
=15的F分布,求P(X>
2.9)的值.输入公式
=FDIST(2.9,5,15)
得到值为0.05,相当于临界值α.
1.2.9F分布的反函数
Excel使用FINV函数得到F分布的反函数,即临界值
,格式为:
FINV(上侧概率,自由度1,自由度2)
已知随机变量X服从F(9,9)分布,临界值α=0.05,求其上侧0.05分位点F0.05(9,9).输入公式
=FINV(0.05,9,9)
得到值为3.178897,即F0.05(9,9)=3.178897.
若求单侧百分位点F0.025(9,9),F0.975(9,9).可使用公式
=FINV(0.025,9,9)
=FINV(0.975,9,9)
得到两个临界值4.025992和0.248386.
若求临界值Fα(n1,n2),则使用公式=FINV(α,n1,n2).
1.2.10卡方分布
Excel使用CHIDIST函数得到卡方分布的上侧概率
,其格式为:
CHIDIST(数值,自由度)
数值(x):
要判断分布的数值;
自由度(v):
指明自由度的数字.
若X服从自由度v=12的卡方分布,求P(X>
5.226)的值.输入公式
=CHIDIST(5.226,12)
得到0.95,即
=0.95或
=0.05.
1.2.11卡方分布的反函数
Excel使用CHIINV函数得到卡方分布的反函数,即临界值
.格式为:
CHIINV(上侧概率值α,自由度n)
下面的公式计算卡方分布的反函数:
=CHIINV(0.95,12)
得到值为5.226,即
=5.226.
若求临界值
(n),则使用公式=CHIINV(α,n).
1.2.12泊松分布
计算泊松分布使用POISSON函数,格式如下:
POISSON(变量,参数,累计)
变量:
表示事件发生的次数;
参数:
泊松分布的参数值;
累计:
若TRUE,为泊松分布函数值;
若FALSE,则为泊松分布概率分布值.
设X服从参数为4的泊松分布,计算P{X=6}及P{X≤6}.输入公式
=POISSON(6,4,FALSE)
=POISSON(6,4,TRUE)
得到概率0.104196和0.889326.
在下面的实验中,还将碰到一些其它函数,例如:
计算样本容量的函数COUNT,开平方函数SQRT,和函数SUM,等等.关于这些函数的具体用法,可以查看Excel的关于函数的说明,不再赘述.
2区间估计实验
计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.
2.1单个正态总体均值与方差的区间估计:
2.1.1σ2已知时μ的置信区间
置信区间为
例1随机从一批苗木中抽取16株,测得其高度(单位:
m)为:
1.141.101.131.151.201.121.171.191.151.121.141.201.231.111.141.16.设苗高服从正态分布,求总体均值μ的0.95的置信区间.已知σ=0.01(米).
步骤:
(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:
G5内输入样本数据.
(2)计算置信下限和置信上限.可以在数据区域B3:
G5以外的任意两个单元格内分别输入如下两个表达式:
=average(b3:
g5)-normsinv(1-0.5*
)*
/sqrt(count(b3:
g5))
g5)+normsinv(1-0.5*
上述第一个表达式计算置信下限,第二个表达式计算置信上限.其中,显著性水平
和标准差
是具体的数值而不是符号.本例中,α=0.05,
,上述两个公式应实际输入为
g5)-normsinv(0.975)*0.01/sqrt(count(b3:
g5)+normsinv(0.975)*0.01/sqrt(count(b3:
计算结果为(1.148225,1.158025).
2.1.2σ2未知时μ的置信区间
置信区间为
例2同例1,但
未知.
输入公式为:
g5)-tinv(0.05,count(b:
3:
g5)-1)*stdev(b3:
g5)/sqrt(count(b3:
计算结果为(1.133695,1.172555).
2.1.3μ未知时σ2的置信区间:
置信区间为
例3从一批火箭推力装置中随机抽取10个进行试验,它们的燃烧时间
(单位:
s)如下:
50.754.954.344.842.269.853.466.148.134.5
试求总体方差
的0.9的置信区间(设总体为正态).
操作步骤:
(1)在单元格B3:
C7分别输入样本数据;
(2)在单元格C9中输入样本数或输入公式=COUNT(B3:
C7);
(3)在单元格C10中输入置信水平0.1.
(4)计算样本方差:
在单元格C11中输入公式=VAR(B3:
C7)
(5)计算两个查表值:
在单元格C12中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)
(6)计算置信区间下限:
在单元格C14中输入公式=(C9-1)*C11/C12
(7)计算置信区间上限:
在单元格C15中输入公式=(C9-1)*C11/C13.
当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:
=(count(b3:
c7)-1)*var(b3:
c7)/chiinv(0.1/2,count(b3:
c7)-1)
c7)/chiinv(1-0.1/2,count(b3:
2.2
两正态总体均值差与方差比的区间估计
2.2.1当σ12=σ22=σ2但未知时μ1-μ2的置信区间
例4在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5和7,分析其蛋白质含量为
甲:
12.613.411.912.813.0
乙:
13.113.412.813.513.312.712.4
蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差μ
-μ
所在的范围.(取α=0.05)
实验步骤:
(1)在A2:
A6输入甲组数据,在B2:
B8输入乙组数据;
(2)在单元格B11输入公式=AVERAGE(A2:
A6),在单元格B12中输入公式=AVERAGE(B2:
B8),分别计算出甲组和乙组样本均值.
(3)分别在单元格C11和C12分别输入公式=VAR(A2:
A6),=VAR(B2:
B8),计算出两组样本的方差.
(4)在单元格D11和D12分别输入公式=COUNT(A2:
A6),=COUNT(B2:
B8),计算各样本的容量大小.
(5)将显著性水平0.05输入到单元格E11中.
(6)分别在单元格B13和B14输入
=B11-B12-TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/5+1/7)
和
=B11-B12+TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/5+1/7)
计算出置信区间的下限和上限.
2.2.2μ1和μ2未知时方差比σ
/σ
的置信区间
.
例5有两个化验员A、B,他们独立地对某种聚合物的含氯量用相同的方法各作了10次测定.其测定值的方差分别是S
=0.5419,S
=0.6065.设σ
和σ
分别是A、B所测量的数据总体(设为正态分布)的方差.求方差比σ
的0.95置信区间.
操作步骤:
(1)在单元格B2,B3输入样本数,C2,C3输入样本方差,D2输入置信度.
(2)在B4和B5利用公式输入
=C2/(C3*FINV(1-D2/2,B2-1,B3-1))
=C2/(C3*FINV(D2/2,B2-1,B3-1))
计算出A组和B组的方差比的置信区间上限和下限.
2.3练习题
1.已知某树种的树高服从正态分布,随机抽取了该树种的60株林木组成样本.样本中各林木的树高资料如下(单位:
m)
22.3,21.2,19.2,16.6,23.1,23.9,24.8,26.4,26.6,24.8,23.9,23.2,23.3,21.4,19.8,18.3,20.0,21.5,18.7,22.4,26.6,23.9,24.8,18.8,27.1,20.6,25.0,22.5,23.5,23.9,25.3,23.5,22.6,21.5,20.6,25.8,24.0,23.5,22.6,21.8,20.8,19.5,20.9,22.1,22.7,23.6,24.5,23.6,21.0,21.3,22.4,18.7,21.3,15.4,22.9,17.8,21.7,19.1,20.3,19.8
试以0.95的可靠性,对于该林地上全部林木的平均高进行估计.
2.从一批灯泡中随机抽取10个进行测试,测得它们的寿命(单位:
100h)为:
50.7,54.9,54.3,44.8,42.2,69.8,53.4,66.1,48.1,34.5.
试求总体方差的0.9的置信区间(设总体为正态).
3.已知某种玉米的产量服从正态分布,现有种植该玉米的两个实验区,各分为10个小区,各小区的面积相同,在这两个实验区中,除第一实验区施以磷肥外,其它条件相同,两实验区的玉米产量(kg)如下:
第一实验区:
62576560635857606058
第二实验区:
56595657605857555755
试求出施以磷肥的玉米产量均值和未施以磷肥的玉米产量均值之差的范围(α=0.05)
3假设检验实验
实验内容:
单个总体均值的假设检验;
两个总体均值差的假设检验;
两个正态总体方差齐性的假设检验;
拟合优度检验.
实验目的与要求:
(1)理解假设检验的统计思想,掌握假设检验的计算步骤;
(2)掌握运用Excel进行假设检验的方法和操作步骤;
(3)能够利用试验结果的信息,对所关心的事物作出合理的推断.
3.1单个正态总体均值μ的检验
3.1.1σ2已知时μ的U检验
例1外地一良种作物,其1000m2产量(单位:
kg)服从N(800,502),引入本地试种,收获时任取5块地,其1000m2产量分别是800,850,780,900,820(kg),假定引种后1000m2产量X也服从正态分布,试问:
(1)若方差未变,本地平均产量μ与原产地的平均产量μ
=800kg有无显著变化.
(2)本地平均产量μ是否比原产地的平均产量μ
=800kg高.
(3)本地平均产量μ是否比原产地的平均产量μ
=800kg低.
操作步骤:
(1)先建一个如下图所示的工作表:
(2)计算样本均值(平均产量),在单元格D5输入公式=AVERAGE(A3:
E3);
(3)在单元格D6输入样本数5;
(4)在单元格D8输入U检验值计算公式=(D5-800)/(50/SQRT(D6);
(5)在单元格D9输入U检验的临界值=NORMSINV(0.975);
(6)根据算出的数值作出推论.本例中,U的检验值1.341641小于临界值1.959961,故接受原假设,即平均产量与原产地无显著差异.
(7)注:
在例1中,问题
(2)要计算U检验的右侧临界值:
在单元格D10输入U检验的上侧临界值=NORMSINV(0.95).问题(3)要计算U检验的下侧临界值,在单元格D11输入U检验下侧的临界值=NORMSINV(0.05).
3.1.2σ2未知时的t检验
例2某一引擎制造商新生产某一种引擎,将生产的引擎装入汽车内进行速度测试,得到行驶速度如下:
250238265242248258255236245261
254256246242247256258259262263
该引擎制造商宣称引擎的平均速度高于250km/h,请问样本数据在显著性水平为0.025时,是否和他的声明抵触?
操作步骤:
(1)先建如图所示的工作表:
(2)计算样本均值:
在单元格D8输入公式=AVERAGE(A3:
E6);
(3)计算标准差:
在单元格D9输入公式=STDEV(A3:
(4)在单元格D10输入样本数20.
(5)在单元格D11输入t检验值计算公式=(D8-250)/(D9/(SQRT(D10)),得到结果1.06087;
(6)在单元格D12输入t检验上侧临界值计算公式=TINV(0.05,D10-1).
欲检验假设
H0:
μ=250;
:
μ>
250.
已知t统计量的自由度为(n-1)=20-1=19,拒绝域为t>
t
=2.093.由上面计算得到t检验统计量的值1.06087落在接收域内,故接收原假设H0.
3.2两个正态总体参数的假设检验
3.2.1当σ12=σ22=σ2但未知时
的检验
在此情况下,采用t检验.
例 试验及观测数据同11.2中的练习题3,试判别磷肥对玉米产量有无显著影响?
欲检验假设
μ1=μ2;
μ1>
μ2.
(1)建立如图所示工作表:
(2)选取“工具”—“数据分析”;
(3)选定“t-检验:
双样本等方差假设”.
(4)选择“确定”.显示一个“t-检验:
双样本等方差假设”对话框;
(5)在“变量1的区域”输入A2:
A11.
(6)在“变量2的区域”输入B2:
B11.
(7)在“输出区域”输入D1,表示输出结果放置于D1向右方的单元格中.
(8)在显著水平“α”框,输入0.05.
(9)在“假设平均差”窗口输入0.
(10)选择“确定”,计算结果如D1:
F14显示.
得到t值为3.03,“t单尾临界”值为1.734063.由于3.03>
1.73,所以拒绝原假设,接收备择假设,即认为使用磷肥对提高玉米产量有显
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- excel 中的 概率 统计 非常好 资料