统计技术Word格式.docx
- 文档编号:15051826
- 上传时间:2022-10-27
- 格式:DOCX
- 页数:12
- 大小:713.98KB
统计技术Word格式.docx
《统计技术Word格式.docx》由会员分享,可在线阅读,更多相关《统计技术Word格式.docx(12页珍藏版)》请在冰豆网上搜索。
3.1.2例子:
5
3.2回归分析6
3.2.1说明:
6
3.2.2例子:
4.控制图7
4.1说明:
7
4.2例子:
5.统计抽样9
5.1说明:
9
5.2例子:
10
1.显著性检验(假设检验)
1.1说明:
假设检验(HypothesisTesting)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:
根据问题的需要对所研究的总体作某种假设,记作H0;
选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;
由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
1.2例子:
在雷达检测中,目标是产生假设的源,它可使用两个假设:
H1和H0,分别表示目标存在(H1)和不存在(H0)。
这是二元简单假设检验。
二元数字通信问题也是简单假设检验。
如果假设中含有目标未知参量,则是复合假设检验。
m元通信问题也是复合假设检验。
如果未知参量是随机变化的,则是随机参量信号的假设检验。
通信系统和雷达系统常用的最佳准则,是最小错误概率准则,即最大后验概率准则。
以雷达检测为例:
目标是源,它可使用的两个假设是H1和H0。
接收端收到样本X(雷达回波)后,判定H1为真(目标存在),或判定H0为真(目标不存在概率可分别表示为p(H1/x)和p(H0/x),称为后验概率。
最大后验概率准则的判决规则是,若
则判定H1为真(选择H1);
否则判定H0为真。
2.实验/试验设计
试验设计的三个基本原理是重复,随机化以及区组化。
所谓重复,意思是基本试验的重复进行。
重复有两条重要的性质。
第一,允许试验者得到试验误差的一个估计量。
这个误差的估计量成为确定数据的观察差是否是统计上的试验差的基本度量单位。
第二,如果样本均值用作为试验中一个因素的效应的估计量,则重复允许试验者求得这一效应的更为精确的估计量。
如s2是数据的方差,而有n次重复,则样本均值的方差是s2/n。
这一点的实际含义是,如果n=1,如果2个处理的y1=145,和y2=147,这时我们可能不能作出2个处理之间有没有差异的推断,也就是说,观察差147-145=2可能是试验误差的结果。
但如果n合理的大,试验误差足够小,则当我们观察得y1 随机化是试验设计使用统计方法的基石。
所谓随机化,是指试验材料的分配和试验的各个试验进行的次序,都是随机地确定的。
统计方法要求观察值(或误差)是独立分布的随机变量。
随机化通常能使这一假定有效。
把试验进行适当的随机化亦有助于“均匀”可能出现的外来因素的效应。
区组化是用来提高试验的精确度的一种方法。
一个区组就是试验材料的一个部分,相比于试验材料全体它们本身的性质应该更为类似。
区组化牵涉到在每个区组内部对感兴趣的试验条件进行比较。
常见的试验设计方法,可分为二类,一类是正交试验设计法,另一类是析因法。
第一类
正交试验设计法
①定义
正交试验设计法是研究与处理多因素试验的一种科学方法。
它利用一种规格化的表格——正交表,挑选试验条件,安排试验计划和进行试验,并通过较少次数的试验,找出较好的生产条件,即最优或较优的试验方案。
②用途
正交试验设计主要用于调查复杂系统(产品、过程)的某些特性或多个因素对系统(产品、过程)某些特性的影响,识别系统中更有影响的因素、其影响的大小,以及因素间可能存在的相互关系,以促进产品的设计开发和过程的优化、控制或改进现有的产品(或系统)。
③表格形式
第二类
析因法
①定义析
因法又称析因试验设计、析因试验等。
它是研究变动着的两个或多个因素效应的有效方法。
许多试验要求考察两个或多个变动因素的效应。
例如,若干因素:
对产品质量的效应;
对某种机器的效应;
对某种材料的性能的效应;
对某一过程燃烧消耗的效应等等。
将所研究的因素按全部因素的所有水平(位级)的一切组合逐次进行试验,称为析因试验,或称完全析因试验,简称析因法。
用于新产品开发、产品或过程的改进、以及安装服务,通过较少次数的试验,找到优质、高产、低耗的因素组合,达到改进的目的。
1.水稻播种机穴盘育秧播种装置的试验设计
随着栽培技术的不断更新,高效、节本、高产的抛秧栽培法获得了迅速发展和推广。
为了改善原有播种装置中窝眼辊轮结构,我们研制成功了穴盘育秧播种装置,它不仅解决了手工操作进行育秧培育的劳动强度大,工作效率低等问题,而且能大幅度地提高播种量的稳定性和播种的均匀性,使水稻播种机械更趋实用与完善。
(1)试验目的 考虑影响播种性能的主要因素对水稻播种机穴盘育秧播种装置播种性能的影响程度,以达到优化设计参数。
(2)试验条件 种子品种:
杂交稻(协优46号)
(3)试验因素 A.可变因素
选用三个可变因素:
生产率(盘/小时)、播种量(粒/穴)、投种高度(mm)。
2.正交试验方案与试验结果分析
(1)正交试验方案与试验结果 选用L9(34)正交表进行试验设计,试验方案与试验结果见下表所示。
其数据采集方法为:
在每种工况(每个试验号)条件下进行随机抽样3盘测定,测定播种合格率时,每盘随机连片抽样100穴。
最后,把3次测定的各项数据的平均值记入试验结果。
3.
3.方差分析和回归分析
3.1方差分析
方差分析(AnalysisofVariance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状。
造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。
某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶(ACE)的影响,将26只家兔随机分为四组,均喂以高脂饮食,其中三个试验组,分别给予不同的降血脂药物,对照组不给药。
一定时间后测定家兔血清ACE浓度(u/ml),如表5.1,问四组家兔血清ACE浓度是否相同?
本例的初步计算结果见表5.1下部,方差分析的计算步骤为
1)建立检验假设,确定检验水准
H0:
四组家兔的血清ACE浓度总体均数相等,μ1=μ2=μ3=μ4
H1:
四组家兔的血清ACE浓度总体均数不等或不全相等,各μi不等或不全相等
α=0.05
2)计算统计量F值
按表5.2所列公式计算有关统计量和F值
=5515.3665
ν总=N-1=26-1=25
ν组间=k-1=4-1=3
ν组内=N-K=26-4=22
表5.3例5.1的方差分析表
变异来源
总变异
8445.7876
25
组间变异
5515.3665
3
1838.4555
13.80
组内变异
2930.4211
22
133.2010
3)确定P值,并作出统计推断
以=3和=22查F界值表(方差分析用),得P<
0.01,按0.05水准拒绝H0,接受H1,可认为四总体均数不同或不全相同。
注意:
根据方差分析的这一结果,还不能推断四个总体均数两两之间是否相等。
如果要进一步推断任两个总体均数是否相同,应作两两比较
3.2回归分析
回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
运用十分广泛,回归分析按照涉及的因变量的多少,分为回归和多重回归分析;
按照自变量的多少,可分为一元回归分析和多元回归分析;
按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
SIM手机用户满意度与相关变量线性回归分析
我们以SIM手机的用户满意度与相关变量的线性回归分析为例,来进一步说明线性回归的应用。
从实践意义讲上,手机的用户满意度应该与产品的质量、价格和形象有关,因此我们以“用户满意度”为因变量,“质量”、“形象”和“价格”为自变量,作线性回归分析。
利用SPSS软件的回归分析,得到回归方程如下:
用户满意度=0.008×
形象+0.645×
质量+0.221×
价格
对于SIM手机来说,质量对其用户满意度的贡献比较大,质量每提高1分,用户满意度将提高0.645分;
其次是价格,用户对价格的评价每提高1分,其满意度将提高0.221分;
而形象对产品用户满意度的贡献相对较小,形象每提高1分,用户满意度仅提高0.008分。
方程各检验指标及含义如下:
指标
显著性水平
意义
R2
0.89
“质量”和“价格”解释了89%的“用户满意度”的变化程度
F
248.53
0.001
回归方程的线性关系显著
T(形象)
0.00
1.000
“形象”变量对回归方程几乎没有贡献
T(质量)
13.93
“质量”对回归方程有很大贡献
T(价格)
5.00
“价格”对回归方程有很大贡献
从方程的检验指标来看,“形象”对整个回归方程的贡献不大,应予以删除。
所以重新做“用户满意度”与“质量”、“价格”的回归方程如下:
满意度=0.645×
用户对价格的评价每提高1分,其满意度将提高0.221分(在本示例中,因为“形象”对方程几乎没有贡献,所以得到的方程与前面的回归方程系数差不多)。
R
374.69
15.15
5.06
4.控制图
控制图(Controlchart)就是对生产过程的关键质量特性值进行测定、记录、评估并监测过程是否处于控制状态的一种图形方法。
根据假设检验的原理构造一种图,用于监测生产过程是否处于控制状态。
它是统计质量管理的一种重要手段和工具。
5.统计抽样
定义:
统计抽样是指同时具备下列特征的抽样方法:
(1)随机选取样本;
(2)运用概率论评价样本结果。
不同时具备上述两个特征的抽样方法为非统计抽样。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 技术