食品试验设计与统计分析期末复习资料.docx
- 文档编号:27855916
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:38
- 大小:130.50KB
食品试验设计与统计分析期末复习资料.docx
《食品试验设计与统计分析期末复习资料.docx》由会员分享,可在线阅读,更多相关《食品试验设计与统计分析期末复习资料.docx(38页珍藏版)》请在冰豆网上搜索。
食品试验设计与统计分析期末复习资料
第一早
1.统计学:
研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学的推断。
因而统计学是认识世界的重要手段。
2.食品试验设计与统计分析:
数理统计原理与方法在食品科学研究中的应用,是一门应用数学。
3.食品试验科学的特点:
1.食品原料的广泛性2•生产工艺的多样性3.质量控制的重要性4.不同学科的综合性
4.统计学发展概貌:
古典记录统计学、近代描述统计学、现代推断统计学。
第二早
5.总体:
根据研究目的确定的研究对象的全体。
6.个体:
总体中一个独立的研究单位。
7.样本:
根据一定方法从总体中抽取部分个体组成的集合。
8.样本含量n(样本容量):
即样本中个体的数目。
(n<30的样本叫小样本,n>30的样本叫大样本)
9.随机样本:
总体中的每一个个体都有同等机会被抽取组成样本。
10.参数:
由总体计算的特征数。
11.统计量:
由样本计算的特征数。
12.参数和统计量的关系:
由相应的统计量来估计参数,如样本平均数估计总体平均数,样本标准差估计总体标
准差。
13.准确性(准确度):
在调查或试验中某一实验指标或性状的观测值与真实值接近的程度。
(观测值与真实值之间)
14.精确性(精确度):
在调查或试验中同一实验指标或性状的重复观测值彼此接近的程度。
(观测值与观测值之间)
15.试样中的误差:
随机误差和系统误差。
16.随机误差(抽样误差):
由许多无法控制的内在和外在偶然因素所造成的误差,不可避免和消除,影响试验的精确性。
17.系统误差(片面误差):
由于试验对象相差较大,测量的仪器不准、标准试剂未经校正所引起,可以通过改进方法、正确试验设计来避免、消除,影响试验准确性。
18.资料的分类:
连续性资料:
对每个观测值单位使用仪器或试剂等量测手段来测定其某项指标的数值大小而得
至U的资料。
间断性资料:
用计数方式得到的数据资料。
分类资料:
可自然或人为地分为两个或多个不同类别的资料。
等级资料:
将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数
而得的资料。
19.连续性资料的整理:
采用组距式分组
1.求全距2.确定组数3.求组距4.确定组限和组中值(最小值为下限,最大值为上限。
第一组的组中值以接近于或等于资料中最小值为好。
)5.制作次数分布表
20.统计表的绘制原则:
结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和分析
21.统计表种类:
简单表,复合表
22.统计图用图形将统计资料形象化。
长条图、圆图、线图、直方图、折线图。
23.平均数豪:
指出资料中数据集中较多的中心位置,描述资料的集中性。
反应了总体分布的集中趋势。
24.平均数的种类:
算术平均数、中数、众数、几何平均数、调和平均数。
25.算数平均数计算方法:
直接法、加权法
26.算数平均数的特性:
离均差为0,离均差平方和最小。
27.离均差:
每个观测值均有一个偏离平均数的度量指标。
算术平均数的离均差之和为零。
28.离均差平方和:
各个离均差平方后相加。
29.方差(MS):
也称均方,各数据与平均数的差的平方和与自由度的比。
样本方差用S2表示。
(无单位)
30.自由度df:
样本内独立而能自由变动的离均差个数。
31.标准差:
样本方差的算术平方根。
(有单位,与观测值单位相同)
32.标准差的特性:
1.标准差的大小受每个观测值的影响,若数值之间变异大,其离均差亦大,标准差必然大。
2.各观测值加或减同一常数,标准差的值不变。
3.每个观测值乘以或除以一个不等于0的常数A时,所得标准差是原标准差的A倍或1/A。
33.样本标准差:
EXCEL用STDEV函数计算。
34.变异系数CV:
标准差相对于平均数的百分数。
反映了总体的可比程度。
CV=2*100%
X
35.变异系数的作用:
当资料所带的单位不同或单位虽然相同而平均数相差较大时,不能直接用标准差比较各个
样本资料的变异程度大小。
消除了不同单位和平均数的影响。
第二早
36.伯努利试验:
只有两种实验结果的随机试验。
37.N重伯努利试验:
伯努利试验在完全相同的实验条件下独立的重复n次,并作为一个随机试验。
38.二项分布(n,p):
离散型随机变量分布。
亠kkn_k
P(x=k)=Cpq(k=0,1,2,3…,n)
39.二项分布的特征n
1.Pn(K)>02.(p+q)n=13.在一定范围内的总概率P等于被包含的几个概率之和。
4.当p值较小且n不大时,分布是偏倚的。
随着n的增大,分布逐渐趋于对称。
5.当p值趋于0.5时,分布趋于对称。
40.二项分布的应用条件:
(1)试验结果为两大类或两种可能的结果。
(2)每次试验的条件不变,每次试验A的发生概率均为n。
(3)各次试验独立,每个观察单位的观察结果不会影响到其他观察单位的结果。
41.二项分布的平均数:
亠np
42.二项分布的方差:
;^=npq
43.泊松分布XfP(h):
可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的分布。
(即小概率事件
分布,意外事故、自然灾害都近似服从)
P(x=k)=
k!
44.泊松分布特点:
离散型随机变量概率分布,均值与方差相等。
尸/=入。
45.泊松分布的应用条件:
1.随机地发生在单位时间或空间里的稀有事件的概念分布。
2.在二项分布中,n很大,p很小时。
3.事件不随机时,不能用泊松分布。
46.正态分布x、N(J;「):
连续型随机变量的概率分布。
47.正态分布的特点:
1.正态分布曲线是以均数•为中心左右对称的单峰悬钟形曲线。
在平均数的左右两侧,只要(X-」)绝对值相等,
f(x)值就相等。
2.f(X)在x=•处达到最大值,且f(」)=1/(d2二)
3.f(x)是非负函数,以横轴为渐近线,分布从-*到+^,且曲线在J±d处各有一个拐点。
4.卩是位置参数,d是形状参数。
5.正态分布的次数多数集中于平均数」的附近,离均数越远,其相应的次数越少。
6.曲线f(x)与横轴之间所围成的面积等于1。
5.
泊松分布,
>30时,用正态分布代替。
51.
抽样分布:
统计量的分布概率。
52.
抽样误差
:
由随机抽样造成的误差。
53.
标准误差
(标准误,均数标准误):
样本平均数抽样总体的标准差。
反应精确性的高低
匸X越大精确度越低。
54.t分布:
在计算Sx时,由于采用S来代替「使得t变量不再服从标准正态分布,而是服从t分布。
t=(x-/Sx
第四章
55.统计推断:
根据抽样分布规律和概率理论,由样本结果去推断总体特征。
主要包括假设检验(显著性检验)和参数估计。
56.表面效应:
样本平均数与总体平均数的差异。
包含两总体平均数的差异(处理效应)(•L-」o)和试验误差一;。
X-_0=-+;--0=(-L-)+;
57.统计假设检验:
对研究总体提出假设,然后在此假设下构造合适的检验统计量,并由该统计量的抽样分布计
算出样本统计量的概率,再根据概率值的大小作出接受或否定假设的判断。
58.无效假设Ho:
通过检验,可能被接受,也可能被否定。
59.备择假设Ha:
与无效假设相对应的假设。
「60.进行假设检验的基本依据:
把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不
可能性原理。
|
61.显著水平a:
决定接受或否定Ho的小概率标准。
(常用显著水平有0.05和0.01)
62.统计假设检验步骤:
1.建立假设2.确定显著水平a3.检验计算4.统计推断
63.I型错误(第一类错误):
指当H。
本身正确,但通过假设检验后却否定了它,也就是将非真实差异错判为真
实差异。
犯第一类错误的概率是〉。
(减少I型错误,可将显著水平定得小一点。
)
64.n型错误(第二类错误):
当H0本身错误时,通过假设检验后却接受了它,也即把真实差异错判为非真实差
异。
(减少n型错误,通常是通过减少均数标准误来减小第二类错误的概率。
而均数标准误的减小是通过精密的试验设计、严格的试验操作和增大样本容量来实现的。
由于一般来说a大B就小,增大了犯第一类错误的概率时,犯第二类错误的可能性就小。
反之,
a小,B大。
因此在实践中可以根据试验目的,通过调整a的大小来控制检验时犯错误的概率。
)
65.两尾检验:
备择假设中,包含了严妙和庐妙两种情况,因而这种检验有两个否定域,分别位于样本平均
数分布曲线的两尾。
_
66.一尾检验:
否定域位于;分布曲线某一尾的统计假设检验。
67.选用两尾检验还是一尾检验应根据专业的要求在试验设计时确定。
若事先不知道卩与⑷谁大谁小,为了检验
两者是否有差异就用两尾检验。
如果能凭借专业只是推测p不会小于(或大于)卩0时,为了检验□是否大于(或
小于)炉应用一尾检验。
68.u检验:
在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。
69.u检验使用范围:
若样本资料总体方差已知,或样本含量》30时用u检验。
70.假设统计误差中试验误差:
随机误差
71.统计假设检验中应注意的问题:
1.试验要科学设计和正确实施2.选用正确的统计假设检验方法3.正确理解
差异显著性的统计意义4.合理建设统计假设,正确计算检验统计量
由于常用显著水平空有氏05和0.0U故柞统计推断时就有3种可能蜡果+毎次检的必须
且只能得其中之一「
1当计算岀的槪率邑〉%05艾h说明表面效应仅由谋差造成的槪率不很小•故炖接受无
效假设H叮拒绝丹…此称为愛建不星笫
2当计算岀的概率匸01[怎dgS时‘说明表面效应仅由逞羞造成的槪率很小,则应否
定接受Hz此时旋歸苹丽差异显著。
差异显著通常是在计寡的统计就值上川机
空>杯来表示"
»冷③当计算出的槪率卫竜gJH时,说明表面效应仪由课差遣成的概率更小,更应否定
翻/填■"na05上的显書性肴所氏别,此时的显著水平称为羞异扱是黏差异极显著在统计
“量值上用标记“*"'来表示.’一「
单个样本平均数的假设检验
N(500,64)(单位,g)。
某
1)单个样本平均数的u检验:
某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布
日随机抽查10瓶罐头,测其净重见表。
分析装罐机当日工作是否正常?
编号
1
2
3
4
5
6
7
8
9
10
净重(g)
505
512
497
493
508
515
502
495
490
510
由題总知•样本所属总体眼从正态分布•并II总体尿准鳧严也苻台欄检验的荷用条件由于当口装罐机的每罐平均净政可能為于或低尸正常匸作状怎下的林准净联.故需作两尼检其方法步«$aT>
1按出假设.
秋,屮=严=500g.即谏日装雄机毎雄平均净匝与标准净朮一样.
HT产•即谏日装壇机的毎喙平均净It与标准净載不同、装繰机匚作不正常.
2确定显着水平.e-0.05(两址槪率几
3检脸计算.
样本平均数j=为工〃=(5054-512+…+&I0)/10=5(J2.7W)
均数标准误①二&斥=dg=2・530
统计联u值=7-500)/2.53=1.067
4统计推断*由显著水平□=0.05査附表2得临界“值;%师=!
.9亿
由于实得|u|=L067 2)单个样本平均数的t检验: t检验: 在假设检验中利用t分布来进行统计量的概率计算的检验方法。 两个样本平均数的假设检验: 由两个样本平均数之差,去判断这两个样本所在的总体平均数有无显著差异。 一、成组资料平均数的假设检验: 1)U检验 1、如果两个样本资料都服从正态分布,且总体方差二;和二2已知。 2、总体方差未知,但两个样本都是大样本时,平均数差数的分布呈正态分布。 叶*■為tUrirx>*~書*m■--.L—t 曲【例4刃说明”tiA-pflirtSOO现舉用一种新「 l例心用山植拥工星齢戦匸艺平均梅I恥山精三: 「标離差*】"。 何浙艺进幵加工*测定了比武■側蒔]00g山擠出柴冻甲均蛙为—工艺科】00g山橫出堆冻址与传统工艺有尤显幷擔界[士如计城讯旳J检醴.检脸步驟如F: 本例中总体方差yjfcftj*X是扌样本•窃料也般从正怂分布*卷: _严=500的卽新*旧工艺毎冋g山樁出棗凉#1£灯弘炉工严•即新、IB工艺每100g山榆出最冻■时差界: 2旳崔駁著水平.口=60"两址療率儿 3检fei+H- /=(j)/S,=(520^500)/3~6-£67… df™n—1=1$~"1=15 均敷标准決 疑计iff值 自由度 4统计推斷.由自由度"fH15和显爭水平a=0-01査附表3得临界tfftr..ut-..■-2/U? .由于实側Ml=6.667>蠢皿=2.947,故否建H°,接受推断讯旧工 乂的协100口山fS出果琮站恳界羟显署.亦即采用新工艺可提閒每1凶K山柚出果彷": 2)t检验 22 1.如果两个样本资料都服从正态分布,且二1—^2时,不论是大样本还是小样本,都有下式服从具有 Sxi卫 自由度df=ni+n2-2的t分布: t二上竺—冬。 【例4・5】海关检査某罐头厂生产的出口红烧花蛤罐头时发现,虽然罐头外观无胖听现象,但产品存在质量问题・于是从该厂随机抽取6个样品,同时随机抽取6个正常罐头测定其SQ含量,测定结果如表4-3所示。 试检验两种罐头的含量是否有差异° 義4謬正常簇头与异幣罐头so』含置 96.1 135.2 102+5 133,5 正當罐头{爼)100.094*29&5gg.£ 异迸罐头a】⑶/131.313Q.5135,2 1建立假设乜 吃: 旳匸戸”即两种罐头的SO,含量没有差异* Ha心工円*即两种罐头的SO.含量有差异。 ②确定显著水平。 屁=59*767 =42.875 窃T-759.73/30+42.875/30=1,阴9 «=(壬[—込)/軌_%=(65.833—59*767)/1*849=3.28J_ ④统计推臥由a=0.01査附表2得叫产乙5乱由干实际冷半产纬故心皿应否定接受“这说明两条生产线的日平均产量有极显著差和甲王厂法日均产量高于乙生产线日均产St。 亠轴 3检验计算。 =98.467 S;=&327 ^2=132.650 Si=5.235 本例的两个样本容量相等(町=t6),所以: =/fSHSI)/n=V(8.327+5.235)/6=-1.503 f=一屁)/民・_九=(9&467-132,65)/L503="22.743 df=2.(tt—1)—2X(6一]}=iq 4统计推断a由dj=10和a0.01查附表3得如間=3.169o由于实得1=也743〉j刚=3.169,故/><0.01(应否定接受即两种罐头的S0含量差异 极显著。 异常的罐头宝入含量高于正常的,该批罐头已被硫化腐败菌感染变质, 二、成对资料平均数的假设检验: 【例I-8J为研究电渗处理对草标果实中钙离产S■就的轧响.选用10个阜皤品种来进行电港处理与讨照的对比试验■结泉见表45.阿电灌处理对草離钙离于含薩是書有影响? 衰4-5电港业理草毒樂实钙鶴子含■ 项目 1 2 3 4 5 6 7 8 9 10 电濮处理(冲)mg 22.23 23.42 23.25 2L38 24,45 22.42 24.37 21.75 19.82 22.56 对照5)W 18.04 20.32 19,64 16.38 21.37 20.43 18.45 20.04 17.3& 18.42 差数J[J=rl-Jz]mg 4*19 3.10 3.61 5.00 3,08 1.99 5.92 1.71 2.44 4.14 本例因每个品种实施了一对处理,所以试验资料为成对资料。 1建立假设。 H,屮」=0・即电渗处理后草莓果实钙离子含量与对照的钙离子含量无差异。 即电渗处理后草莓果实钙离子含凰与对照的钙离子含量有差异o 2确定显著水平。 口=0・01(两尾概率)。 3检验计算° 工d=4.19+3.10+…+4*14二35*18° 工土=4.19’+3.10*+…+4.142=139.708 d=卩c/j.n=35*18/10—3,518 Sj[工岔一(为乩严/丹]心5—1)] =/a39.708-35.18710)/^10X(10-1)J=0.421 i=dSTi=3.518/0.421=&356… 值得皿心=3.250。 由于实得”I=&356二认为电滲处理后草莓果实钙离产含量与对刖 dJ=“—1=1o—1=9 1统计推断。 由df=9和口=0・01査临界1 的钙离子含址差异极显著,即电渗处理能提高草莓果实钙离子含量。 =乱250+故/)<0.01*应否定接受Hz 72.二项百分率的假设检验 1)单个二项百分率的假设检验 o【例⑷某微生物制品的企业标准为倚害做也物不准超过丨%(p,)口现从一批产品中抽出500件(幷),发现有害微生物超标的产品有7件(』儿问该批丘品是否合格? 话本例关心的是该批产品中有害徴牛物是沓超标.而低于企业标准的都属于合格,所以本例 采用一尾检验。 1提出假设。 黑: 警誓豐有害微生物百分率未超企业标准,产品为合格。 进豐该批…口的有害微生物百分率超过了企业标准为不合格。 2确定显著水平。 口=0.05(—尾概率几 3检验计算O =7/500=0.014 S=JpQ(1一仇)"=J001X(1—①而? W=0*00445 «=(/^AV^=(O.014—0.01)/0,00445=0.899 4统计推断。 由一尾概率a=0.05査附表2得一尾临界斑值%呻_窃=陆吓酉=1*645。 由于实得M=0刖9<如5』冲=1・645.所以p>0.05,接受可以认为该批产品达到了企业标准,为合格产品。 上母 2)单个二项百分率的假设检验 呦4-怛小包装贮藏裔萄试验。 装人覷料袋不加保鲜片的葡萄胡5粒(nJA个月后发现有25粒"门薊荀腐烂;装人皺料袋并加保鲜片的葡萄598粒(此叭】个月恰发现禹烂葡萄20粒(花人问加保鲜片与不加保鲜片的两种贮藏葡萄的腐烂率是否有显著差异? 1提出假设口 H“: 曲=利,即两种贮藏葡萄的腐烂率没有差异,也即两种方祛的保鲜效果一致。 HxQHp和即两种贮藏葡萄的腐烂有差异*也即两种方法的保鲜效果不一致匸 2确定显著水平°05,0.01(两尾概率儿 3检验计算. P,=工"叫=25/385=0.0649 A=观/出=肌/598=0・0334 眄+业)/&]+/〉=£25+20)/(385+598)=60458 0.0649-0.0334 0.0137 =2.299* =丿帀一刃储+丘X(1-WW(拓+命)=0.0打7 ④统计推WL由a=0.05和cr=0.01査附表2得临界我值也垃=1.站,%趴=2■伺。 因 为实得L96 氏代~r^ 第五早 73.方差分析(变量分析): 关于观测值变异原因的数量分析。 (三个或三个以上水平的分析,小于3个用t检验。 ) 74.试验设计的作用: 1.可以分析清楚试验因素对试验指标影响的大小顺序,找出主要因素,抓住主要矛盾2. 可以了解试验因素对试验指标影响的规律性3.可以了解试验因素之间相互影响的情况4.可较快地找出优化的 生产条件或工艺条件,确定优化方案5.可以正确估计、预测和有效控制、降低试验误差,提高试验精度6.可 以明确为寻找更优生产或工艺条件、深入揭示事物内在规律而进一步研究的方向。 75.试验指标: 根据研究目的而选定的用来衡量或考核试验效果的质量特性。 如: 考察加热对果胶酶活性的影响,果 胶酶活性是试验指标。 (单指标试验,多指标试验) 76.试验因素: 凡对试验指标可能产生影响的原因或要素。 如■酱油质量受原料、曲种、发酵时间等的影响,这些都 是影响酱油质量的因素。 77.因素水平: 试验因素所处的某种特定状态或数量等级。 女口: 比较3个大豆品种蛋白质含量高低,这3个品种就是 大豆品种这个试验因素的三个水平 kJ •.丁In 因为 *n SSr=52工"”一孔)' i-*]i-I 5~-i~r )J=2Sf(耳)+gi齐)了 i-1/-*1 其中 所以 i冲 另工5—左 EI>-] #M —S另[(毛-—孔)'4-2(^.)5一着”)+(孔一盂.尸] *■】d■岂«kn )£+225*—)25—耳〉+mg—耳・) S(乌一誉」=0 j-1 Jk*It 22g—亍』—n®)? -F2Sa—r』 i01]J»i1™IJ™I 上式中的齐丈(耳一耳尸是各处理均数耳.与总平均数亍••的离均差平方和与重复数K 的桀积■反映了M«次的处理间的变异•称为处理间平方租,记即 SSi匕月另(齐—jf.J'(弭 »-3 而丈£(孔一蛊”)2则是各处理内离均差平方和之和,反映了各处理内的变异即误差用》处理内"平方和或谋差平方和,记为弓艮,即 ss.尹主3#-! J*1* Ji SS■实际上是各赴理内平方和之和•即鈕H运陶*故’ <54 80.f值: 两个方差之比。 f=St2/se 81.F自由度: 两个。 df1=dft=k-1df2=dfe=k(n-1) 82.F检验: 用F值出现概率的大小推断两个方差是否相等的方法。 83.方差分析表: 变异来源 平方和(SS) 自由度(df) 均分(MS) F值 处理间 SSt dft=k-1 MSt=SSt/dft SSt/SSe 处理内
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 食品 试验 设计 统计分析 期末 复习资料