欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    统计学第10章方差分析.docx

    • 资源ID:28453630       资源大小:135.51KB        全文页数:26页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学第10章方差分析.docx

    1、统计学第10章方差分析第10章方差分析适用:多个均值是否相等的检验(分类数据与数值型数据)10.1方差分析引论例 消费者与产品生产者、销售者或服务的提供者 之间经常发生纠纷。当纠纷发生后,消费者通常会向消费者协会投诉。 为了对几个行 业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、 家电制造业分别抽取了一些 企业作为样本。其中零售业 7家、旅游 业6家、航空公司5家、家电制造业5家。每个行业所抽取的这些企 业,假定他们在服务对象、服务内容、企业规模等方面基本相同。然后统计最近一年中消费者对这 23家企业的投诉次数,结果如下表:零售业旅游业航空公司家电制造44576831516639

    2、49654929217740453458345640535144消费者协会想了解这几个行业之间的服务质量是否有显著性差异。10.1.1 分析服务质量 显著性差异投诉次数 均值不相等转化为数学表达:Ho:叫f 4没有显著性差异Hi :上面的等式不全相等 有显著性差异般假设检验的解决方法:没有显著性差异-不同的行业服务质量一样,行业对服务质量没有显著影响有显著性差异不同的行业服务质量不一样,行业对服务质量有显著影响从行业对服务质量影响 的角度来分析平均服务质量的差异问题术语:因素:一个独立的随机变量,是方差分析研究的对象 企业所属行业类型水平:因素的内容 各个行业:零售业、旅游业、航空公司、家电制

    3、造10.1.3 方差分析的原理:1观察值之间差异的原因A由于选取样本的随机性引起的差异(行业不同,B由于因素中的不同水平形成的差异一一系统性差异服务质量不同)2水平内部与水平之间差异的类型A水平内部的差异 只包含随机性差异(同行业企业服务质量的差异)B 水平之间的差异 既包含随机性差异又包含系统性差异(不同行业企业服务质量的差异 )3 原理如不同的水平对结果没有影响 则水平之间的差异应只包含随机性差异 与水平内部的差异应该非常接近 反之如不同的水平对结果产生影响 则水平之间的差异应既包含随机性差异又包含系统性差异 应该大于水平内部的差异 所以,可以通过比较这两个差异的大小 当比较的结果大于某个

    4、临界值时, 就可以判定水平之间包含系 统性差异,即水平对结果有显著影响均值不全相等10.1.4 技术问题选择什么样的指标来衡量这两个差异与比较的结果差异:离散离差平方和 差异的比较:差、商考虑统计量的分布与临界值方差分析的基本假定1每个总体都服从正态分布,即对于因素的每一个水平,其观测值都是来自正态总体的简单随机样本;2各个总体的方差相等3观测值是独立的独立等方差的正态总体实际应用中近似满足即可10.2单因素方差分析单因素方差分析:分析只针对一个因素进行 企业类型双因素方差分析:分析针对两个因素进行企业类型企业文化10.2.1分析步骤1提出假设Ho: = = 因素(自变量)对结果(因变量)没有

    5、显著性差异Hi:叫(i =1,2Hk)不全相等 自变量对因变量有显著性差异上例:Ho:丄1二”2 = %二J4 不同行业对服务质量没有显著性差异Hi :上面的等式不全相等 不同行业对服务质量有显著性差异2计算均值计算各样本的均值设从第i个总体中抽取一个样本容量为m的简单随机样本,令Xi为其均值,则1 niX 瓦 x (i =1,2|k)ni j生其中,Xj为第i个总体的第j个观察值k为因素水平的个数(总体的个数)x2 =48, x3 =35, x4 = 59计算全部观测值的总均值k ni k上例:X7 66 49 77 5J 47.86956523- - xij 二 niXii 1 j 1 i

    6、 1X =n nn 利n2 Jll nk3计算各误差平方和A组内平方和SSE是每个水平或组的各样本数据与其组均值误差的平方和 反映了各个样本观测值的离散状况k mSSE = 送(Xj _XJ2i 4 j 4上例:k nSSE = E Z (Xj XJ2i 4 j 4= (57-49)2 (66-49)2 |(44-49)2=(68-48)2 (39-48)2 |(51-48)2=(3仁35)2 . (49 _3勺2 .山梓0 _35)2= (4459)2 .(5仁 5矿 山(58 _ 59)2= 2708B组间平方和SSA是各组均值与总平均的误差平方和 反映各组的差异kssa 八 口 Xii

    7、=1上例:k _ 二 2SSA八 ni X_Xi =1=7x (49 47.8695652 +6x (48 47.8695652 +5沢(35 -47.8695652 +5汉(59-47.8695652 =1456608696C总平方和SST是全部观测值与总平均的误差平方和SST 二二(Xj -x)2i 4 j=1上例:k Q2SST :二二(Xj -X)i j 4= (57 -47.869565)2 (66-47.869565)2 |( (58 -47.869565)2= 4164608696SST= SSE SSA4计算统计量定理:当各总体满足方差分析的三个基本假设时,有XslllXk,

    8、SSE相互独立SSE 2且一 - (n _k)a当 Ho : 7 = ”2 = III = k 成立时,SSA、2(k_1)cr所以,为了检验H 0 : 7 = I II二k取检验统计量为F二些A二SSA k-1 L F(k-1,n-k)MSE SSE/ (n-k)上例:MSA = SSA/(k-1 )=1456608696/(4-1) =485536232MSE 二SSE/ n-k =2708/(23-4)=142526316MSAMSE485536232142526316=3.4066435统计决策:大于 拒绝原假设 右单侧检验所以当F F-.(k -1,n-k),拒绝原假设当F :; F

    9、:(k _1,n _k),不能拒绝原假设上例:临界值 Fo.05 (4 1,23 4) = F.05(3,19) =3.13因为 3.413.13,所以拒绝原假设,即认为服务质量均值有显著性差异, 行业类型对服务质量有显著性影响。方差分析表误差来源平方和自由度均方F值P值F临界值组间(因素影响)SSAk-1MSAMSA/MSE组内(误差)SSEn-kMSE总和SSTn-1误差来源平方和自由度均方F值P值F临界值组间(因素影响)1456.60873485.53623.410.03883.13组内(误差)270819142.5263总和4164.60872210.2.2关系强度的测量SSA:度量自

    10、变量(行业)对因变量(投诉次数)的影响效应。越大,影响效应越大,两者的关系越强。r2 = QSST上例:r2=sSAJ456.608696 a%SST 4146.608696表明:行业(自变量)对投诉次数(因变量)的影响效应占总效应的34.98%,残差效应占65.02%。即,行业对投诉次数的差异解释的比例高达近 35% ,而其他因素(残差变量)所解释的比例为65%以上。R:用来测量自变量与因变量之间的关系强度。上例:R=0.59,表明行业与投诉次数之间有中等以上的关系。1023方差比较中的多重比较:最小显著差异法 LSD1步骤(1) 提出假设H。屮1:叫(2) 计算检验统计量:XXj(3) 计

    11、算 LSD LSD-gJmSeU 十丄V W nj 丿其中,自由度为(n-k)(4) 决策:当区-斤卜LSD,拒绝Ho上例:解:提出假设:检验1:Ho :2,已:J1检验2:Ho :1J, Hi=J3检验3:Ho :二 J4, Hia检验4: H0=-3,比:2 = 4 检验5: H。:込=亠4屮1 “2 =九 检验 6: H。: =%屮1:% =4 计算检验统计量:低 _引=49-48 =1X, _X3| = 49-35 =14X x4 = 49 - 59 =10x2 - x3 = 48 - 35 =13肉X4 = 48-59| =11|X3 -X4 = 35-59 =24计算LSDt:.2

    12、(n -k)二 to.025 (19) =2.093决策|xX2 =1 13.90,不能拒绝Ho,不能认为零售业与旅游业的投诉次数 之间有显著差异;区一又=14 : 14.63,不能拒绝Ho,不能认为零售业与航空公司的投诉 次数之间有显著差异;|焉乂4 =10 3.4903所以拒绝原假设,即认为品牌对销售量有显著影响。2.1008V3.2592所以不能拒绝原假设,即认为地区对销售量没有显著影响。3关系强度的测量反映了两个自变量对因变量的联合效应;其平方根R反映了这两个自变量联合起来与因变量之间的关系强度上例:素(残差变量)只解释了销售量差异的 16.06%R =0.9162,表明品牌与地区合起

    13、来与销售量之间有较强的关系与分别做两个单因素方差分析比较SSE = SST-SSR-SSC= 17888.95 -13004.55 -2011.7 =2872.7差异源SSdfMSFP-ValueF Crit组间13004.5534334.8514.19988.97E-053.2389组内4884.416305.275总计17888.9519差异源SSdfMSFP-ValueF Crit组间2011.74502.9250.47510.75343.0556组内15877.25151058.4833总计17888.9519双因素方差分析优于分别对两个因素进行单因素方差分析1033有交互作用的双因素

    14、方差分析双因素方差分析中,两个因素搭配在一起会对因变量产生一种新的效 应称为这两个因素对因变量的交互作用例:城市道路交通管理部门为研究不同的路段和不同的时间段对行车 时间的影响,让一名交通警察分别在两个路段的高峰期与非高峰期亲 自驾车进行试验,共获得20个行车时间(单位:分钟)的数据。试 分析路段、时段以及路段与时段的交互作用对行车时间的影响。0.05路段(列变量)路段1路段2时 段(行 变 量)高 峰 期26192420272325222521非 高 峰 期20181717221321161712有交互作用的双因素方差分析表的结构误差来源误差平方和SS自由度df均方MSF值P值F临界值行因素

    15、SSRk-1MSRFr列因素SSCr -1MSCFc交互作用SSRC(k-1)(r-1)MSRCF RC误差SSEkr(m-1)MSE总和SSTkr 1Xji为对应于行因素的第i个水平和列因素第j个水平的第I行的观察 值加为行因素的第i个水平的样本均值Xj为行因素的第j个水平的样本均值Xj为对应于行因素的第i个水平和列因素第j个水平组合的样本均值X为全部n个观察值的总均值总平方和:k r mSST D (Xji -X)2i 4 j 4 l 4行变量的平方和:kSSR = rm %-文)2i 4列变量的平方和:rSSC 二 km (Xj -x)2j 4交互作用的平方和:k rSSRC = m二二

    16、(Xij _XL Xj X)2i吕j生误差平方和:SSE 二 SST - SSR- SSC- SSRC上例:k=r =2,m=5路段:列变量路段1路段226192420高2723时峰2522xl = 23 2段期2521行心=25.4X,2 = 21变非 高 峰 期2018量17172213X亢=17.321161712X21 = 19.4X22 = 15.2Xj =22.4X2 = 18.1X = 20.25kSSR=rm (兀-X)2i 4一 2 2 -|= 2x5x (23.220.25) +(17.3 20.25)卜 174.05r2SSC = km (Xx)j 4=2 5 22.42

    17、0.252 18.20.25 2 =92.45k r2 SSRC二 m二二(X -XL - X j X)i =4 j 4 2 2-5 25.4-23.2-22.4 20.25 21 - 23.2-18.1 20.252 2 +(19.417.3 22.4+20.25)+(15.217.3 18.1 + 20.25)= 0.05k r m2SST - 、 (XiX) =329.75i A j吕丨生SSE 二 SST - SSR - SSC - SSRC= 329.75 174.05 92.45 0.05 =63.2计算统计量的值:查表得:Foe (1,12) =4.49444.06334.494所以拒绝原假设,即认为时间段对行车时间有显著性 影响。進=SSC/(r-1) =A=234501MSE SSE/kr(m-1) 63.2/16查表得:Foe (1,12) =4.49442345014.494所以拒绝原假设,即认为路段对行车时间有显著性影 响。SSRCg(一叽 。诂


    注意事项

    本文(统计学第10章方差分析.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开