用spss软件进行一元线性回归分析.ppt
- 文档编号:2672198
- 上传时间:2022-11-06
- 格式:PPT
- 页数:16
- 大小:300KB
用spss软件进行一元线性回归分析.ppt
《用spss软件进行一元线性回归分析.ppt》由会员分享,可在线阅读,更多相关《用spss软件进行一元线性回归分析.ppt(16页珍藏版)》请在冰豆网上搜索。
利用spss进行一元线性回归上机指导:
王莉上机指导:
王莉Case1Case1:
降水:
降水&纬度纬度Case1Case1数据说明:
数据说明:
nn5353个台站的年降水量、年蒸发量、纬度和海拔数据个台站的年降水量、年蒸发量、纬度和海拔数据nn在本例中,把降水量在本例中,把降水量PP作为因变量,纬度作为自变量作为因变量,纬度作为自变量Case1Case1目的:
目的:
nn分析降水量和纬度之间的数量关系分析降水量和纬度之间的数量关系Case1Case1操作要点:
操作要点:
nn做散点图,查看两因素之间是否线性相关做散点图,查看两因素之间是否线性相关nn如果线性相关,接着做线性回归分析,揭示其数量关系如果线性相关,接着做线性回归分析,揭示其数量关系nn对回归方程做显著性检验对回归方程做显著性检验nn打开打开spssspss的数据编辑器,编辑变量视图的数据编辑器,编辑变量视图注意:
因为我们的数据中注意:
因为我们的数据中“台站名台站名”最多是最多是55个汉字,所以字符串宽度最个汉字,所以字符串宽度最小为小为1010才能全部显示。
才能全部显示。
step1step1:
建立数据文件:
建立数据文件nn编辑数据视图,将编辑数据视图,将excelexcel数据复制粘贴到数据复制粘贴到spssspss中中step1step1:
建立数据文件:
建立数据文件nn从菜单上依次点选:
图形从菜单上依次点选:
图形旧对话框旧对话框散点散点/点状点状nn定义简单分布,设置定义简单分布,设置YY为年降水量,为年降水量,XX为纬度为纬度nn由散点图发现,降水量与纬度之间线性相关由散点图发现,降水量与纬度之间线性相关step2step2:
做散点图:
做散点图step2step2:
做散点图:
做散点图nn给散点图添加趋势线的方法:
给散点图添加趋势线的方法:
双击输出结果中的散点图双击输出结果中的散点图在在“图表编辑器图表编辑器”的菜单中依次点击的菜单中依次点击“元素元素”“总计拟合线总计拟合线”,由此,由此“属性属性”中加载了中加载了“拟合线拟合线”拟合方法选择拟合方法选择“线性线性”,置信区间可以选,置信区间可以选95%95%个体,应用个体,应用nn从菜单上依次点选:
分析从菜单上依次点选:
分析回归回归线性线性nn设置:
因变量为设置:
因变量为“年降水量年降水量”,自变量为,自变量为“纬度纬度”nn“方法方法”:
选择默认的:
选择默认的“进入进入”,即自变量一次全部进入的方法。
,即自变量一次全部进入的方法。
nn“统计量统计量”:
勾选勾选“模型拟合度模型拟合度”,在结果中会输出,在结果中会输出“模型汇总模型汇总”表表勾选勾选“估计估计”,则会输出,则会输出“系数系数”表表nn“绘制绘制”:
在这一项设置中也可以做散点图:
在这一项设置中也可以做散点图nn“保存保存”:
注意:
在保存中被选中的项目,都将在数据编辑窗口显示。
注意:
在保存中被选中的项目,都将在数据编辑窗口显示。
在本例中我们勾选在本例中我们勾选95%95%的置信区间单值,未标准化残差的置信区间单值,未标准化残差nn“选项选项”:
只需要在选择方法为逐步回归后,才需要打开:
只需要在选择方法为逐步回归后,才需要打开step3step3:
线性回归分析:
线性回归分析【统计量统计量】按钮按钮nn“回归系数回归系数”复选框组:
定义回归系数的输出情况复选框组:
定义回归系数的输出情况勾选勾选“估计估计”可输出回归系数可输出回归系数BB及其标准误差,及其标准误差,tt值和值和pp值值勾选勾选“误差条图的误差条图的表征”则输出每个回归系数的则输出每个回归系数的95%95%可信区间可信区间勾选勾选“协方差矩阵协方差矩阵”则会输出各个自变量的相关矩阵和方差、协方差矩则会输出各个自变量的相关矩阵和方差、协方差矩阵。
阵。
nn“残差残差”复选框组:
复选框组:
用于选择输出残差诊断的信息,可选的有用于选择输出残差诊断的信息,可选的有Durbin-WatsonDurbin-Watson残差序列相关残差序列相关性检验、个案诊断。
性检验、个案诊断。
nn“模型拟合度模型拟合度”复选框:
复选框:
模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:
验:
RR,R2R2和调整的和调整的R2,R2,标准误及方差分析表。
标准误及方差分析表。
nn“RR方变化方变化”复选框:
复选框:
显示模型拟合过程中显示模型拟合过程中R2R2、FF值和值和pp值的改变情况。
值的改变情况。
nn“描述性描述性”复选框:
复选框:
提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。
变量间的相关矩阵。
nn“部分相关和偏相关性部分相关和偏相关性”复选框:
复选框:
显示自变量间的相关、部分相关和偏相关系数。
显示自变量间的相关、部分相关和偏相关系数。
nn“共线性诊断共线性诊断”复选框:
复选框:
给出一些用于共线性诊断的统计量,如特征根(给出一些用于共线性诊断的统计量,如特征根(EigenvaluesEigenvalues)、方差膨)、方差膨胀因子胀因子(VIF)(VIF)等。
等。
nn以上各项在默认情况下只有以上各项在默认情况下只有“估计估计”和和“模型拟合度模型拟合度”复选框被选中。
复选框被选中。
nn用于选择需要绘制的回归分析诊断或预测图。
用于选择需要绘制的回归分析诊断或预测图。
可绘制的有标准化残差的直方图和正态分布图,应变量、预测值可绘制的有标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。
和各自变量残差间两两的散点图等。
nn许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一步的分析,保存按钮就是用来存储中间结果的。
预测值等做进一步的分析,保存按钮就是用来存储中间结果的。
可以存储的有:
预测值系列、残差系列、距离(可以存储的有:
预测值系列、残差系列、距离(DistancesDistances)系列、预测)系列、预测值可信区间系列、波动统计量系列。
下方的按钮可以让我们选择将这些值可信区间系列、波动统计量系列。
下方的按钮可以让我们选择将这些新变量存储到一个新的新变量存储到一个新的SPSSSPSS数据文件或数据文件或XMLXML中。
中。
【绘制绘制】按钮按钮【保存保存】按钮按钮注意:
选项按钮只需要在选择方法为逐步回归后,才需要打开注意:
选项按钮只需要在选择方法为逐步回归后,才需要打开“步进方法标准步进方法标准”单选钮组:
设置纳入和排除标准,可按单选钮组:
设置纳入和排除标准,可按PP值或值或FF值来设置。
值来设置。
“在等式中包含常量在等式中包含常量”复选框:
用于决定是否在模型中包括常数复选框:
用于决定是否在模型中包括常数项,默认选中。
项,默认选中。
“缺失值缺失值”单选钮组:
用于选择对缺失值的处理方式,可以是不单选钮组:
用于选择对缺失值的处理方式,可以是不分析任一选入的变量有缺失值的记录(按列表排除个案)而无论分析任一选入的变量有缺失值的记录(按列表排除个案)而无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值的记录(按对排除个案);将缺失值用该变量的均数代替(使值的记录(按对排除个案);将缺失值用该变量的均数代替(使用均值替代)。
用均值替代)。
【选项选项】按钮按钮nn【输入输入/移去的变量移去的变量】此表是拟合过程中变量输入此表是拟合过程中变量输入/移去模型的情况记录,由于我们只引入了一移去模型的情况记录,由于我们只引入了一个自变量,所以只出现了一个模型个自变量,所以只出现了一个模型11(在多元回归中就会依次出现多个回(在多元回归中就会依次出现多个回归模型),该模型中归模型),该模型中“纬度纬度”为进入的变量,没有移出的变量,具体的为进入的变量,没有移出的变量,具体的输入输入/移去方法为移去方法为“输入输入”。
step4step4:
线性回归结果:
线性回归结果nn【模型汇总模型汇总】此表为所拟合模型的情况汇总,显示在模型此表为所拟合模型的情况汇总,显示在模型11中:
中:
相关系数相关系数R=0.904R=0.904拟合优度拟合优度RR方方=0.816=0.816调整后的拟合优度调整后的拟合优度=0.813=0.813标准估计的误差标准估计的误差=92.98256=92.98256nnRR方(拟合优度):
是回归分析的决定系数,说明自变量和因变量形方(拟合优度):
是回归分析的决定系数,说明自变量和因变量形成的散点与回归曲线的接近程度,数值介于成的散点与回归曲线的接近程度,数值介于00和和11之间,这个数值越大之间,这个数值越大说明回归的越好,也就是散点越集中于回归线上。
说明回归的越好,也就是散点越集中于回归线上。
step4step4:
线性回归结果:
线性回归结果nn【AnovaAnova】(analysisofvarianceanalysisofvariance方差分析)方差分析)此表是所用模型的检验结果,一个标准的方差分析表。
此表是所用模型的检验结果,一个标准的方差分析表。
Sig.Sig.(significantsignificant)值是回归关系的显著性系数,)值是回归关系的显著性系数,sig.sig.是是FF值的实际显著值的实际显著性概率即性概率即PP值。
当值。
当sig.=0.05sig.0.05sig.0.05,说明二者之间用当前模型进行回归没有统计学意义,说明二者之间用当前模型进行回归没有统计学意义,应该换一个模型来进行回归。
应该换一个模型来进行回归。
由表可见所用的回归模型由表可见所用的回归模型FF统计量值统计量值=226.725=226.725,PP值为值为0.0000.000,因此我,因此我们用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验们用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。
的结果。
由于这里我们所用的回归模型只有一个自变量,因此模型的检验就等价由于这里我们所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。
与系数的检验,在多元回归中这两者是不同的。
step4step4:
线性回归结果:
线性回归结果nn【系数系数】此表给出了包括常数项在内的所有系数的检验结果,用的是此表给出了包括常数项在内的所有系数的检验结果,用的是tt检验,检验,同时还会给出标化同时还会给出标化/未标化系数。
可见常数项和未标化系数。
可见常数项和“纬度纬度”都是有统都是有统计学意义的。
计学意义的。
由此得到年降水量与纬度之间的一元回归方程为:
由此得到年降水量与纬度之间的一元回归方程为:
nnY=-82.188X+3395.584Y=-82.188X+3395.584step4step4:
线性回归结果:
线性回归结果Case2:
Case2:
气温气温&降雨量降雨量Case2Case2数据说明:
数据说明:
nn伦敦伦敦1212个月的平均气温、降雨量数据个月的平均气温、降雨量数据nn在本例中,把降雨量作为因变量,平均气温作为自变量在本例中,把降雨量作为因变量,平均气温作为自变量Case2Case2目的:
目的:
nn分析平均气温和降雨量之间的数量关系分析平均气温和降雨量之间的数量关系Case2Case2习题要求:
习题要求:
nn做散点图,查看两因素之间是否线性相关做散点图,查看两因素之间是否线性相关nn如果线性相关,接着做线性回归分析,揭示其数量关系如果线性相关,接着做线性回归分析,揭示其数量关系nn对回归方程做显著性检验,写出结论对回归方程做显著性检验,写出结论nn给这个例子的目的是,看大家是否真的理解做散点图的意给这个例子的目的是,看大家是否真的理解做散点图的意义义nn当散点图都不呈现线性关系,那有多少同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 软件 进行 一元 线性 回归 分析