精品SPSS处理多重回归分析.docx
- 文档编号:10511523
- 上传时间:2023-02-17
- 格式:DOCX
- 页数:32
- 大小:798.48KB
精品SPSS处理多重回归分析.docx
《精品SPSS处理多重回归分析.docx》由会员分享,可在线阅读,更多相关《精品SPSS处理多重回归分析.docx(32页珍藏版)》请在冰豆网上搜索。
精品精品SPSS处理多重回归分析处理多重回归分析SPSS处理多重回归分析实验二多重回归分析一、实验目的研究样本数据离差阵、样本协方差阵,以及变量之间的相关系数(包括偏相关)并作相关性分析。
二、实验要求为研究高等院校人文社会科学研究中立项课题数受那些因素的影响,收集到某年31个地区部分高校有关社科研究方面的数据(见SPSS数据),利用此的数据,设定立项课题数X5为因变量(被解释变量),X2,X3,X4,X6,X7,X8为解释变量,作多重回归分析。
三、实验内容1.依次点击“分析回归线性回归”,得到如下图一所示:
【图一】2.点击“统计量”,得到如下图二所示:
【图二】3.点击“继续”,得到如下图三所示:
【图三】4.点击“继续确定”,得到如下表一所示:
【表一】回归其中,容差(容忍度):
是解释变量与其他解释变量间的复相关系数的平方。
容忍度取值范围为0-1,越接近0表示多重共线性越强,容忍度越接近于1表示多重共线性越弱。
方差膨胀因子(VIF):
即为容忍度的倒数。
的值大于等于1,越小,说明多重共线性越弱。
可见,投入高级职称的人年数的容差最小,为0.007,多重共线性是最弱的,其次是投入人年数;获奖数的容差最大,为0.358,多重共线性最强。
其中,解释变量相关阵的特征根和方差比:
如果解释变量有较强的相关性,则它们之间必然存在信息重叠。
可通过解释变量相关阵的特征值来反映。
解释变量相关阵的最大特征根能够解释说明解释变量信息的比例是最高的,其他特征根随其特征值的减小对解释变量方差的的解释能力依次减弱。
如果这些特征根中,最大特征根远远大于其他特征根,说明这些解释变量间具有相当多的重叠信息。
条件指数:
是在特征值基础上的定义的能反映解释变量间多重共线性的指标为第i个条件指数,是最大特征根。
通常当时,认为多重共线性弱;当时,认为多重共线性较强;当是,认为多重共线性很严重。
可见,专著数、论文数及获奖数的多重共线性较强;投入人年数、投入高级职称的人年数及投入科研事业费的多重共线性较弱。
通过观察数据窗口的库克距离和杠杆值变量的值,发现没有明显的异常点。
综上分析,因此此模型需要改进。
将方法中的“进入”改为“逐步”,其余操作不变,如下图四所示:
【图四】点击“确定”,得到如表二所示:
【表二】回归可见,投入高级职称的人年数的容差最小,为0.024,多重共线性是最弱的,其次是论文数;投入科研经费的容差最大,为0.267,多重共线性最强。
通过观察数据窗口的库克距离和杠杆值变量的值,发现没有明显的异常点。
也可将方法改为“向后”,如下图五所示:
【图五】点击“确定”,得出分析结果如下表三所示:
【表三】回归输入移去的变量(b)模型输入的变量移去的变量方法1获奖数,投入科研事业费(百元),论文数,专著数,投入人年数,投入高级职称的人年数(a).输入2.专著数向后(准则:
F-to-remove的概率=.100)。
3.投入高级职称的人年数向后(准则:
F-to-remove的概率=.100)。
4.投入科研事业费(百元)向后(准则:
F-to-remove的概率=.100)。
5.获奖数向后(准则:
F-to-remove的概率=.100)。
6.论文数向后(准则:
F-to-remove的概率=.100)。
a已输入所有请求的变量。
b因变量:
课题总数模型摘要(g)模型RR方调整的R方估计的标准差更改统计量Durbin-WatsonR方更改F更改df1df2显著性F更改1.969(a).939.924231.5255.93961.532624.0002.969(b).939.927226.8644.000.004124.9533.968(c).937.927226.5820-.002.935125.3434.965(d).931.923232.0833-.0062.327126.1395.963(e).927.921234.8694-.0041.676127.2066.959(f).919.917241.9582-.0072.777128.1071.747a预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,专著数,投入人年数,投入高级职称的人年数。
b预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,投入人年数,投入高级职称的人年数。
c预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,投入人年数。
d预测变量:
(常量),获奖数,论文数,投入人年数。
e预测变量:
(常量),论文数,投入人年数。
f预测变量:
(常量),投入人年数。
g因变量:
课题总数ANOVA(g)模型平方和df均方F显著性1回归19790312.87963298385.48061.532.000(a)残差1286497.1212453604.047合计21076810.000302回归19790123.76653958024.75376.903.000(b)残差1286686.2342551467.449合计21076810.000303回归19741985.31144935496.32896.135.000(c)残差1334824.6892651339.411合计21076810.000304回归19622518.60836540839.536121.436.000(d)残差1454291.3922753862.644合计21076810.000305回归19532228.23229766114.116177.039.000(e)残差1544581.7682855163.635合计21076810.000306回归19379040.047119379040.047331.018.000(f)残差1697769.9532958543.791合计21076810.00030a预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,专著数,投入人年数,投入高级职称的人年数。
b预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,投入人年数,投入高级职称的人年数。
c预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,投入人年数。
d预测变量:
(常量),获奖数,论文数,投入人年数。
e预测变量:
(常量),论文数,投入人年数。
f预测变量:
(常量),投入人年数。
g因变量:
课题总数系数(a)型非标准化系数标准化系数t显著性B的95%置信区间相关性共线性统计量B标准误Beta下限上限零阶偏部分容差VIF(常量)-35.31376.580-.461.649-193.367122.740投入人年数.698.2081.3613.352.003.2681.128.959.565.169.01564.811投入高级职称的人年数-.467.626-.464-.747.463-1.759.824.944-.151-.038.007151.824投入科研事业费(百元).003.002.2371.601.122-.001.007.862.311.081.1178.576专著数.022.377.014.059.953-.755.800.868.012.003.04621.875论文数-.064.053-.252-1.198.243-.173.046.887-.238-.060.05817.384获奖数.712.503.1191.416.170-.3261.751.665.278.071.3582.796(常量)-36.24673.442-.494.626-187.504115.011投入人年数.692.1761.3493.932.001.3291.054.959.618.194.02148.202投入高级职称的人年数-.443.458-.439-.967.343-1.385.500.944-.190-.048.01284.526投入科研事业费(百元).003.002.2401.778.088.000.006.862.335.088.1347.446论文数-.064.052-.253-1.230.230-.170.043.887-.239-.061.05817.299获奖数.701.453.1171.548.134-.2321.633.665.296.076.4242.358(常量)-29.79173.047-.408.687-179.942120.360投入人年数.553.1021.0795.411.000.343.764.959.728.267.06116.325投入科研事业费(百元).002.001.1521.525.139-.001.004.862.287.075.2464.069论文数-.088.045-.348-1.934.064-.181.006.887-.355-.095.07513.309获奖数.716.452.1201.586.125-.2121.645.665.297.078.4252.355(常量)-63.38571.340-.889.382-209.76282.991投入人年数.644.0851.2557.527.000.468.819.959.823.380.09210.876论文数-.096.046-.381-2.081.047-.191-.001.887-.372-.105.07613.119获奖数.589.455.0991.295.206-.3441.522.665.242.065.4402.274(常量)-67.92572.109-.942.354-215.63379.783投入人年数.628.0861.2247.330.000.452.803.959.811.375.09410.650论文数-.070.042-.278-1.666.107-.156.016.887-.300-.085.09410.650(常量)-94.52472.442-1.305.202-242.68553.637投入人.492.027.95918.194.000.436.547.959.959.9591.0001.000年数a因变量:
课题总数系数相关(a)模型获奖数投入科研事业费(百元)论文数专著数投入人年数投入高级职称的人年数1相关性获奖数1.000-.048-.310.396.181-.239投入科研事业费(百元)-.0481.000.347-.363.057-.226论文数-.310.3471.000.070.017-.404专著数.396-.363.0701.000.506-.666投入人年数.181.057.017.5061.000-.860投入高级职称的人年数-.239-.226-.404-.666-.8601.000协方差获奖数.253-4.396E-05-.008.075.019-.075投入科研事业费(百元)-4.396E-053.377E-063.383E-05.0002.163E-05.000论文数-.0083.383E-05.003.001.000-.013专著数.075.000.001.142.040-.157投入人年数.0192.163E-05.000.040.043-.112投入高级职称的人年数-.075.000-.013-.157-.112.3922相关性获奖数1.000.112-.369-.025.036投入科研事业费(百元).1121.000.401.299-.673论文数-.369.4011.000-.022-.480投入人年数-.025.299-.0221.000-.813投入高级职称的人年数.036-.673-.480-.8131.000协方差获奖数.2058.537E-05-.009-.002.008投入科研事业费(百元)8.537E-052.815E-063.486E-058.828E-05-.001论文数-.0093.486E-05.003.000-.011投入人年数-.0028.828E-05.000.031-.065投入高级职称的人年数.008-.001-.011-.065.2093相关性获奖数1.000.185-.401.008投入科研事业费(百元).1851.000.119-.578论文数-.401.1191.000-.807投入人年数.008-.578-.8071.000协方差获奖数.204.000-.008.000投入科研事业费(百元).0001.535E-066.719E-06-7.320E-05论文数-.0086.719E-06.002-.004投入人年数.000-7.320E-05-.004.0104相关性获奖数1.000-.434.144论文数-.4341.000-.911投入人年数.144-.9111.000协方差获奖数.207-.009.006论文数-.009.002-.004投入人年数.006-.004.0075相关性论文数1.000-.952投入人年数-.9521.000协方差论文数.002-.003投入人年数-.003.0076相关性投入人年数1.000协方差投入人年数.001a因变量:
课题总数共线性诊断(a)模型维特征值条件索引方差比例(常量)投入人年数投入高级职称的人年数投入科研事业费(百元)专著数论文数获奖数116.1371.000.01.00.00.00.00.00.002.4523.684.33.00.00.03.01.00.043.2944.572.32.00.00.01.00.00.394.0739.142.26.01.00.39.00.06.295.02814.719.09.03.00.37.55.02.156.01421.020.00.12.01.17.00.82.067.00258.796.00.84.98.03.44.10.05215.2471.000.01.00.00.00.00.012.3823.706.52.00.00.06.00.013.2804.325.16.00.00.04.00.554.0738.466.29.01.00.41.06.385.01419.403.00.18.02.14.80.066.00341.788.02.80.97.35.14.00314.2731.000.01.00.01.00.012.3693.401.54.00.13.00.003.2773.925.14.00.09.00.544.0677.987.31.07.59.13.415.01318.195.00.93.17.87.04413.5141.000.02.00.00.022.3143.346.73.00.00.223.1574.727.23.06.02.654.01515.232.02.93.97.11512.7321.000.04.00.002.2513.299.95.02.023.01712.725.01.97.98611.8001.000.10.102.2003.001.90.90a因变量:
课题总数已排除的变量(f)模型BetaInt显著性偏相关共线性统计量容差VIF最小容差2专著数.014(a).059.953.012.04621.875.0073专著数-.103(b)-.592.559-.118.08212.179.059投入高级职称的人年数-.439(b)-.967.343-.190.01284.526.0124专著数.080(c).632.533.123.1646.091.064投入高级职称的人年数.104(c).299.767.059.02246.195.022投入科研事业费(百元).152(c)1.525.139.287.2464.069.0615专著数.016(d).131.897.025.1885.314.065投入高级职称的人年数.035(d).100.921.019.02245.121.022投入科研事业费(百元).123(d)1.220.233.229.2543.930.061获奖数.099(d)1.295.206.242.4402.274.0766专著数.023(e).182.857.034.1885.308.188投入高级职称的人年数-.119(e)-.343.734-.065.02441.733.024投入科研事业费(百元).152(e)1.528.138.278.2673.748.267获奖数.030(e).411.684.077.5421.846.542论文数-.278(e)-1.666.107-.300.09410.650.094a模型中的预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,投入人年数,投入高级职称的人年数。
b模型中的预测变量:
(常量),获奖数,投入科研事业费(百元),论文数,投入人年数。
c模型中的预测变量:
(常量),获奖数,论文数,投入人年数。
d模型中的预测变量:
(常量),论文数,投入人年数。
e模型中的预测变量:
(常量),投入人年数。
f因变量:
课题总数残差统计量(a)极小值极大值均值标准差N预测值-57.6423246.986960.000803.721331残差-466.2850509.6787.0000237.891431标准预测值-1.2662.845.0001.00031标准残差-1.9272.106.000.98331a因变量:
课题总数对上述的实验结果进行分析:
(1)值越大所反映自变量与因变量比率越高,该分析中=0.924,故因变量与自变量间存在显著的相关性。
且由Durbin-Watson值为1.838,很接近2,可知自变量间有较强的相互独立性。
(2)有输出结果中P值为0.000(a),显然小于0.05,所以应该拒绝原假设,说明因变量与自变量间有较强的线性关系。
而“投入人年数x2”的P值为0.0030.05,说明其与因变量“课题总数x5”,间存在较强的相关性,“投入高级职称的人年数x3”、“投入科研事业费x4”、“专著数x6”、“论文数x7”、“获奖数x8”,其P值均大于0.05,说明其与因变量课题总数间相关性极弱。
(3)从累计概率图中可以看出,随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势,计算残差与预测值的Spearman等级相关系数为-0.176,且检验并不显著,因此认为异方差现象不明显。
四、存在问题与解决情况这次试验过程较为复杂,实验数据较为庞大,但经过不断地努力有有了很好的解决,在多元回归中:
1.拟合优度检验常采用统计量,该判定量称为调整的决定系数:
。
2.多重线性回归方程显著性检验H0:
各个偏回归系数均为0的F统计量为:
3.第i个偏回归系数为0的显著性检验的t统计量为:
,其中4.Durbin-Watson检验统计量DW,DW值在0-4之间当DW值为2表示残差序列没有自相关5.标准化残差如果其绝对值如果大于3,则该点为异常值点。
6.学生化残差如果其绝对值如果大于3,则该点为异常值点。
为杠杆值。
7.杠杆值较高表示对应的为强影响点SpSS中的杠杆值是中心化了的杠杆值8.库克距离:
一般库克距离大于1,就可认为对应的观察值为强影响点。
9.标准化回归系数的变化和标准化预测值的变化在剔除第i个样本单元后观察标准化回归系数的变化,如果标准化回归系数变化的绝对值大于,则认为第i个样本单元可能是强影响点。
也可以通过标准化预测值变化的绝对值来判断强影响点。
即如果标准预测值变化的绝对值大于,则认为第i个样本单元可能是强影响点。
10容忍度:
是解释变量与其他解释变量间的复相关系数的平方。
容忍度取值范围为0-1,越接近0表示多重共线性越强,容忍度越接近于1表示多重共线性越弱。
11.方差膨胀因子(VIF):
即为容忍度的倒数。
的值大于等于1,越小,说明多重共线性越弱。
12.解释变量相关阵的特征根和方差比如果解释变量有较强的相关性,则它们之间必然存在信息重叠。
可通过解释变量相关阵的特征值来反映。
解释变量相关阵的最大特征根能够解释说明解释变量信息的比例是最高的,其他特征根随其特征值的减小对解释变量方差的的解释能力依次减弱。
如果这些特征根中,最大特征根远远大于其他特征根,说明这些解释变量间具有相当多的重叠信息。
13.条件指数:
是在特征值基础上的定义的能反映解释变量间多重共线性的指标。
为第i个条件指数,是最大特征根。
通常当时,认为多重共线性弱。
当时,认为多重共线性较强。
当是,认为多重共线性很严重。
14.的改进量:
(为解释变量进入回归方程的决定系数)15.解释变量的偏F统计量:
如果解释变量引入回归方程且通过回归系数显著性检验,它会使均方误差减小且使提高。
并使统计量的观测值发生显著改变。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 SPSS 处理 多重 回归 分析