从回归系数检验的各P值可知,自变量x2不显著,表明因变量y与3个自变量之间的线性关系显著。
从回归系数检验的各P值可知,自变量不显著,其他两个自变量都是显著的。
这可能意味着模型中存在多重共线性。
9.3根据两个自变量得到的多元回归方程为,并且已知n=10,SST=6724.125,SSR=6216.375,,。
(1)在a=0.05的显著性水平下,、与y线性关系是否显著?
(2)在a=0.05的显著性水平下,是否显著?
(3)在a=0.05的显著性水平下,是否显著?
详细答案:
(1)提出假设:
:
:
至少有一个不等于0
计算检验的统计量F
当a=0.05时,。
由于,所以拒绝原假设,表明、与y线性关系显著。
(2)提出假设:
:
:
计算检验的统计量t
当a=0.05,,由于,所以拒绝原假设,表明显著。
(3)提出假设:
:
:
计算检验的统计量t
当a=0.05,,由于,所以拒绝原假设,表明显著。
9.4一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。
下面是近8个月的销售额与广告费用数据
月销售收入y(万元)
电视广告费用(万元)
报纸广告费用(万元)
96
5.0
1.5
90
2.0
2.0
95
4.0
1.5
92
2.5
2.5
95
3.0
3.3
94
3.5
2.3
94
2.5
4.2
94
3.0
2.5
(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(3)上述
(1)和
(2)所建立的估计方程,电视广告费用的系数是否相同?
对其回归系数分别进行解释。
(4)根据问题
(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?
(5)根据问题
(2)所建立的估计方程,检验回归系数是否显著(a=0.05)。
详细答案:
(1)由Excel输出的回归结果如下:
回归统计
MultipleR
0.807807
RSquare
0.652553
AdjustedRSquare
0.594645
标准误差
1.215175
观测值
8
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
16.6401
16.6401
11.26881
0.015288
残差
6
8.859903
1.476651
总计
7
25.5
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
Intercept
88.63768
1.582367
56.01588
2.17E-09
84.76577
92.50959
XVariable1
1.603865
0.477781
3.356905
0.015288
0.434777
2.772952
估计的回归方程为:
。
(2)由Excel输出的回归结果如下:
回归统计
MultipleR
0.958663
RSquare
0.919036
AdjustedRSquare
0.88665
标准误差
0.642587
观测值
8
方差分析
df
SS
MS
F
SignificanceF
回归分析
2
23.43541
11.7177
28.37777
0.001865
残差
5
2.064592
0.412918
总计
7
25.5
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
Intercept
83.23009
1.573869
52.88248
4.57E-08
79.18433
87.27585
XVariable1
2.290184
0.304065
7.531899
0.000653
1.508561
3.071806
XVariable2
1.300989
0.320702
4.056697
0.009761
0.476599
2.125379
估计的回归方程为:
。
(3)不相同。
在月销售收入与电视广告费用的方程中,回归系数表示电视广告费用每增加1万元,月销售额平均增加1.603865万元;在月销售收入与电视广告费用和报纸广告费用的方程中,回归系数表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.290184万元。
(4),。
表明在销售收入的总变差中,被估计的回归方程所解释的比例为88.665%
(5)的P-Value=0.000653,的P-Value=0.009761,均小于a=0.05,两个回归系数均显著。
9.5某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下
收获量y(kg/hm2)
降雨量x1(mm)
温度x2()
2250
25
6
3450
33
8
4500
45
10
6750
105
13
7200
110
14
7500
115
16
8250
120
17
(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。
(2)解释回归系数的实际意义。
(3)根据你的判断,模型中是否存在多重共线性?
详细答案:
(1)由Excel输出的回归结果如下:
回归统计
MultipleR
0.995651
RSquare
0.991321
AdjustedRSquare
0.986982
标准误差
261.431
观测值
7
方差分析
df
SS
MS
F
SignificanceF
回归分析
2
31226615
15613308
228.4445
7.53E-05
残差
4
273384.7
68346.19
总计
6
31500000
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
Intercept
-0.591
505.0042
-0.00117
0.999122
-1402.71
1401.526
XVariable1
22.38646
9.600544
2.331791
0.080095
-4.26892
49.04184
XVariable2
327.6717
98.79792
3.316585
0.029472
53.3647
601.9787
早稻收获量对春季降雨量和春季温度的二元线性回归方程为:
(2)回归系数表示,降雨量每增加1mm,小麦收获量平均增加22.3865kg/hm2;回归系数表示,温度每增加1,小麦收获量平均增加327.6717kg/mh2。
(3)从降雨量和温度与收获量的关系看,两个变量与收获量之间都存在较强的关系,而且温度与降雨量之间也存在较强的关系,因此,模型中可能存在多重共线性。
9.6一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值()、房产的评估价值()和使用面积()建立一个模型,以便对销售价格作出合理预测。
为此,收集了20栋住宅的房地产评估数据
房地产编号
销售价格y(元/㎡)
地产估价(万元)
房产估价(万元)
使用面积(㎡)
1
6890
596
4497
18730
2
4850
900
2780
9280
3
5550
950
3144
11260
4
6200
1000
3959
12650
5
11650
1800
7283
22140
6
4500
850
2732
9120
7
3800
800
2986
8990
8
8300
2300
4775
18030
9
5900
810
3912
12040
10
4750
900
2935
17250
11
4050
730
4012
10800
12
4000
800
3168
15290
13
9700
2000
5851
24550
14
4550
800
2345
11510
15
4090
800
2089
11730
16
8000
1050
5625
19600
17
5600
400
2086
13440
18
3700
450
2261
9880
19
5000
340
3595
10760
20
2240
150
578
9620
用Excel进行回归,回答下面的问题:
(1)写出估计的多元回归方程。
(2)在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
(3)检验回归方程的线性关系是否显著(a=0.05)。
(4)检验各回归系数是否显著(a=0.05)。
详细答案:
(1)由Excel输出的回归结果如下:
回归统计
MultipleR
0.947362
RSquare
0.897496
AdjustedRSquare
0.878276
标准误差
791.6823
观测值
20
方差分析
df
SS
MS
F
SignificanceF
回归分析
3
87803505
29267835
46.69697
3.88E-08
残差
16
10028175
626760.9
总计
19
97831680
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
Intercept
148.7005
574.4213
0.25887
0.799036
-1069.02
1366.419
XVariable1
0.814738
0.511989
1.591321
0.131099
-0.27063
1.900105
XVariable2
0.82098
0.211177
3.887646
0.001307
0.373305
1.268654
XVariable3
0.135041
0.065863
2.050322
0.057088
-0.00458
0.274665
估计的多元回归方程为:
。
(2)判定系数,调整的判定系数。
表明销售价格的总变差中,被估计的回归方程所解释的比例为87.83%。
(3)由于SignificanceF=3.88E-08
(4)的P-Value=0.1311>a=0.05,不显著;的P-Value=0.0013的P-Value=0.0571>a=0.05,不显著。
9.7根据9.4题中的数据,回答下面的问题:
(1)a=0.01的水平下,检验二元回归模型线性关系的显著性。
(2)a=0.05在的水平下,检验回归系数的显著性,你认为应该从模型中剔除吗?
(3)a=0.05在的水平下,检验回归系数的显著性,你认为应该从模型中剔除吗?
详细答案:
(1)由于SignificanceF=0.001865
(2)的P-Value=0.0007
(3)的P-Value=0.0098
9.8根据下面的数据回答下面的问题:
y
123.7
22.3
96.6
126.6
25.7
89.4
120.0
38.7
44.0
119.3
31.0
66.4
110.6
33.9
49.1
130.3
28.3
85.2
131.3
30.2
80.4
114.4
21.4
90.5
128.6
30.4
77.1
108.4
32.6
51.1
112.0
33.9
50.5
115.6
23.5
85.1
108.3
27.6
65.9
126.3
39.0
49.0
124.6
31.6
69.6
(1)计算y与之间的相关系数,有无证据表明二者之间存在线性关系?
(a=0.05)
(2)计算y与之间的相关系数,有无证据表明二者之间存在线性关系?
(a=0.05)
(3)根据上面的结论,你认为对预测y是否有用?
(4)用Excel进行回归,并对模型进行检验,所得的结论与(3)是否相同?
(a=0.05)
(5)计算与之间的相关系数,所得结果意味着什么?
详细答案:
(1)由excel的“CORREL”函数计算的系数r=0.0025。
检验的统计量为:
取a=0.05,。
由于检验统计量,拒绝原假设。
无证据表明二者之间存在线性关系。
(2)由excel的“CORREL”函数计算的系数r=0.4341。
检验的统计量为:
取a=0.05,。
由于检验统计量,拒绝原假设。
无证据表明二者之间存在线性关系。
(3)由于、与y没有相关关系,所以用对预测y没有用。
(4)由Excel输出的回归结果如下:
回归统计
MultipleR
0.999924
RSquare
0.999847
AdjustedRSquare
0.999822
标准误差
0.107155
观测值
15
方差分析
df
SS
MS
F
SignificanceF
回归分析
2
900.7222
450.3611
39222.34
1.28E-23
残差
12
0.137787
0.011482
总计
14
900.86
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
Intercept
-45.1541
0.611418
-73.8515
2.53E-17
-46.4863
-43.822
XVariable1
3.097008
0.012274
252.3137
1.01E-23
3.070264
3.123752
XVariable2
1.031859
0.003684
280.0789
2.89E-24
1.023832
1.039886
由于SignificanceF=1.28E-23
(5)由excel的“CORREL”函数计算的系数r=-0.8998,两个自变量之间高度负相关。
这意味着模型中存在多重共线性。
9.9下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位:
元)
企业编号
销售价格y
购进价格
销售费用
1
1238
966
223
2
1266
894
257
3
1200
440
387
4
1193
664
310
5
1106
791
339
6
1303
852
283
7
1313
804
302
8
1144
905
214
9
1286
771
304
10
1084
511
326
11
1120
505
339
12
1156
851
235
13
1083
659
276
14
1263
490
390
15
1246
696
316
(1)计算y与、y与之间的相关系数