stata数据分析.docx
- 文档编号:4426429
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:13
- 大小:260.05KB
stata数据分析.docx
《stata数据分析.docx》由会员分享,可在线阅读,更多相关《stata数据分析.docx(13页珍藏版)》请在冰豆网上搜索。
stata数据分析
合肥学院
《计量经济与实证分析》实验报告
学生姓名:
朱盈超
学号:
1313101023
系另1」:
管理系
专业:
财务管理
提交时间:
2015
年11
地区财政收入影响因素
题目:
地区财政收入影响因素
一、实验目的
研究地区财政收入影响的因素有哪些,判断这些因素是否存在多重共线性,并提
出解决
二、实验内容
1.用软件计算回归结果
2.根据回归结果判断是否存在多重共线性,提出解决多从共线性的方法
3.判断是否存在其他未被纳入模型的因素
三、实验过程与结论
第一步:
构建模型
以财政收入为被解释变量,固定资产投资总额、工业总产值、农林牧渔总产值、社会消费品零售总额以及地区总人口为解释变量建立线性回归模型。
Y=P0+P1*X1+
P2*X2+P3*X3+P4*X4+P5*X5+u
其中:
第二步:
利用stata软件计算回归结果,结果如下:
・regyxlk2x3x4x5
F值71.68,R-square0.93485个变量由T值看均没有通过显著
性检验,R平方很大,所以可能存在多重共线性这时的模型方程为
Y=96.867+0.665X1-0.0015X2-0.3639X3+0.277X4+0.0345X5+u
第二步进行多重共线性的检验
var1able
VIF
1/V7F
42135XXXXX
MeanviF
0.05496e
0.054999
0.068264
0.083837
0.009270
14.83
判断VIF值大小
从结果看出vif=14.83大于10,所以存在多重共线性。
F面开始采取补救措施
进行主成分分析
.pwcorryxlx3x4x5,5ig
1.0000
多重共线性检验修正
swregy
xl
ppp
0.6791
0.4137
0.1081
>=
>=
>=
x2x3x4x5,pr(0.Ij
beginwithful1modelremovingx2removingx5removingxl
0.1000
0.1000
0.1000
source
ss
df
MS
Number
Model
Residual
13023034.1
1036481.26
26511517.05
2637068,6163
p>
2cr
Fp
Total
14061515.4
30468717.178
R-squared
AdjR-squaredRootMSE
loo
coef.5td.Err.
PA|t|
X3x4_cons
-.2472019.3350361156.4796
.0418269.020186658.70623
-5.91
16.eo
2.67
进行逐步回归剔除
X1X2X5变量留下X3X4
1701
36
50^
9
o
2
9
[95%conf,interval]
-*3328804
.2936657
36.22539
-*1615234.3763864
276.7339
VIf
Variab1e
VIF
1/viF
x3
2.00
0.481757
X4
2.OB
0.481757
Meanvif
■
2・OS
从VIF值可以看出多重共线性不存在了
(3)可能还有地区发展不平衡,国际环境不稳定,国家对经济发展
的结构性调整等因素影响地区财政收入。
合肥学院
《计量经济与实证分析》实验报告
题目:
美国维吉尼亚州公立中小学教师工资
学生姓名:
朱盈超
学号:
1313101023
别:
管理系
专业:
财务管理
提交时间:
2015
11
美国维吉尼亚州公立中小学教师工资
一、实验目的
研究美国维吉尼亚州公立中小学教师工资的情况
二、实验内容
1将2008-2009年度抽样学校教师平均工资对2008年县平均教师工资描点2利用数据估计模型3观察是否存在异方差,如果存在异方差的话列出补救措施
三、实验过程与结论
第一步:
构建模型进行描点
以2008~2009年度抽样学校教师平均工资为被解释变量,2008年县平均教师工
资为解释变量建立现行回归模型,进行描点
Y=®+2*X1+u
其中:
丫为2008—2009年度抽样学校教师平均工资
X1为2008年县平均教师工资
P1、P2为待定系数
卩为随机误差项
第二步:
将2008—2009年度抽样学校教师平均工资对2008年县平均教师工资进行描点,结果如下:
抽样学校教师平均工资对县平均教师工资拟合图
第三步:
进行回归分析,估计数据模型,结果如下:
.regaversalary^schoolaversalary_jcounty
source
55
df
MS
NumberofobsF(1.IS)
Prob>F
R-squared
AdjR-squared
Rootmse
=
20
211.85Oi.ODOO0.92170.91732066.2
ModelResidual
904429518
76847200.8
1
18
904429518
426928ft.93
=
Total
081276718
19
51646143.1
=
aversala
coef.
5td・
Err.
t
PAlt1
[95%conf.
interval]
aversalary~y
_cons
1,043275-745,4817
.07167S5
14,55-0,24
0.000o.sie
・8926835
-73&8,5也
1.
■19逝5
5S77,e
Y=-745.4817+1.043275X1+第四步:
侦察是否存在异方差性
①BP检验,结果如下:
.estathettest
Breusch-Pagan/Cook-WeisbergtestforheteroskedasticityHo:
匚onstantvariance
Variables:
fittedvaluesofy
从上述BP检验中不难看出,回归方程存在异方差
source
ss
df
MS
Model
・322638649
1
■322638649
Residual
・039464972
18
.002192498
Total
・3&2103621
19
-019058085
whire*5
Numberofobs=20
FC1,18)=147.16
Prob>F=0.0000
ft-squared=0.8910
AdjR-squared=0.8850
RootMSE-.04682
Iny
Coef*
Std.Err.
t
P>|t1
[95%conf.
interval]
1nx
"如25495
IN13
0,000
8206503
1.164446
_cons
.104316
.8732254
0.12
0.906
-1.730262
1.9^94
imresr,white
estat
tesxforHO:
homoskedasxicixy
agAlnszHa:
unrestrictedheteroskedasticity
source
chf2
df
P
Heteroskedasticity
0.33
2
0.8466
Skewness
2.69
1
0.1007
Kurtosis
1.22
1
0,2691
Total
4.24
4
th3740
&Trivedi'sdecompositionofiM-test
Cameron
从怀特检验中可以看出,进行对数变换后的回归方程不存在异方差问题,因为
Prob>chi2=0.8486
合肥学院
《计量经济与实证分析》实验报告
题目:
虚拟的时间序列数据
学生姓名:
朱盈超
学号:
1313101023
别:
管理系
专业:
财务管理
提交时间:
2015
11
虚拟的时间序列数据
、实验的目的进行测算数据的回归方程;建立杜宾沃森的检验检查自相关:
再进行广义差分对方程进行重新估计
、具体的实验步骤
(一)实验过程
1、对y、x进行回归。
.regyx
Source
SdfMSNumberofobs=19
F(-4:
—17)-260.59—
75.3691130875.369Prob>F=0.0000
R-squared=0.9388
Model1308
Residual8537.8733717502.227845
Total13941
AdjRsquared=0.93523.242187745.18014RootMSE
22.41
yCoef.
Std.Err.tP>|t|[95%Conf.Interval]
x.24515cons-261.
53.015186716.140.000.2131142.2771964
136532.19819-8.110.000-329.0688-193.2043
由上表的估计模型:
得到回归方程丫=0.2453X-261.2062+b,
2、计算DW统计量。
tssettime
timevariable:
time,1to20delta:
1unit
*estatdwatson
Durbin-Watsond-statisticf2,
20)=,5952977
0 3、利用DW佥验是否存在自相关,并利用d值估算自相关系数。 当n=20、=1、=0.01时,查表可得。 根据d检验的决策规则可得存在正自相关, 根据d与之间的关系可得P=0.70235115 4、运用广义最小二乘法重新估量模型 .geny_1=y[_n-1] (1missingvaluegenerated) .genx_1=x[_n-1] (1missingvaluegenerated) .genp=1-0.5785807/2 .genGDy=y-p*y_1 (1missingvaluegenerated) .genGDx=x-p*x_1 (1missingvaluegenerated) 根据GDy=y-p*y_1 构建GDx=x-p*x_1 然后对GDx和GDy进行回归 .regmy SOLrce 5S df MS Numberofobs Ft1, Prob>F R-squared AdjR-squared RootH5E 二19 M84.30 =0.0000 =0.8322 =0.8223 =14_927 ModelResidual 18782.5348 3787.91682 1 17 18782.S34a 222.818637 Total 22570.4516 IR 1253.913918 GDy coef. std. Err,t P'ltl [95%conf. interval] GDX—Cons 1OTR4O4-l? 0,6? 34 .0337471q.lS 23,02107-5”24 0,000 0,000 2386407-169.1936 .dwstat Durbin-Watsond-statisticC2,19)=1.671759 重新估量的模型的DW/值为1.671759,当n=20=1、=0.01时,查表可得。 DW 的值在与2之间,由德宾-沃森d检验的决策规则可得不存在自相关,重新估量 模型为: Y=0.3098404X-120.6234+b (二)结论 这组时间存在自相关,通过广义最小二乘法重新估计后的模型 Y=0.3098404X-120.6234+b
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- stata 数据 分析
![提示](https://static.bdocx.com/images/bang_tan.gif)