第八章离散选择模型Logist回归Word格式.docx
- 文档编号:19245672
- 上传时间:2023-01-04
- 格式:DOCX
- 页数:9
- 大小:82.82KB
第八章离散选择模型Logist回归Word格式.docx
《第八章离散选择模型Logist回归Word格式.docx》由会员分享,可在线阅读,更多相关《第八章离散选择模型Logist回归Word格式.docx(9页珍藏版)》请在冰豆网上搜索。
综上所述的选取指标的类别和选取原则,全面考虑,选取如下(见表1)财
务指标:
表1选取的指标
反映能
力
财务指标
计算公式
偿债
能力
X1:
流动比率
流动资产/流动负债
X2:
流动负债经营活动净现金流比
经营活动净现金流量/流动负债
X3:
股东权益比率
股东权益/总资产
X4:
总资产周转率
主营业务收入净额/平均总资产
经营
X5:
存货周转率
主营业务成本/存货平均余额
X6:
应付账款周转率
(主营业务成本+期末存货-期初存货”
平均应付账款
盈利
X7:
净资产收益率
禾U润总额/平均股东权益
㈣数据的来源
以2004年上市公司的报出的三大报表数据为依据计算财务指标作为分析对象,选取两组样本。
由于logistic回归模型的特征,为了使守信率更趋近于0和
1,选取两组两端(较好和较坏)作为样本数据,一组为正常上市公司(信用状
况较好),选取被证券之星网站排名在材料行业前30名和机械制造行业前20名的公司,共计50家;
另一组为非正常公司(信用状况较坏),因财务异常而被特别处理(ST)的公司,选取材料和机械制造行业被特别处理的公司和注册会
计师给以“拒绝表示意见”的审计报告的公司共计50家。
三、logistic回归模型分析
㈠数据的初始处理和主成分分析
设选取的原始数据为X(X!
X2...X8),其中:
Xj(X"
X2j...X!
00j),(j1,2...8)
先消除量纲的影响,先对样本数据进行标准化
标准化后的数据记为Xi*(i=1,2,…8)。
为了消除logistic回归模型分析中各变量存在的多重共线性,并对选取的指
标进行分类,对8个指标进行采取主成分分析法进行因子分析,即寻找因子Fi保
持原始的信息,并且互不相关。
计算相关系数矩阵R的特征值,和特征向量D,所求特征值依大小顺序排列为iiLio0,对应i的特征向量为Di,主成分为Fi=XDj.
主成分F的贡献率为hi盲-」•这样可只考虑少数几个主成分而不损失
t
t1
较多信息,抓住主要矛盾,揭示规律性。
并对其通过方差最大化法进行正交因子旋转。
旋转过程对主成分提取的结果只改变信息量在不同主成分之间的分布,从
而可以找到合理的经济解释。
采用SPSS11.5统计软件中Analyze—DataReduction—Factor…进行因
子分析,前4个主成分的特征值的累计贡献率已经达到了78.58%,选取
F1,F2,F3,F4作为最终指标进行分析,可以分别有原来8个指标表示为:
F1=0.456X;
+0.335X2*+0.486X3*+0.031X4*-0.157X5*+0.035X6*-0.073X7*+0.079X8*
F2=-0.048X;
+0.242X2*-0.219X3*+0.498X4*+0.530X5*+0.07X6*-0.015X7*-0.214X8*
F3=0.012X;
-0.138X2*+0.006X3*0.116X4*-0.087X5*0.452X6*+0.05X7*0.698X8*
F4=0.063X1*+0.247X2*-0.398X3*0.065X4*-0.084X5*0.061X6*+0.849X7*0.07X8*
由上表达式可以看出,F1主要表达了X1、X2、X3等三个指标的信息量,反映
的是企业的偿债能力,F2主要表达了X4、X5等指标的信息量,反映的是企业的
营运能力,F1主要表达了X6、X8等指标的信息量,反映的是企业的还款意愿和
总盈利能力,F1主要表达了X7等指标的信息量,反映的是企业的净盈利能力
㈡logistic回归分析
建立logistic回归模型表述如下:
其中:
Zi
1
PiZi
1ei
m
j1
对于各公司i,(i=1,2,…n)若p7),表明信用状况较差,若p~1,表明信用状况较好,称P为守信率。
令Pi(y)Piyi(1Pi)(1yi)
甘出1,若公司i的信用状况较好
八yi0,若公司i的信用状况较差
函数为:
两边取对数:
其中Fj为企业信用风险评定的影响变量,即上述的四个主成分。
使上述函数达
n1
i1[yiF0
[y-J^)]*Fij0(j=1,2,3,4)
i11e
联立上述方程求出各个估计的参数值。
采用SPSS11.5分析软件中AnalyzefRegressionfBinaryLogistic…进
行回归模型分析。
回归方法为向前逐步选择引入法,即通过最大似然估计所得的似然比的概率作为引入变量的标准,采取迭代法逐步计算,直到对数似然比不再
变化为止。
逐步引入的变量及迭代过程以及参数估计值如下表(表2)所示
表2IterationHistory
Iteration
-2Loglikelihood
Constant
Coefficients
F1
F2
F4
Step11
100.074
.000
1.111
2
81.354
.043
2.494
3
75.701
.073
3.725
4
74.923
.091
4.390
5
74.902
.096
4.522
6
4.526
7
Step21
80.290
.861
59.407
.082
2.508
1.253
51.050
.097
4.013
1.643
49.144
.070
5.127
1.937
48.987
.050
5.563
2.051
48.985
.047
5.612
2.063
5.613
2.064
Step31
76.722
.324
55.195
.143
2.394
1.371
.659
46.050
.212
3.800
1.815
1.301
43.109
.282
4.687
2.158
3.030
42.703
.331
5.154
2.367
3.964
42.691
.343
5.258
2.415
4.148
.344
5.262
2.417
4.154
8
由上表可以看到,F1(企业偿债能力)对P的影响最大,第一步就被引入模型,其次是F2和F4。
我们选择第三步的回归结果,其参数估计以及其统计检验如下表(表3),各系数统计量检验的效果显著。
如上所述,估计的
logistic回归模型如下:
p
.(0.344+5.262F1+2.417F2+4.154F4)
1e
表3VariablesintheEquation
B
S.E.
Wald
df
Sig.
Exp(B)
Step3
1.193
19.439
192.856
.653
13.716
11.208
2.413
2.963
.085
63.689
.408
.709
.400
1.410
主成分F3没有引入模型,在我国F3(还款意愿和部分盈利能力)对守信率的影响并不显著。
将样本数据代入模型预测信用状况时,计算出P值,若PO.5,就判断企业为守信较差企业(信用较差),若PO.5,就判断企业为守信较好企业(信用较好)。
对样本数据的预测概率和各企业的频数若下图(图1)所示。
32
ObservedGroups
andPredictedProbabilities
F
R
24
-0
--
E
Q
U
16
1-
N
I
匚
¥
11-
11
00
11
11]1
OOOIJOD000000
Dll1ID0111
111111010
Predicted
—1—
Prob:
0・25
・5J
Group:
ooocooooooooooooiooooooooooocooiiiiimuumini]iminin
图1预测概率和各企业的频数
从表中可以看出,样本分类的准确率如下表(表4),该模型判定的总准确率为93%,对信用好的企业判为守信率高的准确率为92%,对信用较差的企业判为守信率低的准确率为94%,判定结果可信度较高。
表4ClassificationTable
Predictedy
PercentageCorrect
Observedy
47
94.0%
46
92.0%
OverallPercentage
93.0%
从样本之外选择该行业40个测试企业数据进行模型的检验,预测的准确率
为86%,判断结果同样本预测的准确率基本一致,模型比较稳定,可推广应用。
四、结论及建议
㈠基于logistic回归模型对企业信用进行评价,能够为债务人、投资者和交易方提供准确率较高的决策依据,为企业的管理者提供决策信息。
对样本的检验准确率高达93%,选择的测试数据的准确率高达86%。
㈡有回归结果可知,就材料和机械制造行业而言,影响企业信用主要是企业的偿债能力F1(原始指标为X1,X2,X3),再次是企业的营运能力和盈利能力,从参数的系数可以看到这一点,信用状态的好坏同企业的偿债能力、资金的流动性和运营效果密切相关,资金流动性好,偿债能力就强,对债务人、投资者和交易方的保障程度高,与该企业的还款意愿和盈利能力关系并不很强。
一个企业的还款意愿很强,盈利能力较强,但是资金周转效果不好,也不可能及时还债。
对于投资者选择投资对象时,企业的偿债能力,资金的流动性和经营运作能力常作为首要考虑因素。
㈢该模型的定量判别方法并不能代替定性分析方法,需同定性分析有机的结合在一起,这是因为,首先模型判别的准确性建立在真实、公允的财务报表信息的基础上,其次分析信用状况时,必须结合专业判断、管理情况、行业性质和前景以及客观环境等因素进行综合分析,最后定性分析在我国有着较长历史,积累了丰富的经验,这些是不可完全由数据分析所能概括的。
㈣对该模型,可以扩大样本量,充分考虑时间因素,采用平行数据进行分析。
可以分行业、分地区进行建立不同的模型,有针对性进行回归分析,也可以建立多元logistic回归模型,从而划分信用等级。
本文并没有从这几个方面进行探讨。
(根据东北财经大学油永同名论文编写)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 离散 选择 模型 Logist 回归