Matlab与Logistic回归.docx
- 文档编号:22810662
- 上传时间:2023-04-28
- 格式:DOCX
- 页数:32
- 大小:71.81KB
Matlab与Logistic回归.docx
《Matlab与Logistic回归.docx》由会员分享,可在线阅读,更多相关《Matlab与Logistic回归.docx(32页珍藏版)》请在冰豆网上搜索。
Matlab与Logistic回归
Matlab软件包与Logistic回归
在回归分析中,因变量
可能有两种情形:
(1)
是一个定量的变量,这时就用通常的regress函数对
进行回归;(2)
是一个定性的变量,比如,
0或1,这时就不能用通常的regress函数对
进行回归,而是使用所谓的Logistic回归。
Logistic回归的基本思想是,不是直接对
进行回归,而是先定义一种概率函数
,令
要求
。
此时,如果直接对
进行回归,得到的回归方程可能不满足这个条件。
在现实生活中,一般有
。
直接求
的表达式,是比较困难的一件事,于是,人们改为考虑
一般的,
。
人们经过研究发现,令
即,
是一个Logistic型的函数,效果比较理想。
于是,我们将其变形得到:
然后,对
进行通常的线性回归。
例1 企业到金融商业机构贷款,金融商业机构需要对企业进行评估。
例如,Moody公司就是NewYork的一家专门评估企业的贷款信誉的公司。
设:
下面列出美国66家企业的具体情况:
YX1X2X3
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
其中,
建立破产特征变量
的回归方程。
解:
在这个破产问题中,
我们讨论
,概率
。
设
=企业2年后具备还款能力的概率,即,
=企业不破产的概率。
因为66个数据有33个为0,33个为1,所以,取分界值,令
由于我们并不知道企业在没有破产前概率
的具体值,也不可能通过
的数据把这个具体的概率值算出来,于是,为了方便做回归运算,我们取区间的中值,
。
数据表变为:
X1X2X3
于是,在Matlab软件包中编程如下,对
进行通常的线性回归:
X=[1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,1;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,-280,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,-98,,;
1,-129,,;
1,-4,,;
1,,,;
1,,,;
1,,,;
1,-38,,;
1,,,;
1,,,;
1,,-4,;
1,,,;
1,43,,;
1,47,16,;
1,,4,;
1,35,,;
1,,,;
1,,,;
1,33,,;
1,,,;
1,,,;
1,,,;
1,59,,;
1,,,;
1,,7,;
1,,,;
1,,,;
1,,,;
1,,,4;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,2;
1,,,;
1,,,;
1,,,;
1,,7,2;
1,,,1;
1,,,];
a0=*ones(33,1);a1=*ones(33,1);
y0=[a0;a1];
Y=log((1-y0)./y0);
[b,bint,r,rint,stats]=regress(Y,X)
rcoplot(r,rint)
执行后得到结果:
b=
bint=
r=
rint=
stats=
即,得到:
值=(说明回归方程刻画原问题不是太好),F_检验值=>(这个值比较好),与显著性概率
相关的p值=>
,说明变量
之间存在线性相关关系。
回归方程为:
以及残差图:
通过残差图看出,残差连续的出现在0的上方,或者连续地出现在0的下方,这也暗示变量
之间存在线性相关。
编程计算它们的相关系数:
X=[1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,1;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,-280,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,-98,,;
1,-129,,;
1,-4,,;
1,,,;
1,,,;
1,,,;
1,-38,,;
1,,,;
1,,,;
1,,-4,;
1,,,;
1,43,,;
1,47,16,;
1,,4,;
1,35,,;
1,,,;
1,,,;
1,33,,;
1,,,;
1,,,;
1,,,;
1,59,,;
1,,,;
1,,7,;
1,,,;
1,,,;
1,,,;
1,,,4;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,2;
1,,,;
1,,,;
1,,,;
1,,7,2;
1,,,1;
1,,,];
X1=X(:
2);X2=X(:
3);X3=X(:
4);
corrcoef(X1,X2)
corrcoef(X1,X3)
corrcoef(X2,X3)
执行后得到结果:
ans=
ans=
ans=
可见corrcoef(X1,X2)=,这说明,在做回归时,可以去掉
列。
根据经济意义,我们去掉
列,再进行回归。
X=[1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,1;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,-280,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,-98,,;
1,-129,,;
1,-4,,;
1,,,;
1,,,;
1,,,;
1,-38,,;
1,,,;
1,,,;
1,,-4,;
1,,,;
1,43,,;
1,47,16,;
1,,4,;
1,35,,;
1,,,;
1,,,;
1,33,,;
1,,,;
1,,,;
1,,,;
1,59,,;
1,,,;
1,,7,;
1,,,;
1,,,;
1,,,;
1,,,4;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,2;
1,,,;
1,,,;
1,,,;
1,,7,2;
1,,,1;
1,,,];
a0=*ones(33,1);a1=*ones(33,1);
y0=[a0;a1];
Y=log((1-y0)./y0);
X1=X(:
2);X2=X(:
3);X3=X(:
4);E=ones(66,1);
B=[E,X2,X3];
[b,bint,r,rint,stats]=regress(Y,B)
rcoplot(r,rint)
执行后得到:
b=
bint=
r=
rint=
stats=
以及残差图:
残差图仍然显示变量之间的相关性,这说明,最开始调查数据时,3个指标没有选好。
最后得到:
将企业的具体数据
代入
的表达式计算,再结合
金融机构就可以知道,是否应该贷款给这家企业。
注:
一个通常的Regress回归,可以用
等参数评价回归结果的好坏,但对Logistic回归来说,不存在这样简单而令人满意的评价参数,所以,一般应该进行回归诊断。
Logistic回归的诊断
所谓的
回归诊断,就是将
的原始数据代入求得的回归方程中,计算
值,看看有多少个由回归方程计算所得的
值与原始的
值不同,因而判断回归方程的好坏。
(1)用回归方程
进行诊断。
①在Matlab软件包中,编程诊断
X=[1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,1;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,-280,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,-98,,;
1,-129,,;
1,-4,,;
1,,,;
1,,,;
1,,,;
1,-38,,;
1,,,;
1,,,;
1,,-4,;
1,,,;
1,43,,;
1,47,16,;
1,,4,;
1,35,,;
1,,,;
1,,,;
1,33,,;
1,,,;
1,,,;
1,,,;
1,59,,;
1,,,;
1,,7,;
1,,,;
1,,,;
1,,,;
1,,,4;
1,,,;
1,,,1;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,;
1,,,2;
1,,,;
1,,,;
1,,,;
1,,7,2;
1,,,1;
1,,,];
forj=1:
66;
f=1/(1+expiff<=;
j
y=0
elsej
y=1
end
end
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Matlab Logistic 回归