投资组合优化模型.docx
- 文档编号:29936544
- 上传时间:2023-08-03
- 格式:DOCX
- 页数:23
- 大小:23.45KB
投资组合优化模型.docx
《投资组合优化模型.docx》由会员分享,可在线阅读,更多相关《投资组合优化模型.docx(23页珍藏版)》请在冰豆网上搜索。
投资组合优化模型
资料范本
本资料为word版本,可以直接编辑和打印,感谢您的下载
投资组合优化模型
地点:
__________________
时间:
__________________
说明:
本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容
投资组合优化模型
摘要
长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关注的课题。
随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的企业、机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们在投资过程中投资组合的多样性。
而每一项投资在有其收益效果的同时也伴随着风险性,所以不同的投资组合方式将带来不同的效果。
对于不同类型的投资者必然有不同的要求,从而适合不同的投资方式,所以意在建立在不同投资者的不同要求下应采用哪种投资方式的模型,使投资者能做出正确的选择。
本文研究的主要是在没有风险的条件下,找出投资各类资产与收益之间的函数关系,合理规划有限的资金进行投资,以获得最高的回报。
对于问题一,根据收益表中所给的数据,我们首先建立二元线性回归模型来模拟收益U与x,y之间的关系,对于模型中的各项自变量前的系数估计量,利用spss软件来进行逐步回归分析。
发现DW值为0.395,所以原模型的随机误差项违背了互相独立的基本假设的情况,即存在自相关性。
为了处理数据间的自相关问题,运用了迭代法,先通过Excel进行数据的处理和修正,达到预定精度时停止迭代,再一次用spss软件来进行检验,发现DW值变为2.572,此时DW值落入无自相关性区域。
在进一步对模型进行了改进后,拟合度为进行了残差分析和检验预测,这样预测出的结果更加准确、有效,希望能为投资者实践提供某种程度的科学依据。
对于问题二,根据问题一建立的模型和问题二中所给出的条件,确定目标函数,进行线性规划,用MATLAB软件来求得在资金固定的情况下,选择哪种投资方式能使达到利益最大化。
最后,对模型的优缺点进行评价,指出了总收益与购买A类资产x份数和B类资产y份数之间的关系模型的优点与不足之处,并对模型做出了适度的推广和优化。
关键字:
经济效益回归模型自相关迭代法线性规划有效投资方法
一、问题重述
某金融机构选定了A,B两种投资品种,购买A类资产x份和B类资产y份的投资收益是U,经分析测算有如下收益表:
请解决以下问题:
(1)确定U与x,y的关系;
(2)若A的价格是每份120元,B的价格是每份80元,现有资金960万元,选定有效的投资方案以使收益最大。
二、问题分析
对于问题一,根据实际中投资学的相关原理和有关常识,我们知道在同等无风险的条件下,购买A类资产和购买B资产各自都会带来收益,因此,一般先确定U与x、y之间的关系,有利于我们在决定投资时,如何分配对A,B两类资产的投入资金的比重,这也是我们建立模型首先要解决的难点。
观察所给数据之间的大致关系来看,我们首先考虑建立回归模型,在进行数据分析时,不可能通过几个简单的假设就监理处了一个完美的数学模型,这就需要对现有的数据进行较为有效的筛选,在此次建模过程中我们一次进行了进行显著性分析,进行逐个剔除,消除误差项之间的自相关性,进一步优化后,得到最好的模型,再对结果分别进行预测和分析。
对于问题二,这是一个如何配置资源的问题,在已知目标函数的前提下,用有限的资金来得到最大的利益。
可以运用线性规划的相关知识来解决,列出所有已知条件,即约束条件,并利用MATlAB软件来进行求解,得到最优解,最后进行检验。
三、模型假设
1.投资者总是追求较高的收益,即投资者都是符合经济学中的“理性人”的假设。
2.在短时期内所给出的平均收益率不变,即保证所得数据在一定时期内的有效性。
3.假设题设中给的参数是准确值没有偏差。
4.存在无风险资产,即本文对A、B两类资产的投资都为无风险投资。
5.每种投资是否收益是相互独立的。
6.对收益率和风险的预测值是可信的
四、符号说明
U——收益
x——,购买A类资产的份数
y——,购买B类资产的份数
β0、β1、β2——分别为回归模型的常数项,自变量x、y前面的系数
εi——第i个样本回归模型的随机误差项
Ut——第t个收益的回归估计
xt——第t个购买A类资产的样本份数
yt——第t个购买B类资产的样本份数
五、理论背景
1.多元线性回归
一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。
当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。
设y为因变量X1,X2…Xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:
Yi=β0+β1X1i+β2X2i+…+βkXki+μii=1,2,…,n
其中k为解释变量的数目,βj(j=1,2,…,k)称为回归系数(regressioncoefficient)。
上式也被称为HYPERLINK"\t"_blank"总体回归函数的随机表达式。
它的非随机表达式为
E(Y∣X1i,X2i,…Xki,)=β0+β1X1i+β2X2i+…+βkXki
βj也被称为HYPERLINK"\t"_blank"偏回归系数(partialregressioncoefficient)
建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:
(1)自变量对HYPERLINK"\t"_blank"因变量必须有显著的影响,并呈密切的HYPERLINK"\t"_blank"线性相关;
(2)自变量与因变量之间的HYPERLINK"\t"_blank"线性相关必须是真实的,而不是形式上的;
(3)HYPERLINK"\t"_blank"自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于HYPERLINK"\t"_blank"自变量与HYPERLINK"\t"_blank"因变量之因的相关程度;
(4)自变量应具有完整的HYPERLINK"\t"_blank"统计数据,其预测值容易确定。
2、自相关的概念
如果模型的随机误差项违背了互相独立的基本假设的情况,称为自相关性。
对于模型
Yi=β0+β1X1i+β2X2i+……+βkXki+μii=1,2,……,n
随机误差项互不相关的基本假设表现为:
Cov(μi,μj)=0i≠j,i,j=1,2,……,n
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性。
在其他假设仍旧成立的条件下,序列相关即意味着
E(μi,μj)!
=0
或
(
)
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
n
n
T
E
NN
E
m
m
m
m
L
M
1
1
)
(
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
2
1
1
2
1
n
n
n
E
m
m
m
m
m
m
L
M
O
M
L
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
)
(
)
(
)
(
)
(
2
1
1
2
1
n
n
n
E
E
E
E
m
m
m
m
m
m
L
M
O
M
L
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
2
1
1
2
1
)
(
)
(
n
n
n
E
E
s
m
m
m
m
s
L
M
O
M
L
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
2
1
1
2
)
(
)
(
s
m
m
m
m
s
L
M
O
M
L
n
n
E
E
Ω
2
s
=
I
2
s
¹
3、自相关性的后果
(1)参数估计量非有效
(2)变量的显著性检验失去意义
(3)模型的预测失效
4、自相关性的检验
杜宾-瓦森(Durbin-Watson)检验法
该方法的假定条件是:
(1)解释变量X非随机;
(2)随机误差项mi为一阶自回归形式:
mi=rmi-1+ei
(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Yi=b0+b1X1i+¼bkXki+gYi-1+mi
(4)回归含有截距项;
(5)没有缺失数据。
D.W.统计量
5、具有自相关性模型的估计
(1)广义最小二乘法
(2)一阶差分法
(3)广义差分法
(4)随机误差项相关系数r的估计
科克伦-奥科特迭代法
首先,采用OLS法估计原模型
Yi=b0+b1Xi+mi
得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS法估计下式
mi=r1mi-1+r2mi-2+¼rLmi-L+ei
得到r1,r2,¼,rk,作为随机误差项的相关系数r1,r2,¼,rk的第一次估计值。
其次,将上述r1,r2,¼,rk,带入以差分模型
Yi-ρ1Yi-1-……-ρiYi-1=β0(1-ρ1-……-ρi)+βi(Xi-ρ1Xi-1-……-ρiXi-1)+εii=1,2,……,n
在此,将β0,β1代回原模型,计算出原模型随机误差项的新的“近似估计值”,并以之作为模型
Μi=ρ1μi-1+ρ2μi-2+……+ρkμi-k+ε
的样本观测值,采用OLS法估计该方程,得到r1,r2,¼,rk作为相关系数r1,r2,¼,rk的第二次估计值。
关于迭代的次数,可根据具体的问题来定。
一般是事先给出一个精度,当相邻两次r1,r2,¼,rk的估计值之小于这一精度时,迭代终止。
杜宾(Durbin)两步法
该方法仍是先估计r1,r2,¼,rk,再对差分模型进行估计。
第一步,变换差分模型为下列形式:
Yi=ρ1Yi-1+……+ρlYi-l+β0(1-ρ1-……-ρk)+β1(Xi-ρ1Xi-1-……-ρkXi-k)+εii=1,2,……,n
采用OLS法估计该方程,得到各Yj(j=i-1,i-2,……,i-k)前的系数r1,r2,¼,rk的估计值ρ1,ρ2,……,ρk。
第二步,将估计的r1,r2,¼,rk,代入差分模型
采用OLS法估计,得β0(1-ρ1-……-ρk),β1的估计量,记为*β0,*β1。
于是:
)
ˆ
ˆ
1
(
ˆ
ˆ
1
*
0
0
l
r
r
b
b
-
-
-
=
L
,
*
1
1
ˆ
ˆ
b
b
=
六、模型建立
问题一:
假定收益U与x、y之间存在线性关系,则可建立二元线性回归模型
U=β0+β1*x+β2*y+ε
式中,U表示总的收益;x表示购买A类资产的份数;y表示购买B类资产的份数;β0、β1、β2分别表示回归方程的常数项、x和y前面的系数;ε表示随机误差项。
问题二:
由上一问得到的模型U=9.042+0.047x+0.19y后,求目标函数的最大值
建立约束条件:
120x+80y≤9600000
X≥0
Y≥0
式中,x、y表示的是整数。
七、模型求解及优化
1.问题一
(1)根据数据资料定义变量U(收益)、x(A类资产的份数)、y(B类资产的份数),再将全部数据输入spss界面,建立数据文件。
(2)选择U为因变量,以x、y为自变量,进行逐步回归;在Statistics对话框中选择Estimate、Modelfit、Discriptives、Durbin-Watson;选择Plots对话框的残差直方图、残差正态概率图。
并输出以ZRESID为X轴,以DPENDNT为Y轴的散点图;在Save对话框里选择保存未标准预测值、未标准预测值残差、标准预测值、标准预测值残差;Options对话框选项选择默认选项,各选项确认以后,交系统运行。
(3)结果及分析
描述统计表如下:
DescriptiveStatistics
表中显示各个变量的全部观测量的Mean(均值)、Std.Deviation(标准差)和观测量总数N。
U 的均值和标准差分别为14.231579、5.6033772,x的均值和标准差分别为77.368421、77.1479175,y的均值和标准差分别为81.368421、97.2106593。
(4)相关系数矩阵如下:
Correlations
表中显示了三个自变量两两间的Pearson相关系数,以及关于相关系数关系等于零的假设的单尾显著性检验概率。
从表中看到因变量U(收益)与自变量x(A类资产的份数)、y(B类资产的份数)之间相关系数一次为0.852、0.725,反应它们之间有显著的相关关系,而可以看出在同等条件下,购买A类资产相比购买B类资产的收益更大。
(5)回归系数表如下:
Coefficients(a)
aDependentVariable:
U
据表中数据费标准化系数B的数值可以知道,逐步回归过程中先后建立的两个回归模型分别是:
模型1:
U=9.445+0.062*x
模型2:
U=9.042+0.047*x+0.019*y
即β0=9.042,β1=0.047,β2=0.019
Std.Error(标准误)列显示的是各系数的估计标准误差。
从模型中可以看到,购买A类资产和购买B类资产对收益都起到正影响,因为两个自变量前面的系数都为正数,这与假设分析一致,此投资为无风险投资。
(6)回归模型概述表如下:
ModelSummary(c)
aPredictors:
(Constant),x
bPredictors:
(Constant),x,y
cDependentVariable:
U
回归模型概述表中给出了第一个模型中因变量U与自变量x之间的相关系数R=0.852,说明变量U与x之间具有显著的线性关系。
第二个模型中因变量U与x、之间的复相关系数R=0.890,反映了变量U与x、y之间具有高度线性关系。
对于第二个模型给出了杜宾-瓦特森检验DW=0.395,此时的dl=1.08,du=1.53,因为0 由于回归模型存在序列自相关性,在此,我们用迭代法来处理。 Ut=k0+k1xt+k2yt et=ρ*et-1+ut 令 U’t=Ut-ρ*Ut-1 x’t=xt-ρ*xt-1 y’t=yt-ρ*yt-1 其中,上式中的自相关系数p是未知的,可以由DW值做出估计p=1-1/2*DW,计算后得出p的估计值为0.8025。 于是原式变为 U’t=β0+β’1*xt+β’2*yt+ut (7)上式模型有独立随机误差项,它满足线性回归模型的基本假设,用Excel做出有变换后的数据,并录入spss界面进行检验 由变换后的数据得出的回归模型概述表如下: ModelSummary(c) aPredictors: (Constant),xt bPredictors: (Constant),xt,yt cDependentVariable: Ut 概述表中给出了第二个模型给出了杜宾-瓦特森检验DW=2.572,此时的dl=1.08,du=1.53,因为dl 同时,我们可以观察到修改后的回归模型的残差值也基本在水平线y=0附近随机分布 在此时自相关回归中,回归预测值Ut不是用k0+k1*xt+k2*yt计算,而是用 Ut=k’0+ρ*Ut-1+k’1(xt-ρ*xt-1)+k’2*(yt-ρ*yt-1) 在上式为我们最终建立的模型,式中我们取收益表中的最后一组数据作为xt-1和yt-1,即 Ut=k’0+ρ*Ut-1+k’1(xt-ρ*xt-1)+k’2*(yt-ρ*yt-1) =9.042+0.8025*22+0.047*(xt-0.8025*236)+0.019*(yt-0.8025*270) =13.678845+0.047*xt+0.019*yt t统计量值和t分布的双侧显著性概率Sig.皆远小于0.05,可以认为回归系数是显著的。 2.问题二: 根据问题一得到的模型和给出的已知条件,可以得到 目标函数: maxU=13.678845+0.047*x+0.019*y 约束条件: 120x+80y<=960 x>=0 y>=0 用MATLAB软件来求解线性规划的命令如下: c=[-0.047-0.019]; A=[12080]; b=[9600000]; Aeq=[]; beq=[]; lb=[0;0]; vb=[]; [x,fval]=linprog(c,A,b,Aeq,beq,lb,vb) 结果: x= 1.0e+04* 8.0000 0.0000 fval= -3.7600e+03 并运用MATLAB还可以求出该模型的图像 symsxyU x=0: 2: 300; y=0: 2: 300; U=13.678845+0.047*x+0.019*y; [x,y]=meshgrid(x,y); surf(x,y,U) 可得在A的价格是每份120元,B的价格是每份80元,资金960万元的条件下,使收益最大时,应该将所有的资金960万元都用来买A类资产80000份,这是预计的最大收益是3773.679。 八、模型检验 模型检验主要是针对问题一所提出的模型进行检验。 对回归系数的显著性检验,我们用的是t检验。 t检验: 在多元线性回归中,回归方程显著并不意味着美国自变量对U的影响显著,所以需要对每个变量进行显著性检验。 如果某个自变量xj对作用不显著,那么在回归模型中,它的系数βj就取值为零。 因此,检验变量是否显著,等价于检验假设 H0j: βj=0,j=1,2,……,p 据此可以构造t统计量 tj=β/√cjjσ 其中σ是回归标准差。 当∥tj∥≥tα/2时,拒绝元假设H0j: βj=0,认为βj显著不为零,自变量xj对因变量y的线性效果显著;当∥tj∥<tα/2时,接受原假设H0j: βj=0,认为βj为零,自变量xj对因变量y的线性效果不显著。 下图是回归系数表 Coefficients(a) aDependentVariable: U 图中的Sig即显著性P值,由x的P≈0.000,由此可知此自变量x显著,y的P≈0.039,自变量y也显著。 由spss软件做出的残差统计表如下: ResidualsStatistics(a) aDependentVariable: Ut 本表显示预测值(PredictedValue)、残差(Std.PredictedValue)、标准化预测值(StandardErrorofPredictedValue)、标准化残差的最小值(Minimum)、最大值(Maximum)、均值(Mean)、标准差(Std.Deviation)以及样本容量(N)。 根据概率的3-σ原则,上图中标准化残差的绝对值的最大值为1.569<3,说明样本数据中没有奇异数据,模型具有有效性。 残差分布直方图和观测量累计概率P-P图如下: 回归分析中,总是假设残差ε服从正态分布,残差分布直方图和观测量累计概率P-P图就是根据样本数据的计算结果显示残差分布的实际状况,然后对残差分布是否为正态的假设做出检验。 从回归残差的直方图与附在图上的正态分布曲线相比较,可以认为残差不是很明显的服从正态分布。 尽管这样,也不能盲目地否定残差服从正态分布的假设,因为我们用来进行的样本量太小,样本容量仅为19. 观测量累计概率图,也是用来比较残差分布于正态分布差异的图形。 基于以上认识,从上图的散点分布状况来看,19个点大致散布于斜线附近,因此可以认为此次分布基本上是正态的。 输出的图形中还有一个因变量的回归标准化残差图,如下所示: 对于问题二最优解的检验 由于x,y是正整数,且有约束条件120x+80y≤9600000,可知(x,y)的可行域为图中的三角形区域中的整数点集,又由模型一代入最后一组数据而得到的函数U=13.678845+0.047*x+0.019*y, 经变化可得到y=(-0.047/0.019)*x+(13.678845-U)/0.019 故当上式的截距取到最小值时,U为最大,此时的x与y值便是最优投资组合。 用MATLAB画出的图像如下 再者,由问题一建立的模型中,我们可以看到x前的回归系数为0.047,y前面的回归系数为0.019,再由A的价格是每份120元,B的价格是每份80元,在不考虑常数项的情况下,计算可得对于A的投资,每增加1元可得到的收益是0.0003917而对于B的投资,每增加1元可得到的收益是0.0002375,所以我认为在资金有限,不考虑风险的情况下,投资者应该先考虑投资A类资产,如果减去能购买A类最多份数后的剩余的资金J,满足80≤J<120,则此时应该再考虑买一份B类资产。 关于最优解的检验,由于此题所给的可行域小,所以可以列出所有的可能性,再代入目标函数进行检验,,但是对于多元的线性规划最优解,还是要建立相关的矩阵,再来进行计算和检验。 九、模型评价及优化 模型的优点: (1)本模型根据已有数据较好的体现了总收益与购买A、B类资产的份数之间的关系,而且该模型简单易懂,使得求解有了很大的简化。 (2)准确利用了题目所提供的数据,并对数据进行了较为透彻的分析,抓住了分析的要点,较好的完成了数据的提取与应用。 (3)在本文中,我们分别用了spss、Excel、MATLAB等软件来进行数据的分析和处理,这样有利于提高模型的准确度和预测的可信性。 模型的缺点: (1)由于模型是建立在假设 是确定值的基础上的而实际中β0、β1、β2常为随机变量因而模型在这个方面作的还不够,不能很好的抓住市场上的商机,缺乏动态性。 (2)该模型没有考虑到各类投资的风险性,。 (3)实际中的各个项目之间往往是有相关性的其相关程度由相关系数来决定 模型的优化和推广: 将β0、β1、β2 作为随机变量来考虑,并进而考虑个投资项目之间的相关性将是模型的一个主要改进方向,并把投资风险和损失及交易费等因素考虑进模型。 十、参考文献 [1]郝黎仁樊元郝哲
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 投资 组合 优化 模型