量化分析基础上的股票投资对策.docx
- 文档编号:543909
- 上传时间:2022-10-11
- 格式:DOCX
- 页数:8
- 大小:22.26KB
量化分析基础上的股票投资对策.docx
《量化分析基础上的股票投资对策.docx》由会员分享,可在线阅读,更多相关《量化分析基础上的股票投资对策.docx(8页珍藏版)》请在冰豆网上搜索。
量化分析基础上的股票投资对策
量化分析基础上的股票投资对策
摘要:
目的:
通过量化分析研究股票价格的走势,为投资策略的制定提供参考依据。
方法:
选取2007年1月1日至2018年12月31日上海证券指数(上证指数)每日交易收盘价作为原始数据,总共2790个样本数据。
首先,利用MATLAB对指数平滑法、RBF神经网络预测法和马尔科夫链预测法进行编程。
然后,采用以上3种预测法对上证指数的样本数据进行预测分析。
结果:
指数平滑法中二次指数平滑法的预测误差最小,二次指数平滑法拟合出的上证指数的预测值与其实际值的走势基本吻合。
ARCH-LM检验显示基于二次指数平滑法得到的误差序列不存在ARCH效应。
结论:
二次指数平滑法的拟合效果较精确,可以选用二次指数平滑法的研究结果为股票投资策略的制定提供参考。
关键词:
RBF神经网络预测法;上证指数;指数平滑法;时间序列分析;量化分析
中国金融市场经过了近三十年的发展,股票市场早已成为国民经济重要组成部分,国内股票市场逐渐成熟,投资技术不断更新,投资者的投资思想也在不断进步。
国内股票市场主要受国家政策影响,容易受到非市场因素的影响,同发达国家成熟的股票市场相比,国内市场存在着很大的波动性和不可预测性。
上海证券交易指数首次在1990年开始对外公布,其编制机构为上海证券交易所。
上证指数的计算范围为在上海证券交易所进行交易的全部股票,但是新挂牌交易的股票在第二天才划入计算范围。
上证股票指数就成了股本持有较多的大股东对股市实施影响的手段,使上证指数的运行趋势与股票的走势相背离。
由日常的交易可以看出,市场中所发布的上证指数的变化趋势与市场的行情是基本同步的,所以,它也被中国股民及金融机构看作股价变动趋势的重要参考依据。
上证指数反应了国内股票市场的实时走向,也在一定程度上反映了国内金融市场变化趋势。
对于上证指数的实证研究,不仅可以为市场投资者、机构投资者和金融监管机构提供理论参考,而且可以对中国宏观经济运行走势进行更加精确的预测。
众所周知,股票市场一直被看作中国经济的晴雨表,因此对股票市场的研究也具有理论和现实价值。
尤其是在中国经济高速发展的黄金阶段,对于股票市场的研究就显得尤为重要。
在中国金融市场中,投资者偏好于使用上证指数对股票价格的走势进行预测,因此对于金融市场中的投资者而言,上证指数的预测对降低其投资风险、提高投资收益具有很大帮助。
对上证指数进行精确预测,在一定程度上也就是对在上交所交易的股票价格进行预测,对市场投资者和政府机构都具有很好的参考作用。
本文拟通过指数平滑预测法对上证指数收盘价的趋势和波动进行预测,以期对投资股票的个人和机构提供参考,给管理部门科学决策提供依据。
罗伟通过引入多种经济变量,对经济变量之间的相关性进行分析。
采用神经网络法,构建出时间序列股指预测模型。
从关联性的角度考虑,采用改进后的ARIMA法,构建出组合型的股指预测法。
通过研究发现,该算法能够在很大程度上提高模型的精度[1]。
邵明智采用GARCH族模型对股票市场的波动性进行研究。
股票市场的波动性对市场中投资者的投资行为具有非常大的影响。
股票市场的影响因素有很多种,包括政府财政政策、经济周期和金融危机。
该研究结论对于投资者的风险规避和投资收益具有重要的参考作用[2]。
曾静文对德国股市的变动特征进行了实证分析。
研究发现德国股市中的价格指数表现出平稳和自相关的特点。
文中采用ARCH检验对残差进行分析,发现残差具有ARCH效应。
文章最后对股票指数建立GARCH模型对股票指数进行预测,研究发现该模型对德国股市的股票指数预测效果较好[3]。
黄宏运建立以股票历史信息为输入值,每日开盘价为输出值的预测模型对上证指数进行研究,研究得出以下结论,改进后的BP网络对上证指数的预测在预测速度和预测精度上都有很大提高[4]。
蒋辉、徐桂烽采用BP神经网络与灰色残差模型对上证指数和道琼斯指数的动态变化特征进行研究,并且采用线性回归法对灰色残差模型和BP神经网络的预测结果进行拟合,通过研究发现该动态预测模型的拟合精度较高[5]。
孙彬引入V-SVR对上证指数进行预测分析,并对投资的时间选择进行研究[6]。
孟坤、李丽通过构建ARMA模型对上海证券交易价格指数进行实证研究[7]。
常秀芳、李高从需求与供给等角度对股票的价格走势进行研究,并建立了相应的理论模型[8]。
综上所述,国内对股市价格指数的研究主要采用定量分析法,但是分析及预测的精确度较低。
因此,本文采用3种拟合精度较高的研究方法对股市价格指数进行预测,以期对股价指数进行精准的预测。
1、相关概念及理论基础
本文实证部分采用的研究方法包括时间序列分析和指数平滑预测法,本节将对指数平滑预测法理论进行介绍。
1.1指数平滑法
上证指数为一种时间序列数据,时间序列的数值随着时间的变化而发生波动,且具有离散和无规律的特点[9,10,11]。
时间序列的特点也就使得该序列难以用线性函数的形式进行表示。
指数平滑法平滑的理论认为时间序列具有一定的稳定性和规律性,因此本文采用指数平滑法对上证指数进行预测。
一次指数平滑预测法是指取α(1-α)i作为权重其中0<α<1(i=1,2,3,4…),对时间序列数据yt实施加权预测的一种方法。
将α设为yt的权数,将α(1-α)设为yt-1的权数,将α(1-α)2设为yt-2的权数,并依此类推,得到预测函数式
yˆt+1=S
(1)t=αyt+(1−α)S
(1)t−1
(1)
y^t+1=St
(1)=αyt+(1-α)St-1
(1)
(1)
α为模型的平滑系数,且0<α<1。
采用一次指数平滑法计算的预测值和实际值之间的误差用如下函数表示
et=yt−S
(1)t−1=yt−yˆt
(2)
et=yt-St-1
(1)=yt-y^t
(2)
预测结果的标准误差等于
S=∑t=1n−1(yt+1−yˆt+1)2n−1−−−−−−−−−−⎷ (3)
S=∑t=1n-1(yt+1-y^t+1)2n-1 (3)
上式中,n表示原始数据所包含的样本个数。
在一次指数平滑预测法的基础上对时间序列再做一次预测便是二次指数平滑法。
第t+1期预测值需要采用以下函数进行计算
⎧⎩⎨⎪⎪⎪⎪S(i)t=αyt+(1−α)S(i)t−1S(i+1)t=αS(i)t+(1−α)S(i+1)t−1yˆt+T=αt+btT (4)
{St(i)=αyt+(1-α)St-1(i)St(i+1)=αSt(i)+(1-α)St-1(i+1)y^t+Τ=αt+btΤ (4)
式中,at=2S(i)t
t(i)
-S(i+1)t
t(i+1)
;bt=α1−α(2S(i)t−S(i+1)t)
bt=α1-α(2St(i)-St(i+1))
;S(i)t
t(i)
为时间序列在第t期的预测数值;S(i+1)t
t(i+1)
为时间序列在第t+1期的预数测值,yt为时间序列在第t期中的实际数值;yˆ
y^
t+T为时间序列在第t+T期中的实际数值。
α为模型中的平滑系数,α等于0.1、0.3和0.9。
模型估计结果的标准误差等于
S=∑t=1n(yt−yˆt)2n−2−−−−−−−−√ (5)
S=∑t=1n(yt-y^t)2n-2 (5)
若时间序列表现出非线性的变动走势,可以采用三次指数平滑法对序列进行预测。
将x1,x2,…xt设为时间序列,且S′0=S″0=S0=x1。
取相同的平滑系数值α,序列的预测值可以通过以下函数求得
S′t=αxt+(1−α)S′t−1 (6)S′′t=αS′t+(1−α)S′′t−1 (7)S′′′t=αS′′t+(1−α)S′′′t−1 (8)
S′t=αxt+(1-α)S′t-1 (6)S″t=αS′t+(1-α)S″t-1 (7)S‴t=αS″t+(1-α)S‴t-1 (8)
对于时间序列的末期数值,可以按以下函数求解模型的系数值
at=3S′t−3S′′t+S′′′t (9)bt=α2(1−α)2[(6−5α)S′t−(10−8α)S′′t+(4−3α)S′′′t] (10)ct=α22(1−α)2(S′t−2S′′t+S′′′t) (11)
at=3S′t-3S″t+S‴t (9)bt=α2(1-α)2[(6-5α)S′t-(10-8α)S″t+(4-3α)S‴t] (10)ct=α22(1-α)2(S′t-2S″t+S‴t) (11)
预测模型采用如下函数表示
xˆt+T=αt+bt*T+ct*T2 (12)
x^t+Τ=αt+bt*Τ+ct*Τ2 (12)
上式中的T为从时刻t起预测的时期数。
1.2RBF神经网络多指数预测法
一般而言,所有的函数都可以看成一组基函数的加权之和,而RBF神经网络则将网络看成是对未知函数的逼近器。
相当于用隐藏层单元的输出函数构成一组基函数来逼近目标函数;RBF网络中以输入层到隐藏层的基函数的输出是一种非线性映射,而输出则是线性的。
RBF在数据预测方面表现出极好的应用优势。
通过选取多指标来构建神经网络的输入层,具体的多指标有ACD开降线指标、ADX动向平均数指标、BBI多空指数、CHO佳庆指标、CYE市场趋势指标、DD方向标准离差指数、DFM平均线差、DMI趋向指标、EMM简易波动指标、GDX鬼道线指标和JLHB绝路航标等。
BP神经网络是种常用的神经网络,采用反向传播的方式,进行数据的训练仿真,由输入层、隐藏层和输出层构成。
BP神经网络对输入的信息具有自我学习的功能,通过调整适当的属值和权值,得到最佳的输出结果。
RBF网络与BP网络非常相似,RBF、BP神经网络的区别主要在于各自使用了不同的作用函数来表示。
比如说BP网络Sigmoid在其隐藏层中使用。
1.3马尔科夫链预测法
马尔科夫链广泛地应用在经济学、人口排队论等问题建模中。
本文通过上证指数的上涨和下跌,来预测未来几天或者数月上证指数的上涨和下跌状态值。
马尔可夫链模型直观地统计某几个状态出现的频数,进而判断时刻点出现某状态的概率。
马尔可夫链模型状态数由用户自己设定,较为常用的有5种状态,如快速上升、缓慢上升、相对不变、缓慢下降、快速下降,也可以设为3种状态,如上升、相对不变、下降(较多的经济学问题都按照这个划分)。
这个思想和模糊数学的思想相一致。
针对快速上升、缓慢上升、相对不变、缓慢下降、快速下降这5个状态,多大的增长幅度才算是快速上升,多大的下降幅度才算是快速下降呢?
这2个数值由用户自己设定,较为常用的增长率有1%、3%、5%等数值。
本文考虑上证指数的增长幅度问题,采用1%上证指数增长率作为衡量标准。
马尔可夫链模型广泛地应用于长时间地波动数据行业中,例如,某个食品的价格、某个公司员工上下班时间趋势、CPI指数、上证指数、个股价格等。
马尔可夫链模型因其自身数据的统计特性,在预测行业起到举足轻重的作用。
1.4支持向量机(SVM)的涨跌预测法
支持向量机(SVM)算法是根据数据内存属性,通过构造超平面,将数据进行划分,然后应用于分类和回归模型。
SVM算法解决了传统算法不能解决的非线性、离散等问题,将复杂的大数据映射到高维空间,进而实现问题的高效求解,广泛应用于各行各业数据分析中。
本文主要围绕SVM算法进行股票的上涨、下跌分析。
2、对上证指数的实证分析
2.1数据的描述性统计
2.1.1数据选取
上海证券交易指数首次在1990年开始对外公布,其编制机构为上海证券交易所。
上海证券交易指数简称为“上证指数”,其代码为:
000001。
上证指数的权重等于所有上市交易公司的所有股本,因此上证指数的走势在一定程度上反应了中国股票市场的实时变动走势,也在一定程度上反映中国金融市场的变动趋势。
为了能够为投资者提供股市实时的变动趋势,股市市场中的价格指数会随着股价进行实时公布。
实证部分采用的数据为2007年1月1日至2018年12月31日的上海证券交易指数,数据来自于万德数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 量化 分析 基础上 股票投资 对策
![提示](https://static.bdocx.com/images/bang_tan.gif)