基于时间序列的支持向量机在股票预测中的应用资料下载.pdf
- 文档编号:16087266
- 上传时间:2022-11-19
- 格式:PDF
- 页数:4
- 大小:379.60KB
基于时间序列的支持向量机在股票预测中的应用资料下载.pdf
《基于时间序列的支持向量机在股票预测中的应用资料下载.pdf》由会员分享,可在线阅读,更多相关《基于时间序列的支持向量机在股票预测中的应用资料下载.pdf(4页珍藏版)》请在冰豆网上搜索。
1003-6199(2006)03-0088-04基于时间序列的支持向量机在股票预测中的应用彭丽芳1,孟志青2,姜华3,田密3(1.湖南工业大学图书馆,湖南株洲412000;
2.浙江工业大学经贸管理学院,浙江杭州310032;
3.湘潭大学信息工程学院,湖南湘潭411105)摘要:
由于股票预测是不确定、非线性、非平稳的时间序列问题,传统的方法往往难以取得满意的预测效果。
本文提出一种基于时间序列的支持向量机(SVM)股票预测方法。
利用沙河股份的股票数据,建立股票收盘价回归预测模型,该模型克服了传统时间序列预测模型仅局限于线性系统的情况。
实验结果表明,该方法比神经网络方法以及时间序列方法的预测精度更高,可以很好的应用某些非线性时间序列的预测中。
关键词:
支持向量机(SVM);
时间序列;
股票预测中图分类号:
TP181文献标识码:
AApplicationofSupportVectorMachineBasedonTimeSequenceinStockForecastingPENGLi-fang1,MENGZhi-qing2,JIANGHua3,TIANMi3(1.Library,HunanUniversityofTechnology,Zhuzhou412000,China;
2.CollegeofBusinessandAdministration,ZhejiangUniversityofTechnology,Hangzhou310032,China;
3.DepartmentofComputerScienceandEngineer,XiangtanUniversity,Xiangtan411105,China)Abstract:
Becausestockforecastingisauncertain,nonlinearandnonstationarytimeseriesproblem,itisdifficulttoachieveasatisfyingpredictioneffectbytraditionalmethods.ThispaperpresentsanovelstockforecastingmethodinwhichanimprovedSupportVectorMachine(SVM)algorithmbasedontimesequence.UsingShahesstockdata,apredictionmodeloftheclosingpriceregressionisestablished.Themodelabstainsfromthedefaultoftraditionaltimeseriespredictionmodelthatonlycanbeusedinlinearsystem.TheexperimentresultsarealsocomparedwithNeuralnetworksandtimesequencemethods,whichindicatethattheSVMstrategycanimproveprecisionandthereforethispredictionmodelcanbeeffectivelyusedinsomenonlineartimeseriesforecasting.Keywords:
supportvectormachine(SVM);
timeseries;
stockforecasting1引言股票市场,具有高收益与高风险并存的特性。
关于股市分析与预测的研究一直为人们所关注。
但是由于股票市场高度的非线性,众多股市分析方法的应用效果都难如人意。
常用的预测方法有时间序列法、灰色模型法、证券投资分析方法、专家评估法等。
文献1采用灰色系统模型,文献2利用时间序列预测,但都不能很好的模拟股票预测的非线性关系。
随着非线性科学的发展,人们提出了神经网络方法,通过综合系统的不确定性和工程经验,来解决复杂的设计问题。
文献35采用经典BP神经网络进行股票预测,文献68对经典的BP算法进行改进,文献6采用的是粗神经网络,文献7提出了小波神经网络,文献8提出了进化神经网络。
这些算法较经典的BP算法神经网络在收敛精度、收敛速度和全局优化方面有所第25卷第3期2006年9月计算技术与自动化ComputingTechnologyandAutomationVol.25,No.3Sep.2006改善,但这类方法存在最终解过于依赖初值,存在过学习的现象,训练过程中存在局部极小问题,且收敛速度慢,网络的隐节点难于确定等问题。
支持向量机9-10(SupportVectorMachine,简称SVM)方法基于统计学习理论,由Vapnik在90年代中期提出。
支持向量机目前已成为机器学习界的热点,成功应用于分类和回归问题。
当前,SVM已经在模式识别领域取得了很好的应用效果,广泛应用于文本识别、语音识别、人脸识别。
近年来,人们发展了回归型支持向量机,它可以按任意精度逼近非线性函数,具有全局极小值点和收敛速度快的优点,被应用于天气预报13、地下水位预报14、负荷预测15等领域,获得了很好的效果。
本文利用时间序列SVM方法进行股票收盘价预测,希望能为广大股票投资者提供正确、科学地把握股市动态的机会,以及及时准确的购进和抛出股票提供新的思路。
2支持向量机的回归模型回归分析又称函数估计,它要解决的问题是:
根据给定的样本数据集(xi,yi)|i=1,n,其中xi为预测因子值,yi为预测对象值,n为样本个数,寻求一个反映样本数据的最优函数关系y=f(x)。
如果所得函数关系y=f(x)是线性函数,则称为线性回归,否则为非线性回归。
SVM的目标是寻求回归函数:
y=f(x)=(wx)+b
(1)式中w为权重,x为样本输入值,b为阈值。
对于非线性问题,可以通过非线性变换将原问题映射到某个高维特征空间中的线性问题上进行求解。
在高维特征空间中,线性问题中的内积运算可以用核函数来代替,即K(xi,xj)=(xi)(xj)
(2)核函数可以用原空间中的函数实现,没有必要知道非线性的具体形式。
因此非线性问题的回归函数为:
f(x)=(w(x)+b=ni=1(i-i)K(xi,x)+b(3)根据支持向量机回归函数的性质,只有少数(i-i)不为零,这些参数对应的向量称为支持向量,回归函数f(x)完全由其决定。
3基于时间序列的数据建模对于给定的时间序列x1,x2,xn,假定已知xt-1预测xt,则可建立映射gRmR,满足:
xt=g(xt-1,xt-2,xt-m)(4)其中xt为t时间的预测值,由xt-j(j=1,2,m)而得。
对时间序列x1,x2,xn建模,将其分成两部分,其中前ntr(ntr0,选取=0.0001,常数C=85,=0.3。
求解i,和b,即可得到支持向量机的股票预测模型。
5.2实验结果及分析为了说明支持向量机的优越性,本文采用支持向量机预测模型、神经网络预测模型和时间序列预测模型分别进行提前1步5步及第8步和第19步预测。
预测结果如表1所示。
从表1中可以看出,支持向量机在短期预测中具有非常理想的效果,在较长区间预测中仍然具有较高的预测精度(提前19步预测仍可保证平均相对误差0.006531),虽然神经网络和时间序列在短期预测中也具有较好的效果,但在较长区间预测中推广能力降低。
其中,图2、3分别列出了利用这三种模型提前1步预测和提前19步预测的后20天测试数据的预测值相对误差的比较结果。
从表1和图2中可以看出,虽然基于时间序列的支持向量机模型优于另外两种模型,但这三种预测模型的预测结果的相对误差相差并不太大。
从表1和图3中可以看出,支持向量机的相对误差在0.005范围内的有9个,在0.01范围内的有17个。
神经网络的相对误差在0.005范围内的有3个,在0.01范围内的有8个。
传统时间序列的相对误差全部都在0.01范围以外。
因此支持向量机模型与另外两种模型相比就有了相对较大的优势,神经网络模型尤其是传统的时间序列模型与真实值之间的相对误差相差甚远,已经表现出预测能力不强。
另外,表1所列的神经网络和时间序列预测的平均相对误差虽然只有0.015653和0.033308,似乎误差不是太大,但从他们的预测曲线来看,如图4所示,已经明显不具有预测能力,它们表现出一种均值预测,即预测值等于训练样本的均值,而这种情况在其他的预测方法中也存在。
即虽然预测值不会偏离真实值太多,计算出的误差也不会太大,但已经完全无法预测出数据的变化规律了。
所以我们可以得出利用支持向量机对股票价格预测具有重要的价值。
换句话说,在已知的股票价格序列基础上采用支持向量机建模,可以提前多个采样间隔时间进行有效预测,为广大股票投资者提供正确、科学地把握股市动态的机会,以及及时准确的购进和抛出股票提供指导。
表1预测步与平均相对误差预测步数平均相对误差支持向量机神经网络时间序列10.0067950.0085990.00941920.0069550.0095000.01087330.0071290.0101680.01319840.0068470.0122370.01858150.0065310.0151350.03330880.0065310.0138820.033308190.0065310.0156530.033308注:
相对误差计算公式yt-ytyt,平均相对误差计算公式1ntentet=1yt-ytyt,其中yt为t时间的实际值,yt为t时间的预测值,nte为测度数据个数。
6结束语股票预测受很多因素的影响,很难在股票和这90计算技术与自动化2006年9月些因素之间建立一种确定的数学模型。
一方面,这种关系是一种非常复杂的非线性关系;
另一方面,股票价格预测还与具体的因素有很大的关系。
本文分析了支持向量机用于时间序列预测的理论基础,给出了基于时间序列的支持向量机预测模型,针对沙河股份的股票数据分别采用支持向量机回归模型、神经网络模型与时间序列模型进行了预测建模和比较实验。
通过实验结果分析得出:
图2提前1步预测值相对误差比较图图3提前19步预测值相对误差比较图图4提前19步预测值比较图
(1)引入时间序列的支持向量机模型能够较好对股票数据进行预测。
支持向量回归模型具有较快的收敛速度和计算精度,且解收敛于全局最优,使结果更接近于真实值。
(2)随着预测步数的增加支持向量机仍然具有较高的精度,这说明支持向量机具有很强的推广能力。
也说明了基于结构风险最小化原理的支持向量机比基于经验风险最小化原理的神经网络有很大的优越性。
(3)支持向量回归仅取决于支持向量,而支持向量一般小于样本的个数,因而可以降低建模的复杂性。
在时间序列预测中,支持向量与反映趋势变化的点紧密相关,因而回归型支持向量机能更好的跟踪时间序列的发展趋势。
(4)核函数的选择对支持向量机的学习和预测性能具有重要的影响。
不同的核函数,不同的参数取值直接关系到结果的精度。
总之,采用支持向量回归的方法进行时间序列预测前景十分看好,本文分析了支持向量回归用于时间序列分析的理论基础和一般步骤,下一步则需要进一步探讨支持向量机参数选择对预测结果的影响,以便更好的为采用支持向量机进行时间序
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 时间 序列 支持 向量 股票 预测 中的 应用