基于深度学习的移动网络流量态势预测.pdf
- 文档编号:10502397
- 上传时间:2023-02-15
- 格式:PDF
- 页数:57
- 大小:1.10MB
基于深度学习的移动网络流量态势预测.pdf
《基于深度学习的移动网络流量态势预测.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的移动网络流量态势预测.pdf(57页珍藏版)》请在冰豆网上搜索。
摘要-I-摘要随着智能手机时代的来临,巨量的移动流量数据给运营商和基站带来巨大的压力,网络管理人员需要事先预测到移动网络流量的使用状况以便对移动网络态势进行预估和调整,因此移动网络流量态势预测的研究变得越来越重要。
早期的移动网络流量小,预测方法主要是学者们根据经验和一些简单的数理模型进行建模预测,预测精度不高。
随着深度学习的兴起,基于深度学习的移动网络流量态势预测成为了移动网络流量预测领域的研究重点。
但大量的研究主要集中在使用单一神经网络模型提取移动网络流量的时间相关性,而在移动网络流量空间相关性上的研究并未深入。
本文考虑到移动网络流量的时空特性,设计了一种新型的移动网络流量态势时空预测模型,具有比以往的移动网络流量预测模型更好的预测性能。
本文设计了新型的移动网络流量态势时空预测模型,在移动网络流量空间特征提取方法中,设计了一种相关性算子对卷积过程进行改进,对输入卷积网络的数据进行相关性度量,将输入数据按照相关性顺序进行排列,而不是像普通卷积网络一样随机排列,这种根据相关性顺序的排列方式,使卷积网络更大概率卷积到对要预测结果影响较大的数据,提高对移动网络流量特征提取的准确度。
在移动网络流量时间特征提取方法中,设计基于栅格循环单元的时间特征提取模型。
传统长短时记忆网络中状态流和当前输入流共享参数矩阵,本文的基于栅格循环单元的结构将状态流和输入流分开不再共享权值,则状态流和输入流的输出门都会提取到不同的时间特征,使提取到的时间特征更丰富。
为了验证本文提出的预测模型是否比普通深度学习方法有更好的准确度,需要移动网络流量数据的验证,但真实移动网络流量数据难以获取。
本文在ON/OFF网络流量模型的基础上,使用马尔科夫行人流模型对ON/OFF网络流量模型进行改进。
ON/OFF网络流量模型生成的流量主要表现出时间相关性,使用马尔科夫行人流模型增加了对移动网络流量用户的移动状况的考虑,建立了基于时间和空间的移动网络流量生成模型。
该模型生成的数据拥有时空双重特性,与现实移动网络流量的特性比较相似。
关键词:
网络态势;移动网络流量预测;深度学习Abstract-II-AbstractWiththeadventoftheeraofsmartphones,hugeamountsofmobiletrafficdataputtremendouspressureonoperatorsandbasestations.Networkmanagersneedtopredicttheusageofmobilenetworktrafficinadvanceinordertoestimateandadjustthemobilenetworksituation.Researchonmobilenetworktrafficsituationpredictionisbecomingmoreandmoreimportant.Theearlymobilenetworktrafficissmall,andthepredictionmethodwasmainlybasedontheexperienceandsomesimplemathematicalmodelsofthescholars.Withtheriseofdeeplearning,mobilenetworktrafficsituationpredictionbasedondeeplearninghasbecometheresearchfocusofmobilenetworktrafficprediction.However,alargeamountofresearchmainlyfocusesonextractingthetimecorrelationofmobilenetworktrafficusingasingleneuralnetworkmodel,buttheresearchonthespatialcorrelationofmobilenetworktrafficisnotdeep.Consideringthespatio-temporalcharacteristicsofmobilenetworktraffic,thisdissertationdesignsanewtime-spacepredictionmodelofmobilenetworktrafficsituation,whichhasbetterpredictionperformancethanthepreviousdeeplearningmobilenetworktrafficpredictionmodel.Thisdissertationdesignsanewspatialandtemporalpredictionmodelofmobilenetworktrafficsituation.Inthemobilenetworktrafficspacefeatureextractionmethod,acorrelationoperatorisdesignedtoimprovetheconvolutionprocessandfeedthedataintheconvolutionnetwork.Correlationmetricsareusedtorankthefeeddatainorderofrelevance,ratherthanrandomlyarrangedlikeanormalconvolutionalnetwork.Thisarrangementofcorrelationsizesallowstheconvolutionalnetworktobemoreprobabletobepredicted.Asaresult,thedatathataffectsthelargerdataimprovestheaccuracyofthefeatureextractionofthemobilenetworktraffic.Inthemobilenetworktraffictimefeatureextractionmethod,alongandshorttermmemorynetworkbasedonthegridcycleunitstructureisdesigned.Inthetraditionallong-termmemorynetwork,thestatestreamandthecurrentinputstreamsharetheparametermatrix.Thegridimprovestructurebasedonthelong-short-termmemorynetworkdesignedinthisdissertationseparatesthestatestreamfromtheinputstreamandnolongersharestheweight.Thestatestreamandtheoutputstreamwillextractdifferenttimefeatures,makingtheextractedtimefeaturesmoreabundant.Inordertoverifywhethertheproposedpredictionmodelhasbetteraccuracythantheordinarydeeplearningmethod,themobilenetworktrafficdataisrequired,butrealmobilenetworktrafficdataisdifficulttoobtain.BasedontheON/OFFnetworktrafficmodel,thisdissertationusestheMarkovpedestrianflowmodeltoAbstract-III-improvetheON/OFFnetworktrafficmodel.ThetrafficgeneratedbytheON/OFFnetworktrafficmodelmainlyexhibitstimecorrelation.TheMarkovpedestrianflowmodelisusedtoincreasethemobilestatusofmobilenetworktrafficusers,andatimeandspacebasedmobilenetworktrafficmodelisestablished.Thedatageneratedbythemodelhasthedualcharacteristicsoftimeandspace,whichissimilartothecharacteristicsofrealmobilenetworktraffic.Keywords:
networksituation,mobilenetworktraffic,deeplearning目录-III-目录摘要.IABSTRACT.II第1章绪论.11.1课题背景及研究意义.11.2移动网络流量预测研究现状与综述.11.2.1移动网络流量研究现状.11.2.2移动网络流量研究综述.71.3本文主要研究内容.8第2章深度学习基础模型.92.1深度学习网络应用.92.2神经网络模型.102.2.1自编码网络.102.2.2深度置信网络.112.2.3卷积神经网络.132.2.4长短时记忆网络.152.3回归模型.192.3.1支持向量机回归.192.3.2线性回归.212.4本章小结.22第3章移动网络流量时间特性提取方法的研究.233.1网络流量特性.233.1.1自相似性.233.1.2长相关性和短相关性.243.1.3混沌特性.243.2ON/OFF网络流量模型.253.3基于ON/OFF模型改进的移动网络流量生成模型.273.3.1马尔科夫行人流模型.283.3.2移动网络流量生成模型.303.4时间相关特征提取方法研究.313.4.1基于栅格循环单元的时间特征提取模型设计.31目录-IV-3.4.2模型验证与分析.333.5本章小结.36第4章融合时空相关性的移动网络流量预测方法研究.374.1空间相关特征提取方法研究.374.1.1基于相关性算子改进的空间特征提取模型设计.374.1.2模型验证与分析.384.2融合时空相关性的移动网络流量预测模型设计.394.2.1时空预测模型组合方式.394.2.2超参数调节.404.2.3实验结果分析.414.2.4流量预测算法对比分析.424.3本章小结.43结论.44参考文献.45攻读硕士学位期间发表的论文及其它成果.50哈尔滨工业大学学位论文原创性声明和使用权限.51致谢.52哈尔滨工业大学工程硕士学位论文-1-第1章绪论1.1课题背景及研究意义随着移动智能设备的普及,移动网络在人们日常生活中占据着越来越重要的位置,随之而产生的移动网络流量呈指数性的爆发增长,由此也给移动网络带来了大量问题,移动网络拥堵的状况也变得越来越严重,对网络状态的控制和管理已经成为亟待解决的问题。
截止到2017年,全球使用移动设备的用户人数已突破50亿人,对于这个如此惊人的用户数量,必然对移动网络产生巨大的挑战。
应对这种挑战最好的办法就是通过对移动网络流量进行预测,事先对网络业务的规律和性能有一个预估,将这些预估的结果用在网络设计,用在解决网络拥堵解决,用在网络安全检测和提高服务质量等方面。
移动网络流量的特点在于其具有时空移变性。
广义的网络流量并不受空间上的影响,仅随时间的变化而变化,但对于移动网络流量来说,由于跟随着人的移动,所对应的移动流量也会产生位移,在这个过程中,并不仅仅是受时间的影响,也会受到空间的影响,因此,对于移动网络流量的预测分析相比广义网络流量要更加复杂。
广义上的网络流量预测模型并不适用于移动网络流量预测。
由于移动网络流量不同于广义的网络流量,当前的网络流量预测模型大多着重于对时间因素的考虑,忽略了移动网络的空间特性,对于移动网络流量预测的性能并不是很好。
基于深度学习的时空融合预测模型能有效解决移动网络预测问题。
深度学习是以层次化的图结构来学习数据中的规律,通过不断更新图结构中每条边的权重,可以得到具有推理能力的模型。
利用深度学习从移动网络流量数据中提取并融合时空信息,在时序预测的过程中能保证时空全局信息的延续性,有效解决移动网络的预测问题。
1.2移动网络流量预测研究现状与综述1.2.1移动网络流量研究现状由于移动网络流量预测的研究仍处于空白区域,因此本节着重分析广义的网络流量预测法的研究现状1。
广义的网络流量预测只考虑时间因素,忽略了空间的因素的影响,对于移动网络流量这种与空间强相关的数据,拟合哈尔滨工业大学工程硕士学位论文-2-效果往往不尽人意,广义的网络流量预测模型可分为三大类,分别是线性模型、非线性模型和组合模型。
(1)线性模型近些年来对网络流量特性的研究从来没有停止过,研究发现网络流量除了具有长短相关性外,还具有自相似的特性。
因为网络流量具有这些特性,于是使用包含长短相关性和突发性的自相似模型来预测网络流量,在这个框架内众多学者提出了各种基于自相似特性的流量模型,一些学者设计了线性预测模型更好地针对网络流量的短相关这一特点。
线性预测类型的模型只可以用来对短期的流量情况进行预测,线性模型比较典型的代表有自回归模型(AutoregressiveModel,AR)2、移动平均模型(MovingAverage,MA)3,结合自回归和移动平均的特点的自回归移动平均模型(AutoregressiveMovingAverageModel,ARMA)4-5和在前者基础上改进的自回归合成移动平均模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)等。
线性流量预测模型的原理是拟合出能反映过去的流量数据的趋势特征的多项式,再使用这些多项式表现的特征趋势来预测未来的可能出现的情况。
所以这类模型就需要通过设置很多参数来限定这样的多项式,使多项式能够更好的拟合真实的流量状况。
ARMA(p,q)模型是网络流量的线性预测模型中最经典的一种,如果改变模型中的p值和q值,就可以将ARMA自由的转变为自回归模型或者移动平均模型。
如果在模型中增加差分运算的方法,该模型就会转化成ARIMA(p,d,q)模型。
线性预测模型通常用于短期预测,优点是计算速度较快,计算量较小,但是计算精准度不够高。
早期的应用场景如果对实时性要求比较高,通常就会使用线性预测模型。
线性模型通常都是短时相关的,多是基于泊松过程或者马尔可以模型,拟合的结果只能保证最近的趋势和过去的趋势比较相近,且需要预测的时间点和过去的时间点的数据比较平稳,而太长时间的趋势就无法保证这些条件了,所以不能用来预测长时间的状况。
虽然ARIMA(p,d,q)模型也可以用来模拟非平稳的过程,但这个非平稳过程也需要是齐次的才能适用。
(2)非线性预测模型上文中提到的线性预测模型使用条件限制较多,且只能表现少部分网络流量的特性,而在现实的网络流量具有非常多的特性,如非线性、长短时相关性、周期性、自相似性、突发性等特性。
而且现行的网络规模通常都很大,组成网络的结构非常的复杂,同时会受到诸多网络态势要素的影响,所以现行的网络基本都是非线性的复杂网络。
这些网络的内部状态基本都是非平稳哈尔滨工业大学工程硕士学位论文-3-的并且其变化规律有很强的随机性,网络内部态势在运行过程中受多种态势要素同时影响,具体关系非常难以界定。
传统的线性算法很难提取到这类网络流量的特点,为了能够刻画以上所述的网络流量特性,许多学者提出了很多新的非线性预测模型。
这些非线性算法能够比较好的对数据进行映射,拟合出更好的预测结果,并且其学习方式比较灵活有效,在非线性网络流量预测领域表现出较好的表现和更大的潜力。
例如,从统计特征的角度提出的多重分形小波模型、自回归分数整合滑动平均模型(FractionalAutoregressiveIntegrationMovingAverage,FARIMA)6、门限自回归模型和灰色模型,以及机器学习领域的支持向量机模型(SupportVectorMachine,SVM)7、人工神经网络模型(ArtificialNeuralNetwork,ANN)和混沌理论模型8-9。
多分形小波模型(Multi-fractalWaveletModel,MWM)10-12:
基于乘法运算的多分形小波模型具有较小的预测误差,而且这种模型在计算时只需要较少的参数,计算量较小,所以运算速度也会比较快,并且该模型可以很好地描述网络流量的长短相关性,所以该模型对实际的网路流量数据的拟合效果较好。
但是这种模型也有其不足,因为基于小波变换的网络流量模型的使用前提是该网络流量数据的尺度函数和小波函数是大于等于零的,并且要保证小波变换系数在不同尺度下是相互独立的。
同时所选择的小波基的好坏也会影响到所建立模型的预测精确度,这些因素都造成了基于小波技术的多分形小波流量预测模型13的预测结果并不是特别好。
分形ARIMA模型FARIMA:
FARIMA(p,d,q)模型是在ARIMA的基础上进行拓展而来,这两者的不同的地方在于差分的参数是否可以是分数。
并且FARIMA模型可以通过对p,d,q这三个参数的调整来改变模型的自相关结构。
当00.5d且p和q不同时为零时,FARIMA(p,d,q)可以看作是一个由FARIMA(0,d,0)驱动的ARMA过程,并且此时的FARIMA(p,d,q)能够同时刻画出长相关性和短相关性。
当=0d时,FARIMA(p,d,q)就是一个常见的ARMA过程。
FARIMA模型主要的优点是使用这个模型能过同时表现出网络流量的长相关性和短相关性,主要缺点是计算量大且计算过程复杂,导致运算时间过长,无法应用在需要实习预测的场景中。
灰色模型(GrayModel,GM):
灰色模型是专门用来对小样本数据进行建模的,该模型是用来解决“少数据不确定”问题的14-15。
由于样本较小,所以模型也比较简单。
灰色模型主要可分为三种类型:
传统灰色模型16-17、新陈代谢模型18和残差灰色模型。
其中残差灰色模型是在灰色模型的基础上改进的一种修正模型,首先使用一个灰色模型进行网络流量的预测,再将预测结果的误差作为输入再次建立一个灰色模型,并用预测结果的误差值来填哈尔滨工业大学工程硕士学位论文-4-补原预测值19。
在实际工程中为了使预测结果更好,通常会将三种模型结合提高预测精度,例如使用残差灰色模型20预测粗粒度网络流量时,使用残差灰色模型比只是用一种灰色模型的预测精度更高。
灰色模型适合应用于小样本数据,能过用较少的数据提取出数据中的特性,且预测精度高,但这种模型也有其缺点,只有原始数据呈指数分布且数据变化比较平缓的情况下才能有较好的预测结果,当数据在时间序列上波动比较剧烈时,就不能拟合出较好的曲线,预测结果就会有较大的误差。
人工神经网络模型:
神经网络模型是机器学习的一种,这种模型通常拥有较好的自组织、自学习能力,而且这种模型有很好的容错性,并且能够并行计算,提高计算的效率,也可以很好地描述数据的非线性特征,但这种模型也有神经网络模型的通病,神经网络模型是一个黑盒模型,内部的原理缺乏合理的数理解释和统计合理性,训练过程中的输入节点数设置,输出节点数设置,网络层数的设置,每层节点数设置方法等等都没有一个明确的理论依据,都是凭经验来设置这些超参数,而且通过反向传播迭代权值的过程中也有可能产生过拟合和梯度弥散等问题无法解决,这些都是人工神经网络模型面对的问题。
文献21-23介绍了在通常情况下如何选择输入输出节点数、隐藏层节点数和训练中一些其他的超参数,本文在设置这些超参数的时候可以作为参考。
近年来,随着神经网络应用越来越广泛,将神经网络与其他网络结合的技术逐渐引起了人们的兴趣,例如将神经网络和小波变换、混沌理论等技术结合成为了新的研究热点24-25,因为结合后的网络在一定程度上对神经网络固有的缺点进行了一些弥补,使这类改进后的神经网络模型具有更好的预测结果。
针对神经网络模型的缺点,可以从很多方面进行改进,神经网络模型的性能并不稳定,同样的数据每次训练的结果并不完全相同,而且预测的过程中需要大量的数据样本,使用梯度下降的方法不断的迭代修改权值,模型的时间复杂度和空间复杂度都会较高,训练过程花费时间过长。
支持向量机模型:
首先支持向量机是用来处理线性可分的问题,当线性不可分的时候,需要使用核函数的方法将低维不可分数据映射到高维空间使它在高维空间可分,然后在高维空间上使用线性分析,提高了算法的运算效率。
其次支持向量机使用结构风险最小化的理论在线性可分的特征空间中找到最优超平面,本质上是一种以统计学为基础的凸优化问题,可以使算法得到全局最优解而避免了通常神经网络算法容易陷入局部最小化和过拟合问题。
同时支持向量机解决了小样本数据下的学习问题,并且使模型具有较好的泛化能力。
但支持向量机中也有一些神经网络模型固有的缺点,各种超参数例如核函数的选择,惩罚系数的设置等并没有确定的方法,设置这些超参哈尔滨工业大学工程硕士学位论文-5-数的时候主要依靠经验,穷举出所有可能的情况然后逐个对比来确定,这些情况很大程度上影响了网络模型的学习能力,使模型变得难以使用。
文献26使用差分进化算法确定的惩罚系数、不敏感系数和核函数系数等超参数和遗传算法、粒子群算法确定的超参数对比,发现相比于后两种启发式算法,差分进化算法搜索到最优超参数的效率更高。
文献27中对核函数的选择、超参数的选择以及支持向量机框架的改进方面都提出了一些建议。
并且由于深度学习兴起之后,支持向量机的使用通常不再是单独使用,而是和深度学习算法结合28起来,使用深度学习网络提取特征,再用提取的特征来进行支持向量机的分类。
混沌理论模型:
网络流量的众多特性中混沌性是一个很重要的特性29。
混沌模型也是一种非线性的网络流量预测模型,当要对网络流量的自相似特性进行研究的时候,一般会使用混沌理论的知识来分析。
混沌模型比支持向量机模型更好的地方在于,相比于支持向量机的凭经验调参,混沌模型在参数的选择上,现在已有比较好的参数选择算法。
混沌模型可以从两个角度进行网络流量的预测,全局角度和局部角度。
全局的角度理论上比较能自洽比较全面,但是生活中的我们对网络流量数据并不能完全掌控,并且流量在空间中的变化多样,很难全部囊括所有的信息,全局的方法在现实中并不太适用30。
而分段方法和全局方法不同,能够分段拟合流量数据,更好的应对局部数据变化的情况,而且大大的减小了计算量。
但是局部方法也有很大的不足
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 移动 网络流量 态势 预测