最优化理论在信息论中的应用Word下载.docx
- 文档编号:18468184
- 上传时间:2022-12-16
- 格式:DOCX
- 页数:13
- 大小:150.53KB
最优化理论在信息论中的应用Word下载.docx
《最优化理论在信息论中的应用Word下载.docx》由会员分享,可在线阅读,更多相关《最优化理论在信息论中的应用Word下载.docx(13页珍藏版)》请在冰豆网上搜索。
FeasibleDirectionMethodZoutendijk
1引言
最优化方法是在给定约束之下,从问题的许多可能解答中,寻求使某一或某些指标达到最优解答,或者对于给定的问题通过何种途径去寻找最优解答的方法,它是一个重要的数学分支。
最优化是个古老的方法,早在17世纪从英国科学家牛顿提出极值问题开始,就已经出现了最优化研究的雏形。
至20世纪40年代,由于生产和科学研究迅猛发展,尤其是电子计算机的广泛应用,一方面对最优化的研究有力空前的迫切需求,另一方面也为最优化研究提供了新型的有力的工具。
最优化问题与现代电子技术结合,步入了全新发展的快车道,形成了一个新的学科,出现了线性规划、非线性规划、整数规划等众多的分支。
最优化问题普遍存在于各类工程设计和方案规划问题中,例如在工程设计中怎样选择设计参数,使设计方案既满足设计要求又能降低成本;
在资源分配中,怎样分配有限资源,使得分配方案既能满足各方面的基本要求,又能获得好的经济效益。
随着最优化学科的发展,及其与社会各领域的紧密结合,最优化理论和算法在实际中正发挥着越来越大的作用。
信息论是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。
狭义的信息论以香农信息论为基础,核心内容是香农三大定理,涉及最大熵、信道容量、最佳信源编码以及最佳信道编码等最优化问题。
这些问题在教科书中一般以定理形式给出,并未给出具体的求解形式,不利于对定理的理解。
本文结合信息论的部分专业知识以及最优化理论中所学习的求解方法,对信息论中的最大熵和信道容量的最优化问题进行编程分析和求解,主要使用的算法为求解非线性目标函数、线性约束函数极值问题的Zoutendijk可行方向法,用到的编程软件为Matlab2012b。
通过数值分析,对香农定理深入理解并更好的掌握所学习的最优化理论算法。
2最大熵原理和信道容量
2.1最大熵原理
在信息论中,信息是对于事件随机性的一种描述,一个事件所包含的信息量与该事件出现的概率有关,两者之间的关系有如下定义:
(1)
公式
(1)中
表示时间x发生的概率,是介于0和1之间的数。
由公式可以看出,事件发生的概率越大,所包含的信息量就越小,当事件发生的概率为1——即确知该事件会发生时,它所包含的信息量为0,对于确知事件,不再有研究意义。
对于通信系统的信号在信道的传输问题,信源可能产生
个不同的消息
,各自对应于不同的事件,并且产生每个消息的概率不同,假设每个消息
产生的概率为
,因此根据公式
(1)可以得到每个消息包含的信息量。
而由于信源是按照不同的概率来产生这些消息的,因此从信源的角度综合考虑发送信号所包含的总的信息量,则有信源的平均信息量
,定义如下:
(2)
该信源的平均信息量通常也称为信源的熵,可以理解为信源的平均不确定度。
在很多情况下,对一些随机事件,我们并不了解其概率分布,所掌握的只是与随机事件有关的一个或几个随机变量的平均值。
按最大信息熵原理,如果我们从全部相容的分布中挑选这样的分布,它是在某些约束条件下(通常是给定的某些随机变量的平均值)使信息熵达到极大值的分布,这是因为信息熵取得极大值时对应的一组概率分布出现的概率占绝对优势。
可以看出,在给定的等式和不等式约束条件下,由最大信息熵原理求消息发生的“最佳”概率分布,就是一个求解条件极值的最优化问题,可表示如下:
(3)
2.2信道容量
信息论中的另外一个重要的问题是求解信道的容量。
信道容量是指信道上没传送一个符号所能携带的信息量,可以用信道接收端和发送端互信息量的最大值来表征。
假设一个信道输入的字符集为
,信道接收端接收到的字符集为
,信道的转移概率
,则信道发送端和接收端之间的平均互信息量
可以表示为:
(4)
根据定义,信道容量的表达式为:
(5)
对于一个给定的信道,它的特性是固定的,不随信源的不同而改变,因此信道的转移概率
是确定的,则可以从公式(3)和(4)中看出,信道容量是关于变量
的一个极值问题,也就是关于信源产生消息的概率分布的一个最优化问题。
这里我们主要讨论离散无记忆的对称二进制信道的最大熵和信道容量,这种信道在某个时刻的输出符号只与当前时刻的输入符号有关,而与之前的输入符号无关,所以称为无记忆的。
同时离散无记忆的对称二进制信道的输入和输出都是序列
,而且信道噪声和其它干扰导致的信道传输发生的差错统计独立,信道的转移概率相互对称,即
(6)
信道模型可以用简化图表示如下:
根据离散无记忆对称二进制信道的定义,对应的信源的熵可以表示为:
(7)
最大熵的极值表达式为:
(8)
同样的,信道容量在离散无记忆对称二进制信道中可以表示为如下的最优化问题:
(9)
3Zoutendijk可行方向法
可行方向法是约束最优化方法中的一类算法,这种方法可以看作是无约束下降算法的自然推广,它的典型策略是从可行点出发,沿着下降的可行方向进行搜索,求出使目标函数值下降的新的可行点。
算法的主要步骤是在确定初始搜索点
的基础上,选择可行的搜索方向
并确定沿着此方向移动的步长
,依次进行迭代,满足一定规则后停止迭代并得到最终的结果。
可行下降的搜索方向的选择有多种方式,不同的方法就形成了不同的可行方向算法,这里主要对Zoutendijk可行方向法和Frank-Wolfe可行方向法进行详细介绍。
Zoutendijk可行方向法于1960提出的求解约束问题的一种算法。
考虑非线性规划问题:
(10)
其中是
可微函数,
为
阶矩阵,
,
和
分别为
维和
维列向量。
针对上述问题,Zoutendijk可行方向法的计算步骤如下:
(1)给定初始可行点
,令k=1。
如果原问题容易观察得到一个可行点,则可以将其作为初始可行点进行迭代计算,若原问题较为复杂,难以直接观察到可行点,可通过引入人工变量的方法求得。
例如针对最优化问题(10),引入人工变量
,求解辅助线性规划:
(11)
如果优化问题(11)的最优解
,那么
就是优化问题(10)的一个可行解。
(2)在点
处把A和b分解成
使得
,计算
。
(3)求解线性规划问题
(12)
从而得到最优解
(4)如果
,则停止计算,
为K-T点,否则,进行步骤(5)。
(5)求解一维搜索问题
(13)
其中
满足下式:
(14)
得到最优解
,令
(6)令k=k+1,返回步骤
(2)继续迭代执行。
4Zoutendijk可行方向法在信息论中的应用
利用Matlab软件中的优化工具箱,可以求解线性规划、非线性规划和多目标规划问题。
具体而言,包括线性、非线性最小化,最大最小化,二次规划,半无限问题,线性、非线性方程(组)的求解,线性、非线性的最小二乘问题。
另外,该工具箱还提供了线性、非线性最小化,方程求解,曲线拟合,二次规划等问题中大型课题的求解方法,为优化方法在工程中的实际应用提供了更方便快捷的途径。
Zoutendijk可行方向法和Frank-Wolfe可行方向法都是求解非线性规划的方法,因此本文我们借助matlab优化工具箱中的部分函数,基于Matlab的平台分别利用这两种方法对前面所述的最大熵问题和信道容量问题进行编程求解。
4.1利用Zoutendijk可行方向法求解最大熵
最大熵问题所对应的优化问题为:
(18)
为了使表达更加简洁,方便分析和编程,我们这里就用
来代替
,同时将不等式约束化为小于等于的标准形式,则目标函数和约束条件变为:
在本问题中,Zoutendijk可行方向法中的矩阵A=
,矩阵E=
,列向量b=
e=1。
4.1.1算法流程
下面给出算法的具体流程:
(1)首先将矩阵A根据起作用约束和不起作用约束分成A1和A2,同时也将b分为对应的b1和b2。
(2)接下来需要计算
,可以利用matlab自带的jacobian函数进行求解。
(3)利用步骤
(2)求得的目标函数在初始点的梯度求解线性规划问题:
这个问题的求解可以使用matlab中的linprog函数。
linprog是一个专门用来求解线性规划的函数,它的调用格式为:
x=linprog(f,A,b,Aeq,beq,lb,ub),所求解的优化问题的标准格式为:
(4)利用前面步骤计算出的结果判断
,如果为0,则计算结束,
为K-T点,目标函数的最优值为0.否则求解一维搜索问题(13),得到最优解
,更新k,
的值,并返回步骤
(2)继续迭代。
4.1.2实验结果及分析:
在matlab中编写程序并运行,可得到如下的实验结果:
x0=
0.500000027157568
0.499999972842432
f_val=
-0.999999999999998
k=
2
x0即为最优解,目标函数的最优值为f_val,k表示迭代的次数。
因此这个结果表示经过两次迭代目标函数取得最优值f_val=-0.999999999999998,此时x的最优解为x1=0.500000027157568,x2=0.499999972842432。
理论上最大熵问题的最优解应该是x1=x2=0.5,目标函数值为f_val=-1,理论与编程结果对比后可以发现Zoutendijk可行方向法求得的结果非常接近实际结果。
这个结果是符合实际情况的,熵表示信源的平均信息量,是对事件不确定性的度量,事件的不确定度越大,熵越大,而当一个事件所有可能的消息发生概率相同时,事件的不确定性是最大的。
对应于离散二进制信源就是当消息0和1发生的概率相同时熵具有最大值,此时0和1发生的概率应该为0.5,熵的最大值为目标函数值的相反数,即为1。
这表明了对于1位的二进制数,它所能携带的最大的信息量是1bit。
所以使用Zoutendijk可行方向法求得的最优化问题结果完全符合信息论里的结论。
4.2利用Zoutendijk可行方向法求解信道容量
4.1.1算法设计
信道容量问题是前面公式(9)所述的优化问题,类似于求最大熵时的处理,同样用
对于给定的信道,转移概率
是固定的值,在这里我们对转移概率做如下式(19)中取值,从而该最优化问题也是关于
的函数。
(19)
用Zoutendijk可行方向法求解信道容量时,除了目标函数的形式同求解最大熵问题有所区别外,约束条件、子函数和具体的求解步骤都是相同的,因此在程序中只需对目标函数进行相应的改动即可。
4.1.2实验结果及分析
在matlab中编写程序并运行,可得到如下的实验结果:
-0.9565
由信道容量的公式可以进一步将其化为:
因为当信道固定时,转移概率确定,对于离散无记忆二进制信道,由理论分析可知,信道容量在各消息发送等概,也就是信源的熵取到最大的情况下取得最大值。
从程序执行的结果可以看出,各消息发送的概率与前面求最大熵时求得的概率相同,因此说明信道容量在信源熵最大时取得,这与理论分析时相一致的。
对于给定的转移概率为式(19)的信道,信道容量为0.9565,与理论上的计算结果的0.955接近。
因此,可以认为Zoutendijk可行方向法求解信道容量的最优化问题结果较为可靠。
5总结
最优化理论中的方法大部分都是由循环迭代构成的,对于循环问题,使用计算机编程实现较为便捷。
在本文中,通过实验可以看出,使用最优化方法求得的结果与最后理论上的真实结果之间的误差较小,结果较为可靠。
因此,最优化方法为信息论中相应问题的求解提供了一种思路,同时也能够从数值计算的角度加深对信息论中专业知识的理解;
同时在编写程序实现最优化方法的过程中,也能够更好的掌握Zoutendijk可行方向法的原理。
参考文献
[1]陈宝林.最优化理论与算法[M].北京:
清华大学出版社,2005.
[2]谢政,李建华,汤泽潆.非线性最优化[M].第2版.湖南:
国防科技大学出版社,2006.275~281.
[3]傅祖芸.信息论—基础理论与应用[M].北京:
电子工业出版社,2001.93~98.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优化 理论 信息论 中的 应用
