智能控制读书报告.docx
- 文档编号:12356356
- 上传时间:2023-04-18
- 格式:DOCX
- 页数:40
- 大小:118.67KB
智能控制读书报告.docx
《智能控制读书报告.docx》由会员分享,可在线阅读,更多相关《智能控制读书报告.docx(40页珍藏版)》请在冰豆网上搜索。
智能控制读书报告
西安电子科技大学
《智能控制》读书报告
学院机电工程学院
姓名
学号
课题分组
《智能控制》读书报告
机电工程学院
概述
通过本学期对智能控制理论尤其是专家控制的学习,让我接触并了解了一个
新的领域。
智能控制作为当今多学科交叉的前沿领域之一,是应用人工智能的理
论与技术和运筹学的优化方法,并将其同控制理论方法与技术相结合,在未知环
境下,仿效人的智能,实现对系统的控制。
1985 年 IEEE 在美国纽约召开了第一
届智能控制研讨会,随后成立了 IEEE 智能控制专业委员会。
1987 年在美国举行
第一届国际智能控制大会,标志着智能控制领域的形成。
20 世纪 90 年底至今,
智能控制进入了新的发展时期,随着对象规模的扩大以人工智能技术、信息论、
系统论和控制论的发展,人们试从高层次研究智能控制,这不仅形成了智能控制
的多元化,而且在应用实践方面取得了重大进展。
我国智能控制也兴起于这一时
期。
纵观智能控制产生、发展的历史背景与现状,其研究中心始终是解决传统控
制理论、方法(包括古典控制、现代控制、自适应控制、鲁棒控制、大系统方法
等)所难以解决的不确定性问题。
控制学科所面临的控制对象的复杂性、环境的
复杂性、控制目标的复杂性愈益突出,智能控制的研究提供了解决这类问题的有
效手段,集中表现在控制工程中运用智能方法解决复杂系统的控制已取得了相当
多的成功。
智能控制通常被理解为智能化的自动控制系统,其研究的主流在自动
控制界,将人工智能看作自动控制的技术服务学科,运用已有的人工智能方法、
技术解决自动控制系统的部分问题;基于工程控制的观念,把智能控制系统理解
为高度自治的自动控制系统;在智能控制方法上,运用已有控制算法作低层次的
组合;智能控制已不是一个学科所能独自完成得了的,应结合多种学科知识来解
决复杂系统的控制问题,这一点已得到专家的共识。
基于这种认识,人们将各种
学科大胆地应用于控制中引出了许多新理论和新方法。
随着信息技术的发展,许多新方法和技术进入工程化、产品化阶段,这对自
动控制技术提出更新的挑战,促进了智能理论在控制技术中的应用,以解决用传
统的方法难以解决的复杂系统的控制问题。
当前国际最新智能控制主要方法有:
①模糊控制;②神经网络控制;③专家控制;④分层递阶控制;⑤学习控制等。
在本篇读书报告中,我主要从控制方法方面依次介绍了专家控制,模糊控制,
神经网络控制,学习控制,分层递阶控制,并着重介绍了自己所选的课题专家控
制。
在内容上,我主要是介绍了五种控制的概述,核心思想方法,以及自己的心
得体会和个人总结。
一 专家控制
1.概述
专家控制(Expert Control)是智能控制的一个重要分支,又称专家智能控制。
所谓专家控制,是将专家系统的理论和技术同控制理论、方法与技术相结合,在
未知环境下,仿效专家的经验,实现对系统的控制。
由人工智能领域发展起来的
专家控制是一种基于知识的智能计算机程序的技术,专家控制的实质是基于控制
对象和控制规律的各种知识,并且要以智能的方式利用这些知识,以求得控制系
统尽可能的优化和实用化。
一般的专家控制系统由三部分组成,一是控制机制,
它决定控制过程的策略,即控制哪一个规则被激活以及什么时候被激活等。
二是
推理机制,它实现知识之间的逻辑推理以及知识库的匹配。
三是知识库,包括事
实、判断、规则、经验以及数学模型。
传统的控制系统的设计和分析是建立在精
确的系统的数学模型基础上的,而实际系统由于存在复杂性、时变性、不确定性
或不完全性等非线性,一般难以获得精确的数学模型。
过去在研究这些系统时,
必须提出并遵循一些比较苛刻的假设条件,而这些假设在应用中又往往与实际不
相符合。
为了提高控制性能,传统控制系统可能变得很复杂,不仅增加设备投资,
而且会降低系统的可靠性。
因此,自动控制的出路就在于实现控制系统的智能化,
或者采用传统的和智能的混合控制方式。
自 1965 年费根鲍姆等人研制成功第一个专家系统 DENLDRA 以来,专家系统
获得了飞速的发展,并且运用于包括化学、数学、物理、生物、医学、农业、气
象、地质勘探、军事、工程技术、法律、商业、空间技术、自动控制、计算机设
计和制造等众多领域,产生了巨大的经济效益和社会效益。
现在,专家系统已成
为人工智能领域中最活跃、最受重视的领域。
2.工作原理
2.1 专家系统的基本结构
专家系统由知识库(Knowledge Base)、推理机(Inference Engine)、综合数
据库(Global Database)、解释接口(Explanation Interface)和知识获取(Knowledge
Acquisition)等五部分组成。
如下图 1 所示,
问题描述
推 理 机
知识库综合数据库
解
释
接
口
解答、建议
用
户
或解释
知识获取
领域专家
图 1. 专家系统的基本组成
专家系统中的知识的组织方式是,把问题领域的知识和系统的其他知识分离
开来,后者是关于如何解决问题的一般知识或如何与用户打交道的知识。
领域知
识的集合称为知识库,而通用的问题求解知识称为推理机。
按照这种方式组织知
识的程序称为基于知识的系统,专家系统是基于知识的系统。
知识库和推理机是
专家系统中两个主要的组成要素。
知识库是知识的存储器,用于存储领域专家的经验性知识以及有关的事实、
一般常识等。
知识库中的知识来源于知识获取机构,同时它又为推理机提供求解
问题所需的知识。
推理机是专家系统的“思维”机构,实际上是求解问题的计算机软件系统。
推
理机的运行可以有不同的控制策略。
解释接口又称人-机界面,它把用户输人的信息转换成系统内规范化的表示
形式,然后交给相应模块去处理,把系统输出的信息转换成用户易于理解的外部
表示形式显示给用户,回答用户提出的问题。
综合数据库又称为“黑板”或“数据库”。
它是用于存放推理的初始证据、中间
结果以及最终结果等的工作存储器(Working Memory)。
综合数据库的内容是在
不断变化的。
在求解问题的初始,它存放的是用户提供的初始证据。
解释接口又
称人—机界面,它把用户输入的信息转换成系统内规范化的表示形式,然后交给
相应模块去处理,把系统输出的信息转换为用户易于理解的外部表示形式显示给
用户。
2.2 专家控制系统的工作原理
专家控制系统有知识基系统、数值算法库和人-机接口三个并发运行的子过
程。
三个运行子过程之间的通信是通过五个信箱进行的,这五个信箱即出口信箱
(Outbox)、人口信箱(In box)、应答信箱(Answer box)、解释信箱(Result
box)和定时器信箱(Timer box)。
如下图 2 为一个专家控制系统的典型结构图。
定时信箱
定时操作
知
识
基
系
统
出口信箱
应答信箱
入口信箱
数
值
算
法
库
A/D
D/A
受
控
过
程
解释信箱
人-机接口
用户
图 2 专家控制系统的典型结构图
系统的控制器由位于下层的数值算法库和位于上层的知识基子系统两大部
分组成。
数值算法库包含的是定量的解析知识,进行数值计算,快速、精确,由
控制、辨识和监控三类算法组成,按常规编程直接作用于受控过程,拥有最高的
优先权。
控制算法根据来自知识基系统的配置命令和测量信号计算控制信号,例
如 PID 算法、极点配置算法、最小方差算法、离散滤波器算法等,每次运行一种
控制算法。
当基于知识的控制器直接影响被控对象时,这种控制叫做直接专家控制。
如
图 3 所示。
专家控制器
知识库
给定
+
信息获取与
处理
推理机构
控制规则集 输出
-
传感器
图 3 直接专家控制系统
专家系统间接地对控制信号起作用,或者说,当基于知识的控制器仅仅间接
影响控制系统时(譬如监督控制系统,调节关键结构参数;又如为了避免控制回
路的突发效应切断参数估计过程等),我们把这种专家控制称为间接专家控制系
统,或监控专家控制。
如图 4 所示。
专家控制器
特征提取
R
+
E μ
y
控制算法
被控对象
-
检测器
图 4 间接专家控制系统
专家控制虽然引用了专家系统的思想和方法,但它与一般的专家系统还有重要
的差别:
1. 通常的专家系统只完成专门领域问题的咨询功能,它的推理结果一般用于
辅助用户的决策;而专家控制则要求能对控制动作进行独立的、自动的决策,它
的功能一定要具有连续的可靠性和较强的抗扰性。
2. 通常的专家系统一般处于离线工作方式,而专家控制则要求在线地获取动
态反馈信息,因而是一种动态系统,它应具有使用的灵活性和实时性,即能联机
完成控制。
3.个人总结
本学期的课题分组,我选择了专家控制小组,在对整个智能控制内容学习的
基础之上,又着重对自己所选的专家控制进行了重点地研习,翻看了很多教材来
了解专家控制的基本内容,并查阅了很多相关文献以追踪专家控制的前沿发展概
况,了解到国内外相关领域的学者所做的一些工作。
作为一个六人小团队,我们
在课堂上所做的报告在内容上各有分工,我主要是对知识库中知识表示方法在课
堂上作了自己的报告。
在对知识表示方法作进一步深入学习的时候,自己还有一个很大的收获,我
了解到在知识表示方法中有一种 Petri 网知识表示法,而 petri 网正是自己的研究
生的专业方向,正是通过对专家控制的相关学习,我找到了 petri 和专家控制的
知识表示两个不同学科之间的契合点,这也极大的引起了我的兴趣,而且通过查
阅文献,我了解到国内的一些好多学者都在做 petri 网知识表示方法的相关研究,
这为我自己今后的学习提供了一个很好的方向。
下面我简单介绍一些自己所做报
告的核心内容。
知识库是专家系统的核心组成部分,用于存取和管理问题求解所需的专家知
识和经验。
一个专家系统的能力很大程度上取决于其知识库中所含知识的数量和
质量。
知识库的建立包括知识的获取和知识的表示,知识获取要解决的问题是如
何从专家那里获得专门知识;而知识表示就是要将专家的知识和经验表达成计算
机能理解的形式。
知识表示的方法有很多种:
状态空间法,问题归约法,谓词逻
辑法,语义网络法,Petri 网表示法,面向对象表示法,过程表示法,框架表示
法等等。
问题归约法:
已知问题的描述,通过一系列变换把这个问题最终变为一个子
问题集合,这些子问题的解可以直接得到,从而解决初试问题。
为了证明如何使
用问题归约法求解问题我们引入一个例子——“梵塔难题”。
如图 5 所示,
A
B
C
1
1 2 3
A
B
1 C
1 2 3
图 5 梵塔难题
然后,我们引入这样的一种更容易被计算机所存储和处理的结构:
所有问题归约的目的是最终产生具有明显解答的本原问题。
这些问题可以由
状态空间搜索中走动一步就能解决的问题,对终止搜索过程起着明显的作用。
Petri 网作为一种高效的建模和分析工具,近年来得到了快速的发展,但是 Petri
网作为一种纯理论工具,并不能适合所有领域的应用需求。
所以,针对不同领域
的研究对象,很多学者提出了各种各样改进的 Petri 网理论,如近年来得到普遍
应用的随机 Petri 网、有色 Petri 网以及多值 Petri 网等,模糊 Petri 网作为 Petri 网
的一个重要分支,也越来越多地引起了人们的兴趣。
特别是应用在人类知识的表
示和人工智能中非常合适,在这一方面,已有许多学者进行了研究。
从整个专家控制领域看,遗憾的是,目前在国内化工应用的专家控制系
统基本停留于理论研究阶段,还未产业化。
二 模糊逻辑控制
1.概述
模糊控制是以模糊集合论、模糊语言变量及模糊逻辑为基础的计算机智
能控制。
模糊控制从其诞生至今也不过 30 年的时间,1974 年马达尼(Maindani)
教授在他的博士论文中首次论述了如何将模糊逻辑应用于过程控制,从而开
创了模糊控制的先河。
在这之后的 30 年间的发展中,模糊控制在理论和应用
研究方面均取得了重大的成功。
传统的控制方法在执行控制时,往往需要取
得对象的数学模型,比如 PID 控制。
但是一些学者发现人类在处理复杂对象
的过程,并不是首先建立被控对象的数学模型,然后根据这一模型去精确地
计算出系统所需要的控制量,而是完全在模糊概念的基础上利用模糊的量完
成对系统的合理控制。
人们正是因为从中得到了启示,最终导致了模糊控制
的诞生。
可以看到,经验和知识将扮演重要的角色,通过对经验和知识进行
推理进而产生相应的控制策略。
模糊控制从 1974 年到现在,模糊控制的发展经历了两个阶段,即简单模
糊控制阶段和自我完善模糊控制阶段。
简单模糊控制阶段指在计算机系统上
把控制器上的推理过程处理成控制表,这种模糊控制器结构简单但不灵活,
自适应能力和鲁棒性有限,控制精度不高;自我完善模糊控制阶段指具有参数
自调整、自组织和自学习功能的模糊控制器,这样使模糊控制系统的性能得
到了很大的提高。
20 世纪 80 年代末,日本首先将模糊控制技术应用于家用电器领域,之后
相继推出了模糊洗衣机、电冰箱、空调器、电饭锅等,显示了模糊控制强大
的生命力。
2.基本原理
模糊控制是利用模糊数学的基本思想和理论的控制方法。
在传统的控制
领域里,控制系统动态模式的精确与否是影响控制优劣的最主要关键,系统
动态的信息越详细,则越能达到精确控制的目的。
然而,对于复杂的系统,
由于变量太多,往往难以正确的描述系统的动态,于是工程师便利用各种方
法来简化系统动态,以达成控制的目的,但却不尽理想。
换言之,传统的控
制理论对于明确系统有强而有力的控制能力,但对于过于复杂或难以精确描
述的系统,则显得无能为力了。
因此便尝试着以模糊数学来处理这些控制问
题。
一般的模糊控制系统包含以下五个主要部分:
(1) 定义变量:
也就是决定程序被观察的状况及考虑控制的动作,例如在
一般控制问题上,输入变量有输出误差 e 与输出误差之变化率 ec,而控制变
量则为下一个状态之输入 u。
其中 e、ec、u 统称为模糊变量。
(2) 模糊化(Fuzzify):
将输入值以适当的比例转换到论域的数值,利用
口语化变量来描述测量物理量的过程,依适合的语言值(Linguistic value)求
该值相对之隶属度,此口语化变量我们称之为模糊子集合(fuzzy subsets)。
(3) 知识库:
包括数据库(data base)与规则库(rule base)两部分,其
中数据库是提供处理模糊数据之相关定义;而规则库则藉由一群语言控制规
则描述控制目标和策略。
(4) 逻辑判断:
模仿人类下判断时的模糊概念,运用模糊逻辑和模糊推论
法进行推论,而得到模糊控制讯号。
此部分是模糊控制器的精髓所在。
(5) 解模糊化(defuzzify):
将推论所得到的模糊值转换为明确的控制讯
号,作为系统的输入值。
2.1 模糊控制器
带有模糊控制器的控制系统结构原理图,如下图 1 所示。
图 1 带有模糊控制器的控制系统结构原理图
2.2 模糊控制器的研究
模糊控制器一般采用反馈控制结构,从结构上分析,常见模糊控制器一般可
分为二维、三维模糊控制器。
类似于PID控制器,二维模糊控制器一般也称PD或
PI型模糊控制器,三维模糊控制器称为PID型模糊控制器。
(1)基于模糊自适应PID控制器的设计
以模糊PID控制器为例,PID控制具有结构简单、稳定性能好、可靠性高等
优点,尤其适用于可建立精确数学模型的确定性控制系统。
但是在实际的应用中,
大多数工业过程都不同程度地存在非线性、参数时变性和模型不确定性,因而一
般的PID控制无法实现对这样过程的精确控制。
模糊控制对数学模型的依赖性弱,
不需要建立过程的精确数学模型。
模糊自适应PID控制器比常规PID控制器明显
地改善了控制系统的动态性能,抗干扰能力更强,且易于实现,便于工程应用。
(2)模糊自适应PID控制器的原理
模糊自适应PID控制器是应用模糊数学的基本理论和方法,把规则的条件、
操作等用模糊集表示,并把这些模糊控制规则及有关信息作为知识存进计算机的
知识库中,然后计算机根据控制系统的实际响应情况运用模糊推理,即可自动实
现对PID参数的调整,这就是模糊自适应PID控制。
(3)模糊自适应PID控制器的结构
在实际应用中,一般是以误差e和误差的变化率de/dt(ec)作为控制器的输
入,可以满足不同时刻的e和ec对PID参数自整定的要求。
利用模糊控制规则在对
PID参数进行修改,便构成了自适应模糊PID控制器,结构图如图1所示:
+
-
de
dt
模
糊
化
模
糊
推
理
PID
控制
器
对象
图1 自适应调整模糊控制器结构图
2.2 隶属函数的确定方法
隶属函数的确定,应该是反映出客观模糊现象的具体特点,要符合客观规律,
而不是主观臆想的。
但是,一方面由于模糊现象本身存在着差异,而另一方面,
由于每个人在专家知识、实践经验、判断能力等方面各有所长,即使对于同一模
糊概念的认定和理解,也会具有差别性,因此,隶属函数的确定又是带有一定的
主观性,仅多少差异。
正因为概念上的模糊性,对于同一个模糊概念,不同的人
会使用不同的确定隶属函数的方法,建立不完全相同的隶属函数,但所得到的处
理模糊信息问题的本质结果应该是相同的。
目前常用确定隶属函数的方法如模糊
统计法:
其基本思想是对论域E上的一个确定元素是否属于论域上的一0e个可变
动的清晰集合,做出确切的判断。
3.个人总结
对模糊控制的学习,从中我了解了模糊数学的基本思想,作为一种研究和处
理模糊性现象的一种数学理论和方法,它以不确定的物理事物为研究对象,更加
接近工程实用,相比于其他几种控制方法,现阶段在工程上模糊控制得到了更好
的应用,模糊控制作为智能控制领域最具有实际意义的一种方法,已经在工业控
制领域,家用电器自动化领域和其他很多行业中解决了传统控制方法无法或者难
以解决的问题,取得了令人瞩目的成果。
但是,虽然模糊控制的理论和应用取得
了很大的进展,但是就目前的状况来看,尚缺乏重大的突破,因此模糊控制无论
在理论和应用上都有待于进一步的深入研究和探讨。
三 神经网络控制
1.概述
神经网络(简称神经网络,Neural Network)是模拟人脑思维方式的数学模型。
神经网络是在现代生物学研究人脑组织成果的基础上提出的,用来模拟人类大脑
神经网络的结构和行为,它从微观结构和功能上对人脑进行抽象和简化,是模拟
人类智能的一条重要途径,反映了人脑功能的若干基本特征,如并行信息处理、
学习、联想、模式分类、记忆等。
人工神经网络本身各简单结点没有显在的物理
意义,但综合网络可描述复杂和非线性系统的控制和辨识问题,而且能做到并行
实时、冗余容错的运算。
它有如下特点:
能充分逼近任意非线性特性;分布式并
行处理机制;自学习和自适应能力;数据融合能力;适合于多变量系统;多变量
处理;以及可硬件实现。
这些特点使神经网络成为非线性系统建模与控制的一种
重要方法,因此神经网络成为实现非线性预测控制的关键技术之一。
神经网络最早的研究是1943年心理学家McCulloch和数学家Pitts合作提出的,
他们提出的MP模型拉开了神经网络研究的序幕。
神经网络的发展大致经历了三
个发展阶段:
1946-1969为初期,在此期间的主要工作包括Hebb(1949)《The
Organization of Behavior》一书中提出的Hebb学习规则,他的基本思想是:
大脑
在器官接受不同的任务刺激时,大脑的突触在不断的进行变化,这些不停的变化
导致了大脑的自组织形成细胞集合,循环的神经冲动会自我强化。
Hebb在文中
给出了突出调节模型,描述了分布记忆,即后来的关联论(connectionist);这个阶
段另一个重要的工作为Rosenblatt基于MP模型,增加了学习机制,推广了MP模
型研制了感知机。
Rosenblatt感知机器的工作激发了许多的学者对神经网络研究
的极大兴趣,美国上百家有影响的实验室纷纷投入到这个领域。
1969年Minsky和
Papert指出感知机的缺陷并表示出对该方法研究的悲观态度,同时由于专家系统
方法展示出的强大活力,使得神经网络在很长时间内处于一个发展的低潮。
第二
阶段即为1970-1986期间的发展低潮阶段,在此期间科学家们做出了大量的工作,
如Hopfield对网络引入能量函数的概念,给出了网络的稳定性判据,提出了用于
联想记忆和优化计算的途径。
1981-1984年Kohonen提出自组织映射网络模型。
1986年Rumelhart等人提出误差反向传播神经网络,简称BP网络。
目前BP网络已
经得到广泛应用。
1987年至今为发展期,在此期间,神经网络得到了国际重视,
许多国家都展开研究,形成神经网络发展的另一个高潮。
2.基本原理
2.1 神经元模型
人工神经元是神经网络的基本处理单元。
它是对生物神经元的简化和模拟。
图2给出了一种简化的神经元结构。
如下图1所示。
P1
W1
P2
W2
Σ θ f
a
Pn
Wn
图1 神经元结构
从图中可见,它是一个多输入、单输出的非线性元件,其输入/输出关系可
描述为
n
⎨i=1
⎪ y = f (I )
其中 xi (i = 0,1,..., n) 是从其它细胞传来的输入信号,θ 为阈值,权系数 wi 表示
连接的强度,说明突触的负载。
f (x) 称为激发函数或作用函数,其非线性特征可
用阈值型、分段线性型和连续激发函数近似。
2.2 神经网络学习方法
神经网络学习方法有多种,网络的学习规则可以分为三类:
相关规则,即仅
仅根据连接间的激活水平改变权值;纠错规则,即依赖关于输出节点的外部反馈
来改变权系数;无教师学习规则,即学习表现为自适应于输入空间的检测规则。
(1)Hebb学习方法
Hebb 规则是最早的神经网络学习规则之一,是一种联想式学习方法,由
Donald Hebb 在 1949 年作为大脑的一种神经元突触调整的可能机制而提出,从
那以后 Hebb 规则就一直用于人工神经网络的训练。
这一学习规则可归纳为“当
某一突触连接两端的神经元同时处于激活状态(或同为抑制)时,该连接的强度应
增加,反之应减弱”。
Hebb 学习规则是一种无教师的学习方法,它只根据神经元连接间的激活水
平改变权值,因此这种方法又称为相关学习或并联学习。
Hebb 学习规则是一切
神经网络学习规则的基础,可以说,以后所有的学习规则都是基于 Hebb 规则的
变形。
(2)多层前向网络
①单层前向网示意图:
u0 = -1
wk0
u1 (x)
wk1
yk
ud (x)
wkd
输入层输出层
②双层前向网—不含反馈的人工神经网络:
输入层(X)隐层(Z)输出层(Y)
x1y1
x2y2
xdyc
(d 个)W
(1)(M 个)W
(2)(c 个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 控制 读书 报告