人工智能思考题及非官方答案.docx
- 文档编号:24340806
- 上传时间:2023-05-26
- 格式:DOCX
- 页数:15
- 大小:375.09KB
人工智能思考题及非官方答案.docx
《人工智能思考题及非官方答案.docx》由会员分享,可在线阅读,更多相关《人工智能思考题及非官方答案.docx(15页珍藏版)》请在冰豆网上搜索。
人工智能思考题及非官方答案
本
第一章
1人工智能的发展有哪几个阶段组成?
简述每个阶段的重要成果与代表性人物。
孕育期(1956年以前),主要成就是创立数理逻辑、自动机理论、控制论、信息论和系统论,发明了通用电子数字计算机。
这些成就为人工智能的诞生准备了充足的思想、理论和物质技术条件。
代表性人物,西班牙神学家和逻辑学卢乐、法国物理学家数学家帕斯卡、德国数学家哲学家莱布尼兹、英国数学家布尔、英国数学家巴贝奇、英国数学家图灵、美国数学家莫克利和其研究生埃克特等等。
形成期(1956年和60年代),主要成就是人工智能正式诞生,并很快在定理证明、问题求解、博弈、模式识别等领域取得重大突破。
代表性人物是美国的科学家纽厄尔、肖、西蒙、塞缪尔、乔姆斯基、勒洛特、赛尔夫利奇、麦卡锡(人工智能之父)。
发展期(60年代以后),主要成就是人工智能研究向纵深发展,在更多的研究领域取得了重大成就,并开始走向实际应用,在学科上也开始形成自己的理论体系。
代表性人物有美国科学家费根鲍姆(专家系统之父)、Quillian(语义网络)等等。
2研究人工智能的方法有哪几类?
每类的特点是什么?
研究人工智能的方法有:
符号智能、计算智能、行为智能。
符号智能以知识为基础,通过推理进行问题求解,也即所谓的传统人工智能。
计算智能以数据为基础,通过训练建立联系进行问题求解。
神经计算、演化计算、模糊计算等都可以包括在计算智能中。
(软计算LAZadeh)
行为智能是以控制论方法进行AI研究,认为智能取决于感知和行为,提出智能行为的“感知-动作”模式,智能未必需要知识、知识表示与知识推理,智能行为可以通过现实世界与周围环境的交互作用而表现出来。
这又称为行为主义方法。
第二章
1常用知识表示方法有哪些?
各有什么特点?
常用知识表示方法:
一阶谓词逻辑、产生式系统、语义网络、框架系统。
一阶谓词逻辑有谓词公式、连接符(与、或、非、蕴含)和量词(全程、存在)的表示元素。
一阶谓词逻辑的优点是,表示元素具有良好定义的语义,便于自然地表示概念,准确而灵活,其要有很好地表示充分性、基于一阶逻辑的归结定理证明能适用于各种应用系统。
一阶谓词逻辑的缺点是,不能应用启发式知识控制推理,无法描述结构复杂的事物,知识库较大时推理效率低下。
产生式系统是由规则库、综合数据库和控制子系统构成。
规则库是由产生式规则组成的。
产生式的格式:
IF事实THEN事实
IF事实THEN行为
综合数据库是记录问题求解的初始状态、中间结果。
控制子系统负责执行识别到行动的推理循环,识别是前提条件,行动是结果。
控制子系统还会在每一循环选择激活的规则以及执行其拟定的动作。
控制子系统适用于表示各种启发式知识以指示事务间的经验性关联。
其缺点是缺乏结构化手段,产生式系统无法有效地描述结构复杂的事物。
语义网络的形式化描述是SN={N,C}。
其中N是一个带标识的结点的有限集合,N={n1,n2,……,nm},结点ni一般可用一个属性表或框架来表示。
C是结点之间边或弧的集合,用来表示结点之间关系。
框架系统具备基于过去经验而形成概念的能力,也有指出所需要的新事物的能力。
简单的框架由框架名、槽和约束条件三部分组成。
框架名标识特定框架,槽是指框架上可供存放信息的一个位子,类似一个键值对。
槽名用以标识槽的作用,槽的值指明该槽当前的值,是可变的。
槽的值可以使数值、字符串、布尔值、某种条件满足时将会自动执行的一个动过或过程、或者对另一个框架的调用。
约束是一连串约束条件,表示为槽之间的关系。
一般情况下约束需要另外的子框架来说明这些条件。
语义网络和框架系统都属于结构化表示方法,因而提高了系统的概念效率。
这是他们的优点。
其缺点是,在刻画真值理论方面过于自由化,容易引起二义性甚至严重的错误。
2事务表和黑板法是两种面向动作的问题求解组织方式,阐述各自的特点。
事务表是应由系统执行的事务列表,也称为任务表,是面向动作的问题求解组织方式。
其允许各推理模块借由事务表相互通信,以协调诸模块在问题求解中的合作关系。
事务表的特点是:
其具有大系统模块化设计的优点;将复杂问题分解为子问题,每个子问题对应事务中的一个任务;事务表汇集问题求解的各种信息;相对独立的模块能在推理过程中合作求解问题。
黑板法也是一种面向动作的问题组织方式。
系统由一组称为知识源(KS)的独立推理模块和黑板组成。
黑板的特点:
黑板是产生式的直接扩展,KS相当于大粒度的产生式规则,触发模式相当于规则左部,KS体相应于规则右部,黑板相当于综合数据库。
黑板法通过KS把解决问题的知识聚集在一起,实现问题求解的结构化组织,克服产生式系统大规则库情况下面临的困境。
问题的解答逐步生成,可应用任何类型的推理(数据驱动、目标驱动、期望驱动等)。
KS序列的调用是动态的、机遇性的,而非固定、非预先决定的。
时空代价昂贵:
由于动态制定控制决策需大量时空开销。
适用场合广泛:
大的解答空间,不精确、不完全和不可靠的数据,需处理和集成众多异质的信息。
3为什么说知识获取是构筑KB系统的瓶颈。
知识获取是把用于问题求解的专门知识从某些知识源提炼出来,转化为推理机使用的形式的过程。
知识获取十分困难,而机器学习室解决知识获取问题的理想途径,可是其难度较大,因此知识获取是构筑KB系统的瓶颈。
实现知识获取自动化是构筑KB系统的发展方向。
第三章
1模糊集合与普通集合有什么区别与联系?
普通集合中,全集上的元素要么属于要么不属于普通集合A,可以用二值的特征函数来表示特定元素是否属于集合A。
而对于模糊集合,元素可以部分地属于模糊集合A,可以用值在[0,1]的函数μA(u)来表示其隶属度。
当μA(u)={0,1}是模糊集合就演化为普通集合。
因此普通集合是模糊集合的特例,模糊集合是普通集合的扩展。
2模糊集合的模糊性如何度量?
试给出一种新的模糊度计算公式。
模糊度会用数量来表示模糊集合的模糊性的大小。
设A,B∈F(U),若映射D:
F(U)→[0,1],其满足
这叫做F(U)上的模糊度。
(新的模糊度是在给不出了……)
3如何确定模糊集合的隶属函数?
模糊统计法,二元对比后总体排序法,用常用的模糊分布去逼近所研究问题的隶属函数。
4模糊知识表示方法有哪些?
这些方法与普通知识表示方法的不同点在哪里?
模糊知识表示:
模糊命题、模糊产生式、模糊框架、模糊语义网络
一个可以分辨真假的陈述句是命题。
而描述模糊概念和模糊事实的不能完全用真假判定的是模糊命题。
模糊命题的真值表示方法有:
单一真值表示法、区间值表示法、模糊数和模糊函数表示法以及语言真值表示法。
单一真值表示法是用[0,1]中的一个实数x来表示刻画一个模糊命题的真值T(P),x为1时全真,x为0时全假,仅取0和1时,模糊命题就演化为了普通命题。
产生式:
IF事实THEN事实
IF事实THEN行为
以上产生式的事实或者行为含有模糊词,那就称之为模糊产生式。
P→Q(CF,t)
前提P和结论Q都可以是模糊的,它们都可以用模糊自己刻画
CF为规则的置信度,0 应用阈值,0 如果前提P满足了t,则可以以一定的真度退出结论Q,规则的可信度是CF。 模糊框架是普通框架的推广,其特点是: 槽的值允许是模糊数据、模糊动作或模糊过程,这使得很多模糊现象可以标示在框架中,从而大大丰富了框架的表达能力。 框架之间的各种关联是模糊的。 允许用各种模糊逻辑公式来表示判断条件或约束条件,从而条件是否满足也得使用一个阈值来控制,条件真值大于等于该阈值时算满足,否则算不满足。 模糊语义网络 ~ C是一个矩阵,代表结点之间的语义联系,当中的元素也是介于[0,1]之间的模糊度 模糊过程通常用来描述不精确(即模糊)的“过程”性知识。 一个模糊过程通常是一段模糊程序,包括三类基本可执行语句: 完成模糊动作的语句,完成模糊判断从而产生两个或两个以上分支的语句,完成模糊循环的语句。 不同在于,普通知识表示方法只能表示具体而精确的知识,而模糊知识表示方法可以表示模糊的不确定的知识,表示的范围更加广泛。 5模糊控制的基本思想是什么? 模糊控制为什么能够得到广泛应用? 有些复杂的系统过程难于运用现代控制理论来解决他们的控制问题。 但是它们由人来控制却往往工作得很好一般来说,操作人员的控制方式建立在直觉与经验之上,这种方法可看成一组探索式的判定规则。 广泛应用的原因: 算法简单,实现也简单,通过工作经验或者实验建表,最后查表的方法来实现控制,实际控制效果很好地接近人类控制的效果。 6去模糊机制的一般形式说明了什么问题? 去模糊机制一般形式: 模糊结果实际上就是有限论域Z中元素zi的加权和,而权系数wi则是模糊向量C的某种非线性函数。 由去模糊策略的一般形式,为了得到合理有效的去模糊结果,我们知道关键在于选取合适的权系数。 这启发我们可以采取某种优化手段,如人工神经网络自组织自学习技术来解决权系数获取的问题。 换而言之,去模糊策略的一般形式的启迪下,可以开阔思路,建立新的有效的去模糊方法,从而得到更理想的去模糊结果。 7模糊一致矩阵的特点与重要性质有哪些? 8模糊识别原则有哪些? 最大隶属原则 择近原则 最大关联隶属原则 第四章 1人工神经网络的学习准则有哪些? 其基本原理是什么? 误差修正性学习: 根据系统的期望输出和实际输出之间的误差作为连接权调整的参考,最后减小这种误差。 随机型学习: 结合随机过程、概率和能量的概率来调整网络的连接权,从而使网络的能量达到最小。 赫布型学习: 如果两个神经元同时兴奋,则它们之间的突出联系应该得以加强。 竞争性学习: 一种无教师学习。 最简单的学习形式是“胜者为王”。 2与传统人工智能(即符号智能)相比,人工神经网络有哪些特点? 大规模并行分布信息处理 分布式信息存储,信息存储体现在神经元互连的分布上,并以并行分布式处理 高度的鲁棒性和容错性,善于联想、概括、类比和推广,任何局部损伤不会影响整体结果 很强的自学习能力,系统可在学习过程中不断完善,具有创新特点 具有集体运算能力 3BP算法有哪些缺陷? 如何克服? 缺陷: (1)全局代价函数(误差平方和)存在多个极小点,梯度下降不能保证求出全局最小 (2)只要学习率充分小,BP算法可实现与真正梯度下降非常近似的速度下降,然而,小的学习率需要较长的收敛时间,即收敛速度慢 (3)对于训练好的网络,如果要增加训练样本,此时网络的训练就要从头开始(前功尽废),即缺少记忆能力。 克服: (1)给梯度加上惯性量(前次连接权的变化量),避免学习过程的震荡,使学习率可取较大的值,从而加速收敛 (2)分段训练,即训练初期用梯度法,训练后期用牛顿法精确地调整连接权 (3)连续几次重复使用梯度的方法实现有效的学习 (4)用双曲正切函数作为节点的激活函数(代替S型函数),改善学习速度 (5)适当选取初始权矩阵的值以及合适的隐节点数,可以加速收敛 4如何用BP网络解决分类问题? (这个问题的答案我没有在PPT里面找到。 下面是从数据挖掘的课本翻译的原话,仅做参考。 ) BP网络通过迭代地处理训练集的数据并对比每一次网络的预测的类标签和实际的类标签来学习的。 对于训练集的每一条数据,BP网络里面的权值都会作一定修改,以实现网络的预测值和实际值之间的均方误差最小化。 这些修改都是反向进行的,也就是先从最后输出层开始,反向逐层修改直到第一个隐藏层。 因此,这个网络叫做Backpropagation网络。 网络的权重最终都会收敛,学习的过程最终还是会结束的。 这是BP网络的分类学习过程。 5如何Hopfield网络解决组合优化问题? 用HNN(HopfieldNeuralNetwork)解决最优化问题,就是要根据问题的性质将目标函数与能量函数联系在一起,把问题的变量对应于网络单元的状态,通过网络运行时固有的能量函数最小化,从而得到问题的最优解。 6设计一个解决某一问题(自定)的模糊神经网络系统 (这个题目应该不会考吧……) 第五章 1什么是基于范例的推理? 基于范例的推理通过联想(或类比),将解决过去问题的经验(解答、解答过程)用于解决当前问题。 2基于范例的推理的关键技术是什么? 范例检索、解答改编、解答辩证。 3基于范例的推理与基于规则的推理如何实现优势互补? 规则和范例可以视为经验知识的两种重要表示形式。 规则便于描述通用的行为准则,从而用来定义领域理论;而范例则描述已经解决的特别问题,可以包括任何例外情况和特别处理的描述。 规则和范例表示的知识具有较好的互补性。 以规则表示泛化(通用)的领域理论,可以免去建立大型范例库。 而范例库的存在又使理论的建立不会陷入考虑各种例外情况和特别处理的困境。 所以,领域理论不必是完备的,从而可以免除知识获取瓶颈问题。 此外,随着范例库中范例的累积,也可以归纳出泛化的概念——行为准则。 第六章 1基于时间和空间的推理的主要特征是什么? 时间推理与各种物理过程或关于信息处理的工作流程是紧密相关的。 而空间推理从另一个方面拓宽人推理能力的广度。 2时态算子有哪些常用性质? 时态算子: 表示任意语句A与过去或将来时态关联的真值。 F(A): A在某个将来时间为真。 P(A): A在某个过去时间为真。 G(A): A在所有将来时间为真。 H(A): A在所有过去时间为真。 (注: 第一条只是蕴含不是等价,因为未来时间可能一阵子A是真一阵子B是真,所以不能反推。 最后两条,因为A→B等价于非A∨B) 3基于四叉树的最近优先搜索有什么特点? 在二维空间,将平面有规则地递归分解为同等大小的四个区域,直到满足不再分割的准则(即一区域中容纳的对象不超过规定的数量)为止。 从而克服了对象分布不均匀情况下处理稀疏和群集的矛盾,改进了时间和空间的权衡关系。 四叉树结点的路径地址是变长的,长度随节点在树中的深度而增加。 第七章 1试述机器学习的基本模型? 机器学习就是从给定的函数集f(x,w)(w是参数向量),选择出能够最好地逼近训练器相应的函数。 根据n个独立同分布的观测样本,(x1,y1),(x2,y2),……,(xn,yn) 在一组函数{f(x,w)}中求出一个最优函数f(x,w0)对训练器的响应进行估计,使期望风险最小 2什么是经验风险最小化原则? 经验风险最小化原则ERM: 用对参数w求经验风险的最小值代替求期望风险的最小值。 3什么是结构风险最小化? 统计学习理论的策略,把函数集构造为一个函数子集序列,使各个子集按照VC维大小排列,在每个子集中寻找最小经验风险,在子集间折衷考虑经验风险和置信范围,取得实际风险的最小。 这种思想成为结构风险最小化,即SRM准则。 4什么是支持向量? 试述支持向量机的基本原理 过两类样本中离分类面最近的点且平行于最优分类面的超平面H1、H2上的训练样本叫做支持向量。 支持向量机的基本原理: SVM是从线性可分情况下的最优分类面发展而来。 SVM考虑寻找一个满足分类要求的超平面,并且使训练集中的点距离分类面尽可能地远,也就是寻找一个分类面使它两侧的空白区域(margin)最大。 5什么是最优分类平面? 最优分类平面满足如下三个条件: 1)是分类平面 2)经验风险最小(即错分最小) 3)推广能力最大(空白最大,即训练集的点离分类面最远,等价于||w||2最小) 6SVM如何解决非线性分类问题? 非线性可分的数据样本在高维空间有可能转化为线性可分,可通过非线性变换将它转化为某个高维空间中的线性问题,在这个高维空间中寻找最优分类面。 7试比较支持向量机与人工神经网络 SVM的理论基础比NN更坚实,更像一门严谨的“科学”(三要素: 问题的表示、问题的解决、证明) SVM是基于严格的数学推理,NN是强烈依赖于工程技巧 在推广能力上,SVM取决于“经验风险值”和“置信范围值”,NN则不能控制两者中的任何一个 另一方面,NN设计者可以用高超的工程技巧弥补了数学上的缺陷——设计特殊的结构,利用启发式算法,有时能得到出人意料的好结果。 第八章 1为什么说数据挖掘是多学科的交叉汇合? 数据挖掘汇合了数据库系统、机器学习、统计与数据分析方法、可视化、信息科学、数学规划、高性能计算等学科,因此是多学科的交叉汇合。 2数据挖掘的功能有哪些? 概念/类描述: 特征化和区分、关联分析、分类和预测、聚类分析、孤立点分析、演变分析、偏差分析 3列举数据挖掘的应用。 针对生物医学和DNA数据分析的数据挖掘 针对金融数据分析的数据挖掘 零售业中的数据挖掘 电信业中的数据挖掘 交通运输业中的数据挖掘 IT行业中的数据挖掘 4WEB挖掘有哪几类? 各类的特点是什么? Web内容挖掘、Web结构挖掘、Web日志挖掘 Web内容挖掘是从文档内容或其描述中抽取知识的过程,一般用数据库技术、统计方法、机器学习和自然语言理解的处理方法,进行分类、聚类、模式发现等等。 Web结构挖掘研究的是Web文档的连接结构,揭示蕴含在这些文档结构中的有用模式,处理的数据是Web结构数据。 是从WWW的组织结构和链接关系中推导知识。 由于文档之间的互连,WWW能够提供除文档内容之外的有用信息。 利用这些信息,可以对页面进行排序,发现重要的页面。 一般用机器学习等方法,对页面权重计算、分类聚类或者模式发现。 Web日志挖掘是从Web的访问记录中(Web服务器的log日志)抽取感兴趣的模式,理解用户的行为,改进站点的结构,或为用户提供个性化的服务。 一般使用统计方法、机器学习的方法或者关联规则,进行商业决策或者Web站点重建的帮助。 5数据挖掘的十大算法有哪些? C4.5 K-Means SVM Apriori EM PageRank AdaBoost kNN NaiveBayes CART
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 思考题 非官方 答案