基于规则的机器翻译系统.ppt
- 文档编号:2704759
- 上传时间:2022-11-08
- 格式:PPT
- 页数:26
- 大小:194KB
基于规则的机器翻译系统.ppt
《基于规则的机器翻译系统.ppt》由会员分享,可在线阅读,更多相关《基于规则的机器翻译系统.ppt(26页珍藏版)》请在冰豆网上搜索。
机器翻译原理机器翻译原理之之基于规则的机器翻译系统(Rule-basedSystem)机器翻译(机器翻译(machinetranslation)nn机器翻译原理本质:
nn是人类思维和语言活动的模拟;nn是探索如何借助计算机程序将文字或语言从一种自然语言翻译成另一种自然语言的技术。
nn机器翻译的翻译过程如图所示:
(输入)原语(输入)原语分析分析转换转换生成生成目的语(输出)目的语(输出)机器翻译(机器翻译(machinetranslation)nn机器翻译主要有两套系统:
nn一、基于规则的(Rule-basedSystem)nn二、基于语料库的(Corpus-basedSystem)基于规则的机器翻译系统基于规则的机器翻译系统nn规则主要包括:
nn1、词法nn2、句法nn3、短语规则nn4、转换生成语法基于规则的机器翻译系统基于规则的机器翻译系统nn大致可分为三种类型:
nn1、直接翻译nn2、结构转换翻译nn3、中间语翻译基于规则的机器翻译系统基于规则的机器翻译系统之之直接翻译直接翻译nn是把原语中的单词或句子直接替换成相应的目的语的单词,必要时对词序进行适当的调整。
nn这是机器翻译最初的构想。
从目的语中寻找与原语词汇相对应的单词.但并不是电子词典的word-to-word形式,而是翻译句子中所有的词汇。
到后期也加入了一些简单句法甚至语义规则,对替换后的词语进行重新排序,生成目的语文本。
nn其翻译模式如下图:
SL输入输入形态分析双语词典查询语序调整TL输出nn在孩子的教育问题上,家庭教育与学校教育同等重要nnFamilyeducationplayanequallyimportantroleinchildrenseducationasschooleducation.由于原语与目的语在句子语法结构上千差万别,翻译出来的句子的可读性可想而知。
但它是机器翻译的最实质性的一步,是机器翻译从梦想到现实的一次飞跃。
基于规则的机器翻译系统基于规则的机器翻译系统之之转换系统转换系统nn为了提高译文的可读性,人们更多的从句子的层面来分析处理原语与目的语的特征。
nn于是在直接翻译系统之上,出现了机器翻译的转换系统。
基于规则的机器翻译系统基于规则的机器翻译系统之之转换系统转换系统nn通常包括:
nn分析、转换和生成三部分nn其中从原语向目的语的转换是该系统的核心。
nn这种方法被认为是模拟人类翻译活动最恰当的机制。
机器翻译的三个阶段机器翻译的三个阶段nn1957年,美国学者V.Yingve提出了翻译的三个阶段,即:
nn1、用代码化的结构标志转换为目的语句子结构标志(分析阶段)nn2、把原语句子的结构标志转换为目的语句子的结构标志(转换阶段)nn3、有目的语句子结构都标志生成目的语句子(生成阶段)个人见解个人见解SL表层结构我爱你SL深层分析520TL深层结构TL表层结构FiveTwoZeroILoveYou分析转换生成三阶段的新诠释三阶段的新诠释nn法国人B.Vouquois将三阶段诠释为六个步骤分析分析转换转换生成生成原句词法原句句法双语词法双语句法目的语句法目的语词法奈达对翻译过程的诠释奈达对翻译过程的诠释nn奈达根据乔姆斯基的“转换生成语法”做的诠释SL表层结构SL深层结构转换TL深层结构TL表层结构分析生成nn机器翻译中,从原语(SL)句子的表层结构到其深层结构需要经过词法、句法、语义等分析。
性层的深层结构是一种树(syntaxtree)。
它反映的事一个句子内部的语法结构,这种结构认为是人类抽象思维的逻辑表达式。
不同的语言具有相同或相似的深层结构。
就像是一座桥梁,把人类不同的语言连接恰来,使彼此可以翻译交流。
nn问题:
nn这两种诠释有什么相似之处?
基于规则的机器翻译系统基于规则的机器翻译系统之之中间语翻译中间语翻译nn自然语言大多一个单词有多种意思,比如,中文的“方便”二字就有很多不同的意思,容易产生歧义。
在机器翻译中,为了简化纷繁的表达结构,避免其含糊不清的语言现象,独立于各种自然语言,同时又能清晰准确地表达各种自然语言的人造计算机语言英语而生。
这种人造计算机语言就是中间语(interlingua,IL)nn基于中间语的机器翻译原理就是不同语言之间建立一个通用的语义-句法表达式,如图所示:
SL中间语表达式TLSL词典和语法库SL词典TL词典和语法库合成分析个人见解个人见解nn货币的本质是一种等价物,那意味着所有的物品货币的本质是一种等价物,那意味着所有的物品都可以用货币去衡量,就相当于一种中间语,用都可以用货币去衡量,就相当于一种中间语,用货币比喻如图:
货币比喻如图:
nn1000RMB=1000RMB=一头牛一头牛nn100100欧元欧元=一个花瓶一个花瓶nn1000RMB=1001000RMB=100欧元欧元=1=1货币货币nn在这个比喻中,虽然不能把一头牛直接等价于一在这个比喻中,虽然不能把一头牛直接等价于一个花瓶,也不能直接把个花瓶,也不能直接把1000RMB1000RMB直接等价于直接等价于100100欧元,但是它们都有相同的等价物欧元,但是它们都有相同的等价物11货币,这货币,这11货货币就是它们之间的桥梁,它们可以互相交换。
币就是它们之间的桥梁,它们可以互相交换。
nn这就和中间语的功能是相似的这就和中间语的功能是相似的寻找中间语的难度寻找中间语的难度nn“如果要设计出一种元语言(中间语)用来解释,那么它就必须包含多种语言的所有特征。
这种努力不仅毫无止境,而且可能毫无结果”法国人斯莱德
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 规则 机器翻译 系统