计算机辅助翻译.docx
- 文档编号:3982359
- 上传时间:2022-11-26
- 格式:DOCX
- 页数:21
- 大小:120.58KB
计算机辅助翻译.docx
《计算机辅助翻译.docx》由会员分享,可在线阅读,更多相关《计算机辅助翻译.docx(21页珍藏版)》请在冰豆网上搜索。
计算机辅助翻译
76Computer-AidedTranslationTechnology
Itisveryimportanttonotethatcorpusanalysistoolsdonotinterpretthedata-itisstilltheresponsibilityofthetranslatortoanalyzetheinformationfoundinthecorpus.
需要重点注意的是,语料库分析工具不解释数据——分析语料库中的信息仍是译者的责任。
FURTHERREADING
Engwall(1994),Bowker(1996),MeyerandMackintosh(1996),
Pearson(1998).Austermuhl(2001),andBowkerandPearson(2002)discussissuesrelatingtocorpusdesignandcompilation.
Barnbrook(1996),Kennedy(1998),McEneryandWilson(1996),andBowkerandPearson(2002)providegoodintroductionstocorpuslinguisticstoolsandtechniques.
Bowker(1998,2000),Lindquist(1999),andBowkerandPearson(2002)investigatehowcorporacanbeexploitedastranslationresources.
L'Homme(1999a,chapter6)andBowkerandPearson(2002)explainhowmonolingualandbilingualconcordancersworkandexplorehowtheycanbeusefultotranslators.
Pearson(1996)andZanettin(1998)explorehowcorpusanalysistoolscanbeintegratedintothetranslationclassroom.
Garside,Leech,andMcEnery(1997)provideinformationonvarioustypesofcorpusannotation.
扩展阅读
英格沃尔(1994),鲍克(1996),梅耶和麦金托什(1996),皮尔森(1998),奥斯特穆勒(2001),和鲍克和皮尔森(2002)讨论了与语料库设计和编译相关的问题。
巴恩布克(1996),肯尼迪(1998),麦克恩瑞和威尔逊(1996),鲍克和皮尔森(2002)较好地介绍了语料库语言工具和技术。
鲍克(1998,2000),林奎斯特(1999),鲍克和皮尔森(2002)调查了如何将语料库作为翻译资源进行开发。
洛姆(1999a,第6章)和鲍克和皮尔森(2002)解释了单语和双语词语索引的工作机制并探索译者如何将它们作为有用工具进行使用的。
皮尔森(1996)和扎内廷(1998)探讨如何将语料库分析工具应用到翻译课堂中去。
加赛德,利奇,麦克恩瑞(1997)为各种类型语料库注释提供了信息。
4.Terminology-ManagementSystems
_userswhotrytousestandardspreadsheet,database,orword-processingprogramstomanageterminologicaldataalmostinevitablyrunintoproblemsinvolvingcompromiseddataintegrityduetoinadequatemodelingfeatures,inadditiontodifficultiesmanipulatinglargevolumesofdataasresourcesgrowovertime.
Schmitz(2001,539)
4术语管理系统
那些尝试使用标准表格、数据库、或文字处理项目来管理术语数据的用户几乎不可避免地会遇到一些问题,除了难以操作由随着时间的流逝而不断增多的资源产生的大量数据,还包括由于建模功能不足而破坏数据完整性的问题,。
施密茨(2001,539)
Amajorpartofanytranslationprojectisidentifyingequivalentsforspecializedterms.Subjectfieldssuchascomputing,manufacturing,law,andmedicineallhavesignificantamountsoffield-specificterminology.Inaddition,manyclientswillhavepreferredin-houseterminology.Researchingthespecifictermsneededtocompleteanygiventranslationisatime-consumingtask,andtranslatorsdonotwanttohavetorepeatallthisworkeachtimetheybeginanewtranslation.Aterminology-managementsystem(TMS)canhelpwithvariousaspectsofthetranslator'sterminology-relatedtasks,includingthestorage,retrieval,andupdatingoftermrecords.ATMScanhelptoensuregreaterconsistencyintheuseofterminology.whichnotonlymakesdocumentationeasiertoreadandunderstand,butalsopreventsmis-communications.Effectiveterminologymanagementcanhelptocutcosts,improvelinguisticquality,andreduceturnaroundtimesfortranslation,whichisveryimportantinthisageofintensetime-to-marketpressures.
任何翻译项目的主要部分都是识别专业术语的等价项。
诸如计算、制造、法律和医学之类的学科领域都拥有大量的领域专业术语。
此外,很多客户会优先选择内部术语。
研究需要完成所有给定翻译的专业术语是一项非常耗时的任务,译员并不想每次开始新的翻译工作时都要重复这项工作。
术语管理系统(TMS)可以帮助译员进行相关术语的各方面翻译工作,包括存储、检索和更新术语记录。
术语管理系统(TMS)能够确保术语的使用更加一致,这不仅会使文档更易于阅读和理解,而且可以防止出现错误交流。
有效的术语管理有助于降低成本,提高语言质量,减少翻译周转时间,在这个市场竞争激烈的时代中这些优势发挥着重要作用。
TMSshavebeeninexistenceforsometime.Earlyeffortstousecomputersforterminologymanagementbeganinthe1960sandeventuallyledtothedevelopmentofseverallarge-scaletermbanks,suchasEurodicautom.Termium,andtheBanquedeterminologieduQuebec(nowknownastheGranddictionnaireterminologique),whichweremaintainedonmainframecomputersbylargeorganizations.Inthe1980s,whendesktopcomputersbecameavailable,personalTMSswereamongthefirstCATtoolscommerciallyavailabletotranslators.Althoughtheywereverywelcomeatthetime,theseearlyTMSshadsomelimitations.Theyweredesignedtorunonasinglecomputerandcouldnoteasilybeshared.Theytypicallyallowedonlysimplemanagementofbilingualterminologyandimposedconsiderablerestrictionsonthetypeandnumberofdatafieldsaswellasonthemaximumamountofdatathatcouldbestoredinthesefields.Recently,however,thistypeofsoftwarehasbecomemorepowerfulandflexible,particularlyintermsofstorageandretrievaloptions.
术语管理系统已经存在了一段时间。
利用电脑进行术语管理的前期努力始于20世纪60年代,最终开发了Eurodicautom、Termium、theBanquedeterminologieduQuebec(现在被称为巨型词典术语)几个大型术语存储库,它们都是大型组织在主机上保存的存储库。
20世纪80年代,当台式机进入人们的生活,个人的术语管理系统便成为了译者可从市场上买到的首批CAT工具中的一种。
虽然当时很受欢大家迎,但这些早期的术语库管理系统仍具备一定的局限性。
所设计的这些数据库管理系统只能在一台计算机上运行并不便于进行共享。
他们通常只允许对双语术语进行简单管理并且极大限制了数据域的类型和数量以及可以存储在这些数据域中的最大数据信息量。
然而,最近这种类型的软件功能变得更加强大和灵活,特别是在存储和检索选项方面。
4.1Storage
ThemostfundamentalfunctionofaTMSisthatitactsasarepositoryforconsolidatingandstoringterminologicalinformationforuseinfuturetranslationprojects.Previously,manyTMSsstoredinformationinstructuredtextfiles,mappingsource-to-targetterminologyusingaunidirectionalone-to-onecorrespondence.Thiscauseddifficulties,forexample,ifaFrench-EnglishtermbaseneededtobeusedforanEnglish-Frenchtranslation.Thenewer,moresophisticatedsoftwarestorestheinformationusingarelationalmodel.Thismeansthattheinformationisstoredinamoreonomasiologicalorconcept-basedway,whichpermitsmappinginmultiplelanguagedirections.
4.1存储
术语库最基本的功能是作为存储库来巩固并存储术语信息,以备将来翻译项目之用。
之前,许多术语管理系统将信息存储在结构化文本中,使用单向一一对应的方法进行源语和目标语之间的转化。
这样,就产生了一些难题,比方说法英翻译需要用到的法语-英语术语库。
较新、较复杂的软件采用关系模型来存储信息,也就意味着要通过一种更加偏向于以专名学或概念为基础的方法储存信息,允许进行多种语言之间的转化。
Thereisalsoincreasedflexibilityinthetypeandamountofinformationthatcanbestoredonatermrecord.Formerly,userswererequiredtochoosefromapredefinedsetoffields(e.g.,subjectfield,definition,context,source),whichhadtobefilledinoneachtermrecord.
此外,这也使可储存在术语记录中的信息类型和信息数量更加灵活。
以前,用户需要从一组预定义字段(比如主字段、定义、上下文、来源)中进行选择,并且这些字段必须来自每一条术语记录。
Thenumberoffieldswasoftenfixed,aswasthenumberofcharactersthatcouldbestoredineachfield.Forinstance,ifaTMSallowedforonlyonecontext,theuserwasforcedtorecordonlyonecontext,eventhoughitmayhavebeenusefultoprovideseveral.Anexampleofatypicalconventionalrecordtemplateisprovidedinfigure4.1.
Term(En):
Term(Fr)
Subjectfield:
Definition:
Context:
Synonyms:
Source:
Comment:
Administrativeinfo(date,author,qualitycode,etc,):
Figure4.1TMStermrecordwithafixedsetofpredefinedfields
通常,字段数目以及每个字段能够存储的字符数都是固定的。
例如,如果一个术语管理系统只允许记录一个文本的话,即使对用户来说记录多个文本是有好处的,但他还是只能记录一个。
图4.1所示的是传统记录模板的典型例子。
术语(英文):
术语(法文)
主字段:
定义:
上下文:
同义词:
来源:
注释:
管理信息(日期、作者、质量、编码等):
图4.1含有一套固定的预定义领域字段的术语管理系统的术语记录
图4.1
Incontrast,asillustratedinfigure4.2,mostcontemporaryTMSshaveadoptedafreeentrystructure,whichallowsuserstodefinetheirownfieldsofinformation,includingrepeatablefields(e.g.,formultiplecontexts)andsomeevenpermittheinclusionofgraphics.Notonlycanuserschoosetheirowninformationfields,theycanalsoarrangeandformatthem,choosingdifferentlayouts,fonts,orcolorsforeasyidentificationofimportantinformation.Thismeansthatthesoftwarecanbeadaptedtosuitaspecificuser'sneedsandcangrowasfuturerequirementschange.Theamountofinformationthatcanbestoredinanygivenfieldorrecordhasalsoincreaseddramatically.Differenttermbasescanbecreatedandmaintaineddesired.
Term(En):
selected(v)
Subjectfield:
computing
Context1:
Theitemyouselecteddoesnotexist
Source:
ComputermagazineABC,1999
Context2:
Whenyouarefinishedtheselectingthetext,clickontheFormatmenu
Source:
UsermanualXYZ,1998
Client:
CompanyA
Fr:
Sélectionner
Date:
June2000
Client:
CompanyB
Fr:
choisir
Date:
January2001
Figure4.2TMStermrecordwithfreeentrystructure
如图4.2所示,相比之下,大多数术语管理系统当前都采用自由条目结构,让用户自行定义他们自己的信息字段,其中包括可重复字段(例如,处理多个文本时),还有一些甚至允许录入图表。
用户不仅可以选择他们自己的信息字段,还可以将这些信息字段排序和格式化,为它们选择不同的布局和字体,对容易识别的重要信息进行标色等。
这意味着可以对这款软件进行调整以满足特定用户的需求,并且它还可以随着未来用户需求的变化而发展。
很明显,任何给定字段或记录所能存储的信息量也在增加。
可以创建不同的术语库以满足不同需求。
术语(英文):
已选择(v)
主字段:
计算
文本1:
你所选择的项目不存在
来源:
计算机基础杂志,1999
文本2:
完成文本的选择后,单击“格式”菜单
来源:
用户手册指南,1998
客户:
A公司
法文:
竞选人
日期:
2000年6月
客户:
B公司
法文:
选择
日期:
2001年1月
图4.2含有自由条目结构的术语管理系统的术语记录
4.2Retrieval
4.2检索
Oncetheterminologyhasbeenstored,translatorsneedtobeabletoretrievethisinformation.Arangeofsearchandretrievalmechanismsisavailable.Thesimplestsearchtechniqueconsistsofalook-uptoretrieveanexactmatch.SomeTMSspermittheuseofwildcardsfortruncatedsearches.Awildcardisacharacter.suchasanasterisk,thatcanbeusedtorepresentanyothercharacterorstringofcharacters.Forinstance,awildcardsearchusingthesearchstring"comput*"couldbeusedtoretrievethetermrecordsfor"computer,""computing,"andsoon.MoresophisticatedTMSsalsoemployfuzzymatchingtechniques.Afuzzymatchwillretrievetermrecordsthataresimilartotherequestedsearchpattern,butthatdonotmatchitexactly.Fuzzymatchingallowstranslatorstoretrieverecordsformorphologicalvariants(e.g.,differentformsofverbs,wordswithsuffixesorprefixes),spellingvariants(orevenspellingerrors),andmulti-wordterms,evenifthetranslatordoesnotknowpreciselyhowtheelementsofthemulti-wordtermareordered.Table4.1providessomeexamplesofthetermrecordsthatcouldberetrievedusingfuzzymatchingtechniques.
Table4.1Sampletermrecordsretrievedusingfuzzymatching
SearchpatternenteredbyuserTermrecordretrievedusingfuzzymatching
“anovulatory”ovulation
“discus”disk
“departmentfordangerousgoodsdangerousGoodsEmergencyCentre
emergencies”
一旦术语被存储起来,就要求译员具备就这些信息进行检索的能力。
有一系列的搜索和检索机制可供使用。
最简单的搜索技术就是通过查询检索出精确匹配项。
一些术语管理系统允许使用通配符来进行截断搜索。
一个通配符就是一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机辅助 翻译