CAT网络课程笔记积累个人积累Word格式.docx
- 文档编号:19064859
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:22
- 大小:500.58KB
CAT网络课程笔记积累个人积累Word格式.docx
《CAT网络课程笔记积累个人积累Word格式.docx》由会员分享,可在线阅读,更多相关《CAT网络课程笔记积累个人积累Word格式.docx(22页珍藏版)》请在冰豆网上搜索。
(贡酒和资源之多能够帮助译者找平行文本,作参考之间,主要还要靠译者自身的素质)
背景知识:
译者不仅需要具备语言知识,还要具备与文本相关的背景知识.。
8、翻译工具引发的障碍:
辞典工具的问题(信息太旧、中文解释无论多精确也不能供翻译使用....snapoutofsth突然改变———用语料库解决这些问题)有道词典(非居民用水“non-residentialwater”但或许译为“waterfornon-householduse”更好些)
9、学习翻译技术、学习计算机辅助翻译的正确的方法:
只要掌握方法,相信自己,一定能学好。
了解行业发展的前沿所在、依照自己的职业规划来选课。
在实践中学习,以翻译中遇到的问题,努力去解决这些问题为导向和指引。
睁大眼睛、努力去学习和掌握信息技术知识。
在学习中不断的遇到问题、解决问题,
和周边知识结合起来。
不要害怕、不要畏惧、请相信:
我一定行!
多在实践中成长起来的翻译是真正的高手。
第二课:
1、互联网给我们翻译带来的便利是哪几方面:
搜索引擎、学术数据库、在线机器翻译、其他网络资源。
2、搜索引擎:
目录式搜索引擎(searchindex/directory)YAHOO!
AGoogle
国内:
XX、搜狗、有道
国外:
AltavistaGoogleYahooYandexBing(必应)Teoma
元搜索引擎(METASearchEngine)就是把所有搜索网站的结果汇总到一起的搜索引擎
MetacrawlerWebCrawlerdogpile
综合性搜索引擎(检索全面)
垂直式搜索引擎
下面搜索引擎直接可以上传图片进行搜索:
google、XX、retriever
3、搜索引擎的原理:
搜索引擎的好坏主要是看对结果的排序(也是搜索引擎的竞争核心)搜索引擎优化。
GogglePageRanking(链接关系、量化重要性)
改进基础算法:
引入网站重要性、更新频率、内容分析
4、使用搜索引擎的技巧:
选对搜索引擎(不同搜索引擎有不同的的特点,同意关键词会得到不同的结果;
同意搜索引擎的不同语言或版本之间的搜索结果也不相同),大家在不断的实践中积累。
找准关键词(1、关键词主题范围限制:
Eg:
Across(是一个翻译软件)在搜索时:
输入:
across+本地化在搜索时,多加入一些限定词。
2、多角度选词:
正确分析搜索主题得到关键词多方面提炼反映该主题的词汇(从粗到精到细、从普遍到专指)
3、避免口语词汇(the/a/你)
加引号非常重要Eg:
“公民道德实施纲要”输入:
“公民道德建设实施纲要”construction的英译
5、使用语法和高级检索
布尔检索:
逻辑检索符:
逻辑“与”(×
AND)
“或“(+OR)OR可以省略不写,区分大小写or是不对的
“非”(—NOT)
Eg:
计算机OR显示器巴黎AND伦敦跨栏—110
使用google检索语法:
site:
网站
Site可后接:
某具体网站:
如(北京大学的网站)
某国家网站:
如jp.edu等(日本的网站)
关键词(空格)filetype:
文件类型
如:
MicrosoftOffice的xls/ppt/doc文档等
Adobe的pdf文档
ShockWave的swf文档
联系:
搜索:
北京大学的PDF文档
Intitle/allintitle(关键词必须在题目中出现)
Related:
网址如:
related:
6、如何使用学术数据库?
学术数据库助力翻译:
1、背景知识建构(了解专业背景知识)
译者的学习能力:
1、快速的学习能力2敏锐的捕获知识的技巧
中外文电子期刊数据库(英国Nature杂志、CNKI、elsevier)
GoogleScholar(谷歌学术)——泛、全(深入、完整做不到)
中国知网、万方数据、重庆维普期刊
Eg翻译实例讲解:
sourcerock翻译
检索之后:
矿源岩、生油岩
分别输入这几个词:
开放获取的学术资源:
国内外有影响的OA站点:
http:
//www.doaj.org/(directoryofopenaccess)
电子图书和电子报纸:
电子图书:
Amazon、古登堡计划电子图书、
电子报纸:
更高的时效性、相对权威(和电子书、新闻网站相比)
国内外学科信息门户:
专利资源、科技报告、标准文献
小结:
7、搜索引擎中的诱导词(02-04)
什么是诱导词?
诱导词是指与直接检索词有特定关系的源语或目标语间接关键词。
Increase/Cotton搜索:
PuritanIncreaseCotton(结合上下文,添加了Puritan)
从语言维度分:
源语诱导词和目标语诱导词(影响不是很大对检索结果)
从关系维度分:
使用原文中某个词或某几个词的译文作为诱导词
原文:
“土壤盐碱化”检索:
“土壤盐碱化soil”
“查询条件”检索:
“查询条件querycondition”
与原文内容的知识背景有关系的词
“draw”这个单词检索:
“drawLiverpoolManchester”得知了“draw”是“平局”的意思
使用原文所在的地区、领域或行业的名称作为诱导词
“爱丽丝门罗”检索“爱丽丝门罗Canada/nobleprize”
使用与直接检索词有相同词根、词型、来源等的词
检索词是:
pulling其原型pull检索不到。
使用原文中某个词的同义词作为诱导词
修建辐辐射型的道路检索:
放射型
扩展诱导词
直接检索词的语义放大或缩小后,与其有关的词
原文包括:
“破解”检索“hacker”、“patch”、“hacker”
用准、用快、用活
第三课:
语料库怎么做翻译?
语料库比互联网能更准确地帮助我们做翻译
英国诗人叶芝
“制定政策”怎么翻译
政策:
policy
在google中检索:
“thegovernment*apolicy”(互联网检索)
BYU语料库、SketchEngine(BNC语料库)
关键词居中显示qwic
3.1语料库的产生和发展
物质基础:
电脑科技的发展
思想基础:
经验主义(从现象归纳原理的思想原理)
Rationalism(理性主义)andempiricism(经验主义)
因果关系论[恒常连结]
诺姆·
乔姆斯基认为传统的积累语言然后寻找语言学规则体系比较可信。
经验积累的历程:
辞典的编纂
Definitionofcorpus:
Acollectionofmachine-readable,authentictexts(includingtranscriptsofspokendata)whichissampledtoberepresentativeofaparticularlanguageorlanguagevariety.
狭义:
文字
广义(多媒体、多模态语料库):
声音、视频
Corpuslinguistic:
依据语料库的分析结果,对于语言的规范应用给以借鉴和指导。
对传统语言学的修正和补充
3.3语料库的概念方法和类型
够大large、进行标注annotated、对语言现象进行标注parsed(分析、解析)
一个领域内的语料库、有针对性
精加工语料库、粗加工语料库都是有各自的用途的
杨百翰大学的语料库很好
Sketchengine虽然收费,但是注册之后有一个月的免费期
北京大学计算语言所综合语言知识库(国家科学进步奖)可以关注一下
现代语料库建设:
Web-basedcorpora/wiki-basedcorpora
3.4语料库支持的翻译研究
常用术语:
Corpus/Corpora单数/复数
Corpus-basedvsCorpus-driven
Corpustranslation?
语料库翻译学?
语料库支持的翻译研究VS语料库支持的翻译实践
Monolingualcorpus,comparablecorpus,parallelcorpus
用语料库帮助大家做好翻译,理解原文、生成原文(这节课的目标)
Comparablecorpus(可比语料库)
I.e.Textsintwolanguagesthatsharecommonfeatures,eg.Function,texttype,domain,topic,periodofpublication,etc.
Parallelcorpus(平行语料库)
篇章对齐、段落对齐、句对齐
Sourcetextsandtheirtranslation
Parallelcorpusresourcesandconventionalbilingualdictionaries
单语语料库MonolingualCorpus
语料库只有一种语言,似乎与翻译无关
对于绝大多数译员来说,是单语语料库:
外语单语语料库提供了分析观察该语言的使用规划的最佳窗口,借助于语料检索与统计分析工具,可以得到远超过词典和语法书的语用知识。
语料库的类型:
加工与否分成:
熟语料和生语料
按语言种类分:
单语、双语和多语
按规模分:
小型和大型
按预料类型分:
通用和专门用途
其他:
learnercorpus(学习的:
写作学习者语料库、翻译学者语料库、口语学习者语料库...),pedagogiccorpus,monitorcorpus,historical/diachroniccorpus
3.5语料库在翻译中的应用part-1
语料库语料检索和频率统计:
1、观察和把握语言事实
2、分析和研究语言的规律
量化语法现象,并检测和验证语言理论、规则或假设。
1、语言本身:
词汇、语法、语义、语体等等领域,辅助词汇学、语法学、语言理论等研究。
2、加入历史维度、地理维度:
历史语言学研究
语料库的用途:
人文社科:
词汇、语法、语用、语体研究
社会语言学研究、口语研究、词典编纂、语言教学
理工科:
自然语言处理、人工智能、机器翻译、言语识别与合成
统计语言模型
在应用语言学领域:
词典编纂和语言教学
词典编纂:
用于收词、释义、例句、属性标注等。
词语搭配,词语意义辨析。
新词语发现。
语言教学:
语料比较、统计、筛选等方法为外语教学提供必要参考信息。
语料库在翻译实践中的用途:
获取专业知识、学习专业术语、借鉴表达方法、模仿写作风格、提供翻译策略
归根结底:
1、帮助译者理解原文
2、帮助译者寻找更合适的表达方法!
翻译实践可用语料库类型:
1、双语对齐语料库
对齐层级:
篇章、段落、句子、词组/语块、词汇
句对齐语料库——翻译记忆库的主要形式
2、可比语料库(排球运动的例子)
3、单语语料库
从更多的句子、语境中理解待翻译原文
从更多句子、语境及统计分析结果中选择合适的译文
单语语料库在翻译实践中的使用:
英语单语语料库(免费、量大、质高、检索方便,对翻译食物可用性较强)
关键点:
掌握语料库的检索表达式、显示、统计功能
关键概念:
检索范围与频率(词频)
共现——KWIC
检索表达式的构建:
词语、词语通配、语词限(词性、语义、语义角色等)
第四课:
电子词典、工具书与翻译实践
1、电子工具书
Whatwhowherewhenwhyhow
字典、词典dictionary回答:
是什么
年鉴annualalmanacsYearbook回答:
什么时间
手册及指南handbooksandmanuals解决如何做
名录及传记性资料;
directoryandbiographicalsources回答“是谁”
地理性资料geographicalsources回答“在什么地方”
百科全书encyclopedia大不列颠百科全书
2、辞典、词典的类型
母语vs非母语
积极性词典vs消极性词典
多语词典vs单语词典
综合性词典vs专业性词典
3、翻译实践队辞典的期望
全面的语言学习
阅读理解
生成表达
4、“韦编三绝”纸板书电子工具书
5、电子工具书:
光盘工具书、桌面词典、移动设备版本、在线工具书
6、电子工具书的检索功能:
关键词检索
通配符检索,词组检索,语音检索及其他
通配符:
?
代表:
一个字母、一个字符(一个汉字)b?
G(bigbag)
*代表:
从一个到任意个字母或汉字
7、语音搜索(必应搜索)
8、高级检索:
限制条件更复杂、针对性更强
查询对象所在位置,如查询对象出现在词头内或是例句中
查询对象所属语域,是口语词汇还是书面语词汇,是俚语还是正式语,是法律用语还是医学用语,所属词性等。
And/or/not逻辑
位置检索:
startwith、endwith、间隔、顺序
9、辞典、工具书的信息整合
10、辞典、工具书能查到些什么?
桌面辞典——快速浏览
中文译者常用词典工具:
巴比伦、有道词典、灵格斯、金山词霸、译典通、星际译王
有道词典:
巴比伦词典:
声誉最高的词典(所有字典都是正版)
Wordnet:
非常有特色的语言资源(精细语言辨析时使用的)
Longman光盘电子词典
Collinscobuild词典
牛津英语词典:
WorldBook2005(百科全书字典)
不列颠百科全书(britannica)
CIA世界知识手册
收集整理、制作书签、非常重要
纸质词典与电子词典的关系:
电子词典与传统词典互为补充
电子词典与传统词典在一定程度上对立存在
电子词典继承了传统词典的内容
电子词典和传统词典并非简单的取代关系
在线工具书和桌面工具书类似,词条增加和更新的速度较快,而且资源更为丰富。
这些工具搭配使用,威力更大。
如何挑选自己的“武器”?
要首先了解自己的需求定位
不要以为词典是权威的代名词,因此不会出错。
不要以为词典越大越好
不要以为制造商名气大,是电子词典就好,关键是编辑者。
不要被电子词典的多功能迷惑。
不要被容纳若干词典、海量词条、例句所迷惑。
不要以为一生只用一本最好的的词典就足够
光盘工具书是权威品牌词典纸质版的附加增值产品(较高的权威性和可靠性,辨析、搭配、词源、文化背景等讲解)
电子工具书的未来
(1)
更强大的检索1、聚类检索,根据词汇所属的类别进行检索
2、搭配检索
3、文本类型、领域检索
4、智能感知:
根据用户明示或暗示的需求,随机而变
更深层次的知识整合1、加强原有的单部工具书中词条与词条之间的更为复杂的关联
搜索引擎是翻译实践的万能工具:
语料库是语言的快照或仓库:
语料库的建设经过人工的甄选和加工
信息量次于搜索引擎,时效性亦差,但准确性和科学性远优于搜索引擎
可以解决多种多样的语言类问题
语料库提供海量例句和平行文本,供议员进行搭配、辨析、句型句等方面的翻译参考
语料库的顺畅使用,需要学习
辞典、工具书———最经典、最权威
翻译原则:
重视准确、通顺达意、风格得体
语言能力方面的原则:
1、准确地理解原文以及顺畅地表达出译文
2、时刻提醒自己避免四个典型的翻译错误(语言翻译错误、文化翻译错误、语用翻译错误、语篇类型翻译错误)
3、让译文在语言、文化、语用和语篇类型上达到与原文表达的最佳近似
信息技术方面的原则
(1)
灵活变通,选定查询对象(泼了一瓢冷水——泼冷水)
利用词典信息,“顺藤摸瓜”(reflect——reflectoff/reflecton)
原则
(2)
慎将双语词典中的释义直接套用在译文中
1、有些概念在两种语言系统中都有
2、有些概念虽然在两种语言系统中都存在,德纳意义用法上却不尽相同。
吹牛——talkhorse/talkbull
Peasant——农民
Individualism“个人主义”
3、有些概念是一种语言系统中特有的,另一种语言系统中根本不存在的
“元宵”“三个代表”
Beefcake(美男照)
Halfwayhouse(康复医院)
技术术语对等性比较好
原则(3)
“曲线”查询——关联检索
“利玛窦+Italy”“苏丹红+additive”
复习诱导词一节
谷歌很擅长术语翻译,有术语可以去谷歌翻译里面翻译
根据翻译障碍类型,确定选择数字工具的优先顺序:
1、词典——搜索引擎——语料库
2、特定障碍或问题,直接搜索引擎、语料库
原则(4)
多种工具综合使用,反反复验证
1、切不可直接照搬词典释义
2、一种资源查出的说法,可以用另外的资源予以证实
例如用词典找到的几种说法,哪种更常见,就可以用搜索引擎的检索结果数量进行证明。
(把中文放入搜索中,看看是在政府报告中、PDF中还是只有日本或者中国人网站上才有这样的说法)
使用信息技术工具的技巧总结——理解原文
更好的去理解原文
1、查询对象+关键词
2、查询对象+试翻译
3、搜索平行/可比语料
4、查询对象+特征词(人名、地名、时间等)
5、查询对象+上下文关联词语
6、异构检索(改变查询对象的结构)
7、查询对象上位词/下位词/姐妹词
更好的译文表达
1、试翻译+关键词
2、试翻译+查询对象
4、试翻译+特征词(人名、地名、时间等)
5、试翻译+上下文关联词语
6、试翻译上位词/下位词/姐妹词
7、上位词+对应释义
8、限定性检索
多思多想是基础
常联系是保障
勤整理
多交流(学翻译,道不孤)
5-01翻译记忆(translationmemory)
翻译记忆就是记住以前翻译过的东西。
使用翻译记忆工具最简单最直接的动力:
对个体:
节省劳动,提高劳动生产率
对翻译工作:
提高一致性
对翻译公司:
整体生产率提高,生产成本降低。
语言资产,是翻译公司核心竞争力的一部分。
翻译记忆效率!
质量!
翻译记忆的最初形态:
字处理软件
翻译记忆技术发展的推动者们:
第一代翻译记忆工具:
Trados
翻译记忆的工作流程:
1、读取待翻译的句子(翻译单元)
2、将待翻译的句子放到翻译记忆工具中检索,看看有无翻译过
3、如果不存在已经翻译过的句子,就等待译员翻译并打字输入。
翻译结束后,将原文和译文存入翻译记忆库
4、如果存在即有的翻译句,那么久输出既往的译文,供译员使用或适当的予以订正。
5、循环重复,知道译完最后一句待翻译句,翻译工作全部完成。
翻译记忆中若干关键问题:
1、翻译单元的划分
工作——拆解>
子工作
翻译工作——拆解>
子翻译工作
子翻译工作?
字、词、短语、片段、子句、句子、句群、段落乃至篇章
单位大些还是单位小些?
必要性(可重复利用吗?
)
重复出现的可能性
重复出现时,翻译是否可以使用呢?
可行性(能否做到?
不是所有的自然语言单位都有清晰定义
不是所有的单位都容易分辨处理
(使用翻译记忆必须检查后再利用!
翻译单元的最佳选择:
亚句级别的单位:
词、词组、语块、子句
句子级别(最佳选择)
句子的自动识别与切分:
亚句级别的翻译记忆:
确实有用,因为重复出现的可能性高多了
但不好做,因为虽然重复出现的多,但出现多种翻译的可能性也增加了。
与术语管理还是有区别的
加入此项技术后,是否给议员增加负担?
机器翻译的发展,例如层次短语模型,树模型,EBMT,
另辟蹊径,不划分翻译单元可以吗?
(主流的翻译记忆工具还是不使用的)
获得翻译记忆的方法:
一边翻译,一边存储,最自然,最直接
开放格式的记忆库文件TMX
自动对齐双语句子的原理:
翻译记忆库:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CAT 网络 课程 笔记 积累 个人