语料库术语中英对照.docx
- 文档编号:7535092
- 上传时间:2023-01-24
- 格式:DOCX
- 页数:7
- 大小:17.62KB
语料库术语中英对照.docx
《语料库术语中英对照.docx》由会员分享,可在线阅读,更多相关《语料库术语中英对照.docx(7页珍藏版)》请在冰豆网上搜索。
语料库术语中英对照
Aboutness所言之事
Absolutefrequency绝对频数
Alignment(ofparalleltexts)(平行或对应)语料的对齐
Alphanumeric字母数字类的
Annotate标注(动词)
Annotation标注(名词)
Annotationscheme标注方案
ANSI/AmericanNationalStandardsInstitute美国国家标准学会
ASCII/AmericanStandardCodeforInformationExchange美国信息交换标准码
Associate(ofkeywords)(主题词的)联想词
AWL/Academicwordlist学术词表
Balancedcorpus平衡语料库
Baselist底表、基础词表
Bigram二元组、二元序列、二元结构
Bi-hapax两次词
Bilingualcorpus双语语料库
CA/ContrastiveAnalysis对比分析
Case-sensitive大小写敏感、区分大小写
Chi-square(Xtest卡方检验
Chunk词块
CIA/ContrastiveInterlanguageAnalysis中介语对比分析
CLAWS/ConstituentLikelihoodAutomaticWord-taggingSystemCLAWS词性赋码系统
Cleantextpolicy干净文本原则
Cluster词簇、词丛
Colligation类联接、类连接、类联结
Collocaten./v.搭配词;搭配
Collocability搭配强度、搭配力
Collocation搭配、词语搭配
Collocationalstrength搭配强度
Collocationalframework/frame搭配框架
Comparablecorpora类比语料库、可比语料库
ConcGram同现词列、框合结构
Concordance(line)索引(行)
Concordanceplot(索引)词图
Concordancer索引工具
Concordancing索引生成、索引分析
Context语境、上下文
Contextword语境词
Contingencytable连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring共现
Corpora语料库(复数)
CorpusLinguistics语料库语言学
Corpus语料库
Corpus-based基于语料库的
Corpus-driven语料库驱动的
Corpus-informed语料库指导的、参考了语料库的
Co-select/Co-selection/Co-selectiveness共选(机制)
Co-text共文
DDL/DataDrivenLearning数据驱动学习
Diachroniccorpus历时语料库
Discourse话语、语篇
Discourseprosody话语韵律
文本规格
Documentation备检文件、文检报告
EAGLES/ExpertAdvisoryGroupsonLanguageEngineeringStandardsEAGLES
EmpiricalLinguistics实证语言学
Empiricism经验主义
Encoding字符编码
Error-tagging错误标注、错误赋码
Extendedunitofmeaning扩展意义单位
File-basedsearch/concordancing批量检索
Formulaicsequence程式化序列
Frequency频数、频率
General(purpose)corpus通用语料库
Granularity颗粒度
Hapaxlegomenon/hapax一次词
Header/Texthead文本头、头标、头文件
HMM/HiddenMarkovModel隐马尔科夫模型
IdiomPrinciple习语原则
Index/Indexing(建)索引
In-lineannotation文内标注、行内标注
Keykeyword关键主题词
Keyness主题性、关键性
Keyword主题词
KWIC/KeyWordinContext语境中的关键词、语境共现(方式)
Learnercorpus学习者语料库
Lemma词目、原形词、词元
Lemmalist词形还原对应表
Lemmata词目、原形词、词元(复数)
Lemmatization词形还原、词元化
Lemmatizer词形还原(词元化)工具
Lexicalbundle词束
Lexicaldensity词汇密度
Lexicalitem词项、词语项目
Lexicalpriming词汇触发理论
Lexicalrichness词汇丰富度
Lexico-grammar/Lexicalgrammar词汇语法
Lexis词语、词项
LL/Loglikelihood(ratio)对数似然比、对数似然率
Longitudinal/Developmentalcorpus跟踪语料库、发展语料库、历时语料库
Machine-readable机读的
Markup标记、置标
MDA/Multi-dimensionalapproach多维度分析法
Metadata元信息
Meta-metadata元元信息
MF/MD(Multi-feature/Multi-dimensional)approach多特征/多维度分析法
Mini-text微型文本
Misuse误用
Monitorcorpus(动态)监察语料库
Monolingualcorpus单语语料库
Multilingualcorpus多语语料库
Multimodalcorpus多模态语料库
MWU/Multiwordunit多词单位
MWE/Multiwordexpression多词单位
MI/Mutualinformation互信息、互现信息
N-gramN元组、N元序列、N元结构、N元词、多词序列
NLP/NaturalLanguageProcessing自然语言处理
Node节点(词)
Normalization标准化
Normalizedfrequency标准化频率、标称频率、归一频率
Observedcorpus观察语料库
Ontology知识本体、本体
OpenChoicePrinciple开放选择原则
Overuse超用、过多使用、使用过度、过度使用
Paradigmatic纵聚合(关系)的
Parallelcorpus平行语料库、对应语料库
Parolelinguistics言语语言学
Parsedcorpus句法标注的语料库
Parser句法分析器
Parsing句法分析
Pattern/patterning型式
Patterngrammar型式语法
Pedagogiccorpus教学语料库
Phraseology短语、短语学
POSgram赋码序列、码串
POStagging/Part-of-Speechtagging词性赋码、词性标注、词性附码
POStagger词性赋码器、词性赋码工具
Prefab预制语块
Probabilistic(基于)概率的、概率性的、盖然的
Probability概率
Rationalism理性主义
Rawtext/Rawcorpus生文本(语料)
Referencecorpus参照语料库
Regex/RE/RegExp/RegularExpressions正则表达式
Registervariation语域变异
Relativefrequency相对频率
Representative/Representativeness代表性(的)
Rule-based基于规则的
Samplen./v.样本;取样、采样、抽样
Sampling取样、采样、抽样
Searchterm检索项
Searchword检索词
Segmentation切分、分词
Semanticpreference语义倾向
Semanticprosody语义韵
SGML/StandardGeneralizedMarkupLanguage标准通用标记语言
Skipgram跨词序列、跨词结构
Span跨距
Specialpurposecorpus专用语料库、专门用途语料库、专题语料库
Specializedcorpus专用语料库
StandardizedTTR/Standardizedtype-tokenratio标准化类符/形符比、标准化类/形比、标准化型次
比
Stand-offannotation分离式标注
Stoplist停用词表、过滤词表
Stopword停用词、过滤词
Synchroniccorpus共时语料库
Syntagmatic横组合(关系)的
Tag标记、码、标注码
Tagger赋码器、赋码工具、标注工具
Tagging赋码、标注、附码
Tagsequence赋码序列、码串
Tagset赋码集、码集
Text文本
TEI/TextEncodingInitiative文本编码计划
TheLexicalApproach词汇中心教学法
TheLexicalSyllabus词汇大纲
Token形符、词次
Tokendefinition形符界定、单词界定
Tokenization分词
Tokenizer分词工具
Transcription转写
Translationalcorpus翻译语料库
Treebank树库
Trigram三元组、三元序列、三元结构
T-scoreT值
Type类符、词型
TTR/Type-tokenratio类符/形符比、类/形比、型次比
Underuse少用、使用不足
Unicode通用码
Unitofmeaning意义单位
WaC/WebasCorpus网络语料库
Wildcard通配符
Worddefinition单词界定
Wordform词形
Wordfamily词族
可扩展标记语言
Wordlist词表
XML/EXtensibleMarkupLanguage
Zipf'sLaw齐夫定律
Z-scoreZ值
WelcomeTo
Download!
!
!
欢迎您的下载,资料仅供参考!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语料库 术语 中英对照
![提示](https://static.bdocx.com/images/bang_tan.gif)