语料库语言学术语汇编V20CORPUSnplcorpora.docx
- 文档编号:9722423
- 上传时间:2023-02-06
- 格式:DOCX
- 页数:14
- 大小:21.06KB
语料库语言学术语汇编V20CORPUSnplcorpora.docx
《语料库语言学术语汇编V20CORPUSnplcorpora.docx》由会员分享,可在线阅读,更多相关《语料库语言学术语汇编V20CORPUSnplcorpora.docx(14页珍藏版)》请在冰豆网上搜索。
语料库语言学术语汇编V20CORPUSnplcorpora
语料库语言学术语汇编(V2.0)
Lastupdated2015-07-31by许家金
Aboutness
所言之事
Absolutefrequency
绝对频数
Alignment(ofparalleltexts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)、赋码
Annotatedtext/corpus
标注文本/语料库、赋码文本/语料库
Annotation
标注(名词)、赋码
Annotationscheme
标注方案、赋码方案
ANSI/AmericanNationalStandardsInstitute
美国国家标准学会
ASCII/AmericanStandardCodeforInformationExchange
美国信息交换标准码
Associates(ofkeywords)
(主题词的)联想词
AWL/academicwordlist
学术词表
Balancedcorpus
平衡语料库
Baselist/baselist
底表、基础词表
Bigram
二元组、二元序列、二元结构
Bi-text/bitext
双语合璧文本、双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)
Bi-hapax
两次词、二次词
Bilingualcorpus
双语语料库
Bootcampdebate/discourse/discussion
(新手)训练营大辩论/话语/大探讨
CA/ContrastiveAnalysis
对比分析
Case-sensitive/casesensitivity
大小写敏感、区分大小写
Category-basedapproach
基于类(范畴)的方法
Chi-squaretest/χ2
卡方检验
Chunk
词块
CIA/ContrastiveInterlanguageAnalysis
中介语对比分析
CLAWS/ConstituentLikelihoodAutomaticWord-taggingSystem
CLAWS词性赋码系统
Cleantextpolicy
干净文本原则
Cluster
词丛、词簇
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocationalstrength
搭配强度
Collocationalframework/frame
搭配框架
Collocationalprofile
搭配概貌
Collocationalnetwork
搭配网络
Comparablecorpora
类比语料库、可比语料库
ComputationalLinguistics
计算语言学
ConcGram/concgram
框合结构、同现词列
Concord
索引(行)(简略形式)
Concordance(line)
索引(行)
Concordanceplot
(索引)词图
Concordancer
索引工具
Concordancing
索引分析
Context
语境、上下文
Contextword
语境词
Contextualprosody
语境韵律
Contingencytable
连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring
共现、同现
CorpusLinguistics
语料库语言学
Corpus,pl.corpora
语料库
Corpus-based
基于语料库的
Corpus-basedtranslationstudies
语料库译学、基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究
Corpus-driven
语料库驱动的
Corpus-informed
语料库指导下的、参考了语料库的
Corpussize
库容
Corpusstylistics
语料库文体学
Co-select/co-selection/co-selectiveness
共选(机制)
Co-text
共文
Datamining
数据挖掘
DDL/DataDrivenLearning
数据驱动学习
Dependency
(句法)依存关系
Dicecoefficient
Dice系数
Disambiguation
消歧
Diachroniccorpus
历时语料库
Discourse
话语、语篇
Discourseprosody
话语韵律
Documentation
说明文档、文检报告
EAGLES/ExpertAdvisoryGroupsonLanguageEngineeringStandards
EAGLES文本规格
Effectsize
效应量
Empiricallinguistics
实证语言学
Empiricism
经验主义
Encoding/Textencoding/Characterencoding
字符编码
Error-tagging
错误标注、错误赋码
Explicitation
显化
Extendedunitofmeaning
扩展意义单位
File-basedsearch/concordancing
批量检索
Firthian(linguistics)
弗斯(语言学)、弗斯学派的(语言学)
Fisher’sexacttest
费舍尔精确检验
Formulaicsequence
程式化序列、套语
Frequency
频数、频率
Frequencylist
词频表
General(purpose)corpus
通用语料库
Genre
语体、体裁
Grammaticalpatterning
语法型式
Granularity
颗粒度
Hapaxlegomenon/hapax(pl.hapaxlegomena/hapaxes)
一次词
Header/Texthead
文本头、头文件
HiddenMarkovmodel(HMM)
隐马尔科夫模型、隐马模型
Historicalcorpus
历时语料库
HowNet
知网
ICTCLAS
中科院汉语分词系统
Idiomprinciple
习语原则、成语原则
Idiomaticity
习语性、地道程度
Implicitation
隐化
Index/indexing
(建)索引
In-lineannotation
文内标注、行内标注
Interlanguage
中介语
Inter-coderagreement/reliability
标注者间一致性/信度
Introspection/introspective
内省(式)(的)
Intuition
直觉
Keykeywords
关键主题词
Keyness
主题性、关键性
Keywords
主题词
KWIC/KeyWordinContext
语境共现(方式)、语境中的关键词
KWICsort
语境共现排序、索引行排序
Learnercorpus
学习者语料库
Lemma,pl.lemmata/lemmas
原形词、词目
Lemmatization
词形还原
Lemmatizer
词形还原工具
Lexicalbundle
词束
Lexicaldensity
词汇密度
Lexicalfrequencyprofile
词频概貌
Lexicalgrammar
词汇语法
Lexicalitem
词项、词语项目
Lexicalpatterning
词语型式、词汇型式
Lexicalpriming
词汇触发理论、词汇启动理论
Lexicalprofile
词汇分布概貌
Lexicalrichness
词汇丰富度
Lexico-grammar
词汇语法
Lexis
词语、词项
Log-likelihoodratio
对数似然比、对数似然率
Longitudinal/developmentalcorpus
跟踪语料库、发展语料库、历时语料库
Machine-readable
(可)机读的
Machinetranslation
机器翻译
Manualannotation
手工标注、人工标注
Markup/mark-up
标记
MDA(Multi-dimensionalanalysis/approach)
多维分析、多维度分析法
Meaningbycollocation
搭配辨义
Metadata
元信息
MF/MDapproach/multi-feature/multi-dimensionalanalysis
多特征/多维度分析法
Misuse
误用
Monitorcorpus
(动态)监察语料库
Monolingualcorpus
单语语料库
Multilingualcorpus
多语语料库
Multimodalcorpus
多模态语料库
MWU/multiwordunit
多词单位
MWE/multiwordexpression
多词表达
MI/mutualinformation
互信息、互现信息
N-gram
N元组、N元序列、N元结构、N元词、多词序列
Neo-Firth(school)
新弗斯学派
Neo-Firthian
新弗斯学派的
NLP/NaturalLanguageProcessing
自然语言处理
Node(word)
节点(词)
Normalization
标准化、(翻译)规范化
Normalizedfrequency
标准化频率、归一频率
Observedcorpus
观察语料库
Ontology
知识本体、本体
Open-choiceprinciple
开放选择原则
Orthographic
正字层面的、字面的
Orthography
正字法
Overuse
过多使用、超用、使用过度、过度使用
Paradigmatic
纵聚合(关系)的
Parallelcorpus
平行语料库、对应语料库
Parolelinguistics
言语语言学
Parsedcorpus
句法标注的语料库、树库
Parser
句法分析器
Parsing
句法标注、句法分析
Pattern/patterning
型式、模式
Patterngrammar
型式语法
Patternmatching
模式匹配
Pedagogiccorpus
教学语料库
Phraseology
短语学、短语
Phraseologicalunit/sequence
短语单位/序列
Phraseologicalprofile
短语概貌
Plaintext
纯文本
POSgram
赋码序列、码串
POSsequence
赋码序列、码串
POStagging/Part-of-Speechtagging
词性赋码、词性标注、词性附码
POStagger
词性赋码器、词性赋码工具
Prefab
预制语块
Probabilistic
(基于)概率的、概率性的、盖然的
Probabilisticgrammar
概率语法、概率性语法、盖然语法
Probability
概率
Query
查询、检索
Range
分布(范围)、跨度
Rationalism
理性主义
Rawfrequency
原始频数、生频数
Rawtext/corpus
生文本/生语料
Referencecorpus
参照语料库
Regex/RE/RegExp/regularexpressions
正则表达式、正则式
Register
语域
Registervariation
语域变异
Relativefrequency
相对频率
Representative/representativeness
代表性(的)
Representivity
代表性
Rule-based
基于规则的
S-universals
源语型翻译共性(特征)
Samplen./v.
样本;取样、采样、抽样
Sampling
取样、采样、抽样
Samplingframe
取样框架、取样方案
Samplingstrategy
取样方案
Sanitization
净化
Searchterm
检索项
Searchword
检索词
Segmentation
切分、分词
Semanticassociation
语义联想
Semanticpreference
语义倾向、语义趋向
Semanticprosody
语义韵
Sentencealignment
句对齐、句级对齐
SGML/StandardGeneralizedMarkupLanguage
标准通用标记语言
Simplification
简化
SketchEngine
文擎
Skipgram
跨词序列、跨词结构
Span
跨距
Specializedcorpus
专用语料库、专门用途语料库、专题语料库
Standardizedtype/tokenratio
标准化型次比、标准化类符/形符比、标准化类/形比
StandardizedTTR/STTR
标准化型次比、标准化类符/形符比、标准化类/形比
Stand-offannotation
分离式标注
Stochastic
随机的
Stoplist
停用词表、过滤词表
Stopword
停用词、过滤词
Synchroniccorpus
共时语料库
Syntagmatic
横组合(关系)的
Tscore
T值
T-universals
目标语型翻译共性(特征)
Tag
赋码、标记
Tagger
赋码器、赋码工具、标注工具
Tagging
赋码、标注
Tagsequence
赋码序列、码串
Tagset
赋码集、码集
Tertiumcomparationis
对比基础、对比中立项、对比中间项
Text
文本
Texttype
文体、文类
Textcategory
文体、文类
Textmining
文本挖掘
TEI/TextEncodingInitiative
TEI文本编码计划
TheLexicalApproach
词汇中心教学法
TheLexicalSyllabus
词汇大纲
Token
形符、词次
Tokendefinition/worddefinition
形符界定、单词界定
Tokenization
分词
Tokenizer
分词工具
Transcription
转写
Translationmemory
翻译记忆(库)
Translationnorms
翻译规范
Translationuniversals/Universalfeaturesoftranslation
翻译共性、翻译普遍特征
Translationalcorpus
翻译(文本)语料库、译语语料库
Translationese
翻译腔、翻译体
Treebank
树库
Trigram
三元组、三元序列、三元结构
T-score
T值
Type
类符、词种、词型
TTR
型次比、类符/形符比、类/形比
Type/tokenratio
型次比、类符/形符比、类/形比
Underuse
少用、使用不足
Unicode
通用码
Unicodify
按通用码编码、转换为通用码
Unitofmeaning
意义单位
WaC/WebasCorpus
网络语料库
Wildcard
通配符
Wordalignment
词级对齐、词对齐
Wordform
词形
Wordfamily
词族
Wordlist
词表
WordNet
词网
Wordsketch
词语素描
Wordtype
词种、词型
WSD/Word-sensedisambiguation
词义消歧
XML/ExtensibleMarkupLanguage
可扩展标记语言
Zipf’sLaw/ZipfianLaw
齐夫定律、齐普夫定律
Zscore
Z值
常用语料库
ACE
AustralianCorpusofEnglish
ANC
AmericanNationalCorpus
ARCHER
ARepresentativeCorpusofHistoricalEnglishRegisters
BASE
BritishAcademicSpokenEnglishCorpus
BAWE
BritishAcademicWrittenEnglishCorpus
BNC
BritishNationalCorpus
BoE
BankofEnglish
Brown
BrownCorpus
CANCODE
CambridgeandNottinghamCorpusofDiscourseinEnglish
CEC
ChinaEnglishCorpus
CEM
CorpusforEnglishMajors
CHILDES
ChildLanguageDataExchangeSystem
CIC
CambridgeInternationalCorpus
CLEC
ChineseLearnersEnglishCorpus
CLOB
2009BrownfamilycorpusofBritishEnglish
COBUILD
CollinsBirminghamUniversityInternationalLanguageDatabase
COCA
TheCorpusofContemporaryAmericanEnglish
COHA
CorpusofHistoricalAmericanEnglish
COLSEC
CollegeLearnersSpokenEnglishCorpus
COLT
BergenCorpusofLondonTeenageLanguage
Crown
2009BrownfamilycorpusofAmericanEnglish
FLOB
Freiburg-LOBCorpusofBritishEnglish
FROWN
Freiburg-BrownCorpusofAmericanEnglish
GloWbE
GlobalWeb-BasedEnglish
HelsinkiDiachroniccorpus
DiachronicpartoftheHelsinkiCorpusofEnglishTexts
HKCSE
HongKongCorpusofSpokenEnglish
ICCI
InternationalCorpusofCrosslinguisticInterlanguage
ICE
InternationalCorpusofEnglish
ICE-GB
InternationalCorpusofEnglish:
GreatBritain
ICLE
InternationalCorpusofLearnerEnglish
ICNALE
TheInternationalCorpusNetworkofAsianLearnersofEnglish
JEFLL
JapaneseEFLLearnerCorpus
LCMC
LancasterCorpusMandarinChinese
LINDSEI
LouvainInternationalDatabaseofSpokenEnglishInterlanguage
LIVAC
LinguisticVariationsinChineseSpeechCommunities
LLC
LondonLundCorpus
LOB
Lancaster-Oslo/BergenCorpus
LOCNESS
LouvainCorpusofNativeEnglishEssays
LONGDALE
LONGitudinalDAtabaseofLearnerEnglish
MICASE
MichiganCorpusofAcademicSpokenEnglish
MICUSP
MichiganCorpusofUpper-levelStudentPapers
NESSIE
NativeEnglishSpeakers’SimilarlyandIdentically-promptedEssays
PACCEL
ParallelCorpusofChineseEFLLearners
SBCSAE
SantaBarbaraCorpusofSpokenAmericanEnglish
SCCSD
TheSpokenChineseCorpusofSituatedDiscourse
SCORE
SingaporeCorpusofResearchinEducation
SEC
SpokenEnglishCorpus
SECCL
SpokenEnglishCorpusofChineseLearners
SECOPETS
SpokenEnglishCorpusofPublicEnglishTestSystem
SEU
SurveyofEnglishUsage
SWECCL
SpokenandWrittenEnglishCorpusofChineseLearners
ToRCH2009
TextsofRecentCHinese2009
WECCL
WrittenEnglishCorpusofChineseLearners
Lastupdated2015-07-31by许家金
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语料库 语言学 术语 汇编 V20CORPUSnplcorpora
![提示](https://static.bdocx.com/images/bang_tan.gif)