二语学习者作文词汇丰富性发展多纬度研究.docx
- 文档编号:29091114
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:14
- 大小:27.40KB
二语学习者作文词汇丰富性发展多纬度研究.docx
《二语学习者作文词汇丰富性发展多纬度研究.docx》由会员分享,可在线阅读,更多相关《二语学习者作文词汇丰富性发展多纬度研究.docx(14页珍藏版)》请在冰豆网上搜索。
二语学习者作文词汇丰富性发展多纬度研究
二语学习者作文词汇丰富性发展多纬度研究
摘要:
本文以三个水平组英语学习者的定时作文为语料,利用WordSmithTools、RANGE和在线削尾处理器等多种手段,调查了作文词汇丰富性的发展模式。
词汇丰富性被划分为四个层面,即词汇变化性、词汇密度、词汇复杂性和词汇独特性。
多纬度研究表明,在作文长度组间差异很大时,由于长度的影响,词汇变化性没有发展的趋势。
在长度恒定时,词汇的变化性有增大的趋势,尤其在最低水平组与其他两组之间差异显著。
词汇密度能区分最低水平组和最高水平组,但是测量方法的不同却影响了词汇密度在中间组和最高水平组之间的差异程度。
词汇独特性能区分出最高水平组与其他两组,但是在最低水平组和中间组之间却看不出区别。
由此得出,词汇独特性、词汇变化性和词汇密度虽能区分非邻近组却不能很好地区分邻近组,因而发展均呈非线性。
词汇复杂性最能区分不同组之间词汇使用的差异,即使测量方法有异,其发展路线仍呈直线式。
?
?
关键词:
词汇丰富性;词汇变化性;词汇密度;词汇复杂性;词汇独特性?
?
中图分类号:
H319.3[KG4]文献标识码:
A[KG4]文章编号:
1001-5795(2008)05-0038-0007?
お?
词汇是语言的基本建筑材料,词汇评估自然是二语习得研究的一个重要层面。
根据词汇在研究设计中的凸显度,可以将词汇评估分为两类。
一类是以目标词汇为中心设计词汇测试。
它包括接受性词汇和产出性词汇测试,测试词汇知识的类型涉及词汇量和词汇知识深度。
以测试词汇量为主的设计原则是研究者从词频表中分级随机抽取若干词汇作为目标词,再根据接受性和产出性词汇测试的要求设计不同的题型。
除了测试词汇量之外,这类测试还可以测试受试词汇深度的知识。
深度知识可包括词语的纵聚合知识、词语的搭配知识、词义知识和形态知识等。
典型的测试方式是WescheandParibakht(1996:
13-40)设计的词汇知识量表(theVocabularyKnowledgeScale,简称theVKS)和词语联想测试(wordassociationstest)(SchmittandMeara,1997:
17-36)。
国内一些研究者(吴旭东和陈晓庆,2000:
349-360;李俊,2003:
21-24;吕长?
f,2004:
116-123)则根据词语知识的构成自行设计词汇知识深度测试。
另一类评估(Hyltenstam,1988:
67-84;Laufer,1991:
440-448;Engber,1995:
139-155;文秋芳,2006:
3-8)将词汇作为完成一项交际任务(口语产出和书面作文)不可或缺的一部分,考察学习者在完成交际任务过程中是如何使用词汇的。
这类评估克服了第一类测试脱离或削弱语境作用、忽视语言交际功能的缺陷。
?
?
通过作文评估习作者产出性词汇的运用是一个较新的领域。
研究者往往采用各个词汇量化的指标或测量手段,主要包括词汇变化性(lexicalvariance,简称LV)、词汇密度(lexicaldensity,简称LD)、词汇复杂性(lexicalsophistication,简称LS)和词汇独特性(lexicaloriginality,简称LO)。
这些指标可统称为词汇的丰富性(lexicalrichness)(Laufer,1991:
440-448;Read,2000:
200)或词汇的复杂度(lexicalcomplexity)(Wolfe-Quinteroetal.,1998:
101-103)。
前人的研究或者比较不同写作阶段产出性词汇丰富性的差异,或者调查词汇丰富性与写作质量的关系。
这两个方面的研究文献都不是很丰富。
除了Laufer(1991:
440-448)等研究之外,大多数的研究都没有包括词汇丰富性的所有四个指标,而是进行有选择性的研究。
另外,这些研究也基本上限于两个不同组别之间或同一组两个不同写作阶段之间的比较,我们据此很难看出学习者词汇丰富性发展的态势。
为此,本研究拟将比较的范围从两组扩大到三组,涵盖英语专业组和非英语专业组,以探索词汇丰富性在各个指标上的发展模式。
1文献回顾?
?
词汇变化性最初用于口语和书面语的比较,后来作为作文质量的一个指标。
Grobe(1981:
75-85)认为,好的作文与词汇的变化性密切相关。
Linnarud(1986)比较了中学生二语作文与同年级母语学生作文中的词汇变化情况,发现二语学生的词汇变化程度明显小于母语者。
Laufer(1991:
440-448)发现,学习者不同写作阶段之间的作文在词汇变化性上并无差异。
Hyltenstam(1988:
67-84)发现母语者和水平接近母语者的学习者的作文在词汇变化性上没有差异。
在调查词汇变化性与作文质量的关系中,只有Engber(1995)发现两者有显著的关系,其他研究者(Nihanani,1981:
50-56;Linnarud,1986;Hyltenstam,1988:
67-84)均未发现两者的正向关联。
?
?
词汇密度同词汇变化性一样最初用于口语和书面语的比较。
书面文本比口语文本更具有不可预测性。
这种不可预测性体现在书面文本使用更多的承载信息的实词而非功能词,因此,同口语文本相比,书面文本信息较密集。
早期的语料库研究(Ure,1971:
443-452)表明,口语和书面语的词汇密度有差异。
同口语相比,书面语词汇精雕细琢,词汇密度一般情况下更高(Stubb,1996:
72)。
一些研究者(McClure,1991:
141-154;HarleyandKing,1989:
415-440)发现,母语者文本中的词汇密度大于二语学习者。
词汇密度与写作质量的关系基本未得到证实。
Linarud(1986)发现,不同水平组之间词汇密度有显著差异性的趋势(p<.07)。
Nihalani(1981:
50-56;参见Read,2000:
207)的研究发现,实词的使用量与作文的质量有相关的趋势,但未达到统计上的显著相关。
Laufer(1991:
440-448)和Engber(1995:
139-155)等则没有发现词汇密度与作文质量的明显关系。
不过,我们还不能仅从词汇密度与写作质量的关系来看词汇密度的发展。
?
?
词汇复杂性体现为文本中低频词的覆盖率。
该测量具有直觉上的吸引力,因为相对于词汇量小的学习者,词汇量大的学习者能根据主题和写作风格的需要,不受高频词(常用词)的限制而使用更多的低频词。
低频词汇不是学习者在某个水平阶段熟练掌握的词汇,因此,写作中低频词的使用比率可以反映学习者产出性词汇量的相对大小或不同写作阶段词汇量的发展状况。
最常用的量表是由Nation等制作的。
最初的统计软件为Laufer和Nation(1995:
307-322)率先设计出的词频分析程序VocabProfile。
后来,在此基础上,NationandCoxhead(2002:
1-15)扩大了VocabProfile的功能,并重新将之命名为RANGE。
它包括最常用1,000词表、次常用1,000词表、学术词表和表外词。
最新版(2006)RANGEBNC包含16个词表,前14个词表的编制是基于英国国家语料库(BNC,theBritishNationalCorpus)口语子语料库的词频统计,第15个词表是专有名词词表,第16个词表包括口语常用的感叹词等。
一些研究者(LauferandNation,1995:
307-322;Laufer,1991:
440-448)发现,词汇复杂性和写作质量之间有关联。
Laufer(1994:
21-33)采用对复杂词汇的四种不同定义方法,得出两种不同的结果。
一个结果表明,词汇复杂性在不同的写作阶段呈发展趋势,另一结果则没有显示词汇复杂性发展的迹象。
这表明对词汇复杂性的不同定义会影响研究的结果。
刘东虹(2003:
180-187)却发现,写作高分组和低分组之间在词汇复杂性方面没有差异,词汇复杂性对作文的质量没有明显的影响。
?
?
所谓的“独特词”是指同一组学习者中由一个学习者使用的、其他学习者均未使用的词汇。
词汇的独特性体现为独特词在整个文本中的覆盖率。
词汇独特性的直觉吸引力在于,好的作者往往使用独特词汇来表达具体和生动的内容。
不过,词汇独特性的研究很少(Linnarud,1986;Laufer,1991:
440-448),且结果也不一致。
Linnarud(1986)发现,学习者作文词汇独特性逊色于母语者,词汇独特性与写作成绩呈正相关(r=0.45);Laufer(1991:
440-448)却没有发现词汇独特性在不同写作阶段的发展。
2研究设计
2.1研究问题?
?
本文研究不同水平组学习者作文在词汇使用的丰富性方面表现出的差异性。
具体地说,本研究比较三组学习者在词汇变化性、词汇密度、词汇复杂性和词汇独特性四个指标的发展方面呈现的异同,着重回答词汇丰富性在各个指标上随着学习者二语水平的提高呈现怎样的发展趋势。
?
?
前人的研究表明,词汇丰富性的各项指标与学习者作文水平的关系或有或无,对不同水平的学习者的区分力或大或小,由此似乎可以得出结论:
学习者词汇丰富性的发展缺乏规律性。
但是,他们的研究一般只限于两组之间的比较,而且二语水平差异的大小也会影响词汇丰富性指标在组间差异的显著性程度。
本研究拟通过三组作文数据的比较,探索词汇丰富性各指标的发展方向,是直线式地发展,还是曲线式地发展,抑或是没有发展。
2.2作文数据?
?
该研究的作文数据来源于三个水平组。
一组、二组和三组作文分别由非英语专业大二学生、非英语专业一年级研究生和英语专业高年级(大三和大四)学生在课堂完成的50篇定时作文(时间为50分钟)组成。
各组作文题目统一为“EducationasaLifelongProcess”,长度要求为300词左右,多者不限。
非英语专业的两个组均来自同一所文科学院,英语专业组来自另一所综合类重点大学。
虽然三组作文为不同习作者的作文数据,但是以入学要求、英语学习时间的长短和课程要求为参照,我们有理由认为,一、二、三组基本可以代表学习者英语水平由低到高的发展阶段,因此,本研究将之依次设定为低水平组、中间组和高水平组。
三个组的作文基本数据见表1。
从作文的长度来看,二组学习者作文的平均长度略低于三组,一组学习者作文的平均长度则明显低于其他两组。
学习者作文长度的变化呈现由快到慢的增长趋势。
标准偏差数据表明,一组内作文长度的差异性最大,二组次之,三组最小。
?
?
2.3各变量定义及统计工具
2.3.1词汇变化性及统计?
?
词汇变化性的测量采用的是类型与标记之比(type/tokenratio)。
标记是文本中实际使用的词。
对于类型有两种定义。
一种定义是指文本中出现的不同的词,一个词的不同屈折形式如run,runs,running和ran视为不同的词。
以此计算出的词汇变化性是一种粗略的统计方法。
另外一种更准确的定义方法是将一个词的不同屈折形式视为同一个词位,如run,runs,running和ran为同一个词位。
本研究采用第二种定义,在计算类型时只考虑正确的词。
在统计词汇变化性值之前,需要进行削尾(或词位还原)处理。
本研究使用在线削尾处理器(lemmatizer)(网址为:
http:
//nl2.ijs.si/analyze/cgi/testlem.cgi.)代替大量的人工统计。
当然,机器并不能完全代替人工。
机器处理后再进行人工检查,纠正个别问题。
比如处理器不管意义如何将means、meant和meaning一律改为mean(“意为”),但means除为mean的第三人称单数外,还有“手段”的意思;另外,meaning除作为mean的分词形式外,也可单独作为一个词目,作“意义,意思”解。
再如,thought既可为作名词(“想法”),也可作动词think的过去式。
对于拼写错误的词或学习者生造词的屈折变化,我们不作还原处理,譬如削尾处理器将busing(从上下文猜测是“忙”的意思)、lifves(“生活”)还原为buse和lifve,鉴于busing和lifves是错误的形式,我们仍保留原来的busing、lifves,并排除在类型统计之外。
这些都需要根据上下文进行人工处理。
一般情况下,文本越长,往往重复使用的词就越多,因而类型与标记的比率可能越小。
由于不同组别的作文长度有明显的差异(F=37.991,p<.001),本研究采用两种统计方法,以便考查长度对词汇变化性的影响。
第一种方法(LV1)不考虑长度的影响计算各篇作文的类型与标记之比。
另一种方法(LV2)是采用标准化的类型与标记之比(standardisedtype/tokenratio)。
LV2的统计和LV1一样均利用WordSmithTools。
所不同的是,标准化的类型与标记之比(LV2)以100个词(最短的学生作文为127个词)为单位,逐个计算,最后得出均值。
2.3.2词汇密度及统计?
?
词汇密度测量实词在整篇文本中的比率,考查文本的信息含量。
本研究采用两种统计公式。
第一种(LD1)允许实词重复,即允许信息重复,将不同屈折形式的实词视作不同的类型(只考虑正确的类型)。
第二种(LD2)则利用在线削尾处理器将同一个词的不同屈折形式归并为同一类型,因而排除了对重复信息的考虑,只计算使用正确的不同实词(词位)在文本中的比率。
统计工具仍为WordSmithTools。
与词汇变化性统计不同的是,词汇密度的统计需用到由功能词构成的屏蔽或排除词表(stoplist),以便计算实词的数量。
先利用WordSmithTools处理英国国家语料库(BNC),得出一列功能词,再结合本研究中的作文数据,最后制定出由165个单个词和词组构成的屏蔽词表。
2.3.3词汇复杂性及统计?
?
词汇复杂性测量低频词在文本中的比率。
词汇复杂性测量中的一个问题是确定低频词。
考虑到三组学习者词汇产出能力可能差异甚大,本研究采用两个操作定义。
一种是将最常用1,000词以外的词定为低频词,另一种是将最常用2,000词以外的词视作低频词。
统计软件为PaulNation等(2002)设计的RANGE。
关于该软件的详细介绍,参见鲍贵和王霞(2005:
54-58)。
词汇复杂性数值是削尾后的低频词类型总数(只考虑正确的词位)与文本总长度的比率。
?
?
2.3.4词汇独特性及统计?
?
词汇独特性是同一组中一篇文本独用的正确词汇(以词位计算,即削尾后的词语类型)总数与文本总长度的比率。
统计方法为:
先利用RANGE制作独特词表。
一、二、三组各有独特词汇419、552和848个。
从独特词使用的总量来看,从一组到三组有渐增的趋势。
然后,利用这三组词表分别制作三个屏蔽词表,利用WordSmithTools计算每篇削尾后的文本排除屏蔽词表后得到的类型与标记的比率。
每篇词语削尾后的文本中的类型与标记的比率减去同一篇词语削尾后的文本排除屏蔽词表后得到的类型与标记的比率,即为该篇文本的词汇独特性统计值。
3结果与讨论?
?
本节报告和讨论三组作文在词汇丰富性的各个指标上的差异性。
由于各个指标的统计数值均为百分数,为了便于统计和报告,将各个数值去掉百分号后再用SPSS.v12.0进行统计。
?
?
3.1词汇变化性在组间的差异?
?
词汇变化性测量有两个指标。
LV1不考虑文本长度,计算每篇作文的类型与标记之比;LV2则控制文本的长度,计算每篇作文标准化的类型与标记之比。
三个水平组词汇变化性发展走势如图1所示(图中标示的数据为均值,下同)。
?
?
图1显示,在LV1上,三组的均值很接近,几乎看不出发展的迹象。
在LV2上,三组的均值依次增大,尤其在一组和其他两个组之间差异较大,有发展的迹象。
单因子方差分析发现,三组在LV1上没有显著差异(F=.923,p>.05),但在LV2上有显著差异(F=34.060,p<.001)。
这一结果说明,文本长度差异较大会影响词汇变化性的结果。
LV1的研究与Laufer(1991:
440-448)、Nihanani(1981:
50-56)等的发现相吻合。
由LV1和LV2的不同统计结果可以发现,长度是影响作文词汇变化性的一个重要参数。
一般地说,作文越长,重复使用的词就可能越多。
因此,在比较不同作文的词汇变化性时,如果作文之间的长度差异很大,就有必要考虑如何减少长度的干扰。
对LV2事后比较检验的结果见表2。
表2说明,一组在词汇变化性(LV2)方面显著低于二、三组,部分地说明随着二语水平的发展,学习者能够变化词汇,避免较多的词语重复。
这一发现与Linnarud(1986)与Engber(1995:
139-155)的结果相一致。
但是,二、三两组没有显著差异性这一事实使得词汇变化性的发展又表现出复杂性,尽管从p值(p=?
?
069,接近于.05)来看,三组词汇的变化性有大于二组的趋势。
在长度控制时,不同组间词汇变化性未必就一定有差异,词汇变化的差异性程度还可能取决于不同组学习者之间实际水平差异的大小。
二、三组之间或许由于写作水平差异较小而导致词汇变化区分度的减少。
这一推论部分地从Hyltenstam(1998:
67-84)的研究中得到证实。
在控制文本长度之后,Hyltenstam(1998)发现不同水平组间的词汇变化性没有显著差异。
Hyltenstam(1998:
67-84)的受试是母语者和水平接近母语者的二语学习者,正是由于两者水平差异的减少而削弱了词汇变化性的区分度。
?
?
3.2词汇密度在组间的差异?
?
本研究对词汇密度采用了两种测量方法。
LD1允许实词重复,增大文本信息的含量;LD2排除用相同的词位表达重复的信息。
三个水平组词汇密度的发展变化如图2所示。
?
?
图2词汇密度发展曲线
从图2中可以看出,LD1的发展比LD2明显。
LD1值在一、二组之间差异不大,但是到了三组增长幅度非常大;LD2值在邻近组之间变化很小,很难看出增长的趋势。
单因子方差分析发现,三组在LD1(F=211.256,p<.001)和LD2(F=5.271,p<.01)上均有显著差异。
对LD1和LD2事后比较检验的结果见表3。
词汇密度组间差异比词汇变化性复杂。
在LD1方面,三组高于一、二两组,而一、二组之间则没有明显的差异。
LD2方面的结果略有不同:
三组只高于一组,一、二组之间和二、三组之间均没有显著的差异。
以上结果说明,词汇密度能较好地区分水平差异甚大的组别(本研究中的一组和三组)。
这与McClure(1991:
141-154)和HarleyandKing(1989:
415-440)等研究的发现相一致。
但在比较一、二组平均数差异时,我们发现,不管我们是否考虑重复使用的实词,一组与二组之间的词汇密度的差异都很小,且没有显著的差异。
但是,比较一、三组在允许实词重复时的平均数差异和排除实词重复时的平均数差异,我们却发现,三组(高水平组)重复相当多的实词,从而导致二组与三组在LD2上无显著性差异。
高水平组对实词的大量重复一方面是由于文本长度的增加而增加了与主题相关的词的复现度,另一方面或许是出于词汇衔接的需要而重复使用某些词。
简而言之,词汇的密度从低水平组到高水平组有发展的趋势,但是它的弹性依然存在。
?
?
3.3词汇复杂性?
?
鉴于学习者作文能力的差异性,尤其考虑到一组非英语专业大二学习者词汇能力的局限性,本研究采用两种试探性测量方法。
LS1测量学习者在高频1,000词以上的词汇使用比率;LS2测量学习者在高频2,000词以上的词汇使用比率。
三个水平组词汇复杂性发展变化见图3。
?
?
图3显示,LS1和LS2的发展线条几乎平行,都有明显的增长趋势。
单因子方差分析发现,三组在LS1(F=28.853,p<.001)和LS2(F=20.262,p<.001)方面均有显著差异。
对LS1和LS2事后比较检验的结果如表4所示。
?
?
词汇复杂性统计的结果表明,无论是以最高词频1,000词?
ひ酝獾拇驶故且宰罡叽势?
2,000词以外的词作为复杂词(低频词)的测量标准,各组词汇的复杂性都有显著的差异,从一组经由二组到三组有直线式发展的明显态势。
这一结果说明,词汇的复杂性是区分不同水平组词汇差异的最重要指标。
该结果与LauferandNation(1995:
307-322)、Laufer(1991:
440-448)等研究发现相一致,与Laufer(1994:
21-33)的研究结果部分一致。
Laufer(1994:
21-33)比较了两组高级学习者在两个写作阶段的四种词汇复杂性的测量结果。
在两种测量中,她计算了不在2,000常用词表之内和在大学水平词汇表之内的复杂词,发现两组的词汇复杂性在前后不同阶段均有显著性差异。
但在将复杂词定义为不在1,000常用词表和不在她自制的词频表之内的词汇时,Laufer(1994:
21-33)却发现,两组的词汇复杂性在前后不同阶段均没有显著性差异。
如果我们总体上接受学习者的词汇复杂性随着写作水平的提高而提高这一观点,那么该如何解释刘东虹(2003:
180-187)的研究结果呢?
刘东虹(2003)的关于写作成绩与词汇复杂性无关的结论并不能否认词汇复杂性持续发展的这一趋势,因为其研究对象为同一水平上的大二学生,谈不上阶段性发展。
如果学习者的词汇复杂性在同一水平线上,那么决定写作质量的只能是其它示差性的指标如本文的内容和组织等。
此外,刘东虹(2003)的词汇复杂性研究在两个方面存在疑问。
其一,低频词的定义应随学习者二语水平的不同而不同。
既然受试仅为大二的学生,刘东虹(2003)将第二类1,000高频词排除在复杂性词汇之外是否符合学习者词汇发展的实际?
Laufer(1994:
21-33)的研究说明,虽然词汇复杂化能够反映写作词汇的发展,但是它取决于如何定义复杂词汇(Wolfe-Quintero,etal.,1998:
115)。
这就构成我们对刘东虹(2003)的研究结果提出疑问的一个重要原因。
其二,刘东虹(2003:
183)对词汇类型的定义不够明确,只说“一个单词无论重复多少次,它只算一个类型。
”从她对数据分析的描述中,我们认为其所指的类型并非词位或削尾后的词型。
?
?
3.4词汇独特性?
?
词汇独特性(LO)测量同一组内某一文本措词的排他性程度。
三个水平组词汇独特性发展曲线见图4。
如图所示,词汇独特性随学习者水平的提高有明显的发展趋势,其中一组与二组的变化性较小,三组与其他两组差异明显。
单因子方差分析发现,三组在词汇独特性上有显著差异(F=25.673,p<.001)。
对LO事后比较检验的结果如表5所示。
在词汇独特性方面,三组明显高于一、二两组,但是与词汇复杂性统计结果不同的是,一、二两组之间没有显著的差异。
这一结果反映出词汇独特性发展的曲折性,部分地与Linnarud(1986)和Laufer(1991:
440-448)的研究发现相一致。
Linnarud(1986)发现,学习者作文词汇独特性低于母语者,而Laufer(1991:
440-448)却没有发现词汇独特性在不同写作阶段的差异。
Laufer(1991)的研究对象是英语专业的大一学生,具有同质性。
本研究中的一组和二组虽处在不同的水平发展阶段,但也同为非英语专业的学生,三组则为英语专业的学生。
似乎可以认为,词汇独特性能较好地区分英语和非英语专业组,对同质组则缺乏区分度。
这一结果是否具有普遍性还有待于进一步证实。
不过,我们有理由相信,英语专业组由于接触英语的量要远远多于非英语专业组,加之经过长期的专门写作训练,因而他们更能驾驭词汇,借以表达独特的思想内容。
4结论?
?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学习者 作文 词汇 丰富性 发展 纬度 研究
![提示](https://static.bdocx.com/images/bang_tan.gif)