汉语语法研究所面临的挑战Word文档下载推荐.docx
- 文档编号:18636500
- 上传时间:2022-12-30
- 格式:DOCX
- 页数:21
- 大小:52.48KB
汉语语法研究所面临的挑战Word文档下载推荐.docx
《汉语语法研究所面临的挑战Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《汉语语法研究所面临的挑战Word文档下载推荐.docx(21页珍藏版)》请在冰豆网上搜索。
对学生来说,老师讲的语法规则听了就听了,至于老师讲的语法规则对不对,全面不全面,都不怎么考虑,更不会按老师讲的语法规则去说话。
为了第二个目的,前人着实对现代汉语语法作了不少研究和探索,但一般采用归纳法,其研究思路一般都是从正面考虑问题。
这种研究也能而且也已经发现不少语法规则。
对外汉语教学,面对的是外国学生或外族学生,这跟面对汉族学生的汉语教学不同。
外国学生或外族学生对汉语原先是一无所知,老师怎么教,他们就怎么学,就怎么说,而且本能地要按老师讲的语法规则去类推。
可是一类推就出错。
就拿处所宾语来说,不少语法论著都把“吃食堂”、“吃馆子”里的“食堂”、“馆子”分析为处所宾语。
从事对外汉语教学的老师在谈到这类“述宾结构”(或说“动宾结构”)时,常常会这样说:
(1)吃食堂=在食堂吃饭
(2)吃馆子=在馆子里吃饭
老师的话不能说不对,但学生的理解与思考往往是老师所没有预料到的。
既然说“吃食堂”就是“在食堂吃饭”,“吃馆子”就是“在馆子里吃饭”,那也就是说,“在食堂吃饭”、“在馆子里吃饭”可以分别说成“吃食堂”、“吃馆子”。
外国学生这样一想,就类推起来,结果说出了下面这样的病句:
(3)※勺园二号楼食堂的饭不好吃,我现在都吃勺园七号楼餐厅。
(4)※昨天我们进城是吃前门的全聚德。
为什么“在食堂吃饭”、“在馆子里吃饭”可以分别说成“吃食堂”、“吃馆子”,而“在勺园七号楼餐厅吃饭”、“在前门的全聚德吃饭”不能说成“吃勺园七号楼餐厅”、“吃前门的全聚德”?
这就很值得我们思考:
第一,“吃食堂”、“吃馆子”里的“食堂”、“馆子”到底是不是处所宾语,需从新加以考虑。
第二,在“吃食堂”、“吃馆子”这类说法里,对充任宾语的词语有什么限制没有?
第三,“吃食堂”、“吃馆子”这类说法在什么场合,也就是说在什么语境下才能用?
再如,陆俭明、马真(1985)在十多年前就提出了这样一个来自对外汉语教学中所碰到的问题:
“※他这样做是合情合理。
”不能说,因为后面缺少了跟“是”呼应的“的”;
可是有时前面用了“是”后再出现“的”,句子反而不能说了,譬如“※他这样做是偏听偏信的”里的“的”必须删去,得说成:
“他这样做是偏听偏信。
”这为什么?
十多年过去了,至今未见有说清楚这个问题的论文。
再如,动词后如果既有趋向补语又有宾语成分,那么趋向补语和宾语的次序该怎么样?
也早就提出来了,虽然已有一些学者对这个问题进行了探讨,并对不同的语序从多方面进行了解释。
但还存在问题:
一是不周全,不严密;
二是缺乏可操作性。
所以至今仍是对外汉语教学中的一个难点。
类似这样的问题,在对中国汉族学生的语文教学(包括语法教学)中是不大可能提出来的。
类似上面所谈的问题举不胜举。
一个人学习一种外语,常常会说出、写出不合语法的病句,主要原因有两个:
一是学生母语语法规则的负迁移,也就是通常所说的由于受母语语法的影响而出错。
譬如日本学生刚开始说汉语时常常会把宾语放在动词前边(如“※我昨天到王府井衣服买了”),那是因为日语里宾语通常是在动词的前边;
二是目的语(即所学的语言)语法规则的负迁移,也就是上面说的按老师说的语法规则去类推而出错。
前一种原因造成的病句一般容易纠正,随着外语水平的提高,这类语病就会逐步得到克服;
难纠正的是后一种原因造成的病句。
因为需要经过深入的思考和研究后才能有效地纠正外国学生这方面的语病。
在对外汉语教学过程中所碰到的、所出现的这类语法问题,都很值得我们去思考,去研究。
这方面的研究不仅有实用价值,也有理论意义。
事实告诉我们,外国留学生的语法病句常常会成为我们语法研究的新的突破口。
无疑,对外汉语教学对现代汉语语法研究起着挑战作用,同时也起了促进作用。
对外汉语教学不是从九十年代开始的,远的不说,五十年代中国大陆就有对外汉语教学,为什么到了九十年代对外汉语教学才对汉语语法研究形成挑战呢?
这有多方面的原因,一是对外汉语教学进入九十年代以后有了飞速的发展,下面的数字──中国大陆在校留学生(只指长期生)的数字很说明问题:
1950年,33名;
1961年,471名;
1965年,3312名;
1966年,因“文化大革命”而中断;
1977年,1217名;
1988年,5245名;
(参看吕必松(1990));
1997年,41211名。
二是对外汉语教学自八十年代以来已逐渐形成为一个独立的研究学科。
三是现在的外国留学生随着整个知识水平的提高,更喜欢思考,更“不老实”了,他们在学习汉语的过程中常常会提出各种各样老师意想不到、也难以回答的问题。
1.2以往的语法教学和语法研究,即使包括对外汉语教学及其相关的研究在内,面对的都是人,总起来说是要解决人与人之间的交际问题。
碰到问题,即使是对外国学生,适当地指点一下,解释一下,也就过去了。
现在的情况则发生了很大的变化。
我们知道,作为人类文明的历史,已经经历了两个大的时代,一个是农业时代,那个时代以努力开发维持人最起码的生存条件的物质资料为主要特点;
一个是工业时代,那是从英国产业革命开始的,那个时代以开发能源资源、实现体力劳动机械化为主要特点。
现在则又进入了一个新的时代,那就是信息时代。
进入信息时代应该从什么时候算起,说法不一。
有的说应该从四十年代后期(1946年)美国宾西法尼亚大学(PennsylvaniaUniversity)研制出第一部“电子数字综合计算机(ElectricalNumericalIntegratorandCalculator)”开始,有的说应该从八十年代广泛使用个人电脑开始,有的说应该从九十年代建立起英特网(internet)开始。
这个我们暂且不去管它,总之现在进入了信息时代。
这个时代将以进一步开发计算机,以便进一步减轻人的体力劳动并逐步减轻人的脑力劳动为主要特点。
九十年代开始更明确提出了建造信息高速公路、研制智能计算机的任务。
而要建造信息高速公路,研制智能计算机,离不开语言学。
从报章杂志的报道看,当今世界上已形成了三个研制智能计算机的中心,一个是美国,他们力图建立两个新一代的智能系统来处理自由文本军事信息,以建立起新的国家安全防卫系统;
一个就是日本,日本要建立超巨型信息处理中心,决心成为世界上最大的信息商贩;
一个是欧洲共同体,他们准备研制认知代理人,其第一步为认知代理人提供准确而可靠的认知机制。
无论哪个中心,他们在着手进行研制智能计算机的任务中,都不约而同地以语言信息处理为中心。
在他们的研制队伍里既有计算机科学方面的专家,也有语言学家。
其实在七十年代就有人预见,语言学将成为领先科学;
世界著名的语音学家方特好像也曾说过,现在急需的不是第五代计算机,而是第五代语言学家。
这都是说语言学将处于越来越重要的地位。
进入九十年代更有人说,从18世纪以来,世界科学的热点,由经典物理学转向数学,现在又正由数学逐步转向语言学。
这当然只是某些科学家的看法,但这种看法也不是一点没有道理的。
人的思维离不开语言,语言是思维的物质外壳。
所谓智能计算机,也就是能像人一样会思维的计算机,使用这种计算机以实现人机(人与计算机)对话,包括人机笔谈。
而要计算机能思维,必须把人的语言规则形式化,输入到计算机中。
输入的语言规则如果有错误,或者不全面,不严密,都会严重影响计算机对自然语言的理解,计算机也就不能说出人所能听得懂的语言。
而要把语言规则形式化,要保证输入计算机的语言规则全面、准确、严密(这当然也有个过程,不可能一步到位),需要有语言学家的帮助。
在中国,也在酝酿研制智能计算机,并已列入国家科研规划之中。
在实施“211工程”中,也拟在多所综合大学内(其中包括我们北京大学)筹建语言实验室,以便利用综合大学文理交叉、师资力量雄厚的优势,来为研制智能计算机作贡献。
中国在中文信息处理方面,其实起步还是比较早的。
早在五十年代末、六十年代初就开始着手研究机器翻译,在当时还处于世界先进水平。
由于众所周知的原因,研究一度处于停滞状态。
“文化大革命”后,特别是进入八十年代后,中文信息处理,有比较大的发展,特别是在汉字信息处理方面,而且相应地在全国成立了一些研究机构。
但是实际的进展还不让人满意,从语法的角度说,现在只是初步解决了分词和词性标注的问题。
句处理还刚刚起步,而其难度将远远超过分词和词性标注。
句处理不仅面临着复杂的语音问题、句法规则问题,更面临着复杂的语义问题、知识背景问题。
而这些问题的解决都需要有语言学家的参与。
过去从事计算机科学研究的学者和从事汉语研究的学者没有或者说基本没有很好的结合。
八十年代后期,特别是进入九十年代后,大家越来越意识到这个问题,逐步走上了二者互相结合的道路,双方共同承担科研任务,合作进行研究。
我们看到近十年来取得了一些可喜的成绩。
中文信息处理使汉语研究受到前所未有的重视,这是好事,但这对汉语研究者提出了严峻的挑战。
就中文信息处理来说,早期的“人机对话”系统采用简单模式匹配方法,这可以看作是一种原始的处理方法。
现在广泛使用的有两种方法,一是基于规则的处理方法,这种方法有的以一定的形式文法系统加上“复杂特征”来表述自然语言中大小成分的句法信息和它们之间的组合规则,有的则试图“以概念化、层次化、网络化(简称“HNC”)为基础”来提供概念组合、语义表述的规则(参看黄曾阳(1997));
二是基于经验的语料库统计方法,这种方法是以各种统计数据来显示语言成分间的组合可能性。
(参看黄昌宁等(1992)和黄昌宁(1993))许多人认为这是两种对立的处理方法。
其实在我们看来,无论是哪种处理方法,都离不开自然语言(汉语)的知识。
从发展趋势看,基于规则的处理方法和基于经验的语料库统计的处理方法必将走上结合的道路,相辅相成。
不管采用哪种处理方法,大家都深感目前有关汉语的知识远远不能满足中文信息处理的需要。
单就句法方面的情况说,在中文信息处理过程中将会不断遇到我们所想像不到的问题。
许多问题在人看来还是比较容易解决的,但机器解决不了。
譬如说,
(15)北京的公路建设得很快
(16)北京的公路建设很有成绩。
这两句话中,字面上有相同的部分,那就是“北京的公路建设”,但这两句话的内部构造是不同的。
这对我们人来说,只要稍有一点语法知识,是很容易区分的:
(15)'北京的公路建设得很快。
(16)'北京的公路建设很有成绩。
但让计算机来切分时,就出了问题,第
(2)句它可能会切分为:
(17)※北京的公路建设很有成绩。
近十年来我们参与了一些中文信息处理方面的研究工作。
在中文信息处理中,我们就已经遇到了以下四方面的难题:
一是表面词类序列相同而内部结构关系不同的同形格式的区分问题。
大家知道,“汉语词类跟句法成分之间不存在简单的一一对应关系”,“不像印欧语那样,一种词类只跟一种句法成分对应”。
(参看朱德熙(1985))同一类词在句法结构中可以作不同的句法成分,而在形式上则没有任何不同的标志。
例如同是“动词+动词”的词类序列,可以表示多种句法关系,请看:
(18)a.打算回家[述宾关系]
b.唱歌跳舞[联合关系]
c.研究结束[主谓关系]
d.挖掘出来[述补关系]
e.访问回来[连动关系]
f.养殖研究[“定-中”关系]
g.(他)讽刺说[“状-中”关系]
稍有语法知识的人一般都能把它们区别开来,可是计算机则区别不了,你要计算机把它们区别开来,一定得把现代汉语“动词+动词”在什么条件下形成什么样的结构关系的种种规则充分而准确地输入计算机。
说老实话,我们能把它们区分开来,凭的不是严密的规则,而是综合了总体语义理解、自己的经验和部分句法规则。
下面再举一个实际的例子:
(19)他被交通警叫去罚了一百块钱。
(20)他被交通警叫去写了一个检查。
这两句话,词类序列相同,都是“NP1+被+NP2+VP1+VP2”。
对人来说(不管是对汉族人,还是对外国学生),都不难区分,即使有人一下子看不清楚,我们也很容易说明白它们之间的区别:
例(19)介词结构“被交通警”一直管到底,不只管VP1“叫去”,还管着VP2“罚了一百块钱”(“被交通警叫去”,“被交通警罚了一百块钱”);
而例(20)介词结构“被交通警”只管到VP1“叫去”(“被交通警叫去”),而VP2“写了一个检查”就不受那介词结构管辖了(“※被交通警写了一个检查”)。
可是机器分辨不清楚,即使作了上面的说明,也还是分不清楚。
机器所要求的是,把“介词结构+VP1+VP2”这一词类序列在什么情况下介词结构只管到VP1,在什么情况下那介词结构可以一直管到VP2的规则,准确而又充分地输入到计算机里去。
这样,机器才能识别这类词类序列。
(参看詹卫东(1997))
二是句法歧义格式的区分问题。
所谓句法歧义格式是指不仅词类序列相同而且具体的词语也相同的歧义句法格式。
这种句法歧义,八十年代语法学界已经讨论得很多,归纳起来,大致有以下三种情况:
1.由于层次构造不同而造成的句法歧义格式。
例如:
(21)不适当地管教孩子,对孩子成长不利。
[强调要加强对孩子的管教]
(22)不适当地管教孩子,对孩子成长不利。
[强调对孩子管教要适当]
(23)对领导的批评意见,应该认真考虑。
(24)对领导的批评意见,应该认真考虑。
2.由于语法结构关系不同而造成的句法歧义格式。
(25)钱汇去了。
(=钱汇走了)
(动补)
(26)钱汇去了。
(=钱去汇了)
(连动)
(27)姐姐买的|面包。
(可以用来回答“姐姐买的是什么?
”)
(主谓关系)
(28)姐姐买的|面包。
(可以用来回答“吃谁买的面包?
(修饰关系)
3.由于语义结构关系不同而造成的句法歧义格式。
例如
(29)鸡不吃了。
[类似“我不吃了”,“鸡”是动作者(施事)]
(30)鸡不吃了。
[类似“肉不吃了”,“鸡”是受动者(受事)]
(31)山上架着炮。
[=“炮架在山上”,句子表示存在,表静态;
“山上”指明“炮”
存在的处所,类似“墙上挂着画”]
(32)山上架着炮。
[=“山上正在架炮”,句子表示活动,表动态;
“山上”指明
架炮这一活动的场所,类似“教室里上着课”]
上述三种句法歧义格式,现在有一定汉语语法知识的人都可以运用一定方法把它们所表示的歧义加以分化,可是计算机还不能加以分化。
要计算机对这些句法歧义格式加以分化,首先需要人把分化这些句法歧义格式的种种规则充分而又准确地输入计算机。
三是词语串的切分问题,包括一般所说的短语边界问题。
所谓词语串是指词和词连在一起所形成的词语序列。
由于句法构造有层次性,所以连在一起的词语序列不一定就组成一个合法的句法结构。
请看实例:
(33)“爸爸到底去不去呀?
”“爸爸去。
”
(34)小王的爸爸去上海了。
“爸爸去”这个“名词+动词”的词语串,在例(33)答话里是一个合法的句法结构,可是在例(34)里就不是一个合法的句法结构。
我们人很容易区辨,可是计算机区辨不了。
你要计算机区辨,那就得把“名词+动词”这样的词语串在句中什么情况下是一个合法的句法结构,在什么情况下不是一个合法的句法结构的规则充分而又准确地输入到计算机里去。
(参看马真、陆俭明(1996))
四是句中代词的理解(照应)问题。
主要是第三人称代词“他”和反身代词“自己”的理解(照应)问题。
句中的“他”跟哪个名词照应,“自己”回指哪个名词,近十多年来,国内外讨论得很多,也总结归纳出了一些照应、回指的规则。
但远不能满足中文信息处理的需求。
请看下面三个实例:
(35)王春贵刚进家门,就接到李春林打来的电话,他说有要事商量。
(36)王春贵刚进家门,就接到李春林打来的电话,他想一定有要紧的事。
(37)王春贵刚进家门,就接到李春林打来的电话,他今天刚出院,很想与老朋友叙谈叙谈,两人就在电话里聊上了,足足聊了半个小时。
例(35)里的“他”与“王春贵”照应;
例(36)里的“他”与“李春林”照应;
例(37)里的“他”则既可以跟“王春贵”照应,也可以跟“李春林”照应。
对人来说,这三个句子里的“他”所称代的对象,一般都能分别作出正确的理解;
但计算机做不到。
要让计算机分别正确理解这三个例句里“他”的称代对象,就得把“他”的照应规则准确而又充分地输入计算机。
在中文信息处理中所碰到的语法问题当然不止这四方面。
中文信息处理对汉语语法研究的种种要求,无疑是对汉语语法研究的一个极大的挑战。
计算语言学专家俞士汶先生(1997)指出,“句法分析在汉语信息处理系统中具有举足轻重的作用”,“计算机处理需要的汉语语法研究以及句法分析算法研究,在目前来说,应该是汉语信息处理研究的一个重点”。
显然,来自中文信息处理的挑战必将大大推进现代汉语语法研究。
1.3对现代汉语语法研究成果来说,对外汉语教学和中文信息处理可以说是一面镜子,一块试金石。
我们研究得到的种种语法规则,拿到对外汉语教学中,拿到中文信息处理中一用,立刻就可以看出,哪些行,哪些还不行,或者说还不太行,还需进一步修正、补充。
事实证明,这种语言应用对现代汉语语法研究是挑战,同时也起着极大的推动和促进作用。
二、来自理论方面的挑战
2.0从理论方面说,挑战也来自两方面:
一是迫切需要对种种语法规现象作出理论上的解释;
2.1我们知道,从1998年《马氏文通》诞生到四十年代,汉语语法研究基本上是在传统语法学的间架里进行的。
五十年代美国描写语言学的理论与方法逐渐影响汉语语法研究,可以这样说,八十年代中期以前,现代汉语语法研究基本上或者说主要是对汉语语法现象、语法规则的描写说明。
乔姆斯基(N.Chomsky)所开创的语言研究基本上是解释性的,八十年代后期陈平先生(1987)的《描写与解释》一文发表后,对现代汉语语法现象、语法规则的解释开始引起汉语语法学界的普遍关注,陆续发表了一些这一方面的论著。
对语法现象、语法规则的描写,旨在说明“是什么”,对语法现象、语法规则的解释,旨在说明“为什么”。
有人称旨在说明“是什么”的语法研究为“描写性研究”,称旨在说明“为什么”的语法研究为“解释性研究”。
(参看邵敬敏(1989))对语法现象、语法规则的“描写性研究”和对语法现象、语法规则的“解释性研究”,这二者事实上是密不可分的。
我们同意杨成凯先生(1996)的看法:
“描写”与“解释”是个层次问题,它们二者“相辅相成,各有所宜,也各有所用”。
不过,我们也不能不承认,从对语法现象、语法规则的“描写性研究”到对语法现象、语法规则的“解释性研究”,应该说是语言研究的一大进步。
从语法研究的根本目的来说,我们有理由要求我们的语法研究应尽可能做到:
(a)观察的充分、合理性(observationaladequacy),(b)描写的充分、合理性(descriptiveadequacy),(c)解释的充分、合理性(explanatoryadequacy)。
语法现象、语法规则的“解释性研究”将会从整体上促进现代汉语语法研究,因为不仅一个合理的解释本身需要经过深入研究后才能得到的,而且解释需以充分、合理的观察和充分、合理的描写为基础,所以对语法现象和语法规则的观察、描写会面临着来自对语法规则解释这一方面的挑战。
试以“把”字句为例说明这一点。
“把”字句可能是汉语中人们对它研究得最多的一种句式。
据有人统计,近50年来,国内外有关“把”字句的论著(包括未发表的学位论文在内)不下500项,八十年代以来国内外有关“把”字句的研究也有300项左右。
(参看郑定欧(1998))除了不断加强对“把”字句的观察、描写外,也力图对为什么会构成“把”字句、为什么要使用“把”字句等作出解释――有的(Sun,Chao-fen(孙朝奋)(1995))从探源的角度进行解释,有的(沈阳(1997))则从形式和语义两方面进行解释,也有的(金立鑫(1997))从句法、语义、语境以及个人因素等多方面进行综合解释。
这些解释有助于人们对汉语“把”字句的认识,但并不能说已找到了圆满的答案。
“把”字句式,是不是汉语所特有的,语法学界有不同看法,这我们暂且不论。
(参看郑定欧(1998))如果汉族人在语文表达中用不好“把”字句,外国人学汉语把握不好“把”字句,中文信息处理中解决不好“把”字句的句处理问题,那么不管是人际交际还是人机交际都将受到严重妨害。
而要使汉族人用好“把”字句,使外国人掌握好“把”字句,使中文信息处理中处理好“把”字句,就有赖于我们从句法、语义、语用等多方面对“把”字句作进一步的合理观察,合理描写,合理解释,搞清楚
(1)什么情况下必须用“把”字句,条件是什么;
(2)什么情况下决不能用“把”字句,原因是什么;
(3)什么情况下可用可不用“把”字句;
(4)在可用可不用“把”字句的情况下,用与不用在意义表达上有什么差异;
(5)“把”字句到底跟哪些句式关系最密切。
再如,乔姆斯基在扩展的标准理论(1972-1978)里提出了“移位-WH”(Move-WH)转换规则,在后来的支配和约束理论(GBTheory)里进一步完善为“移位-α”(Move-α)转换规则,从而较好地解释了为什么同一个D-结构(Deepstructure)会形成不同的S-结构(Surfacestructure)。
-α是代表某个范畴,“移位-α”就语法说主要是指谓词V的某个论元(argument)NP的移位。
汉语里存在着大量的名词移位的现象,要用乔姆斯基的“移位-α”(Move-α)转换规则来解释汉语里的名词移位现象,这就要求我们必须对汉语里的种种名词移位现象进行充分的考察、合理的描写,而这无疑会推动汉语移位现象的深入研究。
已有的研究成果表明,汉语里不仅存在着整体名词性成分移位现象,还存在着名词短语部分成分移位现象,例如:
“他剥去了橘子皮他把橘子剥去了皮”。
(参看沈阳(1996,1997))这对乔姆斯基的“移位-α”(Move-α)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 汉语 语法 研究所 面临 挑战