对方块汉字的新认识.docx
- 文档编号:4905432
- 上传时间:2022-12-11
- 格式:DOCX
- 页数:13
- 大小:51.13KB
对方块汉字的新认识.docx
《对方块汉字的新认识.docx》由会员分享,可在线阅读,更多相关《对方块汉字的新认识.docx(13页珍藏版)》请在冰豆网上搜索。
对方块汉字的新认识
第二章对方块汉字的新认识
第一节汉字的三个层次
第二节汉字的五种笔划
第三节汉字的三种字型
第四节字根的选取
第五节汉字的结构分析
第六节末笔字型交叉识别
第七节单体结构拆分原则—汉字的拆分
方块汉字给人的第一印象就是笔划形态多变,字型错综复杂,数量数以万计。
在中华民族漫长的历史变革中,汉字的确切数量谁也无从统计。
国家标准《信息交换用汉字编码字符集(基本集)》(GB2312----80)中,有6763个汉字。
(1)国家标准GB2312(80)字集6763个汉字
----
(2)台湾BIG5字集--------------13053个汉字
----(3)简体+繁体-----------------15432个汉字
----(4)大字符集GBK字集-----------21003个汉字
首先对汉字的结构规律进行深入地研究和分析。
第一节汉字的三个层次
笔划、字根、单字
汉字起源于象形文字,直到后来,汉字楷化之后,才形成了“笔划”。
所谓“笔划”就是在书写汉字时,不间断地一次连续写成的一个线条。
“笔划”也有人写作“笔画”。
自从接触汉字以来,就意识到,一个完整的汉字,既不是一系列不同的笔划的线性排列,也不是一组组各种笔划的任意堆积。
而是由若干笔划复合连接交叉所形成的相对不变的结构,绝大多数都是我们部首查字法的字典中部首的图形,我们把这种图形称作“字根”。
一般地说,字根是有形有义的,在多数情况下也叫做构字基本单位(部件、字元、码元)。
这些基本单位经过拼形组合,就产生出众多的汉字。
可见,汉字可以划分为三个层次:
即笔划、字根、单字。
也就是说,由若干笔划复合连接交叉形成相对不变的结构组成字根;再将字根按一定的位置关系拼合起来就构成了汉字。
因此,我们说字根是构成汉字的最重要的单位,字根是汉字的灵魂。
“五笔字型”方案的基本出发点之一是遵从人们的习惯书写顺序,以字根为基本单位来组字编码、拼形输入汉字。
#……#……#……#……#……#……#……#……#……#……#
第二节汉字的五种笔划
横、竖、撇、捺、折
汉字笔划是不间断地一次连续写成的一个线条。
对成千上万的汉字及其字根加以分析,只考虑笔划的运笔方向,不计其轻重长短,将汉字的笔划划归为横、竖、撇、捺、折五种。
为便于记忆和应用,根据其使用频率的高低,依次用1、2、3、4、5作为代号,见下表。
代号笔划名称笔划走向笔划及其变形
1横左右一
2竖上下丨
3撇右上左下丿
4捺左上右下丶
5折带转折乙
从表中可以看出,除基本笔划外,还对汉字的具体形态结构中的笔势变形进行了归类,其理由是:
在汉字的具体形态结构中,其基本笔划横、竖、撇、捺、折常因笔势和结构上的匀称关系而产生某些变形,或者一带笔而变成钩(左钩),如“丨”变为“
”等,或走向多了一些转折,变成了“
”、“
”等。
另外,一些基本笔划的大小、长短有时也有不一致(如上表中笔划及其变形的第二列)。
但是这些都是次要的方面,其共性在于运笔方向及一笔连续写成都仍然具有基本笔划的形态特征。
五种笔划在组成汉字时,笔划间的关系可分为以下四种:
1、单:
即五笔划自身;
2、散:
组成字根的笔划之间有一定距离,如:
“三、八、氵”等;
3、连:
组成字根的笔划之间是相连的,如:
“厂、人、尸、弓”等;
4、交:
组成字根之间的笔划是相互交叉的,如:
“十、力、又、车”等。
当然还会有混合的情况,即一个汉字的各笔划间,有连又有交或散,例如:
“雨”、“禾”等。
掌握上述笔划间的关系,对非基本字根的拆分和“识别码”的选取是非常有用的。
练习
1、汉字的笔划分为哪几类?
各种笔划是如何归并的?
2、把下列汉字按书写顺序拆成单笔划,并分出哪些是散型字根。
戋士犬丁早川甲竹手月八儿文文辛米小了刀巴幺门也心一二十寸石西止卜力贝几由夕广弓疒立彡氵
第三节汉字的三种字型
研究汉字的字型,是研究由字根构成汉字时,字根之间在汉字中所处的位置关系。
成千上万的方块汉字,可以分为三种类型:
左右型、上下型、杂合型。
按照各种类型拥有汉字的多少从1到3给以代号,如下表所示。
字型
代号字型字例
1左右江河北刘谁种
2上下多学花草青看
3杂合因凶重乘天边且
表中,杂合型又叫独体字,左右、上下两种类型又称合体字。
两部分合在一起的汉字叫双合字,三部分合在一起的汉字叫三合字。
一般合体字只分到三合字一级,其原因是“五笔字型”汉字编码方案取四码,由于二、三合体字的字根较少,不足四码(即信息量不足),2~6个字根排列在一个字键上,离散不开,容易造成重码,所以才有必要补加一个字型信息。
而对于由四个部分以上组成或者可以拆分成四个部分的汉字,其信息量已足够,就不必再考虑字型信息了。
三种字型的划分是基于对汉字整体轮廓的认识,指的是整个汉字中字根之间排列的相互位置关系。
搞清这一点,对于确定多字根的汉字的类型是十分重要的,下面分别予以说明。
一型:
左右型汉字
在左右型汉字中,包括两种情况:
1、在双合字中,两个部分分列左右,整个汉字中有着明显的界限,字根间有一定的距离,如:
“杜、明、现、但、咽、枫”等。
“咽”和“枫”的右边也都是各由两个字根构成,显然这两个字根之间是杂合型关系,但整个汉字属于左右字型。
2、三合字中,整个字的三个部分从左到右排列;或者单独占据一边的部分与另外两部分呈左右排列,如:
“侧、别、说”等,都属于左右型。
二型:
上下型汉字
上下型汉字也包括两种情况:
1、双合字中,两个部分分列上下,在整个汉字中有着明显的界限,各部分间有一定的距离,如:
“军、节、晋、愚”等。
2、三合字中,三个部分分上下排列,或者占一层的部分与另外两个部分分作上下排列;如:
“意、想、花”等。
三型:
杂合(单体、内外、包围型)汉字
三型汉字是指组成整字的各个部分之间没有简单明确的左右或上下关系者。
如:
“困、周、斗、飞、秉、函、本、丹、戌、边”等。
汉字的图形特征,可以用来作为识别汉字的一个重要依据。
如说:
“口”、“巴”左右排列为“吧”,上下排列为“邑”等。
由此,我们还可以把三种字型叫做字根的三种排列方式。
在向计算机输入不足四码的汉字时,除了键入组成汉字的字根之外,有时还必须键入字根的排列方式,即补充一个字型信息。
练习
1、汉字分哪几种字型?
2、为以下汉字标出字型代号:
扒艾笆备柏泵卞厕叉场床笛讹封挂荤霍剂连疗码美闷票浅肋好声宋圆钏君尔弗竿冈匡缶
第四节字根的选取
我们说过,由若干笔划交叉连接而成的相对不变的结构,就叫字根。
但是字根并不像汉字那样,有公认的标准和一定的数量。
哪些结构算字根,哪些结构不算字根,历来没有严格的界限。
不同的研究者,不同的应用目的,其筛选的标准和选定的数量差异很大。
例如,我们可以把“里”选作为一个字根,但是,也可以把它拆分为:
“曰”和“土”、“甲”和“二”等两个字根,也有人把它拆成“田”和“土”两个字根。
在汉字拼形编码的研究中,所选字根多数是一些传统的汉字部首。
但由于某种需要,有时也选用一些不是部首的笔划结构作为字根,甚至于硬造出一些“字根”来。
相反,有些虽然是传统部首,但鉴于它们组字很少或者其本身便于拆分成几个部分,在制定编码方案时也未必选取,例如:
在“五笔字型”方案中,“足、鱼、礻、衤、羊、皮、麻、户”都不选作基本字根。
在“五笔字型”方案中,我们把那些组字能力很强(组字频度高),而且在日常汉语文字中出现次数很多(实用频度高)的字根,称作基本字根。
而把所有落选的非基本字根一律按“单体结构拆分原则”,拆分成彼此交连套迭的几个基本字根。
这样,我们就可以说:
一切汉字都是由“基本字根”组成的了。
这里,把优选出的125种基本字根,按照其起笔代号,分为五个大区,再考虑键位设计的需要,每区又分为五个位,命名区号和位号(十位数位为区号,个位数位为位号),以11~55共二十五个代码表示,如五笔字型键位图所示。
这样就建立起了“五笔字型”汉字编码方案的字根总表,今后凡是提到字根,一律指的是这125种基本字根。
也就是说,只有这125种基本字根才有资格参加编码,其它任何形态的笔划结构,都要全部理解为是由这125种基本字根组成的。
因此,这125种基本字根既是组字的依据,又是拆字的依据,是对任何汉字及词汇编码的“基本构件”。
这125种字根中又可分为键名字、笔划和基本字根三种,它们都统称为基本字根。
练习
1、五笔字型中是如何优选字根的?
2、五笔字型方案的字根总表是如何建立的?
3、五笔字型方案中,基本字根的含义是什么?
它们是如何分区归位的?
4、背诵25个键名汉字,并注意它们与英文字母的对应关系。
第五节汉字的结构分析
一切汉字都由基本字根拼合而成的,包括许多没有资格入选为基本字根的单体结构,这些单体结构并不一定都是汉字,如:
“
、
”,也全部是由基本字根与基本字根或基本字根与单笔划,按照一定关系组成的。
基本字根在组成汉字时,按照它们之间的结构关系也可以分为四种类型。
1、单:
基本字根本身就单独成为一个汉字。
如:
“八、用、斤、广、车、马、雨”等称为成字字根,它们的取码有专门的规定,不需要判别字型。
2、散:
指构成汉字的基本字根之间的相互位置关系,分别归属于左右、上下之一;换句话说,只有散结构才有左右、上下可言,这为我们区分字型带来了极大的方便。
3、连:
指一个基本字根连一个单笔划。
如:
“丿”下连“
”成为“生”,“丿”下连“十”成为“千”,“
”下连“丶”成为“久”等。
其中单笔可连前也可连后。
值得提醒的是:
这种情况下的单笔与字根之间,不能当作散的关系,其字型代号仍为“3”型。
连的另一种情况是“带点结构”。
例如:
“勺、术、太、主”等字中,点的远、近、连或不连,为了使问题简化,我们规定,一个基本字根之前或之后的孤立点,一律视作与基本字根相连。
则带点结构其字型代号也归于“3”型。
4、交:
是指几个基本字根交叉套迭之后构成的汉字。
如:
“农”是由“冖”和“
”,“韦”是由“二、
、丨”,“夷”是由“一、弓、人”交叉构成的等等。
字根组字中,还有一种情况就是混合型,如“丙”字,包括了五种基本笔划,可以看出:
相交结构都属于“3”型汉字。
这样,以上可概括为五笔字型的“543”特征,即5种笔划、4种关系(笔划间的4种关系和字根组字时的4种关系)、3种字型。
练习
1、按照组成汉字的字根之间的位置关系,汉字分为哪几种类型?
它们各自的字型代号是什么?
2、请将下列汉字按单、散、连、交归类,并写出各自的字型代号。
汗早夯户幻勾固剂忌笺见市井库君卡刊里气泉冉杀申好农立目刃丘产玉
下面应讲字根键位图(第三章),学完字根键位图后再回来学习下面的末笔字型交叉识别码。
#……#……#……#……#……#……#……#……#……#……#
第六节末笔字型交叉识别
在前面讲述笔划代码和字型代码时,都分别提及,为了离散重码,有些汉字在键入其字根后,还要键入它的末笔划代码;有的汉字在键入字根之后,还有必要键入它的字型代码。
五笔字型方案中,把这两种代码(代号)合并成一组,以末笔代号为区号,字型代号为位号,成为一个“末笔字型交叉识别码”。
不管一个字需要的是末笔识别还是字型识别,都将“末笔字型交叉识别码”一起加给它,让二者各起各的作用。
我们知道,在“五笔字型”中,笔划分五种,字型分三种,那么,末笔笔划和字型配合交叉的可能性就有5×3=15种。
这样,重码率就可大大降低。
“末笔字型交叉识别码”如下表所示。
笔划字型
左右型1
上下型2
杂合型3
横1
11G
12F
13D
竖2
21H
22J
23K
撇3
31T
32R
33E
捺4
41Y
42U
43I
折5
51N
52B
53V
值得注意的是:
追加“末笔字型交叉识别码”,绝大多数是针对二合字和三合字而言的(其中常用汉字极多)。
追加“末笔字型交叉识别码”后,码长从2位加到3位或从3位加到4位,这相当于把它的原码长扩大了15倍,“房间”多了,就能“各就各位”,冲突(重码)的机会就少了。
这正是五笔字型方案键位少、有很好的规律性而重码也很少的根本原因所在,请参考下面的例子。
汉:
435441(ICY)即Y为第4区第1位
末笔代号4(区)、字型代号1(位)
字:
455212(PBF)
末笔代号1(区)、字型代号2(位)
华:
34551222(WXFJ)
末笔代号2(区)、字型代号2(位)
同:
25112313(MGKD)
末笔代号1(区)、字型代号3(位)
本:
141113(SGD)
末笔代号1(区)、字型代号3(位)
东:
154343(AII)乐
末笔代号4(区)、字型代号3(位)
特殊规定:
五笔字型用于识别的末笔有如下特殊规定。
1、对于“刀、九、力、匕”,为了保持一致和照顾直观,规定,凡是这四种字根当作末字根而又需识别时,一律用它们向右下角伸得最长最远的笔划“折”来识别。
如:
“仇”:
WVN,N-51
“花”:
AWXB,B-52等。
但是,“刀”本身作为汉字时,其末笔却是“丿”。
2、所有包围型汉字中的末笔,规定取被包围的那一部分结构的末笔。
如:
“国”末笔应取“丶”,
“远”末笔应取“乙”,
“边”末笔应取“乙”。
3、“我、戋、成”等字的这种最末是一点和一撇结尾的汉字,其末笔规定均为“丿”。
练习
1、为什么要使用末笔字型交叉识别码?
2、末笔字型交叉识别码是怎样编码的?
3、说出末笔字型交叉识别码的使用场合及原因。
4、给下列汉字标注末笔字型交叉识别码。
待单旦等钧冬杜弗赶汇击君兰枚闷农市勺讨旺昔乡羊鱼庄坠耷忏迁耒缶隽雯奋仅灭齐泉冉仁声青私
需用“识别码”的常用汉字有400多个,下面列出,供参考。
艾凹扒叭笆把坝柏败拌钡备泵卞铂仑草厕叉盆场倡扯尘驰尺斥愁仇臭触床闯辞囱歹待丹单旦悼笛刁翟钓冬抖斗杜肚妒兑讹尔耳伐令犯坊妨肪仿飞吠奋封伏弗付父讣改甘杆竿赶秆冈杠皋告汞钩勾苟辜咕沽蛊故固刮挂圭闺旱汗夯亨弘户幻皇回卉汇荤昏霍击讥伎剂忌佳贾钾笺肩奸茧贱见秸却戒巾仅京惊井竞炯洒巨句卷抉诀钧君卡揩刊看扛抗元孔哭苦库匡框矿旷亏奎坤垃兰雷泪厘里礼栗利粒隶连凉晾疗吝漏芦庐虏掠仓玛码蚂吗买麦忙冒枚眉美闷孟苗灭闽牡亩尿捏聂涅牛农弄奴疟呕拍判刨匹票迫粕扑仆奇齐乞企气泣讫扦仟浅羌巧茄怯芹青琼丘囚蛆去泉冉壬仁刃戎茸冗汝腮杀晒汕扇尚勺舌申声升圣什矢屎市谁私宋诵酥粟岁她坍叹讨套汀廷童头秃徒吐推驮洼九万亡枉旺忘妄唯未位蚊纹紊问沃芜吾毋捂午伍勿悟昔硒矽汐虾匣闲香乡翔享泄屑芯锌忻刑杏兄汹朽玄穴血训丫岩阎厌唁秧佯羊仰舀耶页曳沂艺邑异翌音尹应拥佣痈蛹尤铀油酉幼余鱼予吁誉驭元圆钥云孕宰皂责扎札轧闸债盏栈章丈仗瘴正汁仔自走足阻植值址置痔钟仲诌肘住爪庄壮状椎坠谆卓啄孜
第七节单体结构拆分原则
汉字结构分析中,讲了由基本字根通过连或交的关系形成“单体结构”的过程,这是一个正过程。
现在要讲怎样把任意一个单体结构拆分成为几个基本字根,即组字的逆过程----拆字。
一、拆分时注意以下两种结构:
1、连笔结构:
拆成单笔与基本字根。
如:
“自”拆成“丿”与“目”,“天”拆成“一”与“大”,“
”拆成“
”与“耳”等。
2、交叉结构或连交混合结构:
按书写顺序拆分成几个已知的最大字根,以增加一笔不能构成已知字根来决定笔划的分组。
如“朱”只能拆成“
小”;而不能拆成“牛八”,因为次一笔“丨”连到“
”上构成的“牛”已不再是基本字根了;也不能拆成“
丨小”,这样就把“朱”中的笔划“丨”给割断了,且非最大字根。
说明:
属于连笔结构时,就不能按第2条进行拆分,因为这样往往失去直观性。
如:
“生”不能拆成“
土”,也不能拆成“
丨一”,因这些都极不直观,只能拆成“
”。
二、在具体拆分过程中,需掌握以下四个要点:
1、能散不连:
如果一个单体结构可以视为几个基本字根的散的关系,就不要视为连的关系。
这样,常常有较好的直观性。
如:
“午”:
十(都不是单笔划,应视作上下关系),
“占”:
卜口(都不是单笔划,应视作上下关系),
“非”:
三
三(都不是单笔划,应视作左右关系),
“严”:
一
厂(后两部分不是单笔划,应视作上下关系)。
实际上,连只存在于单笔与基本字根之间,此外一般不存在连的关系。
2、兼顾直观:
拆字的目的是为给汉字编码(输入的字根),从键盘上组字(键入字根)。
如果拆的字根有较好的直观性,就便于联想记忆,给输入带来方便。
为照顾直观性,“羊”拆成“
”就比拆成“
二丨”直观得多。
再如:
“自”:
丿目
“生”:
丿
“舟”:
丿
3、能连不交:
指的是一个单体结构能按连的关系拆分的,就不要按交的关系拆分。
“于”可按连的关系拆分成“一十”,就不要按“二丨”相交的关系拆分。
再如:
“天”:
一大(不能拆成“二人”,否则相交),
“
”:
(不能拆成“
一丨”,否则相交),不同于“牛”。
“丑”:
乙土(不能拆成“刀二”,否则相交)。
4、取大优先:
指的是在各种可能的拆法中,保证按书写顺序每次都拆出尽可能大的字根,也叫“能大不小”。
如:
“尺”拆成“尸丶”而不拆成“
人”。
再如:
“夷”:
一弓人
“平”:
一
丨
“无”:
二儿
“重”:
丿一曰土
不难看出“取大优先”的含义,从中可以引伸出一层意思,就是:
在可能的几种拆分方法中,以拆出的字根数量少的那种拆法优先。
例如“缶”可拆成“
十
”或“
一山”,但这两种拆法都没有拆成“
山”的字根数目少,因此,后一种拆法是对的。
总之,拆分应当兼顾上述四个方面的要求,一般说来,首先应当保证每次拆出最大的基本字根,在拆出字根数目相等的条件下,“散”比“连”优先,“连”比“交”优先。
对于常见非基本字根(……)的拆法汇总在下表中,以使读者能尽快掌握拆分方法。
练习
1、单体结构拆分的原则是什么?
举例说明之。
2、拆分以下低频结构,并说明整字属于什么类型?
申呆电重千于牛矢未太尤龙万天夫元书片专义长乐东冈飞左车
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对方 汉字 认识