1基本思路反思多年来汉字编码技术所走过的弯路,主要表现在:要么无奈地把汉字的偏旁部首拆解 为过多地生造出来的“汉字基本构件”,要么无端地把汉字拼音的韵母和声母还原为拼音字母,然 后再简单地硬塞进26个英文字母的框架内。凡此种种均囿于英文输入方式的思维定势,在很大程 度上漠视或违背了汉字在音、形、意方面所固有的一些重要特点。其结果当然也就只能是既不自然 便捷,又无法统一,不但徒然增加了人们的额外负担,更有甚者,还出现了有的人学会了汉字输入 ,却忘了怎么写字的怪现象。鉴于此,我们在开发统一数字码的时候确立了以下基本思路:1)应 当突破26个英文字母的框框。现有计算机键盘配有47个可供编码的键位,如将它们全部开发出 来,则4个码以内的编码数将从现有编码方法的数十万个猛增到300多万个。仅就2个码的编码 数而言,就从现有的600多个增加到2000多个,使得2码重码字从平均15个减少为不到5 个。显而易见,如果不要盲打的话,输入一个汉字最多只要击键3下就可以了。这既可大大提高输 入速度,又可有效减轻手、眼、脑力负担。有的一些重要特点。比如汉字的形体是以偏旁部首为基 本构成单位的,多数偏旁部首均有其特定的或表音或表意的功能,如果能够始终坚持以偏旁部首为 编码的基本单位,就可以使汉字输入比较符合人们认知和识记汉字的习惯,从而不必去强记许多人 为的规定。又比如汉字一字一音非常规范,全部是由1个(或0个)声母和1个韵母拼成的。如果 直接用声母和韵母进行编码,则每个汉字的全拼编码均可缩短为2码。如:zhuang为zh和 uang,只有2码,这比起把它还原为字母而长达6码来自然要方便简捷得多。3)应当使编码 形式数字化。不言而喻,只有数字化的形式,才能达成最广泛的通用性。计算机键盘上的键位,共 排成4行,只要合理地定义每一行的十位数和每一列的个位数,就很容易使每个键盘键位码数字化 。而汉字的偏旁部首,都是由笔划构成的,只要合理地定义10个左右基本笔划的数码,就很容易 根据每个偏旁部首的头几笔笔划和基本部首,使之编码数字化。同样,只要合理地定义10个左右 单韵母的数码,就很容易使得每个复韵母编码数字化。从而就可望实现汉字编码形式的完全数字化 ,开发出一种能灵活反映汉字音、形、意特点的“全息码”,并实现计算机、手机等汉字输入的“ 一2汉字统一数字码的主要特点1)启用计算机键盘上的47个键位码进行编码。开发出了比现有 各种方法多10倍左右的编码数容量,可比较准确地反映汉字的许多固有特性,使编码更为合理和 直观。并且可有效地解决重码问题,实现计算机汉字的真正盲打输入,避免眼睛必须一刻不停地盯 着屏幕所带来的不适和损伤。2)坚持以汉字偏旁部首为编码单位。把240多个汉字部首以及其 他一些常见的汉字偏旁,按照它们的字形结构或起笔特征进行归类处理,合理编码。简单明了、条 理清晰、形象直观,使人一见即可产生深刻牢固的印象,不用背诵任何口诀。3)直接把韵母和声 母,而不是把字母作为编码单位。利用汉字拼音声母在前、韵母在后的规则,将汉语拼音的35个 韵母、21个声母和4个声标,共计60个需要编码的单位,分别都只用计算机键盘上的1个键位 码来表示。不但使每个汉字的全拼编码一律缩短为2码,而且更符合人们的汉语拼音习惯。4)是 一种充分利用汉字音、形、意特征的汉字“全息码”。使汉字输入更为灵活简便,速度更快。如: 不管是遇到不会念的字,还是一时忘了怎么写或弄不清部首的字,都能够轻松自如地进行输入。又 如:无论是想要输入汉语小写数字,还是汉语大写数字,每字平均只要击键一下即可完成。5)将 汉字部首码数字化,将汉字拼音码数字化,将既成的计算机键盘键位码数字化,并巧妙地将它们紧 密地联系起来,形成了具有很强通用性的汉字统一数字码。既可输入简体字,也可输入繁体字,既 方便于海峡两岸同胞的灵活应用,也有助于其他国家人民的学习掌握。而且能够相通无障碍地应用 于计算机、手机汉字输入以及通过快译通查外文单词等诸多方面。此外,应用汉字统一数字码必然 会开发出一种新式汉语字典,使人们日常查字典的过程得以大大简化。总之,汉字统一数字码比其 他汉字输入码更符合人们读写汉字的习惯,编码法则简单明了、易记难忘,可以大大提高输入速度 。3编码规则3.1编码的识记表1为汉字统一数字码基本码表。表达的是计算机键盘第一行键位 的基本键位码,表中无论是声母码、韵母码,还是部首码,均与其所对应的数字码或音似、或形似 、或有着确切的表意或顺序关系,几分钟时间即可掌握。在此基础上,其他的韵母码、部首码,都 完全由以上基本码组合而成。即:计算机键盘第2行键位的键位码依次为21,22,…,20( 后2位为14,15;另外27,28,29与17,18,19重叠);第3行键位的键位码依 次为51,52,…,50(后1位为16);第4行键位的键位码依次为81,82,…,80 。至于其他的声母码,则仍沿用计算机键盘上的相关英文字母码,详见表2。表1sxlqgjc zhchsh101234567890111213yoyieanangwuenengao ngoiaoieian十乂犭一下口一丨一下丨二ノ乙二后丨三-丿ㄑㄋ女巛廴乃了子亖四罒皿 黑目鼎貝見且具五5ˊヽ乀亅ㄅ〦宀日曰中史央六└乚し∨七┐フ乛比匕八丷人入冖冂コユヨ囗 凹凸亞九〇口雨(零之头)士土‖├十一型丆十二型厂巠阝13型14深圳职业技术学院学报 第4卷3.2输入法3.2.1汉语数字输入法(每字平均击键1下)1)汉语小写数字:键位码 +M键即可完成输入。例如:“七”为7+M键;“八十六”为N键(“86”键)+M键。2) 汉语大写数字:键位码+。键即可完成输入。例如:“柒”为7+。键。“伍拾捌”为K键(“5 8”键)+。键3.2.2近200个常用字简码输入法(每字只要击键2下)1)常用字(一) :键位码+空格键即可完成输入。2)常用字(二):键位码+R键即可完成输入。3)常用字( 三):键位码+F键即可完成输入。4)常用字(四):键位码+V键即可完成输入。3.2.3 一般汉字基本输入法以盲打方式输入,每字4码。(在非完全盲打情况下,大多数的字只需2,3 码便可完成输入)。1)依次输入该字各部分的部首码,最多至4码为止(凡无明显部首码的,尽 可能以前2笔或2笔以上的笔划码代替之,但不应破坏接下来的部首码)。例如:“露”字为:0 (零之头)+0(足)+27(夂)+0(口);“鹰”字为:53(广)+2(1亻)+2(1 隹)+55(鸟);“膺”字为:53(广)+21(亻)+21(隹)+82(冃);“稽”字 为:28(禾)+13(尤)+7(匕)+5(日);“我”字为:2(ノ)+15(扌)+6( ∨)+25(ノ‵)。2)只有3码的字,可用该字独立部首的拼音第一码为终结码。(如3个部 首均为独立部首,左中右结构的以左部首的拼音第一码为终结码,上中下结构的以下部首的拼音第 一码为终结码)独体字则以该字的拼音第一码为终结码。如不熟悉拼音码,亦可不用拼音码为终结 码。属于左右或左中右结构的横向字,以空格键为终结码,属于上下或上中下结构的纵向字,以“ V”键为终结码,独体字则以“。”键为终结码。例如:“辩”字为:58(辛)+52(讠)+ 58(辛)+X(辛)<或空格键>;“辨”字为:58(辛)+53(‵ノ)+58(辛)+X (辛)<或空格键>;“茶”字为:20(艹)+8(人)+18(朩)+M(朩)<或“V”键 >;“嵇”字为:28(禾)+13(尤)+16(山)+H(禾)<或空格键>;“部”字为: 58(立)+0(口)+13(阝)+15(右阝)<或空格键>;“驽”字为:3(女)+7( 又)+7(马)+M(马)<或“V”键>;“弩”字为:3(女)+7(又)+85(弓)+G (弓)<或“V”键>;“严”字为:1(一)+11(业)+2(ノ)+13(ian严)<或 “。”键>。3)只有2码的字,属于左右结构的横向字,以该字左、右部首名称的拼音第一码为 终结码(也可以空格键为终结码),属于上下结构的纵向字则以该字下、上部首名称的拼音第一码 为终结码(也可以“V”键为终结码),独体字亦以该字的拼音前两码为终结码(也可以“。”键 为终结码)。凡在以拼音前两码为终结码时,如果遇到零声母字而又弄不清其声标时,均可用“, ”键代替弄不清的声标。例如:“叭”字为:0(口)+8(八)+{K+B}<或空格键>;“ 只”字为:0(口)+8(八)+{11(zh)+1(i)}<或“V”键>;“丙”字为:1 8(一冂)+8(人)+{B+17(ing)}<或“。”键>;“两”字为:18(一冂)+ 88(从)+{6(L)+14(iang)}<或“。”键>;“太”字为:13(大)+5( 丶)+{T+81(ai)}<或“。”键>;“犬”字为:13(大)+5(丶)+{7(q) +23(üan)<或“。”键>;“形”字为:22(开)+22(彡)+{K+S(三撇)} <或空格键>;“林”字为:18(木)+18(木)+{M+M}<或空格键>;“来”字为: 18(一丶ˊ)+18(木)+{6(L)+81(ai)}<或“。”键>;第2期魏贻通,等 :汉字统一数字码的开发15(下转32页)“刘”字为:50(文)+15(刂)+{56(u en)+L(立刀)}<或空格键>;“妻”字为:18(一彐)+3(女)+{7(q)+1( i)}<或“。”键>;“正”字为:1(一)+11(止)+{11(zh)+7(eng)} <或“。”键>;“亚”字为:1(一)+11(业)+{18(ia)+“,”}<或“。”键>。3.2.4部首码字输入法由部首码单独构成的一码字:除了可以按一般汉字基本输入法输入外,也可以在连续输入该字部首码2次后,再输入终结码。例如:“王”字为:2(干)+1(一)+{54(wang)+82(ˊ)}<或“。”键>,或2+2+{54(wang)+82
More summaries about the 汉字统一数字码的开发