甲骨文单字ID
在甲骨文研究中,有几个数据是被学者和社会大众所普遍关注的,一是甲骨的数量,二是甲骨文字的数量。“这两个问题,牵涉两个基本数字,是所有关心甲骨文的人最易提出的,却也是甲骨文专家最难确切回答的。”[1]第二个问题其实包括三个方面:甲骨文字形的总数量、甲骨文单字的总数量和可释字的数量。甲骨文字形总数量是甲骨文单字乘以使用次数,大概一百五十万字是会有的。甲骨文单字总数量指的是归并了异体字之后的、不重复的字形的数量。可释字其实包括了可以隶定和可以释读(即可确识)两种情况,一般关注的是可识字。
关于甲骨的数量,学者们根据已经著录发表的资料以及各单位收藏情况,有过九万、十万、十三万、十五万片等多种估算。最新的数据是160006片,[2]取其整,就是十六万片。这个数据中所包含的资料,绝大部分是殷墟所出的商代甲骨文,也包括了少部分殷墟之外出土的商代甲骨,以及西周甲骨。由于经过数千年的埋藏,绝大部分甲骨出土时都是残碎的,能够缀合到一起的,按一片(一版)计算,尚未缀合的则按实有的碎片计算。各种估算都是根据第一次的著录和缀合成果计算的。[3]按道理,有了新的缀合成果后,实际数量就发生了变化,但现在的统计数据是没有按新的缀合结果进行重新计算的。另外,还存在数量不小的重复著录,而且,新的材料也在不断发现。所以,甲骨的总数量很难有一个精确的数字,只能是约数。
关于甲骨文单字的数量和可识字数量,于省吾先生在《〈甲骨文字释林〉序》(作于1978年9月)开篇就说:“截至现在为止,已发现的甲骨文字,其不重复者总数约四千五百个左右,其中已被确认的字还不到三分之一……而且,已识之字仍有不少被研契诸家误解其义训、通假者。”[4]这个说法影响很大。后来中原有一家出版社还出版了一本叫《三千未释甲骨文集解》的书。[5]甲骨文单字总数量和可释字数量,可以说是萦绕在几代学者心头挥之不去的一件大事,这是甲骨研究者理应摸清的基本账目。
对文字系统中单字资料的整理,中国自古就有这个传统,汉代的蒙学课本以及《说文解字》都是此类的书。从甲骨文发现、研究的初期,学者们就非常重视甲骨文单字资料的整理编纂。第一部甲骨著录书是出版于1903年的《铁云藏龟》,1920年王襄就出版了第一部甲骨文字字汇——《簠室殷契类纂》,紧接着,1923年商承祚出版了《殷虚文字类编》,1934年孙海波出版了《甲骨文编》。[6]这些字编对于推动相关研究,起了很大的作用。在各门类的古文字资料中,应该说甲骨文字编的编纂间隔最密集,更新速度最快,编纂体例最成熟,字形字料最系统(当今战国文字各种字编也很多,但缺乏整合各类文字资料的综合性字编,而且更新速度较慢)。文字编虽然滞后于学术研究,但它毕竟是对一定阶段甲骨文字考释成果的系统梳理和总结,可以基本反映学界关于甲骨文字考释取得的新进展,也是考察甲骨文单字总数量和可释字数量的便捷依托。
1965年版《甲骨文编》[7]正编收字1723字,见于《说文》的941字;附录2949字,二者总计4672字。该书分别部居悉依《说文》,不见于《说文》而可以按其偏旁隶定者,附于各部之后;不能辨认的字,或其字虽经考释而尚未定论者,依其偏旁所从分类,收入“附录上”;校改时从正编和附录中所抽出来的字以及写定后所补收的新字,列入“附录下”(参见该书“编辑凡例”)。该书“编辑序言”云,正、附所收4672字,“其中有些字还可以归并,[8]目前甲骨刻辞中所见到全部单字的总数,在四五〇〇字左右。其中虽然只能辨九百余字,但比之从前所能辨认的五六百字,已增益了许多。”该书所收单字总量为4672个,正编1723字中见于《说文》的有941个,其他782个可以分析旁并加以隶定,由于其一以《说文》作为识字依据,其他虽有少部分可以知其义或怀疑其为某字异体,如卷三·四之“卌”、卷七·一九之“
徐中舒主编《甲骨文字典》批评《甲骨文编》(包括《续甲骨文编》)“所汇字形重复庞杂,或有摹写失误、识字不当之处”(见徐中舒序)。[12]徐书“在搜集字形方面是统览每一字全部字形基础上精选有代表性的字形,按断代标准分别列于各时期之下”(徐序);各字按《说文》分别部居,可隶定而《说文》所无之字,附于各部之后;凡无法隶定之字,均归入与其字形相近之偏旁部首之后,不再另立附录(见凡例)。我们据该书目录统计,其收字总数为2855字,见于《说文》者1080字,其他隶定字38字(大多是见于《说文》之外的字书的字,如《尔雅》《玉篇》《广韵》《字汇补》等;个别字编者疑为《说文》某字,但未按见于《说文》处理,如八一三页“冗”、一〇三九页之“砅”;或《说文》漏收而见于偏旁者,如九六〇页之“免”、一三一九页之“妥”;还有个别字是根据其在卜辞中的确定用法而释定的,如一四三五页之“
刘钊主编《新甲骨文编(增订本)》也是按《说文》排序,该书凡例说:“部分甲骨文与《说文》的某字可能只是同形异字的关系,为使用方便,仍按见于《说文》处理。”[14]该书对不见于《说文》的字大多按其所从偏旁进行了隶定,[15]可释字较之以往有大幅增加,这对甲骨文字的释读无疑是有推动作用的,也是古文字考释中偏旁分析法在文字编中的有效贯彻。只有那些构形不明、难以隶定的字,方入附录。该书第一版后记(2009)云正编字头约2350字,见于《说文》的约1170字。我们据增订本统计其正编收字,字头2310字,见于《说文》者1237字,附录1224字,正附合计3534字。该书立字也是双重标准。由于甲骨文中的很多表意字,后世多为形声字代替(比如一三一页“拘”、六八一页的“拇”等),这种对应只能是词对应。用《说文》排序,字头字与所属字形不相应的情形比较普遍(如二十八页“芒”[16]、九十三页“迅”等)。该书六五九页“雲”,用“雲”形统率“云”,是让甲骨文屈就《说文》。《说文》重出之字,该书也跟着重出(如五十四页、五一八页“吹”字两见)。甲骨文中以“雚”表“觀”,所以“觀”(五一八页)便是一个屈就《说文》而设的字头,“鄉”(三九七页)亦如此。
由以上可以看出,按《说文》排序的甲骨文字编,我们无法据其统计甲骨文单字的实际数量。也无法统计可识字的数量,因为能与《说文》或其他字书对应(字形对应)的不一定就是可识的。
李宗焜在很多场合说起其博士论文的撰写初衷,就是为了弄清甲骨文的单字数量,他于2012年3月出版了《甲骨文字编》一书,是按自然分类法部列甲骨文字,收单字4378个(隶定字2369个),其中可释者(即可识者)1682个(见于《汉语大字典》者1365字;未见于《汉语大字典》而音义基本可定者317字)。其单字总量多出《新甲骨文编》844字。该书处理字形的方法更符合甲骨文实际,科学性更强,比如“有些隶定相同的字,因代表不同的词,所以编为不同的字号”。但该书同时仍然存在以词统字的情形,比如三五三〇号“登”收三类异体,一、二两类都是笔画层面有细微差异的异写字,而第三类增加了“示”旁。该书“牢”、“
通过以上分析,我们发现,现在学界在统计甲骨文单字数量时,观念上和方法上都有一定的缺陷。我们认为在做单字统计时,要严格贯彻形体原则,《汉语大字典》号称收字五万六千多,这是按字形说的,而非按记词职能认同归并后的结果。所以,统计甲骨文单字数量时,第一,要把字与词分开,严格贯彻以形体特征统计单字总量的原则。异写字按一字统计,异构字则应分别计算(如从彳的字,或从行,用法不变,但字形结构不同,当分别统计)。当然,异写、异构等字际关系的判定有赖于文字考释的发展以及对文字系统的准确把握;第二,不能把数百年的甲骨文资料置于同一平面,要观察历时角度的语词分化、文字分化与字量变化的关系。对于当时明确有异体分工的情形,也就是说形体差异有区别记词功能的作用,应分别计入字量,以字统词;第三,从文字完整记录语言的角度,说甲骨文系统是成熟的文字系统,没有错。但是把甲骨文跟小篆之后的文字系统作比,甲骨文形义系统尚缺乏概括性[17]和规范性[18];而且甲骨作为占卜材料,虽然内容丰富,但毕竟有局限;再者,当时文字的使用限于一定的范围和社会阶层,并非普罗大众的日常之物,使用文字的人掌握的字量不能拿今天的情形去简单想象。综合考虑,甲骨文所使用的单字数量应该要多于后世规范化了的文字系统。另外,很多考释者考释甲骨文时,总是试图找出后代跟它对应的词,这也没错,但可以肯定的是,甲骨文中的很多词并没有流传下来,有的可能被其他词替换了,所以,在跟甲骨文字形作词的对应时,存在很大的不确定性,应该要特别慎重。现在的单字统计方法,会掩盖甲骨文形义系统的很多真相,也会人为制造出不少假象。
至于甲骨文可释字的整理,王蕴智和黄天树的成果具有代表性。王先生很早就从事这方面的研究,1999年发表了《商代文字可释字形的初步整理》一文,表列1238字。[19]据有关消息,在清华大学举行的“纪念甲骨文发现一百二十周年古典学论坛暨《甲骨文摹本大系》编纂座谈会”,王先生又提交了《商代文字可释字形的基本整理》的论文,可谓数十年都在倾心关注这一问题。黄天树曾对已识的1231个商代甲骨文逐字进行了结构分析。[20]这些所谓的可释字指的都是形音义或音义可识的字,而非可隶定字。张德劭曾根据《甲骨文字诂林》所收考释意见,进行了未释字和已释字的字数统计:《诂林》收字3431字,未释字计有1405字左右(可隶定者455字),已释字计2026字左右(只要有一家考释意见就算已释字),已释字中考释意见可信或比较可信的约有1126字(包括了一百个左右的先祖称谓合文),而完全没有疑问的只有711字。[21]怎么才算得到确释呢?陈梦家在《殷虚卜辞综述》第二章“文字”中曾有过很好的论述,可以参看。由于这个问题已非本文主题所在,不再赘述。
* 本文为国家社科基金“冷门绝学和国别史等研究专项”项目“唐兰文字学理论体系研究”(19V JX111)的阶段性成果。
本文原载《中国书法》 2019年第23期(总367期)
注释:
[1] 陈炜湛:《关于殷虚甲骨文的两个基本数字》,收入氏著《三鉴斋甲骨文论集》,上海:上海古籍出版社,2003年,第294-295页。
[2] 汉字文明传承传播与教育研究中心、郑州大学汉字文明研究中心编:《甲骨春秋——纪念甲骨文发现一百二十周年》,北京:商务印书馆,2019年,第64页。此数据为宋镇豪、孙亚冰二先生统计。2019年10月在安阳召开了“纪念甲骨文发现一百二十周年国际学术研讨会”,其间安阳电视台作了一期甲骨文访谈节目,受访专家为黄德宽、吴振武、李宗焜先生,上海博物馆葛亮先生主持,节目中,葛亮透露他也对甲骨数量作了统计,有16.1万片左右。
[3] 比如《甲骨文合集》著录了41956片甲骨,因为编辑《合集》时,作了大量的缀合工作,该数据就是按缀合后的片数计算的。
[4] 于省吾:《甲骨文字释林》,北京:中华书局,1979年。
[5] 潘岳:《三千未释甲骨文集解》,郑州:中州古籍出版社,1999年。据称,作者用了近四十年功夫,将此三千未释甲骨文一一破解。
[6] 1965年出版、多次重印、流行颇广、署名中国科学院考古研究所编纂的《甲骨文编》实为孙书的改订本。
[7] 中国社会科学院考古研究所编:《甲骨文编》,北京:中华书局,1965年9月第一版,2004年1月第六次印刷。
[8] 当然有些字形需要分开,如七十六页的“御”字、八十五页“齿”字等。
[9] 有一些见于《说文》的偏旁,如一二三页之“
[10] 陈梦家:《殷虚卜辞综述》,北京:中华书局,1988年,第59页。
[11] 金祥恒:《续甲骨文编》,台北:艺文印书馆,1993年。
[12] 徐中舒:《甲骨文字典》,成都:四川辞书出版社,1989年。
[13] 《甲骨文编》合在一起的字,如卷二·四“牢”下所收还有从羊、从马二形;《字典》八十二页“牢”字所收字形同,但从马之形又见于马部,单设字头,且指出其当为牢字异体(一〇七二页)。《字典》释从羊或从牛之字义为“用于祭祀之牛羊”,而释从马之字义为“养马牢圈,即后世之廐”。也就是说,这三个字构意相同,但卜辞中用法有别,这可能是《字典》把从马之形另立字头的原因所在(刘钊主编《新甲骨文编》增订本五四四页直接释为“廐”)。
[14] 刘钊主编:《新甲骨文编(增订本)》,福州:福建人民出版社,2014年。
[15] 这是继承《甲骨文编》的做法。《甲骨文字典》隶定字少,虽然解说中进行结构分析,但字头大多是以原形摹录。
[16] “芒”,《说文》云“艸耑”,其所属字形是指“刃末”,其本字为“铓”,《集韵》云“刃端”。
[17] 如单义构件多、专门为某个词造的专字多。
[18] 古文字形义系统有很大的开放性、包容性,新的写法、构形不断进入文字系统,文字的书写方向可以为了某种需要进行变换,等等。
[19] 王蕴智:《字学论集》,郑州:河南美术出版社,2004年,第173-190页。
[20] 黄天树:《殷墟甲骨文形声字所占比重的再统计》,李宗焜主编:《出土材料与新视野·第四届国际汉学会议论文集》,“中央研究院”,2013年。
[21] 张德劭:《甲骨文考释简论》,广州:世界图书出版广东有限公司,2012年,第5-6页。