登陆注册
42732600000004

第4章 古籍索引的电子化(1)

从古籍的索引对象来看,古籍索引主要包括两类,即以古籍原著(包括古籍书目原著)为索引对象的索引和以当代人研究古籍的成果为索引对象的索引。本章仅就以古籍原著为索引对象的索引为论述对象。长期以来,古籍索引工作都是靠手工完成,往往一部古籍索引的编制要耗费个人毕生的精力。随着计算机技术的快速发展,索引编制开始运用计算机技术,古籍索引工作出现了前所未有的机遇,古籍索引的编制也迎来了电子化时代。

第一节古籍索引电子化

古籍索引是将古代文献中的各种事物名称,如篇名、字句、词语、人名、地名、内容或主题等,分别摘录,注明出处,并按一定排检方法编排起来的过程。按照不同的排检事项可将索引分为字词索引、句子索引、人名索引、地名索引、关键词语索引、图谱索引、书名索引、篇目索引及引书索引等。

古籍索引电子化是指古籍索引编制过程的计算机化,其内涵包括两个方面:一是用计算机编制的各种纸质形态的古籍索引;二是用计算机表达的古籍索引系统。张琪玉先生认为索引工作现代化的实质就是索引编制和使用的计算机化。用计算机编制索引是索引技术发展的高级阶段。张琪玉先生将计算机编制索引分为两种方式:一种是手工编制索引稿,再输入计算机编排和生产各种索引产品;另一种方式是直接在计算机上制作索引数据和生产各种索引产品。用计算机生产的索引产品有多种载体形式,其中以数据库(数字化索引)和印刷型索引为多见。前者以中国社会科学院文学研究所编制的《论语》逐字索引和《诸子集成》索引、香港中文大学中国文化研究所依据“先秦两汉一切传世文献电脑化资料库”先后编制的《先秦两汉古籍逐字索引丛刊》和《魏晋南北朝古籍逐字索引丛刊》为代表。后者以陕西师范大学《十三经词语索引》系统、广西大学《古今图书集成索引》电子版最具代表性。

需要指出的是,除了利用计算机编制古籍索引外,计算机用于古籍整理的实践过程中,还开发建设了大量可检索的古籍全文数据库。从这些数据库所具有的检索功能来看,这些数据库也应视为一种新的古籍索引,尤其是全文检索型的古籍数据库,更具有古籍索引的基本特征。

“从20世纪20年代直到80年代,限于手工作业的耗时、耗力、耗人,全文检索只能成为一个编制索引的理想目标,应用到卷帙浩繁的传统典籍上,实在令人不敢想象了。”20世纪90年代以来,古籍全文检索系统的开发与建设使这一理想得以实现,“逐字索引(全文检索)的编制体例现已成为海内外中国古籍索引编制工作的主流。”1995年台湾罗凤珠教授开发出了“唐诗多媒体网络系统”,该系统具有作者检索、诗题检索、关键词检索和诗句检索功能。台湾地区“中央研究院”历史语言研究所的“古籍资料库”(其数据类别有影像处理、全文检索、书目及档案检索三大类型五大资料库)、汉学研究中心的“典藏目录及资料库”以及寒泉网站提供的“寒泉资料库”均可提供全文检索。尤其是在大陆地区,参加古籍全文数据库研发的单位既有科研院所,也有部分企业,出现了大量高质量的古籍全文数据库,如书同文数字化技术有限公司开发的《四库全书》、《四部丛刊》和《永乐大典》的全文检索版、南开大学与天津永川公司联合开发的“《二十五史》全文阅读检索系统”、北京龙戴特信息技术有限公司开发的“龙语瀚堂典籍数据库”等大型古籍全文数据库均实现了全文检索功能。

数据库是计算机技术应用于文献存储后的文献形态。古籍全文数据库的检索功能实质上是古籍索引功能的扩展。其多种检索途径使它成为一部多功能索引。古籍全文数据库本质上是一个索引体系。古籍全文数据库的检索字段(如分类号、主题词、题名、著者等)相当于古籍索引的标识项。因此说一个含有分类号、主题词、题名、著者字段的数据库相当于分类索引、主题索引、题名索引、著者索引四套卡片式索引。古籍全文数据库具备了传统索引的全部检索功能,而且古籍全文数据库与传统索引相比具有更多的检索功能。“数据库是比传统索引更为高级、更为先进的索引。”

古籍索引电子化的最终成果是古籍电子索引。古籍电子索引应具备四个基本要素。

(1)具有明确的索取范围。古籍电子索引的索取范围可以是一部单一古籍,如《诗经》、《史记》等;也可以是古籍丛书,如《十三经》、《二十五史》等;另外,也可以确定某一类主题为范围,如地方志人物、历史图像等。

(2)必须确定一定的索引途径。传统的古籍索引以字、词、语、句、篇为索引款目,一般可通过音序、笔画、号码以及分类等途径进行检索。古籍电子索引的索引途径则可进行字词检索、分类检索、标题检索以及组合检索等。

(3)索取结果必须注明原文出处或提供原文文字或图像。传统的古籍索引的检索条目由序号、标目、注释、出处等组成。其中出处必须由读者亲自核对检出原文,而古籍电子索引多数可提供原文文字或图像。

与手工编制古籍索引相比,古籍索引电子化具有手工编制索引无法相比的优点,主要表现在以下几个方面。

(1)具有可复制性。与印刷型古籍索引的不可再生性相比,电子化古籍索引具有可复制性的优势。对于用计算机编制各种纸质形态的古籍索引而言,利用计算机编制可以一次输入、多次多种输出。古籍索引一旦在计算机中完成,可以生成不同检索途径的索引产品。另外,对于古籍索引系统而言,由于印刷型古籍索引是以纸质的形式存在,而纸质的形式会随着时间的推移而逐渐腐化、变质并最终消失。而电子化古籍索引系统是以数字形态存在,可以无限制地复制,因此对古籍的保存和延续具有传统古籍所无可替代的优势。

(2)具有速度快、准确度高的优势。古籍索引电子化实现了检索自动化,可千百倍地提高检索速度,还可以通过各种不同的检索技术,大大提高检索效率。由于古籍索引电子化的检索途径较多,所以,它比手工查检印刷型索引的查全率和查准率都高得多。古籍索引电子化高速度的任意检索与摸糊检索方式,十分有利于开发古籍中蕴藏的特有信息资源,可以在最短的时间查找到所需信息,并具有相应的分析功能。

(3)信息传播量大,资源利用率高。随着国际互联网的迅速发展,电子化古籍索引实现了网络共享。电子化古籍索引不受时间和空间的限制,可以在任意时间、任意空间传播,且信息量大,可大大节约运行成本。更为重要的是电子化古籍索引的网络共享大大提高了古籍资源的利用效率。

(4)古籍索引检索语言得到了扩展。古籍索引电子化产生了许多新的索引方法,如关键词和主题词检索、条件检索、逻辑检索、模糊检索、高级组配检索,以及字数、字频、词频的统计等,推动了索引用语言(情报检索用语言)的创新和改造。

第二节古籍索引编制的回顾

我国索引事业虽有悠久的历史,但发展缓慢。清代以前我国古代的索引多以“韵编”、“检目”、“便检”及“通检”等命名。我国古代索引的编制来源于古代类书编撰的实践。以《艺文类聚》为例,《艺文类聚》以类相从,部下分目,事文并检,注明出处,已经具备了分类索引的特征。唐代林宝编撰的《元和姓纂》,按韵编排,姓氏注明引述,已具有了人名索引的功能。不过,类书并不是真正意义上的索引。这里需要指出的是,类书是否等同于我国古代的索引是古籍索引研究中争论较大的一个问题。1986年,黄恩祝在《类书是我国古代的索引》一文中从索引概念本质属性的角度论证了类书是我国古代早期的索引。文章发表后引起了索引界有关类书与古籍索引的关系的探讨。钱振新在《“类书是我国古代的索引”说质疑》一文中指出:认为类书是我国古代的索引显然是不客观的。索引是一种二次文献情报产品;类书是我国古代的一种集一次文献大成的工具书。索引的作用在于“指南”,旨在提供一次文献的线索而不是直接阅读;类书是供直接阅览备考的。因此有些类书本身需要辅助索引。管蔚华在《试论索引的本质属性及与类书的关系——与黄恩祝同志商榷》一文中通过对索引的本质属性、索引与类书的概念分析后,认为索引和类书是不尽相同的两个事物,分属于检索工具和工具书两个概念。

20世纪90年代后,类书与我国古代的索引分属两种不同的工具书才得以定论。在此结论的基础上,类书与古代索引关系的探讨又有了新的深入,李荣慧在《类书是我国古代索引不发达的主要原因》与《我国类书、索引比较及其消长趋势》中从类书的本质、编撰特点以及古人的阅读习惯得出结论,认为类书是我国古代索引不发达的主要原因,文中预测信息技术的发展将使类书以新的面貌出现并与索引达到完美统一。事实上,类书与索引在功能利用上的确具有相同之处。类书是指摘录、汇辑多种文献中的原文并按内容性质分门别类地编排组织,以供寻检和征引的工具书。潘树广《古籍索引概论》一文也指出,索引的四个要素即规定特定的款目、作为索取对象、款目按一定的排检法编排和注明出处,类书大部分都具备。潘树广认为:类书采自群书资料,分类编排,并冠以类目名称,每条资料均注明出处,这种体例,已具索引的雏形。唐宋以来的类书,如《艺文类聚》、《太平御览》等,种类越来越多,检索功能越来越强,索引的色彩日趋浓厚。但是,严格意义上的索引,到明清时代才真正出现。据现有的资料来看,严格意义上的古籍索引应是明代张士佩的《洪武正韵玉键》。《洪武正韵玉键》(万历三年刊)是《洪武正韵》所收文字的分类索引。明末著名学者傅山的《两汉书姓名韵》,将《汉书》、《后汉书》中的人名分韵编排,详注出处,是我国最早的人名索引。《两汉书姓名韵》还创建了“互见”法的索引参照体式。

清代索引的编撰与明代相比,无论在数量上,还是在索引功能的揭示上都有了很大的发展。如汪辉祖的《史姓韵编》收录了《史记》至《明史》二十四史中的人名,并按姓氏韵部编排;阮元的《经籍纂诂》,依韵排列,是一部群经索引;《本草万方针线》是蔡烈先为查找《本草纲目》中收录的医方而编纂的一部专书索引。同时,清代索引理论也得到了发展。章学诚在《校雠通义》内篇一“校雠条理”中提出了编制规模空前的群书综合索引的大胆设想,其中涉及索引编纂的几个重要理论问题:

窃以典籍浩繁,闻见有限,在博雅者且不能悉究无遗,况其下乎?以谓校雠之先,宜尽取四库之藏,中外之籍,择其中之人名、地号、官阶、书目,凡一切有名可治,有数可稽者,略仿《佩文韵府》之例,悉编为韵。乃于本韵之下,注明原书出处,及先后篇第。自一见再见,以至数千百,皆详注之。藏之馆中,以为群书之总类。至校书之时,遇有疑似之处,即名而求其编韵,因韵而检其本书,参互错综,即可得其至是。此则渊博之儒穷毕生年力而不可究殚者,今即中才校勘可坐收于几席之间,非校雠之良法欤?

章学诚提出了别裁、互见以及索引分类的方法。章学诚还主编了《历代纪元韵览》和《明史列传人名韵编》。在章氏的影响下,先后出现了多种检索类工具书。随着西方索引概念及索引编制技术的传入,我国近现代索引事业也迎来了全新的面貌。在西方学术研究方法的影响下,索引编制受到空前关注,20世纪20年代出现了“索引运动”。索引运动提倡用西方科学的治学方法来整理国故,在胡适、林语堂、刘半农等的大力提倡下,传统国学研究在大量古籍索引的帮助下,也取得了快速进展。在古籍索引编制方面以哈佛燕京学社大规模的古籍引得编纂活动最为突出。从1931年春至1950年冬,哈佛燕京学社引得编纂处共编制引得正刊41种、引得特刊23种(附原文者为特刊),各种引得合计63种,这些古籍索引遍及经、史、子、集。除了索引编制外,哈佛燕京学社引得编纂处也将古籍索引编制工作的经验总结成索引理论,洪业的《引得说》是其代表。此外,部分知名学者也十分重视古籍索引的编制,如叶圣陶的《十三经索引》、王重民等编制的《清代文集篇目分类索引》、顾颉刚的《尚书通检》、杨殿珣的《石刻题跋索引》都是至今还在应用的索引名著。

新中国成立后,我国的古籍索引事业得到了迅速的发展。尤其是改革开放以后,古籍索引工作受到国务院的高度关注,古籍索引工作取得了重大进展。据何小清统计,建国40年来,我国总共编制出版了83种古籍索引。另外,国外汉学界对中国古籍索引的编制也非常重视,编制了大量中国古籍索引,其中尤以日本为最。据陈东辉统计,日本出版的中国古籍索引约占全部中国古籍索引的80%。

同类推荐
  • 中国政治制度史导论(第2版)

    中国政治制度史导论(第2版)

    《中国政治制度史导论(第2版)》论述了中国从前封建时代直至晚清的政治制度史。作者运用制度主义、历史主义的方法研究了这一历史时空的政治组织的构架、政治文化的变迁、政治运作的规则和机制的变化以及社会权力结构的变化理路。既勾勒了中国政治制度史的概观,又彰显了中国政治制度的特色和核心问题。
  • 新课标英语学习资源库-奥林匹斯山众神

    新课标英语学习资源库-奥林匹斯山众神

    课标是常新的,经典却是永恒的,走进经典的选择,学习兴趣的提高你只有一步之遥。奥林匹斯山众神有普罗米修斯,波塞冬,厄洛斯,阿波罗,海尔墨斯,阿尔特弥斯等。
  • 提高自救自护能力

    提高自救自护能力

    青少年是祖国的未来和希望,培养综合素质高的接班人是我们教育的天职。当今社会,我们国家在现代化发展的道路上正面临着极大的机遇和巨大的挑战。要应对挑战就必须使未来的建设者们具备全面的素质;不但要有自然科学的知识,同时也必须掌握人文科学的知识。只有具备综合素质的人,才能称得上是合格的人才。一个民族的全体国民要想全面提高人文素质,就必须以提高综合素质为突破口。本选题是为青少年量身定做的综合素质提高自助读本。
  • 让青少年知道热爱科学的150个故事

    让青少年知道热爱科学的150个故事

    本书精选了古今中外有关热爱科学的150个故事,力图开阔学生们的视野,增强他们热爱科学、学好科学、掌握更多科技知识的信心和决心,为孩子的成长奠定基础。
  • 外国文学作品导读

    外国文学作品导读

    本书的主要内容包括除中国以外世界范围内18个民族、国家的54部作品,适用对象是远程教育中国语言文学专业的学生,还可作为普通高等院校文科教材使用,对一般外国文学爱好者也有重要的参考价值。
热门推荐
  • 我的女帝死党

    我的女帝死党

    我可为你执剑战天下,亦可为情收刀隐山林!我的女帝死党,一言便是一生!
  • 太上开明天地本真经

    太上开明天地本真经

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 从秦皇到汉武:品读《史记》中的两大强者

    从秦皇到汉武:品读《史记》中的两大强者

    一个横扫六合,一个威加海内;一个焚书坑儒,一个独尊儒术;一个建起万里长城。一个驱逐匈奴、扩地千里。
  • 两个人的迷藏

    两个人的迷藏

    有没有人和你说过:无论你躲在那里,我都能找到你。也许别人听来这是很可怕的威胁,可对黎小蔓来说,这是她这辈子最喜欢的表白。因为对她说这句话的郑关鸣,一辈子也不会对她说完下半句:然后,将你藏在我心里。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 做任务我是专业的

    做任务我是专业的

    这是一段开始于六十万年前的爱情。生生世世,哪怕换了时空,变了容颜,也要与你相识相遇相知。死生契阔,与子成说。女频奇葩,沙雕新星,脑洞本洞。
  • 次元间的旅者

    次元间的旅者

    本书更新稳定,要写的世界会随时更新,第一卷可跳过。暂定世界:斗破苍穹、约会大作战、从零开始的异世界生活、刀剑神域、噬血狂袭、学园默示录、斩·赤红之瞳、俺春物、实力至上主义教室、龙女仆、fate(ubw)、东京喰种、天使与龙的轮舞、废天使珈百璃、恶魔高校、鹦鹉女神、Overload、苍蓝钢铁的琶音、AngelBeats、游戏人生zero、魔法禁书目录、弑神者、幻想乡。书友群:672723058,验证口令:761书友群里不定期有回馈书友的活动,欢迎参加!新人新书,感谢支持!
  • 锤子大魔王

    锤子大魔王

    亿年之后,宇宙小爆炸,诸多天体毁灭,地球变质,人类经历了一次次死亡与重生。我叫雷大锤,世人皆称我为锤子大魔王,只因为我太强大了,强大到连黑洞都扛不住我一锤!于是我冲出银河系,跨过室女座超星系团,站在拉尼亚凯亚超星系团上,遥望牧夫座空洞,穿过可观测宇宙。