第一节国外书目数据库的建设
欧美地区共有120余座东亚图书馆,其中北美约有900万册中文图书。大部分的东亚图书馆所使用的编目系统为美国研究图书馆信息网络(RLIN-CJK)系统。这些东亚图书馆在其馆藏发展计划中对中文书籍的计算机编目工作十分重视,这其中也包括中文古籍书目数据库的开发与建设。简要介绍如下。
(1)哈佛燕京图书馆“线装古籍计算机检索系统”。哈佛燕京图书馆是欧美收藏东亚文献最多的图书馆之一。其中中文古籍包括普通线装古籍1.6万余部,善本4千余部,方志近4千种,家谱1千余种。2003年哈佛燕京图书馆邀请复旦大学图书馆眭骏、杨光辉等专业学者帮助完成这1,800余种古籍线装图书的计算机编目工作。目前编目工作已经结束,读者可在哈佛燕京图书馆馆内的“线装古籍计算机检索系统”查询。
(2)美国图书馆研究学会“中文善本数据库”。美国图书馆研究学会(Research Libraries Group)由北美36家图书馆组成。1990年美国图书馆研究学会东亚计划委员会开始了“中文善本书目数据库”计划,该计划预计将中国清代嘉庆以前的古籍全部进行机读编目。第一阶段成功地将台北“中央图书馆”的机读古籍书目转换到RLIN数据库中。第二阶段由中国北京大学、中科院的5位古籍编目专家及美国普林斯顿大学、哥伦比亚大学东亚图书馆的专家,进行编目测试和中文善本书目规则草案的修正。第三、四阶段进行集中编目。目前数据库有2.5万条数据,并且还在不断扩充之中。
(3)美国国会图书馆“Online Catalog”。美国国会图书馆为美国收藏中文书籍最丰富的地方,中文藏书已达754,300册,其中中文古籍善本藏书约有2000种,包括宋元明清善本书、地方志和罕见的珍本图籍。“Online Catalog”也包括中文古籍数据。使用者需以汉语拼音输入检索条件,数据结果以英文呈现。
英国中文古籍的收藏也十分可观。大英图书馆典藏中国珍贵文献和古籍6万多种。牛津大学博德林图书馆馆藏汉文古籍4万余册。剑桥大学图书馆藏有中国文献1.5万册,其中有地方志300余种,抄本80余部,《永乐大典》2册。剑桥大学东亚科学史(即李约瑟研究所)图书馆藏有中国科技史古籍与相关资料约2万册。伦敦大学亚非研究学院藏有中国文献13.7万多册,其善本古籍880种,地方志1,139种。
如大英图书馆“中文图书联合检索”。大英图书馆于1980年开始采用MARC磁带建立“古版书简明标题目录”(Incunable Short Tit-1e Catalogue,简称ISTC),是全球该类文献最大的联机数据库,主要收载15世纪用活版印刷术印刷的文献的题录。ISTC数据库的来源主要为英国图书馆收藏的1501年以前印刷的文献的题录目录。除此之外,还收录了包括部分中文古籍的书目。“中文图书联合检索”包括大英图书馆与牛津大学、剑桥大学等六所大学和研究所的图书馆所收藏的中文书籍,含中文古籍。使用者可直接输入汉语或汉语拼音来查询书目,所得信息也以中文显示。
日本十分重视对中文古籍的整理和编目。20世纪60年代,日本著名的岩波书店陆续出版了由森末义彰、市古贞次、堤精二编著的《图书总目录》,《图书总目录》共收录日本国会图书馆和各大学图书馆的馆藏中文古籍39万部。1978年日本文部省提出并实施了情报系统计算机化。开始着手建立日本机读目录。同时,确定计算机在图书馆的主体地位,逐步实现文献检索(机读目录检索),实现“无卡”管理。
20世纪80年代,日本中国文献研究中心开始在《图书总目录》的基础上建立古籍综合目录数据库。1990年2月《古籍综合目录》数据库编制完成。《古籍综合目录》共收古籍43万件,采集古籍书目约91万件,涉及146个图书馆和文库及其他收藏古籍的机构。同时,日本国内的各个图书馆也开始机读编目工作。由于汉籍书目的汉字处理较为困难,其发展相对缓慢。近10年,汉籍机读编目才取得进展,东洋文库、内阁文库、东京大学东洋文化研究所等机构已经在互联网上独立公开了他们的汉籍目录数据库。东京大学东洋文化研究所于1998年公开的《东洋文化研究所汉籍分类目录》数据库,是全球最早投入实用的汉籍目录数据库之一。日本国立情报学研究所的综合书目数据库系统(NACSIS-CAT)囊括了以各大学图书馆为中心的、全国性的、综合目录的数据库,并可以中文显示。2001年,京都大学人文科学研究所、东京大学东洋文化研究所以及国立情报学研究所三个机构开始协力合作“全国汉籍目录数据库”,其目的在于将依循传统的汉籍目录法制作而成的册子目录更改为自然转换的数据库。日本国内各单位所藏汉籍的目录数字化和共享已达到了一定的水平。简要介绍如下。
(1)全国汉籍——日本所藏中文古籍数据库。日本京都大学人文科学研究所全国汉籍协议会研制并管理。2001年,京都大学人文科学汉字信息研究中心与日本国家信息和计算机科学实验室、东京大学东方文化研究所计划联合编制“全国汉籍书目数据库”,由日本京都大学人文科学研究所全国汉籍协议会主持,计划分两个五年阶段实施。全国主要公共图书馆和大学图书馆提供各馆藏中文古籍书目资料。目前已进入第二阶段,数据库已基本建成,读者可直接登录“全国汉籍——日本所藏中文古籍数据库”输入繁体中文查询。
(2)东洋文化研究所所藏汉籍目录数据库。东京大学东洋文化研究所研制开发。东洋文化研究所为日本收藏中国文献资料的重镇,尤以清代经济与法制资料为其特色。该所藏书非常丰富,其中约有7万本的汉籍,包括法制文书、明清戏曲小说以及一般图书等。数据库只著录该所于2001年前所收藏的汉籍书目,2002年后的书目需利用东京大学的图书馆目录检索系统。数据库共有17种检索栏位,有效地描述了古籍书目的原始数据。
(3)东洋学文献类目检索系统。京都大学人文科学研究所从1963年起便按计划逐年编纂中国研究的论著目录,其后扩充至东亚地区,成为收录亚洲研究最详尽的书目。东洋学文献类目检索系统已纳入该目录自1980年以后的数据。其中包括京都大学图书馆电子图书馆收藏的大量中文古籍和考古资料。目前京都大学人文科学研究所正积极与东京大学、东北大学、鹿儿岛大学等机构合作建设“中国古籍书目数据库”。
(4)东洋文库所藏汉籍目录。东洋文库收藏大量汉籍,包括珍稀汉文善本、古方志、旧族谱以及出土文献等。东洋文库相继编纂了馆藏汉籍目录:《东洋文库所藏中国古籍目录集部》(1967年出版)、《东洋文库所藏中国古籍目录经部》(1978年出版)、《东洋文库所藏中国古籍目录史部》(1986年出版)、《东洋文库所藏中国古籍目录子部》(1993年出版)。“东洋文库所藏汉籍目录”数据库以已出版的书目图书为底本建置而成。读者可直接输入繁体中文检索相关数据。
(5)东京大学总合图书馆汉籍目录。日本东京大学图书馆自1986年开始进行数字化工作,已将馆藏776万册图书进行了目录数字化,建立了完整的图书目录数据库。
韩国收藏汉籍的单位主要为国立中央图书馆、国会图书馆、奎章阁、韩国精神文化研究院、国史编纂委员会、民族文化推进会、韩国国学振兴院、各公私立大学图书馆及数所专门图书馆。韩国国立中央图书馆藏有汉籍15,963种85,953册;国立汉城大学附属中央图书馆有中文藏书133,082册,其中奎章阁藏中国本5,912种65,568册,编有《奎章阁图书中国本书名索引》;岭南大学中央图书馆有中文藏书34,875册;圆光大学附属图书馆有中文藏书15,000册。在书目数据库建设方面,韩国国立中央图书馆统合各图书馆之文献情报数据库,成为国家文献情报数据库,目前已建立各类型数据之书目共计1,746,848册。此外,韩国国立中央图书馆亦建立全文情报数据库,包括古书68,896册,10,244,750页。
如奎章阁档案馆古籍检索系统。奎章阁(The Kyujanggak Archives)曾经是朝鲜李氏王朝皇家藏书的地方。现在为韩国国家珍贵文献与历史文献档案馆。奎章阁所藏中文古籍非常丰富,其中不乏中国久已失传的古代典籍。韩国国家图书馆协会十分重视历史文献的典藏数字化工作,1998年由国家投入巨资对奎章阁所藏古籍进行数字化处理。其工作分两部分:一是对奎章阁所藏古籍进行计算机编目,建立奎章阁古籍书目数据库;二是计划对全部奎章阁所藏古籍进行图像扫描并提供网络全文阅读服务。目前古籍书目数据库已经完成,读者可登录奎章阁古籍检索系统检索书目。
第二节台湾地区书目数据库的建设
台湾地区的古籍书目数据库的编撰开始于20世纪80年代末。20世纪80年代初,台湾地区“中央图书馆”将馆藏善本制成机读目录,开启了台湾地区古籍书目数据库工作。其后,台湾地区故宫博物院、台大图书馆、“中央研究院”傅斯年图书馆等单位也都积极参加进来。台湾地区“中央研究院”自20世纪80年代推动史籍自动化计划以来也开发了大量的古籍书目数据库。随着计算机技术的发展以及机读编目实践的成熟,台湾地区古籍书目数据库的建设也逐步展开。
1990年,台湾地区“国家图书馆”编制成“台湾地区善本古籍联合目录”(数据量116,034笔),向读者提供书名、作者、出版地、出版者、版本项以及主题检索服务。1998年以“台湾地区善本古籍联合目录”为基础,由大陆及港澳、日本、美国、欧洲等地区图书馆,提供若干测试数据,扩增为“中文古籍书目数据库”。目前总计收录45万余笔古籍书目资料。该数据库以Metadata格式表达,共有14个查询值可供读者检索,并提供繁、简体版查询。
台湾地区“国家图书馆”“台湾地区家谱联合目录资料库”也很有特色。数据库可供相关单位汇入CN-MARC以及US-MARC等MARC格式书目数据,以利查询、显示,兼提供著录及维护功能。将来拟进一步扩充系统,提供符合国际标准的Metadata书目数据汇出功能,以利交换。台湾地区现藏中国家谱约14,986种,藏量在中国家谱总数中占有相当的比重,该馆于2002年开始筹建“台湾地区家谱联合目录”,由各相关单位提供馆藏家谱数据。目前参与单位有“中央研究院”民族所、“中央研究院”傅斯年图书馆、台北市文献会、“中央图书馆”台湾分馆、台湾省各姓渊源研究学会、宜兰县史馆、故宫博物院、“国史馆”、“国史馆”台湾文献馆、“国家图书馆”和万万斋。
“明人文集联合目录与篇目索引资料库”由台湾地区“国家图书馆”汉学研究中心研制,包括有故宫博物院图书馆、台湾大学图书馆、“中央研究院”傅斯年图书馆、“国家图书馆”及汉学研究中心所藏明人文集的书目数据。“中央图书馆”台湾分馆开发的“台湾文献数据联合目录”(32,113笔)内容含台湾地区图书文献数据,凡古文书、先贤遗著、士绅之文集、诗集、日记、账簿、族谱、家乘、祭祀公业资料等。包括“中央图书馆”、台湾省文献会、省立台中图书馆、“中央研究院”、台北市文献委员会、台湾师范大学图书馆、成功大学图书馆、傅斯年图书馆、台北市立图书馆等36个单位的文献数据。另外,台北故宫博物院开发建设了“家族谱牒文献资料库”和“善本古籍资料库”;台湾地区“中央研究院”也开发建设了“简帛金石资料库书目”、“生命医疗史研究室资料库检索”以及“中国大陆各省地方志书目查询系统”等特色专题书目数据库。台湾地区古籍书目数据库建设具有如下几个突出特点。