目前,古籍书目数据库著录内容还没有一个统一的标准,不过多数图书馆通常以北京大学图书馆《古籍描述元数据著录规则》作为编目标准。2004年5月北京大学图书馆公布了《古籍描述元数据著录规则》,该报告属于科技部科技基础条件平台工作重大项目《数字图书馆标准与规范建设》的一部分。《古籍描述元数据著录规则》确立了15个元数据核心元素。这15个元数据核心元素分别为:
(1)题名。著录古籍各种题名及正题名的有关说明文字。各种题名分别是:正题名及说明、版心题名、内封题名、书衣题名、卷端题名、其他题名。
(2)主要责任者。根据责任方式著录古籍主要责任者名称及其所处的时代(或国别)。其子元素有责任者名称、责任者名称拼音、责任者时代(或国别)和责任方式。其中责任方式的限定词有撰、修、纂修、注、编、辑、译、书、绘及其他。
(3)其他责任者。著录古籍其他责任者所处的时代(或国别)、责任者名称及责任方式。
(4)出版项。著录古籍版本抄写刻印的时间、地点和责任者。
(5)版本。著录古籍的版本类别及其附加说明。
(6)外观形态。著录古籍的装订方式、数量、图表、尺寸和附件等。
(7)附注说明。著录古籍的内容形式等各方面的注释说明。
(8)收藏历史。著录古籍的收藏沿革、题跋印记、获得方式和购买价格等。
(9)相关文献。著录丛书名、合刻书名、合函书名、有独立检索意义的附录附刻及书目文献。
(10)主题词与类名。著录与古籍内容有关的非控主题词和四库类名。主题词采用自由词标引,四库类名依据自编的《四库分类表》标引。
(11)时空范围。著录古籍内容涉及的时空范围,亦即可查到的古今地名和时代。
(12)古籍语种。著录古籍内容的文字语种。
(13)资源形式。著录“古籍”。
(14)古籍标识。所著录古籍的系统唯一标识符号,由系统自动生成数字符号。
(15)馆藏信息。著录古籍的典藏号、馆藏地址、允许使用的用户范围及其他复本信息等。
第四节古籍书目数据库的规范
一、古籍书目数据库的标准
古籍书目数据库必须依照相应的标准和规范进行建设。秦淑贞在谈到什么是规范化的古籍书目数据库时认为:规范化的古籍书目数据库,是指在各种编目软件支持下作出的在格式、内容、标引依据以及字体等方面都与国家标准相一致的古籍书目数据库。要达到古籍书目数据库规范化必须做到六个统一,即:统一的机读目录格式、统一的著录规则、统一的分类法、统一的主题标引依据、统一的字库、古籍和普通图书统一建库。其中古籍和普通图书统一建库属于建库原则问题。因此,古籍书目数据库建设工作应按照前五个统一的标准来进行。
1.机读目录格式标准
统一标准的机读目录格式是建设和使用古籍书目数据库的必要前提。机读目录(Machine-Readable Catalogue,简称MARC)是一种以代码形式和特定格式结构记录在计算机存储载体上,可由计算机自动控制处理和编辑输出的书目信息目录格式。目前,国内已建成古籍书目数据库所依据的机读目录格式,基本上都是在CN-MARC的基础上进行了适当修改和补充。《中国机读目录格式》中的题名与责任说明、版本说明等著录信息块,同样适合于标识古籍。不过,CN-MARC处理的对象是现代文献,对古籍并不能完全适用。因此,出台适合古籍特征的《古籍机读目录格式》是十分必要的。
2.古籍著录规则标准
文献著录的标准化是文献资源共享的基础,统一而且行之有效的国家著录标准是建立书目数据库的根本条件。我国于1987年颁布了《古籍著录规则》,该标准只是一个为手工著录而编订的著录标准。国内早期的古籍书目数据库建设多数参照了《古籍著录标准》,并将其作为著录内容规范化的准则。后经由全国情报文献工作标准化技术委员会第六分委会结合我国古籍的特点、参考《国际标准书目著录(古书)》并考虑计算机著录的要求,对《古籍著录规则》进行了修订。20世纪90年代,随着古籍书目数据库的开发和建设,各馆藏单位在具体的数据库建设中发现《古籍著录规则》与国际通用的计算机识别兼容的著录规则还存在一定差距。因此,开发单位从实际出发作了适当的调整。基于此,1996年由中国文献编目小组编撰了《中国文献编目规则》。《中国文献编目规则》融合了各类型文献著录规则,确定了不同名称的参照关系,并通过标目法对文献题名和责任者名称予以规范控制,从而形成了适合我国汉语言文字特点,又与世界书目控制原则相吻合的一套完整、系统的编目规则。
3.古籍分类法标准
古籍书目数据库建设的一个重要目的就是向读者提供检索服务。其中分类检索就是一种重要的检索手段。建立统一的古籍书目数据库必须要有一个统一标准的古籍分类法。但是,由于古籍所具有的特殊性以及历史分类习惯难以更改,因此,至今尚未形成统一完善的古籍分类法。对于古籍书目数据库建设分类法的选择,目前图书馆界主要有三种意见,一种意见主张采用《中图法》,另一种意见主张采用《四部法》,第三种意见主张《中图法》和《四部法》相结合。《中图法》是中国图书分类的国家标准,是当前我国最有权威的图书分类法,它依照现代学科进行分类,既有利于读者的检索,也与国际标准相通。从读者检索习惯考虑,《四部法》已被广大文史工作者所熟知。但是,《四部法》的缺陷也十分明显,它不能与国际通用的机读目录数据库通融。因此,图书馆界多数学者倾向于《中图法》和《四部法》相结合,采用《中图法》第三版和《中国古籍总目分类表》作为古籍分类规范化的标准。
4.主题标引的标准
主题标引是保证机读目录质量的重要组成部分,也是开展文献检索的基础。所谓主题标引“就是通过对文献内容的分析,把文献所论述的对象(或事物)概括起来,再使用规范化的词汇——主题词,将其按照一定的规范加以组织,使之成为检索语言的过程。”文献检索的长期实践表明,主题标引的数据库明显优越于其他检索途径。从国内目前的古籍书目数据库建设情况来看,多数采用了《中国分类主题词表》作为规范化的古籍主题标引依据。《中国分类主题词表》采用分类法与叙词表对照的检索语言,从内容到语义结构实现了分类语言与主题语言的兼容。我国各级图书馆的编目主要是建立在《中图法》和《汉语主题词表》的基础上的,因此在机读数据库中使用《中国分类主题词表》不会打乱原有的图书编目体系。