例如,山东省省情资料库是国内目前第一家拥有省级地域资料的大型数据库,也是中国第一家在网上发布地情资料的最大的中文数据库,其设计容量20亿汉字,并最终形成一个大型的、动态的、可多角度检索的资料库。山东省省情资料库设88个专题数据库,是根据社会分工、科学分类建设的带有行业性、专业性的数据库。黑龙江省情信息网(中国龙志)是国内创办较早且最具特色的数据库,2000年开通,其“省情信息库”链接有“省志库”、“市县志书库”和“年鉴库”,内容包括全省121部省志和153部市县志,目前均可提供全文阅读。黑龙江省情信息网的最大特色在于首次实现了全文检索功能,检索内容十分丰富,检索途径多,可实现简单检索、高级检索、组合检索、二次检索与智能检索。“上海通”网站是由上海市地方志办公室负责建立的,是“上海市地情资料库”的重要组成部分。“上海通”实现了方志成果的数字化和网络化。目前,网站中已收录22部区县志、81部专业志和7部《上海年鉴》,字数近1.3亿,涵盖了上海的政治、经济、科技、文化和艺术等方方面面的地情资料,网站栏目丰富,浏览方便,具有全文检索功能。福建省情资料库收录了福建省志、地市县志、部门村镇、旧志库和福建史志等近200部数字方志资源。内蒙古自治区区情数据库(内蒙古区情网)收录有《内蒙古自治区年鉴》、《地方志》和《部门志》等丰富资料。
二、出土文献全文数据库
中国国家图书“碑帖菁华”(中文拓片资源库):中国国家图书馆藏有历代甲骨、青铜器、石刻等类拓片23万余件,其数量之多可谓富甲天下,其内容之丰富可谓包罗万象,历史、地理、政治、经济、军事、民族、民俗、文学、艺术、科技、建筑等方面的研究者都可以从中找到有益的材料。经过数年的努力,影像库已有影像25,000余幅。资源库内容以刻立石年月排序,提供单一字段的简单检索、多条件限定组合的高级检索和元数据内容关联检索等查询方式。2006年数据库更新元数据3,091条,影像4,142幅。数据库支持繁体和汉语拼音检索。中国国家图书馆下一步将建立馆藏法帖、画像、甲骨、青铜器、砖瓦等拓片及印谱影像数据库。
北京大学图书馆“金石拓片特藏”:北京大学图书馆收藏有历代金石拓片2万余种,是北京大学图书馆古籍类特藏之一。金石拓片特藏数据库选择了其中100种拓片的目录信息和照片作为样本。截至2005年“金石拓片特藏”已完成22,000条数据,共2,200拍图像。读者可概览目录后,根据需要检索特定条目。
兰州大学图书馆“敦煌学数据库”:“敦煌学数据库”为“中国高等教育文献保障系统”子项目。内容包括敦煌遗书、题记数据库;敦煌绘画、彩塑数据库;敦煌学研究文献数据库;敦煌学的研究专家和机构数据库等。数据库建立基于Browse/Web Server的三层体系结构的敦煌学数据库应用系统,利用Web方式和大型数据库管理系统在网络上动态管理和发布敦煌学数据,并支持图像、声音、动画和视频等多媒体信息,能够自动采集和维护敦煌学研究网址,自动从数据库挖掘潜在模式,供各敦煌学专家和相关人员使用。
金文字库及金文资料全文检索系统:由陕西省考古研究所和西安大东国际数据有限公司共同合作开发。该系统的金文字库中收集隶定字的4,500字,金文原篆字约2,600字。收录全国自宋代以来传世和出土的商周时期青铜器上的金文资料约12,000件,包括青铜器图像约11,000幅;相关的简介文字(包括名称、出土时间、出土地点、收藏单位、尺寸重量、花纹描述及著作书刊等),按每件器物平均140字计算,共约120万字;铭文拓文12,000幅;释文每件器物平均50字,共180万字。
甲骨文数字典藏:由台湾地区“中央研究院”历史语言研究所开发建设。以《甲骨文合集释文》及《英国所藏甲骨集》等7种海外所藏甲骨卜辞资料为主要数据,可提供拓片出处、合集编号、主题、释文、分期、题记、印记及题名查询。
先秦金文简牍词汇资料库:由台湾地区“中央研究院”历史语言研究所开发建设,是台湾地区数位典藏国家型科技计划——语言典藏项的分支计划。数据库以“殷周金文暨青铜器资料库”为基础,形成殷周金文词汇库和战国简牍词汇库。
简帛金石资料库——全文:由台湾地区“中央研究院”历史语言研究所开发建设。包括《睡虎地秦墓竹简》、《两汉镜铭集录》和《汉代石刻集成》等40余种全文数据,涉及先秦至魏晋的简牍、帛书、碑刻和官印等资料,总计约390万字。
汉代简牍数位典藏:有台湾地区“中央研究院”历史语言研究所开发建设。数据库主要内容为“中央研究院”历史语言研究所收藏的汉代简牍,其中以瑞典考古学家贝格曼(Folke Bergman)等人发掘的“居延汉简”为主,约11,000枚。另外包括黄文弼“罗布淖尔汉简”(58枚),以及夏鼐、阎文儒“敦煌小方盘城汉简”(76枚)、“武威剌麻湾汉简”(7枚)。可按简号、品名、释文及遗址进行检索。
甲骨文全文影像资料库:由台湾成功大学开发建设,是全文检索与全文影像型数据库。系统主要包括《甲骨文合集》十三册、《殷墟甲骨刻辞摹释总集》上下册以及《殷墟甲骨刻辞类纂》上中下三册。可按照部首笔画和拼音进行检索。整个系统分为影像处理、释文建档、指引片与摹片、系统检索等四部分。资料库中已有甲骨拓片11万张(去除重复后7万多张)、甲骨论著专书1,500册、论文3千篇和考释44万条。
汉达文库:“汉达文库”——甲骨文全文计算机化数据库;“汉达文库”——竹简帛书出土文献计算机数据库;“汉达文库”——金文全文计算机化数据库(参本章第二节台港地区的建设)。
加州柏克莱大学东亚图书馆“中国碑帖”:为全文数据库,其中包括铭文和拓片2,700件。
京都大学人文科学研究所“石刻拓本资料电子档”:包括“画像石”143件和“文字拓本”2,296件(汉99件、魏晋38件、南北朝841件、隋140件、唐900件、元273件)两部分,共计2,439件。
早稻田大学文学部工藤元男研究室“楚简——Database for Internet”:包括楚帛书、天星观楚简、信阳楚简、包山楚简、郭店楚简、曾侯乙墓楚简和望山楚简等。该数据库为全文数据库,具有检索功能,但数据不完整。
三、中医古籍全文数据库
中医药珍善本古籍多媒体数据库:该数据库是国家科技部组织开展的“中医药珍籍秘典的整理抢救”项目的重要成果。为了避免我国珍贵的中医药古籍亡佚,科技部于2001年批准“中医药珍籍秘典的整理抢救”项目,项目由中国中医研究院信息所刘国正主持,中国医史文献研究所、中药研究所、上海中医药大学、南京中医药大学、辽宁中医学院、浙江中医学院等单位的20多位专家参加。课题组从现存的8千余种中医药古籍中筛选出16种宋版、50种元版、389种明版、1,045种清版,共1,400种极具学术价值的珍贵中医典籍,同时收录了146种国内已经失传的中医古籍,并在此基础上建立了“全国中医药珍善本古籍档案管理系统”。系统著录了书名、卷数、附录、成书年代、作者、朝代、别名、籍贯、版刻年代、出版者、提要、书籍特征、书品状况、缺损情况、修复状况和藏书地等详细数据。项目组同时研制完成了“中医药珍善本古籍多媒体数据库”,数据库对320种中医珍善本古籍进行了数字化处理,处理图形15万余页,并对古籍中病、证、方、药进行了准确标注。为了满足读者原文对照的要求,数据库采用了图文版对照阅读形式。2004年8月“中医药珍善本古籍多媒体数据库”通过科技部专家组的验收,专家组称“中医药珍善本古籍多媒体数据库”首次将计算机技术引入到中医古籍整理领域,解决了古籍保护与利用之间的矛盾,既完好地保存了古籍,又方便了中医古籍的检索利用。
《中华医典》数据光盘:《中华医典》数据光盘是中国中医药学会、湖南电子音像出版社、嘉鸿科技开发有限公司联合开发的大型中医古籍电子丛书,为国家“九五”重点电子出版规划项目。《中华医典》共收录我国历代医学古籍1千部,总字数达4亿字。《中华医典》分为医经、诊法、本草、方书、针灸推拿、伤寒金匮、温病、临证、养生食疗外治、医论医案及综合医书等12大类,条理清晰科学。《中华医典》链接有中医辞典数据库,内容包括2,500多条中医名言,6千多个中医名词术语,800多部名著内容,1,200多味中草药生态、功用及彩色图谱,1千多种临床广泛应用的中成药药方及1千多个常用方剂。《中华医典》可以提供全文数据的字、词、句检索。《中华医典》现有完全版(17张CD-ROM)和单盘最新版(1张压缩CD)两种版本,并同时提供网络升级服务。
首都医科大学图书馆中医古籍电子全文数据库:该数据库提供《博物新编》、《几希录》、《诚敬六集》、《傅氏妇科》、《全体新论》、《四言脉诀》、《十药神书》、《伤寒论通注》、《伤寒真方歌括》、《黄帝内经素问译释》、《方论合参》、《妇婴新说》、《时方歌括》、《伤寒汲古》、《影印明钞本周慎斋先生医家秘奥》和《灵素商兑》等340部中医古籍的下载阅读,CAJ格式。
《黄帝内经》计算机检索数据库系统:该系统是天津中医学院2001年开发的中医古籍数据库科技成果(成果登记号:津20020012)。系统按“中国图书资料分类法”对《黄帝内经》一次文献和二次文献进行分类整理和加工重组,使《黄帝内经》中《素问》与《灵枢》两部分内容实现统筹整合,实现原文编排、学术内容检索和有序化多路径检索系统的计算机化,为医学科学工作者学习、研究、查对、引证、应用和开发《黄帝内经》提供全新规范化的现代检索手段。
其他中医古籍全文数据库如,上海中医学院于1987年开发了“《针灸大成》检索系统”;中国医史文献研究所研制开发的“中医古籍文献主体数据库”,该数据库含《本草纲目》、《黄帝内经》、《神农本草经》、《金匮要略》和《伤寒论》等经典中医古籍;南京中医学院研制的“针灸腧穴文献资料检索系统”,包括50多部在我国针灸发展史上影响较大的针灸著作中有关腧穴的资料,可通过多种方式进行查询;陕西中医研究院研发的“针灸甲乙经通检系统”;金图国际中医药数字图书馆建设的“中医古籍资料库”,其中含基本中医古典名著200余部;中国医药健康网“中医古籍”,其中包括《神农本草经》、《金匮要略》、《灵枢》、《难经》和《伤寒论》等13部中医古籍;台湾中医药委员会研制的“电子中医药古籍文献(TCMET)”,可进行《黄帝内经》、《金元四大家》和《景岳全书》的全文检索,数据库共有5个板块,可下载简、繁体两种版本的古籍中医文献。
以上只是中医古籍数据库建设的阶段性成果,随着数字化技术和数字图书馆的完善中医古籍数据库的建设将会不断取得新的进展,许多中医古籍收藏和研究单位正积极参与到中医古籍数据库建设的队伍中来。例如,由中国中医研究院中国医史文献研究所联合全国16个中医药单位共同完成的“中药古代文献数据库”,是“中医药科技信息数据库”项目的重要组成部分。该项目对150种古代中药文献数据库进行数字化处理,包括研究抽取中药古代文献知识结构与学术规律、建立适合基于中药古代文献数据加工的计算机处理方法、制定中药古代文献相关词表、制定中药古代文献数据标引、制定相关技术标准文献以及150种中药古代文献的数据加工与存储。南京中医药大学图书馆正在开发建设的“中医药古籍文献数据库”目前已被列入江苏省高等教育文献保障系统(JALIS)二期工程计划。同时,中医学界也开始重视中医古籍的数字化,国家中医药管理局、国家科学技术部等政府部门已专门立项进行研究开发,中医古籍数字化工作在全国蓬勃开展,在国家中医药管理局和中国中医研究院的领导下,在全国20几所中医药院校和研究机构的共同参与下,已制定出一套系统的中医古籍整理研究和古籍数字化的整理方案和技术标准。另外,从2004年开始,经国家中医药管理局“国中医药继教委发[2004]1号320101003”文批准由中国中医研究院负责开办了三次“中医古籍整理与数字化研究方法”高级研修班。