中医药古籍文献数据库建设研究与思考

  浏览量:0
2018年05月31日 16:04来源于:中国医药导报
分享:
回族古籍文献数据库建设探讨.pdf杨其霖田思胜马梅青[摘要]中医药古籍文献数据库建设是一项长期而系统的工程,其原则主要在于标准化和规范化。本文通过总结与研究近年来中医药古籍文献数据库发展现状,结合实地考察,

回族古籍文献数据库建设探讨.pdf

杨其霖 田思胜 马梅青

[摘要] 中医药古籍文献数据库建设是一项长期而系统的工程,其原则主要在于标准化和规范化。本文通过总结与研究近年来中医药古籍文献数据库发展现状,结合实地考察,阐述中医药古籍文献数据库建设标准及应用范围。发现中医药古籍文献数据库建设一般分为:元数据加工、图文关联、数字化处理、构建服务平台、版权维护等过程。完善中医药古籍文献数据库,可以更好地运用数据库建设发展中医药文化,服务于广大中医药学者。

[关键词] 中医药古籍;数据库;数字化

[中图分类号] R2-03 [文献标识码] A [文章编号] 1673-7210(2018)03(a)-0119-04

[Abstract] The construction of ancient literature database of traditional Chinese medicine is a long-term and systematic project, its principle mainly lies in standardization and standardization. This paper expounds the construction standard and application scope of ancient Chinese medicine literature database, through summarized and researched the development status of ancient Chinese literature database of traditional Chinese medicine in recent years combination with field investigation. It is found that the database construction of ancient Chinese medicine literature is generally divided into those parts: metadata processing, graph and text association, digital processing, construction of service platform, copyright maintenance and so on. To improve the database of traditional Chinese medicine literature which can make better use of database construction to develop the culture of traditional Chinese medicine, and better serve the majority of Chinese medicine scholars.

[Key words] Ancient Chinese medicine books; Database; Digital

中醫药古籍文献是中华民族智慧的结晶,是中医药学习的本源。汇载着上古春秋至明清时期我国中医药学发展的成就,在中医药学发展史中具有重要地位。但是使用者在查找、阅读和利用中医古文献上却存在着很多的不便。随着计算机、网络技术的迅速发展,数字化中医古籍为其有效利用开辟了新的途径[1]。中医古籍的数字化处理与隐性知识的挖掘与分析是在对中医古籍保护的基础上进行的二次开发应用,能够满足对中医药文化传承以及中医诊疗理论的研究和发展的需求[2]。本文主要阐述中医药古籍文献数据库发展现状及建设。

1 中医药古籍文献数据库发展现状

古籍数字化是指利用现代技术将古籍中的文字图像信息转化为能被计算机识别的数字符号,形成书目数据库、全文数据库和知识库[3]。运用数字化技术更好地保护、利用、挖掘古籍知识。中国大陆古籍成规模的数字化工作基本是由教学和研究机构、图书馆、商业机构三个类型部门完成[4]。从目前数字化成果来看,中医药古籍数字化建设形式主要有书目型数据库、全文型数据库、全图像型数据库、图文型数据库[5]、古籍知识库[6]。

目前,各大中医药类院校基本都建立了各自的中医药古籍数据库,资源元数据主要来源于各自的图书馆馆藏。⑴中国中医科学院图书馆数据库。其数据库可以通过中医药古籍阅览系统实现电子阅览。其主要功能如下:①中医药古籍在线编辑。可以实现对数字化的中医药古籍图像进行在线图文标注和文本化加工。②多途径检索。数据库的搜索平台具有简单查询、组合查询和全文搜索功能。简单查询可对书名、作者、馆藏地、内容提要等字段进行检索。组合查询可对书名、作者、馆藏地、内容提要等检索项进行组合检索,可以提高检索精度。全文检索功能包括多种匹配检索及后控词检索,如具图文检索、模糊检索、精确检索、生僻字及后控检索等多途径的检索功能,大大提高了检索的精准度。③用户的在线图文阅览。通过阅览系统可以对数据库中的中医药古籍的基本信息、原文图像、横竖文本进行在线阅览。④阅览管理。数据库和阅览系统的管理功能能够对系统、古籍和用户进行有效的管理和数据统计,保障电子古籍的科学利用和数据的安全性。⑵南京中医药大学古籍数据库。南京中医药大学图书馆以馆藏特色古籍为基础建设的全文型数据库。目前入库古籍达200余册,数据库采用图文关联。既能保持数据库原貌,又具有现代文本的检索功能。目前数据库正在不断添加整理之中。⑶浙江中医药大学善本古籍多媒体数据库。浙江中医药大学图书馆研制的古籍全文数据库,可以对馆藏的61种中医药孤、善本古籍进行在线阅览,内容包括针灸、中药、临床各科、养生等方面。同时,该馆建设的“中医药古籍数据库”收录了浙江医家古籍目录数据、全文数据、医案数据、医家传记数据、浙医流派数据、浙医古籍导读等3万余条[7]。

就其他商业机构对中医药古籍文献数据库的建设来说,《中华医典》目前已收录中医药古籍近千种;龙语瀚堂典籍数据库中有专门的中医药文献库;《文渊阁四库全书电子版》中设立了中医药专版;爱如生系列数据库也推出了医书集成产品;金图国际中医药古籍资料库、国学宝典等数据库中都含有大量的中医药书籍。此外,即将投入使用的中医药古籍资源数据库已收录中医药古籍850余种,在建的中医药古代文献知识库也已收录了大量中医药古籍[8]。

2 中医药古籍文献数据库建设一般过程

2.1 元数据加工

对于元数据的加工,主要是将搜集规整到位的古籍文献进行分类。其主要研究依据在于:合理运用《中国中医古籍总目》的分类方法。主要分为:医经、基础理论、伤寒金匮、诊法、针灸推拿、本草、方书、临床各科、养生、医案医治医类、医史、综合性著作、其他等。在这个基础上再细分子类[9]。标明:书名、作者、馆藏地、内容提要。注明:分类、出版年代、出版者、版本项、版式、卷数、书籍特征、保存状况、复制状况、责任者等[10]。对于版本的选择,首选年代久远的珍善本古籍。在进行拍照时将相机设定为室内拍照模式、自然光线、不采用闪光灯,用三角架固定相机避免抖动。拍照时要求原书完整,清晰尽可能拍下原貌。在完成一定量拍照工作后,对拍摄照片的顺序、偏斜度、完整性、清晰度进行检查,进行纠偏、去污等处理[11]。图像数据录入采用SD卡拷贝+扫描仪扫描的方法。文档的录入则将人工录入+资源下载两种方法有机的结合。录入过程中严格执行录入规范、标注清晰、重命名准确。以免错误录入,重复录入。

进行数字化处理过程中,应采取多种手段加强图像扫描和图像加工的色彩管理。原则上,图片分辨率不低于300 dpi,色彩为RGB模式,储存为高品质TIFF/JPBG格式。文本数据加工采用OCR识别,辅以人工校对[12]。

2.2 进行图文关联

图文关联,即将古籍文献分别储存为图像,文本两种形式。将文本对应放在与之相匹配的图像下,并建立索引关系,实现图文对照[13]。这样一来,既能保持中医药古籍原貌,又具有现代文本的检索功能,为读者提供快捷有效的检索、统计、整理和编辑功能。图文结合的方式优势明显,是古籍建库中较多采用的一种方式。

2.3 数字化处理

具体图像的数字化处理分为以下几项。①图像的名称。②图像的分类。分为疾病图、诊断图、医疗图、药物图、器具图、养生图、脏腑图、经穴图、部位图、理论图、符咒图、人物图,共12个一级类目。其下设有相应的二级、三级类目。③图像的主题。④图中文字:图像中起到标记、指示等作用的文字。原则上,图像线条之内的、图像边框之内的文字一般视为“图中文字”。或文字不在图内,但指示的为图中位置,亦视为“图中文字”。⑤释图文字:图像外对其本体起到解释、阐释等作用的文字。根据特定研究工作的需要,还可进一步对释图文字进行必要的细化标引,针对不同类型图像的释图文字,制定相应的扩展元数据。如针对疾病图设置证候表现、辨证分析、治则治法、处方用药等扩展元数据。⑥相关图像:与标引对象有关联的其他图像。⑦备注:关于图像本体需要备注说明的内容。包括时代背景、学术渊源、流传脉络等等[14]。所有图像的标引工作均在“中医药古籍图像标引系统”中完成。

古籍书目信息的数字化处理分为以下几项。①序号:古籍在《中国中医药古籍总目》中的顺序号为古籍在此系统中的唯一标识。②作者信息:每本古籍的作者及注释整理者等。包括作者的别称:字、号、尊称、谥号、官职等。③责任方式:作者对该书的责任方式。包括:撰著、纂、修、注、辑注、编辑、校注、编注、图注、集注、编、辑、译、绘、书、篆刻等。④版本信息:分“版本信息”“馆藏信息”“调研信息”“备注信息”四组进行标引。⑤所属丛书:该版本所属的丛书。⑥馆藏信息:该版本古籍所藏的图书馆。⑦索书号:该古籍所在整理过程中的编号。⑧调研信息:此组标引在文献研究所实地查阅过程中,《中医药古籍图像调查表》上所填写的原始调研记录。包括每本古籍中所刊载的图总数、获图总数、墨线插图数、彩绘插图数、书影总数。单位均为“幅”。⑨备注信息版本形态:对于书本实体形态的描述。包括行款、装订方式和板框形制等。⑩任务备注:关于此标引任务的备注说明。包括任务中关于图像种类、数据完整性、拟分配标引人员等备注信息。

建立数据库时,严格遵守《CALIS特色库管理型元数据规范》《古籍描述元数据规范》《CALIS特色库子项目参见馆本地系统基本技术规范》。以便今后条件成熟时申请加入CALIS数据库建设与共享项目,在购买CSLIS专业特色数据库开发软件时,实现数据库的平滑迁移[11]。

2.4 构建服务平台

服务平台采取B/S模式,即浏览器/服务器模式。用户只需在浏览器中打开该网站网页进行检索和浏览,不需下载任何客户端。网页顶部放置網站名称,标志与广告横幅。紧接着网页顶部下面一栏是对产品类别,服务的简介及导航等。左侧为内容分类等。右侧为登录框和搜索等。网页底端放置网站的辅助信息[15]。服务平台的帮助工具:放大镜,图片管理软件等。相应内容的参考工具:历史年表,干支纪年表,纪年换算表,六十四卦,参考文献等[16]。

①条目检索:限定时代、版本、书名、篇目、作者等条件进行检索。②全文检索:输入任意字、词或字符串进行检索。③高级检索:可以进行多次检索,可以保存最近一次检索结果。其共有三种检索模式:①绝对精准模式,不对检索条件启动任何处理;②精准模式,启动简繁体和异体字转换;③模糊模式,启动人工智能分词检索和简繁体、异体字转换[17]。

2.5 版权维护

对于涉及机构内部藏品著作版权维护问题,可以采用加盖水印的方法加以解决。在对用户的分级上,采用普通用户、高级用户和管理用户三级分类法。屏蔽普通用户的鼠标右键拷贝、粘贴和打印功能。高级用户下载图片和文档需向管理用户申请授权或者支付相应的公益支援性费用。管理用户有权上传或管理图片及文档。同时,在数据库平台的基础上,研究设立中医药古籍论坛。作用在于丰富用户体验,提供宝贵意见,促进中医药古籍文献数据库平稳运行。

3 思考与展望

从某种意义上说,中医古籍数字化的价值不仅在于它能从浩如烟海的中医古籍文献中更有目标性地检索资料,更在于整理文献资料后,各类知识相互支撑、相互解释,最终形成学科知识链,这才是中医古籍数字化的最高目标[18]。权威统计表明,我国公藏机构已经拥有超过20亿的数字化文本格式的古籍,一些已成规模的大型数据库还在原有的基础上不断拓展和完善[19-20]。随着科学技术日新月异的发展,数字化和多媒体信息化逐步应用于各个领域,渗透到各个行业。其便捷性、针对性、直观性,可以对广泛的用户群体提供更加精准的信息提供。中医药古籍文献数据库保障体系建设与应用,以中医药古籍文献元数据的录入为基础,以网络数字化為依托,以创建搜索引擎为平台,以更加全面的中医药古籍学习专业工具为补充,将实体与数字化结合,将“古”与“今”结合。

中医中药学是中华文明的重要组成部分,自从华夏文明伊始,一直在历史的长河中护佑着中华民族。中医药中药自身所具有的优势和疗效,经得起时间的考验和临床的检验。随着国内外越来越多的人受益于中医药、了解中医药、学习中医药、研究中医药,使得中医药类文化知识和书籍受到越来越广泛的关注。

中医药古籍文献数据库保障体系建设与应用,基于计算机数字化技术,采用“原图原貌”的图像实现中医药古籍的永久保存和再生性保护。通过网络化共享,电子化方式实现显性信息的阅览、检索。通过数据库与知识挖掘技术实现古籍隐性信息的分析和服务。其优势性、可行性、必然性在中医药事业的快速发展中得到了充分的体现。也将会在今后的科研、临床、古籍开发利用等方面发挥出重要的作用。

[参考文献]

[1] 王春颖.方书古籍数字化实践研究[D].哈尔滨:黑龙江中医药大学,2015.

[2] 方家选,周青玲,李国栋.中医古籍数据库的建设与应用[J].中国科技信息,2015(5):116-117.

[3] 漆胜兰.2004-2014年中医药古籍数据库建设研究进展[J].中国中医药图书情报杂志,2015,39(1):60-62.

[4] 陈力.中文古籍数字化方法之检讨[J].国家图书馆学刊,2005,14(3):11-16.

[5] 龚娅君,刘春金.中医药古籍数字化建设[J].浙江大学学报:人文社会科学版,2006,36(4):174-176.

[6] 杨继红.中医药古籍数字化资源建设概述[J].现代情报,2008,28(5):136-138.

[7] 李兵,符永驰,张华敏,等.中医药行业古籍数据库的建设与服务[J].西部中医药,2014,27(2):85-87.

[8] 李兵.常用中医药古籍数据库评价与分析[J].江西中医药学院学报,2009,32(2):86-88.

[9] 李斌,符永驰,王蕊,等.中医药古籍资源数据库及阅览系统的功能设计与实现[J].广州中医药大学学报,2010, 27(6):624-627.

[10] 赵士斌,杨艳红,陈金,等.中医药古籍数字化的现状与必要性[J].中国市场,2015(24):191-192.

[11] 程静,杨朝晖.关于中医古籍数字化建设的探讨——以天津医学高等专科学校为例[J].图书馆工作与研究,2012(9):110-111.

[12] 李兵,刘国正,符永驰,等.中医药古籍数字化整理方案探讨[J].中国数字医学,2010,5(5):33-35.

[13] 李兵,刘国正,符永驰,等.从中医药古籍数据库建设看中医药古籍数字化[J].中国中医药信息杂志,2009,16(3):92-93.

[14] 丁侃,胡晓峰,张丽君.解析“中医药古籍图像数据库”的图像标引[J].西部中医药,2016,29(5):48-51.

[15] 邓仲华,彭丽娟,陆颖隽.古籍数据库的交互界面设计研究[J].图书馆学研究,2014(8):31-35.

[16] 李兵,贾守凯.常用中医药古籍数据库评价与分析[J].陕西中医药学院学报,2009,32(4):86-87.

[17] 王大盈.《中国基本古籍库》和《瀚堂典藏》两大古籍数据库比较研究[J].情报杂志,2011,30(S1):157-158, 161.

[18] 林竹鸣,朱翠萍.古籍数字化的历史、现状及问题探析[J].淮北师范大学学报:哲学社会科学版,2014,35(6):192-194.

[19] 孙显斌,李伟.古籍数据库化工作浅谈[J].图书馆理论与实践,2012(8):23-25.

[20] 吴茗.GIS技术在古籍数字化资源建设中的应用[J].图书馆学刊,2016,38(4):55-58.


分享:
相关阅读
古籍 中医药 数据库

佐力药业助力世界高血压日|精准测量,有效控制,

每年的5月17日被定为世界高血压日,旨在提升公众对高血压的认识。2024年5月17日,我们迎来了第20个世界高血压日。今年的主题是精准测量,有效控制,健康长寿。图片来源:世界卫

2024-05-17

新技术:超声引导下神经阻滞麻醉让您减轻术后疼痛

疼痛一直是人们对做手术感到恐惧的原因之一,随着人们生活质量的提高,对于术后疼痛的治疗也成了人们关注的重点。神经阻滞不仅可以满足一些麻醉需求,临床上还可以用来治疗

2024-05-16

钙尔奇“越走越带劲”公益行走活动重磅开启

人人可参与 随时可参与 让骨骼健康融入生活日常(2024年5月14日,中国上海)世界卫生组织指出,运动不足已成为全球第四大死亡风险因素。调查显示,我国成年人经常锻炼率仅1

2024-05-16

明治佰乐益优R-1风味酸乳荣获第二届上海市营养创

2024年5月13日,明治(中国)投资有限公司(以下简称明治中国)参加由上海市国民营养指导委员会、上海市卫生健康委员会、上海市疾病预防控制局作为主办单位的第二届上海市

2024-05-16