男科 妇科 骨科 耳鼻喉 肛肠 泌尿 不孕不育 皮肤病 口腔 肿瘤 糖尿病 眼病 性病 肝病 心血管 更多
中医网
您的位置:首页 > 中医学习 > 中医书籍 > 文献研究 > 正文

计算机检索方法学与中医药文献数据库研究综述


注意阅读时间,健康用眼! 2012-06-13   中医诊疗网  www.zlnow.com

    术语之间还存在更复杂的关系,即域无关(corpus-independent)的情况。这是确立术语之间相互关系的另一种方法,它要求对书写文献的基本词汇进行研究,包括从构造词表到对自然语言进行处理的一系列过程。目前对这一方法的研究是以WordNet的语义网络结构为基础的,但还未取得预期的结果。不过已进行的研究表明:在一个显示术语与术语之间相互关系的通用网络中无法找到所要求的特殊关系。因此,研究的方向就是发展与各领域的基本概念相对应的术语与术语之间的关系的特定领域网络,这与人工智能中得到的一个结论相类似――要解决一个特定问题,就要发展特定领域知识。[9]把这一结论应用于中医药学古籍文献的检索中,非常具有指导意义,它提示我们必须深入到中医古籍特有的语词规律中去,发展特定的标引体系。如果照搬其他医学文献的标引方法,将是行不通的。

    自动做文摘和抽取主题句也是一种可以考虑的标引方法。系统通过自动做出文摘和抽取文中的关键句子和重要公式,可以向用户描述数据空间,从而有助于测度和明确信息需求。分散/集中方法通过为用户提供题名和短语、跟踪用户的抉择,可以帮助用户构造尽可能简洁明了的提问式。

    经过多年的不断发展和完善,目前已建立起检索编码,但存在的不足是:一个程序无法显示它的设计原则的所有特征,这就导致遵循相同原则设计的系统在运作时会出现相当大的差别。由此引起的问题领域包括:(1)在减少某一空间时所需进行的维度选择;(2)为科霍南算法选择意识参数(conscience parameters);(3)选择可改变“文献频率参数”的区间;(4)对词干规则和非用词表的特定选择;(5)建立代表概念的术语集。这几方面都影响系统绩效,但由于系统极其复杂,要想把每一选择所造成的影响独立出来加以考虑非常困难。

    当代信息检索方法无论是在理论层次上,还是在实践中都显示出一种成熟的技术特质,通过对实践经验的不断积累,可以有效地推进理论的发展。

    中医药文献检索方法的进展

    国内在中医药文献方面的理论研究新成果相对较少,尤其缺乏创新性成果。由于建设大型数据库方面要耗费大量的财力、人力,在一定程度上限制了这方面的大型项目的开展,所以可供参考信息的不多。

    建设全国中医药信息网络的设想数年前就有人提出,中国中医研究院在1987年就初步建成我国第一个综合性的《中医药文献分析检索系统》(TCMLARS),收录1984~1987年全国公开发行的300余种生物医学期刊中有关中医、中药、针灸、按摩、气功、养生保健、民族医药等内容的文献十多万条。这个数据库在当时能与国内外主要生物医学数据库兼容,但在时差和收录范围方面则显得落后,而这两项恰好是检索工具先进性的主要标志。[10]“上海市中医药信息协作中心”提出的局域网拓扑结构为总线型与星型相结合,采用Windows NT4.0网络操作系统。该系统大致有以下几方面的应用:(1)行政办公;(2)中医函授;(3)情报文献,网上刊物,报刊摘要,学术动态;(4)学术交流,开设杏林论苑;(5)医药服务,远程会诊,网上就医,健康咨询,药品介绍等。[11]目前,国内已经出现商业性的期刊检索数据库,其中也包含了医药类期刊,如http://www.cnki.net(CNKI数据库)。

    在中医文献的数字化方面的工作,上海中医药大学计算机中心开展得比较早,在数据库的中医特色化上有许多创新思路,值得借鉴。他们最早提出整合性关系化医学电子书(IRMEB)的概念,探索医学的数学和信息学内涵,致力于医学的定量化、数学化、信息化的新研究QMSOC(医学的计算机定量模拟和运算)或信息医学(Information Medicine)的一部分。IRMEB尽可能地把医学的最实质的知识元素化,把知识的表达方式归结为一种结构严格一致的关系形式。将各种专门的知识以诸如“生成”、“组成(所属)”、“激扬”、“阻抑”、“量序”、“时序”、“度序”等构成知识的基本谓词,编辑成知识“积木块”,然后对任何大小范围的医学信息和知识进行重新组装,并利用医学知识的内在的数学属性加以整合互通、互导、互析、互晰等。[12]

微信搜索“zhongyikong”并关注,每天体验中医之道。
友情提示,一切诊断与治疗请遵从医生指导。京ICP备14033551号-10