男科 | 妇科 | 骨科 | 耳鼻喉 | 肛肠 | 泌尿 | 不孕不育 | 皮肤病 | 口腔 | 肿瘤 | 糖尿病 | 眼病 | 性病 | 肝病 | 心血管 | 更多 |
文献资源共享是时代的迫切要求
随着科学技术的飞速进步,人类社会由工业社会向后工业社会——信息社会挺进,社会信息化程度不断地提高,人们越来越重视信息的作用。信息需求的客观性大大刺激了信息技术的发展,全球性的信息网络迅速建立起来。信息资源得以在“信息高速公路”上自由传送,全球性的信息资源共享的梦想终于有望得以实现。
实现文献资源共享是信息社会的客观要求,是现代化技术发展的历史必然。在市场经济的环境下,文献资源的需求更为迫切。实现文献资源共享是我国图书情报事业发展的必然趋势,也是各国图书情报事业发展的重要特点。美国人曾在1850年就提出了编制联合目录的设想,1942年美国制定了进行文献协调补充的“法明顿计划”。1975年,国际图书馆协会联合会(IFLA)将文献资源共享(UAP)正式列为一项中期计划。目前,全世界有上百的检索网络,数以千计机读数据库。仅美国国家医学图书馆医学文献联机检索系统(MEDLINE),其网络由遍布全国的11个地区图书馆中心和800个联机检索点组成,网络还延伸到全世界11个地区和国家,共有3000多个终端。整个系统存贮有79个文献数据库,其中包括350万篇论文及病毒学等专业的数据资料、医学图书馆目录、医学期刊目录等。[1]
Internet是世界上规模最大、用户最多、影响最广的网络互联系统。据估计,Internet上的数据库总数不下1万个,这其中不仅有大量的科技数据库,也有大量的时事评论、社会科学、文学艺术等方面的数据库。北美最大、最有代表性的图书馆资源共享网络要数美国的OCLC和加拿大的ISM了。至1997年3月,OCLC已经发展到24117个成员馆,遍及60多个国家和地区,是世界上最大的专业网络。OCLC中的参考服务系统连接有55个国际上有影响的大型数据库,遵循Z39.50协议,一种检索方式可以访问55个数据库。有的数据库还提供全文,并标有FAX服务的价格。[2]
国际计算机检索方法学的现状和新进展
数据库(Database)是统一管理的相关数据的集合,它能为各种用户所共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。数据库系统(Database System)是指实现有组织地、动态地存储大量的关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。根据ISO.DIS5127号标准(文献与情报工作术语),数据库被定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”[3]按照国际上通用的分类方法,数据库通常划分为以下类型:
1.参考数据库(Reference Databases):指引用户到另一信息源以获得原文或其他细节的一类数据库。它又包括书目数据库和指南数据库。
2.源数据库(Source Databases):指能直接提供原始资料或具体数据的数据库。可划分为:数值数据库、文本-数值数据库、全文数据库、术语数据库、图像数据库、混合型数据库。
计算机检索系统根据存储的数据库内容、文件结构、存储容量、检索方式的不同,可以提供多种内容与形式的检索服务。就全文数据库检索而言,目前的产品的检索方法一般是用布尔(Boolean)逻辑运算和自由词来检索文献中某个词或某几个词所在的出处,也可进行词频检索。当前的检索技术难以做到对检索出的文献按相关程度进行排序,相关程度最大的文献应当排在最前面。布尔检索正是相关程度排序的弱肯定(weak assertion)形式,这种局限性的存在,降低了检索的绩效。[4]
对全文本文献信息检索技术的研究,开始于基于概念(concept-based)的算法,发展到现在的基于内容(content-based)的算法,这一演化反映了对内容知识的检索逐渐取代了对概念知识的检索。每篇文献都是由众多概念构成的,这些概念之间的关系实质上就是文献内容的真实反映,概念之间的相互关系可以称之为“概念结构”。标引和检索文献时,必须如实反映其概念结构,现代检索技术中称之为“事实检索”(message understanding)的检索方法就是追求概念结构的典型形式。目前,普遍应用的是一种基于框架(frame-based)的方法,在这种方法中概念结构被框架化了。[5]