您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页数字资源整合技术研究

数字资源整合技术研究

来源:意榕旅游网
维普资讯 http://www.cqvip.com

第26卷第4期 河南图书馆学刊 2006年8月 数字资源整合技术研究 徐瑞平 (郑州大学远程教育学院,河南 郑州关键词:数字资源;数字资源整合;整合技术 450052) 摘 要:论述了异构数据库跨库访问、链接访问、元数据整合和基于web服务的体系构建等4种整合技术.分 析了这4种整合技术的优缺点和适用范围。 中图分类号:G250.7 文献标识码:A 文章编号:1003—1588(2006)04-0016-03 数字资源整合就是对各种自主的、异构的乃至 写.但用C语言编写的CGI程序具有执行速度快和 分布式的数字资源.采用各种整合技术实现透明无 安全性高等特点。但这种方法有一个明显缺点,对每 缝地集成.用户在统一的利用环境和界面下.实现 “一一个CGI程序的请求都将在服务器端启动一个新进 步到位”的检索、浏览和使用,从而节省用户的时 程.如果有大量用户同时请求同一个CGI程序.所产 间和精力.提高数字资源的公共获取方便性和获取 生的进程将消耗掉服务器的大部分可用资源.从而 效率。目前实际应用的技术主要有异构数据库跨库 降低服务器的性能 访问技术、链接访问技术、元数据整合技术和基于 W。b服务的体系构建技术等几种类型。 l 异构数据库跨库访问技术 1.2开放式数据库互连技术(ODBC) ODBC是一个应用程序编程接口.由微软公司定 义的Windows操作系统到数据库管理系统的标准接 口.是主要针对C 结构的Web数据库。它包含访问不 所谓异构数据库是指至少具备下述特征之一的 两个或两个以上的数据库:其一是数据模型的异构. 数据模型有层次、网状、关系和面向对象4种类型; 同数据库所要求的ODBC驱动程序及驱动程序所支持 的函数.应用程序通过调用不同的驱动程序所支持的 函数来操纵不同的数据库。若想使应用程序操作不同 其二是数据结构异构.如ORACLE与Sybase数据库 类型的数据库。就要动态链接到不同的驱动程序。 物理模型异构、数据结构不同.而有些数据还是半结 1.3 JAVA数据库互连技术(JDBC) 构或非结构的:其三是系统控制方式不同.有集中式 JDBC是JavaSoft公司设计的用于执行SQL的 与分布式;其四是计算机平台的异构,从巨、大、中、 Java数据库应用编程接口.主要针对B/S结构的Web 小型机到工作站、PC等:其五是通信协议的不同,有 数据库。JDBC由一组用Jaye语言编写的类和接口组 Z39.50、 及非标准等;其六是通信结构模式的不 成.它为数据库应用开发人员和数据库前台工具开 同.有主从模式、C/S模式和B/S模式:其七是操作系 发人员提供了一种标准设计接口.使开发人员可以 统的异构,有UNIX,NT,0S/2,Apache、Sun Solaris 用纯JavaAPI语言编写完整的数据库应用程序。与其 和Linux等;其八是网络的异构,有LAN、WAN、以太 他的数据库存取技术相比.JDBC不仅具有独立于平 总线结构与令牌环结构等 台运行、面向对象、坚固性好的优点,而且具有多线 目前.异构数据库跨库访问技术主要有以下几种 程、用内置检校器来防止病毒入侵等功能。因此特别 1.1公共网关接口技术(CGI) CGI是实现Web与数据库连接的接口协议标 适合于Web异构数据库的访问 1.4 ASP和JSP技术 ASP是一套微软开发的服务器端脚本环境。它 准 Web服务器通过调用CGI程序实现和Web浏览 器的交互,从而实现信息网关、反馈机制、访问数据 本身不是一种脚本语言.只是提供了一种使镶嵌在 库、查询等一系列复杂操作 采用CGI连接数据库的 HTML文档中的脚本程序得以运行的环境.通过它可 最大优点在于其通用性.目前几乎所有的H1-1 服务 以结合HTML网页、ASP语句和ActiveX组件ADO 器都支持CGI。CGI程序可以用任何程序设计语言编 建立动态交互且高效的Web服务器应用程序.从而 收稿日期:2006—05—18 作者简介:徐瑞平(1972-),郑州大学远程教育学院讲师,已发表论文3篇,参编学术专著2部。 l6 维普资讯 http://www.cqvip.com

徐瑞平:数字资源整合技术研究 实现与数据库的对话.通过ODBC与后台数据库相 连.由数据库访问组件执行访库操作。ASP代码在服 访问多个分布的物理数据库。这种模式的网络访问 效率较低。 2链接访问技术 务器端执行.当程序执行完毕后,服务器仅将执行的 结果返回给客户浏览器.这样减轻了客户端浏览器 的负担.大大提高了网络交互的速度。在结构关系 上.ASP是通过ODBC访问数据库,并因此可向上兼 容各类数据。另一种相似的动态网页技术是jsP,是 链接技术有动态和静态两种。前者的链接两端 随着链接环境的改变而改变.不会导致死链问题.但 后者的链接状态是固定的,容易产生死链。 1动态链接技术 由Sun公司于1999年发布的.可以充分发挥Java面 2.动态链接是指在用户需要链接时根据一定规则 向对象编程的强大功能.并使用J2EE标准服务和大 量的Java API。 1.5中间件技术 数据访问中间件技术将存储在多个数据库中的 信息映射成源应用程序或目标应用程序可以访问的 对象.而不需考虑数据库的模型和运行平台.通过同 一界面访问各种类型数据库。这种跨库访问机制可 以把不同类型的源数据库和目标数据库映射成易于 集成的相同模型.将应用程序语言转化为可被目标 数据库理解的语言(如SQL),通过网络传递数据库查 询请求.在目标数据库中执行查询,将响应集转化为 请求应用程序可以理解的格式.通过网络返回到请 求应用程序。通常使用的技术可分为呼叫层接口 (CU)和数据库网关,此外还有为特定数据库设计的 本地中间件。 1.6基于互操作开放协议的跨库访问技术 通过信息提供者互相遵守统一的协议.能够在 系统间的数据交换和服务协作两个层面上实现互操 作。这类协议大多应用于行业内部.如图书馆界书目 共享的Z39.50和出版界的OAI等。Z39.50协议是当 前图书馆采用最多的数字资源整合技术.它通过屏 蔽不同服务提供者的数据库间的异构性.使用户能 够以统一的接口访问所有的Z39.50服务器。但在实 际应用中存在一些问题.如服务器和数据库支持问 题[1-21、服务器与数字资源的导航问题[3]、用户接口的 不一致问题…和对H rrP的支持问题[5]等。OAI是基 于m耶的DC元数据的集中式访问机制.用于构造 一个开放的、级联的和可扩展的数据库访问系统。基 于互操作开放协议的跨库访问要求数字资源提供者 在数据库建立时遵守开放系统互联标准.这种在信 息源方面追求一致的做法对数据库技术层面的要求 高、投入大。难以确保所有信息源都遵守。 跨库访问技术为解决各种异构数据库的统一访 问提供了良好的解决方案。目前。已有很多商业机构 和图书馆在从事跨库访问技术的研发.较有影响的 产品有Webfeat公司的WebFeat Prism.Ex Libris公司 的MetaLib,Endeavor公司的ENCompass。Innovative Interfaces公司的Millennium Access Plus(MAP),斯 坦福大学与IBM联合开发的TSIMMIS.清华同方的 USP等。但在实际应用中.即使一个访问请求也需要 计算链接路径并进行链接。因此可对用户链接前刚 出现的链接对象或位置予以链接.也可在链接计算 规则中嵌人选择规则.实现选择性链接.这种技术主 要有OpenURL和SFX。 OpenURL是一种在Web服务之间传递信息的 机制.由一组已定义好的标识组成.它用来为元数据 或一个信息对象的标识符创建Web传输包。各信息 服务提供商只要遵照因特网信息链接的标准陈述语 法.就可以解析信息提供源所传送的要求,而信息提 供者也可经由此规范.对服务提供者送出深度链接 服务。由于OpenURL具有可定制、可移植、可扩展的 开放特性.目前越来越多的数据库开发商已开始在 产品中支持该协议 SFX主要由一个服务组件构成.服务组件在收到 一个OpenURL之后.将解析该OpenURL获得元数 据.或通过该OpenURL提供的标识符到相关服务器 上获得元数据。然后通过这些元数据,并根据资源情 况和订购政策产生恰当的链接。SF'x使各类复杂的数 据和信息之间的关联变成简单的链接.它不仅能完成 从二次文献到全文的链接。还能实现从文摘到文摘、 全文到全文的链接.使所有的数字资源形成一个完全 融合的整体。SFX技术在实际应用中存在的问题是各 数据库根据OpenURL标准制定的接口有很大差异. 若要根据自己的需求自行开发依然比较困难[61。此外, SF'x技术对检索数据还需要在二次检索的扩展服务 中完成“一步到位式”参考链接[7-tll。 这种链接技术与Z39.50相比.在实际应用中被接 受的程度比较理想。虽然该技术本身还存在诸多问题. 但由于其具有的良好可扩展性.为如何解决数字资源 基矛内容的相关性问题提供了值得推广的应用方案。 2.2静态链接技术 静态链接的基本特征是将链接属性直接写为某 一固定URL。用户直接点击就可链接到对象。最常见 的应用是图书馆内部OPAC书目数据库与其他类型 数字资源的整合.在MARC记录里增加856字段 (“电子资源地址与存取”字段)。用于记录被著录的数 字资源的存取地址和存取方式。这种技术实现起来比 较简单。但局限性很大。静态链接属于上下文不相关 链接。无法实现机构端本地化控制.更新和维护比较 17 维普资讯 http://www.cqvip.com

i 徐瑞平:数字资源整合技术研究 困难.链接对象的任何细微变化都会引起链接的失 效。 其核心包括SOAP、WSDL和UDDI,并均以标准的 XML文档形式表达.是一种比较理想的基于Web的 3元数据整合技术 数字资源无序、异构及封闭问题的解决方案。 Web服务的实现过程是:通过XML统一数据描 跨库访问技术解决了分布式异构型数据库的访 述格式.封装各类数字资源。形成标准的信息系统接 问.链接技术提供了动态和静态的链接机制.但都无 口定义方式:利用SOAP协议统一数据的交换格式, 法实现数字资源中的知识发现 数字资源整合中的 保障数字资源在异构平台之间的无障碍传输.SOAP 知识发现技术属于比较深层的整合技术.目前各种 元数据层的创建和应用是这类整合技术的核心 3.1 XML元数据层 目前.存在有各种类型的数字对象存储格式和 描述标准。即使不同数据库(包括异构数据库)之间 实现了数字对象互操作.但由于缺乏或没有遵守统 一的描述标准.数字资源的公共获取仍存在诸多障 碍。因此.只有构建一个简单统一的元数据标准方案 和开放的元数据表达格式.用于描述不同数字资源 的属性.才能方便公共获取.并在一定程度上实现知 识发现 Dublin Core元数据方案作为W3C的一个 推荐标准.由于其简单易用。已被众多数字资源系统 直接或间接采纳.具有很大的推广前景。XML具有很 强的可读性、可扩展性及良好的数据存储格式。并具 备高度结构化、粒状更新和便于网络传输等特点。已 成为目前数据交换和公共获取的事实通用标准 建 立采用标准的元数据集和基于XML的RDF数字资 源描述体系的元数据中间层.可将不同类型的数字 资源进行封装.从而实现各种数据库在元数据层面 上的公共获取 3.2知识本体(Ontology) ̄数据应用 元数据为解决网络资源的互操作提供了语义基 础,但不能解决信息系统之间的语义异构问题。包括 采用不同元数据方案所造成的微观结构的异构以及 资源对象之间存在的复杂关联关系。Ontology作为标 准化和形式化的领域本体.能够为信息系统之间的 高层互操作提供良好工具.并能在元数据之上再建 立一层机制,为信息的组织和公共获取提供模型。 Ontology非常适合描述信息系统中采用不同元 数据方案的不同实体对象之间复杂的关联关系.提 供与元数据有关的语义描述的知识地图。元数据交 换协议能够实现元数据之间的映射.但对于元数据 及信息系统之间的互操作.还要在元数据交换协议 基础上采用知识本体.实现这些元数据方案之间的 语义映射、不同元素之间的关系定义及规则约束。从 而真正实现这些异构分布系统之间的语义互操作 4基于Web服务的体系构建技术 Web服务是一种真正跨平台的数据集成技术. 18 协议使得Web服务具有与平台和程序语言无关的特 性.可满足数字资源分布于不同操作系统平台、使用 不同语言编程、应用于不同场合的需要;通过Web服 务的组件对象模型.封装原有数据和逻辑。并通过 WSDL提供服务接口描述.可屏蔽不同软件平台的差 异.提供统一的访问接口:利用UDDI的统一描述、发 现、集成机制。发现并集成不同的Web服务,实现数 字资源的发布与共享 当相关服务发生了接口或者 功能上的更改时.仍可以通过服务的描述性文档及 时地发现.并自动调整.可以动态实时地整合数字资 源和服务 各种数据库的跨库访问是实现数字资源公共获 取的主要手段。国外已研制并推出了很多产品,并已 在各个领域(包括图书馆)都有很广泛的成功应用。 但由于国内的数据库信息资源和网络环境的复杂性 和特殊性.国外的产品要解决国内数据库公共获取。 目前还有一定的难度.而且国外产品价格昂贵,因此 国内应该借鉴国外的技术.开发出自有知识产权的 成熟产品 参考文献: 『1] 周斌等.Z39.50协议的原理及其在分布式检索 中的应用【J].计算机工程,2002,(9). 『2] 陈培久.Z39.50协议应用的比较研究[I].情报 学报,2001,(1). [3] 张奇,赵亮.Z39.50在因特网上的应用[I].现代 图书情报技术,2000,(3). 『4] 苏桂兰等.基于Z39.50的日本图书馆[I].高校 图书馆工作,20o2,(1). 『5] 陈敏.Z39.50协议在俄罗斯的应用[I].大学图 书馆学报,20o2,(2). [6] 李爱国,汪社教.学术信息资源整合工具:SFX 及其启示【J].网络资源与建设,2003,(3). [7] 李富玲,卢振波.SFX:信息资源整合新工具【J]. 现代图书情报技术,2005,(6). [8] 黄镝.SFX:电子信息资源整合的利器[I].图书 馆杂志,2004,(3). 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务