首页 > 范文大全 > 正文

基于用户个性化需求的数字图书馆集成服务研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于用户个性化需求的数字图书馆集成服务研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]提出一个基于用户个性化需求数字图书馆集成服务框架,并论述服务的具体实现。该框架综合考虑用户的环境、偏好、需求以及数字图书馆服务组件的功能,主要利用Web services技术实现不同数字图书馆系统中符合用户需求的子系统和组件的动态集成,以满足用户的个性化需求。

[关键词]集成服务 个性化 数字图书馆 Web services

[分类号]G250.76

数字图书馆经过了基于数字化资源的发展阶段之后,已经进入基于信息服务集成化、用户服务个性化的发展阶段。随着网络技术的进步,用户希望数字图书馆不仅能够提供集成化的服务,而且能够提供个性化的服务。因此,如何根据用户的个性化需求特点,集成数字图书馆的服务,实现对多个数字图书馆的透明访问,是当前数字图书馆发展面临的重要问题。

1 现有数字图书馆集成服务研究的不足

所谓服务集成就是将两个或多个服务(尤其是异构环境的服务)通过相互间的协调、通信、合作,共同完成一个较复杂功能。数字图书馆集成服务也就是在用户特定任务需求的驱动下,利用统一的服务调度机制,实现多个数字图书馆服务的动态集成,共同满足用户的需求。

数字图书馆是一个十分复杂的系统,实现数字图书馆的集成服务面临着自治性、分布性和异构性三大挑战。目前关于数字图书馆系统之间的集成,相关研究已经提出利用中介器/包装器、元搜索引擎、网格调度等一些解决方案。在数字图书馆中,数据源集成是提供集成服务的基础,也是信息集成服务的关键所在。异构性是数据源集成面临的普遍问题,数据源的异构主要表现在4个方面:系统异构;语法异构;结构异构;语义异构。目前关于数据集成方法和集成技术的研究比较多,其中本体作为解决语义集成的主要方法,近年来受到研究者的关注。本体在异构信息源集成中的作用是:信息源语义的明确描述、作为全局查询模型、描述从全局模式到局部模式映射的具体说明。因此,有研究就提出利用本体作为信息源的元数据描述,通过元数据和互操作可以实现多种信息源的集成视图。这些研究虽然为数字图书馆集成服务提供了一定的解决方案,但是却忽略了用户的个性化需求。

面向信息资源――面向信息交流过程――面向信息用户是信息服务发展的客观规律。面向信息用户是指针对每一个用户的独特需求提供有针对性的服务。数字图书馆集成的目的不是为了解决单个的检索需求,而是面向用户的个性化需求提供持久的跟踪服务,支持个性化的集成检索服务和主动的推送服务。然而,目前的数字资源整合系统非常关注资源的集成与整合,而较为忽略用户需求方面的个性化和差异性。用户需求是多样的,面向用户个性化需求构建的整合系统将成为未来的趋势。因此,如何根据用户的个性化需求对数字图书馆进行集成是数字图书馆集成服务的发展方向。

2 基于用户个性化需求的数字图书馆集成服务框架

在数字图书馆中,用户的个性化需求可能非常复杂,单个数字图书馆的资源和服务往往无法满足用户的需要,这就需要将若干个数字图书馆的资源、服务或其组件按一定的逻辑进行组合。面对一批数字图书馆服务,如何找到最符合用户兴趣偏好的服务,是个性化服务需要解决的关键问题。基于用户个性化需求的数字图书馆集成服务主要依赖的不是各个数字图书馆系统之间的整体集成,而应该是不同数字图书馆系统中符合用户需求的组件之间的动态集成。因此,如何根据用户的个性化需求将不同数字图书馆系统中相关的资源组件、服务组件、应用组件等进行动态集成,是需要解决的关键问题。

Web services是通过Internet可获得的、向其他应用软件提供某些类型服务的应用软件,这种技术主要用于解决异构分布式应用的集成问题,能够实现分布式环境下各种Web服务的发现、调用和组合。Webservices的基本思想是把软件组件当作一种服务,并提供一套描述、、查找和调用这些服务的技术规范,采用HTTP、XML、WSDL、UDDI、SOAP等标准和协议来实现。Web services协议的作用是:发现服务(通过UDDI实现)、理解如何获得服务(通过WSDL实现)、获得并使用服务(通过SOAP实现)。Web services的一大优势是其服务组合能力,它强调了用户需求的复杂性和单个Web服务在满足用户需求方面的不足。因此,Web services技术为基于用户个性化需求将不同数字图书馆系统中有用的资源组件、服务组件、应用组件进行发现和动态组合提供了一种有效的机制。

在Web services中,Web服务发现技术能够根据用户请求对服务注册库进行查找,发现相应的服务以供用户调用。但Web服务发现的能力取决于Web服务发现的查全率、查准率和服务质量(QoS)约束。目前,在个性化服务技术中建立用户兴趣模型,扩展用户描述的上下文信息,以达到对用户描述的准确理解,为进一步提高Web服务发现的查全率、查准率提供了一种不同的方法。因此,为了更好地实现个性化的Web服务组合,必须综合考虑用户环境、用户偏好、用户需求以及Web服务功能等一系列的信息。

为了实现Web上广泛分布的、异构的数字图书馆服务组件的集成,本文以Web services技术为主导,提出了一个基于用户个性化需求的数字图书馆集成服务框架(见图1)。利用该框架能够发现数字图书馆服务中符合用户需求的组件,实现组合调用和集成,并且对参与集成的数字图书馆不施加任何约束。

2.1 用户层

在用Web services技术集成数字图书馆的服务时,最关键的问题是服务组合的结果是否与用户真正需求相一致。为了使服务组合符合用户的个性化需求,就要对用户需求信息进行处理,综合考虑用户的兴趣、偏好、需求以及用户所处的情景信息等。因此,用户层的主要功能是捕捉用户所处情景,准确表达用户需求,为Web服务的个性化发现和组合提供前提条件。该层主要包括用户兴趣本体库、领域本体库和用户情景库。其中,用户兴趣本体库用规范化的本体概念描述了用户的兴趣、偏好、专长及其之间的关系。领域本体库包含着一个领域中最基本的概念、概念的定义以及各个概念之间的语义关系网络。用户情景库描述了特定时间内用户所处状态和情形的任何信息,包括用户的位置状态、任务状态、环境状态等。

2.2 中间层

中间层的主要功能是根据用户层提交的个性化需求信息,利用Web services发现能满足用户需求的服务,进行服务的组合与集成,然后,本地数字图书馆根据组合结果,利用Web services的相关协议调用远程数字图书馆的相应服务。将数字图书馆系统的服务利用标准化的WSDL进行描述,同时将数字图书馆的各种服务进行合理拆分,分别对各个组件提供的服务进行

Web服务描述,以包装成较小的Web服务,并在UDDI统一注册登记。这样,Web services发现技术就能根据用户的个性化需求在UDDI中找到符合用户需求的数字图书馆服务组件,实现服务的组合和调用。

2.3 服务层

服务层的功能有两个:一是将数字图书馆服务进行合理的拆分、描述并注册到Web服务中心;二是根据中间层提供的Web服务组合的结果,执行Web服务以获取符合用户需求的资源。本地和远程数字图书馆在进行服务拆分时,可以将Portlet作为Web服务到UDDI注册表中。数字图书馆的各种服务功能组件包括用户认证功能组件、跨库检索功能组件、分类浏览功能组件、搜索引擎功能组件等,相应地,可以将这些组件对应的Portlet作为一个Web服务进行包装。

Porflet(门户构件)是Portal(门户)的核心组件,它是一种特定的基于Java的Web组件,可以产生动态的网页内容,设计聚合大量内容的组合页面。Portlet运行于门户服务器的portlet容器中。Portal为用户提供一种集中的资源接入方式,提供单点登录、内容聚合、个性化门户定制等功能。Web services通过启用门户应用程序,可以将远程的应用程序聚合到本地门户框架中。本地门户可以使用Portlet与远程PorfletWeb服务进行绑定。

3 基于用户个性化需求的数字图书馆集成服务的实现

基于用户个性化需求的数字图书馆集成服务以用户需求为导向,根据个性化需求组合各个数字图书馆的服务组件,其实现流程如下:

・综合考虑用户情景和需求,在用户兴趣本体库和领域本体库的帮助下对用户需求进行个性化处理,以规范化的方式表达用户需求;

・Web services技术根据用户的个性化需求,发现能满足用户任务的服务,并对这些服务进行组合和集成;

・本地门户通过Pordet与能满足用户需求的远程Web服务进行绑定;

・本地和远程的Web服务根据用户的个性化需求执行查询任务,并返回查询结果,由Portal对返回的各种结果进行整理、合并,统一处理后返回给本地或远程的用户使用。

3.1 用户需求的个性化处理

为了准确的表达用户需求的语义,在用户层引入本体对查询任务进行个性化优化处理。其处理过程是:根据用户所处的情景信息,首先将用户需求与用户兴趣本体库进行映射,查验是否已有相似的查询任务,如果有,则按兴趣本体库中的概念表达用户需求;如果没有,系统则查询领域本体库,从中找出出现该关键字的各个领域,将相应领域的相关概念罗列给用户。用户根据自己的查询意图,确定所需查找的领域和含义,选择相应的查询概念,同时可以选择相关词或上下位词进行查询扩展,以完成需求任务的完整表达。与此同时在用户兴趣本体库中记录用户这一新的需求任务。用户需求的个性化处理是有效的服务发现和组合的前提。

3.2 本地和远程Web服务的集成

本地和远程Web服务的集成是指调用远程服务器的应用软件组件,与本地功能组件相结合,将远程数字图书馆的服务整合到本地,实现对远程门户服务访问的无缝集成。数字图书馆门户服务器将Portlet作为Web服务到UDDI注册表后,本地的门户就可以使用Portlet与远程的Porflet服务进行绑定。其实现过程如图2所示:

一个典型的Web services体系结构包括服务提供者、服务注册中心和服务请求者。利用Web$elwice$集成本地和远程服务的过程是:服务提供者(即远程Por-tal服务器)用WSDL协议描述其提供的服务,服务请求者(即本地Portal服务器)在UDDI注册表中查找符合用户需求的Portlet Web服务,获取相应的WSDL描述文件,然后本地的Portlet通过基于XML的SOAP协议传递信息来实现与该服务的绑定。服务提供者和服务请求者的角色不是固定不变的,当本地的Web服务被远程的Web服务调用时,它就成为服务提供者,当调用远程的Web服务为自己所用时就成为服务请求者,从而实现本地和远程服务的动态组合。

3.3 数字图书馆资源的跨库获取

利用Web services技术组合不同数字图书馆的服务组件,其最终目的是通过执行服务满足用户的个性化需求。因此,数字图书馆中通过执行portlet服务,将数字资源提供给用户是个性化服务得以实现的基础。数字图书馆的服务通常包括跨库检索服务、搜索引擎服务、分类浏览服务、用户认证服务等各种Web服务。用户的个性化需求通过数字图书馆门户映射到选定的Portlet服务后,Portlet需要访问特定的信息。Portlet是J2EE中Servlet的一个特殊子集,两者名称、概念、功能和运行方式都很相似,Portlet可以调用Servlett。因此,本文采用Servlet实现对各种数据源的访问。对于跨库检索Portlet,通过调用Servlet实现对多个数据库的查询;搜索引擎Portlet则是通过Google Servlet实现对数字图书馆中网络资源的查询,如图3所示:

图3所示的数字图书馆资源的跨库访问步骤是:

・用户的个性化需求通过Portal分别提交到跨库检索Portlet和搜索引擎Portlet;

・Servlet根据用户需求通过JDBC API访问数据库资源,将查询结果以相应的形式返回到跨库检索Portlet;Google Servlet利用Google许可钥匙(licensekey)和查询参数执行doSearch,Google Web APls以结构化数据格式返回查询结果,Google servlet将结构化数据转换成XML,并最终将XML数据转换成HTML返回到搜索引擎Portlet;

・Portal统一处理各个组件的访问结果,并将最终结果以个性化的形式返回给信息需求者。

图3中,Servlet是用Java Servlet API编写的跨平台的在服务器端运行的应用程序。Servlet采用请求/响应模式提供Web服务,与使用的协议、平台无关,可以有效地实现分布式数据库查询。Servlet可以被链接,接收客户端请求的Servlet本身也可以调用另一个或一系列Servlet,即成为客户端。采用Servlet技术,可以利用JDBC访问Web数据库。JDBC是开放数据库互联(ODBC)的Java实现,具有对硬件平台、操作系统异构性的支持。JDBC API是JDBC的应用编程接口,可以屏蔽DBMS的差异,对于任何数据库,JDBCAPI都是一致的。Google Web APIs是一个Web服务,使开发者能够获取Google的Web搜索并开发软件。利用Google Web APIs,应用程序能检索网上信息,并以结构化数据返回结果,开发者可以根据应用程序的需要编写程序将结构化的结果转换成XML或其他格式。

4 结语

开放环境下,用户对数字图书馆集成服务的个性化要求越来越高。本文提出一个基于用户个性化需求的数字图书馆集成服务框架,该框架综合考虑用户的环境、偏好、需求以及数字图书馆服务的功能,根据用户的个性化需求,利用Web services技术实现不同数字图书馆系统中符合用户需求的子系统和各种组件的动态集成,并利用Servlet技术对数据源进行访问,从而实现个性化的集成检索。该框架还能实现自动捕捉用户需求,根据用户的即时任务自动组合数字图书馆的服务组件,并进行主动推荐服务。但是要真正实现开放环境下数字图书馆服务的个性化集成,最终满足用户的个性化需求,仍有许多问题需要解决,如数字图书馆以及数字图书馆中各个子系统和组件的WSDL描述等。