首页 > 范文大全 > 正文

基于开放获取的IR联盟研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于开放获取的IR联盟研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]从论述构建IR联盟的优势入手,说明IR联盟是促进开放获取的有效形式。然后基于国内外IR联盟的发展现状,从组织管理和技术结构两方面分析国外IR联盟的运行和管理机制,最后对我国如何构建IR联盟进行探讨,并给出一些建议。

[关键词]机构知识库 IR联盟 开放获取

[分类号]G235

1 开放获取与IR联盟

开放获取(OA)是对文献的开放存取即意味着它在公共网络可以被免费获取,允许任何用户阅读、下载、复制、分发、打印、检索、超链接该文献的全文信息。有两种实现模式:自存储模式和开放期刊。自存储模式又有两种类型:机构知识库(IR)和学科资料库(DR)。IR是对机构内成员智力产品进行收集、存储、管理并提供开放利用的知识传播与知识服务系统。IR以其特有的优势冲击现有的出版模式,是开放获取的有效实现形式,对于促进发展中国家学术信息的获取与交流,缩小与发达国家之间的信息鸿沟起到了十分重要的作用。

但目前据统计,大部分ir包含的文献内容都偏少,而稍小一些的学术机构通常没有资源建立或支持机构知识库的服务或系统。其原因是IR的发展面临两个难题:资金和内容征集。IR联盟就是在单个IR面临上述尴尬境地时诞生了。所谓IR联盟,就是指几个机构以一个机构为基地联合构建知识库,通过合作的方式,将各自的资源库整合起来,统一提供数字化服务。构建IR联盟可以:①降低成本,吸引更多联盟成员;②丰富资源,加强共享和利用;③统一标准,促进交流和合作;④提升服务,使用户更好地参于开放获取。多个学术机构通过合作的方式,可以将不同IR之间的数据交换和共享,整合资源,跨库检索,统一提供服务。更好的推动开放获取的进程。

2 IR联盟及其发展

在欧美一些发达国家和地区已经出现了很多IR联盟:澳大利亚的ARROW是面向世界的澳大利亚联机研究仓储,该项目由澳大利亚教育、科学与培训部资助,是澳大利亚高等教育研究信息基础设施框架的一部分。

DARENET是荷兰所有大学、荷兰国家图书馆、荷兰王室艺术与科学研究会以及荷兰科研组织等学术机构参加的数字学术仓储网络,目标是将全荷兰的研究成果保存在一个仓储网络中,以便于对它们进行访问。该仓储提供免费检索,参加机构以同样方式进行仓储建设,却只负责与控制属于自己的数据。

SHERPA-LEAP由伦敦大学Birkbeck学院、伦敦帝国理工学院、伦敦大学国王学院、伦敦大学政经学院、伦敦大学皇家豪乐威学院、伦敦大学亚非学院、伦敦大学学院这七个高等教育机构组成的联盟,目的是创建一个以伦敦大学学院为中心的所有合作机构共建的e-prints知识库。以UCL为中心的IR面向所有具有成员库或准备实施IR的高校。

我国对IR进行了理论研究,一些研究机构在实践上也取得了一定的成果。2005年7月,50余所高等院校图书馆在武汉大学签署了“中国大学图书馆合作与资源共享武汉宣言”,呼吁建立一批有特色的“学术机构仓储”,促进学术资源开放获取。中国科学院国家科学图书馆兰州分馆与中国西部环境与生态科学数据中心合作共同建立的一个领域知识平台――中国(西部)环境与生态科学知识积累平台已经在网上正式运行;香港科技大学图书馆早在2001年就加盟SPARC。2003年2月起机构仓储开始运行。主要收有由该校教学科研人员和博士生提交的论文(包括已发表和待发表)、会议论文、预印本、博士学位论文、研究与技术报告、工作论文和演示稿全文等。

3 IR联盟运行机制分析

下面以SHERPA-LEAP和ARROW为例,从组织管理以及技术结构两个方面来分析国外IR联盟的运行机制:

3.1 组织管理

SHERPA-LEAP成员机构都属于伦敦大学联盟,但差异明显,既有较大的、多学科、以研究为主的机构,也有较小的、专业性较强的机构。整个项目由SHERPA-LEAP项目团队负责。项目组由项目总监、项目经理、项目办公人员组成。每年项目总监会主持两到三次项目指导小组讨论会,主题主要是评测项目的进展情况以及讨论进一步完善项目的政策。讨论会的作用是确保项目合作伙伴在战略层次上保持紧密联系。项目经理是项目指导小组的成员之一,工作大概占整个项目全时工作量的10%,对项目进展和项目基金负有主要责任,并且还要监督全职项目专员的工作。项目专员的工作始于项目第二阶段,通常还要负责项目的后期技术支持工作,要给项目成员机构提供所有和eprints相关的如软件配置、元数据、著作权等问题建议和指导。每个成员机构都有一个指定的外勤人员,负责协调知识库管理的日常工作。此外,为了使成员机构在更大范围内受益,项目组还会组织一些公开活动,给成员提供了一个分享知识和经验的平台。

ARROW重点在于元数据采集管理,因此宏观调控职责分配是其核心。ARROW中设有知识库管理小组、ARROW发展小组以及澳大利亚知识库元数据咨询委员会(MARCAR)。在ARROW管理小组中,Monash大学是领导机构,受到New South Wales大学与Swinburne技术大学支持。实现跨库采集联合搜索服务是ARROW建设的关键。澳大利亚国家图书馆通过参与到知识库管理委员会提供专家支持以及进行ARROW资源发现服务以对项目不断发展的需求作出回应。Southern Queensland大学作为电子研究资源项目标识符管理框架的伙伴。澳大利亚知识库元数据咨询委员会(MARCAR)主要负责ARROW中元数据标准的选择应用,并制定和知识库中最佳元数据实践标准。ARROW发展小组对联盟机构知识库进展保持高度关注,根据项目发展情况确定项目的后续研究与应用。ARROW由澳大利亚图书馆统一提供搜索服务,并不意味着各个联盟成员只能通过统一检索界面实现资源被发现,各个联盟成员各自都保持着独立性.用户可以分别进入到各个联盟成员的本地机构知识库进行定题、定范围搜索。每个联盟机构负责制定本地机构知识库提交政策与管理。

3.2 技术结构

在SHERPA-LEAP项目的第一阶段,7个知识库以伦敦大学学院为中心。因为可以从SHERPA.LEAP的技术人员那里获得技术支持,GNU eprInts是首选的开源平台。早期的成员机构都体会到用GNU epfints创建知识库非常快速便捷,并且日后如果需要和其他平台融合,也非常方便。伦敦大学学院仍然在为大多数成员机构提供服务:13个知识库中,有10个都是基于伦敦大学学院的eprints平台,2个是在本地运行的Dspace知识库,还有一个是在本地安装的eprints平台。11个知识库运行在一个服务器上。是按照在一个eprints复本下运行的11个分散的文件进行配置的。SHERPA-LEAP的技术结构使得各个成员机构有了更

多的技术与政策自主空间。每个成员机构都负责对自己的EPrints文档进行配置,以实现本机构特殊要求的功能,从而使知识库具有自己的“机构特色”。成员机构依据所收录的文献类型和格式而实施自己的元数据体系,并逐步完善自己的内容存储流程。

ARROW选择了Fedora软件作为识库的技术基础,由于ARROW是以采集其联盟成员机构知识库元数据为服务方式,所以选择良好的资源搜索发现技术是至关重要的,ARROW在国家图书馆图片服务经验基础之上,选择TeraText软件作为资源发现技术支撑;资源管理是资源发现服务的前提,为了更好的管理资源,ARROW与美国佛吉尼亚著名的VTLS公司建立合作关系,应用该公司以Fedora作为存储层的管理图片集合软件VITAL作为内容工作流程管理层,同时为了将开放获取期刊出版集成到ARROW系统之中,AR-ROW选择了英国哥伦比亚大学公共知识项目研发的开放期刊系统(the Open Joumal Systems),将这一系统与VTLS共同纳入到内容工作流程管理层。在此基础上,ARROW开发设计了符合自身发展需求的管理软件系统,如图1所示:

这样,ARROW应用软件中,Fedora既作为知识库存储层支撑技术,也与VITAL、OJS系统共同作为内容管理层支撑技术,最后选择TeraText实现资源发现服务。为了保证应用的软件系统及时更新与完善,AR-ROW每年都对其选择的软件进行评估,以便做出最佳选择。联盟的其他机构成员都是根据自己机构特点选择其他的应用软件。

4对我国构建IR联盟的建议

4.1 构建IR联盟的几个关键问题

4.1.1 广泛宣传、提高对开放存取及IR的认识相关部门应宣传开放存取对国家科技发展的战略意义以及对科研活动和科技信息传播的重要作用,增加对开放存取和机构库的认识。宣传开放存取的理念,鼓励和支持科学家参与开放存取。

图书馆应该充当宣传开放存取理念的主力军,以讲座、展览、网站专题等形式,使科研工作者了解其运作模式和优点,让更多的科研工作者不仅仅作为开放存取的使用者,而且还成为这种模式的出版者,从而推动开放存取的发展。很多学校图书馆(如哈佛大学、MIT、清华大学、宁波大学等)都在主页上宣传和推荐这种新的学术交流方式,并对开放存取免费资源做了相关链接;而Kansas大学图书馆把它作为一种服务内容,提出建立能充分满足当前和未来研究者需要的学术交流系统,需要教师、图书馆员和出版社的积极合作,并建立了自己的机构库(KU Scholar Works)。

4.1.2 制定促进开放存取和机构库发展的相关政策由于我国的科研资助机制和学术出版机制的特殊性,在我国必须依靠政府来推动开放存取的发展,政府和有关科研管理部门应建立有利于开放存取的研究环境,制订国家和机构的开放存取政策。凡是由国家科研经费资助完成的科研成果在发表后规定时间内存入开放存取的机构库,鼓励科研人员将科研成果提交给机构库。

4.2 构建方法

4.2.1 集中式IR联盟集中式IR联盟是指多个机构只建立一个服务器,各个联盟机构内部成员都直接将元数据与内容提交到集中的服务器上,然后通过统一的服务界面提供服务或作为数据提供方,允许其他服务提供方采集其元数据提供服务,如图2所示:

从论文提交一直到开放利用,所有管理与维护功能都实行集中化管理,但这并不意味着只有负责服务器管理的机构承担管理责任,每个联盟成员都有固定的联络员负责协调机构知识库的统一管理与运行。

集中式IR联盟有效解决了个体建设IR中存在的弊端,使每个机构参与建设的成本大大降低,收到“规模性”的经济效益,机构知识库运行中的固定成本与利用层次上的规模效益也可以实现,对于小型机构来说,加入已有的集中式IR联盟不失为一个节约成本的最佳选择,内容数量增加也是建立在多个机构内部成员基础上实现的,因此从一定意义上说,具有发展的丰富潜力,同时由于集中式IR联盟实行集中管理,可以在技术标准应用方面具有统一性,便于内容元数据管理与开放。

其缺点主要是:①政策制定效率不高,因为必须考虑到多个机构各自的发展历史与发展现状,政策制定过程需要联盟机构成员负责人相互协调,然后进行统筹规划,这一过程大大降低了行政管理效率;②本地机构成员归属感低,集中式IR联盟不能体现每个独立机构的品牌,所以使其成员无法感受到归属感,甚至可能成为影响机构成员提交内容的一个制约因素;③存在其他可能引发联盟管理矛盾的因素,例如当联盟机构成员对机构知识库贡献率或利用率不均衡时,是否会引起行政管理层面的问题等;④对于建立全国范围内或全球范围内多个机构的集中式IR联盟,从文化以及管理角度来说,是不切实际的。集中式IR联盟在具有良好合作历史或者具有共同隶属关系的机构中具有较好的应用前景。

4.2.2 分布式IR联盟分布式IR联盟是指成员分别建立属于自己的知识库,在实现独立搜索基础上,在联盟项目指导下构建统一检索平台,元数据被采集并存储到集中的搜索数据库中,但原始数据仍然保留在本地知识库之中,数据与资源本身都是分布式的,如图3所示:

从论文提交一直到开放利用,所有管理与维护功能都实行集中化管理,在这种模式下,每个联盟成员都具有独立性,负责对本地机构知识库管理以及政策制定,但必须保证知识库遵循相关协议,通常情况下是OAI协议,在此基础上开放元数据,实现分布式IR联盟项目提供的统一元数据搜索。

分布式IR联盟的优点:①成员可以共享技术与经验,如果在建设过程中遇到技术问题,可以首先向其他联盟成员寻求合适的解决方案;②成员在政策制定与管理方面具有高度自治性,每个联盟成员都可以在宏观政策指导下,根据本机构发展特点与学术管理传统,制定符合本地机构知识库发展的政策与管理规划;③成员可以个性化本地机构知识库,体现本地机构知识库的特色,保留本地机构的品牌标志;④成员的成本资助来源扩大,有的时候,中小型机构财政收入有限,又很难得到私人或国家资助委员会的资助,当加入到一个统一的联盟团体之中时,就会通过联盟团体获得更多的资助与支持,既起到共享知识的作用,又减缓了机构有限经费投入的压力。

分布式IR联盟的劣势是由于联盟机构成员的高度自治性,致使成员在本地机构知识库建设中存在着不一致性:①应用软件系统不一致,分布式IR联盟强调成员高度自治性,并不强制采用同一软件,只是推荐推广应用;②元数据标准应用不一致,分布式IR联盟是建立在对各成员本地机构知识库元数据采集基础之上的,选择不同的软件导致各成员机构知识库应用的元数据标准存在不一致,这就需要统一跨库检索时进行元数据转换;③政策制定与管理方面的不一致,联盟领导机构并不能统一制定联盟成员政策与管理模式,每个联盟机构都对本地机构知识库实行自治管理,因此,各个机构在政策制定与管理方面存在着不一致性,同时,每个机构制定与实行的质量审核标准不同,也会使联盟机构知识库内容质量受到影响。

另外,构建IR联盟还可采用联合式等,联合式是集中式和采集式IR联盟的结合,由多个机构组织或特定部门之间,通过协议或者联合组织等方式而结成的IR联盟,它既通过集中提交方式聚合资源,又通过采集方式收集元数据,其优点是降低了各机构的构建成本等,但缺点是效率不高等。限于篇幅,这里不再详细阐述。

不同建设模式都具有其自身的优势与劣势,每个机构都应根据机构传统以及与其他机构合作历史或地域特点或学科特色,选择适合自己的建设模式。对于那些中小型机构来说,如果具有良好的合作历史,或具有共同的隶属关系,例如一个地域、一个学会或图书馆联盟,可以通过建立集中式IR联盟实现资源共享,并可以不断吸收新成员参加,既节约成本,又共享技术与资源,避免不必要的技术系统重复与资源浪费;而对于国家层面的科学资源共建共享规划来说,建立集中式IR联盟不具有可操作性,可以建立分布式IR联盟,既将管理压力分散到各个本地机构知识库,同时又可以实现联盟机构成员内部技术、资源、人力、资金的共享。然而,IR联盟作为一种新生事物,每种模式建设都要面临着不同的挑战与困境,未来需要在实践中不断探索与解决。

5 结 语

虽然建设IR利益与挑战并存,但是鉴于IR联盟在在知识库发展过程中起决定作用的成本、人员、技术等因素所占有的优势,在相当长一段时期内,联盟模式还是会为知识库的发展做出积极贡献。而这种模式对于资金、人员、技术、资源都相对匮乏的国内知识库来说,无疑具有很大的借鉴意义。我们应该保持冷静的头脑,认真分析国外的建设经验和发展趋势,结合我国的现状和目标,探索适合我国实际情况的IR联盟发展道路,共同合作,更好地促进开放获取在我国的发展,推动我国科技和知识的传播交流和应用。