开篇:润墨网以专业的文秘视角,为您筛选了八篇文献信息检索范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
首先,文献信息检索是信息时代对人才的要求。随着科技的发展,社会已步入信息化高速发展的时代,掌握文献信息检索是时展的要求、也是素质教育的要求,重点在于培养人才的综合能力,如实际处理事情、解决事情的能力、自学自习能力等。掌握一定的信息查询、信息获取、信息加工等能力是时代对人才的新要求。其次,文献信息检索是人们获取知识的重要手段。特别是互联网传播平台的建立,为知识信息提供了更广阔的的交流空间,但信息量的巨多又成为信息检索的障碍,实践证明在进行工作学习等过程中有一少半时间消耗在查阅文献信息上,严重影响了工作、学习等方面的进展和效率。再次,文献信息的获取过程可以开阔检索者视野,启发检索者思维,对人的思维的发展与拓宽具有积极的意义。此外,通过思维的拓展可以更好的对接收的知识等提出新的见解,有助于人们在工作、学习中的创新能力的增强。第四,文献信息检索有利于促进信息的知晓、交流、利用和发展,有利于人类社会智慧和知识产品的传播和发展,并为人的决策、观念的形成等提供依据。
2关联理论与文献信息检索探讨
2.1关联理论与文献信息检索相关性概述
关联理论认为文献信息具有分裂性的同时又具有一定的关联性。首先,人类在创造知识财富时有相对统一的思考趋向、理解趋向和编排的相似性。关联理论将知识的构造看成有一定相关性的构体,通过对文献信息之间的相关性的研究,可以提高获得所需文献信息的速度和质量。其次,关联理论认为文献信息的产生是一个思维构造过程,也就是说,大脑经过一些列的映射、加工、处理等将文献信息构成一个集合,主要包含词汇信息、逻辑信息、知识信息。虽然人们的表达方式有所不同,但如果我们把关联看做一个常项,差异看成一个变量。那么文献信息之间就会形成一定的相关性,通过对这种相关性研究,实现对文献信息检索的快速性和有效性,提高文献的全查率及查准率。
2.2关联理论在文献信息检索探讨
首先,利用文献信息的关键词在相关数据库进行检索。一方面要注意关键词的选择要偏向大众化思维和广泛性词语。另一方面要注意数据库的关联性,不能定义错概念、意识范围,既费时、费力还找不到自己想要的文献信息。此外,数据库检索方式虽有所不同,但通过文献信息关联性还是能找出其检索的相关规律的。其次,利用文献信息的相关性进行精确辐射。如文献信息中的某一关键词,通过这个词检索到相关文章,相关文章会连接到有关联的数据库或杂志网站,进而完成对文献信息的检索,获得更多、更广泛的相关信息。再次,文献信息生产的过程是对知识的一个编码、输入、输出的过程。知识产品创作者希望自己的思想、意图能广为人知。因此,在论文、著作等文档中会有所明示,这些明示信息与检索者的检索信息就有一定的相关性。结合关联理论原则,论文、著作等文献的每一个观念,每一个词语都会以最佳的相关状态存在在相关的数据库中。文献信息用户在检索过程中会利用这些相关性对所需文献进行检索,达到最好的检索目的。第四,随着文献信息量的不断增长,各类检索系统已经不能完全满足用户的需求,文献信息相关排序技术等方面的研究是满足用户需求的最佳途径。在文献信息传播过程中,一方面注意文献信息观点的新颖性、独特性,最大可能的吸引用户阅读、浏览。另一方面必须注重文献信息的相关性传递,有效的实现文献信息的传播目的和使用效率。文献信息保持创新、新颖的同时应兼顾一定的检索能力和大众检索偏好。
2.3关联理论在文献信息检索中的应用
文献信息检索步骤:第一步,确定检索题目,分析检索题目的信息相关性。第二步,确定文献信息类型数据库,结合检索途径选择适当的检索工具,应用检索工具对其进行检索。其中注意检索的关键字段、检索词条等的关联性与匹配性。第三步,开始文献检索,比较、寻找最佳的检索方式,并进一步分析文献信息相关性的使用价值。并对文献信息检索结果进行分析,查找漏检文献及漏检原因,不断的提高全查率和查准率。此外,在文献信息检索中,常用到“倒查法”和“追溯发”,也就是知果寻根,实质也是关联理论发挥作用。如追溯发,利用已知的一批文献信息查找、检索其他的文献信息,这样可有效的扩大文献信息获得量,同时提高了文献信息检索的效率。又如,利用与文献信息相关的主体、作者、出处等进行检索能较准确的检索到文献的相关信息及更广泛的文献信息资源,为使用者提供更好的检索服务以满足用户的文献信息需求。因此,关联理论不但应用广泛,而且在文献信息检索中有巨大的作用,信息相关性的适当、合理利用,有效的提高了文献信息的检索效率。
3结语
文献信息检索途径较多,操作起来较为复杂。如果不能很好的掌握检索的技巧,将会把大量的时间消耗在文献信息的查询上,影响工作、学习效率。关联理论广泛的利用在翻译、学习等领域,在文献信息的检索领域的使用还处在探索和发展的阶段。随着文献信息库的迅速扩大,文献信息检索的效率越来越难以保证,关联理论为文献信息的检索提供了更清晰的研究方向,将为文献检索的全查率、查准率、高效率提供更多的理论支持,并在次理论指引下创新出更加方便、快捷、准确的检索途径及检索方法。
参考文献:
[1]曹平.中外专利文献信息检索平台比较研究[J].情报探索,2011,(07):67-69.
[关键词]大学生;信息意识;信息检索能力
在这个互联网高速发展的信息时代,信息广泛渗透到科技、文化、经济的各个学科领域以及人类生活的各个方面。正如18世纪英国文豪、辞典编撰家塞缪尔・约翰逊所言:“知识有两类,一类是我们自己知道的;另一类是我们知道在什么地方可以找到。[1]”随着互联网的迅猛发展,网络上充斥着大量良莠不齐的信息,快速、有效、经济地获取与自身需求相关的有用信息,已经成为当代大学生的一项不可或缺的基本技能。
一、信息检索的概念
信息检索一词是在1949年国际数学会议上由高尔文・谬尔斯首次提出的,可以细分为广义的信息检索和狭义的信息检索。广义的信息检索是指按一定的方式对信息进行组织和贮存,并根据信息用户的需求识别和获取所需信息的过程,由信息的存储和检索两个过程组成,故而又称为“信息存储与检索”;狭义的信息检索仅指对所需信息进行的查找,而不包括信息的存储,通常称为“信息搜索”[2]。
二、大学生信息检索能力的现状
(一)大学生信息意识薄弱
如今高校在校大学生基本人手一台电脑,但大学生使用网络一般局限于娱乐消遣,例如网络游戏、网络交流、娱乐八卦、音乐视频等,使用网络查找信息资源的大学生越来越少,而使用搜索引擎查找信息的大学生更是少之又少。多数大学生缺乏主动搜集专业信息的需求和意识,很多只是为了完成老师布置的学习任务而去查找使用信息,甚少为了完善自己的知识面而进行信息搜索。并且很多大学生缺乏对信息的灵敏反应,对与自己专业相关的学术信息源更是知之甚少。因此,培养大学生的信息敏感度,在信息社会就显得愈发重要。
(二)大学生信息能力偏低
现今网络信息资源非常丰富,高校学生获取信息的途径呈现出多样化趋势,大多数学生都拥有简单的信息检索的能力,在一定程度上,可以满足对资料的基本需求。但在海量信息面前,当需要更专业、准确的数据信息时,就会出现一些大学生检索能力较差而无法收集足质足量信息的情况。具体表现为:不知道如何利用学校的数字资源、搜索引擎以及开放性可获取资源去查询所需要的信息;不知怎样对所搜集的众多信息进行筛选,容易导致信息臃肿;缺乏对信息的鉴别能力,无法辨别信息的适用性,导致信息的不恰当使用;缺乏信息创新能力等。
(三)大学生缺乏信息道德观念
信息道德是指在信息活动中,用以规范各种社会关系的信息行为的总称,包括道德意识、道德规范和道德行为三个层次。相关的调查表明,部分大学生对不良信息和违法行为不能有效地抵制、恶意下载文件、传播病毒文件、浏览不良网站,更有甚者通过网络对他人发表带有人身攻击的言论,并且以此为乐不知悔改,这些行为反映了大学生信息规范使用意识不强的现状,所以迫切需要对在校大学生进行信息道德素养的培养。
三、提高大学生信息检索能力的举措
(一)增强大学生信息检索的意识
信息检索意识是自觉获取所需信息的意识,大学生具备较强的信息检索意识,才能在解决问题时主动的捕捉、判断和利用信息。信息意识高的学生平时会注重培养自己使用信息的能力,日积月累地提高信息检索的效率。因此,增强大学生的信息检索意识是首要的也是必要的。高校可以因地制宜的采取多种方法来培养大学生信息检索意识,例如高校图书馆对刚入校新生进行入馆教育活动,通过发放图书馆使用手册、带领新生参观图书馆、请馆员讲解如何利用馆藏资源等一系列措施,加深新生对图书馆的认识,从而使其了解在高校图书馆获取信息的途径;定期组织关于信息检索方面的讲座,交流会等,使大学生了解信息发展的最新动态,培养其对信息知识的兴趣,推动大学生建立科学完整信息意识;经常邀请信息管理专业的老师或经验丰富的图书馆馆员有针对性的对各院系学生讲解怎样高效地利用检索系统,如SCI、EI、ISTP、ISR等常用的检索系统。
(二)开设文献检索课程
高校开设文献检索课程,通过介绍信息检索基本知识,专利文献检索、数据和事实检索、中外文数据库、网络信息资源检索等内容,提高学生的信息检索意识,使其掌握获得和使用文献的技能,这是培养学生信息检索能力的一个重要环节。在开设文献检索课时要注意以下两个问题:首先,尽量设置文献检索课为公共必修课,以此避免一些学生不能客观对待文献检索课反而认为文献信息检索方面的知识和技能对日后发展没有有效助力,从而态度散漫怠慢信息检索学习的情况;其次,文检课的内容与重点应不断更新,除了介绍著录格式、索引途径、检索工具等传统手工检索的基础知识以外,应加大网络和计算机的基础知识,互联网信息检索的内容,以适应现代信息网络环境发展的要求。
(三)完善信息检索设施建设
高校可以设立专项资金,用于完善信息检索硬件建设,为构建大学生信息检索能力提供强有力的保障。如更新老旧的设备,购买先进的终端计算机,加大对电子阅览室、多媒体教室的投入,为大学生提供学以致用的场所,使他们能够利用这些先进的设施去使用并提高信息检索的能力;如今全国大多数高校都建立了计算机校园网,我们应该充分发挥其作用,如学校出资购买一些检索工具和数据库系统,不仅可以让学生们通过校园网免费获取需要的数据资源和各种文献信息资源,也为大学生信息检索实践搭建了一个良好的平台。
(四)开展丰富多彩的信息实践活动
大学生参加适量的信息实践活动,学以致用才能有效提高自身信息检索能力。高校应定期举办丰富多彩的信息实践活动,使大学生能够在娱乐休闲的氛围中轻松提高自己的实际操作能力。可以在校园举办信息知识竞赛、信息交流周等活动,使学生在掌握原有信息检索知识与技能的基础上,获得对大量信息进行分折、鉴别乃至综合利用的满足感;也可以让大学生参加科研活动,让他们把自己所掌握的信息理论知识和科研活动结合起来,不仅能提高实践能力,而且也可以极大增强大学生的科研能力;再次,可以组织大学生以志愿者身份参与图书馆的信息整理工作,从而使其在不断的实践中逐步提高信息检索能力。
四、结语
在这个信息爆炸的时代,高等院校应注重向大学生传授信息检索的知识,激发并增强大学生的信息意识,为提升大学生的信息检索能力提供最大的便利,把大学生信息素养教育进行到底;而作为21世纪的大学生也必须把提高信息素养提上日程,固本培元,以此作为培养自主学习能力的坚实后盾。总而言之,培养信息检索能力刻不容缓。
参考文献:
[关键词]高校图书馆 信息检索 改进措施
[作者简介]徐建锋(1979- ),男,陕西武功人,吉林化工学院图书馆,馆员,硕士,研究方向为图书馆自动化建设。(吉林 吉林 132022)
[中图分类号]G642.3 [文献标识码]A [文章编号]1004-3985(2014)36-0131-01
一、高校信息检索课程教学现状
随着信息技术的不断发展以及信息的快速更新,信息检索课在提高学生的信息情报意识,培养大学生自主学习能力方面的作用更加显著,同时有利于全面提升大学生综合解决问题的能力。掌握信息检索方法、技能和技巧已成为当代大学生更新知识的重要手段,所以,各大高校应将提高大学生的信息检索能力放在重要位置,开设专业的信息检索课程。信息检索课程具有很强的实用性,首先表现在拓宽了大学生获取知识和信息的渠道;其次表现在为学生提供了获得专业最新动态的途径;最后表现在为学生的毕业论文写作提供了全面的素材基础。所以,高校应该积极开展信息检索课程,培养学生终身学习的能力。
目前,手工信息检索已经逐渐淡出了高校信息检索教学,计算机借助Internet网进行信息检索的技术已经普遍应用。但是,部分高校教师和学生的观念还没有转变,没有与时俱进,教学手段相对比较落后,教师的专业素养还有待提高,学校整体对信息检索课程的重视程度不够。信息检索课程中存在的问题也逐渐显露出来,大学生的信息敏感度和知识收集能力有待提高,迫切需要掌握最新的信息检索技术。
二、信息检索教学存在的问题
1.信息检索课程授课范围有限,大部分学生不能掌握信息检索技术。从目前高校开设的信息检索课程来看,多数高校开设的信息检索课程范围还比较有限,经常出现图书馆老师无课可讲的状态。同时,真正学习和掌握信息检索知识的学生也非常有限。作为现代化信息教育的主要途径,信息检索课在提高大学生综合素质方面具有重要作用,但是大多数学生没有熟练掌握信息检索技术,对信息检索工具的掌握和运用了解不够深入,不具备准确获取信息资源的能力,对信息的重要性缺乏认识。部分高校领导、教师以及学生对信息检索课重视程度不够,使得开课范围十分有限,这也导致信息检索课程陷入一种无足轻重的地位。因此,高校应该根据自己学校的实际情况,逐渐扩大授课范围,将信息检索课程定位为必修课程,进一步普及信息检索知识,让更多的学生可以通过信息检索课程获取专业知识和专业动态。所以,如何扩大课程的普及范围就成为高校亟待解决的问题。
2.信息检索课程在高校中的受重视程度比较低。信息检索课在大多数高校被设为选修课的原因有:一方面,信息检索课程不受学生重视,选择这门课程的学生比较少。另一方面,高校对信息检索课程的软硬件投入非常低,专业教师更是少之又少。大多数信息检索课教师由图书馆工作人员兼任,他们缺乏专业的教学方法。以上因素严重制约了大学信息检索课程的发展。
3.学生忽视信息检索课程,导致教学达不到预期效果。高校信息检索课程涉及的知识范围比较广,这对教师的专业素质要求比较高,同时由于课程的专业术语较多,学生很难理解和接受,导致课程教学达不到预期效果。在大多数高校内,信息检索课往往采用传统课堂讲授和上机教学两种方式,而且上机教学模式单一,主要以教师的讲解为核心,学生只能被动接受。这不利于学生的自主学习,使得学生的学习积极性不高。由于没有材,学生无法预习和复习,也使得学生在潜意识中忽视信息检索课程。因此,使得整个检索课程的教学效果较低。
4.信息检索课程在教学计划中得不到重视。在高校的教学安排中,信息检索通常安排的课时较少,大多数是合班课,没有精细的小班授课,再加上学生的课程实习场地有限,使得学生对信息检索课程的兴趣也逐渐淡化,课程开展的根本目的得不到实现。
5.信息检索课程教学效果的评价方式比较单一。学校开设信息检索课程是为了培养大学生对信息检索技能的掌握能力,提高大学生的综合学习能力和自主解决问题的能力。但是在实际的教学实践过程中,教师和学生都以考试过关为最终目的,教学仅仅达到了理论层面,而忽略了对学生实践能力的培养和考核,课程的实用价值也在不断降低。
三、信息检索课程教学的改进与创新
1.配备专业师资队伍,提高教学质量。对于开展信息检索课程的图书馆来说,在开设课程之前,要统一对讲授信息检索课程的教师进行严格培训和考核;定期组织召开信息检索课的教学研讨会,教师之间相互学习和交流教学经验;鼓励教师积极申报和参与学校的教学和科研立项,用教师自己掌握的信息检索技术来解决教学和科研立项中的实际问题;通过举办讲座、论坛和走访的形式,加强与学校各学院系老师的沟通,普及和宣传信息检索课程的重要意义。提高学校领导以及教师对信息检索课程的重视程度,尤其是硬件和软件配置的提高。硬件配置可以在短时间内获得改善,但是软件配置,尤其是师资力量的配备和能力培养是一个长期的过程。团队教师的个人素养关系着课程教学的质量,要积极引进专业团队,开发专业教师的个人潜力,最终打造出高能力的专业授课团队。
2.提高学生获取科学信息的实践能力。在教学过程中,教师不能局限于教学大纲,而是必须在教学大纲的基础上,结合教师的计划和学生的接受能力,提升教学标准。教学不能以完成教学大纲为最终目标,而是必须以提高学生的实践能力为最终目标,要让学生学以致用,切实提高学生的信息获取能力。
3.灵活运用教材,实现课程教学的创新。信息检索课程是非常实用的一门学科,检索技术随着网络技术的发展而不断提高。教学是以教材为基础的,但不能局限于教材。为实现信息检索课程教学的创新,教师应根据学科特点,将教材灵活运用起来,结合自己的教研和科研立项实例讲解知识点,整合教学资源,力争实现教学水平的提高,为学生适应现代网络信息提供途径。
4.为不同层次的学生设定不同的课程内容。学校要针对不同层次的学生设定不同的课程内容,教师应该重视学生检索技能的培训,促进学生综合能力的提高。教师在安排课程的过程中,要结合不同层次学生的水平以及学习能力,积极调整教学计划,不同年级学生的教学内容要有不同的重点。例如,在本科低年级可以重点安排理论性课程以及一些操作容易的内容,因为低年级学生对文献检索的需求比较少,检索的内容是比较简单的。针对高年级学生安排课程时,要多涉及一些专业知识的教授,因为高年级学生的专业课程已经学习到了一定程度,大部分学生的外语能力以及专业知识素养都有了很大提高,可以检索一些专业的内容或者国外文献,检索需求比较大。
5.不断改进教学方式方法,提高学生对知识的运用能力。教师在信息检索课程的教授过程中,要结合实际情况,不断改进教学方式方法,不仅要传授基础知识,而且要提高学生对知识的运用能力,重视对学生实践能力的培养。例如,教师在教学过程中,要加强演示环节力度,应该通过对论文或者课题的信息收集的示范来教授学生实际应用技能。同时可以布置一个课题,让学生根据自己所学到的知识进行查询,并通过集体汇报的方式进行成果检验,为学生创造交流的机会。
四、结语
高校开展信息教育,必须重视信息检索课程。网络技术的发展促进了文献检索的发展,同时也对文献检索提出了新的要求,信息检索课程的教学必须与时俱进,教学方法和手段以及教学内容都要与科学技术的发展接轨,这样学校才能培养出具备现代信息应用技能的综合型人才。
[参考文献]
[1]高媛媛.高校图书馆信息检索教育的探讨[J].群文天地,2012(6).
[2]韩君.论高校图书馆信息检索教育教学的改革[J].江苏技术师范学院学报,2009(5).
>> 职业能力视角下大学生商务信息检索技能的培养 信息化视角下的数据仓库检索优化策略 归因理论视角下信息检索行为失败研究 网络信息检索环境下的语义检索研究 信息技术新课课改的认识与思考 高校文献检索课课堂教学设计的探索与实践 论高校在信息背景下的大文献检索课理念 网络环境下高校数字图书馆信息检索的探讨 数字环境下高校用户信息检索行为初探 基于信息时代视角下的高校班级管理 基于网络信息公开视角下的高校管理研究 新医改视角下公立医院的财务管理信息化建设 计算思维视角下的学生信息通晓能力培养 高校图书馆信息素质教育体系下的文献检索课程建设探讨 高校文献信息检索课的现状及改革 重视信息检索和概括能力的培养 信息检索的嬗变 泛在知识环境下的信息检索课教学 新信息环境下的文献检索课 探析网络背景下的信息检索教学设计 常见问题解答 当前所在位置:,2013-08-08.
[9]赖茂生,屈鹏.大学生信息检索能力调查分析[J].大学图书馆学报,2010,(1):96-104.
[10]王琼,林小露,毛瑞.本科生研究生信息能力教育调查研究[J].中国图书馆学报,2003,(6):77-79.
[11]吴丹.高校图书馆与大学生信息素养教育研究——基于高校在校本科生信息素养调查分析[J].图书馆建设,2006,(4):63-66.
[12]吴钢,郭沁峰,易芳,等.大学生信息素养现状调查与对策分析[J].图书馆理论与实践,2006,(3):39-41.
[13]郭太敏.论信息素质与人才培养[J].中国图书馆学报,2002,(3):80-82.
[14]彭绍东.“信息素质”与“信息素养”辨析[N].中国教育报,2002-10-03,(3).
[15]湖北民族学院图书馆《信息检索》课程组.《信息检索》课调查问卷[EB/OL].,2005,2013-08-21.
[17]孔德超.论个人知识管理[J].图书馆建设,2003,(3):17-18.
[18]陈力行.论个人知识管理[J].情报科学,2005,(7):1072-1075.
[关键词]用户搜索行为信息检索课实践教学教学设计
[分类号]G252.7
1
以用户行为为导向的信息检索课研究背景
笔者在图书馆主要负责读者培训,并承担信息检索课的教学工作。在进行信息检索课教学的过程中发现一个问题:多数教材和参考书的编排内容过于松散,没有一条主线来引导学生自主地进行检索技能的学习。进而,笔者开展了如下调查:
1.1 对信息检索教材的调查
本文选取了笔者所在图书馆有关信息检索方面的馆藏图书作为抽样调查对象,于2010年1月5日分别以“文献检索”、“信息检索”和“文献信息检索”为检索词,采取模糊匹配的方式,检索去重,并加以筛选(可以作为检索课教材的),共计得到106本图书,出版年分布于1994―2009年。笔者查看了每一本书的内容编排体系,发现其大致可以分为以下5种类型:
按照信息源一检索语言一检索工具与方法一主要学科文献检索(大致分成社会科学文献检索、自然科学文献检索等)一论文写作指导这条线来编排内容,此种类型占大部分。
按照文献类型组织内容,如专利文献信息检索、标准文献检索、科技报告信息检索、会议信息检索、知识产权检索等。
按照专题来组织内容:人物传记资料检索、历史/时事资料检索、统计资料检索、法规条约案例信息检索、地理资料检索等。
仅侧重某一方面的介绍,如网络资源的检索、检索原理与资源的介绍、检索工具的介绍等。
专业/学科信息检索方面的图书占32%(34本),一般侧重于专业文献源、专业数据库、专业网络资源和专业论文写作等内容的介绍。
通过抽样调查发现,目前的一些信息检索类教材和教学参考书的编排体系大都倾向于将信息源、检索工具和检索原理等进行简单的介绍和罗列,而没有真正地从用户角度去设计教材内容。尽管有少量检索类教材或教学参考书涉及到检索实习或实践指导方面的内容,但仅侧重于数据库如何使用的介绍,缺乏一个完整的实施检索行为的体系来引导用户去检索。
1.2 对信息检索课程方面研究论文的调研
笔者于2010年1月11日在中国期刊网数据库中分别以“文献检索课”、“信息检索课”和“文献信息检索课”为检索词,分别得到1 580条、360条和117条结果(由于数量多,未去重),可见目前界内人士对检索课的关注度还是比较高的。CNKI知识搜索中有关文献检索课研究论文的时间分布如图1所示:
从图1来看,在2002年和2006年有关检索课的研究达到了高峰,且研究的焦点分别集中在检索课的教学改革和检索课教材的改革这两方面:在检索课的教学改革方面,界内很多人士采用各种方法来进行教学改革的尝试,如何颖等借助信息技术教学中普遍使用的“任务驱动”教学法来设计检索课的教学。不少同仁纷纷将近来兴起的Web2.O思想和技术引入检索课的教学中去,例如,杨明秋不仅提出了文献检索课的"5E”教学模式,还将其与Web2.0相结合,探讨Web2.O技术在“5E”教学模式中的应用;在检索课教材的改革方面,不少文章从理论上提出检索课的教材与教参缺乏更新、教学方式落后、理论与检索实践脱节,缺乏一套完整的检索课教材改革思路。
尽管在检索课的教学方面不乏研究者,但总体来说缺乏有关以用户行为为导向的教材改革和课程设计方面的研究。
另外,龙雪梅等对“985工程”高校图书馆的文献检索课进行了调查,调查结果发现大多数高校图书馆在教学过程巾采用课堂讲授与上机实习相结合的教学方式,仅在具体讲解某一数据库检索时,为了让学生更直观地了解检索过程,利用网络教室实现教师机与学生机同步操作教学。尽管也通过提供网络教学和文献检索讲座来拓展用户获取检索技能的途径,但却没有将重点放在调动学生的学习兴趣上,教学效果欠佳。
用户是检索行为的主体,根据用户的检索行为来设计信息检索课十分有必要。基于上述调研结果,同时鉴于国内信息检索课实践教学环节相对薄弱,本文拟对用户搜索行为为导向的信息检索课实践教学进行课程内容和教学方式的设计,以期抛砖引玉。
2 以用户搜索行为为导向的信息检索课实践教学内容设计
c,C,Kuhlthau通过阅读杜威的“人如何思考”(How we think)的哲学,提出了著名的信息搜索6步骤(被称作Kuhlthau信息搜索过程模型):任务起始(Task initiation)、主题选择(Topic selection)、重点查找(Prefocus exploration)、重点阐明(Focus formulation)、信息收集(Infolaxtation gathering)与搜索结束(Search closure)。虽然在当今复杂的信息环境下,不同用户的检索过程和方式都会有所不同,但是用户在实施搜索行为时一般都是按照选择主题、检索与获取信息、整理加工信息和使用信息这个线性顺序进行操作,这个顺序也符合个人知识管理的基本原理和过程。因此,本文借鉴Kuhlthau信息搜索过程模型,以用户的一般搜索行为为导向,对信息检索课实践教学内容进行了尝试性设计。
以用户搜索行为为导向的信息检索课实践教学课程内容依次包含如下4个部分:主题的选择(即检索课题的选择)、信息的检索与获取、信息的处理与积累、信息的使用。
2.1 主题的选择
多数用户对于如何选择一个合适的主题或课题感到非常焦虑,用户的焦虑状态会影响其检索行为和检索效果。因此,本部分的内容设计思路为在传授用户选择主题的方法和策略之前,先分析用户的检索心理,针对不同的心理因素设计不同的引导策略,让用户了解这些心理状态并掌握自我调节的方法,鼓励和引导用户克服消极心理,以便顺利实施后续的检索行为。
2.1.1
用户的检索心理分析及如何克服检索焦虑心理用户检索焦虑是用户在实施检索行为整个过程中最常见的一种心理。这种焦虑心理一般分为两种:①特质焦虑,即在实施检索的过程中,由于用户的人格特质不同,在相同的情境中,其情绪反应的频度和强度也会不同;②外界因素施加给用户的焦虑感,比如计算机焦虑、成就动机感带来的焦虑等。
检索焦虑心理会带来很多的消极影响,由于检索意愿不强烈或者检索任务不重要等原因导致用户在检索时没有焦虑或者焦虑太轻微,则可能会使用户轻易放弃检索,或者安于接受现有的检索结果,对检索质量毫不在乎。用户在检索时长期处于高度的焦虑中,如遇到检索结果过多、检索质量过低、多次检索仍不能满足信息需求等情况时,则可能导致用户紧张、恐慌、
自我效能感降低、不能理性思考,对自身的信息检索能力产生怀疑,进而使用户在行为上表现出消极选择信息、回避信息甚至拒绝信息。然而,检索焦虑心理对检索行为也会产生积极的影响,如果用户在进行网络信息检索时产生的焦虑在用户能够承受的范围内,就能激发用户的检索兴趣和检索信心,提高用户的检索耐心,使用户更好地完成检索任务,并能在检索过程中增强自我效能感。
总之,不管是哪种焦虑,图书馆员需要做的就是引导用户将消极的焦虑转化成积极的心态,提高检索的质量和效率。
2.1.2 选择与确定主题的方法和策略多数用户对于选题感到焦虑的原因是不知从何处下手,而空想是不切实际的,所以对于选题来源和途径的详细介绍将非常有利于用户检索。选题来源的介绍还应是比较实用的,用户容易做到的。如常用的方法有从教育部的科研规划中选题、从古今中外的文献资料中发现选题,经常浏览本学科的核心期刊,经常收集自己关注或主攻方向的新情报,或从期刊的征稿启事中选题、从各种信息交流中发掘课题、从自己或他人的经验教训中提出课题等。
选题还应有一定策略,用户或可以选择前人没有探索过的新领域,或可以在前人成果基础上进一步探讨,或对已有研究成果提出新看法、新视角,或对某一方面问题进行总结和综述,或可以研究某种方法在新的领域或问题中的应用等。选题策略可以帮助用户更好地进行选题,但必须辅以示例讲解。
进入实践操作。掌握了选题的方法和策略后,要求用户根据自己的实际情况,如兴趣所在、所属学科或专业、手头上的课题、学习中遇到的其他问题等,调整心态,利用所学的选题方法,尝试选题。此次所选主题将贯穿于整个检索课,也就是说后续的信息检索程序实践操作都将围绕着用户自己的这个选题来进行。
2.2 信息检索与获取
选题的范围确定之后,需要引导用户进行主题分析,提炼出主题概念,为检索行为的实施打下基础。而在检索行为开始之前,用户需要对信息源和检索工具有一个充分的了解,然后凭借一定的检索技巧和方法去获取信息。
2.2.1信息源及相应的检索工具不同的学科、不同的检索目的所使用的信息源和检索工具都会有所不同。信息源一般分为传统印刷型文献资源(如纸质图书、期刊、工具书等)和网络资源(数据库资源、专业性或学术性网站、开放资源等)。对于传统文献,我们可以借助图书馆的检索系统进行查询;而对于网络资源,数据库一般都有自身的检索界面和系统(通常需要购买),其他网络资源可以通过搜索引擎获取。
然而,这里需要指出的是,任何一本检索教材或教参都不可能把所有的信息源和检索工具介绍全。因此,建议以索引的方式简介这些信息,以便用户在教师的指导下根据自己的具体情况选择合适的信息源和检索工具。
2.2.2 信息获取的方法与技巧虽然不同检索工具的检索界面和检索方法会有所不同,但利用综合性检索工具讲解基本的检索技能还是必不可少的。检索技能很大一部分要通过实际动手和操作练习来获取,熟能生巧。教师的引导也很重要,以用户感兴趣的案例作为引导,通过一步一步地实施检索策略和一定检索技巧,获取令用户具有吸引力或成就感的检索结果,从而可以鼓励用户进行下一步的操作。
通过检索获取信息只是信息搜集方法中的一种,各种社会调查方法的使用将会为自己搜集得来的资料锦上添花,这类资料通常“用事实说话”,更具说服力。常用的社会调查方法有实地调查、访问调查、问卷调查、案例调查等。
2.2.3 Web2,O信息获取Web2.O既是一种资源,也是一种信息获取与处理工具。如通过RSS工具订阅信息,然后将其发表在自己的博客上。Web2.0工具的简单介绍和灵活应用可以提高用户的信息获取与处理效率;同时Web2.O也是年轻一代喜欢或比较感兴趣的一种信息获取方式。
2.2.4 咨询的途径
目前国内外的高校图书馆、大型公共图书馆等都开展有参考咨询服务,用户在检索过程中遇到困难或问题,都可以向其咨询,从而摆脱“求救无门”的尴尬情况。因此这部分内容也不可或缺,让用户充分了解各种咨询的方式和途径。
鼓励用户根据前面选定的主题,选择相应的信息源和检索工具,利用所学检索技能进行检索。这一部分可根据用户选题的相似性将用户分成小组,进行合作检索,指导教师充当咨询的角色。
2.3 信息处理与积累
通过判断、分析、过滤与整理所获得的信息不仅有利于用户去粗取精,从而更好地保存信息,还有助于用户发现新的信息视野。用户需要掌握一套鉴别、分析、评价信息以及如何更好地保存信息的方法。尤其对于一些数据信息等需要经过统计处理后方可使用,常用统计方法的掌握也需纳入信息处理技能的学习当中。
此外,平时信息的积累也非常重要。鼓励与引导用户要善于从大量信息中随时随地捕捉有用的素材,要善于从一般的信息中找出重要信息,要善于将其他学科中有用的信息移植或嫁接到本学科中,要善于随时记下听到看到的新信息、新知识,要善于捕捉自己思维中瞬间即逝的思路、想法和念头等,从而提高用户对信息的敏感度,养成积累信息的好习惯。
可以举行一些信息积累与处理能力大赛,将信息或知识积累的程度、信息的可用性或适用性、信息处理积累的方法和手段等作为评判依据。
2.4 信息使用
信息的检索获取是为了更好地利用信息,很多检索教材忽视了信息的使用这一重要环节,而导致所获得的信息不能得到充分利用或闲置。信息的使用包括很多方面,如撰写综述、科技查新报告、学术论文等。信息的交流共享也是信息应用的一个重要方面,尤其是在当前网络成为信息获取利用主要途径的环境之下,信息的交流显得尤为重要。信息的交流共享可以拓展用户的知识储备和实现用户个人的知识创新。如用户可以利用博客、维基平台等web2.O工具一些学术新闻或文章、个人经历或感想,或与志向相投者进行相关领域的讨论等。用户在创新利用信息的同时,还可以从他人处得到意外的收获。某一重要数据和最新情况,倘若你不掌握,你的朋友、朋友的朋友或许知道。
实践方面,应引导用户根据自己的选题、搜集与积累的资料做各种信息应用的尝试,如撰写综述、发表学术论文或发表博文等,并进行成果展示。
3 以用户检索行为为导向的信息检索课教学设计
以用户检索行为为导向的信息检索课教学要真正从用户思考的角度出发去设计课堂教学,以灵活的方式和生动的语言激起用户的兴趣,鼓励用户亲自动手去实施或操作整个过程,让用户在不自觉间就获得一定的检索技能。
收稿日期:2013-03-02
基金项目:湖北省高等学校图书情报工作指导委员会基金项目:网络环境下地方高校用户信息需求规律研究(2011ZD06)
作者简介:吴菁(1970-),女,武汉科技大学图书馆副研究馆员,主要从事书刊采编及文献检索研究,(E-mail)。
摘要:高校用户信息行为是用户信息行为研究的一个热点,高校的信息用户群体在信息需求、信息检索和信息利用方面有其自身的规律和特点。根据网络环境的特点对此进行深入的探讨和研究。
关键词:信息检索行为;高校图书馆;信息用户
中图分类号:G250 文献标志码:A 文章编号:1005-2909(2013)03-0139-03 一直以来,用户信息行为都是用户研究的热点之一,这项研究对信息机构设立工作目标、明确发展方向提供了理论基础和决策依据,因而在图书情报学界占据重要地位。高校用户信息检索行为是用户信息行为研究的一个重要分支,高校信息用户群体在信息需求、信息检索和信息利用方面有其自身的规律和特点。高校信息用户对于学术类信息更为敏感,对于信息资源的学科性、系统性、完整性,以及是否能够便利地获取信息尤为重视。他们普遍信息素质较高、信息意识敏锐、理论知识扎实、富于实践,其信息检索行为对于高校的创新能力和教学科研水平的提高有着重要的作用[1]。另一方面,随着社会进入网络数字时代,信息学界对用户信息检索行为研究的重心也发生了转移。以往传统的基于人工服务的信息检索模式已经被人机交互的模式所取代,用户信息检索行为研究的手段和内容都在发生着深刻变化[2]。
一、信息检索行为的概念
(一)信息行为
关于信息行为的定义,近年来国内外学者进行了很多深入的探讨,形成多种观点。如武汉大学胡昌平教授将信息行为定义为“人类特有的一种行为,系指主体为了满足某一特定的信息需求(如科研、生产、管理等活动中的信息需求),在外部作用刺激下表现出来的获取、查询、交流、传播、吸收、加工和利用信息的行为。”
根据用户产生信息需求到吸收利用信息的一系列过程,业界有人将用户信息行为分为信息意识培养、信息咨询行为、信息检索行为、信息吸收行为等4个阶段,它们互为条件、相互依存,其中,信息意识是其他信息行为的起点,信息提问与检索为用户获取信息的重要一步。一切信息行为的最终目的是吸收信息。信息检索行为作为连接信息需求和信息利用的桥梁,历来是图书情报学界研究的重点,也是高校开展信息素质教育最为关键的环节。 (二)信息检索行为
关于信息检索行为的理论研究,最早可以追溯到1948年英国皇家社会科学情报会议(The Royal Society Scientific Information Conference)的召开[3],1970年后,信息服务的导向转为以用户为中心,信息检索行为的研究导向也转为以用户为中心。随着认知科学的发展,研究越来越期望从认知的角度思考用户的想法和感觉,而不是外在的行为表现[4]。
(三)信息检索行为影响因素
信息检索行为是指信息用户为满足自身文献信息需求而进行的查找所需文献信息的行为。将用户潜在的信息需求转化为具体现实的检索行为,一般认为是由用户个体和外界环境两方面因素决定的,这其中包括用户个体特征、检索任务类型、信息系统和对检索结果反馈等。
用户个体特征包括用户的背景知识、计算机应用能力、特定信息需求、知识结构、认知能力、情感状态及人口统计参数等。
在对检索任务的研究中,检索任务的开放性对用户的检索行为有明显影响,开放型的问题又称主题性问题,封闭型问题又称事实性问题。其中开放型问题无特定答案,而封闭型问题则有特定答案。
信息检索行为的本质是用户提问与信息系统之间对比匹配的过程。用户个体因素更多体现在其信息素质方面,而信息系统能力则主要反映在检索系统的设计上。检索系统学习机制的设计,包括两方面内容:其一为行为识别,即观察用户的检索行为方式,设计个性化的检索系统,简化用户的检索步骤;其二为逻辑推理,即分析检索信息的内容,分析其相关性,直接服务于用户检索决策。
二、高校群体用户的分类及信息需求分析
大量研究表明,用户的差异性逐渐在信息检索行为研究中得到重视,检索系统的设计亦逐渐从不同资源整合扩展到不同用户需求的整合。近年来,业界人士通过多重角度研究信息行为,其中重要的一种是通过观察不同群体用户的检索行为,试图总结其中的规律并应用于信息服务。高校相对于企业和其它事业单位,在信息需求和信息行为方面都有着自身的特点。对他们的学术信息检索行为进行分析和比较,能够进一步丰富和发展信息行为研究理论体系,为信息系统设计和信息资源建设服务提供依据[5]。
高校信息用户主要有三种类型:第一类是大学生群体,他们思想活跃、精力充沛,容易接受新生事物,但他们的信息获取与辨识能力不强,其信息需求呈现出多样化、专业化特点,并且与个人爱好兴趣紧密相关[6]。第二类是硕士生、博十生、青年教师群体,他们的信息需求量比本科生大、专业性也更强,多与自身的学科、研究项目、研究课题相关。这一用户群体已经掌握了基本的信息检索技术,实践能力较强,对具体信息需求往往心中有数[7]。第三类是学校的学科带头人、博导、院士群体,他们是高校教学科研工作的引领者,不仅需要吸纳最新最广泛的专业信息,而且也在创造着新的知识。他们往往站在学科研究的最前沿,最需要是国内外相关学科、研究课题的发展动态和最新成果等方面的信息。
三、数字网络环境下高校群体用户的信息检索行为研究
数字网络环境下用户的信息行为主要是基于网络的检索行为。一般认为是用户根据自己的信息需求,利用检索系统,查找特定信息的过程。检索系统可以根据用户提问,按规范化语言文本进行概念转换,经逻辑匹配输出与提问相关的文献[8]。
通过特定的网上信息检索工具来满足特定信息需求的行为,其主要内容为:信息获取途径的选择(如E-mail、数据库、搜索引擎、网站链接等)、检索提问式的构造与修正、各种检索技术的使用、网页浏览与存取技巧、检索问题的解决、检索结果的评价等。
笔者与项目组成员于2012年上半年针对武汉科技大学用户信息检索行为进行问卷调查,调查显示,在数字网络环境下用户的信息检索行为呈现以下特征。
其一,检索词的选择。合适的检索词应该尽量使用专指词、特定概念或非常用词,避免普通词、泛指概念,并能根据检索情况对检索词进行种种限制。而高校信息用户对这方面的技巧重视不够,所选的检索词概念不太准确,外延或大或小,很少考虑使用同义词扩大检索范围,而且选词往往专指度和规范性不强,比较随意。此外,他们还倾向于仅使用单一检索词。这种情况在本科生中尤为常见,而学科带头人、博导、院士群体基于对专业的熟悉程度在选择检索词方面做得最好。
其二,检索技术的使用。用户普遍没有兴趣掌握或者从没想到了解检索系统的检索功能与特定检索技术,对于检索系统提供的词位限定检索、截词检索、布尔逻辑检索等限制性检索技术,本科生中只有18%人能正确运用;硕士生、博士生以及青年教工群体达到48%;学科带头人、博导、院士群体的比例略低,约42%。调查发现,大多数用户对各种高级检索技术的使用及检索提问式的编写虽略有所知,却很少实践,而且不能正确运用字段检索和二次检索。有的用户每次检索只提交一个检索提问式,不会修改提问式进行连续检索。
其三,对检索结果的处理。不同群体的高校用户没有表现出明显的差异。检索结果过多时,各群体用户均表示不会逐一查看。检索结果不足时,也只是简单改变检索词和检索途径。然而,各群体用户对于系统提供的相关检索以及每篇论文的参考文献,基本还是给予了应有的重视。
其四,搜索引擎和网络全文数据库的选择。绝大多数高校用户习惯于长期使用某一两个最先接触的数据库或搜索引擎,有先入为主的习惯,这与个人偏好及对数字产品依赖性的使用特点有关。对于搜索引擎,大多数用户只满足于简单地使用,接近一半的用户利用搜索引擎时,从不考虑其高级检索功能。对于检索词的选择过于简单,很少从规范性、专指性等角度加以考虑。近年来,各高校图书馆购买了越来越多的文摘及全文网络数据库,每种数据库都提供多种检索方式,每种数据库也有自己特有的检索技术,但用户依旧只习惯于使用系统默认的检索方式,不能根据自己的检索目的和课题需要进行调整。从调查看,学科带头人、博导、院士群体对于常用搜索引擎和数据库的忠实程度最大,达到82%;硕士生、博十生、青年教师群体居中,为67%;本科生群体对于新生事物好奇心最强,达54%。这也从侧面说明了学科带头人、博导、院士群体对本专业相关重要数据库的了解和依赖更多。
调查还发现,高校信息用户获取信息的各种途径中,网络全文数据库与网络搜索引擎是最常用的工具。总的来说,从学术资源使用情况看,他们对特定的信息检索系统(如网络数据库与搜索引擎)显示出较强的偏好,但是对信息检索系统所提供的辅助检索手段(如句法工具等检索技术)的使用却不尽人意[9]。当图书馆的资源无法满足用户需求时,22%的硕士、博士生和青年教工更倾向于通过与学生、同事的口头交流获取信息,其次才是寻求馆员帮助。这个群体中有17%的人经常参加图书馆检索知识系列讲座培训,44%的人参加过1~2次相关培训。调查结果还显示,学科带头人、博导、院士群体对网络学术资源最熟悉,利用率最高,而硕士生、博士生和青年教师群体每天用于专业信息检索的时间最多,平均为2~4小时,这充分说明了该群体对网络信息资源的利用更为重视。
参考文献:
[1]韩丽风,郭依群.面向用户需求的信息素质教育实践创新研究[J].中国图书馆学报,2006 (6):32-35.
[2]董富强.网络用户行为分析研究及其应用[D].西安:西安电子科技大学,2005.
[3]吴龙婷.国外网络用户搜索行为研究综述[R].中国人搜索行为研究实验室年度报告2006.北京:北京大学信息管理系,2006.
[4]孙林山.我国信息用户需求和信息行为分析研究综述[J].图书馆论坛,2006(10):76-77.
[5]都平平,宋秋水.高校用户信息需求行为的调查评估及整合分析[J],情报理论与实践,2007(3):369-371.
[6]刘磊.南京地区高校本科生网络信息检索行为调查分析[J].江西图书馆学刊,2007(2):3-6.
[7]李淳.研究生学术信息查寻行为研究[D].南京:南京航空航天大学,2007.
[8]夏晓慧.网络环境下用户信息需求的分析研究[J].农业图书情报学刊,2006,18(1):53-56.
[9]魏力更.高校网络用户信息需求与信息行为研究[J].情报资料工作,2005(5):103-105.
Information retrieval behavior of university library users under digital environment
WU jing, LI Shanshan
(Library, Wuhan University of Science and Technology, Wuhan 430081, P. R. China)
[关键词] 向量空间 中文 信息检索 经济
信息检索( Information Retrieval) 是一个古老而又全新的话题。说它古老,因为自从有了文献便有了信息检索。当人们从中查找所需信息时,信息检索也就应运而生。只不过那时可检索的对象较少,因而检索是一个不自觉的过程。早期的信息检索主要是手工检索,人们通过“心想――手翻――眼看”的方式进行。随着社会的发展和信息量的增加,人们逐渐认识到信息检索的必要性与重要性,信息检索逐渐作为一门新兴的学科发展起来。现代信息检索是以计算机科学与技术、网络技术、光盘技术、通信技术等现代信息技术在信息存储与检索中的应用为基础发展起来的。
一、信息检索简介
1.概念
广义的信息检索范围很大,可以说从书本、报纸以及其他的各种媒体中查找人们需要的信息都可以称为信息检索。
狭义的信息检索是特指利用计算机这个高效的工具对各种信息进行检索的技术。信息检索的内容包括文本、图像、视频和音频等多种,但本文只讨论文本信息的检索技术,特别是中文信息的检索技术。
信息检索是一门研究从一定规模的文档库(Document Collection)中找出满足用户提出的信息需求(User Information Need)的技术。
2.Web信息检索
Web的出现大大地促进了信息检索技术的发展。Web上有异常丰富但又十分混乱的信息资源,其中绝大部分有用的信息还没有挖掘出来。这是因为目前还没有特别好的信息处理和检索工具。这一领域的开发仍然处于初级阶段。
3.中西文信息检索比较
在文本信息检索领域,西文信息检索的发展较为迅速。西文信息检索系统可以利用向量空间表示检索信息内容,并将自然语言处理应用于信息检索,大大提高了信息检索的准确性。中文信息的检索和英文信息的检索在很多地方是一致的,但也有一些不同。比如中文词语之间没有空格,因此在索引前需要进行词语切分。此外,与英文相比,汉语句法分析和语义理解更为困难。
4.信息检索的模型
一般有两种信息检索模型:基于统计的模型和基于语义的模型。基于统计的模型是应用某些统计的手段从被检索文档和高标注等级文档中查询与用户需求匹配程度最好的文档;而基于语义的模型则尝试对需求实现一定程度语法语义分析,即对自然语言文本进行一定程度的理解并重新生成查询。
基于统计的模型主要有:布尔模型(Boolean Model)、扩展布尔模型(Extended Boolean Model)、向量空间模型(Vector Space Model)以及概率模型(Probabilistic Model)等。
二、向量模型
向量模型是重要的检索模型,其主要优点在于:a、通过对特征项的加权改进了模型的检索效果;b.模型的部分匹配策略允许检索出与查询条件相接近的文献;c.相似度的引进使得能够对查询结果进行排序,以倒排文档方式提交结果。
1.文档和项的向量空间表示
首先把一个文档进行分词处理,并去除那些停用词,如“我”、“的”、“人们”等。然后对剩余的词进行合并处理。
在一个给定的集合中先对每个文档进行以上的操作,获得每个文档索引项的集合。再把所有文档的索引项进行合并,形成了一个代表整个文档集合的索引项集合,整个索引项集合表示了一个“空间”。在一个文档空间中,可以给每个索引项赋一个权值,代表这个索引项在这个文档中的地位。如表1所示,文档1的向量空间是(3,4,5),文档2的向量空间是(2,3,3)。
与文档空间相对应的一个概念是“项空间”,它是指一个索引项在文档集合中的各个文档权值的集合。如表1所示,索引项“经济”的向量空间是(4,3,0,0),索引项“金融”的向量空间是(5,3,0,5)。
于是文献和查询均可用由项构成的向量来表示:d=(t1,t2, ……,tn) 。项的权重(term weight) :对于有n 个不同的项的系统,文献D=(t1,t2,……,tn)。
2.项权值
项t k(1≤k≤n)常常被赋予一个数值Wk,表示它在文献中的重要程度,称为项t k 的权重。因此,我们一般用D=(w1,w2,…,wn)的形式表示文献。特征项的权重计算,是人为赋予的,因此主观性较强,但比较权威的确定权重的方法是运用TF - IDF 公式,即Wik = tfik/dfk=tfik ×idfk,其中tfik为特征项Tk在文档Di中的出现频率,称为项频率(term frequency);dfk则是文档集D中出现特征项Tk的文档的数量,称为文档频率;idfk为dfk的倒数,称为反转文档频率(inverteddocument frequency)。另外,还应考虑到文档的长度,否则长文档易被检出,而短文档会被漏检,所以通常还要对上面公式进行标准化处理。
假设有三个项:“经济”、“金融”和“计算机”,它们在不同文档中的权值如表1所示。
根据这个表,可以画出权值和文档的三维向量空间。
3.计算向量之间的相似程度
相似度S(Similarity):指两个文档内容相关程度的大小,当文档以向量来表示时,可以使用向量文档向量间的距离来衡量,一般使用内积或夹角θ的余弦来计算,两者夹角越小说明相似度越高。由于查询也可以在同一空间里表示为一个查询向量(见图1),可以通过相似度计算公式计算出每个文档向量与查询向量的相似度,排序这个结果后与设立的阈值进行比较。如果大于阈值则页面与查询相关,保留该页面查询结果;如果小于则不相关,过滤此页。这样就可以控制查询结果的数量,加快查询速度。
三、以经济信息检索为例的实例分析
经济发展依赖于自然资源的开发与利用,也离不开经济信息资源的开发和利用。开发经济信息资源,实际上是对人类智力的开发,是一种知识和科学技术的开发,一种生产技能和管理技能的开发。现在,经济信息已经渗透到现代生活的各个领域,有效地地开发和利用经济信息,提高经济信息的传播速度已经成为现代经济发展的一种推动力,能够大大提高劳动者的智力水平,从而促进经济的发展。因此,在以经济建设为中心、大力发展社会主义经济的过程中,必须不断地开发和利用经济信息资源。
经济信息是一种社会资源,作用于经济活动过程,已经成为现代社会经济发展的一个先决条件。现代经济建设是一个庞大而复杂的系统,需要依据大量的经济信息去控制、指挥、协调和组织系统的内部关系,系统和系统之间也需要靠经济信息去联系,才能使经济活动达到人们预期的目标。在科学技术迅猛发展的社会里,经济信息资源显得更加重要。
假设现有一个包含4篇经济金融类相关信息文档的集合,这4篇文档如下:
D1:金融投资的对象是金融资产……
D2:金融资产是获得投资收益的资产……
D3:证券投资、基金投资和期权投资组成金融投资……
D4:获得投资收益是证券性金融投资的主要目的……
检索表达式Q为:金融投资的资产收益。
首先,需要对文档和检索表达式进行分词处理,其结果如下:
D1:金融/投资/的/对象/是/金融/资产/……
D2:金融/资产/是/获得/投资/收益/的/资产/……
D3:证券/投资/、/基金/投资/和/期权/投资/组成/金融/投资/……
D4:获得/投资/收益/是/证券/性/金融/投资/的/主要/目的/……
Q:金融/投资/的/资产/收益/。
然后除去停用词,去除后的文档如下:
D1:金融/投资/对象/金融/资产/……
D2:金融/资产/获得/投资/收益/资产/……
D3:证券/投资/基金/投资/期权/投资/组成/金融/投资/……
D4:获得/投资/收益/证券/金融/投资/主要/目的/……
Q:金融/投资/资产/收益/。
计算项的权值根据公式
各个索引项的df和idf值如表2所示
各个索引项在文档中的频度如表3所示
则各个索引项在文档中的权值如表4所示
检索表达式的权值很简单,如表5所示
采用内积法计算向量的相似度,则可以看出,文档D3与检索表达式的相似度最高,D1、D2、D4相同且低于D3。
四、算法分析总结
算法的计算复杂程度还需要进一步探讨,目前这些研究都还不够深入,许多问题还有待于进一步探讨;同时由于自然语言的复杂性,新查询向量的查全率和查准率虽然有所提高向量模型是以假设向量空间的各维之间相互正交(即各关键字之间相互独立) 为前提的,因而不可避免地存在由此带来的损失关键字间的相关性的缺点,可它把对文档内容和查询要求的处理简化为向量空间中向量的运算,克服了布尔模型的二值评价的缺点,可以计算出文档与查询式的相关程度,因而可以很容易地进行输出结果的排序,用户相关性反馈机制也很容易实现,尤其是具有对处理海量数据的适应性等种种优点使得它自诞生以来,至今都有很强的生命力。
参考文献:
[1]雷景生林冬雪符浅浅:基于改进向量空间模型的Web信息检索技术研究[J].计算机工程, 2005, 1: 14~16
[2]王晓黎王文杰:基于向量空间模型的文本检索系统 [J].微电子学与计算机, 2006, 23: 188~190
[3]包金龙:基于向量空间模型的信息检索系统的设计 [J].情报检索, 2005, 7:44~45
[4]安茹娜:浅析经济文献信息的开发和利用[J].科技情报开发与经济,2007,12:54~55
信息检索技术不断发展的今天,其应用的领域也不断的扩大。信息检索的出现,完全是由于信息时代的到来,人们的生活与工作都离不开信息。互联网的极大增长,让信息更加广阔的开始,有了发展的空间和广阔的平台。因此,当信息出现大幅度提升的时候,就会出现信息检索。信息检索实际上是一种信息的搜索技术,能够在一定程度上完成高效率的信息调用,从而简化搜索的繁琐流程,直接实现信息的查阅。对于未来的计算机信息检索技术,可以通过空间模型的方式进行信息检索的设置和设计,从而保证信息检索的高效性。
2信息检索技术的分析
计算机网络技术越来越发达,从而让整个世界连接起来,从而实现了互联网空间。互联网不仅仅成为了人们相互交流的平台,更在一定程度上给信息的提供了广阔的空间。互联网时代实际上也是信息时代的呈现,从而让更多的信息跃然网上。信息时代最大的特点在于信息是人们生活中不可缺少的一部分,从而使得信息检索成为了人们工作中比较重要的一部分。作为信息检索技术而言,其主要的技术基础依然是计算机平台。计算机平台可以实现一定程度上的信息管理,其中数据库就是非常重要的信息存储以及调用的管理系统。那么,对于信息检索技术而言,其技术核心有哪些?需要哪些辅助技术进行支持呢?
首先,信息检索技术应该称之为计算机信息检索技术,其支撑平台是计算机。一般情况下,计算机平台会通过对信息的一定处理方式,来实现对于信息的管理。多数情况下,信息的存储和调用都是通过计算机进行的。
其次,目前的信息检索技术只停留在用户对于自身平台数据的调用,而无法实现跨越平台的信息检索。因此,目前的信息检索技术还是存在一定的局限性。随着人们对于信息检索技术要求的不断提升,必然会开发进一步的信息检索技术。
最后,对于高级计算机用户而言,信息检索技术能够从不同角度进行信息的调用,从而反应出所需要了解的信息。例如,计算机的用户需要完全了解一项事物的特点,就可以通过信息检索功能,逐步进行信息的查询,最终得到所需要的信息。
但是,在信息检索的准确度方面,只能保证不会出现检索失误,但是认为的录入失误必然无法避免。因为毕竟信息是通过人工的录入或者是发表的,因此需要计算机信息检索的工作人员进行认真处理,从而保证录入信息的准确性,才能够实现准确而高效的信息录入。
3基于向量空间模型的信息检索技术分析
向量空间模型是基于计算机的三维设计而提出的,向量空间代表信息除了具备数据性,其还具有方向性。矢量数据的最大优势在于能够通过数据来体现其价值以及信息,单纯的信息则无法实现这一功能。因此,需要通过向量空间的模型基础来进行信息的检索技术开发。
传统的信息检索技术就是单纯的信息搜索,虽然能够提高工作效率,但是却在很大程度上无法实现更大的信息量的提供。例如,在进行一项信息的检索的时候,只能够进行信息的逐一检索,而无法实现全局检索,或者是多维度检索。而向量空间,是采用了物理学中的向量空间的基础概念,将信息进行空间化处理。例如,一项数据分析,其中主要包括的是数据。但是,单纯的数据必然无法满足人们对于数据的了解需求。因此,在进行信息的向量设计方面,就可以给原有的数据信息添加空间内容。例如,对于一个人的个人信息,如果只是单纯的文字信息,必然会无法了解更多的信息。那么,在进行信息的初期设置的时候,可以将个人的照片以及相关视频进行全方位的设置,从而让个人信息更加饱满。那么,在进行信息检索的过程中,就可以实现多角度调用,从而满足用户的需求。
此外,对于计算机检索的检索系统而言,也可以进行空间的模型设计。例如,在进行信息检索的时候,如果通过图像、声音、视频以及文字等多个人口进行信息检索,那么就会在一定程度上提高检索的效率,并且在很大程度上实现了空间化的信息检索。不仅如此,对于计算机的高级用户而言,信息检索将成为一种全面了解信息的最佳方式。
总之,计算机信息检索技术必然会更加高效和准确,未来的向量空间技术也将得以广泛使用,从而实现检索技术的高效应用。
4结语
信息检索技术的出现,在很大程度上是受到计算机技术的影响。计算机的出现,形成了数据的世界。计算机的网络技术将信息作为一种必要的产物带到了信息时代,从而使得信息大爆发一样出现。信息逐渐成为了人们生产和生活的必要组成部分,并且影响着人们的生产与生活。但是,随着信息量的逐渐增加,人们在进行信息查询的过程中就会遇到问题。因此,信息的检索技术出现,并在一定程度上提高了使用者对信息的查找效率。当然,信息检索技术是建立在计算机平台技术之上的。向量空间的模型,也是一种比较高端的信息检索技术,其中包括了三维的信息检索,从而让信息检索更加高效。
参考文献:
[1]孙玲玲,姜新,刘丽.言息检索实践课教学的新模式——以河北民族师范学院为例[J].图书馆学刊,2013,(01):83-85.
[2]辛阳,文益民,曾德森,彭文乐,申孟杰,刘文华.一种专利智能推荐算法设计与软件实现[J].计算机系统应用,2013,(01):70-73.