首页 > 范文大全 > 正文

国内知识检索研究的文献计量学分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇国内知识检索研究的文献计量学分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘 要] 运用文献计量学分析方法,从年份文献增长量、期刊载文量、被引频次、第一作者发文量、第一作者单位、关键词词频、基金论文量、论文主题角度,针对发表在CSSCI来源期刊上,以知识检索为篇名的论文进行梳理和分析。

[关键词] 知识检索;综述;知识管理;文献计量分析;研究进展

[中图分类号] G350 [文献标识码] A 文章编号:1671-0037(2015)01-70-4

Bibliometric Analysis of Domestic Research on Knowledge Retrieval

――Based on Statistic Analysis of CSSCI Source Journals

Wang Pei

(Library of Zhongyuan University of Technology, Zhengzhou Henan 451191)

Abstract:From literature growth by year, number of articles published, citation frequency, numbers of the first author’s publication, the first author’s affiliation, keywords frequency, the quantity of papers supported by Foundation, topics of the papers, the paper reviews the papers with the title of knowledge retrieval published in CSSCI source journals are sorted and analyzed by applying the method of bibliometric analysis .

Keywords:knowledge retrieval;review; knowledge management; bibliometric analysis; research development

1 研究背景

借助《中国期刊全文数据库》,以“知识检索”为篇名精确检索发现:1990年,武汉大学张玉峰在期刊《情报科学》上发表的《基于框架表示的知识检索方法研究》一文,是国内学者涉足知识检索领域研究的开始,是知识检索的萌芽时期。1991―1999年末发现有学者关注该领域,2000年《计算机工程与应用》在第11期刊载了周受钦、谢友柏《分布式集成信息系统中知识检索方法》,这意味着搁置9年的研究主题重新引起学术界的重视。

为了国内知识检索相关研究成果进行全面梳理,本文采用文献计量法[1],以《中国期刊全文数据库》、《万方学术期刊全文数据库》2001―2012年(截至到2012年12月31日)为数据源,以“知识检索”为篇名精确检索分析。考虑到CSSCI来源期刊刊登论文质量相对其他普通期刊更高,对研究主题前沿把握更全面,本文拟对检索到45篇CSSCI来源期刊论文为分析样本[2],其中综述类文献1篇(程慧平[3],2011)。从年份文献增长量、期刊载文量、被引频次、第一作者发文量、第一作者单位、关键词词频、年份基金论文量七个方面,针对国内知识检索领域21世纪以来研究文献进行了归纳与分析,以期能够全面分析我国知识检索的研究状况。

2 分析结果

2.1 年份文献增长量分析

从年份文献量增长曲线,如图1所示。可以看出:2001―2012年CSSCI来源期刊共发表以“知识检索”为篇名的论文45篇,即平均每年不足4篇。关于“知识检索”的研究成为国内图书情报学界研究的热点和重点,从趋势上来看正在走向研究的发展阶段,拓展空间相当广阔[4]。

2.1.1 2001―2012年间,国内知识检索研究经历两次高峰期,分别为2006年和2009年,刊载的论文数量为8篇、10篇。

2.1.2 2006年前,国内知识检索发文量处于平稳上升趋势,2006年后,呈现“下降――上升”波浪式增长趋势。

2.1.3 从图1看出,目前我国知识检索研究正处于相对彷徨期,但并不意味着知识检索发展停滞,表明知识检索领域正面临着新的突破,将产生出更新的分支领域,而研究主题上更新的将是新的突破口。

2.2 期刊载文量统计分析

期刊载文量统计结果如表1所示,45篇论文主要分布在:G25(图书馆事业,信息事业类)和G3(科学,科学研究)两大学科领域。G3领域仅有1篇:《企业业务流程知识检索方法研究――基于知识模式》。G25领域刊文量前3的期刊分别为:《情报科学》、《情报理论与实践》刊文量各为8篇并列第一,《图书情报工作》、《现代图书情报技术》排序第二和第三,刊文量分别为7、6。以上4本期刊刊文共性之处在于偏好知识检索模型(系统)的构建。

按照普赖斯的理论,量为m篇以上的期刊为该领域的核心期刊,核心期刊的最低刊文量m=0.749×<E:\2015创新科技\创新科技1期\Image\01P12-2.tif>,nmax为刊文量最高期刊的刊文数[5]。根据论文量排名第一的《情报科学》、《情报理论与实践》各发表了8篇论文,则在知识检索领域核心期刊最低发文量为m的最大整数为3。

因此,可以发现知识检索领域文章更容易在以下期刊上发表:《情报科学》、《情报理论与实践》、《图书情报工作》、《现代图书情报技术》、《情报杂志》、《情报学报》、《中国图书馆学报》。

2.3 被引频次统计分析

被引频次排名前10位的论文如表2所示:

2.3.1 被引频次最高的论文是马文峰发表在《情报理论与实践》杂志上“知识检索研究”,被引频次52,该文回顾了知识检索的有关理论与方法;其次是,张玉峰发表在《中国图书馆学报》杂志上“论知识检索与信息检索”,被引频次47;第三是,黄红华发表在《情报杂志》上“基于Ontology的知识检索”被引频次37。

2.3.2 《情报理论与实践》、《中国图书馆学报》、《情报杂志》三本杂志的论文均被引频次位于前三名。

2.3.3 被引频次前10位的论文中,《情报科学》刊文量最高,4篇;其次是《中国图书馆学报》、《情报杂志》各刊3篇。第三是《情报理论与实践》、《情报学报》各刊2篇。

2.3.4 高频被引文献的年代分布主要集中在2002―2006年。17篇高频被引文献中,2006年占6篇,2005年占3篇,2004年4篇,2003年3篇,2002年仅1篇。

2.3.5 高频被引文献的单位主要来自于武汉大学,这表明在武汉大学国内知识检索领域所取得的成就遥遥领先,初显出其权威专家、权威团队的核心著者群地位。

2.4 第一作者发文统计分析

分析的原则同一科研机构不同的部门归为一类,统一命名为同一机构名称[6]。按照普赖斯的理论,量为m篇以上的作者为该领域的核心作者,核心作者的最低发文量m=0.749×<E:\2015创新科技\创新科技1期\Image\01P12-2.tif>,nmax为发文量最高作者的发文数。根据论文量排名第一的金燕共计发表了4篇论文,则在知识检索领域核心作者最低发文量为m的最大整数为2。通过计算,得到知识检索核心作者是:金燕、张玉峰、王弼佐。金燕系张玉峰教授的研究生,现为郑州大学信息管理系教师。

2.5 作者单位统计分析

按第一作者单位统计论文数量,45篇论文涉及作者单位为26所,其中科研院所2所,高校24所。武汉大学最多,达到14篇,南京大学第二为4篇。按照普赖斯的理论,可以发现武汉大学和南京大学是知识检索领域权威研究机构。第二军医大学、南京理工大学、中国农业大学各发表2篇,并列第3名。其他高校或科研院所均为一篇。

2.6 关键词词频统计分析

在关键词的统计过程中,出现了一些意思相近表达形式不同的词,如“本体论”、“本体”和“ontology”及“本体技术”等,笔者将此类词统一到一个词上,以便进行简单的规范。通过对相关文献的关键词分析,可以发现知识检索研究的热点和发展动向。对知识检索论文中的关键词进行了统计和词频排名,表2是出现频率大于2的关键词。可以发现:本体、信息检索、语义、检索模型、检索系统、知识组织、可视化、推理、相似度、数字图书馆、知识管理、知识表示、知识抽取是知识检索领域重要研究主题。

从关键词来看,知识检索相关研究主要体现在以下几个层面:①知识检索模型;②知识检索基础:信息检索、知识组织、知识表示、知识抽取;③知识检索系统;④知识检索模块:可视化、推理、相似度;⑤知识检索应用领域:数字图书馆。

2.7 基金论文量分析

笔者对论文受到国家社科和自科基金项目资助的项目进行了统计,结果如表6所示:

基金论文数量为23,总论文数量的50%左右。出现了4次增长极,分别为:2003,2006,2009,2011年。

2001―2005年:2003年从2002年1篇增长至3篇,此期间武汉大学信息管理学院张玉峰教授获得我国首批知识检索专项基金资助,分别为:国家社会科学基金项目“基于学习的智能检索机制研究”(编号:01BTQ011)。教育部人文社会科学重点研究基地重大项目“信息可视化与知识检索”(编号:02JAZJD870004)知识检索子课题,这两项基金奠定张玉峰教授在知识检索领域的开拓者的专家地位。2004年相比2003年而言,刊文下降了1篇;2005年持续下降,仅有1篇。

2006―2010年:2006年基金论文数量为5篇,2007年出现下滑,仅1篇。2008年也仅1篇,2009年再次上升至5篇。2010篇再次下滑至1篇。2011―2012年:2011年上升至2篇,2012年下滑至1篇。

从项目来看,基金论文中国家社科基金资助5项,国家自然基金4项。武汉大学、中国人民大学分别获得国家自科基金和国家社科基金各1项;华南理工大学获得2项国家自科基金。南京政治学院上海分院、南京大学、武汉科技学院(武汉纺织大学)各获得1项国家社科基金。

2.8 论文主题分析

根据45篇论文的研究主题进行分类,结果如图3所示。通过论文主题分析,笔者发现现有论文研究主题主要分布在:知识检索技术、系统、模型、方法、概念、原理、策略、模式、算法、效率、应用、综述。其中,以知识检索技术、知识检索系统、知识检索模型最为突出。可见,国内知识检索研究的热点在知识检索技术、知识检索系统和模型构建。

3 结语

运用文献计量学方法,通过对发表在CSSCI来源期刊上,以知识检索为篇名的论文为分析对象,通过概要梳理和分析,得出以下结论:

3.1 从年份文献增长量来看,国内知识检索研究成果在2006年前的发文量处于平稳上升趋势,2006年后呈现“下降――上升”波浪式增长趋势。

3.2 从期刊载文量来看,45篇论文主要分布在:G25(图书馆事业,信息事业类)和G3(科学,科学研究)两大学科领域。《情报科学》、《情报理论与实践》刊文量并列第一,《图书情报工作》、《现代图书情报技术》分别位于第二、第三。知识检索领域研究成果较容易在以下期刊上发表:《情报科学》、《情报理论与实践》、《图书情报工作》、《现代图书情报技术》、《情报杂志》、《情报学报》、《中国图书馆学报》。

3.3 从被引频次来看,高被引文献发表时期主要在2002―2006年,高被引文献的单位主要来自于武汉大学,高被引期刊主要分布在:《情报理论与实践》、《中国图书馆学报》、《情报杂志》。

3.4 从第一作者发文量来看,知识检索核心作者是:金燕、张玉峰、王弼佐。张玉峰教授团队是知识检索领域核心科研团队。

3.5 从第一作者单位来看,武汉大学和南京大学是知识检索领域权威研究机构。

3.6 从关键词词频来看,语义本体、检索模型、检索系统、知识组织、可视化、推理、相似度、数字图书馆、知识表示、知识抽取是知识检索领域重要研究主题。

3.7 从基金论文量来看,基金论文数量占总论文数量的50%左右。知识检索发文量4次增长年份分别为:2003,2006,2009,2011年。基金论文中国家社科基金资助5项,国家自然基金4项。

3.8 从论文主题来看,国内知识检索研究的热点在知识检索技术、知识检索系统和模型构建。

本文也存在一定的研究不足,如样本的选取不够全面,仅选取《中国期刊全文数据库》、《万方学术期刊全文数据库》以篇名进行精确检索,尚未考察学位论文、会议论文。另外,分析样本仅选取CSSCI来源期刊,而知识检索在分类号TP(自动化技术、计算机技术)学科领域也有研究。未来将通过以知识检索进行主题检索,原因主要在于主题检索是篇名、关键词、摘要的三个字段的逻辑或,这将是今后需要进一步研究的切入点。最后,希望本文的分析结论能对国内未来继续从事或即将涉足于知识检索研究工作的科研人员有所启示,也希望自己的研究结论能对知识检索领域的研究尽一点微薄之力。

参考文献:

[1] 韩红旗,安小米.1991-2010信息资源管理研究发展状况的文献计量分析[J].情报科学,2013(4):145-148.

[2] 邱均平,马凤.近五年我国图书馆研究论文的计量分析[J].图书馆论坛,2011(5):22-26.

[3] 程慧平,陈永超.国内知识检索研究进展[J].图书情报工作,2011(10):126-129.

[4] 周旖.1988-2005年我国“图书馆精神”研究领域论文文献计量分析[J].图书馆建设,2006(6):107-110.

[5] 韩芳芳,范群,韩青青.我国大数据领域研究论文的计量分析[J].图书馆学研究,2013(8):2-7.

[6] 郝屹.近五年竞争情报研究的文献计量分析[J].情报科学,2012(12):1907-1910.