首页 > 范文大全 > 正文

语义网应用研究的文献计量学分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇语义网应用研究的文献计量学分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]在CNKI中国期刊全文数据库中选取2001-2010近10年间关于语义网的研究论文共736篇,用文献计量学的方法,结合内容分析法对这些论文进行分析。从近10年间论文量变化、论文的地区分布、论文作者的机构分布、作者分布、刊物分布等方面总结我国语义网应用研究的现状,并预测今后5年内语义网应用研究的趋势。

[关键词]语义网应用;文献计量学;内容分析

[中图分类号]TP39 [文献标志码]B [文章编号]1005-6041(2012)03-0086-03

1、引言

万维网的发明人蒂姆·伯纳斯·亨爵士于15年前预见到了语义网的兴起,我国关于语义网的研究起步于2002年。至今语义网已在诸多方面发挥其作用,例如:通用及垂直搜索引擎、文本助理工具、个人信息管理系统、语义浏览工具。近两年,国外学者对语义网的应用研究集中在信息组织、虚拟组织、知识管理和Web 2.0等领域。除此之外,图书馆功能在语义网中的应用、受控词表在语义网中的应用、语义网与数字图书馆的研究也正日渐倍受关注。

2、资料与方法

本文选用CNKI中国期刊网全文数据库的数据,从中搜集2001-2010年间有关语义网的学术研究论文并进行统计。检索方法如下:使用关键词检索,检索词为“语义网”,范围为“全部期刊”(包含EI来源期刊、SCI来源期刊、核心期刊和其他),匹配方式为“精确”。

3、结果与分析

3.1 现状分析

3.1.1 从文献量的变化看我国语义网应用研究的发展状况。

(1)根据CNKI的检索结果,2001-2010年间有关语义网的研究论文总量为736篇。经过手工去重、手工去除内容不合要求的文献共64篇(如发刊词、商业评论、会议记录、人物访谈等),共得到文献692篇(表1)。通过数据分析,我国对语义网的研究始于2002年,从2006年始文献增长量趋于稳定(调查时间为2010年7月15日)。

(2)语义网研究分为两个方面:理论研究和应用研究。理论研究是针对语义网自身的研究,其可以是宏观的理论研究,也可以是微观的技术探索。应用研究是有关语义网理论或技术在其之外领域的应用,且语义网的理论和技术在其中起显著作用。利用内容分析法将2001-2010年间有关语义网的692篇论文按“理论研究”和“应用研究”分类并计数,理论研究的论文数量为237篇,占总量的35.27%;应用研究的论文量为435篇,占总量的64.73%。

(3)2001-2010年间,语义网应用研究各年的论文数量及其占当年语义网研究(包括理论研究和应用研究)的百分比制成表格,如表2所示。并将表2中的百分比以年为单位,制成年度折线图,如图1。可以看出,语义网应用研究论文数量最多的年份是2006年,为92篇,同年语义网应用研究论文数量的百分比也为近10年中最高,77.87%。

通过对折线图的分析,语义网应用研究的论文数量占语义网研究的百分比从2003年起趋于平稳,2003-2009年7年间,这个百分比的平均值为67.42%。这表明我国对语义网应用研究的重视程度较理论研究高,且从2003年起一直稳定。

(4)通过内容分析法发现,语义网应用研究已涉及众多的领域。例如:图情档(信息检索、数字图书馆、信息资源管理、个性化信息服务)、互联网建设(e-learning、folksonomy、Web2.0、Web3.0、Web服务、网站建设、网络安全、网络社区)、计算机科学(计算机编程、软件开发、计算机工程、智能)、教育、国民经济(工业、农林业、商业金融、物流、传媒、进出口)、电子政务、军队建设,另外还包括地理学、生物学等。以上的各个领域之间有可能存在交叉,它们在各自发展成熟的过程中相互借鉴和融合,因此并不能截然划分。对于内容交叉的论文,将根据内容主次,归入其主要内容所属的一类。

在上述众多的研究领域当中,存在一些“热点方向”和“新兴方向”。热点方向的论文数量较多,新兴方向的论文数量较少且出现时间较晚。以占语义网应用研究论文总量的比重4%为界,超过4%的被称作热点方向,低于4%且第一篇论文出现的时间在2008-2010年间的被称作新兴方向。通过数据分析和内容分析,共得出6个热点方向,分别是商业金融、Web服务、教学、数字图书馆、信息检索、知识管理。论文数量比例合计占53.79%,论文数量最多的方向为信息检索,为20%;4个新兴方向,分别是智能、Web2.0/3.0、e-learning、计算机科学,论文数量比例合计占9.8%。如图2表示为:

3.1.2 2001-2010年间论文的地区分布。

在本次统计中,标明作者单位的论文共计615篇。此处的作者指论文的第一责任人。除中央级单位的论文41篇之外,地方级高校和科研院所的论文数量为574篇。按照省(自治区、直辖市)的分布进行数据分析并按论文量多寡排序,得出的结论是,北京为论文量最多的地区,有97篇,其次依次为湖北(62篇)、江苏(53篇)、上海(47篇)、浙江(40篇)、广东(39篇)、陕西(27篇)。其余省份不作枚举。

2001-2010年间论文作者(指第一责任人)的机构分布。将作者单位按大专院校、科研机构、医疗单位及其他单位进行分类统计,每类再按“中央”“地方”“其他”分别统计,其结果见表3。

根据论文作者的单位进行分类统计排序之后得出,在2001-2010年间论文出产量最高的单位是武汉大学(25篇),其次依次为浙江大学(17篇)、北京大学(15篇)、清华大学(13篇)、同济大学(13篇)、吉林大学(12篇)、中南大学(12篇)、华中科技大学(11篇)、南京大学(11篇)。其余不作枚举。

3.1.3 论文的作者分布情况。

据统计,2001-2010年间,最多的是中南大学信息科学与工程学院的徐德智、武汉大学计算机学院的虞为,各为5篇。应该指出的是,二人的年限均为2006-2008年间。

3.1.4 2001-2010年间文献的刊物分布及排序。

经统计,量在10篇以上的刊物共有17种,共计234篇,占语义网研究文献总量的34.82%。按刊载文献量的多寡排序如表4。

3.2 趋势分析

一门学科的兴衰动向与其表达科学成果的文献数量和文献内容结构紧密相连,并具某种相关性。预测2010-2014年语义网应用研究的论文数量及其相对于2009年论文数量的百分比,以观察其增长情况见表5。

由表5可见,2014年关于语义网研究的论文数量将比2009年增长10.77%,2014年增长13.98%,2014论文数量年较2002年增长25.53倍。预计未来几年,我国关于语义网应用研究仍将处于上升趋势。