首页 > 范文大全 > 正文

国际大数据研究论文的计量分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇国际大数据研究论文的计量分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

〔摘要〕本文利用Web of Science数据库,对国际数据研究领域的文献进行收集,分别按照论文的年代、著者、国别与机构进行统计分析,并利用SPSS软件对文献的高频关键词进行聚类分析和多维尺度分析,利用Ucinet软件予以可视化呈现,总结了国际大数据研究的现状与热点,以期对国内大数据的研究提供有益的参考和借鉴。

〔关键词〕大数据;共词分析法;聚类分析;多维尺度分析;可视化

DOI:10.3969/j.issn.1008-0821.2013.09.026

〔中图分类号〕TP391;G250.252〔文献标识码〕A〔文章编号〕1008-0821(2013)09-0129-06

2011年5月,麦肯锡全球研究院(McKinsey Global Institute)了研究报告《大数据:创新、竞争和生产力的下一个前沿领域》(Big data,The next frontier for innovation,competition,and productivity)[1]。2012年1月在瑞士达沃斯举行的世界经济论坛上,“大数据”是讨论的主题之一,论坛上的题为《大数据,大影响》(Big Data,Big Impact)的报告中提出,“数据已经成为一种新的经济资产类别,就像货币或黄金一样。[2]”2012年3月29日,美国政府在白宫网站上了《大数据研究和发展倡议》(Big Data Research and Development Initiative),该倡议涉及联邦政府的6个部门,这些部门承诺将投资超过两亿美元,来大力推动和改善大数据的提取、存储、分析、共享和可视化。

无论是美国政府的倡议,麦肯锡的研究报告,还是世界经济论坛的议题,都预示着人们,大数据时代已经到来。大数据正在撬动全世界的神经,大到一个国家、企业,小到每一个独立存在的个人,都将成为大数据时代的贡献者和受益者。那么,大数据究竟是什么?维基百科将大数据解释为“是指无法在一定时间内用通常的软件工具进行捕获、管理的数据集合”[3]。关于数据量究竟要达到多少才可以被称之为大数据,目前尚无统一说法。一般认为,大数据的数量级应该是“太字节”,即240。大数据之“大”,并不仅仅在于其“容量之大”,更多的意义在于,人们可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”[4]。

目前国内学者中,杨绎以国内文献为研究基础,以关键词分析为主要方法,对目前国内期刊和报纸上有关“大数据”的文献进行了研究[5]。韩芳芳等以CNKI为数据源,从文献、作者、关键词3个角度分析我国大数据领域的相关文献。笔者认为很有必要对国际大数据领域文的献进行分析,从而把握国际大数据领域的研究现状与热点,以供国内学者参考借鉴。

1数据来源与研究方法

Web of Science(简称WOS)是美国汤姆森集团开发的产品,是大型综合性、多学科期刊引文索引数据库。WOS收录了世界上经过同行专家评审的有影响力的文献,选用WOS作为数据源进行研究可以保证研究资料的权威性。本文选取WOS数据库下3个子库Science Citation Index Expanded(SCI-EXPANDED,科学引文索引扩展版)、Social Sciences Citation Index(SSCI,社会科学引文索引)、Arts & Humanities Citation Index(A&HCI,人文艺术科学引文索引),检索年限为“所有年份”,数据库更新日期为2013年4月5日,以“big data”为检索词进行“主题”检索,共检得171篇大数据领域的相关文献(检索日期:2013年4月10日)。

本文借助SPSS 190软件,采用共词分析法对国际大数据的研究热点进行分析。共词分析法(Co-term Analysis)最早是在20世纪70年代中后期由法国文献计量学家提出的,其思想来源于文献计量学中的引文耦合与共被引的概念。共词分析法的基本原理是,统计一组词(关键词或者主题词)两两在同一篇文献中出现的次数,以此作为基础进行聚类分析,从而得出这些词语之前的亲疏远近的关系,进而分析出这些词语所代表的学科或者主题的结构变化情况[7]。共词分析法研究的是某一学科领域中当前的学术文献所集中关注的主题,很适合于分析某一学科的研究热点和知识结构[8]。

2013年9月1第33卷第9期1现?代?情?报1Journal of Modern Information1Sep,20131Vol.33No92013年9月1第33卷第9期1国际大数据研究论文的计量分析1Sep,20131Vol.33No92文献计量分析

2.1年代分析

通过对文献发表时间的分析,可以勾勒出国际大数据研究领域的发展轨迹,揭示其发展的总体趋势。将在数据库中检索得到的论文按照年度进行归类,如表1所示。

从表1可以看出,国际大数据研究可以分为两个时期:第一时期从1974-2007年,是起步探索时期。这一时期的研究成果比较零散,数量较少,除2006年有3篇外,其余年份均在2篇或以下。第二时期是从2008年至今,是快速增长期。2008年的文献量突然增长到11篇,究其原因,是因为2008年9月《Nature》杂志开设了“大数据”专刊,发表了10篇有关大数据研究的文章,从大数据的技术、发展方向以及对人类的挑战等多个角度介绍了大数据的相关问题。这10篇文献也被后来的文章多次引用,揭开了国际上研究大数据热潮的序幕。2012年文献量达到历史性的84篇,是第一时期文献量最多的2006年的近30倍。这与2011年麦肯锡研究中心的大数据研究报告以及2012年初奥巴马的大数据倡议息息相关。由于数据库的收录具有滞后性以及检索时间是4月份,2013年的数据不全,却已经有29篇文献,可以预测未来几年国际大数据研究还会继续保持快速增长的趋势。