基于CSCD和SCI的跨省区科学合作网络可视化分析(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇基于CSCD和SCI的跨省区科学合作网络可视化分析范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

〔摘要〕利用cscd(1998-2005)和sci(2000-2005)数据库得出我国31个省区科学合作论文的数据矩阵，构建出一系列跨省区、有向加权的合作网络。利用网络绘图分析软件Netdraw将其可视化，并从不同角度将省区间的科学合作状态表现出来并加以分析。结果显示：弱势省区倾向于与强势省区合作;弱势省区之间合作极少;SCI合作网络中各省区之间的合作差异程度大于CSCD合作网络中的合作差异程度。

〔关键词〕科学合作合作网络可视化

〔分类号〕G306.3

Analysis of Interprovincial Science Collaboration Network Visualization Based on CSCD and SCI Databases

Yin Lichun1Yin Fuliang3

School ofElectronic and Information Engineering, Dalian University ofTechnology, Dalian116024

Jiang Chunlin2Wang Youqiang4

21st Century Development and Research Center,Dalian University ofTechnology, Dalian116024

〔Abstract〕Using the databases of CSCD and SCI, the paper gets the data matrix of science collaboration papers of 31 provinces in China, and constructs a series interprovincial collaboration networks with directed weight. The paper also makes the cooperation network visualization by using the social network analysis software――Netdraw. The results show that developing provinces tend to cooperate with developed provinces, especially with the capital cities such as Beijing, but cooperation among developing provinces are seldom, and that cooperation differences among provinces in SCI database are more distinctive than in CSCD database.

〔Keywords〕science collaborationcollaboration networkvisualization

1引言

随着现代科学技术的进展和经济全球化步伐的加快，科学研究正日益呈现出既高度分化又充分整合的趋势。科学合作是实现研究资源共享、减低科研难度和学者获得学术声誉的重要形式。科学合作的迅猛增长引起了众多学者们的注意。著名科学学和科学计量学家普赖斯(J. D. Price)，于20世纪60年代通过考察1910-1960年间发表于《化学文摘》中论文的署名形式，发现合作论文由不足20%增长至80%。美国科学社会学家朱克曼(Zuckerman)在20世纪70年代通过一项研究发现，在诺贝尔奖设立的头25年中，合作获奖者占41%；第二个25年达到65%；第三个25年则已高达79%。格兰采尔(W. Glanzel)和克罗文(H.Gzerwon)从1992年出版的SCI中随机抽取4 534篇论文进行分析，发现90%以上的论文是通过合作研究完成的[1]。不仅自然科学领域，而且人文社会科学领域的合作趋势也呈加强之势[2]。科学合作已成为科学计量学研究的一个重要领域，可为科技政策的制定提供理论基础。

20世纪90年代后，科学计量学对科学合作的关注已经从简单测算某一学科领域的合著率、合作度、合作强度等，开始向构建数学模型、聚类、可视化方向转移。国内学者刘杰等对我国物理学权威期刊《物理快报》和Chinese Physics发表的有关混沌理论方面的学术论文合作关系形成的小型科学合作网络进行了研究，发现该合作网络及其内部连通组群的聚类特性和小世界特征等[3]。梁立明等人利用中国科学引文数据库(CSCD)对我国34个行政区跨省区科学合作的马太效应和地域倾向进行了探讨[4]。奥特(E. Otte)和鲁索(R. Rousseau)将社会网络分析成功应用于信息科学[5]。克里奇默(H. Kretschmer)运用网络分析方法研究了62个COLLNET成员构成的合作网络特征[6]。网络分析方法在国内已经得到了广泛的研究，但在科学计量学领域中的应用还极为有限，本文将利用网络分析方法对国内省区间的合作特征展开讨论。

2数据来源

本文研究使用的原始数据为中国科学院文献情报中心的CSCD(1998-2005)数据库和SCI(2000-2005)给出的中国大陆31个省区合作论文分布矩阵①②，1998年和1999年无SCI合作论文统计项，具体数据略。所得分布矩阵中的列表示第一作者所在省区，行表示与第一作者合作的省区(不区分第二作者、第三作者……)。只要第一作者省区和其他省区作者有合作，即累计一次，这样矩阵中的元素就会有很大差异，合作次数越多，数值就越大。

3研究方法与结果分析

社会网络分析方法最初主要应用于社会学研究，随着数学、计算机科学和复杂性科学的发展，网络分析的理论、方法和技术日臻成熟，几乎在所有学科领域得到应用[7]。本文使用广为流行的网络分析软件Ucinet对各省区合作关系进行分析，并绘出可视化图形。

在网络分析中，某一个节点的度就是与这个节点相关联的边的条数。对于有向网络，节点的度又分为入度和出度。出度是指从给定节点出发的边的数量，入度是指指向给定节点的边的数量。31个省份之间基本上都存在合作关系，但合作次数差别很大。所得矩阵的行向量表示所在行的省份作为第一作者分别与各个列省份合作论文的次数。而矩阵的每一列则代表所在的列省份作为合作作者分别与各个行所在省份作为第一作者合作的论文数量。在本文研究的省区合作网络中，节点代表各个省份;出度代表某一个省的作者作为第一作者的合作文章数量;入度则是某一个省的作者作为合作作者出现的次数。因此这个合作网络是一个有向带权重的网络。为了能更加清楚直观地展示出各个省份之间合作状况，本文将各个年度段的合作次数取平均值，然后将合作次数少于平均值的边去掉，这样在图上显示出的就是合作强度很高的边。

表1给出了1998年和1999年各省区科学合作的出度和入度值。可以看出，北京作为我国高等学校和科研机构云集的地区，出度和入度值均处于最高水平，表明其在省区间科学合作中的中心地位。此外，江苏、上海、广东作为我国科技和经济文化较发达地区也是其他省区寻求科技合作的主要对象。而青海、、宁夏和海南则极少与其他省区合作，其他省区也很少与其合作。从整个数据分布可以看出，在这两年内，我国省区间的科学合作存在较大差异。从合作方向看，基本可以分为三种类型，即出度和入度基本平衡、出度大于入度、出度小于入度三种。出度和入度的差异反映了某省区与其他省区、其他省区与该省区合作的倾向性。

为了形象展示历年的省区合作及变化情况，针对CSCD 1998-2005年和SCI 2000-2005年的数据，我们分别将相邻两年数据合并，这样就得到了7组数据，形成7个合作矩阵。我们将数据转化为Ucinet可接受的DL格式，应用Netdraw功能，以可视化的图形来表示各省区的合作状况，见图1-7。各图中的节点代表省区。节点的大小与节点的出度成比例，表示节点所代表的省份作为第一作者省份的发文情况。边的粗度与合作的次数成比例，合作次数越多，边就越粗。

首先分析在CSCD合作环境中各省区合作的状况，见图1-4。1998-2005年，在合作网络中，北京作为合作的主导方，网络节点最大，合作论文数最多，边的粗度较大，与其他省区的联系紧密，始终占据整个网络的核心位置。江苏、山东、上海、广东、湖北等经济发达省份的边粗度也较大，表明这些省区与其他省区的科学合作也较为活跃。而新疆、内蒙古、宁夏、青海等省区不仅作为主导方参与的科学合作较少，而且与其他省区合作的频度也很少，但合作次数有增加趋势。再看在SCI合作环境中的情况。一般情况下，SCI收录的论文往往具有较高的学术水平和研究质量。我国学者之间以什么样的合作方式进入国际科技交流领域，哪些省份之间合作的研究成果会更多进入到SCI，是一个值得探讨的课题。图5-7展示了从2000年到2005年6年间省区间合作情况。从图中可以看出，相对于CSCD，SCI合作网络图的节点之间的相对大小相差很大。这说明进入SCI系统，作为合作的主导方，省区间的差距拉大。在整个网络中，北京仍然处于强势地位，其次为江苏、上海、浙江、安徽等省区。新疆、宁夏、青海、内蒙古、江西、等西部省区仍处于合作网络的弱显示度状态，即以这些省区为第一作者省区的论文较少进入SCI系统。从连接省区间的边的粗度来看，合作呈现出与强者合作的倾向。北京作为中心，几乎所有的省区都偏好与其合作，上海、江苏、广东等省区也成为弱者合作的选择对象，而弱―弱省区之间的合作却较少出现，几乎没有多少边的联接。

4 结论

通过对两个数据库合作论文网络的分析，可得出以下结论：第一，合作中，在国内数据库中表现出以北京为中心，以江苏、上海等为次中心的网络结构，弱势省区倾向于与发达省区合作; 第二，以合作形式发表于SCI中的论文网络，同样表现出北京等强势省份的中心地位，作为主导方，与弱势省区的差距相对于CSCD差距拉大。弱势省区同样倾向与发达省区合作; 第三，弱势省区之间没有表现出明显的合作倾向。

科学合作的动机十分复杂，合著论文仅是合作关系的外在表现。合作各方产出能力的差异、地理接近性、学科差异、基金投入、社会文化传统、政策导向等均是影响科学合作的主要因素[8]。在我国中长期科学和技术发展规划中，特别强调要加强自主创新，提升我国的科学技术竞争力。在有限的科技投入条件下，如何充分发挥创新功能，缩小地区之间科技经济差距，加强省区科学合作，提高各省区科学研究效率，是一条可供选择的路径。

参考文献:

[1]Glanzel W. Gzerwon H. A new methodological approach to bibliography coupling and its application to national, regional and institutional level. Scientometrics, 1996(2):195-221.

[2]Smith M. The trend toward multi-authorship in psychology. American Psychologist,1958(130):596-599.

[3]刘杰,陆君安.一个小型科学合作复杂网络及其分析.复杂系统与复杂科学,2004(3):56-62.

[4]梁立明,朱凌,侯长红.我国跨省区科学合作中的马太效应和地域倾向.自然辩证法通讯,2002,24(2):42-50.

[5]Otte E, Rousseau R. Social network analysis: a powerful strategy, also for the information sciences. Journal of Information Science, 2002,28(6):443-455.

[6]Krechemer H. Author productivity and geodesic distance in bibliographic co-authorship networks and visibility on he web.Scientometrics, 2004,60(3):409-420.

[7]谢彩霞.科学合作方式及其功能的科学计量学研究[学位论文].大连:大连理工大学,2006.

[8]梁立明,武夷山.科学计量学:理论探索与案例研究.北京:科学出版社,2006:223-225.

基于CSCD和SCI的跨省区科学合作网络可视化分析

优秀范文

精选范文