首页 > 范文大全 > 正文

我国生物技术知识网络结构的时空演变研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇我国生物技术知识网络结构的时空演变研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:以国际ISI数据库中2000~2010年我国作者发表于生物技术领域的合著论文为数据源,构建了我国地级以上城市的生物技术知识网络,使用复杂网络分析方法从网络演进特征、网络关联性、重点城市三方面分析了知识网络结构的演变特征及规律。结果发现我国生物技术知识网络具有较小的平均路径和较大的集聚系数,度分布满足幂律分布,呈现小世界性和无标度性;除顶层以外的其他层次结构不明显;优先连接、组织邻近、地理邻近、社会邻近等共同促进知识网络结构演化,演化动力多元化。

关键词:知识网络演变;生物技术;复杂网络理论

中图分类号:Q81 文献标识码:A 文章编号:1001-8409(2013)11-0038-06

Spatiotemporal Evolution of Chinese Biotechnology Knowledge Network Structure

WANG Beibei, WANG Tao

(School of Geography Science, Nanjing Normal University, Nanjing 210023)

Abstract:

This paper, using coauthorships of Chinese research publications in 2000~2010 from international ISI database in the field of biotechnology as data sources, constructs Chinese biotechnology knowledge network at city level, and then analyzes the spatiotemporal evolution of the knowledge network structure from three aspects of network evolution, network correlation and key city based on complex network methods. The result shows that Chinese biotechnology knowledge network has a relatively small average path length and a relatively large cluster coefficient. More importantly, the degree distribution follows an exponential expression. Therefore, the knowledge network exhibits the characteristics of “Small World” and “Scalefree”; the network hierarchy has no distinct difference with the exception of the top one; forces to drive the evolution of knowledge network present diversity, for example, preferential attachment, organizational proximity, geographic proximity, social proximity and so on.

Key words: knowledge network evolution; biotechnology; complex network theory

1 引言

复杂网络是由大量节点通过边的相互连接而构成的大规模网络。Watts等的W-S 模型[1]及Barabasi等的B-A模型[2,3]分别揭示了复杂网络的小世界性和无标度性,

从此掀起了复杂网络研究热潮。大型数据库的出现和计算机处理能力的提高使得该研究遍布于各领域,如科学家合作网络[4]、因特网[5]、交通运输网络[6,7]、技术网络[8]、生物网络[9]等。

随着知识经济时代的到来,知识网络在知识交流、创新等方面的作用越来越受到西方国家政府和学术界的关注。复杂网络模型能较好地分析和模拟知识网络的发展演变,近年来,基于复杂网络方法对知识网络的研究已成为国际经济地理学、创新经济学关注的热点。B-A模型中指出增长性和优先连接是无标度网络形成的重要机制,Maggioni[10]对因特网链接、国际交流生、EPO专利合作网络的研究发现了小世界性及无标度性。Cassi[11]运用法国1999~2006年的基因组专利数据,实证研究了优先连接在网络演化中的作用。

目前,使用复杂网络方法分析我国知识网络的研究还较少。国内学者对知识网络的研究主要集中于情报学、管理学领域,侧重于探讨知识网络理论[12]、知识网络结构及效应[13,14]、知识网络演化的模拟[15,16]等。由于语言文化上的障碍,国外学者对我国知识网络的研究通常重视国际上的合作,鲜有涉及到国内层面的合作。尽管国内也有学者尝试从社会网络分析的角度进行研究,但缺乏基于长时间序列数据对我国知识网络结构演变规律的系统分析。生物技术的发展对大型仪器设备、高端实验室、高级科研人员等的需求较高,较多的成果需要两个以上单位协作完成,因此科研合作程度高。本文以复杂网络方法和GIS为研究手段,试图揭示我国城际生物技术知识网络结构的演变特征。

2 网络构建与指标选取

2.1 网络构建

本文以ISI数据库中2000~2010年我国作者发表于生物技术领域的合著论文为数据源。论文筛选标准为:(1)论文须由两个及以上的机构合作发表,至少有一个为中国机构;(2)检索范围限定于生物技术领域;(3)只

选择2000~2010年中文献类型为“article”的文章。紧接着对数据作如下处理:提取出每篇文章中机构所属城市;出现在县级市中的机构将其整合到所隶属的地级市中;对同一篇文章中的城市去重复;C++编程计算出我国每两个城市之间的合作次数;利用社会网络分析工具UCINET,构建我国城际生物技术知识网络。

2.2 网络指标

(1)网络规模、线数

网络规模是网络中节点的数目,线数是节点间联系总数。

(2)平均路径

两点之间所有路径中长度最短的叫测地线,测地线的长度称为最短路径长度。平均路径指的是节点的最短路径长度的平均值。

(3)度及相关指标

有直接联系的节点对之间彼此称为邻节点,度指与节点i直接相连的节点个数,其邻节点,集合为Ni ,定义一个节点i所有邻节点的平均度为K(i)=1KijNiKj,则度为k的所有节点的邻节点平均度

Knn(k)=1N(k)Ki=kK(i),其中, N (k)表示度为k的节点数量。

度度相关性是指节点度与其邻节点平均度之间的相关

性,考察节点之间相互选择的偏好性。若度大的节点之间倾向于彼此联系,网络正相关;反之,网络负相关。

(4)集聚系数及相关指标

节点的集聚系数是指它所有邻节点之间连边的数目占最大可能连边数目的比例。网络的集聚系数是所有节点集聚系数的平均值,用来衡量节点的集聚情况。

集聚系数-度相关性即度数为 k 的节点的平均集聚系数同度之间的相关性,用以考察网络的层次性、结构性。

3 实证分析

3.1 生物技术知识网络演进的总体特征

自2000年以来,参与生物技术知识合作的城市越来越多,网络变得稠密化,生物技术知识网络演进呈现出4个显著特征。

(1)知识网络具有小世界性。相比于其规模,网络平均路径较小(见表1),平均两个城市联系仅需22~26个路径长度;另一方面,网络的集聚系数明显大于随机网络(见图1)。知识网络具备了小世界网络的两个基本特征,即较小的平均路径和较大的集聚系数。

(2)知识网络演进呈现出稠密化趋势。从表1可以看出,2010年网络的线数比2000年增加了将近27倍,平均度数是2000年的8倍多,反映出城市间的合作次数在不断增多。2010年网络的平均路径比2000年缩短了428%,集聚系数增加了666%,不仅反映了各城市可以用较短距离联系那些曾经遥远的城市,知识联系得到加强,而且揭示出知识网络呈稠密化趋势。

(3)网络的度分布满足幂律分布。以节点度数k为横坐标,网络中度为k的节点所占百分比p(k)为纵坐标做图,由于2006年以前网络规模较小,为了保证良好的拟合度,仅对2006~2010年网络的度分布进行幂律拟合,得出度分布曲线如图2所示。

由图2可知网络度分布满足幂律分布,且幂指数位于1~2之间。说明知识网络中大多数城市的度数很小,处于网络的边缘地位,少数城市的度数很大,处于网络的中心地位,该现象可用优先连接机制解释,节点在选择合作对象时,优先选择高连接度的节点,从而导致此类节点的度越来越高,形成幂律分布。动态来看,幂指数呈下降的趋势,即度数k每变化一个单位,对p(k)值所引起的变化越来越小,说明虽然度数依然集中于少数节点中,但这种不均匀性在减弱。

(4)知识网络中次级中心逐渐形成。早期阶段,知识网络中全国中心城市是上海、北京和广州,几乎所有的强联系都是在这三个城市间产生的。随着时间的推移,区域次级中心逐渐形成,如:哈尔滨、昆明、兰州、成都、乌鲁木齐等。从长远来看,这些次级中心充当了所在区域的知识守门人(Gatekeeper),在全国核心城市和较低级的城市之间搭起桥梁,拓宽了知识流通的渠道。

32 网络关联性分析

321 度度相关性

以节点度数为横坐标,邻节点的平均度数为纵坐标,同样只做出2006~2010年的度度相关性图(见图3)。

由图3可知网络的度度相关性为负,即各节点的度与其邻节点的平均度之间负相关,Powell[17]对生命科学产业的研究也发现了同样的现象,度值越高的节点,其邻节点的平均度越低。以2010年为例,度最高的为北京(82),其邻节点的平均度为最小值1326;上海的度为60,其邻节点的平均度仅为1673。相反,度为2的所有节点,其邻节点的平均度为最大值3965,其次分别是度为3和1的节点。究其原因,在优先连接作用下,这些节点倾向于连接核心节点,故其邻节点的平均度高。因此,核心城市的形成,不仅因其度值较大,更因它们高等级的城市功能具有很强的吸引力。

322 集聚系数-度相关性

以度数为横坐标,集聚系数为纵坐标做出2006~2010年的集聚系数-度拟合曲线如图4所示。

由图4可知度数和集聚系数之间负相关,即低度节点比高度节点更容易集聚成团。例如,在2010年集聚系数为1的节点共有32个,占总数的22%,而这些节点的度在2~6之间,均为低度节点。原因在于:(1)这些城市的度数较小,其邻节点连接成网更容易;(2)这些节点基本上都直接与知识网络中的枢纽节点连接,其中有34%连接了北京(11个),25%连接了上海(8个),25%连接了广州(8个),而这些枢纽之间是相互连接的。高度节点均具有较小的集聚系数,如北京(013)、上海(021),这源于它们所连接的城市中相当一部分为低度节点,而这些节点之间相互关联较少。由此分析可知:集聚系数较大的节点,度数普遍偏低,且均具有与顶层节点直接联系的特点,这在一定程度上导致了知识网络除顶层结构外的其他层级结构不明显。

动态来看,该相关性在减弱,2010的相关系数绝对值比2006下降了25%。随着时间的演变,促使节点之间集聚成团的因素越来越多元化,不仅与度数有关,还与地理、组织、社会等的邻近性有关。

33 重点城市分析

331 枢纽城市

表2中列出了每一年度数排名前十的城市,以此来分析他们在网络演变中地位的变化特征和规律。由此看出:

(1)北京和上海是主要核心,称为超级中心。11个年份中,北京一直排名第一,上海有8年处于第二。北京和上海是我国先进生产力和高科技聚集的地方,从技术和资金上

得到了国家的大力扶持,不仅拥有一大批生物技术领域的科研院校外,还具有生物医药科技产业基地——张江生物医药基地和北京生物医药科技园区等。

(2)香港的核心地位在下降,称为衰落中心。2000~2002年香港分别位于第三、五、四位,2004~2008年落入第六至九位中,而在最后两年未跻身前十名,尤其在2009年香港是孤立点。该

现象的出现与本文的研究层面仅限于国内合作有关,香港由于其特殊的文化和语言背景,更倾向于国际合作。

(3)武汉、青岛、广州、杭州、天津这几个城市都至少有7年排名前十,地位日趋稳定,称为稳定中心。这与城市自身所拥有的科研条件有关,如:青岛市内的中科院海洋研究所同中科院的其他所在组织和社会上邻近,合作较多。

(4)东西部的差异较明显。排名前十的大都是东部沿海城市,很少有西部城市,所有出现过的西部城市只有西安、成都、昆明,其中西安共出现了5次,成都和昆明均只出现过1次,且排名均较靠后,位于第八至十位。

332 特质性城市

在网络演进中,有些城市表现出显著的“分异”特征,即,在某些时期,这些城市与某些城市联系较为紧密,而与其他城市联系较弱,呈现出较强的指向性[18]。本文利用分异系数来评价城市的分异特征,计算公式为

Y(v)=jN(v)WvjSv2。

其中,Y(v)表示节点v的分异系数,Sv 为节点v总共的联系数目, N (v)为节点v的邻节点集合,Wvj为节点v和节点j之间的联系数目,Wvj/Sv 表示的是节点v和j的联系在节点v所有联系中的权重。分异系数越大,说明节点v联系的指向性越强。本文选择了分异系数大于05且度数不小于2的部分城市进行分析。

由表3可看出,分异特征明显的城市逐年增多,影响这些城市选择合作对象的因素呈现多元化。

(1)优先连接机制是关键因素。经统计,表3中分异明显的城市度数较小,位于2~4之间,在优先连接机制作用下,它们主要选择了度数排名前十的枢纽城市合作。

(2)组织、社会邻近性促进合作。2009年泰州的主要合作对象是上海,调取原始数据后发现,合作主要集中在泰州(复旦)健康科学研究院和复旦大学及其附属医院之间,泰州(复旦)健康科学研究院是由复旦大学与泰州市医药高新技术产业园共同建立的事业型科研机构,组织、社会上的邻近性促进了人员的流通和交流。

(3)地理邻近也是主要影响因素。2008年的株洲市和扬州市以及2009年的宁波市,它们的主要合作对象均是本省的省会城市,地理上的邻近性促进了面对面交流,同时还容易获利于省会城市先进知识的外溢。

4 结论

(1)生物技术知识网络整体结构呈现出小世界性和无标度性

生物技术知识网络具备了小世界网络的两个基本特征:较小的平均路径和较大的集聚系数,因而呈现出小世界性。网络的度分布满足幂律分布,表现出一定的“无标度”性,大多数城市的度数很小,少数城市具有高连接度,处于网络的中心地位,这部分城市对于网络的形成发展起到重要作用。

(2)生物技术知识网络的层次结构尚不明显

通过对网络度度相关性、集聚系数-度相关性以及网络空间结构的分析可知,知识网络的顶层结构已经形成,虽然也形成了一定的区域次级中心,但新形成的节点都倾向于同最高级节点联系,忽略了区域枢纽节点,致使网络的次级层次结构得不到很好的发展。构建层次分明的网络结构,促进知识在全国知识网络中的快速流通,充分发挥区域次级中心的作用是关键。

(3)驱动知识网络演化的动力呈现多元化

优先连接机制无疑是知识网络演化的驱动力之一,节点倾向于同网络中高连接度的节点进行合作,该机制可解释幂律分布、度度相关性等。对集聚系数-度相关性的动态分析和特质性城市的分析则发现:促使节点之间联系的因素呈现多元化,地理、社会、组织上的邻近以及政府政策都是促使节点联系进而驱动网络演化的动力。

参考文献:

[1]Watts D J, Strogatz S H Collective Dynamics of “Small-world” Networks[J]. Nature, 1998, 393: 440-442.

[2]Barabási A L, Albert R. Emergence of Scaling in Random Networks[J]. Science, 1999, 286(5439): 509-512.

[3]Barabási A L, Albert R, Jeong H. Mean Field Theory for Scale 2 Free Random Networks [J]. Physica A, 1999,272(1-2): 173-187.

[4]Newman M E J. Coauthorship Networks and Patterns of Scientific Collaboration[J]. Proceedings of the National Academy of Sciences, USA, 2004, 101(Suppl 1): 5200-5205.

[5]Liu Z Y, Liu L. Complex Network Property Analysis of Knowledge Cooperation Networks[J]. 2009 International Symposium on Intelligent Ubiquitous Computing and Education, DOI 10.1109/IUCE.2009, 117: 544-547.

[6]Wang Y L, Zhou T, et al. Empirical Analysis of Dependence between Stations in Chinese Railway Network[J].Physica A, 2009, 388: 2949-2955.

[7]Guimera R, Mossa S, Turtschi A. The Worldwide Air Transportation Network :Anomalous Centrality, Community Structure, and Cities' Global Roles[J]. Proceedings of the National Academy of Sciences, USA, 2005, 102(22):7794-7799.

[8]Cai K Y, Yin B B. Software Execution Processes as an Evolving Complex Network[J]. Information Sciences,2009, 179(12): 1903–1928.

[9]Heoa M, Maslovb S, Shakhnovicha E. Topology of Protein Interaction Network Shapes Protein Abundances and Strengths of Their Functional and Nonspecific Interactions[J]. Proceedings of the National Academy of Sciences,USA, 2011, 108(10): 4258-4263.

[10]Maggioni M A, Uberti T E. Knowledge Networks Across Europe: Which Distance Matters?[J] The Annals of Regional, 2009, 43(3): 691-720.

[11]Cassi L, Plunket A. The Determinants of Co-inventor Tie Formation: Proximity and Network Dynamics[J]. Papers in Evolutionary Economic Geography, 2010, Unpublished.

[12]马德辉,包昌火.企业知识网络探析[J].情报理论与探索,2007,30(6):737-741.

[13]陈子凤,官建成.合作网络的小世界性对创新绩效的影响[J].中国管理科学,2009,17(3):115-120.

[14]蔡宁,吴结兵,殷鸣.产业集群复杂网络的结构与功能分析[J].经济地理,2006,26(3):378-382.

[15]傅荣,裘丽,张喜征等.产业集群参与者交互偏好与知识网络演化:模型与仿真[J].中国管理科

学,2006,14(4):129-133.

[16]崔爱香,傅彦,尚明生等.复杂网络局部结构的涌现:共同邻居驱动网络演化[J].物理学

报,2011,60(3):038901.

[17]Powell W P, White D, Koput K, et al. Network Dynamics and Field Evolution: The Growth of

Interorganizational Collaboration in the Life Sciences[J]. The American Journal of Sociology, 2002, 110(4):

1132-1205.

[18]武文杰,董正斌,张文忠,等.中国城市空间关联网络结构的时空演变[J].地理学

报,2011,66(4):435-445.

收稿日期:2012-11-23

基金项目:国家自然科学基金项目(40971069);国家软科学项目(2013GXS4D116);江苏省软科学项目(BR2013079); ISTIC-Thomson Reuters 科学计量学联合实验室开放基金(IT2012003)

作者简介:王贝贝(1988-),女,山东泰安人,硕士研究生,研究方向为区域创新与知识网络;汪 涛(1970-),女,安徽池州人,教授,研究方向为知识与技术的地理效应及区域创新系统。