首页 > 文章中心 > 复杂网络分析

复杂网络分析

开篇:润墨网以专业的文秘视角,为您筛选了八篇复杂网络分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

复杂网络分析范文第1篇

[摘要] 目的:分析李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的用药规律,为中医药治疗艾滋病带状疱疹及其后遗神经痛提供相应的用药参考依据。方法:利用复杂网络分析方法,研究河南尉氏县在2007年10月—2011年7月期间接受李发枝教授治疗过的艾滋病带状疱疹及其后遗神经痛患者,将全部病例录入结构化临床诊疗信息采集系统,转化为可分析的数据,利用复杂网络分析算法和复杂网络分析系统进行中药配伍规律研究。结果:运用多维检索查询分析得出,本次研究中治疗艾滋病带状疱疹及其后遗神经痛的核心药物为黄芩、甘草、红花、车前子、全瓜蒌、当归、龙胆草;核心处方为龙胆泻肝汤加减和瓜蒌红花甘草汤加减。结论:李发枝教授治疗艾滋病带状疱疹及其后遗神经痛以清热利湿活血为要。

 

[关键词] 带状疱疹;中药;复杂网络分析

李发枝教授,国家第4批名老中医,国家中医临床研究基地重点病种(艾滋病)首席专家,国家中医药防治艾滋病专家组成员,河南省中医药治疗艾滋病专家组组长。自2004年始,每周二下午定时在河南省尉氏县中医院对艾滋病人进行义诊,常年如一日,每次都有大量的病人就诊,疗效甚好。为继承和发扬其诊疗经验,本研究通过对临床信息数据化处理后,进行复杂网络模型分析,对李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的核心方药进行数据挖掘,解析其治疗思路,揭示隐藏在其中的规律。

 

1 材料与方法

1.1 病例纳入标准 艾滋病临床诊断标准:按照卫生部、中华医学会《艾滋病诊疗指南》[1]标准执行。艾滋病带状疱疹及其后遗神经痛诊断标准:①符合艾滋病临床诊断标准;②符合中华人民共和国中医药行业标准《中医病证诊断疗效标准》(ZY/T001.1-94)中带状疱疹及其后遗神经痛的诊断依据,并以带状疱疹及其后遗神经痛作为主症。

 

1.2 病例资料 选择在2007年10月—2011年7月期间在李发枝教授尉氏县中医院义诊门诊接受治疗的艾滋病带状疱疹及其后遗神经痛患者,符合上述诊断标准,全部患者共9人,包括多次复诊,共37例次,其中4例次首诊是正在发生的带状疱疹,其余33次均为带状疱疹后遗神经痛。

 

1.3 研究方法 病例资料收集方法:初诊、复诊病例格式经过专门科研设计,保留病历原始信息。收集资料基本齐全,9例共37例次的数据均纳入本次研究中。 

数据库说明:本研究使用的数据库隶属于“名老中医临床信息采集系统”的数据库,该系统由北京市科技计划重大项目课题的“基于信息挖掘技术的名老中医临床诊疗经验研究”课题组建立。

 

1.4 资料处理 数据采集:确定研究的主要内容为分析李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的用药规律,为中医药治疗艾滋病带状疱疹及其后遗神经痛提供相应的用药参考依据。以上述研究目的为目标,采集了病例的文本信息[2],对文本信息结构化处理[3]并录入,形成可分析的结构化数据,数据录入严格按照标准操作规程进行[4-5]。

 

建立规范数据库:数据前期整理及规范录入完成后,进行数据汇总,形成数据库。对各类数据进行进一步的规范,以利于数据挖掘。

复杂网络分析:本研究运用中医临床复杂网络分析系统常使用的EclipseRCP技术。复杂网络分析方法是复杂科学研究的热点之一,在社会、生物学、商业、通信和计算机网络等领域广泛应用[6]。根据节点度的分布情况,可以将复杂网络分为指数网络和无尺度网络2个大类。把具有幂律分布的网络称为无尺度网络(scale-free network)。这是基于关联规则的一种数理分析模型与方法,反映了复杂网络在一定驱动力的影响下动态的自组织过程宏观规律,据研究显示,中医理论指导下的复方配伍过程具有无尺度复杂网络现象,复杂网络分析为中医药理论如复方配伍、药物相互作用等的研究提供依据,通过对名老中医的基本处方配伍经验或是某一病症的药物配伍经验进行复杂网络分析,进而发现核心药物配伍特点及药对信息,由此能够总结名老中医某方面的学术思想[4]。

 

2 结果

2.1 治疗艾滋病带状疱疹及其后遗神经痛核心药物及配伍规律 全部患者共9人,包括多次复诊,共37例次,其中4例次首诊是正在发生的带状疱疹,其余33次均为带状疱疹后遗神经痛,临床治疗均有效。运用多维检索查询分析[7]得出,李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的高频药物,见表1。在37例次中,使用黄芩33次、甘草31次、红花25次、车前子24次、全瓜蒌23次、当归22次、龙胆草22次等。说明李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的核心药物主要为清热燥湿之黄芩,活血化瘀之红花,清热解毒、利尿渗湿之车前子,清肺化痰之全瓜蒌,养血活血之当归,清泄肝胆经湿热之龙胆草。

 

基于复杂网络图分析方法,根据处方中药物的使用频次及该药与其他药物配伍的频度,可以分析出李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的常用药物即核心处方。李发枝教授治疗艾滋病带状疱疹的常用药物网络见图1。结合网络图能直观看出常用药物和使用较多药物。基于复杂网络图分析方法的可视化的处方配伍网络见图2,可以直观地看出黄芩、甘草、红花、车前子、全瓜蒌、当归、龙胆草处于处方配伍网络的核心节点。每一味药物与周围药物的边表示配伍关系。药物节点之间的连接边的权重即药物配伍次数在一定程度上表现了药物之间同时配伍应用的强度。与该网络相对应的药物配伍频度信息见表2,黄芩-甘草配伍频度最高,其次为红花-甘草,再其次为黄芩-红花、全瓜蒌-红花、黄芩-全瓜蒌、全瓜蒌-甘草。方剂疗效的基础不是单味中药功效的相加,而是中药之间的配伍作用[8],药对是为达到某种疗效而组合使用的,是中医临床用药的经验总结,明确药对之理论,掌握在组方中的应用规律,更好的去应用药物的配伍理论,为中医药的治疗提高疗效。结合两部分信息,可提炼出李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的处方特点为以清热、活血药物为核心药物,利于总结经验及指导临床应用。

2.2 李发枝教授治疗艾滋病带状疱疹及其后遗神经痛辨证特点及症状加减用药特点 复杂网络分析法对药物的进一步分析显示出相对独立的方药组团,复杂网络图2可示龙胆泻肝汤和瓜蒌红花甘草汤加减的方药组团。图2可示在龙胆泻肝汤基础上加入全瓜蒌、红花。这与李发枝教授治疗本病时若出现原疱疹处及其周围皮肤剧痛,而表现为余热(湿)未尽,络脉瘀阻证之后遗神经痛相一致。这一配伍特点反映了李发枝教授治疗艾滋病带状疱疹及其后遗神经痛的辨证及治疗思路。

 

复杂网络分析范文第2篇

社会网络分析方法在国内医药卫生领域应用研究的可视化图谱。经计算,得到节点数271,连接数234,同时我们取出现频次≥5的17个关键词,得出高频关键词词频表,另取中心度≥0.10的28个关键词,得到高中心度关键词,发现高频关键词与高中心度关键词并非完全一致,也就是说,一些高频关键词并非与其他关键词联系紧密。被引频次和中心度都比较高的关键词包括社会资本、自感健康、生命质量、社会支持,它们有助于进一步分析此类研究热点。综合分析可以看出,社会网络分析方法在医药卫生领域中的应用现状。从研究内容看,在医药卫生领域中,社会网络分析方法主要应用于疾病传播与防控研究、卫生政策研究。一是在疾病传播与防控研究方面,有作者通过分析社会网络在艾滋病、吸毒、性传播等过程中的作用,来探讨预防干预疾病的方法,相对应的关键词有艾滋病预防、网络结构、流行病学研究、安全等。二是在卫生政策研究方面,有作者对基本公共卫生服务均等化网络互动进行分析,对健康风险管理的整体网进行分析,从而提出构建以政府为主导的情感支持网络、信息支持网络,建立非正式的健康风险机制,形成健康风险管理体系。其中,对社会资本与社会支持在居民就医行为以及老年人心理健康方面的影响研究也很广泛,代表性的关键词有自感健康、心理、生命质量、社会支持、调查分析、危险行为、信任、影响因素、行为、对策、社会参与等。还有作者对公立医院医务人员知识创新的社会网络关系进行分析,以增强公立医院的创新能力,有代表性的关键词为健康教育、影响因素、网络结构、干预等。从方法的技术运用角度看,通过共现分析、可视化技术来研究和展现某一特定医药领域的合著情况、研究热点、发展方向等是社会网络分析方法在国内医药领域的主要应用。共现方法可以定性和定量分析学科情况,监测学科领域动态发展情况,多角度揭示信息的内容关联和隐性知识。将提取的共现矩阵用社会网络分析软件(如Ucinet、Pajek、Gephi等)以可视化的形式展现出来,可以快速定位特定领域的研究热点,为进一步的研究奠定基础。

2讨论

本文通过对国内医学领域近十几年发表的社会网络分析文献进行系统梳理,对社会网络分析方法应用情况有了较清晰的认识。

2.1社会网络分析方法应用于医药卫生研究取得的成绩

社会网络分析方法是情报学研究的最新手段,将它创新性地运用到医药卫生科技领域的研究有助于更快地获得某些领域的研究动态与发展前沿,同时能较直观地进行国家间的对比,从而找出差异,为我国的医药卫生事业提出具有时效性的决策参考。通过对比表1和表2我们发现,有些频次较高的关键词中心度并不强,这也在一定程度上说明传统的统计频次的方法显然不适用于对研究热点的探测。采用社会网络分析方法能够从网络的个体属性、整体属性方面进行分析,挖掘出更多深层次的信息。通过可视化技术直观展示关键词网络,可增强研究问题的现实感,使人们更容易了解网络内部结构,揭示隐性知识。国内医学界运用社会网络可视化工具探测医学领域的研究进展与热点、作者和机构间的合著网络等的研究构成了近年来这一领域的热点。虽然社会网络分析在卫生政策领域的应用研究数量有限,但研究大多规范、操作严谨,将社会网络分析的理论进行了本土化理解,产生了多样化的研究成果。如陈嘉伟等通过建设医院科室团队的社会网络结构来分析医院知识创新的影响因素,为提高医院知识创新能力提供借鉴;王欢等将每户家庭作为一个节点,了解农村贫困家庭所处的健康风险和分析网络的结构特性,并构建了健康风险管理的整体网。

2.2社会网络分析应用于医药卫生研究的不足

复杂网络分析范文第3篇

关键词:社会网络; 旅游网站; 网络结构

中图分类号 F 592.3 文献标识码 A 文章编号 1006-575(2012)-06-0080-09

旅游网站作为互联网和旅游业结合的产物,为旅游者提供了信息搜寻途径和旅游产品购买途径,影响着旅游者的旅游目的地感知,旅游计划、决策过程和网上社区参与行为等,在信息化技术大发展的背景下,网络在旅游业中的应用也更加广泛和深入(孙晓琳,2008)。近年来国内外对旅游网站的研究主要围绕旅游网站的评价、营销、服务等方面展开,如Evans 和King(1999)、Stern(2002)、Law等(2010)、熊伟和叶淋玮(2011)等对旅游网站的建设、功能等进行了一系列的评价,Stepchenkova和Morrison(2006),程霞和单芳(2011),路紫和李晓楠(2011)对旅游网站访问者行为进行了研究,张捷等(2004)研究了中国旅游网站的空间分布类型及其影响因子,程绍文等(2009)对我国旅游网站空间分布的地域差异和空间规模结构特征进行了研究,钟栎娜和吴必虎(2007)分析了世界知名旅游城市与我国国际旅游城市的网络营销。但上述研究基本都是针对旅游网站个体展开的,对旅游网站之间千丝万缕的关系很少涉及。

社会网络分析法是一种研究社会结构和社会关系的分析方法,被广泛应用于社会学、情报学等研究领域,成为社会科学研究的一种新范式。如Hu和Racherla(2008)采用网络分析法探索了学术研究领域内的网络结构,测量知识共享的状况,Zagenczyk和Scott(2010)等通过社会网络分析法证实员工的组织支持感受其社会背景影响。社会网络分析法在旅游管理相关研究中也有应用,如陈秀琼和黄福才(2006)采用社会网络理论分析了旅游网站访问行为时间分布的复杂化特征及其与网站功能深度使用之间的内在联系,杨兴柱等(2007)借助社会网络分析法研究了南京市旅游流的网络特征。社会网络分析法可以实现组织知识网络的优化,提高组织成员的共享能力(罗家德,2005),逐渐成为旅游研究一种新的范式(杨效忠,等,2009;刘法建,等,2010;周蓓,2008)。本文采用社会网络分析法对我国旅游网站进行定量分析,从网络密度、平均距离、中心度、凝聚子群以及核心-边缘结构等角度探索旅游网站的群体特征,为旅游网站管理和优化提供建议。

1 研究方法

1.1 研究对象

考虑到Baidu采用竞价排名,即一种按效果付费的网络推广方式,而Google只作与竞价相关的广告,没有竞价排名,故本文选择Google为检索工具。我们于2011年8月16~18日,以“旅游网站”为检索词在Google上进行检索,发现第25页以后的检索结果与检索词的相关性较小,故将前25页作为初步分析的对象。然后,逐个确认链接是否能打开、链接的网站是否为旅游网站,剔除掉不符合要求的,最后得到真正意义上的旅游网站154个。这些网站基本涵盖了目前国内最常用的、知晓度最高的旅游网站,最终将这154个旅游网站作为本文的研究对象。

复杂网络分析范文第4篇

0引言

网络拓扑分析是电力系统网络分析应用软件的基础,它的任务就是对网络中开关状态的变化进行处理,形成新的网络结线,得到拓扑数据,供电力系统应用程序使用。拓扑分析的效果直接影响着应用程序的使用效果。早期的网络拓扑分析是利用堆栈技术进行搜索[1]。为了加快拓扑的速度,出现了以下几种利用数据结构加上特定的算法来实现拓扑的改进方法:1)追踪网络拓扑变化[2]。其拓扑处理方法是保存前一次网络拓扑分析的母线结构,通过对比前后开关状态的变化,局部修改母线编号。这种方法虽比较费时,但拓扑分析效率有所提高。2)分电压等级拓扑法。该拓扑分析方法只搜索断开开关所在的厂站电压等级,大大减小了搜索的空间,提高了网络拓扑分析的效率[3]。3)面向对象(OO)的电力网络拓扑。实现拓扑跟踪OO模型的启发式拓扑分析方法,利用OO技术可扩展拓扑算法的适用范围[4,5]。4)基本分析单元的有色Petri法。将整个电网拓扑分析问题分解为若干基本分析单元,采用基本分析单元的有色Petri网模型,只重新计算受开关状态变化影响的分析单元,减小了搜索的空间,可提高拓扑分析的效率[6]。随着电力系统自动化的深化,地理信息系统(以下简称为GIS)在电网中的应用越来越广泛,如何在GIS基础上构建电力网络拓扑,已成为在GIS基础上构建电力系统的高级应用软件需解决的首要问题。为了充分利用GIS的信息资源,有效地利用GIS系统提供的网络拓扑数据,本文提出了一种实用的基于GIS的电网网络拓扑分析算法。

1GIS中的网络拓扑功能[7]

地理信息系统以地理空间数据库为基础,对空间相关数据进行管理、操作、分析、模拟和显示,提供了空间和动态的地理信息。对于容纳海量数据的地理空间数据库而言,拓扑分析是其核心技术。

1.1GIS中拓扑的基本功能

根据拓扑学原理,图形元素可以大致分为点、线、面三种基本形式,空间实体的拓扑特征就体现为这三种基本元素的拓扑关系。所以,对空间的拓扑分析,就是对点、线、面三种基本元素相互之间的关系进行分析处理后提取的拓扑特征。基于结点-弧段-多边形的拓扑分析,是建立在点集拓扑的理论基础之上的。它描述了空间实体之间的连接性和邻接性,此即为拓扑空间关系所要描述的内容。在GIS中,基础的拓扑表述方法已经集成为通用函数,供开发使用。其中连通性分析功能便是一种带有自动拓扑功能的函数,它根据定义的拓扑规则,自动进行图形的拓扑分析,得到拓扑数据。

1.2拓扑空间数据模型空间数据模型的基本类型起源于“Spaghetti模型”,如图1所示。GIS中的拓扑生成意味着给Spaghetti文件增加拓扑结构。图2为增加了拓扑结构的拓扑模型示意图。GIS拓扑空间数据定义为空间特征数据和属性数据。空间特征数据记录的是空间实体的位置(X,Y),拓扑关系和几何特征,是将GIS和其他各种数据库管理系统区分开的标志,其拓扑关系是通过拓扑模型自动创建的;属性特征数据,需要按照其级别来分类以便进行属性的概括和显示,通常用关系表的形式组织。图2中线(或弧)由结点定义,是有方向的;点、线、面之间的拓扑关系用若干拓扑属性表来描述。按照分类,GIS用一些表明实体类别的整数来代替实体原始属性的级别值,这些整数就是GIS赋给实体的标识号(OID),这些OID号具有很好的完备性,与实体一一对应,是各个实体之间关联的桥梁。查找时,直接在拓扑属性表中查找OID即可,比Spaghetti模型在整个图中查找效率高。

2GIS拓扑分析的应用局限

现有的GIS拓扑分析主要用于电力系统故障点查询、停电范围的查找、着色显示等简单分析功能,而不适用于电力系统网络分析的潮流计算、无功优化、智能操作票专家系统等高级应用。网络分析中所用到的拓扑描述方式与GIS对拓扑关系的描述方式并不完全相同。主要有以下几点区别:1)在GIS系统中,其拓扑分析是基于空间连通性,分析的是将实体经过抽象之后的点、线、面之间的空间关系。而电网分析应用程序所用的数据是以描述电网模型为主,即主要描述电网结构和逻辑关系。2)GIS中的拓扑描述并不区分节点类型,对杆塔与线路端点等一般节点在拓扑分析的时候并不加以区分,而杆塔节点在网络分析中是不需要的。3)GIS中的母线是用线实体来表示,而在网络分析中所需的拓扑数据却是节点号。因此,GIS构建的拓扑数据不能够直接应用于网络分析应用程序,应该通过一定的方法将以GIS方式描述的拓扑数据进行转换。除了能够提供地理空间分布信息数据外,还可以给出网络分析用的元件参数,包括节点号、支路数据、节点数据等等,并对母线、连接线等零阻抗元件做正确的拓扑处理。

3基于GIS的电力网络拓扑分析

电力网络拓扑一般分为两个基本步骤[1~3]:第一步是厂站的结线分析,也称母线分析;第二步是系统网络分析,分析整个系统的母线由支路连接成多少个子系统,也称为电气岛分析。本文在GIS平台上,按照网络分析要求,定义了各元件的属性表结构,对母线、开关和节点编号做了有效的处理,并依照拓扑的基本步骤和GIS的连通,形成了一种实用的基于GIS的电力网络拓扑算法。

3.1拓扑实现的环境由于GIS系统具有庞大的空间数据库系统,直接在上面进行拓扑分析必然会影响计算速度,而且,数据库中有很多数据是电网网络分析软件不需要的,如前面提到的杆塔等。因此,本文在GIS上只加载与网络分析所需数据相关的图层,在此基础上实现拓扑分析。利用GIS自身强大的功能,该平台具有和外界接口的能力,与实际系统对接可以得到实时数据;与其他作图软件如AutoCAD等对接可以直接得到电网图形及数据;与其他数据库对接可以直接通过数据库引擎技术将获取所需的数据。

3.2元件属性表结构GIS提供的实体属性表中,含有地理空间信息及OID号。为满足电力网络分析软件对其提供数据的要求,重新定义了电网中各网络元件的属性表。在原有的属性表基础上加入了网络分析所需要的数据,如带电状态、型号等。各属性表结构如表1所示。由给出的结构定义可以得到各元件的网络参数,供网络分析软件使用。其中,带电状态可以用来进行着色显示;型号用来获取具体的参数,如在线路属性表中,得到线路的型号和长度,结合标准线路参数,就得到了线路的阻抗值。为了程序能自动给出元件的网络参数,定义了标准线路参数表和标准变压器表,专门存放各种型号对应的参数。开关元件的关联线路字段、负荷及电容器等元件的关联节点字段都是用来存放元件拓扑关系数据的,线路、变压器等都是支路,拓扑存放在“支路-节点关联表”之中,其形成在节点编号处理中给出。

3.3母线的处理母线是节点的集合,按照电力系统的习惯将母线定义为线状零阻抗实体,其上节点号码均相同,包括连接线等线状零阻抗实体都按照这种方式定义。对于由网络开关造成的母线模型影响,采用了一种非常简便实用的方法[3]。开关断开后,母线分裂,分裂出一个或者多个母线,则新增母线编号排在初始母线最大编号之后;开关操作未造成母线模型的变化,或者开关闭合后,删除一个或多个母线,母线合并,采用初始母线编号。这种处理方法,实现简单,计算量小,效率高,适合用于开关操作频繁的情况。

3.4开关的处理拓扑的主要任务是处理网络中开关状态变化所引起的接线变化,因此,开关在拓扑中的处理方式至关重要。GIS系统中,开关是图2中的中间点,通过GIS拓扑中点与线的关系,分别与所连接的线路相关联。当开关状态发生变化时,对母线模型影响的拓扑处理过程如图3所示。由开关变化的状态来确定对母线模型的影响后,再按照上文对母线的处理方法更新受影响母线模型;然后,由与线路的关联情况,通过GIS连通性分析可以迅速形成网络结线。这个功能还可用于实现带电模拟操作、查询停电范围等功能。

3.5节点编号按照GIS系统的连通性所得到的拓扑编号,即实体的标识号-OID号,具有很好的数据完备性,而且不需要人工输入网络原始编号信息。同时,连通性分析是对平台上的整个网络进行分析,和拓扑分析的第二个基本步骤有相同的作用,因此,获得的OID号已经具有子系统的信息。应用程序只需要将OID号从图库中读出,按照自己的要求对OID号重新编号即可。本文对编号的处理只需要简单地将OID号变成从一开始的连续编号,无须进行复杂的编号工作。编号的简要程序流程如图4所示。其中所有OID号由GIS原始连通性自动给出;用GIS的邻接关系判断函数将线路和节点关联,形成的关联表为初始关联表;用SQL语句将关联表中节点号更新得到编号后的关联表。当开关状态发生变化,需要进行拓扑处理的时候,直接利用此表,拓扑速度将大大提高。超级秘书网

3.6算法的整体流程算法的整体流程简图如图5所示。其中网络拓扑初始分析包括初始厂站分析、初始母线分析;自动节点编号,形成节点-支路关联表;进行初始连通性分析,得到了电气岛号。此处可以与实际的系统接口,也可以用于模拟操作。当开关状态发生变化的时候,按照对母线的处理办法,来确定对母线模型的影响。首先对开关状态进行判断,决定是否影响母线模型,对受影响的母线进行处理,然后根据支路-节点关联表,进行连通性分析,相当于电气岛分析。分析的结果按照带电与否进行着色,显示于GIS系统之中,使拓扑的结果一目了然。整个过程均在开发的电网图形平台上进行,拓扑过程中,充分利用了GIS的连通性分析功能,使得整个过程简单易行。

复杂网络分析范文第5篇

[关键词]中心度 网络分析 中介中心度

[分类号]G350

中心度是应用于网络分析的一个重要度量指标,用于测量网络中“元素”的重要性,这里的“元素”是一种泛指,包括网络中的节点、边、社团及整个网络。本文的研究主要集中在节点中心度上。首先解释并明确中心度的概念,回顾当前的节点中心度的主要算法,对现有算法研究、分类研究及应用研究进行总结和分析,最后对中心度算法研究情况予以总结及展望。

1 中心度的概念

中心度研究能够识别网络中的重要节点,节点的重要程度由网络的拓扑属性、结构特点及节点在网络中的具置决定。Mike Gotta指出“中心度的概念,简单来说是识别网络中具有高度连接的活动者”。这个定义有些片面,而维基百科中也没有给出明确的定义,只给出了相关解释:“在图论和网络分析中,对一个节点的多种中心度测量,这些测量主要是决定图中一个节点的相对重要性”的一种解释。

之前的研究中并没有给出关于中心度的严格定义,笔者认为它是关于节点重要性的度量指标。这种重要性,根据不同网络和结构特点及关系表现为节点的影响力、权威性(重要思想、知识或判断决策的源头)、流行度、控制力(如传输、流量的控制能力)、便利性(位置上的优势、易于访问)或某种特殊意义,也可以表现为节点的脆弱性和易受攻击性。不同的中心度算法含义不同,此处给出的是一个总结性质的定义。

2 中心度算法分类及研究进展

2.1 中心度算法分类研究

已有不少学者对中心度算法的分类进行了研究。Noaht在描述中心度测量的理论基础时将中心度划分为三种类型,包括总体效果中心度、接近效果中心度和调解中心度。Dirk Kosehtitzki等将中心度分为4种类型,包括基于可到达性、基于流量、基于活力值和基于反馈的中心度。Zhang将中心度算法划分为5类,包括基于点度、基于最短路径、基于流、基于随机行走和基于反馈的中心度。从其他角度考虑中心度的划分,还可以分为基于全局的中心度算法、基于局部的中心度算法;或根据具体算法分为绝对中心度和相对中心度算法;根据网络动态性,分为动态中心度算法和静态中心度算法。另外,根据网络属性、权重和方向又可以分为基于有向网络的算法和基于无向网络的算法、基于加权网络和基于无权网络的算法及几者组合的分类方式。

2.2 主要的中心度算法研究

根据2.1的分类,本文基于生成原理将中心度算法分类,划分为基于连接的、基于最短路径的、基于流的、基于随机行走的和基于反馈的中心度算法5种。

2.2.1 基于连接的中心度算法度中心度算法(Degree)用于测度网络中一个节点与其他节点直接连接数的总和。在有向网络中,度又分为人度和出度。Hildrun基于合著网络比较有权和无权的度中心度算法,提出查找一种函数,使元素权重均等分布数等于元素的个数。得到偏离相等分布越大、函数值越小的包含权重连接关系的复杂度中心度算法。Benjamin聚焦于在网络规模、边密度、边强度和方向性等变量变化条件下的度中心度研究。由于度中心度算法反映的是静态的局部联系,在反映重要节点时具有局限性,研究中通常与其他网络属性测度指标结合应用。

2.2.2 基于最短路径的中心度算法基于最短路径的中心度算法包括接近中心度(CIoseness)、中介中心度(Betweenness)、Harmonic中心度、Eccentrality和Centroid等。这一类中心度基于网络中节点间的最短距离。Yannick对Harmonic中心度和接近中心度进行比较,指出Harmonic中心度可以作为接近中心度的替代算法,并将其扩展到无向图当中。Centroid也可看作是接近中心度的变种,它测量的是一个节点比其他节点在位置上的优势程度。中介中心度是基于最短路径的经典算法,能够用于揭示网络中具有连接桥作用的节点,从而发现网络连接中的关键点或脆弱点。由于该算法的重要性,诸多学者关注该算法的研究,对其进行改进与优化。其中,Ulrik Brandes较系统地总结了中介中心度的变种算法及其适用范围。虽然基于最短路径的算法是中心度测量的重要方法之一,但是基于最短路径的原理也成为这类算法的局限,在实际网络中并不是所有重要节点都通过最短路径。

2.2.3 基于流的中心度算法基于流的中心度算法引入电网电流流动理论,将网络关系看作是包含电压、电流的电网,基于在网络中电流的流动进行建模。主要包括基于流的中介中心度,基于流的接近中心度及信息中心度。这类中心度算法主要被应用于社会网络,用于探测社团结构,如Franco提出通过计算图中相关的局部流中介中心度,利用边的权重建模进行社团的抽取及聚类。

2.2.4 基于随机行走的中心度算法基于随机行走的中心度算法包括随机行走中介中心度、随机行走接近中心度和马尔可夫中心度算法。这类算法主要基于随机行走原理,计算在起始节点和目标节点间对中间节点的随机访问次数。基于随机行走的中介中心度算法是由Newman提出的,用于解决最短路径的局限性问题。S.Lee等提出基于偏好随机行走的中心度算法,并将其应用于复杂网络,在度相当大的条件下该算法能够对多种中心度算法进行统一。

2.2.5 基于反馈的中心度算法基于反馈的中心度算法,包括Katzes status、HubbeH、Eigenvector及著名的PageRank、HITS等算法。

研究广泛集中在PageRank等网络排序算法上。由于其缺乏对网页主题内容等其他因素的考虑,不少学者对该算法进行了改进和扩展。算法改进注重综合多方面影响因素,包括网页链接、网页内容、用户点击及浏览行为等。目前较突出的研究如主题敏感的PageRank、个性化加权PageRank算法等能够对已知查询识别出更多相关度更高的网页。

2.3 中心度近似算法研究

由于精确算法需要多次迭代,在时间和空间消耗上较大,特别是在真实大型网络中,给实际计算带来巨大挑战。因此对近似算法的研究能够在一定程度上解决这方面的问题,近似算法研究关注在迭代次数、最短路径计算、抽样等方面的改进,提高计算效率和性能。

David等提出一种基于适应性抽样技术的中介中心度近似算法,大大地降低了对高中心度节点的单源最短路径计算的消耗。Kazuya等根据接近中心度的精确值和近似值计算提出新的算法。算法主要用于选取接近中心度值最高的节点,而非全部节点从而降低了时间消耗。近似算法能够在一定程度上提高计算

效率并保证得到的结果在可接受的误差之内。

2.4 并行中心度算法研究

由于网络、特别是真实网络,更加复杂并且规模庞大,因此对于现有算法的性能和效率提出了挑战。当前的一些算法研究关注于在更精细粒度上的并行方法,对算法进行切分和加和,分布到多台机器上运行,提高运行效率的同时提高运行效果。

Christian等提出一种新的并行模式的PageRank算法。该算法通过引入网络二维视图,保存主机ID作为区分,而后将PageRank划分为不相连的部分,应用GauB--Seidel迭代算法进行快速的线性系统求解。该算法与其他并行PageRank算法相比,在每次迭代时间上有很大改进。Tan等提出一种新的适用于CREWPRAM的并行中介中心度算法,应用于大规模网络分析,通过适当的数据处理器映射、新的数边策略和三元数据矩阵结构,通过记录最短路径减少访问共享存储器冲突问题。

3 中心度计算方法应用研究

虽然中心度计算方法主要被应用于复杂网络研究,但是由于它是基于网络的,在其他领域研究中也受到广泛关注。本文对其应用领域进行归纳,可主要体现在复杂网络分析、期刊及论文评价、大众标注标签分析及推荐、网页排名、关键词抽取及文本摘要、语义结构探测及语义消歧、科学前沿及创新探测、重要作者识别等方面。由于网页排名主要涉及PageRank算法前文已经总结,此处着重于归纳中心度算法在其他领域的研究情况。

3.1 复杂网络分析

中心度算法主要被应用于复杂网络分析,如社会网络、生物蛋白质网络、电力网络等。Nicola等研究了复杂网络中的中心度算法,回顾并比较了基于图矩阵拓扑属性的中心度算法,包括PageRank、Eigenvector和HITS,发现一些中心度是相互关联的。Francesco等将中心度的拓扑概念应用于解释复杂网络连接的可靠性和安全性,将度中心度、中介中心度、接近中心度、信息中心度拓展为可靠性度中心度、可靠性接近中心度等算法,将其应用到电力传输系统网络中,用于评估网络路径连接元素的重要性。

3.2 期刊及论文评价

随着研究的深入,不少学者将中心度算法应用于期刊引用网络,为科学质量评价提供新的方法。其中Jevin West提出一种新的学术期刊评价指标Eigenfactor,它基于Eigenveetor,利用文献对期刊的引用率对期刊进行排序,其与传统期刊评价指标的区别在于其考虑了整个引用网络的结构,考虑了间接联系及效果。Chena等应用PageRank算法对1982年~2003年物理评论系列期刊中的所有出版物进行了重要性评估。发现每个出版物的PageRank值和引用数相关。利用PageRank算法识别了期刊中物理学家熟悉的一些杰出的具有影响力的论文。

3.3 大众标注标签分析及推荐

大众标注是自Web2.0以来倍受学术界关注的一个领域,中心度算法在大众标注中的应用研究主要体现在对标签的推荐和对标注用户的社会网络分析等方面。主要通过用户、资源、标签所构成的三元组关系构建不同的关系图或关系网络,并基于此进行中心度的测量和评估,进行对标签推荐或标签网络规律特点的分析。

Andreas H根据大众分类法基于用户、资源、标签三元组关系的特点,提出FolkRank算法,将其主要用于特殊主题的标签、资源或用户的推荐。Robert等对FolkRank、基于改进的PageRank及基于标签流行度的推荐方法进行了测试对比,发现前两种方法均比非个性化的推荐方法更有效,特别是FolkRank方法在探测超图结构、解决冷启动问题上都有优势。Ivan基于共现图使用节点中心度算法进行社会标签推荐。通过关键词集抽取,检索相关书签,构建全局共现子图,结合TF4DF算法计算相关标签的中心度,将具有最高中心度的标签作为推荐结果。

3.4 关键词抽取及文本摘要

关键词抽取和文本摘要也是中心度算法应用的重要领域,其主要被应用于测量文本中的词或句子的中心度,确定关键词或中心句,揭示文本的主题内容。特别是在关键词抽取研究中,中心度算法能够规避对低频但重要的词的忽略问题。

Kino使用Wikify系统从维基百科的文章中抽取关键词,利用基于随机冲浪的中心度算法进行主题识别。Zhang等提出利用Hub,Authority框架进行文本摘要的方法,结合线索短语、句子长度、首句等线索,将子主题的属性融入基于图的句子排序算法中来探测多文本子主题。

3.5 语义结构探测及语义消歧

时至今日,对于语义的探测和挖掘成为研究者关注的热点,中心度在语义结构探测和语义消歧方面也有主要应用。Jason等提出通过语义结构挖掘算法构建一致性本体和计算局部和全局语义中心度的思想,用于增强子团体的发现和资源的共享。

在语义消歧方面,Ravi应用词义相似度和中心度计算进行基于图的词义消歧,并使用测试数据集对入度中心度、接近中心度、中介中心度等算法分别结合基于WordNet的不同相似度计算进行了实验,取得较好的效果。

3.6 科学前沿及创新探测

中心度被应用于引文网络、共被引网络测度具有重要影响力的论文,发现科学前沿和研究基础。在引文网络中,Chen提出在知识域中通过对标志性节点、中心节点和拐点的发现,查找重要文献的潜在特征。标志性节点是网络中具有特殊属性的节点,如高被引文献提供重要的标志,这种节点具有较大的半径。中心节点其节点度相对较高,在引文网络中体现为共被引文献,其具有重要智力贡献。拐点是连接不同网络的枢纽,是两个子网络共享的节点或子网络交互路径上的节点。Chen在其开发的引文分析工具Citespace中利用中介中心度对引用网络中科学发展中的拐点进行识别。ShibataTM等通过被引次数和聚集中心度、中介中心度、接近中心度间的关系,探测作为基础创新萌芽的论文及预测论文未来被引的能力。

3.7 重要作者识别

PageRank、中介中心度等算法也被用于论文合著网络或作者引用网络中,根据网络属性特点,作者在网络中的贡献,如合作或被引的链接数量,合作者之间、引用者与被引用者之间的相互关系测量作者在网络中的影响力,对作者进行排序,识别网络中重要的、具有高度影响力及支持度的作者。Yan等将中心度算法作为一种影响力分析指标,通过来自16个图书情报期刊的1988年到2007年的数据生成合著者网络,利用接近中心度、中介中心度、度中心度和PageRank四种算法对作者排序,分析了各种算法在作者影响力评估上的局限性。

复杂网络分析范文第6篇

关键词:组织模型;数据组织;微博

中图分类号:TP301 文献标识码:A 文章编号文章编号:16727800(2014)001001503

作者简介作者简介:张咏梅(1977-),女,硕士,西华师范大学网络中心实验师,研究方向为网络应用。

0 引言

随着互联网的发展,以微博、SNS、微信等社交网络平台为代表的典型应用,在网友的日常生活中越来越重要。这些平台以社交网络为基础,组织各类文本、图像、声音、视频信息。伴随着便携移动终端的普及和无线网络的广泛布局,微博在近两年发展势头迅猛,微博平台创造了海量信息资源,而微博平台的信息组织展现出新的模式、方法和规律。

1 微博的特点

1.1 微博对用户的作用

微博作为松散、开放式社交网络支撑下的媒体平台,它是用户、信息内容和资源的集合体,使其成为理想的信息交流平台。从满足用户需求的角度看,微博平台的功能体现在如下方面:①与朋友和同事保持联系。关注他人,通过评论微博、转发微博、私信等方式保持联系;②使自己的信息被知晓。个人信息,自己的粉丝就可以马上获知;③根据兴趣和职业,获取有用信息。通过微博寻找新闻线索、潜在的科学问题和用户需求等;④寻求帮助和建议。类似于问答平台,通过微博问题,获得粉丝的帮助;⑤减压。浏览适当的信息内容,放松身心,减轻压力。

除了个人用户外,机构也是微博的用户,包括公司、报社、政府部门等,这些机构通过微博公开信息、征求意见、推广品牌、促销产品。因此,微博也是机构信息和互动的重要平台,我们将微博用户统称为“主体”(Agent),以囊括个人用户和机构用户。

1.2 微博的基本特征

微博与博客、BBS、SNS、即时通讯等都具有相关性,同时也有明显的不同。从主体的信息行为上看,其典型的特征包括:①主体信息。通过多种设备访问,个人用户和机构用户可以方便地短小的信息内容;②实时更新,现场直播。移动便携终端的普及,信息可以实时更新,具有现场直播的功能。

从信息传播的角度来看,它具备如下特征:①同步异步。微博是异步沟通工具,通过消息(评论、私信)的推送又能实现同步效果;②广播。微博条目是自己所见、所闻、所感的记录,每条微博都会广播给所有粉丝;③内嵌在社会网络之上。用户彼此关注形成社会网络,信息沿着社会网络的结构进行传播。

从信息格式及技术方案看,微博具备如下特征:①格式简洁。微博限制长度在140字,易于通过移动便携终端和阅读,降低了使用成本;②移动阅读,随时随地阅读。通过智能移动终端的应用接口,不受时空限制地使用;③基于微博用户的RSS种子。主体的微博被关注后,

就类似于RSS种子向粉丝推送信息。

1.3 微博的本质特征

上述基本特征除了微博具备外,许多其它信息平台也具备。与之相比,微博独具的特征如下:①与即时通讯相比,微博更开放,用户间易于彼此关注。而即时通讯以信息交流为目的,私密性强,社会网络结构具有小圈子特性和排他性;②与博客相比,二者内嵌于社会网络上,都以信息为目标,但从信息的多样性、方便性和社会网络的核心地位上看,微博更胜一筹;③与SNS相比,SNS在社交网络关系上更倾向于熟人网络,网络结构也具有一定的排他性,微博的公开性导致的信息传播性和新闻性更强,使之成为重要的新闻传播平台。

综上所述,微博区别于其它类似平台的本质特征是:①开放性。任何用户可以关注任何用户的微博数据,任何用户可以转发任何用户的微博数据。开放性强促进了信息传播与信息交流;②信息格式短小,方便和阅读。由于开放性和阅读方便性,使用户将其作为记录个人生活、记录机构行为的工具,相比其它媒体,信息内容多样化,如:个人所见所闻所感、机构公开信息、媒体信息等等,都能在微博上找到;③以社会网络为核心构架。微博通过粉丝方式,激励用户维系其社会关系网络并保证主体微博的受关注度,也因为社会网络的结构,导致信息的转发、订阅能够利用社会网络的特性,广泛传播。

2 面向信息事件的微博数据组织

微博作为信息、主体交流的平台,其信息组织不仅涉及信息本身,还涉及信息主体及其构成的社会网络,而信息的产生和网络的构建都是在一系列信息事件基础之上完成的。因此微博数据组织在微观层面需要解决微博平台的信息事件记录方式和模型中不同实体的表达方式。

2.1 微博数据是各类事件的记录

用户在微博平台中的行为会产生一系列信息事件,这些事件构成了微博数据事件集合,以事件为基础可对微博平台的各类信息进行有效组织。信息事件包括如下组成部分:事件主体、事件类型、事件发生时间、发生地点、信息单元内容、关联资源。

①事件主体:信息事件的执行者和参与者;②事件类型:根据不同信息行为对应的类型,类型不同,事件的描述方式不同;③事件发生时间:信息行为发生的时间;④发生地点:事件发生的具体地点;⑤信息单元内容:每个主体的信息内容,对应用户的每条微博;⑥关联资源:微博数据单元中引用的各类资源总称。

2.2 不同层次的信息事件组织

事件类型与表1中每层的信息行为相对应,可被微博平台记录的信息事件包括:

(1)社会网络层事件:①关注他人:主体1、主体2、时间、地点;②加入群组:主体、群组、时间、地点;③邀请好友:主体、好友列表、时间、地点;④推荐好友:主体1、主体2、好友列表、时间、地点。

(2)信息单元层事件:①微博:主体、时间、地点、信息单元、资源列表;②转发微博:主体、时间、地点、信息单元[转发微博]、参考信息单元;③评论微博:主体、时间、地点、信息单元[评论微博]、参考信息单元、资源列表;④回复评论:主体、时间、地点、信息单元、参考信息单元[评论微博]、资源列表;⑤投票:主体、时间、地点、信息单元、投票单元、资源列表;⑥私信交流:主体1、主体2、时间、地点、信息单元、资源列表。

(3)资源层事件:①上传资源:主体、时间、地点、资源列表;②标注资源:主体、时间、地点、资源ID、资源描述单元。

2.3 信息事件中的核心实体

通过对信息事件的描述,可以从中抽取出核心实体,并为实体添加属性信息描述。

(1)主体(Agent):主体是信息事件的执行者和参与者,作为实体,其具备分类体系,同时具备相应的属性信息。在用户注册时,会初始化这些属性信息。主体具备的信息包括:

[ Agent分类,Agent属性标注(职业、兴趣标签、年龄……)]

(2)群组(Group):群组是由某个主体创建的用户组,它由多个主体构成,按照兴趣、行业等标准进行分类,具备分类体系,同时具备群组标题、兴趣等信息。群组具备的信息包括:

[ Group分类,Group属性标注(标题,群主,管理员列表,群简介……)]

(3)信息单元(Information Unit,IU):信息单元是用户的微博,可以根据微博目的予以分类(如:转发微博、评论微博、原创微博),也可按照微博内容的主题进行分类。信息单元具备的信息包括:

[ IU分类,IU属性标注(转发数,评论数,收藏数,……)]

(4)资源(Resource):资源是信息单元的基础,信息单元是对资源的集成,资源可按照媒体形式分类,也可按照资源内容主题分类,而每个资源都可以采用通用的元数据标准(如DC元数据)加以标注,其具备的信息包括:

[ 资源分类,资源属性标注(链接、主题标签、资源拥有者、创建日期、语种……)]

2.4 语义网络构建

在语义网络层,包含主体、信息单元、资源之外的其它类型的实体,如机构、公司、会议、比赛等,这些语义实体多种多样,涉及领域知识。社会网络层、信息单元层、资源层的信息行为将生成大量事件记录,通过这些记录以及相关的信息单元和资源,利用内容分析、语义对象提取、语义关联提取算法和工具,可以构造语义网络,实现语义检索、语义组织和语义推理,使微博数据资源的利用上升到语义层面。语义网络层以前三层为基础,通过语义实体识别和关系抽取算法,并辅以群体协作的方式,通过群体智能实现语义网络的构建。

3 微博数据组织核心维度

在微博平台中,根据上述层次模型和事件模型,选择核心实体的重要属性作为微博数据组织的核心维度。这些维度包括:时间维、地点维、类目标签维、主题标引维、社交网络属性维、资源网络属性维、信息单元网络属性维、语义网络属性维等,如表1所示。

社交网络属性维[]从社会网络分析的角度,提取相关的属性维度,如(入度:粉丝数;出度:关注数;中介中心性:跨组传播能力),这些维度,可以成为某类实体重要的序性指标

信息单元网络属性维[]信息单元之间相互参考和引用,通过转发、评论行为,形成信息单元网络,信息单元网络与社会网络紧密相关,又独立存在,转发数、评论数等属性,是信息单元排序和展示的重要维度

资源网络属性维[]资源包括图像、视频、音频、文本等,这些资源之间的关系包括:引用关系(一个文章参考另一个文章)、共被引关系(2个资源在一个信息单元中同被引用)等,这样形成资源网络,这些属性可以作为资源节点及其网络的序性指标

语义网络属性维[]语义单元之间彼此关联,形成语义网络,这些语义网络中的语义单元及其关联,构成了新的信息组织维度,同样通过映射复杂网络中的相关指标,作为序性指标,可用于语义层面信息统计分析、挖掘和预测

4 微博平台信息组织发展趋势

微博成为日益重要的信息平台,其信息组织的方式和方法也围绕微博平台功能升级和微博用户的高层需求不断发展,从信息组织的目的上看,它的发展趋势如下:

4.1 地理信息可视化与分析

地理信息的使用日益广泛,微博与移动平台的整合使地理信息的采集变得方便,微博数据组织也应朝着地理信息可视化、分析、挖掘与利用的方向演进,并催生一系列基于地理信息的应用。

4.2 语义提取与挖掘

随着第三代互联网语义网(Semantic Web)的发展,各类信息资源的组织和应用也将朝着这个方向演进。微博平台的信息组织也需要采用相关的语义内容表达、存储规范和标准,使其能在语义层面上得到有效组织。

4.3 信息空间可视化表达

随着可视化技术的广泛应用,微博数据空间也将朝着可视化方向发展。为用户提供更易识别和理解的信息界面,同时有效地展示网络结构的信息和树状结构的信息。

4.4 网络分析

复杂网络研究引领了各个领域的研究热潮。微博平台的社会关系网络和信息单元网络都属于复杂网络的范畴。充分利用已有的复杂网络和社会关系网络的研究成果,进行网络分析,提取合适的序性指标和分类指标,是微博数据资源利用发展的趋势。可进行的网络分析包括:社会网络分析、语义网络分析、资源网络分析、信息单元网络分析等。

参考文献参考文献:

[1] 陆伟,魏泉,寇广增.基于Blog的网络信息组织[J].情报科学,2005(2):260263.

[2] 王树义,王鑫.基于微博客Twitter的企业竞争情报搜集[J].情报学报,2010(3):522545.

复杂网络分析范文第7篇

>> 基于微文化传播的高校网络舆情危机对策研究 基于微博的高校网络舆情社会影响力评价研究 基于复杂网络的新闻传播控制策略研究 高校在线社交网络舆情传播调查研究 高校网络舆情传播与舆论引导研究 “双感染”模型下复杂社会网络品牌传播研究 高校校园网络舆情的预警与应对 基于复杂网络社会网络动力学研究 基于小集团集散观点模型的网络舆情传播研究 基于动力场理论的网络反腐舆情演化与传播仿真研究 基于多主体的网络舆情信息传播模型研究 高校校园网络舆情工作的动态发展与研究 高校图书馆在校园网络舆情管理与引导中的作用研究 突发事件网络舆情传播的实证研究 基于社会网络分析方法的口碑传播研究 基于社会网络的危机信息传播研究框架 基于社会网络的微博危机信息传播研究 基于信任机制的复杂网络知识传播模型的研究 基于网页文本获取的高校网络舆情监控 基于熵理论的高校网络舆情危机探析 常见问题解答 当前所在位置:l.

[2]王来华.舆情研究概论――理论、方法和现实热点[M].天津:天津社会科学院出版社,2003:336.

[3]张建勇.论群体性突发事件的产生原因及有效防范[J].兰州学刊,2004(3):901-902.

[4]Kwak H,Lee C Y,Park H, et al.What is twitter,a social network or a news media?[C]//Proceeding of the 19th International World Wide Web Conference.Raleigh,North Carolina USA,2010.

[5]金鑫,谢斌,朱建明.基于复杂网络分析的微博网络舆情传播[J].吉林大学学报(工学版),2012,9(42).

[6]Watts D.J.,Strogatz S. H. Collective dynamics of small world networks[J].Nature 1998,393:440-442.

[7]Barrat ment on small-world networks: evidence for a crossover picture[J].PhysRevLett,1999.

作者简介:童亚拉,女,湖南桃源人,博士,教授,主研领域:智能计算,复杂网络,数据挖掘。

复杂网络分析范文第8篇

舆情传播模型的研究,我国起步相对较晚,欧美基于“Publicopinion”视野开始对舆情传播模型进行研究,Sznajd–Weron运用离散分析个人怎样受到外界社会群体的影响,并提出了Sznajd模型[22],Sznajd假设个人意见只有+1和-1表示,每个人的意见受邻里或群体的影响并影响着邻里以及群体,各群体或者子系统意见将会趋于一致。在Sznajd模型中,用+1或者-1表示个体意见,在现实生活中,个体意见并不是非左即右,往往处于两者之间,呈现出连续的状态。很多学者用离散模型修正对Szanjd模型进行修正,在连续模型中,混合模型[23]和边际动力模型[23]对后来研究影响较大,混合模型和边际动力模型与Sznajd同样,进行模型模拟结构并未解释模型,缺乏理论模拟解释。ShuguangSuo和YuChen基于社会网络分析法,提出Sznajd修正模型—社会网络动力舆情传播模型[24],假设个人意见只有+1和-1,通过对模型连续的观测,在某一个时间点上选取一个点,并随即选取某一个邻居,经过足够长的时间后,系统内成员总会达成一致,具有相同的观点。但现实中,社会长期存在多种观点,而且在交往过程中也总是与多个系统以及系统外成员进行交往,为此我国学者潘新、邓贵仕、佟斌针[4]对这种情况进行,对模型进行了改进,提出了舆情传播模型,试图解释舆情传播连续性和交互性;最后解释为在社会网络中,信息受体(个人)并非直接全部接触信息源的观点,而是有选择地接受信息源的观点,在整体网络中存在持不同观点的受体且成一定比例;否则整体网络中所有受体观点将趋于一致。在舆情前传播阶段,体育赛事在关注的群体中观点较为一致地传播。一旦突发成型舆情事件,社会各界(自媒体)加入到体育赛事舆情事件传播中,形成更复杂更宽广传播系统并带入多种观点。为此本文通过实证分析体育赛事舆情传播模式,试图揭示体育赛事舆情传播规律,路径以及传播宽度和速度。

2赛事舆情社会网络结构

斯坦利•沃瑟曼、凯瑟琳•福斯特[25]分析认为,社会中的人、组织彼此间关系可以表述为相互作用的关系模型或规律,这种个人、组织之间关系将对彼此产生影响。社会网络分析不仅可以描述行动者个体与其周边邻居之间错综复杂的关系和连接,并且可以借助计算机工具对行动者和组织成员之间进行可视化建模,使研究者更加直观清楚地了解行动者的关系和关系图式[27]。基于社会网络分析,行动者之间相互作用,可以用一种基于关系模式或规则进行表述,然而WEB技术发展,传统的社会关系模式已经难以适应,通过量化和可视化两个角度对社会行动者实体关系进行研究,社会网络分析最常选用社群图和社群矩阵两种研究方法,已经成为社会网络分析重要方向。社群图通过节点和连接线描述行动者之间关系,社群矩阵分析行动者角色及其关系。体育赛事舆情事件传播行动者之间的信息传播有接受也有传出,为此赛事舆情事件传播表述需要采用有向图。突发赛事舆情事件传播社会网络传播模型通常采用关系矩阵和社会网络分析结构图。本文研究对象仅为体育赛事网络传播舆情传播,研究该事件网络传播集合内部各个行动者之间的关系,也就是1—模网络。社会网络分析时,整体网结构、行动者在整体网地位和角色以及网络内部结构特征都是1—模网络分析重要内容[21],这也是本文的研究内容。社会网络分析研究自20世纪40年代在社会理论和实证发展之间因为缺乏中层理论而发展起来的,20世纪80、90年代受到多个学科的重视,时至今日,社会网络分析提供了很多用于结构测量的参数[28]。按照网络规模可以将其分为整体网络结构、局域网络分析和个体网络分析[29]。本文测度赛事舆情事件传播,对体育赛事舆情传播网络模型进行分析和研究,分析1-模网络整体结构。网络整体结构主要通过行动者之间紧密关联程度进行描述,即密度和中心度,密度反映整体网络凝聚力的总体水平。巴恩斯研究了随机网络模型,指出网络图密度最大值为0.5[30]。Lauman,Marden[31]对网络整体结构研究指出:整体网络中核心结点极其重要,可通过分析核心结点数量及链接结点测度核心结点的重要性。整体社会网络核心结点测量为中心度测度提供了可能和大量的参数,行动者中心度和组群中心势就是社会网络中心最常用的两个参数。Proctor和Loo-mis[32]认为行动者中心度和组群中心势是分析行动者中心位置的指标,反映其在社会网络中具有怎样的权利以及中心点位,这也是早期社会网络分析理论的主要观点。中心度反映行动者与其他行动者联系紧密程度,反映该行动者在整体网络传播过程中的重要程度,在整体网络中拥有“权力”大小。整体网络中行动者点度中心度就是该行动者直接联系行动者数目。说明整体网络集中趋势为中心势,中心势描述整体网络差异性程度,整体网络中心势描述额该网络整体的集中趋势。由于行动者在整体网络角色和地位不同,起到作用也各异。斯坦利•沃瑟曼[25]、罗家德[28]等在对整体网络进行分析研究时指出,社会网络是通过结构等价描述和探讨个体行动者在整体网络中的地位和角色,如何嵌入到整体中网络中的,两个行动者接受和发向网络中所有其他行动者的关系是相同的,那么它们结构等价。Burt[33]通过研究指出欧几里得距离法通过度量成对行动者传播距离来测度整体网络行动者角色和地位。成对行动者距离构成观测矩阵,矩阵中的每个元素度量的是行行动者与列行动者的欧几里得距离。在整体网络中,并不是所有的行动者直接联系,通过中介传播必不可少,Burt将这种非直接并通过中介传播的联系定义为结构洞[33],结构洞也是描述行动者位置和角色重要概念。结构洞的存在使得部分处于中间位置的行动者居于重要的联络位置,因而在整体网络中对资源和信息流动具有重要的作用。结构洞计算相对复杂,目前关于结构洞计算主要有两种方法:Burt的结构洞计算和Borgetti中间度计算,结构洞计算测量主要是测量有效规模、效率、限制度以及等级度,限制度在整体网络结构洞测量中最为重要,是指该行动者在整体网络中在多大程度上拥有运用结构洞的能力或者协商能力[29],测量数值越大,限制能力越大,测量数值越小,行动者跨越结构洞可能性越大,结构非冗余信息源能力也越强[34]。在社会结构网络中,联系越紧密,联系关系越强,越易受关系的限制,在舆情传播过程中,弱联系有利于信息传递。组成整体网络基本要素就是行动者及子群,测评行动者、子群关系,是测度整体网络内部结构不可或缺的重要手段。凝聚子群在整体网络测度中扮演着重要的角色,是整体网络中行动者之间具有较强、直接、紧密、经常的或者积极关系的行动者子集合[25]。在舆情传播网络中,凝聚子群指该社会网络行动者之间关系特别紧密,结合成为一个内部结构的团体,从而成为交流传递信息的集合。本文采用κ-核分析凝聚子群,κ-核是每个节点至少与一定数量(κ)相邻结点链接形成凝聚子群,凝聚子群内部行动者关系紧密,有利于信息传播和分析;不同凝聚子群行动者交叉重叠则更加有利于信息的扩散。

3实证研究

3.1“广州马拉松”舆情事件概况

2012年11月18日,广东省广州市举办马拉松比赛,10公里选手陈杰和5公里选手丁喜桥比赛中突发休克,最后经抢救无效先后死亡。人民网、新华网、新浪网、凤凰网等新闻网站在第一时间报道了相关新闻,赛事组委会也通过各类渠道积极对外消息。由于体育赛事本身受体人群庞大,经微博等自媒体爆炸式传播,形成强劲舆论影响力,仅新浪微博上与广马死亡事件有关的微博就达到135万条之多。本次赛事受到了政府官员、媒体、医疗行业等等关注。2012年11月18日当天,随着第一名运动员猝死,舆情掀起了一个小高峰;2012年11月25日,第二名运动员经抢救无效死亡后,掀起舆情传播高峰。随着组委会信息公开,舆情在此刻达到高峰后逐步下降。2012年11月26日,广马引起的新闻报道共1520篇,网名跟帖179万次条。广马舆情,主题事件影响大,波及范围较广,传统媒体在整个事件扮演着信息源等不可或缺的重要角色,赛事组委会和广州市体育赛事主办单位积极应对,及时公布信息,尤其是在后半阶段,国内主流媒体正面引导和宣传,在一定程度上挽回了赛事负面影响。赛事组委会积极与媒体沟通,并通过新媒体及时公布信息,成为本次舆情事件应对的关键点。

3.2数据处理与采集

3.2.1社会网络分析概念描述本研究用关联矩阵表示舆情传播网络结构,节点表示舆情传播行动者,边表示行动者之间关系。基于赛事舆情事件传播速度快,为此假设赛事舆情传播在某一节点时间内,为静止状态[4]。分别用+1和0表示舆情传播系统的两种观点,即在初始状态下,系统中所有用户的意见被随机设为+1和0,进而对网络传播链接进行计量[21]。基于社会网络舆情传播分析主要就是对网络结构、角色地位进行分析,本文选择测量对整体网络结构、行动者网络角色和地位、整体网络内部结构[4,35]进行测量和分析。整体网络结构分析参数为密度、中心度和中心势,行动者角色和地位参数主要为欧几里得参数和结构洞限制度,整体网络内部结构参数为κ-核。3.2.2赛事舆情网络传播数据采集本文以2012年广州马拉松舆情事件为研究对象,选取公共信息发表平台和个人信息交换平台进行数据截取。公布信息平台选取了40个节点,包括新华网、人民网、大洋网、南方都市网、网易、新浪、腾讯新闻等以新闻传播为主线的信息平台;选取了天涯网、猫扑网、搜狐论坛、凤凰论坛、百度贴吧等以论坛和交流社区为主线的公共信息平台,以优酷网、土豆网、凤凰视频网、百度视频、酷六网等以视频为信息平台。选取自媒体舆情行动者40个,主要来源于微博、博客、微信等自媒体,通过挖掘各结点之间关联线以及评论进行数据采集。信息传播由信息源往受体方向传播,信息员向受体传播的方向性,为有向社会网络结构。舆情传播过程中,信息源将信息传递给受体,受体在一定程度上又将影响信息源,表现为一种互动关系模式。在有向社会网络关系中,信息受体既可以反作用影响信息源,也可能并不发送信息影响信息源,为此存在单向网络和双向网络。通过网络循证数据,整理排列出80×80互动关系矩阵,运用PAJEk软件进行可视化分析,生成广马有向舆情传播结构图,具体见图1。

3.3整体网络结构侧度

3.3.1密度分析密度是社会网络分析常用指标,尤其是在无向网络分析中,指网络实际连接数量与理论可能存在最大连接数量之间的比值,密度越大,表明行动者之间连接越密切,信息交流就更为顺畅;密度越低,情况相反。由于密度受测评传播网络规模的影响,社会网络最大联系数为N×(N-1),当增加一个行动者时,增加的社会网络最大连接数较大,但实际连接数相对固定,尤其是在网络规模较大时。为此社会网络分析专家引进了点度概念用语测评社会网络密度,点度是指在社会网络中,行动者所拥有最大连接数量。通过Pajek软件测量广马舆情事件密度可知,平均密度(矩阵)为0.156,平均点度为24.95,即一个行动者将与24.95个邻居进行信息互动,实现信息传播。由此可见,在广马舆情事件结构图中,各节点相互联系紧密。尤其是传统公共媒体间存在信息互动,这成为推动广马事件迅速传播最直接原因,扩大广马舆情事件传播范围和影响力,增加受关注程度,造成关注过于集中,给广马赛事带来不良的影响。3.3.2点度中心性分析点度中心度是基于行动者与它接邻行动者节点数,节点入度是邻接至行动者的节点数,出度是邻接到自行动者的节点数。在社会网络中,点度中心度出度是扩张性测度,入度则是接受性测度。对出度测量,有利于掌握信息扩展的途径,对入度的测度,有利于掌握信息发展的态势。表1为广马舆情事件点度中心度的测度数据。广马舆情事件传播节点的点度范围4~95,整体传播点度密度为0.45472,lc老蔡通过网络传播邻居数量最少,在社会网络中,相对孤立,对网络传播产生的影响最小;以人民网为代表的大众传媒,出入度较高,网络传播邻居的数量最大,影响相对较大,成为网络传播有力推手。3.3.3行动者距离在社会网络中,行动者距离是用来描述一个行动者到另一个行动者之间最短距离,也称为“测地线”,尤其是在六度空间理论发展起来之后,行动者距离在社会网络分析研究中,具有举足轻重的地位。图2显示,广马舆情网络结构图中,各行动者之间的距离,其中最大距离以76号行动者“联合早报”到17号行动者“静如山岳”为代表,最大距离值为12,最小为1,大部分行动者之间的距离为1和2。在舆情信息传播过程中,传播距离越短,传播速度就越大,造成的影响力也越大。整个广马舆情传播的平均距离为2.93833,信息传播速度较快。

3.4行动者在整个网络中的地位和角色

3.4.1行动者整体结构等测度———相似性检验行动者整体结构等价用来说明两个行动者接受或发向网络中其他行动者的关系是相同的,那么认为其在结构上是等价的,主要是测评行动者在网络结构中多大程度上的相似。图3通过Pajek测度的相关系数图。通过图3可知,除了在对角线相关系为1外(行动者与自己在结构上是完全对等的),非对角线元素中没有等于1的元素,这也就是说在建议关系上没有结构等价的行动者。其他行动者之间相关系数各不相同,行动者等价结构也各不相同,各自在社会网络中影响力也各不相同。为此行动者相互替代之后,必然会影响到整个网络传播,为此结构等价性较小,可替代程度也较小。由此可见,传统媒体在网络传播依然起到至关重要的作用,传统大众媒体在舆情传播中也同样具有重要的作用,不能被取而代之。3.4.2结构洞分析结构洞主要用于测评社会结构网络非直接联系以及关系断链的现象,由于社会网络结构传播过程中,行动者之间非直接联系,造成行动者信息传播的缺失,从网络整体看好像网络结构中出现了洞穴,结构洞存在使得处于中间位置的行动者居于重要的位置。为此本文根据结构洞特征,对广马舆情事件结构洞指数和中间中心性进行测度。在结构洞测度中,主要测度社会网络限制度。社会网络限制度是衡量一条纽带的重要性或独占性指标,代表了一个行动者与邻接行动者关系的比例,占这个行动者对所有行动者管理的比例。限制度是指行动者与对方的关系会对对方产生的影响,这种限制取决于行动者对方强连接节点与行动者之间的纽带强度。图4是通过Pajek测度的广马舆情事件限制图(图4)。从图4可知,广马舆情网络结构中,存在大量的传播结构洞,各指标之间的限制度程度不一至,说明了信息传播的制约性,各自受制约的程度大小不一至,最大为62号“体育咨询榜”,受64号“zg赵哥”约束性达12%,这就意味着62号“体育资讯榜”有12%的信息是通过“zg赵哥”这个行动者传播出去的。通过图4可知行动者受结构洞影响力约束相对较小,这说明行动者在舆情信息传播过程中,行动者接收多个行动者的信息,不易受单一其他自媒体或传统媒体的影响。点度中介度就是在网络中所有其他行动者之间的测地线,经过该行动者的测地线比例,对信息传递起到重要的中介作用,也就是占据更为重要的中心位置。通过表2可知,大洋网、搜狐新闻和星岛新闻点度中介度相对较高,点度中介度值分别为0.146023、0.122810和0.109847,在整个网络传播过程中起到重要的中介作用。这说明这些网络占据较多信息资源,并为扩大自媒体提供了大量的信息交流平台,从而促使信息资源资源共享和信息资源的传播。但通过表2可知,整体网络中介中心势并不高,这说明在广马舆情事件中,直接信息传播在整体网络中占据重要的位置,受中介影响较小。

3.5整体网络内部结构测度

κ-核就是每个节点至少与一定数量κ的其他节点相邻接的子图,来界定舆情传播中存在的小团体数量,κ-核界定了相对密集的子网络,相对密集κ-核有利于信息在子网络传递。测度结果显示,广马舆情事件κ-核的最大值为17,结点数共有17个,占全部节点21.25%。通过图5可知,κ-核的值在15级以上的占整个舆情网络的66.25%,说明在该舆情事件中存在联系紧密的凝聚子群,该子群在整个网络中处于中心位置,通过彼此信息的互动,掌握大量的舆情信息,通过凝聚子群约束性进而占据了传播途径的重要节点。

4结论与建议

通过研究表明:广马舆情事件传播网络中整体密度较高,传统媒体和自媒体信息互动传播频繁;各行动者信息互换距离较短,从而导致信息传播速度较快。通过对行动者整体网络结构等价性的侧度发现,行动者在整体网络中地位和角色相对独立,虽有结构洞的存在,但约束力相对较小,对信息传播制约有限,尤其是点度中介值较低,说明信息以直接传播较多。通过对整体网络内部结构测度,发现广马舆情事件广泛存在凝聚的子网络,子网络存在加速了信息在子网络行动者间的共享和交换,从而促生多中心的传播网络结构。

4.1组建多中心并行舆情网络结构

由于举国体制以及政府办赛等原因,我国发生体育赛事舆情事件,信息传播的主要途径是主办方新闻会,经由传统媒体进行传播,具有信息传播渠道单一性以及传播时间阶段性的特点,显然不能适应体育赛事突发舆情事件的复杂性特点以及自媒体网络传播迅速发展的需要。构建并行化、连续性的多中心网络结构,替代机械、僵化、费时的信息传播管理模式,实现并行舆情网络管理流程,提高舆情管理者对传播环境的感知能力和适应能力,确保对舆情事件反应的及时性和准确性。体育赛事舆情事件发生时,不同利益主体将从不同的角度传播信息,强调网络传播不同利益主体共同利益和协助重要性,在舆情传播管理中尤为重要。由于互连网络技术发展,打破传统的单一的、面对面的信息传播途径,扩展了多元主体在时间和空间上实现多元灵活组合的可能,多元主体相互依赖,共享信息,形成动态网络信息管理系统。将原有信息管理传播网络纳入体育赛事突发舆情事件管理系统,增强信息管理深度和广度,建立横向舆情评估体系,实现突发舆情事件管理的即时性、完整性和通达性,完善多中心并行舆情监控与协同应对。

4.2关注舆情事件网络引导时机

突发舆情危机时,当持某一观点信息源占据优势时,网络受众就会迅速靠拢,形成“集聚效应”[36]。突发舆情事件主要体现在个体信息交换以及信息共享之后的群体,这种群体行为属于非常规状态下由于信息不对称所引发的好奇、恐慌心理,导致的临时性、非正式的弱关系。舆情事件在社会中受关注程度越高,这种临时的、不稳定弱关系就越容易形成。在社会网络结构中,社会公众既是信息受体,也是信息的传播者,通过自身将信息传播到其他结点。基于社会网络舆情网络分析不仅关注信息内容,更关注信息传播者与受体之间的关系,在进行舆情监控管理过程中,选择合适时机,选择关键位置,通过舆情引导的方法对舆情发展进行干预,将在较短时间内改变或引导受众的观点,起到较好的舆情引导作用。同时建立透明的舆情传播平台,促进受众在透明的平台下理流和理性探索,支持理性化的多样性,提高公信力。

4.3增强核心网络效应