首页 > 范文大全 > 正文

微博客信息传播结构\路径及其影响因素分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇微博客信息传播结构\路径及其影响因素分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]以新浪微博客为研究平台,采集事件传播路径中的用户属性数据及行为数据,利用社会网络分析软件绘制信息传播网络图,并对传播网络的结构路径及其影响因素进行分析,最后,发现传播网络的形态与用户的影响力、节点的合理布局及外部干扰因素有关。

[关键词]微博客 信息传播 社会网络分析

[分类号]G206 TP393

微博客是一种被定义为书写文字不超过140个字符,记录用户当前活动、意见和状态,通过关注、粉丝、评论、转发等功能实现信息传播和共享的博客变体。微博客较其他互联工具最大的优势在于能够更为快速地传播信息,其快速传播信息的原因除了发送方式的多样化以外,一个非常重要的因素是它具有转发功能,并且转发贴能通过“粉丝”的“粉丝”迅速传播扩散。当某一原创贴后,它通常被原创作者的粉丝发现并可能转发,转发贴又可能被粉丝的粉丝发现并可能转发,以此层层传播扩散,形成了一个典型的级联传播网络。为了考察微博客的传播规律,本文以新浪微博客为研究平台,跟踪了事件在研究周期内被传播的路径,绘制了节点和路径形成的传播网络结构图,最后对影响信息传播网络结构及路径形成的因素进行了分析。

1 数据选择与处理

数据选择与处理通过以下步骤完成:

1.1 微博客平台的选择

由于新浪微博客是目前我国用户数最多,也是最有影响的微博客,因此,本研究确定在新浪微博中选择研究样本。

1.2 传播事件的选择

为了使研究结论更具有一般性,本研究避免选择被过份热捧或有商业炒作嫌疑的事件,而是随机选择一条农民工生存状态的话题(以下称原创贴),原创作者为薛晓棠,地址为:http://t.省略/1554014995/k4CeUoLKt.话题以文字配发图片的形式出现,图片显示一个满脸皱纹、衣着破旧的农民工半蹲着吃干粮的图片,文字对农民工艰苦的生活状态表示了同情。

1.3 确定转发原创贴的用户集,并采集每个用户信息

转发用户及其信息按以下步骤采集:①以原创贴为起点,采集原创贴页面的评论信息,包括:评论用户名,评论用户名的ID,评论中引用的用户名,评论内容,评论时间;②搜索评论中所引用的用户的ID;如“@老沉:盟国//@USMBA:有机会要去感受一下这种友谊”这条评论中取老沉和USMBA的ID;③获取上述两类用户(一类是评论用户,一类是评沦用户引用的用户)的关注和粉丝(由于系统限制,粉丝至多只能取到前1000位)。④搜索上述用户的微博客(截止到原创内容发表的时问),观察是否转发了原创内容,如果转发,记录该用户,该用户即为本研究要找的转发用户,再取其关注和粉丝,循环上面过程,直到无新的转发者。

在搜索转发原创贴用户的同时,采集该用户7项信息:用户ID、关注数、粉丝数、发表的微博文数、是否认证用户、被转发数、传播级别。其中,被转发数是指用户或转发该原创贴后,被其他用户转发的次数,传播级别是本研究中为了考察信息传播的路径而设定的参数,在某条传播路径上,根据用户转发时间的先后划分为不同的传播等级,转发原创节点的节点A设为1级,转发节点A的节点B设为2级,以此类推。

原创贴时间2010年3月8日23点55分,采集时间从3月25日13点整到3月29日13点整,即数据存在时间域为3月8日23点55分―3月29日13时。共获取转发数为2530次,其中2 340个用户转发了,1次,61个用户转发了2次,11个用户转发了3次,转发4次和9次的各1个用户,转发5次和6次的各2个用户,也就是说,2351个用户参与转发,这些用户即为转发原创贴的用户集,用户集中每个用户的7项信息被采集入库,以备分析所用。

2 微博客信息传播网络结构与路径

首先定义传播图G=|V,E,W|来描述微博客信息传播网络,其中,V是微博客的节点集合,将微博客用户及其微博客页面统一看作微博客网络的节点,本研究的节点即传播该农民工贴的所有微博客用户及其微博站点。节点a,转发了原创节点1的原创贴,则生成一条由1指向a,的有向链,a.称为一级传播节点,当a,又转发了a,所转发的贴,则又生成一条由a。指向a,的有向链,a:称为二级传播节点,以前类推,于是形成了从1a1a2……的传播链,节点与节点的转发路径数称为距离,例如,节点a2到原创节点1的距离为2,节点到原创点的距离称为链长,当一条传播链传播到5级传播节点后,再没有被转发,则称该传播链链长为5;E为由原创节点出发,所有转发原创贴的用户及微博站点形成的所有路径集合;在所有转发节点中,由于不同节点的粉丝数、关注数、性别、地域、是否是认证用户均不相同,用户的某些特征可能会造成节点影响力不同,将节点的影响力集合记为w。电就是说,整个传播网络由节点、路径以及节点的影响力所构成。此外,为了叙述方便,根据一个节点被转发次数的多寡,该节点被称为强势节点、次强势节点及弱势节点。

利用社会网络工具Netdraw绘制信息传播网络图。Netdraw的文本文件程序为(部分):

文本文件中的节点“*node data”不仅给出了节点ID,I司时给出了各节点的属性信息,即包括传播级别(1evel)、被转发次数(forward)、关注数(focus)、粉丝数(fans)、发表的微博文数(blogs)以及是否是认证用户(vip)。这样做的优点在于,当使用Netdraw,绘制原创贴传播的网络图时,鼠标放在任何一个节点上,点击右键,即可看到每个节点的属性信息,便于进行数据观察和分析,更重要的是,可以任意选择节点的某一项属性显示传播网络,使图形更易于观察,如选择节点粉丝数这一属性显示网络时,粉丝数量大的用户的节点尺寸大于粉丝数量小的用户的节点尺寸,一般根据研究的目的及观察的需要,确定选择何种属性显示网络。

文本文件中的“*tie data”中,第一列与第二列都是节点的ID,根据第二列节点到原点(原点ID为1554014995)的链长(dl’stanee)分为若干组,如第一组的链氏为l,说明第一组中第二列节点都是到原点链长为1的节点,即在原创贴后最早转发的一级传播节点;第二组的链长为2,以此类推。

调用Netdraw,绘制原创贴传播的网络图(见图1),为了图形的清晰,图1未显示每个节点的ID,但在重要的节点标记了数字(如原创节点命名为节点1)。此外,在软件中设置了节点属性,根据节点被其他用户转发的次数多寡显示节点的大小(如节点3被转发了77次,图1中显示节点3的面积最大),以便从图中可以清楚地观测到被转发次数多的用户节点,即所谓强势节点;图1中省略了对原创节点仅进行了一级传播

和二级传播便无进一步传播的节点,由于原创节点附近有大量这类节点,省略这部分节点,可以更为清楚地观测信息传播的主要路径,但对于大于或等于三级传播的路径,图中保留从1级到最终的路径,以保证信息传播路径的完整显示。

图1也清楚地显示了微博客信息传播是一个从原创贴为中心层层扩散的级联传播结构,在数据采集周期内,从原创节点出发,最长传播路径链长为12,即最后一次传播为12级传播,以下将对传播过程中的几种典型类型进行分析:

第1种类型:偶发型。仅发生一级传播,没有其他用户再次传播上一次的传播。它包括两种情况:第一种是对原创节点的一级传播,即A转发了原创节点后再没有其他用户转发A的转发,从而中断了传播链。在2351个参与转发的用户中,有1770个用户一次传播原创贴后再未被其他用户转发,说明微博客的偶发性传播所占的比例是非常大的;第二种情况是在二级(包括二级)以上传播链中,B又转发了上一个用户的转发,但没有其他用户再次传播B(如节点8),图1中可以看到大量这类只有一个分支的情况,这种偶发型的用户通常是在网络中没有影响力的用户,因为没有影响力,信息到此难以继续被传播。

第2种类型:偶遇机会型。在传播过程中,偶遇强势节点,扩大了传播的面积及传播的链长。如原创节点1经过节点2、3到节点4的分支,如果根据新浪微博的用户ID排序,该分支按以下用户逐级传播:1554014995(节点1)―1404971935―1662345577―1212040547(节点2)―1253531973(节点3)―1699941995―1698108537―16817171lO(节点4)。该分支在传播过程中,到了第4级时,遇到节点3,该用户有很强的传染力,引发了大量转发,扩大了转发的宽度,将传播延长到7级,如果未遇到节点3,传播可能在5级时就中断。同样分支1―9―10―11也属此类型,该分支最长距离为9;分支1―14―15情况类似,但由于节点14在后面又遇到较为强势的节点,导致传播链长达11。

第3种类型:强势节点相互呼应型。从节点5发出以下分支:分支1―5―6―7―8,分支1―5―6―18―19,分支15―12―13。该子网主要由上述三个分支网络组成,是整个传播网络中传播面积最大且传播链最长(链长为12)的一个子网。该传播网络强势的原因在于:①在数据采集时间域,节点5(ID为1641428154)的粉丝数高达24 655个(可通过http://t.省略/1641428154访问),并且不同于第二种类型的是,在第二种类型中,虽然节点3(ID为1253531973)和节点lO(ID为1680313495)的粉丝分别高达108627和42734,但是由于该两个节点分别处于第4级和第5级传播,传播级别高于节点5的传播级别(节点5的传播级别为1级),从转发发生的时间看,节点5比节点3和节点10分别早6小时41分和10小时34分(节点5是3月25日零点31分,而节点3和节点10的转发时间分别是3月25日7点12分和3月25日11点05分)。在常舰情况下,节点转发时问相差6―10小时并不会明显地影响传播效率,但对传播量较为密集的时间段(如突发事件往往在短时间快速传播),则会有较大的影响,本文原创贴传播虽然时间周期界定在3月8日23点55分―3月29日13点,但大量的转发均密集地发生在3月25日这天(原因将在第4节分忻),因此,在25日这一天时间周期里传播提早6―10小时,就占据了传播E的优势,尽管节点5的粉丝量低于节点3和节点10,但由于在传播级别及传播时间上占据优势,从而使其传播具有更大的扩散面积及更长的传播链。②强势节点相互承接配合。继节点5后,又有6,18,12等强势节点在不同的时刻逐步扩散。从图l中可以看到,还有其他次强势节点也在网络中不断承接扩散,形成一个强势、次强势节点逐层承接、均匀地分布较大的传播网络,其中最大链氏达到12。分支1―16―17(见图1第4象限)的情况,属第2型与第3型中间状态,由于节点16属2级传播节点,边上又有两个次强势节点配合,使早期传播的面积扩散较快,但整个子网络后面缺乏强势节点承接,分布不够均匀,因此传播网络从面积上弱于第3型。

第4种类型:以节点1―20―21―22为主支及临近4个支干形成的子网,该子网没有明显的强势传播节点,但是在图1中可以看到传播早期有一些次强势节点较为均匀地分布着,中期和后期又有几个次强势节点承接,导致整个网络的面积较大,且传播链长也达到11。

从上述四种类型可以看到,当传播中强势节点在传播的早期传播,并目,网络中强势节点均匀分布时,传播的面积及链长较为理想。这点在网络传播及营销方面有重要意义,合理设置、增加或改变强势节点及其节点合理布局,会改善网络传播结构、速度、面积及链长。

3 网络结构及路径形成的影响因素

传播网络的形成与多种因素有关,除了偶发因素外,发现以下因素对网络的结构及路径的形成产生较大的影响:

3.1 高影响力用户数量影响网络规模及结构

在事件传播网络巾,转发是信息传播的关键,当网络中有较多的高被转发的用户时,才易形成较大规模的网络,那么用户被转发与哪些因素有关就成了问题的关键?为此,从转发用户集中提取各用户的ID、所处的传播级别、被转发的数量,转发时间,关注数、粉丝数、发表的微博数量、足否是认证用户,再将用户被转发数分别与其他字段进行相关性分析,结果发现,用户被转发的数量与该用户的粉丝数存在高度相关,相关系数达0.7040,与该用户是否是认证用户存在低度相关,而与所发表的微博客条数等没有相关性,如表1、表2所示:

注:用厂ID-新浪微博客给予的用户标识;传播级―从原创节点开始发散的一条路径中,各节点按传播的先后命名为传播级,原点本应是零传播级,但为了相关系数计算的方便,将原点设置为1级,其它节点相应均增加一级;是否认证-记0为非认证用户,1为认证用户。

上述研究说明,刚户被转发的数量只与用户的粉丝量高度相关,即拥有粉丝数多的用户所或转发的贴子才易于被他人发现并继续转发,拥有较多粉丝的用户被称为有影响力的用户,当网络中拥有较多的有影响力用户时,才能吸引更多的关注,从而引起信息的持续传播,形成更大的网络规模,这些有影响力的用户则成了网络的信息中枢。从图1中也可以看到重要的传播链中都有高影响力的用户。

3.2 传播时间、传播级别及高影响力用户的合理分布决定传播的路径

从信息传播的周期看,一般来说,信息传播分为早期、中期和晚期三个阶段,信息的早期较易受到关注或引发兴趣,即使是有影响力的用户,如果是在传播的晚期介入,也会影响传播效果,如节点3,虽然他吸

引了大量的转发,但却难以为继,而节点5,由于节点5是高影响力用户,尽管影响力低于节点5,但由于在传播的早期,易形成更大的网络,高影响力用户传播级别越小、传播时间越早、高影响力用户之间相互承接配合的越好,越容易形成较大的传播网络和较长的传播路径。

3.3 外部因素会干扰或改变传播网络

一般认为,一条原创贴后,渐渐被传播开来,在一定时间积聚达到峰点,最后再慢慢衰减。本研究中考察的农民工贴却反映了一个很奇怪的再现,即在3月8日和9日分别被转发1次和5次后,似乎从此销声匿迹,再无一次转发,但在24日却突然被转发,25日达到转发的高潮,如表3所示:

进一步考察发现,原因在于微博客场外事件的影响,3月23日美国总统奥巴马在白宫签署医保改革法案,24日在白宫举行新闻会,25正式宣布该法案。由于累卯是原创作者薛绍裳的粉丝,是第一个转原创贴的人(于3月9日转发),风之子又是是累卵的粉丝,当累卵转发了薛绍裳后,风之子又于3月24日转发了累卵的这条转发贴,并评论说“奥巴马完成了为美国96%的人争取医疗保障的工作。这一个业绩,足以名垂青史!――”,此贴掀 起了24日和25日转发、评价或回复该贴的高潮,内容均是关于养老、医保及农民工生活的话题。

由于该外部因素的影响,将一个普通的、几乎无人讨论的话题上升到民生问题的高度,吸引了大量关注民生问题的用户参与,不仅放大的网络的规模,也延长了网络传播的路径。

4 结语

从上述研究可见,微博客信息传播网络以原创贴为中心,沿着多条路径逐级发散,发散的面积大小、路径长度与传播过程中经历的节点有关系,当节点拥有较多的粉丝数时,该节点具有明显的强传播能力,能吸引更多的用户关注并转发,强势节点越早出现在传播早期,越有利于信息的扩散,传播网络的而积将会更大,传播链将更长,传播中强势节点、次强势节点的合理分布有助于构建更大的传播网络。此外,传播网络的规模及速度还与其他因素有关,如与事件本身性质有关系,有些事件较其他事件更易于吸引用户注意力;还与传播过程中所遇到的其他事件干扰有关,当发生了新的触发点,可能再次触发了对原事件的转发或讨论,使事件传播网络可能重新放大。也就是说,信息传播的面积、传播链长、传播的速度及传播的生命周期取决于事件本身、微博客场内场外的干扰因素、传播的节点以及节点的合理布局几个方面。这一研究结论对网络营销及互联网舆情监控具有一定的意义。当需要扩散信息时,合理地有目的地进行节点的监控和布局,使结构更加利于传播,当需要将信息传播的周期延长时,可以合理地策划话题,进一步激发传播,掀起新一轮的扩散;当需要对信息传播进行控制和遏制时,则可能通过监控强势节点、限制强势节点、破坏网络结构或转移话题等活动达到目的。