首页 > 范文大全 > 正文

关于网络舆情事件热点发现算法的比较分析刍议

开篇:润墨网以专业的文秘视角,为您筛选了一篇关于网络舆情事件热点发现算法的比较分析刍议范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:该文首先从宏观和微观两个角度分析了当前网络环境下舆情事件的特点,然后简单分析了网络舆情事件的热点识别方法,详细说明了几种不同的舆情事件热点算法,最后对几种算法进行了对比分析,对实际网络舆情事件的科学有效分析具有非常重要的意义。

关键词:网络舆情事件 热点 发现算法 比较分析

中图分类号:TP393 文献标识码:A 文章编号:1674-098X(2015)06(c)-0217-01

网络舆情事件由于主要通过网络传播,而网络也是一个公众性极为突出的平台,因此对于其发生的舆情事件的分析也能够非常容易的通过数据运算实现。网络舆情事件虽然传播于网络,但一般仍然是以现实社会为基础所产生的,因此其现实意义也非常重要,通过对网络上的舆情发生和走向分析,能够从一定程度上反映出社会中的实际舆情走向。

1 网络舆情事件分析

1.1 宏观网络舆情事件分析

宏观角度分析舆情事件主要是指事件热点或焦点程度,以及其在网络舆论中造成的影响等。对网络舆情事件的热点数据分析,首先要明确宏观性的舆情事件特点;其次有针对性的进行其具体热点数据分析,实现对整个事件舆论状态及发展走向的整体分析。

1.2 微观网络舆情事件分析

微观角度分析网络舆情事件主要就是根据网络上的事件点击、转发、讨论人数等具体信息进行数据的统计、计算和分析,这种分析更加注重实际的网络数据,虽然其结果更加具体化,但由于网络信息量的庞大,其分析工作量也是同样巨大的。

2 网络舆情事件热点识别与检测

在网络舆情事件的识别与检测中,识别是一项相对比较简单的工作,根据具体的网络事件热度进行简单分析就能够判定出是否热点事件,而舆情事件的热点检测是一项对具体数据要求较高的工作任务,因此需要有准确的数据统计、计算和对比分析才能实现。另外舆情事件最大的特点就是变化性强,根据不同时期事件的发展变化走向,需要进行同步信息和数据的掌握,才能够随时准确的反映事件的热点程度,从而全面的掌握网络舆情走向。同时根据事件的多面性也要针对不同的事件反映或讨论结果进行多元化信息分析,对比结果或讨论观点的热度走向等,进而做出相应的舆论干预策略。

3 网络舆情事件热点发现算法

3.1 single pass单程事件识别算法

这种算法是根据某一单独事件或某一类事件进行的相应数据计算和分析,其分析所需要的数据有事件的关键字及其出现的频率,有关事件的话题出现和查询的频率等。以Di表示某一话题,每个与话题相关的事件都作为一个向量,事件的热点计算公式如下:

然后进行信息的预处理对各项数据分类、过滤、识别、匹配,再根据其中的热点数据进行发现和运算,将运算结果作为未来的跟踪对象,实施持续性的热点数据统计与计算,最终完成对整个事件的热点分析及评估。这种算法对于事件热点的数据分析比较科学,同时算法也比较容易,是一种好操作的常用热点事件计算方法之一。

3.2 KNN最邻近事件分类识别算法

KNN最邻近事件是指在某一热点事件范围内,所出现的不同角度的各种话题,这种通过分类和对比的方法进行的热点事件运算能够对当前热点事件进行全面、准确的数据运算,同时客观的反映出事件不同话题的热点程度,掌握整个事件在网络中的舆论状态。首先根据事件相关的各个话题进行基本的搜寻;其次对不同的话题根据时间先后进行划分,并针对不同时期话题所出现的关键字及其数量、频繁、类型等信息进行统计分析,最终计算出其中最为相近的几个话题,根据其热点程度进行由重到轻的分类和排序,最终实现对各个话题的全面分析。

3.3 SVM支持向量机事件识别算法

这种算法一般是针对同一时期的不同热点事件进行的热点识别算法,由于网络信息量的庞大,决定了在同一时间内不可能仅仅有一个事件是热点,如何针对这些同一时间内的热点事件进行识别与热点运算,就是SVM算法能够解决的问题。通过函数算法能够将事件的热点计算更加精确,但是算法相对复杂,普遍应用性稍差。

3.4 K-means平均值事件识别算法

根据网络事件发生情况建立起K平均聚类的模型,计算不同话题与中心事件的距离为根本,来判定其热点程度并根据结果实行相关的报道。具体的算法是,以某个话题中心为Di,以Ci表示不同事件,公式如下:

m是与话题相关事件文档的数量。这种算法对于一些话题比较集中的热点事件比较适用,难易程度相对较低,容易快速实现对事件的热点数据分析。

3.5 SOM自组织映射事件识别算法

这种算法是一种非常容易实际运用的事件热点计算方法。首先针对最先出现的热点事件进行信息收集与提取,针对其热点特征进行基本的分析;其次建立起以些热点为基础的映射事件组织,根据随时出现的相关话题或报道与热点事件的关系,及出现的时间先后进行事件的热点分析和舆情走向分析,从而掌握事件的发展规律或发展方向。

4 网络舆情事件热点算法比较

single pass单程事件识别算法是最基本的事件热点算法,它主要是针对网络信息环境下事件不断发展变化的特点所适合的热点运算方法,同时能够很好的反映出事件的变化情况。

KNN最邻近事件分类识别算法虽然运算比较复杂,但其结果也是非常准确的,缺点是对不同事件的存储需求较高,信息的输入、读取的运算复杂。

SVM支持向量机事件识别算法能够以最安全、最精确的运算识别出不同事件的热点程度,但其复杂的运算方法使其广泛运用受到限制。

K-means平均值事件识别算法能够根据事件的基本发展情况和话题状态进行有效的数据分析,同时计算方法也比较简便,在监测网络舆情走向时有效性非常明显。

SOM自组织映射事件识别算法所设计的映射类聚能够根据各种事件或不同事件之间的关联建立起完整的聚类,并进行相应的运算,在对比不同事件的热点分析时能够有效和准确的掌握具体的网络舆情。

5 结语

针对不同的网络舆情事件算法进行分析,要将网络上的信息更加具体化,通过数据的形式来表现不同舆情事件所造成的影响,是一项非常直观、易于研究的方式。

参考文献

[1] 柳虹,徐金华.网络舆情热点发现研究[J].科技通报,2011(3):421-425.

[2] 曾润喜,杜换霞,王君泽.网络舆情指标体系、方法与模型比较研究[J].情报杂志,2014(4):96-101.