首页 > 范文大全 > 正文

基于Web挖掘的突发事件网络舆情预警策略探讨

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于Web挖掘的突发事件网络舆情预警策略探讨范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要

就目前的舆情预警系统来看是没有办法进行网络舆情的的,因此就将挖掘的技术充分的引入到突发的事件中,这里就包括建立舆情采集、挖掘层、分析层等基于web挖掘突发事件网络舆情预警系统的模型,该模型在一定的程度上可以整合预警全过程中的主要功能,有利于实现突发事件等舆情的分析与处理。因此本文主要就是针对基于Web挖掘的突发事件网络舆情预警策略进行分析与讨论的。

【关键词】基于web挖掘 突发事件 网络舆情预警系统

网络不仅可以为广大群众提供信息的选择,更是已经成为了社会突发事件的起源。网络舆情不仅可以发展为,进一步引发社会危机,而且网络舆情的情绪化更会导致各种突发事件的恶性发展,也会增加各种突发事件的处理难度。因此,如何利用现代技术处理好网络舆情突发事件,避免突发事件的发生或提供预警是解决问题的关键。

1 突发事件舆情与预警时所面临的困难

1.1 网络舆情与突发事件的关系进一步加深了预警难度的处理

突发事件在我国主要是事件的突然发生,在一定的程度上很容易造成社会危机,带来严重危害。突发事件与其他的事件是不同的,突发事件最主要的特点是破坏性、突发性等,在特殊的情况下就会转化成公共危机。

1.2 现有舆情系统对突发事件处理的能力不够

网络舆情分析的预警融汇了各种学科知识,如数据挖掘、计算机网络等,这里面涉及到了有关网络舆情的信息采集、对信息的分析、处理等全过程。在最近几年来,国内外的学者也从各个角度中分析了网络舆情预警处理系统,针对讨论的结果开发出了一些系统,比如说方正、Review等。这些系统在一定的程度上都为网络舆情分析提供一定的条件与支持。但是从整体上来看这些软件的功能还没有达到网络舆情分析智能化的程度,其中都存在着这样那样的不足,目前还没有形成一个完整的系统。

第一,舆情的信息资源整合程度不高。从现有的舆情系统来看信息源显然是不够的,对各种各样的信息整合力度也不大,这样就会导致不能够进行全网采集,就会制约舆情预警的效果。另一方面,当前的舆情系统一般都是借助搜索引擎等工具来搜索信息的,算法简单,导致很多信息在搜索出来的时候发生重复,甚至会产生虚假信息,降低信息的采集效率。

第二,舆情分析的过程缺少智能化、信息分析的程度不够深。现在舆情预警系统在处理信息方面,仅仅就是将收集到的信息经过简单的处理后交给工作人员进行分析或是借助统计学来分析,导致信息仅仅停留在表面上,就没有办法深入挖掘数据背后的深刻含义。

第三,舆情预警的判断力偏弱。目前现有的舆情预警系统一般都是自动与人工相结合的方式,几乎没有设置科学系统预警指标体系,在一定程度上就会导致预警结果没有办法满足决策的需要。

2 基于Web挖掘突发事件的网络舆情预警分析

2.1 Web挖掘

Web挖掘主要是指数据挖掘在Web上的应用,综合使用了数据挖掘、自然语言处理等智能技术来提取人们感兴趣的内容。根据不同的挖掘对象,Web挖掘可以分为三种形式:Web内容挖掘、结构挖掘、使用挖掘。与传统的网络舆情分析方法相比,Web挖掘的最大优点就是可以得到指定时间内的状况与热点。

2.1.1 Web内容挖掘

内容挖掘主要就是指从Web文档本身中的内容进行知识的抽取,同时还可以针对大量的Web文本集合进行分析。

2.1.2 Web使用挖掘

主要就是通过挖掘Web的使用数据来进行浏览者行为模式的提取,来获取有价值的信息。Web使用挖掘主要就是通过挖掘用户上网的信息等资源来更好的为用户提供智能化的服务。另外通过Web使用挖掘还可以分析与预测网民的行为。

2.1.3 Web结构挖掘

主要就是通过网页链接结构来挖掘有价值的信息的过程,大量的链接信息是进行舆情分析的重要资源。

2.2 基于Web挖掘的突发事件网络舆情预警的过程

以下主要介绍基于Web挖掘突发事件网络舆情预警的五个步骤。

2.2.1 舆情主题的策划

根据舆情所需要的不同可以设置出不同的舆情主题目标,还可以根据各种不同的需求在确定舆情的来源、主题等的同时在实施过程中调整采集的主题。

2.2.2 舆情信息的采集

根据舆情主题任务的多少可从信息资源中来提取相关的数据,并且对目标中的Web数据进行网页特征的提取、内容的聚类等,这样就可以挖掘到相关有用数据。

2.2.3 舆情信息的预处理

首先应该要将网页源码等来进行信息的处理,这里主要包括网页净化、词频统计等,这样才能够为舆情分析做好准备。

2.2.4 舆情信息分析

主要就是利用Web的挖掘算法来对信息进行分析,这样才能够挖掘出有效的信息。

2.2.5 危机预警处理

对挖掘出来的信息应该要做到及时分析,进而生成舆情报告,并且根据有分析出来的结果进行危机预警处理。

2.3 基于web挖掘突发事件网络舆情预警系统模型

2.3.1 舆情采集层

采集层是网络舆情预警系统模型中的最底层,主要的作用就是要完成对信息的采集与预处理。在采集的时候不仅要利用搜索引擎进行信息的搜索,还需要与最近所发生的舆情相结合。

2.3.2 舆情挖掘层

这个层次主要就是针对信息库中的内容进行处理的,利用Web挖掘技术来对网络上的内容与网民所留下的记录进行挖掘,这样在一定的程度上有利于更好的对网络舆情突发事件进行处理与监控。

2.3.3 舆情分析层

这个层次是整个模型中的中心部分,同时也是实现舆情预警的前提条件。

2.3.4 预警研判层

这个层次主要就是针对在分析层中所得到的舆情报告来进行舆情评估,主要是对危险性等方面进行测评。

3 总结

通过实践证明,把Web挖掘技术引入到突发事件网络舆情分析中,在一定程度上是可以充分发挥Web技术自身所具有的优势,实现网络舆情信息的自动化与智能化等。在突发事件网络舆情预警中运用Web挖掘技术在一定程度上可有效提高舆情的监控力度,这也是未来网络舆情预警的发展方向。

参考文献

[1]董坚峰.基于Web挖掘的突发事件网络舆情预警研究[J].现代情报,2014(02).

[2]刘.非常规突发事件的关键在线信息挖掘与预警研究[J].电子科技大学,2013(03).

作者简介

贾娴(1984-)女,山东省菏泽市人。硕士学位。现为菏泽学院助教。研究方向为网络信息安全、舆情信息过滤。

作者单位

菏泽学院 山东省菏泽市 274000