开篇:润墨网以专业的文秘视角,为您筛选了一篇农业网络舆情论文范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
1研究现状
我国的网络舆情研究还是处于初级阶段,一方面,政府投入资金鼓励研究,建立了基础性的理论知识;另一方面,舆情的采集和分析缺乏相应的制度,同时舆情的应用也面临着很大的挑战。目前只有人民网的舆情监测室和一些企业开发系统研究,在农业方面则更加缺乏。在国外,网络舆情研究比较早。刚开始的研究都与政府有关,特别是与政治生活密切相关的大型选举活动的选情分析和研究。此外,针对舆情规范部分国家已经上升到行政制度层面,提出和采取了一系列的措施。伴随互联网的快速发展,农业网络舆情研究已经广泛发展,政府研究机构和企业对舆情的研究技术相当成熟。
2模型设计
云环境下的农业网络舆情监测模型由三部分构成,即舆情信息采集层、舆情分析层和舆情服务层(图1)。为了对主流媒体、门户网站、资讯平台、知名论坛、搜索引擎、博客、贴吧等网络载体的监测,全面掌控互联网上与农业相关的人、地、物、事、组织,不漏掉有价值的舆情信息,通过收集相关网页信息,并对其过滤、分类;对已经处理与农业相关的舆情信息进行动态分类采集、智能化分析,及时发现隐藏热点舆情、突发事件和重大公共事件信息。在整个过程中,农业网络舆情监测的信息都在云数据中心计算和存储。
3系统功能模块
3.1舆情信息采集
舆情信息采集模块是整个系统数据处理分析的信息源[6]。舆情信息采集主要是由网络爬虫来实现,系统采用NUTCH采集信息,从给定的一个初始集URLs出发,依次按顺序出去URL,获取该URL指向的网页,同时将页面中的新链接加入到URLs中,不断重复上述过程,直至所有的URLs全部被采集完终止。为了提高网页的采集速度,系统设计了多个采集器并行采集,同时在将采集到页面中的链接进行过滤,除去重复的、过时的URL(图2)。上述流程的输入是给定的URL,URL过滤规则和页面过时判定值,而输出的是网页的正文内容。当进行信息采集时,由于整个互联网包含的信息量太大,在消耗系统资源和网络宽带的情况下,采集有效的页面率却不高。系统对舆情主题进行规划,使用主题网络爬虫,提高系统资源利用率(图3)。将采集得到的信息存入云数据中心,进行舆情信息预处理。信息预处理主要实现的功能是解析网页正文内容、进行中文分词、特征提取和关键词提取、删除停用词[7]。
3.2舆情分析模块
舆情分析模块是系统中最核心的处理模块,利用信息技术对预处理后的舆情信息进行分析挖掘,实现舆情信息的热点发现和话题追踪等(图4)。本体是通过某领域内诸多知名专家协作共同构建该领域概念体系、公理和体系关系集合体,以计算机所能理解的语言和形式描述、表示和组织知识,促进知识重用、知识共享和知识服务。而农业本体是通过农业与其他领域(如农产品加工、经济管理等领域)专家的积极参与和通力协作,从而构建的以机器能理解的形式化语言表示和组织的农业知识和模型[8]。构建农业领域本体,能够更好的发现舆情信息,提高预警能力。敏感话题识别主要是分析在不同时间内的某一主题关注程度。随时间的变化,话题关注度也会出现一定的波动。敏感话题不等同于热点话题,涉及范围比较广。敏感话题主要处理过程包括对网络舆论内容进行分词,并针对当前社会形势,总结出目前较为敏感的词汇,建立农业敏感词库。其具体实现是将根据分词后的结果与敏感词库中的敏感词匹配来完成,从而实现当前网络中敏感话题自动发现。热点话题是文本聚类分析的结果。其主要流程是将预处理的文本信息归入相关的话题中,文本聚类就是将话题按照文档进行聚类,从而发现新的热点。话题追踪是得到的热点话题与用户感兴趣的进行比较,若判断是用户感兴趣的则交给用户,这里还可以通过机器学习不断地向用户兴趣进行修正,使得系统能够更好地满足用户的需求。此外,热点发现还可以通过对用户的访问日志信息挖掘。用户在浏览网页时,网页日志中会记载相应的IP地址、浏览时间和URL地址等信息,通过统计分析日志得到某地区某时某刻的热点信息。另外,还可以通过统计用户在某段时间内搜索的关键词量,来描述网民关注点的产生和变化过程,甚至可以追踪到舆情产生和变换的源头。
3.3舆情服务平台
舆情服务平台是系统和用户的交互界面。系统在经过舆情分析之后,将产生的结果结合可视化技术呈现给用户。同时也可以进行个性化的定制将农业舆情报告提供给舆情监管部门或者决策者,决策者或者监管部门在进行舆情报告评估基础上产生新的舆情需求,进行舆情采集主题规划。舆情服务还包括敏感话题的趋势分析、热点话题排行榜等,当这些超过了系统预先设定好的阀值,系统将发出预警信息,提前采取措施应对。
4结束语
网络舆情监测是一个新兴交叉学科的研究领域,农业网络舆情监测研究是农业和计算机技术应用的一大重要表现。对农业领域的网络舆情研究主要是解决以下需求:透过互联网获取农民真实的诉求;准确收集农业部门最需要的舆情信息;随时了解和追踪与农业相关的舆情信息;应对农业领域的突发事件和舆情危机蔓延;对未来的舆情信息走势进行判断等。农业网络舆情监测模型能够有效的分析网络舆情发生、发展和变化情况,也可以为预测舆情未来的发展提供科学依据。该模型能够加强舆情信息的分析能力,全面准确地提供农业舆情分析,随时关注农业领域的新动态,在帮助农业有关部门和决策者进行决策提供有力依据等方面有重要意义。
作者:陈涛 刘世洪 单位:农业部农业信息服务技术重点实验室 中国农业科学院农业信息研究所