首页 > 范文大全 > 正文

面向大数据的可视化数据方法探究

开篇:润墨网以专业的文秘视角,为您筛选了一篇面向大数据的可视化数据方法探究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】目前,大数据正在被越来越多的研究机构和个人所使用,然而,想要挖掘出大数据中的重要信息则需要一定的方法,本文介绍几种可视化数据的工具和研究方法,为读者展示大数据处理中的一些关键性问题。

【关键词】大数据;可视化数据;处理工具;图像化

中图分类号:TP39 文献标识码:A 文章编号:1006-0278(2014)07-172-01

一、大数据概述

巨量资料(big data),或称大数据、海量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity。“大数据”是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用,形成的智力资源和知识服务能力。

二、可视化数据与大数据

数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着,数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。

三、可视化数据方法的工具

目前可用的数据可视化工具大约有上百种,但适合处理大数据的工具并不太多,约有20余种,以下简单介绍几种常用工具:

(一)简易数据处理工具

Excel的图形化功能并不强大,但Excel是分析数据的理想工具,它也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上可选择的范围有限,这也意味着用Excel很难制作出能符合专业出版物和网站需要的数据图。

CSV(逗号分隔值)和JSON(JavaScript对象注释)虽然并不是真正的可视化工具,但却是常见的数据格式。你必须理解他们的结构,并懂得如何从这些文件中导入或者导出数据。以下将要介绍的所有数据可视化工具都支持CSV、JSON中至少一种格式。

Google Chart API工具集中取消了静态图片功能,目前只提供动态图表工具。能够在所有支持SVG\Canvas和VML的浏览器中使用,但是GoogleChart的一个大问题是:图表在客户端生成,这意味着那些不支持JavaScript的设备将无法使用,此外也无法离线使用或者将结果另存其他格式,之前的静态图片就不存在这个问题。尽管存在上述问题,不可否认的是Google Chart API的功能异常丰富,如果没有特别的定制化需要,或者对Google视觉风格的抵触,那么你大可以从Google Chart开始。

D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。虽然D3能够提供非常花哨的互动图表,但你在选择数据可视化工具时,需要牢记的一点是:知道在何时保持简洁。

(二)进阶数据处理工具

作为用来分析大数据集的统计组件包,R是一个非常复杂的工具,需要较长的学习实践,学习曲线也是本文所介绍工具中最陡峭的。但是R拥有强大的社区和组件库,而且还在不断成长。当你能驾驭R的时候,一切付出都是物有所值的。

Processing是数据可视化的招牌工具。你只需要编写一些简单的代码,然后编译成Java。目前还有一个Processing.is.项目,可以让网站在没有Java Applets的情况下更容易地使用Processing。由于端口支持Obiective-C,你也可以在iOS上使用Processing。虽然Processing是一个桌面应用,但也可以在几乎所有平台上运行,此外经过数年发展,Processing社区目前已近拥有大量实例和代码。

四、针对大数据的可视化数据方法的使用

针对不同的大数据体系和数据结构,我们可以选择以上所介绍的几种工具来使用,不同的工具使用技巧和难度迥异,然而如何在适当的数据面前使用适当的工具来处理也是一个不小的难题。我们应当针对不同的问题和数据的使用效率来决定使用哪种工具。例如:需要统计一个地区的年温度数据并可视化的时候,我们可以使用D3(DataDrivenDocuments)来进行处理,然而如果需要统计全球的温度数据并按时间序列排布且能进行动态化演示的时候,我们就需要类似Open-Layers的工具来达成目的了。

五、结论

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。通过一定的可视化数据方法,我们可以很有效的对大数据进行深入加工,从而获得数据中的潜在信息。

从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术,也是大数据的可视化方法最有价值的一点。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。

参考文献:

[1]维克托・迈尔-舍尔维恩,肯尼斯・库克耶.大数据时代[M].浙江人民出版社,2013.

[2]弗莱(Fry.B).可视化数据[M].电子工业出版社,2009.

[3]刘涛,张群会.科学计算可视化与数据可视化的比较研究[J].科技广场,2008(10).

[4]孔晶晶.基于Processing的互动媒体设计研究[D].江南大学,2009.