首页 > 范文大全 > 正文

开源力量主导大数据发展

开篇:润墨网以专业的文秘视角,为您筛选了一篇开源力量主导大数据发展范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

随着互联网的加速普及及应用,基于互联网的企业业务发展和技术创新持续加速。在技术创新方面,可汇集全球各地各类智力资源的开源模式日益成熟,并受到全球主要科技企业和发达国家的大力支持。随着全球各大科技巨头的竞相加入,开源模式正逐渐成为推动大数据等各领域技术创新的主导力量

从大数据的发展历程可以看出,大数据源于开源,并基于开源不断演进发展,自身就已具备了开源基因。经过若干年的发展,开源软件和开源工具已经覆盖到了大数据产业发展的各个环节,基于开源软件企业可以快速地构建大数据应用平台,提供丰富的大数据开发和应用工具。根据统计,大数据领域的开源软件已涵盖了计算软件、存储软件、查询软件、基础平台、平台管理、系统工具、数据应用等多种类型。此外,与云计算类似,在大数据处理平台这个基础性并处于核心地位的环节,开源技术的作用至关重要,不管是Hadoop生态,还是Spark生态,抑或是其他支线平台,其绝大多数都属于开源软件,典型代表包括Hadoop生态的Hadoop、Pig、HBase、ZooKeeper、Hive、Yarn和Impala;Spark生态的Spark、Shark、Spark Streaming、Bagel、GraphX和Spark SQL;Hypertable、Cassandra、Dryad、S4、Kalka、Haloop、Storm等支线平台。当前,从小型初创企业到行业科技巨头,各种规模的企业都在使用开源软件和工具处理大数据和基于数据的预测分析。开源不仅驱动着大数据技术的创新演进,也推动着大数据产业的不断进步,对繁荣大数据应用生态起到不可忽视的作用。

表面上看,大数据基础平台和主要环节的技术创新均是基于开源模式推动的,全球各界人士均有平等的参与和应用机会。但是,从技术演进的确定权和影响力来看,大数据领域的技术创新离不开全球主要科技企业的参与。科技企业既是大数据技术创新的主要力量,同时也围绕开源世界的游戏规则不断扩大行业影响力,紧抓技术创新前沿,抢占大数据技术发展和标准制定的话语权,培育发展形成以企业核心竞争力为中心、以开源为主要方式的新型产业生态。一方面,科技企业是推动大数据基础平台演进发展的主导力量,Hadoop的发展离不开谷歌,Impala和Cassandra的主要贡献者分别为Cloudera和Facebook,S4则主要由雅虎来主导。另一方面,在数据存储和计算等大数据产业链中的重点环节中,科技企业均加大了布局力度,特别是在键值存储和表格存储等关键方向,几乎在所有的开源项目背后都有大型科技企业的支持。其中,我国的阿里巴巴就是Tair存储引擎和OceanBase数据库的主导者。

综上可见,开源已经成为了大数据技术创新的主要模式,而且全球各大科技企业均积极基于开源模式建立产业发展新生态,构筑技术创新的主动权和产业发展的制高点。为推动我国大数据产业健康发展,提高我国企业在大数据领域的竞争优势,掌控产业发展的主动权,提出以下建议。

一是加强开源理念传播和前沿技术跟踪,要不断加强研究和跟踪,加大对开源模式的引导和宣传,使行业企业更好地认识开源、熟悉_源、融入开源。

二是提升开源技术的应用和反馈水平,既要通过建立公共技术服务平台促进成熟开源技术的应用和融合,也要鼓励我国企业通过主动开源和积极反馈等方式提升我国企业在全球主要开源项目中的影响力。

三是优化基于开源的技术创新环境,积极发展我国本土的开源社区,促进形成开源式的技术创新模式,促进开源项目和实践应用的对接。同时,要构建综合性的完善的第三方服务体系,促进形成围绕开源技术创新和应用的良性产业发展生态体系。