首页 > 范文大全 > 正文

大数据应用:理想照进现实

开篇:润墨网以专业的文秘视角,为您筛选了一篇大数据应用:理想照进现实范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

自身业务的创新推动了企业对海量级数据价值挖掘的需求。通用汽车的安吉星(OnStar)服务每年管理的数量早已多达3 PB,该服务为车主提供远程车辆诊断服务、应对突发事件。在安吉星CIO Jeffrey Liedel看来,这些数据就是金矿。

例如,通用汽车正在测试在雪佛兰混合动力汽车Volt上使用的一款移动应用程序,该程序可以帮助驾驶员们监测汽车电池和远程管理充电。事实上,为数众多的车主都希望汽车制造商们可以缓解“里程焦虑”(担心电动汽车还没到开到目的地时已耗尽电量),所以目前,包括日产和福特在内的汽车制造商也已在提供或打算提供监测电动汽车的类似功能。Liedel说:“除此之外,客户对车辆驾驶情况、驾驶模式和燃油经济性等分析数据也非常感兴趣。”

并非只有电动汽车的用户想通过安吉星服务更深入地了解车况,通用汽车内部的业务部门用户和外部的合作伙伴也需要这些数据。Liedel表示,可靠、安全、灵活地提供数据,这项任务落到了IT部门的肩上。他说:“关键在于认识到数据和分析的重要性。”

除了这些掌握PB级信息的CIO要琢磨如何管理数据,那些仅仅收集GB级数据的公司也看好利用自有系统之外的信息。拥有处理“大数据”的能力和有效分析大数据的工具,正成为一种必需的竞争优势。

埃森哲首席技术创新官Gavin Michael说:“每家企业都在竭力利用自身拥有或可以访问的数据,希望获得比以往更有成效的数据支撑。不过,由于许多公司的分析人员数量很少,他们从未把大数据当做一种企业资源来利用。CEO们需要从企业的角度看待数据,了解如何整合和分析数据。”

交易和分析不混搭

随着硬件和存储成本不断下降,有些CIO会认为在现有系统的基础上添加容量以支持数据分析是经济高效的举措。但一些人则认为,分析大数据时,交易系统和分析系统单独维护是搞好这两个流程的必要条件。

美国退伍军人事务部在过去两年中部署了25个数据仓库,用于分析大数据。该部门为2200万名退伍军人提供健康福利,其CIO Roger Baker表示,分析来自退伍军人电子健康档案(EHR)的数据直接影响到临床医生能否更有效地使用该系统,隐藏在数PB的临床和遗传数据中的宝贵信息有望带来更有效的医疗方法。退休军人事务部甚至启动了征集DNA样本的一项计划,补充退伍军人的健康档案。

Baker说:“我们有一大堆二三十年间收集起来的宝贵信息,涉及病人的症状、治疗情况和治疗结果。”

Baker表示,EHR系统包含“面向交易速度的层次数据库,所以临床医生在门诊时,需要数据库快速反应。”另一方面,分析数据库会根据临床主题来加以组织:药剂信息在一个地方,血液数据在另一个地方。“我们希望为研究人员提供重要的关联数据和计算能力,让研究人员可以弄清楚需要什么样的数据。”

但是,数据分析并不容易,需要将某一病人的档案和其他病人的档案进行比较,同时也要和同一病人多年前的档案进行比较。由于数据量很大,Baker打算在明年添置超级计算机以便更快速地处理数据。他说:“数据访问速度越快,信息带来的价值就越大。”

不过,并非所有对大数据进行分析的公司都决定投资超级计算机,要不要投资于超级计算机取决于用户对获得查询结果的速度的需求。一般情况下同使用超级计算机获得查询结果只需几小时或几分钟,使用传统服务器从庞大数据集获得结果可能需要几天。

波士顿儿童医院的信息学主管兼哈佛医学院的教授Isaac Kohane表示,获得数据分析结果的速度也是因人而异的。目前,他负责哈佛医学院及附属医院的研究人员和医生之间的合作,开发用于处理临床和研究数据的技术。他表示,需要花这么长时间的查询所处理的工作并非优先级很高的业务事项,所以没必要花钱购置更强大的处理能力,来加快获得结果的速度。

重点在数据

在大数据处理的过程中,CIO们面临的一个更大的问题是,确保数据本身可用性和可靠性。大数据加大了数据治理、确保数据质量和访问控制方面的难度,因为它既涉及IT技术,又与业务部门密切相关。埃森哲的Michael说:“共享整个企业的数据未必是件容易的事,很难让整个企业共同来解决这个问题。”

2011年,罗得岛蓝十字蓝盾保险公司重组后精简了业务。在这个过程中,管理人员认真分析了企业自身处理利用这些数据的情况。这家保险公司原CIO现CEO Bill Wray说:“我们的数据资源非常分散,每个部门各行其是,财务分析人员、保险业务受理人和保健分析人员建立各自的数据集,且没有中央治理机制把数据汇集起来。”

由于受联邦医疗保健改革的推动,蓝十字/蓝盾保险公司希望改变原有仅仅处理医疗赔付的方式,通过为医疗服务机构提供经济激励以促进病人的健康,同时鼓励病人与初级保健医生建立更密切的关系,以降低现在每月处理100万笔索赔的压力,当然这需要企业级的分析功能做决策后盾。

Wray说:“如果更好地利用初级保健医生的资源,在疾病预防上下功夫,会让病人更健康,医疗赔付的成本也会随之降低。但是,人们在就医的过程中需要有大量纵向分析和趋势分析,这些分析让这个问题变得错综复杂。”

目前,罗得岛蓝十字蓝盾保险公司有一个企业数据库,但建立数据库的目的主要是收集数据,报告给用于横向比较的全美蓝十字蓝盾商业智能系统,本地分析人员并不使用该数据库。这样一来,要完成新业务模式所需的分析工作,该数据库就缺少来自公司理赔系统的信息,同时也缺乏可整合的外部市场数据。

科罗拉多州教育部在大数据应用方面也有着自己的遭遇,对他们来说,确定新的数据治理做法是开发全州纵向数据系统(SLDS)过程中的一个重要步骤。该项目旨在把来自178个学区和28所公立高等院校的学生数据与福利、收入和劳动力等数据整合起来,建立统一平台,用于分析学生从幼儿园到大学的成绩。

科罗拉多州教育部CIO Daniel Domagala介绍,该项目的25个目标中有9个涉及获取数据,包括建立一套通用的课程和项目编码,以及确定整合幼儿园收集的数据的方法等。