首页 > 范文大全 > 正文

让数据仓库“动”起来

开篇:润墨网以专业的文秘视角,为您筛选了一篇让数据仓库“动”起来范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

在激烈的市场竞争中,数据正日益成为企业超越对手的利器,甚至成为企业安身立命的根本。但是如何从海量的、庞杂的业务数据中提取出有用的信息,来帮助企业更好地认识自己,服务客户,这成为企业信息化发展到一定阶段不得不面对的问题。

数据仓库的出现创造了一个分析型的数据环境,为企业基于数据进行分析、决策提供了支持。

但是,数据仓库的实施并不意味着企业从中获取了价值,让数据仓库真正地服务于业务,产生业务价值,这才是数据仓库的根本目的。而要做到这点,就必须让人用起来,而不是一个摆设;同时要让所有的人用起来,而不是单纯的决策者,这样才能产生最大的价值。

在使用过程中改进

“数据仓库项目绝不只是一个建设的问题,必须注意相应配套措施的跟进,加强推广和培训工作。如果没有人使用,大家就会认为这是一个失败的项目。”Teradata中国区数据仓库事业部副总经理王闯舟这样说道。他认为,从当前国内数据仓库的实施情况来看,应用的全面和深入地推广是需要尽快解决的问题。

现实中总有一些数据仓库项目,在建设完成后成为了摆设,被束之高阁,或者乏人问津。而之所以出现这种问题,有两个方面的原因。

首先,相应的应用程序没有跟进,单纯地建设数据仓库是没有任何意义的,必须配合实用的分析工具和应用程序才能发挥数据仓库的价值。

对于企业来说,数据仓库建设是一个立体的工程,必须把它放到整个企业信息系统环境中,才能成功实施。

其次,不注意后续的推广和培训。在数据仓库建设过程中,会有专业的人员为企业提供咨询,但是在项目实施完成之后,企业往往忽视了持续的推广和培训工作。

简单地认为只要把工具交给相应人员手里就大功告成了,而他们往往忘记了工具的目的是让人使用的,同时也低估了人们对于新生事物的抵制,单纯地认为只要性能更好,功能更加大,人们自然会蜂拥而至。

从根本上来说,整个商业智能是一个锦上添花的项目,企业从中获取更大的发展,而不是赖以为生。因此不像其他的业务运营系统,离开了,企业就无法正常开展工作。对于员工来说,没有使用的压力,就很难促使他们改变自己,接受新事物。另外,数据仓库的使用需要掌握一定的技能,而对普通的员工来说,这也是一个门槛。

因此对于数据仓库项目的实施,一定要注意推广、培训,让员工充分认识到它的价值,促使他们愿意用;同时进行相关的培训,使其掌握相应的技能,保证他们能够正常使用。另外还需要建立一定的绩效考核制度,施加一定的压力,督促他们真正地使用起来。

只有在数据仓库真正使用起来以后,企业才能不断地明确业务需求,发现问题,同时积累经验。在此基础上,企业再对数据仓库进行不断地完善、扩充,从而形成一个良性的循环,而不是一上来就建立一个大而全的,苛求完美的数据仓库。这样分阶段地、循环地实施可以帮助企业规避风险、节省不必要的开支,同时快速地看到回报,有利于建立信心,推动数据仓库项目持续地进行。

“数据仓库的建设要想大做小,在整个企业级的架构指导下,逐步地进行实施。”王闯舟进一步说道。“数据仓库的建设有两种思路,一种是数据驱动,致力于建立一个企业级的数据仓库;另一种是应用驱动,致力于解决现实的问题。在现实的项目当中,我们应该把这两者结合起来。”

让所有的人都能使用

操作型商业智能正在成为商业智能发展的一个方向,它要求商业智能不仅要为企业“金字塔”组织架构中的高层提供决策支持,同时也要帮助一线的业务人员更好地开展工作。

但是普通业务人员的关注点和要求与决策层差别很大。对于管理人员来说,他们更关注历史数据的分析,期望从中找出规律,发现问题。而对于一线的业务人员,他们则关注操作型的数据,要求实时地看到最新的业务进展情况,指导自己当前的工作。

但是传统的数据仓库都是静态的,它存储的数据都是历史性的和加总的。它丢失了具体的事务性信息,同时最新的进展情况也无法得到及时反映。为了解决这种问题,操作型数据存储(ODS)的概念被提出。

“数据仓库之父”比尔・ 恩门认为ODS是支持企业对最新的、运营性的、整合的、总体的信息的需求而建立的具有主题导向的、整合的、变动的、显示当前值的、只有细节的数据的集合。

ODS代表着企业最新一分钟运营情况,而从ODS中做出的决定的焦点是即刻的。

因此在数据仓库的建设中,我们会看到在企业级数据仓库之外还存在一个ODS,通过在物理上把传统的数据仓库和ODS区别开来,整个数据仓库项目满足了企业不同的业务需要。

但是在这样的架构下,企业数据仓库建设的成本上将大幅提高,不仅要维护企业数据仓库,还要维护ODS,数据冗余度增加的同时,成本也急剧增加。

另外,一份数据同时存储于两个地方,使数据的一致性和准确性也面临着挑战。

而动态数据仓库的出现解决了这些问题,它利用一套数据仓库系统来同时满足管理层决策的需求和业务人员实时操作的需求。

动态数据仓库的构建技术实际上和传统的数据仓库一样,但是在扩展性和负载性上有了更高的要求。

动态数据仓库要实时地或者准实时地从业务系统中提取数据,同时要求对用户的请求快速地响应,另外还要应对大量人员的同时使用。这对动态数据仓库的稳定性提出了很大的挑战。

那到底什么样的数据仓库才能称得上动态的数据仓库呢?在动态数据仓库方面走在前面的Teradata公司提出了六个方面的衡量指标:

动态地访问:对一线操作性的决策和服务提供支持,响应时间要少于10秒。

动态地加载:准实时地导入数据,在一分钟或几秒钟之内小批量地快速加载。

动态事件监控:快速地反映业务中发生的事件,例如在信用卡业务中,一次性地大额透支事件,要及时地被提取出来,从而提醒银行保持警惕,避免信用卡被盗取对银行和用户造成损失。

要做到这一步,就必须在业务规则中进行定义,并能够从复杂的环境中进行一定的智能判断。

动态地企业整合:能够把数据动态地整合进企业级的架构中,从而支持所有人员的快速决策。

动态地负荷管理:动态地系统管理,从而实时地进行性能优化和资源利用。

动态地可获得性:在提供用户实时地使用时要保证高度的可靠性和稳定性。

在动态数据仓库的建设中,王闯周提出了节点扩充的概念,每个节点都能应对一定程度的数据加载和用户访问,随着数据量的不断增大和用户群的增长,不断扩充节点,从而轻松地扩展。

数据仓库的目的有两个,一个是对内帮助企业进行内部管控,降低成本,提高效率。另一个是对外,更好地服务客户,提升客户价值。传统的数据仓库只关注前者,而动态数据库的出现不仅使企业内部管控上更加强大,同时大幅地提升了用户满意度。

在Teradata在与中国邮政合作的邮件跟踪查询系统中,就采用了动态数据仓库。通过这个系统,客户可以在网上方便地查看自己的邮件是否送达,如果没有送达,现在在什么地方,是在飞机上呢,还是在某个中心局。同时,中国邮政也可以对邮件进行实时的、更加细致地监控,保证邮件的安全、快速地送达。