首页 > 范文大全 > 正文

部署企业数据仓库

开篇:润墨网以专业的文秘视角,为您筛选了一篇部署企业数据仓库范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

企业从来没有像今天这样,对数据产生如此巨大的依赖,数据的有效、安全、快捷使用,已经成为战胜竞争对手的先决条件。而建立合理有效的数据仓库系统是企业制胜的关键。

为应对日益加剧的商业竞争,企业不断增加内部IT及信息系统,如ERP、CRM、SCM、电子商务以及人事管理系统等。然而,随着这些IT系统的增加,企业的商业数据也分散在这许许多多的“信息孤岛”当中,企业面临的数据风险也越来越大。

建立数据仓库系统完全可以解决上述问题。数据仓库是将企业范围内的全部数据集成到一个数据仓库中,用户可以方便地从中进行信息查询、产生报表和进行数据分析等,从而实现对企业的数据进行合理有效的安全管理。数据仓库是一个决策支撑环境,它从不同的数据源得到数据,并加以组织,使得数据有效地支持企业决策。

企业决策者利用终端用户访问工具与数据仓库打交道,访问工具有五类: 报表和查询工具、应用程序开发工具、执行信息系统(EIS)工具、联机分析处理(OLAP)工具、数据挖掘工具。数据仓库系统是一个信息提供平台,它从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识,实现对企业数据进行管理。

为什么要选择数据仓库

调查研究表明,大多数企业并不缺少数据,而是受阻于过量的冗余数据和数据不一致; 而且它们变得越来越难于访问、管理和用于决策支持; 其数据量也正以成倍的速度增长。那么怎样把大量的数据转换成可靠的、商用的信息以便于决策支持呢?数据仓库被广泛地公认为是最好的解决方案。

数据仓库化是企业范围内数据的处理过程,它将企业内分散的原始操作数据和来自外部的数据汇集和整理在一起,为企业提供完整、及时、准确和明了的决策信息,使最终用户能够真正利用决策支持系统(DSS)工具直接从企业信息池中随机地提取、分析数据,有效地服务于企业的全方位决策。

接下来,现有管理系统和数据仓库将得到扩展,一是使数据仓库从一种局部的企业解决方案扩展到企业外部,扩展到企业的用户中去,使企业用户的数据仓库使用面更加广泛,这可以通过Internet/Intranet的帮助来实现,也是数据仓库与电子商务相互融合的一点; 二是使数据仓库从一种企业数据管理工具扩展到企业辅助决策工具,能够充分利用数据仓库中的数据资源,为企业的发展起到辅助决策的功能,使企业用户的数据仓库得到更加深入的使用,这可以通过数据库厂商提供的工具来实现,也可以由其它软件公司提供的独立工具包来实现,是数据仓库与商务智能相互融合的一点。

数据仓库的概念一经出现,就被用于金融、电信、保险等主要传统数据处理密集型行业。下面以数据仓库在证券业和银行领域的应用为例来说明。数据仓库在证券行业的应用十分广泛,它可以处理客户分析、账户分析、证券交易数据分析和非资金交易分析等多个业界关心的主题。数据仓库、OLAP、数据挖掘、多媒体和高带宽网络技术为银行的科学管理提供了新的技术支持,利用数据仓库的强大功能,银行可以建立企业客户群和个人客户群的数据仓库,并对企业的结构、经营、财务以及市场竞争等多个数据源进行统一组织,形成一个一体化的存储结构,为决策分析奠定基础。通过先进的信息加工、分析和处理,加上银行的经营决策及信贷营销人员的经验,对每一个投资方向和每一笔贷款做出科学的判断,可以有效控制投资及信贷风险。

企业数据库与数据仓库的关系

数据库是面向事务的设计,数据仓库是面向主题设计的; 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据; 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库设计是有意引入冗余,采用反范式的方式来设计; 数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表; 数据仓库是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。近年来,随着数据库技术的应用和发展,人们尝试对数据库中的数据进行再加工,形成一个综合的、面向分析的环境,以更好支持决策分析,从而形成了数据仓库技术。数据仓库的关键是数据库,以辩证的眼光来看,数据仓库的兴起实际上是数据管理的一种回归,是螺旋式的上升。

数据仓库是一种概念,不是一种产品,它包括电子邮件文档、语音邮件文档、CD-ROM、多媒体信息以及还未考虑到的数据。数据仓库最根本的特点是物理地存放数据,而且这些数据并非是最新的、专有的,而是来源于其它的数据库。数据仓库的建立并不是要取代原有的数据库,而是建立在一个较全面、完善的信息应用的基础上,用于支持高层决策分析。数据仓库是数据库技术的一种新的应用,它是用数据库管理系统来管理其中的数据。

目前像IBM、Oracle、Sybase、CA、NCR、Microsoft和SAS等有实力的公司相继(通过收购或研发的途径)推出了自己的数据仓库解决方案。IBM提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括: Visual Warehouse、Essbase/DB2 OLAP Server、IBM DB2 UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS); Oracle数据仓库解决方案主要包括Oracle Express和Oracle Discoverer两个部分; Sybase提供的数据仓库解决方案称为Warehouse Studio,包括数据仓库的建模、数据抽取与转换、数据存储与管理、元数据管理以及可视化数据分析等工具。Microsoft SQL Server 是一个全面的、集成的、端到端的数据解决方案,可以支持TB级的数据仓库,它为企业中的用户提供了一个安全、可靠和高效的平台用于企业数据管理和商业智能应用。

企业数据仓库的发展趋势

数据仓库已经被企业所采用已有十多年的时间,其中的成功或失败都为许多企业提供了宝贵经验。随着数据仓库使用者日益成熟,人们对数据仓库的期望也不断提高。许多企业以运用业界最佳实例与先进的技术为基础,开始重整其数据仓库,因此逐渐迈入了部署第二代数据仓库(动态数据仓库)的时期。数据仓库已从后端的策略性决策支持系统,变为整个企业运营的一个关键组件。

第一代“数据仓库”通常是部门级的数据集市,它仅能支持来自特定部门的有限查询,容易导致信息重复、各数据集市的信息不一致、无法解答企业层的问题,更不用提支持所有分散系统所需的高额成本。然而,那些已将数据集市整合至集中数据仓库的公司,则已开始体验到整合数据集中所带来的优势,以及以前不可能达到的业务成果。

实现客户关系管理(CRM)与数据仓库之间的整合便是其中一例。成功的CRM必须是基于对企业当前的、历史性的及数据统计详细资料的整合的分析,即必须是以数据仓库为基础。动态数据仓库包含了操作系统的整合分析,以制定最佳的战术和策略性决策为目的。采用数据仓库的企业正积极导入动态数据仓库,以提高工作效率,使其数据仓库的投资回报率达到最高,为其客户提供更佳的服务,并改善整体的业务。

链接:数据仓库的含义及特征

数据仓库,英文名称为Data Warehouse,可简写为DW。数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。因此它的特征如下:

面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。

集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。