首页 > 范文大全 > 正文

数据仓库在银行信息化中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇数据仓库在银行信息化中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:随着我国金融行业的快速发展,传统的金融信息系统已经无法满足银行在经营过程中的各种需求。因此众多银行开始构建数据仓库,并基于此技术进行业务运作、经营管理、客户关系管理、银行产品推广等各种分析,在激烈的竞争中掌握主动、获得更大的发展空间。

关键词:数据仓库;银行信息化;应用

中图分类号:TP311.13 文献标识码:A 文章编号:1007-9599 (2012) 17-0000-02

1 引言

近些年我国经济取得了快速的发展,金融信息化程度也随之得以大幅的提升。金融行业是我国国民经济的重要组成部分之一,也是市场经济的核心行业,因此重点发展金融信息化、提高金融信息化水平是我国信息化战略中一项不能或缺的内容。金融信息化的发展促进金融市场逐步联合成一个整体,大大提高了各类相关信息的收集、处理和从而提高金融企业的竞争能力。

2 数据仓库的设计要求

传统的金融信息管理系统大多采用c/s结构,客户直接访问生产数据库,完成信息的查询、更新、管理。但这就存在很多缺陷,例如系统安全性不够、系统仅仅是信息的存储容器而无法达到分析预测的高度等等。随着数据库的发展以及数据仓库技术的出现,越来越多的金融企业开始构建自己的数据仓库。

与传统的金融信息管理系统不同的是,基于数据仓库技术构建的系统不仅保留了原有系统的各种业务功能,同时在金融结构多年累积的数据的基础上,进一步加强信息查询分析预测以及报表的功能,使用户数据得以最大的利用。数据仓库的设计应满足如下一些要求:

3 建立数据仓库的基础

目前投入使用的金融信息管理系统大部分是基于关系数据库(Relational Database Service,RDS)技术,因为关系数据库起步较早,发展较成熟,使用复杂性较低。关系型数据库是构建数据仓库的基础,但仅仅是使用关系数据库也不能完全构建符合用户需求的数据仓库,还需要使用其他的数据库技术,例如,优化查询、位图索引、动态分区等,在大型数据仓库应用环境中,通过上述几项技术使关系数据库管理系统的性能极大的优化和提升。

4 建立数据仓库的过程

基于用户的需求构建数据仓库,通常由以下三个步骤组成:设计、数据抽取、数据管理。

4.1 数据仓库设计。系统设计师基于用户的需求和企业的数据设计数据仓库的结构。常用的结构包括星型模型和雪花模型,在星型模型中事实表居中,多个维表分布在事实表周围与其连接。在星型模型的基础上发展出雪花模型。具体的构建过程包括如下三个部分:

(1)确定用户数据库涉及的各个数据源的细节,这些细节包括使用数据源的方式、用户数据结构、数据更新频率、数据拥有者等。(2)确定从用户数据源抽取数据的方式。设计师需要制定计划如何从各个用户数据源抽取数据,并对数据进行恰当的格式转换并储存在当前库。(3)设计师应该将用户数据细分成数个业务主题,并基于这些业务主题构建业务主题表。这些业务主题表就是基于用户数据的数据子集,即数据集市(DataMart)。一般来说,数据集市往往针对部分用户数据(例如某一部门的用户数据、某一类特定产品的等),因此,它的规模通常较小,开发成本较低,开发周期较短。在实际的数据仓库构建过程中,设计师通常首先基于用户核心数据构建若干个数据集市,在基于数据集市构建企业级数据仓库。

4.2 数据抽取模块。再完成数据仓库的设计后,需要构建数据抽取模块。数据抽取模块基于之前设计的数据抽取规则对各类数据源(包括各类数据库、文本数据、各类用户知识库等)中的数据进行转换、清洗并储存到目标库中。在从数据源转换和清洗数据时,通常需要将数据先暂存为一个中间模式,并将数据存储在数据库临时区,这样是为了保证数据的安全性以及一致性。举例来说,存在两个存储人员基本信息的数据源,在确定数据源中人员的某些属性编码时,可能采用完全不同的编码形式。例如一个是整型、另一个是字符型。在确定人员性别这属性的编码时,可以采用2字节长度字符型,其中存贮的值为中文“男”和“女”,也可以采用1字节长度字符型,其中存贮的值为“M”和“F"。这两个数据源使用的这两种数据编码表达的内容是一致的,但这两个数据源对目标数据来说,这些数据必须被转换成一种统一的数据表述方法,并且由用户进行确认,这样才能保证数据源的质量。因此设计师需要基于用户的需求才能实现用户数据的统一。较早的技术,开发人员使用程序生成器和建立手工规则的方式来抽取数据,随着技术的进步目前市场上出现的专业的抽取工具,如SAS的数据仓库产品SAS/WA (Warehouse Administrator)、Ardent公司的Infomoter产品。

4.3 数据维护模块。数据维护模块主要由元数据维护和目标数据维护两个部分组成。其中目标数据维护基于元数据库,并根据设计师制定的更新频率,更新数据等策略去更新数据仓库。这些操作都与时间高度相关,反映了用户数据源的数据变化。更新操作包括两个类型:一、生成一个新的时间集合数据,因为数据仓库中的数据与汇总数据有关系,必需全部汇总,这样才能确保信息的一致性;二、在数据仓库的数据表中进行部分数据的更新。

5 数据仓库在金融信息系统的应用

数据仓库体建设属于企业的基础信息建设,一般建立了稳定的数据仓库体系才能支撑各种企业级的数据方面的应用。在我国的银行业,数据仓库技术应用非常普遍,基本上涉及银行业务运作、经营管理等等各方面。以下就举例一些基础的应用:

5.1 银行收入与经营成本分析。随着外资银行、小额贷款公司等各种金融企业进入市场,银行业面临越来越大的竞争和挑战。银行作为金融企业,运作的核心目标之一毫无疑问是获取最大的经济效益,当然在此之余还应兼顾客户服务和社会效益等各方面。收入与经营成本分析就是对银行企业的各种日常经济活动进行成本核算,分析相应的业务收入(中间业务收入、存贷款利息差、其他收益)与各种费用(税收、管理费用、业务成本、其他支出)之间的收支差额,分析经营情况的情况,得到相应的经营方针,从而减少企业开支,降低运营成本、提高经营收入。

5.2 银行卡用卡行为分析。信用卡市场也是银行也竞争非常激烈的领域,许多银行为了扩展市场往往投放了大量的信用卡,这也必然导致了市场中大量“睡眠卡”的存在,这些“睡眠卡”浪费银行的资源提高了经验成本。基于数据仓库技术,银行可以对自身客户的金融交易数据进行关联分析,从而产生信用卡客户的分类,从消费周期、消费能力、消费习惯等各个方面对客户金融消费行为进行分析预测,这样就能分析出哪些用户具有较强的消费能力,具有成为信用卡大客户的资质,基于这些分析结果,银行可以针对性地提供一些贵宾服务。对于那些长期不使用信用卡的客户,可以定期邮寄一些优惠措施,这样可以提高银行客户的信用卡消费的热情,从而改善大量“睡眠卡”的问题。

5.3 优惠预测仿真。银行往往会定期推出一些银行卡的优惠措施,以此鼓励客户更多的使用银行卡,增加银行卡消费额。这些优惠策略方便了持卡客户的使用,同时也增加了银行的利润额。银行固然可以通过银行卡的优惠拓展市场,但优惠策略设置不恰当,其结果很可能会适得其反。利用数据仓库基于历史数据建立优惠消费模型,在此模型基础上进行优惠措施的仿真,其仿真结果能够提示当前制定的优惠策略的效果,并可按情况进行优化和调整,使促销优惠策略取得预期的成效。

参考文献:

[1]李嶶,李宛州.基于数据仓库技术的进销存系统的设计与实现.2001(10):93-94.

[2]W.H.Inmon.数据仓库.机械工业出版社2000,5.

[3]林字等编著.数据仓库原理与实践.北京:人民邮电出版社,2003.

[4]陈京民等.数据仓库与数据挖掘技术[M].北京:电子工业出版社,2002.

[作者简介]

吴建(1978-),男,浙江省杭州市人,中级职称,硕士学位,主要研究方向为软件工程与数据库。