首页 > 范文大全 > 正文

空间数据仓库浅析

开篇:润墨网以专业的文秘视角,为您筛选了一篇空间数据仓库浅析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:空间数据仓库是GIS与数据仓库结合的产物。将数据仓库引入GIS中,以便可以利用数据仓库来管理海量的空间数据及更方便的提取信息。本文首先对空间数据仓库进行了概述,接着介绍了空间数据仓库的特征、体系结构、元数据管理等知识,最后,对空间数据仓库的空间维及时间维及开发空间数据仓库应注意的问题进行的讨论。

关键词:空间数据仓库,元数据, 空间维, 时间维

中图分类号:C37 文献标识码:A 文章编号:

空间数据仓库技术概述

空间数据仓库是GIS与数据仓库结合的产物。在数据仓库基础上引入空间数据,根据主题从不同的GIS应用系统中截取从瞬态到区段、从局部到全球系统的不同规模时空尺度上的信息,具有面向主题性与集成性、进行数据变换与增值等特性,为地学研究以及有关环境资源政策的制定提供最好的信息服务。空间数据仓库就是实现对分散的、各自独立的现有多种地理空间数据库管理系统统一集成和管理,形成用户获取测绘数字产品的统一模式、界面和标准,然后按照相应的主题查询数据仓库得到多种测绘数字产品,再根据用户需要通过各种专业模型关联多种专题信息,从多维角度进行分析,满足用户空间辅助决策分析信息的需求。空间数据仓库对于决策用户来说是透明的,用户无需了解系统的内部结构及数据的来源和组织方式,只需要通过空间数据仓库提供的统一界面,进行面向主题的信息查询和分析。

空间数据仓库特征

随着信息技术的飞速发展和企业界新需求的不断提出,以面向事务处理为主的空间数据库系统已不能满足需要,信息系统开始从管理转向决策处理,空间数据仓库就是为满足这种新的需求而提出的空间信息集成方案,它有四个特点:

(1)主题与面向主题。与传统空间数据库面向应用进行数据组织的特点相对应,空间数据仓库中的数据是面向主题进行数据组织的。它在较高层次上将企业信息系统中的数据进行综合、归类并加以抽象地分析利用。

(2)集成的数据。空间数据仓库的数据是从原有的空间数据库数据中抽取来的。因此在数据进入空间数据仓库之前,必然要经过统一与综合,这一步是空间数据仓库建设中最关键、最复杂的一步,所要完成的工作包括消除源数据中的不一致性和进行数据综合计算。

(3)数据是持久的。空间数据仓库中的数据主要供决策分析之用,所涉及的数据操作主要是数据查询,一般情况下并不进行修改操作。空间数据仓库的数据反映的是一段相当长的时间内的数据内容,是不同时间的空间数据库快照的集合和基于这些快照进行统计、综合和重组、导出的数据,而不是联机处理的数据。空间数据库中进行联机处理的数据经过集成输入到空间数据仓库中,一旦空间数据仓库存放的数据已经超过空间数据仓库的数据存储期限,这些数据将从空间数据仓库中删去。

(4)数据是随时间不断变化的。空间数据仓库的数据是随时间的变化不断变化的,它会不断增加新的数据内容,不断删去旧的数据内容,不断对数据按时间段进行综合。

1.2空间数据仓库体系结构

空间数据仓库是储存、管理空间数据的一种组织形式,其物理实质仍是计算机存储数据的系统,只是由于使用目的的不同,其存储的数据在量和质及其前端分析工具与传统GIS应用系统不同。空间数据仓库按照功能分为以下几个部分:

(1)源数据。空间数据仓库为了支持高层次的决策分析需要大量的数据。这些数据可能分布在不同的已有的应用中、存储在不同的平台和数据库中。

(2)转换工具。为了优化空间数据仓库的分析性能,源数据必须经过变换以最适宜的形式进人空间数据仓库。变换主要包括:提炼、转换、空间转换。数据提炼主要指数据的抽取如数据项的重构、删去不需要的运行信息、字段值的解码和翻译、补充缺漏的信息、检查数据的完整性和相容性等。数据转换主要指统一数据编码和数据结构、给数据加土时间标志、根据需要对数据集进行各种运算以及语义转换等。空问转换主要指空间坐标和比例尺的统一、赋予一般数据空间属性。数据转换工具为数据库和空间数据仓库之间架起了一座桥梁,使源数据得到统一和增殖,最大限度的满足空间数据仓库高层次决策分析的需要。元数据是数据仓库的核心,它是关于数据的数据,定义了数据的存储模型和数据结构以及转换规则和控制信息等。

(3)空间数据仓库。源数据经过变换进入空间数据仓库。空间数据仓库以多维方式来组织数据和显示数据。维是人们观察现实世界的角度,但多维数据库中的维并不是随意定义的,它是一种高层次的类型划分。为了获得较高的系统性能,维屏蔽掉了许多原始数据,决策分析所需的综合数据预先已被统计出来放在其中。空间维和时间维是空间数据仓库反映现实世界动态变化的基础,空间数据仓库的数据组织方式是整个空间数据仓库技术的关键。在实际分析过程中,可按需要把任一维与其它维进行组合,以多维方式显示数据,供人们从不同角度多方位认识世界。空间数据仓库的数据组织方式可分为基于关系表的存储方式和多维数据库存储方式。空间维数据的具体表现形式为空间对象的名称和指向空间对象的指针。空间数据仓库的大多数计算分析主要集中于空间多边形的融合和分离。空间数据仓库的目标是提供决策支持,它不仅需要一般的GIS查询和分析工具,更需要功能强大的分析工具,它是空间数据仓库的重要组成部分。客户端分析工具按照功能可以划分为查询型、验证型、挖掘型,主要采用旋转、嵌套、切片、钻取和高维可视化分析技术,以多维视图的形式展现给用户,使用户能直观地理解、分析数据 进行决策支持。

空间数据仓库中的元数据管理

元数据是联系数据仓库各部分的纽带,其内容反映数据仓库存储的数据内容及其与数据源之间的关系。通过元数据库,数据管理员可以实现对数据仓库的全面管理维护,终端用户可以对仓库数据的内容有一个系统的了解。在系统环境中,元数据几乎代表了整个数据仓库系统的逻辑结构,数据仓库中元数据的作用主要有以下五个方面

把数据源系统映射到数据仓库中的表;

记录关于数据抽取、转换和装载的过程的信息;

记录数据整理(包括数据更新、转存等操作)的有关信息,如时间安排等;

有助于业务用户正确识别数据仓库中的数据;

有助于用户组织自己的查询,以获得所需的数据。

数据仓库系统中的元数据机制主要支持的系统管理功能有:描述哪些数据在数据仓库中、定义要进入数据仓库中的数据、从数据仓库中产生的数据、记录根据业务事件发生而随之进行的数据抽取工作时间安排、记录并检测系统数据一致性的要求和执行情况及衡量数据质量。

元数据查询是元数据软件的基本功能,也是数据仓库功能实现的基本环节,对于元数据查询,FGDC定义了元数据最小查询集,即由What、Where、When、Who、Why和 How 等六部分组成(表),每一部分又详细定义了一个查询项所必须的内容。元数据查询用到全局索引和本地索引,其中全局索引负责站点的管理,解决搜索算法中如何快速找出与要查询数据相关的站点的问题以及加入站点的方便性问题。本地索引是对本地单个元数据库中各个类型的元数据按照最小查询集内容进行的索引。这里的站点是指单台计算机上的单个元数据库,一个站点应包括其含有的所有元数据对象以及站点本身的信息。

空间数据仓库的空间维与时间维

空间数据仓库处理的数据都是与地球有关的,都是三维连续分布的,但是由于空间数据仓库理论还不成熟及三维基础上的数据量很大,建立高效的,易于实现的三维数据模型是很难实现的,就当前在空间数据仓库所采用的数据模型有:(1)2.5DGIS 把高程仅作为一个属性值;(2)准-3DGIS 指在DTM之上叠加地面建筑设施的3D造型,如CSG模型、TEN模型,通常两者是分离的;而准3DGMS则是基于面元够模;(3)真-3DGIS,则是将3D空间坐标(x,y,z)作为独立参数进行空间实体对象的几何建模,其数学表示为:F=f(x,y,z);且必须采用3D矢量建模或3D体元构模方式。