首页 > 范文大全 > 正文

面向移动GIS的图属联动检索方法研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇面向移动GIS的图属联动检索方法研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】针对移动gis中存在的图形和属性联动检索效率低的问题,提出了一种基于全文检索和地理编码技术的图属联动检索方法。首先介绍了全文检索技术,对其发展以及优缺点进行了简单概括;继而在分析全文检索无法直接应用于移动GIS空间数据搜索基础上,提出了一种基于地理编码的空间数据全文检索方法;最后应用Visual C# 2008结合SQL Mobile数据库在智能手机上对本文方法进行了实验验证。

【关键词】全文检索;地理编码;移动GIS

Abstract: We introduced the concept and developing situation of full-text retrieval technology, analyzed the search engine mechanism of full-text retrieval technology in this paper. Based on full-text retrieval technology and geocoding technology, a new retrieval method of mobile GIS oriented for spatial data is proposed in this paper. Finally, we developed a full-text retrieval system on mobile phone for spatial data to validate the correctness and reliability.

Key words: Full text retrieval; Geocoding; Mobile GIS

中图分类号:TN919.3+1文献标识码:文章编号:

1.引言

日新月异的计算机科学为地理信息系统的发展带来了无穷的活力。随着微电子技术、光电子技术的发展,计算机发展已经进入移动时代,以智能手机为代表的移动式计算系统日益普及。随着智能手机和移动GIS的发展,移动电子地图信息愈来愈多,这些信息大致可分为两类:结构化数据和非结构化数据,结构化数据指的是诸如测绘部门生产数据、各要素数据等,非结构化数据则是一些文本数据、图像视频等多媒体数据等。据统计,非结构化数据占有整个信息量的80%以上。对于结构化数据,用RDBMS(关系数据库管理系统)技术来管理是目前最好的一种方式[1][2]。但是由于RDBMS自身底层结构的缘故使得它管理非结构化数据显得有些先天不足,特别是其查询速度较慢。因此,如何高效的存储和查询非结构数据,是一个值得研究的问题。这其中以全文检索技术成为国内外学者的研究的热点[3][4][5]。

移动电子信息中隐含地包含了大量的空间信息,如地名等。GIS所管理空间对象的信息通常由两部分所组成,一部分是图形对象的位置信息,另一部分是图形对象的属性信息。随着信息技术的发展,迫切需要同时管理空间对象的图形位置信息和描述对象的属性信息,目前的全文检索技术并不具备这种GIS数据检索能力。如何有效的利用这些空间信息直接定位到信息实体,增强检索效率,使得移动GIS系统能同时具备全文检索能力和图属联动检索能力,是目前空间信息检索领域面临的一个重要问题。本文旨在将GIS技术引入全文检索,实现空间数据中属性信息的全文检索并将结果映射到地图上。

2.全文检索

2.1 全文检索简介

全文检索技术是20世纪50年代末产生的一种新的信息检索技术。其是以各类数据,诸如文字、声音、图像等为处理对象,提供按照数据资料的内容而不是外在特征来实现的信息检索手段。它能提供快捷的数据管理工具和强大的数据查询手段,快速帮助人们进行大量文档资料的整理和管理工作。并使人们能够快速方便地查到他们想要的任何信息。它的基本工作方式是能够将所有包含检索词的文献检索出来, 不管这个词出现在文献的什么位置, 或者说文献中的任意一个词都可以作为检索到该文献的条件。全文检索提供存取全文文本(指原始记录)的空间,文本中任何字符和字符串均可作为检索的入口点, 全文检索是以原始记录中的检索词、字间的特定位置为对象的运算,对文献不作标引,故没有标引用词。因此,全文检索是一种可以不依赖叙词表而直接使用自由词的检索方法。全文检索技术以其易用和实用性,成为包括中文在内信息领域的基本技术,目前,全文检索系统也已成为新一代管理信息系统的代名词。以全文检索为核心技术的搜索引擎也已成为网络时代的主流技术之一。

2.2 全文检索技术的特点

从基本概念、实现条件中可以看出,全文检索技术具有主题词检索不可比拟的灵活、简便的优势,另外,由于自然语言缺乏规范的固有特点,也存在误检现象多的缺陷。

(1)全文检索技术的优点

全文检索技术具有直接客观性,它提供存取全文文本的空间,能直接检查原始文献或解决问题所需要的文献资料,不必进行二次检。全文检索技术具有详尽彻底性,可对文中任何字、词、句进行检索,还可表示检索词间的复杂位置关系,文献的正文部分或附属部分都可以检索和显示。

全文检索的广泛适用性,体现在能处理结构化和非结构化的各类文本数据,能够采集各种来源文本,这些来源可能是跨越广泛地理分布的,也可以是不同介质、不同格式产生的文本。全文检索具有对检索出的文本进行处理的能力,允许使用任意词乃至词的片段,并从文本中进行匹配查找,查出文本中全部与检索用词形式相同之处。

(2)全文检索技术的欠缺

词语与概念之间存在着多对多的关系,即:一个词语可以表达多个概念,同时一个概念也可以用多个不同的词来表达。自然语言的这种情况给基于关键词的信息检索造成了一定的困难。基于关键词的全文检索是以文档中有没有检索要求中的关键词,而不是以检索词所表达的意思来召回结果的。从这个角度讲,全文检索可能会造成大量的漏检。全文检索系统不适应于学科或专业的分类检索要求及某一特类检索要求;越是被论述得多的事物,越难在全文检索系统中得到满意的检索结果。有较多同义词、准同义词的检索对象,由于检索对象的用词不定型,以及遇“一词多义”、“词义含糊”、不普遍使用的缩略词、词的嵌套等情况,都会或多或少影响其检索效率。

2.3 全文检索过程

全文检索的过程如下:

(1) 首先构建一个文本库,这个文本库用来保存用户可能检索的信息,在这些信息的基础上确定检索系统中的文本模型。文本模型就是被系统认可的一种信息格式,一旦确定之后,不应对其再进行大的变动。

(2) 建立索引,索引可以大大提高信息检索的速度。采用何种方式取决于检索系统的规模,大型的检索系统通常采用倒排的方式来建立索引。

(3) 索引建立之后,就可以开始进行搜索。通常由用户提交请求,请求分析后,然后利用文本操作进行多关键字处理。

(4) 对结果进行过滤和排序,再将过滤排序后的结果返回给用户。

全文检索实现流程图如1图所示:

图1 全文检索实现流程图

3.空间数据全文检索

本文所指空间数据全文检索指的是将全文检索与GIS一体化,在提高一般文本信息的同时,增强对包含空间信息的文本的检索能力。其包括两个层面。第一个层面是数据层面,全文检索的文档数据表和GIS的空间数据表同时存储于同一个关系数据库之中,且相互直接操作对方的数据表;第二个层面是功能层面,即将文档中隐含的地理空间信息,如地名等,显示地赋给确定的空间位置信息,本文通过地理编码技术使得属性数据与空间数据相关联,实现文档数据的GIS功能,进而完成GIS空间数据的全文检索。