首页 > 范文大全 > 正文

二值图像轮廓局部描述和检索方法

开篇:润墨网以专业的文秘视角,为您筛选了一篇二值图像轮廓局部描述和检索方法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:提出了一种针对二值图像的基于轮廓分解和局部描述检索策略。首先从二值图像中提取物体轮廓,采用特定的方法对轮廓进行分解,得到轮廓的参考点集。求取每一个参考点的对应弧线段,构造从参考点指向对应弧线上各点的向量集合。对向量集合进行Fourier变换,得到Fourier系数可以作为该参考点的特征向量,从而原图像就被表示为特征空间中的特征点集。最后,采用点匹配的方法来计算图像之间的距离,实现二值图像的检索。实验结果表明,与目前已有的方法相比该方法具有较高的检索精度。

关键词:轮廓分解;局部描述;Fourier变换;点匹配

中图分类号: TP391

文献标志码:A

Local description and retrieval method for binary image contour

YANG Xiaodong,WU Lingda,XIE Yuxiang,YANG Zheng,ZHOU Wen

College of Information System and Management, National University of Defense Technology, Changsha Hunan 410073, China

)

Abstract: This paper proposed a strategy for retrieving binary images based on contour decomposition and local description. Firstly, the contour of object was extracted from binary image and decomposed by special method, and then the set of reference points were acquired. For each reference point, the curve to which the point corresponds was gained. A set of vectors which connect the reference point to all the points in the curve were computed. After that, Fourier transform was applied to the set of vectors and Fourier coefficients were treated as the eigenvector of the reference point. As a result, the image could be represented by a set of feature vectors in feature space. Finally, the distance between two images could be calculated by the method of points matching and the retrieval of binary images could be implemented. Experiments show that this method has higher retrieval precision, compared with some classical methods.

Key words: contour decomposition; local description; Fourier transform; points matching

0 引言

面对着海量的图像数据,如何从中检索出用户感兴趣的图像是一个值得深入研究的问题。以往通过人工标注,使用关键词进行检索的方法已经不能适应技术的发展。于是研究人员提出了基于内容的图像检索技术(ContentBased Image Retrieval,CBIR)。CBIR技术提取输入图像的颜色,纹理和形状等底层特征,到图像数据库中检索出与其相似的图像并反馈给用户实现图像的检索。

形状是CBIR中所用到的一类重要特征,基于形状的图像检索是CBIR的一个重要分支。在基于形状的图像检索中,物体形状的表示和描述是一个核心问题。由于客观世界的复杂多样,物体的形状也是千差万别。目前较普遍的做法都是把形状作为一个整体来进行描述,文献[1]中将对物体轮廓进行随机采样得到采样点集,计算点之间的向量,使用一个包含了长度和角度的直方图来表示物体的形状。文献[2]中把物体轮廓上的每个点的坐标视为一个向量,遍历轮廓一周得到向量集合,对该集合进行变换,用变换得到的特征向量来表示物体的形状。在这些方法中,图像的相似度都是通过直接计算直方图或者特征向量的距离而得到的。上述对形状的描述方法可以从整体上分析形状的特点,计算简单。然而,全局描述方法对局部的描述并不充分。对于发生形变的物体,与形变前相比其整体相似度可能有差异,但在某些局部相似度仍然很高;对于有部分缺失或者被遮挡的物体,与原物体在全局形状上有变化,但对保留下来的部分来说依然很相似。所以在进行形状分析时,不但要考虑全局的相似性,还要考虑局部的相似性[3]。

考虑到现有方法中存在的这些不足,本文提出了一种基于轮廓分解和局部描述的图像特征提取和检索方法。

图片

图1 应用轮廓局部描述的图像检索流程

图1描述了本文算法的总体流程:①对二值图像进行简单的预处理,然后提取图像中物体的轮廓;②轮廓分解,将分解点作为参考点并求出每个参考点对应的弧线段;③计算参考点到其对应弧线段上各点的向量,对该向量集进行Fourier变换得到参考点的特征向量;④采用点匹配的方法计算输入图像参考点集与图像库中各个图像的参考点集之间的距离,实现二值图像的检索。

1 轮廓的分解及参考点的求取

二值图像中物体已经从背景中分离出来,可以直接对图像进行轮廓提取。与物体的整个形状区域相比,轮廓表示简单,计算量较小,便于进行变换域的处理。为了对轮廓的局部进行描述,必须将轮廓分解,通过计算轮廓的最小惯量轴可以得到轮廓分解的起始点。最小惯量轴定义为这样一条直线,其到物体轮廓上各个点的距离的平方的和最小。关于最小惯量轴的具体求法可以参考文献[4]。最小惯量轴与轮廓可能有多个交点,选择距离物体重心最近的交点作为轮廓分解的起始点。采用等间距的方法来对轮廓进行分解,也即从分解起始点开始,每隔相同的距离就在轮廓上取一个分解点。将得到的分解点都视为参考点,就得到了参考点集。所取的参考点的数目M是一个经验值,本文在实验中取参考点的数目为M=15。

2 参考点特征的计算

在得到轮廓的参考点集后,对每一个参考点都求取一段与之对应的弧线段。当这种对应关系确定后,基于每个参考点来计算与之对应的弧线段的特征,以此来作为该参考点的特征。下面将具体介绍参考点特征的计算方法。

┑1期 ┭钕东等:二值图像轮廓局部描述和检索方法

┆扑慊应用 ┑30卷

2.1 参考点的对应弧线段

孤立地考虑单个参考点本身并没有意义,较普遍的做法是考虑以其为中心的一个邻域或者是按照某种规则与之对应的一个集合。本文考虑的是与参考点对应的一段弧线段。

设当前参考点为C,计算物体轮廓在C点处的法线,该法线与轮廓可能有多个交点,本文选取距离参考点C最远的交点D。以D点为中心,以N/M(N为边缘点数,M为参考点数)为长度选取轮廓上的弧线段L,L就是与当前参考点C相对应的弧线段。图2显示了参考点C所对应的弧线段(图中C为当前参考点,D为法线与轮廓的远端交点,粗线部分为C所对应的弧线段L)。オ

图片

图2 Р慰嫉C及其对应的弧线段L

2.2 参考点的特征

У玫搅嘶∠叨L,如何对其进行描述并提取特征成为主要问题。受到文献[1,5]中相关算法思想的启示,在参考点和对应弧线段之间可以建立一个向量集,д飧鱿蛄考可以较详细地描述弧线段L。オ

设当前参考点为C,对应的弧线段为L,从C点向L的每个点引一个向量v=(x,y),将其表示为复数形式得到v=x+jy。这样可以得到包含了N/M个向量的向量集:オ

V(k)=xk+jyk; k=0,1,…,K-1(K=N/M)

为了获得便于比较的特征,对V(k)进行Fourier变换,如式(1)所示:

a(u)=∑K-1k=0V(k)e-j2πuk/K; u∈[0,K-1](1)

复系数a(u)称为弧线段L的Fourier形状描述子。为了使其具有平移,旋转和缩放不变性,需要对Fourier描述子进行归一化[6]。归一化的Fourier描述子b(u)定义为:

b(u)=a(u)a(1); u=1,2,…,K-1(2)

根据相关的文献和实验,没有必要采用全部复系数。只需要取前面P(0

3 参考点的匹配和轮廓距离的计算

设两幅图像A,B的参考点集分别为φA={ai,i=1,2,…,M},φB={bj, j=1,2,…,M},对于A中的某个参考点ai,在φB中找到与之相匹配的点,即距离最小的点。ai与φB的距离可以计算如下:オ

di=d(ai,φB)=┆minj d(ai,bj)(3)

设点a的特征向量V={vi,i=1,2,…,P},b的特征向量W={wi,i=1,2,…,P},那么式(3)中的d(a,b)就是计算V与W的欧氏距离,如式(4):オ

d(a,b)=∑Pi=1vi-wi2(4)

У钡玫A中的每一个参考点与φB的距离之后,两幅图像A,B的距离就为:オ

DAB=1M∑Mi=1di(5)

为了符合检索的习惯,计算出图像的距离之后对其进行归一化得到DAB′,г倮用式(6)将DAB′П涑赏枷竦南嗨贫泉SAB:

SAB=1-DAB′(6)

4 图像检索实验

为了检验本文提出的算法的可行性,本文设计了相关的实验来进行验证。实验用的图像库是MPEG7 Part B shapes[2],该库含有70类物体,每类有20幅图像,共1B400幅。选取其中的Apple和Bone两类来实验。同时,本文还实现了Fourier描述子[6]和几何矩法[7]与本文所提算法进行比较。

对所选的每一类图像,选择其中一幅作为输入在整个图库中检索与其相似的图像。按照图像相似度的降序排列展示给用户。对于检索结果,如果与输入图像是同一类,那么认为检索成功。构造每类查询结果表,以此来分析各种算法在检索中的表现。

图3(a)、(b)分别显示了Apple和Bone两类图像的检索结果。可以看出本文所提算法要全面优于几何矩法和Fourier描述子法。当返回结果较少时,各种方法的准确率都较高;随着返回结果的增加,所有算法的准确率都有所降低,但是相对于其他方法,本文算法还是保持了较高的准确率。

图片

图3 检索结果

5 结语

本文提出了一种基于轮廓分解和局部描述的特征提取和图像检索策略。该策略首先将轮廓分解并提取参考点,然后对每一个参考点求取其对应的弧线段,通过实验验证了这种对应关系的合理性,最后为每一个参考点提取了特征向量,进而实现二值图像的检索。与文献[1,6,7]中形状的整体描述方法相比,本文的方法考虑了形状的局部特性,在更加细致的层面上对形状进行了描述。从本文的实验结果可以看出,将轮廓进行分解并对局部进行描述是一种行之有效的方法,检索精度有所提高,能够达到较理想的检索效果。在今后的工作中还需要对一些方面进行思考和改进,比如考虑是否有更优的分解方法来对轮廓进行优化分解,对每一类轮廓找到一个最优的分解点数目。

参考文献:[1] BELONGIE S, MALIK J, PUZICHA J.Shape matching and object recognition using shape contexts[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(4):509-522.

[2] ATTALLA E, SIY P.Robust shape similarity retrieval based on contour segmentation polygonal multiresolution and elastic matching[J].Pattern Recognition,2005,38(2):2229-2241.

[3] PETRAKIS E G M, DIPLAROS A, MILIOS E. Matching and retrieval of distorted and occluded shapes using dynamic programming[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(11):1501-1516.

[4] TSAI D M, CHEN M F. Object recognition by a linear weight classifier[J].Pattern Recognition Letters,1995,16(1):591-600.

[5] 陈竹修.基于傅里叶变换的形状上下文描述方法[J].计算机应用与软件,2007,24(6):140-144.

[6] 王涛,刘文印,孙家广,等.傅里叶描述子识别物体的形状[J].计算机研究与发展,2002,39(12):1714-1719.

[7] HU M K. Visual pattern recognition by moments invariants[J]. IRE Transactions on Information Theory,1962,8(2):179-187.