首页 > 范文大全 > 正文

图形形状特征提取前的重要工作

开篇:润墨网以专业的文秘视角,为您筛选了一篇图形形状特征提取前的重要工作范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:在阐明图形概念的基础上,研究并改进了图形形状特征提取前的重要工作,包括:提出了适合将特定图象二值化为图形的方法,实现了自动判断图形前景颜色的方法,提出了图形的简单分类体系并实现了自动分类。

关键词:图形;二值化;前景;分类

中图分类号:TP393 文献标识码:A文章编号:1009-3044(2007)16-31115-02

The Important Works Before Abstracting Graphics’ Characteristic of Shape

LIU Qing,MENG Xiang-zeng,JI Cui-ping

(Shandong normal university,Jinnan 250014,China)

Abstract: Based on expounding the graphics concept, this thesis studies and develops the important works before abstracting graphics’ feature of shape, including proposing the method of changing specific image into graphics by binaryzation, achieving the method of determining the foreground color of graphics automatically, proposing the simple classification system of graphics and achieving automatic classification.

Key words:graphics;binaryzation;foreground;classification

1 图形的概念

图象的特征提取是图象处理领域的一个重要内容,目前的研究主要是低层视觉特征的提取。形状作为图象低层视觉特征之一,较颜色和纹理等更接近人的知觉和语义,但描述也更为复杂。在提取形状特征的实验中所使用的图象具有以下特点:黑白二值图象以便于背景和前景分离,前景由一条或多条封闭的边界曲线及其内部区域组成,形状特征明显且为最主要低层视觉特征。这一点体现在文献中的例图以及各形状测试图库中,我们称这类图象为图形,如图1。也就是说,这里所定义的图形属于位图,研究领域属于图象处理而非计算机图形学。

图1 图形示例

目前,在形状特征研究领域,广大的研究者大都把目光集中在形状特征提取及基于形状特征的图形识别、匹配、检索等方面,这些也无疑是该领域最重要的研究内容。在进行这些研究之前的工作往往被忽视,但这些工作也很重要,它们包括:图象二值化为图形、自动判定图形前景颜色和图形分类。在接下来的部分,将一一阐述我们在这三方面所做的研究。

2 图象二值化为图形的方法

图形的一个重要特点就是黑白二值图象,已存在的形状测试图库虽然都是二值图象,较著名的有MPEG-7 contour shape database Set B 、MPEG-7 region shape database、Foliage、F. Mokhtarian fish database等,但它们为数不多且难以找到。当研究者找不到合适的、足够的图库时,就不得不面对图象二值化的问题。

图象二值化的关键是阈值的选取,经典的方法主要有灰度直方图法、微分直方图法[1]、最大熵法[2]、最小模糊度法[3],近些年很多学者提出了一些改进的方法,但没有哪种通用的方法可以让所有图象的二值化结果都理想,针对一类的图象往往采用特定的方法。我们针对用来获得图形的图象的特点,提出了一种简单有效的方法,取得了良好的实验结果。首先,我们人为的选择背景单一或背景颜色相差很小的那些图象来二值化,然后将彩色图象变为灰度图象后执行二值化。二值化算法思想如下:图象的边框处多为背景,据此取第m行m列点的颜色值及其上下n个值的区域为背景颜色的范围,将背景颜色范围内的点置1即白色,否则为0即黑色,最后将二值化后的图象中极小的连通区域视为噪声置1。第m行m列点容易受噪声影响,可在边框2*m个像素宽度内求灰度均值及此均值上下n个值的区域为背景颜色的范围。我们取m=5,n=12,对1000幅图象进行二值化,采用第m行m列点的方式,正确率达90.2%;采用边框2*m宽度内均值的方式,正确率达94.6%。我们将此方法命名为边框二值化法,此方法简单有效,但只适用于背景颜色较单一和前背景颜色相差较大的情况。

3 自动判定图形前景颜色

图形有的以黑色为前景,有的则以白色为前景,还有一些图形难以确定谁为前景合适,如图2。为了对图形进行后续处理,需要判定其前景颜色。目前研究者一般在选择图库时就人为的统一采用黑色或白色为前景的图形,从而忽略掉判定图形前景颜色的环节。我们提出了让程序自动判断图形前景颜色的方法。

(a)前景为黑色;(b)前景为黑色;(c)前景不好确定

图2 不同前景示例

方法一:图形中黑色和白色,较少的颜色为前景。方法二:图形边框k(k=10)个像素宽度内黑色和白色,较少的颜色为前景。图库中的图形多以黑色为前景,根据我们的边框二值化方法得到的图形也是黑色为前景,所以当黑白相当时,选择黑色为图形前景。对于前景色为白色的,进行反色,以保证前景色为黑色,方便以后的图形描述。我们对MPEG-7 contour shape database Set B中的1400幅图形,其中黑白前景各占一半,利用以上两种方法分别进行实验,实验结果用查全率和查准率表示。其定义用公式表示如下[4]:

准确率(Precision)=正确识别的图像数/应正确识别的图像数

正确率(Accuracy)=正确识别的图像数/所有识别出的图像数

实验结果为查全率分别是81.42%、98.57%,查准率分别是81.46、98.59%。

那些前景判断错误的图形,是由于其主体所占面积比例过大。这里我们选择方法二来求整幅图形前景,因为它既简单正确率又高。

对于主体既有黑色又有白色的图形,也可能主体中背景颜色所表达的形状才是真正的中心,所以要对主体进一步分析。我们认为,如果主体中背景颜色面积占主体面积的四分之一以上,则表示主体中背景颜色所代表的图形有分析的必要。将图形主体中背景的颜色置黑,其它全部置白,得到新的图形。这样对这幅图形的描述,就要添加上新图形的描述部分。图2(a)就是图2(c)的新图形,对图2(c)的描述除了要描述其白色部分的形状特征外,还要加上图2(a)黑色部分的形状特征。

4 图形分类

我们认为,图形根据对象数可分为多对象图形和单对象图形,单对象图形再根据欧拉数可分为实体单对象图形和空心单对象图形(见图3)。图形分类的意义主要体现的两个方面。一是在图形形状描述时,多对象图形主要研究其拓扑结构及将图形分离为多个单对象图形后的分别描述,而实体单对象图形适合基于轮廓的形状描述,空心单对象图形更适合基于区域的形状描述。二是在图形检索时,用户可以直接选择需要检索哪类图形,以提高检索效果。

图3 图形分类

我们实现了程序自动进行图形分类,无需再人为的分类。算法:首先,计算图形对象数,一个对象被定义为一个较大的连通区域,若对象数为1则为单对象图形,对象数大于1则为多对象图形。然后计算图形的欧拉数,欧拉数定义为连通区域数减孔洞数,欧拉数为1为实心单对象图形,欧拉数小于等于0为空心单对象图形。

我们随机选择了120幅图形进行分类实验,其中多对象图形、实心单对象图形、空心单对象图形各40幅。对象数=连通区域数-小连通区域数。小连通区域的面积小于最大连通面积0.1倍。多对象图形、实体单对象图形和空心单对象图形的查全率分别为95%、97.5%和92.5%,查准率分别为92.68%、97.5%、94.87%。

我们在知觉上定义一个对象是根据语义上的一个物体,而不是一个较大的连通区域,所以在分类时会出现错误。

5 结论

实验表明,特定图像二值化为图形、自动判断图形前景颜色和自动对图形分类均取得到了良好的效果。这些前期处理工作,为下一步的图形形状描述、匹配和检索,做好了必要的准备。

参考文献:

[1]Weszka J S. Survey of threshold selection techniques[J]. Vision Graphic Image Process, 1978:259-265.

[2]吴谨,李娟,刘成云等.基于最大熵的灰度阈值选取方法[J].武汉科技大学学报(自然学科版),2004,(1):58-60.

[3]Deluca A, Termini S. A definition of a non-probabilistic entropy in the set-ting of fuzzy set theory[J]. Int Control, 1972:301-312.

[4]何强,何英.MATLAB扩展编程[M].清华大学出版社.2002.6: 293-300.

注:“本文中所涉及到的图表、公式注解等形式请以PDF格式阅读原文。”