手写体字符任意行分割算法设计(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇手写体字符任意行分割算法设计范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

摘要:“基于个人手写笔体的信息查找”这一全新理念的实现,既要求对于手写体汉字本身结构信息的把握,又对捕获单个字与周边文字之间相对位置信息的规律性提出了要求。而以往人们在“笔迹鉴别”等领域所做的工作都是针对行、列分布较规范的整段文字或整篇文章进行的,对于如今我们面临的空间分布极具任意性的个人手写笔记而言,昔日的经典算法仅仅具备一定意义上的参考价值,谋求一种适用性更强、能够对个人手写笔记字符进行准确分割的算法成为了正确查找信息的重要前提。本算法采用行、列同步扫描,交替确定字符边界从而极大程度上提升了字符分割的准确性。

关键词:手写笔体;信息查找;同步扫描;字符分割

中图分类号:TP311文献标志码:A文章编号:1009-3044(2010)22-6282-02

1 图像分割技术

图像分割是图像处理和前期视觉中的基本技术,是按照图像的某些特征(灰度级、频谱、纹理等)将图像空间划分成一些区域,在这些区域的内部,其特性是相同的或者是均匀的,两个相邻区域的特性则互不相同。图像分割是有图像处理转为图像分析的关键。一方面,它是目标图像表达的基础,对特定测量有重要影响。另一方面,图像分割也是图像的目标表达、特征提取和参数测量等分割所用的主要方法。[13-14] 对于一般复杂图像,图像分割较为复杂,比如Wang等[17]通过对生长区域进行分级,识别出由同一物体组成的整体区域,从而获得物体的轮廓,但是可能导致区域空洞的出现,但由于本系统在去除背景、对字符分割的这一特定条件下,处理过程相对较为简单。

到目前为止,所有的图像分割算法均是针对某具体问题而提出的,并没有一种可适用于任何图像的通用分割算法,这也可以从一个方面说明,为什么能研究出上千种方式各异的图像分割算法,而且每年都是上百种的速度在递增。尽管存在着数量庞大的各种图像分割方法,但均可以将其分割处理的特点归纳为以下几条:

1)分割产生的所有区域之和包括了原始图像中原有的所有像素,即分割把原始图像的每个像素都分到某个区域。

2)分割后的结果互不重叠,即原有像素不能同时分割到两个区域。

3)分割后的各个区域有其独有的特性,即同区域的像素具有某种共性。

4)分割后的不同区域具有不同的特性,分割后同一区域内任两像素在该区域内相互连通,即分割后的区域是一个连通组元。

2 图像分割途径

图像分割有三种不同的途径。

1)将各像素划归到相应物体或区域的像素聚类方法即区域法;

2)通过直接确定区域间的边界来实现分割的边界方法;

3)首先检测边缘像素再将边缘像素连接起来构成边界形成分割。字符分割是为了便于对单个字符进行进一步的单独处理。因为一般字符图像均能满足相邻文字行列间至少有一行或者一列全为背景象素这一条件。系统在读进来的图像中一般会含有多个字符,识别的时候只能根据每个字符的特征来进行判断,所以还要进行字符分割的工作。这一步工作就是把图像中的字符独立的分割出来。[15]

3 手写体字符任意行分割算法设计

3.1 系统提出

本系统提出的“基于个人手写笔体的信息查找”的概念是一个全新的概念,它既要求对于手写体汉字本身结构信息的把握,又对捕获单个字与周边文字之间相对位置信息的规律性提出了要求。而以往人们在“笔迹鉴别”等领域所做的工作都是针对行、列分布较规范的整段文字或整篇文章进行的,对于如今我们面临的空间分布极具任意性的个人手写笔记而言,昔日的经典算法仅仅具备一定意义上的参考价值,谋求一种适用性更强、能够对个人手写笔记字符进行准确分割的算法成为了正确查找信息的重要前提。比如图1这种比较典型的情形,进行行、列扫描的嵌套设定阈值将距离小于阈值的相邻的两部分进行分割,此时这样的算法显然就无用武之地了。

对于左右结构或者左中右结构的汉字,分割阈值的设置与个人的书写习惯是一对比较难以解决的矛盾,例如《沁园春・长沙》的“沁”、汕头的“汕”,前者由于“心”字的左边一点在垂直投影上与“]”无重叠部分而恰恰同“シ”有交叠,故而将整字错误地分割为

而“汕”字则不光是左右被分开,连三点水最上面的一点也被独立划分为一块,至于为什么“清”和“澈”就会被正确地框出呢?实质上是一个道理,注意用红色圈出的部分。

由于手写体的随意性,文字大小不尽相同,这就要对文字尺寸进行归一化,因此字符分割是非常重要的一步;同时字符分割又为之后的文字拼接提供了一条简单易行的途径。因此,若我们光从传统的算法入手,将阈值设定得较小同时要求用户刻意将字间距放大,那显然这是不人性的设计、是治标不治本的下策。

3.2 分割算法

综合考虑汉字结构的分布规律及书写的随意性,本系统采用了如下的字符分割算法:

1)首先对整幅图像进行扫描,定出上、下、左、右四条边界线(如图中箭头1、2、3、4所示)

2)对图像进行第二次扫描,此次扫描目的是对分立的字符进行分割。基本思想是认为手写的汉字大致是可以被一个正方形的边框所包围的,假设以列扫描作为外层循环,如图中3号箭头所示,以其扫描到地第一个像素点的横坐标为“虎”字的左边界同时以该像素点的纵坐标rectpop.bottom作为列扫描的循环次数,当扫描到如图5号箭头所示位置时,发现再往右扫一列时像素点的纵坐标便已经远大于rectpop.bottom,故而马上进行右边界的分割,之后“虎”字的行扫描继续,当扫描到6号箭头所示位置的下一行时,又发现扫描到的像素点的横坐标远大于rectpop.bottom,所以此时可以将“虎”字的下边界定出,到此为止,第一个“虎”字的分割完成,而之后的第二个“虎”字的分割思想与之如出一辙。至于“威”字的分割,则与之前的两个字的分割方法不同,由于扫描在一维上是从单一方向进行的,即对于列地扫描始终定格为从左到右,这就造成了其在空间分布上的独立性,换句话说,对于该字的扫描就无法贯彻之前的以具体像素点左边界的纵坐标rectpop.bottom作为列扫描的循环次数,所以对于“威”字的扫描实质上是沿袭了整幅大图像的扫描方式,只不过该字的右边界已定(就是整幅图像的右边界),而其余三个边界则只能老老实实地由行列嵌套循环定出。

又如图3(i)所示,字与字之间的位置关系毫无规律性可循,系统首先依旧按照设定的算法进行整幅图像的上、下、左、右四条边界的确定,将整幅图拆成如图(ii)所示的左半部分以及剩余的右半部分,我们发现:(ii)图的情形与上一例如出一辙,但为什么与(ii)中的“水”字毗邻的“森”字却没有以它的最底端作为其本身的下边界而是以2号箭头所示位置为其下边界呢?原因是它的右边还有字符。

当行扫描进行到(ii)中的“森”(称其为森2)字最底端时,扫描线被其右边的另一个“森”(称其为森3)的像素点“挡住去路”,这一信息的反馈使得系统得知行扫描还未结束,所以确定森2的下边界就等效为确定森3的下边界,正如我们所分析的那样,扫描结果是森2与森3的下边界相同且均为整幅图像的下边界。

同样道理,因为森3的至高点在森2的最低点上方,而行扫描在划过森2的最低点后始终向下寻找森2的下边界,这就使得森3 的上边界成为了由前级附带确定的因素。所以,整幅图中,尽管单个字可以准确无误地分割开来,但个别字边界的确定却是不尽如人意的。

图3字符分割实例3

4 结束语

再严密的算法总是在逻辑框架下执行一定顺序的操作,本算法也同样如此。我们的本意自然是希望得到如图(iii)所示的理想结果,但任何一套算法都是对规律的总结,其相对适用性无法脱离一般性的约束,而手写体的随意性恰恰是以特殊性来考验一般性,所以即使当前的算法对于个体分割具备了一定程度的正确性,其与我们设想的理想状态还是有一定距离的。以上两例充分说明本算法中前级对后级有影响,后级对前级同样有牵制,前后级字符之间的相互制约构成了当前分割算法的核心体系。

参考文献:

[1] 唐伟成.手写英文字符识别系统[D].沈阳理工大学硕士论文,2009.

[2] 朱娜敏.精通Windows程序设计――基于Visual C++实现[M].北京:人民邮电出版社,2009.

[3] 郭一平. 数字图像压缩历史的分析与检测[D]. 大连理工大学硕士论文,2009

[4] 沈军.一心两用.“双显”让游戏电影两相宜[J].电脑爱好者,2010(5).

[6] 梁红飞.四线电阻式触摸屏测试系统的研究[M].中南大学硕士论文,2009.

[7] 赵志强.基于GPRS的便携式信令控制系统的设计与实现[M].同济大学硕士论文,2008.

[8] 何斌.Visual C++数字图像处理[M].北京:人民邮电出版社,2005.

[9] 孙鑫.Visual C++深入讲解[M].北京:电子工业出版社,2006.

[10] 师春礼.手写体字符预处理与识别系统研究[M].硕士学位论文.北京:北京邮电大学,1995.

[11] 王丽华.基于神经网络的图像识别系统的研究[M].中国石油大学硕士论文,2008.

[12] 蔡樱.中文手写文稿的二值化与行列切分[J].中文信息学报,2000,14(1).

[13] 章毓晋.图像理解与计算机视觉[M].北京:清华大学出版社,2000.

[14] 靳藩.神经计算与智能基础[M].重庆:西南交通大学出版社,2000.

[15] 唐伟成.手写英文字符识别系统[D].沈阳理工大学硕士论文,2009.

[17] 张宏林.Visual C++数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2003.

[18] 孙艺峰.基于多种特征的数字图像分割理论和方法研究[M]. 辽宁师范大学硕士论文,2009.

[19] Wang J H,Chang F C,Su FW.Image segmentation via self-organising fusion[C].IEEE Proc.-Vis.ImageSignal Process,2006,153(5):657-665.

[20] 王宇石.基于图像内容的像检测[J].计算机应用技术,2009(4).

手写体字符任意行分割算法设计

优秀范文