首页 > 范文大全 > 正文

手写体汉字识别方法的分析与研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇手写体汉字识别方法的分析与研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:本文在介绍手写体汉字识别系统工作原理的基础上,对当前常用手写体汉字识别方法的特点及存在的不足进行了分析,并对其在实际中的应用进行了介绍,在研究相关热点问题的同时,提出了手写体汉字识别的研究方向。

关键词:人工智能;神经网络;多方案集成法;集群识别策略

中图分类号:TP391.43 文献标识码:A

1 前言

由于汉字其独特的复杂结构,考察人类认识汉字的过程成为研究人类认识能力的一个良好手段。这是因为人类对具有丰富结构特征的汉字进行辩识时,不仅要应用模式识别能力,还要应用推理判断能力。这样人对汉字识别的过程既包括高层的以符号推理为主的“深思熟虑”型的智能,又包括底层的非推理的“本能反应”型的智能,使得它处于人类高层智能与低层智能的结合部,能够部分为意识所觉察和描述。汉字识别技术的研究是揭示人类智能奥秘的一个理想窗口,也是实现人工智能的良好平台和环境。手写体汉字识别方法的研究,具有广阔的应用前景,它使习惯汉语的计算机用户保持传统的书写方式,又享受到计算机给人们带来的快捷和便利。

2 手写体汉字识别系统的工作过程

手写体汉字识别系统采用光电转换装置把汉字转换为电信号,送入经过训练的计算机,由计算机自动辨认、“阅读”。手写体汉字识别系统由汉字图形输入装置、预处理器、识别器和后处理器等几个主要部分组成,其工作过程如下:

首先,待识别的汉字经过汉字图形输入装置,产生模拟电信号。模拟电信号经过模数转换,转换为带灰度值的数字信号。经光电转换后的待识汉字是一种二维点阵图形,将其送至预处理环节。预处理的内容和要求取决于识别方法,一般包括行、字切分、二值化、细化或抽取轮廓、平滑、规范化等。

行、字切分。首先从上到下,搜索一行文字的上下边界,切分出文字行,然后从左到右搜索一行文字的左右边界,切分出单字或标点符号。

所谓二值化,即把汉字图形带灰度电平的数字信号处理成二值(0,1)的数字信号,其中,“0”部分代表背景象素点,“1”部分代表笔画象素点。

细化即是将二值化的汉字点阵逐层剥去轮廓边缘上的点,变成笔化宽度只有一个bit的汉字骨架图形。

对汉字图形做平滑处理的目的是去掉图形中的孤立噪声、干扰并平滑笔画边缘。

规范化就是把文字尺寸变换成统一大小,文字位置纠正,字笔画粗细变换等文字图形的规格化处理。

识别器是整个汉字识别系统的主要环节。待识汉字经过预处理后,汉字模式成为规范的二值数字点阵信息,将其送至识别器。识别器首先进行特征抽取,即从预处理后的点阵图象中按一定的方式抽取汉字特征。

最后为了进一步提高整个系统的正确识别率,对识别结果进行后处理,即对单字识别的结果,利用语言知识等上下文进行识别结果的确认或纠错。

特征抽取与分类器的设计是整个系统中最为重要的环节,稳定特征的抽取与良好性能的分类器的设计是整个识别系统的核心,他们直接决定了识别系统的性能。下面从特征抽取和匹配判决的角度对现有的识别方法进行分析。

3 手写体汉字识别方法分析

手写体汉字识别是一个高难度的模式识别问题,传统的模式识别理论不能提供系统具体的方法,相关学科的交叉研究又不够深入,研究人员往往靠直觉和实验效果来选择识别方法,从预处理、特征选取、分类决策到后处理,人们提出了种类繁多的识别方案,很难进行理想的归纳分析,从特征选取和分类决策角度可将其粗略地分为四类:统计模式识别法、结构模式识别法、松弛匹配识别法和人工神经网络识别法。

3.1 统计模型识别方法

统计模式识别法采用统计特征向量进行模式描述,该方法不直接考虑汉字的笔划结构,主要是选取分类性能好、稳定的统计特征。识别时根据未知样本的特征向量与识别字典中的参考特征向量的匹配程度来判定识别结果。

进行特征提取时,通常先对汉字点阵进行某种局部或全局性的变换,从点阵平面得出特征平面;再对特征平面进行区域选取、网格划分、投影及变换等处理,从而形成特征向量。

统计模式识别法的特点是对局部噪声和微小畸变不敏感,分类性能较稳定,粗分类效果良好。传统的统计方法一般采用多维特征值累加的办法,把局部噪声和微小的畸变“淹没”在最后的累加结果里,同时那些用来区分字型结构的“敏感部位”的差异也随之淹没了,因此这种方法对于近似字的识别率很低。

3.2 结构模式识别方法

结构模式识别方法,也叫句法结构识别法。汉字是一种特殊的模式,汉字图形含有丰富的结构信息,用一定的方法提取含有结构信息的结构特征及其组字规律,作为识别汉字的依据。这种方法把待识汉字模式看作是由若干个较简单的子模式构成的集合,后者又可继续分解为若干个更简单的子模式,最简单而且不可再分解的子模式叫基元。这样任何模式都可以用一组基元及一定的组合关系形成的符号串来描述。识别器将输入的汉字描述为一串符号串,然后和存储在字典中的标准汉字符号串逐一相比较,和哪一类接近就被识别为哪一类。

由于结构法描述模式细部结构的能力较强,因此对相似字的分类能力较强,但是该方法所需的工作量很大,能够识别的字数有限。

3.3 松弛匹配识别方法

松弛匹配是目前广泛使用的一种手写体汉字识别方法,它利用了计算机视觉中的形状分析和匹配,该方法把汉字看作多角形轮廓,首先试探着将输入特征向量中的任一维特征和标准特征向量的所有维以初始概率进行匹配,然后利用支持函数不断地迭代对匹配概率进行更新,通过不断动态地改变相关概率,抛弃小者,保留大者,直到最后确定一个稳定的匹配。

当松弛匹配与具有很好描述能力的结构特征配合时,一般都能实现较好的识别性能,但它的最大缺点是计算量大,运行相当耗时,因此该方法适宜于用作细分类方法。

3.4 人工神经网络识别方法

人工神经网络汉字识别方法,利用子结构检测器进行手写体汉字笔划的分割识别和特征抽取,所抽取到的特征用集识别和特征抽取与一体的人工神经网络进行识别,并用“弱刺激畏缩”学习算法实现神经网络的组块神经元的建立,来解决BP网络收敛速度太慢的问题。另外,还利用叠层BP网的手写体汉字识别方法,同时选用外轮廓线、笔划、特征点分别为叠层BP网中的输入层、隐含层和输出层的特征进行分类,通过总网和子网的分批学习,以缩短网络的学习时间,解决手写体汉字复杂多变的问题。人工神经网络识别法具有自适应功能、泛化功能、非线性映射功能及高度并行处理等优点,

在脱机手写体汉字识别过程中,由于每个人书写汉字都各有特点,差异较大,所以在研究识别方法的时候,着重考虑的是如何找出它们共同的特点,尽量消除这些差异,提高总体识别率。但同时带来一个问题,由于汉字中的相似字也有较多共同点,而使得相似字的识别更加困难,虽然整体识别率提高了,而相似字的识别率反而降低了。由于汉字识别的人工神经元网络方法在小规模分类中的具有很强的分类能力,对手写体相似字有比较满意的区分效果,但是,随着分类规模的逐渐加大,其分类能力则明显下降。而传统的统计识别方法的大规模分类能力强,如何利用统计识别方法大规模分类能力,缩小识别范围,在小范围内体现人工神经元网络对相似字识别的优势,本文通过研究将这两种方法结合起来,充分发挥统计识别方法整体识别率高和人工神经元网络方法对相似字区分能力强的特点,使得相似字的识别率大大提高。

4 手写体汉字识别技术的应用

手写体汉字识别已经历了漫长的研究历程,在预处理、特征抽取、匹配判别及后处理等各个环节产生了许多有价值的思想和方法,具有广阔的应用

4.1 基于语言知识的手写体汉字集群识别

单个字的机器识别能力是有限的,近年来基于语言知识的集群识别是手写体汉字识别的一个发展趋势。

集群识别的基本思想是,首先把若干个待识对象在语料库和语法库的引导下,约束成一个群体,作为一个被识别对象,接着把集群捆绑形成的群体作为一个完整的识别对象同时加以识别分类,最后模仿人类细看的原理,把同类分类的结果与识别对象进行比较认同。集群识别思想包含两层反馈线路,内层反馈是为了对同步分类的结果进行反馈验证,外层反馈是为了对集群捆绑的成员进行重新分配。若反馈验证表面前面的集群捆绑有错误成员,再进行调整。利用模型、语言的多种统计知识及距离测度,对汉字识别的各个关键环节进行综合评判的策略和方法。

4.2 心理学研究成果在手写体汉字识别中的应用

汉字识别的心理学研究对手写体汉字识别具有启发意义。对人类汉字的认知心理实验研究结果进行总结后,认为人的汉字识别是经由整字属性及分层结构的多种途径复合而成的,其中大多数都可以在手写体汉字的机器识别中模仿应用。基于人类认知心理的手写体汉字机器识别模型,,应用子模式法和整模式法建立了一个实验系统,有效的提高了系统性能。这方面的研究虽然起步晚,但却是一个值得注意的新动向。

4.3 小波变换在特征抽取中的应用

小波变换是一种在图象分析、图象压缩中的重要分析工具,小波变换的多尺度分解特性更加符合人类的视觉机制,与计算机视觉中由粗到细的认识过程十分相似,更加适于图象信息的处理,因此一些研究者将该方法用于手写体汉字的特征抽取,取了较理想的效果。汉字的二维点阵图象按行、列分开进行一级小波变换后,得到一个低频分量和三个高频分量,低频分量保持了图象的大致轮廓,而高频分量表示图象的细节部分。将汉字图象经过小波变换后,使提取横、竖、撇、捺笔划非常容易,且简洁、明晰,再加上特征点共同组成特征向量,然后进行识别。

4.4 模糊数学方法在手写体汉字识别中的应用

模糊数学作为描述不确定事物的有效方法,在模式识别领域得到了广泛的应用,手写体汉字识别的研究对模糊数学也寄予很大的希望。在特征抽取中引入模糊数学的思想,提出汉字的模糊方向线素特征识别方法,有效地克服手写体汉字识别中变形问题。虽然模糊数学在此领域的应用还有许多问题亟待解决,如隶属函数的确定,模糊集合运算量大等问题,但是用模糊数学工具探索手写体汉字识别过程中的许多不确定问题,是一种值得重视的工具。

5 结论

通过对手写体汉字识别的基本原理和常用方法综合介绍,针对目前研究的热点问题,本文主要分析了手写体汉字识别的多方案综合集成方法、心理学研究成果的应用、小波变换特征抽取方法应用以及模糊数学方法在手写体汉字识别技术中的应用。从分析中看到,各种方法都有自己的优点和不足,特别是近年来手写体汉字识别研究的经验表明,重视多学科的交叉渗透,加强人类识字规律的心理学研究并努力借鉴,注意吸收和利用人工智能、神经网络以及模糊数学等最新研究成果,是当前技术条件下脱机手写体汉字识别研究的一个重要方向。

参考文献:

[1] 郭宝兰, 张彩录. 光学字符识别技术发展[J]. 计算机世界报, 2008(10).

[2] G Nagy, Chinese character recognition a twenty-five-year retrospective, ICPR 98:9th Int Conf, On Pattern Recognition, 2010.

(本文审稿 赵海廷)