首页 > 范文大全 > 正文

基于脊波变换的金融汉字不变性特征提取方法

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于脊波变换的金融汉字不变性特征提取方法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

フ 要:为了满足对多方向选择性的要求,提出一种基于脊波变换的手写体金融汉字不变性特征提取方法。该方法首先利用Radon变换将原始图像的旋转转换成Radon域的环形移位,再利用傅里叶变换振幅具有平移不变性的特点,在Radon域应用一维傅里叶变换,得到的振幅矩阵具有旋转不变性,它对旋转不变特征提取是非常理想的;然后沿振幅矩阵行的方向执行一维多分辨小波变换,使得从频域适当的子带提取特征成为可能;从Ridgelet子带中提取均值、标准差和能量组成特征向量。通过实验的验证,该方法可以满足表单自动处理系统应用对手写体金融汉字识别的要求。

ス丶词:脊波;多分辨分析;不变性;特征提取;手写体金融汉字识别

ブ型挤掷嗪: TP391.41 文献标志码:A

Abstract: To meet the requirements of multidirectional choice, a new approach to the invariant feature extraction of handwritten amount Chinese characters was raised, with Ridgelet transform as its foundation. As far as this approach is concerned, first of all, the original images would be rotated to the Radon circular shift by means of Radon transform. On the basis of the characteristic that Fourier transform is row shift invariant, then, the onedimensional Fourier transform would be adopted in Radon field to gain the conclusion that magnitude matrixes bear the rotationinvariance as a typical feature, which was pretty beneficial to the invariant feature extraction of rotation. When this was done, onedimensional wavelet transform would be carried out in the direction of rows, thus achieving perfect choice of frequency, which made it possible to extract the features of subline in the appropriate frequencies. Finally, the average values, standard deviations and the energy values would form the feature vector which was extracted from the Ridgelet subbands. The approaches mentioned in the paper could satisfy the requirements from the form automatic processing on the recognition of handwritten amount Chinese characters.

Key words: Ridgelet; multiresolution analysis; invariance; feature extraction; handwritten amount Chinese characters recognition

0 引言

随着表单自动处理技术的快速发展,银行金融表单的自动处理和识别成为图像处理和模式识别的一个重要分支,同时也成为手写体识别最有前景的一种商业应用。表单自动处理主要涉及英文字符、小写数字、金融汉字以及条码、标志等识别要素,目前除了手写体金融汉字识别外,其余各要素的识别均已达到实用水平。因此,针对小字符集手写体金融汉字的识别具有广阔的应用前景和很强的实用价值。

根据生理学家对人类视觉系统的研究结果和自然图像统计模型,优秀的图像表示方法应该具有多分辨特性、局域性和方向性等性质。

常用的多分辨分析方法如Fourier变换、Gabor变换、小波变换等,它们都不能同时满足上述三个性质。为了能充分利用图像的几何正则性,希望基的支撑区间表现为长条形,以达到用最少的系数来逼近奇异曲线。

1998年,美国斯坦福大学的E.J.Candès和D.L.Donoho建立了一种新的多分辨分析方法――脊波(Ridgelet)变换[1],并完成了脊波的理论框架[2],它能够对高维空间中的直线状和超平面状的奇异性进行很好的逼近。脊波是用一系列脊函数的叠加来表示相当广泛的函数类,同时具有给予离散变换的“近似正交”的脊函数框架。它不仅具有小波变换良好的局部时频分析能力,而且具有很强的方向选择性和辨别能力,能有效表示图像中具有方向性的奇异特征,如图像的边缘、直线等轮廓特征。

Chen等人[3]首先提出了用脊波变换和cyclespinning技术提取旋转不变特征的方法,在印刷体汉字识别、数字识别和形状识别等方面都得到了很高的识别率。Arivazhagan等人[4]利用脊波变换能有效处理线状奇异性的优点,从脊波分解的子带中提取能量特征对四个数据集分类,识别率较高。Pan等人[5]提出一种基于脊波变换和频率―方向空间分解的旋转不变纹理分类方法,它类似于多路滤波技术,在脊波域得到多路频率―方向分解,提取纹理的旋转不变特征,能有效获得纹理的性质,得到了理想的识别效果。

本文提出一种基于脊波变换的旋转不变手写体金融汉字的特征提取方法。首先,将图像的旋转在Radon域产生角度方向的平移,然后在Radon域应用一维离散傅里叶变换,由于傅里叶变换的振幅是对平移不变的,因此提取的振幅矩阵具有旋转不变性,再在振幅矩阵的每一行应用多分辨一维小波变换,得到脊波变换的系数,在每个分解的脊波子带上提取均值、标准差和能量特征组成特征向量,最后用k近邻分类器进行分类。通过对比实验的结果显示所提出的方法在识别率和速度方面都能满足金融表单自动处理系统应用中对手写体金融汉字识别的要求,证明了该方法的有效性。

1 脊波变换的基本原理

定义1[1] 设单变量的光滑函数Е:RR,Ь哂凶愎坏乃ゼ鹾拖失矩,若满足条件:А姚(t)dt=0,及容许条件: オ

Kψ=∫(ξ)2ξ2dξ

г蚨杂诓问集γ,定义R2R函数:オ

Е转γ(x)=a-12•ψu•x-ba(2)

С痞转γ为容许条件生成的Ridgelet函数。其中,aС莆 Ridgelet的尺度参数,u表示方向,b为位置参数。オ

定义2[1] 二元函数f(x)∈L2(R2)У牧续脊波变换定义为:

RFTf(a,b,θ)=∫R2a-12•ψx1cos θ+x2sin θ-baf(x)dx(3)

2 基于脊波变换的旋转不变性特征提取算法

Ridgelet变换本质上是通过对小波基函数添加1个表征方向的参量得到的,因此它不仅具有局部时频分析能力,而且具有很强的方向选择和辨识能力,对获取图像中的直线型方向信息具有独特的优势。

根据投影切片定理[6],图像的Ridgelet变换可表示为在该图像的Radon变换切片上的一维小波变换。因此Ridgelet变换的实现可以分成两个阶段:Radon变换阶段和一维小波变换阶段。Radon变换实际上在频域的极坐标网格上提供图像信息,它能将原始图像上的旋转转换成Radon域相应于角度参数的循环移位,因此它对旋转不变特征提取是很适合的。为了消除角度平移的影响,在Radon域执行一维傅里叶变换,提取振幅值,然后在得到的振幅矩阵上按行执行一维多分辨小波变换,得到Ridgelet变换系数,根据频域特征划分Ridgelet子带,计算每个子带的均值、方差和能量值组成特征向量。

手写体金融汉字的不变性特征提取算法的框图如图1所示。

2.1 Radon变换的旋转不变性分析

图像f(x1,x2)г讵R2上的Radon变换定义为:

Rf(θ,t)=∫R∫R f(x1,x2)δ(x1cos θ+x2sin θ-t)dx1dx2(4)

在Rfе校行索引是角度,列索引是频率。对定义中的方向参数Е龋Radon变换在它的表达式中明确表示了图像的方向,如果原始图像旋转了角度ИΔθ,г蛐转引入一个相应于角度参数的平移[7]。

设原始图像f1(x1,x2)旋转了ИΔθЫ嵌群蟮耐枷窦俏f2(x1,x2),г颍邯

Rf2(θ,t)=∫R∫R f1(y1,y2)δ(y1cos(θ-Δθ)+

y2sin(θ-Δθ)-t)dy1dy2=

Rf1((θ-Δθ),t)(5)

这里Rf1((θ-Δθ),t)是原始图像f1(x1,x2)УRadon变换。可见,在原始图像上的旋转将产生在Radon域相应于角度参数的循环移位。

用一个实例说明,选取手写体金融汉字“壹”的图像,对原图像和逆时针旋转了45°的旋转图像,分别进行Radon变换,生成相应的Radon变换系数,如图2所示。

从图2可以看出,将原图像的Radon变换与逆时针旋转了45°的旋转图像的Radon变换相比较,只是按角度发生了循环移位。

设FRf1是图像f1(x1,x2)УRadon变换Rf1(θ,t)а鬲Е泉У母道镆侗浠唬则:

FRf2=∫RRf1(θ-Δθ,t)e-j2πuθ/Ndθ=FRf1e-j2πuΔθ/N(6)

FRf2=FRf1e-j2πuΔθ/N=FRf1e-j2πuΔθ/N=FRf1(7)

即FRf1和FRf2У恼穹相同,这个性质是指在时域的平移不会改变傅里叶变换的振幅,被称为傅里叶域变换的时位移不变性质。因此,在Radon域沿参数Е泉У母道镆侗浠坏恼穹是旋转不变的。

手写体金融汉字“壹”的图像执行Radon变换后,在Radon域执行傅里叶变换的结果如图3(a)所示。

2.2 Ridgelet的子带划分

根据Ridgelet变换的定义,对Radon域执行一维傅里叶变换后得到的振幅矩阵的每一行,执行一维多尺度小波变换,其变换后的系数就是图像的脊波变换系数。尺度和角度的共同离散化将二维平面分解成频域多尺度分解结构,Ь断虻j个圆环对应尺度2j≤ω≤2j+1,г诟迷不纺诮嵌炔问又将其等分为2jЦ鲎忧域,这些子区域随着尺度的增加而越来越多[8]。

手写体金融汉字“壹”的脊波变换系数如图3(b)所示。

Ridgelet变换具有很强的方向集中性,系数矩阵只在少数列具有较大的幅值,这为确定子带划分方案提供了重要的依据[9]。

尽管Ridgelet变换比小波变换复杂,但是它比小波变换有更好的稀疏性,它能起到更好的能量集中的作用[10]。

由于能量分布集中的区域通常包含更多的频率信息,参照一维离散小波变换(Discrete Wavelet Transform,DWT)分解的特点,提出一种用于手写体金融汉字的特征提取的Ridgelet子带划分方案。在该方案中,考虑视觉系统对不同角度直线特征的感知能力不同,对角度进行非均匀划分,敏感方向的Ridgelet系数划分更精细的子带。

三级Ridgelet分解划分的子带结构如图4所示。

2.3 算法描述

具体的不变性特征提取算法描述如下:

1)图像预处理。首先将手写体金融汉字图像进行预处理,包括切分、细化、平滑去噪等。

2)对样本图像作平移和尺度归一化,使得它是平移和尺度不变的,设归一化后的样本图像为f(x1,x2)(x1=1,2,…,N,x2=1,2,…,N)。オ

3)选定图像的内切圆区域,中心为(N/2,N/2),半径为N/2,Р⑥鹌在内切圆之外的图像像素。

4)在选定的内切圆区域中应用Radon变换。切片的方向角度以逆时针方向排列,投影间隔为Иπ/2N,ЫВ0,π)等分为2N个投影角度θ1,θ2,…,θ2N,г谟爰轴成Е泉iЫ堑闹毕呱希f(x1,x2)投影得到一个一维序列,则所有投影角度上得到的投影序列构成了Radon变换系数矩阵:

Rf = g│泉1 (1) g│泉1 (2) … g│泉1 (N)g│泉2 (1) g│泉2 (2) … g│泉2 (N)う螃 螵g│泉2N (1) g│泉┆2N (2) … g│泉┆2N (N)オ

每个角度的投影点的个数为N,矩阵中的第i行表示f(x1,x2)г谀骋桓鼋嵌泉Е泉i下的投影序列(g│泉i(1),g│泉i(2),…,g│泉i(N))(i=1,2,…,2N),它能够反映金融汉字在该方向上的特征,而整个的Radon变换矩阵RfХ从沉私鹑诤鹤滞枷裨诙喔龇较蛏系奶匦浴*

5)沿着Rf的每一列应用一维离散傅里叶变换,并提取振幅值,以消除角度循环移位的影响,它具有旋转不变性,得到的矩阵记为FR。オ

6)对变换后的投影矩阵FR中的每一行,е葱幸晃多分辨小波变换,其变换后的系数就是图像的脊波变换系数。三级分解后的子带结构如图4所示,共有26个子带,用式(8)~(10)计算每个子带的均值、标准差和能量值。

均值:

Mi=1MN∑Mx=1∑Ny=1Ri(x,y)(8)

标准差:

Е要i=1MN∑Mx=1∑Ny=1(Ri(x,y)-Mi)2(9)

能量值:

Ei=-1log(M×N)

∑Mx=1∑Ny=1Ri(x,y)∑∑ x,yRi(x,y)logRi(x,y)∑∑ x,yRi(x,y)(10)

其中Ri(x,y)是大小为M×N的第i个脊波分解子带在(x,y)的值,i=1,2,…,26。オ

将所有子带的均值、标准差和能量值连接组成特征向量,记为:

f=(M1,σ1,E1,M2,σ2,E2,…,Mi,σi,Ei,…,M26,σ26,E26)オ

7)对特征向量进行归一化,Иf^i,j=(fi,j-μj)σj, fi,j表示第i个图像的第j个特征,μj和σj是在训练集中相应的第j个特征的均值和方差。オ

8)对给定图像,输出特征向量Иf^ё魑具有不变性的特征向量。

3 实验结果与分析

用手写金融汉字库HCCLIB来测试算法的有效性。Р馐缘哪勘臧括:1)测试提出的基于脊波变换的不变性特征提取算法的性能,比较使用不同的小波基和k近邻法取不同k值的分类性能;2)测试有旋转变化的金融汉字的识别性能。オ

每个金融汉字按64×64点阵进行归一化,首先执行Radon变换,Radon变换矩阵大小为128×64,然后在Radon域执行一维傅里叶变换,得到的矩阵大小为128×64,再沿行的方向执行多分辨一维小波变换,脊波系数矩阵的大小也是128×64。

3.1 Р煌小波基和k近邻分类器取不同k值オ

从手写体金融汉字库HCCLIB中任取4B200个样本(每个汉字200个样本)构成数据集一。然后任取1B050个样本(每个汉字50个样本)作为训练样本集一,其余的3B150个样本(每个汉字150个样本)构成测试样本集一。

在实验中选用了四种小波基,分别是Biorthogonal小波族的bior2.4、Daubechies小波族的db4、Coiflet小波族的coif5和Symlets小波族的sym8。在训练集一和测试集一上用k近邻法取不同的k值来测试分类的性能,分类结果如图5所示。

从图5结果可以观察到,选用db4小波基和sym8小波基得到的识别率较高,显然小波基的选择对识别率也有一定的影响。另外,Уk近邻法的最近邻的数量增加时,分类的性能并不总是随着k值的增加而增加。Ю如采用db4小波基,У豹k=9时,识别率最高,达到了95%,而当k值继续增加时,识别率反而稍稍下降,采用其他小波基也有类似的情况,说明k近邻法并不是k值越大分类性能越好。オ

3.2 旋转不变性的实验结果和分析

从手写体金融汉字库HCCLIB中任取4B200个样本(每个汉字200个)构成数据集二。每个汉字分别取25个样本逆时针旋转0°、45°、90°、135°、180°、235°、270°、315°,使得每类金融汉字图像有8个旋转方向。

每个汉字0°方向的25个样本构成训练集二,其余的7个方向的样本(每个汉字175个样本)构成测试集二,来测试本章提出的算法对旋转变化的手写体金融汉字的分类性能。

在实验中仍选用四种小波基,分别是bior2.4、db4、coif5和sym8。г谘盗芳二和测试集二上用k近邻法取不同的k值来测试分类的性能,Х掷嘟峁如图6所示。

从图6的结果可以观察到,选用db4小波基,k值为11时得到的识别率最高,为93.3%。而且选用db4小波基取得的识别率普遍高于其他几种小波基。

4 结语

基于Ridgelet变换的不变性特征提取方法的优点主要体现在以下两个方面:1)Radon变换将原图像的旋转变化转换为Radon域角度方向的循环移位,然后再结合一维傅里叶变换振幅值的平移不变性,得到的振幅矩阵是旋转不变的,它对旋转不变特征提取非常理想;2)沿矩阵的行方向执行一维多分辨小波变换,带来了好的频率选择性,使得从频域的适当的子带提取特征成为可能。

实验结果显示基于Ridgelet变换的方法能得到更好的识别率,已达到表单自动识别系统中对手写体金融汉字的识别要求,证明了该方法的有效性。

げ慰嘉南:

[1] CANDES E J, DONOHO D L. Ridgelets: theory and applications[D]. Stanford:Stanford University, 1998.

[2] CANDES E J, DONOHO D L. Curvelets, multiresolution representation, and scaling laws[J]. SPIE Wavelet Application in Signal and Image Processing. 2002, 4(2):119-126.

[3] CHEN G Y, BUI T D, KRZYZAK A. Rotation invariant pattern recognition using ridgelets, wavelet cyclespinning and Fourier features[J]. Pattern Recognition, 2005, 38(12):2314-2322.

[4] ARIVAZHAGAN S, GANESAN L, SUBASH K T G. Texture classification using ridgelet transform[J]. Pattern Recognition Letters,2006, 27(16):1875-1883.

[5] PAN W, BUI T D, SUEN C Y. Rotation invariant texture classification by ridgelet transform and frequencyorientation space decomposition[J]. Signal Processing,2008, 88(2):189-199.

[6] DURRANI T S, BISSET D. The Radon transform and its properties[J]. Geophysical,1984, 49(1):1180-1187.

[7] HUANG K, AVIYENTE S. Rotation invariant texture classification with ridgelet transform and Fourier transform[C]// Proceedings of the 13th International Conference on Image Processing.New York:IEEE, 2006:2141-2144.

[8] JAFARIKHOUZANI K, SOLTANIANZADEH H. Rotation invariant multiresolution texture analysis using Radon and wavelet transforms[J]. IEEE Transactions on Image Processing,2005, 14(6):783-795.

[9] 侯文君,李杨,都思丹. 基于Radon变换的多尺度虹膜识别算法[J]. 中国科学技术大学学报,2007,37(2):208-211.

[10] 贾建,焦李成. 数字脊波变换的实现与一种改进方法[J]. 计算机研究与发展,2006,43(1):115-119.