基于随机hough变换的文字图像倾斜检测(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇基于随机hough变换的文字图像倾斜检测范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

【摘要】复杂多变的采集环境和不确定的人工采集质量给后期的文字图像识别带来困难。通过总结前人的经验，本文提出的方法，首先在图像中提取出纯文本区域，并对随机hough变换的点选择进行位置限定，在保留原有图像特征的同时大大缩减了检测的数据量，通过仿真结果可知，该算法具有很好的检测准确度和速度。

【关键词】文字图像；倾斜校正；hough变换；文字区域提取；随机hough变换

0 前言

在信息时代，图像已经成为一种重要的信息载体，图像文字识别的发展已经经历了几十年的过程。在实际生活中，图像文字识别技术广泛应用于如车牌识别、文字扫描、地图中的文字识别等。但是，在文字图像识别中，图像的倾斜对于系统始终是一个敏感因素，因此，如何能够快速而准确的检测出图像的倾斜角度一直是该领域研究的课题。

文本图像的倾斜校正可分为倾角检测、旋转校正两个问题。目前存在的比较常用的倾角检测算法主要有基于投影的方法、基于Hough变换的方法以及基于K-最近邻簇法。基于Hough变换的方法由于其高精确度一直广受关注，但在应用中却一直面临着高时间成本和高内存消耗的问题。针对该问题，文献[2]通过投影法预先筛选出文字子区域，再结合连通域搜索法提取出文本直线来计算倾斜角度，但其文字子区域筛选区域面积大，且当文字图像中存在页面宽的图像时，无法提取出文字子区域，连通域搜索法在倾斜角度大于20度时就无法使用；文献[3]提出两级hough变换法，相对传统hough变换速度是有提高，但仍需要消耗大量的时间；陈军等[4]提出的随机 hough 变换，将传统的“一对多”的hough变换转化成“多对一”的映射，大大降低了内存需求和计算时间；文献[5]在此基础上，运用变分辨率金字塔策略，分别对低、高分辨率图层进行两级随机 Hough变换，算法取得了不错的效果。

本文在总结前人研究的基础上，首先利用投影法筛选出纯文本区域，再运用随机hough变换方法，并限定变换两点的选择区域，然后计算出文本图像倾斜角度。该方法在保留文本倾斜的特征的基础上，通过三个步骤大大减少了变换的数据量。

1 纯文本区域提取

图像投影时，不同的内容会形成不同的投影特征。在选取筛选区域时，考虑一般的页面特征，从上到下贯穿整个版面的图像概率较小，而由于段落的原因，版面右侧出现行不完整情况的概率较大，这样会对纯文本的投影特征造成一定的影响。再综合考虑拍照倾斜时可能带入的页面边界，在文字图像中的行1/4处，列1/4、2/4、3/4处分别取m*n像素大小的区域，作为候选区进行水平投影。

其中，a、b、c、d、e、f是位于Vproj取值范围[0，m]之间的相邻点，Vproj是该行的黑色像素点数。

当a与b， b与c，c与d组成的线段满足相应的长度限制时，则认为存在满足条件的波峰与波谷，如图所示，[b，c]和[d，e]所在区域为波峰，[a，b]和[c，d]所在区域为波谷。

利用以上算法对选择的区域进行筛选，找出有效的纯文本区。

2 随机hough变换

Hough变换方法是利用图像空间和参数空间中点与线的关联对偶性，将原始图像空间的给定曲线通过适当表达式运算变换为参数空间的一个对应点。文本图像一行中通常会存在较多的字，这条文本行可以看成是由许多中间有隔断的直线组成，这条直线代表着文本行的走向。

例如，直线在二维空间的参数表示形式为：

其中ρ为极半径，θ为极角。则图像中某条直线就会与参数空间中的一点（ρ，θ）相对应，图像中某点对应参数空间中的一条正弦曲线。因此，原图中直线上的任意两点（xi，yi）、（xj，yj）对应参数空间中的两条正弦曲线理论上相交于共同的一点（ρ，θ）。再通过投票累加找出局部最大值，即为对应直线的参数。但若对图像中的每一点都做hough变换，则计算量会相当大，因此本文采用随机hough变换。

随机hough变换是在hough变换的基础上运用统计学知识，并不对所有点进行变换，只随机取两点作直线，取得一个参数（ρ′，θ′），对结果进行投票累加。当迭代达到一定的阈值后，投票累加最高的结果就对应着图像上的直线。将图像空间中的两个点映射到参数空间中的一个点，是一个 “多对一 ”的映射，避免了传统 Hough变换 “一Χ ”映射的庞大计算量。

为了进一步减小计算量，本文在运用随机hough变换法时，在纯文本区域竖直方向选取一个窄长的区域D，并根据实际精度要求选择区域E。分别在区间D和E中随机各选择一个黑点 d1、d2，hough变换后，求得参数（ρ′，θ′），对累加器数组 P[ρ，θ]中相应结果投票加一。

当区域D的高度和区域E的高度选取合适时，可以进行大幅度的倾斜角检测。

通过实验得知，本文中手机采集的2448*3264的照片通过该算法处理检测出倾斜角度的时间为1.02s，检测结果相对传统hough变换的标准偏差为0.047，可见其在保证准确度的同时大大提高了检测速度。

3 小结

本文提出的算法是在前人的基础上所做的改进。子区域具有与页面相同的倾斜角度，通过提取纯文本区域，减少背景和页面中图像的干扰；采用随机hough变换，保证hough变换准确度；同时对于随机hough变换中的两个点采取限定区域的方式，三个阶段均对变换数据量有大幅减少。通过实验可知，通过该算法对文本图像倾斜角度的检测角度具有较高的准确度和速度。对内含表格、背景或版面较复杂的文本图片来说，只要通过合适的方法筛选出纯文本区域后，同样适用，具有较高的应用价值。

【参考文献】

[1]吴飞飞.文本图像倾斜校正算法的研究与应用[D].北京：北方工业大学，2014.

[2]周冠玮，平西建，程娟.基于改进Hough变换的文本图像倾斜校正方法[J].计算机应用，2007，27（7）：52-57.

[3]陈军，徐友春，赵明，等.基于随机hough变换的道路边界识别算法研究[J].中国图象图形学报，2009，14（5）：905-911.

基于随机hough变换的文字图像倾斜检测

优秀范文

精选范文