首页 > 范文大全 > 正文

探讨智能性模式识别在版面分析中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇探讨智能性模式识别在版面分析中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘 要】版面分析作为OCR的一个局部应用领域和模式识别有必然的联系,将一个具体的版面分析对象视为模式识别对象,从而运用模式识别的方法和技术对在版面识别过程中出现问题的解决手段,是有益的探讨。当然最终的版面分析问题还是靠综合手段来解决,其中还涉及控制合并风险的算法的研究。

【关键词】版面分析;模式识别;应用

1 模式类区分方法[1]

对于图文混排的复杂度高的文档图像一般采用自底向上的版面分析策略,在通过连通区搜索算法(包括二次分析)获得版面全部连通区信息后即面临文本区域和图像区域的连通区信息区分问题。为方便讨论,依模式识别理论我们称文本区域和图像区域的连通区为不同的模式类对象。由于文本区域和图像区域不能出现交叠(这种交叠情况我们结合后续相同模式类对象合并过程称为合并或聚类风险),但试验表明即使在刚刚获得版面全部连通区信息,即在尚未展开后续合并等处理过程就已经存在文本区域和图像区域交叠的情况,或者说存在合并风险问题。所以有理由说合并风险将是伴随相同模式类对象合并过程始终的。由于问题的复杂性,受二分法思想启发,我们把问题逐步分解,即确立图文分解的方法。

对于一个待分析图像文档,我们将图像中的图像模式类对象:边框线和标题在原图像中滤除,同时将所提取的文字图像部分就其在文档中区域信息(该信息由对原图像的连通区搜索得到)规范化为图像文档,即作为原始文档的伴随图像。由于生成伴随图像,初步排除图像模式类对象的干扰,从而就其文字图像的版面分析的复杂度大为降低[2-3]。

需要说明的是这仅是初步做到图文分解,就是说在伴随图像中仍可能存在图像模式类信息,为此我们采取“渐进合并,特征凸现”的策略在后续处理中解决(对此将作另文详述);另一方面的关键问题是仍无法保证对不同图像模式类对象(如文字、图像甚至表格)分析的互不干扰性,而这一点正是我们要求系统所能体现出的智能性,它是由聚类稳定性算法保证实现的。

2 辅助功能模块的运用

承前所述,随着并行合并过程进行,由于对模式类对象是采用“渐进合并,特征凸现”的策略,模式类对象的确定要建立在一定前提条件上,即要待其模式类特征从不明显到明显之后,但在此过程完成时会有相互冲突情况产生。尽管上述算法的采用极大提高了系统的版面分析质量,但必须佐以其他功能模块的运用来处理这种更复杂的情形。该模块的功能将分别不同情况实现:1)择取强势特征模块,该情况下将保留取强势特征对象同时舍弃异类对象;2)折中退让,该情况下将根据冲突的情形做单方面的退让,如可以是文本类对象退让图像类对象(简称“文退图”)等,由于该情况较复杂,鉴于篇幅作者只做一般情形解释。

3 结论

对于模式类区分方法可以做策略层面的理解,这对于整个版面分析系统的质量是举足轻重的,但没有其他方法的辅助则很多具体问题仍不可得以完善和解决,因为版面分析要面临很多复杂的模式识别问题。本文正是探讨通过两者的融合从而是系统最终能体现出智能性的特点,进而获得实际应用的价值。

【参考文献】

[1]周长岭.中文OCR中的版面分析算法初探[C]//第六届全国汉字识别学术会议论文集,重庆,1996:137-142.

[2]H.Fujisawa, and Y.Nakano. A top-down approach for the analysis of document images[J]. Proc, SSPR90,1990:113-122.

[3]R.Ingold, and D.Armangil. A top-down document analysis method for logical structure recognition[J].Proc.First Int. Conf.On Document Analysis and Recognition, Saint-Malo, France,Sept.30-Oct.2,1991:41-49.