首页 > 范文大全 > 正文

中英文混合识别的利器

开篇:润墨网以专业的文秘视角,为您筛选了一篇中英文混合识别的利器范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:在日常信息化办公过程中,经常利用OCR(光学字符识别)技术,通过扫描仪或数码相机检查纸上打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机数字化的文档。作者结合具体实例对OCR软件——ABBYY FineReader进行了相关阐述。

关键词:中英文混合识别;OCR软件;ABBYY FineReader

中图分类号:TP319 文献标识码:A 文章编号:1673—8454(2012)18—0064—02

我们在日常信息化办公过程当中,经常利用OCR(光学字符识别)技术,通过扫描仪或数码相机检查纸上打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机数字化的文档。但是,在实际使用过程中,绝大多数OCR软件只能识别单一语言,若遇到中文、英文或其他多语言混合时就无法正确识别,甚至出现天书一样的乱码。此时,我们只有反复变换语言再识别,或将其分割为单一语言再整合成文档,这样不但操作步骤烦琐,而且往往要影响我们的工作效率。为此,对于中英文混合识别的问题,有没有一种更好的解决方案,下面针对OCR软件——ABBYY FineReader并结合具体实例加以阐述。

三、实施读取识别、检查拼写并导出

在软件ABBYY FineReader的工具栏中选择“读取”,软件将用中英文混合识别方式对左侧扫描后的图像进行分析、读取并进行有效的识别,识别后的内容将在右侧的文本区域进行预览,同时软件ABBYY FineReader将不确定的识别内容予以彩色显示,以便进一步检查拼写,这样可以有效地提高扫描内容的识别率。

最后,在软件ABBYY FineReader的工具栏中选择“保存”,我们可以将识别及检查后的内容保存为Word文档,以供数字化的保存、处理、共享及再修改,。

软件ABBYY FineReader的下载地址:宁波象山现代教育技术学会网站,http://.cn/。ABBYY FineReader支持多种形式的内容导入,如扫描仪、PDF文件、数码相片等,同时还提供了现在主流电子文件格式的导出,如Word文件、PDF文件、TXT文件、JPEG文件,只要我们深入挖掘软件ABBYY FineReader的众多功能,相信它不但能成为我们中英文混合识别的利器,而且也能为我们日常信息化办公带来极大的方便。