首页 > 范文大全 > 正文

碎纸片的拼接复原技术

开篇:润墨网以专业的文秘视角,为您筛选了一篇碎纸片的拼接复原技术范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

本技术利用数学方法,解决碎纸片拼接问题,以提高拼接复原效率,研究复原同一页仅纵切后的碎纸片。通过对碎纸片的图像进行数字化,得到单个碎纸片的灰度矩阵,建立优化模型,利用遍历的方法,得到碎片复原结果。同时,复原同一页既纵切又横切后的碎纸片以及复原双面打印文件的原理类似。

【关键词】灰度矩阵 边缘比对法 相似度指标 优化模型

1 前言

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。我们研究的问题是:对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法。

2 碎纸片的拼接复原技术分析

破碎文件的拼接是一个最优匹配问题。首先,我们需要将图像数字化,利用matlab软件,可得到数字图像的灰度矩阵。在这一过程中,数值越小,颜色越深,其中:灰度值0表示全为黑色;灰度值255表示全为白色。

众所周知,图像的边缘对人的视觉具有重要意义。一般而言,当人们看一个有边缘的物体时,首先感觉到的是边缘,而两个原本属于一体的(匹配的)碎片必然有相同的边缘。因此,可以从这个角度考虑碎纸片的拼接复原,可以基于碎片的边缘灰度值进行匹配,而不考虑碎片的内容。

为了比较两个碎片边缘的相似度,需要确定相似度指标,我们可以求出两个碎片的绝对距离,归一化后得到相似度公式。最后,建立优化模型,找到每个碎片对应相似度大的碎片。

3 模型建立与求解

3.1 数据处理

在计算机领域内,灰度图像也称黑白图像,灰度图像通常显示为从最暗黑色到最亮的白色的灰度,其中:灰度越低,颜色越深。同时,0表示每个像素点全为黑色,255表示每个像素点全为白色。为了将文字图像数字化,我们利用matlab软件,分别将碎片图像转换成19个像素为1980×72的灰度图像,得到19个1980×72的灰度矩阵。

3.2 模型建立

我们根据最左边的碎片有页边距即碎片最左边一列的元素的灰度值均为255,找到最左边的那一个碎片,按照以下建立的模型,依次向右拼接,直至19张碎纸条全部拼接完成。

不难看出,图2中,图(a)和图(b)的边缘灰度值具有相同的变化趋势,且二者大部分近似相等,结合图1可以得出,两个原本属于一体的碎片必然有灰度值相似的边缘。从这个角度考虑,可以基于碎片的边缘灰度值进行匹配。我们需要建立相似度指标,将每一个碎片的边缘与其他碎片边缘进行比较,从而选取与其相似度最大的碎片。

3.2.1 相似度指标

由以上分析,纵切后我们可以将两幅图的左右边缘进行匹配。任选两幅图X,Y。xk,72为X的第k行第72列的灰度值,yk,1 为Y的第k行第1列的灰度值。

3.3 模型求解

利用公式(1),我们求出了每个碎片与其他18个碎片的相似度,给出一个19x19的相似度矩阵。为了求解此问模型,我们建立算法如下:Step 1:算出任意两个碎纸条之间的相似度;Step 2:根据页边距找到最左边的碎纸条,设为a;Step 3:找出与a相似度最大的碎纸条,设为b,则b即为a右边的碎纸条;Step 4:若已经排好序的碎纸条数小于19,用令b等于a,转Step 3;若已经排好序的碎纸条数为19,则碎纸条已拼接好。

4 评价与推广

(1)模型的优点:第一,通过得到灰度矩阵,将文字图像数字化,为接下来的求解提供了很大的方便;第二,由于两个原本属于一体的碎片必然有相同的边缘,故将边缘灰度值匹配,进一步简化了计算量,且模型合理。

(2)模型的缺点:模型是建立在原纸片的上下左右都留有空白的假设上的,虽然和大部分实际情况符合,但是不排除纸片上下左右不留有空白的可能性。

(3)模型的推广:本研究的模型在司法物证复原、历史文献修复以及军事情报获取等领域都可发挥作用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低,特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。本文建立的模型,旨在用数学方法,解决破碎文件的拼接,利用计算机技术,完成碎纸片的自动拼接。虽然在自动拼接过程中,还需要人工干预,但是方法是有效可行的,很大程度上提高了拼接复原效率。

参考文献

[1]罗智中.基于文字特征的文档碎纸片半自动拼接[J].计算机工程与应用,2012(05).

[2]毕楷明.碎纸片的拼接复原数学模型的构建[J].价值工程,2014(25).

[3]高鸿.文档图像拼接技术研究[D].长沙:中南大学学位论文,2011.

[4] 王慧燕.图像边缘检测和图像匹配研究及应用[D].杭州:浙江大学,2003.

[5]卓金武等.MATLAB在数学建模中的应用[M]. 北京:北京航空航天大学出版社,2011.

[6]余锦华等.多元统计分析与应用[M].广州:中山大学出版社,2005.

作者简介

周玮(1993-),女, 江苏省南京市人。南京邮电大学通信与信息工程学院2011级本科生,就读于通信工程专业。

卫逸梦(1993-),女, 江苏省无锡市人。南京邮电大学通信与信息工程学院2012级本科生,就读于通信工程专业。

作者单位

南京邮电大学 江苏省南京市 210003