首页 > 范文大全 > 正文

基于数字标签的电子文档分割存储研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于数字标签的电子文档分割存储研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:电子文件的应用伴随信息化进程的推进得到很大发展,政府以及各类型企业的电子档案数量已经远远超过纸质档案数量。但由于电子文件自身易复制、易修改、易传播、易扩散等特点,导致传统文档防扩散管理办法难以保障电子文档的安全性和可靠性。本文首先设了一种电子文档多属性数字标签,其次提出基于多属性标签的电子文档加密分割方法,然后采用STAR码对文档分割后的数据块进行编码,最后通过实验对算法的性能进行了测试,以论证本文提出的电子文档防扩散方法可以更高效、安全地解决电子文档被恶意窃取的问题,为电子文件细粒度安全管控提供有力的技术支撑。

关键词:数字标签;文档分割;数据块编码

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)18-0021-02

根据国家制定的电子文档相关管理规范,电子文档从开始创建到销毁的整个生命周期内,须对文件自身添加安全标记信息,并且记录文件在传输过程中的流转状态。但是,由于现有的电子文档防护技术无法实现文件的动态跟踪,同时也不能完成对电子文档从创建到销毁全过程的安全管控[1]。现有标签技术虽可对文件属性信息进行保存,然而却存在标签易被删除修改等问题[2]。本文针对现有标签技术无法保障电子文档隐私信息安全性的问题,设计了一种电子文档多属性数字标签,并且研究了基于标签的电子文档加密分割方法,确保电子文档在整个生命周期中的信息安全。

1 现有标签技术介绍

目前,对电子文档进行加密分割的方法研究较少,并且使用的标签技术都无法保障隐私数据的安全性。Heymann P等人所提出的标签技术中,由于未考虑到标签的时间属性,所以存在一定的局限性[3]。Goloder Sa等人虽然对标签技术的时间属性考虑周全,但由于其忽略了单个标签的可能性,所以导致其方法的应用具有一定的约束条件。Gilad Mishne根据关键信息的重要性,提出一种基于权重排序的标签管理方法。本文采用对电子文档整体进行分割后形成文档数据块组,然后对其中的每个数据块进行编码离散存储。这样即使某一部分数据块泄露,也不会导致整个文件泄密。

2 多属性数字标签的设计

多属性数字标签是与文档在逻辑上紧密关联,结构上融为一体的特定数据段。标签内包含文档属性、数字标签属性、行为属性以及日志属性等。其中文档属性主要包含与标签一一对应的电子文档的身份信息,标签属性则记录标签自身的身份识别信息,行为属性主要负责记录文件使用者的操作权限信息,日志属性主要工作就是记录文件在流转过程中的操作日志。电子文档在执行读取操作时,第一步工作是阅读多属性数字标签的属性信息,并依据数字标签里面的权限信息,判断用户操作权限。多属性数字标签应用过程如图1所示。

1)用户通过客户端向服务端发送文档读取请求,服务端接收到读取请求后,对用户身份进行审核。当访问某一文档时,服务端对其进行审核,判断其是否绑定有多属性数字标签,同时查询其标签中属性值的完整性。如果审核通过,则向客户端返回文件位置信息;如果审核未通过,那么返回请求失败。

2)客户端接收到服务端返回的文件位置信息后,再向管理者结点发送文件查询请求,管理者结点接收到由客户端发送的文件位置信息后,从该文件多属性数字标签中查询该用户操作权限,并返回结果信息。

3)用户操作结束后,多属性安全数字标签中可编辑或者打印次数减一。

3 电子文档分割存储方法

本文采用对电子文档加密分割存储的方法,确保文档隐私数据不被恶意窃取。首先将电子文档进行数据块分割,然后再将分割数据块进行编码,最后将编码数据块以离散的方式存储在服务端。数据块存储过程中采用了离散存储的方式,所以在每个存储设备中可能只存储很小一部分文档数据块,因而降低了电子文档被非法窃取的可能性。

3.1 文档加密分割算法

通过对电子文档进行先加密再分割的处理过程后,原文件从一个完整的数据文件划分成为若干个文件数据块,最后对这些数据块进行离散存储至云服务端。

3.2 文档数据块编码存储策略

至此流程结束。采用STAR码对分割块进行编码不仅保证了在存储数据块失效时,能够让余下的可用存储数据块来还原其数据,同时也确保系统的数据可用、可靠与安全。

4 测试结果分析

对于电子文档加密分割算法而言,文件分块的数目越多,容量越小,则安全性越高。然而,文件块越多,对数据存储系统的负载压力就越大,同时加密分割过程耗时也就越长。因此文件加密分割过程耗时长短主要取决于文件分块大小。

实验1:选取大小为170MB的电子文件进行加密分割实验,其中分割单位由1MB到10MB,测试结果如图3。

图3 文件分割测试汇总图

通过以上测试可得,当文件块大小选择为4~5MB时,电子文件加密分割算法的效率最高;同时如果文件块大小的选择大于6MB,文件分割过程耗时会随着分割单位的增大而成线性增长的趋势,降低了算法执行效率。所以以下实验暂时选取文件分割为4MB大小为基准进行。

实验2:通过选取不同大小的电子文件及固定文件分割长度来进一步了解文件大小对文件加密分割算法效率的影响。选取大小范围为100~1000MB递增的电子文件进行加密分割测试,分割长度以4MB为基准,测试结果如图4。

结合以上实验得出的数据进行分析,在文件分割基准大小为4MB并且保持不变的情况下,电子文件加密分割的效率与文件的大小成线性关系,文件加密分割算法的执行效率会随着文件自身大小的逐渐增大而逐渐降低。

5 结束语

对电子文档增加多属性安全标签,是电子文档自身具备防

扩散的能力,并通过文中的文档分割方法对其进行数据块分割,使一个完整的电子文档分割称为文档数据块组,并对数据块进行编码操作形成编码块,然后将每一个编码块离散存储至服务端。基于数字标签的电子文档分割存储方法提高了文档自身防护能力的同时,也极大地降低了文档因为部分存储空间暴露而导致隐私数据泄密的可能性,确保了隐私信息的安全性。

参考文献:

[1] 姜红德.文档加密技术防护信息泄密[J].中国信息化,2012(17):62-63.

[2] 黄滨,吕岩.电子文档防扩散体系建设研究[J].信息安全与技术,2012,3(10):53-55.

[3] Heymann P, Garcia-Molina H. Collaborative Creation of Communal Hierarchical Taxonomies in Social Tagging Systems[J]. Stanford, 2006.