首页 > 范文大全 > 正文

信息系统“风险熵”计算模型的研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇信息系统“风险熵”计算模型的研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

〔摘 要〕本文基于“熵”的相关理论,从“熵”的角度考虑研究信息系统风险评估定量分析方法,提出信息系统“风险熵”这一概念,依据“熵”的不同定义及应用原理,分别构建两种信息系统“风险熵”计算模型,旨在能量化信息系统安全状况。

〔关键词〕信息系统;风险评估;熵;信息系统风险熵

DOI:10.3969/j.issn.1008-0821.2011.12.008

〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2011)12-0030-04

Research of Computational Models of Information System“Risk Entropy”Fan Jianhua Zhao Wen

(International Business School,Shanxi Normal University,Xian 710062,China)

〔Abstract〕Based on the theories of the“entropy”,this article researched the quantitative analysis of information system risk assessment in the view of“entropy”,proposed the concept of“risk entropy”and built two kinds computational models of information system“risk entropy”,which could give quantitative assessment about the safe of the information system.

〔Key words〕information system;risk assessment;entropy;information system risk entropy

随着信息化在全球的快速发展,世界对信息的需求快速增长,信息的传递、交流和共享已成为现代科技和经济发展的重要前提,信息产品和信息服务对于各个国家、地区、企业、单位、家庭、个人都不可缺少,信息技术也已成为支撑当今经济活动和社会生活的基石,然而就在整个信息化不断深入发展、信息网络技术为人们不断带来惊喜的同时,信息安全所导致的问题也在日益突出,逐渐升级。一方面,已为各类社会组织带来了前所未有的威胁与破坏。另一方面,迫使计算机信息系统的安全状况不断面临着日趋复杂的挑战。本文针对当前分析解决信息系统安全问题有效方法之一的信息安全风险评估,在其已有的多种定性、定量分析方法基础之上考虑用“熵”来对信息系统安全问题再做新视角的定量分析。

1 信息系统安全研究现状

为了加强信息系统的安全性,不少科研技术人员,管理人员从技术手段及管理措施都对信息系统做出了相应的努力,也取得了不少成果。

对信息系统安全模型研究较为典型的有:BLP模型:它是专门针对军方需求设计的访问控制模型,也是最早的和迄今为止最为常用的安全模型。Bita模型:该模型用完整性等级取代了BLP模型中的安全等级,用一个结构化网络来表示授权用户和提供用户类型级别的划分。这些属性可以防止非授权用户的修改。对信息系统安全技术手段研究较为典型的有:加解密算法,安全协议和安全防护技术等。除此之外,各国许多专家在信息系统安全评估这一重要研究领域,经过多年研究,也已形成了广泛接受,普遍适用的标准和评估细则。

然而正如引言所述,伴随着科技的飞速发展,计算机技术不断的创新升级,信息系统的安全问题势必愈演愈烈,这就需要我们尽可能的从多方面多角度去观察问题,描述问题,继而解决问题。

2 熵理论

熵作为一个概念,在希腊文中的字义是发展演化。从对熵概念的研究历史来看,熵是由1865年由德国物理学家克劳休斯(K.Clausius)在热之唯动说一书中,为了将热力学第二定律格式化而提出的。他发现,熵(S)是一个状态函数,用它可以表征热力学第二定律:

dS=dQ/T

ds0

上式表明:在孤立系统中,不可逆过程使熵值增加,可逆过程则熵值不变,即为著名的熵增加原理。

除此之外,对熵的认识理解还有两种主要思路,一种是来自统计力学。1870年玻尔兹曼(L.Boltzmann)研究发现某物质系统的微观单元的运动状态共有Ω种,那么该物质系统的lnΩ与热力学熵S成正比。由此提出:熵是形容分子运动的无序程度和混乱程度的状态量。公式表示为:

S=KlnΩ

另一种是来自信息论[1-2]。香农(C.E.Shannon)在1948年将热力学熵引进信息论,在信息论中,熵表示的是不确定性的量度。一个系统X的信息量大小H(即信息熵)与该系统的状态概率P紧密联系在一起。若该系统由状态集{a1,a2,…,an}组成,每个状态对应的概率分别为p1,p2,…,pn,且∑ni=1pi=1。则系统X的信息熵为:

H[X]=H(p1,p2,…,pn)=k∑ni=1PilnPi

在自然科学和社会科学的各个领域中存在着大量的不同层次不同类别的随机事件的集合,由于熵对不确定性和无序度的描述可以不受各个学科内容的限制,因此熵概念能够广泛应用于众多学科[3]。如在物理学领域有量子熵、黑洞熵等;在化学领域有电离熵、迁移熵等;在数学领域有拓扑熵、样本熵等等[4]。

信息系统“风险熵”计算模型的研究3 信息系统“风险熵”模型的构建

3.1 信息系统“风险熵”的提出

在参考了上述对熵的不同认识理解以及将熵应用于众多学科,定义出多种熵学科的基础上,本文结合熵原理对信息系统提出“风险熵”的概念和定义,同时构建并分析研究不同角度下的信息系统“风险熵”模型。

3.2 基于“系统状态丰富程度”的信息系统“风险熵”模型3.2.1 模型的引入

从对熵理论的3种成功认识思路中可以看出[5],虽然它们彼此对应用熵理论的原理不一样,但是在分析中也有一个共同点,即都涉及对象的状态。不妨认为熵就是计量状态的标尺。所谓状态的多少具体是说状态的丰富程度。一个系统内部的状态越多也就是状态越丰富、越复杂。反之,状态越少就是状态越不丰富、越简单,越单调。

丰富程度这个词在科学中较为严格,但通俗一些而又不歪曲本质的提法是复杂程度。这样就把熵直接理解为物质系统的状态的丰富程度或称为复杂程度的度量。由此这里定义信息系统“风险熵”为对信息系统面临风险的状态丰富程度的度量。

根据风险的产生来考虑,只有系统资产本身的脆弱性面临与之相对应的威胁时,才能构成风险。在这里考虑构建风险熵模型就是找资产脆弱性和威胁的对应关系。这种判断等同于已有风险评估方法里求风险值。即假设某资产为A1,它面临2个威胁,其威胁发生频率值分别为T1和T2,T1可以利用A1存在的2个脆弱性,分别为V1和V2;T2可以利用用A1存在的3个脆弱性,分别为V3、V4和V5,因此资产A1面临的风险值共有5个。

3.2.2 模型的定义与计算

根据上述的解释,构架信息系统“风险熵”数量化模型如下:

Hi=clnΩi①

其中,Ωi=f(Vi,Ti),(i=1,2,3…n)

Ωi为某信息资产的风险态个数,其数值由威胁与脆弱性决定;

C是一个比例常数;

Vi是信息资产存在的脆弱性个数;

Ti是信息资产面临的威胁个数。

3.2.3 模型的分析

客观地说,信息系统之间如果不发生信息的交流,传递,即它处于一种相对的静态时,它所面临的风险会低于信息在各个信息系统之间交流、传递时的状态,从极限角度分析此模型存在两个极限状态值。

H=0:信息系统处于相对静态,即各实体资产处于无用状态。

H=HMAX:信息系统处于相对动态,即各资产处在应用当中,同时信息系统处于裸保护。

为了方便对此模型的理解,现选取某公司信息系统的“物理环境”为要评估的资产,对其所面临的威胁及自身脆弱性识别列举如下图1:

威胁脆弱性 断电静电灰尘潮湿温度鼠疫虫害电磁干扰洪灾火灾地震雷击机房场地机房防火机房供配电机房防静电机房接地与防雷电磁防护通信线路的保护机房区域的防护机房设备图1 “物理环境”面临的威胁与自身脆弱性对应关系图

图1中连线表示左侧威胁与右侧脆弱性相对应的关系,可以看出“物理环境”的Ω=f(V,T)=14,H=ClnΩ=Cln14=3C。因为C是比例常数,可以根据不同的信息系统需要确定数值,由此可计算出信息系统里每一个需要评估的信息资产的风险熵值。由熵的基本原理知道,信息系统内某资产熵值越大,即其所呈现“风险态”的丰富程度就越高,相比其它资产来说越危险,从做好信息系统安全管理的角度来看,可依据此模型求出的风险熵值高低有主次的采取相应保护措施降低信息系统内熵值高的资产,将资产的风险弱化,故而达到降低信息系统风险目的。

这种模型要求计算出需要判别的信息资产的风险熵值,而熵值计算的模型中需要识别列举所关注信息资产面临的威胁和自身脆弱性,而目前在信息安全管理研究进展中,威胁的穷举是个暂时还未解决的难题,导致该模型公式计算信息系统风险熵集中表现在对信息资产的主要风险态的丰富程度做到定量计算,不能穷尽资产的所有风险态,自然计算结果并非完全精确。所以只有对信息系统资产面临的威胁和自身脆弱性认识越全面详尽,其“风险熵”计算结果越能准确反映该资产“风险态”的丰富程度,继而为后续信息系统的安全管理提供更可靠依据。

3.3 基于“信息系统损失分析数量度量”的信息系统“风险熵”模型 与上述的信息系统“风险熵”模型的含义理解不同的是,以下建立的信息系统的“风险熵”模型是从另一角度研究的。即构建数量化模型力求计算出信息系统内实体资产与信息资产的熵值,旨在对信息系统遭遇风险的损失有个数量度量。

3.3.1 信息系统安全的考量因素

有文献[6]定义信息系统是指用于采集、处理、存储、传输、分布和部署信息的整个基础设施、组织结构、人员和组件的总和。其基本构成元素如下:计算机硬件、软件、网络、人员和信息流程。这些元素彼此合作,为组织的运营和管理提供有价值的信息,因此信息系统的安全性分析是基于上述元素以及其提供信息的综合分析。

从信息安全的属性来看,被学术界普遍认可的是信息安全金三角CIA的框架,而与CIA三元组相反的是DAD三元组的概念,即泄漏(Disclosure)、篡改(Alteration)和破坏(Destruction),实际上DAD就是信息安全面临的最普遍的3类风险,是信息安全实践活动最终应该解决的问题[7]。

文献[8]对信息系统安全的定义:信息系统安全是指确保信息系统结构安全、与信息系统相关的元素安全以及与此相关的各项安全技术、安全服务和安全管理的总和。由此分析信息系统的安全从以下两项内容考虑:(1)信息系统各实体资产安全;(2)信息系统所传递的信息安全。

3.3.2 模型的定义与计算

在有了前述对“熵”、信息系统安全相关考量因素的认识理解后,从计算信息系统遭遇风险损失后的数量表征结果出发,构建信息系统“风险熵”计算模型,以定期时间为检测单位,对信息系统安全所涉及的对象分别计算出“风险熵”值,用数量结果分析信息系统遭遇风险损失情况,为信息系统安全管理的后续研究提供某些数量化参考对象,提高信息系统安全管理工作效率。

在此模型中,一个相对完整的信息系统“风险熵”从构成来讲包括:信息系统实体资产风险熵:SA和信息系统信息风险熵:SR。同时定义信息系统资产风险熵是指对信息系统中信息实体资产发生风险导致安全损益的度量;信息系统风险熵是对信息系统中的信息遭遇的最普遍的3类风险的影响的度量。

其中SA、SR计算公式分别如下:

SA:信息系统实体资产风险熵

SA=∑ni=1dli/p②

dli:信息系统各信息资产的损益比,其中dli=vi/ci,vi为信息系统实体资产的意义价值,ci为信息系统实体资产的实际购买价值。

P:信息系统中实体资产抵御风险最低防护能力等级。

对②式的含义理解如下:分子、分母分别代表广延量和强度量,即广延量与强度量之比得广义熵,由于广义熵具有势函数的品格,故可作为系统的判据。(广延量:整体的值是2个或2个以上部分值的和,如:长度 ;强度量:整体和部分相同,如:压强)。例如信息系统中实体资产“液晶显示器”的购买价格为1 000元,它的意义价值为200元(在信息系统的运作中,液晶显示器不能正常工作并不影响硬盘里的数据信息,故其意义价值低于出售价格),损益比dl1=0.2,p的取值决定于信息系统实体资产中防护能力最弱的资产,即信息系统的防护能力由防护能力最弱的资产定。依据相对取值的原理:一个信息系统当中总有抵御风险能力最薄弱的实体资产,这个薄弱处资产的取值在本信息系统中量化取1,即②式中的P值为1。

SR:信息系统信息风险熵

SR=∑ni=1p(xi)log1p(xi)=-∑ni=1p(xi)logp(xi) (i=1,2,3)③

③式中,令B(x1,x2,x3)为信息系统中信息可能遭遇的3类风险,其中xi为对应某类风险的相关信息,P(xi)是关于此类风险的相关信息的确知度,在实际信息系统计算应用时,P(xi)是信息在一定时间内发生上述3类风险的统计概率值,且P(xi)≤1。

3.3.3 模型的分析

如同前述熵理论中所说的,在热力学中,物理系统的熵在不可逆过程中随着时间的变化总是在单调递增的,除非有外界能量介入才会导致它的熵值减小。信息系统也是如此,随着各种实体资产的增加以及数据信息的不断产生、传递,信息系统实体资产风险熵和信息系统信息风险熵的熵值是逐步单调增加的,只有借助外界的防护措施,才有可能降低各熵值。

一旦信息系统发生风险势必造成损失,而即便最大程度的弥补信息系统的损失,从某种意义上讲也不能使其恢复如初,即发生风险导致损失决定了信息系统运行的不可逆。此模型求得的各熵值在量化表述信息系统风险损失程度的前提下也反映出信息系统运行过程不可逆性的大小,亦即可作为不可逆性的量度。但是正如“一枚硬币的两面性”一样,此种模型在其具有创新性意义的前提下也有些许不足,例如对信息系统实体资产意义价值的确定还有待精确化、客观化等。

4 结 语

由于信息系统所面临的安全问题的复杂性,多样性,不可预见性等特征,决定了对一个实际信息系统进行安全分析是一项艰巨的任务。本文是在对“熵”基本原理的理解上,从本着最大限度保护信息系统安全这一原则出发,从不同角度,不同侧重点出发构建本质意义不同的信息系统“风险熵”模型,这不仅是对信息安全风险评估增加定量分析的评估方法,也是对信息系统实体资产与数据信息在遭遇风险后损失的数量化度量,更是对“熵”这一概念广泛应用的又一跨越。但由于熵理论本身十分丰富和复杂,信息系统遭遇风险也有众多不可估量的因素,故上述两个信息系统“风险熵”模型也都分别存在一些未考虑完善的问题。需要在后续研究中,不断努力,理论上更好的诠释代表不同意义的信息系统“风险熵”熵值分析方法,解决模型存在的某些不足,实证上更好的验证不同信息系统“风险熵”的实用性,方便不同企业依据各自系统特点、业务需求等做好按需选取分析模型,以求有效,经济的做好信息系统安全管理。

参考文献

[1]贾世楼,等.信息论理论基础(第二版)[M].哈尔滨:哈尔滨工业大学出版社,2004.

[2]傅祖芸.信息论――基础理论与应用[M].北京:电子工业出版社,2001.

[3]朱耀铠.信息系统安全熵值分析方法研究[D].国防科学技术大学,2008.

[4]何西培,何坤振.信息熵辨析与熵的泛化[J].情报杂志,2006,(1):110-112.

[5]张学文.熵究竟是什么.熵与交叉学科[M].北京:气象出版社,1988.

[6]全国信息安全标准化技术委员会,TC260 N0001,信息技术安全技术信息系统安全保障等级评估准则第一部分:简介和一般模型[S].2004.

[7]戴宗坤,罗万伯,等.信息系统安全[M].北京:电子工业出版社,2002.

[8](美)M.达塔.熵的一百年[J].今日物理,1968,21(1).译文载《摘译――外国自然科学哲学》,1976,(1).

[9]C,E.Shannon,A Mathematical Theory of Communication[J].Bell System Technical Journal,1948,27.