首页 > 范文大全 > 正文

基于假设检验的隐写分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于假设检验的隐写分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:提出了一种基于假设检验的隐写分析方案。该方案将隐写信息的存在性检测转化为二元假设检验问题,原始图像的先验概率密度函数采用隐马尔可夫树(HMT)模型进行估计。将该方案应用于乘性扩频隐写的检测,实验结果表明,基于隐马尔可夫树模型的检测器比基于独立同分布(i.i.d)模型的检测器具有更好的检测性能。

关键词:隐写分析;假设检验;隐马尔可夫树模型

中图分类号:TP391文献标识码:A文章编号:1009-3044(2010)02-299-03

Steganalysis Based on Hypothesis Testing

WANG Yang-guo, WANG Xue-yong, LI Tong-ze, XU Bo

(Military Operations Research Center, Shijiazhuang Army Command College, Shijiazhuang 050084, China)

Abstract: This paper proposes a novel steganalysis scheme based on hypothesis testing. The scheme views the problem of detection the hidden data as binary hypothesis testing and uses hidden Markov tree (HMT) model to estimate the priori probability density of original image. The scheme is applied to detect multiplicative spread spectrum steganography and experimental results indicate the superiority of the HMT based detector than i.i.d based detector.

Key words: steganalysis; hypothesis testing; hidden Markov tree model

1 概述

隐写术(Steganography)通过在载体(图像、视频或音频文件)上嵌入秘密信息以达到隐藏信息的目的。它的一个重要特性就是不可感知性,即虽然载体中嵌入了机密信息,但是并不影响载体的视觉或听觉效果。隐写分析(Steganalysis)就是研究如何通过某种检测方法发现隐藏于载体的信息,目的是破坏信息隐藏系统。隐写分析可分为被动分析和主动分析[1]。被动分析的目的只是检查通信中是否含有隐蔽信息。主动分析的目的则是试图提取、删除、篡改或覆盖部分或全部隐藏信息,以使隐藏系统无法正常工作。

从数字通信的角度看,秘密信息的嵌入可以理解为在一个宽带信道(原始图像)上传输一个窄带信号。尽管嵌入的信号具有一定的能量,但分布到信道中各频率分量上的能量是难以检测到的。由于盲检测相当于在强噪声中检测微弱信号,检测器算法的设计在很大程度上依赖于“信道”的统计模型,即基于宿主载体的统计模型来设计检测器。因此,如何准确描述信道(原始图像)统计模型,对提高检测性能至关重要。

当前,一般对秘密信息假定为服从0均值的高斯随机序列。但是,对原始图像的统计描述,则有多种模型,常用的有高斯分布[2]、拉普拉斯分布[3]和广义高斯分布[4]等。这些模型都是假定原始图像采样(如像素值、DCT系数和DWT系数)是独立同分布的,忽略了采样间的统计相关性。但是实际上采样间却是统计相关的,这样的假设会低估隐写分析算法的性能,高估隐写算法的安全性[5]。一些研究者已经在图像建模方面做出了有益的探索。Sidorov使用MC(马尔可夫链)模型和MRF(马尔可夫随机场)模型来描述像素间的相关性,并用于LSB替换隐藏算法的分析[6];Sullivan使用MC模型用于SS(扩频)类和QIM(量化索引模型)类隐藏算法的分析[5]。本文使用小波域HMT(隐马尔可夫树)[7]模型来描述小波系数间的相关性,提出了基于假设检验的隐写分析方案,并将之应用到乘性扩频隐写算法[8]的检测。实验结果表明,本文提出的考虑相关性的隐写分析方法可以有效地提高隐写分析的检测性能。

本文剩余部分安排为:第2部分描述基于假设检验的隐写分析方案,包括方案描述、需要解决的关键问题和描述统计相关性的HMT模型,第3部分将提出的方案应用于乘性扩频隐写算法的检测,并对实验结果进行分析与对比,结论见第4部分。

2 基于假设检验的隐写分析方案

假定S、W和Z分别指原始图像、秘密信息载体和隐写后的图像样本空间,s、w和z分别是各自空间的一个实例,si、wi和zi分别指它们的第i个采样(采样可以是像素值或变换域系数等)。在嵌入操作前,一般需要对原始图象和秘密信息进行预处理,常用的方法是置乱或随机调制。本研究的目的是从隐写图像{zi}中提取出秘密信息载体,至于从提取的序列中解调出秘密信息,这属于加解密的范畴,不是本文的研究目标。因此,这里的s和w都是指预处理后的信息。一般假设{wi}是高斯随机序列,且统计独立于{si},则隐写过程E可以表示成:

Z=E(S,W)(1)

被动隐写分析的目的,就是要检测出隐写图象z中是否嵌入了秘密信息。

2.1 假设检验方案

从统计学的观点看,被动隐写分析问题本质上是二元假设检验的问题,零假设H0对应待检测图像未嵌入秘密信息,备择假设H1对应待检测图像嵌入了秘密信息。由隐写过程可知,被动分析可表示为如下的二元假设检验:

如果H0为真,判决H1成立,这是一种错误判决,称为第一类错误,或虚警;如果H1为真,判决H0成立,这也是一种错误判决,称为第二类错误,或漏警。

假设原始图像采样序列s的概率密度函数为Ps,则在H0假设下,z的概率密度函数为:

fZ(z|H0)=fS (3)

在H1假设下,z的概率密度函数为:

fZ(z|H1)=fE(4)

似然比表达式为:

Neyman-Pearson准则的判决表达式为:

这里α是给定的虚警概率,判决门限λ由其决定,即

由上式可解得判决门限λ。

此时,对应的检测概率为:

从上面的分析可以得到检测器的结构和计算流程示意图(见图1)。

几点说明:

1)关于原始图像概率密度函数fs的估计。

要做出判决,首先需要知道原始图像概率密度函数fs。但是,在实际环境中,隐写分析人员不太可能知道这种先验知识,一般的处理方法是假设图像采样是服从某种分布的独立同分布序列。这种假设并不合理,因为图像采样间具有很强的相关性,例如,小波系数就具有聚集性和持续性的特点[7]。这样的假设会低估隐写分析算法的性能,高估隐写算法的安全性。鉴于小波分解在信息隐藏领域的广泛应用,本文采用能精确描述小波系数的统计模型―小波域HMT模型来对原始图像建模,并采用EM(expectation maximization)[7]算法估计模型的参数。

2)关于隐写图像概率密度函数fE的计算。

这依赖于对嵌入过程的建模,针对具体的嵌入过程,可以计算出相应的概率密度函数。例如,乘性扩频隐写算法将隐写过程抽象为:

z=E(S,W)=s(1+βW) (9)

β是嵌入强度,此时,隐写图像概率密度函数fE可表示为[9]:

3)检测器的检测性能。

为了考察检测器的性能,我们可以进行蒙特卡罗仿真实验[10],使用接收机工作特性(Receiver Operating Characteristic, ROC)曲线作为检测器的性能指标。ROC曲线描述了检测概率随虚警概率变化的函数关系。

2.2 小波域HMT模型

在HMT模型中,小波系数及其所处的状态构成一个四叉树,其中实心点表示小波系数ci,空心点表示小波系数ci所处的状态Si。用ρ(i)表示节点i的父节点。尺度j=1表示能量最高的层。

1)尺度内的系数服从高斯分布

若已知第i个小波系数的状态概率,则小波系数ci的概率密度与其它小波系数及状态无关。即:

其中,

Psi=P(Si=m|θ)表示已知参数θ的情况下第i个小波系数处于状态m的概率;

fci|si(Ci|Si=m)=h(Ci,μi,m,δi2,m)表示第i个小波系数处于状态m时取值为ci的概率,它服从均值、方差分别为μi,m,vi,m的高斯分布。M为第i个小波系数可能的状态数。

一般为了简化模型,都取μi,m=V,M=2(即小波系数有两种状态:“大”和“小”)。本文也同样处理。

2)尺度间状态的MC依赖

对于小波系数沿尺度的能量相关性,HMT 模型以隐状态的马尔可夫链来描述,即第i个小波系数的状态仅依赖于父节点ρ(i)的状态,这种依赖关系由以下条件概率表示:

于是小波域的HMT模型可以用下面的参数集来完整地描述:

(13)

该统计模型可以有效地描述小波系数的统计分布及不同尺度间系数的能量相关性,模型参数的估计可以通过EM算法获得。

如果知道小波系数C和模型参数θ,则可以通过Upward-Downward[7]方法求出各小波系数的后验状态概率P(Si=m|C,θ)。

3)小波系数的联合概率密度

已知小波系数及其状态,则小波系数的联合概率密度函数可以按下式求出:

这里K为小波系数的个数。

3 乘性扩频隐写算法的检测

我们将提出的检测方案应用于检测乘性扩频隐写。隐写图像由公式(9)得到,采用HMT模型对图像建模并估计模型参数,原始图像概率密度函数fS由公式(14)估计得到,隐写图像概率密度函数fE由公式(10)计算得到,判决门限可以通过公式(7)计算得到。

需要说明的是,嵌入强度β未知,且取值可正可负,因此,判决准则取决于参数β。为简化计算,我们这里不妨设β>0。

3.1 实验设计

1)从网上收集1000幅各种大小的图片,并转为8位深度的灰度图像作为原始载体图像。

2)生成均值为0、方差为1、长度L分别为10、100、1000、2000和5000的5组高斯随机序列,作为嵌入的秘密信息。

3)将每幅载体图像小波分解,选取中频带最大的L个系数嵌入秘密信息,分别嵌入上述5组不同随机序列,取嵌入强度β=0.1,嵌入后的小波系数由公式(9)计算得到,然后再逆小波变换,得到嵌入不同长度秘密信息的5幅隐写图像。

4)将得到的5000幅隐写图像分别使用HMT模型、Gaussian滤波和Wiener滤波进行去噪处理,并计算滤波前后的峰值信噪比(PSNR),以此来比较衡量HMT模型预测载体图像的性能。

5)将所有6000幅图像分别按照文献[11]和本文的方法进行假设检验,判决是否含有秘密信息。分别记录判决正确和发生虚警的次数,以此得到检测器的ROC曲线。

3.2 实验结果与分析

1)HMT模型预测载体图像的性能

表1是512×512×8bit灰度图像Lena分别使用HMT模型、Gaussian滤波和Wiener滤波进行去噪处理,并计算滤波前后的PSNR所得到的结果。从结果来看,HMT预测的性能要明显好于后两者,Wiener滤波的效果最差。对其它隐写图像进行同样的处理,得到的结果也是类似的。

分析其原因,从Wiener滤波公式[12]的推导过程来看,它实际上是假设原始图像服从Gaussian分布,完全忽略图像采样间的相关性;而Gaussian滤波则是使用3×3窗口内像素的均值代替中心点的值,考虑了图像采样的邻域相关性;而HMT则考虑了更复杂的相关性,因此,性能也最好。

2)HMT检测器的性能

作为检测性能的比较,我们采用文献[11]的检测器作为对比,对比结果如图3所示。

从实验结果可以看出,本文的检测器的性能明显优于文献[11]的检测性能。因为后者的检测方法以广义高斯分布来对载体图像进行统计建模,没有考虑到载体图像的实际统计分布特性,自然检测性能比不上更符合实际统计分布的HMT检测器。由此可见,采用采样相关性模型能显著提高隐写分析的性能,这和文献[5]中独立同分布的假设“会低估隐写分析算法的性能,高估隐写算法的安全性”的论断是一致的。

4 结论

该文针对现有的隐写分析方法存在的问题开展研究,应用信号检测理论,将隐写信息的存在性检测转化为二元假设检验问题,提出了基于假设检验的隐写分析方案,并将其应用到乘性扩频隐写算法的检测。该方法将载体图像建模为HMT模型,比独立同分布的模型更符合实际的统计分布特性,实验结果表明,基于该模型的检测器具有更好的检测性能。

参考文献:

[1] Trivedi S,Chandramouli R.Active steganalysis of sequential steganography[J].SPIE conference California,vol.5020,pp.123-130,2003.

[2] Trivedi S,Chandramouli R.Secret key estimation in sequential steganography[J].Signal Processing,IEEE Transactions on.2005,53(2):746-757.

[3] 张涛,平西建.基于差分直方图实现LSB信息伪装的可靠检测[J].软件学报,2004,15(1):151-158.

[4] Cheng Q,Huang T S.An additive approach to transform-domain information hiding and optimum detection structure[J].Multimedia,IEEE Transactions on. 2001,3(3):273-284.

[5] Sullivan K,Madhow U,Chandrasekaran S,et al.Steganalysis for Markov cover data with applications to images[J].IEEE Transactions on Information Forensics and Security.2006,1(2):275-287.

[6] Sidorov M.Hidden Markov models and steganalysis[J].Proceedings of the 2004 workshop on Multimedia and security,2004:63-67.

[7] Crouse M S,Nowak R D,Baraniuk R G.Wavelet-based statistical signal processing using hidden Markov models[J].Signal Processing,IEEE Transactions on.1998,46(4):886-902.

[8] Marvel L,Boncelet C G,Jr,and Retter C T.Spread spectrum image steganography[J].IEEE Trans.on Image Process.1999,8(8):1075-1083.

[9] Papoulis AS,Pillai U.Probability, Random Variables,and Stochastic Processes[M].Boston:McGraw-Hill,2002.

[10] 罗鹏飞,张文明.随机信号分析与处理[M].北京:清华大学出版社,2006:246--247.

[11] Cheng Q,Huang TS.Robust optimum detection of transform domain multiplicative watermarks[M].IEEE Trans.on Signal Processing,2003,51(4):906-924.

[12] Lim J S.Two-dimensional signal and image processing[M].NJ:Prentice-Hall,1990:674-693.