1.前言
在現實生活中,恐怖分子嵌入秘密指令的載體往往是彩色圖像而不是灰度圖像,本文經過調查研究,提出一個針對彩色圖像的隱寫檢測分析方案,具有很好的隱寫檢測正確率。
2.研究內容
2.1圖像表示規范
給一個RGB真彩色圖像X,它的大小是MxN。X被表示為紅、綠、藍三個顏色通道{X1,X2,X3},其中,
,
,
,
。隱寫算法被應用于彩色圖像上,相當于將+1或-1的隱寫噪聲添加到每個顏色通道上。因此,經過隱寫后,彩色圖像X的每個顏色通道可以被表示為
,其中
,
表示對應的顏色通道,
,
表示添加的隱寫噪聲。對于一個原始圖像,
,
的值都是0,表示未添加隱寫噪聲。
2.2兩種卷積方式
所有的深度學習隱寫分析都基于卷積神經網絡CNN。CNN的主要部分是不斷交替使用的卷積層、正則層和池化層的堆疊體,在它們的最頂部即最后輸出結果的位置是可選的多個全連接層。卷積層是CNN的核心組成部分。對于一個卷積層,設當前卷積層是,它將上層J通道的輸出特征圖
,
作為輸入,與JxK個卷積核
做卷積運算生成一個K通道的輸出
,
。在圖像隱寫分析領域,
,
和
是一個二維矩陣。標準卷積運算可表示為:
如下圖。
設計一種通道級別的卷積運算方式,它是標準卷積運算的一個變體。在通道級別的卷積運算方式中,輸入變量的每個通道與K個卷積核做運算后生成對應K個通道的值,這樣當輸入變量是J個通道時,輸出特征圖的通道數為JxK,此時卷積可表示為:
如下圖。
2.3兩種卷積方式對隱寫分析的貢獻
對于隱寫分析工作,彩色隱寫圖像的三個顏色通道相同位置的強度值顯示出很強的相關性。從統計的角度來看,它們的均值(或期望)相似,但顏色通道間由隱寫噪聲+1或-1造成的差異非常小。
設E([·])和Var([·])表示矩陣[·]的期望和方差,Corr([·], [·])表示矩陣[·]和[·]的相關性。在隱寫分析領域信噪比SNR可表示為:
對于標準卷積,對彩色隱寫圖像做卷積運算生成一個K通道的輸出特征圖,則計算過程可表示為:
此時,信噪比可表示為:
設,
,已知彩色圖隱寫術將隱寫信號盡可能均勻地嵌入到三個顏色通道中,因此,設
,
,則
因為卷積運算屬于線性變換類別,而線性變換不會影響變量的相關性,因此,
已知對于彩色隱寫圖,經統計各通道相同位置隱寫噪聲的相關性不超過0.3,因此設置。則:
而對于通道級別的卷積運算方式,則不存在通道間隱寫噪聲相關性的比較,對于每個顏色通道,有:
分析可知,,
,標準卷積確實削弱了信噪比,通道級別的卷積運算方式則有效地提高了信噪比。因此,標準卷積能保留隱寫圖內容的相關性,卻削弱了隱寫噪聲,而通道級別的卷積運算方式則有效地保留了隱寫噪聲。
2.4隱寫分析模型
在模型底層即輸入彩色圖的位置,使用通道級別的卷積運算方式能更好地保留隱寫圖像的隱寫特征,并選擇空域富模型的高通濾波器初始化卷積核從而更好地提取隱寫特征。在之后的卷積層中,連接特征圖,使用標準卷積保留并訓練豐富的隱寫特征內容。最后使用全連接層匯聚特征做預測。
模型基本架構如下圖。模型將真彩色圖像作為輸入,并對輸入圖像的紅色、綠色和藍色通道分別應用通道級別的卷積運算方式。在這一過程,分配給每個通道的卷積核權重通過SRM中的30個高通濾波器進行初始化,以提高信噪比。因此,每個通道與三十個5?x?5的已初始化的卷積核權重矩陣進行卷積,并對應生成三十個通道的特征圖。注意,在訓練過程中,本文將卷積核權重矩陣設置為可學習模式,即在訓練過程中權重矩陣值會隨著訓練而變化。然后將三個獨立的輸出通道組連接在一起,以形成第二個卷積層的90通道的輸入特征圖。
從第二個卷積層開始,即應用標準卷積運算方式。在這一階段,正常的卷積層中結構依次是卷積運算層、BN層、ReLU層和平均池化層,在第一個正常卷積層中添加了絕對值操作獲取卷積運算后的絕對值。因為預處理層得到的隱寫殘差信息經過卷積運算后具有符號對稱性,取其絕對值更有利于增強模型的特征表達。在此階段中,從底部到頂部的正常卷積層的輸出特征圖的大小分別為256?x?256、128?x?128和32?x?32。為了保持每個卷積層的復雜度從而更好地進行隱寫特征的提取和處理,將每個卷積層中的卷積核數相應地增加了四倍,這樣,輸出特征圖的數量分別為72 ,288和1152。在最頂部的正常卷積層后面,將輸出特征圖以32的步幅合并,合并后的特征向量作為全連接網絡的輸入。在最高層的全連接網絡中,所有三個隱藏層都使用ReLU激活功能,最后一個全連接層包含兩個神經元表示預測的正常圖像和隱寫圖像的結果。
在卷積網絡的頂部,有一個四層全連接神經網絡,可以匯聚特征進行最終的分類預測。全連接網絡層分別包含800、400、200和2個神經元。
網絡結構的核心代碼如下:
本文實驗的數據源是BOSSBase v1.01,將其圖像集通過轉換和隱寫操作生成1000對彩色的原始圖像和隱寫圖像。mini-batch隨機梯度下降方法訓練模型,設置batch_size為16,設置學習率為0.001。在10000對原始圖像和隱寫圖像中,隨機選擇5000對用于訓練,1000對用于驗證,4000對用于測試。
2.5底層優化的卷積核對隱寫性能的貢獻
在模型底層通道級別的卷積運算中,卷積核數值使用高通濾波器初始化后,還會隨著網絡的訓練過程不斷優化,最終有效地提升模型的隱寫分析性能。但這里優化的詳細作用一直眾說紛紜。本文針對當前模型解釋這一優化的詳細作用。
自從提出了空域富模型SRM以來,模型多樣性對于隱寫分析的性能至關重要。因此,本文認為本隱寫分析模型的性能提高歸功于模型底層卷積層中經過不斷學習和優化卷積核帶來的模型多樣性,并認為底層卷積層的卷積核不能有效地提升信噪比。下面詳細展開說明。
底層卷積核可分為三個通道的卷積核,記為,
,則不同通道卷積核權重的相關性的平均值可記為:
可用于評估底層卷積核的多樣性,其值越小,則卷積核相關性越弱,多樣性越豐富。初始狀態下
,
是SRM中的高通濾波器,因此初始狀態下
,表示卷積核相關性最強,多樣性差。在訓練過程的模型驗證中,隨著模型性能提升,發現卷積核權重通過學習不斷更新數值,然而
卻不斷減小,說明更新后的卷積核多樣性越來越豐富,卷積核多樣性和模型的性能是正相關的。
在上文中有提到隱寫分析領域信噪比SNR的計算方法,其中假設,則對于一個圖像定義
,
,則
。設
是
與
的夾角,夾角的變化程度可通過余弦相似度的絕對值來表示:
當與
的夾角越逼近時,
越接近1,在初始狀態
。在訓練過程的模型驗證中,可知
一直逼近1而沒有什么明顯的升降趨勢,這有力地證明了在訓練過程中,
一直逼近0,即
約等于
,則
,因此對于本模型,前述信噪比SNR的假設是合理的,推導過程是正確的。
所以,底層卷積層的卷積核權重通過不斷優化,增加了卷積核權重的豐富性,這有效地提升了模型的隱寫分析性能。
2.6實驗結果
對圖像集做了HILL隱寫術操作和隱寫分析,結果如下,可知隱寫分析模型具有良好的準確率。
核心網絡代碼鏈接:
https://github.com/HYWZ36/Color_Steganalysis
參考資料:
http://dde.binghamton.edu/download/ImageDB/BOSSbase_1.01.zip
https://ieeexplore.ieee.org/document/7109899
https://ieeexplore.ieee.org/document/7342902
https://ieeexplore.ieee.org/document/8664587
https://ieeexplore.ieee.org/document/7084325