《電子技術(shù)應用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應用 > 基于卷積神經(jīng)網(wǎng)絡(luò)的詩詞隱寫檢測方法
基于卷積神經(jīng)網(wǎng)絡(luò)的詩詞隱寫檢測方法
2018年電子技術(shù)應用第10期
金 鵬1,2,楊忠良1,2,黃永峰1,2
1.清華大學 電子工程系,北京100084;2.清華信息科學與技術(shù)國家實驗室,北京100084
摘要: 利用詩詞作為載體實現(xiàn)文本信息隱藏是近兩年非常熱門的研究方向。這一類方法具有隱藏容量大并且隱蔽性高的優(yōu)點。然而現(xiàn)在還沒有針對這一類方法的非常有效的隱寫檢測算法。提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的詩詞隱寫檢測算法,該算法能自動判斷輸入的文本是否含有隱藏信息。通過大量數(shù)據(jù)對模型進行訓練并測試,實驗結(jié)果顯示所提出的模型能達到94.8%的檢測準確率,表現(xiàn)出非常高的詩詞隱寫檢測性能。
中圖分類號: TP309.2
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.180439
中文引用格式: 金鵬,楊忠良,黃永峰. 基于卷積神經(jīng)網(wǎng)絡(luò)的詩詞隱寫檢測方法[J].電子技術(shù)應用,2018,44(10):114-117,126.
英文引用格式: Jin Peng,Yang Zhongliang,Huang Yongfeng. Poetry steganalysis based on convolutional neural network[J]. Application of Electronic Technique,2018,44(10):114-117,126.
Poetry steganalysis based on convolutional neural network
Jin Peng1,2,Yang Zhongliang1,2,Huang Yongfeng1,2
1.Department of Electronic Engineering,Tsinghua University,Beijing 100084,China; 2.Tsinghua National Laboratory of Information Science and Technology,Beijing 100084,China
Abstract: Using Chinese poetry as a carrier to realize text information hiding(IH) is a very hot research topic in the resent years. This kind of method has the advantages of large capacity and high concealment. However there isn′t a very effective steganalysis detection algorithm according to this kind of method. This paper puts forward a kind of poetry steganalysis detection algorithm based on convolution neural network(CNN),which can automatically judge whether the text of the input contains hidden information or not. Through training and testing the model by a large amount of data, the experiment results show that the proposed model can achieve 94.8% of detection accuracy, which shows very high poetry steganographic detection performance.
Key words : convolutional neural network;information hiding;steganography detection

0 引言

    隱寫術(shù)是信息安全領(lǐng)域的一個非常重要的研究熱點,它通過難以察覺的方式將秘密信息隱藏到數(shù)字載體中。它可以用來建立秘密信道,并通過互聯(lián)網(wǎng)在連接受到限制或監(jiān)控的雙方之間傳遞隱蔽信息[1]。密碼術(shù)主要通過設(shè)計加密技術(shù),使保密信息不可讀,但同時也暴露了數(shù)據(jù)的重要性,使其更容易遭受攔截、破解等攻擊。而隱寫術(shù)則致力于通過設(shè)計精妙的方法,使其根本不會引起非授權(quán)者的注意并且無從得知保密信息的存在與否。由此可以看出,隱寫術(shù)的最大特征就是具有極強的隱蔽性。基于此,設(shè)計并實現(xiàn)自動隱寫檢測方法成為一件非常具有挑戰(zhàn)性的任務(wù)。

    信息載體的形式多種多樣,因此有基于不同載體的信息隱藏方法,比如基于圖像[2]、語音[3]、文本[4-5]等。這些隱寫技術(shù)在信息安全保障體系的諸多方面發(fā)揮著重要作用。但隱寫術(shù)也有可能被用于非法目的。因此,急需解決非法信息的檢測問題,阻止非法信息的傳輸。由于圖像和語音相比于文本具有更大的信息冗余度,使其成為非常常用的信息隱藏載體,相關(guān)的信息隱藏技術(shù)[6-7]也已經(jīng)比較成熟。

    文本中可用于隱藏數(shù)據(jù)的冗余空間非常有限,導致在文本中嵌入信息非常困難,但也吸引了大量研究者對其進行研究。現(xiàn)有的基于文本的信息隱藏方法大致可以分為兩大類,一類是基于文本格式[5,8-9],一類是基于文本內(nèi)容[10-11]。基于文本格式的信息隱寫方法一般將文本當成一種特殊編碼的圖像進行處理,它們通過調(diào)整文本的字符間距[8]、字詞的偏移[5]、字符編碼方式[9]等實現(xiàn)信息隱藏。這一類方法通常容量較大、實現(xiàn)簡單,但魯棒性不強。基于文本內(nèi)容的方法,通常通過對文本進行詞匯、句法、語義等方面的修改,盡量保持文本局部以及全局語義不變、語法正確的方式來實現(xiàn)信息的嵌入。例如,文獻[12]利用馬爾科夫模型進行自然文本生成并通過對生成過程中轉(zhuǎn)移概率進行編碼實現(xiàn)信息隱藏,但存在的缺點是生成的文本都不太自然。然而,隨著近些年自然語言處理技術(shù)的發(fā)展,出現(xiàn)了越來越多基于文本自動生成的信息隱藏方法,例如一些隱寫技術(shù)能自動生成大量的詩詞并在生成過程中實現(xiàn)大容量秘密信息嵌入[13-15],同時最終生成的詩很難與真實詩人寫的詩區(qū)分開。這一類方法比基于格式的方法具有更強的魯棒性和更好的隱蔽性。目前基于文本語義內(nèi)容的信息隱藏技術(shù)是文本信息隱藏技術(shù)發(fā)展的研究重點和熱點。本文主要針對這一類方法,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的文本自動隱寫檢測方法,實現(xiàn)對文本中是否隱藏信息的自動識別。

1 相關(guān)研究工作

    隱寫分析技術(shù)是和隱寫術(shù)相對抗的一種技術(shù)。通常認為判定某個數(shù)據(jù)載體中隱藏信息的存在即可認為該隱寫系統(tǒng)被攻破。因此,本文重點研究自動檢測文本中是否含有隱藏信息。

    目前,已有的文本隱藏信息檢測研究要么是主要針對一些特定的隱藏算法進行研究,要么是根據(jù)人為定義的統(tǒng)計規(guī)則進行判別。針對前一類方法的研究有:吳明巧僅僅針對Stego工具,提出了基于標記特征與統(tǒng)計特征相結(jié)合的檢測方法[16];KWON H等針對基于文檔結(jié)構(gòu)數(shù)據(jù)的隱藏信息,利用微軟復合文檔格式特征的分析,檢測利用未用空間和插入流數(shù)據(jù)隱藏的信息的存在性[17]。針對后一類方法的研究有:周繼軍借鑒概念圖的思想,提出了基于句間相關(guān)性度量判定法的自然語言隱藏信息檢測算法[18];HUANG L S研究團隊也提出了基于詞位置分布統(tǒng)計特征[19]以及基于統(tǒng)計詞的頻度、檢測熵的方法[20]。這些文本隱寫檢測方法最大的缺點在于,它們的針對性太強,覆蓋的可檢測的信息隱藏方法有限。

    隨著技術(shù)的發(fā)展,已經(jīng)有很多研究將信息隱藏和特殊文本的生成相結(jié)合起來,取得了不錯的效果。比如DESOKY A利用很多特殊的文本形式,例如筆記[15]、笑話[21]等來隱藏信息。文獻[14]中提出的模型利用計算機自動生成詩詞實現(xiàn)信息隱藏。文獻[4]和[13]中也通過利用馬爾科夫模型和循環(huán)神經(jīng)網(wǎng)絡(luò)算法生成符合規(guī)則的詩詞。這一類方法生成的詩詞對于未經(jīng)訓練的人很難區(qū)分開,因此具有極高的隱蔽性。現(xiàn)在還沒有針對這一類隱寫算法的隱寫檢測算法,本文的目的就在于解決這個問題。

2 基于卷積神經(jīng)網(wǎng)絡(luò)的詩詞隱寫檢測方法

    近兩年,以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度神經(jīng)網(wǎng)絡(luò)模型在計算機視覺[22]和自然語言處理[23]等領(lǐng)域取得非常大的成功。大量的研究顯示卷積神經(jīng)網(wǎng)絡(luò)具有強大的特征抽取和表達能力,能自動從大量數(shù)據(jù)中學習得到特征[22]。本文中設(shè)計并實現(xiàn)了一套基于卷積神經(jīng)網(wǎng)絡(luò)的自動文本隱寫檢測算法,它能自動對待檢測的文本進行特征抽取進而判斷是否隱藏信息。

    本文最終采用的卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如下:一個輸入層、一個包含多個不同尺寸卷積核的卷積層、一個平均池化層、一個全連接層以及一個Softmax分類器。輸入層將輸入文本轉(zhuǎn)換成一個適合后續(xù)卷積層操作的二維矩陣。卷積層用來對輸入矩陣進行特征抽取,不同尺寸的卷積核能學到不同的上下文相關(guān)特征。平均池化層用來對學習的特征進行下采樣,它能增強模型的魯棒性并顯著提升模型性能。全連接層用來對學習到的特征進行融合并送給Softmax分類器。Softmax分類器的參數(shù)通過自學習完成之后,對輸入的特征向量進行分類,判斷是否發(fā)生了信息隱寫。卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。

tx2-t1.gif

    模型的輸入是待檢測的文本,輸出是判斷是否發(fā)生隱寫的概率。對于每一個輸入的待檢測文本S,將其表示成如式(1)所示的矩陣,其中矩陣的第i行表示文本S中第i個詞,每個詞表示成一個隨機初始化的D維的向量,即:

tx2-gs1-3.gif

tx2-gs4-13.gif

其中,P和T向量的維度都是2,分別表示有/沒有隱藏信息。T是輸入文本的標簽,如:可以用向量[0,1]表示有隱寫,[1,0]表示沒有隱寫。

    模型的訓練過程是通過在訓練數(shù)據(jù)集上最小化LOSS函數(shù),采用的是帶動量項的隨機梯度下降算法(SGD)。對模型中參數(shù)w的更新公式如下:

tx2-gs14.gif

3 實驗結(jié)果及評估

3.1 實驗數(shù)據(jù)

    在本次實驗中,為了測試本文模型的性能,收集了全唐詩共13 342首五言詩作為正樣本,即不含隱藏信息的樣本。然后利用文獻[4]中的算法生成10 000首隱藏信息的五言詩作為負樣本。因此整個實驗所用到的數(shù)據(jù)集共含有23 342首五言詩,利用其中17 000首作為訓練集訓練本文模型,剩下6 342首作為測試集測試本文模型,具體劃分如表1所示。

tx2-b1.gif

3.2 實驗設(shè)置

    對于每首輸入模型的樣本,首先對其進行去結(jié)構(gòu)化。具體來說,即去掉每首詩的標題,并將剩下的4句話首尾相連,因此每首詩都轉(zhuǎn)化為一個包含20個字的文本。其次,將每個字映射成一個300維隨機初始化的向量,因此實際上模型的輸入是一個20×300的矩陣。卷積層中卷積核的寬度和輸入矩陣寬度一致,即300維。而卷積核的高度是可變的,實驗中采用的卷積核高度是1,2,3,并且每個尺寸包含56個卷積核。最后輸出層的維度是2,對應是否隱藏信息。訓練過程中,采用隨機梯度下降方法訓練模型參數(shù),初始學習率為0.01。

3.3 實驗結(jié)果及分析

    采用幾種分類任務(wù)中常用的指標來評價本文模型最后的性能,即Precision、Recall、F1-score和Accuracy。計算公式如下:

     tx2-gs15-18.gif

其中,TP表示正樣本被預測為正樣本的數(shù)量,F(xiàn)P表示負樣本被預測成正樣本的數(shù)量,F(xiàn)N表示正樣本預測成負樣本的數(shù)量,TN表示負樣本預測成負樣本的數(shù)量。

    表2中展示了本文模型以及其他3種機器學習算法的測試結(jié)果,其中CNN表示本文模型的結(jié)果。從結(jié)果中可以看到,本文模型在各個指標上取得了最好的實驗結(jié)果,這充分證明了本文模型強大的特征抽取能力,能非常有效地應用于文本隱寫檢測任務(wù)上。

tx2-b2.gif

4 結(jié)論

    文中提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的文本隱寫分析算法。它能自動從大量數(shù)據(jù)中提取到高層次的語義信息,并判斷輸入文本中是否隱藏信息。同時,利用大量的數(shù)據(jù)訓練并測試本文模型,結(jié)果反映該模型能非常高準確率地檢測出文本中是否含有隱藏信息,證明了模型的有效性。

參考文獻

[1] PETITCOLAS F A P,ANDERSON R J,KUHN M G.Information hiding-a survey[J].Proceedings of the IEEE,1999,87(7):1062-1078.

[2] ZHOU Z,SUN H,HARIT R,et al.Coverless image stega-nography without embedding[C].International Conference on Cloud Computing and Security Nanjing University of Aeronautics and Astronautics,2015.

[3] PENG X,HUANG Y,LI F.A steganography scheme in a low-bit rate speech codec based on 3d-sudoku matrix[C].IEEE International Conference on Communication Software and Networks,2016:13-18.

[4] LUO Y,HUANG Y.Text steganography with high embedding rate: using recurrent neural networks to generate Chinese classic poetry[C].ACM Workshop on Information Hiding and Multimedia Security,2017:99-104.

[5] SHIRALI-SHAHREZA M H,SHIRALI-SHAHREZA M.A new approach to persian/arabic text steganography[C]. IEEE/ACIS International Conference on Computer and Information Science and IEEE/ACIS International Workshop on Component-Based Software Engineering,Software Architecture and Reuse,2006:310-315.

[6] KER A D,BOHME R.Revisiting weighted stego-image steganalysis[J].Proceedings of SPIE-The International Society for Optical Engineering,2008,6819:681905.

[7] ALTUN O,SHARMA G,CELIK M,et al.Morphological steganalysis of audio signals and the principle of diminishing marginal distortions[C].Proceedings of IEEE International Conference on Acoustics,Speech,and Signal Processing,2005,2:21-24.

[8] CHOTIKAKAMTHORN N.Electronic document data hiding technique using inter-character space[C].The 1998 IEEE Asia-Pacific Conference on Circuits and Systems,1998.IEEE APCCAS 1998,1998:419-422.

[9] LOW S H,MAXEMCHUK N F,LAPONE A M.Document identification for copyright protection using centroid detection[J].IEEE Transactions on Commun.1998,46(3):372-383.

[10] MAHATO S,KHAN D A,YADAV D K.A modified approach to data hiding in microsoft word documents by change-tracking technique[J/OL].Journal of King Saud University.(2017-08-30)[2018-02-08].https://www.sciencedirect.com/science/article/pii/S1319157817300939?via%3Dihub.

[11] MURPHY B,VOGE C.The syntax of concealment: reliable methods for plain text information hiding[C].Proceedings of SPIE,2007:6505.

[12] GE X,JIAO R,TIAN H,et al.Research on information hiding[J].US-China Education Review,2006,3(5):77-81.

[13] LUO Y,HUANG Y,LI F,et al.Text steganography based on ci-poetry generation using markov chain model[J].Ksii Transactions on Internet & Information Systems,2016,10(9):4568-4584.

[14] YU Z S,HUANG L S.High embedding ratio text steganography by ci-poetry of the song dynasty[J].Journal of Chinese Information Processing,2009,23(4):55-62.

[15] DESOKY A.Notestega:notes-based steganography methodology[J].Information Systems Security Journal,A Global Perspective,2009,18(4):178-193.

[16] 吳明巧,金士堯.針對文本隱寫工具Stego的隱寫分析方法[J].計算機工程,2006,32(23):10-12.

[17] KWON H,KIM Y,LEE S,et al.A tool for the detection of hidden data in microsoft compound document file format[C].International Conference on Information Science and Security.IEEE,2008:141-146.

[18] 周繼軍,楊著,鈕心忻,等.文本信息隱藏檢測算法研究[J].通信學報,2004,25(12):97-101.

[19] CHEN Z L,HUANG L S,YU Z S,et al.A statistical algorithm for linguistic steganography detection based on distribution of words[C].Third International Conference on Availability, Reliability and Security.IEEE Computer Society,2008:558-563.

[20] CHEN Z L,HUANG L S,YU Z S,et al.Effective linguistic steganography detection[C].IEEE,International Conference on Computer and Information Technology Workshops,2008,Cit Workshops.IEEE,2008:224-229.

[21] DESOKY A.Jokestega:automatic joke generation-based steganography methodology[J].International Journal of Security and Networks,2012,7(3):148-160.

[22] KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[C].International Conference on Neural Information Processing Systems.Curran Associates Inc.2012:1097-1105.

[23] KIM Y.Convolutional neural networks for sentence classification[Z].arXiv:1408.5882,2014.




作者信息:

金  鵬1,2,楊忠良1,2,黃永峰1,2

(1.清華大學 電子工程系,北京100084;2.清華信息科學與技術(shù)國家實驗室,北京100084)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美在线3区| 欧美国产日韩精品| 日韩一级黄色片| 亚洲国产99| 香蕉久久精品日日躁夜夜躁| 99精品国产在热久久下载| 在线精品视频一区二区三四| 国产在线视频不卡二| 国产欧美一区二区三区沐欲| 欧美性事免费在线观看| 欧美日韩亚洲国产一区| 欧美另类视频| 欧美激情亚洲激情| 欧美国产激情| 欧美精品videossex性护士| 欧美 亚欧 日韩视频在线| 麻豆精品在线观看| 猛男gaygay欧美视频| 麻豆成人综合网| 美女黄毛**国产精品啪啪| 六月婷婷一区| 欧美大片一区二区三区| 欧美激情一区在线| 欧美日本一道本| 欧美午夜精品电影| 国产精品国产福利国产秒拍| 国产精品久久影院| 国产日韩亚洲| 国内视频精品| 亚洲激情电影在线| 亚洲乱码国产乱码精品精| 在线视频精品一区| 亚洲视频专区在线| 新67194成人永久网站| 亚洲第一毛片| 日韩亚洲欧美成人一区| 一区二区三区高清视频在线观看 | 亚洲欧美激情一区二区| 午夜在线a亚洲v天堂网2018| 久久精品国产久精国产爱| 久久亚洲欧洲| 欧美日韩国产在线观看| 国产乱码精品一区二区三区不卡| 国产综合av| 亚洲欧洲日产国产综合网| 亚洲视频在线观看三级| 欧美一区二区高清| 亚洲美女诱惑| 校园春色综合网| 噜噜噜躁狠狠躁狠狠精品视频 | 国产欧美日韩视频一区二区| 在线看国产一区| 99精品视频免费| 亚洲自拍三区| 亚洲经典视频在线观看| 亚洲一区三区视频在线观看 | 国产午夜精品一区二区三区视频| 影音先锋久久精品| 一区二区三区久久久| 久久国产色av| 亚洲视频在线视频| 巨乳诱惑日韩免费av| 国产精品video| 怡红院av一区二区三区| 在线一区二区三区四区五区| 久久精品国产视频| 亚洲午夜av| 久热国产精品视频| 国产精品捆绑调教| 亚洲国产美女| 亚洲欧美中日韩| 亚洲视频成人| 蜜臀久久99精品久久久久久9| 国产精品久久久久av免费| 亚洲高清自拍| 欧美一区二区三区免费大片| 亚洲图片自拍偷拍| 欧美成在线视频| 国产午夜精品理论片a级大结局 | 在线视频日韩| 免费成人黄色| 国产一区二区精品在线观看| 99国产精品一区| 亚洲精品国产系列| 久久精品成人一区二区三区| 欧美日韩中字| 亚洲国产高清在线观看视频| 欧美亚洲免费电影| 亚洲免费视频在线观看| 欧美连裤袜在线视频| 在线观看国产欧美| 欧美一区国产在线| 午夜精品亚洲一区二区三区嫩草| 欧美精品乱码久久久久久按摩| 激情欧美一区二区三区在线观看| 亚洲女人天堂av| 亚洲影视在线| 欧美日韩成人综合天天影院| 影音先锋久久久| 久久成人一区| 久久精品亚洲一区二区三区浴池| 欧美午夜电影一区| 亚洲肉体裸体xxxx137| 亚洲激情一区二区| 老司机成人网| 国精品一区二区三区| 亚洲欧美成人精品| 亚洲自拍偷拍网址| 国产精品99免视看9| 亚洲美女毛片| 99视频在线观看一区三区| 美女视频网站黄色亚洲| 激情小说另类小说亚洲欧美| 欧美一区二区三区免费观看视频| 欧美亚洲视频在线看网址| 国产精品乱人伦一区二区| 亚洲视频一区在线| 亚洲欧美国内爽妇网| 国产精品毛片| 亚洲欧美日韩精品久久久久| 性做久久久久久久免费看| 国产麻豆91精品| 先锋a资源在线看亚洲| 久久不射2019中文字幕| 国产日韩在线播放| 欧美亚洲综合久久| 久久久亚洲人| 在线欧美日韩| 日韩视频中文字幕| 欧美日韩美女| 亚洲一区二区三区精品动漫| 午夜久久99| 国产亚洲欧美一区二区三区| 欧美在线视频一区二区| 久久久噜噜噜久噜久久| 黄色成人精品网站| 最新日韩中文字幕| 欧美日韩久久久久久| 亚洲午夜精品| 久久国产欧美精品| 精品动漫3d一区二区三区| 亚洲激情国产精品| 欧美日韩精品久久久| 亚洲视频第一页| 欧美中文字幕在线播放| 海角社区69精品视频| 亚洲精品国久久99热| 欧美日韩亚洲一区| 亚洲欧美三级伦理| 久久中文精品| 亚洲麻豆视频| 欧美中文字幕在线播放| 黑人巨大精品欧美一区二区| 亚洲激情一区| 欧美视频一区二区三区| 亚欧成人在线| 欧美激情一区二区三区在线视频| 夜夜爽av福利精品导航| 欧美中文字幕视频| 亚洲国产影院| 午夜一区在线| 亚洲高清视频在线| 亚洲免费在线看| 黄色精品网站| 亚洲视频一区| 国产一区日韩二区欧美三区| 亚洲精品国产精品国自产在线| 欧美色偷偷大香| 久久精品国产久精国产思思| 欧美激情第二页| 亚洲欧美美女| 欧美激情一区二区三级高清视频| 亚洲一区二区三区四区在线观看 | 久久久久久久波多野高潮日日| 亚洲电影第1页| 亚洲欧美日韩一区| 亚洲盗摄视频| 欧美亚洲一区二区在线观看| 亚洲高清不卡在线| 小黄鸭精品密入口导航| 91久久视频| 久久精品中文字幕一区二区三区| 亚洲国产日韩一级| 欧美影视一区| 亚洲免费成人av| 久久视频一区| 亚洲香蕉网站| 欧美高清在线一区二区| 亚洲欧美激情视频在线观看一区二区三区| 免费看成人av| 欧美亚洲午夜视频在线观看| 欧美日韩mv| 亚洲国产成人精品久久久国产成人一区| 欧美日韩一区三区| 亚洲欧洲中文日韩久久av乱码| 国产女人精品视频| 99精品视频免费全部在线| 国产一区二区三区四区老人| 亚洲专区一区| 亚洲另类一区二区|