《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 基于字節序列頻域采樣的惡意軟件分類
基于字節序列頻域采樣的惡意軟件分類
網絡安全與數據治理
蔣永康,孫遜,楊玉龍
貴州航天計量測試技術研究所
摘要: 近年來,利用機器學習直接從文件字節序列中提取特征并進行惡意軟件分類的方法受到了廣泛關注。但惡意軟件字節序列較長,直接輸入模型進行訓練,時間和空間開銷巨大,難以適用大數據場景下的海量文件樣本。針對該問題,提出基于字節序列頻域采樣的惡意軟件分類方法,通過離散傅里葉變換設計頻域采樣策略保留字節序列中的主要低頻成分,合成新的短信號,實現訓練效率的提高。公開數據集上的實驗結果表明,與最先進的基于原始字節序列的惡意軟件分類方法相比,所提出的方法與其分類效果相當,且將模型的訓練時間和GPU顯存占用分別降低了90%和50%以上。
中圖分類號:TP393.08文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.01.003引用格式:蔣永康,孫遜,楊玉龍. 基于字節序列頻域采樣的惡意軟件分類[J].網絡安全與數據治理,2025,44(1):15-20.
Frequency domain sampling of byte sequences for malware classification
Jiang Yongkang,Sun Xun,Yang YuLong
Institute of Guizhou Aerospace Measuring and Testing Technology
Abstract: Recently, methods of using machine learning to directly extract features from byte sequences and classify malware have received widespread attention. However, byte sequences of malware are long, directly inputting them into models for training will involve large time and space overheads, making it difficult to adapt to massive samples in big data scenarios. To address this problem, this paper proposes a malware classification method based on frequency domain sampling of byte sequences. A frequency domain sampling strategy is designed through discrete Fourier transform to retain main low-frequency components in byte sequence, synthesize new short signals, and achieve the purpose of improving training efficiency. Experimental results show that compared with the state-of-the-art malware classification method based on raw byte sequences, the proposed method has comparable accuracy and can reduce the model training time and GPU memory usage by more than 90% and 50% respectively.
Key words : malware classification; byte sequences; frequency domain sampling; machine learning

引言

惡意軟件分類致力于研究如何識別惡意軟件以及區分不同的惡意軟件家族,作為網絡安全研究領域中的一個重要分支,對于理解和防御不同類型的惡意軟件以及溯源網絡攻擊具有重要意義。惡意軟件分類方法大致可以分為:基于靜態特征[1]和動態特征[2]的傳統方法,以及引入機器學習[3]的新式方法。基于靜態特征的方法[4-6]依賴于復雜的特征工程,難以應對惡意軟件的快速演化;基于動態特征的方法[7-9]涉及耗時的行為特征監控[10],難以規模擴展。近年來,利用機器學習直接從文件字節序列中提取特征并進行惡意軟件分類的方法受到了廣泛關注[11-12]。該方法的框架如圖1所示,其研究核心是設計一個分類模型,將輸入樣本x的字節序列映射到一個范圍為[0,1]的概率分布c=[c0,c1,…,cM]上,其中∑cm=1。測試時,計算類別m=argmax(c),m=0表示良性軟件,m≥1表示相應的惡意軟件家族。如果M=1,分類模型實現面向良性軟件與惡意軟件的二分類;如果M≥2,則分類模型實現面向惡意軟件家族的多分類,此時良性軟件被看作一類特殊的家族。

03.1.png

圖1基于字節序列分析的惡意軟件分類框架

通過機器學習模型自動地從序列中提取和編碼特征的技術路線能更好地適應當今惡意軟件的動態變化,也能更好地實現各類型和跨平臺的惡意軟件分類。然而,當面對大數據場景下的海量文件樣本時,該路線面臨因惡意軟件的字節序列較長,直接輸入模型進行訓練,導致時間和空間開銷巨大的挑戰。從形式上看,字節序列分類任務類似于時間序列分類任務,借鑒其研究成果已被證明極具挑戰[12]。惡意軟件通常包含數十萬到數百萬長度的字節序列,以100萬長度的字節序列為例,其相當于T=1 000 000步長的時間序列,而已知的最長時間序列分類任務步長≤16 000[13],這限制了現有時間序列分類模型的直接應用。目前為止,能處理這種極端長度字節序列分類任務的實現是MalConv[11],其通過簡潔的模型設計,可以處理T=2 000 000步長的字節序列。遺憾的是,MalConv的訓練開銷極大,例如在Ember[14]數據集60萬樣本上訓練該模型,128 GB顯存的DGX1需要消耗一個月的時間。盡管MalConv2[12]通過優化池化降低了訓練的顯存開銷,但訓練的時間開銷依然很大。本文針對上述如何提高字節序列分類模型的訓練效率展開研究。通過引入離散傅里葉變換[15]分析文件字節序列的頻率分量發現,字節序列中的能量主要集中在低頻部分。本文通過截取低頻分量來縮短輸入字節序列的長度,進而提出基于字節序列頻域采樣的惡意軟件分類方法。核心的設計思路為:設計頻域采樣策略,保留字節序列中的主要低頻分量,合成新的短信號,從而實現訓練效率的提高。Windows和Android公開惡意軟件數據集上的實驗結果表明,與最先進的基于原始字節序列的MalConv2[12]相比,本文提出的方法與其分類效果相當,且將模型的訓練時間和GPU顯存占用分別降低了90%和50%以上。綜上,本文的主要貢獻如下:(1)提出了一種基于字節序列頻域采樣的惡意軟件分類方法,通過設計頻域采樣策略,減小輸入字節序列的長度,實現模型訓練效率的提高。(2)在公開數據集上進行了驗證,結果表明,提出的惡意軟件分類方法與最先進的基于原始字節序列的方法分類效果相當,且能將模型的訓練時間和GPU顯存占用大幅降低。(3)分析了字節序列頻域采樣策略中采樣長度的影響,并對未來的研究方向進行了討論。


本文詳細內容請下載:

http://www.jysgc.com/resource/share/2000006296


作者信息:

蔣永康,孫遜,楊玉龍

(貴州航天計量測試技術研究所,貴州貴陽550009)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产精品久久午夜| 狠狠色狠狠色综合日日tαg| 久久黄金**| 亚洲免费在线| 99国产精品久久久久久久成人热| 欧美中文字幕在线观看| 亚洲综合色视频| 亚洲深夜福利网站| 一区二区三区 在线观看视| 国产精品久久久久久久久久妞妞| 亚洲人成人99网站| 永久555www成人免费| 国产视频在线观看一区二区| 国产精品国产三级国产aⅴ无密码| 欧美美女视频| 欧美激情一区二区三区不卡| 欧美a级一区二区| 美女主播精品视频一二三四| 久久精品日韩| 久久青草欧美一区二区三区| 久久三级视频| 免费亚洲一区二区| 欧美国内亚洲| 欧美伦理视频网站| 欧美日韩激情小视频| 欧美久久久久免费| 欧美日韩视频在线一区二区| 欧美日韩亚洲激情| 欧美性生交xxxxx久久久| 欧美日韩在线播| 欧美日韩亚洲一区二区三区在线观看 | 久久riav二区三区| 欧美综合国产精品久久丁香| 久久久噜噜噜| 免费亚洲电影| 欧美日韩国产页| 国产精品wwwwww| 国产美女精品人人做人人爽| 国产欧亚日韩视频| 黄色成人免费网站| 亚洲国产欧美另类丝袜| aa级大片欧美三级| 午夜精品网站| 亚洲黄网站黄| 一本色道久久综合狠狠躁的推荐| 亚洲午夜在线| 久久久精品国产免大香伊| 麻豆精品视频在线观看视频| 欧美精品一区二区三区蜜桃| 国产精品国产三级欧美二区| 国产亚洲欧洲一区高清在线观看| 精品福利免费观看| 日韩系列在线| 午夜激情久久久| 亚洲欧洲三级| 亚洲女优在线| 狂野欧美激情性xxxx| 欧美福利一区二区三区| 欧美日韩一卡| 国产一区二区三区无遮挡| 亚洲人成精品久久久久| 亚洲视频网在线直播| 久久精品视频免费播放| 正在播放亚洲一区| 久久久久久尹人网香蕉| 欧美片第1页综合| 国产日韩在线播放| 最新国产成人av网站网址麻豆 | 亚洲欧美中日韩| 久久综合中文字幕| 国产精品久久久久久模特| 国模私拍视频一区| 99国内精品久久| 久久成人免费| 亚洲综合国产精品| 欧美a级片一区| 国产九九视频一区二区三区| 亚洲黄网站黄| 欧美在线免费播放| 亚洲男女自偷自拍| 欧美电影免费观看| 国产日韩精品一区二区| 日韩视频在线播放| 亚洲国产裸拍裸体视频在线观看乱了| 日韩视频亚洲视频| 久久欧美肥婆一二区| 国产精品日韩| 日韩视频在线一区二区三区| 亚洲成色777777女色窝| 午夜国产欧美理论在线播放| 久久精品人人做人人爽| 欧美在线一区二区| 亚洲在线免费| 欧美成人黑人xx视频免费观看| 国产精品人人爽人人做我的可爱| 亚洲国产一区二区三区高清| 性伦欧美刺激片在线观看| 亚洲无限av看| 欧美精品首页| 亚洲第一在线视频| 欧美一区二区三区久久精品| 亚洲一区三区视频在线观看| 欧美裸体一区二区三区| 亚洲第一二三四五区| 欧美中日韩免费视频| 午夜伦理片一区| 欧美午夜精品久久久| 亚洲欧洲日韩在线| 最新国产乱人伦偷精品免费网站| 久久久精品一区| 国产欧美一区二区三区视频| 夜夜嗨av一区二区三区免费区| 亚洲精品一区在线| 欧美88av| 一区在线免费| 亚洲第一中文字幕在线观看| 久久精品视频免费观看| 国产伦精品一区二区三区高清版 | 在线观看日韩一区| 久久国产福利国产秒拍| 欧美一区二区日韩| 国产精品毛片一区二区三区| 一本大道久久精品懂色aⅴ| 夜夜爽夜夜爽精品视频| 欧美激情一二三区| 91久久黄色| 亚洲美女色禁图| 欧美国产91| 亚洲欧洲日本在线| 在线午夜精品| 欧美日韩一区高清| 亚洲视频精品| 亚洲免费中文字幕| 国产精品一区毛片| 亚洲欧美一区二区原创| 久久精品99久久香蕉国产色戒| 国产精品一区亚洲| 性欧美大战久久久久久久久| 久久xxxx精品视频| 国产中文一区| 亚洲国产专区校园欧美| 久久综合中文| 亚洲国内欧美| 亚洲视频欧美在线| 国产精品裸体一区二区三区| 亚洲免费影视| 久久久精品日韩欧美| 亚洲高清视频一区二区| 99re在线精品| 国产精品久久久久久福利一牛影视| 亚洲视频在线观看网站| 欧美一区二区视频网站| 国产在线精品成人一区二区三区| 亚洲国产日韩一级| 欧美伦理91i| 亚洲一区二区三区四区在线观看| 欧美一区二区视频观看视频| 狠狠色狠狠色综合系列| 亚洲精品影院| 国产精品盗摄一区二区三区| 亚洲欧美综合精品久久成人| 美脚丝袜一区二区三区在线观看 | 国产欧美亚洲日本| 亚洲高清自拍| 欧美日韩激情小视频| 午夜精品久久| 免费日韩av电影| 一区二区三区产品免费精品久久75 | 中文欧美日韩| 国产欧美在线| 亚洲精品一品区二品区三品区| 欧美日韩另类综合| 午夜精品久久久久久久99樱桃 | 亚洲三级影院| 欧美一二三视频| 亚洲成人在线观看视频| 亚洲午夜在线观看| 国产日韩欧美中文| 日韩视频永久免费| 国产欧美日韩视频一区二区三区| 亚洲欧洲一区二区在线观看| 国产精品成人观看视频免费| 亚洲二区免费| 国产精品av一区二区| 亚洲电影免费观看高清完整版在线观看 | 欧美日韩福利视频| 欧美在线播放高清精品| 欧美日韩视频免费播放| 久久精品99| 国产精品福利在线| 亚洲福利在线视频| 国产精品激情偷乱一区二区∴| 亚洲国产福利在线| 国产精品都在这里| 亚洲日本va午夜在线影院| 国产精品永久免费| 日韩视频一区二区在线观看 | 亚洲一区久久| 在线欧美三区| 欧美在线一级视频|