《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于Boosting集成學(xué)習(xí)的風(fēng)險(xiǎn)URL檢測研究
基于Boosting集成學(xué)習(xí)的風(fēng)險(xiǎn)URL檢測研究
網(wǎng)絡(luò)安全與數(shù)據(jù)治理
馮美琪1,2,李赟1,2,蔣冰1,2,王立松1,2,劉春波3,陳偉1,2
1.中國民航信息網(wǎng)絡(luò)股份有限公司運(yùn)行中心; 2.中國民航信息網(wǎng)絡(luò)股份有限公司IT基礎(chǔ)設(shè)施國產(chǎn)化適配工程技術(shù)研究中心; 3.中國民航大學(xué)信息安全測評中心
摘要: 隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)站數(shù)量不斷增長,URL作為訪問網(wǎng)站的唯一入口,成為Web攻擊的重點(diǎn)對象。傳統(tǒng)的URL檢測方式主要是針對惡意URL,主要方法是基于特征值和黑白名單,容易產(chǎn)生漏報(bào),且對于復(fù)雜URL的檢測能力不足。為解決上述問題,基于集成學(xué)習(xí)中的Boosting思想,提出一種針對業(yè)務(wù)訪問的風(fēng)險(xiǎn)URL檢測的混合模型。該模型前期將URL作為字符串,使用自然語言處理技術(shù)對其進(jìn)行分詞及向量化,然后采用分步建模法的思想,首先利用GBDT算法構(gòu)建二分類模型,判斷URL是否存在風(fēng)險(xiǎn),接著將風(fēng)險(xiǎn)URL原始字符串輸入到多分類模型中,利用XGBoost算法對其進(jìn)行多分類判定,明確風(fēng)險(xiǎn)URL的具體風(fēng)險(xiǎn)類型,為安全分析人員提供參考。在模型構(gòu)建過程中不斷進(jìn)行參數(shù)調(diào)優(yōu),并采用AUC值和F1值分別對二分類模型和多分類模型進(jìn)行評估,評估結(jié)果顯示二分類模型的AUC值為98.91%,多分類模型的F1值為0.993,效果較好。將其應(yīng)用到實(shí)際環(huán)境中,與現(xiàn)有檢測手段進(jìn)行對比,發(fā)現(xiàn)模型的檢出率高于現(xiàn)有WAF和APT安全設(shè)備,其檢測結(jié)果彌補(bǔ)了現(xiàn)有檢測手段的漏報(bào)。
中圖分類號:TP393文獻(xiàn)標(biāo)識碼:ADOI:10.19358/j.issn.2097-1788.2024.07.006
引用格式:馮美琪,李赟,蔣冰,等.基于Boosting集成學(xué)習(xí)的風(fēng)險(xiǎn)URL檢測研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,43(7):32-40.
Research on risk URL detection based on Boosting ensemble learning
Li Yun 1,2,Jiang Bing 1,2,Wang Lisong 1,2,Liu Chunbo3,Chen Wei1,2
1. Operation Center,TravelSky Technology Limited; 2. IT Infrastructure Localization Adaptation Engineering Technology Research Center,TravelSky Technology Limited 3. Information Security Evaluation Center, Civil Aviation University of China
Abstract: With the continuous development of the Internet and the growing number of websites, URL, as the only access to websites, has become the focus of web attacks. The traditional URL detection method mainly targets malicious URLs, based on feature values and black-and-white lists, but it is prone to false positives and lacks detection capability for complex URLs. To resolve the appeal issue, a hybrid model for risk URL detection in business access is proposed based on the Boosting concept in ensemble learning. In the early stage of this model, the URL is treated as a string, and natural language processing techniques are used to segment and vectorize it. Then, a two-step approach is adopted. Firstly, the GBDT algorithm is used to construct a binary classification model to determine whether the URL is at risk. Then, the original string of the risk URL is input into a multi classification model, and the XGBoost algorithm is used to perform multi classification judgment on it, clarifying the specific risk types of the risk URL and providing reference for security analysts. During the model construction process, parameter optimization was continuously carried out, and the AUC value and F1 value were used to evaluate the binary classification model and the multi classification model, respectively. The evaluation results showed that the AUC value of the binary classification model was 98.91%, and the F1 value of the multi classification model was 0.993, indicating good performance. Applying it to practical environments and comparing it with existing detection methods, it was found that the detection rate of the model is higher than that of existing WAF and APT detection devices, and its detection results make up for the missed reports of existing detection methods.
Key words : web attacks; ensemble learning; regularization; stepwise modeling method

引言

隨著互聯(lián)網(wǎng)的快速發(fā)展,在線購物、出行服務(wù)、系統(tǒng)工具和生活服務(wù)等都為人們帶來了極大的便利。根據(jù)CNNIC數(shù)據(jù),截至2023年12月,中國網(wǎng)民數(shù)達(dá)10.92億,互聯(lián)網(wǎng)滲透率達(dá)77.5%。同時(shí),Log4j等重大漏洞的出現(xiàn)也印證了Web應(yīng)用程序所帶來的嚴(yán)重危害。而URL作為訪問網(wǎng)站的唯一入口,其也成為了Web攻擊的重點(diǎn)對象,如何從海量業(yè)務(wù)訪問中檢測出風(fēng)險(xiǎn)URL也成為了重點(diǎn)研究方向。針對URL的檢測,目前的研究方向主要集中在惡意URL,是指通過作為釣魚網(wǎng)頁的載體、XSS攻擊等多種方式竊取用戶的隱私和財(cái)產(chǎn),造成嚴(yán)重的網(wǎng)絡(luò)安全威脅的URL[1],檢測方法主要包括特征值檢測、黑白名單過濾等,其不足之處在于,當(dāng)特征值或URL不在預(yù)設(shè)的名單中,則會產(chǎn)生漏報(bào),同時(shí)此類方法無法實(shí)時(shí)對新的URL進(jìn)行檢測。啟發(fā)式技術(shù)的提出解決了對新的URL檢測的不足,但此類方法僅能用于有效數(shù)量的常見威脅[1]。然而,隨著URL攻擊的復(fù)雜度以及攻擊能力的不斷增強(qiáng),傳統(tǒng)的檢測方法已無法滿足防護(hù)需求,且其覆蓋范圍較窄,無法識別海量業(yè)務(wù)訪問中存在風(fēng)險(xiǎn)的URL,需要探索新的應(yīng)用場景和檢測方法。在20世紀(jì)80年代,隨著人工神經(jīng)網(wǎng)絡(luò)的成功,機(jī)器學(xué)習(xí)越來越受到重視,由于其使計(jì)算機(jī)能夠?qū)W習(xí)、適應(yīng)、推測模式,在沒有明確編程指令的情況下相互通信[2]的特點(diǎn),逐漸應(yīng)用到網(wǎng)絡(luò)安全領(lǐng)域。相較于傳統(tǒng)的檢測方法,機(jī)器學(xué)習(xí)模型具有更高的檢測效率和更強(qiáng)的泛化能力。目前對于URL的研究主要集中在惡意URL,而非業(yè)務(wù)相關(guān)的風(fēng)險(xiǎn)URL的檢測。惡意URL的相關(guān)研究主要可以分為三類:第一類是單一的機(jī)器學(xué)習(xí)算法,如BP神經(jīng)網(wǎng)絡(luò)[3]、卷積神經(jīng)網(wǎng)絡(luò)[4]、關(guān)聯(lián)規(guī)則[5]等。第二類是集成多種機(jī)器學(xué)習(xí)算法,如雙向長短期記憶網(wǎng)絡(luò)[6]和膠囊網(wǎng)絡(luò)結(jié)合、雙向長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)結(jié)合[7-9]等,同時(shí)引入注意力機(jī)制來增加關(guān)鍵特征的權(quán)重。此類研究中還有一種是集成學(xué)習(xí)[1],一種方法是主要利用嶺分類、支持向量機(jī)、樸素貝葉斯作為初級學(xué)習(xí)器,采用邏輯回歸作為次級學(xué)習(xí)器,通過初級學(xué)習(xí)器和次級學(xué)習(xí)器相結(jié)合的雙層結(jié)構(gòu)對URL進(jìn)行檢測[10];另一種方法采用CNN與XGBoost相結(jié)合的檢測模型,利用CNN實(shí)現(xiàn)自動提取特征,通過XGBoost進(jìn)行分類[11]。最后一類研究是機(jī)器學(xué)習(xí)與其他手段聯(lián)合進(jìn)行檢測,如威脅情報(bào)[12]、專家知識[13]、字符嵌入編碼[14]等。本文對業(yè)務(wù)從互聯(lián)網(wǎng)接收到的風(fēng)險(xiǎn)URL請求開展檢測研究,采用分步建模法和集成學(xué)習(xí)的思想,將風(fēng)險(xiǎn)URL檢測模型分為兩個(gè)子模型:風(fēng)險(xiǎn)URL檢測以及風(fēng)險(xiǎn)URL類型分類。首先采用GBDT算法確定業(yè)務(wù)訪問的URL是否存在風(fēng)險(xiǎn),針對風(fēng)險(xiǎn)URL,采用XGBoost算法確定具體的風(fēng)險(xiǎn)類型。同時(shí)產(chǎn)生告警供安全運(yùn)營人員確認(rèn)并處置,在一定程度上彌補(bǔ)現(xiàn)有特征值檢測方法的漏報(bào)。


本文詳細(xì)內(nèi)容請下載:

http://www.jysgc.com/resource/share/2000006089


作者信息:

馮美琪1,2,李赟1,2,蔣冰1,2,王立松1,2,劉春波3,陳偉1,2

(1.中國民航信息網(wǎng)絡(luò)股份有限公司運(yùn)行中心,北京101318;

2.中國民航信息網(wǎng)絡(luò)股份有限公司IT基礎(chǔ)設(shè)施國產(chǎn)化適配工程技術(shù)研究中心,北京101318;

3.中國民航大學(xué)信息安全測評中心,天津300300)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
夜夜躁日日躁狠狠久久88av| 欧美一区二区三区四区高清| 国产欧美69| 欧美日韩国语| 免费亚洲电影在线观看| 欧美在线网站| 午夜精品久久一牛影视| 亚洲小说欧美另类社区| 一区二区精品国产| 99精品99久久久久久宅男| 91久久线看在观草草青青| 久久精品欧美日韩| 午夜久久资源| 午夜在线一区二区| 亚洲欧美日韩国产综合在线 | 亚洲国产专区校园欧美| 在线观看亚洲视频| 亚洲第一精品夜夜躁人人爽| 永久域名在线精品| 亚洲国产精品t66y| 91久久精品视频| 亚洲欧洲精品一区| 亚洲精品一区二区三区四区高清| 亚洲精品久久久久久久久久久久| 亚洲老板91色精品久久| 夜夜夜久久久| 亚洲一区二区三区四区中文| 亚洲欧美中文另类| 久久国产99| 91久久久一线二线三线品牌| 日韩午夜激情电影| 亚洲无毛电影| 欧美主播一区二区三区美女 久久精品人| 欧美一区二区三区在线观看| 久久精品国产2020观看福利| 久久五月天婷婷| 欧美激情第一页xxx| 欧美片在线观看| 国产精品久久久久久久久久尿| 国产精品日韩一区二区| 国产视频在线观看一区二区三区 | 一本色道久久综合狠狠躁的推荐| 亚洲无人区一区| 欧美在线观看一区| 亚洲欧洲综合另类| 亚洲视频在线播放| 性欧美videos另类喷潮| 久久久久久久综合日本| 欧美高清视频在线 | 国产精品黄色在线观看| 国产三区精品| 亚洲第一精品福利| 在线视频欧美一区| 欧美一区二区三区久久精品茉莉花| 亚洲国产另类精品专区| 一本大道久久a久久精品综合| 午夜精品久久久久久久久| 久久婷婷亚洲| 欧美三区在线视频| 国产综合久久| 日韩视频不卡| 久久精品国产99国产精品| 99视频+国产日韩欧美| 欧美亚洲日本一区| 欧美ab在线视频| 国产精品久久久久久五月尺| 一区精品在线播放| 国产精品99久久久久久人 | 欧美中文字幕不卡| 99热精品在线| 久久久噜久噜久久综合| 欧美日韩成人| 国内精品久久久久久久果冻传媒| 99re6这里只有精品视频在线观看| 午夜激情一区| 一区二区免费看| 久久久国产一区二区三区| 欧美日韩国产色视频| 国产一区二区三区久久悠悠色av| 亚洲人成网站在线观看播放| 午夜精品国产更新| 亚洲视频成人| 免费成人小视频| 国产亚洲精品一区二区| 9国产精品视频| 亚洲青色在线| 欧美专区在线播放| 欧美日韩午夜激情| 1024国产精品| 香蕉视频成人在线观看| 亚洲先锋成人| 欧美激情aⅴ一区二区三区| 国产性色一区二区| 一区二区三区 在线观看视频| 亚洲黄色一区| 欧美伊人久久| 国产精品jizz在线观看美国| 亚洲国产精品久久久久秋霞影院| 欧美一区二区三区免费视| 亚洲一区二区精品在线| 欧美激情综合色综合啪啪| 国内揄拍国内精品少妇国语| 亚洲欧美中日韩| 亚洲在线第一页| 欧美区视频在线观看| 亚洲第一精品夜夜躁人人爽 | 久久av二区| 午夜精品美女久久久久av福利| 欧美日产一区二区三区在线观看| 亚洲高清av在线| 亚洲福利国产| 久久蜜桃香蕉精品一区二区三区| 国产精品视频一区二区三区| 在线亚洲欧美视频| 在线亚洲自拍| 欧美日韩成人一区| 亚洲精品国产精品乱码不99| 亚洲精品国产无天堂网2021| 免费观看在线综合色| 一区二区三区在线免费视频 | 久久―日本道色综合久久| 国产日产欧产精品推荐色| 亚洲综合电影| 欧美一区二区精品在线| 国产精品女人久久久久久| 亚洲视频在线观看网站| 亚洲综合精品自拍| 国产精品久久国产三级国电话系列 | 久久精品国产综合精品| 久久久水蜜桃av免费网站| 国产在线精品一区二区中文| 欧美亚洲视频| 久久久一本精品99久久精品66| 国产一区日韩欧美| 亚洲国产成人精品视频| 免费亚洲电影在线| 亚洲欧洲综合另类在线| 一区二区三区四区蜜桃| 欧美性猛交一区二区三区精品| 亚洲视频大全| 欧美在线|欧美| 国产主播一区二区三区四区| 久久疯狂做爰流白浆xx| 欧美大片91| 日韩视频久久| 亚洲欧美春色| 国产色综合网| 久久精品色图| 欧美精品一区二区三区在线看午夜| 亚洲精品乱码| 亚洲欧美另类综合偷拍| 国产欧美日韩伦理| 亚洲国产精品va在线看黑人| 欧美福利在线| 一本久久知道综合久久| 久久不射网站| 亚洲高清视频在线| 亚洲一区二区三区三| 国产一区二区日韩精品| 最新日韩欧美| 国产精品99免费看| 欧美在线观看视频在线| 欧美精品99| 亚洲一区三区电影在线观看| 久久久亚洲高清| 亚洲人成亚洲人成在线观看图片| 亚洲一区二区三区精品动漫| 国产婷婷成人久久av免费高清 | 在线日韩一区二区| 亚洲午夜精品久久久久久app| 国产九九视频一区二区三区| 亚洲高清中文字幕| 欧美日韩视频| 欧美亚洲一级| 欧美日韩人人澡狠狠躁视频| 亚洲欧美综合精品久久成人| 欧美黑人国产人伦爽爽爽| 亚洲综合色视频| 欧美mv日韩mv国产网站app| 宅男噜噜噜66国产日韩在线观看| 久久久亚洲成人| 一区二区三区久久久| 老司机67194精品线观看| 正在播放欧美一区| 老司机精品视频网站| 夜色激情一区二区| 久久综合免费视频影院| 一区二区三区视频观看| 六月婷婷久久| 亚洲欧美国产精品va在线观看 | av不卡在线| 精品二区视频| 亚洲女女做受ⅹxx高潮| 亚洲国产日本| 久久精品国产精品 | 亚洲欧洲日韩女同| 国产伦精品一区二区三区在线观看 | 欧美精品一区二区久久婷婷| 欧美在线一级va免费观看| 欧美日韩人人澡狠狠躁视频|