《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 一種基于網絡表示學習的網絡安全用戶發(fā)現方法
一種基于網絡表示學習的網絡安全用戶發(fā)現方法
網絡安全與數據治理 2022年 第1期
劉向宇,燕 瑋,孟星妤,侯開茂
(華北計算機系統(tǒng)工程研究所,北京100083)
摘要: 發(fā)現社交媒體中的網絡安全用戶對于追蹤網絡安全動態(tài)有重要意義,針對這一特定領域用戶的發(fā)現,提出了一種新的發(fā)現方法。首先利用社交媒體節(jié)點間的相互關注關系建立有向關系網絡,然后用網絡表示學習模型Node2vec生成節(jié)點的向量表示,并將收集到的網絡安全關鍵字轉化為特征向量,拼接后輸入分類算法進行預測。實驗結果表明,在社交媒體網絡安全數據集上,所提方法的預測準確率優(yōu)于現有的其他特定領域用戶發(fā)現算法。
中圖分類號: TP181
文獻標識碼: A
DOI: 10.20044/j.csdg.2097-1788.2022.01.012
引用格式: 劉向宇,燕瑋,孟星妤,等. 一種基于網絡表示學習的網絡安全用戶發(fā)現方法[J].網絡安全與數據治理,2022,41(1):78-82.
A method of finding cyber security user based on network representation learning
Liu Xiangyu,Yan Wei, Meng Xingyu,Hou Kaimao
(National Computer System Engineering Research Institute of China,Beijing 100083,China)
Abstract: Finding cyber security users in social media is quite important to track network security trends. This paper proposes a method to find users of specific areas. Firstly, a directed network is established by using the mutual attention relationship between social media nodes. Then network representation learning model Node2vec is used to generate the feature vectors of social network nodes. We change the key words collected from blogs and profiles into cyber security feature vectors . Finally, the concatenated two vectors are input into binary classifier to find the cyber security users. Experimental results show that the prediction precision of the proposed method is better than other existing domain specific user discovery algorithms on social media network security data sets.
Key words : cyber security;Node2vec;social media;binary classification;self training

0 引言

發(fā)現社交媒體中的網絡安全用戶可以有效追蹤網絡安全動態(tài),對網絡安全防護具有重要意義。實際上,識別社交網絡中的網絡安全用戶也是對社交網絡節(jié)點進行分類發(fā)現。

現實生活中,人們傾向于與類似的人發(fā)展社會關系,所以社交用戶的好友會分享更多的屬性,如種族、民族、宗教和職業(yè)——這就是所謂的“同質性原則”[1]。這導致了在Twitter上相互關注的人通常有共同的話題興趣,可以通過相互關注關系來推斷社交媒體用戶的屬性。另外,社交用戶還具備其他可以獲取的數據,如社交文本和用戶資料,這些資料構成新的用戶屬性,也有助于推斷用戶的興趣或者職業(yè),與用戶的社交關系形成互補。

當前已經有大量的用戶分類工作都是基于網絡拓撲結構進行節(jié)點的分類。比如,網絡表示學習方法直接對網絡結構特征進行學習提取,將得到的特征用于分類可以取得不錯的效果。然而,現有的網絡表示學習方法缺乏對社交文本和社交基本資料特征的學習,極大地限制了其分類效果。相對于單純利用社交網絡結構對用戶進行分類,當前主流的圖神經網絡算法創(chuàng)新性地融入了網絡節(jié)點的其他屬性特征,獲得了更高的分類準確率。本文針對網絡表示學習方法缺乏社交文本特征的問題,通過改進Node2vec[2]方法,使其融合多種網絡屬性特征而更加有利于分類,從而識別出社交媒體中的網絡安全用戶。

本文的創(chuàng)新性工作包括:

(1)利用網絡表示學習模型Node2vec來進行網絡節(jié)點的特征表示,將結構特征向量和相應用戶節(jié)點的文本特征向量進行拼接,形成社交用戶節(jié)點的向量表示。

(2)標注了部分網絡安全用戶,初步形成網絡安全用戶資料庫。對于每個用戶節(jié)點,生成其網絡安全文本特征。

(3)利用自監(jiān)督學習方法進行分類模型的訓練樣本擴充,提升了分類效果。

結果表明,在已經收集的Twitter數據集上,所提方法的平均識別準確率為96.37%,比現有常用的算法平均高出0.48%~3.67%。




本文詳細內容請下載http://www.jysgc.com/resource/share/2000004615




作者信息:

劉向宇,燕  瑋,孟星妤,侯開茂

(華北計算機系統(tǒng)工程研究所,北京100083)


此內容為AET網站原創(chuàng),未經授權禁止轉載。
主站蜘蛛池模板: 国产狂喷潮在线观看| 小丑joker在线观看完整版高清| 亚洲日韩亚洲另类激情文学| 精品午夜一区二区三区在线观看| 国产亚洲美女精品久久久2020 | 99久久精品国产一区二区蜜芽| 怡红院免费的全部视频| 久久91精品国产一区二区| 日韩不卡手机视频在线观看| 亚洲一区爱区精品无码| 欧美日韩综合一区| 亚洲综合15p| 狠狠躁日日躁夜夜躁2022麻豆| 八戒网站免费观看视频| 美女网站色在线观看| 国产乱人伦偷精品视频下| 日本黄网站动漫视频免费| 国产精品哟哟视频| 69国产精品视频免费| 国内精品久久久人妻中文字幕| a毛片免费观看| 天天色综合图片| videofree极品另类| 尤物在线观看精品国产福利片| 中文字幕在线观看| 攵女yin乱合集高h小丹| 久久99国产精品久久99果冻传媒| 日本人与黑人xxxx| 久久亚洲精品视频| 日韩av高清在线看片| 久久精品桃花综合| 日韩精品专区在线影院重磅| 九九九九九九伊人| 日韩高清在线播放| 五月天丁香在线| 日韩视频在线观看| 五月婷婷免费视频| 日韩精品无码一区二区视频| 久草新在线观看| 日韩欧美三级在线观看| 久久婷婷是五月综合色狠狠|