《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 涉及隱私侵占類APP識別與分類方法研究
涉及隱私侵占類APP識別與分類方法研究
信息技術(shù)與網(wǎng)絡(luò)安全 12期
易 黎1,邱秀連1,馬 芳1,彭艷兵1,程 光2
(1.南京烽火星空通信發(fā)展有限公司,江蘇 南京210019;2.東南大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,江蘇 南京211189)
摘要: 隨著信息基礎(chǔ)建設(shè)的發(fā)展和移動應(yīng)用的普及,用戶個人信息在使用過程中被應(yīng)用開發(fā)者大量收集,出現(xiàn)了對個人信息的非法泄露和使用問題,嚴重威脅到了個人信息安全。為了更加高效準(zhǔn)確地識別是否存在侵占隱私行為及對應(yīng)APP類別,提出了一種基于多模態(tài)特征的多策略組合的識別算法。首先,該算法采用Word2vec的方法來完成APP相關(guān)文本的詞匯層面的特征向量表示,隨后有針對性地將獲得的特征向量輸入CNN網(wǎng)絡(luò)進行分類,接著根據(jù)文本分類的結(jié)果和多種行為特征集合生成應(yīng)用程序特征向量,最后結(jié)合多種不同的基分類器,采用硬投票的方式預(yù)測侵占隱私行為。實驗結(jié)果表明,經(jīng)過訓(xùn)練的模型在驗證集上的分類結(jié)果F1值最高可達91%,該方法可以有效地對侵占隱私類APP進行識別及分類,有助于在大數(shù)據(jù)時代,保障個人信息安全建設(shè)。
中圖分類號: TP391.4
文獻標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.12.002
引用格式: 易黎,邱秀連,馬芳,等. 涉及隱私侵占類APP識別與分類方法研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(12):8-14.
Research on identification and classification methods of APP involving privacy infringement
Yi Li1,Qiu Xiulian1,Ma Fang1,Peng Yanbing1,Cheng Guang2
(1.Nanjing FiberHome Software Technology Co.,Ltd.,Nanjing 210019,China; 2.School of Cyber Science and Engineering,Southeast University,Nanjing 211189,China)
Abstract: With the development of information infrastructure and the popularization of mobile applications, a large number of users′ personal information is collected by application developers in the process of use, and there are problems with the illegal collecting and using of personal information, which seriously threatens the security of personal information. In order to more effectively identify the type of APP and whether it has violated privacy, a recognition algorithm based on multi-modal features and multi-strategy combination is proposed. Firstly, the algorithm uses the Word2vec method to extract feature formation vectors related to APP text, and then the obtained feature vector is input into the CNN network for classification. Based on the result of the text classification and a variety of behavior feature sets, it generates application feature vectors, and finally combines a variety of different base classifiers and uses hard voting to predict the applications′ invade-privacy categories. The experimental result shows that the F1 value of the trained model on the validation set can be as high as 91%. This method can effectively identify and classify privacy-invading apps, which is helpful to ensure the security of personal information in the era of big data.
Key words : multi-label text classification;feature extraction;behavioral features;model construction;machine learning

0 引言

中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第48次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》表明,截至2021年6月,中國手機網(wǎng)民的數(shù)量已高達10.07億,如此巨大的用戶量具有不可估量的商業(yè)價值,而其背后如此巨大的用戶個人信息在當(dāng)前信息時代環(huán)境下更是蘊含著巨大價值[1]。但在實踐中,如此眾多的用戶使用量其問題也接踵而至,最明顯的是關(guān)于用戶個人信息泄漏事件層出不窮,對用戶個人信息的侵害可謂無孔不入,智能手機APP為用戶帶來便利的同時,也成為個人信息泄漏的根本原因之一。

依據(jù)敏感程度和安全性不同,用戶個人信息內(nèi)容分為用戶核心隱私信息、用戶的重要隱私信息與用戶的普通隱私信息三個類別[2]。其中關(guān)于通訊錄聯(lián)系人、手機賬號、賬戶密碼、聊天記錄以及定位用戶當(dāng)前所在地點等內(nèi)容被劃分為核心隱私信息;關(guān)于手機發(fā)送接收短信信息、撥通電話、調(diào)用手機自帶的攝像頭權(quán)限等內(nèi)容信息歸屬于重要隱私信息一類;最后用戶的Wi-Fi連接無線網(wǎng)絡(luò)、藍牙連接無線設(shè)備、手機數(shù)據(jù)網(wǎng)絡(luò)流量使用等信息屬于普通隱私信息。





本文詳細內(nèi)容請下載:http://www.jysgc.com/resource/share/2000003889







作者信息:

易  黎1,邱秀連1,馬  芳1,彭艷兵1,程  光2

(1.南京烽火星空通信發(fā)展有限公司,江蘇 南京210019;2.東南大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,江蘇 南京211189)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 天天狠狠色噜噜| 高校饥渴男女教室野战| 性欧美大战久久久久久久| 久艾草国产成人综合在线视频| 美国经典三级版在线播放| 国产裸舞福利资源在线视频 | 精品国产91久久久久久久a | a级成人高清毛片| 日韩在线视频一区二区三区| 亚洲女人影院想要爱| 男人桶女人的肌肌30分| 国产在线jyzzjyzz免费麻豆 | 亚洲伊人久久精品影院| 欧美黑人粗大xxxxbbbb| 伊人久久综在合线亚洲91| 精品无码久久久久久尤物| 国产MD视频一区二区三区| 青苹果乐园在线高清| 国产成人精品一区二区三区| aa级国产女人毛片水真多| 国产精品第6页| 上原瑞穗最全番号| 无码专区久久综合久中文字幕| 亚洲无砖砖区免费| 毛片手机在线观看| 亚洲精品无码不卡| 男人j桶进女人p无遮挡免费观看| 内射白嫩少妇超碰| 综合五月天婷婷丁香| 和武警第一次做男男gay| 色噜噜视频影院| 国产一区内射最近更新| 你懂的视频在线播放| 国产精品黄页网站在线播放免费| 99久在线国内在线播放免费观看 | 免费人成在线观看视频高潮| 精品国产呦系列在线看| 嘟嘟嘟在线视频免费观看高清中文| 色综合久久综合欧美综合图片| 国产亚洲精品91| 青苹果乐园影视免费观看电视剧hd |