《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于信息熵的數據集重標識風險評估方法
基于信息熵的數據集重標識風險評估方法
2020年信息技術與網絡安全第12期
陳 磊1,2,薛見新1,2,張潤滋1,2,劉文懋1
1.綠盟科技集團股份有限公司,北京100089;2.清華大學 自動化系,北京100084
摘要: 去標識化作為一種隱私保護技術,在數據發布領域得到了廣泛應用。然而,在大數據時代下,攻擊者可能獲得了更多的關聯數據,去標識數據集仍然存在重標識攻擊的風險。基于Shannon信息熵,并結合信息安全風險評估框架,提出了一種綜合的重標識風險評估方法。首先,將攻擊者可能利用的數據集的各種屬性組合歸納為若干個脆弱性,然后逐一對這些脆弱性從可能性和危害性兩個維度進行評估。最后,為了綜合評估整個數據集的重標識風險,構造了一種基于熵值增量和加權的評估算法。實驗結果表明,所提評估方法可全面、直觀地反映風險分布與趨勢。
中圖分類號: TP399
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.001
引用格式: 陳磊,薛見新,張潤滋,等. 基于信息熵的數據集重標識風險評估方法[J].信息技術與網絡安全,2020,39(12):1-7.
Re-identification risk assessment of de-identified datasets based on information entropy
Chen Lei1,2,Xue Jianxin1,2,Zhang Runzi1,2,Liu Wenmao1
1.Nsfocus Information Technology Co.,Ltd.,Beijing 100089,China; 2.Department of Automation,Tsinghua University,Beijing 100084,China
Abstract: As a privacy protection technology, de-identification has been widely used in data publishing scenarios. However, in the era of big data, attackers may obtain more associated data, and there is still a risk of re-identification attacks on de-identified datasets. Based on information entropy and information security risk assessment framework, this paper proposes a comprehensive re-identification risk assessment method. Firstly, the various attribute combinations of a de-identified dataset that attackers may utilize are summarized into several vulnerabilities, and then these vulnerabilities are evaluated one by one from probability and impact dimension. Finally, in order to comprehensively evaluate the re-identification risk of the dataset, this paper constructs a fast evaluation algorithm based on entropy increments and weights. Extensive experimental results demonstrate that the proposed evaluation method can comprehensively and intuitively reflect the risk distribution and trend.
Key words : privacy protection;de-identified datasets;re-identification risk assessment;information entropy

0 引言

    在大數據時代下,數據共享、發布和交易等場景需求變得越來越多,一方面促進了數據流通與價值利用,另一方面引發的個人數據與隱私安全事件近年來呈現爆發趨勢[1]

    為了應對挑戰,在法規層面,全球掀起了數據隱私的立法熱潮,如歐盟《通用數據保護條例》(GDPR)、美國《加州消費者隱私法案》(CCPA)等。我國2017年實施的《網絡安全法》,其中一個章節專門明確個人信息安全;此外,我國《個人信息保護法》在加快立法與制定中。在技術層面,如何平衡數據利用與隱私保護問題,已經成為學術界和工業界的一大研究熱點[2]。當前,已經發展出了保留格式加密(Format-Preserving Encryption,FPE)[3]、差分隱私(Differential Privacy,DP)[4]、K-匿名(K-Anonymity)[5]和L-多樣性(L-Diversity)[6]以及去標識化(De-identification)[7]等技術。其中,去標識化技術通過對原始個人信息進行部分屏蔽、泛化和失真等數據變換操作,是一種意圖消除“個人身份”的隱私保護技術。由于其處理規則簡單靈活且易于并行處理(高效),目前在隱私保護的數據發布和數據挖掘等實際場景中有廣泛應用與部署。通常,在工業界習慣稱為“數據脫敏”。




本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003069




作者信息:

陳  磊1,2,薛見新1,2,張潤滋1,2,劉文懋1

(1.綠盟科技集團股份有限公司,北京100089;2.清華大學 自動化系,北京100084)

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 美女视频黄a视频全免费网站色| 明星造梦一区二区| 精品国产午夜肉伦伦影院| 被黑人侵犯若妻中文字幕| 香蕉啪视频在线观看视频久| 欧美日韩一区二区三区麻豆 | 成人乱码一区二区三区AV| 国产精品白嫩在线观看| 国产精品亚洲欧美日韩久久| 国产av激情无码久久| 亚洲精品午夜久久久伊人| 亚洲欧美成aⅴ人在线观看| 亚洲国产一区二区三区在线观看| 中文字幕网站在线| 一区二区三区福利| 98精品国产综合久久| 西西人体www44rt大胆高清| 羞羞色在线观看| 欧美人与动人物乱大交| 日本高清乱理伦片中文字幕啊| 无翼乌r18无遮掩全彩肉本子| 小泽码利亚射射射| 国精产品一品二品国精品69xx| 国产精品亚洲欧美大片在线观看 | 国产一级视频免费| 免费高清资源黄网站在线观看| 亚洲av乱码一区二区三区 | 中文乱码人妻系列一区二区| 一个色综合导航| 2021国产麻豆剧传媒官网| 黄色三级电影网址| 美美女高清毛片视频免费观看| 欧美XXXX做受欧美1314| 扒开双腿猛进入喷水免费视频| 国产精品无码一区二区三区免费| 国产在线视频福利| 免费看国产一级特黄aa大片| 亚洲欧美日韩国产精品26u| 两个人看的www免费高清| 香蕉99国内自产自拍视频| 欧美另类videovideosex|