《電子技術應用》
您所在的位置:首頁 > 測試測量 > 設計應用 > 基于DAG的Hive數據溯源方法
基于DAG的Hive數據溯源方法
2020年信息技術與網絡安全第11期
杜 娟1,蘇秋月2
1.61646部隊,北京100192;2.四川大學,四川 成都610065
摘要: 數據溯源能夠快速定位數據的來源及其產生過程,對審計、數據生命周期管理都有很大幫助,是數據安全防護中的重要一環。針對傳統數據溯源機制難以應用于Hive數據倉庫中大規模、復雜的數據處理的問題,提出了一種基于DAG的數據溯源方法,實現了對Hive中數據的溯源。最后通過實驗對該方法的有效性以及性能進行了測試與驗證。
中圖分類號: TP311.13
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.11.005
引用格式: 杜娟,蘇秋月. 基于DAG的Hive數據溯源方法[J].信息技術與網絡安全,2020,39(11):31-37.
Hive data provenance method based on DAG
Du Juan1,Su Qiuyue2
1.Unit 61646 of PLA,Beijing 100192,China;2.Sichuan University,Chengdu 610065,China
Abstract: Data provenance can quickly locate the source of data and its production process, which is of great help to audit and data life cycle management. It is an important part of data security protection. Aiming at the problem that traditional data provenance mechanisms are difficult to apply to large-scale and complex data processing in Hive data warehouses, this paper proposes a data traceability method based on Directed Acyclic Graph(DAG). It can implement the traceability of Hive data. Finally, the effectiveness and performance of this method are tested and verified by experiments.
Key words : data provenance;big data;directed acyclic graph

0 引言

    Hive是基于Hadoop的開源數據倉庫工具,它提供了豐富的SQL查詢方式來分析存儲在Hadoop分布式文件系統中的數據:可以將結構化的數據文件映射為一張數據庫表,并提供完整的SQL查詢功能;可以將SQL語句轉換為MapReduce任務運行,通過自己的SQL查詢分析需要的內容。這套SQL簡稱Hive SQL,使不熟悉MapReduce的用戶可以很方便地利用SQL語言查詢、匯總和分析數據[1]。由于Hive在數據存儲和分析上的靈活性,眾多企業用它存儲重要數據。這些敏感的商業數據被大量企業內部人員訪問和操作,一旦發生人為誤操作或違規操作,很容易導致數據的泄露?,F有大數據平臺上的數據安全防護方案缺乏對敏感數據靈活的訪問控制,難以對數據的生命周期及用戶操作行為進行精確的追蹤溯源,無法提供對大數據合規審計管理的支撐。因此,如何提供有效的安全防護機制來保障Hive中數據的安全,是目前研究的重點。

    數據溯源也稱為數據血緣、數據譜系等,數據溯源技術根據追蹤路徑重現數據的歷史、狀態和演變過程,實現數據歷史檔案的追溯[2]。通過數據溯源能追蹤到異常發生的原因,還能幫助人們確定數據倉庫中各項數據的來源。國內外學者在數據溯源技術上進行了深入研究。在數據溯源模型方面,汪洪昕[3]提出了數據染色體溯源模型,更加完善地揭示數據傳播過程中的變化及數據的關系,并在Hadoop平臺中得以實現。郝鵬飛[4]通過對大數據模型分析平臺工作流特征分析,討論了基于Oozie模型工作流的數據溯源問題。

    目前針對數據庫的數據溯源追蹤主要有兩種方法:(1)基于標注的方法[5],此類方法雖然實施起來比較簡單,但需要額外的存儲空間且隨著處理的數據量增加其執行效率會降低,難以直接應用于維護著海量數據的Hive數據倉庫;(2)基于逆置函數的方法[6],此類方法需要的存儲空間較小,但不是所有的數據處理都可以逆置,且其溯源追蹤的性能完全取決于逆置機制。對于Hive數據倉庫中復雜的數據處理,要構造一個良好的逆置機制難度較大。Hive數據的溯源重點在于數據沿襲問題,而給定數據的數據沿襲問題可以概括為建立數據的血緣關系,得到其產生過程以及源數據。

    對于數據倉庫中數據溯源問題,柯潔[7]等人基于W3C的PROV模型對ETL過程的數據溯源進行了深入分析,并提出了相應的數據溯源算法。文獻[8-9]討論了數據倉庫中的數據譜系跟蹤問題,提供了譜系跟蹤算法以及溯源過程中屬性映射和轉換起源集的求解方法。但這些研究均針對傳統數據倉庫中的數據溯源,難以應用于大數據環境下Hive的數據溯源。針對大數據環境,文獻[10]提出了一種基于層的數據溯源架構,其中包括大數據來源的捕獲及可視化,并且在溯源數據中引入了一種訪問控制機制。文獻[11-13]總結了數據庫中的數據溯源技術,分析了在Hadoop環境下數據溯源面臨的研究挑戰,并從數據溯源模型、溯源數據存儲、溯源查詢語言等方面梳理了現有解決方案。Apache Atlas是Hadoop社區為解決Hadoop生態系統的元數據治理問題而產生的開源項目,它為Hadoop集群提供了包括數據分類、集中策略引擎、數據溯源、安全和生命周期管理在內的元數據治理核心能力[14],因此可以將Apache Atlas引入到Hive數據溯源中。

    針對傳統數據溯源機制難以滿足Hive中大規模、復雜的數據處理問題,本文提出了基于有向無環圖(Directed Acyclic Graph,DAG)的數據溯源方法。通過對Apache Atlas進行擴展,在Hive中實現了該數據溯源方法,并通過實驗證明該方法可為Hive提供準確、高效的數據溯源機制,也為數據安全審計提供了有力支撐。




本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003062




作者信息:

杜  娟1,蘇秋月2

(1.61646部隊,北京100192;2.四川大學,四川 成都610065)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美午夜电影在线| 激情婷婷亚洲| 狂野欧美激情性xxxx欧美| 亚洲无玛一区| 亚洲最新中文字幕| 日韩视频在线一区| 亚洲欧洲日本mm| 亚洲欧洲日韩在线| 亚洲国产另类 国产精品国产免费| 欧美中文在线观看| 欧美在线观看一二区| 欧美一区1区三区3区公司| 亚洲在线免费视频| 亚洲专区在线| 亚洲欧美另类综合偷拍| 亚洲欧美日韩第一区| 亚洲一区二区精品在线| 中文亚洲视频在线| 亚洲影视九九影院在线观看| 亚洲一级高清| 亚洲综合色在线| 欧美亚洲免费电影| 欧美一区二区三区在| 欧美在线国产| 亚洲国产精品ⅴa在线观看 | 99精品久久| 日韩一级裸体免费视频| 国产亚洲欧美一区二区| 欧美在线视频在线播放完整版免费观看| 亚洲一区二区三区精品视频| 亚洲综合色自拍一区| 午夜精品一区二区三区在线| 欧美一区国产二区| 91久久久久久久久久久久久| 亚洲理论电影网| 亚洲视频一区二区| 香港久久久电影| 久久久爽爽爽美女图片| 欧美顶级艳妇交换群宴| 欧美日韩三级在线| 国产精品乱码妇女bbbb| 国产欧美精品日韩区二区麻豆天美| 国产亚洲高清视频| 在线精品国产欧美| 亚洲免费久久| 亚洲制服av| 亚洲国产小视频| 亚洲深夜激情| 久久精品亚洲一区| 欧美激情无毛| 国产精品xvideos88| 国产性做久久久久久| 亚洲国产综合在线| 亚洲一区日本| 亚洲国产精品久久久久婷婷老年| 日韩视频免费观看| 欧美一区二区在线| 欧美不卡一卡二卡免费版| 欧美三日本三级少妇三2023| 国产欧美视频在线观看| 亚洲黄页一区| 亚洲欧美日本视频在线观看| 亚洲欧洲日本一区二区三区| 亚洲免费小视频| 久久九九有精品国产23| 欧美理论电影网| 国产欧美一区二区精品仙草咪| 亚洲第一网站| 亚洲欧美日韩第一区| 亚洲狼人精品一区二区三区| 欧美一区二区三区在线免费观看| 欧美激情视频给我| 国产一级一区二区| 99re66热这里只有精品3直播| 欧美一区二区三区免费视| 日韩一级片网址| 欧美影院一区| 欧美日本在线| 黄色成人av在线| 亚洲视频综合在线| 亚洲美女av网站| 久久国产精品72免费观看| 欧美伦理视频网站| 黑丝一区二区| 亚洲一区一卡| 亚洲视频二区| 你懂的成人av| 国产亚洲欧美色| 一本一本久久a久久精品综合妖精| 亚洲成色最大综合在线| 香蕉av777xxx色综合一区| 欧美日韩美女在线| 亚洲电影免费观看高清完整版在线观看 | 国产主播一区二区三区| 日韩写真视频在线观看| 亚洲国产美女精品久久久久∴| 亚洲一区二区三区精品在线| 欧美高清在线视频观看不卡| 国产一区二区三区久久| 亚洲综合首页| 亚洲一区3d动漫同人无遮挡| 欧美国产视频在线| 亚洲成人在线视频播放| 欧美在线观看一二区| 欧美影院成年免费版| 欧美四级伦理在线| 亚洲欧洲另类| 亚洲精品在线免费| 欧美顶级艳妇交换群宴| 伊伊综合在线| 亚洲国产高清高潮精品美女| 久久久久久久一区| 国产一区欧美日韩| 久久国产精品久久久久久电车| 欧美一区二区成人| 国产精品女人毛片| 亚洲视频综合| 午夜激情久久久| 国产精品免费福利| 亚洲视频欧美在线| 亚洲女同精品视频| 国产精品高清在线观看| 一区二区三区久久网| 亚洲一区二区三| 国产精品www.| 亚洲性感美女99在线| 午夜国产精品视频| 国产麻豆成人精品| 亚洲午夜精品17c| 午夜精品短视频| 国产欧美 在线欧美| 亚洲欧美综合v| 久久精精品视频| 国产有码在线一区二区视频| 久久精品久久综合| 欧美.www| 亚洲精品国产精品国自产观看浪潮| 日韩视频一区| 欧美视频精品在线| 亚洲影音先锋| 久久精品视频在线观看| 狠狠色丁香久久婷婷综合丁香 | 久久久人成影片一区二区三区观看 | 亚洲特色特黄| 久久av二区| 国语自产精品视频在线看一大j8| 久久精品人人做人人爽| 欧美fxxxxxx另类| 亚洲精品自在在线观看| 亚洲男人的天堂在线aⅴ视频| 国产精品日本精品| 久久精品30| 欧美激情一区二区三区| 一区二区三区视频免费在线观看| 亚洲欧美在线网| 国产一区二区无遮挡| 亚洲精选中文字幕| 国产精品高潮呻吟久久av黑人| 欧美亚洲一区二区在线| 另类欧美日韩国产在线| 亚洲精品一区二区三| 午夜精品av| 在线视频观看日韩| 亚洲综合不卡| 一区二区亚洲精品国产| 一区二区三区四区五区精品视频 | 欧美成人一区在线| 99视频精品在线| 久久久精品国产一区二区三区 | 亚洲日本乱码在线观看| 亚洲欧美激情一区| 一区二区在线观看视频在线观看| 99天天综合性| 国产一区二区三区自拍| 一道本一区二区| 国内成人精品2018免费看| 亚洲最新视频在线| 国产一区二区三区奇米久涩 | 亚洲丰满在线| 国产精品s色| 亚洲高清自拍| 国产精品毛片| 亚洲精品一区二区在线| 国产精品人成在线观看免费| 亚洲欧洲日韩综合二区| 国产精品在线看| 一本一本久久| 伊人久久婷婷| 欧美一区二区网站| 99re国产精品| 欧美不卡福利| 性欧美大战久久久久久久免费观看 | 最新国产拍偷乱拍精品| 久久久精品tv| 亚洲午夜黄色| 欧美日韩国产小视频| 久久精品一级爱片| 国产精品亚洲精品| 99在线热播精品免费99热| 国语自产精品视频在线看|