《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 面向多源異構數據的知識圖譜可視化融合方法
面向多源異構數據的知識圖譜可視化融合方法
電子技術應用
梁浩1,付達2
1.深圳鵬銳信息技術股份有限公司;2.北京京能能源技術研究有限責任公司
摘要: 為解決數據冗余沖突與關聯缺失問題,研究面向多源異構數據的知識圖譜可視化融合方法,提升數據融合的可靠性。利用網絡本體語言為多源異構數據建立對應的領域本體庫與全局本體庫,使得知識實體抽取和知識融合在同一框架下進行;通過長短期記憶網絡-條件隨機場模型,在本體庫約束下,從多源異構數據中抽取符合領域定義的知識實體;利用基于層次過濾思想的知識融合模型,可視化融合抽取的知識實體,解決多源異構數據中冗余信息和不一致性問題,形成準確、完整、可靠的多源異構數據可視化融合知識圖譜,有助于發現潛在的數據關聯,補全數據關聯缺失。實驗結果表明:隨著數據缺失比例的提升,尺度系數與屬性覆蓋度均開始下降,最低尺度系數與屬性覆蓋度是0.86與0.87,均顯著高于對應的閾值;所提方法在處理四個數據源時,視覺清晰度達93%~97%,信息融合度達92%~96%,均優于對比方法。說明該方法可有效抽取多源異構數據知識實體,建立知識圖譜,實現多源異構數據可視化融合;在不同數據缺失比例下,該方法多源異構數據可視化融合的尺度系數與屬性覆蓋度均較大,即數據可視化融合效果較優;同時有效提升了數據可視化效果和信息整合程度。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.245966
中文引用格式: 梁浩,付達. 面向多源異構數據的知識圖譜可視化融合方法[J]. 電子技術應用,2025,51(6):47-53.
英文引用格式: Liang Hao,Fu Da. Knowledge graph visualization fusion method for heterogeneous data from multiple sources[J]. Application of Electronic Technique,2025,51(6):47-53.
Knowledge graph visualization fusion method for heterogeneous data from multiple sources
Liang Hao1,Fu Da2
1.Plant Resource Technology Co., Ltd.; 2.Beijing Jingneng Energy Technology Reach Co., Ltd.
Abstract: In order to solve the problem of data redundancy conflict and lack of association, a knowledge graph visualization fusion method for multi-source heterogeneous data is studied to improve the reliability of data fusion. The domain ontology database and global ontology database corresponding to multi-source heterogeneous data are established by using Web Ontdogy Languge(OWL), so that knowledge entity extraction and knowledge fusion are carried out under the same framework. Based on the Long Short-Term Memory network(LSTM) and Conditional Random Field(CRF) model, knowledge entities conforming to domain definition are extracted from heterogeneous data from multiple sources under the constraint of ontology library. The knowledge fusion model based on hierarchical filtering is used to visualize the extracted knowledge entities, solve the redundant information and inconsistency problems in multi-source heterogeneous data, and form an accurate, complete and reliable multi-source heterogeneous data visualization fusion knowledge graph, which helps to find potential data associations and complete the missing data associations. The experimental results show that with the increase of the proportion of missing data, the scaling coefficient and attribute coverage begin to decrease, and the lowest scaling coefficient and attribute coverage are 0.86 and 0.87, which are significantly higher than the corresponding thresholds. When dealing with four data sources, the visual clarity of the proposed method is 93%~97%, and the information fusion is 92%~96%, which are better than the comparison methods. It shows that the method can effectively extract the knowledge entities of multi-source heterogeneous data, establish the knowledge graph, and realize the visualization fusion of multi-source
Key words : multi-source heterogeneous data;knowledge graph;visual ization fusion;ontology library;long short-term memory network;conditional random field

引言

在實際應用中,數據往往來源于多個不同的源頭,具有異構性、多樣性和復雜性等特點,這給數據的處理、分析和應用帶來了巨大挑戰[1]。多源異構數據融合方法應運而生,旨在通過先進的技術手段,將來自不同數據源、不同格式、不同結構的數據進行有效整合與展示,為用戶提供直觀、全面、深入的數據洞察[2]。

多源異構數據融合方法不僅有助于解決數據孤島問題,實現數據的互聯互通[3],還能夠顯著提升數據處理的效率和準確性,為決策支持、科學研究、產業創新等領域提供強有力的數據支撐。例如,莫慧凌等人利用聯邦學習框架實現數據融合,各參與方均利用張量Tucker分解理論,提取數據特征;通過中央服務器收集并聚合來自各參與方的模型參數,形成全局模型;以多次迭代方式優化全局模型,完成數據融合[4]。在異構數據中,存在冗余或沖突的信息。Tucker分解和聯邦學習框架在處理這些信息時無法完全避免冗余和沖突的影響,進而影響數據融合效果。王姝等人利用信息熵評估各證據源的相對重要性,并通過散度計算來獲取證據可信度優化證據,得到差異信息量,確定各數據源的最終權重,進行數據融合[5]。信息熵方法主要關注于信息量的評估,而對于數據之間的冗余性缺乏直接的識別能力,導致數據融合過程中冗余數據仍然被保留,增加數據處理的復雜性和計算成本。匡廣生等人利用圖的聚類算法來識別數據中的相似性,進而將相似的數據項進行融合[6]。圖的聚類算法主要依賴于數據間的相似關系進行聚類。然而,當數據集中存在關聯缺失時,該算法無法準確地將這些數據項劃分為同一聚類,導致數據融合結果無法完全反映數據間的真實關系。Gong等人提出了一種多粒度視覺引導的多模態異構圖實體級融合命名實體識別方法,該方法通過在不同視覺粒度上整合文本與視覺的跨模態語義交互信息,構建全面的多模態表示[7]。利用多模態異構圖精確描述實體級單詞與視覺對象的語義關系,并借助異構圖注意力網絡實現細粒度跨模態語義交互,顯著提升識別準確率,但實現過程復雜度較高,可能影響應用效率。

在多源數據融合過程中,數據冗余和沖突是常見問題。知識圖譜通過去重、糾錯等步驟,以及關系網絡的構建,能夠減少數據冗余和沖突,提高數據融合的準確性和可靠性。同時,知識圖譜通過構建實體之間的關系網絡,能夠發現數據之間的潛在關聯,從而補全數據關聯缺失的問題。為此,研究面向多源異構數據的知識圖譜可視化融合方法,充分利用各種數據資源,避免數據浪費,提高數據利用率。


本文詳細內容請下載:

http://www.jysgc.com/resource/share/2000006561


作者信息:

梁浩1,付達2

(1.深圳鵬銳信息技術股份有限公司,廣東 深圳 518055;

2.北京京能能源技術研究有限責任公司,北京 100020)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 鸡鸡插屁股视频| 一区二区三区久久精品| 欧美亚洲国产一区二区三区| 免费**毛片在线播放视| 美女被cao免费看在线看网站| 国产在线精品一区二区| 两个人看的视频播放www | 亚洲色图黄色小说| 精品人妻少妇一区二区三区在线| 国产乱人视频在线播放| 高清毛片aaaaaaaa**| 国产白领丝袜办公室在线视频| 44444色视频在线观看| 国产黄色片在线观看| WWW免费视频在线观看播放| 好黄好猛好爽好痛的视频| 中文字幕一区日韩在线视频| 日本亚州视频在线八a| 久久婷婷五月综合97色| 最新69堂国产成人精品视频| 亚洲av永久精品爱情岛论坛| 欧美另类精品xxxx人妖换性| 亚洲欧美中文日韩欧美| 污视频免费看网站| 亚洲视频456| 浪荡欲乱之合集| 人人澡人人澡人人看添av| 男女做羞羞的事漫画| 免费精品国产日韩热久久| 精品哟哟哟国产在线不卡| 办公室啪啪激烈高潮动态图| 精品视频香蕉尹人在线| 变态调教视频国产九色| 美女张开腿让男人桶的动态图| 99精品在线播放| 天堂新版资源中文最新版下载地址| www久久com| 天天爽夜夜爽每晚高澡| av无码免费永久在线观看| 天天操2018| 99精品在线播放|