《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于分簇的本體映射方法
基于分簇的本體映射方法
來源:微型機與應用2013年第2期
熊 穎,李海波,李 靜
(華僑大學 計算機科學與技術學院,福建 廈門361021)
摘要: 為了能夠充分地挖掘、分享和重復利用本體中的知識,提出一種基于映射關系的分簇方法,先通過已存在的高質量的本體映射關系,對原本體和目標本體分別進行分簇,再挖掘出實體間潛在的關系。通過實驗證明,采用改進的映射方法提高了本體映射的質量,采用具有完善實體關系的映射結果提高了檢索系統的準確率和查全率。
Abstract:
Key words :

摘  要: 為了能夠充分地挖掘、分享和重復利用本體中的知識,提出一種基于映射關系的分簇方法,先通過已存在的高質量的本體映射關系,對原本體和目標本體分別進行分簇,再挖掘出實體間潛在的關系。通過實驗證明,采用改進的映射方法提高了本體映射的質量,采用具有完善實體關系的映射結果提高了檢索系統的準確率和查全率。
關鍵詞: 分簇;本體映射;實體關系發現

    隨著越來越多的本體被開發,以及持續性和高效性的知識訪問需求不斷提高,本體知識的充分挖掘、分享和重復利用已成為本體庫優化的重要研究內容。由于本體的獨立開發性,導致在相同或者重疊領域本體中實體的定義和實體間的關系有所不同,即本體間的互操作性較低。本體映射已成為當今本體研究中的熱點,它是解決并促進本體間互操作性問題的重要方法。但是要更充分地挖掘、分享和重復利用本體知識,該方法還需要不斷地改進和優化。本體映射過程中存在以下兩個問題:
    (1)基于特征低相似性進行本體映射的質量不高。目前對語義、詞匯和結構特性相似度較高的本體進行映射,在一定范圍內其映射質量是較高的,但是大部分本體的建模粒度都不相同,導致本體中實體表示的詞匯和結構特性都不相同,即本體中實體的特征相似度較低,所以采用基于詞匯和結構特征的相似性進行本體映射的質量不高。
    (2)映射結果中實體關系不夠完善。目前大量本體映射方法在建立了本體映射關系后不會對實體關系進行分析和處理,導致本體映射結果的實體關系不夠完善,應用質量較低。
1 相關工作
    目前大多數的本體映射方法(例如ASMOV[1-2]和RiMOM[3]等)是基于詞匯和結構特征的相似性進行本體映射的,在一定范圍內映射質量較高,但當兩個本體的建模粒度不相同時,采用基于這些特征相似性進行本體映射的質量就較低。例如,石灰在原本體中包括氧化鈣和氫氧化鈣,在目標本體中包括煅燒石灰、熟石灰、石灰乳和消石灰,這兩個本體中用不同的術語描述相同的信息石灰,采用傳統的本體映射方法測量得到的映射準確度低于1%,本體映射時就無法建立實體間高質量的映射關系。為解決這一問題,可以重復利用已存在的高質量本體映射關系,提高本體映射的質量。調查本體映射關系重復利用的目的在于利用多對一或者一對多的實體映射關系實現分簇的過程,從而獲取準確的匹配信息。
    本文以最新的ASMOV映射系統[4]為基礎。它是一種半自動化本體映射過程,聯合了元素級和結構級的相似度測量,使用本體中四種不同特征相似度的加權平均值作為實體間的總相似度,采用了語義驗證要求遵守的規則來判斷是否建立映射鏈接的技術,以確保建立的映射鏈接不包含語義矛盾,但是其映射匹配的準確率和查全率還有待提高。針對本體映射過程中存在的問題以及ASMOV在映射匹配質量方面的不足,提出了一種基于分簇的本體映射方法OMMC(Ontology Mapping Method based on Clumping),該方法有助于建立本體間高質量的映射關系,通過高質量的映射關系再進行實體間關系的再發現,從而提高了本體映射的應用質量。
2 基于分簇的本體映射
    基于分簇的本體映射的流程是:先將原本體和目標本體分別進行分簇,再將分簇后的原本體和目標本體應用于ASMOV映射系統中的本體映射,主要包括分簇和建立映射鏈接兩個模塊。
2.1 分簇
    定義1  簇。利用已存在的高質量的本體映射關系,在多對一的映射場景下,一個本體O中的多個實體和另一個本體中的相同實體匹配,則將這多個實體看做是一個簇,本體O可劃分為多個簇。
   
    對原本體和目標本體分別進行分簇,原本體和目標本體都被劃分為多個簇,得到一個原本體的劃分和一個目標本體的劃分。以農業領域的本體S和本體T為例,原本體S是PWP(Prism Web Pages)定義的一個中文本體,包含1 028個實體,S和本體PWP1已存在本體映射關系,通過它們之間的映射關系進行分簇,可將S劃分為196個簇,S中一個簇的映射關系如表1所示;目標本體T是FAO(Food and Agriculture Organization)定義的一個中文本體,包含2 420個實體,T和本體FAO1已存在本體映射關系,通過它們之間的映射關系進行分簇,將T劃分為357個簇,T中一個簇的映射關系如表2所示。
2.2 建立映射鏈接
    對原本體S和目標本體T分別進行分簇,得到了兩個穩定性劃分PS和PT后,直接進入本體映射匹配階段,在ASMOV系統中,對本體S和目標本體T采用OMMC方法進行映射的過程如圖1所示。

 

 

    本體映射的核心模塊是相似度計算,改進的ASMOV映射過程在相似度計算時要優先考慮在一個簇中的實

    運行改進后的ASMOV系統步驟如下:
    (1)數據準備。準備好已經分簇的原本體和目標本體。
    (2)預處理階段進行詞匯匹配。利用一個詞庫來計算概念、屬性和個體的詞匯相似度。
    (3)進行相似度計算。包括外部關系、內部匹配和個體匹配相似度的計算,并將計算結果放入相似度矩陣中。
    (4)從相似矩陣中提取兩個本體中相似度最高的匹配對實體集,依據這些實體集找到對應的簇,建立簇中實體間多對多的映射關系,并放入預映射模塊中。
    (5)對預映射模塊中的映射關系集進行語義驗證,即通過一些已定義的規則進行驗證并修剪無效的映射關系,且將連接無效映射關系的實體間相似度置零。循環執行步驟(3)~步驟(5),直到本體S或T中所有簇都執行一遍迭代過程。
    (6)提取最終的本體映射關系。
3 實體關系的再發現
    在建立了高質量的本體映射關系后,連接每一條映射關系的兩個實體間都可發現新的關系,主要包括父類關系發現、子類關系發現和等價類關系發現。
    規則1  父類關系發現是指若連接一條映射關系的兩個實體的父類不同,那么這兩個實體的父類可以合并,同時對合并后的父類消除重復,最后這兩個實體得到了相同的新的父類集合,依此類推應用于每一條映射關系中。如圖2所示,建立實體C4和實體E2的映射關系以后,C4和E2的父類都為C1和E1,若C1與E1重復,那么去除重復后C4和E2的父類都為C1或者E1。

    規則2  子類關系發現是指若連接一條映射關系的兩個實體的子類不同,那么這兩個實體的子類可以合并,同時對合并后的子類消除重復,最后這兩個實體得到了相同的新的子類集合,依此類推應用于每一條映射關系中。如圖3所示,建立C4和E2的映射關系以后,C4和E2的子類都為C5、C6、C7和E4,若E4與C5、C6和C7其中一個重復,那么去除重復后C4和E2的子類都為C5、C6和C7。

    在合并父類、子類及等價類關系時,以T為目標,且需互相說明彼此之間的關系,如果發生沖突,則調用以下沖突處理規則進行解決。
    規則 4  類層次結構沖突處理[6]。以目標本體中類層次結構為基準,刪除原本體的沖突結構,保證關系合并中類層次結構的完整性。例如在本體S中的C2和C3是等價類,在本體T中的E1是E2的父類,若C2和E1建立了映射關系,C3和E2建立了映射關系,則先合并E2,然后合并E1,本體中C2和C3既是父子關系又是等價關系,此時就存在類層次沖突問題,以本體T層次結構為基準,把C2和C3的等價類關系刪除。
4 實驗評估
4.1 改進ASMOV前后映射質量比較實驗

    在ASMOV的測試場景中,逐步對本體S和本體T進行映射檢測,獲取的參數包括標準配對數x、配對總數量n和配對總數n中準確的配對數r,通過獲取的參數值來計算匹配的準確率P和查全率R,其計算公式為P=r/n和R=r/x。經過多次測試改進前后的方法,證明采用OMMC方法得到的映射匹配質量均明顯提高,相對于傳統方法,在相同條件下采用OMMC方法使得匹配的準確率和查全率均提高了約0.2。比較結果如表3和圖5所示。

4.2 關系再發現前后映射結果應用的質量比較實驗
    本文提出的分簇方法是在已存在的高質量的本體映射關系中發現本體內部結構,即將本體劃分為若干個簇。在映射匹配時采用以簇為單位替換以實體為單位的ASMOV方法,建立高質量的本體映射關系,然后對實體關系進行再發現,完善了映射結果的實體關系。將實體關系完善前后的映射結果應用于海量農業信息語義檢索系統中,用多組請求信息分別進行檢索,比較檢索結果的準確率和查全率。
    海量農業信息語義檢索系統總體框架主要包括本體管理、數據獲取、請求管理、請求信息匹配、海量農業信息處理及語義請求客戶端6個部分。通過網絡爬蟲工具采集海量農業信息,并對爬下的網頁進行信息的抽取和整理,抽取和整理后的網頁可保存在海量農業信息數據庫中作為檢索時的資源庫。為使實驗能夠更準確和更快速得出結論,選擇了整理好的10萬個網頁作為資源庫,運用該系統進行實驗的具體步驟如下:
    (1)清除本體庫中已經存在的本體信息,將本體及映射結果添加到本體庫中。
    (2)將本體庫中的本體信息與海量農業信息相關聯,即運行信息標注與詞頻計算、倒排表建立和農業信息聚類3個模塊,并將關聯信息存入海量農業信息數據庫中。
    (3)通過配置文件管理接口設置配置文件信息,如本體庫中等價類、父類和子類各自所占的權重等。
    (4)啟動系統服務器,在用戶檢索接口輸入用戶需要檢索的信息。
    (5)計算檢索結果的準確率和查全率。
    在建立高質量的本體映射鏈接后得到映射結果M1,在完善映射結果M1中的實體關系后得到映射結果M2,將M1和M2分別應用于海量農業信息語義檢索系統中,運行該系統進行實驗,輸入多組檢索數據,計算檢索結果的準確率和查全率,如圖6所示。通過比較分析可知,對采用了M2的系統進行檢索,得到了較高的準確率和查全率,從而表明了完善映射結果中的實體關系對本體映射應用的重要性。

     本文提出一種基于映射關系的分簇方法,首先通過各自已有的映射關系,對原本體和目標本體分別進行分簇,再采用改進的ASMOV映射系統,建立高質量的映射關系,并完善實體間的關系。通過對比采用OMMC方法和傳統方法的ASMOV系統的映射質量,可知采用OMMC方法具有一定的優越性,即匹配結果更準確和全面;通過對比完善實體關系前后本體映射結果應用的質量,可知完善了實體關系的映射結果應用于檢索系統中,提高了檢索系統的準確率和查全率。
參考文獻
[1] Jérme Euzenat,MEILICKE C,STUCKENSCHMIDT H,et al.Ontology alignment evaluation initiative:six years of experience[C].Proceedings of the Journal on Data Semantics  XV.Berlin Heidelberg:Springer,2011:158-192.
[2] JEAN-MARY Y R,SHIRONOSHITA E P,KABUKA M R. Ontology matching with semantic verification[J].Web  Semantics,2009,7(3):235-251.
[3] Wang Zhichun,Zhang Xiao,Hou Lei,et al.RiMOM results for OAEI 2010[C].Proceedings of the 5th International  Workshop on Ontology Matching(OM-2010) collocated with  the 9th International Semantic Web Conference(ISWC-2010).Shanghai:CEUR-WS,2010:195-202.
[4] ASMOV Results for OAEI 2007[EB/OL].[2012-06-30].http://ftp.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-304/paper12.pdf,2007.
[5] 張釙.基于語義的網絡服務匹配機制的研究與實現[D]. 北京:清華大學,2005.
[6] 羅正海.面向語義Web服務的本體合并研究[D].大連:大連海事大學,2009.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲综合日本| 亚洲欧美中文字幕| 亚洲欧美日韩国产| 一区二区欧美激情| 亚洲美女在线一区| 亚洲人成小说网站色在线| 亚洲国产老妈| 亚洲欧洲在线免费| 亚洲福利在线视频| 亚洲国产美国国产综合一区二区| 黄色精品免费| 在线免费观看日韩欧美| 极品尤物久久久av免费看| 伊人成年综合电影网| 在线看欧美日韩| 亚洲国产高潮在线观看| 亚洲国产精品一区制服丝袜| 亚洲国产成人精品视频| 亚洲国产mv| 亚洲精选国产| 日韩视频一区二区三区在线播放免费观看| 亚洲日本理论电影| 日韩视频免费大全中文字幕| 一道本一区二区| 亚洲专区国产精品| 欧美一级视频免费在线观看| 欧美一区二区观看视频| 久久国产成人| 亚洲理伦电影| 亚洲综合不卡| 久久精品国产v日韩v亚洲 | 亚洲一级二级| 午夜精品久久久久久久白皮肤| 亚洲欧美日本国产有色| 久久国产视频网站| 欧美14一18处毛片| 欧美视频精品一区| 国产精品自拍网站| 在线成人av| 一本大道久久精品懂色aⅴ| 亚洲一区二区三区精品视频| 亚洲欧美中日韩| 亚洲国产精品一区制服丝袜 | 欧美怡红院视频| 麻豆精品视频在线观看| 欧美日韩一本到| 国产女主播一区| 在线观看国产精品淫| 99精品99| 欧美有码在线观看视频| 日韩视频在线观看| 欧美一级淫片播放口| 另类春色校园亚洲| 欧美日韩在线精品| 国产一区二区三区在线观看网站| 亚洲国产免费| 亚洲淫片在线视频| 亚洲激情自拍| 午夜一区在线| 欧美韩国一区| 国产午夜精品一区理论片飘花 | 香蕉乱码成人久久天堂爱免费| 久久久蜜桃一区二区人| 欧美日韩美女| 狠狠色综合日日| 亚洲午夜在线| 99xxxx成人网| 久久精品国产亚洲aⅴ| 欧美精品一区二区视频| 国产日本亚洲高清| 日韩一区二区精品| 亚洲黄色小视频| 欧美在线免费视频| 欧美日韩精品中文字幕| 激情五月***国产精品| 亚洲小少妇裸体bbw| 亚洲免费成人av电影| 久久激五月天综合精品| 欧美三区在线观看| 亚洲丰满在线| 欧美在线视频一区二区| 亚洲一区三区视频在线观看| 蜜臀a∨国产成人精品| 国产美女精品视频| 99国产精品99久久久久久粉嫩| 亚洲福利视频在线| 欧美综合激情网| 国产精品红桃| 日韩午夜电影av| 亚洲三级毛片| 久久综合影视| 国产视频一区在线观看| 一本色道久久加勒比精品| 亚洲精选视频在线| 久久综合狠狠综合久久综合88| 国产精品毛片在线看| 日韩亚洲欧美成人| 日韩视频免费观看高清完整版| 久久在线视频| 国产日韩亚洲欧美| 亚洲免费伊人电影在线观看av| 亚洲午夜在线观看| 欧美日韩免费观看中文| 亚洲国产精品尤物yw在线观看| 亚洲国产精品电影在线观看| 久久精品99国产精品日本| 国产精品一区二区黑丝| 亚洲无限av看| 亚洲视频二区| 欧美三日本三级少妇三2023| 亚洲欧洲一区二区三区在线观看| 亚洲人永久免费| 欧美成人伊人久久综合网| 精品成人在线| 亚洲韩日在线| 女同性一区二区三区人了人一| 影音先锋亚洲一区| 亚洲国产免费| 欧美大尺度在线观看| 亚洲国产美女久久久久| 亚洲狼人综合| 欧美日韩ab| 一区二区免费在线观看| 亚洲男人第一av网站| 国产精品劲爆视频| 亚洲免费在线精品一区| 欧美一区久久| 国内精品视频一区| 亚洲国产精品成人| 欧美波霸影院| 亚洲激情中文1区| 一区二区三区精品国产| 欧美性大战xxxxx久久久| 99视频超级精品| 羞羞答答国产精品www一本| 国产麻豆综合| 久久精品亚洲一区二区| 欧美国产精品一区| 日韩视频精品在线| 午夜精品免费在线| 国内精品久久久| 亚洲精品一区二区三区在线观看| 欧美精品一区二区三区在线播放| 日韩一级不卡| 久久成人18免费网站| 尤妮丝一区二区裸体视频| 日韩视频在线播放| 国产精品久久久久久久午夜片 | 尹人成人综合网| 日韩亚洲视频| 国产精品免费电影| 久久黄色小说| 欧美片第一页| 亚洲一区国产| 久久午夜视频| 日韩午夜电影在线观看| 性感少妇一区| 尤物精品在线| 亚洲深夜av| 国产一区二区三区av电影| 亚洲三级观看| 国产精品久久久久久久午夜| 欧美有码在线视频| 欧美日韩成人综合| 午夜久久99| 欧美喷水视频| 欧美一区二区三区视频在线 | 亚洲精品1区| 国产精品久久久久久模特| 欧美永久精品| 欧美三级中文字幕在线观看| 欧美一区二区国产| 欧美日韩国产电影| 午夜久久一区| 欧美精品精品一区| 午夜日本精品| 欧美日韩视频不卡| 欧美在线视频日韩| 欧美日韩免费观看一区| 欧美亚洲在线播放| 欧美日韩精品免费看| 久久黄色影院| 国产精品视频内| 亚洲精品美女91| 国产一二三精品| 亚洲伊人观看| 亚洲第一精品电影| 久久精品91| 在线视频一区观看| 欧美国产精品专区| 欧美主播一区二区三区美女 久久精品人| 欧美日韩激情小视频| 亚洲高清资源| 国产精品影院在线观看| 亚洲深夜福利网站| 亚洲国产成人91精品| 久久精品视频导航| 亚洲欧美999| 欧美三级电影精品| 99国产精品国产精品久久|