《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 面向農業知識圖譜構建的文本實體標注準則構建及應用
面向農業知識圖譜構建的文本實體標注準則構建及應用
2023年電子技術應用第5期
陳曉晉1,唐球2,王耀君1
(1.中國農業大學 信息與電氣工程學院,北京 100083;2.中國電子信息產業集團有限公司第六研究所,北京 100083)
摘要: 隨著農業大數據及智慧農業的發展,面對海量的農業文本數據,構建知識圖譜等自然語言處理應用需求逐漸增長。目前,在農業領域的實體語料庫及實體標注體系仍處于空白狀態。對農業文本進行處理時,面臨如何定義實體類別及范圍等問題。基于此問題,以農業科學敘詞表為科學依據,提出面向農業知識圖譜構建的農業文本數據實體標注準則,涵蓋了農作物、病蟲草害等多種農業實體,以及基于該準則設置標注原則構建基于農業文本的自注釋語料庫,并進行實驗驗證,證明了該準則的有效性。該準則為農業實體語料庫的構建提供可參考的標注規范,以及為農業實體識別提供語料支持。
中圖分類號:TP391
文獻標志碼:A
DOI: 10.16157/j.issn.0258-7998.233824
中文引用格式: 陳曉晉,唐球,王耀君. 面向農業知識圖譜構建的文本實體標注準則構建及應用[J]. 電子技術應用,2023,49(5):1-7.
英文引用格式: Chen Xiaojin,Tang Qiu,Wang Yaojun. Construction and application of agricultural text data entity labeling criteria for agricultural knowledge graph construction[J]. Application of Electronic Technique,2023,49(5):1-7.
Construction and application of agricultural text data entity labeling criteria for agricultural knowledge graph construction
Chen Xiaojin1,Tang Qiu2,Wang Yaojun1
(1.College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China; 2.National Computer System Engineering Research Institute of China ,Beijing 100083 ,China)
Abstract: With the development of agricultural big data and smart agriculture, in the face of massive agricultural text data, the demand for building knowledge graph and other natural language processing applications has gradually increased. At present, the entity corpus and entity labeling system in the agricultural field are still in a blank state. When dealing with agricultural texts, we are faced with such problems as how to define the category and scope of entities. Based on this problem, this paper takes the agricultural thesaurus as the scientific basis, proposes the agricultural text data entity labeling criteria for the construction of agricultural knowledge graph, covering a variety of agricultural entities such as crops, pests and weeds, and constructs a self-annotation corpus based on agricultural text based on the labeling principles of the criteria, and carries out experimental verification to prove the effectiveness of the criteria. This criterion provides a referential labeling specification for the construction of agricultural entity corpus and corpus support for agricultural entity recognition.
Key words : knowledge graph;agricultural text;entity tagging;knowledge representation

0 引言

近年來,隨著大數據技術的發展,各個領域的數值、圖像、文本、語音視頻等多源大數據增長迅速。以農業領域為例,農業新聞、農資信息、農業政策法規等與農業生產生活息息相關的信息通過互聯網發布和傳播,構成了農業文本大數據的主要組成部分。農業從業者及研究者主要通過網絡中的文本信息來獲取農業資訊,有效分析文本數據不僅可以幫助農業從業者了解最新的實踐和趨勢,還可以為農業從業者、專家在農業任務管理中做出決策提供支持。農業資訊中蘊含著大量的專業農業知識及豐富的農業信息,且主要以非結構化的形式存在。農業領域的命名實體識別的任務是從非結構化的文本中識別與農業領域相關的實體,例如作物名稱、病蟲害、農藥、肥料等,是作為農業知識圖譜構建和問答等下游任務不可或缺的基本組成部分。

針對命名實體識別任務的主要方法為,基于規則和字典匹配、基于機器學習的方法以及兩者混合的方法。但存在不足,無法滿足復雜文本需求,仍有局限性。

近年來隨著深度學習的快速發展,其實現了無需復雜的特征工程和豐富的領域知識就可以學習復雜的隱藏表示。目前,基于深度學習的模型已被廣泛應用于完成命名實體識別任務,并已廣泛應用于醫學、金融等領域,但是目前,在農業領域仍存在挑戰。

農業文本實體存在著領域特殊性、實體命名方式繁多、實體邊界模糊、特征提取不充分、實體邊界標注不一致、數據庫不足等問題。這在一定程度上增加了識別農業文本中實體的成本和難度。

為了解決上述問題,并促進基于農業文本命名實體識別任務及其后續應用的完成,本文將構建農業文本數據實體標注準則,并以此建立農業實體標注語料庫。為農業領域相關從業人員提供實體標注準則,便于其開展農業文本研究,例如知識圖譜構建及問答等相關工作。



本文詳細內容請下載:http://www.jysgc.com/resource/share/2000005299




作者信息:

陳曉晉1,唐球2,王耀君1

(1.中國農業大學 信息與電氣工程學院,北京  100083;2.中國電子信息產業集團有限公司第六研究所,北京 100083)


微信圖片_20210517164139.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 年轻人免费看电影网站| 曰批免费视频播放在线看片二| 四虎永久在线精品视频免费观看 | 污污视频在线观看免费| 初尝黑人巨砲波多野结衣| 色综合a怡红院怡红院首页| 国产成人无码AⅤ片在线观看| 三级网站在线免费观看| 激情内射日本一区二区三区| 吃女邻居丰满的奶水在线观| 青娱乐在线播放| 国产日韩精品一区二区在线观看播放 | 狠狠色综合一区二区| 中文字幕亚洲综合久久综合| 日韩午夜电影在线观看| 亚洲av乱码一区二区三区香蕉 | 国产在线一区二区三区av| ass日本熟妇大全pic| 嫩草成人永久免费观看| 中文午夜人妻无码看片| 无码人妻一区二区三区在线视频 | 7777久久亚洲中文字幕蜜桃| 揉美女胸的黄网站| 久久大香香蕉国产免费网站| 最近中文字幕高清字幕在线视频| 亚洲国产小视频| 欧美在线视频a| 亚洲国产第一区| 欧美性白人极品hd| 亚洲国产精品张柏芝在线观看| 欧美牲交a欧美牲交aⅴ久久| 亚洲欧美日韩精品久久| 污视频免费网站| 亚洲精品二三区伊人久久| 波多野结衣中文字幕一区| 亚洲精品自产拍在线观看| 激情综合色综合啪啪开心| 亚洲视频在线观看免费视频| 狠狠色狠狠色综合伊人| 人人爽人人澡人人高潮| 特黄aaaaaaaaa及毛片|