基于BERT-BiGRU-CRF與多頭注意力機(jī)制 | |
所屬分類:技術(shù)論文 | |
上傳者:wwei | |
文檔大小:991 K | |
標(biāo)簽: 地理知識(shí)圖譜 命名實(shí)體識(shí)別 BERT預(yù)訓(xùn)練模型 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:地理知識(shí)圖譜作為一種科學(xué)領(lǐng)域的知識(shí)圖譜,從概念探討和初步實(shí)驗(yàn)階段快速發(fā)展為地理信息科學(xué)領(lǐng)域的跨學(xué)科研究熱點(diǎn)。地理命名實(shí)體識(shí)別是地理知識(shí)圖譜構(gòu)建的基礎(chǔ),直接影響著地理知識(shí)圖譜的構(gòu)建效率與質(zhì)量。設(shè)計(jì)了一個(gè)地理知識(shí)圖譜應(yīng)用管理系統(tǒng),針對其中地理實(shí)體庫構(gòu)建過程依賴人工制定規(guī)則以及信息提取不充分等問題,面向地理知識(shí)圖譜構(gòu)建過程進(jìn)行地理命名實(shí)體識(shí)別研究。首先,通過人工標(biāo)注方法構(gòu)建了一個(gè)地理知識(shí)語料庫;其次,通過BERT預(yù)訓(xùn)練模型得到結(jié)合語境信息的動(dòng)態(tài)字向量,利用雙向門控循環(huán)單元提取全局語義特征,并基于注意力機(jī)制獲得增強(qiáng)語義特征;最后,通過CRF解碼輸出概率最大的全局最優(yōu)標(biāo)簽序列,實(shí)現(xiàn)地理命名實(shí)體的自動(dòng)識(shí)別。實(shí)驗(yàn)結(jié)果表明,相比傳統(tǒng)的BiLSTM-CRF、BERT-BiLSTM-CRF等模型,所提出的基于BERT-BiGRU-CRF與多頭注意力機(jī)制的模型在地理命名實(shí)體識(shí)別任務(wù)中表現(xiàn)更優(yōu),能夠?yàn)榈乩碇R(shí)圖譜構(gòu)建提供有效支撐。 | |
現(xiàn)在下載 | |
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2