基于預訓練模型的基層治理敏感實體識別方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:3658 K
標簽: 預訓練語言模型 基層治理 中文命名實體識別
所需積分:0分積分不夠怎么辦?
文檔介紹:基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進行數(shù)據(jù)脫敏。因此,需要對非結(jié)構(gòu)化文本數(shù)據(jù)進行命名實體識別以提取敏感數(shù)據(jù)。首先把敏感實體分為16類并對信訪文本進行標注,輸入層表示采用預訓練模型BERT,編碼層利用雙向長短時記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過條件隨機場模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權(quán)重,并采用敏感實體框選率輔助評價模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進行實驗,F(xiàn)1值分別為88.38%和90.11%,相較于基準模型提升了4.64%和3.78%。該模型可應用于非結(jié)構(gòu)化文本的敏感實體識別,識別成功率高。現(xiàn)有評價指標未能較好地反映敏感實體的間接推理關(guān)系,應當探索更完善的敏感實體評價體系。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 国产成人涩涩涩视频在线观看免费| 妈妈的柔润小说在线阅读| 亚洲国产精品午夜电影| 男人激烈吮乳吃奶视频免费| 四虎影院国产精品| 青草青青视频在线观看| 国产极品美女高潮抽搐免费网站| 7777久久亚洲中文字幕蜜桃| 天堂新版8中文在线8| 一本精品99久久精品77| 打屁股xxxx| 久久久精品一区| 日韩精品一区二区三区在线观看 | 亚洲综合色区中文字幕| 国内精品一区二区三区最新| eeuss影院eeuss天堂| 好紧好大好爽14p| 一级做a爰片性色毛片刺激| 成年人视频在线免费播放| 久久久久亚洲AV无码麻豆| 日本暴力喉深到呕吐hd| 久久精品中文字幕不卡一二区| 最近韩国免费观看hd电影国语| 亚洲人成电影网站色| 欧美乱大交xxxxx在线观看| 亚洲国产精品免费视频| 欧美日韩生活片| 亚洲欧洲中文日韩久久av乱码| 污污视频网站免费在线观看| 亚洲综合五月天欧美| 狠狠做深爱婷婷久久综合一区| 免费在线观看理论片| 真正全免费视频a毛片| 六十路依然风韵犹存| 精品国产品香蕉在线观看| 啊灬啊灬啊灬快好深在线观看 | 欧美A级毛欧美1级a大片免费播放| 亚洲国产精品尤物yw在线观看| 欧美成人久久久| 亚洲国产日韩a在线播放| 欧美人与动性xxxxx杂性|