數(shù)據(jù)中心最新文章

基于預(yù)訓(xùn)練模型的基層治理敏感實(shí)體識別方法

基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進(jìn)行數(shù)據(jù)脫敏。因此,需要對非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行命名實(shí)體識別以提取敏感數(shù)據(jù)。首先把敏感實(shí)體分為16類并對信訪文本進(jìn)行標(biāo)注,輸入層表示采用預(yù)訓(xùn)練模型BERT,編碼層利用雙向長短時記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過條件隨機(jī)場模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實(shí)體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權(quán)重,并采用敏感實(shí)體框選率輔助評價模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進(jìn)行實(shí)驗,F(xiàn)1值分別為88.38%和90.11%,相較于基準(zhǔn)模型提升了4.64%和3.78%。該模型可應(yīng)用于非結(jié)構(gòu)化文本的敏感實(shí)體識別,識別成功率高。現(xiàn)有評價指標(biāo)未能較好地反映敏感實(shí)體的間接推理關(guān)系,應(yīng)當(dāng)探索更完善的敏感實(shí)體評價體系。

發(fā)表于:9/25/2023

主站蜘蛛池模板: 日韩丰满少妇无码内射| 你懂的在线视频| 久久精品天天中文字幕人妻| 日批视频网址免费观看| 插鸡网站在线播放免费观看| 亚洲码欧美码一区二区三区| 被三个男人绑着躁我好爽视频| 天天爽天天爽夜夜爽毛片| 亚洲va韩国va欧美va| 精品国精品无码自拍自在线| 国产精品亚洲欧美日韩久久| 一级毛片aa高清免费观看| 欧美国产小视频| 动漫美女被吸乳羞羞网站动漫| 色婷婷丁香六月| 天天操夜夜操天天操| 中文人妻无码一区二区三区| 欧美丰满熟妇xxxx性ppx人交| 公和我做好爽添厨房| 国产精品www| 天堂√最新版中文在线天堂 | 亚洲人成网站免费播放| 综合偷自拍亚洲乱中文字幕| 国产清纯白嫩初高生在线观看性色 | 欧美一区二区三区久久综| 免费特级黄毛片| 青青免费在线视频| 国产裸体歌舞一区二区| 中国国语毛片免费观看视频| 永久免费无内鬼放心开车| 国产一区二区福利| 69av在线播放| 天天澡天天碰天天狠伊人五月 | 黑冰女王踩踏视频免费专区| 在线精品91青草国产在线观看| 久久久久久久亚洲AV无码 | 怡红院av一区二区三区| 久久精品水蜜桃av综合天堂| 未满十八18禁止免费无码网站| 亚洲视频一区在线播放| 羞羞视频在线播放|