一種結(jié)合TF-IDF和Simhash的科技項目文本相似性度量方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:3591 K
標簽: 科技項目文本 文本相似度 TF-IDF
所需積分:0分積分不夠怎么辦?
文檔介紹:為了提高科技項目文本相似性度量的準確性和性能,將TF-IDF和Simhash相結(jié)合,提出了一種新的科技項目文本相似性度量方法。首先,該方法對科技項目文本進行預(yù)處理得到詞項集合,再使用TF-IDF計算詞項集合中每個詞項的權(quán)重值,并選取具有較高權(quán)重值的重要詞項;其次,使用Simhash把重要詞項映射為固定長度的二進制串,并求和得到文本的Simhash簽名;最后,使用漢明距離計算兩個Simhash簽名間的相似性。實驗結(jié)果表明,所提方法在查準率、召回率和F度量值方面優(yōu)于傳統(tǒng)的Simhash算法和TF-IDF方法。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 免费看欧美一级特黄a大片 | 偷拍区小说区图片区另类呻吟| 青草青草久热精品观看| 国产精品日韩欧美在线| chinese国产xxxx实拍| 成年丰满熟妇午夜免费视频 | 色噜噜在线观看| 国产成人久久777777| 2018av男人天堂| 在线视频一区二区日韩国产| 一本大道香蕉在线观看| 日本三级在线视频| 久精品国产欧美亚洲色aⅴ大片| 欧美最猛黑人xxxx黑人猛交黄| 伊人久久精品无码麻豆一区 | 久久免费动漫品精老司机| 欧美一级在线视频| 国产精品自在自线| yy一级毛片免费视频| 手机永久无码国产av毛片| 久久国产精品偷| 日韩色视频在线观看| 亚洲人成777| 欧美日韩国产精品自在自线| 亚洲综合视频在线| 秋霞电影网一区二区三区| 嘘禁止想象免费观看| 草莓视频在线免费 | 欧美日韩一区二区综合| 亚洲精品人成在线观看| 男人团vip每日更新番号库| 加勒比综合在线| 美女主动张腿让男人桶| 国产精品揄拍一区二区| 99r在线视频| 大乳丰满人妻中文字幕日本| g0g0人体全免费高清大胆视频| 客厅餐桌椅子上波多野结衣| 亚州一级毛片在线| 欧美午夜在线视频| 亚洲国色天香视频|