不可靠語(yǔ)料庫(kù)的提純及詞權(quán)度量指標(biāo)IDF的改進(jìn) | |
所屬分類(lèi):技術(shù)論文 | |
上傳者:aet | |
文檔大小:447 K | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:不良短信的泛濫嚴(yán)重影響了社會(huì)風(fēng)氣,干擾了人們正常的生活秩序,研發(fā)不良短信過(guò)濾技術(shù)具有相當(dāng)高的實(shí)用價(jià)值。研究了文本分類(lèi)中的兩個(gè)問(wèn)題,可應(yīng)用于不良短信過(guò)濾。其一是應(yīng)用聚類(lèi)方法進(jìn)行不可靠語(yǔ)料集的提純,實(shí)驗(yàn)表明,該方法對(duì)不可靠數(shù)據(jù)的提純效果比較明顯;其二是關(guān)于IDF詞權(quán)度量指標(biāo)的一點(diǎn)改進(jìn)。 | |
現(xiàn)在下載 | |
VIP會(huì)員,AET專(zhuān)家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2