《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > CoNLL 2018 | 最佳論文揭曉:詞嵌入獲得的信息遠比我們想象中的要多得多

CoNLL 2018 | 最佳論文揭曉:詞嵌入獲得的信息遠比我們想象中的要多得多

2018-10-31

CoNLL自然語言處理領域的頂級會議,每年由 SIGNLL 組織舉辦。CoNLL 2018 大會將于 10 月 31 日-11 月 1 日在比利時布魯塞爾舉行,地點與 EMNLP 2018 一樣(EMNLP 2018 將于 10 月 31 日-11 月 4 日舉行)。


昨日,CoNLL 公布了最佳論文,由來自西班牙巴斯克大學 IXA NLP 組的 Mikel Artetxe 等人獲得。該論文展示了詞嵌入模型能夠捕獲不同層面的信息(如語義/句法和相似度/相關度),為如何編碼不同的語言信息提供了新的視角,該研究還研究了內外部評估之間的關系。

 

近年來,詞嵌入成為自然語言處理的核心主題。業內提出了多種無監督方法來高效地訓練單詞的密集型向量表征,且成功地應用到語法解析、主題建模、文檔分類等多類任務。


機器之心Synced詞嵌入小程序


雖然從理論角度理解這些模型是更加活躍的研究路線,但這些研究背后的基本思路都是為類似的單詞分配類似的向量表征。由此,大部分詞嵌入模型依賴來自大型單語語料庫的共現統計信息(co-occurrence statistics),并遵循分布假設,也就是相似單詞傾向于出現在相似語境中。


然而,上述論點沒有定義「相似單詞」的含義,且詞嵌入模型實際中應該捕捉哪種關系也不完全清楚。因此一些研究者在真正相似度(如 car - automobile)與關聯度(如 car - road)之間進行區分。從另一個角度來說,詞語相似度可聚焦在語義(如 sing-chant)或者句法(如 sing-singing)上。我們把這兩個方面作為相似度的兩個坐標軸,且每一個坐標軸的兩端為兩種性質:語義/句法軸和相似度/關聯度軸。


本論文提出了一種新方法來調整給定的任意嵌入向量集,使其在這些坐標軸中靠近特定端點。該方法受一階和二階共現研究的啟發,可推廣為詞嵌入向量線性變換的連續參數,我們稱之為相似度階(similarity order)。雖然業內提出了多種學習特定詞嵌入的方法,但之前的研究明確地改變了訓練目標,且總是依賴知識庫這樣的外部資源。而本論文提出的方法可用做任意預訓練詞嵌入模型的后處理,不需要任何額外資源。同樣,該研究表明,標準的詞嵌入模型能夠編碼不同的語言信息,但能夠直接應用的信息有限。此外,該研究也分析了該方法與內部評估和下游任務的關系。該論文主要貢獻如下:


1. 提出了一個具備自由參數的線性變換,能夠調整詞嵌入在相似度/關聯度和語義/句法坐標軸中的性能,并在詞匯類推數據集和相似度數據集中進行了測試。


2. 展示了當前詞嵌入方法的性能受到無法同時顯現不同語言信息(例如前面提到的坐標軸)的限制。該研究提出的方法表明,詞嵌入能夠捕獲的信息多于表面顯現出的信息。


3. 展示了標準的內部評估只能給出一個靜態的不完整圖景,加上該研究提出的方法能夠幫助我們更好地理解詞嵌入模型真正編碼哪些信息。


4. 展示了該方法也能運用到下游任務中,但相比于使用一般詞嵌入作為輸入特征的監督系統,其效果在直接使用詞嵌入相似度的無監督系統上更顯著,因為監督系統有足夠的表達能力來學習最優變換。


總之,該研究揭示了詞嵌入如何表示不同語言信息,分析了它在內部評估和下游任務中所扮演的角色,為之后的發展開創了新機遇。


論文:Uncovering divergent linguistic information in word embeddings with lessons for intrinsic and extrinsic evaluation

微信圖片_20181031230220.jpg


論文鏈接:https://arxiv.org/abs/1809.02094


摘要:隨著詞嵌入最近取得成功,有人認為根本不存在詞的理想表征,因為不同的模型傾向于捕捉不同且往往互不兼容的方面,如語義/句法和相似性/相關性。本論文展示了每個詞嵌入模型捕獲的信息多于直接顯現的信息。線性轉換無需任何外部資源就能調整模型的相似度階,因此能夠調整模型以在這些方面獲得更好的結果,這為詞嵌入編碼不同的語言信息提供了新的視角。此外,我們還探索了內、外部評估的關系,我們在下游任務中的變換效果在無監督系統中的效果優于監督系統。


機器之心Synced非監督學習小程序


內部評估

微信圖片_20181031230254.jpg

表 1:原始嵌入以及具備對應 α 值的最佳后處理模型的內部評估結果。評估指標是詞匯類比任務的準確率和詞語相似度的斯皮爾曼等級相關系數。

微信圖片_20181031230312.jpg

圖 1:詞匯類比任務中,不同 α 值所對應的相對誤差減少,原始嵌入的 α = 0。


外部評估

微信圖片_20181031230329.jpg

表 2:原始嵌入和具備對應 α 值的最佳后處理模型的語義文本相似度結果,衡量標準為皮爾遜相關系數。DAM 分數是 10 次運行的平均得分。

微信圖片_20181031230347.jpg


圖 3:不同 α 值對應的語義文本相似度結果。DAM 分數是 10 次運行的平均得分。


討論


我們認為該研究為嵌入編碼不同語言信息提供了新的視角,其與內外部評估之間的關系如下所示:


標準內部評估提供的是不同詞嵌入模型編碼的靜態、不完整信息圖。

使用預訓練嵌入作為特征的監督系統具備足夠的表達能力來學習任務的最優相似度階。

盡管我們的研究展示了嵌入捕獲的默認相似度階對較大的學習系統影響較小,但它未必是最優的整合策略。如果研究者認為某個相似度階可能更適合某個下游任務,則他/她設計的整合策略很可能鼓勵這個相似度階,我們認為這是未來一個有趣的研究方向。例如,研究者可以設計正則化方法去懲罰預定義相似度階的較大偏差。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产欧美一区视频| 亚洲国产二区| 欧美激情第1页| 老色鬼久久亚洲一区二区| 久久er精品视频| 香蕉久久一区二区不卡无毒影院| 一区二区三区精品| 日韩视频免费观看高清在线视频 | 亚洲福利国产| 午夜亚洲影视| 翔田千里一区二区| 亚洲视频在线视频| 亚洲一区二区不卡免费| 国产精品99久久久久久久久| 在线亚洲精品| 亚洲私人影院在线观看| 亚洲天堂av综合网| 亚洲一级二级| 亚洲一区二区欧美| 亚洲欧美久久久久一区二区三区| 亚洲欧美美女| 欧美在线视频日韩| 亚洲国产精品一区二区www在线 | 国产乱理伦片在线观看夜一区| 国产精品久久一级| 国产日韩精品久久久| 国产目拍亚洲精品99久久精品| 国产亚洲福利社区一区| 黄色成人在线免费| 亚洲国产精品t66y| 最新热久久免费视频| 亚洲卡通欧美制服中文| 在线综合亚洲| 亚洲欧美日韩系列| 久久精品国内一区二区三区| 亚洲黄色毛片| 99精品福利视频| 午夜精品久久久久久久99热浪潮 | 欧美日韩国产三级| 国产精品欧美一区二区三区奶水| 国产伦一区二区三区色一情| 国内精品久久久久久久影视麻豆| 一区在线电影| 99精品视频一区| 亚洲欧美日韩精品综合在线观看| 欧美一区二区三区在线看| 亚洲精品一区二区三区99| 亚洲一区二区三区免费在线观看| 欧美一区在线看| 欧美大片在线观看| 欧美性事在线| 国语自产精品视频在线看一大j8 | 久久久久久穴| 欧美日本韩国一区| 国产欧美韩日| 亚洲国产三级在线| 亚洲欧美电影院| 亚洲激情综合| 亚洲综合激情| 男同欧美伦乱| 国产精品亚洲人在线观看| 一区二区在线视频观看| 一本色道综合亚洲| 亚洲第一狼人社区| 亚洲一区二区三区在线观看视频| 久久精品中文| 欧美天堂亚洲电影院在线播放| 国产亚洲人成a一在线v站| 亚洲人体大胆视频| 欧美一级视频| 亚洲小说春色综合另类电影| 久久综合色播五月| 国产精品卡一卡二卡三| 亚洲国产欧美久久| 午夜一区不卡| 宅男噜噜噜66一区二区| 久久久久久夜精品精品免费| 欧美日韩在线不卡| 在线成人激情黄色| 亚洲免费一区二区| 一区二区欧美国产| 久久在线视频在线| 国产精品一级二级三级| 亚洲人体大胆视频| 亚洲大片精品永久免费| 亚洲欧美综合网| 欧美日本一道本| 精品成人在线观看| 亚洲欧美一区二区三区极速播放| 日韩一级大片在线| 久久婷婷av| 国产精品一区视频网站| 亚洲美女免费精品视频在线观看| 久久精品国产精品亚洲综合| 亚洲制服av| 欧美日韩成人激情| 亚洲高清一区二区三区| 久久精品国产一区二区三区| 亚洲欧美日韩综合aⅴ视频| 欧美日韩国产在线| 亚洲国产小视频在线观看| 久久国产高清| 久久激情网站| 国产日韩欧美夫妻视频在线观看| 一区二区高清在线| 在线视频精品一| 欧美日韩国产欧美日美国产精品| 亚洲国产高潮在线观看| 亚洲国产免费| 久久久久青草大香线综合精品| 国产精品视频一区二区三区| 一区二区三区欧美在线| 一区二区三区高清在线观看| 欧美激情1区| 亚洲电影第1页| 亚洲第一在线视频| 久久久亚洲一区| 国内久久精品| 久久精品久久综合| 久久精品主播| 国产资源精品在线观看| 亚洲欧美在线另类| 欧美一区二区高清| 国产精品视频网| 精品不卡一区| 91久久精品美女高潮| 欧美不卡在线视频| 亚洲黄色三级| 一本色道久久| 欧美三日本三级少妇三99| 亚洲最新合集| 亚洲欧美日韩一区二区三区在线观看| 欧美色另类天堂2015| 一区二区三区波多野结衣在线观看| 亚洲私人影吧| 国产精品久久久免费| 亚洲一区自拍| 久久成人免费视频| 国产在线播放一区二区三区| 久久精品国产v日韩v亚洲| 蜜臀av国产精品久久久久| 亚洲国产精品激情在线观看| 亚洲精品中文字幕在线| 欧美日韩精品免费观看| 亚洲视频福利| 久久精品一二三| 在线精品一区| 在线亚洲激情| 国产精品婷婷午夜在线观看| 午夜国产精品视频| 可以免费看不卡的av网站| 亚洲经典三级| 亚洲永久免费| 国产亚洲精品久久久久久| 亚洲第一主播视频| 欧美日本高清一区| 亚洲午夜一区| 久久久青草婷婷精品综合日韩| 在线不卡欧美| 亚洲一区二区欧美| 国产亚洲二区| 亚洲精品网址在线观看| 欧美成人精品一区| 国产精品99久久久久久久女警| 久久精品在线观看| 最新成人av网站| 欧美一二区视频| 亚洲国产精品成人| 亚洲欧美日本视频在线观看| 激情另类综合| 这里只有精品电影| 国内精品一区二区三区| 一区二区三区四区五区精品视频| 国产精品揄拍一区二区| 亚洲精品黄色| 国产美女诱惑一区二区| 亚洲免费激情| 国产一区二区三区视频在线观看| 日韩视频在线播放| 国产情侣一区| 一区二区久久久久| 激情综合亚洲| 午夜精品免费视频| 精品不卡一区| 欧美一区国产二区| 99精品国产在热久久下载| 久久免费偷拍视频| 一区二区三区国产精品| 欧美91大片| 欧美一级二区| 国产精品豆花视频| 99国产精品| 黄色成人免费网站| 先锋影院在线亚洲| 亚洲精品一二三区| 噜噜爱69成人精品| 午夜在线播放视频欧美| 欧美日韩在线精品| 亚洲人午夜精品免费| 国产综合精品一区|