《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > Ian Goodfellow:你的GAN水平我來打分

Ian Goodfellow:你的GAN水平我來打分

2018-08-17

如何評價生成模型的性能好壞?這似乎是一個復雜而困難的任務。Ian Goodfellow 提出的生成對抗網絡 GAN 已經成為人工智能的重要研究方向,吸引了眾多學者投入研究。但 GAN 也遭遇了「改無可改」的呼聲(參見:六種改進均未超越原版:谷歌新研究對 GAN 現狀提出質疑)。近日,Goodfellow 團隊提出了一種全新生成模型評價方式,看來,GAN 的開山鼻祖終于坐不住了,他試圖親自解決這個問題。


Ian Goodfellow 表示:通過估計解釋模型表現的隱技能變量來評估生成模型的能力似乎是一個很有希望的研究方向。

微信圖片_20180817184112.jpg

谷歌研究科學家 Jordi Pont-Tuset 對于 CVPR 各屆接收論文名稱的統計,GAN 已經超過 LSTM,成為了重要關鍵詞,大有趕超「深度學習」的趨勢。但眾多論文里,真正的改進又有多少?


生成模型的評估是一項非常困難的任務。目前該領域已經探索了許多不同的方法,但每一種方法都存在顯著的缺點。Theis [2016] 和 Borji [2018] 等人概覽了這些方法,并展示了它們各自的缺點。


在這一篇論文中,谷歌大腦提出了一種通過對抗過程評估生成模型的新框架,在該對抗過程中,許多模型在錦標賽(tournament)中進行對抗。谷歌大腦團隊利用先前開發的人類選手評估方法來量化模型在這類錦標賽中的性能。


在國際象棋或網球比賽中,Elo 或 Glicko2 等技能評分系統通過觀察多個參賽者的勝利數和失敗數,推斷每一個參與者的隱藏、未觀察到的技能值(它們解釋了這些觀察到的輸贏數),從而評估他們的技能表現。同樣,谷歌大腦團隊通過構建一個多參與者的錦標賽將生成模型的評估構建為隱藏技能估計問題,該錦標賽可推廣至噪聲對比估計(NCE)和生成對抗網絡(GAN)所使用的兩參與者的可分辨博弈(two-player distinguishability game),并且估計參與這些錦標賽的生成模型的隱藏技能。


錦標賽的參與者可以是嘗試區別真實數據和偽數據的判別器,也可以是嘗試欺騙判別器將偽造數據誤認為是真實數據的生成器。雖然框架主要為 GAN 設計,但它也可以估計任何成為該框架參與者的模型效果。例如顯式密度模型等任何能夠生成樣本的模型都可以作為生成器。


我們引入了兩種方法來總結錦標賽的結果:


錦標賽勝率:錦標賽中每個生成器成功欺騙判別器的平均比率。

技能評分。用技能評分系統對錦標賽的結果進行評估,然后對每個生成器生成一個技能分數。


實驗表明,錦標賽是一種評估生成器模型的有效方式。首先,within-trajectory 錦標賽(在訓練的連續迭代中,單個 GAN 自身的判別器和生成器的 snapshot 之間)提供了一個有用的訓練進度衡量標準,即使只能接觸正在訓練的生成器或判別器。其次,更普遍的錦標賽(具有不同種子、超參數和架構的 GAN 生成器和判別器 snapshot 之間)提供了不同訓練過的 GAN 之間的有效對比。


本論文第二部分將研究放在生成模型評估系統這一更大背景下,詳細說明了谷歌大腦提出的方法和其他方法相比的優點和局限性。4.1 節初步證明了該方法適用于不能很好地表征為標準化圖像嵌入的數據集,例如未標注數據集或自然圖像以外的形式。谷歌大腦研究者還展示了使用技能評分系統來總結錦標賽結果,實現了在一場比賽中對所有參與者進行技能評分,而無需進行二次比賽。4.2 節展示了 GAN 判別器能成功地判斷哪些樣本來自于沒訓練過的生成器,包括其他 GAN 生成器和其他類型的生成模型。4.3 節展示了該方法可以應用于生成器近乎完美的情況下。


論文:Skill Rating for Generative Models

微信圖片_20180817184250.jpg


論文鏈接:https://arxiv.org/abs/1808.04888v1


摘要:我們利用評估人類選手在競技游戲中表現的方法,探索了一種評估生成模型的新方式。我們通過實驗展示了生成器和判別器之間的錦標賽為評估生成模型提供了一種有效方式。我們介紹了兩種對比錦標賽結果的方法:贏率和技能評定。評估在不同語境中都有用,包括監控單個模型在訓練過程中的進展、對比兩個不同的完全訓練模型的能力。我們展示了包含單個模型與其之前、之后版本比賽的錦標賽可以有效輔助對訓練進展的衡量。包含多個單獨模型(使用不同隨機種子、超參數和架構)的錦標賽提供了對不同訓練 GAN 的有效對比。基于錦標賽的評定方法在概念上與大量之前的評估生成模型方法不同,且具備互補的優劣勢。

微信圖片_20180817184322.jpg

圖 1:實驗 1 的 Within-trajectory 錦標賽結果。圖 1a:左圖展示了原始比賽結果。每個像素表示來自實驗 1 不同迭代的生成器和判別器之間的平均贏率。像素越亮表示生成器的性能越強。右圖對比了比賽的概括性指標和 SVHN 分類器得分。該圖中比賽贏率指熱力圖中每列平均像素值。(注意:i=0 時分類器得分低于 4.0,遮擋了同一軸線上其余曲線的對齊,因此我們選擇忽略它。)圖 1b 展示了相同的數據,不過它使用的是相距較遠的迭代之間的比賽,如圖 1b 左圖褐色像素所示的部分。右圖展示了技能評定繼續追蹤模型的進展,即使忽略了一些信息量最大的「戰斗」(早期生成器和晚期判別器,如圖左上角所示),而贏率不再具備信息。

微信圖片_20180817184346.jpg

圖 2:繪制蘋果圖片的 within-trajectory 技能評分。我們評估了在 QuickDraw 數據集上訓練的 DCGAN。從左到右,主觀樣本(subjective sample)質量隨著迭代次數的增加而提高。SVHN 分類器判斷這些樣本質量的能力不強,迭代 0 次時評成了最高分,此后提供了不穩定且惡化的得分。SVHN Fréchet 距離擬合地更好,采樣質量的評分穩定增加,直到 1300 次迭代;但是,它會在 1300 上飽和,而主觀樣本質量繼續增加。(注意 Fréchet 距離圖上的 y 軸是反轉的,這使得較低距離(更好質量)在圖上位置更高)。within-trajectory 技能評分在 1300 次迭代以后繼續提升。

微信圖片_20180817184408.jpg

圖 3:多軌競賽結果。我們組織了一個競賽,其中包含 SVHN 生成器和具有不同種子、超參數和架構的模型的判別器 snapshot(已在 4.2 節中提及)。我們利用 SVHN 分類器評分 (左)、SVHN Fréchet 距離 (中) 和技能評分方法(右;見 3.2 節)對其進行評估。每個點代表一個模型一次迭代的分數。總體軌跡表明隨著訓練次數增加,每個模型都得到了改進。要注意 Fréchet 距離圖上的 y 軸是反轉的,這使得較短的距離(質量較好)在坐標圖上標得更高。真實數據樣本的得分用黑線表示。6-auto 的分數是根據單個 snapshot 而非一條完整的訓練曲線來計算的,并以灰線表示。技能評分生成的學習曲線與 Fréchet 距離生成的學習曲線大致相同,僅在條件模型 4-cond 和 5-cond 中與分類器得分的曲線不一致——我們在 4.2 節中對此差異進行了推測。

微信圖片_20180817184651.jpg

圖 4:完全訓練的生成模型樣本。從每個訓練模型中,我們展示了 64 個樣本(來自 GAN 的 200,000 次迭代和 6-auto 的 106 次 epoch),以及用于比較的真實數據。在每組樣本中,我們列出模型的 Glicko2 技能評分(SR)、SVHN 分類器分數(CS)以及模型的 SVHN Fréchet 距離(FD)。我們的技能評分系統在實驗 5-cond 中略遜于真實數據,但優于 runner-ups 4-cond 和 1,而分類器得分 5-cond 比真實數據好,Fréchet 距離 5-cond 比 4-cond 和 1 都差。在其它情況下,我們系統的排名與 Fréchet 距離一致。

微信圖片_20180817184719.jpg

圖 5:用一個簡單的任務來評估近乎完美的生成器。我們訓練一個普通的 GAN 來模擬具有全協方差矩陣的高斯分布。迭代 8000 次以后的生成器已經掌握了這個任務。迭代 8000 次以后的判別器不再產生有用的判斷(圖 5a),迭代 8000 次之后的 Chekhov GAN 判別器則仍可以判斷之前的生成器樣本(圖 5b)。圖 5c 對這些判別器的技能評分與普通生成器的真實性能進行了比較,并將之衡量為生成器的協方差矩陣估計和數據協方差矩陣之間的平均絕對差。與 within-trajectory 比賽相比,Chekhov 判別器的技能評分更符合真實情況。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美v国产在线一区二区三区| 国产午夜精品理论片a级探花| 欧美在线视频在线播放完整版免费观看| 亚洲电影中文字幕| 午夜一级久久| 亚洲免费视频网站| 亚洲私人影院| 亚洲深夜影院| 一本色道久久综合亚洲二区三区| 亚洲茄子视频| 亚洲精品视频免费观看| 亚洲日韩欧美一区二区在线| 亚洲精品1234| 最新国产の精品合集bt伙计| 亚洲激情在线观看| 亚洲激情国产| 最新国产成人在线观看| 亚洲区中文字幕| 亚洲毛片一区二区| 亚洲免费观看| 一区二区三区波多野结衣在线观看| 99伊人成综合| 一区二区三区四区五区视频| 亚洲午夜精品久久久久久app| 在线一区二区三区四区五区| 亚洲午夜激情在线| 午夜精品福利视频| 欧美与黑人午夜性猛交久久久| 欧美一区成人| 亚洲国产精品成人综合色在线婷婷| 久久精品夜色噜噜亚洲a∨| 亚洲国产日韩在线| 亚洲免费观看视频| 亚洲一区精品视频| 欧美一区日韩一区| 久久一区二区三区国产精品| 欧美韩国一区| 欧美视频三区在线播放| 国产精品视频精品视频| 国内成人精品视频| 亚洲日本免费电影| 亚洲一区区二区| 亚洲第一色在线| 在线亚洲欧美| 欧美一区二区性| 蜜臀av在线播放一区二区三区| 欧美日韩另类字幕中文| 国产麻豆综合| 亚洲黄色三级| 亚洲在线国产日韩欧美| 亚洲激情一区| 亚洲一区二区三区影院| 久久精品日韩一区二区三区| 欧美成人一区二免费视频软件| 欧美日韩中文精品| 国产精品午夜在线| 激情视频一区二区三区| 亚洲高清在线观看| 韩国一区电影| 91久久久亚洲精品| 妖精视频成人观看www| 亚洲特色特黄| 久久gogo国模裸体人体| 最新高清无码专区| 亚洲色图制服丝袜| 欧美亚洲一区三区| 久久亚洲一区二区三区四区| 欧美成年人视频| 久久久久国产精品一区二区| 久久久久久久综合色一本| 蜜桃精品久久久久久久免费影院| 欧美区二区三区| 欧美日韩性生活视频| 国产久一道中文一区| 精品999日本| 亚洲美女精品一区| 亚洲综合三区| 亚洲国产一成人久久精品| 亚洲天堂成人在线观看| 久久精品欧美日韩| 欧美精品二区| 国产精品亚洲视频| 亚洲福利小视频| 亚洲卡通欧美制服中文| 亚洲在线播放电影| 亚洲国产欧美日韩精品| 亚洲一区二区三区在线看| 久久蜜桃香蕉精品一区二区三区| 欧美日本久久| 国产亚洲综合在线| 亚洲精品一区在线观看| 欧美在线日韩在线| 日韩一级在线观看| 亚洲欧美在线aaa| 欧美日韩成人一区二区三区| 国产一区二区精品久久91| 亚洲欧洲三级| 欧美在线综合视频| 亚洲图片激情小说| 老司机免费视频久久| 国产精品网站在线观看| 亚洲欧洲在线观看| 欧美在线一级视频| 亚洲一区在线观看视频| 欧美成人一区二区三区片免费| 国产免费一区二区三区香蕉精| 亚洲精品美女91| 亚洲欧美国产毛片在线| 亚洲免费成人| 美女国产一区| 国产欧美一区二区白浆黑人| 999亚洲国产精| 亚洲国产精品国自产拍av秋霞| 亚洲欧美一区二区视频| 欧美激情欧美激情在线五月| 韩日精品视频一区| 亚洲综合不卡| 夜夜嗨av一区二区三区中文字幕 | 欧美一区二区三区免费视频| 亚洲淫片在线视频| 欧美激情精品久久久久久变态| 国模叶桐国产精品一区| 亚洲免费视频一区二区| 亚洲视频视频在线| 欧美激情一二三区| 欧美精品入口| 91久久久亚洲精品| 亚洲人www| 久久午夜精品一区二区| 国产日韩亚洲欧美| 亚洲综合色视频| 亚洲欧美中日韩| 国产精品久久久久久久久借妻 | 亚洲视频你懂的| 美女视频黄a大片欧美| 亚洲电影毛片| 亚洲国产欧美一区| 老司机精品视频一区二区三区| 国产一区二区视频在线观看| 午夜久久福利| 久久精品国产清高在天天线| 国产精品蜜臀在线观看| 一区二区高清视频| 日韩系列欧美系列| 欧美午夜宅男影院在线观看| 99视频日韩| 亚洲天堂成人在线视频| 欧美无乱码久久久免费午夜一区| av成人免费在线观看| 中文在线一区| 国产精品v欧美精品v日韩| 亚洲国产综合在线| 亚洲一区二区三区四区五区午夜 | 欧美在线免费视屏| 久久午夜国产精品| 国产一区二区三区四区三区四| 91久久夜色精品国产九色| 欧美国产精品久久| 亚洲欧洲三级| 亚洲一区二区三区精品视频| 欧美午夜精品久久久久久人妖| 亚洲一区二区高清| 午夜在线视频观看日韩17c| 国产日本欧美一区二区| 午夜视频精品| 麻豆亚洲精品| 亚洲日本免费| 亚洲欧美在线播放| 国产欧美一二三区| 久久精品av麻豆的观看方式| 久热精品在线| 亚洲精品久久嫩草网站秘色 | 久久久亚洲欧洲日产国码αv| 极品日韩av| 日韩一级在线观看| 国产精品久在线观看| 欧美一区二区视频观看视频| 久久先锋影音av| 亚洲私人影院| 久久综合网络一区二区| 亚洲精品乱码视频 | 日韩亚洲精品电影| 国产精品久久久久久久久久免费看 | 在线观看日韩| 亚洲精品久久7777| 欧美日韩一区二区三区四区在线观看| 中文成人激情娱乐网| 欧美中文字幕久久| 亚洲国产精品成人久久综合一区| 在线一区二区三区四区五区| 国产精品推荐精品| 亚洲国产裸拍裸体视频在线观看乱了 | 国产精品丝袜白浆摸在线| 久久精品亚洲精品| 免费在线亚洲| 亚洲视频二区| 久久久亚洲高清| 99视频精品全部免费在线| 久久精品人人做人人综合| 亚洲欧洲精品成人久久奇米网|