《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > 業(yè)界動(dòng)態(tài) > 前沿 | 不使用深度學(xué)習(xí),進(jìn)化算法也能玩Atari游戲!

前沿 | 不使用深度學(xué)習(xí),進(jìn)化算法也能玩Atari游戲!

2018-07-23

深度學(xué)習(xí)因?yàn)槠鋸?qiáng)大的表征能力,在很多方面都有非常優(yōu)秀的性能,它不論是在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理,還是在游戲智能體上都能構(gòu)建出優(yōu)秀的模型。而最近圖盧茲聯(lián)邦大學(xué)等研究者表示進(jìn)化算法也有著與深度學(xué)習(xí)相類(lèi)似的潛力,它可以進(jìn)化出一些能玩 Atari 游戲的智能體,并取得與人類(lèi)相匹配的性能。


近期街機(jī)學(xué)習(xí)環(huán)境(ALE)被用于對(duì)比不同的控制器算法,從深度 Q 學(xué)習(xí)到神經(jīng)進(jìn)化算法。Atari 游戲的環(huán)境在一個(gè)通用界面上提供了大量不同任務(wù)、可理解的獎(jiǎng)勵(lì)度量和令人興奮的研究領(lǐng)域,且它所需的計(jì)算資源相對(duì)有限。無(wú)怪乎該基準(zhǔn)套件得到了如此廣泛的應(yīng)用。


Atari 領(lǐng)域中的一個(gè)困難在于使用純像素的輸入。盡管與現(xiàn)代游戲平臺(tái)相比,Atari 的屏幕分辨率不算高,但處理這類(lèi)視覺(jué)信息對(duì)于人工智能體來(lái)說(shuō)仍然是個(gè)挑戰(zhàn)。人們使用目標(biāo)表征和像素縮減方法,將該信息壓縮成更適合進(jìn)化控制器的形式。這里深度神經(jīng)網(wǎng)絡(luò)控制器表現(xiàn)更加優(yōu)秀,原因在于卷積層和在計(jì)算機(jī)視覺(jué)領(lǐng)域的長(zhǎng)期應(yīng)用。


笛卡爾遺傳規(guī)劃(Cartesian Genetic Programming,CGP)在計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用也有很長(zhǎng)的歷史,盡管比深度學(xué)習(xí)稍微短了一些。CGP-IP 能夠創(chuàng)建圖像濾波器,用于去噪、目標(biāo)檢測(cè)和質(zhì)心定位(centroid determination)。在強(qiáng)化學(xué)習(xí)任務(wù)中使用 CGP 的研究相對(duì)較少,本論文將展示首次使用 CGP 作為游戲智能體的研究。


簡(jiǎn)單而言,笛卡爾遺傳規(guī)劃是遺傳規(guī)劃的一種形式,其中程序表征為有向的、通常由笛卡爾坐標(biāo)索引的非循環(huán)圖。其中功能性節(jié)點(diǎn)通常由一組進(jìn)化的基因定義,并通過(guò)它們的坐標(biāo)連接輸入與其它功能性節(jié)點(diǎn)。程序的輸出由任何內(nèi)部節(jié)點(diǎn)或程序輸入基于進(jìn)化的輸出坐標(biāo)得出。


ALE 提供了 CGP 和其他方法之間的定量對(duì)比。直接將 Atari 游戲分?jǐn)?shù)與之前研究中的不同方法結(jié)果進(jìn)行對(duì)比,以對(duì)比 CGP 與其他方法在該領(lǐng)域的能力。


CGP 的獨(dú)特優(yōu)勢(shì)使得其應(yīng)用在 ALE 上非常合適。通過(guò)定長(zhǎng)的基因組,小型程序能通過(guò)進(jìn)化生成并被讀取以理解。雖然深度 actor 或進(jìn)化神經(jīng)網(wǎng)絡(luò)的內(nèi)部機(jī)制可能難以了解,但 CGP 進(jìn)化的程序可以讓我們深入理解玩 Atar 游戲的策略。最后,通過(guò)使用用于矩陣運(yùn)算的函數(shù)集,CGP 能夠僅使用像素輸入而不使用先驗(yàn)游戲知識(shí),在多種游戲上實(shí)現(xiàn)與人類(lèi)相當(dāng)?shù)男阅堋?/p>

論文:Evolving simple programs for playing Atari games


微信圖片_20180723191606.jpg


論文地址:https://arxiv.org/abs/1806.05695

項(xiàng)目地址:hps://github.com/d9w/CGP.jl


摘要:笛卡爾遺傳規(guī)劃(Cartesian Genetic Programming,CGP)之前已被證明在圖像處理任務(wù)中具備使用計(jì)算機(jī)視覺(jué)專(zhuān)用的函數(shù)集來(lái)進(jìn)化程序的能力。類(lèi)似的方法也可用于 Atari 游戲。使用混合型 CGP 和適用于矩陣運(yùn)算的函數(shù)集(包括圖像處理)來(lái)進(jìn)化程序,但是允許出現(xiàn)控制器動(dòng)作。盡管這些程序相對(duì)較小,但很多控制器的性能與 Atari 基準(zhǔn)集的最優(yōu)方法不相上下,且需要的訓(xùn)練時(shí)間更短。通過(guò)評(píng)估最優(yōu)進(jìn)化的程序,我們可以找到簡(jiǎn)單卻有效的策略。


3 方法


盡管有很多在圖像處理中使用 CGP 的案例,但在玩 Atari 游戲時(shí)這些實(shí)現(xiàn)必須進(jìn)行修改。最重要的是,輸入像素必須通過(guò)進(jìn)化程序處理以確定標(biāo)量輸出,這需要程序減少輸入空間。本研究選擇的方法可確保和其它 ALE 結(jié)果的可比較性,同時(shí)鼓勵(lì)有競(jìng)爭(zhēng)力且簡(jiǎn)單的程序的進(jìn)化。

微信圖片_20180723191714.jpg

圖 1:使用 CGP 來(lái)玩 Atari 游戲,藍(lán)色像素矩陣是進(jìn)化程序的輸入,進(jìn)化的輸出決定最后的控制器動(dòng)作。這里展示了所有控制器動(dòng)作,但大多數(shù)游戲僅使用可用動(dòng)作的子集。帶紅色標(biāo)記的動(dòng)作表示一個(gè)按鈕。


4 結(jié)果

微信圖片_20180723191745.jpg

圖 2: Kung-Fu Master 游戲的蹲伏方法和玩家功能圖。為簡(jiǎn)潔起見(jiàn),這里忽略未激活的輸出和導(dǎo)致這些輸出的計(jì)算圖。

微信圖片_20180723191813.jpg

圖 3:Centipede 玩家,僅激活了輸出 17,下-左-開(kāi)火。所有其它輸出導(dǎo)致空值或恒定零輸入,此處未展示。

微信圖片_20180723191834.jpg

圖 4:Boxing 游戲,使用像素輸入來(lái)連續(xù)移動(dòng)和采取不同動(dòng)作。這里,CGP 智能體通過(guò)不斷打擊 Atari 玩家來(lái)緩慢移動(dòng),將 Atari 玩家逼到圍繩處。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
日韩一区二区精品| 亚洲人被黑人高潮完整版| 极品尤物久久久av免费看| 国产精品美女主播在线观看纯欲| 欧美韩国一区| 久久综合九色99| 久久久久综合一区二区三区| 性18欧美另类| 亚洲欧美另类中文字幕| 亚洲网站在线| 亚洲午夜精品福利| 在线亚洲一区观看| 这里只有精品电影| 一区二区三区四区国产精品| 日韩午夜激情电影| 亚洲精品五月天| 日韩午夜中文字幕| 99国内精品| 99在线热播精品免费99热| 日韩亚洲一区二区| 艳女tv在线观看国产一区| 99热精品在线观看| 在线综合欧美| 亚洲一区免费网站| 午夜日韩在线| 欧美一区二区视频免费观看| 羞羞答答国产精品www一本| 亚洲欧美日韩国产一区二区| 亚洲主播在线观看| 香蕉免费一区二区三区在线观看 | 亚洲欧美日韩国产一区二区三区| 宅男精品视频| 亚洲欧美日韩直播| 欧美一区二区三区免费大片| 欧美中文字幕在线观看| 久久久亚洲国产美女国产盗摄| 久久久久9999亚洲精品| 久久亚裔精品欧美| 欧美成人免费大片| 欧美午夜精品久久久久免费视| 国产农村妇女毛片精品久久莱园子| 国产深夜精品| 在线观看亚洲一区| 亚洲日本理论电影| 一区二区三区你懂的| 亚洲免费中文字幕| 亚洲国产精品v| 一区二区免费在线视频| 午夜精品久久| 麻豆精品视频在线观看| 欧美精品一区二区三区久久久竹菊| 欧美吻胸吃奶大尺度电影| 国产精品素人视频| 在线观看一区视频| 在线视频欧美精品| 欧美一区日本一区韩国一区| 91久久久在线| 午夜精品一区二区三区在线播放| 久久五月激情| 国产精品高清一区二区三区| 影音先锋久久| 亚洲一区图片| 日韩午夜免费| 欧美专区日韩视频| 欧美日本精品| 国模私拍一区二区三区| 亚洲美女诱惑| 欧美专区18| 亚洲影院免费| 欧美顶级大胆免费视频| 国产精品久久久久影院色老大 | 欧美一区二区三区在线观看视频| 亚洲精品韩国| 久久成人免费网| 欧美视频精品在线观看| 国产主播一区二区三区四区| 一区二区高清视频| 91久久久亚洲精品| 久久国产欧美| 国产精品九九| 亚洲卡通欧美制服中文| 亚洲第一区中文99精品| 亚洲专区在线| 欧美日本簧片| 亚洲国产精品福利| 欧美在线亚洲在线| 午夜精品福利电影| 欧美日韩免费一区| 亚洲成人自拍视频| 欧美在线一二三区| 午夜亚洲影视| 欧美日韩一区二区在线视频 | 国产精品高精视频免费| 亚洲国产精品第一区二区三区| 午夜欧美理论片| 亚洲制服av| 欧美日韩在线播| 亚洲精品一区二区三区樱花 | 欧美国产激情| 激情亚洲网站| 久久av老司机精品网站导航| 性欧美暴力猛交另类hd| 欧美亚洲成人免费| 日韩视频免费观看高清完整版| 亚洲精品色婷婷福利天堂| 久久久久久久激情视频| 国产精品一区二区男女羞羞无遮挡 | 亚洲视频www| 亚洲一区二区三区涩| 欧美精品一区在线发布| 亚洲国产高清aⅴ视频| 91久久国产综合久久| 久久天天躁夜夜躁狠狠躁2022| 国产视频精品网| 亚洲欧美日本在线| 亚洲欧美日韩视频二区| 欧美日韩中文字幕| a91a精品视频在线观看| 一区二区三区高清在线| 欧美日韩另类综合| 一本一本久久| 亚洲一区二区三区四区五区午夜| 欧美日韩精品在线| av成人天堂| 亚洲永久网站| 国产精品视频自拍| 香蕉成人伊视频在线观看 | 欧美激情视频在线播放| 亚洲黄页一区| 亚洲美女黄色| 欧美三级视频在线播放| 亚洲毛片视频| 亚洲视频在线播放| 国产精品久久久久永久免费观看| 亚洲一区激情| 久久激情视频| 伊人久久大香线蕉av超碰演员| 亚洲国产精品黑人久久久| 女女同性精品视频| 亚洲日本欧美天堂| 亚洲自拍都市欧美小说| 国产免费成人av| 亚洲国产精品va在线看黑人动漫| 欧美成人精品不卡视频在线观看| 亚洲精品国精品久久99热一| 亚洲一区成人| 国产视频一区在线观看一区免费| 久久精品日韩| 欧美人成网站| 亚洲一区二区av电影| 久久九九免费视频| 亚洲欧洲精品一区二区三区| 亚洲一区二区黄色| 国产性天天综合网| 亚洲国产精品久久| 欧美日韩一区二区在线观看| 亚洲欧美日韩一区二区| 蜜臀99久久精品久久久久久软件| 亚洲欧洲视频在线| 午夜精品久久久久久久99黑人| 国内外成人免费激情在线视频网站 | 国产丝袜一区二区| 亚洲激情综合| 国产精品久久久久天堂| 久久狠狠亚洲综合| 欧美日韩国产区| 欧美亚洲综合在线| 欧美激情一区二区三区高清视频| 亚洲视频在线看| 久久综合狠狠综合久久综青草| 亚洲美女av网站| 欧美在线视频免费观看| 亚洲高清在线精品| 翔田千里一区二区| 亚洲国产高清aⅴ视频| 亚洲摸下面视频| 亚洲电影免费观看高清完整版在线观看 | 一本色道久久综合| 久久一二三四| 亚洲视频图片小说| 免费观看一级特黄欧美大片| 亚洲天堂av图片| 欧美成人精品| 小辣椒精品导航| 欧美日精品一区视频| 亚洲丰满少妇videoshd| 国产精品扒开腿做爽爽爽视频| 亚洲大胆av| 国产精品国产三级国产普通话99| 亚洲国产一成人久久精品| 国产精品稀缺呦系列在线| 亚洲精品视频在线观看网站| 国产日韩精品在线播放| aa亚洲婷婷| 在线免费高清一区二区三区| 欧美一区二区三区在线观看视频| 亚洲精品视频在线播放| 久久亚洲综合| 欧美一区二区成人| 国产精品成人aaaaa网站|