聯(lián)合隨機性策略的深度強化學習探索方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經(jīng)可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯(lián)合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經(jīng)驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優(yōu)勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環(huán)境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優(yōu)于DDPG算法。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 777xxxxx欧美| 七仙女欲春2一级裸片免费观看| 欧美激情一区二区三区四区| 免费国产成人高清在线观看麻豆 | 五月综合色婷婷在线观看| 欧美第一页浮力影院| 人妻人人澡人人添人人爽| 一级一级18女人毛片| 欧美交换乱理伦片在线观看| 亚洲色无码一区二区三区| 精品国产丝袜自在线拍国| 国产50部艳色禁片无码| 青娱乐国产视频| 国产成人免费片在线视频观看| 最新亚洲精品国自产在线观看| 成人在线观看不卡| 亚洲人成7777影视在线观看| 精品视频在线观看一区二区三区| 国产人成免费视频| 麻豆国产成人AV在线| 国产成人精品曰本亚洲78| 亚洲色欲色欲www| 国产精品免费拍拍1000部| 一本色道久久综合亚洲精品高清| 护士撩起裙子让你桶的视频| 亚洲一区二区观看播放| 欧美成人在线视频| 亚洲欧美日韩中文字幕在线一 | 国产精品vⅰdeoXXXX国产| 18禁男女爽爽爽午夜网站免费| 国产网站在线播放| 三级视频在线播放| 成年大片免费视频| 中文字幕日韩一区二区三区不卡| 日日噜噜噜夜夜爽爽狠狠| 久久九九国产精品怡红院| 欧美日韩亚洲成人| 亚洲永久精品ww47| 欧美激情视频一区二区三区| 亚洲白嫩在线观看| 欧美激情xxxx性bbbb|