《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 干線動態協調控制的深度Q網絡方法
干線動態協調控制的深度Q網絡方法
《信息技術與網絡安全》2020年第6期
郭瑝清1,陳 鋒1,2
1.中國科學技術大學 信息科學技術學院,安徽 合肥230027; 2.安徽中科龍安科技股份有限公司,安徽 合肥230088
摘要: 為有效降低城市交通干線的車均延誤與停車次數,將深度Q網絡引入干線協調控制,給出了一種干線動態協調控制的DDDQN(Dueling Double Deep Q Network)方法。該方法結合雙重深度Q網絡與基于競爭架構深度Q網絡,并將干線作為整體處理,通過深度神經網絡挖掘干線各交叉口協調控制的相關性,基于Q學習進行交通信號控制決策。通過仿真實驗,在近飽和流量和干線存在初始排隊的情況下,將DDDQN方法與現有綠波方法,以及經典深度Q網絡、雙重深度Q網絡、基于競爭架構深度Q網絡的干線協調控制算法進行對比,實驗結果表明基于DDDQN的干線動態協調控制算法性能優于其他四種方法。
中圖分類號: TP181
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.06.001
引用格式: 郭瑝清,陳鋒. 干線動態協調控制的深度Q網絡方法[J].信息技術與網絡安全,2020,39(6):1-6.
A deep Q network method for dynamic arterial coordinated control
Guo Huangqing1,Chen Feng1,2
1.School of Information Science and Technology,University of Science and Technology of China,Hefei 230027,China; 2.Anhui LoongSec Science and Technology Ltd.,Hefei 230088,China
Abstract: In order to effectively reduce the average delay and number of stops for urban traffic trunk roads,a deep Q network is introduced to arterial coordinated control, and a DDDQN(Dueling Double Deep Q Network) method is presented in this paper. This method combines the double deep Q network and the dueling deep Q network, and views the trunk road as a whole. The deep neural network is applied to find the correlation of the coordinated control for each intersection in the trunk road, and Q learning makes these decisions for traffic signal control. Through simulation platform, in the condition of near saturation and initial queue, the method proposed in this paper is compared with the existing green wave method, the arterial coordinated methods respectively based on deep Q network, double deep Q network, and dueling deep Q network. The experimental results show that the performance of DDDQN algorithm is better than the other four methods.
Key words : urban traffic;arterial coordinated control;deep Q network;double deep Q network;dueling deep Q network

隨著城市人口的增多與經濟的快速發展,我國汽車保有量不斷增長,城市交通擁堵問題日益嚴峻。而城市交通干線是城市交通的動脈,實現干線各交叉口間交通信號的動態協調,有效地疏導干線車輛,對于緩解城市交通擁堵具有重要意義。

       目前,城市主干道多交叉口的協調控制,主要采用Maxband和Multiband法以及圖解法、數解法等綠波方法。LITTLE J D C等人最早提出最大綠波帶寬Maxband模型;GARTNER N H等人在Maxband模型的基礎上,提出復合綠波帶寬Multiband模型;陳昕等人對圖解法進行了優化,基于綠波帶的中心線交點,設計了一種新的雙向綠波圖解法;盧凱等人[在綠燈中心點型雙向綠波協調設計數解法的基礎上,建立了一種綠燈終點型的雙向綠波數解法,從而減少了干線車隊的延誤時間;曲大義等人在綠波協調中考慮了公交車輛的影響,并通過增加綠信比與對公交車輛適當的提速,進一步提升了交叉口的通行效率。

       現有的綠波方法難以準確地描述復雜的城市干線交通流狀態,且采用靜態的控制模式,無法有效地協調時變的干線交通流。隨著人工智能的不斷發展,采用深度強化學習實現城市交通信號優化控制已成為研究的熱點。HA-LI P等人為提高交叉口通行能力,提出了一種基于深度強化學習算法的單交叉口信號優化控制方法;GAO J等人提出一種深度強化學習算法,從實時的交通流數據中自動提取有用特征,實現單交叉口交通流的自適應控制,并采用經驗回放和目標網絡技術,提高了算法的穩定性;LI C C等人為提高城市路網通行能力,提出了一種用于區域交叉口交通信號控制的深度強化學習算法,通過多智能體學習最佳的交通信號控制策略;VAN DER POL E采用Max-plus算法和基于深度強化學習的多智能體方法,實現城市交通區域協調控制。

       在深度強化學習領域,目前對于城市交通信號控制的研究,多以單交叉口為研究對象,而對于多交叉口的協調處理,普遍采用多智能體的協調控制。本文結合了雙重深度Q網絡(Double Deep Q Network,Double DQN)與基于競爭架構深度Q網絡(Dueling Deep Q Network,Dueling DQN),設計了基于DDDQN(Dueling Double Deep Q Network,DDDQN)的干線動態協調控制算法。通過將干線多交叉口的交通信號作為一個整體進行處理,相比于采用多智能體協調控制,減輕了智能體間通信協調的負擔,且智能體通過獲取多交叉口的實時狀態,掌握干線全局信息,并使用Dueling DQN網絡結構模型,能更充分地發揮網絡提取干線交通流特征的能力,挖掘出多交叉口間協調控制的相關性。實驗結果表明,本文方法相比于現有綠波方法、經典的深度Q網絡(Deep Q Network,DQN)、以及Double DQN與Dueling DQN,能夠更有效地降低城市主干道的車均延誤和車輛的停車次數等重要的交通評價指標。



本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003143


作者信息:

郭瑝清1,陳  鋒1,2

(1.中國科學技術大學 信息科學技術學院,安徽 合肥230027;

2.安徽中科龍安科技股份有限公司,安徽 合肥230088)


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 亚洲精品二三区伊人久久| 国产亚洲av片在线观看播放| jizz国产在线观看| 成年网在线观看免费观看网址| 久久精品国产只有精品2020| 欧美在线视频免费看| 亚洲美女在线观看播放| 第一福利官方导航大全| 四虎永久在线精品视频免费观看| 香蕉视频亚洲一级| 国产成人高清亚洲一区91| 无遮挡1000部拍拍拍免费凤凰| 在线中文高清资源免费观看| xxxxxx日本处大片免费看| 成人性开放大片| 丰满女人又爽又紧又丰满| 日本精品高清一区二区2021| 乱了嗯祖宗啊用力| 橘子没熟svk| 亚洲乱码在线播放| 欧美性大战xxxxx久久久| 亚洲欧美不卡视频| 污污小视频在线观看| 亚洲视频一区二区三区四区| 男女抽搐动态图| 免费看男阳茎进女阳道动态图| 精品无码av无码专区| 四虎国产精品永久在线| 色窝窝无码一区二区三区成人网站| 国产免费内射又粗又爽密桃视频| 黄a视频在线观看| 国产成人精品cao在线| 狠狠色伊人亚洲综合网站色| 国产热re99久久6国产精品| 亚洲综合丁香婷婷六月香| 国产精品国产三级在线专区| 37pao成人国产永久免费视频| 欧美日韩小视频| 亚洲精品在线播放| 澳门开奖结果2023开奖记录今晚直播视频| 免费A级毛片高清在钱|