《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 交通場景下基于深度強化學習的感知型路徑分配算法
交通場景下基于深度強化學習的感知型路徑分配算法
信息技術與網絡安全 6期
曹 歡
(中國科學技術大學 信息科學技術學院,安徽 合肥230026)
摘要: 路徑分配問題是交通數字孿生系統的重要研究方向之一,其重點是綜合考量行駛需求的動態變化以及路網信息的實時改變,實現高效合理的路徑規劃。現階段一些經典的分配算法如粒子群、Dijkstra等算法及其優化模型僅能達到全局靜態最優,忽略了現實交通中的復雜變化。而逐漸推出的各種深度學習算法雖能進行全面的時空預測,但受限于海量歷史數據的歸納分析以及較高的運算成本,難以大規模應用。鑒于此,提出了一種靜態分配算法與深度強化學習算法結合的感知型路徑分配算法,在行駛中依據實時路網信息和車輛當前狀態,實現全局路徑動態再分配及更新,相關算法的精度和效率在仿真實驗中得到驗證。
中圖分類號: TP181
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.06.008
引用格式: 曹歡. 交通場景下基于深度強化學習的感知型路徑分配算法[J].信息技術與網絡安全,2022,41(6):43-49.
Perceptual path allocation algorithm based on deep reinforcement learning in traffic scene
Cao Huan
(School of Information Science and Technology,University of Science and Technology of China,Hefei 230026,China)
Abstract: Path allocation problem is one of the important research directions of traffic digital twin system. Its focus is to comprehensively consider the dynamic changes of driving demand and the real-time changes of road network information, so as to realize efficient and reasonable path planning. At present, some classical allocation algorithms such as particle swarm optimization, Dijkstra and their optimization models can only achieve global static optimization, ignoring the complex changes in real traffic. Although various depth learning algorithms gradually introduced can carry out comprehensive spatio-temporal prediction, they are difficult to be applied on a large scale due to the inductive analysis of massive historical data and high operation cost. In view of this, this paper proposes a perceptual path allocation algorithm based on the combination of static allocation algorithm and deep reinforcement learning algorithm. During driving, the global path is dynamically redistributed and updated according to the real-time road network information and the current state of vehicles. The accuracy and efficiency of the proposed algorithm are verified in the simulation experiment.
Key words : path allocation;deep reinforcement learning;road network;traffic perception

0 引言

目前我國交通環境日益復雜,現有交通體系的服務能力難以滿足城市居民的出行期望,城市面臨日益嚴峻的交通管理挑戰。研究者們希望借助交通數字孿生技術,通過數據驅動、精準建模,實現交通的模擬、預測診斷和優化[1]。然而在交通仿真模擬層次,現有的路徑分配模塊不能反映出現實交通的多變狀況。在人-車-路的核心體系中,天氣氣候、交通管制、突發事故等影響因子將時刻影響駕駛員的判斷以及路網的狀態[2]。

在當前的交通數字孿生系統中,現有的路徑分配方法主要分為兩類,第一類為用于實現靜態全局路徑最優的傳統算法,如經典的蟻群算法、Floyd算法、A-Star、粒子群算法、Dijkstra及其改進算法等,本質為基于圖論中重要的最短路徑問題所提出的各種方案,也即在一個加權有向圖中,按一定要求尋找一條權重總和最短的路徑[3]。如Xu[4]等基于二叉樹結構,通過雙向搜索方法加快搜索效率,作為A-Star改進算法;Lee[5]等基于遺傳算法實現蟻群算法中的參數調節優化。在路網信息發生變化時,該類算法難以做出及時反饋。如果需要滿足動態路徑規劃的需求,則需要施加額外的更新優化和重規劃機制。第二類指的是通過機器學習、時空神經網絡、強化學習等技術來實現路徑分配。這一類更加強調數據的搜集、分析和處理,通過提取海量歷史數據的價值信息,為解決路徑規劃問題提供了一個新的思路[6]。

本文的中心工作是研究了一種基于傳統路徑算法與深度強化學習的感知型路徑分配算法,首先通過改進版Dijkstra算法為所有車輛分配初始路徑,路網中的車輛在不斷感知當前位置、行駛軌跡以及目標路網中各路段的車流等信息后,通過DDQN(Double DQN)將自動選擇是否重新進行全局的路徑規劃,實現路徑更新。與現有的經典路徑規劃方法相比,本文提出的規劃方案填補了傳統模型在路況變化下的泛化性、拓展性不足,優化了深度學習型方法的資源損耗,同時基于強化學習模型在長期收益方面的優越性,本文模型更加滿足路徑分配模型對當今城市路網交通出行的各種需求。




本文詳細內容請下載http://www.jysgc.com/resource/share/2000004534





作者信息:

曹  歡

(中國科學技術大學 信息科學技術學院,安徽 合肥230026)




微信圖片_20210517164139.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 国产日韩av在线播放| 好大好硬好深好爽想要之黄蓉| 亚洲人成在线播放网站岛国 | 久久久精品午夜免费不卡| 欧美一级二级三级视频| 亚洲理论精品午夜电影| 男女混合的群应该取什么名字| 和僧侣的交行之夜樱花| 被女同桌调教成鞋袜奴脚奴| 国产无av码在线观看| 一个色中文字幕| 国产高清不卡视频| 99在线观看视频免费| 天天躁夜夜躁狠狠躁2023| 一级做a爰片欧美一区| 成年人性生活片| 久久99精品久久久久久国产| 日韩在线一区二区三区| 亚洲an日韩专区在线| 欧美亚洲欧美区| 亚洲天堂电影在线观看| 欧美综合区自拍亚洲综合图区| 人人干在线视频| 精品久久伦理中文字幕| 华人生活自拍区杏吧有你| 美女被免费网站视频在线| 国产一区二区女内射| 视频一区在线免费观看| 国产做国产爱免费视频| 韩国中文字幕电影| 国产午夜视频在线观看| 香蕉久久综合精品首页| 日本漫画大全彩漫| 久久精品国产色蜜蜜麻豆| 最近最好最新2018中文字幕免费| 亚洲国产一区二区三区在线观看| 欧美日韩亚洲国产精品| 亚洲日韩中文无码久久| 欧美成人在线影院| 亚洲国产欧美在线人成精品一区二区 | 久久96国产精品|