基于异步优势演员-评论家的交通信号控制方法 |
|||||||||||||||||||||||||||||
叶宝林,孙瑞涛,吴维敏,陈滨,姚青 | |||||||||||||||||||||||||||||
Traffic signal control method based on asynchronous advantage actor-critic |
|||||||||||||||||||||||||||||
Baolin YE,Ruitao SUN,Weimin WU,Bin CHEN,Qing YAO | |||||||||||||||||||||||||||||
表 2 对比实验中各深度强化学习模型的参数设置 | |||||||||||||||||||||||||||||
Tab.2 Parameter setting of various deep reinforcement learning model in comparative experiment | |||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||