无信号交叉口处基于深度强化学习的智能网联车辆运动规划
张名芳,马健,赵娜乐,王力,刘颖

Intelligent connected vehicle motion planning at unsignalized intersections based on deep reinforcement learning
Mingfang ZHANG,Jian MA,Nale ZHAO,Li WANG,Ying LIU
表 2 TD3模型的超参数设置
Tab.2 Hyperparameter settings for TD3 model
参数名称数值
折扣因子0.99
Actor网络学习率0.00002
Critic网络学习率0.0001
学习率衰减间隔2×104
批次大小64
经验池大小3×105
初始探索概率0.5
最小探索概率0.05
探索概率衰减步数2×104
策略频率2