动态窗口法引导的TD3无地图导航算法
柳佳乐,薛雅丽,崔闪,洪君
TD3 mapless navigation algorithm guided by dynamic window approach
Jiale LIU,Yali XUE,Shan CUI,Jun HONG
表 1
DWA-LSTM TD3算法的超参数设定
Tab.1
Hyperparameter setting of DWA-LSTM TD3 algorithm
参数
数值
折扣因子
$\gamma $
0.99
软目标更新率
τ
0.005
每回合最大时间步 MaxStep
500
学习率 LearningRate
0.001
策略噪声 PolicyNoise
0.2
经验池大小 ReplayBuffer
${10^6}$