动态窗口法引导的TD3无地图导航算法
柳佳乐,薛雅丽,崔闪,洪君

TD3 mapless navigation algorithm guided by dynamic window approach
Jiale LIU,Yali XUE,Shan CUI,Jun HONG
表 1 DWA-LSTM TD3算法的超参数设定
Tab.1 Hyperparameter setting of DWA-LSTM TD3 algorithm
参数数值
折扣因子 $\gamma $0.99
软目标更新率 τ0.005
每回合最大时间步 MaxStep500
学习率 LearningRate0.001
策略噪声 PolicyNoise0.2
经验池大小 ReplayBuffer${10^6}$