基于深度强化学习的大口径轴孔装配策略
姜玉峰,陈东生
Assembly strategy for large-diameter peg-in-hole based on deep reinforcement learning
Yu-feng JIANG,Dong-sheng CHEN
表 3
DDPG算法和DDPGFA算法训练参数
Tab.3
Training parameters of DDPG algorithm and DDPGFA algorithm
参数
数值
Actor网络学习率
0.001
Critic网络学习率
0.01
折扣因子
0.99
经验池容量
10000
小批量采样数量
32
开始采样时经验池数量
1000
衰减率
0.01