基于深度强化学习的大口径轴孔装配策略
姜玉峰,陈东生

Assembly strategy for large-diameter peg-in-hole based on deep reinforcement learning
Yu-feng JIANG,Dong-sheng CHEN
表 3 DDPG算法和DDPGFA算法训练参数
Tab.3 Training parameters of DDPG algorithm and DDPGFA algorithm
参数 数值
Actor网络学习率 0.001
Critic网络学习率 0.01
折扣因子 0.99
经验池容量 10000
小批量采样数量 32
开始采样时经验池数量 1000
衰减率 0.01