基于改进强化学习的多智能体追逃对抗

基于改进强化学习的多智能体追逃对抗

薛雅丽,叶金泽,李寒雁

Multi-agent pursuit and evasion games based on improved reinforcement learning

Ya-li XUE,Jin-ze YE,Han-yan LI

图 4 3种强化学习算法训练的平均奖励曲线

Fig.4 Mean rewards curve of three reinforcement learning algorithms