基于策略梯度的目标跟踪方法
王康豪,殷海兵,黄晓峰

Visual object tracking based on policy gradient
Kang-hao WANG,Hai-bing YIN,Xiao-feng HUANG
图 2 马尔可夫决策过程
Fig.2 Markov decision process