基于策略梯度的目标跟踪方法

基于策略梯度的目标跟踪方法

王康豪,殷海兵,黄晓峰

Visual object tracking based on policy gradient

Kang-hao WANG,Hai-bing YIN,Xiao-feng HUANG

图 2 马尔可夫决策过程

Fig.2 Markov decision process