为了避免个体操作习惯对智能轮椅机器人(WR)人机共享运动控制的影响,引入动态强化学习策略,基于三重奖励系统建立个体操作习惯与碰撞风险的关联特性,提出能够自适应用户行为及保证安全性的模糊强化学习状态融合式共享控制策略. 为了实现机器人的智能操控,采用距离型模糊推理算法建立基于座椅压力的方向意图识别模型和机器人人机共享控制框架. 面向用户意图方向与机器人实际方向的偏差度,分别基于高斯函数与偏差率建立当前奖励函数与预测奖励函数,以估计用户操作习惯. 基于边界距离建立任务奖励函数,以估计人机安全性. 基于模糊强化学习策略,利用三重奖励函数构建用户操作习惯与安全性的关联性,以动态调整共享控制中的用户控制权重,适应个体习惯,提高人机共享的操控精度和安全性. 在实验室搭建试验环境,验证了所提算法的有效性.