知识继承型迭代学习控制的研究与应用
Research and application of iterative learning control with knowledge inheritance
通讯作者:
收稿日期: 2018-05-23
Received: 2018-05-23
作者简介 About authors
蒲陈阳(1992—),男,博士生,从事智能控制方法的研究.orcid.org/0000-0002-0953-6739.E-mail:
针对一类具有同质特征的多维轨迹群,提出基于知识继承的迭代学习控制(ILC)策略. 该策略以一类工业机器人系统为控制对象,在跟踪具有渐变幅值的同质轨迹群(HTG)时,应用迭代学习控制方法,从起始源轨迹中获得基准控制知识. 将基准控制知识预设为下一新轨迹迭代学习的首次运行知识. 通过增益变换和偏移变换实现迭代学习控制的知识继承,使得该类工业机器人系统加快对新轨迹的学习速度,以此降低跟踪同质轨迹群的整体学习次数,实现跟踪效率的较大提升. 理论分析和仿真结果证明了所提控制策略的优越性.
关键词:
A new iterative learning control (ILC) strategy based on knowledge inheritance was proposed for a class of multi-dimensional trajectory with homogenous features. A kind of industrial robot system was taken as the control object throughout the tracking process. The homogeneous trajectory group (HTG) which was characterized by a gradual change in amplitude and the initial trajectory in HTG were respectively introduced. Then ILC scheme was utilized to track the initial trajectory in HTG. The effective knowledge could be obtained through ILC scheme from the initial trajectory. The knowledge was inherited to the next new trajectory in HTG for the first iteration. Gain transformation and offset transformation were applied according to the association of adjacent trajectories in HTG in order to effectively make the knowledge be inherited. Then the ILC with knowledge inheritance could make the industrial robot system track the new trajectory in fewer iterations. The overall learning times of tracking the HTG can be reduced and the tracking efficiency can be significantly improved compared with the traditional ILC. The theoretical analysis was presented to prove the convergence of the ILC based on knowledge inheritance, and the simulation results showed the advantage of the proposed control strategy.
Keywords:
本文引用格式
蒲陈阳, 刘作军, 庞爽, 张燕.
PU Chen-yang, LIU Zuo-jun, PANG Shuang, ZHANG Yan.
ILC是一种基于数据驱动的控制算法[12],并在机器人系统的应用中取得了极大的进展. 韦巍等[13]以PUMA-560机械手的前三关节为控制对象,采用ILC策略,得到了良好的跟踪效果. 何熊熊等[14]针对不确定的多连杆机械手,基于边界层设计自适应ILC策略,系统参数在迭代域内不断自适应调节,所提控制律能够保证算法的收敛性并满足平滑要求. 张雪峰等[15]针对四足机器人的单腿机构模式,采用PD型ILC策略对关节轨迹进行跟踪控制,实现了触地和腾空2个阶段的垂直跳跃,达到了良好的鲁棒性. 田国会等[16]针对家居机器人的物体搬运问题,提出基于视觉的ILC伺服算法. 朱雪枫等[17]将ILC应用于五自由度上肢外骨骼机器人,提高了系统的跟踪性能. 上述文献均在参考轨迹一致的情况下,研究机器人控制中的ILC算法应用,然而迭代过程中变化的参考轨迹是ILC研究的关键问题之一[12],具有更广泛的工业应用背景. 对于参考轨迹非严格一致的情况,Saab等[18]提出带遗忘因子的学习算法. Xu等[19-20]针对参考轨迹的幅值刻度相异及时间刻度相异两类情况,分别设计控制器,从理论上分析算法的稳定性和收敛性. 王晔等[21]通过引入小波来逼近逆系统的未知参数,使得系统能够近似跟踪非一致性轨迹. 安通鉴等[22]针对含初态扰动的线性系统轨迹跟踪问题,设计每次迭代改变目标轨迹的方法,达到了加速收敛的目的. 周伟等[23]针对离散非线性系统,利用高阶内模原理设计控制器增益,实现了参考轨迹在迭代域不严格重复时的有效跟踪. 这些方法虽然都讨论了ILC在参考轨迹出现一定变化时的应用问题,但其中所描述的参考轨迹变化,在本质上都属于随机变化,所以无法有效利用不同轨迹间的本质联系.
本文针对一类具有相似特征轨迹群的工业机器人加工对象,提出基于知识继承型ILC控制方法. 常规ILC策略具有3个轴,分别为时间轴、迭代轴和幅值轴,本文方法在此基础上引入控制系统跟踪的轨迹轴,目的是充分利用相似轨迹的控制知识,通过知识继承,加速学习、提高跟踪效率,同时进一步拓展ILC在工业机器人上的应用范围.
1. 同质轨迹群
1.1. 问题提出
图 1
首先,将立体曲面分解为多条曲线组成的轨迹群. 这些轨迹虽然不完全一致,但具有相似的特征,本文称为同质轨迹. 其次,通过对初始源轨迹进行常规的迭代学习控制,获得有效的控制知识. 然后,从这类轨迹群的内在特征着手,通过对源轨迹控制知识的继承,工业机器人系统可以加快对新轨迹的跟踪. 最终实现对同质轨迹群的高效率跟踪控制.
1.2. 同质轨迹群
1.2.1. 源轨迹
源轨迹是同质轨迹群中的起始轨迹,若无特别说明,用
式中:
1.2.2. 同质轨迹
将由源轨迹通过增益变换和偏移变换得到的轨迹群称为同质轨迹群(homogeneous trajectory group,HTG),其中任一轨迹均为同质轨迹,相邻同质轨迹的转换矩阵为
式中:
式中:
通过
式中:
2. 基于知识继承的ILC策略
2.1. 问题描述
考虑一类具有以下形式的工业机器人系统:
时间轴用
以下给出本文控制策略所需的前提假设.
假设1:对于同一轨迹,引起系统模型偏差的扰动量在各次迭代中保持不变,即
其中,
假设2:系统存在理想初态,并且满足
其中,
假设3:学习参数须满足以下收敛条件:
式中:
假设4:系统参数C、B均满足可逆条件,即
假设5:增益变换矩阵
式中:
假设6:系统的扰动量偏差有界,其界为
2.2. 控制策略设计
工业机器人系统的跟踪误差定义为
式中:
系统的最大跟踪误差定义为
为了便于分析,有效跟踪的收敛条件定义为
式中:
基于知识继承型ILC的控制律为
式中:
定理:当工业机器人系统(5)满足假设1~6时,控制算法(15)表现出以下性质.
性质1:对于序号相同的同质轨迹,跟踪误差随着迭代次数在有限时间内渐近收敛于零,即
性质2:对于同质轨迹群的跟踪任务,在满足相同的误差精度要求时,采用基于知识继承型ILC的控制策略可以加速收敛,从而降低学习次数,即
式中:
2.3. 理论证明及分析
2.3.1. 收敛性分析
由式(5)的第1式,可得
结合假设1、2,可得
进一步可得
采用压缩映像法可以证明所提方法的收敛性,因为文献[2]已论述过该方法,不再赘述. 结合假设3、式(12)、式(15)第1式,可以推导出
式(22)表明,具有扰动的工业机器人系统(5)在满足假设1~3时,跟踪误差渐近收敛.
2.3.2. 跟踪效率分析
由式(5)第2式并结合假设2,可得
由假设4可知,系统参数
式(24)中令
相邻轨迹关系式(3)在初始时刻为
将式(26)代入式(25),可得
将式(23)代入式(27),可以推导出同质轨迹的相邻初态关系:
当
结合式(5)第2式,可得
将相邻初态关系(28)和控制律(15)第2式代入式(30),可得
由于
由假设5可知,
因此,有下式成立:
同理可得,
将式(33)、(34)代入式(31),可得
当
将式(36)代入式(35),可得
式中:
第
由式(12)可得,第
将式(39)代入式(38),可得
由假设6可知,
对式(41)在
由于
由式(14)可知,编号为
上述结果表明,采用基于知识继承型ILC策略跟踪同质轨迹群,通过大幅降低工业机器人系统在首次迭代时的跟踪误差可以减少学习次数,从而提升控制系统的跟踪效率.
注1:在动态系统(5)中,若
注2:算法的知识继承由式(15)第2式实现;若无式(15)的第2式,则为常规ILC.
3. 仿真实例
3.1. 一类工业机器人
采用如图2所示的工业机器人系统,对所提算法进行验证. 图中,编号1为加工件,编号2为加工件旋转运动的驱动系统,编号3、4为沿轨迹轴运动的平移驱动系统,编号5为机械臂伸缩运动的驱动系统,编号6表示机械臂加工终端.
图 2
图 2 加工同质轨迹群的一类工业机器人系统
Fig.2 Industrial robot system for processing homogeneous trajectory group
3.2. 轨迹群参数设置
图 3
图 3 空间曲面离散化后的同质轨迹群
Fig.3 Homogeneous trajectory group via spatial surface discreting
在极坐标下,零部件位移轨迹群方程和位移导数轨迹群方程分别为
式中:
空间高度的离散化公式为
式中:l为轨迹序号,
式中:
式中:
式中:a(l)、b(l)由式(48)给出;N=16,T=10 s. 经计算可知,有下式成立:
记
工业机器人系统加工终端的位移轨迹群和速度轨迹群与零部件的位移轨迹群和位移导数轨迹群的对应关系分别为
当
式(54)结合式(52)、(53),可以推导出同质轨迹群各分量轨迹的关系为
记
由增益变换矩阵
3.3. 控制系统参数设置
工业机器人系统的参数设置为
式中:
因为
系统的扰动量设置为
式中:
控制算法的学习增益按照满足假设3中的收敛条件设置为
当
有效跟踪的收敛条件设置为
3.4. 同质轨迹群的跟踪过程
图 4
如图5所示为同质轨迹群中源轨迹的最大跟踪误差随迭代次数的收敛曲线,最大跟踪误差
图 5
图 5 源轨迹最大跟踪误差的迭代收敛过程
Fig.5 Maximum error convergence process of initial trajectory along iterative axis
图 6
图 6 知识继承型迭代学习控制的同质轨迹群跟踪过程
Fig.6 Tracking processes of HTG via ILC based on knowledge inheritance
图 7
图 7 知识继承型迭代学习控制的同质轨迹群误差收敛过程
Fig.7 Error convergence process of HTG via ILC based on knowledge inheritance
3.5. 跟踪效率
图 8
图 8 采用不同策略跟踪同质轨迹群所需学习次数的比较
Fig.8 Comparison in HTG tracking of two different methods
工业机器人系统采用常规ILC完成对同质轨迹群有效跟踪的总时间记为
在仿真中,同质轨迹群的末轨迹号
4. 结 语
针对工业加工部件中普遍存在具有渐变特征的加工曲面,本文提出基于知识继承的ILC控制策略. 在常规ILC固有时间轴、迭代轴和幅值轴的基础上,在控制系统的设计中引入轨迹轴,通过增益变换和偏移变换实现ILC的知识继承. 对基准控制的知识继承可以显著降低跟踪新轨迹时首次运行的跟踪误差,大幅减少跟踪同质轨迹群的整体学习次数,实现跟踪效率的较大提升.
本文方法目前仅针对一类线性工业机器人系统进行分析,在后续的研究中,需要深入探讨非线性机器人系统在跟踪同质轨迹群时的知识继承问题.
参考文献
Formulation of high-speed motion pattern of a mechanical arm by trial
[J].DOI:10.9746/sicetr1965.14.706 [本文引用: 1]
Bettering operation of robots by learning
[J].DOI:10.1002/(ISSN)1097-4563 [本文引用: 2]
学习控制的现状与展望
[J].
On learning control: the state of the art and perspective
[J].
Iterative learning control: brief survey and categorization
[J].DOI:10.1109/TSMCC.2007.905759 [本文引用: 1]
On spatial iterative learning control via 2-D convolution: stability analysis and computational efficiency
[J].DOI:10.1109/TCST.2015.2501344 [本文引用: 1]
反馈辅助PD型迭代学习控制: 初值问题及修正策略
[J].
Feedback-aided PD-type iterative learning control: initial condition problem and rectifying strategies
[J].
A robust adaptive iterative learning control for trajectory tracking of permanent-magnet spherical actuator
[J].
Robust iterative learning control for nonrepetitive uncertain systems
[J].DOI:10.1109/TAC.2016.2560961 [本文引用: 1]
Flexible iterative learning control based expert system and its application
[J].DOI:10.5391/IJFIS.2009.9.3.185 [本文引用: 1]
加速抑制随机初态误差影响的迭代学习控制
[J].
Iterative learning control for accelerated inhibition effect of initial state random error
[J].
Precise speed tracking control of a robotic fish via iterative learning control
[J].
间歇过程最优迭代学习控制的发展: 从基于模型到数据驱动
[J].
Optimal iterative learning control of batch processes: from model-based to data-driven
[J].
基于学习方法的机器人轨迹控制的实现
[J].
Learnning-based control of robot trajectory
[J].
基于边界层的不确定机器人自适应迭代学习控制
[J].
Adaptive iterative learning control for uncertain robot based on boundary layer
[J].
液压驱动四足机器人单腿竖直跳跃运动分析与控制
[J].
Motion analysis and control of a single leg of hydraulically actuated quadruped robots during vertical hopping
[J].
非线性迭代学习算法在机器人上肢康复中的应用
[J].
Nonlinear iterative learning algorithm and its application in upper limb rehabilitation
[J].
learning control algorithms for tracking " slowly” varying trajectories
[J].DOI:10.1109/3477.604109 [本文引用: 1]
Direct learning of control efforts for trajectories with different time scales
[J].DOI:10.1109/9.701122 [本文引用: 1]
On iterative learning from different tracking tasks in the presence of time-varying uncertainties
[J].DOI:10.1109/TSMCB.2003.818433 [本文引用: 1]
期望轨迹可变的非线性时变系统迭代学习控制
[J].
Iterative learning control of non-identical desired trajectories for a class of nonlinear time-varying systems
[J].
目标轨迹更新的点到点鲁棒迭代学习控制
[J].
Point-to-point robust iterative learning control via reference trajectory regulating
[J].
/
〈 |
|
〉 |
