浙江大学学报(工学版), 2025, 59(9): 1964-1974 doi: 10.3785/j.issn.1008-973X.2025.09.020

机械工程

空中作业机器人系统显式时间自适应跟踪控制

刘宜成,, 马翔, 严文

四川大学 电气工程学院,四川 成都 610065

Explicit-time adaptive tracking control for aerial manipulator systems

LIU Yicheng,, MA Xiang, YAN Wen

College of Electrical Engineering, Sichuan University, Chengdu 610065, China

收稿日期: 2024-10-31  

基金资助: 四川省智能制造与机器人重大科技专项资助项目 (2019ZDZX0019).

Received: 2024-10-31  

Fund supported: 四川省智能制造与机器人重大科技专项资助项目(2019ZDZX0019).

作者简介 About authors

刘宜成(1975—),男,副教授,博士,从事机器人建模和控制研究.orcid.org/0000-0003-3571-3839.E-mail:liuyicheng@scu.edu.cn , E-mail:yichengliu@scu.edu.cn

摘要

空中作业机器人系统的复杂物理结构使其在运行过程中易受复杂环境扰动影响,难以实现在较小控制输入下的固定时间稳定控制. 提出一种新型的显式时间自适应控制(ETAC)方法,在未知扰动存在时,使系统误差在显式时间内快速收敛. 利用牛顿-欧拉法建立空中作业机器人的动力学模型,设计自适应神经网络逼近策略,无须依赖先验知识即可估计扰动;结合显式时间稳定策略以确保控制收敛性,加快系统收敛速度,并有效缓解控制输入过大导致的控制器饱和问题. 数值仿真和飞行实验结果表明,与预定义时间控制方法相比,所提方法的控制输入减少了30.51%,系统误差收敛时间缩短了8.36%;在机械臂受到扰动的情况下,系统误差降低了31.25%. 该方法在保持较小控制输入的同时,显著增强了系统的抗扰动能力.

关键词: 空中作业机器人 ; 轨迹跟踪 ; 显式时间稳定策略 ; 扰动估计 ; 自适应神经网络

Abstract

A novel explicit-time adaptive control (ETAC) method was proposed to address the challenge of achieving fixed-time stable control with minimal control input in aerial manipulator systems which are susceptible to environmental disturbances during operation due to the complex physical structure. This method enabled rapid system error convergence within an explicit time frame even in the presence of unknown disturbances. The Newton-Euler method was utilized to establish the dynamic model of the aerial manipulator, and an adaptive neural network approximation strategy was designed to estimate disturbances without relying on prior knowledge. An explicit-time stability strategy was incorporated to ensure control convergence, accelerating system convergence while mitigating the problem of controller saturation caused by excessive control input. The results of numerical simulation and flight experiments indicated that, compared to the predefined-time control method, the proposed method reduced the control input by 30.51%, shortened the system error convergence time by 8.36%, and decreased the system error by 31.25% under manipulator disturbances. This method significantly enhances the system’s disturbance rejection capability while maintaining a lower control input.

Keywords: aerial manipulator ; trajectory tracking ; explicit time stabilization strategy ; disturbance estimation ; adaptive neural networks

PDF (2568KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

刘宜成, 马翔, 严文. 空中作业机器人系统显式时间自适应跟踪控制. 浙江大学学报(工学版)[J], 2025, 59(9): 1964-1974 doi:10.3785/j.issn.1008-973X.2025.09.020

LIU Yicheng, MA Xiang, YAN Wen. Explicit-time adaptive tracking control for aerial manipulator systems. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(9): 1964-1974 doi:10.3785/j.issn.1008-973X.2025.09.020

近年来,将四旋翼无人机与机械臂系统结合的空中作业机器人系统(aerial manipulator system, AMS)发展迅速[1-2]. 通过扩展无人机的功能,这类系统能够主动与外界环境进行交互,从而显著降低作业风险. 因此,AMS在高空维修、危险区域采样和科学研究等场景中得到了广泛应用. 尽管空中作业机器人展现出巨大的应用潜力,但其控制系统的设计仍面临诸多挑战,包括多自由度、非线性、强耦合、高动态特性、建模不确定性以及外界干扰等复杂因素.

目前,设计准确的扰动估计方法是空中作业机器人实现高性能控制的关键. 为了提高空中作业机器人的抗扰动能力,Zeghlache等[3]设计自适应反步神经网络来逼近空中作业机器人的精确数学模型,以降低建模不确定性对系统控制器的影响. Cao等[4]在位置控制器中采用自适应权重更新的径向基函数神经网络(radial basis function neural network, RBFNN)来补偿动态耦合引起的扰动. Yao等[5]设计一种带有 RBFNN 的控制器,有效地降低了扰动的影响,提高了系统的鲁棒性. 因此,使用自适应神经网络进行扰动估计有利于提高控制性能.

滑模控制是一种鲁棒非线性控制技术,因其收敛速度快、抗干扰、鲁棒性好等优点,广泛应用于空中作业机器人控制领域. 然而,传统的滑模控制只能保证渐近收敛到零,不能满足四旋翼子平台[6]的快速响应要求. 笔者[7]提出一种固定时间滑模控制器,与初始条件无关,保证收敛时间有界. 该控制器在保证系统稳定性的同时,获得了更快的收敛速度. 刘浩等[8]提出预定义时间滑模控制方法. 该方法离线设置稳定时间的上限,确保控制系统在指定的时间内达到稳定状态. 然而,预定义时间滑模控制引入了额外的无限控制增益项,导致实际应用时出现输入饱和问题. 为此,Yan等[9]提出一种显式时间稳定策略,有效地解决了输入饱和问题,减少了需要设计的控制器参数数量. 上述方法可以使误差在固定时间内收敛,在收敛速度方面具有优势. 然而,这些方法尚未针对空中作业机器人进行专门研究,且未充分考虑扰动存在的情况.

基于上述分析,提出一种空中作业机器人显式时间自适应控制(explicit-time adaptive control, ETAC)方法. 针对空中作业机器人轨迹跟踪控制问题,设计基于显式时间稳定策略的滑模控制器,确保系统能够在预定显式时间内快速收敛到零域,从而提升了控制精度和响应效率. 为了应对未知扰动带来的不确定性,控制器中集成了自适应神经网络,能够实时更新控制参数,确保系统的显式时间稳定性不受外界扰动的破坏,有效提高了系统的鲁棒性和抗干扰能力. 在真实环境下进行飞行实验,结果表明,该方法在精确性和稳定性方面具有优越的性能.

1. 控制对象建模

空中作业机器人的现有建模方法有独立建模法和整体建模法[10]. 独立建模法针对2个独立的子系统分别建立动力学模型,并在模型中添加耦合作用力,通过力传感器进行测量[11]. 整体建模法将空中作业机器人视为整体,将机械手与四旋翼之间的耦合作用视为扰动,通过设计综合控制器进行补偿. 本研究采用空中作业机器人整体建模法,主要原因是该方法可以避免子系统间交互耦合作用对控制精度的额外影响,简化控制器设计,并且不依赖外部力传感器,提升了实际工程的可实现性.

空中作业机器人结构如图1 所示. 令$I = {O_I} \left\{ {{x_I},{y_I},{z_I}} \right\}$表示惯性坐标系, $B = {O_b}\left\{ {{x_b},{y_b},{z_b}} \right\}$表示机体坐标系,且2个坐标系均符合右手螺旋法则[12]. 空中作业机器人相对于惯性坐标系${O_I}$的姿态角表示为${\boldsymbol{\varPhi}} = {\left[ {\phi ,\theta ,\psi } \right]^{\text{T}}} \in {{\bf{R}}^{3 \times 1}}$,其中,$\phi $表示绕$x$轴顺时针旋转的滚转角,$\theta $表示绕$y$轴顺时针旋转的俯仰角,$\psi $表示绕$z$轴顺时针旋转的偏航角. 机体坐标系相对于惯性坐标系的位置表示为${\boldsymbol{p}} = {\left[ {x,\;y,\;z} \right]^{\text{T}}} \in {{\bf{R}}^{3 \times 1}}$,机械臂子平台的关节角度变量表示为${\boldsymbol{q}} = {\left[{{q_1},\;{q_2},\;{q_3}} \right]^{\text{T}}} \in {{\bf{R}}^{3 \times 1}}$. 空中作业机器人相对于机体坐标系的旋转角速度表示为$ {{\boldsymbol{\varOmega}} _b} = {[{\omega _{xb}},\;{\omega _{yb}},\;{\omega _{zb}}]^{\mathrm{T}}} = {[p,\;q,\;r]^{\mathrm{T}}} \in {{\bf{R}}^{3 \times 1}} $.

图 1

图 1   空中作业机器人系统结构示意图

Fig.1   Schematic diagram of aerial manipulator system structure


假设空中作业机器人为对称结构,利用牛顿-欧拉方程建立的姿态动力学方程[13]

$ \;\left. {\begin{array}{*{20}{l}} {\dot{\boldsymbol{ \varPhi }} = {\boldsymbol{T}}{{\boldsymbol{\varOmega }}_{{b}}},} \\ {{\boldsymbol{J}}{{\dot{\boldsymbol{ \varOmega }}}_{{b}}} = - {{\boldsymbol{\varOmega }}_{{b}}} \times {\boldsymbol{J}}{{\boldsymbol{\varOmega }}_{{b}}}+{{\boldsymbol{G}}_{\text{a}}}+{\boldsymbol{\tau }}+{{\boldsymbol{f}}_{\text{d}}}+\Delta {\boldsymbol{d}}.} \end{array}} \right\} $

$ \quad{\boldsymbol{T}} = \left[ {\begin{array}{*{20}{c}} 1&{{T_\theta }{S_\phi }}&{{T_\theta }{C_\phi }} \\ 0&{{C_\phi }}&{ - {S_\phi }} \\ 0&{{{{S_\phi }} \mathord{\left/ {\vphantom {{{S_\phi }} {{C_\theta }}}} \right. } {{C_\theta }}}}&{{{{C_\phi }} \mathord{\left/ {\vphantom {{{C_\phi }} {{C_\theta }}}} \right. } {{C_\theta }}}} \end{array}} \right]. $

式中:${\boldsymbol{T}} \in {{\bf{R}}^{3 \times 3}}$为机体坐标系到惯性坐标系的变换矩阵;${\boldsymbol{J }}= {\text{diag}}\;({J_{xx}},\;{J_{yy}},\;{J_{zz}}) \in {{\bf{R}}^{3 \times 3}}$为惯性矩阵,其中 ${J_{xx}}、{J_{yy}}、{J_{zz}} $分别为机体绕 xbybzb轴旋转时的转动惯量;$ \times $表示矩阵叉乘运算;${{\boldsymbol{G}}_{\mathrm{a}}} \in {{\bf{R}}^{3 \times 1}}$为陀螺仪转矩;${\boldsymbol{\tau}} \in {{\bf{R}}^{3 \times 1}}$为控制转矩;${{\boldsymbol{f}}_{\mathrm{d}}}$为空气阻力;$\Delta {\boldsymbol{d}}$为整体扰动;${C_ * } = \cos\; ( * )$${S_ * } = \sin\; ( * )$${T_ * } = \tan\; ( * )$,其中$ * \in \{ \phi ,\theta \} $.

为了提高计算效率,采用文献[14]提出的方法建立空中作业机器人解耦合模型,机械臂动力学模型为

$ {\boldsymbol{M}}({\boldsymbol{q}})\ddot{\boldsymbol{ q}}+{\boldsymbol{C}}({\boldsymbol{q}},\dot{\boldsymbol{ q}})\dot{\boldsymbol{ q}}+{\boldsymbol{G}}({\boldsymbol{q}}) = {{\boldsymbol{\tau}} _{\boldsymbol{q}}}. $

式中:${\boldsymbol{M}}({\boldsymbol{q}})$为惯性矩阵,$ {\boldsymbol{C}}({\boldsymbol{q}},\dot{\boldsymbol{ q}}) $为科里奥利矩阵,${\boldsymbol{G}}({{\boldsymbol{q}}})$为重力矢量矩阵,$ {{\boldsymbol{\tau}} _{\boldsymbol{q}}} = {[{\tau _1},{\tau _2},{\tau _3}]^{\text{T}}} $为机械臂关节电机控制输入.

空中作业机器人的机械手子系统在作业时,四旋翼飞行器需要处于悬停状态,此时机械臂对空中作业机器人机体产生1个力,导致重心不平衡[6]. 此时,可视为机械臂子系统产生了1个扰动项,其估计值为

$ {{\boldsymbol{d}}_{\text{η }}} = - {\boldsymbol{C}}_I^B{\boldsymbol{f}}({q_1},\;{q_2},\;{q_3}). $

式中:${\boldsymbol{f}}({q_1},\;{q_2},\;{q_3})$表示机械臂关节处于不同角度下对于机体的作用力,${\boldsymbol{C}}_I^B$表示作用力从惯性坐标系到机体坐标系的转换矩阵.

结合式(4),使用${{\boldsymbol{d}}_{\text{q}}}$表示空中作业机器人机身倾转而产生的额外升力,则式(1)中的整体扰动可以表示为

$ \Delta {\boldsymbol{d}} = {{\boldsymbol{d}}_{\text{q}}}+{{\boldsymbol{d}}_{\text{η }}}. $

在实际的空中作业环境中,空中作业机器人会受到多种未知升力扰动的影响,这些扰动来源广泛,如复杂的气流变化、作业现场的局部强风、周围环境的温度梯度变化等. 这些未知升力扰动可能导致机器人飞行姿态不稳定,进而影响系统的整体稳定性. 因此,在建立模型时需要充分考虑这些扰动影响,并研究设计相应的鲁棒控制策略,以应对未知扰动对于系统稳定性的影响,保证空中作业机器人在不同工作状态中均具有良好性能.

空中作业机器人由4台电机驱动螺旋桨旋转,其中电机$ {R}_{1}、{R}_{3} $逆时针旋转,$ {R}_{2}、{R}_{4} $顺时针旋转[15]. 定义电机转速为${\omega_i} \in {\bf{R}}\;(i = 1,2,3,4)$,电机的转矩为${\tau _i} \in {\bf{R}}\;(i = 1,2,3,4)$. 控制转矩 ${\boldsymbol{\tau }}=[ {{\tau _\phi }},\;{{\tau _\theta }},\;{{\tau _\psi }} ]^{\text{T}} \in {{\bf{R}}^{3 \times 1}}$,与电机转速的关系表示为

$ {\boldsymbol{\tau}} = \left[ {\begin{array}{c} {\sqrt 2 l{c_T}(\omega_1^2 - \omega_2^2 - \omega_3^2+\omega_4^2)/2} \\ {\sqrt 2 l{c_T}(\omega_1^2+\omega_2^2 - \omega_3^2 - \omega_4^2)/2} \\ {{c_M}( - \omega_1^2+\omega_2^2 - \omega_3^2+\omega_4^2)} \end{array}} \right]. $

式中:$l$表示空中操纵器的电机旋翼中心到机身中心的距离,${c_T}$为螺旋桨拉力系数,${c_M}$为螺旋桨转矩系数. 式(6)所示的关系能够有效应对因载荷偏移、转子性能差异或气动力不均匀引起的复杂情况,在多种工况下均能保持较高的预测精度和较强的动态响应能力.

空中作业机器人螺旋桨提供的升力$F$

$ F = {f_1}+{f_2}+{f_3}+{f_4}. $

式中:${f_ * }$表示单个螺旋桨提供的升力,且$ * \in \{ 1,2,3,4\} $.

当空中作业机器人处于悬停状态时,各转子通常以近似相同的转速工作,从而产生对称的升力和相互抵消的反扭矩,使其保持静止的姿态. 假设4个旋翼安装得对称、平衡,其产生的总推力严格垂直向上且不会引入倾斜角度. 当$\phi ,\theta \ll {\text{1 rad}}$时,按照小角度近似条件[16],不同坐标系下的变换关系趋于线性,矩阵${\boldsymbol{T}}$近似为单位矩阵${{\boldsymbol{I}}_3} \in {{\bf{R}}^{3 \times 3}}$. 由此可得旋转角速度与姿态角变化率的关系:

$ \left[ {\begin{array}{*{20}{c}} p \\ q \\ r \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\dot \phi } \\ {\dot \theta } \\ {\dot \psi } \end{array}} \right]. $

根据式(1)、(8),空中作业机器人的姿态动力学方程可以表示为

$ \left. {\begin{gathered} {\ddot \phi = \frac{{({J_{yy}} - {J_{zz}})}}{{{J_{xx}}}}\dot \theta \dot \psi +\frac{{{\tau _\phi }}}{{{J_{xx}}}}+\frac{{{J_{{\text{RP}}}}\dot \theta \varpi }}{{{J_{xx}}}}+\frac{{\sqrt 2 {k_\phi }l}}{{2{J_{xx}}}}\dot \phi +\Delta {d_\phi },} \\ {\ddot \theta = \frac{{({J_{zz}} - {J_{xx}})}}{{{J_{yy}}}}\dot \phi \dot \psi +\frac{{{\tau _\theta }}}{{{J_{yy}}}} - \frac{{{J_{{\text{RP}}}}\dot \phi \varpi }}{{{J_{yy}}}}+\frac{{\sqrt 2 {k_\theta }l}}{{2{J_{yy}}}}\dot \theta +\Delta {d_\theta },} \\ {\ddot \psi = \frac{{({J_{xx}} - {J_{yy}})}}{{{J_{zz}}}}\dot \phi \dot \theta +\frac{{{\tau _\psi }}}{{{J_{zz}}}}+\frac{{{k_\psi }l}}{{{J_{zz}}}} \dot \psi +\Delta {d_\psi }.} \\\end{gathered}} \right\} $

式中:$\varpi = - {\omega_1}+{\omega_2} - {\omega_3}+{\omega_4}$表示由电机安装和偏航角操作偏移[17]引起的不平衡旋翼转速,${J_{{\text{RP}}}}$为电机转子和螺旋桨的总转动惯量,$ {k}_{\phi }、{k}_{\theta }、{k}_{\psi } $分别为3个姿态方向的空气阻力系数,$\Delta{d_\phi }$$\Delta{d_\theta }$$\Delta {d_\psi }$分别表示对应于姿态变化方向的扰动项.

空中作业机器人的位置动力学方程为

$ m\ddot {\boldsymbol{p}} = {}_B^I{\boldsymbol{R}}F{{\boldsymbol{e}}_3} - mg{{\boldsymbol{e}}_3}+{\boldsymbol{K}}\dot {\boldsymbol{p}}. $

式中:$m$为空中作业机器人的总质量,$g$为重力加速度,$_B^I{\boldsymbol{R}}$为坐标系变换矩阵,${{\boldsymbol{e}}_3} = {\left[ {0,1,1} \right]^{\text{T}}}$为单位向量,${\boldsymbol{K}}$为空气阻力系数矩阵.

空中作业机器人的位置动力学方程可以表示为

$ \left. {\begin{gathered} {\ddot x = \frac{F}{m}\left( {\cos\; \phi \sin\; \theta \cos\; \psi +\sin \;\phi \sin\; \psi } \right) - \frac{{{k_x}}}{m}\dot x,} \\ {\ddot y = \frac{F}{m}\left( {\cos\; \phi \sin\; \theta \sin\; \psi - \sin\; \phi \cos\; \psi } \right) - \frac{{{k_y}}}{m}\dot y,} \\ {\ddot z = \frac{F}{m}\cos\; \phi \cos\; \theta - g - \frac{{{k_z}}}{m}\dot z.} \\\end{gathered}} \right\} $

式中:$ {k}_{x}、{k}_{y}、{k}_{z} $表示惯性坐标系下$ x、y、z $方向的阻力系数.

2. 控制器设计

基于显式时间稳定策略设计滑模控制器,并采用自适应神经网络补偿参数不确定性和外界干扰,最后对空中机械手子系统进行稳定性分析. 空中作业机器人控制系统的结构框架如图2所示.

图 2

图 2   空中作业机器人控制结构框图

Fig.2   Control structure diagram of aerial manipulator system


2.1. 理论基础

根据建立的动力学模型,定义状态变量$ {{\boldsymbol{x}}_1} = {\boldsymbol{\varPhi }} = {\left[ {\phi ,\theta ,\psi } \right]^{\text{T}}} $${{\boldsymbol{x}}_2} = \dot{\boldsymbol{ \varPhi }} = {\left[ {\dot \phi ,\dot \theta ,\dot \psi } \right]^{\text{T}}}$,动力学模型重写为标准仿射非线性系统状态方程的形式:

$ \left. {\begin{array}{*{20}{l}} {{{\dot{\boldsymbol{ x}}}_1} = {{\boldsymbol{x}}_2},} \\ {{{\dot{\boldsymbol{ x}}}_2} = {{\boldsymbol{f}}_{\boldsymbol{\varPhi}} }+{{\boldsymbol{g}}_{\boldsymbol{\varPhi}} }{\boldsymbol{u}}+{{\boldsymbol{D}}_{\boldsymbol{\varPhi}} }.} \end{array}} \right\} $

式中:${{\boldsymbol{g}}_{\boldsymbol{\varPhi}} } = {\text{diag}}\;(1/{J_{xx}},1/{J_{yy}},1/{J_{zz}})$表示控制增益函数,$ {\boldsymbol{u}} = {\left[ {{\tau _\phi },{\tau _\theta },{\tau _\psi }} \right]^{\text{T}}} $为控制输入,${\boldsymbol{x}} = {\left[ {{{\boldsymbol{x}}_1},\;{{\boldsymbol{x}}_2}} \right]^{\text{T}}} \in {{\bf{R}}^6}$${{\boldsymbol{D}}_{\boldsymbol{\varPhi}} } = {[\Delta {{{d}}_\phi },\;\Delta {{{d}}_\theta },\;\Delta {{{d}}_\psi }]^{\text{T}}}$表示有界但未知的系统总扰动,系统函数${{\boldsymbol{f}}_{\boldsymbol{\varPhi}} }$表示为

$ {{\boldsymbol{f}}_{\boldsymbol{\varPhi}} } = \left[ {\begin{gathered} {\frac{{({J_{yy}} - {J_{zz}})\dot \theta \dot \psi +{J_{{\mathrm{RP}}}}\dot \theta \varpi +\sqrt 2 {k_{\phi}}l\dot \phi /2}}{{{J_{xx}}}}} \\ {\frac{{({J_{zz}} - {J_{xx}})\dot \phi \dot \psi - {J_{{\mathrm{RP}}}}\dot \phi \varpi +\sqrt 2 {k_{\theta}}l\dot \theta /2}}{{{J_{yy}}}}} \\ {\frac{{({J_{xx}} - {J_{yy}})\dot \phi \dot \theta +{k_{\psi}}l\dot \psi }}{{{J_{zz}}}}} \\\end{gathered}} \right]. $

定义空中作业机器人跟踪控制的期望姿态角为$ {{\boldsymbol{x}}_{\text{d}}} = {{\boldsymbol{\varPhi }}_{\text{d}}} = {\left[ {{\phi _{\text{d}}},{\theta _{\text{d}}},{\psi _{\text{d}}}} \right]^{\text{T}}} $. 姿态角的误差定义为

$ {{\boldsymbol{e}}_1} = {{\boldsymbol{x}}_1} - {{\boldsymbol{x}}_{1{\text{d}}}} = \left[ {\begin{array}{*{20}{c}} {\phi - {\phi _{\text{d}}}} \\ {\theta - {\theta _{\text{d}}}} \\ {\psi - {\psi _{\text{d}}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{{{e}}_\phi }} \\ {{{{e}}_\theta }} \\ {{{{e}}_\psi }} \end{array}} \right]. $

对式(14)求导可得:

$ {{\boldsymbol{e}}_2} = {{\boldsymbol{x}}_2} - {{\boldsymbol{x}}_{2{\text{d}}}} = \left[ {\begin{array}{*{20}{c}} {\dot \phi - {{\dot \phi }_{\text{d}}}} \\ {\dot \theta - {{\dot \theta }_{\text{d}}}} \\ {\dot \psi - {{\dot \psi }_{\text{d}}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{{\dot e}_\phi }} \\ {{{\dot e}_\theta }} \\ {{{\dot e}_\psi }} \end{array}} \right]. $

由于空中作业机器人的欠驱动特性,需要利用解耦合的方法在位置控制子系统中引入虚拟控制量. 位置控制子系统的虚拟控制量表示为

$ \left[ {\begin{gathered} {{{{u}}_x}} \\ {{{{u}}_y}} \\ {{{{u}}_z}} \\\end{gathered}} \right] = \left[ {\begin{gathered} {(\cos \;\phi \sin\; \theta \cos\; \psi +\sin\; \phi \sin\; \psi ){{{u}}_1}} \\ {(\cos \;\phi \sin\; \theta \sin\; \psi - \sin\; \phi \cos\; \psi ){{{u}}_1}} \\ {(\cos \;\phi \cos\; \theta ){{{u}}_1}} \\\end{gathered}} \right]. $

式中:${{{u}}_1} = F/m$$ {u}_{x}、{u}_{y}、{u}_{z} $分别表示位置控制子系统中xy$z $方向上的虚拟控制量.

将位置控制子系统的虚拟控制输入作为姿态控制子系统的参考姿态角,以实现状态变量解耦合的目的. 此外,在实际控制中,由于缺乏速度反馈信息,需要引入虚拟控制量,间接求解出参考姿态角. 该方法将状态变量转换为传感器能够直接测量的物理量,以实现对于系统位置和姿态的有效控制. 参考姿态角可以表示为

$ \left. {\begin{gathered} {{\phi _{\text{d}}} = {{\sin }^{ - 1}}\left( {\frac{{{{{u}}_x}\sin\; {\psi _{\text{d}}} - {{{u}}_y}\cos \;{\psi _{\text{d}}}}}{{{{{u}}_1}}}} \right),} \\ {{\theta _{\text{d}}} = {{\tan }^{ - 1}}\left( {\frac{{{{{u}}_x}\cos\; {\psi _{\text{d}}}+{{{u}}_y}\sin \;{\psi _{\text{d}}}}}{{{{{u}}_z}}}} \right).} \\\end{gathered} } \right\} $

空中机械手子系统存在建模不确定性和外界干扰问题,总不确定性项定义为$\Delta {{\boldsymbol{G}}_{\boldsymbol{\varPhi}} } \in {{\bf{R}}^{3 \times 1}}$,可以得到系统模型的集中估计为

$ {{\boldsymbol{G}}_{\boldsymbol{\varPhi}} } = \left[G_{{\boldsymbol{\varPhi }}_1}, G_{{\boldsymbol{\varPhi }}_2}, G_{{\boldsymbol{\varPhi }}_3}\right]^{\mathrm{T}}={{\boldsymbol{f}}_{\boldsymbol{\varPhi }}}+{{\boldsymbol{D}}_{\boldsymbol{\varPhi}} }+\Delta {{\boldsymbol{G}}_{\boldsymbol{\varPhi }}}. $

式中:$G_{{\boldsymbol{\varPhi}}_1}、G_{{\boldsymbol{\varPhi}}_2}、G_{{\boldsymbol{\varPhi}}_3}$分别表示$\phi、\theta、\psi $方向上的集总扰动估计值.

${\boldsymbol{x}} = [{{\boldsymbol{e}}_1},{{\boldsymbol{e}}_2}]$,结合式(12)、(18),可得系统误差模型为

$ {\dot{\boldsymbol{ e}}_2} = {{\boldsymbol{G}}_{\boldsymbol{\varPhi}} }+{{\boldsymbol{g}}_{\boldsymbol{\varPhi}} }{\boldsymbol{u}} - {\dot{\boldsymbol{ x}}_{2{\text{d}}}}. $

引理1[9] 考虑以下系统:

$ \dot{\boldsymbol{ x}} = - \frac{{G({{\boldsymbol{x}}_{\text{c}}}) - G({\boldsymbol{0}})}}{{{T_{\text{c}}}}}{\left(\frac{{\partial G({{\boldsymbol{x}}^\varepsilon })}}{{\partial {\boldsymbol{x}}}}\right)^{ - 1}}. $

式中:$0 < \varepsilon < 1$${T_{\text{c}}} > 0$$ {{\boldsymbol{x}}}_{\text{c}}\geqslant {\boldsymbol{0}} $$G({{{{\boldsymbol{x}}}}_{\text{c}}})$表示边界增益项,$G( \cdot )$为显式时间函数. 当初始条件满足${{\boldsymbol{x}}_0} \in [ - {{\boldsymbol{x}}_{\text{c}}},{{\boldsymbol{x}}_{\text{c}}}]$时,式(20)所示系统满足显式时间稳定策略所需的条件.

引理2[18] 对于 Lyapunov 函数${\boldsymbol{V}}$,若对其进行微分可以得到以下关系:

$ \dot{{\boldsymbol{V}}}\leqslant -\frac{G({{\boldsymbol{x}}}_{\text{c}}^{\varepsilon })-G({\boldsymbol{0}})}{\varepsilon {T}_{\text{c}}}{\left[\frac{\partial G({(2{\boldsymbol{V}})}^{\varepsilon /2})}{\partial {(2{\boldsymbol{V}})}^{\varepsilon /2}}\right]}^{-1}{(2{\boldsymbol{V}})}^{1-\varepsilon /2}+{\boldsymbol{\zeta}} , $

则称该系统是显式时间稳定的. 式中:${\boldsymbol{\zeta}}$为非负常数向量,$G( \cdot )$${T_{\text{c}}}$${{\boldsymbol{x}}_{\text{c}}}$的定义与引理1中的定义相同.

${\boldsymbol{x}} \to {\boldsymbol{0}}$时,系统的收敛时间可以通过求解式(21)中的微分方程得到:

$ T({{\boldsymbol{x}}}_{0})=\frac{G({(2{\boldsymbol{V}}({{\boldsymbol{x}}}_{0}))}^{\varepsilon /2})-G({\boldsymbol{0}})}{G({{\boldsymbol{x}}}_{\text{c}}^{\varepsilon })-G({\boldsymbol{0}})}{T}_{\text{c}}\leqslant {T}_{\text{c}}. $

系统的收敛时间只与系统初始状态边界${{\boldsymbol{x}}_{\text{c}}}$有关,且系统的收敛时间可以明确表示. 因此,具有式(20)所示形式且收敛时间满足式(22)的系统,被称为显式时间稳定系统.

2.2. 自适应神经网络设计

空中作业机器人遇到的扰动会严重影响控制器的性能,并且无法使用传统的数学方法准确估计扰动. 本研究采用神经网络概念来整体近似不确定性扰动,无需复杂的数学建模. 径向基函数神经网络(radial basis function neural network, RBFNN)具有结构简单、逼近能力强的优点[19-20]. 在线更新的自适应律可以有效地拟合扰动并使系统建模更加准确[21].

假设1 对于任何${\boldsymbol{z}},{\boldsymbol{z}}' \in \bf{R}$,存在最小值 $L > 0$,使得${\boldsymbol{\sigma }}({\boldsymbol{x}})$满足

$ \left|{\boldsymbol{\sigma}} ({\boldsymbol{z}})-{\boldsymbol{\sigma }}({{\boldsymbol{z}}}^{\prime })\right|\leqslant L\Vert {\boldsymbol{z}}-{{\boldsymbol{z}}}^{\prime }\Vert . $

式中:${\boldsymbol{\sigma}} ({\boldsymbol{x}})$表示系统中的非线性不确定项.

引理3[22] 对于任意连续函数${\boldsymbol{\zeta}} ({\boldsymbol{x}})$,以高斯函数作为激活函数,将经过RBFNN逼近后的结果记为$\hat {\boldsymbol{\zeta}} ({\boldsymbol{x}}) = {{\boldsymbol{W}}^{\text{T}}}{\boldsymbol{h}}({\boldsymbol{x}})$,存在正常数$\varepsilon $,满足如下关系:

$ \mathrm{sup}\left|{\boldsymbol{\zeta}} ({\boldsymbol{x}})-{{\boldsymbol{W}}}^{*\text{T}}{\boldsymbol{h}}({\boldsymbol{x}})\right|\leqslant \varepsilon . $

式中:${\boldsymbol{W}} = {[{w_1},{w_2}, \cdots ,{w_N}]^{\text{T}}}$为神经网络的权值,$ {{\boldsymbol{W}}^*} = \arg \min \left[ {\sup \left| {\hat {\boldsymbol{\zeta}} ({\boldsymbol{x}}) - {\boldsymbol{\zeta}} ({\boldsymbol{x}})} \right|} \right] $为理想的最优权值,${\boldsymbol{h}}({\boldsymbol{x}}) = \left[ {{h_1}({\boldsymbol{x}}),{h_2}({\boldsymbol{x}}), \cdots ,{h_N}({\boldsymbol{x}})} \right]$$\varepsilon $表示非线性不确定项. 高斯基函数${h_i}({\boldsymbol{x}})$可表示为

$ {h_i}({\boldsymbol{x}}) = \exp \;[ - {\left\| {{\boldsymbol{x}} - {{\boldsymbol{\mu}} _t}} \right\|^2}/\sigma _t^2]. $

式中:${{\boldsymbol{\mu}} _t}$表示高斯基函数的中心,$t = 1,2, \cdots ,m$,其中$m$为隐藏层节点数;${\sigma _t}$为径向基宽度.

本研究设计的自适应神经网络输入层的输入维数是6,隐藏层的节点数$m = 7$,输出层的维度是3. 高斯基函数中心向量${{\boldsymbol{\mu}} _t} = [ - 2.0, - 1.5, - 1,0,1,1.5, 2.0]$,径向基宽度${\sigma _t} = 10$. 在训练过程中,通过梯度下降法更新网络权值${\boldsymbol{W}}$,并通过最小化逼近误差的目标函数来实现自适应调整,权值${\boldsymbol{W}}$的更新公式为

$ {\boldsymbol{W}}(k+1) = {\boldsymbol{W}}(k)+\gamma {\boldsymbol{E}}{{{h}}_i}({\boldsymbol{x}});{\text{ }}i = 1,2, \cdots ,N. $

式中:$\gamma \in (0,1.0)$为学习率,${\boldsymbol{E}} = {\boldsymbol{\zeta}} ({\boldsymbol{x}}) - \hat {\boldsymbol{\zeta}} ({\boldsymbol{x}})$为神经网络的近似误差,高斯基函数的数量N=7.

神经网络的理想输出为

$ {{\boldsymbol{G}}_{\boldsymbol{\varPhi}} } = {{\boldsymbol{W}}^*}^{\text{T}}{\boldsymbol{h}}({\boldsymbol{x}})+{\boldsymbol{\varepsilon}} . $

实际输出为

$ {\hat {\boldsymbol{G}}_{\boldsymbol{\varPhi}} } = {\hat {\boldsymbol{W}}^{\text{T}}}{\boldsymbol{h}}({\boldsymbol{x}}). $

式中: $\hat {\boldsymbol{W}}$为实际权重. 定义神经网络权重误差为$\tilde {\boldsymbol{W}} = {{\boldsymbol{W}}^*} - \hat {\boldsymbol{W}}$,则输出误差为${\tilde {\boldsymbol{G}}_{\boldsymbol{\varPhi}} } = {{\boldsymbol{G}}_{\boldsymbol{\varPhi}} } - {\hat {\boldsymbol{G}}_{\boldsymbol{\varPhi}} }$.

2.3. 显式时间控制器设计

现有的固定时间稳定策略[7]和预定义时间稳定策略[8]的主要不足在于其在实际应用中存在一定局限性. 这些方法在使系统收敛到原点附近时,对应的初始状态边界范围相对较窄,而为了保证系统在有界初始条件下的稳定性,往往需要较大的控制输入,这就容易引发控制输入饱和问题,影响系统的实际控制效果. 显式时间稳定策略的设计原理是基于收敛时间函数增益有界化的思想. 由于系统初始状态边界范围不同,显式时间稳定策略可以通过合理调整这一范围,从而在有界初始条件下保证系统稳定性. 因此,使用显式时间稳定策略设计控制器时,无须额外考虑控制输入饱和的问题.

根据引理1中的显式时间稳定策略,滑模面函数可以设计为如下形式:

$ {{\boldsymbol{s}}_i} = {{\boldsymbol{e}}_{2i}}+\frac{{{\boldsymbol{x}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}\frac{{{{\boldsymbol{e}}_{1i}}}}{{{{\left| {{{\boldsymbol{e}}_{1i}}} \right|}^m}}}. $

式中:$0 < m < 1.0$${T_{\text{c}}} > 0$${{\boldsymbol{x}}_0} \in \left[ { - {{\boldsymbol{x}}_{\text{c}}},{{\boldsymbol{x}}_{\text{c}}}} \right]$$i \in \{ \phi ,\theta ,\psi \} $${\boldsymbol{e}}_{1i} $${\boldsymbol{e}}_{2i} $分别为e1e2$ \phi 、\theta、\psi $分量. 此外,在实际应用中须设定系统误差安全阈值为${10^{ - 10}}$,以避免滑模面函数及其导数的奇异问题.

对式(29)求导可得

$ {\dot {\boldsymbol{s}}_i} = {\dot {\boldsymbol{e}}_{2i}}+\frac{{{\boldsymbol{x}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}\frac{{(1 - m){{\boldsymbol{e}}_{2i}}}}{{{{\left| {{{\boldsymbol{e}}_{1i}}} \right|}^m}}}. $

为了加快系统收敛速度,设计如下形式的滑模收敛律:

$ {\dot {\boldsymbol{s}}_i} = - \frac{{{\boldsymbol{s}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}\frac{{{{\boldsymbol{s}}_i}}}{{{{\left| {{{\boldsymbol{s}}_i}} \right|}^m}}}. $

式中:${{\boldsymbol{s}}_{\text{c}}}$是根据式(29)计算的滑模面函数的初始边界.

根据式(30)和(31),显式时间自适应控制器可以设计为

$ {{\boldsymbol{u}}_i} = - \frac{1}{{{{\boldsymbol{g}}_{{\boldsymbol{\varPhi}} i}}}}\left[ {{{\hat {\boldsymbol{G}}}_{{\boldsymbol{\varPhi}} i}} - {{\dot {\boldsymbol{x}}}_{2{\text{d}}i}}+\frac{{{\boldsymbol{x}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}\frac{{(1 - m){{\boldsymbol{e}}_{2i}}}}{{{{\left| {{{\boldsymbol{e}}_{1i}}} \right|}^m}}}+\frac{{{\boldsymbol{s}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}\frac{{{{\boldsymbol{s}}_i}}}{{{{\left| {{{\boldsymbol{s}}_i}} \right|}^m}}}} \right]. $

式中:${ {\boldsymbol{g}}_{{\boldsymbol{\varPhi}} i}} $${\hat {\boldsymbol{G}}}_{{\boldsymbol{\varPhi}} i}$${{\dot {\boldsymbol{x}}}_{2{\text{d}}i}} $分别为${{\boldsymbol{g}}_{{\boldsymbol{\varPhi}} }} $${\hat {\boldsymbol{G}}}_{{\boldsymbol{\varPhi}} }$${{\dot {\boldsymbol{x}}}_{2{\text{d}}}} $$ \phi、\theta、\psi $分量.

根据上述原理,设计空中作业机器人位置子系统和机械臂子系统的控制器.

定理1 对于式(19)所示的系统误差模型,当选取滑模面(29)和收敛律(31)时,系统能够在全局范围内达到稳定状态,系统的姿态角跟踪误差和姿态角变化率误差能够在显式时间内收敛到零.

备注1 采用滑模控制原理设计控制器时,系统状态变化分为2个阶段:收敛阶段,滑模函数趋近于零;滑动阶段,系统误差趋近于零. 因此,需要分别分析每个阶段的稳定性和收敛时间.

证明 选择 Lyapunov 函数为

$ {{\boldsymbol{V}}_1} = \frac{1}{2}{\boldsymbol{s}}_i^2+\frac{1}{2}{\tilde {\boldsymbol{W}}^{\text{T}}}\tilde {\boldsymbol{W}}. $

${{\boldsymbol{V}}_1}$进行求导,并代入式(30),可得:

$ \begin{split}\dot{\boldsymbol{V}}_1= & \boldsymbol{s}_i\left[\left(\boldsymbol{G}_{\boldsymbol{\varPhi}_i}-\hat{\boldsymbol{G}}_{\boldsymbol{\varPhi}_i}\right)-\frac{{\boldsymbol{s}}_{\mathrm{c}}^m}{m T_{\mathrm{c}}} \frac{\boldsymbol{s}_i}{\left|\boldsymbol{s}_i\right|^m}\right]+\tilde{\boldsymbol{W}}^{\mathrm{T}} \dot{\tilde{\boldsymbol{W}}}= \\& -\frac{{\boldsymbol{s}}_{\mathrm{c}}^m}{m T_{\mathrm{c}}} \frac{\boldsymbol{s}_i^2}{\left|\boldsymbol{s}_i\right|^m}+\boldsymbol{s}_i\left(\boldsymbol{G}_{\boldsymbol{\varPhi}_i}-\hat{\boldsymbol{G}}_{\boldsymbol{\varPhi}_i}\right)-\tilde{\boldsymbol{W}}^{\mathrm{T}} \dot{\hat{\boldsymbol{W}}} .\end{split} $

${{\boldsymbol{V}}_0} ={\boldsymbol{s}}_i^2 /{2}$,代入式(34)中可得:

$ \begin{split}\dot{\boldsymbol{V}}_1= & -\frac{{\boldsymbol{s}}_{\mathrm{c}}^m}{m T_{\mathrm{c}}}\left(2 \boldsymbol{V}_0\right)^{1-{m}/{2}}+\boldsymbol{s}_i\left(\boldsymbol{G}_{\boldsymbol{\phi}_i}-\hat{\boldsymbol{G}}_{\boldsymbol{\phi}_i}\right)-\tilde{\boldsymbol{W}}^{\mathrm{T}} \dot{\hat{\boldsymbol{W}}}= \\& -\frac{{\boldsymbol{s}}_{\mathrm{c}}^m}{m T_{\mathrm{c}}}\left(2 \boldsymbol{V}_0\right)^{1-{m}/{2}}-\tilde{\boldsymbol{W}}^{\mathrm{T}} \dot{\hat{\boldsymbol{W}}}+\boldsymbol{s}_i \tilde{\boldsymbol{W}}^{\mathrm{T}} \boldsymbol{h}({\boldsymbol{x}})+\boldsymbol{s}_i \varepsilon .\end{split} $

将式(26)中自适应权重更新率代入式(35)中,式(35)可以写为

$ {\dot {\boldsymbol{V}}_1} = - \frac{{{\boldsymbol{s}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}{(2{{\boldsymbol{V}}_0})^{1 - {m}/{2}}}+{{\boldsymbol{s}}_i}\varepsilon . $

根据假设1可知,神经网络具有很好的拟合能力,近似误差$\varepsilon $可以忽略不计. 根据引理2,${{\boldsymbol{s}}_i}$$\tilde {\boldsymbol{W}}$均满足显式时间稳定策略,同时可知滑模面(29)可以达到${{\boldsymbol{s}}_i} = {\bf{0}}$,系统是稳定的.

根据式(22),可以计算得到系统在收敛阶段的收敛时间为

$ \begin{split} {T}_{\text{c}1}=&-{\displaystyle {\int }_{{{\boldsymbol{V}}}_{1}({{\boldsymbol{s}}}_{{{0}}})}^{{\boldsymbol{0}}}\dfrac{{\mathrm{d}}{{\boldsymbol{V}}}_{1}}{\dfrac{{{\boldsymbol{s}}}_{\text{c}}^{m}}{m{T}_{\text{c}}}{\left(2{{\boldsymbol{V}}}_{1}\right)}^{1-{m}/{2}}}}=\\ &{T}_{\text{c}}{\displaystyle {\int }_{{\boldsymbol{0}}}^{{{\boldsymbol{V}}}_{1}({{\boldsymbol{s}}}_{0})}\dfrac{m}{{{\boldsymbol{s}}}_{\text{c}}^{m}}}{\left(2{{\boldsymbol{V}}}_{1}\right)}^{{m}/{2}-1}{\mathrm{d}}{{\boldsymbol{V}}}_{1}=\\ &{T}_{\text{c}}\dfrac{{{\boldsymbol{s}}}_{0}^{m}}{{{\boldsymbol{s}}}_{\text{c}}^{m}}\leqslant {T}_{\text{c}}.\end{split} $

式中:${{\boldsymbol{s}}_0} = {{\boldsymbol{s}}_i}({{\boldsymbol{x}}_0}) \in \left[ { - {{\boldsymbol{s}}_{\mathrm{c}}},{{\boldsymbol{s}}_{\mathrm{c}}}} \right]$表示滑模函数的初始值. 由引理2可知系统是显式时间稳定的,且系统误差可以在显式时间${T_{\mathrm{c}}}$内收敛到原点附近的某个领域内.

当系统处于滑动阶段时,${{\boldsymbol{s}}_i} = {\bf{0}}$,式(29)可以重写为

$ { {\boldsymbol{e}}_{2i}} = - \dfrac{{{\boldsymbol{x}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}\dfrac{{{{\boldsymbol{e}}_{1i}}}}{{{{\left| {{{\boldsymbol{e}}_{1i}}} \right|}^m}}}. $

定义1个Lyapunov函数为${{\boldsymbol{V}}_2} = {\boldsymbol{e}}_i^2/{2}$,可以通过微分得到

$ {{\dot {\boldsymbol{V}}}_2} = {{\boldsymbol{e}}_{1i}}{{ {\boldsymbol{e}}}_{2i}} = {{\boldsymbol{e}}_{1i}}\left( { - \dfrac{{{\boldsymbol{x}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}\dfrac{{{{\boldsymbol{e}}_{1i}}}}{{{{\left| {{{\boldsymbol{e}}_{1i}}} \right|}^m}}}} \right) = - \dfrac{{{\boldsymbol{x}}_{\text{c}}^m}}{{m{T_{\text{c}}}}}{\left( {2{{\boldsymbol{V}}_2}} \right)^{1 - {m}/{2}}}. $

结合式(39)和引理2,可知系统的误差可以收敛到零,系统稳定.

根据式(22),可以算出系统在滑动阶段的收敛时间为

$ {T}_{\text{c}2}=-{\displaystyle {\int }_{{{\boldsymbol{V}}}_{2}\left({{\boldsymbol{x}}}_{0}^{}\right)}^{{\boldsymbol{0}}}\dfrac{{\mathrm{d}}{{\boldsymbol{V}}}_{2}}{\dfrac{{{\boldsymbol{x}}}_{\text{c}}^{m}}{m{T}_{\text{c}}}{\left(2{{\boldsymbol{V}}}_{2}\right)}^{1-{m}/{2}}}} ={T}_{\text{c}}\dfrac{{{\boldsymbol{x}}}_{0}^{m}}{{{\boldsymbol{x}}}_{\text{c}}^{m}}\leqslant {T}_{\text{c}}. $

根据以上证明,系统是全局稳定的,且系统的总收敛时间${T_1}$满足$ {T}_{1}\leqslant {T}_{\text{c}1}+{T}_{\text{c2}}\leqslant 2{T}_{\text{c}} $,系统显式时间稳定的上界为$2{T_{\text{c}}}$.

备注2 在实际控制系统设计中,通信延迟等问题使系统误差不能准确收敛到原点,而只能收敛到原点附近的1个邻域,但系统仍然满足显式时间稳定策略.

3. 仿真与飞行实验结果

对空中作业机器人进行数值仿真和物理飞行实验,以验证所提控制方法的有效性. 此外,与现有的先进控制方法进行对比实验.

3.1. 实验设置

3.1.1. 实验平台

采用的四轴无人机硬件由DJI F450机架、20 A电子调速器(electronic speed controller, ESC)、3S 4 300 mAh 45C LIPO电池、CFN 1045自锁桨叶和X2212 KV980电机组成. 自驾仪为PIXHAWK 2.4.8,长距离无线电(LORA)通信模块为LR900. 主控单片机接收姿态传感器传来的数据,通过无线通信模块发送到地面站. 地面站中的控制器计算出电机输出转速,并通过无线通信模块将转速信息发送给主控单片机,后者接收到目标转速后,将其转化为脉冲宽度调制(pulse width modulation, PWM)并发送给ESC. ESC根据接收到的PWM指令对电机转速进行闭环控制. 空中作业机器人实验平台如图3所示. 地面站控制器的采样频率为1 kHz,与传感器的处理速度同步.

图 3

图 3   空中作业机器人实验平台

Fig.3   Aerial manipulator system experimental platform


3.1.2. 物理参数测量

在数值模拟和实物实验中,升力$F$固定,设置为0.65 N. 四旋翼无人机的硬件参数为:质量$m = {\text{1}}{\text{.33 kg}}$,臂长$l = {\text{0}}{\text{.225 m}}$. 提出的控制方法需要测量动力系统中的物理参数,以建立控制量和实际物理量之间的关系. 使用双摆扭转法测量的四旋翼的转动惯量${J_{xx}}、{J_{yy}}、{J_{zz}} $分别为:0.00750.0076,0.014 6. 按照文献[23]提出的方法,计算得到位置和姿态动力学方程中的空气阻力系数分别为0.222、0.011.

四旋翼无人机上的无刷直流电机由电子调速器驱动. 通过实验测量转速,得到电机转速$(\omega_i) $与PWM$(p_i) $的关系如图4所示. 建立参数拟合公式${w_i} = {k_1}{p_i}+{k_2}$,其中${k_1} = {\text{0}}{\text{.801 7}}$${k_2} = - {\text{691}}{\text{.532 8}}$.

图 4

图 4   电机转速和输入PWM拟合实验结果

Fig.4   Fitting experimental results of motor speed and input PWM


ETAC的输出为虚拟控制转矩,而在实际控制中需要控制电机转速. 为了得到虚拟控制转矩与电机转速的关系,利用张力计和电流表测量不同转速下的张力和转矩数据. 采用拟合方法得到系数${c_T}$${c_M}$,拟合实验结果如图5所示. 通过拟合实验可得:${c_T} = 1.041 \times {10^{ - 5}}\;{\text{N/}}{({\text{rad}} \cdot {{\text{s}}^{{{ - }}1}})^2}$${c_M} = 2.120 \times {10^{ - 7}}\;{\text{N}} \cdot {\text{m/}}{({\text{rad}} \cdot {{\text{s}}^{{{ - }}1}})^2}$. 通过以上参数测量实验,可以得到控制量与控制对象之间的定量关系,以便在实际四旋翼飞行器上进行实验.

图 5

图 5   电机拉力系数与转矩系数拟合结果

Fig.5   Motor tension coefficient and torque coefficient fitting results


3.2. 数值仿真

对空中作业机器人轨迹跟踪控制进行数值仿真,以验证所提控制方法的理论正确性. 数值仿真在 MATLAB 2023b/Simulink 工具箱中进行.

空中作业机器人参考关节状态变量设置为

$ \left. {\begin{gathered} {{q_{1{\text{d}}}} = \dfrac{{\text{π}} }{6}\sin\; (0.5t),} \\ {{q_{2{\text{d}}}} = \dfrac{{\text{π}} }{{18}}\sin\; (0.1{\text{π}} t),} \\ {{q_{3{\text{d}}}} = \dfrac{{\text{π}} }{9}\sin\; (0.2{\text{π}} t).} \\\end{gathered}} \right\} $

空中作业机器人初始关节角是0,其他状态变量设置为$\left[ {{\phi _0},{\theta _0},{\psi _0}} \right] = \left[ {2,2,2} \right]^\circ $$\left[ {{p_0},{q_0},{r_0}} \right] = \left[ {0,0,0} \right]^\circ / \mathrm{s}$. 参考跟踪信号为${x_{\mathrm{d}}} = 10 \cos \;(0.6t)\;{\mathrm{m}}$${y_{\text{d}}} = 10\cos\; (0.4t)\;{\mathrm{m}}$${z_{\text{d}}} = 5\;{\mathrm{m}},\,\,$${\phi _{\text{d}}} = 10\cos \;(0.6t)^\circ $${\theta _{\text{d}}} = 10\cos \;(0.5t)^\circ $${\psi _{\text{d}}} = 5^\circ $. 通过在姿态系统各控制支路加入正弦合成信号来模拟复杂的外界扰动,可以表示为$\Delta {d_i} = 2\sin \;(2t)+ 2\cos \;(t)+0.2\;{\mathrm{N \cdot m}}$.

自适应神经网络对系统集总扰动的估计效果如图6所示. 在该实验中,神经网络的学习率$\gamma = 0.005$. 可以看出,在0~0.26 s期间,估计值波动较为显著. 经过动态调整,估计值与实际值的误差逐渐减小,并在1.13 s时收敛至一定范围内,该范围内峰值误差为0.85. 将系统的误差输入作为神经网络的输入,实时估计扰动,同时调整控制器的输出,保证控制器获得较好的抗扰性能.

图 6

图 6   自适应神经网络对集总不确定项的估计结果

Fig.6   Estimation results of lumped uncertainty terms using adaptive neural network


图7展示了ETAC方法中扰动补偿对系统控制性能的影响. 图中,$e_\phi 、 e_\theta 、e_\psi$分别为滚转角、俯仰角和偏航角的误差. ETAC方法通过RBFNN进行扰动估计后,将补偿项引入控制器. 可以看出,加入补偿项后,系统误差基本趋近于零,与未加入补偿项的情况相比,误差减少了43.85%. 此外,加入补偿项的误差曲线更加平滑,进一步体现了控制性能的显著提升.

图 7

图 7   扰动补偿对系统控制性能的影响

Fig.7   Impact of disturbance compensation on system control performance


利用给定的初始信号和参考信号,姿态和机械臂轨迹跟踪的仿真结果如图89所示. 可以看出,尽管空中作业机器人的控制过程中存在扰动,提出的控制方法在存在初始误差的情况下仍然实现了较高的跟踪精度,同时控制输入保持在较小的区间内. 姿态误差的实际收敛时间为1.11 s,比理论收敛时间缩短了0.39 s;机械臂跟踪误差的实际收敛时间为0.76 s,比理论收敛时间缩短了0.74 s.

图 8

图 8   姿态跟踪控制的数值仿真结果

Fig.8   Numerical simulation results of attitude tracking control


图 9

图 9   机械臂关节角跟踪结果

Fig.9   Manipulator joint angle tracking results


为了进一步说明所提显式时间控制器的性能,在位置跟踪实验中与文献[24]提出的固定时间控制器和文献[21]提出的预定义时间控制器进行对比仿真. 图10展示了3种不同控制器下的跟踪精度和控制输入. 可以看出,提出的控制器在保证控制输入较小的同时,能够缩短系统的收敛时间.

图 10

图 10   位置跟踪控制对比实验结果

Fig.10   Comparative experimental results of position tracking control


进一步量化对比仿真结果,仿真比较结果的控制输入均值和收敛速度如图11所示. 在图11(a)中,$ E(\left| \cdot \right|) $为控制输入均值;在图11(b)中,${T_{\text{c}}}$为误差收敛时间,$ e_x、e_y、e_z $分别为xy$z $方向上的位置轨迹跟踪误差. 可以得出,提出的显式时间控制器具有最小的控制输入和最短的收敛时间,表明其在控制输入和收敛速度方面具有优越性.

图 11

图 11   位置跟踪仿真实验量化结果

Fig.11   Quantitative results of position tracking simulation experiment


为了验证系统能在显式时间内完成收敛,设定1.0 s、1.5 s、2.0 s共3个不同的显式收敛时间进行仿真实验,实验结果如图12所示. 可以看出,3个姿态角的误差均能在设定的显式时间${T_{\mathrm{c}}}$内收敛到原点. 上述3个显式收敛时间对应的控制输入转矩如图12中(b)所示. 可以看出,随着${T_{\mathrm{c}}}$的减小,控制输入增大,凸显了选择合适的${T_{\mathrm{c}}}$对于系统最优控制性能的重要性. 在本研究的所有实验中,${T_{\mathrm{c}}}$均设置为1.5 s,既保证了收敛速度,又避免了系统控制输入的饱和问题.

图 12

图 12   显式时间控制中不同收敛时间的性能对比

Fig.12   Performance comparison of different convergence times in explicit time control


3.3. 飞行实验
3.3.1. 姿态跟踪

设计1组飞行实验来验证所提控制方法的有效性,并与其他方法进行比较. 首先,在如图13所示的空中作业机器人实验平台上进行姿态跟踪飞行实验. 出于飞行安全的考虑,该实验平台将空中作业机器人固定在光滑的球面万向节上,以限制其位置变化. 空中作业机器人的3个关节被置零,以充分展示所提控制方法的控制性能.

图 13

图 13   空中作业机器人姿态跟踪实验装置

Fig.13   Attitude tracking experimental device of aerial manipulator system


飞行实验中采用的控制器参数和参考跟踪信号与数值仿真中采用的相同. 为了进一步验证ETAC方法的性能,与文献[24]提出的固定时间滑模控制(fixed time sliding mode control, FTSMC)方法和文献[21]中提出的预定义时间滑模控制(predefined time sliding mode control, PTSMC)方法进行对比实验,实验结果如图14所示. 可以看出3种方法都在短时间内取得了良好的姿态跟踪性能. 图14中(b)展示了空中作业机器人的姿态跟踪误差,具体数值结果如表1所示,表明提出的控制方法的姿态跟踪误差明显减小. 图14中(c)展示了控制输入转矩的对比结果. 可以看出,在跟踪同一参考轨迹时,ETAC方法的控制输入转矩较小,表明ETAC方法能够更好地跟踪参考轨迹,并将跟踪误差收敛到原点附近的1个邻域内. 在高动态快速响应和存在传感器信号干扰的实际飞行试验中,ETAC方法也获得了比其他方法更好的性能.

图 14

图 14   不同控制方法的空中作业机器人飞行实验对比结果

Fig.14   Comparative results of aerial manipulator flight experiments using different control methods


表 1   飞行实验中不同控制方法的定量比较

Tab.1  Quantitative comparison of different control methods in flight experiments

姿态角控制方法${T_{\text{c}}}/{\mathrm{s}}$RMSE/(°)${E_{\max }}$/(°)
滚转角FTSMC1.760.659 21.883 8
PTSMC1.580.644 51.956 4
ETAC1.360.479 51.486 8
俯仰角FTSMC2.270.764 81.853 6
PTSMC1.850.523 11.611 8
ETAC1.800.397 21.096 4
偏航角FTSMC1.890.512 91.847 7
PTSMC1.350.384 11.161 8
ETAC1.220.256 10.923 9

新窗口打开| 下载CSV


3.3.2. 抗扰实验

空中作业机器人中机械臂的运动会对四旋翼平台产生反作用力,导致系统姿态无法稳定. 为了进一步说明ETAC方法的抗扰性能,与文献[25]提出的自抗扰控制(active disturbance rejection control, ADRC)方法进行对比飞行实验. 在本实验中,空中作业机器人处于悬停状态,使机械臂各关节从零点运动到相应角度. 抗扰飞行实验示意图如图15所示.

图 15

图 15   空中作业机器人抗扰动飞行实验

Fig.15   Disturbance-rejection flight experiments of aerial manipulator


本次实验采用带激光测距的光流模块获取位置,在初始时刻空中作业机器人的${q_1}、{q_2}、{q_3}$均为零. 第20 s时使机械臂的${q_2}$变为−20°,第35 s时使机械臂的${q_3}$变为30°.

图16为空中作业机器人在悬停状态下受到机械臂扰动时的姿态角变化情况,具体数值如表2所示. 机械臂的安装位置对空中作业机器人运动时的俯仰角影响较大. 可以看出,使用ARDC方法时姿态角波动较大,导致飞行不稳定,无法满足空中作业任务的需求. 当采用本研究提出的ETAC方法时,机械臂运动时姿态角在较小范围内波动,且很快收敛到稳定状态,验证了ETAC控制方法具有良好的跟踪性能和抗干扰能力.

图 16

图 16   空中作业机器人抗扰动对比实验结果

Fig.16   Comparative experimental results of disturbance rejection of aerial manipulator


表 2   不同控制方法抗扰性能定量比较结果

Tab.2  Quantitative comparison results of disturbance-rejection performance of different controll method

姿态角控制方法$\text { RMSE } /\left({ }^{\circ}\right) $$E_{\text {max }} /\left({ }^{\circ}\right) $
滚转角ADRC0.747 72.768 5
ETAC0.418 41.340 3
俯仰角ADRC0.754 83.875 4
ETAC0.588 03.012 3
偏航角ADRC0.285 91.388 4
ETAC0.222 91.062 1

新窗口打开| 下载CSV


4. 结 语

针对空中作业机器人轨迹跟踪控制中的挑战,提出了结合自适应神经网络与显式时间稳定策略的控制方法,重点解决了动力学模型中存在扰动和不确定性的问题. 研究结果表明,该方法能够在不依赖先验知识的条件下,自适应地逼近系统中的动态不确定性,并实现显式时间内的姿态收敛,同时具有较低的控制输入需求和较强的扰动抑制能力. 实际飞行实验验证了该方法在复杂工况下具有良好的稳定性和适应性,为空中作业机器人在任务执行过程中的高精度轨迹跟踪提供了理论支持与工程实践价值. 然而,本研究主要集中于部分自由度的轨迹跟踪控制,尚未涵盖全自由度的控制场景和空中抓取等复杂任务. 未来的研究将进一步探索空中作业机器人在全自由度跟踪控制和多任务协同作业中的潜力,推动其在多样化实际应用中的广泛发展.

参考文献

KHALID A, MUSHTAQ Z, ARIF S, et al.

Control schemes for quadrotor UAV: taxonomy and survey

[J]. ACM Computing Surveys, 2023, 56 (5): 1- 32

[本文引用: 1]

HUA H, FANG Y, ZHANG X, et al

A novel robust observer-based nonlinear trajectory tracking control strategy for quadrotors

[J]. IEEE Transactions on Control Systems Technology, 2021, 29 (5): 1952- 1963

[本文引用: 1]

ZEGHLACHE S, RAHALI H, DJERIOUI A, et al

Robust adaptive backstepping neural networks fault tolerant control for mobile manipulator UAV with multiple uncertainties

[J]. Mathematics and Computers in Simulation, 2024, 218: 556- 585

[本文引用: 1]

CAO H, WU Y, WANG L

Adaptive NN motion control and predictive coordinate planning for aerial manipulators

[J]. Aerospace Science and Technology, 2022, 126: 107607

[本文引用: 1]

YAO Y, DING L, WANG Y

Fractional-order nonsingular terminal sliding mode control of a cable-driven aerial manipulator based on RBF neural network

[J]. International Journal of Aeronautical and Space Sciences, 2024, 25 (2): 759- 771

[本文引用: 1]

FANG Q, MAO P, SHEN L, et al

Robust control based on adaptive neural network for the process of steady formation of continuous contact force in unmanned aerial manipulator

[J]. Sensors, 2023, 23 (2): 989

[本文引用: 2]

刘宜成, 贺嘉辣, 严文

旋翼飞行机械臂固定时间滑模控制

[J]. 电光与控制, 2024, 31 (1): 69- 76

DOI:10.3969/j.issn.1671-637X.2024.01.011      [本文引用: 2]

LIU Yicheng, HE Jiala, YAN Wen

Fixed-time sliding mode control of rotor flight manipulator

[J]. Electronics Optics and Control, 2024, 31 (1): 69- 76

DOI:10.3969/j.issn.1671-637X.2024.01.011      [本文引用: 2]

刘浩, 黄山, 涂海燕

基于预定义时间的四旋翼滑模控制

[J]. 北京航空航天大学学报, 2024, 50 (5): 1665- 1674

[本文引用: 2]

LIU Hao, HUANG Shan, TU Haiyan

Quadrotor sliding mode control based on predefined time

[J]. Journal of Beijing University of Aeronautics and Astronautics, 2024, 50 (5): 1665- 1674

[本文引用: 2]

YAN W, ZHAO T, GONG X

An explicit-time and explicit-accuracy control for a state-constrained nonstrict-feedback uncertain system based on adaptive fuzzy dynamic-approximation

[J]. Journal of the Franklin Institute, 2023, 360 (9): 6425- 6462

[本文引用: 2]

LI H, LI Z, LIU J, et al

Adaptive neural network backstepping control method for aerial manipulator based on coupling disturbance compensation

[J]. Journal of the Franklin Institute, 2024, 361 (7): 106733

[本文引用: 1]

LIANG J, CHEN Y, LAI N, et al

Low-complexity prescribed performance control for unmanned aerial manipulator robot system under model uncertainty and unknown disturbances

[J]. IEEE Transactions on Industrial Informatics, 2022, 18 (7): 4632- 4641

[本文引用: 1]

ZHAO K, ZHANG J, MA D, et al

Composite disturbance rejection attitude control for quadrotor with unknown disturbance

[J]. IEEE Transactions on Industrial Electronics, 2020, 67 (8): 6894- 6903

[本文引用: 1]

JIANG H, MA Q, GUO J

Fuzzy-based fixed-time attitude control of quadrotor unmanned aerial vehicle with full-state constraints: theory and experiments

[J]. IEEE Transactions on Fuzzy Systems, 2024, 32 (3): 1108- 1115

[本文引用: 1]

LIU K, HUNG T, LIN C, et al

Redundancy-driven multi-task adaptive backstepping tracking control for aerial manipulators

[J]. IEEE Access, 2024, 12: 47134- 47145

[本文引用: 1]

YOGI S C, TRIPATHI V K, BEHERA L

Adaptive integral sliding mode control using fully connected recurrent neural network for position and attitude control of quadrotor

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32 (12): 5595- 5609

[本文引用: 1]

LIU Y C, HUANG C Y

DDPG-based adaptive robust tracking control for aerial manipulators with decoupling approach

[J]. IEEE Transactions on Cybernetics, 2022, 52 (8): 8258- 8271

[本文引用: 1]

YANG Y, GORBACHEV S, ZHAO B, et al

Predictor-based neural attitude control of a quadrotor with disturbances

[J]. IEEE Transactions on Industrial Informatics, 2024, 20 (1): 169- 178

[本文引用: 1]

YAN W, ZHAO T, YANG H, et al

1-order-smooth explicit-time nonsingular terminal sliding mode control of industrial cyber-physical systems against cyber-attacks

[J]. IEEE Transactions on Industrial Cyber-Physical Systems, 2023, 1: 371- 380

[本文引用: 1]

MAHMOOD A, UR REHMAN F, OKASHA M, et al

Neural adaptive sliding mode control for camera positioner quadrotor UAV

[J]. International Journal of Aeronautical and Space Sciences, 2025, 26 (2): 733- 747

[本文引用: 1]

ZHU Z, XIA Y, FU M

Adaptive sliding mode control for attitude stabilization with actuator saturation

[J]. IEEE Transactions on Industrial Electronics, 2011, 58 (10): 4898- 4907

[本文引用: 1]

LIAN S, MENG W, LIN Z, et al

Adaptive attitude control of a quadrotor using fast nonsingular terminal sliding mode

[J]. IEEE Transactions on Industrial Electronics, 2022, 69 (2): 1597- 1607

[本文引用: 3]

TONG S, LI Y, LIU Y

Observer-based adaptive neural networks control for large-scale interconnected systems with nonconstant control gains

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32 (4): 1575- 1585

[本文引用: 1]

DAI X, KE C, QUAN Q, et al

RFlySim: automatic test platform for UAV autopilot systems with FPGA-based hardware-in-the-loop simulations

[J]. Aerospace Science and Technology, 2021, 114: 106727

[本文引用: 1]

YU L, HE G, WANG X, et al

A novel fixed-time sliding mode control of quadrotor with experiments and comparisons

[J]. IEEE Control Systems Letters, 2021, 6: 770- 775

[本文引用: 2]

YANG H, CHENG L, XIA Y, et al

Active disturbance rejection attitude control for a dual closed-loop quadrotor under gust wind

[J]. IEEE Transactions on Control Systems Technology, 2018, 26 (4): 1400- 1405

[本文引用: 1]

/