<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 2类执行智能体

Fig.1 Two types of executive agents

2. 养老情景下HMSRMA的动态任务分配机制

区别于其他情境，养老机构中的任务分配具有以下特点. 1）任务类型相对固定，被服务对象每天的生活需求内容有限；2）任务多为并发，同时刻会出现多个被服务对象提出多个需求的情况；3）养老机构为动态环境，被服务对象的需求随机出现. 为此，提出的动态任务分配机制描述如下.

1）设定固定时间间隔作为时间窗口. 每经过1个时间窗口，中央智能体收集当前时间窗口内新产生的任务需求，根据任务分解机制将这些任务分解为多个子任务，将子任务连续发布给所有的执行智能体.

2）各执行智能体分别依次接收子任务，根据自身功能约束 ${c}_{\mathrm{r}}$判断自身是否与任务需求匹配. 若功能匹配，基于实时状态（所处物理位置信息、正在执行以及将要执行任务信息）根据投标值 ${b}_{i,j}$函数计算对该子任务的投标值.

3）执行智能体进行信息交换，确定赢得该子任务的执行智能体，并更新自身的任务执行序列 ${T}_{\mathrm{s}}$. 自锁检测与解锁后，执行智能体再次更新任务执行序列，将更新后的执行序列发送给中央智能体.

4）中央智能体基于拓扑排序算法对更新后的任务执行序列进行互锁检测和解锁，并判断成功与否. 当解锁失败次数达到阈值（本研究设定为3），将当前时间窗口内任务优先级最低的任务移至下个时间窗口，并将优先级提升1级. 如果最低优先级任务数大于1，则根据任务需求提出的时刻，选择后提出的低优先级任务.

时间窗口触发的动态任务分配机制在某一时间窗口的流程如图2所示.

图 2

图 2 任务分配机制流程图

Fig.2 Flow chart of task allocation mechanism

2.1. 执行智能体任务序列与投标值计算模型

养老情景下的机器人由多个被服务对象分时共享，1个执行智能体会分时执行多个子任务，形成本地任务执行序列 ${T}_{\mathrm{s}}$^[11-13]. 本地序列存储子任务信息，执行智能体根据实时信息调整任务执行序列. 养老院中任务分配及执行规划问题的数学描述为

(1) $ \left.\begin{array}{l}\mathrm{max}\left({\displaystyle \sum\nolimits_{i}^{N}{\displaystyle \sum\nolimits _{j}^{M}{b}_{i,j}}}\right); \\ {{{\rm{s}}.{\rm{t}}.\;}}\left\{{{c}}_{\text{r}}^{}\right\}, \left\{{c}_{\text{s}}^{}\right\}. \end{array}\right\} $

式中：M为待处理子任务数，N为执行这些子任务的服务机器人数， ${b}_{i,j}$为第i个机器人对第j个子任务的投标值， ${c}_{\mathrm{s}}$为子任务时序约束.

多智能体系统的目标是减小任务执行成本以扩大收益^[14-16]. 养老情景下将被服务对象的感受作为收益，引用李勇等^[10]提出的满意度模型来计算任务分配投标值. 基于文献[10]的满意度模型，提出AR、WR计算满意度的模型，在本研究场景下， AR完成拉/放任务时不存在运行速度的参数. 为了保证满意度值为正，将AR、WR的满意度计算公式分别修改为

(2) $\begin{split} {S _{{{\rm{AR}}} }} =& \left| {{\alpha _0}{{P}} - {\alpha _1}{{I}}{{\rm{exp}}}\,({\alpha _2}{{t_{\rm{w}}}}/{t_{\rm{wm}}}) - } \right.\\ &\left. { {\alpha _3}{{\rm{exp}}\,({{\alpha _4}\left( {{t_{\rm{e}}} - {t_{{\rm{es}}}}} \right)/{\alpha _5}}}}) \right|^{-1} , \end{split} $

(3) $ \begin{split} {S _{{\rm{WR}}}} =& \left| {\alpha_{{0}}}{{P } -}{\alpha _1}{I}{{\rm{exp}}}\,({\alpha _2}{t_{\rm{w}}}/{{{t_{{\rm{wm}}}}}}) -\right. \\ &\left.{\alpha _3}{{\rm{exp}}\,({{\alpha _4}\left( {v - {v_{\rm{s}}}} \right)}}) \right|^{-1}.\quad \end{split} $

式中： $ {\alpha }_{0} $~ $ {\alpha }_{5} $为可调参数； $ P $服务任务的优先级，其中吃饭任务优先级 $ P\in \left\{0,\mathrm{1,2},\mathrm{3,4}\right\} $，摔倒任务优先级 $ P\in \left\{10,\mathrm{11,12,13,14}\right\} $，摔倒任务的优先级远大于吃饭； $ I $为被服务对象的性格急躁系数， $I\in \left\{\mathrm{1.0,} \mathrm{1.1,1.2,1.3,1.4}\right\}$； $ {t}_{\mathrm{w}} $为被服务对象提出服务需求至服务智能体开始任务执行的时间； $ {t}_{\mathrm{w}\mathrm{m}} $为被服务对象能忍受的最大等待时间； $ {t}_{\mathrm{e}} $为AR执行拉/放任务的时间，该参数为AR的固定属性； ${t}_{\mathrm{es}}$为被服务对象感到舒适的拉/放时间； $ v $为WR执行运送任务的速度； ${v}_{\mathrm{s}}$为被服务对象感到舒适的运送速度^[10].

$ {t}_{\mathrm{w}} $是影响满意度的主要参数. 若智能体本地任务执行序列中有 $ l $个子任务，则第 $ n $个子任务的等待时间计算公式为

(4) $ {t_{{\rm{w}},{n}}} = \left( {{t_{{\rm{b}}}} - {t_{\rm{p}}}} \right)+{t_{{{\rm{a}}},n}}+{t_{{{\rm{c}}},n}}+{t_{{{\rm{t}}}}}. $

(5) $ {t_{{{\rm{a}}},n}} = {D}/{v}. $

(6) $ {t}_{\text{c},n}=\left\{\begin{array}{l}0,\quad\quad\quad\quad\quad \text{无前件子任务};\\ 0,\quad\quad\quad\quad\quad {t}_{\text{a},n}+{t}_{\text{t}} < {t}_{\text{ep}};\\ {t}_{\text{a},n}+{t}_{\text{t}}-{t}_{\text{ep}},\;\;\;\;{t}_{\text{a},n}+{t}_{\text{t}}\geqslant {t}_{\text{ep}}.\end{array}\right. $

(7) $ {t_{{{\rm{ep}}}}} = {t_{{{\rm{w}},{{n}}-1}}}+t_{{{\rm{e}},{{n}}-1}}. $

(8) $ {t_{\rm{t}}} = \sum\nolimits_{i = 1}^{ n - 1} {{t_{{{\rm{w}}},{i}}}+{t_{{{\rm{e}}},i}}} . $

式中：D为执行智能体本地任务序列中第n个子任务与第（n−1）个子任务间的距离； $ {t}_{\mathrm{b}} $为投标时间， ${t}_{\mathrm{p}}$为子任务发布时间， ${（t}_{\mathrm{b}}-{t}_{\mathrm{p}}）$表示该子任务从发布到投标的时间； ${t}_{\mathrm{a},n}$为该智能体本地序列中第 $ n $个子任务与第（n−1）个子任务间的到达时间； ${t}_{{\rm{c}},n}$为第 $ n $个子任务与第（n−1）个子任务交接的等待时间； $ {t}_{\mathrm{e}\mathrm{p}} $为序列中（n−1）个子任务的执行时间； ${t}_{\mathrm{w},n-1}$为第（n−1）个的等待时间； ${t}_{\mathrm{e},n-1}$为第（n−1）个子任务的执行时间； $ {t}_{{\rm{t}}} $为智能体本地任务执行序列中前 $ n $个子任务的执行与等待时间总和； $ {t}_{\mathrm{w},i} $为序列中第 $ i $个子任务的等待时间，可根据式（4）求出； $ {t}_{\mathrm{e},i} $为第 $ i $个子任务的执行时间，由不同执行智能体的预设信息得出.

兼顾整体与个体的投标值计算模型为

(9) $ {{b}}_{i,j}= {{{L}}_{\text{1}}}\left( {S^\prime { - }S} \right){\text+}{{{L}}_{\text{2}}}\left( {{s_{i,j}^\prime }{{ - }}{s}_{i,j}} \right), $

(10) $ S^\prime = \sum\nolimits_{k = 1}^{L'} {{S_k}} , $

(11) $ {S = \sum\nolimits_{k = 1}^L {{S_k}} .} $

式中： ${S}^{{'}}$为执行智能体本地任务执行序列调整后序列中所有任务的满意度之和； $ {L}{{'}} $为调整后在任务序列中的任务数； $ S $为执行智能体本地任务执行序列调整前（尚未对新任务投标时）序列中所有任务的满意度之和； $ L $为调整前在任务序列中的任务数； $ {\mathrm{S}}_{k} $为序列中第 $ k $个任务的满意度； ${s}_{i,j}$、 $ {s}{{'}}_{i,j} $分别为调整前后的智能体本地任务执行序列的最小满意度； $ {L}_{1} $、 $ {L}_{2} $为可调系数. 当执行智能体的功能不满足子任务需求时，智能体无法对新任务投标，规定此时投标值为0，即无效投标. 可以看出，执行智能体投标值计算公式由子任务满意度计算得到，被服务对象满意度由子任务满意度加和得到，因此式（9）可以有效反映被服务对象的满意度情况.

2.2. 多执行智能体间的分布协商机制

新的子任务投标结束后，所有执行智能体进行分布式协商以确定投标值最大的智能体. 为了方便执行智能体存储本地投标信息，引入任务向量 $ {\boldsymbol{T}}_{\rm{v}} $^[6]. 任务向量中的信息存储格式为

(12) $ {{{\boldsymbol{T}}}_{\rm{v}}}{ = }\left[ {{{{T}}_{{\rm{ID}}}}{,{{T}}}_{{\rm{id}}},{{b}}_{{i,j}},\,{{{a}} _{{\rm{ID}}}},\,{{{t}}_{\rm{b}}}} \right]{.} $

式中： ${T}_{\mathrm{I}\mathrm{D}}$为主体任务标号， ${T}_{\mathrm{i}\mathrm{d}}$为子任务标号， $ {a}_{\mathrm{I}\mathrm{D}} $为给出投标值的智能体标号. 各智能体的本地任务向量在对子任务投标及智能体间协商完成后进行更新. 设定4种执行智能体任务执行状态为空闲、响应、任务执行中、任务锁定. 当某子任务正在被执行时，执行该子任务的智能体会向准备执行后件子任务的智能体发出锁定命令，接到该命令后负责执行后件子任务的智能体不再投标新任务. 协商过程的算法流程图如图3所示.

图 3

图 3 执行智能体间协商算法的流程图

Fig.3 Flow chart of negotiation algorithm between executing agents

2.3. 死锁的检测及处理

死锁是分布式系统中的常见问题^[17-18]. 当某个执行智能体须执行多个子任务时，最优执行序列中的子任务可能不满足子任务时序约束；以该顺序执行时，无法完成的任务便陷入无限等待，这种执行智能体自身任务序列的死锁称为执行智能体自锁. 当某个智能体执行的任务须以另一个智能体陷入等待的子任务完成为前提时的死锁称为多执行智能体间互锁.

引入基于拓扑排序算法（topological sort）的死锁检测与解锁算法^[18]. 该算法基于任务时序优先级图(task precedence graph，TPG). TPG由任务执行子图(task executing subgraph, TESG)和任务约束子图(task constraint subgraph, TCSG)构成. 其中TESG反应执行智能体本地任务执行序列的约束，TCSG反应1个服务任务包含的子任务时序约束. 使用拓扑排序算法对TPG排序，判断任务分配方案是否存在死锁，若存在，则调整存在死锁的执行智能体任务序列.

2.3.1. 执行智能体自锁的检测及解锁

如图4所示，基于自锁检测算法检测各执行智能体的本地任务序列，若存在自锁，则执行如下解锁流程. 1）改变本地任务执行序列中的子任务执行顺序，采用遍历法生成所有可能的新的本地任务序列集1. 2）基于拓扑排序算法检测集1中各个序列是否存在自锁。删除自锁序列后，得到本地任务序列集2. 3）执行智能体计算集2每个序列的满意度和. 4）选择某个满意度和最大序列作为该执行智能体解锁后的本地任务执行序列.

图 4

图 4 自锁检测算法

Fig.4 Self locking detection algorithm

2.3.2. 中央智能体对多执行智能体间互锁的检测及解锁

若多智能体间出现互锁，往往仅需调整某个智能体的任务序列，为此需要准确定位死锁的任务节点. 由于各执行智能体中只包含局部任务分配信息，采用基于拓扑排序算法检测全局分配方案须在中央智能体中运行. 若某种任务分配方案存在互锁，则其任务时序优先级图中存在强连通分量（strongly connected components，SCC），SCC与TESG的交集构成可变子图. 可变子图可以调整，且包含死锁子任务节点间的有向边，由此实现对死锁节点的准确定位. 通过转置可变子图的邻接矩阵得到无锁子任务间的依赖关系，再由新的任务时序优先级图得到调整后的执行智能体本地任务执行序列.

为了提高多机协作机制的决策效率，对任务分配结果中的互锁问题进行多次解锁操作. 当多智能体系统某次出现死锁并进行解锁后，更新本地任务执行序列，再次检测解锁后的任务分配方案是否解锁成功. 在任务分配机制流程中，死锁情况下最低优先级的任务被移至下个时间窗口后，与该时间窗口中被服务对象提出的新需求一起进行新的任务分配. 此时，该时间窗口下的任务序列若依然出现死锁，则与前个时间窗口下的解锁流程进行相同的解锁操作，以此类推. 若多次解锁操作失败，说明对于现有规模的多执行智能体来说，须处理的任务规模太大。引入空闲的备用资源或减少当前时间窗口下多智能体系统接受的任务数，使系统正常运行（在养老机构中，通常不会有空闲机器人，多数情况下采用减少任务规模的方式）后，更新多智能体系统执行方案中的任务池.

3. 仿真分析

3.1. 虚拟养老机构环境的建立

如图5所示为仿真场景各房间及固定点坐标。其中 A（10，10）、B（25，5）、C（25，15）、D（25，25）、E（25，35）、F（15，35）、G（15，25），食堂（5，35），卫生间（5，25），T₁（35，5）、T₂（35，15）、T₃（35，25）、T₄（35，35），上述信息均存储在各执行智能体中.

图 5

图 5 虚拟养老机构环境

Fig.5 Virtual elderly care institution environment

为了简化研究，规定起始点、被服务对象的房间、卫生间等仿真场景都有对应的固定点，即点A、B、C等. 在不考虑执行智能体间碰撞问题的前提下，将所有智能体均视为点，设系统初始状态的执行智能体均处于点A位置. 以任务T1智能体AR为例，在初始状态下，当某个执行智能体收到任务并要前往该任务所在位置时，AR确定当前所处位置坐标点A，确定点B为T1任务位置对应的固定点，则AR在当前位置沿直线AB行驶至点B，再从点B直线行驶到点T₁. 在非初始状态下，执行智能体按照其自身任务序列前往下个任务所在位置时（执行完T3，后序任务为T4），AR确定当前所处位置坐标点T₃，确定点D为T3任务位置对应的固定点，确定点E为T4任务位置对应的固定点. 则AR从点T₃沿直线行驶到点D，再从点D直线行驶到点E，由点E直线行驶到点T₄. 以此类推，所有智能体均按上述机制行驶.

3.2. 仿真实验

3.2.1. 同一时间窗口内同时出现多个任务

设多智能体系统由1个中央智能体及4个执行智能体组成，执行智能体的编号分别为AR1（技能为拉/放，空载速度1 m/s，服务时间20 s）、AR2（技能为拉/放，空载速度1 m/s，服务时间15 s）、WR1（技能为运送，空载速度1.5 m/s，服务速度0.6 m/s）、WR2（技能为运送，空载速度1.8 m/s，服务速度0.5 m/s）. 在该情况中模拟1个任务收集时间窗口内同时出现2个同类型任务的情况，设时间窗口为60 s，此时多执行智能体系统在点A位置，各智能体的本地任务执行序列为空. 任务的具体信息如下：任务T1，位置为（35，5），任务类型为吃饭，任务优先级为1，被服务对象性格急躁系数为1.1，最大忍受等待时间为70 s；任务T2，位置为（35，15），任务类型为吃饭，优先级为1，老人急躁系数为1.2，最大忍受等待时间为75 s. 服务任务的子任务信息如表1所示.

表 1 服务任务T1和T2的子任务信息

Tab.1 Subtask information of task T1 and T2

子任务标号	所需技能	${t}_{\rm{e}}$/s	${v}$/(m·s⁻¹)
T1_1	拉/放	18	—
T1_2	运送	—	0.6
T1_3	拉/放	15	—
T2_1	拉/放	20	—
T2_2	运送	—	0.7
T2_3	拉/放	17	—

如表2所示为各智能体对子任务的投标值. 表中，不带括号的投标值为当 $ {L}_{1}=1、{L}_{2}=0 $时由式（9）计算得出的结果，带括号的投标值为 $ \mathrm{当}{L}_{1}=1\mathrm{、} {L}_{2}=10 $时由式（9）计算得出的结果. 可以看出，在完成某个子任务投标后，执行智能体能协商出对该子任务投标值最大的智能体，得出使任务T1、T2中所有子任务获得最大投标值的方案. 任务分配结果如下：AR1本地任务执行序列为T1_3(T1_3,T1_1,T2_3); AR2本地任务执行序列为T1_1, T2_1, T2_3(T2_1); WR1本地任务执行序列为T2_2(T2_2)；WR2本地任务执行序列为 T1_2(T1_2). T1_1、T1_2、T1_3、T2_1、T2_2、T2_3的满意度分别为0.112 0(0.060 0)，0.056 0(0.083 0)，0.0006(0.0008)，0.018 0(0.097 0)，0.010 0(0.0008)，0.0006(0.0004)，总体满意度为0.199 0(0.242 0).

表 2 执行智能体对各子任务的投标值

Tab.2 Bidding value of executing agent for each subtask

子任务标号	$ {b}_{i,j} $
子任务标号	AR1	AR2	WR1	WR2
T1_1	0.087 0 (7.074×10⁻⁵)	0.112 0 (0.073)	0(0)	0(0)
T1_2	0(0)	0(0)	0.054 (3.002×10⁻⁵)	0.056 0 (0.602)
T1_3	0.0006 (6.833×10⁻⁵)	0.0005 (−1.261)	0(0)	0(0)
T2_1	0.0001 (8.187×10⁻⁵)	0.018 0 (0.012)	0(0)	0(0)
T2_2	0(0)	0(0)	0.010 (3.680×10⁻⁵)	0.0004 (3.679×10⁻⁵)
T2_3	0.0002 (7.947×10⁻⁴)	0.0006 (−1.214)	0(0)	0(0)

为了进一步证明多异构服务机器人协作机制可以提高被服务对象的满意度，分别采用先到先得及随机分配机制，进行养老服务任务的分配并计算完成各子任务时被服务对象的满意度. 先到先得机制的任务分配结果：AR1的本地任务执行序列为（T1_1, T2_1），AR2的本地任务执行序列为（T1_3, T2_3），WR1的本地任务执行序列为（T1_2），WR2的本地任务执行序列为（T2_2）. 按该方案执行任务时，T1_1、T1_2、T1_3、T2_1、T2_2、T2_3的满意度分别为0.087、0.014、4.421×10⁻⁵、8.837×10⁻⁶、1.701×10⁻⁶、8.204×10⁻⁹ ，总体满意度为0.101. 随机机制的任务分配结果：AR1的本地任务序列为（T2_1, T1_3），AR2的本地任务序列为（T1_1, T2_3），WR1的本地任务序列为（T2_2），WR2的本地任务序列为（T1_2），按该方案执行任务时，T1_1、T1_2、T1_3、T2_1、T2_2、T2_3的满意度分别为9.243×10⁻⁶、1.877×10⁻⁶、2.678×10⁻⁹、0.106、0.006，0.001×10⁻¹.

各种分配机制下各子任务的满意度对比图如图6所示. 图中，机制1）表示 $ {L}_{1}=1、{L}_{2}=0 $时的多协作机制，机制2）表示 $ {L}_{1}=1、{L}_{2}=10 $时的多协作机制，机制3）表示先到先得机制，机制4）表示随机分配机制. 可以看出，采用机制3）分配任务时，后发布的任务等待时间过长，导致后发布任务的各子任务满意度始终较低，本研究所提多异构服务机器人协作机制可以显著提高被服务老人的满意度. 采用机制4）分配任务时，只有子任务T2_1的满意度高于本研究所提机制进行分配时的满意度. 机制4）各子任务满意度之和为0.113，使用本研究所提机制时各子任务的满意度之和为0.199，表明应用本研究所提机制可以使各子任务的满意度之和较大.

图 6

图 6 多种分配机制的子任务满意度对比折线图

Fig.6 Comparison of subtask satisfaction with multiple allocation mechanisms

提出任务需求的2个被服务对象满意度对比图如图7所示. 可以看出，不采用本研究所提机制进行分配时，会出现总体满意度和个体满意度很小的情况. 使用本研究所提机制时，机制1）偏重总体满意度，机制2）偏重提升个体满意度的最小值. 因此，可以根据使用者偏好，调整投标值函数中的 $ {L}_{1} $、 $ {L}_{2} $，实现兼顾使用者偏好和整体个体满意度的任务分配机制.

图 7

图 7 被服务对象满意度对比条状图

Fig.7 Comparison of satisfaction for served

3.2.2. 不同时间窗口内出现任务

假设在前个任务收集时间窗口完成的下个时间窗口内出现新任务T3，将T3定义为摔倒救援任务，任务优先级为最高，T3的具体信息如下：任务位置为（5，25），任务优先级为4，被服务对象的性格急躁系数为1.2，最大可忍受等待时间为50 s. T3所包含的子任务为T3_1（所需技能为拉/放，最佳服务时间为16 s），T3_2（所需技能为运送，最佳服务速度为0.5 m/s），T3_3（所需技能为拉/放，最佳服务时间为15 s）. T3出现时，多智能体系统完成上个时间窗口的任务T1、T2的分配，各智能体状态已经改变，基于新的状态，各智能体对T3中子任务的投标结果如表3所示. 分配结果：AR1的任务执行序列（T1_3），AR2的任务执行序列（T3_1, T2_3, T3_3），WR1的任务执行序列（T2_2），WR2的任务执行序列为（T3_2）. 可以看出，当T3出现时，上个时间窗口任务的子任务T1_1已完成，T1_2、T2_1正在执行，因此更新智能体本地序列。根据执行智能体状态可知，此时AR1、WR1为锁定状态，无法投标新任务，因此其投标值为0. 同时高优先级任务的子任务总是处于任务序列靠前的位置.

表 3 执行智能体对T3中子任务的投标值

Tab.3 Bidding value of executing agent for T3 sub task

子任务标号	$ {b}_{i,j} $
子任务标号	AR1	AR2	WR1	WR2
T3_1	0	6.523×10⁻³	0	0
T3_2	0	0	0	8.566×10⁻⁴
T3_3	0	6.983×10⁻⁴	0	0

3.2.3. 死锁

通过模拟实验验证同个时间窗口出现大规模（相对于智能体数量）需求时，本研究所提机制的有效性. 在某时间窗口内出现任务T1、T2的基础上，将该时间窗口内出现的任务数增加到4个，即T1、T2、T4、T5. T4的具体信息如下：位置为（35，25），任务类型为吃饭，优先级为1，被服务对象的性格急躁系数为1.1，最大忍受等待时间为70 s. T5的具体信息如下：任务位置为（35，35），任务类型为吃饭，优先级为1，被服务对象的性格急躁系数为1.0，最大忍受等待时间为75 s. 子任务信息如表4所示. 此时子任务总数为12个，仅有4个执行智能体，每个智能体的子任务数量较多.

表 4 服务任务T4和T5的子任务信息

Tab.4 Subtask information of task T4 and T5

子任务标号	所需技能	${t}_{\rm{e}}$/s	${v}$/(m·s⁻¹)
T4_1	拉/放	19	—
T4_2	运送	—	0.5
T4_3	拉/放	18	—
T5_1	拉/放	16	—
T5_2	运送	—	0.7
T5_3	拉/放	15	—

DOI:10.14132/j.2095-7963.2019.03.005 [本文引用: 1]

当基于未添加死锁处理及预防机制的多机协作机制进行任务分配时，分配结果如下：AR1的本地任务执行序列为T1_3, T2_1, T4_1, T4_3, T5_1；AR2的本地任务执行序列为T2_3, T1_1, T5_3；WR1的本地任务执行序列为T1_2, T2_2；WR2的本地任务执行序列为T4_2, T5_2. 当同个时间窗口出现4个任务时，AR1 本地序列的第1个子任务及 AR2 本地任务序列中第1个子任务均有2个前件子任务，它们的首个前件子任务又不在对方本地序列的第1位，这使 AR1 、AR2 陷入无限等待，因此该方案无法运行. 死锁处理后任务分配结果如下：AR1的本地任务执行序列为T1_3, T2_1, T4_1, T4_3, T5_1；AR2的本地任务执行序列为T1_1, T2_3, T5_3；WR1的本地任务执行序列为T1_2, T2_2；WR2的本地任务执行序列为T4_2, T5_2. 即经过处理后，AR2先执行子任务T1_1（AR1中第1个任务的前件子任务），便不会出现死锁. 可以看出，在为本研究所提机制增加互锁的处理及预防功能后，得出了可以正常执行的无锁任务分配方案.

4. 结　语

本研究基于多智能体系统，针对养老情景下的异构多服务机器人任务分配问题，提出动态任务分配机制. 以被服务对象的满意度函数为基础，建立投标值计算模型，在完成养老情境下被服务对象提出的需求的同时，提高了被服务对象的满意度. 解决了多智能体系统在进行动态任务分配过程中出现的执行智能体自身和各执行智能体间的死锁问题. 由仿真结果可以看出，所提机制可以基于任务的不同类型及被服务对象的个体差异进行动态任务分配，有效提高了被服务对象的总体满意度. 由于被服务对象满意度是根据常识建立的数学模型，其真实性还有待研究。后续计划采集真实数据，建立更符合实际的被服务对象满意度模型.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

郭冉, 王俊

世界人口发展趋势和人口转变——理论与现实

[J]. 人口与社会, 2019, 35 (3): 52- 63

GUO Ran, WANG Jun

World population trends and demographic transition: theory and reality

[J]. Population and Society, 2019, 35 (3): 52- 63

DOI:10.14132/j.2095-7963.2019.03.005 [本文引用: 1]

[2]

雷莹

我国人口老龄化发展趋势问题及对策研究

[J]. 农村经济与科技, 2019, 30 (16): 207- 208

DOI:10.3969/j.issn.1007-7103.2019.16.124 [本文引用: 1]

LEI Ying

Research on the development trend, problems and countermeasures of population aging in China

[J]. Rural Economy and Science, 2019, 30 (16): 207- 208

DOI:10.3969/j.issn.1007-7103.2019.16.124 [本文引用: 1]

[3]

郑健, 陈建, 朱琨

基于多智能体强化学习的无人集群协同设计

[J]. 指挥信息系统与技术, 2020, 11 (6): 26- 31

DOI:10.15908/j.cnki.cist.2020.06.005 [本文引用: 1]

ZHENG Jian, CHEN Jian, ZHU Kun

Unmanned swarm cooperative design based on multi-agent reinforcement learning

[J]. Command Information System and Technology, 2020, 11 (6): 26- 31

DOI:10.15908/j.cnki.cist.2020.06.005 [本文引用: 1]

[4]

张思锋, 张泽滈

中国养老服务机器人的市场需求与产业发展

[J]. 西安交通大学学报:社会科学版, 2017, 37 (5): 49- 58

ZHANG Si-feng, ZHANG Ze-hao

Market demand, industrial base and development of aged service robot

[J]. Journal of Xi'an Jiaotong University: Social Sciences, 2017, 37 (5): 49- 58

[5]

洪奕光, 翟超

多智能体系统动态协调与分布式控制设计

[J]. 控制理论与应用, 2011, 28 (10): 1506- 1512

HONG Yi-guang, ZHAI Chao

Dynamic coordination and distributed control design of multi-agent systems

[J]. Control Theory and Applications, 2011, 28 (10): 1506- 1512

[6]

DAS G P, MCGINNITY T M, COLEMAN S A, et al

A distributed task allocation algorithm for a multi-robot system in healthcare facilities

[J]. Journal of Intelligent and Robotic Systems, 2015, 80: 33- 58

DOI:10.1007/s10846-014-0154-2 [本文引用: 2]

[7]

HUNT S, MENG Q, HINDE C, et al. Consensus-based grouping algorithm for multi-agent cooperative task allocation with complex requirements [J] Cognitive Computation, 2014, 6(3): 338–350.

[8]

LEE D H

Resource-based task allocation for multi-robot systems

[J]. Robotics and Autonomous Systems, 2018, 103: 151- 161

DOI:10.1016/j.robot.2018.02.016 [本文引用: 2]

[9]

TERESHCHUK V, STEWART J, BYKOV N, et al

An efficient scheduling algorithm for multi-robot task allocation in assembling aircraft structures

[J]. IEEE Robotics and Automation Letters, 2019, 4 (4): 3844- 3851

DOI:10.1109/LRA.2019.2929983 [本文引用: 2]

[10]

李勇, 李坤成, 孙柏青, 等

智能体Petri网融合的多机器人-多任务协调框架

[J]. 自动化学报, 2021, 47 (8): 2029- 2049

DOI:10.16383/j.aas.c190400 [本文引用: 4]

LI Yong, LI Kun-cheng, SUN Bai-qing, et al

Multi-robot-multi-task coordination framework based on the integration of intelligent agent and Petri net

[J]. Acta Automatica Sinica, 2021, 47 (8): 2029- 2049

DOI:10.16383/j.aas.c190400 [本文引用: 4]

[11]

KARAMAN S, RASMUSSEN S, KINGSTON D, et al. Specification and planning of UAV missions: a process algebra approach [C]// 2009 American Control Conference. St. Louis: IEEE, 2009: 1442–1447.