一种基于场景人物数量的任务卸载方案：针对云边协同智能监控系统

doi:10.3785/j.issn.1006-754X.2024.03.407

一种基于场景人物数量的任务卸载方案：针对云边协同智能监控系统

庞笛^,, 魏喆^,^,, 陈墨, 张凯

沈阳工业大学机械工程学院，辽宁沈阳 110020

A task offloading scheme based on number of scene characters: for cloud edge collaborative intelligent monitoring system

PANG Di^,, WEI Zhe^,^,, CHEN Mo, ZHANG Kai

School of Mechanical Engineering, Shenyang University of Technology, Shenyang 110020, China

通讯作者: 魏喆（1982—），男，教授，博士，从事智能制造、数字设计等研究，E-mail: weizhe@sut.edu.cn，https://orcid.org/0000-0002-6059-7326

收稿日期: 2023-12-06 修回日期: 2024-01-04

基金资助:

国家自然科学基金面上项目.  51975386
辽宁省“揭榜挂帅”科技项目.  2022020630-JH1/108
中国国家铁路集团有限公司科技研究开发计划资助项目.  N2022J014

Received: 2023-12-06 Revised: 2024-01-04

作者简介 About authors

庞笛（1997—），男，硕士生，从事智能制造、边缘计算研究，E-mail:13624766332@163.com , E-mail：13624766332@163.com

摘要

在云边协同智能监控系统的边缘计算设备上部署行为识别算法时，由于缺乏合理的任务卸载方案，使得系统的计算资源分配不均，从而导致系统运行功耗不稳定，并影响识别的速度及准确率。为解决上述问题，设计了一种基于场景人物数量的任务卸载方案，以优化云边协同智能监控系统的运行稳定性和识别效果。首先，对智能监控系统的运行参数进行了采集，确定了其功耗曲线和识别性能。然后，设计了轻量型人物数量识别模块，并通过程序编写实现了基于场景人物数量的监控任务分类。接着，测试了不同视频采样率对智能监控系统功耗和识别性能的影响，并确定了最佳采样率分配方案。最后，在复兴号动车组生产线的智能监控系统上对所提出的任务卸载方案进行了测试。结果显示，相较于现有的并行式任务卸载方案，基于场景人物数量的任务卸载方案使该生产线智能监控系统的平均识别准确率提高了0.53%，平均延迟缩短了1.56%，平均功耗降低了14.47%，有效地提高了系统的运行稳定性。研究结果对云边协同智能监控系统运行稳定性和识别效果的优化具有重要意义，可为其性能提升提供理论依据和工程支持。

关键词： 边缘计算 ; 智能监控系统 ; 任务卸载 ; 云边协同

Abstract

When the behavior recognition algorithm is deployed on the edge computing device of the cloud edge collaborative intelligent monitoring system, due to the lack of a reasonable task offloading scheme, the computing resources of the system are distributed unevenly, which leads to unstable system operation power consumption and affects the speed and accuracy of recognition. To solve the above problems, a task offloading scheme based on the number of scene characters has been designed to optimize the operational stability and recognition effect of the cloud edge collaborative intelligent monitoring system. Firstly, the operating parameters of the intelligent monitoring system were collected, and its power consumption curve and recognition performance were determined. Next, a lightweight character number recognition module was designed, and the classification of monitoring tasks based on the number of scene characters was realized by programming. Then, the influence of different video sampling rates on the power consumption and recognition performance of the intelligent monitoring system was tested, and the optimal sampling rate allocation scheme was determined. Finally, the proposed task offloading scheme was tested on the intelligent monitoring system for the production line of Fuxing electric multiple units. The results showed that compared with the existing parallel task offloading scheme, the task offloading scheme based on the number of scene characters improved the average recognition accuracy of the intelligent monitoring system of the production line by 0.53%, reduced average delay by 1.56%, and reduced average power consumption by 14.47%, which effectively improved the operational stability of the system. The research results are of great significance for optimizing the operational stability and recognition effect of the cloud edge collaborative intelligent monitoring system, and can provide theoretical basis and engineering support for its performance improvement.

Keywords： edge computing ; intelligent monitoring system ; task offloading ; cloud edge collaboration

PDF (5162KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

庞笛, 魏喆, 陈墨, 张凯. 一种基于场景人物数量的任务卸载方案：针对云边协同智能监控系统[J]. 工程设计学报, 2024, 31(6): 689-696 doi:10.3785/j.issn.1006-754X.2024.03.407

PANG Di, WEI Zhe, CHEN Mo, ZHANG Kai. A task offloading scheme based on number of scene characters: for cloud edge collaborative intelligent monitoring system[J]. Chinese Journal of Engineering Design, 2024, 31(6): 689-696 doi:10.3785/j.issn.1006-754X.2024.03.407

智能监控系统作为工厂智能化的重要组成部分，能够自主监测、分析工作场景中的人机交互，在助力安全生产的同时减少了监控人员的工作量。将边缘计算引入智能监控系统^[1]，可以解决数据传输过程中的延迟和丢失问题^[2]。然而，在实际部署过程中，出现了系统识别速度慢、准确率低以及系统功耗高等问题^[3-4]。为解决这些问题，专家学者们主要从算法模型优化、云边协同结构优化和卸载方案优化三个方面开展了研究。

在算法模型优化方面，Li等人^[5]提出了引入提前退出机制的DNN（deep neural network，深度神经网络）模型，缩短了计算时间。Nikouei等人^[6]提出了一种L-CNN（lightweight convolutional neural network，轻量级卷积神经网络）模型，以较小的计算量实现了较高的识别准确率和识别速度。Yao等人^[7]提出了一种名为DeepIoT（deep internet of things，深度物联网）的剪枝方法，该方法通过查找最少数量的非冗余隐藏元素，将深度学习网络结构压缩为较小的密集矩阵。李华等人^[8]通过在空间图卷积模块中引入注意力机制，以更好地提取人体各个关节之间的关系，实现了基于关节识别的行为识别神经网络模型的轻量化。辛莉等人^[9]通过更改后处理的方式，在保证复杂场景下车牌识别网络识别速度的前提下提高了识别准确率。Li等人^[10]提出了一种基于Token的人体姿态估计方法，通过Transformer的多头自注意力机制来学习不同关键点之间的关联性，极大地减少了模型的参数量和计算量。在云边协同结构优化方面，Li等人^[11]针对DNN在边缘计算领域的应用进行了研究，提出了在保证服务质量前提下的最大任务并行数。Liu等人^[12]提出了一种采用基于边缘计算的服务计算范式的食品识别系统，并通过添加预处理步骤降低了系统功耗并加快了系统响应速度。Jiang等人^[13]提出了一种新型视频分析系统，利用网络迁徙方法实现了计算共享，改善了视频分析效果。在卸载方案优化方面，Teerapittayanon等人^[14]提出了一种分布式DNN，通过将计算任务分布到云端和边缘服务器上，降低了通信成本。Mao等人^[15]提出了一种Mo-DNN（mobile distributed DNN，分布式移动深度神经网络），以自适应负载的方式将计算任务卸载至分布式边缘设备上，提高了DNN的性能。Zhao等人^[16]提出了DeepThings框架，通过卷积层融合分区减少了内存占用，提高了计算速度。Ding等人^[17]提出了一种云边缘协作框架，该框架在边缘服务器上部署了一个浅层模型，并在云端服务器上部署了一个深度模型，使得认知服务的平均响应时间缩短了55.08%，准确率提高了26.70%。Chakraborty等人^[18]在道路监控系统中使用K-最近邻算法来形成警报消息的分布集群，使得该系统的延迟缩短了12%~44%，功耗降低了50%。Hsu等人^[19]提出了一种基于机会成本的任务卸载算法来优化资源分配，该算法的阻塞概率降低了59.3%，功耗节省了58.7%，服务质量提高了47.6%。

综上可知，在云边协同智能监控领域，任务卸载方案优化^[20]的改进效果显著超越了算法模型优化和云边协同结构优化。但是，对于任务卸载方案优化，仍存在一些尚未解决的问题：1）现有的任务卸载方案主要基于系统的实时负载设计，即根据计算负荷来分配计算任务，存在延后性，无法满足实时性要求；2）现有的任务卸载方案主要针对DNN结构进行优化，优化指标通常为识别准确率和识别速度，并未考虑卸载方案对系统功耗的影响。

针对上述问题，本文提出了一种基于场景人物数量的任务卸载方案。该任务卸载方案通过引入预处理步骤，对工作场景中的人物数量进行识别，并采用可变采样率的方式分配边缘计算设备的算力。最后，在复兴号动车组生产线的智能监控系统上对所提出的任务卸载方案进行测试，以验证其在优化系统运行稳定性和识别效果上的有效性。

1 云边协同智能监控系统介绍

本文主要针对面向离散生产场景所构建的云边协同智能监控系统。该系统利用云边协同实现边缘侧设备、人员、工艺流程的识别，其结构如图1所示。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 云边协同智能监控系统

Fig.1 Cloud edge collaborative intelligent monitoring system

云边协同智能监控系统利用监控摄像头采集视频数据，并通过网关将视频数据传输至边缘计算设备以进行下一步处理。边缘计算设备内置基于LRCN（long-term recurrent convolutional network，长期循环卷积网络）的行为识别算法，可有效提取工作场景中人员的行为特征并进行分类。分类结果和视频数据均被上传至云端服务器，以便进行存储和传递至SCADA（supervisory control and data acquisition，监控与数据采集）平台，供管理者实时查看。在该系统中，边缘计算设备主要负责视频数据的特征提取与分类，而云端服务器主要负责行为识别算法的更新与训练。

Wang等人^[21]提出，最能体现智能监控系统识别效果和运行稳定性的3个参数分别为识别准确率（recognition accuracy）、延迟（latency）和功耗（power consumption），其定义具体如下。

1）识别准确率是指分类正确的样本数与总样本数的比值，用于评估算法或模型的性能^[23]。在一些对安全性要求较高的应用场景中，如自动驾驶系统和道路导航系统，对识别准确率的要求很高。但在智能监控领域，由于可以进行多帧采集和重复判断，故对识别准确率的要求并不严格。此外，过高的识别准确率需要更深层次的DNN，这会增加边缘计算设备的运算压力。因此，在智能监控领域，一般不将识别准确率作为唯一的评价指标。识别准确率A的计算式如下：

A = {\frac{\sum_{i = 1}^{s} T_{P i}}{\sum_{i = 1}^{s} (T_{P i} + F_{N i})}}_{}

式中： $i$ 表示第 $i$ 类行为， $s$ 表示行为类别总数， $T_{P i}$ 、 $F_{N i}$ 分别表示第 $i$ 类行为正确分类和错误分类的数量。

2）延迟是指输入用户请求至得到预测结果的时间间隔，包括预处理、算法运行和后处理所花费的时间^[22]。边缘计算可将计算资源和存储能力尽可能地靠近数据源和终端设备，以减少数据传输时间和网络延迟，这样可实现快速响应，更适用于对实时性要求较高的应用场景。

3）功耗是指设备或系统在执行任务时单位时间内消耗的电能。通常情况下，由于边缘计算设备的整体功率和性能有限，但在运行复杂模型时可能会引入大量的计算和通信开销，这可能会导致性能优秀而运算复杂的模型在边缘计算设备上的运行效果不理想。因此，功耗也是智能监控领域较为关注的评价指标。

2 云边协同智能监控系统运行参数采集

为了评估目前所采用的并行式任务卸载方案的效果，对现有云边协同智能监控系统的识别准确率、延迟和功耗数据进行采集。

2.1　识别准确率提取

为了获取现有云边协同智能监控系统的识别准确率以及便于后续比较，本文使用一个针对复兴号动车组生产线的危险行为数据集对系统进行了测试。该数据集包含21个与生产流程安全相关的行为类型，如跌倒、触电、是否佩戴安全帽等，如图2所示。在复兴号动车组生产车间，采集实际生产监控视频作为数据来源。为了增加数据集的多样性，本文通过互联网获取了监控视频中未出现的起火、触电等事故的视频数据，以更好地评估基于LRCN的行为识别算法的识别准确率。所采集的数据集共包含2 100个视频数据，其中1 260个视频用作训练集，420个视频用作测试集，另外420个视频用作交叉验证集。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 生产场景人员行为数据集

Fig.2 Production scenario personnel behavior dataset

首先，针对现有的LRCN，在云端服务器上利用生产场景人员行为数据集进行训练。随后，从测试集中提取并制作包含21种危险行为的7 h长视频以及1 h的正常行为视频，并将这2段视频整合成一段长视频。将这段长视频通过视频网关的接口1传入LRCN进行测试。同时，为了模拟实际应用场景中多个监控摄像头共用同一网关和边缘计算设备的情况，将上述长视频传入视频网关的接口2。此外，由于实际工作场景中存在长时间无人的停产状态，制作了一段8 h的无人视频，并将其传入视频网关的接口3，以模拟停产状态。基于同时传入的3段长视频开展识别准确率测试，将智能监控系统的识别结果与真实的行为标签进行对比，并利用式(1)计算识别准确率，结果如图3所示。由图3可知，该智能监控系统的平均识别准确率为94.32%。

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 智能监控系统的识别准确率

Fig.3 Identification accuracy of intelligent monitoring system

2.2　延迟提取

在计算机视觉领域，帧率和处理时间常常用作评估算法或模型在处理视频时的性能指标。其中，帧率表示算法或模型在单位时间内能够处理的图像或视频帧数，单位为帧/s；处理时间表示算法或模型处理每一帧图像或视频所花费的时间，单位为ms。通常情况下，较高的帧率和较短的处理时间说明算法或模型的处理速度更快，即性能更好。智能监控系统的延迟通常定义为从工作场景中出现人物开始到系统对人物行为进行识别并得到识别结果所需的时间。这一时间不仅包括算法或模型的处理时间，还包括数据传输和预处理所需的时间。鉴于帧率只能评估算法或模型的性能，而处理时间可以评估整个智能监控系统的延迟，本文使用Python编程语言中的Time模块来提取处理时间。该模块可以记录监控视频从传入网关开始到获得识别结果的时间。为了方便计算和提取处理时间，从生产场景人员行为数据集中重新提取了21段不同行为类型的视频以及1段正常行为视频以进行测试。每段视频的时长控制在5 s内，记录智能监控系统识别各个行为类型的延迟，结果如图4所示。由图4可知，该智能监控系统的平均延迟为106.17 ms。

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 智能监控系统的延迟

Fig.4 Delay of intelligent monitoring system

2.3　功耗提取

由于实际应用场景中监控摄像头和视频网关的数量可变，本文所提取的功耗仅包含智能监控系统的计算功耗，并不包含摄像头和网关等设备的功耗。为了提取功耗数据，在边缘计算设备上安装AID64软件，通过测量边缘计算设备待机功耗和工作功耗之间的差值，来获取实际的预处理、识别算法运行以及后处理的功耗。由于AID64软件所提供的是边缘计算设备的实时功耗数据，故须将其转换为平均功耗，计算式如下：

P = \sum_{j = 1}^{n} \frac{P_{w j} - P_{s j}}{n}

(2)

式中： $P_{w j}$ 为设备的瞬时功耗， $P_{s j}$ 为设备的待机功耗，n为采集点数量。

按上述方式对智能监控系统各边缘计算设备的功耗数据进行采集，结果如图5所示。图中：CPU1和GPU1表示该系统在工作状态下的CPU（central processing unit，中央处理器）功耗和GPU（graphics processing unit，图形处理器）功耗，CPU2和GPU2表示该系统在待机状态下的CPU功耗和GPU功耗。对智能监控系统的总功耗进行统计，结果如图6所示。

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 智能监控系统的CPU、GPU功耗

Fig.5 Power consumption of CPU and GPU of intelligent monitoring system

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 智能监控系统的总功耗

Fig.6 Total power consumption of intelligent monitoring system

由图6可知，该智能监控系统的平均待机功耗为31.88 W，平均实际功耗为116.06 W，实际功耗的方差为145.32 W²，说明该系统的功耗曲线存在较大波动。这是因为智能监控系统在将多线路的监控任务卸载至边缘计算设备时采用了并行策略，并没有考虑场景变换所造成的计算压力的变化，导致计算资源未被充分利用。

3 基于场景人物数量的任务卸载方案

为了解决因任务并行处理而导致的系统功耗波动异常问题，提出了一种基于场景人物数量的任务卸载方案。该方案分为两部分：任务分类策略和任务处理策略。

3.1　任务分类策略

根据复兴号动车组生产线的实际生产场景，对智能监控任务进行分类，包括停产状态、正常状态和特殊状态。为了实现上述任务分类，在云边协同智能监控系统的预处理部分引入了一个场景人物数量识别模块，该模块具有一个轻量化DNN模型，用于准确识别不同工作场景中的人物数量，识别效果如图7所示。

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 场景人物数量识别模块

Fig.7 Scene character number identification module

在完成场景人物数量识别后，通过程序编写来实现基于场景人物数量的监控任务分类，以便后续处理。监控任务的分类策略如表1所示。在后续的任务卸载方案中，将针对停产状态、正常状态和特殊状态这3种任务类型采取不同的处理策略。

表1 监控任务分类策略

Table 1 Classification strategy for monitoring tasks

任务类型	人数/人
停产状态	0
正常状态	1~5
特殊状态	>5

新窗口打开| 下载CSV

3.2　任务处理策略

为了更好地说明任务处理策略，对智能监控系统中基于LRCN的行为识别算法进行详细介绍，其流程如图8所示。首先，将视频流分解为关键帧并将关键帧传入CNN，以进行空间特征提取。然后，将提取的空间特征传入LSTM（long short-term memory，长短时记忆）神经网络，以进行时间特征提取，并通过全连接层进行分类。根据He等人^[24]的研究，卷积层和预处理占用了大部分的计算资源。由于卷积层的结构只能在DNN的设计阶段进行调整，因此本文拟通过优化视频帧分解阶段来合理分配计算资源。

图8

新窗口打开| 下载原图ZIP| 生成PPT

图8 基于LRCN的行为识别算法流程

Fig.8 Flow of behavior recognition algorithm based on LRCN

目前，我国监控设备视频流的帧率通常为25帧/s。因此，上述智能监控系统在处理视频流时，会进行在1 s内提取25帧关键帧的采样过程，即采样率为25 Hz，并将多个识别任务同时传入边缘计算设备。通常情况下，提高采样率可以增加数据的丰富性和细节，有助于提高系统的识别准确率^[25]。但在实际应用中，具体的采样率应根据实际任务类型进行调整，以实现在计算资源有限的情况下获得较好的识别效果。

3.3　最佳采样率的确定

基于第2节中的生产场景人员行为数据集，通过更改采样率的方式对智能监控系统的识别准确率、延迟和功耗进行测试，以确定最佳的采样率。不同采样率下系统的识别准确率、延迟分别如图9和图10所示。由于不同采样率下智能监控系统的功耗曲线并不直观，故整理为表格形式，同时对不同采样率下系统的识别准确率和延迟取平均值，结果如表2所示。

图9

新窗口打开| 下载原图ZIP| 生成PPT

图9 不同采样率下智能监控系统的识别准确率

Fig.9 Recognition accuracy of intelligent monitoring system with different sampling rates

图10

新窗口打开| 下载原图ZIP| 生成PPT

图10 不同采样率下智能监控系统的延迟

Fig.10 Delay of intelligent monitoring system with different sampling rates

表2 不同采样率下智能监控系统的运行参数

Table 2 Operating parameters of intelligent monitoring system with different sampling rates

采样率/Hz	平均识别准确率/%	平均延迟/ ms	平均功耗/ W
1	87.45	99.43	112.71
5	89.50	99.51	112.93
10	92.21	99.58	113.59
15	93.60	101.80	115.76
20	94.21	102.03	116.57
25	94.32	106.17	130.09

新窗口打开| 下载CSV

由表2可知，随着采样率的增大，智能监控系统的平均识别准确率、平均延迟及平均功耗均有所升高。以智能监控系统的平均功耗为首要指标，同时满足识别准确率大于90%的要求，最终选择以10，15，20 Hz作为任务处理策略的最佳采样率。

4 实例验证

本文依托复兴号动车组生产线的云边协同智能监控系统，对基于场景人物数量的任务卸载方案进行测试，并与并行式任务卸载方案进行对比，以验证所提出的任务卸载方案的有效性。为了与采用并行式任务卸载方案的智能监控系统进行对比，利用上文相同的测试方法对任务卸载方案改进后的智能监控系统进行测试，结果如图11至图13所示。

图11

新窗口打开| 下载原图ZIP| 生成PPT

图11 智能监控系统的识别准确率对比

Fig.11 Comparison of identification accuracy of intelligent monitoring system

图12

新窗口打开| 下载原图ZIP| 生成PPT

图12 智能监控系统的延迟对比

Fig.12 Comparison of delay of intelligent monitoring system

图13

新窗口打开| 下载原图ZIP| 生成PPT

图13 智能监控系统的功耗对比

Fig.13 Comparison of power consumption of intelligent monitoring system

根据图11至图13，计算得到任务卸载方案改进后智能监控系统的平均识别准确率、平均延迟和平均功耗，结果如表3所示。由表3可知，采用基于场景人物数量的任务卸载方案的智能监控系统的平均识别准确率为94.82%，平均延迟为104.51 ms，平均功耗为99.7 W，功耗方差为0.434 5 W²，说明改进后智能监控系统的功耗曲线波动较小，表明本文所提出的任务卸载方案能够高效利用边缘计算设备的计算资源。

表3 智能监控系统的运行参数对比

Table 3 Comparison of operating parameters of intelligent monitoring system

智能监控系统	平均识别准确率/%	平均延迟/ms	平均功耗/W	功耗方差/W²
采用并行式任务卸载方案	94.32	106.17	116.57	145.32
采用本文任务卸载方案	94.82	104.51	99.70	0.434 5

新窗口打开| 下载CSV

测试结果表明，在同一生产线中，相较于采用并行式任务卸载方案的智能监控系统，采用基于场景人物数量的任务卸载方案的智能监控系统具有更为优异的性能，后者的平均识别准确率提高了0.53%，平均延迟缩短了1.56%，平均功耗降低了14.47%。结果表明，基于场景人物数量的任务卸载方案在云边协同智能监控系统中具有更好的适应性。

5 结论

1）本文对复兴号动车组生产线的云边协同智能监控系统的识别准确率、延迟和功耗进行了测试。结果表明，不考虑场景变化对计算压力的影响，直接采用并行式任务卸载方案会导致边缘计算设备的计算资源无法得到充分利用，进而导致系统的运行稳定性和识别效果不佳。

2）本文提出了一种基于场景人物数量的任务卸载方案，通过轻量化DNN来实现工作场景中人物数量的识别并通过程序编写实现了基于场景人物数量的监控任务分类，同时通过对不同类型任务分配不同采样率的方式实现了计算资源的合理分配。

3）在现有复兴号动车组生产线的云边协同智能监控系统上对基于场景人物数量的任务卸载方案进行了测试。结果表明，添加基于场景人物数量的任务卸载方案后，智能监控系统的平均识别准确率提高了0.53%，平均延迟缩短了1.56%，平均功耗降低了14.47%，说明本文所提出的任务卸载方案在云边协同智能监控系统中具有较好的适应性。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

阴艳超，梁珉清，张万达，等.

基于云边协同的智能数控车间自调控系统研究与实现

［J/OL］. 计算机集成制造系统： 1-18 （2023-04-10）［2023-10-22］. .

URL [本文引用: 1]

YIN

Y C

， LIANG

M Q

， ZHANG

W D

， et al.

Research and implementation of intelligent NC workshop self-regulation system based on cloud-edge collaboration

［J/OL］. Computer Integrated Manufacturing Systems： 1-18 （2023-04-10）［2023-10-22］. .

URL [本文引用: 1]

[2]

KIM

， PARK

， JEONG

， et al.

Intelligent monitoring system with privacy preservation based on edge AI

［J］. Micromachines， 2023， 14（9）： 1749.