浙江大学学报(工学版), 2024, 58(5): 967-978 doi: 10.3785/j.issn.1008-973X.2024.05.010

计算机技术、通信技术

能量收集下的D2D-MEC计算卸载

曾耀平,, 刘月强, 关赛莘, 江伟伟, 夏玉婷

西安邮电大学 通信与信息工程学院,陕西 西安 710121

Computational offloading in D2D-MEC with energy harvesting

ZENG Yaoping,, LIU Yueqiang, GUAN Saishen, JIANG Weiwei, XIA Yuting

School of Communications and Information Engineering, Xi'an University of Posts and Telecommunications, Xi'an 710121, China

收稿日期: 2023-04-27  

基金资助: 陕西省重点研究开发项目(2024NC-YBXM-206).

Received: 2023-04-27  

Fund supported: 陕西省重点研究开发项目(2024NC-YBXM-206).

作者简介 About authors

曾耀平(1975—),男,副教授,博士,从事移动边缘计算的研究.orcid.org/0000-0003-2326-2372.E-mail:zengyp03@163.com , E-mail:zengyp03@163.com

摘要

针对移动边缘计算(MEC) 在能源消耗和安全性方面的问题,研究具有社会关系和能量收集(EH)的D2D-MEC物联网网络中的任务卸载和资源分配问题,提出基于李雅普诺夫优化的D2D在线决策匹配和资源分配(ODMRA)算法. 将用户之间的社会关系量化为社会信任矩阵,将能源消耗、包丢失、社会信任度表述为长期随机优化问题,采用李雅普诺夫优化方法将其分解为一系列子问题后分别求解. 对于D2D间的决策选择子问题,结合子模块优化和贪婪算法设计低复杂度的策略选择算法. 理论分析和仿真结果表明,所提出的ODMRA算法有效地优化了卸载方案,平衡了系统服务成本和队列长度,在能量消耗、系统服务成本方面优于其他对比算法.

关键词: 移动边缘计算 ; 设备对设备 ; 能量收集 ; 李雅普诺夫优化 ; 子模块优化

Abstract

The task offloading and resource allocation problems within D2D-MEC internet of things, which incorporates social relationships and energy harvesting (EH), were analyzed aiming at the energy consumption and security in mobile edge computing (MEC). An online decision matching and resource allocation (ODMRA) algorithm was proposed based on Lyapunov optimization for D2D communication. Social relationships among users were quantified into a social trust matrix. Energy consumption, packet loss and social trustworthiness were articulated as a long-term stochastic optimization problem. The Lyapunov optimization technique was employed to decompose this into a series of sub-problems, which were then solved individually. A low-complexity strategy selection algorithm was designed by combining submodular optimization and greedy algorithms for the decision-making sub-problems between D2D pairs. Theoretical analysis and simulation results showed that the proposed ODMRA algorithm effectively optimized the offloading scheme, balanced the system service cost and queue length, and outperformed other comparative algorithms in terms of energy consumption and system service cost.

Keywords: mobile edge computing ; device-to-device ; energy harvesting ; Lyapunov optimization ; submodular optimization

PDF (1365KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

曾耀平, 刘月强, 关赛莘, 江伟伟, 夏玉婷. 能量收集下的D2D-MEC计算卸载. 浙江大学学报(工学版)[J], 2024, 58(5): 967-978 doi:10.3785/j.issn.1008-973X.2024.05.010

ZENG Yaoping, LIU Yueqiang, GUAN Saishen, JIANG Weiwei, XIA Yuting. Computational offloading in D2D-MEC with energy harvesting. Journal of Zhejiang University(Engineering Science)[J], 2024, 58(5): 967-978 doi:10.3785/j.issn.1008-973X.2024.05.010

在5G和人工智能快速发展下,计算密集型和潜在关键型应用急剧增加(如虚拟现实、自动驾驶和大规模实时视频监控)[1-2]. 由于设备资源和计算能力有限,难以满足这些应用程序的计算需求. D2D-MEC(device-to-device mobile edge computing)技术应运而生,它整合了移动边缘计算与D2D通信技术[3],旨在改善通信性能、降低延迟,并减轻核心网络负担[4-6].

现有的D2D-MEC研究大多忽略了D2D通信中的社会关系属性,这在很大程度上影响了D2D-MEC系统[7-9]的性能. Gao等[8]提出通过用户的社会关系决定D2D传输过程的功率分配和D2D连接的补偿机制. Li等[9]设计存在社会关系的中继设备选择机制,使更多的设备参与了D2D的合作计算. 关于社会意识的D2D-MEC网络中的长期随机优化问题及资源分配问题仍存在许多不足.

李雅普诺夫优化方法可以根据实时输入的数据在线计算系统控制参数,解决了长期时变的问题. Sun等[10]研究在D2D辅助的MEC系统中,使用李雅普诺夫优化理论进行UEE和网络稳定性之间的权衡,但没有考虑D2D之间的匹配问题. Jiang等[11]研发了新的支持MEC的多请求者协作者模型,但是没有考虑协作者卸载到MEC的计算过程. Long等[12]研究具有社会感知的长期D2D协作MEC网络节能计算卸载框架,但仅考虑了D2D之间的一对一卸载,所使用的匹配理论算法复杂度较高.此外,传统电池供电设备的总能量有限[13],可能会因为能量耗尽而导致计算性能受损.

针对上述问题,本文提出考虑不同设备下能量收集(energy harvesting, EH)技术和用户间社会信任关系的D2D-MEC网络架构,此架构可以有效地降低系统的能量损耗,提高D2D链路的安全性. 设计基于李雅普诺夫的在线决策和资源分配(online decision matching and resource allocation, ODMRA)算法,最小化所有用户的长期平均服务成本,将原始随机优化问题转化为单时隙独立的确定性问题,然后分别求解. 仿真结果验证了ODMRA算法在系统服务成本和队列稳定性方面具有性能优势.

1. 系统模型

图1所示为能量收集下的D2D辅助MEC网络系统,由物理域和社会域2个部分组成. 其中物理域由一个配备MEC服务器的基站(base station, BS)和多个移动设备组成. 移动设备分为远程发送设备(distant transmitters, DTs)和近端发送设备(nearby receivers, NRs)2种类型,其中DTs的集合为${N} $,NRs的集合为${K} $. 考虑细粒度的卸载方式,DTs生成的任务可以在本地、NRs和MEC服务器上3处并行执行. 定义$D_i^{{\rm{DT}}}(t)$为DTi 在时隙t内执行的任务量. 由于DTs与BS距离较远,信道连接很差,DTs不能直接将任务卸载到MEC服务器. NRs距离BS较近,且有空闲的计算能力来协助DTs计算任务.${D_{ij}}(t)$为从 DTi传输到NRj的任务量,其中NRj为在时隙t内执行$D_j^{{\rm{NR}}}(t)$的数据量,由于NR处的计算和传输能力有限,剩余的数据量在NR处的任务缓冲区中等待进一步执行.

图 1

图 1   能量收集下的D2D辅助MEC网络系统模型图

Fig.1   System model of D2D-assisted MEC network with energy harvesting


将时间离散为时隙的形式,用$ t \in {T}$表示,其中每个时隙长度为${\tau _0}$. 引入二进制指示器${x_{ij}}(t)$表示用户的关联决策[14],在每个时隙开始的时刻,DTi通过D2D卸载决策${x_{ij}}(t)$决定卸载到哪个NRj,若DTi决定将任务卸载到NRj,则${x_{ij}}(t) = 1$,否则${x_{ij}}(t) = 0$. 一个DT在一个时隙内只能将任务卸载到一个NR上,一个NR最多辅助${N_{{\rm{max}}}}$个DTs,因此D2D设备间关联的约束条件如下.

$ {\displaystyle \sum{X}_{ij}(t)}\le 1,\forall j\in {K}\text{.} $

$ \sum\limits {{X_{ij}} \leqslant {N_{\max }}} ,\forall i \in {N}{\text{.}} $

$ {x_{ij}}(t) \in \{ 0,1\} ,\forall i \in {N}, j \in {K},t \in {T}{\text{.}} $

假设DTi在每个时隙产生的计算任务量为${A_i}(t)$. 在不失一般性的情况下,${A_i}(t)$在每个时隙内服从${A_i}(t) \in [{A_{{\rm{min}}}},{A_{{\rm{max}}}}]$的均匀分布,即任务量服从${{{{E}}}}[{A_i}(t)] = {\lambda _i}$的独立同分布函数. 由于下行传输中任务的数据量较小,忽略数据返回能耗和传输时间.

本节阐述了物理域中移动设备的基本关系. 物理域包含队列模型、传输模型、任务计算模型和EH模型,其中每个DT和NR对应社会域中的单个用户. 在社会域中,将用户之间的社会关系量化为社会信任矩阵后,作为D2D匹配过程中决策选择的重要依据. 下面详细介绍各个模型.

1.1. 任务队列模型

由于D2D的传输速率大于本地任务的生成速率,DT生成的任务在本地计算一部分后,剩余部分可以通过D2D快速上传到匹配的NR上.一个NR最多可以接收${N_{{\rm{max}}}}$个DT的部分计算任务,考虑本身计算能力的限制, 在每个NR处都设置任务缓冲区$ Q_j^{{\rm{NR}}}(t) $,用于储存从DT卸载到NR上的任务. NR处过多的任务量将存储在任务缓冲区中,在后续的时隙中进行计算或卸载. $ Q_j^{{\rm{NR}}}(t) $可以用下式表示:

$ Q_j^{{\rm{NR}}}(t+1) = {[Q_j^{{\rm{NR}}}(t) - D_j^{{\rm{NR}}}(t) - {D_{j{\mathrm{s}}}}(t)]^+}+{D_{ij}}(t){\text{.}} $

式中:$ {[x]^+} = \max \;\{ x,0\} $,$ \; {D_{ij}}(t) = {A_i}(t) - D_i^{{\rm{DT}}}(t) $. ${D_{j{\mathrm{s}}}}(t)$为NRj处在时隙t内卸载到MEC上的数据量,队列长度反映了任务完成时延,队列过长会导致严重的延迟. 队列长度应该尽可能短,以保证服务品质.

1.2. 传输模型

为了避免不同卸载用户间的严重干扰,系统采用正交频分多址(OFDMA)技术. D2D传输过程中分为N 个相同大小的子信道,从NRj卸载到MEC的可用带宽被划分为K 个相同大小的子信道,N+K 个子信道的带宽均为W Hz. 从DTi到NRj的信道功率增益为${H_{ij}}(t) = {h_{ij}}(t){g_0}{({d_0}/{d_{ij}})^\theta }$. 从NRj到MEC的蜂窝链路信道功率增益设置为${H_{j{\mathrm{s}}}}(t) = {h_{j{\mathrm{s}}}}(t){g_0}{({d_0}/{d_{j{\mathrm{s}}}})^\theta }$.其中$ {h_{ij}}(t) $$ {h_{j{\mathrm{s}}}}(t) $为小尺度的瑞利衰落系数,符合单位均值的指数分布,${g_0}$为路径损失函数,$\theta $为路径损失指数,$ {d_0} $为参考距离,$ {d_{ij}} $为从DTi到NRj的距离,$ {d_{j{\mathrm{s}}}} $为从NRj到边缘服务器MEC的距离. 通过香农公式可知,从DTi到NRj的D2D传输速率为$ {r_{ij}}\left( t \right) = W{\mathrm{lo}}{{\mathrm{g}}_2} \; (1+ P_{ij}^{{\rm{DT}}}(t) {H_{ij}}(t)/{\sigma ^2}) $,从NRj到边缘服务器MEC的传输速率为$ {r_{j{\mathrm{s}}}}\left( t \right) = W{\mathrm{lo}}{{\mathrm{g}}_2}\; (1+P_{j{\mathrm{s}}}^{{\rm{NR}}}(t) {H_{j{\mathrm{s}}}}(t)/{\sigma ^2}) $. 其中$\:P_{ij}^{{\rm{DT}}}(t)$为DTi的发射功率,$P_{j{\mathrm{s}}}^{{\rm{NR}}}(t)$为NRj的发射功率,${\sigma ^2}$为背景噪声方差.

1.3. 任务计算模型

为了确保MEC的可持续使用,搭载MEC的基站通常由电网供电,所以忽略MEC计算过程的能量消耗. 令${f_i}^{{\rm{DT}}}(t)$为DTit时刻的本地CPU循环频率,${\gamma _i}$为DTi的计算负载,单位为cycles/bit. DTi在单个时隙内的计算任务大小为$ D_i^{{\rm{DT}}}(t) = f_i^{{\rm{DT}}}(t) {\tau _0}/{\gamma _i} $,执行DTi本地计算任务$D_i^{{\rm{DT}}}(t)$的能耗为$ E_i^{{\rm{DT}}}(t) = {\kappa _1} {(f_i^{{\rm{DT}}}(t))^3} {\tau _0} $.其中${\kappa _1}$为DT芯片架构的功率系数.

D2D链路的传输能耗为$ {E_{ij}}(t) = P_{ij}^{{\rm{DT}}}(t) {\tau _0} $.$ f_j^{{\rm{NR}}}(t) $为NRjt时刻的本地CPU循环频率,${\gamma _j}$为本地计算负载,单位为cycles/bit. 单个时隙内NRj计算任务大小表示为$ D_j^{{\rm{NR}}}(t) = f_j^{{\rm{NR}}}(t) {\tau _0} \gamma _j^{ - 1} $.近端发送设备NR在执行计算任务$D_j^{{\rm{NR}}}(t)$时的能耗为$ E_j^{{\rm{NR}}}(t) = {\kappa _2} {(f_j^{{\rm{NR}}})^3} {\tau _0} $,其中${\kappa _2}$为NR芯片架构的功率系数. 从NRj到MEC的任务卸载能耗为${E_{j{\mathrm{s}}}}(t) = P_{j{\mathrm{s}}}^{{\rm{NR}}}(t) {\tau _0}$. 从NRj卸载至MEC的数据大小为${D_{j{\mathrm{s}}}}(t) = {r_{j{\mathrm{s}}}}(t) {\tau _0}$.

1.4. EH模型

每个移动设备都配备EH装置,可以捕获可再生能源供能. 在时隙开始的时刻,DTi的能量为$ E_{\rm{H}}^i(t) $,NRj的能量为$E_{\rm{H}}^j(t)$,它们服从在不同时隙的最大值为$E_{{\rm{H,max}}}^i$$E_{{\rm{H,max}}}^j$的独立同分布模型.${e_i}(t)$$ {e_j}(t) $为被收集并存储在电池中的能量,用于本时隙的任务计算和下一个时隙的任务卸载. 在每个时隙中,${e_i}(t)$$ {e_j}(t) $满足以下约束:

$ 0 \leqslant {e_i}(t) \leqslant E_{\rm{H}}^i(t){\text{;}} $

$ 0 \leqslant {e_j}(t) \leqslant E_{\rm{H}}^j(t){\text{.}} $

采用虚拟电池能量队列来量化DTi和NRj的电池能量水平,在每个时隙开始时,将DTi和NRj的虚拟电池队列记为$ {B_i}(t) $${B_j}(t)$.在本文中${B_i}(0) = 0$ , ${B_j}(0) = 0$ , $ {B_i}(t) < \infty $, $\;{B_j}(t) < \infty $,DTi和NRjt时刻消耗的能量记为

$ {E_i}(t) = E_i^{{\rm{DT}}}(t)+{E_{ij}}(t){\text{,}} $

$ {E_j}(t) = E_j^{{\rm{NR}}}(t)+{E_{j{\mathrm{s}}}}(t). $

两者受到以下能量关系的约束:

$ {E_i}(t) < {B_i}(t) < \infty {\text{;}} $

$ {E_j}(t) < {B_j}(t) < \infty {\text{.}} $

DT和NR的虚拟电池能量队列动态模型为

$ {B_i}(t+1) = {B_i}(t) - {E_i}(t)+{e_i}(t){\text{,}} $

$ {B_j}(t+1) = {B_j}(t) - {E_j}(t)+{e_j}(t){\text{.}} $

1.5. 社会信任矩阵

在社会域中,社会关系为用户通过社交网络中的连接、交流和互动构建的关系网络,反映了用户间的信任度和亲密程度. 利用贝叶斯技术,将不同社交网络平台下收集到的历史记录进行整合,获得用户之间的社会关系,用社会信任矩阵表示一个时隙内DTi和NRj的社会关系强度. 社会关系的强度越大,移动设备之间越有可能建立D2D通信链接. 社会关系属性在D2D匹配决策中发挥了关键作用.

1.5.1. 社会信任矩阵的获取方案

在互联网的社交领域,系统在微博、抖音、Twitter等社交平台上获取用户间的社会关系,如发布的帖子、评论、点赞、分享等. 这些记录不仅可以揭示用户的兴趣、观点和偏好,还反映用户之间的社交关系.利用贝叶斯技术,可以对不同社交网络平台收集到的历史记录进行整合,得到社会信任矩阵[9,15].

具体过程如下. 使用贝叶斯技术对不同的社交网络平台上收集的数据进行整合,通过用户选择相似内容的概率密度分布函数来表示用户行为的相似性,决定社会关系的强度. 量化社会关系的强度,在得到社会信任值后,可得社会信任矩阵.该模型在获取用户之间的社会信任关系模型中得到了广泛应用[8,12].

1.5.2. 社会信任矩阵在本文的应用

在利用上述方案得到多个社交网络的数据整合模型后,社会信任矩阵${\boldsymbol{ \varOmega }}(t) = [{{\boldsymbol{\omega}} _1}(t),{{\boldsymbol{\omega}} _2}(t),\cdots,{{\boldsymbol{\omega}} _N}(t)] $表示用户之间的社会关系. 其中社会信任矩阵$ {\boldsymbol{\varOmega}} (t) $的列向量为$ {{\boldsymbol{\omega}} _i}(t) = {[{\omega _{i1}}(t),{\omega _{i2}}(t), \cdots ,{\omega _{iK}}(t)]^{\rm{T}}} $,其中 ${\omega _{ij}}(t)$为DTi和NRj之间的社会信任值,用来表示一个时隙内DTi和NRj的社会关系强度. 时变的社会信任值${\omega _{ij}}(t)$

$ {\omega }_{ij}=\left\{\begin{array}{l}(0,1.0],\text{ }\text{DT}i和\text{NR}j存在社会关系;\\ 0,\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }其他.\end{array}\right. $

${\omega _{ij}}(t) = 0$表示DTi和NRj之间不存在社会关系,因此他们之间不会建立D2D链接. 从D2D传输的信息安全性和传输可靠性的方面考虑,用户之间更喜欢与其社会关系较高的用户建立D2D链接,传输DT产生的计算任务.

2. 问题公式化

2.1. 性能度量

本文的优化目标为在计算资源和队列稳定性约束下尽量减少系统服务成本,其中系统服务成本主要包括系统能耗成本、任务丢失成本和安全成本3部分. 当DT或NR没有足够的能量或者无线信道条件较差时,放弃到达的任务. 考虑这方面的因素,对每一个放弃的任务都加一个单位成本惩罚因子[16-17]. 此时,将系统的服务成本定义为所有设备的计算能耗和传输能耗、任务丢失成本和社会信任值的加权和.

$ \begin{split}{W}(t)=&{\displaystyle \sum _{j\in {K}}{\displaystyle \sum _{i\in {N}}{x}_{ij}(t)[{E}_{i}(t)+{E}_{j}(t)-\phi {\omega }_{ij}(t)}}+\\ \text{ }&{\varphi }_{i}(t){D}_{i}(t)+{\varphi }_{j}(t){D}_{j}(t)].\end{split} $

式中:${x_{ij}}(t) \in \{ 0,1\} $为在t时刻的D2D链接指示器,若DTi与NRjt时刻建立链接,则${x_{ij}}(t) = 1$,否则${x_{ij}}(t) = 0$;${D_i}(t)、{D_j}(t) \in \{ 0,1\} $为DTi和NRj的任务丢弃指示器,等于1表示不丢弃任务,否则为丢弃;${\varphi _i}(t)、{\varphi _j}(t)$为DTi和NRj的丢弃任务惩罚成本;$\phi $为社会信任值的惩罚成本,社会信任值与系统安全成本间存在近似反比关系,应选择尽可能大的社会信任值来降低系统服务成本.

2.2. 最小化系统服务成本

由于$ {B_i}(t) $${B_j}(t)$为理想化状态下的电池能量队列,将扰动参数${\theta _i}$${\theta _j}$加入其中表示消耗的实际电池能量水平,则2种设备的虚拟能量队列${\tilde B_i}(t)$${\tilde B_j}(t)$表示为

$ {\tilde B_i}(t) = {B_i}(t) - {\theta _i}{\text{,}} $

$ {\tilde B_j}(t) = {B_j}(t) - {\theta _j}{\text{.}} $

扰动参数${\theta _i}$${\theta _j}$满足下列不等式[16,18]

$ {\theta _i} \geqslant {\tilde E_{i,{\rm{max}}}}+V {\varphi _i}/{E_{i,\min }}{\text{,}} $

$ {\theta _j} \geqslant {\tilde E_{j,{\rm{max}}}}+V {\varphi _j}/{E_{j,\min }}{\text{.}} $

式中:${\tilde E_{i,{\rm{max}}}} = \min \;\{ {E_i}(t),{E_{i,{\rm{max}}}}\} $${\tilde E_{j,{\rm{max}}}} = \min \;\{ {E_j}(t), {E_{j,{\rm{max}}}}\}; $$0 < V < \infty $为非负的控制参数,它表示能量队列长度和服务成本之间的权衡;$ {E_{i,\min }} $${E_{j,\min }}$为引入的非零下界,作为电池在每个时隙的最小放电能量,可以消除系统决策和时间在不同时隙之间的耦合关系. 优化的参数定义为${O}(t) = \{ e(t), f(t), p(t),x(t)\} $,系统成本最小化问题表示如下.

不等式(19a)~(19d)表示每个设备的计算频率和发射功率不超过它们的最大值. 式(19e)表示社会信任值的约束. 不等式(19f)、(19g)表示DTs和NRs的电池输出量不超过它们的电池放电约束. 式(19h)保证了任务缓冲队列$Q_j^{{\rm{NR}}}(t)$是有界的,即平均速率稳定.${P_1}$是随机的混合整数规划问题,其中包括的连续变量和二元变量是耦合且时变的,到达的计算任务和队列积压是随机且不可预测的,很难推导出长期的最优策略. 李雅普诺夫优化技术是解耦长期问题的有效方法,可以根据系统实时输入的数据,在线计算系统的控制参数,实现对系统的在线控制和调整,在解决资源分配问题上得到了广泛应用[19-20].

2.3. 李雅普诺夫优化框架

为了解决随机优化问题${P_1}$,在队列稳定条件下最小化系统服务成本问题转化为漂移加惩罚函数,通过漂移函数满足队列稳定,利用惩罚函数满足系统成本最小化.当前时刻的队列积压为$ \varTheta (t) = (Q_j^{{\rm{NR}}}(t),{\tilde B_i}(t),{\tilde B_j}(t)) $,引入二次的李雅普诺夫函数:

$ L(\varTheta (t)) = \frac{1}{2}\sum\limits_{j \in K} {\sum\limits_{i \in N} {(Q_j^{{\rm{NR}}}{{(t)}^2}+{{\tilde B}_i}{{(t)}^2}+{{\tilde B}_j}{{(t)}^2})} } {\text{.}} $

式中:$L(\varTheta (t))$表示队列积压的标量度量,$L(\varTheta (t)) > 0$.$L(\varTheta (t))$越小,所有任务的队列积压数量越少.

引入李雅普诺夫漂移函数:

$ \Delta \varTheta (t) = {E}[L(\varTheta (t+1)) - L(\varTheta (t))|\varTheta (t)]{\text{.}} $

通过将队列稳定性纳入执行成本性能中,定义李雅普诺夫漂移加惩罚函数来解决上述问题:

$ {\Delta }_{V}(\varTheta (t))=\Delta \varTheta (t)+V{E}\left[{W}(t)\right]\text{.} $

式中:V为目标函数对漂移惩罚的权值,可以作为调整系统成本和队列稳定性的控制参数[21].

在每个时隙中,通过最小化$ {\Delta _V}(\varTheta (t)) $,将系统成本最小化的同时,稳定了队列水平.由于$ {\Delta _V}(\varTheta (t)) $是非线性的,没有直接最小化$ {\Delta _V}(\varTheta (t)) $,而是推导出李雅普诺夫漂移加罚函数的上界,并设计在线卸载算法,最小化$ {\Delta _V}(\varTheta (t)) $在可行区域$ {O}(t) $的上界,使得队列稳定.

在每个时隙中,对于任意队列积压$\varTheta (t)$和系统服务成本${W}(t)$,在可行决策${O}(t)$下的漂移加惩罚函数$ {\Delta _V}(\varTheta (t)) $满足

$ \begin{split}& {\Delta _V}(\varTheta (t)) \leqslant C+{E}\left[ {\sum\limits_{j \in K} {\sum\limits_{i \in N} {D_j^{{\rm{NR}}}(t){D_{j{\mathrm{s}}}}(t)} } } \right]+ \\ &V{E}\left[ {{W}(t)} \right]+{E}\left[ {\sum\limits_{j\in K} {[{{\tilde B}_j}(t)({e_j}(t) - {E_j}(t))]} } \right]+ \\ &{E}\left[ {\frac{1}{2}\sum\limits_{j\in K} {\sum\limits_{i\in N} {[D_i^{{\rm{DT}}}{{(t)}^2}+D_j^{{\rm{NR}}}{{(t)}^2}+{D_{j{\mathrm{s}}}}{{(t)}^2}+{A_i}{{(t)}^2}]} } } \right]+ \\& {E}\left[ {\sum\limits_{j\in K} {\sum\limits_{i\in N} {Q_j^{{\rm{NR}}}[{A_i}(t) - D_i^{{\rm{DT}}}(t) - D_j^{{\rm{NR}}}(t) - {D_{j{\mathrm{s}}}}(t)]} } } \right]+ \\& {E}\left[ {\sum\limits_{i\in N }{[{{\tilde B}_i}(t)({e_i}(t) - {E_i}(t))]} } \right] - {E}\left[ {\sum\limits_{i \in N} {{A_i}(t)D_i^{{\rm{DT}}}(t)} } \right]. \end{split} $

证明:将队列积压公式(4)的两边平方,得到

$ \begin{split} &Q_j^{{\rm{NR}}}{(t+1)^2} = {(Q_j^{{\rm{NR}}}(t) - D_j^{{\rm{NR}}}(t) - {D_{j{\mathrm{s}}}}(t))^2}+ \\ &{D_{ij}}{(t)^2}+2{D_{ij}}(t)[Q_j^{{\rm{NR}}}(t) - D_j^{{\rm{NR}}}(t) - {D_{j{\mathrm{s}}}}(t)]{\text{.}} \end{split} $

式中:$ {D_{ij}}(t) = {A_i}(t) - D_i^{{\rm{DT}}}(t) $,故

$ \begin{split} &Q_j^{{\rm{NR}}}{(t+1)^2} \leqslant Q_j^{{\rm{NR}}}{(t)^2}+{(D_j^{{\rm{NR}}}(t)+{D_{j{\mathrm{s}}}}(t))^2}+ \\ &2Q_j^{{\rm{NR}}}(t)[{A_i}(t) - D_i^{{\rm{DT}}}(t) - D_j^{{\rm{NR}}}(t) - {D_{j{\mathrm{s}}}}(t)]+ \\ &{({A_i}(t) - D_i^{{\rm{DT}}}(t))^2}{\text{.}} \end{split} $

将式(25)的所有移动设备相加,得到以下不等式:

$ \begin{split} &\frac{1}{2}\sum\limits_{i\in N } {\sum\limits_{j\in K } {(Q_j^{{\rm{NR}}}{{(t+1)}^2} - Q_j^{{\rm{NR}}}{{(t)}^2}) \leqslant } } \\ &\sum\limits_{i\in N } {\sum\limits_{j\in K } {[D_j^{{\rm{NR}}}{{(t)}^2}+{D_{j{\mathrm{s}}}}{{(t)}^2}} +} {A_i}{(t)^2} - D_i^{{\rm{DT}}}{(t)^2}+ \\ &Q_j^{{\rm{NR}}}(t)({A_i}(t) - D_i^{{\rm{DT}}}(t) - D_j^{{\rm{NR}}}(t) - {D_{j{\mathrm{s}}}}(t))+ \\& {A_i}(t)D_i^{{\rm{DT}}}(t)+D_j^{{\rm{NR}}}(t){D_{j{\mathrm{s}}}}(t)]{\text{.}} \end{split} $

对2种设备的虚拟能量队列(15)、(16)开展与式(4)相同的操作,如下所示:

$ \begin{split} &\frac{1}{2}\sum\limits_{i\in N } {({{\tilde B}_i}{{(t+1)}^2} - {{\tilde B}_i}{{(t)}^2})} \leqslant \\ &\frac{1}{2}\sum\limits_{i\in N } {({E_i}{{(t)}^2}+{e_i}{{(t)}^2})} +{{\tilde B}_i}(t)({e_i}(t) - {E_i}(t)){\text{.}} \end{split} $

$ \begin{split} &\frac{1}{2}\sum\limits_{j\in K } {({{\tilde B}_j}{{(t+1)}^2} - {{\tilde B}_j}{{(t)}^2})} \leqslant \\ &\frac{1}{2}\sum\limits_{j\in K } {({E_j}{{(t)}^2}+{e_j}{{(t)}^2})} +{{\tilde B}_j}(t)({e_j}(t) - {E_j}(t)){\text{.}} \end{split} $

将式(26)~(28)相加,可得

$ \begin{split}& L(\varTheta (t+1)) - L(\varTheta (t)) \leqslant \\ &C+\sum\limits_{j\in K } {\sum\limits_{i\in N } {D_j^{{\rm{NR}}}(t){D_{j{\mathrm{s}}}}(t)} } - \sum\limits_{i\in N } {{A_i}(t)D_i^{{\rm{DT}}}(t)} + \\ &\frac{1}{2}\sum\limits_{j\in K } {\sum\limits_{i\in N } {[D_i^{{\rm{DT}}}{{(t)}^2}+D_j^{{\rm{NR}}}{{(t)}^2}+{D_{j{\mathrm{s}}}}{{(t)}^2}+{A_i}{{(t)}^2}]} } + \\ & \sum\limits_{j\in K } {\sum\limits_{i\in N } {Q_j^{{\rm{NR}}}[{A_i}(t) - D_i^{{\rm{DT}}}(t) - D_j^{{\rm{NR}}}(t) - {D_{j{\mathrm{s}}}}(t)]} } + \\& \sum\limits_{i\in N } {[{{\tilde B}_i}(t)({e_i}(t) - {E_i}(t))]} +\sum\limits_{j\in K } {[{{\tilde B}_j}(t)({e_j}(t) - {E_j}(t))]} . \end{split} $

C和式(29)代入式(22),可得漂移加罚函数的上界(23).

根据漂移加罚函数的上界,设计基于李雅普诺夫的在线优化方法. 通过最小化式(23)的右侧,将长期优化问题转化为基于单个时隙的优化问题${P_2}$,将其拆分后逐个进行处理,使得优化问题更加容易、高效地求解.

3. ODMRA算法的设计

该部分的目标是将长期平均优化问题转化为如下4个单时隙优化问题:1)能量收集;2)计算资源分配;3)发射功率分配;4)D2D匹配决策. 结合凸分解和子模块优化理论,提出基于李雅普诺夫优化的D2D在线决策匹配和资源分配(ODMRA)算法,分别解决这些子问题.

3.1. 收获的最佳能量

通过如下问题求解DTs和NRs收获的能量.

${P_3}$为线性问题,最优的解决方案如下.

$ {e}_{i}^{*}(t)=\left\{\begin{array}{l}{E}_{{\mathrm{H}}}^{i}(t),\; {\tilde{B}}_{i}(t)\leqslant 0;\\ 0,\;\;\;\;\;\;\;\;其他.\end{array}\right. $

$ {e}_{j}^{*}(t)=\left\{\begin{array}{l}{E}_{{\mathrm{H}}}^{j}(t),\; {\tilde{B}}_{j}(t)\leqslant 0;\\ 0,\;\;\;\;\;\;\;\;其他.\end{array}\right. $

3.2. 最优卸载决策和资源分配

${P_3}$从问题${P_2}$中解耦后,则转化为问题${P_4}$. 通过解决以下问题,获得DTs和NRs的最优CPU频率、最优的D2D传输功率、最优的上传功率和最佳的D2D匹配决策.

${P_4}$是混合整数规划问题,若使用蛮力方法求解,则计算复杂度非常高. 观察到可行区域是$f(t)、p(t)、x(t)$的笛卡尔乘积,使用高斯-赛德尔迭代法交替[22-23]最小化求解,可以有效地保证${P_4}$的收敛性. 设计ODMRA算法,提出利用迭代的方法交替求解问题${P_4}$.

3.2.1. 最优的CPU频率

假设发射功率和D2D匹配决策固定,最优的CPU周期频率调度问题为

${P_{4.{\text{1}}}}$分解为DTs的CPU频率问题和NRs的CPU频率问题. 由于DTs的CPU频率问题是非凸的,将$ D_i^{{\rm{DT}}}{(t)^2} $放缩后,得到原问题的上界为

将目标函数${P_{4.{\text{1}}{\text{.1}}}}$记为$ {{J}_1}(f_i^{{\rm{DT}}}(t)) $,关于$f_i^{{\rm{DT}}}(t)$的一阶导数和二阶导数如下所示:

$ \begin{split} &\frac{{{{{\mathrm{d}}}}{{J}_1}(f_i^{{\rm{DT}}}(t))}}{{{\mathrm{d}}f_i^{{\rm{DT}}}(t)}} = 3{\kappa _1}{\tau _0}\left( {V - {{\tilde B}_i}(t)} \right)f_i^{{\rm{DT}}}{(t)^2} - \\ &{\text{ }}Q_j^{{\rm{NR}}}(t){\tau _0}\gamma _i^{ - 1} - {A_i}(t){\tau _0}\gamma _i^{ - 1}{\text{,}} \end{split} $

$ \frac{{{{\mathrm{d}}^2}{{J}_1}(f_i^{{\rm{DT}}}(t))}}{{{\mathrm{d}}f_i^{{\rm{DT}}}{{(t)}^2}}} = 6{\kappa _1}{\tau _0}\left( {V - {{\tilde B}_i}(t)} \right)f_i^{{\rm{DT}}}(t){\text{.}} $

分以下2种情况讨论$ {{J}_1}(f_i^{{\rm{DT}}}(t)) $的凹凸性.

情况1:若$f_i^{{\rm{DT}}}(t)$的二阶导数$ \geqslant 0$,即$V \geqslant {\tilde B_i}(t)$,则$ {{J}_1}(f_i^{{\rm{DT}}}(t)) $为典型的凸函数,目标函数的最优值在最低点取得. 令$ {\mathrm{d}}{{J}_1}(f_i^{{\rm{DT}}}(t))/{\mathrm{d}}f_i^{{\rm{DT}}}(t) = 0 $,则$f_i^{{\rm{DT}}}{(t)^ * } = \sqrt {\left( {Q_j^{{\rm{NR}}}(t)\gamma _i^{ - 1}+{A_i}(t)\gamma _i^{ - 1}} \right)/\left( {3{\kappa _1}\left( {V - {{\tilde B}_i}(t)} \right)} \right)} $.

情况2:若$f_i^{{\rm{DT}}}(t)$的二阶导数$ < 0$,即$V < {\tilde B_i}(t)$,则$ {{J}_1}(f_i^{{\rm{DT}}}(t)) $为凹函数,此时目标函数的最优值通过获取$f_i^{{\rm{DT}}}(t)$的定义域两侧端点处的最小值取得,故

$f_i^{{\rm{DT}}}{(t)^ * } = \mathop {\arg \min }\limits_{f_i^{{\rm{DT}}}(t)} \left\{ {{{J}_1}\left( {f_i^{{\rm{DT}}}{{(t)}_{\mathrm{U}}}} \right),{{J}_1}\left( {f_i^{{\rm{DT}}}{{(t)}_{\mathrm{L}}}} \right)} \right\}. $

其中$f_i^{{\rm{DT}}}{(t)_{\mathrm{U}}} = \min \left\{ {{f_{i,{\rm{max}}}},\sqrt[3]{{\left( {{E_{i,{\rm{max}}}} - {E_{ij}}(t)} \right)/({\kappa _1}{\tau _0})}}} \right\}$$f_i^{{\rm{DT}}}{(t)_{\mathrm{L}}} = \max \left\{ {0,\sqrt[3]{{\left( {{E_{i,{\rm{min}}}} - {E_{ij}}(t)} \right)/({\kappa _1}{\tau _0})}}} \right\}$ . DTi最优的CPU频率为

$ \begin{gathered} f_i^{{\rm{DT}}}{(t)^*} = \\ \left\{ \begin{gathered} \sqrt {\frac{{ {Q_j^{{\rm{NR}}}(t)\gamma _i^{ - 1}+{A_i}(t)\gamma _i^{ - 1}} }}{ {3{\kappa _1}\left( {V - {{\tilde B}_i}(t)} \right)}}} {\text{, }}V \geqslant {{\tilde B}_i}(t); \\ \mathop {\arg \min }\limits_{f_i^{{\rm{DT}}}(t)} \left\{ {{{J}_1}\left( {f_i^{{\rm{DT}}}{{(t)}_{\mathrm{U}}}} \right),{{J}_1}\left( {f_i^{{\rm{DT}}}{{(t)}_{\mathrm{L}}}} \right)} \right\},V < {{\tilde B}_i}(t). \end{gathered} \right.\end{gathered} $

${P_{4.{\text{1}}{\text{.2}}}}$为NRs的CPU频率问题:

将目标函数${P_{4.{\text{1}}{\text{.2}}}}$记为$ {{J}_2}(f_j^{{\rm{NR}}}(t)) $,NRj最优的CPU频率为

$ \begin{gathered} f_j^{{\rm{NR}}}{(t)^*} = \\ \left\{ \begin{gathered} \sqrt {\frac{{\left[ {Q_j^{{\rm{NR}}}(t)+{D_{j{\mathrm{s}}}}(t)} \right]{\gamma _i}^{ - 1}}}{ {3{\kappa _2}\left( {V - {{\tilde B}_j}(t)} \right)}}} , \;V \geqslant {{\tilde B}_j}(t); \\ \mathop {\arg \min }\limits_{f_j^{{\rm{DT}}}(t)} \left\{ {{J}\left( {f_j^{{\rm{NR}}}{{(t)}_{\mathrm{U}}}} \right),{J}\left( {f_j^{{\rm{NR}}}{{(t)}_{\mathrm{L}}}} \right)} \right\},\;V < {{\tilde B}_j}(t). \\ \end{gathered} \right. \end{gathered} $

式中:

证明:证明过程与$ {P_{4.{\text{1}}{\text{.1}}}} $类似,此处省略.

3.2.2. 功率分配问题

通过固定DTs和NRs的CPU循环频率和D2D连接决策,功率分配问题可以写成如下形式:

问题${P_{4.2}}$可以分解为${P_{4.2.1}}$${P_{4.2.2}}$2个子问题.

${P_{4.2.1}}$是线性问题,解得D2D最优的发射功率为

$ P_{ij}^{{\rm{DT}}}(t) = \left\{ \begin{gathered} \min \left\{ {{P_{i.{\mathrm{max}}}},\dfrac{{{{E_{i,{\rm{max}}}} - E_i^{{\rm{DT}}}(t)} }}{{{\tau _0}}}} \right\},V \leqslant {{\tilde B}_i}(t); \\ \max \left\{ {0,\dfrac{{ {{E_{i,\min }} - E_i^{{\rm{DT}}}(t)} }}{{{\tau _0}}}} \right\}, V > {{\tilde B}_i}(t). \\ \end{gathered} \right. $

接下来解决NR到MEC的传输功率问题:

将目标函数${P_{4.2.2}}$记为${S}(P_{j{\mathrm{s}}}^{{\rm{NR}}}(t))$,其一阶导数和二阶导数为

$ \begin{split} &\frac{{{\mathrm{d}}{S}(P_{j{\mathrm{s}}}^{{\rm{NR}}}(t))}}{{{\mathrm{d}}P_{j{\mathrm{s}}}^{{\rm{NR}}}(t)}} = \left( {V - {{\tilde B}_j}(t)} \right){\tau _0}+ \\ &\frac{{\left( {1+Q_j^{{\rm{NR}}}(t)+D_j^{{\rm{NR}}}(t)} \right)W{\tau _0}{H_{j{\mathrm{s}}}}(t)}}{{\left( {1+P_{j{\mathrm{s}}}^{{\rm{NR}}}{H_{j{\mathrm{s}}}}(t)/{\sigma ^2}} \right){\sigma ^2}{\mathrm{ln}}\;2}}. \end{split} $

$ \begin{split}& \frac{{{{\mathrm{d}}^2}{S}(P_{j{\mathrm{s}}}^{{\rm{NR}}}(t))}}{{{\mathrm{d}}P_{j{\mathrm{s}}}^{{\rm{NR}}}{{(t)}^2}}} = - \frac{{\left( {1+Q_j^{{\rm{NR}}}(t)+D_j^{{\rm{NR}}}(t)} \right)W{\tau _0}{H_{j{\mathrm{s}}}}{{(t)}^2}}}{{{\sigma ^4}{\mathrm{ln}}\;2}}\times \\ &{\left( {1+\frac{{P_{j{\mathrm{s}}}^{{\rm{NR}}}{H_{j{\mathrm{s}}}}(t)}}{{{\sigma ^2}}}} \right)^{ - 2}}. \end{split} $

${S}(P_{j{\mathrm{s}}}^{{\rm{NR}}}(t))$的二阶导数$ \leqslant 0$,故${S}(P_{j{\mathrm{s}}}^{{\rm{NR}}}(t))$为凹函数,极小值在$P_{j{\mathrm{s}}}^{{\rm{NR}}}(t)$的端点处取得,最优传输功率为

$ P_{j{\mathrm{s}}}^{{\rm{NR}}}{(t)^*} = \mathop {\arg \min }\limits_{P_{j{\mathrm{s}}}^{{\rm{NR}}}(t)} \left\{ {{S}(P_{j{\mathrm{s}}}^{{\rm{NR}}}{{(t)}_{\mathrm{U}}}),{S}(P_{j{\mathrm{s}}}^{{\rm{NR}}}{{(t)}_{\mathrm{L}}})} \right\}. $

式中:$ P_{j{\mathrm{s}}}^{{\rm{NR}}}{(t)_{\mathrm{U}}} = \min \left\{ {{P_{j,{\rm{max}}}},\left( {{E_{j,{\rm{max}}}} - E_j^{{\rm{NR}}}(t)} \right)/{\tau _0}} \right\} $

3.2.3. D2D决策选择问题

给定最优的发射功率和设备的CPU频率,关于社会信任关系的D2D匹配决策问题表述如下:

式中:${U_{ij}}(t) = V\phi {\omega _{ij}}(t)+\left( {{{\tilde B}_i}(t) - V} \right){E_{ij}}(t)$.${U_{ij}}(t)$为D2D传输能耗和用户间社会信任值的加权和,作为D2D决策选择的效用函数. 不同的社会信任值会导致不同的D2D决策选择效用函数,不同的效用函数会影响D2D的决策选择,从而影响系统效用成本.

子模块优化是解决组合问题的强大工具[23-24],适用于求解策略选择问题. 与其他的策略选择算法相比,它具有高效性、复杂度更低、资源分配更加公平等优点,因此子模块优化在网络问题中被广泛应用.

利用子模块优化来寻找D2D之间的决策. 具体来说,将约束下的2种移动设备DT和NR之间的决策约束(1)和(2)写为拟阵的形式,严格证明了D2D决策选择的效用函数${x_{ij}}(t){U_{ij}}(t)$存在单调性和子模性. 将问题${P_{4.{\text{3}}}}$转化为拟阵约束下的子模函数最大化问题,用“边际效用递减”性质结合低复杂度的贪婪算法,可得保证系统性能最优的D2D匹配决策.

定义DTs与NRs匹配决策的地面集合$ {G}(t) = \{ {\tilde x_{11}}(t), \cdots ,{\tilde x_{N1}}(t), \cdots ,{\tilde x_{1K}}(t), \cdots ,{\tilde x_{NK}}(t)\} $,其中$ {\tilde x_{ij}}(t) $表示DTi与NRj互相关联. 定义元组$ {M} = ({G}(t),{I}) $,其中${I} \subseteq {2^{{G}(t)}}$,表示$ {G}(t) $的一个独立子集,将其写成拟阵的形式为

$ \begin{split} {I} =& \{ {X}(t) \subseteq {G}(t);\;\left| {{X}(t) \cap {A_i}(t)} \right| \leqslant 1,{i\in N}, \\&|{X}(t) \cap {B_j}(t)|\leqslant {N_{{\rm{max}}}},\:{j\in K}\} {\text{.}} \\ \end{split} $

${G}(t)$包含所有可能的关联策略,这些策略可以划分为N 个不相交的集合,$ 如{G}(t) = \cup _{{i\in N}}{A_i}(t),{A_i}(t) \cap {A_{{i'}}}(t) = \phi ,i \ne {i'} $. 其中${A_i}(t) = \{ {\tilde x_{i1}}(t),\cdots, {\tilde x_{iK}}(t)\} ,\forall i \in {N}$,表示DTi与NR配对的集合. 这些策略可以划分为K 个不相交的集合,$ 如{G}(t) = \cup _{j\in K}{B_j}(t), {B_j}(t) \cap {B_{{j'}}}(t) = \phi , j \ne {j'} $.其中${B_j}(t) = \{ {\tilde x_{1j}}(t),\cdots,{\tilde x_{Nj}} (t)\} , \forall j \in {K}$表示NR与DTs配对的集合.

拟阵$ {I} $表示每个DT可以关联的NRs的约束(1)和每个NR可以关联的DTs的约束(2),$| \cdot |$表示基数.

定理1:给定地面集合${G}(t)$和它的一个子集$ {X}(t) \in {G}(t) $,则${F}\left( {{X}(t)} \right) = \sum\nolimits_{{{\tilde x}_{ij}}(t) \in {X}(t)} {{{\tilde x}_{ij}}(t){U_{ij}}(t)} $是基于${X}(t) \in {G}(t)$的单调子模函数.

证明:因为

$ \begin{split} &{F}\left( {{X}(t)} \right) =\displaystyle \sum\limits_{{{\tilde{x}}_{ij}}(t) \in X (t)} {{{\tilde x}_{ij}}(t){U_{ij}}(t)} = \\ &{\text{ }}\sum\limits_{{{\tilde x}_{ij}}(t) \in X (t)} {{{\tilde x}_{ij}}(t)\left( {V\phi {\omega _{ij}}(t)+\left( {{{\tilde B}_i}(t) - V} \right){E_{ij}}(t)} \right)} . \end{split} $

$\varepsilon (t) \subset \;{X}(t)$$v \in {X}(t)\backslash \varepsilon (t)$,则

$ \begin{split} &{F}\left( {\varepsilon (t) \cup v} \right) = \\& {\text{ }}\sum\limits_{{{\tilde x}_{ij}}\left( t \right) \in \varepsilon \left( t \right)} {{{\tilde x}_{ij}}(t)\left( {V\phi {\omega _{ij}}(t)+\left( {{{\tilde B}_i}(t) - V} \right){E_{ij}}(t)} \right)} + \\& \sum\limits_{{{\tilde x}_{ij}}^\prime (t) \in {X}(t)\backslash \varepsilon \left( t \right)} {{{\tilde x}_{ij}}^\prime (t)\left( {V\phi {\omega _{ij}}(t)+\left( {{{\tilde B}_i}(t) - V} \right){E_{ij}}(t)} \right)} = \\& {F}\left( {\varepsilon (t)} \right)+ \\ &\sum\limits_{{{\tilde x}_{ij}}^\prime (t) \in {X}(t)\backslash \varepsilon \left( t \right)} {{{\tilde x}_{ij}}^\prime (t)\left( {V\phi {\omega _{ij}}(t)+\left( {{{\tilde B}_i}(t) - V} \right){E_{ij}}(t)} \right)} = \\& {F}\left( {\varepsilon (t)} \right)+\sum\limits_{{{\tilde x}_{ij}}^\prime (t) \in {X}(t)\backslash \varepsilon \left( t \right)} {{{\tilde x}_{ij}}^\prime (t){U_{ij}}(t)} . \end{split} $

${\tilde x_{ij}}^\prime (t) \in \{ 0,1\} $,其中${U_{ij}}(t) \geqslant 0$,故不等式${F}\left( {\varepsilon (t) \cup v} \right) \geqslant {F}\left( {\varepsilon (t)} \right)$成立,证明了目标函数是单调的.

接下来证明目标函数${F}\left( {{X}(t)} \right)$的子模性. 若$ {F}\left( {{X}(t)} \right) $满足“边际效应递减”性质,则它具有子模性. 向集合$\varepsilon (t)$中添加一个元素的边际增益至少与它的超集中添加一个元素的边际增益相等,即满足

$ \begin{split} &{F}\left( {\varepsilon (t) \cup \{ a(t)\} } \right) - {F}\left( {\varepsilon (t)} \right) \geqslant \\& {\text{ }}{F}\left( {{\varepsilon ^\prime }(t) \cup \{ a(t)\} } \right) - {F}\left( {{\varepsilon ^\prime }(t)} \right){\text{.}} \end{split} $

式中:$\varepsilon (t) \subseteq \varepsilon {(t)^\prime } \in {X}(t)$,$a(t) \in {G}(t)\backslash {\varepsilon ^\prime }(t)$. 根据式(46),可以推导出如下的边际效应关系.

$ \begin{split} &{\varDelta _{{F}\left( t \right)}}\left( {\left. {a(t)} \right|\varepsilon (t)} \right) = {F}\left( {\varepsilon (t) \cup \{ a(t)\} } \right) - {F}\left( {\varepsilon (t)} \right) =\\ & \sum\limits_{{{\tilde x}_{ij}}^\prime (t) \in {X}(t)\backslash \varepsilon \left( t \right)} {{{\tilde x}_{ij}}^\prime (t){U_{ij}}(t)} {\text{.}} \end{split} $

$ \begin{split}& {\varDelta _{{F}\left( t \right)}}(\left. {a(t)} \right|{\varepsilon ^\prime }(t)) = {F}({\varepsilon ^\prime }(t) \cup \{ a(t)\} ) - {F}({\varepsilon ^\prime }(t)) = \\& \sum\limits_{{{\tilde x}_{ij}}^\prime (t) \in {X}(t)\backslash \varepsilon \left( t \right)} {{{\tilde x}_{ij}}^\prime (t){U_{ij}}(t)} {\text{.}} \end{split} $

可以看出,${\Delta _{{F}(t)}}\left( {\left. {a(t)} \right|\varepsilon (t)} \right) = {\Delta _{{F}(t)}}\left( {\left. {a(t)} \right|{\varepsilon ^\prime }(t)} \right)$,满足“边际效应递减”性质,证明了函数${F}\left( {{X}(t)} \right)$的子模性,从而证明了定理1存在的合理性. 此时,可以将最小化问题${P_{4.3}}$转化为最大化问题,求解最优策略.

将问题${P_{4.3}}$重新表示为拟阵约束的单调子模问题的最大问题:

在拟阵约束的情况下,根据“边际效应递减”性质,结合贪婪算法的思想,设计策略选择算法,解决问题$ {P_{4.4}} $ . 设置${\tilde x_{ij}}(t) \in {G}(t)\backslash {X}(t)$,定义函数$ {F}\left( {{X}(t)} \right) $的边际增益为

$ \begin{split} &{\varDelta _{{F}\left( t \right)}}\left( {\left. {{{\tilde x}_{ij}}(t)} \right|{X}(t)} \right) = \\ &{\text{ }}{F}\left( {{X}(t) \cup \{ {{\tilde x}_{ij}}(t)\} } \right) - {F}\left( {{X}(t)} \right). \end{split} $

初始化集合${X}(t)、{{X}_i}(t)、{{X}_j}(t)$$(\forall i \in {N}$,$\forall j \in {K})$为空集$\phi$,其中${X}(t)$为D2D的策略选择集合. ${{X}_i}(t)$包含了DTi将任务卸载到哪个NR的决策集合. ${{X}_j}(t)$表示NRj辅助哪些DTs的决策集合. 在初始化完成后,用户匹配策略选择算法设计如下.

算法1 策略选择算法

输入 设置集合${H}(t) = {G}(t)\text{,}$ $\;{X}(t) = \phi\text{,} $$\;{{X}_i}(t) = \phi\text{.} $${{X}_j}(t) = \phi $

输出 D2D决策匹配集合$ {X}{{(t)}} $

{Repeat

计算

${\tilde x_{ij}}\left( t \right) = \mathop {\arg \max }\limits_{{{\tilde x}_{ij}}\left( t \right) \in {H}\left( t \right)\backslash {X}\left( t \right)} {\varDelta _{{F}\left( t \right)}}\left( {\left. {{{\tilde x}_{ij}}(t)} \right|{X}(t)} \right) $

//计算每个${\tilde x_{ij}}(t) \in {H}(t)\backslash {X}(t)$元素的边际效用函数${\varDelta _{{F} \left( t \right)}} \left( \left. {{{\tilde x}_{ij}}(t)} \right| \right. \left. {X}(t) \right)$的最大边际增益

更新集合${X}(t) = {X}(t) \cup {\tilde x_{ij}}\left( t \right)\text{,}$$ \; {{X}_i}(t) = {{X}_i}(t) \cup {\tilde x_{ij}}\left( t \right)\text{,}$${{X}_j}(t) = {{X}_j}(t) \cup {\tilde x_{ij}}\left( t \right)$

更新集合${H}(t) = {H}(t)\backslash {A_i}(t)$// DTi此时不匹配其他任何NR

{If $\left| {{{X}_j}(t)} \right| = {N_{{\rm{max}}}}$, 更新集合${H}(t) = {H}(t)\backslash {B_j}(t)$

}//End if NRj此时不辅助其他任何DT

直到${H}(t) = 0$或者${\varDelta _{{F}\left( t \right)}}\left( {\left. {{{\tilde x}_{ij}}(t)} \right|{X}(t)} \right) = 0$

}//End repeat

3.2.4. ODMRA算法和最优值分析

通过考虑D2D用户卸载决策、CPU-周期频率、传输功率分配和收集的电池能量,将ODMRA算法总结在算法2中. 求解问题${P_3}$的计算复杂度为$O(N+K)$,本方案通过交替迭代解决子问题${P_{4.1}}$${P_{4.2}}$${P_{4.3}}$来优化目标问题${P_4}$,假设迭代过程中的最大迭代次数为$\kappa $,在每次迭代中复杂度为$O(2(N+K)+NK)$,因为在地面集合${G}(t)$中有NK 个元素,求解${P_{4.3}}$的时间复杂度为$O(NK)$. 本文所提ODMRA算法的计算复杂度为$O(N+K+\kappa (2(N+K)+NK))$.通过对算法复杂度进行理论分析可知,与匹配博弈算法相比,本文算法的复杂度更低,可以更好地应用于实际系统.

算法2  ODMRA算法

输入 每个时隙开始的时刻,获取$ {A_i}(t)、{H_{ij}}(t)、 {H_{j{\mathrm{s}}}}(t)、 {B_i}(t)、{B_j}(t)、Q_j^{{\rm{NR}}}(t),\forall i \in {N},\forall j \in {K} $和控制参数V.

输出 $ f_i^{{\mathrm{DT}},{\text{*}}}(t)、f_j^{{\mathrm{NR}},{\text{*}}}(t)、P_{ij}^{{\mathrm{DT}},{\text{*}}}(t)、P_{j{\mathrm{s}}}^{{\mathrm{NR}},{\text{*}}}(t)、x_{ij}^{\text{*}}(t) $

{While $t \leqslant {t_{{\mathrm{end}}}}$

根据式(30)、(31),得到$e_i^*(t)、e_j^*(t)$.

随机初始化:$x_{ij}^{(0)}(t)$$f_i^{{\mathrm{DT}},(0)}(t)$$f_j^{{\mathrm{NR}},(0)}(t)$$P_{ij}^{{\mathrm{DT}},(0)}(t)$$P_{j{\mathrm{s}}}^{{\mathrm{NR}},(0)}(t)$, 迭代次数$\kappa = 0$

{Repeat

给定$x_{ij}^{(\kappa )}(t)、f_j^{{\mathrm{NR}},(\kappa )}(t)、P_{ij}^{{\mathrm{DT}},(\kappa )}(t)、P_{j{\mathrm{s}}}^{{\mathrm{NR}},(\kappa )}(t)$,通过式(36)计算$f_i^{{\mathrm{DT}},(\kappa +1)}(t)$

给定$x_{ij}^{(\kappa )}(t)、f_i^{{\mathrm{DT}},(\kappa +1)}(t)、P_{ij}^{{\mathrm{DT}},(\kappa )}(t)、P_{j{\mathrm{s}}}^{{\mathrm{NR}},(\kappa )}(t)$,通过式(38)计算$f_j^{{\mathrm{NR}},(\kappa +1)}(t)$

给定$x_{ij}^{(\kappa )}(t)、f_i^{{\mathrm{DT}},(\kappa +1)}(t)、f_j^{{\mathrm{NR}},(\kappa +1)}(t)、P_{j{\mathrm{s}}}^{{\mathrm{NR}},(\kappa )}(t),$通过式(40)计算$P_{ij}^{{\mathrm{DT}},(\kappa +1)}(t)$

给定$x_{ij}^{(\kappa )}(t)、f_i^{{\mathrm{NR}},(\kappa +1)}(t)、f_j^{{\mathrm{NR}},(\kappa +1)}(t)、 $$P_{ij}^{{\mathrm{DT}},(\kappa +1)}(t) $,通过式(43)计算 $P_{j{\mathrm{s}}}^{{\mathrm{NR}},(\kappa +1)}(t)$

给定$ f_i^{{\mathrm{DT}},(\kappa +1)}\,(t)、f_j^{{\mathrm{NR}},(\kappa +1)}\,(t) 、P_{ij}^{{\mathrm{DT}},(\kappa +1)} \,(t) 、$ $ P_{j{\mathrm{s}}}^{{\mathrm{NR}},(\kappa +1)} (t) $${\small{,通过算法1计算}}x_{ij}^{(\kappa +1)}(t)$

在下一次迭代中输出$ f_i^{{\mathrm{DT}},(\kappa +1)}(t)、f_j^{{\mathrm{NR}},(\kappa +1)}(t)、 $$ P_{ij}^{{\mathrm{DT}},(\kappa +1)}(t)、P_{j{\mathrm{s}}}^{\mathrm{{NR}},(\kappa +1)}(t)、x_{ij}^{(\kappa +1)}(t) $

$\kappa = \kappa +1 $

Until 收敛

输出$ f_i^{{\mathrm{DT}},{\text{*}}}(t)、f_j^{{\mathrm{NR}},{\text{*}}}(t)、P_{ij}^{{\mathrm{DT}},{\text{*}}}(t)、P_{j{\mathrm{s}}}^{{\mathrm{NR}},{\text{*}}}(t)、 x_{ij}^{\text{*}}(t) $

}//End repeat

t = t+1

}//End while

4. 仿真分析

考虑半径为200 m的圆形区域,配备了MEC服务器的BS位于该区域的中心. NRs和DTs分别随机分布在半径分别为50~150 m和150~200 m的环状区域内. 仿真参数基于文献[12]和[16]设置. DT生成的任务在$1.0 \times {10^4}\sim2.0 \times {10^4}$ bits/s内呈均匀分布.信道功率增益呈平均值为${g_0} {(d/{d_0})^{ - 4}}$的指数分布. 时隙数T = 200, DTs的数量Nmax = 10, NRs的数量K= 4, W = 1 MHz, $ {\tau _0} = 0.1{\text{ s}} $, ${\sigma ^2} = {10^{ - 12}}{\text{ W}}$,${\gamma _i} = {\gamma _j} = [1,1.1,1.2,1.3]$ cycles/bit,${\kappa _1} = {10^{ - 12}}$${\kappa _2} = {10^{ - 16}}$, d0 = 1, g0 = −40 dB. 为了评估本文算法的性能,最大程度地消除单次运行的随机性对仿真结果造成的误差,因此进行100次蒙特卡罗模拟,对最终的仿真结果取平均值.

本文的对比算法如下. 1)基线1:只考虑MEC服务器的执行和本地执行,而附近的设备只作为中继设备,无法执行计算任务. 2)基线2:NRs仅用于通过D2D通信卸载任务,不作为中继设备. 3)随机算法:DTs和NRs在D2D中随机匹配的算法. 4) SADLS算法:Long等[12]提出的使用匹配博弈的方法进行D2D的策略选择算法. 5)Q-learning算法.

近端发送设备NR的队列长度随时隙数t变化的图像如图2所示. 随着时间的增加,近端发送设备的队列长度逐渐增加并趋于稳定.这是由于ODMRA算法可以通过最小化目标函数,调整惩罚函数的大小来调整任务到达率和任务处理率之间的动态关系,使得李雅普诺夫漂移项逐渐减小,系统逐渐趋于稳定状态. 仿真图像显示了李雅普诺夫漂移惩罚函数的上界,证明了本文算法的有效性.

图 2

图 2   辅助设备队列长度随时隙数的变化

Fig.2   NR’s queue length with number of time slot


2种设备的虚拟电池队列随着时间变化的图像如图3所示. NRs的计算能力大于DTs,故NRs的电池容量大于DTs. 随着时间的增加,2种设备的虚拟电池队列长度在本文算法的优化下逐渐减小并逐渐稳定在扰动参数${\theta _i}$${\theta _j}$附近,验证了电池水平的下界.

图 3

图 3   电池队列长度随时隙数的变化

Fig.3   Battery queue length with number of time slot


图45所示,比较了2种移动设备数量改变时辅助设备队列长度的变化,图4显示了辅助设备数量为4时,队列长度随着DT数量NDTs的增加而增加. 随着任务数量的增加,D2D传输和辅助设备计算的任务量增加.在系统任务处理能力不变的情况下,移动设备产生的计算任务将会在NR中不断积累,导致队列长度增加,近端设备的队列需要更长的时间达到稳定状态. 图5中,当DT的数量固定为10时,队列长度随着NR数量NNRs的增加而减小. 这是因为随着辅助设备数量的增加,在任务到达率不变的情况下,系统的任务处理能力提升,队列积压减小.

图 4

图 4   不同数量DTs下队列长度随时隙数的变化

Fig.4   Change of queue length with number of time slot under different quantities of DTs


图 5

图 5   不同数量NRs下队列长度随时隙数的变化

Fig.5   Change of queue length with number of time slot under different quantities of NRs


图6所示为不同算法下时隙长度对系统性能的影响. 可知,执行延迟越长,系统的服务成本越小. 所有算法的系统服务成本都随着${\tau _{\mathrm{0}}}$的增加而减小,其中本文算法的平均服务成本性能最好,验证了该算法的有效性. 随着${\tau _{\mathrm{0}}}$的增加,本文算法、随机匹配算法和SADLS算法均可达到相似的平均服务成本. 由于信道条件的不确定性,基线1和基线2的算法性能明显最差.

图 6

图 6   平均服务成本随时隙长度的变化

Fig.6   Change of average service cost with length of time slot


图7所示为不同算法下平均任务到达率${\lambda _i}$的变化对系统性能的影响. 图中,$\bar E$为平均能量消耗. 由于未能充分利用系统资源,基线1、基线2和随机算法的平均能耗随着${\lambda _i}$的增加而出现大幅度上升. Q-learning算法、SADLS算法和本文算法都设计了卸载决策和资源分配方案,显著降低了系统平均能耗. 其中Q-learning算法通过训练过程生成的Q表是静态的,这意味着Q表一旦被创建,它就不能根据系统状态的实时变化(如队列积压或长期成本的变化)进行动态调整,故会导致平均能耗较高. SADLS算法采用匹配博弈,每个用户追求自身利益最大化,各方之间的利益冲突可能会导致参与者失去利益,得到较差的纳什均衡解,故算法性能较差且不稳定. 本文算法在决策选择时,从系统的整体性能出发,将问题拆分成单个子模块后逐个进行优化,每个参与者可以分配相对公平和合理的资源. 在该模型中,本文算法相较于其他算法能耗更低且更加稳定.

图 7

图 7   平均能量消耗随平均任务到达率的变化

Fig.7   Change of average energy consumption with average task arrival rate


5. 结 语

本文研究具有社会关系属性的D2D-MEC网络的任务卸载和资源分配框架,即具有空闲计算能力的附近设备发挥中继作用,帮助远程发送设备执行或进一步将其任务转移到MEC服务器.将具有QoS和能量队列稳定性约束的平均服务成本最小化的随机优化问题表述为一系列的短期确定性优化问题. 设计基于李雅普诺夫优化的ODMRA算法解决该问题. 该算法对设备收集的能量、CPU计算频率、发射功率及D2D链路匹配决策进行优化. 仿真结果和理论分析表明,在任务随机到达、系统状态时变的情况下,该算法提高了队列稳定性,减少了能量消耗,且算法复杂度较低,优于其他算法.

参考文献

LIU Y, PENG M, SHOU G, et al

Toward edge intelligence: multiaccess edge computing for 5G and Internet of Things

[J]. IEEE Internet of Things Journal, 2020, 7 (8): 6722- 6747

DOI:10.1109/JIOT.2020.3004500      [本文引用: 1]

韩晓非, 宋青芸, 韩瑞寅, 等

移动边缘计算卸载技术综述

[J]. 电讯技术, 2022, 62 (9): 1368- 1376

[本文引用: 1]

HAN Xiaofei, SONG Qingyun, HAN Ruiyin, et al

Survey on mobile edge computing offloading technology

[J]. Telecommunication Engineering, 2022, 62 (9): 1368- 1376

[本文引用: 1]

韩英斌. 基于博弈论的D2D辅助MEC计算卸载与资源分配联合优化算法研究[D]. 长春: 吉林大学, 2023.

[本文引用: 1]

HAN Yingbin. Research on D2D assisted MEC computation offloading and resource allocation joint optimization algorithm based on game theory [D]. Changchun: Jilin University, 2023.

[本文引用: 1]

方韬, 杨旸, 陈佳馨

D2D辅助移动边缘计算下的卸载策略优化

[J]. 计算机科学, 2022, 49 (Suppl. 1): 601- 605

[本文引用: 1]

FANG Tao, YANG Yang, CHEN Jiaxin

Optimization of offloading decisions in D2D-assisted MEC networks

[J]. Computer Science, 2022, 49 (Suppl. 1): 601- 605

[本文引用: 1]

FANG T, YUAN F, AO L, et al

Joint task offloading, D2D pairing, and resource allocation in device-enhanced MEC: a potential game approach

[J]. IEEE Internet of Things Journal, 2021, 9 (5): 3226- 3237

PENG J, QIU H, CAI J, et al

D2D-assisted multi-user cooperative partial offloading, transmission scheduling and computation allocating for MEC

[J]. IEEE Transactions on Wireless Communications, 2021, 20 (8): 4858- 4873

DOI:10.1109/TWC.2021.3062616      [本文引用: 1]

GAO Y, TANG W, WU M, et al

Dynamic social-aware computation offloading for low-latency communications in IoT

[J]. IEEE Internet of Things Journal, 2019, 6 (5): 7864- 7877

DOI:10.1109/JIOT.2019.2909299      [本文引用: 1]

GAO Y, XIAO Y, WU M, et al

Dynamic social-aware peer selection for cooperative relay management with D2D communications

[J]. IEEE Transactions on Communications, 2019, 67 (5): 3124- 3139

DOI:10.1109/TCOMM.2019.2894138      [本文引用: 2]

LI Y, ZHANG Z, WANG H, et al

SERS: social-aware energy-efficient relay selection in D2D communications

[J]. IEEE Transactions on Vehicular Technology, 2018, 67 (6): 5331- 5345

DOI:10.1109/TVT.2018.2810162      [本文引用: 3]

SUN M, XU X, HUANG Y

Resource management for computation offloading in D2D-aided wireless powered mobile-edge computing networks

[J]. IEEE Internet of Things Journal, 2020, 8 (10): 8005- 8020

[本文引用: 1]

JIANG C, CAO T, GUAN J

Intelligent task offloading and collaborative computation over D2D communication

[J]. China Communications, 2021, 18 (3): 251- 263

DOI:10.23919/JCC.2021.03.020      [本文引用: 1]

LONG H, XU C, ZHENG G, et al

Socially-aware energy-efficient task partial offloading in MEC networks with D2D collaboration

[J]. IEEE Transactions on Green Communications and Networking, 2022, 6 (3): 1889- 1902

DOI:10.1109/TGCN.2022.3153956      [本文引用: 4]

SUDEVALAYAM S, KULKARNI P

Energy harvesting sensor nodes: survey and implications

[J]. IEEE Communications Surveys and Tutorials, 2010, 13 (3): 443- 461

[本文引用: 1]

HU H, SONG W, WANG Q, et al

Energy efficiency and delay tradeoff in a MEC-enabled mobile IoT network

[J]. IEEE Internet of Things Journal, 2022, 9 (17): 15942- 15956

DOI:10.1109/JIOT.2022.3153847      [本文引用: 1]

XU C, GAO C, ZHOU Z, et al

Social network-based content delivery in device-to-device underlay cellular networks using matching theory

[J]. IEEE Access, 2017, 5: 924- 937

DOI:10.1109/ACCESS.2016.2621010      [本文引用: 1]

HU H, WANG Q, HU, et al

Mobility-aware offloading and resource allocation in a MEC-enabled IoT network with energy harvesting

[J]. IEEE Internet of Things Journal, 2021, 8 (24): 17541- 17556

DOI:10.1109/JIOT.2021.3081983      [本文引用: 3]

DENG Y, CHEN Z, YAO X, et al

Parallel offloading in green and sustainable mobile edge computing for delay-constrained IoT system

[J]. IEEE Transactions on Vehicular Technology, 2019, 68 (12): 12202- 12214

DOI:10.1109/TVT.2019.2944926      [本文引用: 1]

ZHANG G, ZHANG W, CAO Y, et al

Energy-delay tradeoff for dynamic offloading in mobile-edge computing system with energy harvesting devices

[J]. IEEE Transactions on Industrial Informatics, 2018, 14 (10): 4642- 4655

DOI:10.1109/TII.2018.2843365      [本文引用: 1]

ZHANG Q, GUI L, HOU F, et al

Dynamic task offloading and resource allocation for mobile-edge computing in dense cloud RAN

[J]. IEEE Internet of Things Journal, 2020, 7 (4): 3282- 3299

DOI:10.1109/JIOT.2020.2967502      [本文引用: 1]

FENG J, PEI Q, YU F R, et al

Dynamic network slicing and resource allocation in mobile edge computing systems

[J]. IEEE Transactions on Vehicular Technology, 2020, 69 (7): 7863- 7878

DOI:10.1109/TVT.2020.2992607      [本文引用: 1]

NEELY M. Stochastic network optimization with application to communication and queueing systems [M]. San Rafael: Springer Nature, 2022.

[本文引用: 1]

GRIPPO L, SCIANDRONE M

On the convergence of the block nonlinear Gauss–Seidel method under convex constraints

[J]. Operations research letters, 2000, 26 (3): 127- 136

DOI:10.1016/S0167-6377(99)00074-7      [本文引用: 1]

YANG Y, ZHAO S, ZHANG W, et al

DEBTS: delay energy balanced task scheduling in homogeneous fog networks

[J]. IEEE Internet of Things Journal, 2018, 5 (3): 2094- 2106

DOI:10.1109/JIOT.2018.2823000      [本文引用: 2]

KUO T W, LIN K C J, TSAI M J

Maximizing submodular set function with connectivity constraint: theory and application to networks

[J]. IEEE/ACM Transactions on Networking, 2014, 23 (2): 533- 546

[本文引用: 1]

/