浙江大学学报(工学版), 2024, 58(4): 664-673 doi: 10.3785/j.issn.1008-973X.2024.04.002

计算机与控制工程

面向实时决策的物联网时效与失真性能研究

王艳芳,, 王伟, 董云泉,

1. 南京信息工程大学 电子与信息工程学院,江苏 南京 210044

Study of timeliness and distortion performance for real-time decision making in IoT

WANG Yanfang,, WANG Wei, DONG Yunquan,

1. School of Electronics and Information Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, China

通讯作者: 董云泉,男,教授,博士. orcid.org/0000-0001-5282-4245. E-mail:yunquandong@nuist.edu.cn

收稿日期: 2023-08-29  

基金资助: 国家自然科学基金资助项目(62071237).

Received: 2023-08-29  

Fund supported: 国家自然科学基金资助项目(62071237).

作者简介 About authors

王艳芳(1998—),女,硕士生,从事无线网络通信研究.orcid.org/0009-0000-9512-4791.E-mail:20211218041@nuist.edu.cn , E-mail:20211218041@nuist.edu.cn

摘要

在物联网中,传感器及时、准确地数据传输是决策单元获得有效数据决策(如估计、推断或控制)的保障. 为了减小估计失真,决策单元同时使用多个数据包并利用最佳线性无偏估计量(BLUE)进行联合估计. 以决策信息年龄(AuD)和均方误差(MSE)分别度量系统决策时刻信息的时效性和失真,提出2种决策方案,研究所提方案的信息时效性与失真性能. 在固定数量数据包的决策方案中,监测中心每收到固定数量数据包后进行一次估计;在固定时间间隔的决策方案中,监测中心每隔固定时间间隔进行一次估计. 通过调度系统的决策过程来最小化平均AuD和平均失真的加权和,实现系统的时效性和失真的关系平衡. 仿真结果表明,通过优化系统决策过程,所提方案可以实现在提升系统时效性的同时减小估计失真.

关键词: 物联网(IoT) ; 更新决策系统 ; 决策信息年龄(AuD) ; 估计失真 ; 决策调度

Abstract

The sensor's timely and accurately data transmission is a guarantee for the decision-making unit to obtain effective data for decision-making (e.g., estimation, inference, or control) in IoT. To reduce estimation distortion, the decision unit uses multiple packets concurrently for joint estimation by using the best linear unbiased estimator (BLUE). Age upon decisions (AuD) and mean-squared-error (MSE) were introduced as metrics to measure the timeliness and the distortion of the information at the decision moments of the system, respectively. Two decision-making strategies were proposed, and the information timeliness and the distortion performance of the proposed strategies were investigated. In the strategy of using a fixed number of packets for decision making, the monitoring center performed an estimation after per fixed number of packets were received. In the strategy of using fixed time intervals for decision making, the monitoring center made an estimation at fixed intervals. The relationship between the system timeliness and the distortion was balanced by scheduling the decision process of the system to minimize the weighted sum of average AuD and average distortion. Simulation results show that the proposed strategies can improve the system timeliness and reduce the distortion performance by scheduling the decision-making process of the system.

Keywords: internet of things (IoT) ; update-and-decide system ; age upon decisions (AuD) ; estimation distortion ; decision scheduling

PDF (1538KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王艳芳, 王伟, 董云泉. 面向实时决策的物联网时效与失真性能研究. 浙江大学学报(工学版)[J], 2024, 58(4): 664-673 doi:10.3785/j.issn.1008-973X.2024.04.002

WANG Yanfang, WANG Wei, DONG Yunquan. Study of timeliness and distortion performance for real-time decision making in IoT. Journal of Zhejiang University(Engineering Science)[J], 2024, 58(4): 664-673 doi:10.3785/j.issn.1008-973X.2024.04.002

时延敏感应用包括智能车联网[1-2]、无线智能相机网络[3]、无人机网络通信[4-5]、工业4.0、智慧医疗[6]和智慧城市[7]等,这些应用的关键环节涉及系统状态信息的收集、处理以及使用,要求及时有效的信息交付. 传统性能指标(如时延和吞吐量)以数据为中心,主要关注信息传输环节的时延,不能有效衡量信息的时效性. 作为一种新的时效性指标,信息年龄(age of information,AoI)[8-9]被定义为接收机最新可用数据包的年龄,即数据包在源节点生成以来所经过的时间. Yates等[10-12]总结了使用AoI表征信息新鲜度的相关研究.

特定时刻上可用信息的时效性直接影响网络/系统的控制,因而备受物联网应用研究者的关注. 例如,在车联网中,收集车辆状态信息更关注车辆接近路口或发生紧急情况的时刻,即状态信息用于动态规划路线或调整行驶速度的时刻;在工业4.0现代工厂中,终端处理人员收集设备故障时的状态信息,以便做出合理调整. Dong等[13]引入决策信息年龄(age upon decisions,AuD)来表征所接收的数据包在决策时刻的信息新鲜度. AuD比其他时效性度量指标更关注特定时刻的新鲜度,这些时刻的信息对于物联网应用的实时决策更有价值. 更新决策系统根据接收到的数据包做出随机决策,面向实时决策的物联网更新系统将接收到的数据包用于决策,因而决策时刻信息的时效性至关重要. 学者研究了不同排队模型下的系统平均AuD. Dong等[13]提出使用AuD表征决策时刻的信息新鲜度,研究了M/M/1/M排队策略下更新决策系统的AuD. 沿着相似的路线,Dong等[14]进一步推导了G/G/1/M和G/M/1/M排队策略下更新决策系统平均AuD的闭式解. Dong等[15]通过优化数据的生成过程来降低泊松决策系统的平均AuD,分析了周期性决策系统D/M/1/D的平均AuD. Bao等[16]探讨了不同服务时间分布对M/G/1/M和M/G/1/D更新决策系统时效性的影响. Chen等[17]研究了无缓冲队列更新决策系统的AuD,从服务调度和决策过程两方面对系统性能进行了优化.

时效性是基于物联网的传感系统的重要性能指标. 在提高信息新鲜度的过程中,如果系统的失真增大,恢复信号将无法准确地描述现象,可能导致错误的决策. 因此,在考虑系统时效性的同时,还必须考虑状态更新系统的失真性能[18]. 通常采用解码(或估计)信号的均方误差(MSE)来度量信号的失真. 例如,对具有有限节点分布式的传感器系统,常将传感器观测值与最佳线性无偏估计量(best linear unbiased estimator, BLUE)结合来估计信号源的失真[19]. Ornee等[20]提出在远程估计中生成及时更新的问题,研究了通过队列估计维纳过程的MSE最优策略和AoI最优策略. Bastopcu等[21]讨论的信息更新系统权衡了服务性能和信息新鲜度,在给定的更新质量约束下,通过数据处理降低了信息年龄. 为了实现及时准确的边缘推断,在平均推理失真约束条件下,Qiao等[22]提出优化边缘推理系统准确性和新鲜度之间权衡的框架. Bastopcu等[21-22]都是在给定阈值下进行新鲜度和失真的权衡,以最小化信息年龄.

在实际应用中,边缘计算应用于物联网能够在一定程度上提高系统的时效和失真性能. 例如,在自动驾驶车联网中,各个车载传感器感知内外部环境,并生成位置、速度、道路拥堵情况等信息. 传输主路侧单元对数据信息进行计算并传输至车载控制器,控制器根据接收到的数据包做出驾驶决策(如控制车辆转向、减速或停止等),实时传输的数据可带有部分可接受的失真[23]. 信息的时效性对于监测中心非常重要,数据收集和传输的延迟、数据源的准确性等因素可能会导致交通信息的失真. 为了平衡信息新鲜度和失真,车联网系统通过多源数据融合、实时数据处理和数据验证机制,以提供尽可能准确和及时的交通信息. 在面向实时决策的物联网更新系统中,频繁实施决策即降低AuD会导致恢复信号的失真增大;决策频率适当降低,在一定的决策间隔内接收到的数据包增多,失真的减小可能会使AuD增大. 本研究针对如何在决策过程中同时提高信息的时效与失真性能问题,通过优化平均AuD和平均失真的加权,平衡面向实时决策的物联网更新系统时效性和失真.

1. 系统模型

图1所示,物联网更新决策系统由传感器、服务器(传输控制单元和传输链路)和监测中心(目的节点和决策单元)组成. 时间是离散的,并被划分为单位长度的时隙. 在没有碰撞的条件下,假设每个数据包可以在1个时隙内准确完成传输. 各数据包到达与离开都发生在时隙边界,监测中心的每一次决策也发生在时隙边界. 假设传感器生成数据包的过程遵循速率$\lambda $的伯努利过程,并将数据包存储在一个充分长的缓冲区中;服务器的服务时间服从参数为$\mu $的几何分布,根据先到先服务(first-come-first-served, FCFS)策略将数据包交付监测中心,有待进一步决策.

图 1

图 1   物联网更新决策系统

Fig.1   IoT update-and-decide system


1.1. 传感模型

图2所示,传感器对源信号$\theta $进行观测,观测结果$\tilde \theta $将被直接放大和前向模拟传输. 放大后的信号通过具有单位功率增益和噪声功率的高斯信道进行传输. 监测中心根据接收到的信号$\hat \theta $,对有一定失真要求的源信号进行估计. 对传感模型进行如下假设:1)$\theta $为服从均值为零和方差为$\sigma _\theta ^2$的高斯随机变量建模的标量参数,即$\theta \sim {\text{N}}\left( {0,\sigma _\theta ^2} \right)$;2)每次采样被编码为1个数据包并被传输,直至监测中心接收到$K$个数据包后进行联合估计;3)在传感器和监测中心之间的信道是带有加性高斯白噪声(additive white Gaussian noise, AWGN)的信道;4)传感器和监测中心的时间同步;5)监测中心具有强计算能力,可以通过有效的信道估计获取信道状态信息.

图 2

图 2   传感模型

Fig.2   Sensing model


在传输过程中,传感器上的观测结果$\tilde \theta $受到高斯观测噪声${n_{{\text{ob}}}}$的影响,可以描述为$\tilde \theta = \theta +{n_{{\text{ob}}}}$,其中${n_{{\text{ob}}}}$为均值为0、方差为$\sigma _{{\text{ob}}}^2$的高斯噪声,即${n_{{\text{ob}}}} \sim {\text{N}}\left( {0,\sigma _{{\text{ob}}}^2} \right)$. 在此基础上,定义传感器的局部观测信噪比${\gamma _{{\text{ob}}}} = {{\sigma _\theta ^2} \mathord{\left/ {\vphantom {{\sigma _\theta ^2} \sigma }} \right. }} \sigma _{{\text{ob}}}^2$. 本研究采用非编码方案[19]$\tilde \theta $被直接放大并传输,即$\tilde \theta $$\alpha $为功率放大系数增大,其中$\alpha = {{{P_{\text{t}}}} \mathord{\left/ {\vphantom {{{P_{\text{t}}}} {\left( {\sigma _\theta ^2+\sigma _{{\text{ob}}}^2} \right)}}} \right. } {\left( {\sigma _\theta ^2+\sigma _{{\text{ob}}}^2} \right)}}$${P_{\text{t}}}$为传感器的发射功率. 经放大后的$\tilde \theta $通过噪声功率为$\sigma _{{\text{ch}}}^2$的高斯信道传输到监测中心,其中信道的衰落功率增益$g = 1$,信道的信噪比$ {\gamma _{{\text{ch}}}} = {g \mathord{\left/ {\vphantom {g {\sigma _{{\text{ch}}}^2}}} \right. } {\sigma _{{\text{ch}}}^2}} $.$K$个数据包通过信道传输并在监测中心依次被接收后,监测中心采用BLUE从接收向量${\boldsymbol{X}}$中估计源信号$\theta $的幅度. 此时, ${\boldsymbol{X}} = {\boldsymbol{h}}\theta +{\boldsymbol{w}}$,其中$ \boldsymbol{h}=\left[\sqrt{\alpha g},\sqrt{\alpha g},\cdots,\sqrt{\alpha g}\right]^{\text{T}} $为已知的$K$维信道状态信息向量, $ \boldsymbol{w} $$K \times 1$的噪声矢量,主要由观测噪声${n_{{\text{ob}}}}$和信道噪声${n_{{\text{ch}}}}$组成. 非编码传感系统的失真[24]计算式为

$ D = \sigma _\theta ^2{\left( {\sum\limits_{k = 1}^K {\frac{{\alpha _k^{'}{\gamma _{{\text{ch}}k}}}}{{\gamma _{{\text{ob}}k}^{ - 1}\alpha _k^{'}{\gamma _{{\text{ch}}k}}+1}}} } \right)^{ - 1}}. $

其中$ {\gamma _{{\text{ob}}k}} \,=\, {{\sigma _\theta ^2} / {\sigma _{{\text{ob}}k}^2}} $$\alpha _k^{'} \,=\, {{{P_{{\text{t}}k}}} / {\left( {1+\gamma _{{\text{ob}}k}^{ - 1}} \right)}}$$ {\gamma _{{\text{ch}}k}} \,=\, {{g_k}} / \sigma _{{\text{ch}}k}^2 = {1 / {\sigma _{{\text{ch}}k}^2}} $. 在如图2所示的传感模型中,一个传感器节点观测源信号,数据包通过单信道进行传输. 将$ {\gamma _{{\text{ob}}}} $$ {\gamma _{{\text{ch}}}} $代入式(1),推导出$K$个数据包被接收后,恢复信号$\hat \theta $的失真计算式为

$ \begin{split} {D_K} &= \sigma _\theta ^2{\left( {\frac{{K{\alpha ^{'}}{\gamma _{{\text{ch}}}}}}{{\gamma _{{\text{ob}}}^{ - 1}{\alpha ^{'}}{\gamma _{{\text{ch}}}}+1}}} \right)^{ - 1}}= \\ & \frac{{\sigma _\theta ^2}}{K}\left( {\frac{1}{{{\gamma _{{\text{ob}}}}}}+\frac{1}{{{\gamma _{{\text{ch}}}}}}+\frac{1}{{{\gamma _{{\text{ob}}}}{\gamma _{{\text{ch}}}}}}} \right);{\text{ }}K = 1,2, \cdots ,\infty .\end{split} $

1.2. 决策信息年龄

图3所示为AuD和AoI的样本路径示例. 在不失一般性的情况下,系统从$n = 0$开始运行,此时系统的缓冲区为空,系统的初始AoI为${\varDelta _0}$. 将第$k$个数据包的到达时间和离开时间分别表示为${n_k}$$n_k^{'}\left( {k = 1,2, \cdots,\infty } \right)$.$n_{k - 1}^{'}$$n_k^{'}$时间段内,由于目的节点没有收到来自传感器节点的新的数据包,目的节点处的AoI随时间增大. 一旦目的节点接收到新的数据包,AoI将会被重置为较小的值. 定义第$k - 1$个和第$k$个数据包之间的到达时间间隔${X_k} = {n_k} - {n_{k - 1}}$,第$k$个数据包的系统时间${T_k} = n_k^{'} - {n_k}$. 系统时间${T_k}$是等待时间${W_k}$和服务时间${S_k}$的总和,即${T_k} = {W_k}+{S_k}$. 2个相邻数据包的离开时间间隔${Y_k} = n_k^{'} - n_{k - 1}^{'}$,在此时段,将决策数表示为${N_k}$,第$j$个决策的决策时间表示为$ \tau_j\left(j=1,2,\cdots,\infty\right) $,相邻决策之间的决策时间间隔${Z_j} = {\tau _j} - {\tau _{j - 1}}$. 在每个离开间隔内,决策单元可能会做出多次决策,即前一个数据包被多次使用;也可能会没有做出任何决策,即前一个数据包没有被使用.

图 3

图 3   决策信息年龄和信息年龄的样本路径示例

Fig.3   Examples of sample paths for age upon decisions and age of information


与AoI度量中系统会度量数据包在接收后的每个时刻上的新鲜度不同,本研究通过AuD度量接收到的数据包在决策时刻的新鲜度. 具体来说,第$j$个决策的决策年龄等于当前决策时刻${\tau _j}$与传感器节点上最新成功传输的数据包的生成时刻$U\left( {{\tau _j}} \right)$之间的差值[13]

$ {\varDelta _{\text{D}}}\left( {{\tau _j}} \right) = {\tau _j} - U\left( {{\tau _j}} \right). $

在给定系统到达过程、服务过程和决策过程的情况下,假设在时间段$n$${N_n}$个决策,系统的平均决策年龄的计算式为

$ {\overline \varDelta _{\text{D}}} = \mathop {\lim }\limits_{n \to \infty } \frac{1}{{{N_n}}}\sum\limits_{j = 1}^{{N_n}} {{\varDelta _{\text{D}}}({\tau _j})} . $

1.3. 问题描述

在面向实时决策的物联网更新系统中,平均失真$\overline D$取决于用于联合估计的数据包数量. 如果监测中心频繁地使用接收数据包进行决策,决策将更加及时(${\overline \varDelta _{\text{D}}}$减小),但会导致$\overline D$增大;如果决策频率适当降低,那么在一定的决策间隔内接收到的数据包会增多,多个数据包间具有相关性进行联合估计会使$\overline D$减小,但${\overline \varDelta _{\text{D}}}$可能会增大. 为了找到系统时效与失真性能的最优折中,本研究通过调度决策过程来最小化AuD和失真均值的加权和,建立以平均决策年龄和平均失真加权和为目标函数的优化问题P0,即

$ \min {\text{ }}{\overline \varDelta _{\text{D}}}+\omega \overline D. $

式中: $\omega $为权重($\omega > 0$).

分别研究定包数决策和周期性决策的年龄与失真的平衡问题. 为了保证系统的失真性能,考虑使用固定数量数据包进行联合估计和决策的策略. 传感器通过高斯信道依次将$M$个数据包交付给监测中心,监测中心正确接收$M$个包后,决策单元在第$M$个包完成传输的时刻进行1次联合估计与决策,此时系统的失真会相对稳定. 为了保证系统决策的时效性,考虑固定时间间隔进行决策. 传感器通过高斯信道将数据包交给监测中心,监测中心每隔$m$个时隙执行1次估计与决策的调度策略.

2. 决策年龄分析

在给定数据包的到达过程和服务过程的情况下,通过排队论和数理统计方法研究2种不同决策方式下系统的平均AuD.

2.1. 定包数决策

对于定包数决策,信源将在各时隙上以概率$\lambda $进行一次采样并将所得数据包发送至目的节点. 监测中心利用$M$个连续接收的数据包进行联合估计并做出决策,因此决策时刻年龄为自首个数据包的生成时刻到当前的决策时刻(第$M$个包完成传输的离开时刻)的时间段. 具体来说,第$j$个决策的决策年龄等于后$M - 1$个数据包的到达时间间隔与第$M$个数据包的系统时间的累加,即

$ {\varDelta _{\text{D}}}\left( {{\tau _j}} \right) = {X_{j{\text{2}}}}+{X_{j3}}+ \cdots +{X_{jM}}+{T_{jM}}. $

式中: ${X_{jk}}$为第$j$次决策等待第$k$个数据包到达(生成)所需的到达时间间隔. 由于数据包的到达过程遵循速率为$\lambda $的伯努利过程,服务过程服从参数为$\mu $的几何分布,因此数据包的传输过程建模为Geom/Geom/1排队模型,到达时间间隔${X_{jk}}$的概率分布函数$P\left\{ {{X_{jk}} = i} \right\} = \lambda {\left( {1 - \lambda } \right)^{i - 1}},其中{\text{ }}i = 1,2, \cdots ,\infty $,可以得到$E\left[ {{X_{jk}}} \right] = {1 \mathord{\left/ {\vphantom {1 \lambda }} \right. } \lambda }$. 数据包传输的系统时间${T_{jk}}$服从参数为$\left( {1 - p} \right)$的几何分布[25],即

$ P\left\{ {{T_{jk}} = i} \right\} = \left( {1 - p} \right){p^{i - 1}};{\text{ }}i = 1,2, \cdots ,\infty . $

其中$p = {{\left( {1 - \mu } \right)} / {\left( {1 - \lambda } \right)}}$. ${T_k}\;$的期望$E\left[ {{T_k}} \right] = {\left( {1 - \lambda } \right)} / ( \mu - \lambda )$,在固定每$M$个数据包进行一次决策的情况下,系统的平均决策年龄为

$ \begin{split} {{\overline \varDelta }_{{\text{D}}M}}= &\mathop {\lim }\limits_{n \to \infty } E\left[ {{\varDelta _{\text{D}}}\left( {{\tau _j}} \right)} \right] = \left( {M - 1} \right)E\left[ {{X_k}} \right]+E\left[ {{T_k}} \right] =\\ & \frac{{M - 1}}{\lambda }+\frac{{1 - \lambda }}{{\mu - \lambda }}. \end{split} $

2.2. 周期性决策

研究使用周期性决策策略的更新决策系统的平均AuD. 信源在每时隙上以概率$\lambda $生成数据包,监测中心在第$m$个时隙做一次决策. 因此,数据包的到达间隔${X_k}$服从几何分布,系统服务时间${S_k}$服从几何分布,决策时间间隔${Z_j} = m$服从确定性分布,更新决策系统建模为Geom/Geom/1/D排队决策模型,即$P\left\{ {{S_k} = i} \right\} = \mu {\left( {1 - \mu } \right)^{i - 1}},其中{\text{ }}i = 1,2, \cdots ,\infty $$P \{ {Z_j} = m \} = 1$. 在这种策略下,将通过分析每个离开间隔${Y_k}$内包含决策的次数求解决策年龄. 对于每个${Y_k}$(对应于收到一个数据包)相应的分析分为如图4所示的2种情况进行考虑. 图中,向上的箭头代表一次决策,相邻决策间隔为$ m $时隙.

图 4

图 4   数据包的到达时间间隔与系统时间

Fig.4   Packet arrival time interval versus system time


情况1:当前数据包的系统时间不小于下一个数据包的到达时间间隔,即${X_k} \leqslant {T_{k - 1}}$. 在这种情况下,在数据包$k$的生成时刻${n_k}$,服务器处于忙碌状态(${T_{k - 1}}$未结束,数据包$k - 1$处于被服务状态). 因此,数据包$k$须等待一段时间,并在数据包$k - 1$离开后,立即得到服务. 此时,离开时间间隔${Y_k} = {S_k}$. 由情况1可以得到

$ \begin{gathered} P\left\{ {{X_k} \leqslant {T_{k - 1}}} \right\} = \sum\limits_{i = 1}^\infty {P\left\{ {{T_{k - 1}} = i} \right\}\sum\limits_{j = 1}^i {P\left\{ {{X_k} = j} \right\}} } = \frac{\lambda }{\mu } = \rho, \end{gathered} $

$ \begin{split}& E\left[ {{T_{k - 1}}\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right] = \\&\quad \frac{1}{\rho }\sum\limits_{i = 1}^\infty {iP\left\{ {{T_{k - 1}} = i} \right\}\sum\limits_{j = 1}^i {P\left\{ {{X_k} = j} \right\}} } = \frac{{2\mu - {\mu ^2} - \lambda }}{{\mu \left( {\mu - \lambda } \right)}}.\end{split} $

${Y_k} = {S_k}$得到

$ P\left\{ {{Y_k} = i\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right\} = \mu {\left( {1 - \mu } \right)^{i - 1}};{\text{ }}i = 1,2, \cdots ,\infty . $

由于时间是离散的,数据包的到达和离开以及决策都发生在时隙边界,那么系统时间${T_k}$是时隙长的整数倍. 假设${T_{k - 1}}$包含有$\zeta $个决策间隔,即${T_{k - 1}}$满足$\zeta m \leqslant {T_{k - 1}} < \left( {\zeta +1} \right)m$.${b_\zeta } = {T_{k - 1}} - \zeta m$${a_\zeta } = m - {b_\zeta }$,则有${a_\zeta } = \left( {\zeta +1} \right)m - {T_{k - 1}}$. 分析可知, $a$为在$\left\{ \right.1,2, \cdots , m\left. \right\}$上服从离散均匀分布的随机变量,概率分布为$P\left\{ {a = i} \right\} = {1 \mathord{\left/ {\vphantom {1 m}} \right. } m}$,其中${\text{ }}i = 1,2, \cdots ,m $;期望为$E\left[ a \right] = ( m+ 1 ) / 2$. 对于给定的$a$,在情况1中,假设离开时间间隔${Y_k}$中包含的决策次数为${N_{k1}}$

$ \begin{split}& P\left\{ {{N_{k1}} = 0} \right\} = P\left\{ {{Y_k} < a\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right\} = \\&\qquad \sum\limits_{i = 2}^m {P\left\{ {a = i} \right\}\sum\limits_{j = 1}^{i - 1} {P\left\{ {{Y_k} = j\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right\}} } =\qquad \\&\qquad 1 - \frac{1}{m}\sum\limits_{i = 1}^m {{{\left( {1 - \mu } \right)}^{i - 1}}} = {P_{{\text{s}}1}}. \end{split} $

$ \begin{split}& P\left\{ {{N_{k1}} = j} \right\} =\\ &\qquad P\left\{ {m\left( {j - 1} \right)+a \leqslant {Y_k} < mj+a\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right\} =\\&\qquad \sum\limits_{i = 1}^m {P\left\{ {a = i} \right\}\sum\limits_{l = m\left( {j - 1} \right)+i}^{mj+i - 1} {P\left\{ {{Y_k} = l\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right\}} } =\\&\qquad \frac{1}{m}\sum\limits_{i = 1}^m {{{\left( {1 - \mu } \right)}^{i - 1}}\left( {{{\left( {1 - \mu } \right)}^{m\left( {j - 1} \right)}} - {{\left( {1 - \mu } \right)}^{mj}}} \right)} =\\&\qquad \left( {1 - {P_{{\text{s}}1}}} \right)\eta _1^{j - 1}\left( {1 - {\eta _1}} \right);{\text{ }}j = 1,2, \cdots ,\infty . \end{split} $

其中$ {\eta _1} = {\left( {1 - \mu } \right)^m} $. ${Y_k}$中的决策次数${N_{k1}}$的期望和二阶矩分别为

$ E\left[ {{N_{k1}}} \right] = \frac{{\left( {1 - {P_{{\text{s}}1}}} \right)}}{{\left( {1 - {\eta _1}} \right)}}, \qquad\qquad\;$

$ E\left[ {{{\left( {{N_{k1}}} \right)}^2}} \right] = \frac{{\left( {1 - {P_{{\text{s}}1}}} \right)\left( {1+{\eta _1}} \right)}}{{{{\left( {1 - {\eta _1}} \right)}^2}}}. $

${Y_k}$内第$i$个决策的决策年龄为

$ {\varDelta _{\text{D}}}\left( {{\tau _{ki}}} \right) = {T_{k - 1}}+a+\left( {i - 1} \right)m;{\text{ }}i = 1,2, \cdots ,{N_{k1}}. $

由式(16)得到${Y_k}$${N_{k1}}$个决策的决策年龄总和为

$ \begin{gathered} \varDelta _{{\text{D}}k}^1 = \sum\limits_{i = 1}^{{N_{k1}}} {{\varDelta _{\text{D}}}\left( {{\tau _{ki}}} \right)} = {N_{k1}}\left( {{T_{k - 1}}+a - \frac{m}{2}} \right)+\frac{{m{{\left( {{N_{k1}}} \right)}^2}}}{2}. \end{gathered} $

因此,情况1的${Y_k}$内决策年龄的期望为

$ \begin{split}& E\left[ {\varDelta _{{\text{D}}k}^1\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right] = \\& \left( {E\left[ {{T_{k - 1}}\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right]+\frac{1}{2}} \right)E\left[ {{N_{k1}}} \right]+\frac{m}{2}E\left[ {{{\left( {{N_{k1}}} \right)}^2}} \right].\end{split} $

情况2:系统时间${T_{k - 1}}$小于到达时间间隔${X_k}$,即${X_k} > {T_{k - 1}}$. 在这种情况下,数据包$k - 1$$ n_{k - 1}^{'} $时刻完成服务时,数据包$k$还未生成. 此时,在数据包$k$到达之前,服务器将有一段空闲时间${X_k} - {T_{k - 1}}$. 2个数据包之间的离开间隔可以表示为${Y_k} = {X_k} - {T_{k - 1}}+{S_k}$,则有

$ P\left\{ {{X_k} > {T_{k - 1}}} \right\} = 1 - P\left\{ {{X_k} \leqslant {T_{k - 1}}} \right\} = 1 - \rho ,\qquad\;\;\;\;\;\;\;\; $

$ \begin{split}& E\left[ {{T_{k - 1}}\left| {{X_k} > {T_{k - 1}}} \right.} \right] = \\&\quad \frac{1}{{1 - \rho }}\sum\limits_{i = 1}^\infty {iP\left\{ {{T_{k - 1}} = i} \right\}\sum\limits_{j = i}^\infty {P\left\{ {{X_k} = j} \right\}} } = \frac{1}{{\mu \left( {1 - \lambda } \right)}}. \end{split} $

在情况2中,考虑将离开时间间隔${Y_k}$分为数据包$k$到达之前${Y_{k1}}$和到达之后$ {Y_{k2}} $两部分,即${Y_{k1}} = {X_k} - {T_{k - 1}}$${Y_{k2}} = {S_k}$.

$ \begin{split}& P\left\{ {{Y_{k1}} = i\left| {{X_k} > {T_{k - 1}}} \right.} \right\} = \\&\qquad\quad\; P\left\{ {{X_k} - {T_{k - 1}} = i\left| {{X_k} > {T_{k - 1}}} \right.} \right\} =\\&\qquad\quad\; \left( {1 - \rho } \right)\lambda {\left( {1 - \lambda } \right)^{i - 1}}; {\text{ }}i = 1,2, \cdots ,\infty. \end{split}$

$P\left\{ {{Y_{k2}} = i\left| {{X_k} > {T_{k - 1}}} \right.} \right\} = \mu {\left( {1 - \mu } \right)^{i - 1}}; {\text{ }}i = 1,2, \cdots ,\infty . $

将数据包$k - 1$的离开时刻$ n_{k - 1}^{'} $与随后的下一个决策时刻的距离记为$c$,数据包$k$的离开时刻$ n_k^{'} $与随后的下一个决策时刻的距离为$d$. 随机变量$c$$d$均服从离散型均匀分布,且$c$$d$同分布,其概率分布表示为$P\left\{ {c = i} \right\} = P\left\{ {d = i} \right\} = {1 / m}, 其中 {\text{ }}i = 1,2, \cdots ,m$,因而有$E\left[ c \right] = E\left[ d \right] = {{\left( {m+1} \right)} \mathord{\left/ {\vphantom {{\left( {m+1} \right)} 2}} \right. } 2}$. 假设在${Y_{k1}}$${Y_{k2}}$内所做决策的次数分别为${N_{k21}}$${N_{k22}}$. 在给定$c$的情况下,

$ \begin{split}& P\left\{ {{N_{k21}} = 0} \right\} = P\left\{ {{Y_{k1}} < c\left| {{X_k} > {T_{k - 1}}} \right.} \right\} =\qquad\quad\;\;\\&\quad \left( {1 - \rho } \right)\left( {1 - \frac{1}{m}\sum\limits_{i = 1}^m {{{\left( {1 - \lambda } \right)}^{i - 1}}} } \right) = {P_{{\text{s}}2}}. \end{split} $

$ \begin{split}& P\left\{ {{N_{k21}} = j} \right\} =\\&\quad P\left\{ {m\left( {j - 1} \right)+c \leqslant {Y_k} < mj+c\left| {{X_k} > {T_{k - 1}}} \right.} \right\} =\\&\quad \frac{{1 - \rho }}{m}\sum\limits_{i = 1}^m {{{\left( {1 - \lambda } \right)}^{i - 1}}\left( {{{\left( {1 - \lambda } \right)}^{m\left( {j - 1} \right)}} - {{\left( {1 - \lambda } \right)}^{mj}}} \right)} = \\&\quad \left( {1 - \rho } \right)\left( {1 - {P_{{\text{s}}2}}} \right)\eta _2^{j - 1}\left( {1 - {\eta _2}} \right);{\text{ }}j = 1,2, \cdots, \infty . \end{split} $

其中${\eta _2} = {\left( {1 - \lambda } \right)^m}$.${Y_{k1}}$中决策数${N_{k21}}$的一阶矩和二阶矩分别为

$ E\left[ {{N_{k21}}} \right] = \frac{{\left( {1 - \rho } \right)\left( {1 - {P_{{\text{s}}2}}} \right)}}{{\left( {1 - {\eta _2}} \right)}},\qquad\qquad \;$

$ E\left[ {{{\left( {{N_{k21}}} \right)}^2}} \right] = \frac{{\left( {1 - \rho } \right)\left( {1 - {P_{{\text{s}}2}}} \right)\left( {1+{\eta _2}} \right)}}{{{{\left( {1 - {\eta _2}} \right)}^2}}}. $

基于上述分析,随机变量$a$$c$同分布,且情况1中的${Y_k}$与情况2中的${Y_{k2}}$均服从参数为$\mu $的几何分布. 由此,对于给定的$d$,结合式(12)、(13)可以得到

$ P\left\{ {{N_{k22}} = 0} \right\} = 1 - \frac{1}{m}\sum\limits_{i = 1}^m {{{\left( {1 - \mu } \right)}^{i - 1}}} = {P_{{\text{s}}1}}. \qquad\qquad $

$ P\left\{ {{N_{k22}} = j} \right\} = \left( {1 - {P_{{\rm{s}}1}}} \right)\eta _1^{j - 1}\left( {1 - {\eta _1}} \right);{\rm{ }}j = 1,2, \cdots ,\infty . $

进一步得到${Y_{k2}}$中决策数目${N_{k22}}$的期望和二阶矩分别为

$ E\left[ {{N_{k22}}} \right] = E\left[ {{N_{k1}}} \right] = \frac{{\left( {1 - {P_{{\text{s}}1}}} \right)}}{{\left( {1 - {\eta _1}} \right)}},\qquad\qquad\quad\; \;\;$

$ E\left[ {{{\left( {{N_{k22}}} \right)}^2}} \right] = E\left[ {{{\left( {{N_{k1}}} \right)}^2}} \right] = \frac{{\left( {1 - {P_{{\text{s}}1}}} \right)\left( {1+{\eta _1}} \right)}}{{{{\left( {1 - {\eta _1}} \right)}^2}}}. $

在离开间隔${Y_k}$内第$i$个决策的决策年龄可以表示为

$ {\varDelta _{\text{D}}}\left( {{\tau _{ki}}} \right) = {T_{k - 1}}+c+\left( {i - 1} \right)m;{\text{ }}i = 1,2, \cdots ,{N_{k21}}+{N_{k22}}. $

由式(31)可以得到在离开时间间隔${Y_k}$$( {N_{k21}}+ {N_{k22}} )$个决策的决策年龄总和为

$ \begin{split} \varDelta _{{\text{D}}k}^2 = &\sum\limits_{i = 1}^{{N_{k21}}+{N_{k22}}} {{\varDelta _{\text{D}}}\left( {{\tau _{ki}}} \right)} = \left( {{N_{k21}}+{N_{k22}}} \right)\left( {{T_{k - 1}}+c - \frac{m}{2}} \right){\kern 1pt} + \\&\frac{{m{{\left( {{N_{k21}}+{N_{k22}}} \right)}^2}}}{2}. \\[-1pt]\end{split} $

情况2的${Y_k}$内决策年龄的均值为

$ \begin{split}& E\left[ {\varDelta _{{\text{D}}k}^2\left| {{X_k} > {T_{k - 1}}} \right.} \right] = \Bigg( E\left[ {T_{k - 1}}\left| {{X_k} > {T_{k - 1}}} \right. \right]+\Bigg. \\&\quad \left.\frac{1}{2} \right)\left( {E\left[ {{N_{k21}}} \right]+E\left[ {{N_{K22}}} \right]} \right)+\frac{m}{2}\left( E\left[ {{{\left( {{N_{k21}}} \right)}^2}} \right]+ \right. \\&\quad \left. 2E\left[ {{N_{k21}}} \right]E\left[ {{N_{k22}}} \right]+E\left[ {{{\left( {{N_{k22}}} \right)}^2}} \right] \right). \end{split} $

在包含$n$个时隙的一段时间内,记被接收的数据包数为$K$,记在此期间做的决策次数为${N_n}$. 在情况1中,系统在${Y_k}$内做出${K_1}$次决策;在情况2中,系统在${Y_k}$内做出${K_2}$次决策. 当$n$趋向于$\infty $时,有

$ \mathop {\lim }\limits_{n \to \infty } \frac{{{N_n}}}{K} = \frac{{E\left[ {{Y_k}} \right]}}{m} = \frac{1}{{m\lambda }}. $

其中$E\left[ {{Y_k}} \right] = E\left[ {{X_k}} \right] = {1 \mathord{\left/ {\vphantom {1 \lambda }} \right. } \lambda }$. 根据文献[13]中决策年龄的定义,结合式(18)、式(33)、式(34)和式(4),系统的平均决策年龄可以表示为

$ \begin{split} {{\overline \varDelta }_{\text{D}}} = &\mathop {\lim }\limits_{n \to \infty } \frac{1}{{{N_n}}}\sum\limits_{k = 1}^K {{\varDelta _{\text{D}}}_k} = \mathop {\lim }\limits_{n \to \infty } \frac{K}{{{N_n}}}\left( \frac{{{K_1}}}{K}\frac{1}{{{K_1}}}\sum\limits_{k = 1}^{{K_1}} \varDelta _{{\text{D}}k}^1+ \right. \\ &\left.\frac{{{K_2}}}{K}\frac{1}{{{K_2}}}\sum\limits_{k = 1}^{{K_2}} {\varDelta _{{\text{D}}k}^2} \right) = m\lambda \left( \rho E\left[ {\varDelta _{{\text{D}}k}^1\left| {{X_k} \leqslant {T_{k - 1}}} \right.} \right]+ \right. \\&\left. \left( {1 - \rho } \right)E\left[ {\varDelta _{{\text{D}}k}^2\left| {{X_k} > {T_{k - 1}}} \right.} \right] \right). \end{split} $

由式(14)、式(15)、式(25)、式(26)、式(29)和式(30),可以得到

$ \begin{split} {{\overline \varDelta }_{\text{D}}} =& \frac{\lambda }{\mu }\left( \frac{{{\lambda ^3}+{\lambda ^2}{\mu ^2} - 2{\lambda ^2}\mu - \lambda {\mu ^2}+ {\mu ^2}}}{{{\mu ^2}(1 - \lambda )(\mu - \lambda )}}\right.+\\&+\left.\frac{1}{2}+\frac{{m\left( {1+{{(1 - \mu )}^m}} \right)}}{{2\left( {1 - {{(1 - \mu )}^m}} \right)}} \right)+\frac{{{{(\mu - \lambda )}^2}}}{{{\mu ^2}}}\left( \frac{1}{{\mu (1 - \lambda )}}+ \right. \\&\left.\frac{1}{2}+\frac{1}{\mu }+\frac{{m\left( {1+{{(1 - \lambda )}^m}} \right)}}{{2\left( {1 - {{(1 - \lambda )}^m}} \right)}} \right). \end{split} $

假设在时间间隔$m$内有$N$个数据包被成功接收,其中$N$为随机变量. 由文献[25]以及排队模型的统计特性分析可知, $N$为服从参数为$m$$\lambda $的二项分布,即$ N \sim {\text{B}}\left( {m,\lambda } \right) $,有

$ P\left\{ {N = i} \right\} = C_m^i{\lambda ^i}{\left( {1 - \lambda } \right)^{m - i}};{\text{ }}i{\text{ = 0,1,}} \cdots, m. $

在使用固定时间间隔进行决策的策略中,系统每隔$m$个时隙进行一次决策,考虑到时间间隔$m$内监测中心可能接收到多个数据包进行联合估计. 为了准确度量接收数据包在决策时刻的新鲜度,决策时刻年龄等于当前决策时刻与传感器节点上联合估计的第一个数据包的生成时刻之间的差值. 根据式(36)和式(37),对于给定到达率$\lambda $,服务率$\mu $,系统在使用固定时间间隔$m$进行决策的策略时的平均决策年龄为

$ \begin{split} {{\overline \varDelta }_{{\text{D}}m}} =& {{\overline \varDelta }_{\text{D}}}+E\left[ {\left( {N - 1} \right){X_k}} \right] = \\ &\frac{\lambda }{\mu }\left( \frac{{{\lambda ^3}+{\lambda ^2}{\mu ^2} - 2{\lambda ^2}\mu - \lambda {\mu ^2}+{\mu ^2}}}{{{\mu ^2}(1 - \lambda )(\mu - \lambda )}}+\frac{1}{2}+ \right. \\ &\left.\frac{{m\left( {1+{{(1 - \mu )}^m}} \right)}}{{2\left( {1 - {{(1 - \mu )}^m}} \right)}}+\frac{{m\mu }}{\lambda } - \frac{\mu }{{{\lambda ^2}}} \right) +\frac{{{{(\mu - \lambda )}^2}}}{{{\mu ^2}}} \left( \frac{1}{{\mu (1 - \lambda )}}+\right. \\&\left.\frac{1}{2}+\frac{1}{\mu }+\frac{{m\left( {1+{{(1 - \lambda )}^m}} \right)}}{{2\left( {1 - {{(1 - \lambda )}^m}} \right)}} \right). \\[-1pt]\end{split} $

3. 决策年龄与失真权衡

在2种不同的决策方式下进行系统的决策年龄与失真权衡研究,同时分析决策过程对更新决策系统的时效与失真性能的影响. 为了得到系统的极限性能,假设一段无穷长的时间内的信息传输,即$n \to \infty $.

3.1. 定包数决策

在固定数据包的个数$M$进行决策时,系统的失真会相对稳定. 由式(2)可以得到,$M$个数据包被成功接收时,监测中心进行联合估计并实施决策,相应的失真为

$ {D_M} = \frac{{\sigma _\theta ^2}}{M}\left( {\frac{1}{{{\gamma _{{\text{ob}}}}}}+\frac{1}{{{\gamma _{{\text{ch}}}}}}+\frac{1}{{{\gamma _{{\text{ob}}}}{\gamma _{{\text{ch}}}}}}} \right). $

每次决策时的失真在时间上是恒定的,因此定包数决策时系统的平均失真${\overline D_M} = {D_M}$. 值得注意的是,当$M$较小时,监测中心会频繁地接收数据包进行决策,系统决策更加及时会降低决策年龄,此时每次用于决策的数据包较少,那么失真会相应增大. 因此,在时效性和失真之间存在一定的权衡. 对于固定数据包个数进行决策,优化问题P0可以表示为P1

$ \begin{split} \mathop {\min }\limits_M & {\text{ }}{{\overline \varDelta }_{{\text{D}}M}}+\omega {{\overline D}_M}. \\ &{\text{ s}}{\text{.t}}{\text{. }}M \geqslant 1,M \in Z. \end{split} $

优化问题P1转化为求目标函数${J_M}$的最优解. 其中,${J_M}$$M$的导数为

$ \frac{{\partial {J_M}}}{{\partial M}} = \frac{1}{\lambda } - \frac{{\omega \sigma _\theta ^2\left( {1+{\gamma _{{\text{ob}}}}+{\gamma _{{\text{ch}}}}} \right)}}{{{M^2}{\gamma _{{\text{ob}}}}{\gamma _{{\text{ch}}}}}}. $

对于任意${\gamma _{{\text{ob}}}}$$M \geqslant 1$的情况,当$ \omega \leqslant {\omega _0} = {\left( {{\gamma _{{\text{ob}}}}{\gamma _{{\text{ch}}}}} \right)} {/} \left( {\lambda \sigma _\theta ^2 \left( {1+{\gamma _{{\text{ob}}}}+{\gamma _{{\text{ch}}}}} \right)} \right) $时,$ \left( {{{\partial {J_M}} \mathord{\left/ {\vphantom {{\partial {J_M}} {\partial M}}} \right. } {\partial M}}} \right) > 0 $.$ \omega > {\omega _0} $时,对任意的$M \geqslant 1$,若$ {\gamma _{{\text{ob}}}} \geqslant {\gamma _{{\text{ob}}0}} = {\left( {\omega \lambda \sigma _\theta ^2\left( {1+{\gamma _{{\text{ch}}}}} \right)} \right)} / \left( \right.{\gamma _{{\text{ch}}}} - \omega \lambda \sigma _\theta ^2 \left.\right.) $$ \left( {{{\partial {J_M}} \mathord{\left/ {\vphantom {{\partial {J_M}} {\partial M}}} \right. } {\partial M}}} \right) > 0 $. 因此,当$M \geqslant 1$时,在$ \omega \leqslant {\omega _0} $$ {\gamma _{{\text{ob}}}} \geqslant {\gamma _{{\text{ob}}0}} $的条件下,即失真的权重过小或观测信噪比足够高,${J_M}$的最优解为$M = 1$,即决策的最佳数据包个数为$M = 1$. 在满足$ \omega > {\omega _0} $$ {\gamma _{{\text{ob}}}} > {\gamma _{{\text{ob}}0}} $的情况下,${J_M}$的最优解通过求解$ ( {\partial {J_M}} / {\partial M} ) = 0 $得到. 因此,可以得到

$ M = \sqrt {\frac{{\omega \lambda \sigma _\theta ^2\left( {1+{\gamma _{{\text{ob}}}}+{\gamma _{{\text{ch}}}}} \right)}}{{{\gamma _{{\text{ob}}}}{\gamma _{{\text{ch}}}}}}} . $

通常情况下,平均决策年龄远大于平均失真. 当$\omega $很小时,失真对目标函数的贡献很小. 在这种情况下,可以考虑更频繁地做出决策,即$M = 1$,以此来实现决策年龄和失真权衡最优. 理论上,问题P1中$M$应为整数,但式(42)给出的解不一定为整数. 尽管如此,通过进行取整操作,式(42)给出的解决方案对问题P1都是最优的.

3.2. 具有周期性决策过程的系统最优调度

在固定时间间隔$m$进行决策的情况下,研究基于Geom/Geom/1/D排队模型的更新决策系统的时效性和失真权衡. 基于均方误差的失真度量,式(2)为$K$个数据包被接收的失真. 如果在时间间隔$m$内,监测中心无数据包被接收,那么此时系统的失真可以表示为${D_0} = E\left[ {{\theta ^2}} \right] = \sigma _\theta ^2$. 结合式(2)和式(37),系统周期性决策的平均失真计算式为

$ \begin{split} {{\overline D}_m} =& \sum\limits_i {{D_i}} P\{ N = i\} =\\ &{D_0}P\{ N = 0\} +\sum\limits_{i = 1}^m {{D_i}} P\{ N = i\} = \\& \sigma _\theta ^2\left( {{(1 - \lambda )}^m}+\left( \frac{1}{{{\gamma _{{\text{ob}}}}}}+\frac{1}{{{\gamma _{{\text{ch}}}}}}+\right.\right.\\&\left.\left.\frac{1}{{{\gamma _{{\text{ob}}}}{\gamma _{{\text{ch}}}}}} \right)\sum\limits_{i = 1}^m {\mathop C\nolimits_m^i } {\lambda ^i}{{(1 - \lambda )}^{m - i}}\frac{1}{i} \right). \end{split} $

$m$较大时,监测中心决策不那么及时,在决策间隔$m$内接收到的数据包增多,多个数据包之间具有相关性进行联合估计会使失真减小,导致决策年龄增大. 因此,在减小信息失真的同时,系统的时效性不能得到保证. 考虑到二者存在折中关系,可以通过优化决策时间间隔$m$来使时效性与失真之间的权衡最优. 对于给定的权重$\omega $,周期性决策过程的优化问题P0可以表示为P2

$ \begin{split} \mathop {\min }\limits_m & {\text{ }}{{\overline \varDelta }_{{\text{D}}m}}+\omega {{\overline D}_m}. \\ & {\text{ s}}{\text{.t}}{\text{. }}m \geqslant 1,m \in Z. \end{split} $

令目标函数${J_m} = {\overline \varDelta _{{\text{D}}m}}+\omega {\overline D_m}$,则有

$ \begin{split} {J_m} =& \frac{\lambda }{\mu }\left( \frac{{{\lambda ^3}+{\lambda ^2}{\mu ^2} - 2{\lambda ^2}\mu - \lambda {\mu ^2}+{\mu ^2}}}{{{\mu ^2}(1 - \lambda )(\mu - \lambda )}}+\frac{1}{2}\right.+\\ & \left.\frac{{m\left( {1+{{(1 - \mu )}^m}} \right)}}{{2\left( {1 - {{(1 - \mu )}^m}} \right)}}+\frac{{m\mu }}{\lambda } - \frac{\mu }{{{\lambda ^2}}} \right) +\\& \frac{{{{(\mu - \lambda )}^2}}}{{{\mu ^2}}}\left( {\frac{1}{{\mu (1 - \lambda )}}+\frac{1}{2}+\frac{1}{\mu }+\frac{{m\left( {1+{{(1 - \lambda )}^m}} \right)}}{{2\left( {1 - {{(1 - \lambda )}^m}} \right)}}} \right) +\\&\omega \sigma _\theta ^2\left( {{(1 - \lambda )}^m}+\left( \frac{1}{{{\gamma _{{\text{ob}}}}}}+\frac{1}{{{\gamma _{{\text{ch}}}}}}+\right.\right.\\&\left.\left.\frac{1}{{{\gamma _{{\text{ob}}}}{\gamma _{{\text{ch}}}}}} \right)\sum\limits_{i = 1}^m {\mathop C\nolimits_m^i } {\lambda ^i}{{(1 - \lambda )}^{m - i}}\frac{1}{i} \right). \end{split} $

问题P2转化为求解使${J_m}$最小化的决策间隔$m$. 针对问题P2,目标函数${J_m}$较为复杂. 借助Matlab求解问题P2,给出基于遗传算法的优化算法,如算法1所示. 通过算法1找到使${J_m}$最优的决策间隔$m$.

算法1 基于遗传算法的优化算法

输入:确定种群规模$S$、交叉概率${P_{\text{c}}}$、变异概率${P_{\text{v}}}$、迭代次数${I_{{\text{iter}}}}$.

输出:最佳染色体$m$、最优平均AuD和平均失真加权和${J_m}$.

初始化:

1. 令初始迭代次数$i \leftarrow 0$

2. 采用随机数生成器生成基因来初始化规模为$S$的染色体种群${S_{{\text{p}}}}\left( 0 \right)$

3. for $i$ to ${I_{{\text{iter}}}}$ do

4. 根据式(46)计算${S_{{\text{p}}}}\left( i \right)$中每条染色体的适应度值;

5. 通过所有染色体的适应度值计算累积概率,从${S_{{\text{p}}}}\left( i \right)$中选择父代染色体,生成种群规模为$S$的新种群;

6. 对所选择的新种群依概率${P_{\text{c}}}$选择父代染色体进行交叉产生新的子代染色体,生成新的染色体种群;

7. 依概率${P_{\text{v}}}$对新种群中染色体的基因执行变异操作,生成新的染色体种群;

8. 再根据式(46)计算新种群${S_{{\text{np}}}}\left( i \right)$中各染色体的适应度值,记录最佳染色体$m$和最优平均AuD和平均失真加权和${J_m}$

9. $i \leftarrow i+1$

10. end for

算法1考虑规模为$S$的染色体种群,把每个$m$称为1个染色体. 在初始化阶段,采用二进制遗传编码,设置染色体长度${C_{\text{l}}}$为10,并随机生成$S$个不同的二进制编码组合,即生成$S$个染色体,用${v_j}\left( {j = 1,2, \cdots ,S} \right)$表示每个染色体. 在每次迭代中,先评估染色体的适应度值. 为了求解目标函数的最小值,将目标函数${J_m}$的倒数定义为染色体个体的适应度值,即

$ f = {J_m}^{ - 1} = {\left( {{{\overline \varDelta }_{{\text{D}}m}}+\omega {{\overline D}_m}} \right)^{ - 1}}. $

在迭代过程中,每个染色体被随机选择的概率为${p_j} = {{{f_j}} \mathord{\left/ {\vphantom {{{f_j}} {\sum\nolimits_{j = 1}^N {{f_j}} }}} \right. } {\displaystyle\sum\nolimits_{j = 1}^N {{f_j}} }}$,以此选出相对优秀的$S$个染色体个体,得到新的染色体种群. 接下来,新种群根据概率${P_{\text{c}}}$选择染色体进行交叉产生新染色体种群,交叉完成后生成的新种群依概率${P_{\text{v}}}$执行变异操作. 在完成交叉和变异之后,种群得到更新,算法将进入下一次迭代,算法终止于第${I_{{\text{iter}}}}$次迭代. 由于在迭代过程中,每次迭代的平均AuD和平均失真加权和并不一定是严格递减的,因此将记录每次迭代的最佳染色体以及对应的平均AuD和平均失真加权和,最后将整个迭代过程中的最佳$m$${J_m}$作为输出.

4. 数值结果分析

使用Matlab对所得结果进行数值和仿真模拟,验证2种不同决策方式下更新决策系统的平均AuD和平均失真的分析结果.

4.1. 平均决策年龄

图5所示为更新决策系统的平均决策年龄随到达率$\lambda $的变化情况. 图5(a)比较在使用不同服务率$\mu $时,周期性决策过程的数据包到达率与平均AuD的关系,决策间隔$m = 10$ 时隙. 图5(b)为不同决策策略下到达率$\lambda $对更新决策系统平均决策年龄的影响,设置服务率$\mu = 0.3$ 包/时隙,决策间隔$m = 10$ 时隙,数据包数量$M = 3$,理论结果和蒙特卡洛仿真结果分别用TH和MC标记.由图5(a)可以观察到,当$\lambda $很小或相对很大时,系统的平均AuD较大. 原因是在$\lambda $很小时,数据包的等待时间较长,导致平均AuD很大;当$\lambda $较大时,由于服务器的服务能力有限,数据包的排队延迟较大. 当$\lambda $接近$ {\mu \mathord{\left/ {\vphantom {\mu 2}} \right. } 2} $时,平均AuD最小. 此外,如果服务率$\mu $提高,决策单元将以更高的速率接收数据包用于决策,意味着平均AuD将更小. 为了使系统的AuD尽可能地小,应该考虑尽量提高服务率,并将到达率设为接近服务率的一半,即$\lambda = {\mu \mathord{\left/ {\vphantom {\mu 2}} \right. } 2}$.图5(b)可以发现,1)随着到达率$\lambda $的增加,平均AuD呈现先减后增的趋势;2)具有周期性决策过程的平均AuD最小,原因是决策过程的周期性消除了不确定性,有利于降低系统的平均AuD;3)当$\lambda $较大时,2种决策方式的时效性能接近;4)蒙特卡洛仿真结果与理论结果基本吻合,进一步验证了理论分析的正确性.

图 5

图 5   系统平均决策信息年龄与到达率的关系

Fig.5   System average age upon decisions versus arrival rate


图6所示为在2种不同的决策过程下数据包个数对平均决策年龄的影响,其中设置服务率$\mu = 0.6$ 包/时隙. 为了使相应的平均AuD最小,设置到达率为服务率的一半,即$\lambda = 0.3$ 包/时隙. 对于周期性决策过程,在决策间隔$m$内有$N$个数据包被成功接收,其中$E\left[ N \right] = m\lambda $. 由图可知,系统的平均AuD随着数据包个数$M$的增加而增大. 原因是系统在给定数据包个数进行决策时,随着数据包增多,决策单元决策不及时,相应的决策次数少,导致平均决策年龄增大. 这表明,除了调度更新决策系统的到达过程和服务过程,还可以通过调度决策过程来进一步降低平均决策年龄.

图 6

图 6   系统平均决策信息年龄与数据包个数(或决策间隔)的关系

Fig.6   System average age upon decisions versus number of packets (or decision interval)


4.2. 平均失真

图7所示为不同决策过程下数据包个数$M$影响平均失真$ \overline D $的变化曲线,设置$\lambda = 0.5$ 包/时隙、$ \sigma _\theta ^2 = 1.0 $ W、${\gamma _{{\text{ob}}}} = 2$${\gamma _{{\text{ch}}}} = 1.5$[18]. 可以看出,系统的平均失真随$M$的增加而减小. 此外,2种决策方式对失真性能的影响基本一致. 原因是失真的度量取决于数据包是否被成功接收,在合并多个数据包进行估计时,随着数据包增多,相应的决策次数少,多个数据包之间具有相关性会联合检测,平均失真会减小.

图 7

图 7   数据包个数(或决策间隔)对平均失真的影响

Fig.7   Effect of number of packets (or decision intervals) on average distortion


4.3. 年龄和失真加权和

图8所示为2种决策方式在不同到达率下权重$\omega $对平均AuD和平均失真加权和的影响,设置$ \mu = 0.6 $ 包/时隙、$ \sigma _\theta ^2 = 1.0 $ W、$ {\gamma _{{\text{ob}}}} = 2.0 $$ {\gamma _{{\text{ch}}}} = 1.5 $[18]. 由图可知,随着$\omega $的增大,$J = \left( {{{\overline \varDelta }_{\text{D}}}+\omega \overline D} \right)$呈现上升的趋势. 一般情况下,失真对目标函数的贡献小,随着权重$\omega $越大,失真对$J$的贡献越大. 此外,对于给定的决策方式,$\lambda $越大,$J$越小. 对于给定的到达率,定包数决策对应的$J$更小,也就是说定包数决策策略下的时效与失真性能更好.

图 8

图 8   平均决策信息年龄和平均失真加权和与权重的变化关系

Fig.8   Variation of average age upon decisions and average distortion weighted sum versus weight


图9所示的三维图像更加直观地反映了决策过程参数与权重$\omega $对平均AuD和平均失真加权和的影响,设置$\lambda = 0.3$ 包/时隙、$ \mu = 0.6 $ 包/时隙、$ \sigma _\theta ^2 = 1.0 $ W、$ {\gamma _{{\text{ob}}}} = 2.0 $$ {\gamma _{{\text{ch}}}} = 1.5 $[18]. 图9(a)和图9(b)分别表示系统在定包数$M$和固定时间间隔$m$决策方式下$J$的变化情况. 从图9(a)中可以看出,当$\omega $较小时,$J$$M$单调递增. 在这种情况下,要使决策年龄和失真权衡最优,系统须考虑频繁决策,即$M = 1$. 随着$\omega $增大,$J$$M$先减小后增大. 此时,使$J$取得最小值的最佳决策数据包数$M$由式(42)得到. 由图9(b)可以看出,当$\omega \to 0$$m = 1$时,$J$取最小值. 同样地,随着$\omega $的增大,$J$$m$先减后增,当$\omega $增大到一定值之后,$J$呈下降趋势. 此时,使$J$最优的最佳决策间隔$m$由算法1给出.

图 9

图 9   决策过程与权重对平均决策信息年龄和平均失真加权和的影响

Fig.9   Effect of decision process and weighting on weighted sum of average age upon decisions and average distortion


5. 结 语

本研究针对面向物联网的实时应用,分析了更新决策系统的平均AuD和失真. 考虑采用固定数据包个数和固定时间间隔2种决策方式,分别保证了系统的估计失真性能和信息的决策时效性,并推导相应的平均AuD和平均失真的表达式. 考虑到提高信息时效性时可能会增加信号失真,通过平均AuD和平均失真加权探讨了系统时效性和失真的平衡问题,并对时效与失真性能进行联合优化. 仿真结果验证了理论分析的正确性,表明通过调度决策过程可以实现最小化加权和AuD和失真的平均值. 在未来的研究中,可以考虑在多源传感网络场景中进一步分析系统的时效与失真性能,以满足无线传感网络及时准确传输数据的应用需求.

参考文献

杨荣悦, 张鹏洲, 宋卿

基于5G技术的智能车联网研究与展望

[J]. 电信科学, 2020, 36 (5): 106- 114

[本文引用: 1]

YANG Rongyue, ZHANG Pengzhou, SONG Qing

Research and prospect of intelligent internet of vehicles based on 5G technology

[J]. Telecommunications Science, 2020, 36 (5): 106- 114

[本文引用: 1]

JU Z, ZHANG H, LI X, et al

A survey on attack detection and resilience for connected and automated vehicles: from vehicle dynamics and control perspective

[J]. IEEE Transactions on Intelligent Vehicles, 2022, 7 (4): 815- 837

DOI:10.1109/TIV.2022.3186897      [本文引用: 1]

HE Q, DAN G, FODOR V. Minimizing age of correlated information for wireless camera networks [C]// IEEE INFOCOM 2018-IEEE Conference on Computer Communications Workshops (INFOCOM WKSHPS) . Honolulu: IEEE, 2018: 547–552.

[本文引用: 1]

LI B, FEI Z, ZHANG Y

UAV communications for 5G and beyond: recent advances and future trends

[J]. IEEE Internet of Things Journal, 2019, 6 (2): 2241- 2263

DOI:10.1109/JIOT.2018.2887086      [本文引用: 1]

BURHANUDDIN L A B, LIU X, DENG Y, et al

QoE optimization for live video streaming in UAV-to-UAV communications via deep reinforcement learning

[J]. IEEE Transactions on Vehicular Technology, 2022, 71 (5): 5358- 5370

DOI:10.1109/TVT.2022.3152146      [本文引用: 1]

HABIBZADEH H, DINESH K, SHISHVAN O R, et al

A survey of healthcare internet-of-things (HIoT): a clinical perspective

[J]. IEEE Internet Things Journal, 2020, 7 (1): 53- 71

DOI:10.1109/JIOT.2019.2946359      [本文引用: 1]

SONG H, GAO S, LI Y, et al

Train-centric communication based autonomous train control system

[J]. IEEE Transactions on Intelligent Vehicles, 2023, 8 (1): 721- 731

DOI:10.1109/TIV.2022.3192476      [本文引用: 1]

KAUL S, GRUTESER M, RAI V, et al. Minimizing age of information in vehicular networks [C]// 2011 8th Annual IEEE Communications Society Conference on Sensor, Mesh and Ad Hoc Communications and Networks . Salt Lake City: IEEE, 2011: 350–358.

[本文引用: 1]

KAUL S, YATES R, GRUTESER M. Real-time status: how often should one update? [C]// 2012 Proceedings IEEE INFOCOM . Orlando: IEEE, 2012: 2731–2735.

[本文引用: 1]

YATES R D, SUN Y, BROWN D R, et al

Age of information: an introduction and survey

[J]. IEEE Journal on Selected Areas in Communications, 2021, 39 (5): 1183- 1210

DOI:10.1109/JSAC.2021.3065072      [本文引用: 1]

WANG Q, CHEN H, ZHAO C, et al

Optimizing information freshness via multiuser scheduling with adaptive NOMA/OMA

[J]. IEEE Transactions on Wireless Communications, 2022, 21 (3): 1766- 1778

DOI:10.1109/TWC.2021.3106778     

CHIARIOTTI F, HOLM J, KALØR A E, et al

Query age of information: freshness in pull-based communication

[J]. IEEE Transactions on Communications, 2022, 70 (3): 1606- 1622

DOI:10.1109/TCOMM.2022.3141786      [本文引用: 1]

DONG Y, CHEN Z, LIU S, et al. Age of information upon decisions [C]// 2018 IEEE 39th Sarnoff Symposium . Newark: IEEE, 2018: 1–5.

[本文引用: 4]

DONG Y, FAN P. Age upon decisions with general arrivals [C]// 2018 9th IEEE Annual Ubiquitous Computing, Electronics and Mobile Communication Conference . New York: IEEE, 2018: 825–829.

[本文引用: 1]

DONG Y, CHEN Z, LIU S, et al

Age-upon-decisions minimizing scheduling in Internet of Things: to be random or to be deterministic?

[J]. IEEE Internet of Things Journal, 2020, 7 (2): 1081- 1097

DOI:10.1109/JIOT.2019.2950054      [本文引用: 1]

BAO Z, DONG Y, CHEN Z, et al

Age-optimal service and decision processes in Internet of Things

[J]. IEEE Internet of Things Journal, 2021, 8 (4): 2826- 2841

DOI:10.1109/JIOT.2020.3020875      [本文引用: 1]

CHEN S, ZHANG T, CHEN Z, et al

Minimizing age-upon-decisions in bufferless system: service scheduling and decision interval

[J]. IEEE Transactions on Vehicular Technology, 2023, 72 (1): 1017- 1031

DOI:10.1109/TVT.2022.3202790      [本文引用: 1]

DONG Y, FAN P, LETAIEF K B

Energy harvesting powered sensing in IoT: timeliness versus distortion

[J]. IEEE Internet of Things Journal, 2020, 7 (11): 10897- 10911

DOI:10.1109/JIOT.2020.2990715      [本文引用: 4]

DONG Y

Distributed sensing with orthogonal multiple access: to code or not to code?

[J]. IEEE Transactions on Signal Processing, 2020, 68: 1315- 1330

DOI:10.1109/TSP.2020.2971203      [本文引用: 2]

ORNEE T Z, SUN Y. Sampling for remote estimation through queues: age of information and beyond [C]// International Symposium on Modeling and Optimization in Mobile, Ad Hoc, and Wireless Networks . Avignon: IEEE, 2019: 1–8.

[本文引用: 1]

BASTOPCU M, ULUKUS S. Age of information for updates with distortion [C]// 2019 IEEE Information Theory Workshop (ITW) . Visby: IEEE, 2019: 1–5.

[本文引用: 2]

QIAO L, ZHOU Y

Timely split inference in wireless networks: an accuracy-freshness tradeoff

[J]. IEEE Transactions on Vehicular Technology, 2023, 72 (12): 16817- 16822

DOI:10.1109/TVT.2023.3294494      [本文引用: 2]

HUANG Y, ZHANG W. Research on the methods of data mining based on the edge computing for the IoT [C]// IEEE International Conference on Integrated Circuits and Communication Systems . Raichur: IEEE, 2023: 1–6.

[本文引用: 1]

CUI S, XIAO J J, GOLDSMITH A J, et al

Estimation diversity and energy efficiency in distributed sensing

[J]. IEEE Transactions on Signal Processing, 2007, 55 (9): 4683- 4695

DOI:10.1109/TSP.2007.896019      [本文引用: 1]

田乃硕, 徐秀丽, 马占友. 离散时间排队论[M]. 北京: 科学出版社, 2008: 38–49.

[本文引用: 2]

/