浙江大学学报(工学版), 2025, 59(11): 2430-2438 doi: 10.3785/j.issn.1008-973X.2025.11.022

航空航天工程

面向不完备信息的无人机空战态势评估方法

王昱,, 李硕, 张展, 孟光磊

沈阳航空航天大学 自动化学院,辽宁 沈阳 110136

Method for UAV air combat situation assessment under incomplete information

WANG Yu,, LI Shuo, ZHANG Zhan, MENG Guanglei

School of Automation, Shenyang Aerospace University, Shenyang 110136, China

收稿日期: 2024-10-23  

基金资助: 国家自然科学基金资助项目(61906125,62373261);辽宁省高校基本科研业务费资助项目(LJ232410143020,LJ212410143047).

Received: 2024-10-23  

Fund supported: 国家自然科学基金资助项目(61906125,62373261);辽宁省高校基本科研业务费资助项目(LJ232410143020,LJ212410143047).

作者简介 About authors

王昱(1980—),女,副教授,博士,从事空战机器推理、智能决策的研究.orcid.org/0000-0002-8262-9317.E-mail:wangyu@sau.edu.cn , E-mail:wangyu@sau.edu.cn

摘要

针对传统态势评估方法因模型和推理机制固定,在信息不完备时难以持续提供有效结果的问题,提出基于证据修正机制的多模式变权时空融合证据网络方法. 按照信息的时间关联程度划分证据类型,构建模块化证据网络推理模型. 基于证据信息的类型和不完备程度,结合时序性信息预测技术,提出多模式证据修正方法. 考虑修正证据可靠度差异同时基于变权原理,提出网络节点权值的自适应生成方法. 通过设计折扣率随时间递减的三步时空融合机制,强化非突变型证据的时间关联,提升连续性态势评估的准确性. 分别通过两规模下4种信息不完备程度的无人机空战仿真实验,验证方法的有效性.

关键词: 态势评估 ; 不完备信息 ; 证据修正 ; 权值调整 ; 时空融合

Abstract

A multi-mode variable-weight spatiotemporal fusion evidential network method based on an evidence correction mechanism was proposed in order to address the issue that traditional situation assessment methods struggled to continuously provide effective results when information was incomplete due to their fixed models and reasoning mechanisms. Evidence types were classified according to the degree of temporal correlation of information, and a modular evidential network reasoning model was constructed. A multi-mode evidence correction method was proposed combined with temporal information prediction technology based on the type and incompleteness degree of evidence information. An adaptive generation method for network node weights was proposed considering the differences in the reliability of corrected evidence and based on the variable weight principle. The temporal correlation of non-mutant evidence was strengthened, and the accuracy of continuous situation assessment was improved by designing a three-step spatiotemporal fusion mechanism with a time-decreasing discount rate. The effectiveness of the proposed method was verified through UAV air combat simulation experiments under two scales with four levels of information incompleteness.

Keywords: situation assessment ; incomplete information ; evidence correction ; weight adjustment ; spatio-temporal fusion

PDF (1465KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王昱, 李硕, 张展, 孟光磊. 面向不完备信息的无人机空战态势评估方法. 浙江大学学报(工学版)[J], 2025, 59(11): 2430-2438 doi:10.3785/j.issn.1008-973X.2025.11.022

WANG Yu, LI Shuo, ZHANG Zhan, MENG Guanglei. Method for UAV air combat situation assessment under incomplete information. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(11): 2430-2438 doi:10.3785/j.issn.1008-973X.2025.11.022

无人机空战态势评估的核心为在高对抗环境下综合分析无人机与敌方目标的位置、速度、高度及作战意图等关键要素,实时量化评估战场态势的优劣,这对于无人机的安全与高效决策至关重要. 传感器技术局限、信息传输损耗及敌方干扰常导致信息出现不确定、错误乃至缺失等情况,严重恶化评估结果. 有效融合不完备多源战场信息,实现持续准确的态势评估,已成为智能化空战亟待解决的关键难题.

目前,针对上述问题所开展的研究主要聚焦于态势信息的不确定性特征,涉及方法包括贝叶斯网络[1-3]、模糊理论[4]和证据推理[5]. 其中,贝叶斯网络和模糊理论方法依赖大量条件概率或模糊规则,在动态空战环境中难以有效应用. 相比之下,D-S证据理论引入了信度函数的概念,特别增加了对“完全未知”信息的表达,能够更全面地描述和评估不确定性命题. 作为其进阶方法,证据网络(evidential network, EN)基于树状图模型结构,在处理多源异构信息融合方面展现出卓越的能力,且对先验信息的需求低,十分适合复杂多变的空战态势评估. 李山等[5]针对空中目标威胁评估的问题,建立基于改进D-S证据理论的多时刻评估模型. Wang等[6]利用云模型构造属性信度函数,通过证据网络同时处理随机和认知不确定性,以深度感知目标意图. 近年来,随着决策信息复杂度的增加,Deng熵概念的提出将证据推理对信息特点的聚焦从不确定性推广至不完备性. Zhou等[7-9]利用空集的非零mass函数值对不完备信息建模,采用Deng熵计算不确定度以修正不完备证据,通过态势意图评估和电子转子故障诊断2个简单实例进行方法说明. 基于Deng熵的证据修正方法虽然在不完备信息融合理论研究中取得进展,但应用多局限于同源信息融合,且该方法对信息不完备性的量化缺乏泛化规则,在处理大量不完备信息的复杂决策场景,尤其多源异构信息推理的态势评估时适用性不足.

本文面向不完备信息下的空战态势评估,提出基于证据修正机制的多模式变权时空融合证据网络(multi-mode variable weight spatio-temporal fusion evidential network, MVWSF-EN). 基于深度学习与平滑指数法构建非突变型证据预测模型,设计多模式证据修正方法及自主切换流程,提升证据质量. 引入模式切换折扣因子与变权原理,设计节点权值的自适应生成公式,增强推理合理性. 针对信息类型的差异,提出3步时空融合网络推理机制,提升态势评估的准确性.

1. MVWSF-EN态势评估方法

提出的MVWSF-EN方法的总体流程如图1所示.

图 1

图 1   MVWSF-EN空战态势评估流程

Fig.1   Air combat situation assessment flow of MVWSF-EN


1.1. 模块化证据网络模型的建立

借鉴郝启凯等[10-12]以作战意图、作战能力和几何优势三大指标构建态势评估指标体系的主体思路,充分考虑近距空战中评判无人机威胁等级的关键因素,进一步将作战意图细化为火控雷达状态及敌我关系识别,并将武器攻击范围和处理危机能力纳入作战能力指标. 几何优势采用传统的角度、距离、速度、高度等指标,构建如图2所示的模块化态势评估证据网络模型.

图 2

图 2   态势评估的模块化模型

Fig.2   Modular model for situation assessment


该模型依据态势信息的时间关联性,划分为突变型、确定型和连续型3类. 其中,突变型由于在时间上不相关,具有不可预测性;连续型呈现规律性时序变化,确定型是在一定时段内保持稳定或缓慢变化,两者均具有时间序列的特征,可以进行预测. 各证据节点的物理含义、识别框架、模块类型定义如表1所示,其中上层节点的识别框架和模块类型由于待融合及约简无法确定,用“—”表示.

表 1   节点变量的说明

Tab.1  Description of node variables

证据节点变量说明识别框架等级说明
S态势等级0_低;—
HI作战意图0_低;—
C作战能力0_低;—
G几何优势0_弱;—
FCR火控雷达{0,1}0_关;1_开
NF非友方平台{0,1}0_错;1_对
IFF敌友识别{0,1}0_敌;1_友
WER武器攻击范围{0,1,2,3}0_弱;3_强
I处理危机能力{0,1,2,3}0_弱;3_强
ADA角度距离优势0_低;—
VA速度优势{0,1,2,3,4}0_弱;4_强
AA角度优势{0,1,2,3}0_弱;3_强
DA距离优势{0,1,2,3,4}0_弱;4_强
HA高度优势{0,1,2,3}0_弱;3_强

新窗口打开| 下载CSV


图2中,$\mathop m\nolimits_1 $~$\mathop m\nolimits_{14} $为节点信度. 其中$\mathop m\nolimits_1 $~$\mathop m\nolimits_8 $为证据信度,由对应的实测态势信息计算;$\mathop m\nolimits_9 $~$\mathop m\nolimits_{14} $为上层节点间信度,主要由逻辑关系、具有区间支持概率的条件规则2种方式计算. 基于专家知识,构建初始的融合规则,如表2所示.

表 2   初始的融合规则

Tab.2  Initial fusion rule

信度节点融合规则
m9NF、IFF(IFF=1)$ \Rightarrow $(NF=0):[0.95,1];
(IFF=0)$ \Rightarrow $(NF=1):[0.4,0.6]
m10HI、FCR、NFHI=FCR&3NF+3NF
m11C、WER、IC = 3WER+I
m12ADA、AA、DAADA = AA×DA
m13G、ADA、VA、HAG = 3ADA+VA+2HA
m14S、HI、CGS = HI+C+G

新窗口打开| 下载CSV


1.2. 态势评估数据的获取

为了洞悉整个作战过程中敌我双方的态势变化,在评估时刻获取图2模型中各个证据节点的实时态势信息. 其中原始定量信息主要来源于实战双方的对抗轨迹,即通过惯导传感器、激光雷达等实现对双方战机的航向角($\mathop p\nolimits_{\text{b}} $$\mathop p\nolimits_{\text{r}} $)、直线距离$d$、速度($\mathop v\nolimits_{\text{b}} $$\mathop v\nolimits_{\text{r}} $)以及高度($\mathop h\nolimits_{{\mathrm{b}}} $$\mathop h\nolimits_{\text{r}} $)等信息的检测.

定性信息的实战获取涉及以下多种途径. 突变型证据信息,例如,火控雷达的开启状态,通过机载电子侦察设备是否探测到敌方雷达发射的电磁波信号来判断;敌友识别信号依赖于敌方对询问信号的反馈;针对武器攻击范围和处理危机能力这类指标,通常通过目标识别[13-15],结合军事资料和专家经验以模糊语言描述.

1.3. 不完备信息处理及证据修正

在综合分析态势信息特点的基础上,考虑证据类型和信息不完备程度,引入时序性信息预测方法,为上述3种类型证据设计4种有针对性的输入及修正模式,相关流程如图3所示.

图 3

图 3   证据输入及修正模式的选取流程

Fig.3   Selection process of evidence input and correction mode


图3中,对于各类型证据信息当前时刻是否正确的判定标准如下. 考虑到突变型证据不具备时序性,因此缺失即视为错误,反之正确. 非突变型证据(连续型和确定型)具有时序关联性,均通过判定当前检测值与预测结果的误差是否满足预设阈值进行判别,超出判定为错误,反之正确,如此,缺失证据亦会判定为错误.

提出的证据修正方法如表3所示.

表 3   证据修正方法

Tab.3  Method of evidence amendment

输入模式适用类型修正方案
模式1全部类型原始信息本身
模式2确定型、连续型预测数据替换
模式3确定型前一时刻数据替换
模式4突变型、确定型删除当前证据节点

新窗口打开| 下载CSV


连续型和确定型证据均可通过预测获取替代数据,达到证据修正的目的. 考虑2类证据的获取方式及在时间关联度上的差异,分别采用深度学习方法和指数平均法,对2类时序性证据构建预测模型.

针对连续型证据,构建基于CNN-GRU深度学习的轨迹预测模型,如图4所示. 具体操作如下:应用前期工作中构建的DDPG[16]决策模型生成不同初始态势下无人机空战的对抗轨迹,提取轨迹样本数据用于CNN-GRU模型的训练和测试,获取预测模型后用于实战数据预测.

图 4

图 4   CNN-GRU网络模型

Fig.4   CNN-GRU network model


针对确定型证据,假设待预测证据节点的识别框架为$\varPsi = \{ 0,1,\cdots,g\} $,各焦元下的信度分配为$ m = \{ {m^{_0}},{m^{_1}},\cdots,{m^{_g}}\} $,计算t时刻的单值信度期望[17]

$ {e_t} = \sum\limits_{i = 1}^g {(i - 1) m_{_t}^{i - 1}} . $

基于指数平均法[18],提出利用历史证据的信度期望预测当前时刻证据信度期望的计算公式:

$ \mathop {\hat e}\nolimits_t = \frac{{3\mathop e\nolimits_{t - 1} +2\mathop e\nolimits_{t - 2} +\mathop e\nolimits_{t - 3} }}{6}. $

若将式(2)计算的证据预测期望作为不完备确定型证据的修正值直接输入网络,则由于不符合网络推理所需的信度结构形式,不能进行后续融合. 采取如下思路,提出信度期望$ \mathop {\hat e}\nolimits_t $的逆转换公式.

k为预测证据前一时刻识别框架中信度最高的焦元,则选择将$ \mathop {\hat e}\nolimits_t $逆转换至焦元k和整个识别框架,如图5所示.

图 5

图 5   预测信度期望的逆转换过程

Fig.5   Inverse conversion process of predicted belief expectation


由信度期望计算

可以推得$ \mathop {\hat e}\nolimits_t $的逆转换公式:

$ \hat m _t^k = \frac{{2\mathop {\hat e}\nolimits_t - g}}{{2k - g}}. $

1.4. 证据信度结构的转换

证据网络推理要求输入信息为信度结构的形式,因此需要对图2的信息进行信度结构转换.

对于定性信息,可以将传感器检测结果采用模糊语言直接赋予信度,如判定X-47B无人机处理危机能力(I)为中高强度,则可在其划分的3个等级下进行信度赋值[0.1, 0.3, 0.5, 0.1]:0级信度为0.1,1级信度为0.3,2级信度为0.5,整个识别框架(不确定性)的信度为0.1.

对于定量信息,将经1.3节方法修正后的物理信息依照文献[19]中角度、距离、速度和高度的优势函数公式计算优势值(0~1.0),采用模糊数学方法[20],设计三角隶属度公式进行信度结构的转换. 此外,考虑到不同信息的作用范围不同,设计4级和5级2种模糊隶属度函数. 其中,4级转换公式如下所示.

$ \begin{array}{l}{{\displaystyle \sigma }}_{0}=\left\{\begin{array}{l}0.8\times \left(-3\sigma \left(t\right)+1\right),\text{ 0}\leqslant \sigma \left(t\right) < {\text{1}}/{\text{3}};\\ 0,\text{ }{\text{1}}/{\text{3}}\leqslant \sigma \left(t\right)\leqslant \text{1}\text{.}\end{array}\right.\\{{\displaystyle \sigma }}_{1}=\left\{\begin{array}{l}0.8\times \left(3\sigma \left(t\right)\right),\text{ 0}\leqslant \sigma \left(t\right) < {\text{1}}/{\text{3}};\\ 0.8\times \left(-3\sigma \left(t\right)+2\right),\text{ }{\text{1}}/{\text{3}}\leqslant \sigma \left(t\right) < {\text{2}}/{3};\\ 0,\text{ }{\text{2}}/{\text{3}} \leqslant \sigma \left(t\right)\leqslant \text{1}\text{.}\end{array}\right.\\{{\displaystyle \sigma }}_{2}=\left\{\begin{array}{l}0,\text{ 0}\leqslant \sigma \left(t\right) < {\text{1}}/{\text{3}};\\ 0.8\times \left(3\sigma \left(t\right)+1\right),\text{ }{\text{1}}/{\text{3}}\leqslant \sigma \left(t\right) < {\text{2}}/{3}.\\ 0.8\times \left(-3\sigma \left(t\right)+3\right),\text{ }{\text{2}}/{\text{3}} < \sigma \left(t\right)\leqslant \text{1}\text{.}\end{array}\right.\\{{\displaystyle \sigma }}_{3}=\left\{\begin{array}{l}0,\text{ 0}\leqslant \sigma \left(t\right) < {\text{2}}/{\text{3}};\\ 0.8\times \left(3\sigma \left(t\right)-2\right),\text{ }{\text{2}}/{\text{3}} \leqslant \sigma \left(t\right)\leqslant \text{1}\text{.}\end{array}\right.\end{array} $

式中:$ \sigma (t) $t时刻的0~1.0的几何优势值;$ \mathop \sigma \nolimits_0 $$\mathop \sigma \nolimits_1 $$\mathop \sigma \nolimits_2 $$\mathop \sigma \nolimits_3 $分别为证据在0、1、2、3等级下的信度. 5级模糊隶属度函数在式(4)的基础上改变自变量取值范围,调整参数并将0~4级扩充为0~5级.

1.5. MVWSF-EN推理

1.5.1. 节点自适应权值生成方法

传统态势评估方法的常权方式存在缺陷,容易引发“状态失衡”的违背实际现象. 引入变权原理[21],依据目标属性实测值的变化来优化调整经验权重,对属性值低却根据经验赋予的“高权”施加“惩罚”,对属性值高却根据经验赋予的“低权”给予“激励”(惩罚力度大于激励力度). 综合考虑不同修正模式下的证据可靠度差异对推理结果准确性的影响,提出自适应权值生成机制,具体方法如下.

1)考虑不完备信息修正方式的不同所引发的输入证据可靠度的不同及其对网络节点权重所产生的影响,为网络中的每个节点匹配模式切换折扣因子(MSF). 对于证据节点的MSF,考虑到模式1、2、3下证据可靠度逐渐递减,进行如下设定:${\text{1}} \geqslant \mathop {{\text{MSF}}}\nolimits^{\text{1}} $$\mathop {{\text{MSF}}}\nolimits^{\text{2}} $>$\mathop {{\text{MSF}}}\nolimits^3 > 0.{\text{5}}$. 当某证据节点被判定为模式4时,虽然进行节点删除操作,但在计算上层节点权值时,为了体现删除该节点对上层节点贡献度的削弱,将已删除子节点的权值设定为小于1的常值$\gamma $($0 < \gamma \leqslant 0.6$). 当计算上层节点的MSF时,将评判上层节点可靠度的MSF设置为由子节点的MSF乘积计算.

2)基于变权原理,设置状态变权因子SCF,用以表征实际推理结果变化对经验权值的修正. 参考文献[21],设计计算公式(相关参数数值在后续仿真中通过实验确定)如下.

$ {\mathrm{SCF}}\;({v}_{j}\text{)}=\left\{\begin{array}{l}{{\displaystyle {\mathrm{exp}}}}\;[{{{\displaystyle -\eta {{\displaystyle \beta }}_{1}{{\displaystyle W}}_{j}\left({{\displaystyle \mu }}_{j}-\lambda \overline{\mu }\right)}}^{2}}],{{\displaystyle \text{ }\mu }}_{j}\in \left[0,\lambda \overline{\mu }\right];\\ {{\displaystyle {\mathrm{exp}}}}\;[{{{\displaystyle \eta {{\displaystyle \beta }}_{2}{{\displaystyle W}}_{j}\left({{\displaystyle \mu }}_{j}-\lambda \overline{\mu }\right)}}^{2}}],\text{ }{{\displaystyle \mu }}_{j}\in \left[\lambda \overline{\mu },1\right].\end{array}\right. $

$ \mathop \mu \nolimits_j = {{e\left( {\mathop v\nolimits_j } \right)}}/{g}. $

$ \bar \mu = \frac{1}{l}\sum\limits_{j = 1}^l {\mathop \mu \nolimits_j } . $

式中:$\mathop v\nolimits_j $为网络中第j个子节点变量,$j = 1,2,\cdots ,l$$\mathop W\nolimits_j $$\mathop v\nolimits_j $的初始权值,$\eta $$\mathop v\nolimits_j $所在分支的节点总数,$\lambda $为状态的奖惩分界系数,$\mathop \beta \nolimits_1 $$\mathop \beta \nolimits_2 $分别为惩罚因子和奖励因子($\mathop \beta \nolimits_1 $>$\mathop \beta \nolimits_2 $),$ \mathop \mu \nolimits_j $$\mathop v\nolimits_j $的信度期望$e(\mathop v\nolimits_j )$的归一化标准值,$\bar \mu $为所有$\mathop \mu \nolimits_j $的平均值,g$\mathop v\nolimits_j $识别框架中的最大焦元.

3)将原始权值与上述2个因子相乘,计算动态权值:

$ \mathop {\tilde w}\nolimits_j = \mathop W\nolimits_j \cdot {\text{MSF}}\;(\mathop v\nolimits_j {\text{)}} \cdot {\text{SCF}}\;(\mathop v\nolimits_j ). $

通过下式进行整数化处理:

$ \mathop {\tilde w}\nolimits_j = \left[ {{{\mathop {\tilde w}\nolimits_j } \mathord{\left/ {\vphantom {{\mathop {\tilde w}\nolimits_j } {\min \left\{ {\mathop {\tilde w}\nolimits_1 ,\mathop {\tilde w}\nolimits_2 ,...,\mathop {\tilde w}\nolimits_m } \right\}}}} \right. } {\min \left\{ {\mathop {\tilde w}\nolimits_1 ,\mathop {\tilde w}\nolimits_2 ,\cdots ,\mathop {\tilde w}\nolimits_m } \right\}}}} \right]. $

1.5.2. 3步时空融合机制

考虑非突变型模块各时刻推理结果的时间关联性以及选择不同证据输入模式对相邻时刻推理结果平滑性的影响,提出如下动态的3步时空融合机制.

1)在每个时间片对模块网络采用证据输入模式切换的空间融合,结果取决于当前输入证据.

2)基于1)中3个连续时间片的结果,对非突变型网络模块实施变权时间融合,如图6所示. 其中,$\mathop G\nolimits_i $为时空融合的根节点($i$为时间片序号);$\mathop m\nolimits_{\mathop G\nolimits_i } $为信度分配,由下层节点融合而来;$\rho $为折扣率,考虑到越临近当前时刻的结果越有价值,将融合权值设为$ \text{1}、\rho 、{{\displaystyle \text{ }\rho }}^{2} $$ 0 < \rho < 1 $.0).

图 6

图 6   非突变型网络模块的变权时空融合过程

Fig.6   Variable-weight spatiotemporal fusion process of non-mutant network module


3)完成步骤1)、2)后,得到每个模块内的时空融合结果. 对当前时间片在整个网络内进行自下而上的空间推理,得到态势评估的最终信度分配.

1.5.3. 推理过程

为了解决不完备信息下的态势评估难题,MVWSF-EN在传统的EN基础上融入三大机制:不完备信息处理及证据修正﹑节点自适应权值生成以及3步时空融合. 推理过程如下.

采用1.3节的方法,对当前评估时刻的证据信息进行修正,作为叶子节点输入1.1节所建立的模块化树状网络模型. 基于1.5.2节的3步时空融合机制,依次执行网络模块内、外节点融合,融合权重由1.5.1节的自适应方法动态计算,采用不确定性融合规则实时更新信度函数. 通过循环多次的扩展、Dempster合成和边际化运算,获取目标态势等级(根节点)的信度分配函数. 利用Pignistic公式,对根节点(目标态势等级)进行概率测度计算.

上述扩展、合成及边际化等运算公式见文献[17].

1.6. 推理结果的处理

为了显示各时刻的态势评估结果,将经上述推理融合获取的态势等级的概率测度转换为态势标准值(设为p)进行输出(见式(1)、(6)). 设最终获取的态势等级S的识别框架为${\varPsi_S} = \{ 0,1,\cdots ,q\} $,若经上述融合过程获取${\varPsi _S}$下的概率测度为$ m_S = \{ \mathop m\nolimits_0 ,\mathop m\nolimits_1 ,\cdots ,\mathop m\nolimits_q \} $,则p的计算如下:

$ p = q^{-1}{{\displaystyle \sum\limits_{f = 1}^{q+1} {(f - 1) \cdot {m_{(f - 1)}}} }}. $

2. 仿真分析

为了验证所提方法的有效性,基于建立的DDPG[16]和MADDPG[22]决策模型,分别构建1对1和2对1无人机近距对抗场景,开展态势评估实验. 主要参数如下:模式切换因子$\mathop {{\text{MSF}}}\nolimits^{\text{1}} $=0.9,$\mathop {{\text{MSF}}}\nolimits^{\text{2}} $=0.9,$\mathop {{\text{MSF}}}\nolimits^3 $=0.6;奖励和惩罚因子$\mathop \beta \nolimits_1 $= 0.7,$\mathop \beta \nolimits_2 $= 0.3;奖惩分界系数$\lambda $=0.8;缺失节点融合权值$\gamma $= 0.6;时空融合折扣率$\rho $= 0.5.

2.1. 方法有效性及优越性的验证

1对1对抗场景如图7所示.

图 7

图 7   1对1对抗轨迹

Fig.7   One against one track


假设我方遭遇空袭,则在对抗过程中进行我机相对于敌机的态势评估,以便在我方占据优势时对敌机展开攻击. 将图7的双方对抗过程划分为10个时刻进行态势评估,由双方对抗轨迹获取相关的定量信息,定性信息参考文献[23],由此形成原始的态势信息,如表4所示. 模拟高对抗过程中由于检测延迟及释放干扰造成上述信息的不完备情况,对表4的数据进行不同程度的错误及缺失处理,形成4组实验数据. 实验1的证据完全可靠(见表4),实验2存在极少的数据缺陷(错误率为7.5%),实验3存在少量的数据缺陷(缺失率为10%,错误率为10%),实验4存在大量的数据缺陷(缺失率为18.75%,错误率为17.5%).

表 4   1对1空战信息

Tab.4  One-on-one air combat information

信息
时刻
$ \mathop p\nolimits_{\text{b}} {\text{/}}(^\circ) $$ \mathop p\nolimits_{\text{r}} {\text{/}}(^\circ) $$d/{\mathrm{m}}$$ \mathop v\nolimits_{\text{b}} {{/({\mathrm{m}} \cdot {\mathrm{s}}^{-1})}} $$ \mathop v\nolimits_{\text{r}} {{/({\mathrm{m}} \cdot {\mathrm{s}}^{-1})}} $$ \mathop h\nolimits_{\text{b}} {\text{/m}} $$ \mathop h\nolimits_{\text{r}} {\text{/m}} $m
FCRIFFWERI
t196.0798.396065.07190.61190.648000.388091.27{0.8, 0, 0.2}{0.1, 0.9, 0}{0.5, 0.2, 0.1, 0, 0.2}{0, 0.2, 0.5, 0.2, 0.1}
t2100.50103.765618.49190.16191.338037.198104.47{0.5, 0, 0.5}{0.1, 0.8, 0.1}{0.1, 0.6, 0.1, 0, 0.2}{0, 0.2, 0.5, 0.1, 0.2}
t392.4097.484472.12188.58191.638112.708135.21{0.1, 0.5, 0.4}{0.1, 0.7, 0.2}{0.3, 0.5, 0.1, 0, 0.1}{0, 0.1, 0.6, 0.1, 0.2}
t483.7590.053893.08187.53191.058148.838150.74{0.1, 0.5, 0.4}{0.1, 0.7, 0.2}{0.1, 0.7, 0.1, 0, 0.1}{0, 0.1, 0.6, 0.1, 0.2}
t583.7580.413258.55186.22190.858189.448167.48{0, 0.8, 0.2}{0.3, 0.6, 0.1}{0.1, 0.6, 0.2, 0, 0.1}{0, 0.1, 0.6, 0.2, 0.1}
t698.0353.972188.50183.45183.458261.838202.54{0.1, 0.7, 0.2}{0.3, 0.6, 0.1}{0.1, 0.7, 0.2, 0, 0}{0, 0.1, 0.5, 0.2, 0.2}
t7115.0438.251906.01182.29189.028292.218221.95{0.1, 0.8, 0.1}{0.4, 0.5, 0.1}{0, 0.8, 0.1, 0, 0.1}{0, 0.2, 0.5, 0.1, 0.2}
t8123.4431.461837.03189.02188.808306.068232.44{0.8, 0, 0.2}{0.1, 0.9, 0}{0.5, 0.2, 0.1, 0, 0.2}{0, 0.2, 0.5, 0.2, 0.1}
t9131.1026.271806.53181.26188.488319.028243.45{0.5, 0, 0.5}{0.1, 0.8, 0.1}{0.1, 0.6, 0.1, 0, 0.2}{0, 0.2, 0.5, 0.1, 0.2}
t10143.2820.771809.42180.36187.138342.298267.10{0.1, 0.5, 0.4}{0.1, 0.7, 0.2}{0.3, 0.5, 0.1, 0, 0.1}{0, 0.1, 0.6, 0.1, 0.2}

新窗口打开| 下载CSV


1) 多模式证据修正.

依据1.3节的证据修正方法(见图3表3),得到不完备信息实验(实验2~4)的证据输入模式切换情况,如图8所示. 可见,随着证据信息不完备程度的加剧,非“1”的输入模式占比逐渐增大,达到了有效修正证据的目的. 从3个实验(实验2~4)中选取不同类型证据进行输入模式切换及修正过程,说明如下. 实验2中,突变型证据FCR(编号1)在t4时刻缺失,直接进行节点删除操作,因此由t3时刻的模式1切换为模式4. 实验3中确定型证据IFF(编号2)在t7时刻检测到信度为{0.1,0.5, 0.1},存在失真,但由于IFF不满足“前3个时刻信息均有效”的预测条件,将其用前一时刻的有效证据替代,由t6时刻的模式1变为模式3. 实验4中证据VA(编号7)在t5时刻的检测值为0 m/s(即数据缺失),按照1.3.1节的连续型证据预测方法进行数据预测,预测结果为186.705 2 m/s,检测值与预测值的误差超出规定阈值5 m/s. 采用预测值替代,由t4时刻的模式1变为t5时刻的模式2.

图 8

图 8   证据输入模式的切换

Fig.8   Switching of evidence input mode


2)推理结果及方法比较.

将修正后并经信度结构转换(见1.4节)的4组证据输入MVWSF-EN中,根据1.5.3节的推理操作,获取我方相对敌方的10个时刻态势等级. 为了验证本文方法的优越性,开展与EN、变权时空融合EN(TSF-EN)及基于邓熵修正证据的EN(DE-EN)在不完备信息下(实验2~4)的推理结果对比,如图9所示. 其中平均值为将实验1可靠证据输入EN和MVWSF-EN后,对推理的态势值取平均,作为态势期望衡量误差. 因DE-EN未明确不完备信息表述规则,开展如下处理:突变型信息将空集信度分配置1;非突变型信息对前两时刻信息进行不确定处理后,计算邓熵折扣系数,依据改进的合成公式[7]获取当前信息信度分配函数的修正结果.

图 9

图 9   1对1场景不完备信息下的各方法结果对比

Fig.9   Comparison of results of various methods under incomplete information in one against one scenario


图9可知,利用MVWSF-EN方法获取的各时刻态势标准值与态势期望最一致,且态势变化与图7对抗过程的3个阶段相符:初期敌机逃离我机,咬尾追击,优势先降后升;中期敌机半滚倒转,优势渐减;末期我机横滚加速绕至敌尾,敌机逐渐进入我方不可逃逸区,我方终占优势.

从数据分析来看,信息不完备程度的加剧显著影响推理准确性. EN因缺乏对不完备信息的处理机制,平均相对误差从0.286 4激增至0.585 2,出现严重失真. 虽然TSF-EN通过信度替换和权重调整策略优化,但处理手段单一,导致平均相对误差从0.166攀升至0.376 9. DE-EN虽然基于Deng 熵理念处理不完备信息,但因缺乏通用框架与差异化校正标准,平均相对误差从0.140 7上升到0.284 1,结果不理想. 相比之下,MVWSF-EN在各实验中的平均相对误差始终约为0.05,展现出卓越的信息不完备性处理能力.

2.2. 消融实验

为了验证三大机制创新的有效性和必要性,构建2对1的无人机对抗场景(见图10). 假设在执行某次追击任务时,我方派出1号长机负责攻击敌机、2号僚机进行掩护支援.

图 10

图 10   2v1对抗轨迹

Fig.10   Two against one track


以我方1号长机相对于敌机的态势评估过程为例,开展MVWSF-EN、去掉自适应权值生成机制的MSF-EN、去掉自适应权值生成机制和时空融合的M-EN以及3种策略全部去掉的传统EN共4种方法的消融实验.4组实验(不完备信息的处理方法同2.1节)下的对比结果如图11所示.

图 11

图 11   消融实验的态势评估结果

Fig.11   Situation assessment result of ablation experiment


图10的对抗场景中,敌机加速逃逸,我方1号长机快速提速爬升绕至敌机尾后占据有利位置,2号僚机同步保持掩护伺机而动. 在该过程中,1号机的态势优势持续增强,与图11(a)所示的4组实验结果高度契合.

与其他方法相比,图11(b)的MSF-EN因未基于证据可靠度差异与实战变化动态调整权值,评估结果显著偏高,平均相对误差达到0.17.图11(c)的M-EN进一步缺失时空融合机制,未考虑时序信息的关联,导致态势推理偏差扩大,10个时刻下的平均相对误差达到0.33. 图11(d)所示的传统EN丧失2项核心策略及证据修正能力,当信息不完备加剧时,该方法的态势评估结果与实际趋势严重背离,失去实用价值.

2.3. 方法复杂度的比较

为了评估MVWSF-EN方法的实际应用能力,比较上述4种方法的推理时间. 针对所构建的1对1和2对1无人机对抗实战场景,在不完备信息缺陷率为7.5%的情况下,利用各方法分别进行200次实验,对单个推理时刻的平均运行时间tav进行比较,结果如表5所示.

表 5   4种方法的平均运行时间比较

Tab.5  Average running time comparison of four methods

方法tav/s
MVWSF-ENDE-ENTSF-ENEN
1对10.170.250.260.25
2对10.320.640.720.66

新窗口打开| 下载CSV


表5可知,MVWSF-EN算法虽然增加了证据修正、动态变权、时空融合等功能,但运行时间保持在$ {\text{1}}{{\text{0}}^{{{ - 1}}}} $ s量级(只是由于作战规模增加,目前采用的串行计算导致时间成本加倍),在确保态势评估结果持续准确的前提下低于其他3种算法的运算时间,能够满足实战需求.

3. 结 语

本文提出基于证据修正机制的多模式变权时空融合证据网络方法,用于解决不完备信息下的空战态势评估问题. 通过结合数据类型与缺陷程度的多模式证据修正策略,实现缺陷信息的针对性修正,显著提升态势评估的准确度. 提出的节点权值自适应生成机制可以依据证据输入模式和推理结果自主调节权值,避免“常权”引发的推理矛盾. 针对时序信息的3步时空融合机制,区分“突变型”与“非突变型”信息的时间关联,进一步增强评估结果的合理性.1对1和2对1空战对抗场景下的多组仿真实验表明,本研究方法在多种不完备信息下表现优异,评估结果显著优于EN、TSF-EN和DE-EN等方法.

在未来研究中,将引入优化技术修正网络的主要参数,进一步提升推理结果的准确性.

参考文献

XU X M, YANG R N, FU Y

Situation assessment for air combat based on novel semi-supervised naive Bayes

[J]. Journal of Systems Engineering and Electronics, 2018, 29 (4): 768- 779

DOI:10.21629/JSEE.2018.04.11      [本文引用: 1]

SUN Y, MA P, DAI J, et al

A cloud Bayesian network approach to situation assessment of scouting under water targets with fixed-wing patrol aircraft

[J]. CAAI Transactions on Intelligence Technology, 2022, 8 (2): 532- 545

LI W N, ZHANG W G, LIU B N, et al

The situation assessment of UAVs based on an improved whale optimization Bayesian network parameter-learning algorithm

[J]. Drones, 2023, 7 (11): 655

DOI:10.3390/drones7110655      [本文引用: 1]

GAO L, JIANG J F, XU J W, et al

SAPFIS: a parallel fuzzy inference system for air combat situation assessment

[J]. Journal of Supercomputing, 2024, 81 (1): 73

[本文引用: 1]

李山, 权文, 李昉, 等

基于改进D-S理论的多时刻空中目标威胁评估

[J]. 电光与控制, 2024, 31 (3): 48- 52

[本文引用: 2]

LI Shan, QUAN Wen, LI Fang, et al

Multi-moment aerial target threat assessment based on improved D-S theory

[J]. Electronics Optics and Control, 2024, 31 (3): 48- 52

[本文引用: 2]

WANG H B, GUAN X, YI X

Evidence network inference recognition method based on cloud model

[J]. Electronics, 2023, 12 (2): 318

DOI:10.3390/electronics12020318      [本文引用: 1]

ZHOU X L, TANG Y C

A note on incomplete information modeling in the evidence theory

[J]. IEEE Access, 2019, 7: 166410- 166414

DOI:10.1109/ACCESS.2019.2954132      [本文引用: 2]

TANG Y C, ZHOU D Y, CHAN F T S

An extension to Deng’s entropy in the open world assumption with an application in sensor data fusion

[J]. Sensors, 2018, 18 (6): 1902

DOI:10.3390/s18061902     

CHEN Y T, TANG Y C

An improved approach of incomplete information fusion and its application in sensor data-based fault diagnosis

[J]. Mathematics, 2021, 9 (11): 1292

DOI:10.3390/math9111292      [本文引用: 1]

郝启凯, 荀盼盼, 鄂超然, 等

基于变异系数法和改进TOPSIS法的空战威胁评估

[J]. 火炮发射与控制学报, 2024, 45 (5): 56- 63

[本文引用: 1]

HAO Qikai, XUN Panpan, E Chaoran, et al

Air combat threat assessment based on the coefficient of variation method and improved TOPSIS method

[J]. Journal of Gun Launch and Control, 2024, 45 (5): 56- 63

[本文引用: 1]

杨爱武, 李战武, 李宝, 等

基于动态变权重的空战态势评估

[J]. 兵工学报, 2021, 42 (7): 1553- 1563

DOI:10.3969/j.issn.1000-1093.2021.07.023     

YANG Aiwu, LI Zhanwu, LI Bao, et al

Air combat situation assessment based on dynamic variable weight

[J]. Acta Armamentarii, 2021, 42 (7): 1553- 1563

DOI:10.3969/j.issn.1000-1093.2021.07.023     

华家辉, 孙鑫, 陈晓东, 等

基于集群分析的空中作战目标威胁评估技术研究

[J]. 战术导弹技术, 2023, 218 (2): 96- 104

[本文引用: 1]

HUA Jiahui, SUN Xin, CHEN Xiaodong, et al

Research on air objective threat assessment technology based on cluster analysis

[J]. Tactical Missile Technology, 2023, 218 (2): 96- 104

[本文引用: 1]

YANG J Y, LI C H, LI S Y, et al

Anti-interference recognition for aerial infrared object based on convolutional feature inference network

[J]. IEEE Aerospace and Electronic Systems Magazine, 2023, 78 (2): 4- 15

[本文引用: 1]

ZHANG K, WEI J Y, WANG T T, et al

Air target recognition algorithm based on mixed depth features in the interference environment

[J]. Optik, 2021, 245: 167535

DOI:10.1016/j.ijleo.2021.167535     

ZHANG X Y, HUANG W, LIN X, et al

Complex image recognition algorithm based on immune random forest model

[J]. Soft Computing, 2020, 24 (16): 12643- 12657

DOI:10.1007/s00500-020-04706-0      [本文引用: 1]

王昱, 任田君, 范子琳, 等

基于角度特征的分布式DDPG无人机追击决策

[J]. 控制理论与应用, 2025, 42 (7): 1356- 1366

DOI:10.7641/CTA.2024.30105      [本文引用: 2]

WANG Yu, REN Tianjun, FAN Zilin, et al

Distributed DDPG UAV pursuit decision based on angle feature

[J]. Control Theory and Applications, 2025, 42 (7): 1356- 1366

DOI:10.7641/CTA.2024.30105      [本文引用: 2]

王昱, 章卫国, 傅莉, 等

基于改进证据网络的空战动态态势估计方法

[J]. 航空学报, 2015, 36 (12): 3896- 3909

[本文引用: 2]

WANG Yu, ZHANG Weiguo, FU Li, et al

Dynamic situation assessment method of aerial warfare based on improved evidence network

[J]. Acta Aeronautica et Astronautica Sinica, 2015, 36 (12): 3896- 3909

[本文引用: 2]

余蕾, 邹志科, 刘凤丽, 等

湖北漳河灌区中稻气象产量变化特征及预测模型

[J]. 长江科学院院报, 2024, 41 (2): 82- 90

DOI:10.11988/ckyyb.20221141      [本文引用: 1]

YU Lei, ZOU Zhike, LIU Fengli, et al

Variation features and estimation model for meteorological yield of mid-season rice in Zhanghe irrigated area of Hubei Province

[J]. Journal of Changjiang River Scientific Research Institute, 2024, 41 (2): 82- 90

DOI:10.11988/ckyyb.20221141      [本文引用: 1]

贺宝记, 白林亭, 文鹏程. 基于态势评估及DDPG算法的一对一空战格斗控制方法 [J]. 航空工程进展, 2024, 15(2): 179-187.

[本文引用: 1]

HE Baoji, BAI Linting, WEN Pengcheng. One-on-one air combat control method based on situation assessment and DDPG algorithm [J]. Advances in Aeronautical Science and Engineering, 2024, 15(2): 179-187.

[本文引用: 1]

余付平, 黄益恒, 沈堤, 等

D-S证据理论在空中目标识别中的应用现状与展望

[J]. 电光与控制, 2024, 31 (4): 75- 86

DOI:10.3969/j.issn.1671-637X.2024.04.012      [本文引用: 1]

YU Fuping, HUANG Yiheng, SHEN Di, et al

Application status and prospects of D-S evidence theory in aerial target identification

[J]. Electronics Optics and Control, 2024, 31 (4): 75- 86

DOI:10.3969/j.issn.1671-637X.2024.04.012      [本文引用: 1]

张堃, 张振冲, 刘泽坤, 等

基于FD-TODIM的混杂空战多目标动态威胁评估

[J]. 系统工程与电子技术, 2023, 45 (1): 148- 154

[本文引用: 2]

ZHANG Kun, ZHANG Zhenchong, LIU Zekun, et al

Multi-target dynamic threat assessment in mixed air combat based on FD-TODIM

[J]. Systems Engineering and Electronics, 2023, 45 (1): 148- 154

[本文引用: 2]

王昱, 关智慧, 李远鹏

基于轨迹预测和分布式MADDPG的无人机集群追击决策

[J]. 计算机应用, 2024, 44 (11): 3623- 3628

DOI:10.11772/j.issn.1001-9081.2023101538      [本文引用: 1]

WANG Yu, GUAN Zhihui, LI Yuanpeng

Distributed UAV cluster pursuit decision-making based on trajectory prediction and MADDPG

[J]. Journal of Computer Applications, 2024, 44 (11): 3623- 3628

DOI:10.11772/j.issn.1001-9081.2023101538      [本文引用: 1]

BENAVOLI A, RISTIC B, FARINA A

An application of evidential networks to threat assessment

[J]. IEEE Transactions on Aerospace and Electronic Systems, 2009, 45 (2): 620- 639

DOI:10.1109/TAES.2009.5089545      [本文引用: 1]

/