基于信息共享的多智能体自主电子干扰系统
Multi-agent autonomous electronic jamming system based on information sharing
通讯作者:
收稿日期: 2021-03-15 接受日期: 2021-11-24
基金资助: |
|
Received: 2021-03-15 Accepted: 2021-11-24
Fund supported: | 国家杰出青年科学基金资助项目(61525403);省级重点研发计划资助项目(209C05004);之江国际青年人才基金资助项目 |
作者简介 About authors
张盼(1993—),男,博士生,从事智能信息感知、信号处理的研究.orcid.org/0000-0002-9818-1043.E-mail:
为了实现电子干扰机在复杂电磁环境中对辐射源的有效干扰,利用多智能体电子干扰机与信息共享机制,突破原有单传感器的有限信息感知能力,实现实时动态态势信息共享,增强电子干扰机的智能决策认知能力. 基于信息共享的多智能体自主电子干扰系统实现了μs级的干扰参数快速收敛,减小了单传感器的信息误差概率. 通过仿真实验表明,基于该方法的干扰参数更新策略随着态势环境的动态变化而实时自主调整,实现了更加自主与智能的认知电子干扰系统.
关键词:
Multi-agent electronic jammers and information sharing mechanism was used to break through the limited information perception ability of the original single sensor in order to realize the effective jamming of radiation source in complex electromagnetic environment. Then real-time dynamic situation information sharing was realized, and the intelligent decision cognition ability of electronic jammer was enhanced. The rapid convergence of the microsecond-level about the jamming parameters was achieved by the multi-agent independent electronic jamming system based on information sharing, and the information error probability in a single-jammer conditions was reduced. The experimental results show that the jamming parameter update strategy based on the method is adjusted in real time with the dynamic change of situational environment. A more autonomous and intelligent cognitive electronic jamming system is realized.
Keywords:
本文引用格式
张盼, 丁华, 张颖而, 李冰凝, 皇甫江涛, 金仲和.
ZHANG Pan, DING Hua, ZHANG Ying-er, LI Bing-ning, HUANG-FU Jiang-tao, JIN Zhong-he.
本文引入多智能体电子干扰机,考虑分布式多智能体,实现对三维电磁态势的实时感知与高效处理. 提出基于信息共享的多智能体协同探测感知机制,实现对环境的实时高动态自主态势感知能力. 本文基于分布式电子干扰机对外部电磁环境的实时动态感知与快速响应机制,利用多智能体信息共享的优势,实现对辐射源目标电磁信息的协同感知;干扰决策中心能够基于当前电磁态势进行自适应调整,实现电子干扰策略及干扰参数的自主高效决策实施.
1. 电子对抗系统中的博弈模型
如图1所示为几种传统的电子干扰方法,大致可以分为2类:欺骗干扰与压制干扰. 欺骗干扰通过分析辐射源发射的有效信号的特征与参数,利用数字射频存储器(digital ratio frequency memory, DRFM)对有效信号进行存储、转发,实现干扰回波信号在速度、距离及多普勒域的变化,从而实现速度欺骗、距离欺骗、速度距离联合欺骗以及假目标密集复制效果. 压制干扰主要通过对辐射源发射功率较大的噪声调制信号,将真实目标回波湮没在干扰噪声中,使辐射源无法辨别有效目标的距离、速度等相关参数,达到对真实目标的压制干扰效果.
图 1
由于压制干扰在对抗过程中所发射的能量通常较大,很容易暴漏己方干扰源的相关辐射源信息,使己方在博弈对抗系统中处于劣势地位. 为了使博弈对抗系统中己方的收益更大,通常利用更加灵巧的电子欺骗干扰方式实现对目标更加自主与智能的干扰效果.
1.1. 电子干扰模型
在电子战对抗过程中,雷达对特定空域发射相应的探测信号
如图2所示为电子对抗干扰模型的示意图.
图 2
雷达的发射电压信号为
式中:
电子干扰机接收到的辐射源电压信号为
式中:
电子干扰机接收到有源雷达发射的直达波信号后,对
图 3
图 3 辐射源电磁参数侦察流程
Fig.3 Processing of electromagnetic parameters about radiation source
图3中的辐射源电子侦察包括对信号载波频率fc、脉冲宽度wp、脉冲重复频率fPR及有效信号带宽Bw的参数估计. 基于时域能量包络法实现对接收雷达脉冲重复周期PRI的测量,fPR为PRI的倒数,即
1.2. 基于动态态势感知的电子干扰策略
电子干扰机对被干扰目标的干扰策略是基于外部环境及电磁环境的变化而实时动态变化的. 传统的电子干扰方法是有限次模式的干扰策略,干扰策略是静态、非实时模式,不能适应动态的电磁环境. 在高动态电磁环境中,传统的电子干扰机不能适应复杂电磁环境,导致电子干扰机功能失效,可能暴露己方的位置、速度信息.
基于动态态势感知的电子干扰方法是基于环境交互的实时动态感知,可以实现对被干扰目标的实时动态电磁感知能力,从而实现更加智能的电子干扰策略.
如图4所示为基于环境交互的干扰机智能体观察与反馈示意图.
图 4
图 4 基于环境交互的动态电子干扰策略
Fig.4 Dynamic electronic jamming strategy based on environmental interaction
图4中,基于环境交互的动态电子干扰策略可以实时监测外部电磁环境,为更加精准的智能电子干扰提供先验信息. 其中,电子干扰机从外部电磁环境中实时感知电磁态势信息,包括频率、带宽、脉冲重复频率等相关信号参数. 通过与上一时刻的态势信息对比,实现对下一时刻电子干扰系统中相应参数的更新并将更新好的干扰信号作用于电磁环境中的被干扰目标. 干扰机从外部电磁环境中得到实时信息的反馈,为下一时刻的电子干扰决策提供精准的依据.
2. 基于信息共享的多智能体联合感知
图 5
图 5 基于信息共享的多智能体联合态势感知
Fig.5 Multi-agent joint situational awareness based on information sharing
2.1. 多智能体态势参数平衡问题
假设多智能体系统由N个单智能体电子干扰机节点组成,表示为
式中:Ci表示第i个智能体参数的集合.
整个多智能体系统能感知到的全部态势信息可以表示为
各个智能体中的参数主要包括fc、wp、fPR及Bw,干扰信号的参数权重用
式(5)中参数集合
由于同一时刻不同干扰机智能体感知到的态势参数信息不完全相同,需要对不同智能体之间的侦察参数进行态势观察与平衡处理. 对相邻电子干扰机智能体内的侦察态势参数求偏导,表达式为
以此类推,对相邻智能体之间的其他参数求偏导,如下所示:
若不同智能体之间的侦察参数信息不平衡,则各智能体的参数需要进行相应的调整.
各个智能体之间通过信息共享的方式,利用信息共享链路,实现不同智能体之间态势信息的平衡处理. 态势信息的传递表达式如下:
式中:
信息共享后的多智能体态势参数
式中:
基于多智能体参数信息共享的机制,可以实现各个智能体之间对外部电磁环境态势感知信息的平衡.
2.2. 智能体干扰参数自主决策
信息共享后的多智能体通过合作的方式实现全域空间电磁态势信息的协同感知,为了使电子干扰机的干扰信号能够不断适应新的态势环境,需要对干扰参数进行实时动态自主调控.
假设在
式中:
在下一时刻
式(11)对当前的态势参数与前一时刻的干扰参数求偏导,得到同一智能体在不同时刻的态势信息变化率. 利用这些态势信息,得到适应当前态势环境的电子干扰参数. 新的干扰参数变化过程如下:
式(12)为
由此,实现了智能体在不同时刻基于实时态势信息的电子干扰参数变化.
基于Q-learning的电子干扰策略[18]表达式如下:
式中:
3. 仿真及分析
基于信息共享的分布式多智能体合作博弈电子干扰系统是在与外部电磁环境不断交互的过程中持续修正、试错的一个过程,变化是连续实时动态的. 电子对抗系统中的双方在彼此博弈的过程中不断学习、持续改进,实现“道高一尺魔高一丈”的效果. 为了验证该方法的有效性,通过仿真结果对实验进行分析.
如表1所示为各个阶段辐射源的电磁态势信息变化表. 表中,T0、T1、T2、T3、T4、T5分别表示第0分钟、第10分钟、第20分钟、第30分钟、第40分钟、第50分钟的辐射源变化时刻,相邻2个态势变化之间间隔10 min. 从表1可以看出,在不同阶段,电磁辐射源发射的信号参数都不同,可以有效地避免辐射源发射信号参数单一带来的被跟踪的问题. 发射不同参数的信号,可以在回波中感知异常信息,从而识别回波中的干扰信号,对干扰源进行定位与追踪,因此具有参差变化的辐射源特性具有一定的抗干扰功能. 电子干扰机需要在动态复杂的电磁环境中,实时感知辐射源态势信息的变化趋势,将这些信息作为电子干扰参数更新的先验信息与依据,使电子干扰系统成为自主系统,实现对目标态势信息的自主感知与动态认知干扰策略.
表 1 辐射源电磁态势变化表
Tab.1
阶段 | fc/GHz | wp/μs | fPR/Hz | Bw/MHz |
T0 | 3.25 | 22.5 | 5 000 | 10 |
T1 | 5 | 60 | 10 000 | 10 |
T2 | 4.375 | 40 | 5 000 | 20 |
T3 | 2.6 | 50 | 2 500 | 20 |
T4 | 5.45 | 20 | 10 000 | 15 |
T5 | 6.25 | 35 | 5 000 | 15 |
基于Q-Learning的动态认知电子干扰策略,可以实现基于环境电磁态势的实时感知;依据感知结果实时更新系统电子干扰参数,使电子干扰系统的干扰策略一直处于最佳状态. 系统流程如图6所示.
图 6
图 6 多智能体协同感知自主干扰的流程图
Fig.6 Flow chart of multi-agent cooperative sensing autonomous jamming
图6中,多智能体之间通过协同感知的方式,实现分布式电子干扰机对空间电磁态势信息的获取. 信息共享后的智能体态势信息表达为
3.1. 态势信息共享
基于表1中辐射源发射信号的参数态势信息,电子干扰机通过无源被动电子侦察系统,实现对辐射源电磁参数的估计与调制类型识别.
6个电子干扰机智能体等边距地分布在辐射源周边,实现对空间全域电磁态势信息的动态感知,示意图如图5所示. 假设辐射源所在环境的信噪比为0 dB,其中噪声为
图 7-1
图 7
图 7 多智能体电子干扰机测量不同时刻的电磁态势信息
Fig.7 Multi-agent electronic jammer measures electromagnetic situation information at different time
系统中6个电子干扰机分别在T0、T1、T2、T3、T4、T5时刻经过均衡化处理后感知到的辐射源不同特征参数(包括fc、wp、fPR、Bw)的电磁态势信息如图7所示.
基于信息共享后的辐射源信号参数估计结果如表2所示. 表中,测量得到的辐射源信号参数包括
表 2 信息共享后的辐射源信号参数估计
Tab.2
阶段 | fc/GHz | wp/μs | PRI/μs | k / (1011Hz · s−1) |
T0 | 3.2539 | 22.367 | 198.30 | 4.4920 |
T1 | 4.9758 | 59.76 | 102.760 | 1.6340 |
T2 | 4.3863 | 40.432 | 200.843 | 4.9317 |
T3 | 2.6036 | 50.372 | 399.346 | 3.9705 |
T4 | 5.4620 | 19.874 | 100.264 | 7.5475 |
T5 | 6.2510 | 35.006 | 201.149 | 4.2850 |
分析表2的辐射源信号参数估计可知,基于多智能体的态势信息共享参数更能够表征当前的电磁态势,可以避免单智能体观测导致的信息参数不平衡问题.
3.2. 干扰参数自主更新
将均衡化处理后的辐射源信号特征参数作为环境感知信息
根据Q-Learning方法,通过对多参数估计结果的更新策略,实现干扰机中干扰参数的自主更新. 与传统的电子干扰方法相比,利用提出的基于多智能体协同感知电磁环境的动态电子干扰方法可以实现对全域电磁态势信息的实时感知与信息共享,为后续的智能化电子干扰方式提供决策依据;这些策略依据将指导电子干扰参数的精准连续变化,实现与外部电磁环境的“同频共振”.
基于共享后的电磁态势信息结果,在不同时间段T0~T5之间(其中T0、T1、T2、T3、T4、T5分别表示第0分钟、第10分钟、第20分钟、第30分钟、第40分钟、第50分钟的辐射源变化时刻,相邻2个态势变化之间间隔10 min),输入电子干扰机的电磁态势信息(包括
图 8
图 9
图 10
图 10 干扰参数矩阵随时间的动态响应曲线图
Fig.10 Dynamic response curve of jamming parameter matrix with time
从图10可以看出,当辐射源发射的雷达信号发生变化时,电子干扰机能够快速对当前的电磁态势进行评估,利用Q-Learning方法实现对下一时刻干扰机的干扰参数进行调整,以适应当前的电磁环境,不被辐射源雷达发现干扰机信号.
3.3. 性能分析
基于分布式信息共享的多电子干扰机协同感知与快速响应高效智能决策的方法,提升了电子干扰机对外部电磁环境的高置信度认知能力. 为了对比基于信息共享的动态智能电子干扰方法与传统单电子干扰机在电磁信息感知能力方面的区别,设计如下仿真实验.
图 11
图 11 辐射源态势信息的感知准确率随智能体数量变化的曲线
Fig.11 Curve of perception accuracy of radiation source situation information with number of agent
如图11所示为不同数量的电子干扰机智能体对辐射源态势信息感知准确率Acc的变化曲线图.
辐射源态势信息感知准确率的表达式为
参数集合中第i个智能体参数的感知概率可以表示为
式中:
从图11可以看出,随着智能体数量的增加,系统对辐射源雷达态势信息的感知准确率越高. 相比于单个智能体对辐射源信息的感知,多智能体对辐射源态势信息的感知更加精准,当智能体数量达到7个时,识别率能够达到98.43%.
传统的电子干扰方法[19]中的干扰参数不能实时连续动态更新,干扰参数是基于电子侦察结果进行相应参数的直接改变. 基于信息共享的分布式多智能体动态电子干扰系统能够实现对外部电磁环境实时立体式多维度感知,避免单一传感器参数测量带来的误差. 基于Q-Learning方法的电子干扰参数更新过程是渐变的过程,参数更新具有连续性,避免干扰信号参数突变带来暴露电子干扰机的弊端.
为了验证该方法的实时干扰效果,分别计算传统电子干扰方法与基于Q-Learning方法的干扰参数响应时间. 在一个周期内,传统的静态电子干扰方法干扰参数响应时间为12.372 μs,基于Q-Learning方法的干扰参数响应时间为7.843 μs. 通过对比分析可知,相比于传统的静态电子干扰方法,提出的动态自主电子干扰方法的平均响应时间提升了36.61%,可以实现更加自主与灵敏的动态干扰信号参数的快速响应与自主更新. 利用基于Q-Learning的动态电子干扰参数更新方法可以实现连续时间下的电磁态势动态反馈与精准电子干扰功能.
利用提出的分布式多智能体电子干扰方法可以实现对被干扰目标的协同感知与态势信息获取,利用当前的电磁态势信息与上一时刻的电子干扰参数,实现对目标干扰策略与干扰参数的实时动态更新.
4. 结 语
本文基于分布式智能体的思想,提出信息共享的多电子干扰机协同感知与高效电子干扰决策的方法. 空间中的电磁环境复杂且多变,电子对抗博弈系统更需要充分感知电磁态势信息,以实现对目标信息的动态感知与精准决策功能. 本文基于Q-Learning方法的快速电磁态势信息感知与电子干扰参数更新方法,可以实现电子干扰机对外部电磁环境的实时感知与下一时刻电子干扰参数的在线精准决策,摆脱了传统电子干扰系统中固定干扰模式的弊端,为后续的智能化电子干扰系统提供了实践意义,也为后续的认知电子对抗系统的研究奠定了坚实的基础.
参考文献
人工智能技术在电子战中的应用
[J].
Application of AI technology in EW
[J].
Analysis of range_doppler coherent jamming performance against radar with the RATR technique
[J].
Tracking technique for radar network in the presence of multi-range-false-target deception jamming
[J].
认知电子战体系结构与技术
[J].DOI:10.1360/N112018-00153 [本文引用: 1]
The architecture and technology of cognitive electronic warfare
[J].DOI:10.1360/N112018-00153 [本文引用: 1]
基于Q-学习的智能雷达对抗
[J].DOI:10.3969/j.issn.1001-506X.2018.05.11 [本文引用: 1]
Intelligent radar countermeasure based on Q-learning
[J].DOI:10.3969/j.issn.1001-506X.2018.05.11 [本文引用: 1]
基于Q-学习算法的认知雷达对抗过程设计
[J].
Design of cognitive radar jamming based on Q-learning algorithm
[J].
Efficient low-PAR waveform design method for extended target estimation based on information theory in cognitive radar
[J].DOI:10.3390/e21030261 [本文引用: 1]
Multi-agent containment control with input saturation on switching topologies
[J].DOI:10.1049/iet-cta.2014.0393 [本文引用: 1]
Distributed robust global containment control of second-order multiagent systems with input saturation
[J].
Cooperative output regulation of discrete-time linear time-delay multi-agent systems under switching network
[J].
Cooperative output regulation of discrete-time linear time-delay multi-agent systems
[J].DOI:10.1049/iet-cta.2016.0106 [本文引用: 1]
Distributed containment control of multi-agent systems with general linear dynamics in the presence of multiple leaders
[J].DOI:10.1002/rnc.1847 [本文引用: 1]
/
〈 |
|
〉 |
