针对多无人机(UAV)协同路径规划的问题,提出改进黏菌人工蜂群算法(ISMABC). 建立路径规划代价模型,通过引入适应度函数和约束条件,将三维环境中的路径规划问题转化为优化问题,利用所提算法求解模型,获得最优路径. 采用佳点集策略和非线性收敛因子,对黏菌算法进行改进,在增加种群多样性的同时,提高算法的收敛速度. 对全局最优个体采用精英反向学习策略,提高种群质量. 在人工蜂群探索能力的基础上,引入全局最优位置引导,提高黏菌算法的开发能力. 通过对14个测试函数和CEC2017测试函数集中部分函数的寻优对比分析可知,ISMABC算法的寻优能力和收敛速度都有了较大的提升. 为了验证ISMABC算法的可行性,采用所提算法求解多无人机协同路径规划问题. 通过对比分析可知,利用ISMABC算法能够为每架UAV规划出满足约束且代价最小的路径.
为了实现高效地将任务分配给每个智能体,为智能体规划出尽可能短且不与其他智能体发生碰撞的路径,提出多目标多智能体路径规划方法. 针对传统路径规划算法使用离散时间导致成功率低的问题,该算法定义连续时间下智能体间的冲突定义与解冲突方式,在A*算法的基础上引入安全间隔与标签的概念,使得A*算法可以规划出满足连续时间约束的最优路径. 针对多智能体路径规划问题中因碰撞检测、冲突避免造成的较大计算量,提出冲突分级策略,减少了算法求解过程中扩展的节点数量. 实验结果表明,利用所提出的算法能够求解得到更优的解决方案,且该算法具有更好的适用性;在智能体分布密集的场景下,该算法表现出更低的路径总成本和更高的求解成功率.
针对无人机航拍图像背景复杂、目标尺寸小及设备资源有限等问题,提出轻量化小目标检测算法RTA-YOLOv8s. 在主干网络引入RepVGG模块,增强特征提取能力. 应用三分支注意力机制,降低小目标的误检率和漏检率. 增加小目标专用检测头,提高对小目标的检测能力. 采用WIoUv3作为损失函数,提升模型的定位性能和鲁棒性. 实验结果表明,RTA-YOLOv8s算法在VisDrone数据集中的mAP50达到44.9%,检测速度达到88.5帧/s. 与基线算法YOLOv8s相比,mAP50提升了6.1%,检测准确率提高了4.7%,参数量减少了13.9%. 利用改进的算法,有效解决了复杂场景下检测效果不佳的问题,在精度和速度之间取得了很好的平衡. 设计人机界面,实现结果可视化,使检测任务更加直观且易操作,适合无人机航拍的目标检测.
针对多模态情感分析中单模态特征质量较差及多模态特征交互不够充分的问题,提出基于多头自注意力机制和MLP-Interactor的多模态情感分析方法. 通过基于多头自注意力机制的模态内特征交互模块,实现单模态内的特征交互,提高单模态特征的质量. 通过MLP-Interactor机制实现多模态特征之间的充分交互,学习不同模态之间的一致性信息. 利用提出方法,在CMU-MOSI和CMU-MOSEI 2个公开数据集上进行大量的实验验证与测试. 结果表明,提出方法超越了当前诸多的先进方法,可以有效地提升多模态情感分析的准确性.
针对现有的源代码漏洞检测模型对异构特征和底层信息提取不足导致的检测准确率不高的问题,提出基于异构图表征的源代码漏洞检测方法. 从中间代码表示(IR)中提取8种指令级特征作为程序依赖图的节点嵌入,解决底层信息提取不足的问题. 在节点层和依赖层分别构建基于注意力机制的聚合模块来提取图表征数据中的异构性特征,通过调整注意力系数捕获关键节点信息. 对图数据的聚合结果进行分类,预测是否存在漏洞. 在合成数据集和2个真实项目数据集上的实验表明,相比于现有方法,本文方法具有更强的异构特征提取能力和更高的漏洞检测综合性能.
针对视听语音增强模型复杂度高且性能不佳的问题,提出基于卷积和门控注意的两阶段视听语音增强算法. 采用分块混合的门控注意单元(GAU)为特征融合网络主干,使用简化的单头注意力机制及应用块内二次-块间线性注意力,降低复杂度并捕获音视频序列的全局依赖关系. 在GAU中融入卷积模块,利用逐深度卷积和点卷积对音视频块内-块间局部特征进行提取,捕获音视频序列的局部依赖关系. 卷积与注意力相结合,可以显著提升模型在处理音视频序列时的性能. 为了利用2种模态包含的语音信息,采用两阶段算法,第1阶段音频作为主导模态,视频作为条件模态. 第2阶段视频作为主导模态,第1阶段提取的音频作为条件模态. 实验结果表明,提出的模型较现有模型在PESQ和SNR指标上均有显著提高,有效降低了复杂度.
为了解决伪装目标检测中目标的边缘特征及对应场景下独特纹理特征信息表达处理不足的问题,提出基于Convnextv2与纹理边缘引导的伪装目标检测算法. 通过纹理编码模块在输入图片上提取纹理特征,与主干网络提取的边缘特征进行融合,生成图片的纹理-边缘特征. 通过设计的纹理边缘引导的注意力模块,将纹理-边缘特征融入主干特征以定位目标的真实位置. 利用特征融合模块进行多层次特征融合,采用多级监督的方式,设计总的损失函数. 在3个公开数据集CAMO、COD10K、NC4K和迷彩伪装混合数据集MICAI_TE上的实验表明,该算法的综合性能最优.
针对低轨卫星扩频通信系统信噪比较低且多普勒频偏较大的问题,提出改进的FFT-IFFT捕获算法. 利用扫频区间的边带信息估计捕获区间,在高灵敏度高动态条件下减少FFT次数并缩短捕获时间. 结合数字自动增益控制(AGC)辅助的捕获机制降低误捕概率,提升了算法的可靠性. 理论分析与实验表明,改进算法比传统算法更有优势,在满足检测概率大于99%、最小载噪比为34.66 dB、最小信噪比为16 dB的情况下,极限灵敏度可达?130 dBm,总多普勒频偏捕获范围可达140 kHz,捕获时间低至0.8 s,满足实际应用的需求,已应用于浙江大学自主研制的某大规模低轨卫星星座中.
针对生产线和仓库之间单载自动导引车(AGV)任务调度的行驶距离优化问题,考虑多种任务选择策略,提出基于二进制粒子群优化的嵌套算法框架(BPSO嵌套框架),求解优化调度方案. 针对固定任务选择策略下的优化调度方案求解,考虑任务执行顺序约束和任务节点信息随环境变化,以最小化AGV行驶总距离为目标,建立基于有向无环图建模的动态旅行商问题(DAGDTSP)模型,提出改进遗传算法(IGA)求解模型. 实验结果表明,针对AGV任务调度方案的优化,利用IGA算法,能够有效地求解固定任务选择策略下的优化调度方案. BPSO嵌套框架能够提升求解质量,所求解的优化调度方案能够在一定程度上适应任务变化. DAGDTSP模型在不同环境参数设置的测试问题上具备准确性.
针对深度强化学习(DRL)算法训练数据需求量大、连续导航信息利用不充分的问题,提出DWA-LSTM TD3算法. 该算法根据目标点相对位置、机器人自身速度和当前激光雷达数据控制机器人运动,过程无需先验地图. 在训练过程中,利用动态窗口法(DWA)引导双延迟确定策略梯度(TD3),提高训练数据的质量. 在策略网络中引入长短期记忆神经网络(LSTM),提升智能体对连续导航信息的处理能力. 搭建仿真环境训练测试,与其他方法进行对比. 实验结果表明,DWA-LSTM TD3在相同的训练步数下能够获得更高的奖励值,提高了导航任务的成功率;导航姿态角的波动范围变化更小,轨迹更平滑,改善机器人的运动安全性能. 利用该算法,能够在不同场景下高效完成导航任务. 该算法具有很强的泛化能力.
针对现有交通图像自动标注方法标注类别不可扩展、精度低的问题,提出基于模态间对比学习的可扩展交通图像自动标注方法. 该方法以文本和图像双模态数据为研究对象,通过对比学习捕获模态间特征的相似关系,采用模态间特征增强策略优化跨模态数据的有效对齐. 在文本特征提取阶段,提出文本距离融合编码模块,通过构建距离感知特征融合组件,增强文本序列的局部特征表达能力. 在图像特征提取阶段,设计可变形过滤卷积结构,在增强不规则目标识别能力的同时,有效过滤噪声信息. 建立组合对比损失函数,改进原有的损失结构,提升模态间正、负样本的区分度. 实验结果表明,相较于同类规模的其他模型,所提模型在BIT车辆数据集上的mAP0.5和mAP0.5:0.95分别提升了5.3%、4.8%,在交通图像自动标注方面,表现更优.