全文下载排行

一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

当前位置: 一年内发表文章
Please wait a minute...
1. 基于改进Transformer的复合故障解耦诊断方法
王誉翔,钟智伟,夏鹏程,黄亦翔,刘成良
浙江大学学报(工学版)    2023, 57 (5): 855-864.   DOI: 10.3785/j.issn.1008-973X.2023.05.001
摘要   HTML PDF(pc) (2584KB)(627)   

大多复合故障诊断方法视复合故障为一种新的单一故障类型,忽视了内部单一故障的相互作用、故障分析粒度含糊和解释性差. 为了解决复合故障难解耦的问题,针对工业环境中复合故障数据极少的情况,提出一种基于改进Transformer的复合故障解耦诊断方法. 诊断流程分为预处理、特征提取和故障解耦3个步骤. 故障解耦引入Transformer的解码器,利用交叉注意力机制使得每个单一故障标签可以在提取的特征层中,自适应地关注到与故障特征相对应的判别特征区域,进一步预测每个单一故障标签的输出概率以实现复合故障解耦. 设计多组复合故障试验与业界先进算法进行对比,以验证方法的有效性. 结果表明,所提方法在少量单一故障训练样本和极少量复合故障训练样本情况下,有较高的诊断准确度. 当训练集中复合故障样本数仅为5时,复合故障诊断准确度达到88.29%,与其他方法比较更具有显著优势.

2. 基于改进强化学习的多智能体追逃对抗
薛雅丽,叶金泽,李寒雁
浙江大学学报(工学版)    2023, 57 (8): 1479-1486.   DOI: 10.3785/j.issn.1008-973X.2023.08.001
摘要   HTML PDF(pc) (1158KB)(416)   

针对多智能体追逃问题,提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法(MADDPG)和双延迟-确定策略梯度算法(TD3)相结合,提出多智能体双延迟-确定策略梯度算法(MATD3). 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题,提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数,将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励,提出DEPER-MATD3算法. 基于此算法设计仿真实验,并与其他算法对比,实验结果表明,该算法有效解决了过估计问题,且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高,追击者有更大的概率追击到逃逸者.

3. 基于改进Transformer的结构化图像超分辨网络
吕鑫栋,李娇,邓真楠,冯浩,崔欣桐,邓红霞
浙江大学学报(工学版)    2023, 57 (5): 865-874.   DOI: 10.3785/j.issn.1008-973X.2023.05.002
摘要   HTML PDF(pc) (1744KB)(410)   

针对现有的结构化图像超分辨重建算法大多只能解决特定单一种类的结构化图像超分辨问题,提出一种基于改进Transformer的结构化图像超分辨率网络(TransSRNet). 该网络利用Transformer的自注意力机制在空间序列中挖掘大范围的全局信息. 采用沙漏块结构搭建空间注意力单元,关注低分辨率空间和高分辨率空间在局部区域的映射关系,提取图像映射过程中的结构化信息,使用高效通道注意力模块对自注意力模块和空间注意力模块做特征融合. 在高度结构化CelebA、Helen、TCGA-ESCA 和TCGA-COAD数据集上的模型评估结果表明,相较于主流超分辨算法,TransSRNet整体性能表现更好. 在放大因子为8时,人脸数据集和医学峰值信噪比(PRNR)可以分别达到28.726、26.392 dB, 结构相似性(SSIM)可以分别达到0.844、0.881.

4. 基于小世界理论的区块链Kademlia网络改进方法
赵越,赵赫,谭海波,余斌,俞望年,马志宇
浙江大学学报(工学版)    2024, 58 (1): 1-9.   DOI: 10.3785/j.issn.1008-973X.2024.01.001
摘要   HTML PDF(pc) (1194KB)(384)   

针对当前区块链Kademlia网络研究中通常以牺牲安全性为代价提升可扩展性的问题,提出基于小世界理论的区块链Kademlia网络改进方法. 该方法遵循小世界理论的思想,提出置换扩容节点的概率公式,概率与节点间距离呈反比,节点置换次数和额外增加的节点数量可以根据实际情况灵活调整. 通过理论分析和实验验证,证明了采用该方法改造的网络能够达到最终的稳定状态. 实验结果显示,利用该方法将全网广播交易消息时须经历的传输层级减少了15.0%~30.8%,加快了定位节点的速率. 与其他改变网络结构的优化算法相比,该方法降低了网络的结构化程度,增强了网络的安全性.

5. 多特征融合的驾驶员疲劳状态检测方法
方浩杰,董红召,林少轩,罗建宇,方勇
浙江大学学报(工学版)    2023, 57 (7): 1287-1296.   DOI: 10.3785/j.issn.1008-973X.2023.07.003
摘要   HTML PDF(pc) (1481KB)(349)   

针对现有疲劳状态检测方法无法适用于疫情防控下的驾驶员,利用改进后的YOLOv5目标检测算法,对驾驶员的面部区域进行检测,建立多特征融合的疲劳状态检测方法. 针对公交驾驶特性,建立包含佩戴口罩和未佩戴口罩情况的图像标签数据. 通过增加YOLOv5模型的特征采样次数,提高眼、嘴、面部区域的检测精度. 利用BiFPN网络结构保留多尺度的特征信息,使得预测网络对不同大小的目标更敏感,提升整体模型的检测能力. 结合人脸关键点算法提出参数补偿机制,提高眨眼、打哈欠帧数的准确率. 将多种疲劳参数融合归一化处理,开展疲劳等级划分. 公开数据集NTHU和自制数据集的验证结果表明,该方法对佩戴口罩和未佩戴口罩情况均可以进行眨眼、打哈欠识别,可以准确地判断驾驶员的疲劳状态.

6. 自适应樽海鞘群算法求解考虑运输时间的柔性作业车间调度
牛昊一,吴维敏,章庭棋,沈微,张涛
浙江大学学报(工学版)    2023, 57 (7): 1267-1277.   DOI: 10.3785/j.issn.1008-973X.2023.07.001
摘要   HTML PDF(pc) (1024KB)(343)   

针对考虑运输时间的柔性作业车间调度问题,以最小化最大完工时间为优化目标,提出自适应樽海鞘群算法. 设计基于随机密钥方法的3层编码方案,将编码的离散解空间连续化. 引入惯性权重评价跟随者之间的相互影响程度,增强算法的全局探索与局部搜索能力. 提出自适应更新领导者-跟随者种群数量策略,根据种群迭代状态对领导者和跟随者的数量进行自适应调整. 在邻域搜索中引入禁忌搜索策略,防止算法陷入局部最优. 通过基准算例测试,验证了算法的有效性和优越性,发现AGV数量对完工时间的影响符合边际效应递减的规律.

7. 混合采样下多级特征聚合的视频目标检测算法
秦思怡,盖绍彦,达飞鹏
浙江大学学报(工学版)    2024, 58 (1): 10-19.   DOI: 10.3785/j.issn.1008-973X.2024.01.002
摘要   HTML PDF(pc) (2492KB)(279)   

针对现有基于深度学习的视频目标检测算法无法同时满足精度和效率要求的问题,在单阶段检测器YOLOX-S的基础上,提出基于混合加权采样和多级特征聚合注意力的视频目标检测算法. 混合加权参考帧采样(MWRS)策略采用加权随机采样操作和局部连续采样操作,充分利用有效的全局信息与帧间局部信息. 多级特征聚合注意力模块(MFAA)基于自注意力机制,对YOLOX-S提取的分类特征进行细化,使得网络从不同层次的特征中学到更加丰富的特征信息. 实验结果表明,所提算法在ImageNet VID数据集上的检测精度均值AP50达到77.8%,平均检测速度为11.5 ms/帧,在检测图片上的目标分类和定位效果明显优于YOLOX-S,表明所提算法达到了较高的精度,具有较快的检测速度.

8. 大跨钢-混凝土组合楼盖的优化设计
吴一凡,潘文豪,罗尧治
浙江大学学报(工学版)    2023, 57 (5): 988-996.   DOI: 10.3785/j.issn.1008-973X.2023.05.015
摘要   HTML PDF(pc) (1380KB)(278)   

针对大跨度钢-混凝土组合楼盖的经济适用工况和优化方向,以重要参数为基础,对大跨钢-混凝土组合楼盖的优化设计问题进行研究. 在优化分析时,以组合楼盖的经济等效用钢量为目标函数,变量包括钢梁截面尺寸、钢梁间距和混凝土翼板厚度等8个参数,约束条件服从塑性设计理论、规范规定和工程经验. 在不同跨度和可变荷载下,利用广义简约梯度(GRG)算法求解获得经济等效用钢量最小的组合梁截面. 根据优化结果,跨度小于60 m、可变荷载小于6 kN/m2的组合楼盖能够有效地发挥组合结构的组合作用,具有较好的经济效益. 对于传统组合楼盖经济适用性不强的超大跨楼盖,从提高腹板承载效率的角度,可以使用波形钢腹板组合楼盖体系,考虑张弦梁受力高效的优点提出新型弦支组合楼盖体系.

9. 基于动态注意力网络的图像超分辨率重建
赵小强,王泽,宋昭漾,蒋红梅
浙江大学学报(工学版)    2023, 57 (8): 1487-1494.   DOI: 10.3785/j.issn.1008-973X.2023.08.002
摘要   HTML PDF(pc) (1196KB)(269)   

针对图像超分辨率算法在具有不同重要性的通道和空间域上采取相同的处理方式,导致计算资源无法集中利用到重要特征上的问题,提出基于动态注意力网络的图像超分辨率算法. 该算法改变了现有均等处理注意力机制的方式,通过构建的动态注意力模块对不同的注意力机制赋予动态学习的权重,以获取网络更需要的高频信息,重建高质量图片;通过特征重用的方式构建双蝶式结构,充分融合2个注意力分支的信息,弥补不同注意力机制间所缺失的特征信息. 在Set5、Set14、BSD100、Urban100和Manga109数据集上的模型评估结果表明,相较于其他主流超分辨率算法,本研究所提算法整体性能表现更好. 当放大因子为4时,相较于次优算法,所提算法在5个公开测试集上的峰值信噪比分别提升了0.06、0.07、0.04、0.15、0.15 dB.

10. 航空装配领域中命名实体识别的持续学习框架
刘沛丰,钱璐,赵兴炜,陶波
浙江大学学报(工学版)    2023, 57 (6): 1186-1194.   DOI: 10.3785/j.issn.1008-973X.2023.06.014
摘要   HTML PDF(pc) (1091KB)(260)   

为了构建航空装配领域中装配流程信息、装配技术知识、行业标准和三者内在联系组成的航空装配知识图谱,提出基于持续学习的命名实体识别技术框架. 所提框架的特点是从零语料到大规模语料的渐进式学习过程中,在不依赖人工设定特征的情况下,始终保持较高的识别效果. 从飞机总装配和部件对接的实际工业场景展开所提框架的性能对比实验,并以操纵拉杆和钢索的安装为实验案例. 实验结果表明,在处理不同规模的语料环境的情况下,所提框架在正确率、召回率、F1值上均显著优于以往算法,所提框架可以为航空装配领域命名实体识别任务持续提供可信的结果.

11. 基于Transformer的高效自适应语义分割网络
张海波,蔡磊,任俊平,王汝言,刘富
浙江大学学报(工学版)    2023, 57 (6): 1205-1214.   DOI: 10.3785/j.issn.1008-973X.2023.06.016
摘要   HTML PDF(pc) (1465KB)(252)   

基于Transformer的语义分割网络存在2个问题:分辨率变化引起的分割精度显著下降,自注意力机制计算复杂度过高。为此,利用零值填充的卷积可保留位置信息的特性,提出自适应卷积位置编码模块;利用自注意力计算中特定矩阵的维度可相互抵消的特性,提出降低自注意力计算量的联合重采样自注意力模块;设计用于融合不同阶段特征图的解码器,构造能够自适应不同分辨率输入的高效分割网络EA-Former. EA-Former在数据集ADE20K、Cityscapes上的最优平均交并比分别为51.0%、83.9%. 与主流分割算法相比,EA-Former能够以更低的计算复杂度得到具有竞争力的分割精度,由输入分辨率变化引起的分割性能下降问题得以缓解.

12. 基于个体预测的动态多目标优化算法
王万良,陈忠馗,吴菲,王铮,俞梦娇
浙江大学学报(工学版)    2023, 57 (11): 2133-2146.   DOI: 10.3785/j.issn.1008-973X.2023.11.001
摘要   HTML PDF(pc) (1723KB)(250)   

为了快速追踪随环境变化的动态多目标优化问题的Pareto前沿,提出基于个体预测的动态多目标优化算法(IPS). 利用参考点联系算法筛选出特殊点,该特殊点具有良好的收敛性和多样性,通过对特殊点集的预测快速响应环境变化. 提出针对种群中心点预测的反馈校正机制,在预测非支配解集的过程中,对预测步长进行反馈校正,从而使预测更加准确;为了避免算法陷入局部最优,提出混合多样性维持机制,引入由拉丁超立方抽样和精度可控的突变策略分别产生的随机个体,以提高种群的多样性. 将所提算法与其他4种动态多目标优化算法进行对比分析,实验结果表明,IPS能够平衡种群的多样性和收敛性,在FDA、DMOP、F5~F10系列问题上,实验结果优于其他4种算法.

13. 基于循环神经网络的双目视觉物体6D位姿估计
杨恒,李卓,康忠元,田兵,董青
浙江大学学报(工学版)    2023, 57 (11): 2179-2187.   DOI: 10.3785/j.issn.1008-973X.2023.11.005
摘要   HTML PDF(pc) (1068KB)(248)   

针对当前物体6D位姿估计任务准确率较低的问题,提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN. 将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容,利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入,输入各物体相关参数,由虚拟双目相机右摄像头捕获合成图片. 利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取. 经过循环神经网络对几何特征进行融合,并预测物体6D位姿. 以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比. 结果表明,在利用单一物体对网络进行训练时,Binocular-RNN 的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍. 利用基于物理的实时渲染(Real+PBR)方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法(DeepIM).

14. 面向水下场景的轻量级图像语义分割网络
郭浩然,郭继昌,汪昱东
浙江大学学报(工学版)    2023, 57 (7): 1278-1286.   DOI: 10.3785/j.issn.1008-973X.2023.07.002
摘要   HTML PDF(pc) (2385KB)(238)   

提出面向水下场景的图像语义分割网络,考虑到速度和准确度之间的权衡问题,网络采用轻量且高效的编解码器结构. 在编码器部分,设计倒置瓶颈层和金字塔池化模块,高效地提取特征. 在解码器部分,构建特征融合模块融合多水平特征,提升了分割的准确度. 针对水下图像边缘模糊的问题,使用辅助的边缘损失函数来更好地训练网络,通过语义边界的监督细化分割的边缘. 在水下语义分割数据集SUIM上的实验数据表明,对于320像素×256像素的输入图像,该网络在NVIDIA GeForce GTX 1080Ti显卡上的推理速度达到258.94帧/s,mIoU达到53.55%,能够在保证高准确度的同时,达到实时的处理速度.

15. 基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型
陈曦泽,贾俊峰,白玉磊,郭彤,杜修力
浙江大学学报(工学版)    2023, 57 (6): 1061-1070.   DOI: 10.3785/j.issn.1008-973X.2023.06.001
摘要   HTML PDF(pc) (2896KB)(238)   

为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型. 使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合. 采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较. 使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释. 结果表明,经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能,且SHAP方法能够有效地解释XGBoost模型的输出.

16. 结合静态事实和重复历史事实的动态知识图谱推理方法
林栋,李永强,仇翔,冯远静,谢碧峰
浙江大学学报(工学版)    2023, 57 (10): 1915-1922.   DOI: 10.3785/j.issn.1008-973X.2023.10.001
摘要   HTML PDF(pc) (856KB)(236)   

针对现有的动态知识图谱推理方法容易忽略动态知识图谱中存在着大量静态信息和重复历史事实的问题,提出结合静态事实和重复历史事实的动态知识图谱网络方法. 该方法利用动态知识图谱中实体间隐藏的静态联系来构成静态事实,并协助动态知识图谱推理;利用历史事实构建历史词表,在预测未来时对历史词表进行查询;对历史中未发生的事实进行惩罚,提高重复历史事实的预测概率. 在2个公开的数据集上进行动态知识图谱推理实验,对比实验时选用目前主流的5个模型作为基线. 在实体预测实验中,平均倒数排名(MRR)达到0.489 1和0.530 3,Hits@10达到0.588 7和0.616 5,证明了所提方法的有效性.

17. 分体式飞行汽车全自主对接导引系统设计与验证
王琛,林威,胡良鹏,张骏铭
浙江大学学报(工学版)    2023, 57 (12): 2345-2355.   DOI: 10.3785/j.issn.1008-973X.2023.12.001
摘要   HTML PDF(pc) (3722KB)(235)   

研究针对分体式飞行汽车全自主对接导引系统的流程架构、软硬件系统、核心算法以及验证. 根据导引方式的过渡,采用远程、中程、近程多段融合导引. 针对YOLOv4-tiny实际使用中的误检、漏检情况,使用点密度聚类和核相关滤波算法提供光顺的融合信息. 提出修正因子方法以实现近程导引阶段AprilTag测量数据的融合修正,通过姿态补偿算法解决相机与无人机固连的相机姿态问题. 引入暗光图像增强算法,将引入算法与视觉导引算法结合,以满足低照度环境下的对接导引需求. 搭建仿真平台和工程应用平台,逐步对发展的流程、系统架构以及算法进行验证. 试验结果表明,工程应用飞行平台可以导引安全、平稳且精准的降落任务,在圆锥形对接机构中的容许误差为6 cm、角度误差为5°. 该结果证明提出的全自主对接导引技术精度良好且具有可靠性.

18. 基于集成学习与深度学习的日供水量预测方法
周欣磊,顾海挺,刘晶,许月萍,耿芳,王冲
浙江大学学报(工学版)    2023, 57 (6): 1120-1127.   DOI: 10.3785/j.issn.1008-973X.2023.06.007
摘要   HTML PDF(pc) (1780KB)(226)   

为了有效改善日供水量预测精度低、泛化能力不足的问题,以义乌市4个水厂的历史日供水数据为基础,提出基于集成学习算法改进的长短时记忆(LSTM)神经网络的供水预测方法. 该方法以拉依达准则预处理后的历史日供水量作为数据输入,将具备长期时序信息记忆能力的LSTM神经网络作为集成学习的弱预测器,使用网格搜索法进行网络超参数调优,使用AdaBoost集成学习算法对弱预测器进行加权组合得到强预测器. 结果表明:与随机森林、AdaBoost与LSTM神经网络相比,基于集成学习算法改进的LSTM神经网络有最高的纳什效率系数(NSE)、最低的均方根误差(RMSE)与平均绝对误差(MAE),对日供水数据的变化趋势与峰值的拟合效果最好;改进LSTM供水预测方法的时序预测精度得到极大提升,有较好的泛化能力、稳定的预测性能,能够为城市水资源合理配置、一体化智能供水调度提供重要参考.

19. 基于YOLOv5s的无人机密集小目标检测算法
韩俊,袁小平,王准,陈烨
浙江大学学报(工学版)    2023, 57 (6): 1224-1233.   DOI: 10.3785/j.issn.1008-973X.2023.06.018
摘要   HTML PDF(pc) (2789KB)(221)   

针对无人机图像中背景复杂、小目标数量多且分布密集的特点,提出基于YOLOv5s的无人机密集小目标检测算法LSA_YOLO. 构造多尺度特征提取模块LM-fem,增强网络的特征提取能力. 为了抑制复杂背景的干扰,使算法关注目标信息,提出依靠多尺度上下文信息的、新的混合域注意力模块S-ECA. 设计自适应权重动态融合结构AFF,为浅层特征和深层特征合理分配融合权重. 将S-ECA、AFF应用于PANet结构,提高算法在复杂背景下的密集小目标检测能力. 使用损失函数Focal-EIOU代替损失函数CIOU,增强模型检测性能. 在公开数据集VisDrone2021上的实验结果表明,当设置输入分辨率为1 504 $ \times $1 504时,对所有目标类别的平均检测精度从YOLOv5s的51.5%提高到LSA_YOLO的57.6%.

20. 基于无线D2D网络的分层联邦学习
刘翀赫,余官定,刘胜利
浙江大学学报(工学版)    2023, 57 (5): 892-899.   DOI: 10.3785/j.issn.1008-973X.2023.05.005
摘要   HTML PDF(pc) (1301KB)(220)   

为了解决在无线网络中部署联邦学习面临的通信资源消耗大和设备计算资源有限的问题,提出一种基于无线设备直通(D2D)网络的分层联邦学习框架. 与传统架构不同,模型训练采用分层聚合. 该框架通过D2D网络进行簇内聚合,各个簇同时进行去中心化训练,从每个簇中选择一个簇头上传模型至服务器进行全局聚合. 通过将去中心化学习与分层联邦学习结合,降低了中央节点网络流量. 使用D2D网络中节点的度来衡量模型收敛性能,通过最大化所有簇头的度之和,对簇头选择与带宽分配问题进行联合优化,并且设计一种基于动态规划的算法求出最优解. 仿真结果表明,与基线算法相比,该框架不仅能够有效地降低全局聚合的频率和减少训练时间,而且能够提高最终训练得到的模型性能.