浙江大学学报(工学版)

Select

1. 基于改进Transformer的复合故障解耦诊断方法

王誉翔,钟智伟,夏鹏程,黄亦翔,刘成良

浙江大学学报(工学版) 2023, 57 (5): 855-864. DOI: 10.3785/j.issn.1008-973X.2023.05.001

摘要

HTML

PDF（pc）（2584KB）（731）

大多复合故障诊断方法视复合故障为一种新的单一故障类型，忽视了内部单一故障的相互作用、故障分析粒度含糊和解释性差. 为了解决复合故障难解耦的问题，针对工业环境中复合故障数据极少的情况，提出一种基于改进Transformer的复合故障解耦诊断方法. 诊断流程分为预处理、特征提取和故障解耦3个步骤. 故障解耦引入Transformer的解码器，利用交叉注意力机制使得每个单一故障标签可以在提取的特征层中，自适应地关注到与故障特征相对应的判别特征区域，进一步预测每个单一故障标签的输出概率以实现复合故障解耦. 设计多组复合故障试验与业界先进算法进行对比，以验证方法的有效性. 结果表明，所提方法在少量单一故障训练样本和极少量复合故障训练样本情况下，有较高的诊断准确度. 当训练集中复合故障样本数仅为5时，复合故障诊断准确度达到88.29%，与其他方法比较更具有显著优势.

Select

2. 基于深度学习三维成型的钢板表面缺陷检测

兰欢,余建波

浙江大学学报(工学版) 2023, 57 (3): 466-476. DOI: 10.3785/j.issn.1008-973X.2023.03.004

摘要

HTML

PDF（pc）（5141KB）（375）

为了解决二维检测方法难以检测带有深度信息的缺陷问题，提出全新的三维重建网络. 提出基于多尺度特征增强的级联式三维重建网络(MFE-CasMVSNet)，并与点云数据处理技术结合，用于钢板表面缺陷检测. 为了提高三维重建的精度，提出位置导向的特征增强模块(PFEM)和多尺度特征自适应融合模块(MFAFM)，对特征进行有效提取并减少信息丢失. 提出基于曲率稀疏化的密度聚类方法(CS-DBSCAN)，用于精确识别不同部位的缺陷. 引入三维检测框，实现对缺陷的定位与检测可视化. 实验结果表明，相较于图像几何的重建方法，MFE-CasMVSNet能够更加精确、快速地实现钢板表面的三维重建. 相较于二维检测，三维缺陷检测能够精确获取缺陷的三维形状信息，实现对钢板表面缺陷的多维度检测.

Select

3. 基于语义增强特征融合的多模态图像检索模型

杨帆,宁博,李怀清,周新,李冠宇

浙江大学学报(工学版) 2023, 57 (2): 252-258. DOI: 10.3785/j.issn.1008-973X.2023.02.005

摘要

HTML

PDF（pc）（928KB）（457）

为了在多模态图像检索任务中建立文本特征与图像特征的相关性，提出基于语义增强特征融合的多模态图像检索模型（SEFM）. 该模型通过文本语义增强模块、图像语义增强模块2部分在特征融合时对组合特征进行语义增强. 在文本语义增强模块建立多模态双重注意力机制，利用双重注意力建立文本与图像之间的关联以增强文本语义；在图像语义增强模块引入保留强度和更新强度，控制组合特征中查询图像特征的保留和更新程度. 基于以上2个模块可以优化组合特征使其更接近目标图像特征. 在MIT-States和Fashion IQ这2个数据集上对该模型进行评估，实验结果表明在多模态图像检索任务上该模型与现有方法相比在召回率和准确率上都有所提升.

Select

4. 基于改进YOLOv5的电子元件表面缺陷检测算法

曾耀,高法钦

浙江大学学报(工学版) 2023, 57 (3): 455-465. DOI: 10.3785/j.issn.1008-973X.2023.03.003

摘要

HTML

PDF（pc）（1697KB）（616）

目标检测模型在电子元件生产环境中的实时检测能力不佳，为此采用GhostNet替换YOLOv5的主干网络. 针对电子元件表面缺陷存在小目标及尺度变化较大的目标的情况，在YOLOv5主干网络中加入坐标注意力机制，在避免大量计算资源消耗的前提下增强感受野，将坐标信息嵌入通道注意力中以提升模型对目标的定位. 使用加权双向特征金字塔网络结构替换YOLOv5特征融合模块中的特征金字塔网络(FPN)结构，提升多尺度加权特征的融合能力. 在自制缺陷电子元件数据集上的实验结果表明，改进的GCB-YOLOv5模型平均精度达到93%，平均检测时间为33.2 ms，相比于原始YOLOv5模型，平均精度提高了15.0%，平均时间提升了7 ms，可以同时满足电子元件表面缺陷检测精度与速度的需求.

Select

5. 基于YOLOv5s的无人机密集小目标检测算法

韩俊,袁小平,王准,陈烨

浙江大学学报(工学版) 2023, 57 (6): 1224-1233. DOI: 10.3785/j.issn.1008-973X.2023.06.018

摘要

HTML

PDF（pc）（2789KB）（290）

针对无人机图像中背景复杂、小目标数量多且分布密集的特点，提出基于YOLOv5s的无人机密集小目标检测算法LSA_YOLO. 构造多尺度特征提取模块LM-fem，增强网络的特征提取能力. 为了抑制复杂背景的干扰，使算法关注目标信息，提出依靠多尺度上下文信息的、新的混合域注意力模块S-ECA. 设计自适应权重动态融合结构AFF，为浅层特征和深层特征合理分配融合权重. 将S-ECA、AFF应用于PANet结构，提高算法在复杂背景下的密集小目标检测能力. 使用损失函数Focal-EIOU代替损失函数CIOU，增强模型检测性能. 在公开数据集VisDrone2021上的实验结果表明，当设置输入分辨率为1 504 $ \times $1 504时，对所有目标类别的平均检测精度从YOLOv5s的51.5%提高到LSA_YOLO的57.6%.

Select

6. 文本生成图像研究综述

曹寅,秦俊平,马千里,孙昊,闫凯,王磊,任家琪

浙江大学学报(工学版) 2024, 58 (2): 219-238. DOI: 10.3785/j.issn.1008-973X.2024.02.001

摘要

HTML

PDF（pc）（2809KB）（373）

对文本生成图像任务进行综合评估和整理，根据生成图像的理念，将文本生成图像任务分为3大类：基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像. 针对基于生成对抗网络架构的文本生成图像方法，按照改进的不同技术点归纳为6小类：采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型. 通过对不同方法的分析，总结并讨论了现有的文本生成图像方法通用评估指标和数据集.

Select

7. 基于多头自注意力的复杂背景船舶检测算法

于楠晶,范晓飚,邓天民,冒国韬

浙江大学学报(工学版) 2022, 56 (12): 2392-2402. DOI: 10.3785/j.issn.1008-973X.2022.12.008

摘要

HTML

PDF（pc）（1335KB）（432）

针对内河港口背景复杂、类间尺度差异大和小目标实例多的特点，提出基于多头自注意力机制(MHSA)和YOLO网络的船舶目标检测算法(MHSA-YOLO). 在特征提取过程中，基于MHSA设计并行的自注意力残差模块(PARM)，以弱化复杂背景信息干扰并强化船舶目标特征信息；在特征融合过程中，开发简化的双向特征金字塔结构，以强化特征信息的融合与表征能力. 在Seaships数据集上的实验结果表明，与其他先进的目标检测方法相比，MHSA-YOLO拥有较好的学习能力，在检测精度方面取得97.59%的平均均值精度，MHSA-YOLO对复杂背景船舶目标和小尺寸目标的检测更有效. 基于自制数据集的实验结果表明，MHSA-YOLO的泛化能力强.

Select

8. 无砟轨道结构层间损伤识别技术研究进展

杜威,任娟娟,张书义,杜俊宏,邓世杰

浙江大学学报(工学版) 2023, 57 (2): 353-366. DOI: 10.3785/j.issn.1008-973X.2023.02.015

摘要

HTML

PDF（pc）（1642KB）（285）

无砟轨道在长期服役过程中受到列车荷载和复杂环境的耦合作用，会发生材料性能衰退、结构损伤累积，导致其服役性能逐渐劣化. 综合论述中国板式和双块式无砟轨道常见层间损伤的表现形式和产生的原因；总结探地雷达法、冲击回波法及其他局部损伤识别方法在无砟轨道损伤识别中的应用情况，提出结合多种局部损伤识别技术是实现轨道局部损伤精准识别的关键；归纳基于模态参数、无砟道床振动信号及车辆振动信号的整体损伤识别技术，指出须扩充现场损伤检测样本以提高识别方法的泛化能力；详细分析各类识别方法的优势和局限性，为完善中国无砟轨道结构损伤识别技术体系和制定科学合理的维修策略提供指导．

Select

9. 基于物理信息神经网络的燃烧化学微分方程求解

王意存,邢江宽,罗坤,王海鸥,樊建人

浙江大学学报(工学版) 2022, 56 (10): 2084-2092. DOI: 10.3785/j.issn.1008-973X.2022.10.020

摘要

HTML

PDF（pc）（2369KB）（401）

为了有效地将湍流燃烧复杂的物理化学信息嵌入到物理信息神经网络（PINNs），选取湍流燃烧模拟中的2个典型场景案例，即刚性常微分方程ROBER问题及稳态射流火焰混合分数方程求解，探索PINNs在燃烧化学微分方程计算中的应用潜力. 结果表明，对于零维刚性反应系统，利用PINNs模型可以较好地捕捉到系统的演化过程；对于稳态射流火焰，PINNs的预测解与传统的数值解有较好的一致性. 残差点的选取对于燃烧化学领域内的复杂微分方程求解尤为重要，应基于具体的构型详细考虑.

Select

10. 基于深度强化学习的数控铣削加工参数优化方法

邓齐林,鲁娟,陈勇辉,冯健,廖小平,马俊燕

浙江大学学报(工学版) 2022, 56 (11): 2145-2155. DOI: 10.3785/j.issn.1008-973X.2022.11.005

摘要

HTML

PDF（pc）（1928KB）（430）

为了提高数控加工中的机床效能和加工效率，探究深度强化学习在加工参数优化问题中的适用性，提出一种基于深度强化学习的数控铣削加工参数优化方法. 选取切削力合力和材料除去率作为效能和效率的优化目标，利用遗传算法优化反向传播神经网络（GA-BPNN）构建切削力合力和铣削参数的优化函数，并采用经验公式建立材料除去率的优化函数. 应用竞争网络架构（Dueling DQN）算法获得切削力合力和材料除去率多目标优化的Pareto前沿，并结合优劣解距离法和熵值法从Pareto前沿中选择决策解. 基于45钢的铣削试验，验证了Dueling DQN算法用于加工参数优化的有效性，相比经验选取加工参数，通过Dueling DQN优化得到的加工方案使切削力合力降低了8.29%，加工效率提高了4.95%，为加工参数的多目标优化方法和加工参数的选择提供了指导.

Select

11. 基于知识图谱的商用飞机维修方案推荐系统集成建模

邢雪琪,丁雨童,夏唐斌,潘尔顺,奚立峰

浙江大学学报(工学版) 2023, 57 (3): 512-521. DOI: 10.3785/j.issn.1008-973X.2023.03.009

摘要

HTML

PDF（pc）（2093KB）（251）

针对我国商用飞机智能维修和数字化诊断的需求,面向非结构化故障隔离手册，提出新型BM长短期记忆网络（BM LSTM）算法. 运用多数投票法融合条件随机场（CRF）、双向长短期记忆网络（BiLSTM）、BiLSTM CRF 3种实体识别算法，有效提高实体识别精度. 基于商用飞机维修故障诊断手册构建维修方案知识图谱，结合词频-逆向文件频率（TF-IDF）相似度算法与BM LSTM算法，设计商用飞机维修方案推荐系统，实现通过检索非结构化故障描述文本准确匹配到维修方案的功能. 实验结果表明，利用商用飞机故障隔离手册构建知识图谱、基于所提创新方法开发的维修方案推荐系统，能够有效保证维修信息精确匹配，显著提高维修方案形成效率.

Select

12. 面向节点分类的图神经网络节点嵌入增强模型

曾菊香,王平辉,丁益东,兰林,蔡林熹,管晓宏

浙江大学学报(工学版) 2023, 57 (2): 219-225. DOI: 10.3785/j.issn.1008-973X.2023.02.001

摘要

HTML

PDF（pc）（1473KB）（357）

考虑到实际的图结构往往是有噪的，可能包含实际不存在的边或者遗漏节点间实际存在的部分边，提出可微分相似度模型（DSM）. 通过挖掘节点间隐藏关系增强节点嵌入，以提高节点分类的准确度. DSM基于普通图神经网络方法（GNN）得到各节点的基础表征，根据节点表征相似度为目标节点选出相似节点集合，结合相似节点集合的基础表征对目标节点进行嵌入表征增强. 在数学上，DSM 是可微分的，可以将 DSM 作为插件与任意 GNN 相结合，以端到端的方式进行训练. DSM具有挖掘隐藏连接关系的能力，能促使GNNs学习到更具辨识性和鲁棒性的节点表征. 基于最常用的多个公开的节点分类数据集，开展实验验证. 结果表明，将已有GNNs与DSM结合能显著提升分类准确度，其中GAT-DSM相对GAT在数据集Cora和Citeseer上分别取得了2.9%、3.5%的提升．

Select

13. 基于强度理论的内聚力模型的有限元实现及应用

石天翔,张昕,王洋洋,郑克洪,张永强

浙江大学学报(工学版) 2023, 57 (3): 573-582. DOI: 10.3785/j.issn.1008-973X.2023.03.015

摘要

HTML

PDF（pc）（2243KB）（362）

在对基于强度理论的内聚力模型(ST-CZM)进行二维整理及三维拓展的基础上，使用Abaqus用户单元子程序(UEL)对该模型进行有限元实现. 通过经典界面破坏算例验证ST-CZM有限元模型的有效性和准确性，建立纤维增强复合材料(FRP)加固混凝土模型，采用ST-CZM模拟FRP与混凝土界面间的黏结破坏过程，实现ST-CZM在复杂工况下的应用. 相较于传统基于牵引力准则的内聚力模型，ST-CZM具有更灵活的混合模态耦合方式，且其切向和法向的强度模型相互独立，ST-CZM的收敛性更好，对强度的预测更准确. 所有算例表明，相较于传统基于牵引力准则的内聚力模型，ST-CZM有限元模型能够更好地实现黏结界面峰值应力的预测和损伤阶段的模拟.

Select

14. 基于改进强化学习的多智能体追逃对抗

薛雅丽,叶金泽,李寒雁

浙江大学学报(工学版) 2023, 57 (8): 1479-1486. DOI: 10.3785/j.issn.1008-973X.2023.08.001

摘要

HTML

PDF（pc）（1158KB）（682）

针对多智能体追逃问题，提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法（MADDPG）和双延迟-确定策略梯度算法（TD3）相结合，提出多智能体双延迟-确定策略梯度算法（MATD3）. 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题，提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数，将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励，提出DEPER-MATD3算法. 基于此算法设计仿真实验，并与其他算法对比，实验结果表明，该算法有效解决了过估计问题，且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高，追击者有更大的概率追击到逃逸者.

Select

15. 基于Transformer和知识图谱的新闻推荐新方法

凤丽洲,杨阳,王友卫,杨贵军

浙江大学学报(工学版) 2023, 57 (1): 133-143. DOI: 10.3785/j.issn.1008-973X.2023.01.014

摘要

HTML

PDF（pc）（1590KB）（570）

为了增加新闻推荐的辅助信息并提高预测精度，提出基于Transformer和知识图谱的新闻推荐方法. 为了结合新闻语义信息和实体信息，利用自注意力机制获取新闻单词之间和新闻实体之间的联系，采用加法注意力机制捕捉单词和实体对新闻表示的影响. 考虑到用户对新闻的偏好具有时序性特点，引入Transformer以捕捉用户点击新闻间的关联信息及用户兴趣随时间的变化情况. 利用知识图谱中的高阶结构信息，融合候选新闻邻接实体，提升候选新闻嵌入向量所含信息的完整性. 在2个版本的MIND新闻数据集上与5个典型推荐方法的对比实验表明，注意力机制、Transformer和知识图谱的引入提高了算法在新闻推荐方面的表现.

Select

16. 基于特征复用机制的航拍图像小目标检测算法

邓天民,程鑫鑫,刘金凤,张曦月

浙江大学学报(工学版) 2024, 58 (3): 437-448. DOI: 10.3785/j.issn.1008-973X.2024.03.001

摘要

HTML

PDF（pc）（4531KB）（298）

针对无人机(UAV)航拍图像检测存在的小目标检测精度低和模型参数量大的问题，提出轻量高效的航拍图像检测算法FS-YOLO. 该算法以YOLOv8s为基准网络，通过降低通道维数和改进网络架构提出轻量的特征提取网络，实现对冗余特征信息的高效复用，在较少的参数量下产生更多特征图，提高模型对特征信息的提取和表达能力，同时显著减小模型大小. 在特征融合阶段引入内容感知特征重组模块，加强对小目标显著语义信息的关注，提升网络对航拍图像的检测性能. 使用无人机航拍数据集VisDrone进行实验验证，结果表明，所提算法以仅5.48 M的参数量实现了mAP0.5=47.0%的检测精度，比基准算法YOLOv8s的参数量降低了50.7%，精度提升了6.1%. 在DIOR数据集上的实验表明，FS-YOLO的泛化能力较强，较其他先进算法更具竞争力.

Select

17. 基于多源信息融合的医学图像分割方法

杨长春,叶赞挺,刘半藤,王柯,崔海东

浙江大学学报(工学版) 2023, 57 (2): 226-234. DOI: 10.3785/j.issn.1008-973X.2023.02.002

摘要

HTML

PDF（pc）（1105KB）（303）

医学图像中各成像方式存在自身缺陷，以单一源数据作为输入进行分割模型的构建与训练易导致病灶的分割准确率不足，因此提出基于多源信息融合的医学图像分割方法，并以乳腺癌微钙化簇病灶诊断中的FFDM与DBT这2类数据源为例，验证方法的有效性. 方法利用Yolov4区域候选网络对FFDM数据进行可疑区域筛选；根据同一病人FFDM可疑区域进行DBT图像预处理；以预处理后的DBT图像作为改进U-Net模型的输入实现病灶分割；通过基于序贯相似性判别的断层分割结果融合策略，综合DBT中多断层结果完成病灶最终分割. 方法在20例病人的FFDM与DBT数据上得到98.52%的真阳性率、10.45%的假阳性率与94.07%的精度. 结果表明，本研究提出的基于多源信息融合的医学图像分割方法，有效利用多源数据优势，最终实现病灶的快速精确分割，可以为医学图像诊疗智能化提供一种全新的解决方案.

Select

18. 太阳电池工程简化模型参数确定及模型应用

虞效益,饶大千,胡长兴,徐美娟

浙江大学学报(工学版) 2023, 57 (1): 63-70. DOI: 10.3785/j.issn.1008-973X.2023.01.007

摘要

HTML

PDF（pc）（864KB）（261）

针对现有文献中太阳电池工程简化模型的模型系数值不适用于当今光伏组件的问题，提出简单的仅需利用光伏组件出厂数据的模型系数确定方法.系数b通过拟合25 ℃下不同辐照度对应的开路电压数据得到，系数a和c分别取短路电流和开路电压的温度系数. 不同厂家生产的光伏组件系数b不同，同一厂家生产的不同型号的光伏组件系数b可以取相同值.综合改进后的太阳电池工程简化模型、分段函数形式的太阳电池温度模型和考虑安装条件的入射光强度模型，开展光伏组件电气输出特性的动态仿真. 当组件倾角小于最佳倾角时，角度变化对最大输出功率的影响很小；当倾角大于最佳倾角时，角度变化对最大输出功率的影响较大，影响程度随着角度的增大而增大.

Select

19. 共享单车停车需求的多尺度时空影响因素

徐标,路庆昌

浙江大学学报(工学版) 2023, 57 (2): 380-391. DOI: 10.3785/j.issn.1008-973X.2023.02.017

摘要

HTML

PDF（pc）（2519KB）（252）

为了揭示城市多维特征与共享单车停车需求的时空关系及其关联尺度，结合上海市多源数据，构建以骑行距离为约束的多尺度时空地理加权回归模型(RD-MGTWR)来探究建成环境和区域经济属性对停车需求影响的时空异质性模式. 模型对比分析表明，相比于时空地理加权回归模型(GTWR)，MGTWR模型表现出更好的解释力和可靠性，骑行距离的引入也进一步提高了MGTWR模型的鲁棒性. 结果显示社会经济属性对停车需求的正向影响尺度具有全局性，而区位条件的负向影响呈现局部异质性，在通勤早高峰的内环中心区域最为显著. 此外，具有微观空间或时间作用尺度的公交站点密度、地铁站点密度和购物类服务设施密度对停车需求产生了正负向影响. 影响因素尺度效应的发现有助于指导停车设施的分区规划和共享单车的分时调度.

Select

20. 多特征融合的驾驶员疲劳状态检测方法

方浩杰,董红召,林少轩,罗建宇,方勇

浙江大学学报(工学版) 2023, 57 (7): 1287-1296. DOI: 10.3785/j.issn.1008-973X.2023.07.003

摘要

HTML

PDF（pc）（1481KB）（521）

针对现有疲劳状态检测方法无法适用于疫情防控下的驾驶员，利用改进后的YOLOv5目标检测算法，对驾驶员的面部区域进行检测，建立多特征融合的疲劳状态检测方法. 针对公交驾驶特性，建立包含佩戴口罩和未佩戴口罩情况的图像标签数据. 通过增加YOLOv5模型的特征采样次数，提高眼、嘴、面部区域的检测精度. 利用BiFPN网络结构保留多尺度的特征信息，使得预测网络对不同大小的目标更敏感，提升整体模型的检测能力. 结合人脸关键点算法提出参数补偿机制，提高眨眼、打哈欠帧数的准确率. 将多种疲劳参数融合归一化处理，开展疲劳等级划分. 公开数据集NTHU和自制数据集的验证结果表明，该方法对佩戴口罩和未佩戴口罩情况均可以进行眨眼、打哈欠识别，可以准确地判断驾驶员的疲劳状态.

摘要阅读排行