浙江大学学报(工学版)

Select

1. 基于深度学习的EEG数据分析技术综述

钟博,王鹏飞,王乙乔,王晓玲

浙江大学学报(工学版) 2024, 58 (5): 879-890. DOI: 10.3785/j.issn.1008-973X.2024.05.001

摘要

HTML

PDF（pc）（690KB）（6689）

对近年来的相关工作进行全面分析、横向比较，梳理出基于深度学习的EEG数据分析闭环流程. 对EEG数据进行介绍，从深度学习在EEG数据预处理、特征提取以及模型泛化3个关键阶段的应用进行展开，梳理深度学习算法在相应阶段提供的研究思路和解决方案，包括各阶段所存在的难点与问题. 全方位总结出不同算法的主要贡献和局限性，讨论深度学习技术在各个阶段处理EEG数据时所面临的挑战及未来的发展方向.

Select

2. 基于多任务学习与层叠 Transformer 的多模态情感分析模型

陈巧红,孙佳锦,漏杨波,方志坚

浙江大学学报(工学版) 2023, 57 (12): 2421-2429. DOI: 10.3785/j.issn.1008-973X.2023.12.009

摘要

HTML

PDF（pc）（1171KB）（1942）

针对单模态特征提取存在的模态特征异质性难以保留问题和跨模态特征融合存在的特征冗余问题，基于跨模态Transformer，提出新的多模态情感分析模型（MTSA）. 使用长短时记忆(LSTM)与多任务学习框架提取单模态上下文语义信息，通过累加辅助模态任务损失以筛除噪声并保留模态特征异质性. 使用多任务门控机制调整跨模态特征融合，通过层叠Transformer结构融合文本、音频与视觉模态特征，提升融合深度，避免融合特征冗余. 在2个公开数据集MOSEI和SIMS上的实验结果表明，相较于其他先进模型，MTSA的整体性能表现更好，二分类准确率分别达到83.51%和84.18%.

Select

3. 足式机器人触地检测方法的研究综述

姜晓勇,应凯健,吴起威,魏璇

浙江大学学报(工学版) 2024, 58 (2): 334-348. DOI: 10.3785/j.issn.1008-973X.2024.02.012

摘要

HTML

PDF（pc）（1751KB）（1705）

基于现有足式机器人触地检测方法的研究，综合论述了腿部结构设计、足端设计、传感器设计对触地检测的影响. 总结外部传感器直接检测的触地检测方法、基于运动学与动力学的触地检测方法以及基于学习的触地检测方法. 归纳地面湿滑、地面松软以及非足端触地这3种特殊场景中的触地检测方法. 分析触地检测技术的应用场景，具体包括运动控制的需要、导航中的应用、地形与地质的感知这三大应用场景. 指出硬件改进和集成、多模态触地检测、多传感器融合化触地检测以及智能化触地检测这四大触地检测方法相关的发展趋势，总结各触地检测算法之间的具体关联，为触地检测后续技术的发展及触地检测的具体应用提供指导.

Select

4. 基于超图卷积神经网络的多行为感知服务推荐方法

陆佳炜,李端倪,王策策,徐俊,肖刚

浙江大学学报(工学版) 2023, 57 (10): 1977-1986. DOI: 10.3785/j.issn.1008-973X.2023.10.007

摘要

HTML

PDF（pc）（1380KB）（1686）

针对现有服务推荐方法中高阶服务特征提取不够充分的问题，提出基于超图卷积神经网络的多行为感知服务推荐方法(MBSRHGNN). 该方法根据服务交互类型和服务组合信息构建多重超图，基于谱分解理论和多重超图的功能结构特性以设计双通道超图卷积网络. 利用切比雪夫多项式近似超图卷积核来降低计算复杂度；在超图卷积过程中，结合多行为推荐方法和自注意力机制度量多行为交互之间的重要性差异，提出HG-DiffPool超图池化方法来降低特征维度；通过融合服务嵌入向量和超图信号，学习不同服务的推荐概率分布；爬取真实服务数据，构造不同稀疏度的数据集进行实验. 实验结果表明，所提的MBSRHGNN服务推荐方法能够适应数据高度稀疏的推荐场景，并且在推荐精确度和相关性上的表现优于现有基线方法.

Select

5. 融合知识图谱的时空多图卷积交通流量预测

李劲业,李永强

浙江大学学报(工学版) 2024, 58 (7): 1366-1376. DOI: 10.3785/j.issn.1008-973X.2024.07.006

摘要

HTML

PDF（pc）（1616KB）（1419）

现有的交通流量预测方法关注交通信息的时空相关性，未充分考虑外部因素对交通的影响，为此提出融合静态和动态知识图谱的时空多图卷积交通流量预测模型. 基于道路交通信息和外部因素，构建城市交通知识图谱和4个不同语义的路网拓扑图，将城市交通知识图谱输入关系演化图卷积神经网络，实现知识嵌入；使用知识融合模块将车流量矩阵与知识嵌入融合；将4个路网拓扑图和融合知识的车流量矩阵输入时空多图卷积模块，提取时空特征，通过全连接层输出交通流量预测值. 在杭州交通数据集上评估模型性能，与先进的基线模型对比，所提模型的性能提高了5.76%~10.71%. 鲁棒性实验结果表明，所提模型具有较强的抗干扰能力.

Select

6. 基于改进强化学习的多智能体追逃对抗

薛雅丽,叶金泽,李寒雁

浙江大学学报(工学版) 2023, 57 (8): 1479-1486. DOI: 10.3785/j.issn.1008-973X.2023.08.001

摘要

HTML

PDF（pc）（1158KB）（1264）

针对多智能体追逃问题，提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法（MADDPG）和双延迟-确定策略梯度算法（TD3）相结合，提出多智能体双延迟-确定策略梯度算法（MATD3）. 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题，提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数，将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励，提出DEPER-MATD3算法. 基于此算法设计仿真实验，并与其他算法对比，实验结果表明，该算法有效解决了过估计问题，且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高，追击者有更大的概率追击到逃逸者.

Select

7. 熔滴复合电弧增材制造2219铝合金组织与性能

王勇超,魏正英,贺鹏飞

浙江大学学报(工学版) 2024, 58 (8): 1585-1595. DOI: 10.3785/j.issn.1008-973X.2024.08.006

摘要

HTML

PDF（pc）（7116KB）（1111）

为了提高铝合金电弧增材制造的质量和效率，采用新型的电弧增材制造工艺——熔滴复合电弧增材制造（DAAM）技术来制造铝合金样品. 采用全新的熔滴生成系统（DGS）代替传统的送丝系统，使得材料的添加与电弧能量相互独立. 成形的材料为2219铝合金，通过熔滴系统添加了微量Mg元素. 利用熔滴复合电弧增材制造设备沉积了薄壁结构，沉积速率较传统电弧增材制造技术大幅提升（约为160 mm³/s）. 观察和分析薄壁结构截面的微观组织表明，薄壁结构的晶粒形态以柱状晶为主，呈现层内柱状晶和层间等轴晶的周期性分布规律. 经过T6热处理后，试样水平和垂直方向的平均抗拉强度分别为455.4和417.0 MPa，屈服强度分别为342.4和316.4 MPa. 较之前的研究结果对比表明，Mg元素的添加提升了2219铝合金的屈服强度，但导致延伸率降低.

Select

8. 多目标粒子群优化算法及其应用研究综述

叶倩琳,王万良,王铮

浙江大学学报(工学版) 2024, 58 (6): 1107-1120. DOI: 10.3785/j.issn.1008-973X.2024.06.002

摘要

HTML

PDF（pc）（1559KB）（1040）

现有研究较少涵盖最先进的多目标粒子群优化（MOPSO）算法. 本研究介绍了多目标优化问题（MOPs）的研究背景，阐述了MOPSO的基本理论. 根据特征将其分为基于Pareto支配、基于分解和基于指标的3类MOPSO算法，介绍了现有的经典算法. 介绍相关评价指标，并选取7个有代表性的算法进行性能分析. 实验结果展示了传统MOPSO和3类改进的MOPSO算法各自的优势与不足，其中，基于指标的MOPSO在收敛性和多样性方面表现较优. 对MOPSO算法在生产调度、图像处理和电力系统等领域的应用进行简要介绍. 并探讨了MOPSO算法用于求解复杂优化问题的局限性及未来的研究方向.

Select

9. 基于物理信息神经网络的Burgers-Fisher方程求解方法

徐健,朱海龙,朱江乐,李春忠

浙江大学学报(工学版) 2023, 57 (11): 2160-2169. DOI: 10.3785/j.issn.1008-973X.2023.11.003

摘要

HTML

PDF（pc）（1371KB）（1007）

为了探索基于物理信息的神经网络（PINN）求解微分方程时，物理信息在训练神经网络中的作用，提出将物理信息分为规律信息和数值信息2类，以阐释PINN求解微分方程的逻辑，以及物理信息的数据驱动方式和神经网络可解释性.设计基于2类信息的神经网络综合损失函数，并从训练采样和训练强度2方面建立信息的训练平衡度，从而利用PINN求解Burgers-Fisher方程. 实验表明，PINN能够获得较好的方程求解精度和稳定性；在求解方程的神经网络训练中，Burgers-Fisher方程的数值信息比规律信息能更好地促进神经网络逼近方程解；随着训练采样和迭代次数的增加，以及2类信息的平衡，神经网络训练效果得到提高；增加神经网络规模可以提高方程求解精度，但也增加了网络训练迭代时间，在固定训练时间下并非神经网络规模越大效果越好.

Select

10. 基于法条知识的事理型类案检索方法

李林睿,王东升,范红杰

浙江大学学报(工学版) 2024, 58 (7): 1357-1365. DOI: 10.3785/j.issn.1008-973X.2024.07.005

摘要

HTML

PDF（pc）（814KB）（957）

现有类案检索研究忽略了模型应当蕴含的法律逻辑，无法适应实际应用中案件相似标准的要求；类案检索任务的中文数据集较少，难以满足研究需求现状. 为此提出基于法律逻辑、有较强可解释性的类案检索模型，构建以谓语动词为基础的案件事理图谱. 将各类罪名对应的法条知识融入所提模型，将提取的不同要素输入以神经网络为基础的评分器以实现准确、高效的类案检索. 构建针对类案检索任务、以易混淆罪名组为主要检索案由的Confusing-LeCaRD数据集，所提模型在LeCaRD数据集和Confusing-LeCaRD数据集上的归一化折损累计增益分别为90.95%和94.64%，在各项指标上均优于TF-IDF、BM25和BERT-PLI模型.

Select

11. 四向穿梭车仓储系统复合作业调度优化

许丽丽,詹燕,鲁建厦,郎一丁

浙江大学学报(工学版) 2023, 57 (11): 2188-2199. DOI: 10.3785/j.issn.1008-973X.2023.11.006

摘要

HTML

PDF（pc）（1485KB）（912）

为了提高仓储系统作业效率，对四向穿梭车仓储系统复合作业开展调度优化研究. 在四向穿梭车和提升机采用复合作业完成任务的基础上，考虑设备在水平方向和垂直方向的协同作业特性. 通过四向穿梭车和提升机开始和结束作业时间以及开始作业层数之间的联系，在不同作业模式下进行讨论，从而构建以出入库作业时间最短为目标的数学模型. 提出基于任务分类的方法对遗传算法的种群进行初始化，随后在该方法的基础上完成种群的交叉和变异来求解模型，进而得出系统的最优任务分配及排序. 通过实例分析四向穿梭车数量及单双台提升机对系统作业效率和成本的影响，验证基于任务分类的遗传算法的有效性，结果表明该算法至少提高10.3%的作业效率.

Select

12. 基于小世界理论的区块链Kademlia网络改进方法

赵越,赵赫,谭海波,余斌,俞望年,马志宇

浙江大学学报(工学版) 2024, 58 (1): 1-9. DOI: 10.3785/j.issn.1008-973X.2024.01.001

摘要

HTML

PDF（pc）（1194KB）（905）

针对当前区块链Kademlia网络研究中通常以牺牲安全性为代价提升可扩展性的问题，提出基于小世界理论的区块链Kademlia网络改进方法. 该方法遵循小世界理论的思想，提出置换扩容节点的概率公式，概率与节点间距离呈反比，节点置换次数和额外增加的节点数量可以根据实际情况灵活调整. 通过理论分析和实验验证，证明了采用该方法改造的网络能够达到最终的稳定状态. 实验结果显示，利用该方法将全网广播交易消息时须经历的传输层级减少了15.0%~30.8%，加快了定位节点的速率. 与其他改变网络结构的优化算法相比，该方法降低了网络的结构化程度，增强了网络的安全性.

Select

13. 基于多模态融合的开放域三维模型检索算法

毛福新,杨旭,程嘉强,彭涛

浙江大学学报(工学版) 2024, 58 (1): 61-70. DOI: 10.3785/j.issn.1008-973X.2024.01.007

摘要

HTML

PDF（pc）（993KB）（845）

为了满足开放域下海量新增模型数据的管理和检索需求，提出开放域三维模型检索算法，可以有效地利用多模态信息的语义一致性. 借助无监督算法探寻未知样本间的类别信息，利用该类别信息实现网络模型的参数优化，使得网络模型在开放域条件下具有更好的模型表征性能及检索结果. 提出基于Transformer结构的层级化多模态信息融合模型，有效地剔除了多模态间的冗余信息，得到鲁棒性更强的模型表征向量. 在数据集ModelNet40上进行实验，通过与其他典型算法的对比实验可知，所提方法在mAP指标上优于所有的对比方法，验证了该方法在检索性能提升上的有效性.

Select

14. 大点数FFT在“申威26010”上的并行优化

郭俊,刘鹏,杨昕遥,张鲁飞,吴东

浙江大学学报(工学版) 2024, 58 (1): 78-86. DOI: 10.3785/j.issn.1008-973X.2024.01.009

摘要

HTML

PDF（pc）（1231KB）（728）

根据“神威·太湖之光”超级计算机所用国产“申威26010”处理器的架构特点和编程规范，提出针对大点数FFT的众核并行优化方案. 该方案源自经典的Cooley-Tukey FFT算法，通过将一维大点数数据迭代分解为二维小规模矩阵进行并行加速. 为了解决矩阵“列FFT”的读写、转置和计算问题，提出“列均分-行连续”的读写策略，通过对数据进行合理的分配、重排、交换，结合SIMD向量化、旋转因子优化、双缓冲、寄存器通信、跨步传输等优化手段，充分利用了众核处理器的计算资源和传输带宽. 实验结果显示，单核组64从核并行程序较主核运行FFTW库，可以达到最高65x、平均48x以上的加速比.

Select

15. 基于改进YOLOv5s的无人机小目标检测算法

宋耀莲,王粲,李大焱,刘欣怡

浙江大学学报(工学版) 2024, 58 (12): 2417-2426. DOI: 10.3785/j.issn.1008-973X.2024.12.001

摘要

HTML

PDF（pc）（708KB）（726）

为了解决传统目标检测算法对无人机(UAV)航拍小目标存在错漏检严重的问题，提出基于YOLOv5的无人机小目标检测算法FDB-YOLO. 在YOLOv5的基础上增加小目标检测层，优化特征融合网络，充分利用网络浅层小目标细粒信息，提升网络感知能力；提出损失函数FPIoU，通过充分利用锚框的几何性质，采用四点位置偏置约束函数，优化锚框定位，加快损失函数收敛速度；采用结合注意力机制的动态目标检测头(DyHead)，通过增加尺度、空间、任务感知提升算法检测能力；在特征提取部分引入双级路由注意力机制(BRA)，通过有选择性地对相关区域进行计算，过滤无关区域，提升模型的检测精确度. 实验证明，在VisDrone2019数据集上，本算法与YOLOv5s目标检测算法相比，精确率提升了3.7个百分点，召回率提升了5.1个百分点，mAP₅₀增加了5.8个百分点，mAP_50∶95增加3.4个百分点，并且相比当前主流算法而言都有更加优秀的表现.

Select

16. 煤矿井下无人驾驶轨道电机车障碍物识别

杨豚,郭永存,王爽,马鑫

浙江大学学报(工学版) 2024, 58 (1): 29-39. DOI: 10.3785/j.issn.1008-973X.2024.01.004

摘要

HTML

PDF（pc）（2463KB）（725）

针对现有煤矿井下无人驾驶轨道电机车因巷道环境恶劣导致障碍物识别精度低的问题，提出用于无人驾驶电机车障碍物精准实时检测的PDM-YOLO模型. 基于YOLOv5，将模型C3模块中的传统卷积替换为部分卷积，构建C3_P特征提取模块，有效减少模型的浮点运算量（FLOPs）与计算延迟. 采用改进后的解耦头，对传统YOLOv5的预测头进行解耦，提高模型的收敛速度及对障碍物的识别精度. 优化Mosaic数据增强方法，丰富训练图像的特征信息，提高模型的普适性和鲁棒性. 实验结果表明，PDM-YOLO模型在自制数据集上的平均检测精度（mAP）达到96.3%，平均检测速度达到109.2 帧/s，PDM-YOLO模型在PASCAL VOC公共数据集上的检测精度高于现有主流的YOLO系列模型.

Select

17. 基于交通事件短视频资源的多模态情绪特征分析

董镇滔,徐暟敏,万清颖,刘晓菲,申昊,李书涵,奇格奇

浙江大学学报(工学版) 2025, 59 (4): 661-668. DOI: 10.3785/j.issn.1008-973X.2025.04.001

摘要

HTML

PDF（pc）（3695KB）（715）

为了刻画以短视频形式传播的交通事件舆情对公众情绪的导向，通过文本情感分析和多模态生理信号特征提取，构建生理特征图谱. 爬取抖音平台136个高赞视频及38 805条评论，以所有视频为文档集，单个视频为文档，评论为单词，采用隐狄利克雷分布主题模型进行主题挖掘，获得不同主题的评论单词分布和不同视频的主题分布. 使用基于朴素贝叶斯的SnowNLP计算评论单词的情感分数，分析不同舆情主题表达的情感倾向. 开展神经科学实验，采集脑电、眼动、心电和呼吸等多模态生理信号及情绪评分. 统计检验结果表明，不同情感倾向的视频会诱发不同情绪，不同情绪下脑电的相对谱功率、眨眼频率、呼吸标准差和心电极低频功率等多模态生理特征具有特异性，评论文本中蕴含的情感语义会在视频诱发情绪的基础上对公众情绪造成不同方式的影响.

Select

18. 面向垃圾分类场景的轻量化目标检测方案

陈健松,蔡艺军

浙江大学学报(工学版) 2024, 58 (1): 71-77. DOI: 10.3785/j.issn.1008-973X.2024.01.008

摘要

HTML

PDF（pc）（1542KB）（693）

针对边缘端进行垃圾检测分类实时性差的问题，提出轻量化的Yolov5垃圾检测解决方案. 引入Stem模块，增强模型对输入图像的特征提取能力. 将backbone的C3模块进行改进，提高特征提取能力. 使用深度可分离卷积替换网络中的3×3降采样卷积，实现模型轻量化. 使用K-means++算法重新计算物体的锚框值，使模型在训练过程中能够更好地预测目标框的大小. 通过实验研究对比可知，改进模型相比于Yolov5s模型，mAP_0.5提升了0.8%，mAP_0.5:0.95提升了3%，模型参数量减少到原来的77.9%，推理速度提升了21.9%，极大地提高了模型的检测性能.

Select

19. 基于循环神经网络的双目视觉物体6D位姿估计

杨恒,李卓,康忠元,田兵,董青

浙江大学学报(工学版) 2023, 57 (11): 2179-2187. DOI: 10.3785/j.issn.1008-973X.2023.11.005

摘要

HTML

PDF（pc）（1068KB）（674）

针对当前物体6D位姿估计任务准确率较低的问题，提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN. 将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容，利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入，输入各物体相关参数，由虚拟双目相机右摄像头捕获合成图片. 利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取. 经过循环神经网络对几何特征进行融合，并预测物体6D位姿. 以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比. 结果表明，在利用单一物体对网络进行训练时，Binocular-RNN 的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍. 利用基于物理的实时渲染（Real+PBR）方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法(DeepIM).

Select

20. 基于图神经网络的路面病害态势预测方法

马泽超,刘小明,夏汗青,王伟强,王久增,申海涛

浙江大学学报(工学版) 2024, 58 (12): 2596-2608. DOI: 10.3785/j.issn.1008-973X.2024.12.019

摘要

HTML

PDF（pc）（1111KB）（674）

针对路面病害生成和恶化的预测问题，提出应用图卷积神经网络的路面病害态势预测方法. 通过聚类算法建立拓扑网络，选取目标病害在演化过程中的主要影响因素；为了增强图神经网络对病害信息的表达能力，采用图拓扑增强的方法，从静态和动态方面分别构造与病害信息相关的视图；采用图神经网络(GNN)架构增强的方法，在视图维度上应用注意力机制调整不同视图的影响力，并在时间维度上应用Transformer和GRU模块，增强模型在长时间序列中对病害状态的预测性能. 设计模型的内部调整测试，经消融试验、多样本测试和超参数对照组的验证，证明所提模型的适用性和稳定性. 针对大型稀疏的路面病害数据集，此模型的平均绝对误差均值收敛在4.0以内，综合性能优于传统预测算法.

全文下载排行