全文下载排行

一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

当前位置: 两年内
Please wait a minute...
1. 基于深度学习的EEG数据分析技术综述
钟博,王鹏飞,王乙乔,王晓玲
浙江大学学报(工学版)    2024, 58 (5): 879-890.   DOI: 10.3785/j.issn.1008-973X.2024.05.001
摘要   HTML PDF(pc) (690KB)(817)   

对近年来的相关工作进行全面分析、横向比较,梳理出基于深度学习的EEG数据分析闭环流程. 对EEG数据进行介绍,从深度学习在EEG数据预处理、特征提取以及模型泛化3个关键阶段的应用进行展开,梳理深度学习算法在相应阶段提供的研究思路和解决方案,包括各阶段所存在的难点与问题. 全方位总结出不同算法的主要贡献和局限性,讨论深度学习技术在各个阶段处理EEG数据时所面临的挑战及未来的发展方向.

2. 基于改进Transformer的复合故障解耦诊断方法
王誉翔,钟智伟,夏鹏程,黄亦翔,刘成良
浙江大学学报(工学版)    2023, 57 (5): 855-864.   DOI: 10.3785/j.issn.1008-973X.2023.05.001
摘要   HTML PDF(pc) (2584KB)(739)   

大多复合故障诊断方法视复合故障为一种新的单一故障类型,忽视了内部单一故障的相互作用、故障分析粒度含糊和解释性差. 为了解决复合故障难解耦的问题,针对工业环境中复合故障数据极少的情况,提出一种基于改进Transformer的复合故障解耦诊断方法. 诊断流程分为预处理、特征提取和故障解耦3个步骤. 故障解耦引入Transformer的解码器,利用交叉注意力机制使得每个单一故障标签可以在提取的特征层中,自适应地关注到与故障特征相对应的判别特征区域,进一步预测每个单一故障标签的输出概率以实现复合故障解耦. 设计多组复合故障试验与业界先进算法进行对比,以验证方法的有效性. 结果表明,所提方法在少量单一故障训练样本和极少量复合故障训练样本情况下,有较高的诊断准确度. 当训练集中复合故障样本数仅为5时,复合故障诊断准确度达到88.29%,与其他方法比较更具有显著优势.

3. 基于改进强化学习的多智能体追逃对抗
薛雅丽,叶金泽,李寒雁
浙江大学学报(工学版)    2023, 57 (8): 1479-1486.   DOI: 10.3785/j.issn.1008-973X.2023.08.001
摘要   HTML PDF(pc) (1158KB)(700)   

针对多智能体追逃问题,提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法(MADDPG)和双延迟-确定策略梯度算法(TD3)相结合,提出多智能体双延迟-确定策略梯度算法(MATD3). 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题,提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数,将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励,提出DEPER-MATD3算法. 基于此算法设计仿真实验,并与其他算法对比,实验结果表明,该算法有效解决了过估计问题,且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高,追击者有更大的概率追击到逃逸者.

4. 基于改进YOLOv5的电子元件表面缺陷检测算法
曾耀,高法钦
浙江大学学报(工学版)    2023, 57 (3): 455-465.   DOI: 10.3785/j.issn.1008-973X.2023.03.003
摘要   HTML PDF(pc) (1697KB)(637)   

目标检测模型在电子元件生产环境中的实时检测能力不佳,为此采用GhostNet替换YOLOv5的主干网络. 针对电子元件表面缺陷存在小目标及尺度变化较大的目标的情况,在YOLOv5主干网络中加入坐标注意力机制,在避免大量计算资源消耗的前提下增强感受野,将坐标信息嵌入通道注意力中以提升模型对目标的定位. 使用加权双向特征金字塔网络结构替换YOLOv5特征融合模块中的特征金字塔网络(FPN)结构,提升多尺度加权特征的融合能力. 在自制缺陷电子元件数据集上的实验结果表明,改进的GCB-YOLOv5模型平均精度达到93%,平均检测时间为33.2 ms,相比于原始YOLOv5模型,平均精度提高了15.0%,平均时间提升了7 ms,可以同时满足电子元件表面缺陷检测精度与速度的需求.

5. 基于Transformer和知识图谱的新闻推荐新方法
凤丽洲,杨阳,王友卫,杨贵军
浙江大学学报(工学版)    2023, 57 (1): 133-143.   DOI: 10.3785/j.issn.1008-973X.2023.01.014
摘要   HTML PDF(pc) (1590KB)(586)   

为了增加新闻推荐的辅助信息并提高预测精度,提出基于Transformer和知识图谱的新闻推荐方法. 为了结合新闻语义信息和实体信息,利用自注意力机制获取新闻单词之间和新闻实体之间的联系,采用加法注意力机制捕捉单词和实体对新闻表示的影响. 考虑到用户对新闻的偏好具有时序性特点,引入Transformer以捕捉用户点击新闻间的关联信息及用户兴趣随时间的变化情况. 利用知识图谱中的高阶结构信息,融合候选新闻邻接实体,提升候选新闻嵌入向量所含信息的完整性. 在2个版本的MIND新闻数据集上与5个典型推荐方法的对比实验表明,注意力机制、Transformer和知识图谱的引入提高了算法在新闻推荐方面的表现.

6. 程序表示学习综述
马骏驰,迪骁鑫,段宗涛,唐蕾
浙江大学学报(工学版)    2023, 57 (1): 155-169.   DOI: 10.3785/j.issn.1008-973X.2023.01.016
摘要   HTML PDF(pc) (1100KB)(533)   

为了提高软件的开发效率,目前已出现应用人工智能技术进行智能化开发的趋势,如何理解程序语义是智能化开发中需要重点解决的问题. 针对该问题,出现了一系列程序表示学习的研究,程序表示学习可以自动地从程序中学习有用的特征,将特征表示为低维稠密向量,高效地提取程序语义并使用于相应的下游任务. 对程序表示学习的研究工作进行综述,介绍了主流的程序表示学习模型,包括基于图结构和基于token序列的程序表示学习框架. 展示了程序表示学习技术在缺陷检测、缺陷定位、代码补全等任务上的应用,总结了程序表示学习的常用工具集和测试集. 分析了程序表示学习未来需要应对的挑战.

7. 多特征融合的驾驶员疲劳状态检测方法
方浩杰,董红召,林少轩,罗建宇,方勇
浙江大学学报(工学版)    2023, 57 (7): 1287-1296.   DOI: 10.3785/j.issn.1008-973X.2023.07.003
摘要   HTML PDF(pc) (1481KB)(526)   

针对现有疲劳状态检测方法无法适用于疫情防控下的驾驶员,利用改进后的YOLOv5目标检测算法,对驾驶员的面部区域进行检测,建立多特征融合的疲劳状态检测方法. 针对公交驾驶特性,建立包含佩戴口罩和未佩戴口罩情况的图像标签数据. 通过增加YOLOv5模型的特征采样次数,提高眼、嘴、面部区域的检测精度. 利用BiFPN网络结构保留多尺度的特征信息,使得预测网络对不同大小的目标更敏感,提升整体模型的检测能力. 结合人脸关键点算法提出参数补偿机制,提高眨眼、打哈欠帧数的准确率. 将多种疲劳参数融合归一化处理,开展疲劳等级划分. 公开数据集NTHU和自制数据集的验证结果表明,该方法对佩戴口罩和未佩戴口罩情况均可以进行眨眼、打哈欠识别,可以准确地判断驾驶员的疲劳状态.

8. 基于改进Transformer的结构化图像超分辨网络
吕鑫栋,李娇,邓真楠,冯浩,崔欣桐,邓红霞
浙江大学学报(工学版)    2023, 57 (5): 865-874.   DOI: 10.3785/j.issn.1008-973X.2023.05.002
摘要   HTML PDF(pc) (1744KB)(492)   

针对现有的结构化图像超分辨重建算法大多只能解决特定单一种类的结构化图像超分辨问题,提出一种基于改进Transformer的结构化图像超分辨率网络(TransSRNet). 该网络利用Transformer的自注意力机制在空间序列中挖掘大范围的全局信息. 采用沙漏块结构搭建空间注意力单元,关注低分辨率空间和高分辨率空间在局部区域的映射关系,提取图像映射过程中的结构化信息,使用高效通道注意力模块对自注意力模块和空间注意力模块做特征融合. 在高度结构化CelebA、Helen、TCGA-ESCA 和TCGA-COAD数据集上的模型评估结果表明,相较于主流超分辨算法,TransSRNet整体性能表现更好. 在放大因子为8时,人脸数据集和医学峰值信噪比(PRNR)可以分别达到28.726、26.392 dB, 结构相似性(SSIM)可以分别达到0.844、0.881.

9. 基于小世界理论的区块链Kademlia网络改进方法
赵越,赵赫,谭海波,余斌,俞望年,马志宇
浙江大学学报(工学版)    2024, 58 (1): 1-9.   DOI: 10.3785/j.issn.1008-973X.2024.01.001
摘要   HTML PDF(pc) (1194KB)(489)   

针对当前区块链Kademlia网络研究中通常以牺牲安全性为代价提升可扩展性的问题,提出基于小世界理论的区块链Kademlia网络改进方法. 该方法遵循小世界理论的思想,提出置换扩容节点的概率公式,概率与节点间距离呈反比,节点置换次数和额外增加的节点数量可以根据实际情况灵活调整. 通过理论分析和实验验证,证明了采用该方法改造的网络能够达到最终的稳定状态. 实验结果显示,利用该方法将全网广播交易消息时须经历的传输层级减少了15.0%~30.8%,加快了定位节点的速率. 与其他改变网络结构的优化算法相比,该方法降低了网络的结构化程度,增强了网络的安全性.

10. 基于语义增强特征融合的多模态图像检索模型
杨帆,宁博,李怀清,周新,李冠宇
浙江大学学报(工学版)    2023, 57 (2): 252-258.   DOI: 10.3785/j.issn.1008-973X.2023.02.005
摘要   HTML PDF(pc) (928KB)(472)   

为了在多模态图像检索任务中建立文本特征与图像特征的相关性,提出基于语义增强特征融合的多模态图像检索模型(SEFM). 该模型通过文本语义增强模块、图像语义增强模块2部分在特征融合时对组合特征进行语义增强. 在文本语义增强模块建立多模态双重注意力机制,利用双重注意力建立文本与图像之间的关联以增强文本语义;在图像语义增强模块引入保留强度和更新强度,控制组合特征中查询图像特征的保留和更新程度. 基于以上2个模块可以优化组合特征使其更接近目标图像特征. 在MIT-States和Fashion IQ这2个数据集上对该模型进行评估,实验结果表明在多模态图像检索任务上该模型与现有方法相比在召回率和准确率上都有所提升.

11. 基于多头自注意力的复杂背景船舶检测算法
于楠晶,范晓飚,邓天民,冒国韬
浙江大学学报(工学版)    2022, 56 (12): 2392-2402.   DOI: 10.3785/j.issn.1008-973X.2022.12.008
摘要   HTML PDF(pc) (1335KB)(449)   

针对内河港口背景复杂、类间尺度差异大和小目标实例多的特点,提出基于多头自注意力机制(MHSA)和YOLO网络的船舶目标检测算法(MHSA-YOLO). 在特征提取过程中,基于MHSA设计并行的自注意力残差模块(PARM),以弱化复杂背景信息干扰并强化船舶目标特征信息;在特征融合过程中,开发简化的双向特征金字塔结构,以强化特征信息的融合与表征能力. 在Seaships数据集上的实验结果表明,与其他先进的目标检测方法相比,MHSA-YOLO拥有较好的学习能力,在检测精度方面取得97.59%的平均均值精度,MHSA-YOLO对复杂背景船舶目标和小尺寸目标的检测更有效. 基于自制数据集的实验结果表明,MHSA-YOLO的泛化能力强.

12. 基于深度强化学习的数控铣削加工参数优化方法
邓齐林,鲁娟,陈勇辉,冯健,廖小平,马俊燕
浙江大学学报(工学版)    2022, 56 (11): 2145-2155.   DOI: 10.3785/j.issn.1008-973X.2022.11.005
摘要   HTML PDF(pc) (1928KB)(445)   

为了提高数控加工中的机床效能和加工效率,探究深度强化学习在加工参数优化问题中的适用性,提出一种基于深度强化学习的数控铣削加工参数优化方法. 选取切削力合力和材料除去率作为效能和效率的优化目标,利用遗传算法优化反向传播神经网络(GA-BPNN)构建切削力合力和铣削参数的优化函数,并采用经验公式建立材料除去率的优化函数. 应用竞争网络架构(Dueling DQN)算法获得切削力合力和材料除去率多目标优化的Pareto前沿,并结合优劣解距离法和熵值法从Pareto前沿中选择决策解. 基于45钢的铣削试验,验证了Dueling DQN算法用于加工参数优化的有效性,相比经验选取加工参数,通过Dueling DQN优化得到的加工方案使切削力合力降低了8.29%,加工效率提高了4.95%,为加工参数的多目标优化方法和加工参数的选择提供了指导.

13. 基于物理信息神经网络的燃烧化学微分方程求解
王意存,邢江宽,罗坤,王海鸥,樊建人
浙江大学学报(工学版)    2022, 56 (10): 2084-2092.   DOI: 10.3785/j.issn.1008-973X.2022.10.020
摘要   HTML PDF(pc) (2369KB)(443)   

为了有效地将湍流燃烧复杂的物理化学信息嵌入到物理信息神经网络(PINNs),选取湍流燃烧模拟中的2个典型场景案例,即刚性常微分方程ROBER问题及稳态射流火焰混合分数方程求解,探索PINNs在燃烧化学微分方程计算中的应用潜力. 结果表明,对于零维刚性反应系统,利用PINNs模型可以较好地捕捉到系统的演化过程;对于稳态射流火焰,PINNs的预测解与传统的数值解有较好的一致性. 残差点的选取对于燃烧化学领域内的复杂微分方程求解尤为重要,应基于具体的构型详细考虑.

14. 自适应樽海鞘群算法求解考虑运输时间的柔性作业车间调度
牛昊一,吴维敏,章庭棋,沈微,张涛
浙江大学学报(工学版)    2023, 57 (7): 1267-1277.   DOI: 10.3785/j.issn.1008-973X.2023.07.001
摘要   HTML PDF(pc) (1024KB)(440)   

针对考虑运输时间的柔性作业车间调度问题,以最小化最大完工时间为优化目标,提出自适应樽海鞘群算法. 设计基于随机密钥方法的3层编码方案,将编码的离散解空间连续化. 引入惯性权重评价跟随者之间的相互影响程度,增强算法的全局探索与局部搜索能力. 提出自适应更新领导者-跟随者种群数量策略,根据种群迭代状态对领导者和跟随者的数量进行自适应调整. 在邻域搜索中引入禁忌搜索策略,防止算法陷入局部最优. 通过基准算例测试,验证了算法的有效性和优越性,发现AGV数量对完工时间的影响符合边际效应递减的规律.

15. 基于改进YOLOv3的印刷电路板缺陷检测算法
卞佰成,陈田,吴入军,刘军
浙江大学学报(工学版)    2023, 57 (4): 735-743.   DOI: 10.3785/j.issn.1008-973X.2023.04.011
摘要   HTML PDF(pc) (1420KB)(438)   

针对现有基于深度学习的印刷电路板(PCB)缺陷检测算法无法同时满足精度和效率要求的问题,提出基于YOLOv3改进的AT-YOLO算法来检测PCB缺陷. 将主干网络替换为ResNeSt50,提高特征提取能力,减少参数量. 引入SPP模块,融合不同感受野的特征,丰富了特征的表达能力. 改进PANet结构替换FPN,插入SE模块提升有效特征图的表达能力,增加1组高分辨率特征图的输入输出,提升对小目标物体的敏感程度,检测尺度由3个增加到4个. 使用K-means算法重新聚类生成锚框尺寸,提高了模型的目标检测精度. 实验证明,AT-YOLO算法在PCB缺陷检测数据集上的精度均值AP0.5达到98.42%,参数量为3.523×107,平均检测速度为36帧/s,满足精度和效率的要求.

16. 带复杂计算的金融领域自然语言查询的SQL生成
何佳壕,刘喜平,舒晴,万常选,刘德喜,廖国琼
浙江大学学报(工学版)    2023, 57 (2): 277-286.   DOI: 10.3785/j.issn.1008-973X.2023.02.008
摘要   HTML PDF(pc) (739KB)(429)   

研究金融领域基于自然语言查询的结构化查询语言(SQL)生成问题(Text-to-SQL), 构建一个金融领域Text-to-SQL数据集,称为SOFT数据集. 该数据集覆盖了金融领域的常见查询,具有鲜明的特点,并对Text-to-SQL提出了挑战. 提出金融领域Text-to-SQL模型FinSQL,该模型优化了对金融领域复杂查询的支持. 通过分析一类复杂计算查询(行计算查询)的特点,提出一种基于分治的方法,即先将一个行计算查询分解为若干个子查询,分别针对每个子查询生成SQL语句,再将子查询的SQL语句组合在一起得到原始查询的SQL语句. 在SOFT数据集上进行验证,结果显示,本研究所提的方法在复杂查询上效果优于已有方法. 特别地,所提出的模型FinSQL能够较好地支持行计算查询.

17. 基于改进GhostNet-FCOS的火灾检测算法
张融,张为
浙江大学学报(工学版)    2022, 56 (10): 1891-1899.   DOI: 10.3785/j.issn.1008-973X.2022.10.001
摘要   HTML PDF(pc) (2209KB)(424)   

针对现有火灾检测算法检测精度不佳和算法模型复杂度过高的问题,提出基于改进GhostNet-FCOS的火灾检测算法. 该算法以目标检测网络FCOS为基础,降低通道维数并选用GhostNet作为特征提取网络,以实现轻量化火灾检测算法. 引入动态卷积,在不增加网络宽度和深度的情况下优化主干网络的基础模块,提高对形态多变的火焰图像的特征提取能力. 增加空间注意力模块,优化网络空间特征的表达. 改进正负样本定义和回归损失函数,优化训练过程中算法模型对标注框内不同区域的关注程度. 在自建火灾数据集和公开数据集中的实验结果表明,该算法在检测精度和模型复杂度方面具有优势. 该算法在自建火灾数据集中的检测精度为90.9%,参数量为4.58×106,浮点计算量为31.45×109.

18. 基于物理信息神经网络的Burgers-Fisher方程求解方法
徐健,朱海龙,朱江乐,李春忠
浙江大学学报(工学版)    2023, 57 (11): 2160-2169.   DOI: 10.3785/j.issn.1008-973X.2023.11.003
摘要   HTML PDF(pc) (1371KB)(418)   

为了探索基于物理信息的神经网络(PINN)求解微分方程时,物理信息在训练神经网络中的作用,提出将物理信息分为规律信息和数值信息2类,以阐释PINN求解微分方程的逻辑,以及物理信息的数据驱动方式和神经网络可解释性.设计基于2类信息的神经网络综合损失函数,并从训练采样和训练强度2方面建立信息的训练平衡度,从而利用PINN求解Burgers-Fisher方程. 实验表明,PINN能够获得较好的方程求解精度和稳定性;在求解方程的神经网络训练中,Burgers-Fisher方程的数值信息比规律信息能更好地促进神经网络逼近方程解;随着训练采样和迭代次数的增加,以及2类信息的平衡,神经网络训练效果得到提高;增加神经网络规模可以提高方程求解精度,但也增加了网络训练迭代时间,在固定训练时间下并非神经网络规模越大效果越好.

19. 基于循环神经网络的双目视觉物体6D位姿估计
杨恒,李卓,康忠元,田兵,董青
浙江大学学报(工学版)    2023, 57 (11): 2179-2187.   DOI: 10.3785/j.issn.1008-973X.2023.11.005
摘要   HTML PDF(pc) (1068KB)(409)   

针对当前物体6D位姿估计任务准确率较低的问题,提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN. 将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容,利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入,输入各物体相关参数,由虚拟双目相机右摄像头捕获合成图片. 利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取. 经过循环神经网络对几何特征进行融合,并预测物体6D位姿. 以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比. 结果表明,在利用单一物体对网络进行训练时,Binocular-RNN 的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍. 利用基于物理的实时渲染(Real+PBR)方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法(DeepIM).

20. 基于深度学习三维成型的钢板表面缺陷检测
兰欢,余建波
浙江大学学报(工学版)    2023, 57 (3): 466-476.   DOI: 10.3785/j.issn.1008-973X.2023.03.004
摘要   HTML PDF(pc) (5141KB)(399)   

为了解决二维检测方法难以检测带有深度信息的缺陷问题,提出全新的三维重建网络. 提出基于多尺度特征增强的级联式三维重建网络(MFE-CasMVSNet),并与点云数据处理技术结合,用于钢板表面缺陷检测. 为了提高三维重建的精度,提出位置导向的特征增强模块(PFEM)和多尺度特征自适应融合模块(MFAFM),对特征进行有效提取并减少信息丢失. 提出基于曲率稀疏化的密度聚类方法(CS-DBSCAN),用于精确识别不同部位的缺陷. 引入三维检测框,实现对缺陷的定位与检测可视化. 实验结果表明,相较于图像几何的重建方法,MFE-CasMVSNet能够更加精确、快速地实现钢板表面的三维重建. 相较于二维检测,三维缺陷检测能够精确获取缺陷的三维形状信息,实现对钢板表面缺陷的多维度检测.