全文下载排行

一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

当前位置: 三年内
Please wait a minute...
1. 基于深度学习的EEG数据分析技术综述
钟博,王鹏飞,王乙乔,王晓玲
浙江大学学报(工学版)    2024, 58 (5): 879-890.   DOI: 10.3785/j.issn.1008-973X.2024.05.001
摘要   HTML PDF(pc) (690KB)(2084)   

对近年来的相关工作进行全面分析、横向比较,梳理出基于深度学习的EEG数据分析闭环流程. 对EEG数据进行介绍,从深度学习在EEG数据预处理、特征提取以及模型泛化3个关键阶段的应用进行展开,梳理深度学习算法在相应阶段提供的研究思路和解决方案,包括各阶段所存在的难点与问题. 全方位总结出不同算法的主要贡献和局限性,讨论深度学习技术在各个阶段处理EEG数据时所面临的挑战及未来的发展方向.

2. 基于改进强化学习的多智能体追逃对抗
薛雅丽,叶金泽,李寒雁
浙江大学学报(工学版)    2023, 57 (8): 1479-1486.   DOI: 10.3785/j.issn.1008-973X.2023.08.001
摘要   HTML PDF(pc) (1158KB)(1001)   

针对多智能体追逃问题,提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法(MADDPG)和双延迟-确定策略梯度算法(TD3)相结合,提出多智能体双延迟-确定策略梯度算法(MATD3). 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题,提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数,将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励,提出DEPER-MATD3算法. 基于此算法设计仿真实验,并与其他算法对比,实验结果表明,该算法有效解决了过估计问题,且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高,追击者有更大的概率追击到逃逸者.

3. 基于改进YOLOv5的电子元件表面缺陷检测算法
曾耀,高法钦
浙江大学学报(工学版)    2023, 57 (3): 455-465.   DOI: 10.3785/j.issn.1008-973X.2023.03.003
摘要   HTML PDF(pc) (1697KB)(958)   

目标检测模型在电子元件生产环境中的实时检测能力不佳,为此采用GhostNet替换YOLOv5的主干网络. 针对电子元件表面缺陷存在小目标及尺度变化较大的目标的情况,在YOLOv5主干网络中加入坐标注意力机制,在避免大量计算资源消耗的前提下增强感受野,将坐标信息嵌入通道注意力中以提升模型对目标的定位. 使用加权双向特征金字塔网络结构替换YOLOv5特征融合模块中的特征金字塔网络(FPN)结构,提升多尺度加权特征的融合能力. 在自制缺陷电子元件数据集上的实验结果表明,改进的GCB-YOLOv5模型平均精度达到93%,平均检测时间为33.2 ms,相比于原始YOLOv5模型,平均精度提高了15.0%,平均时间提升了7 ms,可以同时满足电子元件表面缺陷检测精度与速度的需求.

4. 足式机器人触地检测方法的研究综述
姜晓勇,应凯健,吴起威,魏璇
浙江大学学报(工学版)    2024, 58 (2): 334-348.   DOI: 10.3785/j.issn.1008-973X.2024.02.012
摘要   HTML PDF(pc) (1751KB)(927)   

基于现有足式机器人触地检测方法的研究,综合论述了腿部结构设计、足端设计、传感器设计对触地检测的影响. 总结外部传感器直接检测的触地检测方法、基于运动学与动力学的触地检测方法以及基于学习的触地检测方法. 归纳地面湿滑、地面松软以及非足端触地这3种特殊场景中的触地检测方法. 分析触地检测技术的应用场景,具体包括运动控制的需要、导航中的应用、地形与地质的感知这三大应用场景. 指出硬件改进和集成、多模态触地检测、多传感器融合化触地检测以及智能化触地检测这四大触地检测方法相关的发展趋势,总结各触地检测算法之间的具体关联,为触地检测后续技术的发展及触地检测的具体应用提供指导.

5. 多特征融合的驾驶员疲劳状态检测方法
方浩杰,董红召,林少轩,罗建宇,方勇
浙江大学学报(工学版)    2023, 57 (7): 1287-1296.   DOI: 10.3785/j.issn.1008-973X.2023.07.003
摘要   HTML PDF(pc) (1481KB)(865)   

针对现有疲劳状态检测方法无法适用于疫情防控下的驾驶员,利用改进后的YOLOv5目标检测算法,对驾驶员的面部区域进行检测,建立多特征融合的疲劳状态检测方法. 针对公交驾驶特性,建立包含佩戴口罩和未佩戴口罩情况的图像标签数据. 通过增加YOLOv5模型的特征采样次数,提高眼、嘴、面部区域的检测精度. 利用BiFPN网络结构保留多尺度的特征信息,使得预测网络对不同大小的目标更敏感,提升整体模型的检测能力. 结合人脸关键点算法提出参数补偿机制,提高眨眼、打哈欠帧数的准确率. 将多种疲劳参数融合归一化处理,开展疲劳等级划分. 公开数据集NTHU和自制数据集的验证结果表明,该方法对佩戴口罩和未佩戴口罩情况均可以进行眨眼、打哈欠识别,可以准确地判断驾驶员的疲劳状态.

6. 基于改进Transformer的复合故障解耦诊断方法
王誉翔,钟智伟,夏鹏程,黄亦翔,刘成良
浙江大学学报(工学版)    2023, 57 (5): 855-864.   DOI: 10.3785/j.issn.1008-973X.2023.05.001
摘要   HTML PDF(pc) (2584KB)(832)   

大多复合故障诊断方法视复合故障为一种新的单一故障类型,忽视了内部单一故障的相互作用、故障分析粒度含糊和解释性差. 为了解决复合故障难解耦的问题,针对工业环境中复合故障数据极少的情况,提出一种基于改进Transformer的复合故障解耦诊断方法. 诊断流程分为预处理、特征提取和故障解耦3个步骤. 故障解耦引入Transformer的解码器,利用交叉注意力机制使得每个单一故障标签可以在提取的特征层中,自适应地关注到与故障特征相对应的判别特征区域,进一步预测每个单一故障标签的输出概率以实现复合故障解耦. 设计多组复合故障试验与业界先进算法进行对比,以验证方法的有效性. 结果表明,所提方法在少量单一故障训练样本和极少量复合故障训练样本情况下,有较高的诊断准确度. 当训练集中复合故障样本数仅为5时,复合故障诊断准确度达到88.29%,与其他方法比较更具有显著优势.

7. 基于TOUGH2和FLAC3D的流固弱耦合程序开发及验证
刘夏临,张晟斌,陈佺,舒恒,刘尚各
浙江大学学报(工学版)    2022, 56 (8): 1485-1494.   DOI: 10.3785/j.issn.1008-973X.2022.08.002
摘要   HTML PDF(pc) (1589KB)(775)   

传统、新型岩土工程问题诸如压缩空气含水层储能、充气截排水技术、二氧化碳地质封存、油气地下储备工程等均涉及气水两相流与应力耦合. 针对这一工程实际,根据非饱和土气水两相渗流-应力弱耦合理论,开发了基于TOUGH2与FLAC3D的气水两相渗流-应力耦合计算搭接程序. 该计算程序能够较为真实地模拟气水两相渗流问题,能够探讨流动过程中气水的相互作用及其对过程的影响. 程序考虑了气水两相渗流与土体骨架变形直接的相互作用,反映了这一过程中孔隙度、渗透率、毛管压力和土体物理力学参数的变化,实现了更为完善的气水两相渗流与应力弱耦合分析. 通过与经典的排水试验和模型试验对比,验证了该程序可以较为准确地模拟气水两相流-应力之间的相互作用.

8. 程序表示学习综述
马骏驰,迪骁鑫,段宗涛,唐蕾
浙江大学学报(工学版)    2023, 57 (1): 155-169.   DOI: 10.3785/j.issn.1008-973X.2023.01.016
摘要   HTML PDF(pc) (1100KB)(740)   

为了提高软件的开发效率,目前已出现应用人工智能技术进行智能化开发的趋势,如何理解程序语义是智能化开发中需要重点解决的问题. 针对该问题,出现了一系列程序表示学习的研究,程序表示学习可以自动地从程序中学习有用的特征,将特征表示为低维稠密向量,高效地提取程序语义并使用于相应的下游任务. 对程序表示学习的研究工作进行综述,介绍了主流的程序表示学习模型,包括基于图结构和基于token序列的程序表示学习框架. 展示了程序表示学习技术在缺陷检测、缺陷定位、代码补全等任务上的应用,总结了程序表示学习的常用工具集和测试集. 分析了程序表示学习未来需要应对的挑战.

9. 基于物理信息神经网络的Burgers-Fisher方程求解方法
徐健,朱海龙,朱江乐,李春忠
浙江大学学报(工学版)    2023, 57 (11): 2160-2169.   DOI: 10.3785/j.issn.1008-973X.2023.11.003
摘要   HTML PDF(pc) (1371KB)(682)   

为了探索基于物理信息的神经网络(PINN)求解微分方程时,物理信息在训练神经网络中的作用,提出将物理信息分为规律信息和数值信息2类,以阐释PINN求解微分方程的逻辑,以及物理信息的数据驱动方式和神经网络可解释性.设计基于2类信息的神经网络综合损失函数,并从训练采样和训练强度2方面建立信息的训练平衡度,从而利用PINN求解Burgers-Fisher方程. 实验表明,PINN能够获得较好的方程求解精度和稳定性;在求解方程的神经网络训练中,Burgers-Fisher方程的数值信息比规律信息能更好地促进神经网络逼近方程解;随着训练采样和迭代次数的增加,以及2类信息的平衡,神经网络训练效果得到提高;增加神经网络规模可以提高方程求解精度,但也增加了网络训练迭代时间,在固定训练时间下并非神经网络规模越大效果越好.

10. 基于Transformer和知识图谱的新闻推荐新方法
凤丽洲,杨阳,王友卫,杨贵军
浙江大学学报(工学版)    2023, 57 (1): 133-143.   DOI: 10.3785/j.issn.1008-973X.2023.01.014
摘要   HTML PDF(pc) (1590KB)(661)   

为了增加新闻推荐的辅助信息并提高预测精度,提出基于Transformer和知识图谱的新闻推荐方法. 为了结合新闻语义信息和实体信息,利用自注意力机制获取新闻单词之间和新闻实体之间的联系,采用加法注意力机制捕捉单词和实体对新闻表示的影响. 考虑到用户对新闻的偏好具有时序性特点,引入Transformer以捕捉用户点击新闻间的关联信息及用户兴趣随时间的变化情况. 利用知识图谱中的高阶结构信息,融合候选新闻邻接实体,提升候选新闻嵌入向量所含信息的完整性. 在2个版本的MIND新闻数据集上与5个典型推荐方法的对比实验表明,注意力机制、Transformer和知识图谱的引入提高了算法在新闻推荐方面的表现.

11. 基于多任务学习与层叠 Transformer 的多模态情感分析模型
陈巧红,孙佳锦,漏杨波,方志坚
浙江大学学报(工学版)    2023, 57 (12): 2421-2429.   DOI: 10.3785/j.issn.1008-973X.2023.12.009
摘要   HTML PDF(pc) (1171KB)(659)   

针对单模态特征提取存在的模态特征异质性难以保留问题和跨模态特征融合存在的特征冗余问题,基于跨模态Transformer,提出新的多模态情感分析模型(MTSA). 使用长短时记忆(LSTM)与多任务学习框架提取单模态上下文语义信息,通过累加辅助模态任务损失以筛除噪声并保留模态特征异质性. 使用多任务门控机制调整跨模态特征融合,通过层叠Transformer结构融合文本、音频与视觉模态特征,提升融合深度,避免融合特征冗余. 在2个公开数据集MOSEI和SIMS上的实验结果表明,相较于其他先进模型,MTSA的整体性能表现更好,二分类准确率分别达到83.51%和84.18%.

12. 基于小世界理论的区块链Kademlia网络改进方法
赵越,赵赫,谭海波,余斌,俞望年,马志宇
浙江大学学报(工学版)    2024, 58 (1): 1-9.   DOI: 10.3785/j.issn.1008-973X.2024.01.001
摘要   HTML PDF(pc) (1194KB)(646)   

针对当前区块链Kademlia网络研究中通常以牺牲安全性为代价提升可扩展性的问题,提出基于小世界理论的区块链Kademlia网络改进方法. 该方法遵循小世界理论的思想,提出置换扩容节点的概率公式,概率与节点间距离呈反比,节点置换次数和额外增加的节点数量可以根据实际情况灵活调整. 通过理论分析和实验验证,证明了采用该方法改造的网络能够达到最终的稳定状态. 实验结果显示,利用该方法将全网广播交易消息时须经历的传输层级减少了15.0%~30.8%,加快了定位节点的速率. 与其他改变网络结构的优化算法相比,该方法降低了网络的结构化程度,增强了网络的安全性.

13. 基于改进Transformer的结构化图像超分辨网络
吕鑫栋,李娇,邓真楠,冯浩,崔欣桐,邓红霞
浙江大学学报(工学版)    2023, 57 (5): 865-874.   DOI: 10.3785/j.issn.1008-973X.2023.05.002
摘要   HTML PDF(pc) (1744KB)(626)   

针对现有的结构化图像超分辨重建算法大多只能解决特定单一种类的结构化图像超分辨问题,提出一种基于改进Transformer的结构化图像超分辨率网络(TransSRNet). 该网络利用Transformer的自注意力机制在空间序列中挖掘大范围的全局信息. 采用沙漏块结构搭建空间注意力单元,关注低分辨率空间和高分辨率空间在局部区域的映射关系,提取图像映射过程中的结构化信息,使用高效通道注意力模块对自注意力模块和空间注意力模块做特征融合. 在高度结构化CelebA、Helen、TCGA-ESCA 和TCGA-COAD数据集上的模型评估结果表明,相较于主流超分辨算法,TransSRNet整体性能表现更好. 在放大因子为8时,人脸数据集和医学峰值信噪比(PRNR)可以分别达到28.726、26.392 dB, 结构相似性(SSIM)可以分别达到0.844、0.881.

14. 流化床垃圾焚烧炉烟气停留时间计算及预测
林晓青,应雨轩,余泓,李晓东,严建华
浙江大学学报(工学版)    2022, 56 (8): 1578-1587.   DOI: 10.3785/j.issn.1008-973X.2022.08.012
摘要   HTML PDF(pc) (1591KB)(615)   

保证焚烧烟气在大于850 ℃区域内停留2 s以上是保证垃圾稳定燃烧和避免二次污染的重要途径,但目前只采用炉膛出口热电偶测温对其定性评估,难以定量计算和预测烟气在高温区域停留时间. 本研究基于热力学计算方法、运行参数关联性分析和多种机器学习算法(反向传播神经网络、循环神经网络、随机森林算法),对我国某典型生活垃圾循环流化床焚烧锅炉开展了烟气高温段(>850 ℃)停留时间计算、关键运行参数关联计算和停留时间预测模型构建等研究. 结果表明,炉膛温度、一二次风温度和压力等10个关键运行参数与高温烟气停留时间具有强关联性和预测性. 循环神经网络预测模型相对最优,其拟合度及准确性较反向神经网络、随机森林算法更高,均方根误差(MSE)为0.11626,预测值与真实值的平均绝对误差为1.174%. 本研究可以用于预测炉内高温区域烟气温度变化,为炉内焚烧工况优化和污染物减排超前调控提供支撑.

15. 基于超图卷积神经网络的多行为感知服务推荐方法
陆佳炜,李端倪,王策策,徐俊,肖刚
浙江大学学报(工学版)    2023, 57 (10): 1977-1986.   DOI: 10.3785/j.issn.1008-973X.2023.10.007
摘要   HTML PDF(pc) (1380KB)(615)   

针对现有服务推荐方法中高阶服务特征提取不够充分的问题,提出基于超图卷积神经网络的多行为感知服务推荐方法(MBSRHGNN). 该方法根据服务交互类型和服务组合信息构建多重超图,基于谱分解理论和多重超图的功能结构特性以设计双通道超图卷积网络. 利用切比雪夫多项式近似超图卷积核来降低计算复杂度;在超图卷积过程中,结合多行为推荐方法和自注意力机制度量多行为交互之间的重要性差异,提出HG-DiffPool超图池化方法来降低特征维度;通过融合服务嵌入向量和超图信号,学习不同服务的推荐概率分布;爬取真实服务数据,构造不同稀疏度的数据集进行实验. 实验结果表明,所提的MBSRHGNN服务推荐方法能够适应数据高度稀疏的推荐场景,并且在推荐精确度和相关性上的表现优于现有基线方法.

16. 基于语义增强特征融合的多模态图像检索模型
杨帆,宁博,李怀清,周新,李冠宇
浙江大学学报(工学版)    2023, 57 (2): 252-258.   DOI: 10.3785/j.issn.1008-973X.2023.02.005
摘要   HTML PDF(pc) (928KB)(610)   

为了在多模态图像检索任务中建立文本特征与图像特征的相关性,提出基于语义增强特征融合的多模态图像检索模型(SEFM). 该模型通过文本语义增强模块、图像语义增强模块2部分在特征融合时对组合特征进行语义增强. 在文本语义增强模块建立多模态双重注意力机制,利用双重注意力建立文本与图像之间的关联以增强文本语义;在图像语义增强模块引入保留强度和更新强度,控制组合特征中查询图像特征的保留和更新程度. 基于以上2个模块可以优化组合特征使其更接近目标图像特征. 在MIT-States和Fashion IQ这2个数据集上对该模型进行评估,实验结果表明在多模态图像检索任务上该模型与现有方法相比在召回率和准确率上都有所提升.

17. 环境规制下中国工业绿色转型的创新类型选择
刘海英,蔡先哲
浙江大学学报(工学版)    2024, 58 (1): 188-196.   DOI: 10.3785/j.issn.1008-973X.2024.01.020
摘要   HTML PDF(pc) (707KB)(584)   

为了解决严格环境规制背景下工业企业如何选择适宜的绿色技术创新类型来实现工业绿色转型的问题,采用包含非期望产出的超效率与基于松弛值测算(SBM)相结合的SBM模型,测算中国30个省份2008—2020年的工业环境效率,以该效率表征工业绿色转型水平. 通过面板门槛模型,探究不同环境规制强度下绿色技术创新类型对工业绿色转型的影响机理. 结果表明,整体上,2008—2020年中国工业环境效率处于波动上升态势,区域间的效率差距整体上呈微幅减小的趋势. 不同绿色技术创新的环境效应存在显著差异,其中强调工艺和产品的过程导向型绿色技术创新是实现工业绿色转型的关键. 随着环境规制强度的加大,过程导向型绿色技术创新的正向环境效应会加大,结果导向型绿色技术创新的负向环境效应会降低.

18. 带复杂计算的金融领域自然语言查询的SQL生成
何佳壕,刘喜平,舒晴,万常选,刘德喜,廖国琼
浙江大学学报(工学版)    2023, 57 (2): 277-286.   DOI: 10.3785/j.issn.1008-973X.2023.02.008
摘要   HTML PDF(pc) (739KB)(575)   

研究金融领域基于自然语言查询的结构化查询语言(SQL)生成问题(Text-to-SQL), 构建一个金融领域Text-to-SQL数据集,称为SOFT数据集. 该数据集覆盖了金融领域的常见查询,具有鲜明的特点,并对Text-to-SQL提出了挑战. 提出金融领域Text-to-SQL模型FinSQL,该模型优化了对金融领域复杂查询的支持. 通过分析一类复杂计算查询(行计算查询)的特点,提出一种基于分治的方法,即先将一个行计算查询分解为若干个子查询,分别针对每个子查询生成SQL语句,再将子查询的SQL语句组合在一起得到原始查询的SQL语句. 在SOFT数据集上进行验证,结果显示,本研究所提的方法在复杂查询上效果优于已有方法. 特别地,所提出的模型FinSQL能够较好地支持行计算查询.

19. 基于循环神经网络的双目视觉物体6D位姿估计
杨恒,李卓,康忠元,田兵,董青
浙江大学学报(工学版)    2023, 57 (11): 2179-2187.   DOI: 10.3785/j.issn.1008-973X.2023.11.005
摘要   HTML PDF(pc) (1068KB)(562)   

针对当前物体6D位姿估计任务准确率较低的问题,提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN. 将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容,利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入,输入各物体相关参数,由虚拟双目相机右摄像头捕获合成图片. 利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取. 经过循环神经网络对几何特征进行融合,并预测物体6D位姿. 以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比. 结果表明,在利用单一物体对网络进行训练时,Binocular-RNN 的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍. 利用基于物理的实时渲染(Real+PBR)方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法(DeepIM).

20. 文本生成图像研究综述
曹寅,秦俊平,马千里,孙昊,闫凯,王磊,任家琪
浙江大学学报(工学版)    2024, 58 (2): 219-238.   DOI: 10.3785/j.issn.1008-973X.2024.02.001
摘要   HTML PDF(pc) (2809KB)(544)   

对文本生成图像任务进行综合评估和整理,根据生成图像的理念,将文本生成图像任务分为3大类:基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像. 针对基于生成对抗网络架构的文本生成图像方法,按照改进的不同技术点归纳为6小类:采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型. 通过对不同方法的分析,总结并讨论了现有的文本生成图像方法通用评估指标和数据集.