全文下载排行

一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

当前位置: 一年内发表文章
Please wait a minute...
1. 基于改进强化学习的多智能体追逃对抗
薛雅丽,叶金泽,李寒雁
浙江大学学报(工学版)    2023, 57 (8): 1479-1486.   DOI: 10.3785/j.issn.1008-973X.2023.08.001
摘要   HTML PDF(pc) (1158KB)(590)   

针对多智能体追逃问题,提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法(MADDPG)和双延迟-确定策略梯度算法(TD3)相结合,提出多智能体双延迟-确定策略梯度算法(MATD3). 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题,提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数,将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励,提出DEPER-MATD3算法. 基于此算法设计仿真实验,并与其他算法对比,实验结果表明,该算法有效解决了过估计问题,且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高,追击者有更大的概率追击到逃逸者.

2. 基于小世界理论的区块链Kademlia网络改进方法
赵越,赵赫,谭海波,余斌,俞望年,马志宇
浙江大学学报(工学版)    2024, 58 (1): 1-9.   DOI: 10.3785/j.issn.1008-973X.2024.01.001
摘要   HTML PDF(pc) (1194KB)(416)   

针对当前区块链Kademlia网络研究中通常以牺牲安全性为代价提升可扩展性的问题,提出基于小世界理论的区块链Kademlia网络改进方法. 该方法遵循小世界理论的思想,提出置换扩容节点的概率公式,概率与节点间距离呈反比,节点置换次数和额外增加的节点数量可以根据实际情况灵活调整. 通过理论分析和实验验证,证明了采用该方法改造的网络能够达到最终的稳定状态. 实验结果显示,利用该方法将全网广播交易消息时须经历的传输层级减少了15.0%~30.8%,加快了定位节点的速率. 与其他改变网络结构的优化算法相比,该方法降低了网络的结构化程度,增强了网络的安全性.

3. 基于循环神经网络的双目视觉物体6D位姿估计
杨恒,李卓,康忠元,田兵,董青
浙江大学学报(工学版)    2023, 57 (11): 2179-2187.   DOI: 10.3785/j.issn.1008-973X.2023.11.005
摘要   HTML PDF(pc) (1068KB)(330)   

针对当前物体6D位姿估计任务准确率较低的问题,提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN. 将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容,利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入,输入各物体相关参数,由虚拟双目相机右摄像头捕获合成图片. 利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取. 经过循环神经网络对几何特征进行融合,并预测物体6D位姿. 以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比. 结果表明,在利用单一物体对网络进行训练时,Binocular-RNN 的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍. 利用基于物理的实时渲染(Real+PBR)方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法(DeepIM).

4. 基于物理信息神经网络的Burgers-Fisher方程求解方法
徐健,朱海龙,朱江乐,李春忠
浙江大学学报(工学版)    2023, 57 (11): 2160-2169.   DOI: 10.3785/j.issn.1008-973X.2023.11.003
摘要   HTML PDF(pc) (1371KB)(319)   

为了探索基于物理信息的神经网络(PINN)求解微分方程时,物理信息在训练神经网络中的作用,提出将物理信息分为规律信息和数值信息2类,以阐释PINN求解微分方程的逻辑,以及物理信息的数据驱动方式和神经网络可解释性.设计基于2类信息的神经网络综合损失函数,并从训练采样和训练强度2方面建立信息的训练平衡度,从而利用PINN求解Burgers-Fisher方程. 实验表明,PINN能够获得较好的方程求解精度和稳定性;在求解方程的神经网络训练中,Burgers-Fisher方程的数值信息比规律信息能更好地促进神经网络逼近方程解;随着训练采样和迭代次数的增加,以及2类信息的平衡,神经网络训练效果得到提高;增加神经网络规模可以提高方程求解精度,但也增加了网络训练迭代时间,在固定训练时间下并非神经网络规模越大效果越好.

5. 文本生成图像研究综述
曹寅,秦俊平,马千里,孙昊,闫凯,王磊,任家琪
浙江大学学报(工学版)    2024, 58 (2): 219-238.   DOI: 10.3785/j.issn.1008-973X.2024.02.001
摘要   HTML PDF(pc) (2809KB)(309)   

对文本生成图像任务进行综合评估和整理,根据生成图像的理念,将文本生成图像任务分为3大类:基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像. 针对基于生成对抗网络架构的文本生成图像方法,按照改进的不同技术点归纳为6小类:采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型. 通过对不同方法的分析,总结并讨论了现有的文本生成图像方法通用评估指标和数据集.

6. 混合采样下多级特征聚合的视频目标检测算法
秦思怡,盖绍彦,达飞鹏
浙江大学学报(工学版)    2024, 58 (1): 10-19.   DOI: 10.3785/j.issn.1008-973X.2024.01.002
摘要   HTML PDF(pc) (2492KB)(308)   

针对现有基于深度学习的视频目标检测算法无法同时满足精度和效率要求的问题,在单阶段检测器YOLOX-S的基础上,提出基于混合加权采样和多级特征聚合注意力的视频目标检测算法. 混合加权参考帧采样(MWRS)策略采用加权随机采样操作和局部连续采样操作,充分利用有效的全局信息与帧间局部信息. 多级特征聚合注意力模块(MFAA)基于自注意力机制,对YOLOX-S提取的分类特征进行细化,使得网络从不同层次的特征中学到更加丰富的特征信息. 实验结果表明,所提算法在ImageNet VID数据集上的检测精度均值AP50达到77.8%,平均检测速度为11.5 ms/帧,在检测图片上的目标分类和定位效果明显优于YOLOX-S,表明所提算法达到了较高的精度,具有较快的检测速度.

7. 基于深度学习的EEG数据分析技术综述
钟博,王鹏飞,王乙乔,王晓玲
浙江大学学报(工学版)    2024, 58 (5): 879-890.   DOI: 10.3785/j.issn.1008-973X.2024.05.001
摘要   HTML PDF(pc) (690KB)(298)   

对近年来的相关工作进行全面分析、横向比较,梳理出基于深度学习的EEG数据分析闭环流程. 对EEG数据进行介绍,从深度学习在EEG数据预处理、特征提取以及模型泛化3个关键阶段的应用进行展开,梳理深度学习算法在相应阶段提供的研究思路和解决方案,包括各阶段所存在的难点与问题. 全方位总结出不同算法的主要贡献和局限性,讨论深度学习技术在各个阶段处理EEG数据时所面临的挑战及未来的发展方向.

8. 基于个体预测的动态多目标优化算法
王万良,陈忠馗,吴菲,王铮,俞梦娇
浙江大学学报(工学版)    2023, 57 (11): 2133-2146.   DOI: 10.3785/j.issn.1008-973X.2023.11.001
摘要   HTML PDF(pc) (1723KB)(292)   

为了快速追踪随环境变化的动态多目标优化问题的Pareto前沿,提出基于个体预测的动态多目标优化算法(IPS). 利用参考点联系算法筛选出特殊点,该特殊点具有良好的收敛性和多样性,通过对特殊点集的预测快速响应环境变化. 提出针对种群中心点预测的反馈校正机制,在预测非支配解集的过程中,对预测步长进行反馈校正,从而使预测更加准确;为了避免算法陷入局部最优,提出混合多样性维持机制,引入由拉丁超立方抽样和精度可控的突变策略分别产生的随机个体,以提高种群的多样性. 将所提算法与其他4种动态多目标优化算法进行对比分析,实验结果表明,IPS能够平衡种群的多样性和收敛性,在FDA、DMOP、F5~F10系列问题上,实验结果优于其他4种算法.

9. 基于动态注意力网络的图像超分辨率重建
赵小强,王泽,宋昭漾,蒋红梅
浙江大学学报(工学版)    2023, 57 (8): 1487-1494.   DOI: 10.3785/j.issn.1008-973X.2023.08.002
摘要   HTML PDF(pc) (1196KB)(284)   

针对图像超分辨率算法在具有不同重要性的通道和空间域上采取相同的处理方式,导致计算资源无法集中利用到重要特征上的问题,提出基于动态注意力网络的图像超分辨率算法. 该算法改变了现有均等处理注意力机制的方式,通过构建的动态注意力模块对不同的注意力机制赋予动态学习的权重,以获取网络更需要的高频信息,重建高质量图片;通过特征重用的方式构建双蝶式结构,充分融合2个注意力分支的信息,弥补不同注意力机制间所缺失的特征信息. 在Set5、Set14、BSD100、Urban100和Manga109数据集上的模型评估结果表明,相较于其他主流超分辨率算法,本研究所提算法整体性能表现更好. 当放大因子为4时,相较于次优算法,所提算法在5个公开测试集上的峰值信噪比分别提升了0.06、0.07、0.04、0.15、0.15 dB.

10. 结合静态事实和重复历史事实的动态知识图谱推理方法
林栋,李永强,仇翔,冯远静,谢碧峰
浙江大学学报(工学版)    2023, 57 (10): 1915-1922.   DOI: 10.3785/j.issn.1008-973X.2023.10.001
摘要   HTML PDF(pc) (856KB)(273)   

针对现有的动态知识图谱推理方法容易忽略动态知识图谱中存在着大量静态信息和重复历史事实的问题,提出结合静态事实和重复历史事实的动态知识图谱网络方法. 该方法利用动态知识图谱中实体间隐藏的静态联系来构成静态事实,并协助动态知识图谱推理;利用历史事实构建历史词表,在预测未来时对历史词表进行查询;对历史中未发生的事实进行惩罚,提高重复历史事实的预测概率. 在2个公开的数据集上进行动态知识图谱推理实验,对比实验时选用目前主流的5个模型作为基线. 在实体预测实验中,平均倒数排名(MRR)达到0.489 1和0.530 3,Hits@10达到0.588 7和0.616 5,证明了所提方法的有效性.

11. 大点数FFT在“申威26010”上的并行优化
郭俊,刘鹏,杨昕遥,张鲁飞,吴东
浙江大学学报(工学版)    2024, 58 (1): 78-86.   DOI: 10.3785/j.issn.1008-973X.2024.01.009
摘要   HTML PDF(pc) (1231KB)(271)   

根据“神威·太湖之光”超级计算机所用国产“申威26010”处理器的架构特点和编程规范,提出针对大点数FFT的众核并行优化方案. 该方案源自经典的Cooley-Tukey FFT算法,通过将一维大点数数据迭代分解为二维小规模矩阵进行并行加速. 为了解决矩阵“列FFT”的读写、转置和计算问题,提出“列均分-行连续”的读写策略,通过对数据进行合理的分配、重排、交换,结合SIMD向量化、旋转因子优化、双缓冲、寄存器通信、跨步传输等优化手段,充分利用了众核处理器的计算资源和传输带宽. 实验结果显示,单核组64从核并行程序较主核运行FFTW库,可以达到最高65x、平均48x以上的加速比.

12. 分体式飞行汽车全自主对接导引系统设计与验证
王琛,林威,胡良鹏,张骏铭
浙江大学学报(工学版)    2023, 57 (12): 2345-2355.   DOI: 10.3785/j.issn.1008-973X.2023.12.001
摘要   HTML PDF(pc) (3722KB)(254)   

研究针对分体式飞行汽车全自主对接导引系统的流程架构、软硬件系统、核心算法以及验证. 根据导引方式的过渡,采用远程、中程、近程多段融合导引. 针对YOLOv4-tiny实际使用中的误检、漏检情况,使用点密度聚类和核相关滤波算法提供光顺的融合信息. 提出修正因子方法以实现近程导引阶段AprilTag测量数据的融合修正,通过姿态补偿算法解决相机与无人机固连的相机姿态问题. 引入暗光图像增强算法,将引入算法与视觉导引算法结合,以满足低照度环境下的对接导引需求. 搭建仿真平台和工程应用平台,逐步对发展的流程、系统架构以及算法进行验证. 试验结果表明,工程应用飞行平台可以导引安全、平稳且精准的降落任务,在圆锥形对接机构中的容许误差为6 cm、角度误差为5°. 该结果证明提出的全自主对接导引技术精度良好且具有可靠性.

13. 基于自动驾驶车辆调度的停车系统收费策略优化
冯驰,梅振宇
浙江大学学报(工学版)    2024, 58 (1): 87-95.   DOI: 10.3785/j.issn.1008-973X.2024.01.010
摘要   HTML PDF(pc) (1491KB)(243)   

针对有人驾驶车辆与自动驾驶车辆共存的停车系统,设计基于自动驾驶车辆调度的停车系统收费策略,以提升停车系统运行效率. 该策略在停车场无可用停车泊位但存在自动驾驶车辆时向有人驾驶车辆提供自动驾驶车辆调度服务,停车系统向有人驾驶车辆收取一定调度费用后,通过在多个停车场间调度若干自动驾驶车辆,为有人驾驶车辆在其目标停车场创造可用停车泊位. 各停车场的调度费用会影响有人驾驶车辆用户的停车选择,进而影响停车系统的运行效率,构建基于智能体的停车仿真模型,采用遗传算法差异化地设置系统内各个停车场的停车调度收费方案. 仿真结果显示,采用基于自动驾驶车辆调度的差异化收费策略,可以有效地减少有人驾驶车辆用户的行驶时间、步行时间、总出行时间及行驶里程,增加停车系统营收,降低社会成本,有效地缓解停车矛盾.

14. 基于模态注意力图卷积特征融合的EEG和fNIRS情感识别
赵卿,张雪英,陈桂军,张静
浙江大学学报(工学版)    2023, 57 (10): 1987-1997.   DOI: 10.3785/j.issn.1008-973X.2023.10.008
摘要   HTML PDF(pc) (1285KB)(243)   

为了提升情感识别的准确率,从情绪视频引起的脑电(EEG)和功能近红外(fNIRS)数据中提取每个通道的信号之间的联系,并提出基于模态注意力多路图卷积神经网络(MA-MP-GF)的特征融合情感识别方法. 将EEG和fNIRS数据构建为图结构数据,通过多路图卷积分别对每种模态的信号进行特征提取;利用模态注意力图卷积层融合不同模态通道间的连接信息. 模态注意力机制可以赋予不同模态节点不同权重,使得图卷积层能够更加充分提取不同模态节点间连接关系. 对采集的30个被试的4类情感数据进行实验测试,与仅EEG和仅fNIRS单模态识别结果相比,所提出的图卷积融合方法能够获得更高的识别准确率,分别提升了8.06%、22.90%;与当前常用的EEG-fNIRS融合方法相比,所提出的图卷积融合方法的平均识别准确率提升了2.76%~7.36%;图卷积融合方法在加入模态注意力后识别率最高提升了1.68%.

15. 基于特征复用机制的航拍图像小目标检测算法
邓天民,程鑫鑫,刘金凤,张曦月
浙江大学学报(工学版)    2024, 58 (3): 437-448.   DOI: 10.3785/j.issn.1008-973X.2024.03.001
摘要   HTML PDF(pc) (4531KB)(242)   

针对无人机(UAV)航拍图像检测存在的小目标检测精度低和模型参数量大的问题,提出轻量高效的航拍图像检测算法FS-YOLO. 该算法以YOLOv8s为基准网络,通过降低通道维数和改进网络架构提出轻量的特征提取网络,实现对冗余特征信息的高效复用,在较少的参数量下产生更多特征图,提高模型对特征信息的提取和表达能力,同时显著减小模型大小. 在特征融合阶段引入内容感知特征重组模块,加强对小目标显著语义信息的关注,提升网络对航拍图像的检测性能. 使用无人机航拍数据集VisDrone进行实验验证,结果表明,所提算法以仅5.48 M的参数量实现了mAP0.5=47.0%的检测精度,比基准算法YOLOv8s的参数量降低了50.7%,精度提升了6.1%. 在DIOR数据集上的实验表明,FS-YOLO的泛化能力较强,较其他先进算法更具竞争力.

16. 面向垃圾分类场景的轻量化目标检测方案
陈健松,蔡艺军
浙江大学学报(工学版)    2024, 58 (1): 71-77.   DOI: 10.3785/j.issn.1008-973X.2024.01.008
摘要   HTML PDF(pc) (1542KB)(223)   

针对边缘端进行垃圾检测分类实时性差的问题,提出轻量化的Yolov5垃圾检测解决方案. 引入Stem模块,增强模型对输入图像的特征提取能力. 将backbone的C3模块进行改进,提高特征提取能力. 使用深度可分离卷积替换网络中的3×3降采样卷积,实现模型轻量化. 使用K-means++算法重新计算物体的锚框值,使模型在训练过程中能够更好地预测目标框的大小. 通过实验研究对比可知,改进模型相比于Yolov5s模型,mAP_0.5提升了0.8%,mAP_0.5:0.95提升了3%,模型参数量减少到原来的77.9%,推理速度提升了21.9%,极大地提高了模型的检测性能.

17. 轻量化YOLOv5s网络车底危险物识别算法
金鑫,庄建军,徐子恒
浙江大学学报(工学版)    2023, 57 (8): 1516-1526.   DOI: 10.3785/j.issn.1008-973X.2023.08.005
摘要   HTML PDF(pc) (3082KB)(220)   

针对现有车底危险物检测模型结构复杂、参数量大、不易部署于端侧的问题,提出轻量化SG-YOLOv5s网络模型. 对YOLOv5s网络的骨干和颈部进行优化改进,显著降低网络的参数量,大幅缩小模型的权重体积;在训练阶段采用Mixup数据增强,提高模型的泛化能力;采用SIoU替换边框回归损失函数CIoU,使危险物预测框更接近真实框,提高检测精度. 鉴于车底危险物数据集较少的现状,利用智能小车拍摄大量车底碎片化图像,采用AutoStitch算法进行图像拼接,最终获得自建车底图像数据集. 实验结果表明:在自建的9种模拟车底危险物数据集上,SG-YOLOv5s模型识别精确率为97.63%,相较于原YOLOv5s模型提升了1.26%,而参数量减少了71.27%,模型权重体积下降了71.28%,为后续识别模型的嵌入式部署提供了可能.

18. 基于相变材料的蒸汽卡诺电池热力学循环设计
林小杰,徐家豪,孙鹏,钟崴,胡亚才
浙江大学学报(工学版)    2024, 58 (1): 161-168.   DOI: 10.3785/j.issn.1008-973X.2024.01.017
摘要   HTML PDF(pc) (1691KB)(218)   

为了研究工业园区综合能源系统的多能互补新路线,提出基于高低温相变材料的新型蒸汽卡诺电池. 建立计及设备性能与质量流量的热力学循环计算模型,分析设计参数、多级压缩结构对系统热泵系数、循环效率、储电损失与供热?效率的影响. 通过探究发现,低温相变材料的相变温度和高温相变材料的相变温度是影响蒸汽卡诺电池性能的主要因素,得到蒸汽卡诺电池的高循环性能区. 优化蒸汽卡诺电池的参数与结构,结果表明,循环效率可达56.96%,热泵系数可达2.55,供热?效率可达68.74%.

19. 基于EtherCAT总线的六维力传感器在线解耦技术
查浩,费少华,傅云,吕震,朱伟东
浙江大学学报(工学版)    2023, 57 (10): 2042-2050.   DOI: 10.3785/j.issn.1008-973X.2023.10.013
摘要   HTML PDF(pc) (1510KB)(216)   

为了克服传统六维力传感器数据采集模块体积大、精度低、缺乏数据处理功能的弊端,设计了一种体积小、精度高、实时性高、采集速度快、采集处理一体化的基于EtherCAT总线的六维力传感器数据采集模块. 为了减小六维力传感器的维间耦合,开发了遗传算法优化的神经网络来对实验数据进行离线训练. 利用多重随机操作来提高算法的泛化性能,并将训练好的参数移植到微控制器中进行在线解耦. 通过单维和六维力传感器加载实验,表明模块可在1 ms之内完成数据的采集及处理;解耦后相对误差在0.85%以下,相对于最小二乘法解耦矩阵计算得到的精度提高了37.1%.

20. 基于轻量级Transformer的城市路网提取方法
冯志成,杨杰,陈智超
浙江大学学报(工学版)    2024, 58 (1): 40-49.   DOI: 10.3785/j.issn.1008-973X.2024.01.005
摘要   HTML PDF(pc) (4885KB)(214)   

针对现有方法存在道路区域提取不精准和实时性不足的限制,提出基于轻量级Transformer的路网提取方法RoadViT. 利用卷积神经网络与Transformer混合的MobileViT架构进行编码特征,有效地提取高级上下文信息. 提出金字塔解码器实现多尺度特征的提取和融合,生成像素类别的概率分布. 结合Mosaic与多尺度缩放和随机裁剪策略实现数据增强,构建精细多样的遥感图像. 针对城市遥感图像中道路类别和背景类别的不平衡问题,提出动态加权损失函数. 实验结果表明,RoadViT的参数量仅为1.25 × 106,在Jetson TX2上的推理速度可达10帧/s,在CHN6-CUG数据集上的精度可达57.0%. 所提方法是轻量级Transformer在城市遥感图像中的有效探索,在保证推理实时性的同时,实现道路提取精度的提升.