浙江大学学报(工学版)

Select

1. 基于深度学习的EEG数据分析技术综述

钟博,王鹏飞,王乙乔,王晓玲

浙江大学学报(工学版) 2024, 58 (5): 879-890. DOI: 10.3785/j.issn.1008-973X.2024.05.001

摘要

HTML

PDF（pc）（690KB）（13474）

对近年来的相关工作进行全面分析、横向比较，梳理出基于深度学习的EEG数据分析闭环流程. 对EEG数据进行介绍，从深度学习在EEG数据预处理、特征提取以及模型泛化3个关键阶段的应用进行展开，梳理深度学习算法在相应阶段提供的研究思路和解决方案，包括各阶段所存在的难点与问题. 全方位总结出不同算法的主要贡献和局限性，讨论深度学习技术在各个阶段处理EEG数据时所面临的挑战及未来的发展方向.

Select

2. 基于改进YOLOv5的枸杞虫害检测

杜丁健,高遵海,陈倬

浙江大学学报(工学版) 2024, 58 (10): 1992-2000. DOI: 10.3785/j.issn.1008-973X.2024.10.002

摘要

HTML

PDF（pc）（3603KB）（617）

为了检测复杂环境下枸杞的虫害情况，提出基于改进YOLOv5m的模型. 以下一代视觉转换器（Next-ViT）作为骨干网络，提高模型的特征提取能力，使模型更加关注关键目标特征. 在模型颈部增加自适应融合的上下文增强模块，增强模型对上下文信息的理解与处理能力，提高模型对小目标（蚜虫）的检测精度. 将颈部网络中的C3模块替换为C3_Faster模块，减少模型占用量并进一步提高模型检测精度. 实验结果表明，所提模型的准确率和召回率分别为97.0%、92.1%，平均精度均值为94.7%；相比于YOLOv5m，所提模型的平均精度均值提高了1.9个百分点，蚜虫的检测平均精度提高了9.4个百分点. 对比不同模型的平均精度均值，所提模型比主流模型YOLOv7、YOLOX、DETR、EfficientDet-D1、Cascade R-CNN分别高1.6、1.6、2.8、3.5、1.0个百分点. 所提模型在提高检测性能的同时，模型占用量也保持在合理范围内.

Select

3. 基于改进深度强化学习算法的农业机器人路径规划

赵威,张万枝,侯加林,侯瑞,李玉华,赵乐俊,程进

浙江大学学报(工学版) 2025, 59 (7): 1492-1503. DOI: 10.3785/j.issn.1008-973X.2025.07.017

摘要

HTML

PDF（pc）（2200KB）（207）

农业机器人采用深度强化学习算法进行路径规划时存在难以找到目标点、稀疏奖励、收敛缓慢等问题，为此提出基于多目标点导航融合改进深度Q网络算法（MPN-DQN）的路径规划方法. 利用激光同步定位与建图（SLAM）扫描全局环境以构建先验地图，划分行走行和作物行区域；对地图边界进行膨胀拟合处理，形成前向弓字形作业走廊. 利用中间目标点分割全局环境，将复杂环境划分为多阶段短程导航环境以简化目标点搜索过程. 从动作空间、探索策略和奖励函数3个方面改进深度Q网络算法以改善奖励稀疏问题，加快算法收敛速度，提高导航成功率. 实验结果表明，搭载MPN-DQN的农业机器人自主行驶的总碰撞次数为1，平均导航时间为104.27 s，平均导航路程为16.58 m，平均导航成功率为95%.

Select

4. 基于改进遗传算法的倾转旋翼无人机区域覆盖路径规划

吴越安,杜昌平,杨睿,俞佳浩,方天睿,郑耀

浙江大学学报(工学版) 2024, 58 (10): 2031-2039. DOI: 10.3785/j.issn.1008-973X.2024.10.006

摘要

HTML

PDF（pc）（2211KB）（798）

基于改进遗传算法研究倾转旋翼无人机（TRUAV）在多障碍物约束下的区域覆盖路径规划问题. 运用最小跨度算法和往返路径生成算法进行任务区域内的覆盖路径初规划，将区域覆盖问题转化为旅行商问题以优化覆盖路径顺序. 为了避开区域内的障碍物，提出鱼尾形避障策略. 引入最近邻算法，生成比传统遗传算法质量更高的初始种群，设计三点式交叉算子和动态区间变异算子进行遗传操作以提高所提算法的全局搜索能力，避免算法陷入局部最优. 在含多个障碍物的多边形区域算例内仿真验证所提算法的性能. 结果表明，相比于逐行路径覆盖算法和传统遗传算法，所提算法的覆盖路径长度减少了7.80%，TRUAV的任务区域覆盖效率显著提升.

Select

5. 仿生六足折纸机器人结构设计与运动分析

曹东兴,贾艳超,郭翔鹰,毛佳佳

浙江大学学报(工学版) 2024, 58 (8): 1543-1555. DOI: 10.3785/j.issn.1008-973X.2024.08.002

摘要

HTML

PDF（pc）（3603KB）（348）

针对现有折纸机器人组成结构单一，运动不够灵活的问题，将折纸结构与多足机器人设计相结合，耦合三浦折纸和六折痕折纸，提出新型的仿螃蟹六足折纸机器人设计方案，扩展了折纸机器人的运动构型，提升了折纸机器人的运动灵活性. 在面对称假设下，该机器人单足具有2个自由度，此时将机器人腿部顶点等效为关节，轴线折痕等效为连杆，建立机器人腿部的平面连杆等效模型，并以折面夹角为运动变量，通过仿真计算得出机器人足端的理论运动范围. 利用楔形面板技术对折面增厚并避免相邻折面发生物理干涉，建模得到折纸仿螃蟹六足机器人的三维模型. 基于平面连杆的等效模型，分析折面夹角与足端运动之间的联系，设计确定机器人的足端运动轨迹与运动步态. 利用3D打印技术设计并制作折纸仿生六足机器人试验样机，基于STM32单片机控制实现了机器人三横向角步态运动. 结果表明，该折纸仿生机器人可以实现平面构型到仿螃蟹构型的转换，在6条腿的协同运动下，机器人可以平稳地左右横向移动.

Select

6. 基于改进YOLOv7的复杂环境下苹果目标检测

莫恒辉,魏霖静

浙江大学学报(工学版) 2024, 58 (12): 2447-2458. DOI: 10.3785/j.issn.1008-973X.2024.12.004

摘要

HTML

PDF（pc）（1927KB）（407）

采摘机器人在不稳定光照、果实多样性和树叶遮挡等复杂自然环境下识别苹果时，检测模型难以捕获关键特征，导致采摘效率和准确性较低. 提出基于YOLOv7模型的针对复杂场景下苹果目标检测的改进算法. 通过限制对比度自适应直方图均衡化算法增强苹果图像对比度，以减少背景干扰，增强目标轮廓清晰度；提出多尺度混合自适应注意力机制，通过特征解构与重构，协同整合空间和通道维度的注意力导向，优化多层次特征的长短距离建模，增强模型对苹果特征的提取能力与抗背景干扰能力；引入全维度动态卷积，通过精细化的注意力机制优化特征选择过程；增加检测头个数，解决小目标检测问题；采用Meta-ACON激活函数，优化特征提取过程中的关注度分配. 结果表明，改进后的YOLOv7模型对苹果的平均检测准确率和召回率分别为85.7%、87.0%，相比于Faster R-CNN、SSD、YOLOv5、YOLOv7，平均检测精度分别提高了15.2、7.5、4.5、2.5个百分比，平均召回率分别提高了13.7、6.5、3.6、1.3个百分比. 模型效果表现优异，为苹果生长监测及机械摘果研究提供了坚实的技术支撑.

Select

7. 基于电力系统机电振荡的发电侧惯量评估

任智强,田铭兴,姜宇,邢东峰

浙江大学学报(工学版) 2025, 59 (4): 870-878. DOI: 10.3785/j.issn.1008-973X.2025.04.023

摘要

HTML

PDF（pc）（1102KB）（248）

新能源发电设备接入发电侧会导致发电侧呈现“弱惯量”特征，影响系统的安全稳定运行. 利用同步相量测量单元(PMU)测量机电振荡响应，提出基于小扰动下机电振荡参数的发电侧惯量评估方法. 根据惯量响应过程的特点，推导与各发电机惯量有关的不平衡功率分配公式. 根据多机系统小信号状态方程与特征根的关系，推导多机系统发电侧惯量计算公式. 介绍单机系统发电侧惯量的计算方法，阐述惯量计算公式中的惯量比与固有振荡频率的测量方法. 通过单机系统、双机互联系统、WSCC3机9节点系统、10机39节点系统仿真算例验证所提方法的正确性. 结果表明，所提方法在多个系统中的发电侧惯量评估值与实际值接近，具有良好的适应性，可用于电力系统的发电侧惯量评估.

Select

8. 基于多智体的自动驾驶汽车停车空载收费策略

黎文皓,季彦婕,吴浩,贾叶雯,张水潮

浙江大学学报(工学版) 2024, 58 (8): 1659-1670. DOI: 10.3785/j.issn.1008-973X.2024.08.013

摘要

HTML

PDF（pc）（2970KB）（218）

为了制订自动驾驶车辆(AV)停车需求管理方案，搭建多智能体停车模拟框架，提出2种空载行驶收费策略：基于行驶距离的静态收费和基于道路拥堵水平的动态收费，研究费率计算方法. 建立空载行驶收费策略下停车场停车、居住地停车及持续空载巡航3种停车模式的成本函数，使用logit模型描述不同停车模式下的选择行为. 利用Simulation of urban mobility (SUMO)，以南宁市主城区为例开展大规模路网下的仿真实验，研究2种策略下的AV停车行为及路网运行状态变化. 仿真结果表明，静态收费策略和动态收费策略下的AV空载行驶里程分别减少了20.16%和10.85%，车辆总延误分别降低了39.80%和43.52%；动态收费策略能够灵活地根据路况变化进行实时调整，路网运行效率提升更显著.

Select

9. 基于秃鹰搜索算法优化的三维多无人机低空突防

温夏露,黄鹤,王会峰,杨澜,高涛

浙江大学学报(工学版) 2024, 58 (10): 2020-2030. DOI: 10.3785/j.issn.1008-973X.2024.10.005

摘要

HTML

PDF（pc）（2152KB）（436）

三维空间环境复杂，多无人机的低空突防航迹规划计算量大，现有多目标秃鹰搜索算法存在求解易趋于中心点及精度低的缺陷，为此提出基于改进多目标秃鹰搜索算法(IMBES)的三维多无人机低空突防方法. 构建三维环境模型、威胁源模型、无人机物理约束模型、多无人机协同约束模型以及路径平滑度约束模型，确定多目标代价函数. 设计耦合混沌映射初始化，有效提高初始化种群质量；设计基于“侦察鹰”的自适应高斯游走策略，平衡开发与搜索能力；引入快速非支配排序，进一步提高算法效率. 利用秃鹰位置与无人机速度、转弯角度、爬升角度的对应关系，采用IMBES高效搜索无人机构型空间，找到最优的帕累托前沿. 实验结果表明，IMBES的成功率为70.5%. 与现有路径规划方法相比，所提方法的优化能力强、能耗低，适用于多无人机协同低空突防.

Select

10. 丘陵山地果园植保无人机三维路径规划

于少猛,闫铭,王鹏飞,朱建锡,杨欣

浙江大学学报(工学版) 2025, 59 (3): 635-642. DOI: 10.3785/j.issn.1008-973X.2025.03.021

摘要

HTML

PDF（pc）（2985KB）（216）

丘陵地区果园植保无人机作业时人工操控难度大，自动作业缺少三维路径规划，为此提出山地果园植保无人机全覆盖三维作业路径规划方法. 利用实景三维模型获取作业区域三维坐标，基于往复牛耕法和丘陵果园实景三维模型，进行植保无人机全覆盖三维路径规划. 考虑植保无人机运动状况及自身载重变化，构建植保无人机能量消耗模型，进而对作业航向角（1°~180°）进行寻优，获得最小能耗的作业路径. 田间试验表明，最小能耗的作业路径（航向角为91°）相比于最大能耗的作业路径（航向角为147°）降低了完成植保作业所需总能耗（能耗降低率为20.88%），缩短了完成植保作业所需时间（时间降低率为16.31%），且作业区域内各采样点的冠层雾滴沉积量波动较小，在优化能耗、提高作业效率的同时实现了对作业区域的全覆盖植保作业.

Select

11. 含多种灵活性资源的综合能源系统低碳优化调度

邢海军,叶宇静,刘哲远,江伟建,张文博,田书欣

浙江大学学报(工学版) 2024, 58 (6): 1243-1254. DOI: 10.3785/j.issn.1008-973X.2024.06.014

摘要

HTML

PDF（pc）（1651KB）（367）

针对含多园区的综合能源系统(IES)所面临的灵活性和低碳性不足的问题，提出考虑多种灵活性资源的综合能源分布式低碳经济调度模型. 分析系统的灵活性需求，提出IES灵活性裕度约束，并构建包含碳捕集电厂在内的多种灵活性资源模型，充分利用碳捕集电厂的灵活运行模式. 引入阶梯式碳交易，建立综合能源系统双层调度模型. 模型上层以能源供应商供能成本最小为目标，下层以由能量枢纽(EH)组成的能源运营商运行成本最小为目标. 针对多主体运营特性，利用目标级联分析法进行求解，实现能源供应商和能源服务商上下层协同调度. 通过由IEEE30节点电网、比利时20节点气网和多个能量枢纽组成的算例，验证所提模型对提升系统灵活性和低碳性的积极作用.

Select

12. 无信号交叉口处基于深度强化学习的智能网联车辆运动规划

张名芳,马健,赵娜乐,王力,刘颖

浙江大学学报(工学版) 2024, 58 (9): 1923-1934. DOI: 10.3785/j.issn.1008-973X.2024.09.017

摘要

HTML

PDF（pc）（2586KB）（220）

为了兼顾无信号交叉口处智能网联车辆通行效率和舒适性要求，提出基于深度强化学习的车辆运动规划算法. 结合时间卷积网络(TCN)和Transformer算法构建周围车辆行驶意图预测模型，通过多层卷积和自注意力机制提高车辆运动特征捕捉能力；利用双延迟深度确定性策略梯度 (TD3)强化学习算法构建车辆运动规划模型，综合考虑周围车辆行驶意图、驾驶风格、交互风险以及自车舒适性等因素设计状态空间和奖励函数以增强对动态环境的理解；通过延迟策略更新和平滑目标策略提高算法稳定性，实时输出期望加速度. 实验结果表明，所提运动规划算法能够根据周围车辆的行驶意图实时感知潜在的交互风险，生成的运动规划策略满足通行效率、安全性和舒适性要求，且对不同风格的周围车辆和密集交互场景均有良好的适应能力，不同场景下成功率均高于92.1%.

Select

13. 基座模型技术背景下的具身智能体综述

李颂元,朱祥维,李玺

浙江大学学报(工学版) 2025, 59 (2): 213-226. DOI: 10.3785/j.issn.1008-973X.2025.02.001

摘要

HTML

PDF（pc）（841KB）（778）

近年来，虽然自然语言处理、计算机视觉、多模态学习等领域的基座模型取得了突破性的进展，展现出了通用人工智能的潜力，但它们在因果推理和物理常识理解方面的表现远不及人类或动物. 这是因为这些模型主要依赖于大量的数据和计算能力，缺乏与现实世界的直接互动和经验积累. 许多研究者开始质疑，单纯通过增加模型规模是否足以克服这些根本性的问题. 这促使学界重新审视智能的本质，认为智能不仅是计算能力的提升，更是源于与环境的互动. 具身智能正逐渐受到人工智能领域的关注，因为它强调智能体通过与物理世界的直接互动，学习和适应环境，展现出更接近生物智能的特性. 结合基座模型的技术背景，对具身人工智能进行全面的调研. 讨论当前具身智能体背后的技术思想、测试基准及应用. 对未来具身人工智能的趋势和挑战进行前瞻性的分析.

Select

14. 基于MA-ConvNext网络和分步关系知识蒸馏的苹果叶片病害识别

刘欢,李云红,张蕾涛,郭越,苏雪平,朱耀麟,侯乐乐

浙江大学学报(工学版) 2024, 58 (9): 1757-1767. DOI: 10.3785/j.issn.1008-973X.2024.09.001

摘要

HTML

PDF（pc）（5637KB）（813）

针对复杂环境下苹果叶片病害图像背景杂乱、病斑大小不一，以及现有模型参数多、计算量大的问题，提出基于注意力和多尺度特征融合的苹果叶片病害识别网络(MA-ConvNext). 通过引入多尺度空间通道重组块(MSCB)和融合三分支注意力机制的特征提取模块(TAFB)，有效提取苹果叶片病害图像不同尺度的特征，增强模型对叶片病斑的关注. 采用分步关系知识蒸馏方法，将“教师”网络(MA-ConvNext)和“中间”网络(DenseNet121)融合，指导“学生”网络(EfficientNet-B0)训练，实现模型轻量化. 实验结果表明，MA-ConvNext网络识别准确率为99.38%，较ResNet50、MobileNet-V3和EfficientNet-V2网络分别提高了3.98个百分点、7.55个百分点和4.27个百分点. 经过分步关系知识蒸馏后，识别准确率较蒸馏前提高了1.76个百分点，并且具有更小的网络规模和参数量，分别为1.56×10⁷、5.29×10⁶. 所提方法能为后续精准农业的病虫害检测提供新思路和技术支持.

Select

15. 融合注意力的滤波器组双视图图卷积运动想象脑电分类

吴书晗,王丹,陈远方,贾子钰,张越棋,许萌

浙江大学学报(工学版) 2024, 58 (7): 1326-1335. DOI: 10.3785/j.issn.1008-973X.2024.07.002

摘要

HTML

PDF（pc）（2102KB）（340）

在运动想象任务中，传统卷积神经网络难以准确表达大脑多区域协同神经活动；图卷积网络（GCN）能够在图数据中考虑节点（脑区）间的连接和关系，适于表示不同脑区的协同任务，为此提出融合注意力的滤波器组双视图GCN（AFB-DVGCN）. 由滤波器组构建双分支网络，提取不同频段的时域和空域信息；采用双视图图卷积空间特征提取方法实现信息互补；利用有效通道注意力机制增强特征和捕捉不同特征图的交互信息，以提高分类准确率. 在公开数据集BCI Competition IV-2a和OpenBMI上的验证结果表明，AFB-DVGCN的分类性能良好，其分类准确率显著高于对比网络的分类准确率.

Select

16. 基于多尺度特征融合的轻量化道路提取模型

刘毅,陈一丹,高琳,洪姣

浙江大学学报(工学版) 2024, 58 (5): 951-959. DOI: 10.3785/j.issn.1008-973X.2024.05.008

摘要

HTML

PDF（pc）（1551KB）（762）

针对当前用于遥感图像道路提取领域的语义模型存在计算复杂度较高、道路提取效果不佳的问题，提出基于多尺度特征融合的轻量化道路提取模型（MFL-DeepLab V3+). 为了减少模型参数量并降低模型的计算复杂度，骨干网络选用轻量化Mobilenet V2网络代替原模型的Xception网络，在空洞空间金字塔池化（ASPP）模块中引入深度可分离卷积. 为了增强模型的道路提取能力，优化对细小路段的提取效果，在解码区提出联合注意力的多尺度特征融合（MFFA）. 基于Massachusetts roads数据集的各项实验表明，MFL-DeepLab V3+模型的参数规模显著降低，较原模型参数量压缩了88.67%，道路提取图像完整，边缘清晰，精确率、召回率和F1分数分别达到88.45%、86.41%和87.42%，与其他模型相比取得了更好的提取效果.

Select

17. 基于滑模自抗扰的储能变流器控制策略

皇金锋,周杰,黄红杰

浙江大学学报(工学版) 2024, 58 (10): 2171-2181. DOI: 10.3785/j.issn.1008-973X.2024.10.021

摘要

HTML

PDF（pc）（1993KB）（164）

为了提高储能变流器(PCS)的动态性能，设计基于降阶级联扩张状态观测器(ESO)和互补滑模控制(CSMC)的改进自抗扰控制(ADRC)策略，将改进ADRC策略应用于PCS的双向DC/AC变流器电压外环. 改进ESO为降阶级联ESO以提高状态变量和系统总扰动的估计速度，增加扰动估计能力；更改PD控制为CSMC以设计状态误差反馈律，提升PCS的系统鲁棒性；设计改进指数趋近律以抑制抖振现象. 为了证明改进ADRC策略相较于PI控制和传统ADRC的优越性，建立仿真模型并搭建相关实验平台. 仿真与实验结果表明，改进ADRC策略减小了PCS暂态时直流母线电压波动，提高了PCS交流侧功率响应速度，改善了交流侧的输出电能质量.

Select

18. 基于CNN和Transformer聚合的遥感图像超分辨率重建

胡明志,孙俊,杨彪,常开荣,杨俊龙

浙江大学学报(工学版) 2025, 59 (5): 938-946. DOI: 10.3785/j.issn.1008-973X.2025.05.007

摘要

HTML

PDF（pc）（12404KB）（311）

针对现有的遥感图像超分辨模型很少考虑噪声、模糊、JPEG压缩等因素对图像重建所带来的影响，以及Transformer模块构建高频信息能力受限的问题，提出多层退化模块. 设计基于CNN和Transformer聚合的网络，使用CNN识别图像的高频信息，Transformer提取全局信息. 利用基于注意力机制的聚合模块将2个模块聚合，在保持全局结构连贯性的同时，显著增强局部高频细节的重建精度. 利用所提模型，在AID数据集上随机选取6个场景进行实验，与MM-realSR模型在PSNR和SSIM指标上进行比较.结果表明，所提模型在PSNR指标上相比于MM-realSR模型平均提高1.61 dB，SSIM指标平均提升0.023.

Select

19. 基于改进YOLOv5的SAR图像有向舰船目标检测算法

薛雅丽,贺怡铭,崔闪,欧阳权

浙江大学学报(工学版) 2025, 59 (2): 261-268. DOI: 10.3785/j.issn.1008-973X.2025.02.004

摘要

HTML

PDF（pc）（2761KB）（632）

针对合成孔径雷达 (SAR) 小目标成像特征不显著、目标具有任意朝向易出现漏检、检测精度较低的问题，提出面向SAR舰船小目标的ES-YOLOv5检测算法. 添加小目标检测层调整感受野大小，更适应小目标尺度特征，方便进行多尺度融合. 引入EMA注意力机制重点关注目标关键信息，强化特征的表达能力. 使用圆平滑标签(CSL)技术适应角度的周期性，实现了对角度的高精度分类. 实验结果表明，在RSDD-SAR数据集上，该方法在交并比阈值为0.5时的平均检测精度达到90.9%，在提高SAR舰船小目标检测精度方面比基准算法YOLOv5提高了6%，显著改善了模型的检测性能.

Select

20. 多模态信息增强的短视频推荐模型

霍育福,金蓓弘,廖肇翊

浙江大学学报(工学版) 2024, 58 (6): 1142-1152. DOI: 10.3785/j.issn.1008-973X.2024.06.005

摘要

HTML

PDF（pc）（906KB）（632）

提出用于短视频点击率预估任务的多模态增强模型（MMa4CTR）. 模型综合利用用户与短视频交互中的多模态数据，以构建用户的嵌入表示，并学习用户的多模态兴趣. 通过组合和交叉不同模态特征，探索各模态间的共同语义. 通过引入自动学习率调整和验证中断这2种训练策略，提升模型整体的推荐性能. 为了解决多模态数据量增加带来的计算挑战，采用计算效率较高的多层感知机. 在微信视频号和抖音短视频数据集上进行性能比较实验和超参数敏感性实验，结果显示MMa4CTR在保持较低计算开销的同时，实现了超越基线模型的卓越推荐效果. 通过在2个数据集上进行的消融实验，进一步证实了短视频模态交叉模块、用户多模态嵌入层以及自动学习率调整策略和验证中断策略在提升推荐性能方面的重要性和有效性.

摘要阅读排行