浙江大学学报(工学版)

Select

1. 多目标粒子群优化算法及其应用研究综述

叶倩琳,王万良,王铮

浙江大学学报(工学版) 2024, 58 (6): 1107-1120. DOI: 10.3785/j.issn.1008-973X.2024.06.002

摘要

HTML

PDF（pc）（1559KB）（644）

现有研究较少涵盖最先进的多目标粒子群优化（MOPSO）算法. 本研究介绍了多目标优化问题（MOPs）的研究背景，阐述了MOPSO的基本理论. 根据特征将其分为基于Pareto支配、基于分解和基于指标的3类MOPSO算法，介绍了现有的经典算法. 介绍相关评价指标，并选取7个有代表性的算法进行性能分析. 实验结果展示了传统MOPSO和3类改进的MOPSO算法各自的优势与不足，其中，基于指标的MOPSO在收敛性和多样性方面表现较优. 对MOPSO算法在生产调度、图像处理和电力系统等领域的应用进行简要介绍. 并探讨了MOPSO算法用于求解复杂优化问题的局限性及未来的研究方向.

Select

2. 融合知识图谱的时空多图卷积交通流量预测

李劲业,李永强

浙江大学学报(工学版) 2024, 58 (7): 1366-1376. DOI: 10.3785/j.issn.1008-973X.2024.07.006

摘要

HTML

PDF（pc）（1616KB）（502）

现有的交通流量预测方法关注交通信息的时空相关性，未充分考虑外部因素对交通的影响，为此提出融合静态和动态知识图谱的时空多图卷积交通流量预测模型. 基于道路交通信息和外部因素，构建城市交通知识图谱和4个不同语义的路网拓扑图，将城市交通知识图谱输入关系演化图卷积神经网络，实现知识嵌入；使用知识融合模块将车流量矩阵与知识嵌入融合；将4个路网拓扑图和融合知识的车流量矩阵输入时空多图卷积模块，提取时空特征，通过全连接层输出交通流量预测值. 在杭州交通数据集上评估模型性能，与先进的基线模型对比，所提模型的性能提高了5.76%~10.71%. 鲁棒性实验结果表明，所提模型具有较强的抗干扰能力.

Select

3. 基于区块链的移动群智感知数据处理研究综述

邵子豪,霍如,王志浩,倪东,谢人超

浙江大学学报(工学版) 2024, 58 (6): 1091-1106. DOI: 10.3785/j.issn.1008-973X.2024.06.001

摘要

HTML

PDF（pc）（772KB）（475）

针对移动群智感知（MCS）数据处理的用户广泛参与性、采集设备灵活移动性与通信环境复杂性的特点，对基于区块链的移动群智感知数据处理进行评估. 回顾移动群智感知与区块链的发展历程，总结移动群智感知数据处理面临的挑战与区块链技术的特点；设计基于区块链的移动群智感知体系结构（BMCA），实现数据去中心化管理、数据安全保障、数据质量精准评估与激励可信性增强；从隐私保护、数据质量评估、激励机制3个维度，对比分析现有的数据处理关键技术研究工作；探讨基于区块链的移动群智感知数据处理研究在资源消耗控制、数据精准分析、全周期与差异化隐私保护、融合模式应用等方面存在的问题及未来可能的发展方向.

Select

4. 基于改进YOLOv5s的无人机小目标检测算法

宋耀莲,王粲,李大焱,刘欣怡

浙江大学学报(工学版) 2024, 58 (12): 2417-2426. DOI: 10.3785/j.issn.1008-973X.2024.12.001

摘要

HTML

PDF（pc）（708KB）（457）

为了解决传统目标检测算法对无人机(UAV)航拍小目标存在错漏检严重的问题，提出基于YOLOv5的无人机小目标检测算法FDB-YOLO. 在YOLOv5的基础上增加小目标检测层，优化特征融合网络，充分利用网络浅层小目标细粒信息，提升网络感知能力；提出损失函数FPIoU，通过充分利用锚框的几何性质，采用四点位置偏置约束函数，优化锚框定位，加快损失函数收敛速度；采用结合注意力机制的动态目标检测头(DyHead)，通过增加尺度、空间、任务感知提升算法检测能力；在特征提取部分引入双级路由注意力机制(BRA)，通过有选择性地对相关区域进行计算，过滤无关区域，提升模型的检测精确度. 实验证明，在VisDrone2019数据集上，本算法与YOLOv5s目标检测算法相比，精确率提升了3.7个百分点，召回率提升了5.1个百分点，mAP₅₀增加了5.8个百分点，mAP_50∶95增加3.4个百分点，并且相比当前主流算法而言都有更加优秀的表现.

Select

5. 基座模型技术背景下的具身智能体综述

李颂元,朱祥维,李玺

浙江大学学报(工学版) 2025, 59 (2): 213-226. DOI: 10.3785/j.issn.1008-973X.2025.02.001

摘要

HTML

PDF（pc）（841KB）（436）

近年来，虽然自然语言处理、计算机视觉、多模态学习等领域的基座模型取得了突破性的进展，展现出了通用人工智能的潜力，但它们在因果推理和物理常识理解方面的表现远不及人类或动物. 这是因为这些模型主要依赖于大量的数据和计算能力，缺乏与现实世界的直接互动和经验积累. 许多研究者开始质疑，单纯通过增加模型规模是否足以克服这些根本性的问题. 这促使学界重新审视智能的本质，认为智能不仅是计算能力的提升，更是源于与环境的互动. 具身智能正逐渐受到人工智能领域的关注，因为它强调智能体通过与物理世界的直接互动，学习和适应环境，展现出更接近生物智能的特性. 结合基座模型的技术背景，对具身人工智能进行全面的调研. 讨论当前具身智能体背后的技术思想、测试基准及应用. 对未来具身人工智能的趋势和挑战进行前瞻性的分析.

Select

6. 基于多特征重构的三维目标反演算法

薛雅丽,周李尊,王林飞,欧阳权

浙江大学学报(工学版) 2024, 58 (11): 2199-2207. DOI: 10.3785/j.issn.1008-973X.2024.11.001

摘要

HTML

PDF（pc）（2281KB）（427）

为了解决基于深度学习的三维反演方法中存在的内存占用大、训练耗时久的问题，提出基于多特征重构的三维目标反演算法. 通过特征分解提取目标的水平区域、中心深度、垂直厚度和剩余密度4类特征，实现对三维模型的压缩，降低内存占用. 设计多特征重构反演网络(MRNet)，通过不同的Decoder实现对目标4类特征的预测，利用4类特征重构三维模型，实现对三维目标的反演. 在网络输入端引入梯度联合实现对目标边界信息的增强. 在跨层连接处引入CA注意力机制，实现对Decoder预测功能的分化，优化反演效果. 模拟实验结果显示，MRNet的局部相对准确度相对于3D U-Net提升了30%以上，达到88.91%，每轮训练时间仅为3D U-Net的1/13. 将MRNet应用于Vinton盐丘地区，较准确地得到了盖岩的分布情况，验证了MRNet具备一定的泛化性.

Select

7. 基于法条知识的事理型类案检索方法

李林睿,王东升,范红杰

浙江大学学报(工学版) 2024, 58 (7): 1357-1365. DOI: 10.3785/j.issn.1008-973X.2024.07.005

摘要

HTML

PDF（pc）（814KB）（369）

现有类案检索研究忽略了模型应当蕴含的法律逻辑，无法适应实际应用中案件相似标准的要求；类案检索任务的中文数据集较少，难以满足研究需求现状. 为此提出基于法律逻辑、有较强可解释性的类案检索模型，构建以谓语动词为基础的案件事理图谱. 将各类罪名对应的法条知识融入所提模型，将提取的不同要素输入以神经网络为基础的评分器以实现准确、高效的类案检索. 构建针对类案检索任务、以易混淆罪名组为主要检索案由的Confusing-LeCaRD数据集，所提模型在LeCaRD数据集和Confusing-LeCaRD数据集上的归一化折损累计增益分别为90.95%和94.64%，在各项指标上均优于TF-IDF、BM25和BERT-PLI模型.

Select

8. 基于图神经网络的路面病害态势预测方法

马泽超,刘小明,夏汗青,王伟强,王久增,申海涛

浙江大学学报(工学版) 2024, 58 (12): 2596-2608. DOI: 10.3785/j.issn.1008-973X.2024.12.019

摘要

HTML

PDF（pc）（1111KB）（353）

针对路面病害生成和恶化的预测问题，提出应用图卷积神经网络的路面病害态势预测方法. 通过聚类算法建立拓扑网络，选取目标病害在演化过程中的主要影响因素；为了增强图神经网络对病害信息的表达能力，采用图拓扑增强的方法，从静态和动态方面分别构造与病害信息相关的视图；采用图神经网络(GNN)架构增强的方法，在视图维度上应用注意力机制调整不同视图的影响力，并在时间维度上应用Transformer和GRU模块，增强模型在长时间序列中对病害状态的预测性能. 设计模型的内部调整测试，经消融试验、多样本测试和超参数对照组的验证，证明所提模型的适用性和稳定性. 针对大型稀疏的路面病害数据集，此模型的平均绝对误差均值收敛在4.0以内，综合性能优于传统预测算法.

Select

9. 多模态信息增强的短视频推荐模型

霍育福,金蓓弘,廖肇翊

浙江大学学报(工学版) 2024, 58 (6): 1142-1152. DOI: 10.3785/j.issn.1008-973X.2024.06.005

摘要

HTML

PDF（pc）（906KB）（301）

提出用于短视频点击率预估任务的多模态增强模型（MMa4CTR）. 模型综合利用用户与短视频交互中的多模态数据，以构建用户的嵌入表示，并学习用户的多模态兴趣. 通过组合和交叉不同模态特征，探索各模态间的共同语义. 通过引入自动学习率调整和验证中断这2种训练策略，提升模型整体的推荐性能. 为了解决多模态数据量增加带来的计算挑战，采用计算效率较高的多层感知机. 在微信视频号和抖音短视频数据集上进行性能比较实验和超参数敏感性实验，结果显示MMa4CTR在保持较低计算开销的同时，实现了超越基线模型的卓越推荐效果. 通过在2个数据集上进行的消融实验，进一步证实了短视频模态交叉模块、用户多模态嵌入层以及自动学习率调整策略和验证中断策略在提升推荐性能方面的重要性和有效性.

Select

10. 熔滴复合电弧增材制造2219铝合金组织与性能

王勇超,魏正英,贺鹏飞

浙江大学学报(工学版) 2024, 58 (8): 1585-1595. DOI: 10.3785/j.issn.1008-973X.2024.08.006

摘要

HTML

PDF（pc）（7116KB）（286）

为了提高铝合金电弧增材制造的质量和效率，采用新型的电弧增材制造工艺——熔滴复合电弧增材制造（DAAM）技术来制造铝合金样品. 采用全新的熔滴生成系统（DGS）代替传统的送丝系统，使得材料的添加与电弧能量相互独立. 成形的材料为2219铝合金，通过熔滴系统添加了微量Mg元素. 利用熔滴复合电弧增材制造设备沉积了薄壁结构，沉积速率较传统电弧增材制造技术大幅提升（约为160 mm³/s）. 观察和分析薄壁结构截面的微观组织表明，薄壁结构的晶粒形态以柱状晶为主，呈现层内柱状晶和层间等轴晶的周期性分布规律. 经过T6热处理后，试样水平和垂直方向的平均抗拉强度分别为455.4和417.0 MPa，屈服强度分别为342.4和316.4 MPa. 较之前的研究结果对比表明，Mg元素的添加提升了2219铝合金的屈服强度，但导致延伸率降低.

Select

11. 基于改进的NSGA-II算法的三维扇区自动划设

张盈斐,胡小兵,周航,冯序增

浙江大学学报(工学版) 2025, 59 (2): 413-422. DOI: 10.3785/j.issn.1008-973X.2025.02.019

摘要

HTML

PDF（pc）（1634KB）（283）

针对人工划分空域扇区耗时长且难以比较不同扇区划分方案优劣的问题，提出改进的快速非支配排序遗传算法(NSGA-II）. 以均衡管制员扇区内工作负荷和减少管制员扇区间工作负荷为目标，基于网格-区域块-扇区层级提出三维扇区划分多目标优化模型. 为了提高种群的可行解数量、多样性及算法的解算速度，在NSGA-II算法中引入适应度评估算子、变概率组合交叉算子和动态变异算子. 对西安高空空域进行三维扇区自动划设的仿真模拟. 结果表明，与实际划分构型相比，优化后的方案将扇区内工作负荷均衡性提高了37%，扇区间工作负荷减少了24%；与传统的加权多目标优化算法相比，基于改进的NSGA-II算法得到的扇区划分方案可以为不同偏好的决策者提供更广泛的选择.

Select

12. 基于边界点估计与稀疏卷积神经网络的三维点云语义分割

杨军,张琛

浙江大学学报(工学版) 2024, 58 (6): 1121-1132. DOI: 10.3785/j.issn.1008-973X.2024.06.003

摘要

HTML

PDF（pc）（1828KB）（276）

针对大规模点云具有稀疏性，传统点云方法提取上下文语义特征不够丰富，并且语义分割结果存在物体边界模糊的问题，提出基于边界点估计与稀疏卷积神经网络的三维点云语义分割算法，主要包括体素分支与点分支. 对于体素分支，将原始点云进行体素化后经过稀疏卷积得到上下文语义特征；进行解体素化得到每个点的初始语义标签；将初始语义标签输入到边界点估计模块中得到可能的边界点. 对于点分支，使用改进的动态图卷积模块提取点云局部几何特征；依次经过空间注意力模块与通道注意力模块增强局部特征；将点分支得到的局部几何特征与体素分支得到的上下文特征融合，增强点云特征的丰富性. 本算法在S3DIS数据集和SemanticKITTI数据集上的语义分割精度分别达到69.5%和62.7%. 实验结果表明，本研究算法能够提取到更丰富的点云特征，可以对物体的边界区域进行准确分割，具有较好的三维点云语义分割能力.

Select

13. 基于MA-ConvNext网络和分步关系知识蒸馏的苹果叶片病害识别

刘欢,李云红,张蕾涛,郭越,苏雪平,朱耀麟,侯乐乐

浙江大学学报(工学版) 2024, 58 (9): 1757-1767. DOI: 10.3785/j.issn.1008-973X.2024.09.001

摘要

HTML

PDF（pc）（5637KB）（271）

针对复杂环境下苹果叶片病害图像背景杂乱、病斑大小不一，以及现有模型参数多、计算量大的问题，提出基于注意力和多尺度特征融合的苹果叶片病害识别网络(MA-ConvNext). 通过引入多尺度空间通道重组块(MSCB)和融合三分支注意力机制的特征提取模块(TAFB)，有效提取苹果叶片病害图像不同尺度的特征，增强模型对叶片病斑的关注. 采用分步关系知识蒸馏方法，将“教师”网络(MA-ConvNext)和“中间”网络(DenseNet121)融合，指导“学生”网络(EfficientNet-B0)训练，实现模型轻量化. 实验结果表明，MA-ConvNext网络识别准确率为99.38%，较ResNet50、MobileNet-V3和EfficientNet-V2网络分别提高了3.98个百分点、7.55个百分点和4.27个百分点. 经过分步关系知识蒸馏后，识别准确率较蒸馏前提高了1.76个百分点，并且具有更小的网络规模和参数量，分别为1.56×10⁷、5.29×10⁶. 所提方法能为后续精准农业的病虫害检测提供新思路和技术支持.

Select

14. 2.4 GHz GaAs HBT高线性度功率放大器设计

张松,傅海鹏

浙江大学学报(工学版) 2024, 58 (7): 1524-1532. DOI: 10.3785/j.issn.1008-973X.2024.07.022

摘要

HTML

PDF（pc）（2677KB）（262）

为了满足Wi-Fi 6射频前端对高线性度、高发射功率的需求，基于GaAs HBT工艺设计工作于2.4~2.5 GHz的功率放大器. 利用有源自适应偏置、二次谐波阻抗控制和多级放大器失真互补实现所设计放大器的高线性输出功率，通过键合金线的高品质因子寄生电感降低输出匹配的插损，并将直流与射频功率检测集成. 测试结果表明，所设计放大器的小信号增益为30.6~30.7 dB，输入输出回波损耗均小于?10 dB，输出1 dB压缩功率为29.2 dBm，对应功率附加效率为26.4%. 在802.11ax标准、MCS7调制策略、40 MHz带宽的测试信号下，当误差矢量幅度小于?30 dB时，所设计放大器的最大输出功率为24.1 dBm. 在MCS9调制策略下，当误差矢量幅度小于?35 dB时，所设计放大器的最大输出功率为23.6 dBm；在MCS11调制策略下，当误差矢量幅度小于?40 dB时，所设计放大器的最大输出功率为22.4 dBm，对应最大功率附加效率为10.2%.

Select

15. 基于动态位置编码和注意力增强的目标跟踪算法

熊昌镇,郭传玺,王聪

浙江大学学报(工学版) 2024, 58 (12): 2427-2437. DOI: 10.3785/j.issn.1008-973X.2024.12.002

摘要

HTML

PDF（pc）（1684KB）（258）

为了充分利用模板和搜索区域之间的位置信息以及提高融合特征的表征能力，提出使用动态位置编码和多域注意力特征增强的方法. 在注意力模块内部嵌入带有卷积操作的位置编码模块，随注意力计算更新位置编码，提高自身空间结构信息的利用率. 引入多域注意力增强模块，在空间维度上使用不同空洞率和步长的平行卷积进行采样，以应对不同大小的目标物，并聚合通道注意力增强后的特征. 在解码器中加入空间域注意力增强模块，为预测头提供更精确的分类回归特征. 本算法在GOT-10K数据集上的平均重叠度(AO)为73.9%；在TrackingNet、UAV123和OTB100数据集上分别取得了82.7%、69.3%和70.9%的曲线下面积(AUC). 与主流算法的对比结果表明，融合了动态位置编码和通道、空间注意力增强的跟踪模型可以有效提升模板和搜索区域间的信息交互，提高跟踪的精度.

Select

16. 数据驱动的智能计算及其应用研究综述

戴瑞,介婧,王万良,叶倩琳,吴菲

浙江大学学报(工学版) 2025, 59 (2): 227-248. DOI: 10.3785/j.issn.1008-973X.2025.02.002

摘要

HTML

PDF（pc）（1476KB）（257）

为了有效地解决实际应用中涌现出的越来越复杂的昂贵优化问题（EOPs），全面综述了能够有效降低计算成本和提高求解效率的最新数据驱动智能计算（DDICs）方法. 从算法和应用2个层面系统地概述了最新DDICs的研究成果，归纳和总结了广义DDICs和自适应DDICs中的不同技术点，剖析了DDICs在解决EOPs时所面临的挑战与机遇. 提出未来研究的潜在发展趋势，如进行更深层次的理论分析、探索新颖的学习范式及其在更多不同实际领域中的应用等，旨在为研究者提供有针对性的参考与方向，激发创新思路，从而更有效地应对实际应用中的各种复杂EOPs.

Select

17. 基于深度学习的隧道衬砌多病害检测算法

宋娟,贺龙喜,龙会平

浙江大学学报(工学版) 2024, 58 (6): 1161-1173. DOI: 10.3785/j.issn.1008-973X.2024.06.007

摘要

HTML

PDF（pc）（4841KB）（257）

针对已有目标检测算法在隧道衬砌病害检测中全局信息提取不充分、检测精度低的问题，提出隧道衬砌表观病害检测算法TDD-YOLO. 该算法以YOLOv7框架为基础，采用MobileViT作为主干特征提取网络，提高网络全局信息和局部信息提取能力；在特征金字塔网络的上采样和下采样后增加Coordinate attention (CA)注意力模块，突出病害的特征信息，去除背景信息的干扰；提出卷积模块TP Block，在计算量较小的情况下进一步提高网络的特征提取能力. 为了验证所提出算法的有效性，选用SSD、Faster-RCNN、EfficientDet、YOLOv5、YOLOv7这5种算法进行对比分析. 实验结果表明，TDD-YOLO算法的F1为77.43%，相对5种对比算法，分别提高了15.58%、17.36%、12.19%、6.32%、6.14%；mAP为77.52%，相对5种对比算法，分别提高了15.20%、14.24%、9.44%、7.44%、6.39%. TDD-YOLO算法病害识别精度最高，综合性能最优，适用于实际隧道工程的病害检测任务.

Select

18. 时间感知组合的动态知识图谱补全

李忠良,陈麒,石琳,杨朝,邹先明

浙江大学学报(工学版) 2024, 58 (8): 1738-1747. DOI: 10.3785/j.issn.1008-973X.2024.08.020

摘要

HTML

PDF（pc）（970KB）（252）

针对现有时序知识图谱嵌入方法仅考虑时序信息的关系或仅编码独立的时序向量，知识图谱补全性能不高的问题，提出时间感知组合（TAC）的时序知识图谱补全方法. 通过建模维度特征，分析时序信息对知识图谱补全方法的有效程度. 通过时序信息内嵌和独立相结合的嵌入方式，考虑时序信息嵌入后，不同学习方式对表示学习能力产生不同的影响. 提出的方法利用长短时记忆（LSTM）网络编码时序信息，学习到更准确的时间维度特征，有助于提升时序图谱的性能. 在ICEWS14、ICEWS05-15和GDELT数据集上进行实验，验证了时间感知组合方法的有效性. 对比相关的研究性能指标可知，本文方法在链接预测上表现较优.

Select

19. 全齿轮耦合机器人齿侧间隙建模与公差仿真

蒋君侠,仲笑欧,吕林灿,来建良,金丁灿

浙江大学学报(工学版) 2024, 58 (8): 1533-1542. DOI: 10.3785/j.issn.1008-973X.2024.08.001

摘要

HTML

PDF（pc）（2479KB）（248）

鉴于全齿轮耦合机器人齿轮传动链长、反转频率高的特点，分析机器人的结构和传动原理. 为了减小侧隙对机器人传动精度的影响，提出齿侧间隙理论建模及三维公差仿真分析方法. 针对驱动端的圆柱齿轮机构，对齿侧间隙进行理论建模和公差仿真分析，两者相吻合. 针对关节处的圆锥齿轮机构，提出将圆锥齿轮副等效为假想圆柱齿轮副的侧隙建模方法，与公差仿真分析结果吻合. 以机器人肩关节偏摆传动链为分析对象计算机器人末端误差，为了降低齿侧间隙及其导致的传动链回程误差，提出圆锥齿轮加垫的计算方法和电机转角补偿方法，通过实验验证该补偿方法的有效性.

Select

20. 双有源桥无回流功率控制的死区影响与补偿

张国澎,蒋闯闯,陶海军,陈卓

浙江大学学报(工学版) 2024, 58 (11): 2406-2416. DOI: 10.3785/j.issn.1008-973X.2024.11.022

摘要

HTML

PDF（pc）（3254KB）（241）

针对三重移相协同控制（CTPS）加入桥臂死区后，会导致双有源桥（DAB）变换器回流功率发生及软开关失效的问题，提出针对CTPS控制的死区补偿策略. 通过分析CTPS控制不同模式下桥臂死区引起的变压器原副边电压及漏感电流的变化，基于回流功率产生的原理，更正了不同模式移相比之间的耦合关系，对功率传输模型及CTPS控制模式的切换条件进行修正，实现了死区对CTPS控制影响的有效控制. 利用所提的补偿方案，抑制了由死区引起的回流功率，恢复了CTPS控制的软开关性能，具有较补偿前更优的电流应力. 分别开展死区补偿前、后的实验，对死区影响的分析和所提出的补偿策略进行验证.

全文下载排行