融合用户行为与评论关系的双通道电商欺诈检测方法
Dual-channel E-commerce fraud detection method integrating user behavior and review relationships
通讯作者:
收稿日期: 2025-01-8
| 基金资助: |
|
Received: 2025-01-8
| Fund supported: | 天津市教委科研计划项目(2023SK115). |
作者简介 About authors
凤丽洲(1987—),女,副教授,博士,从事机器学习、数据挖掘研究.orcid.org/0000-0002-1010-8539.E-mail:
现有方法偏重用户行为的全局建模,对评论信息挖掘不足,为此提出双通道图神经网络方法用于电商平台用户级欺诈检测任务. 通过实体交互图和评论语义图对用户的多维行为建模,实体交互图基于购买与评分行为捕捉整体交互模式,评论语义图利用时间敏感性建模评论之间的语义关联以刻画细粒度行为特性. 利用图神经网络对双图并行建模,通过注意力机制实现双通道特征的动态交互优化,生成包含多跳邻居信息的高阶节点特征. 通过多头加性注意力机制自适应融合不同邻域范围和特征空间,生成用户级的综合行为表示. 在公开数据集上的实验结果表明,所提方法在多个指标上显著优于传统方法,验证了方法在用户级欺诈检测中的有效性.
关键词:
A dual-channel graph neural network method was proposed for user-level fraud detection tasks on E-commerce platforms to address the limitations of existing approaches that overemphasized global modeling of user behavior while insufficiently exploiting comment information. Multi-dimensional user behavior was modeled through the construction of two complementary graphs: an entity interaction graph and a comment semantic graph. The entity interaction graph was designed to capture global interaction patterns based on purchase and rating behaviors, while the comment semantic graph was built to model time-sensitive semantic relations between comments for characterizing fine-grained behavioral features. Parallel modeling of the dual graphs was performed using graph neural networks. Dynamic interaction optimization between dual-channel features was achieved through an attention mechanism, and higher-order node features containing multi-hop neighborhood information were generated. A comprehensive user-level behavior representation was produced by adaptively fusing different neighborhood ranges and feature spaces with a multi-head additive attention mechanism. Experimental evaluations were conducted on public datasets to validate the proposed method, and significant improvements were observed in multiple evaluation metrics compared to traditional approaches. Results show that the proposed method effectively enhances fraud detection performance at the user level.
Keywords:
本文引用格式
凤丽洲, 白至纯, 王友卫.
FENG Lizhou, BAI Zhichun, WANG Youwei.
在数字化转型的浪潮下,电子商务平台已成为推动全球经济发展的重要引擎. 随着电子商务的快速崛起,平台面临着诸多挑战,尤其是部分商家为了追逐不正当经济利益,组织用户实施欺诈行为,包括虚假交易、恶意评价操纵和刷单等. 欺诈行为的隐蔽性和复杂性不断增强,这些用户一方面通过构建多层级的间接交易链路规避单账户行为检测,另一方面利用同质化评论文本提升商品排名,形成多模态耦合的欺诈模式,在拓扑结构、语义特征维度上与正常用户行为逐渐趋同,使得传统检测方法的识别难度大幅提高.
欺诈检测方法主要分为2个类别:基于行为的数据驱动方法和基于网络的关系建模方法. 基于行为的方法主要通过如用户账户行为日志的结构化数据提取特征,结合统计分析[1-2]、机器学习[3]或深度学习[4-6]技术,捕捉偏离正常用户行为模式的异常模式. 这类方法在处理大规模数据时计算效率高,但依赖于数据质量和特征设计,对新型欺诈行为的适应能力有限. 基于网络的关系建模方法通过构建用户之间的交互关系网络,分析节点间的连接模式和行为特征. 这类方法大多基于图神经网络(graph neural networks, GNNs),通过邻居节点信息的传播和整合,增强目标节点的特征表示,特别是在处理隐蔽社交连接的欺诈行为时表现出较高的有效性. 然而,欺诈团伙常通过多个关联账户发布的相似评论文本构建协同信号,传统GNN仅依赖用户属性与交易拓扑建模,导致单纯依赖节点属性的模型难以识别这些隐蔽欺诈用户. 此外,对于多账户接力刷评(如用户A→B→C)构建的跨层次交易链,由于用户A与C之间没有直接的共同交易关系,传统GNN在信息传递过程中容易受到深层特征噪声的干扰,导致A与C之间的有效信息传递受阻,从而影响模型的检测精度.
为了解决上述问题,并全面捕捉用户在电商平台中的多维度行为特征,本研究提出基于用户实体与评论关系的双通道电商欺诈检测方法(entity-comment graph neural network, EC-GNN):通过联合建模用户的交易行为与评论关系,整合用户的行为特征、评价内容及时间动态,从语义与结构双视角揭示潜在的异常模式;同时引入多头加性注意力机制,动态衡量邻居节点重要性以突出欺诈关键信息. 本研究在公开的欺诈数据集上进行EC-GNN性能的系统性验证,以证明所提方法在实际应用中的有效性.
1. 相关工作
图异常检测领域已发展出多种通用方法[7],这些方法通过建模网络拓扑特征和行为模式,为特定领域的欺诈检测研究奠定了重要基础. 在电商交易场景中,以双增强图神经网络(dual-augment graph neural network, DA-GNN)[8]为代表的图神经网络方法虽能有效建模用户总体交易历史的宏观行为特征,却未能充分揭示个体行为的深层语义关联. 如Motie等[9]所述,现有研究对边级别特征的细粒度检测关注不足,而交易欺诈往往更直接体现在特定交易行为的异常模式中. 有方法尝试引入边行为特征以增强模型表现,Bai等[10-11]提出基于超边的图卷积策略,通过将节点特征传递至超边,再由超边反馈信息至节点,从而捕捉节点间的复杂关系. 该方法在本质上依然侧重于节点特征的聚合,未能充分揭示节点行为之间的语义联系及其相互作用的深层结构. 部分研究进一步引入基于边行为特征的注意力机制[12],通过结合边行为特征与节点信息计算注意力分数,使得模型能够突出对欺诈检测中关键行为的关注,但这些方法通常将边缘和节点信息进行简单的融合,忽视了行为间的独立语义和其相互关系的重要性. Hu等[13]提出的行为信息聚合网络(behavior information aggregation network, BIAN)方法通过相邻节点属性的分布来聚合邻居节点信息,在一定程度上增强了边缘属性对节点关系的影响. 然而,该方法过于依赖局部节点行为特征的聚合,未能从全局视角考虑行为间的复杂关联. 可以看出,现有方法普遍缺乏对行为间关系和语义信息的深度挖掘,未能充分揭示潜在的欺诈模式.
欺诈行为可能表现为局部模式(如异常的高频交易),也可能涉及远程依赖(如虚假交易链或协同欺诈). 这种隐蔽性和多样性要求模型既能捕捉局部特征以识别直接异常,又能提取全局信息揭示复杂模式. 传统图神经网络依赖多跳消息传递获取远程信息,容易导致特征模糊化. 针对上述问题,Chen等[14]提出去平滑正则化方法,通过在损失函数中添加正则项来限制特征相似性,并结合残差连接增强浅层特征的保留能力. 尽管该方法增强了特征清晰度,但缺乏对不同层次特征的动态建模能力,未能充分适应欺诈行为跨越局部异常和远程协同的特征多样性. Xu等[15]提出的跳跃知识网络架构(jumping knowledge networks, JK-Net)通过层间跳跃连接聚合不同深度特征,使模型能够结合浅层局部信息与深层全局特征,部分满足电商欺诈检测对多层次信息的需求. 该方法采用固定聚合策略,忽视了层次特征间的动态关系,难以灵活适应局部或全局特征的重要性变化. 尽管Rusch等[16]提出的梯度门控框架通过梯度信号动态调节层间消息传递速率,但多速率计算架构显著增加了内存开销. 类似地,Ying等[17]提出的Graphormer图神经网络架构虽通过全局交互建模远程依赖,避免了多跳消息传递导致的特征模糊问题,但方法的计算复杂度过高,难以应对动态交易网络的实时需求.
现有的电商平台欺诈检测方法普遍存在如下问题. 1)主要关注用户行为的宏观特征,忽略了多维度信息(如评论、交易时间). 评论通常只被视为节点关系的附属,未能充分挖掘评论间的潜在关联和结构特征. 2)深层特征趋同,难以适应复杂交易网络中特征重要性的层次变化,且计算复杂度随网络规模急剧上升,限制了模型的实际应用.
针对上述不足,本研究从两方面展开技术改进. 1)突破节点中心建模模式,显式构建评论关系特征图,将评论定义为独立语义实体,结合语义相似性与时间敏感性捕捉交互特性,避免边缘信息简化导致的损失. 2)引入多头加性注意力机制,动态融合局部与全局特征以抑制同质化问题,同时依托参数共享设计提升大规模数据处理效率.
2. 模型介绍
2.1. 问题定义
以电商平台中的用户实体作为研究对象,根据用户的交易及评论行为给定用户行为集
2.2. 方法框架
将电商平台用户交易数据形式化为图结构,通过双通道建模实现对欺诈用户的精准识别,核心流程包括以下3个部分. 1)在双图构建阶段,实体交互图以用户为节点,当2个用户存在共同购买或评分行为时建立连边,形成显式的交易关联网络;评论语义图以评论为节点,通过基于Transformer的双向编码器表示(bidirectional encoder representations from Transformers,BERT)模型提取评论文本语义向量,基于评论间的时间邻近性建立带权连边,形成融合语义与行为的动态关系图. 2)双通道架构通过分层特征聚合实现信息融合. 在实体交互通道,采用基于节点相似度的注意力机制,通过可学习的权重向量计算相邻节点间的注意力得分,实现基于行为模式相似性的特征加权聚合;在评论语义通道,引入时序加权的注意力机制,将原始时间权重与语义相似度得分相结合,动态调整评论节点的聚合权重. 2个通道均采用多跳信息传播机制,通过多层堆叠的图卷积网络迭代更新节点表示. 3)利用多头加性注意力机制对高阶节点表示向量序列进行深度整合,形成目标用户的全局嵌入向量,实现欺诈用户的精准检测. EC-GNN的双通道联合建模完整流程及其高效信息融合机制如图1所示.
图 1
图 1 双通道图神经网络方法的总体框架
Fig.1 Overall framework of dual-channel graph neural network method
2.3. 关系图构建
构建包含所有交易行为的综合性原始图,如图1中以目标用户为中心的部分交易结构图所示. 该图捕捉与目标用户直接(1跳)和间接(2跳)交易行为相关的邻居节点,包括商家节点和其他用户节点,这些节点之间的连接(边)表示评论和购买行为. 为了更深入地从不同视角理解交易网络中的实体交互与评论动态,将原始图分解为分别聚焦于实体交互属性和评论内容2个独立视图.
2.3.1. 实体交互图构建
实体交互图通过基于用户与商品之间的交互行为(如购买和评分),建立用户之间的关联关系,旨在从宏观层面建模用户的全局交互模式和平台互动特性. 从原始图中提取参与交易的所有用户作为实体交互图的节点,用户之间共同购买或评分过至少1个相同商品时建立无向边,从而构建能够直观反映用户交易关联关系的网络结构.
具体而言,将用户
2.3.2. 评论语义图构建
评论作为连接用户与商品的关键特征,评论内容、时间及其间的关联性在传统分析框架中往往未被充分的挖掘. 本研究将原始评论节点
为了更准确描述评论的文本特征,引入BERT模型构建节点特征. BERT模型通过双向编码器结构深入地理解评论文本的上下文含义,将评论
在得到图中每个评论节点的语义向量后,评论向量
式中:
2.4. 节点信息传递和融合
给定实体交互图
2.4.1. 实体交互图信息传递
实体交互图
式中:
其中可训练的权重向量
式中:
式中:
2.4.2. 评论语义图信息传递
评论文本图
式中:
对于目标节点
2.4.3. 节点信息融合
对生成的实体表示向量
对于
式中:
使用注意力权重
将
同理获得节点
式中:
式中:
EC-GNN的伪代码如算法1所示.
算法1 双通道图神经网络方法
输入: 用户集合U, 商品集合V, 评论集合C
输出: 用户节点的欺诈预测
1: 构建实体关系图; 构建评论关系图; 初始化节点特征向量h
2: while 训练未收敛 do
3: for 用户节点
4: //实体关系图信息传递
5: for l = 1 to L do
6:
7: end
8: 保存
9: //评论关系图信息传递
10: for 用户
11: for l = 1 to L do
12:
13: end
14:
15: end
16: 保存
17: //多头加性注意力机制聚合
18: for
19:
20:
21: end
22:
23:
24:
25: end
26: 计算损失并反向传播更新参数
27: end
EC-GNN的时间复杂度如下. 在实体图信息传递中,
3. 实验分析
3.1. 实验设置及数据
实验环境:Python3.8+Pytorch1.11,显卡为NVIDIA A16,硬件环境为CPU:2×Intel(R) Xeon(R) Gold 5318Y CPU @ 2.10GHz,显存为30 G. 在实验中,设置实体图和评论图隐藏节点特征向量维数分别为64和1 024,输入特征维度分别为24和768. 设置模型迭代的次数为2,多头加性注意力机制的头数为2. 正样本权重设置为训练集中负样本数与正样本数的比值,通过增加正样本的损失权重来处理类别不平衡问题.
表 1 实验用数据集的统计信息
Tab.1
| 数据集 | n | |||
| 用户 | 虚假用户 | 评论 | 虚假评论 | |
| Pet | 35 872 | 637 | 157 563 | 713 |
| Garden | 28 230 | 903 | 114 354 | 1 080 |
| Instrument | 17 813 | 866 | 87 678 | 1 131 |
| Yelp | 35 378 | 1 102 | 148 445 | 3 328 |
3.2. 评价指标
采用广泛使用的指标曲线下面积AUC、宏召回率Rm和宏F1值F1来评价分类器性能[8]. AUC代表ROC曲线下的面积,ROC曲线通过绘制假正率FPR和真正率TPR展示模型分类能力. AUC衡量正样本得分高于负样本的概率,适合不平衡数据,
宏召回率反映不平衡数据下模型在所有类别中识别欺诈用户的平均能力:
式中:TP为正确分类的欺诈用户总数,FN为未正确分类的欺诈用户总数. F1是精确率P与召回率R的调和平均数,用于综合评估模型在不平衡数据下的分类性能,
式中:FP为未正确分类的正常用户总数.
3.3. 对比实验
将基准模型划分为2组:1)传统图神经网络模型,包括GCN[23]、GAT[24]和GraphSAGE[25];2)面向欺诈检测的改进GNN模型,包括GEM[26]、GeniePath[27]、FdGars[28]、GraphConsis[29]、PC-GNN[30],不考虑此类模型的异构结构. 基准模型使用与EC-GNN相同的参数以保持公平性. 在模型训练阶段,使用Adam作为优化器,LeakyReLU为注意力机制的激活函数,L2系数为0.001. Pet和Yelp数据集的初始学习率均设置为0.01,批次大小为2 048,Garden和Instrument数据集的初始学习率设置为0.005,批次大小为1 024,以上数据每训练20轮,学习率会衰减为前一阶段的0.1. 此外,GraphSAGE和GraphConsis模型在聚合邻居特征时使用均值池化,每个卷积层采样邻居节点的数量大小设置为50;GAT和GEM模型中注意力机制使用的头数设置为2.
如表2所示为不同模型在4个数据集中的预测性能评价指标对比. 可以看出,EC-GNN在AUC、Rm和F1上均显著优于传统GNN模型和面向欺诈检测的改进GNN模型. 传统GNN模型(GCN、GAT、GraphSAGE)的性能受限主要源于单模态图结构建模与注意力机制的单一性. 在Garden数据集上,GAT的AUC和F1均接近随机分类水平,原因是该模型仅依赖用户交互图中的浅层特征相似性分配注意力权重,难以捕捉欺诈用户潜在的协同行为;GraphSAGE虽通过邻居采样在Pet数据集的AUC达到74.71%,但50.00%的宏召回率表明对少数类的识别能力不足,原因是该模型未建模评论文本中的语义欺诈线索. 相对于GraphSAGE而言,EC-GNN通过双图建模将用户交互与评论语义动态融合,在Pet数据集上的AUC和F1分别提升13.36个百分点与17.58个百分点,验证了多模态信息互补对欺诈检测的重要性. 面向欺诈检测的改进GNN模型(GEM、GraphConsis、PC-GNN等)的性能差距主要体现在多模态信息融合与动态关系建模的缺失. 以GraphConsis为例,尽管该模型通过一致性正则化和高阶全局关联在Instrument数据集的AUC为77.11%,达到了相对较高的性能,但F1显著低于EC-GNN,原因是该模型未显式融合评论语义的时间动态特征,导致对欺诈模式的隐式关联捕获不足. PC-GNN在Yelp数据集上的宏召回率显著低于EC-GNN,差异源于PC-GNN的设计初衷是处理多关系异构网络,本研究中用户行为与评论文本的关联本质上是单关系下的多模态特征融合问题,PC-GNN基于元路径的异构建模难以直接适配此类场景. EC-GNN通过双通道架构分离行为与语义模态的学习,由多头注意力机制融合2类模态的高阶特征,实现对欺诈用户的多维度判别,在Yelp数据集中,EC-GNN的宏召回率较PC-GNN提升了约25个百分点.
表 2 不同欺诈检测方法在实验用数据集上的性能对比
Tab.2
| 方法 | Pet | Garden | Instrument | Yelp | |||||||||||
| AUC | Rm | F1 | AUC | Rm | F1 | AUC | Rm | F1 | AUC | Rm | F1 | ||||
| GCN | 49.89 | 50.00 | 49.12 | 49.70 | 50.00 | 48.45 | 55.11 | 51.43 | 45.88 | 52.35 | 50.00 | 49.10 | |||
| GAT | 50.48 | 50.32 | 49.53 | 49.04 | 50.00 | 48.75 | 58.29 | 52.77 | 48.75 | 51.70 | 50.21 | 49.29 | |||
| GraghSAGE | 74.71 | 50.00 | 49.89 | 73.19 | 50.13 | 49.45 | 76.22 | 55.43 | 57.68 | 67.43 | 50.00 | 49.29 | |||
| GEM | 64.36 | 59.16 | 53.94 | 54.39 | 52.11 | 51.77 | 66.72 | 63.25 | 52.79 | 64.87 | 49.89 | 49.09 | |||
| GeniePath | 53.99 | 50.00 | 50.03 | 55.77 | 51.02 | 48.97 | 53.21 | 50.00 | 49.58 | 51.20 | 50.00 | 49.79 | |||
| FdGars | 63.93 | 52.00 | 50.14 | 56.12 | 51.31 | 48.58 | 52.58 | 50.78 | 47.88 | 52.37 | 51.32 | 50.03 | |||
| GraphConsis | 79.93 | 74.88 | 57.68 | 74.58 | 71.59 | 54.26 | 77.11 | 72.29 | 55.98 | 69.18 | 52.10 | 49.28 | |||
| PC-GNN | 67.86 | 61.90 | 51.42 | 63.66 | 59.07 | 53.90 | 63.67 | 59.34 | 50.01 | 61.08 | 54.77 | 52.82 | |||
| EC-GNN | 87.14 | 79.08 | 62.05 | 88.07 | 78.52 | 67.03 | 88.89 | 81.09 | 65.21 | 86.73 | 79.03 | 54.26 | |||
3.4. 消融实验
控制变量法对模型核心组件进行解耦分析,具体实验设置如下. 1)EC-NoERG:移除实体关系图模块及相关特征表征,将模型简化为仅依赖评论关系图的推理架构. 2)EC-NoCRG:剔除评论关系图及其特征提取层,保留实体关系图运算,使模型仅基于用户交易网络拓扑进行决策. 3)EC-NoAtt:在特征融合阶段移除多头加性注意力层,直接采用最终迭代输出作为节点表示,以验证EC-GNN在动态融合多层次特征中的有效性. 4)EC-Tfidf:将评论文本嵌入层由BERT预训练模型替换为TF-IDF词袋模型,保持其他模块参数不变,验证上下文感知的文本建模对欺诈模式识别的必要性.
如表3所示为EC-GNN及其模型组件在4个数据集中的预测性能评价指标对比. 可以看出,完整模型在所有数据集和指标上均取得最优表现,验证了多组件协同的有效性. 进一步分析发现,评论关系图的移除(EC-NoCRG)引发系统性性能大幅下降,尤其在Garden数据集上,AUC骤降31.78个百分点至56.29%,F1最低降至53.48%,证实评论文本的时空关联是欺诈检测的核心特征. 相较而言,实体关系图的消融(EC-NoERG)对性能影响存在领域异质性,在Instrument数据集AUC下降4.33个百分点,表明用户行为属性对高价值商品欺诈识别具有关键作用,而在Garden数据集仅下降1.55个百分点,暗示该场景中交易行为模式的可解释性较弱. 注意力机制的移除(EC-NoAtt)虽对基础AUC指标影响有限,在Pet数据集仅下降2.3个百分点,但导致Instrument数据集宏召回率下降6.77个百分点、F1下降6.81个百分点,揭示该组件在细粒度特征融合中的重要性,特别是在处理欺诈模式边界模糊场景时,动态权重分配可增强语义判别性. 文本表征对比实验(EC-Tfidf)凸显深度语义建模的必要性,尽管TF-IDF在Pet数据集AUC达85.63%,但其在Yelp领域的AUC较BERT下降16.28个百分点,且所有数据集的F1平均低2.1~4.3个百分点,说明传统文本统计特征难以捕捉欺诈评论中隐含的上下文信息. 跨领域分析表明,模型对复杂场景具有差异化敏感性,但整体上验证了双通道图神经架构在行为-语义联合建模中的有效性.
表 3 基于实验用数据集的模型消融实验结果对比
Tab.3
| 消融模型 | Pet | Garden | Instrument | Yelp | |||||||||||
| AUC | Rm | F1 | AUC | Rm | F1 | AUC | Rm | F1 | AUC | Rm | F1 | ||||
| EC-NoERG | 84.65 | 72.42 | 59.33 | 86.52 | 76.73 | 65.56 | 84.56 | 76.86 | 60.89 | 84.69 | 76.68 | 52.60 | |||
| EC-NoCRG | 63.89 | 57.25 | 53.89 | 56.29 | 53.94 | 53.48 | 61.55 | 60.75 | 53.62 | 70.12 | 65.40 | 52.19 | |||
| EC-NoAtt | 84.84 | 75.09 | 59.00 | 82.44 | 72.56 | 63.21 | 82.49 | 74.32 | 58.40 | 84.67 | 76.79 | 51.95 | |||
| EC-Tfidf | 85.63 | 72.85 | 60.86 | 78.30 | 61.13 | 60.70 | 74.23 | 69.09 | 56.95 | 70.45 | 65.13 | 52.19 | |||
| EC-GNN | 87.14 | 79.08 | 62.05 | 88.07 | 78.52 | 67.03 | 88.89 | 81.09 | 65.21 | 86.73 | 79.03 | 54.26 | |||
3.5. 参数分析
对比模型在调整实体图和评论图隐藏层的维度大小和迭代次数后的性能指标变化,探究隐藏层维度和迭代次数在欺诈检测模型中的关键作用. 在每个实验中,保持其他参数不变,仅调整隐藏层维度或迭代次数,观察对模型性能的影响. 为了防止改变参数后产生过拟合,调整L2系数以适应不同模型配置. 实体图维度大小分别设置为16、32、64和128,评论图维度大小分别设置为256、512、1 024、2 048,迭代次数分别设置为1、2、3.
如图2、图3所示为调整隐藏层维度DH对EC-GNN预测性能的影响情况. 实验结果表明,隐藏层维度对多模态分类模型的性能具有非线性调控效应. 当实体交互图的隐藏层维度从16逐步提升至64时,数据集的AUC、Rm及F1均呈现系统性改善,平均增幅达到3个百分点左右,表明模型对实体间复杂关系表征能力的增强. 当维度进一步扩展至128时,由于模型复杂度过高引发过拟合风险,3个核心指标出现同步衰减,其中F1下降最为显著,验证了低维特征空间模型对实体交互数据的适配性优势. 评论文本图的维度敏感特性更强. 当维度从256增至1 024时,各数据集的性能呈现稳定提升,Instrument数据集在此阶段获得最大增益,表明高维空间能有效捕获评论文本的语义非线性特征. 当维度扩展至2 048时,Pet和Yelp数据集在同等维度下出现指标同步下降,证实了维度过度扩展对多数场景的负面影响,盲目增加模型容量可能破坏特征空间的语义连贯性. 值得注意的是,Garden数据集出现与其他3个数据集相悖的指标分化现象,其宏召回率提升7.1个百分点且F1增长1.4个百分点, AUC微降0.2个百分点,这种有限的性能提升伴随着计算成本的显著增加,从效率与性能的权衡角度分析,选择1 024维能在保持较高性能的同时显著降低计算开销.
图 2
图 2 实体交互图隐藏层维度对双通道图神经网络方法性能的影响分析
Fig.2 Impact of entity interation graph hidden dimensions on performance of dual-channel graph neural network method
图 3
图 3 评论语义图隐藏层维度对双通道图神经网络方法性能的影响分析
Fig.3 Impact of comment semantic graph hidden dimensions on performance of dual-channel graph neural network method
如图4所示为调整迭代次数NI对EC-GNN预测性能的影响情况,每次邻居信息聚合的迭代操作对应GNN的一层信息聚合,即迭代次数等同于GNN层数与邻居跳数. 实验结果表明,模型性能与网络深度呈现显著非线性关联. 当GNN层数设置为1时,模型因结构浅层化导致特征聚合能力不足,4个数据集的AUC、Rm和F1均处于基线水平. 随着层数增加至2层,模型在跨邻域特征传播过程中获得优化,4个数据集的3个指标均呈现系统性提升,宏召回率提升至78.52%~81.09%,较1层结构普遍提升约3~10个百分点,F1提升约2个百分点,证实适度增加层数能够增强模型表征能力. 当层数扩展至3层时,性能出现显著退化现象. 所有数据集的宏召回率降幅达1~8个百分点,AUC下降幅度为2.5~7.7个百分点,F1亦同步降低3~5个百分点. 这种性能衰退与过参数化效应密切相关,深层GNN在多次迭代特征传播中引入冗余噪声,削弱模型对欺诈模式的判别能力. 实验结果表明,在本研究的图数据场景下,2层GNN结构在模型性能上达到最优.
图 4
图 4 迭代次数对双通道图神经网络方法性能的影响分析
Fig.4 Impact of iterations on performance of dual-channel graph neural network method
3.6. 注意力可视化
在对Instrument训练集的最终训练迭代完成后,对生成的实体关系图进行可视化分析. 随机抽取4个欺诈目标节点和正常目标节点的相关网络进行可视化分析,结果如图5、图6所示. 其中边的粗细程度反映注意力权重的大小,边越粗表示权重越高. 当目标节点为欺诈节点时,欺诈节点与其欺诈邻居节点之间注意力权重较大,表明模型能够聚焦于欺诈行为的关联特性,从而有效识别潜在的欺诈模式. 当目标节点为正常节点时,正常节点倾向于对正常邻居节点分配更高的注意力权重,表明模型在同质关系(如欺诈节点-欺诈节点、正常节点-正常节点)中赋予更高的注意力权重,在非同质关系(如正常节点-欺诈节点)中显著弱化权重,从而有效区分不同节点类型及其交互特性.
图 5
图 5 欺诈节点及其一跳邻居的网络可视化
Fig.5 Visualization of fraud nodes and their one-hop neighbors
图 6
图 6 正常节点及其一跳邻居的网络可视化
Fig.6 Visualization of normal nodes and their one-hop neighbors
4. 结 语
本研究提出融合用户行为与评论关系的双通道电商欺诈检测方法,主要贡献包括:1)提出包含交易行为与评论关系的双图建模框架,将评论作为独立语义实体,突破传统方法重节点而轻连边的局限,丰富了多模态图结构在欺诈检测领域的应用范式;2)设计多头加性注意力与参数共享的轻量化架构,既缓解了现有GNN的特征同质化问题,又提升了大规模电商数据的处理效率. 3)在公开数据集上通过多方法对比与模块消融实验,量化验证了双图融合、注意力机制的有效性,且所提方法性能优于基线模型,为电商平台降低欺诈损失提供可落地的技术方案. 本研究聚焦于静态场景下欺诈团伙的共性特征挖掘,未来将扩展至动态图建模,以捕捉用户行为的时序演化模式,进一步提升方法对新兴欺诈策略的适应性.
参考文献
运用数据挖掘技术检测金融欺诈行为
[J].
Detecting financial fraud using data mining techniques
[J].
Predicting fraudulent financial statements using fraud detection models
[J].
一种面向网络支付反欺诈的自动化特征工程方法
[J].
An automated feature engineering method for online payment fraud detection
[J].
基于kNN-Smote-LSTM的消费金融风险检测模型: 以信用卡欺诈检测为例
[J].
KNN-smote-LSTM based consumer financial risk detection model: a case credit card fraud detection
[J].
Detection of financial statement fraud using deep learning for sustainable development of capital markets under information asymmetry
[J].
Enhanced autoencoder-based fraud detection: a novel approach with noise factor encoding and SMOTE
[J].DOI:10.1007/s10115-023-02016-z [本文引用: 1]
Graph anomaly detection with graph neural networks: current status and challenges
[J].DOI:10.1109/ACCESS.2022.3211306 [本文引用: 1]
Financial fraud detection using graph neural networks: a systematic review
[J].DOI:10.1016/j.eswa.2023.122156 [本文引用: 1]
Hypergraph convolution and hypergraph attention
[J].DOI:10.1016/j.patcog.2020.107637 [本文引用: 1]
Graph convolutional networks with dual message passing for subgraph isomorphism counting and matching
[J].DOI:10.1609/aaai.v36i7.20725 [本文引用: 1]
Spammer group detection and diversification of customers’ reviews
[J].DOI:10.7717/peerj-cs.472 [本文引用: 1]
A subgraph-based knowledge reasoning method for collective fraud detection in E-commerce
[J].DOI:10.1016/j.neucom.2021.03.134 [本文引用: 1]
GeniePath: graph neural networks with adaptive receptive paths
[J].DOI:10.1609/aaai.v33i01.33014424 [本文引用: 1]
/
| 〈 |
|
〉 |

