浙江大学学报(工学版), 2023, 57(3): 495-502 doi: 10.3785/j.issn.1008-973X.2023.03.007

计算机与控制工程

结合社交影响和长短期偏好的个性化推荐算法

周青松,, 蔡晓东,, 刘家良

桂林电子科技大学 信息与通信学院,广西 桂林 541004

Personalized recommendation algorithm combining social influence and long short-term preference

ZHOU Qing-song,, CAI Xiao-dong,, LIU Jia-liang

School of Information and Communication, Guilin University of Electronic Technology, Guilin 541004, China

通讯作者: 蔡晓东,男,研究员,博导.orcid.org/0000-0001-8505-1007. E-mail: caixiaodong@guet.edu.cn

收稿日期: 2022-03-9  

基金资助: 广西创新驱动发展专项(AA20302001)

Received: 2022-03-9  

Fund supported: 广西创新驱动发展专项(AA20302001)

作者简介 About authors

周青松(1997—),男,硕士生,从事数据挖掘和推荐算法研究.orcid.org/0000-0003-2396-1691.E-mail:1796296884@qq.com , E-mail:1796296884@qq.com

摘要

针对基于会话的推荐算法只捕获用户的短期动态兴趣,忽略长期兴趣和社交好友对用户行为的影响,提出结合社交影响和长短期偏好的推荐算法. 设计新颖的异构关系图来组织用户的社交关系和历史会话,提出基于注意力机制的异构图神经网络对图进行学习,得到融合用户社交影响的长期偏好. 针对社交影响力不一致容易引入噪声的问题,提出加权剪枝策略,减少了噪声干扰且丰富了图结构信息. 利用无损的会话建模方法捕获用户的短期偏好,将短期偏好与长期偏好进行自适应融合,得到反映用户全局偏好的特征表示. Gowalla和Delicious数据集上的实验结果表明,所提方法的各项指标相比现有先进方法均有显著提升,证明了所提算法的有效性.

关键词: 推荐算法 ; 社交影响 ; 长短期偏好 ; 加权剪枝策略 ; 异构关系图 ; 异构图神经网络

Abstract

Session-based recommendation algorithms only capture users’ short-term dynamic interests, ignoring the impact of long-term interests and social friends on their behavior. To address the problem, a recommendation algorithm combining social influence and long short-term preferences was proposed. Firstly, a novel heterogeneous relation graph was designed to organize users’ social relations and historical interaction behaviors. And a heterogeneous graph neural network based on the attention mechanism was proposed to learn the graph, and to obtain long-term preference for integrating social influence of users. Moreover, considering the problem of noise caused by inconsistent social influence, a weighted and pruning strategy was proposed to reduce noise interference and enrich the graph structure information. Then, a lossless session modeling method was used to capture users’ short-term preference. Finally, users’ short-term preference and long-term preference were adaptively fused to obtain a feature representation that reflects users’ global preferences. Experimental results on Gowalla and Delicious datasets show that the indicators of the proposed method are significantly improved compared with the existing advanced methods, which proves the effectiveness of the proposed algorithm.

Keywords: recommendation algorithm ; social influence ; long short-term preference ; weighted and pruning strategy ; heterogeneous relation graph ; heterogeneous graph neural network

PDF (793KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

周青松, 蔡晓东, 刘家良. 结合社交影响和长短期偏好的个性化推荐算法. 浙江大学学报(工学版)[J], 2023, 57(3): 495-502 doi:10.3785/j.issn.1008-973X.2023.03.007

ZHOU Qing-song, CAI Xiao-dong, LIU Jia-liang. Personalized recommendation algorithm combining social influence and long short-term preference. Journal of Zhejiang University(Engineering Science)[J], 2023, 57(3): 495-502 doi:10.3785/j.issn.1008-973X.2023.03.007

传统的推荐算法往往使用用户的历史交互信息挖掘用户的兴趣表示,得到的是长期和静态的偏好. 除了长期偏好,用户对内容的选择还依赖于他们短期的、最近的偏好以及与时间相关的上下文场景,并且他们对内容的偏好会随着时间的推移而演变[1].为了捕获用户的短期和动态的偏好,基于会话的推荐[1]被提出,并引起了广泛关注.

Hidasi等[2]受自然语言处理中的序列建模任务启发,将循环神经网络(recurrent neural network, RNN) [3]运用于基于会话的推荐,解决了诸如在基于内容和基于协同过滤的传统方法中,每个内容相互独立,不能建模内容间连续信息的问题. Li等[4]提出将注意力机制整合到RNN中,以捕获用户的序列行为和主要目的. Liu等[5]使用注意力层来替换之前工作中的所有RNN编码器,并注意捕捉用户对当前会话的一般兴趣和最后点击内容的短期兴趣. 随着图神经网络(graph neural networks,GNN)[6-7]对图结构数据强大的建模能力,研究者开始尝试将其应用于推荐系统领域. Wu等[8]提出SR-GNN模型,将会话序列建模为图结构化的数据,不仅能够捕捉用户和内容之间交互信息,还保留了内容之间的关系结构. Zhang等[9]认为,会话中的内容可以由一些潜在的分类抽象概念来描述,于是提出新的预测模块,用于挖掘内容的潜在分类分布,并基于学习出的会话级潜在类别表示去预测下一项内容的得分,再和由会话序列建模得到的得分进行分数上的融合. 针对基于GNN的会话推荐普遍存在的有损会话编码问题和无效的远程依赖捕获问题,Chen等[10]提出LESSR模型,实现了无信息丢失的会话建模. Pang等[11]指出,几乎现有的基于会话的推荐方法都依赖于内容转换模式,在建模用户偏好时由于用户历史会话被忽略,导致了非个性化推荐,为此提出异构全局图神经网络捕获所有会话中的内容转换,以便更好地从当前和历史会话中推断用户的偏好. 该方法实现了更加准确且满足个性化需求的推荐.

在社交网络中,用户与内容的交互不仅依赖自身兴趣,还可能受社交好友的影响. 研究者试图将用户的社交网络信息融入推荐框架,以更好地了解用户的偏好[12-15]. 将用户好友喜欢的内容推荐给该用户,可以一定程度上解决传统推荐算法普遍面临的数据稀疏性和冷启动问题. 但现有社交推荐方法往往只单独对社交关系建模,没有考虑用户各个交互内容之间的顺序相关性和用户的短期动态偏好,不适用于基于会话的推荐. Song等[16]将用户的社交关系融合到基于会话的推荐中,通过RNN建模会话中的用户行为,并利用图注意力网络捕获好友的影响,实现了基于会话的社交推荐. 随后,Gu等[17]提出通过内容图嵌入和上下文社交关系建模的方法来捕获用户偏好和社交影响.

受文献[11]的启发,本研究针对现有基于会话的推荐方法忽略用户的长期偏好、社交好友对用户下一次交互行为的影响,以及现有社交推荐算法在构图或建模时假设每个好友邻居的影响力一致容易引入噪声的问题,提出结合社交影响和长短期偏好的个性化推荐算法(social influence and long short-term preferences for personalized recommendation,SLSPR). SLSPR构造包含用户历史交互行为及社交关系的异构关系图,用基于注意力机制的异构图神经网络挖掘异构关系图,学习出包含用户社交影响的长期偏好表示. 在构造异构关系图时,通过加权剪枝边给予模型更多的先验知识并过滤潜在噪声. 将结合了社交影响的长期偏好表示和利用无损的会话建模方法的短期偏好表示进行自适应特征融合,得到用户的全局偏好.

1. SLSPR模型

1.1. 问题定义

$ U{\text{ = \{ }}{u_1},{u_2},\cdots,{u_{|U|}}{\text{\} }} $$ V{\text{ = \{ }}{v_1},{v_2},\cdots,{v_{|V|}}{\text{\} }} $分别表示用户和内容的节点集合,其中 $ |U| $为用户数, $ |V| $为内容数. $ F = (U,{E^{\text{S}}}) $为用户的社交网络,其中 $ {E^{\text{S}}} $为社交联系的边集合. 用户 $ u \in U $的历史会话记录集 $ {S_u} = \{ S_u^1,S_u^2,\cdots,S_u^M\} $,其中 $ M $$ u $ 的会话总数. $ S_u^M = \{ v_u^1,v_u^2,\cdots,v_u^N\} $$ u $ 的当前会话,是由 $ u $ 交互过的按照时间戳排序的内容列表,其中 $ v_u^n \in V $为该会话中的第 $ n $个内容, $ N $ 为会话的长度. $ \hat {\boldsymbol{y}} $ 为用户下一次将交互的内容的概率分布.

将计划解决的问题进行如下定义:给定用户的历史会话、当前会话信息以及社交网络关系,通过构建有效算法挖掘用户的长短期偏好和社交影响,得到更加准确的用户嵌入表示和内容嵌入表示,以精准预测用户下一次最有可能交互的内容.

1.2. 模型框架

SLSPR模型的整体框架如图1所示. 1)利用所有用户的历史会话数据和社交网络信息,通过加权剪枝操作,生成具有丰富关系和语义信息的异构关系图. 2)利用基于注意力机制的异构图神经网络(heterogeneous graph neural network based on attention mechanism,A-HGNN)对异构关系图中的节点进行特征学习,得到包含用户社交影响和长期偏好特征的用户嵌入表示(简称为长期偏好表示)以及具有丰富语义的内容嵌入表示. 3)对用户的当前会话序列先转换成会话图,再利用会话编码器进行建模,学习出用户短期偏好表示. 利用门机制对用户的长期偏好表示和短期偏好表示进行自适应特征融合,以动态结合2种偏好的不同影响,得到用户的全局偏好表示. 4)将该偏好表示和各个内容嵌入表示输入Softmax层,得到用户对下一个交互内容的概率分布.

图 1

图 1   结合社交影响和长短期偏好的个性化推荐算法模型的整体框架图

Fig.1   Framework of social influence and long short-term preferences for personalized recommendation model


1.3. 异构关系图构造

受文献[11]、[18]的启发,为了有效地利用所有用户的历史会话信息并结合社交好友的影响,设计新的图构造方法步骤如下. 1)根据用户的社交网络和历史会话记录,将用户与社交好友的链接关系和用户历史会话中的各个交互行为集成到同一张图中. 不同于主流方法构造的只存在1种节点或1种边的同质图(常见的“内容-内容图”和“用户-内容二分图” ),该图包含用户和内容2种节点,存在用户-用户边和用户-内容边2种关系边,是节点和边都存在异质特点的图,因此命名为异构关系图. 通过将用户的社交联系和历史交互内容集成,在后续的图建模过程中,有利于用户节点和内容节点学习到更多的知识以增强它们的特征表示. 2)为了充分地挖掘用户的长期偏好,克服现有社交推荐方法在构图时假设每个好友邻居的影响力一致容易引入噪声的问题,采用加权剪枝策略对图中的边进行预处理,使图具备更多的先验知识并降低了在后续对图进行建模时容易引发的噪声干扰. 根据上述步骤构成具有丰富关系和语义信息的异构关系图 $ G = (\upsilon ,\varepsilon ) $,其中 $ \upsilon = U \cup V $$ \varepsilon = {E_{_{{UU}}}} \cup {E_{_{{UV}}}} $$ {E_{_{{UU}}}} $为用户-用户边的集合, $ {E_{_{{UV}}}} $为用户-内容边的集合.

1.3.1. 加权剪枝策略

考虑到用户对不同内容的兴趣不一致,用户的各个社交好友对用户的影响也不尽相同. 为了显式区分不同内容和社交好友的影响,避免潜在噪声干扰,提出加权剪枝策略. 对于用户-用户边,先计算用户间的社交影响力并对该边进行加权操作,针对影响力低于预设阈值的边进行剪枝操作,以提供先验知识并避免在后续利用A-HGNN进行消息传递时聚合来自低影响力好友的节点信息,使得到的用户嵌入表示引入噪声. 对于用户-内容边,计算内容对用户的吸引力,利用吸引力分数对边进行加权,以提供更多关于用户交互行为和兴趣偏好的先验知识.

1.3.2. 社交影响力计算

在实际情形中,并非用户的所有好友都对该用户有兴趣偏好层面的积极影响,不同好友的兴趣往往不同. 好友之间的推荐也不是同等重要的,相比一般好友,用户会更加信任同一生活圈的熟人,因此拥有更多共同好友的2个用户的相互影响力可能更大. 由此提出从兴趣相似度和关系亲密度来计算社交影响力 $ {\text{SI}} $的方法,计算式为

$ {\text{SI}}\,({u_i},{u_j}) = {\text{Sim}}\,({u_i},{u_j})+{\text{Fim}}\,({u_i},{u_j}). $

式中: $ {u_i} $为目标用户; $ {u_j} $为其社交好友; $ {\text{Sim}}\,(\cdot) $$ {\text{Fim}}\,(\cdot) $分别为好友间的兴趣相似度得分和关系亲密度得分,计算式分别为

$ \text{Sim}\,({u}_{i},{u}_{j})=\frac{\left|{I}_{{u}_{i}}\cap {I}_{{u}_{j}}\right|}{\sqrt{\left|{I}_{{u}_{i}}\right|\cdot \left|{I}_{{u}_{j}}\right|}}\text{,} $

$ {\text{Fim}}\,({u_i},{u_j}) = \frac{{\left| {{F_{{u_i}}} \cap {F_{{u_j}}}} \right|}}{{\left| {{F_{{u_i}}} \cup {F_{{u_j}}}} \right|}}. $

式中: $ {I_{{u_i}}} $$ {I_{{u_j}}} $分别为对应用户的历史交互内容集合, $ {F_{{u_i}}} $$ {F_{{u_j}}} $分别为对应用户的好友集合.

1.3.3. 内容吸引力计算

不同内容对用户产生的吸引力不同,如果用户在历史交互行为中频繁交互某一内容,代表该内容对用户有较高的吸引力,用户对该内容有更浓烈的兴趣. 由此,提出根据各内容占用户交互行为的比重来计算内容吸引力 $ {\text{AT}} $的方法,计算式为

$ {\text{AT}}\,({u_i},{v_j}) = \frac{{N({u_i},{v_j})}}{{\displaystyle\sum\nolimits_{k \in {I_{{u_i}}}} {N({u_i},{v_k})} }}. $

式中: $ N({u_i},{v_j}) $为用户 $ {u_i} $在其历史会话中对内容 $ {v_j} $交互过的总次数.

1.4. 基于A-HGNN的长期偏好和社交影响捕获

为了有效挖掘所构建异构关系图中节点和边的特征信息,受文献[11]的启发,基于A-HGNN对异构关系图进行建模. 通过不同节点之间的信息传递和聚合,学习出语义更加丰富的用户嵌入表示和内容嵌入表示. 遵循Li等[4]的做法,先将用户和内容序列号都嵌入 $ d $维向量空间,并随机初始化作为图中用户节点和内容节点的初始嵌入表示,分别为 ${{\boldsymbol{h}}^0}\left[ u \right] \in {{\bf{R}}^d}$$ {{\boldsymbol{h}}^0}\left[ v \right] \in {{\bf{R}}^d} $. A-HGNN有 $ L $层,各个节点的嵌入表示通过沿边传递消息和聚合邻居节点的特征来更新.

对于目标用户节点,其存在2种类型的邻居节点和边. 为了同时聚合来自相邻用户节点和相邻内容节点的信息,区分各邻居节点的重要性,采用注意力机制.

1)计算每个邻居节点和 $ u $之间的注意力权重,以表征不同邻居节点对 $ u $的影响大小,计算式为

$ \alpha _{{E_x}}^{l+1}(n,u){\text{ = Soft}}\left( {{{({\boldsymbol{q}}_{{E_x}}^{l{\text+}1})}^{\text{T}}}\sigma \left( {{\boldsymbol{W}}_{{E_x}}^{l+1}({{\boldsymbol{h}}^l}\left[ n \right]\parallel {{\boldsymbol{h}}^l}\left[ u \right])} \right)+{\boldsymbol{b}}_{{E_x}}^{l+1}} \right). $

式中: $ n \in N_u^G $$ u $在异构关系图 $ G $中的邻居节点, ${{\boldsymbol{h}}^l}\left[ u \right]$${{\boldsymbol{h}}^l}\left[ n \right]$分别为 $ u $$ n $在A-HGNN第 $ l $层的嵌入表示, $ {E_x} \in \{ {E_{_{{UU}}}},{E_{_{{UV}}}}\} $为特定的边类型, $ {\boldsymbol{q}}_{{E_x}}^{l{\text{+}}1} \in {{\bf{R}}^d} $$ {\boldsymbol{W}}_{{E_x}}^{l{\text{+}}1} \in {{\bf{R}}^{d \times 2d}} $均为可学习的参数, $ {\boldsymbol{b}}_{{{{E}}_x}}^{l{\text{+}}1} \in {{\bf{R}}^d} $为对应边 $ {E_x} $的特征向量, $ \parallel $为向量拼接, $ \sigma $为Sigmoid激活函数, $ {\text{Soft}} $为Softmax函数.

2)基于注意力权重聚合 $ u $所有邻居节点的信息,得到 $ u $的邻居聚合信息嵌入表示,计算式为

$ {{\boldsymbol{n}}^{l+1}}\left[ u \right] = \sum\limits_{n \in N_u^G} {\alpha _{{E_x}}^{l+1}} (n,u){{\boldsymbol{h}}^{l+1}}\left[ n \right]. $

$ u $的嵌入表示 $ {{\boldsymbol{h}}^l}\left[ u \right] $和其邻居聚合信息嵌入表示 $ {{\boldsymbol{n}}^{l+1}}\left[ u \right] $进行融合以更新嵌入表示,计算式为

$ {{\boldsymbol{h}}^{l+1}}\left[ u \right] = {\text{ReLU}}\left( {{{\boldsymbol{W}}^{l+1}}({{\boldsymbol{n}}^{l+1}}\left[ u \right]\parallel {{\boldsymbol{h}}^l}\left[ u \right])+{{\boldsymbol{b}}^{l+1}}} \right). $

式中: ${{\boldsymbol{W}}^{l+1}} \in {{\bf{R}}^{d \times 2d}}$${{\boldsymbol{b}}^{l+1}} \in {{\bf{R}}^d}$均为可学习的参数. 对式(5)~(7)迭代计算 $ L $次,在第 $ L $层获得用户节点的嵌入表示 $ {{\boldsymbol{h}}^L}\left[ u \right] $. 由于 $ {{\boldsymbol{h}}^L}\left[ u \right] $融合了好友的兴趣特征和自身的长期兴趣特征,为了表示方便,表述为融合社交影响的用户长期偏好表示 $ {\boldsymbol{h}}_{{\text{sL}}}^u $.

内容节点只存在用户与内容之间的边 $ {E_{_{{UV}}}} $,其邻居信息的聚合过程和节点信息的更新过程与用户节点类似. 在第 $ L $层可以获得内容节点 $ v $的嵌入表示 $ {{\boldsymbol{h}}^L}\left[ v \right] $,由于 $ {{\boldsymbol{h}}^L}\left[ v \right] $在异构关系图中聚合了不同用户及其社交好友的交互行为特征,具备更深层次的语义信息,为了表示方便,将 $ {{\boldsymbol{h}}^L}\left[ v \right] $表述为具有丰富语义的内容嵌入表示 ${\boldsymbol{ h}}_{\rm{R}}^v $.

1.5. 基于会话编码器的短期偏好捕获

得益于GNN的强大图建模能力,研究者开始采用GNN模型来对会话序列进行建模. Chen等[10]指出基于GNN的会话建模方法普遍存在2个问题. 1)有损会话编码问题:从会话序列到会话图的有损编码以及消息传递期间的排列不变聚合,忽略了有关会话转换的一些顺序信息. 2)无效的长期依赖捕捉问题:受GNN层数的限制,无法捕获会话中的某些远程依赖. 这2个问题都会影响最终的推荐效果.为了实现用户短期偏好的精准捕获,采用LESSR模型[10]作为会话编码器,对用户的当前会话进行序列建模,步骤如下. 1)将用户 $ u $的当前会话序列作为输入并转换成会话图,2)利用会话编码器对会话图进行建模,输出表征用户对当前会话全局偏好的图级别嵌入表示 $ {\boldsymbol{s}}_{\text{g}}^u $后,与表征局部偏好的最近时刻的内容节点的嵌入表示 $ {\boldsymbol{s}}_{\text{l}}^u $结合,生成短期偏好表示 $ {\boldsymbol{h}}_{\rm{S}}^u $

$ {\boldsymbol{h}}_{\text{S}}^u{\text{ = }}{{\boldsymbol{W}}_{\text{S}}}({\boldsymbol{s}}_{\text{g}}^u\parallel {\boldsymbol{s}}_{\text{l}}^u). $

式中: ${{\boldsymbol{W}}_{\text{S}}} \in {{\bf{R}}^{d \times 2d}}$为可学习的参数.

本研究会话图中内容节点的初始特征无须按照LESSR中的方式进行随机初始化,而是利用具有丰富语义的内容嵌入表示 $ {\boldsymbol{h}}_{\text{R}}^v $根据内容序列号对相应节点的特征进行赋值,使会话图中各个内容节点具有包括用户及好友对内容的长期兴趣偏好、用户间的社交影响在内的更多先验知识.会话编码器还能够选择其他基于会话序列建模的方法,SLSPR模型具有很强的拓展性.

1.6. 基于门机制的用户全局偏好计算

用户的兴趣偏好复杂多变,他们可能有风格稳定的长期偏好和动态变化的短期偏好,还可能会受朋友的影响,这些都在不同程度上影响用户的下一次决策. 为了同时考虑并平衡以上因素的潜在影响,受文献[19]的启发,采用门机制进行自适应特征融合,得到结合用户社交影响和长短期偏好的用户全局偏好表示,计算式为

$ {\boldsymbol{g}}=\sigma \left({{\boldsymbol{W}}}_{\text{g}}\left[{{\boldsymbol{h}}}_{\text{sL}}^{u}\parallel {{\boldsymbol{h}}}_{\text{S}}^{u}\right]\right)\text{,} $

$ {\boldsymbol{h}}_{\text{G}}^u = {\boldsymbol{g}} \cdot {\boldsymbol{h}}_{{\text{sL}}}^u+(1 - {\boldsymbol{g}}) \cdot {\boldsymbol{h}}_{\text{S}}^u. $

式中: $ {\boldsymbol{g}} $为门控向量,用于控制不同偏好的特征对总体偏好特征的贡献; $ {{\boldsymbol{W}}_{\text{g}}} \in {{\bf{R}}^{d \times 2d}} $为可学习的参数.

1.7. 模型预测和训练

对于每个内容 $ {v_i} \in V $,使用其嵌入表示 $ {\boldsymbol{h}}_{\text{R}}^{{v_i}} $和目标用户的全局偏好表示 ${\boldsymbol{ h}}_{\text{G}}^u $计算分数,并利用Softmax函数进行归一化,计算式为

$ {\hat y_i} = {\text{Soft}}\,\,(({\boldsymbol{h}}_{\text{G}}^{u})^{{\text{T}}}{\boldsymbol{h}}_{\text{R}}^{{v_i}}){\text{.}} $

式中: $ {\hat y_i} $为预测用户下一次将要交互内容 $ {v_i} $的概率. 对于top-K推荐任务来说,将概率值最大的前K项内容作为推荐项目即可. 令独热向量 $ {\boldsymbol{y}} $为下一个交互内容的真实概率分布,损失函数采用预测概率分布 $ \hat{\boldsymbol{ y}} $与真实概率分布 ${\boldsymbol{ y}} $的交叉熵为

$ L({\boldsymbol{y}},\hat {\boldsymbol{y}}) = - {{\boldsymbol{y}}^{\text{T}}}\ln \,\, \hat {\boldsymbol{y}}. $

在反向传播下,对所有的嵌入表示及参数进行端到端的联合学习,完成SLSPR模型的训练.

2. 实验结果与分析

实验环境如下:操作系统为Ubuntu 18.04 LTS,硬件配置为Intel Core i9-10900X CPU with 3.70 GHz×20、NVIDIA GeForce RTX2080Ti,深度学习框架采用Pytorch和DGL,编程语言为Python.

2.1. 数据集

为了验证SLSPR的有效性,在2个公共现实数据集Gowalla[10]、Delicious[16]上进行实验. 这2个数据集都包含用户身份信息、社交关系信息、具有时间戳的用户与内容交互信息. 将每个数据集前80%的会话数据作为训练集,剩下20%作为测试集. 遵循Li等[4]的做法,滤掉短会话和不频繁的内容,应用数据增强技术对数据集进行预处理. 预处理后的数据集统计信息如表1所示.

表 1   2个实验数据集的统计信息

Tab.1  Statistical information of two experimental datasets

数据集 $ |U| $ $ |V| $ 交互数 会话数 社交关系数
Gowalla 33654 40473 1130463 258628 283972
Delicious 1313 5781 266044 60397 9130

新窗口打开| 下载CSV


2.2. 评价指标

为了评估推荐效果,采用基于会话的推荐任务中广泛使用的HR@K和MRR@K作为本实验的评价指标. 其中HR@K用于评估目标内容是否出现在top-K推荐列表中,计算前K个推荐项中被正确推荐的比例. MRR@K为正确推荐内容的倒数排名的平均值,该指标考虑推荐排名的顺序,指标的值越大,表示正确推荐内容的排名越靠前. 本研究取K=20.

2.3. 基线模型和参数设置

为了验证SLSPR模型的有效性,将其与4个有代表性的基于会话的基线模型进行比较:NARM[4]、DGRec[16]、LESSR[10]、FLCSP[9]. 按照Chen等[10]的做法,每种模型均使用最后20%的训练集作为验证集,应用网格搜索法寻找最优超参数. 超参数的范围:嵌入维度 $ d \in \{ 32,64,96,128\} $,学习率 $\eta \in \{{10^{-4},} {{\text{10}}^{{-3}},{\text{10}}^{{-2}},{\text{10}}^{{-1}}}\}$,GNN层数 $ L \in \{ 1,2,3,4 \} $. 实验使用Adam优化器来训练模型,batchsize设为512.

2.4. 实验结果

SLSPR模型与各个基线模型在HR@20和MMR@20评价指标上的实验对比结果,如表2所示.

表 2   结合社交影响和长短期偏好的个性化推荐算法(SLSPR)模型的有效性实验结果

Tab.2  Experimental results on validity of social influence and long short-term preferences for personalized recommendation (SLSPR) model

模型 Gowalla Delicious
HR@20 MMR@20 HR@20 MMR@20
NARM 49.93 23.58 46.45 20.36
DGRec 50.44 24.05 47.43 20.69
LESSR 51.76 25.41 47.84 21.40
FLCSP 52.52 25.75 48.53 21.58
SLSPR 55.13 27.35 51.67 23.53

新窗口打开| 下载CSV


在对比的基线模型中,NARM将注意力机制整合到RNN中,捕获了用户的序列行为和主要目的. DGRec在此基础上还考虑到用户的行为会受好友的影响,将社交关系融合到基于会话的推荐中,利用基于注意力机制的图卷积网络来捕获朋友的影响,提高了推荐准确率. LESSR相比NARM进一步考虑了会话中内容之间的复杂转换行为,将每个会话建模为一张图,捕获了用户交互行为之间更复杂和隐含的关联. LESSR虽然没有考虑社交因素和历史行为的影响,但利用改进过的会话图构建方法及GNN模型,解决了基于GNN建模的会话推荐中普遍存在的有损会话编码问题和无效的远程依赖捕获问题,取得了比NARM和DGRec更好的推荐效果. FLCSP除了利用GNN建模会话序列并预测下一项内容的概率分数外,还通过所提出的潜在类别预测模块作为辅助任务生成了另一项概率分数,通过对2种概率分数进行分数级融合得到了对下一项内容的最终预测得分,相比其他基线模型,取得了更好的实验效果. SLSPR模型通过所设计的异构关系图和加权剪枝策略,使图中节点具备更多关联和丰富的上下文语义,利用A-HGNN对图进行建模,学习出更加精确的用户嵌入表示和内容嵌入表示,有效捕获了用户的社交影响和长期偏好. SLSPR模型将用户的长期偏好和利用LESSR中的无损会话建模方法所得到的短期偏好进行有效结合,获得了比所有基线模型更加全面的偏好表示.和基于匿名用户假设的LESSR和FLCSP相比,SLSPR在实际应用中能够实现具备社交属性和个性化的推荐效果.

表2中的对比实验结果可以看出,SLSPR模型显著优于所有对比基线模型. 在Gowalla数据集上,HR@20和MMR@20指标比先进的FLCSP模型分别提升了4.97%和6.21%,在Delicious数据集上,则分别提升了6.47%和9.04%. 实验结果表明了SLSPR模型的有效性.

2.5. 消融实验

为了证明SLSPR模型中各关键组件的有效性,进行消融实验分析.

2.5.1. 用户社交关系和长期偏好的影响

由于SLSPR模型在构建异构关系图时结合了用户的社交关系,用户好友的兴趣特征会通过用户-用户边传递给自身. 为了衡量社交关系的有效性,设计变体模型SLSPR-UU,表示去除异构关系图中的用户-用户边,这样通过A-HGNN得到的仅有用户自身的长期偏好表示. 将SLSPR-UU和SLSPR模型进行比较,可以衡量社交关系对推荐性能的影响;与LESSR模型相比,SLSPR-UU可以衡量用户自身的长期偏好对推荐性能的影响.

表3所示为用户社交关系和长期偏好的有效性对比. 可以看出,SLSPR-UU模型相比LESSR模型在2个数据集上的性能均明显提升,表明考虑用户的长期偏好十分有效. 原因是用户下一次的交互行为,很可能会与自己固有稳定的兴趣偏好、以往交互过的内容保持一致.由于社交关系的引入,SLSPR相比其变体模型SLSPR-UU在Gowalla上的HR@20和MMR@20指标分别提升了1.10%和2.13%,在Delicious上分别提升了1.43%和2.04%,说明社交关系也有助于提升推荐效果.在实际应用中,通过将好友所喜欢的或交互过的内容推荐给用户的方式,能够缓解推荐系统中普遍存在的数据稀疏性和冷启动问题.

表 3   用户社交关系和长期偏好的有效性对比

Tab.3  Effectiveness comparison of users’ social relationships and long-term preferences

模型 Gowalla Delicious
HR@20 MMR@20 HR@20 MMR@20
LESSR 51.76 25.41 47.84 21.40
SLSPR 55.13 27.35 51.67 23.53
SLSPR-UU 54.53 26.78 50.94 23.06

新窗口打开| 下载CSV


2.5.2. 加权剪枝操作的影响

在进行异构关系图构造时,对图中的边进行加权和剪枝的操作,为了验证所提出的加权剪枝策略的有效性,设计变体模型SLSPR-WP,表示不对边进行加权剪枝操作.

表4所示为加权剪枝操作的有效性对比. 可以看出,SLSPR-WP模型相比SLSPR模型在2个数据集上性能都出现下降,说明所提加权剪枝操作是有效的. 原因是通过对用户-用户边和用户-内容边进行加权,分别为用户-用户边和用户-内容边赋予社交影响力和交互次数的先验知识,有助于各个节点学习到更好的嵌入表示. 通过对低影响力的社交关系进行剪枝,还可以避免A-HGNN在进行邻居采样和消息传递时聚合到来自低影响力好友的节点信息,从而过滤了潜在噪声.

表 4   加权剪枝操作的有效性对比

Tab.4  Effectiveness comparison of weighting and pruning operations

模型 Gowalla Delicious
HR@20 MMR@20 HR@20 MMR@20
SLSPR 55.13 27.35 51.67 23.53
SLSPR-WP 54.74 27.07 51.26 23.23

新窗口打开| 下载CSV


2.5.3. 社交影响力阈值的影响

为了显式地衡量用户的各个社交好友对用户的影响程度,通过兴趣相似度和关系亲密度,计算社交影响力并对用户-用户边进行加权,根据设定阈值剪枝掉影响力较低的社交关系边. 不同阈值 $ \theta $对社交关系数量影响如表5所示,对推荐性能的影响如图2所示. 表中,Ns为按照阈值设置进行剪枝后剩余的社交关系数,P为剩余关系数占总数的比例. 由表可知,阈值设得越大,滤掉的社交关系数量越多,所剩余的数量越少. 在2个数据集中,阈值对Gowalla的影响更明显,当 $ \theta $=2、5时,分别剩余20.24%和3.30%的社交关系,Delicious的分别为70.01%和13.87%. 若 $ \theta $=0,即不进行剪枝操作,相当于和现有社交推荐方法的处理方式保持一致,采用全部的社交关系. 由图可知,当 $ \theta $=2时,在2个数据集上HR@20和MMR@20指标都取得了最佳结果; $ \theta $=1、3时的指标均比 $ \theta $=0时的有一定提升,说明采用全部社交关系的惯用设置往往存在噪声,通过设置合适阈值过滤低影响力、保留高质量关系的剪枝方法能够有效降噪.

表 5   社交影响力阈值对社交关系数量的影响

Tab.5  Impact of social influence threshold on number of social relationships

$ \theta $ Gowalla Delicious
Ns P/% Ns P/%
012345 283 972116 71457 48029 15415 9869 384 10041.1020.2410.275.633.30 9 1307 9326 3924 5742 8741 266 10086.8870.0150.1031.4813.87

新窗口打开| 下载CSV


图 2

图 2   社交影响力阈值对推荐性能的影响

Fig.2   Influence of social influence threshold on recommendation performance


3. 结 语

本研究提出结合社交影响和长短期偏好的个性化推荐算法SLSPR. 设计异构关系图的图结构化方法来组织用户的社交关系和历史交互行为,通过所提出的基于注意力机制的异构图神经网络实现用户的社交影响和长期兴趣偏好的充分捕获. 利用无损的会话建模来捕获用户的短期偏好,将其与长期偏好动态结合得到用户最终的全局偏好表示. 提出加权剪枝策略以解决各邻居节点重要性不一致和低影响力社交关系可能会引入噪声的问题,使异构关系图具备更多的先验知识. 在Gowalla、Delicious数据集上的对比实验结果证明了所提SLSPR模型的有效性,与先进模型相比有较大提升. 本研究尚未挖掘历史会话中不同内容之间隐含的复杂转换信息,如何更加有效地对用户的短期兴趣表示进行提取有待深入研究.

参考文献

WANG S, CAO L, WANG Y, et al

A survey on session-based recommender systems

[J]. ACM Computing Surveys, 2022, 54 (7): 1- 38

[本文引用: 2]

HIDASI B, KARATZOGLOU A, BALTRUNAS L, et al. Session-based recommendations with recurrent neural networks [EB/OL]. [2022-03-09]. https://arxiv.org/pdf/1511.06939.pdf.

[本文引用: 1]

MIKOLOV T, KARAFIAT M, BURGET L, et al. Recurrent neural network based language model [C]// Interspeech. Chiba: [s. n.], 2010: 1045-1048.

[本文引用: 1]

LI J, REN P, CHEN Z, et al. Neural attentive session-based recommendation [C]// Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. Singapore: ACM, 2017: 1419-1428.

[本文引用: 4]

LIU Q, ZENG Y, MOKHOSI R, et al. STAMP: short-term attention/memory priority model for session-based recommendation [C]// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London: ACM, 2018: 1831-1839.

[本文引用: 1]

KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks [EB/OL]. [2022-03-09]. https://arxiv.org/pdf/1609.02907.pdf.

[本文引用: 1]

HAMILTON W, YING Z, LESKOVEC J. Inductive representation learning on large graphs [C]// Proceedings of the 31st International Conference Neural Information Processing Systems. Long Beach: [s. n.], 2017: 1025-1035.

[本文引用: 1]

WU S, TANG Y, ZHU Y, et al. Session-based recommendation with graph neural networks [C]// Proceedings of the AAAI Conference on Artificial Intelligence. Honolulu: AAAI, 2019: 346-353.

[本文引用: 1]

ZHANG Z, WANG B

Fusion of latent categorical prediction and sequential prediction for session-based recommendation

[J]. Information Sciences, 2021, 569: 125- 137

DOI:10.1016/j.ins.2021.04.019      [本文引用: 2]

CHEN T, WONG R C W. Handling information loss of graph neural networks for session-based recommendation [C]// Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. [S. l.]: ACM, 2020: 1172-1180.

[本文引用: 6]

PANG Y, WU L, SHEN Q, et al. Heterogeneous global graph neural networks for personalized session-based recommendation [C]// Proceeding of the 15th ACM International Conference on Web Search and Data Mining. [S. l.]: ACM, 2022: 775-783.

[本文引用: 4]

MA H, ZHOU D, LIU C, et al. Recommender systems with social regularization [C]// Proceedings of the 4th ACM International Conference on Web Search and Data Mining. Hong Kong: ACM, 2011: 287-296.

[本文引用: 1]

ZHAO T, MCAULEY J, KING I. Leveraging social connections to improve personalized ranking for collaborative filtering [C]// Proceedings of the 23rd ACM International Conference on Information and Knowledge Management. Shanghai: ACM, 2014: 261-270.

XIAO L, MIN Z, YONGFENG Z, et al. Learning and transferring social and item visibilities for personalized recommendation [C]// Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. Singapore: ACM, 2017: 337-346.

FAN W, MA Y, LI Q, et al. Graph neural networks for social recommendation [C]// The World Wide Web Conference. San Francisco: [s. n.], 2019: 417-426.

[本文引用: 1]

SONG W, XIAO Z, WANG Y, et al. Session-based social recommendation via dynamic graph attention networks [C]// Proceedings of the 12th ACM International Conference on Web Search and Data Mining. Melbourne: ACM, 2019: 555-563.

[本文引用: 3]

GU P, HAN Y, GAO W, et al

Enhancing session-based social recommendation through item graph embedding and contextual friendship modeling

[J]. Neurocomputing, 2021, 419: 190- 202

DOI:10.1016/j.neucom.2020.08.023      [本文引用: 1]

FU B, ZHANG W, HU G, et al. Dual side deep context-aware modulation for social recommendation [C]// Proceedings of the Web Conference 2021. Ljubljana: [s. n.], 2021: 2524-2534.

[本文引用: 1]

YU Z, LIAN J, MAHMOODY A, et al. Adaptive user modeling with long and short-term preferences for personalized recommendation [C]// Proceedings of the 28th International Joint Conference on Artificial Intelligence. Macao: [s. n.], 2019: 4213-4219.

[本文引用: 1]

/