<img src="https://www.zjujournals.com/sci/images/1008-9497/images/logo.png" class="img-responsive">

图1 图嵌入原理

Fig.1 Graph embedding principle

2　模型与算法

早期，图数据量小、结构常规且维度较低，往往将图嵌入作为一种降维技术。首先将基于邻域的一组n个D维节点构建为一个相似图，然后将图的节点嵌入至d （d $≪$ D）维向量空间，使相互链接的节点彼此更靠近，如拉普拉斯特征图和局部线性嵌入（locally linear embedding，LLE）^［1］，主要用于解决可伸缩性，其时间复杂度为O（|V|²）^［8］。

2010年后，图嵌入研究转向可扩展的技术领域，以迎合并较好地利用实际网络数据的稀疏性。文献［1］运用邻接矩阵的近似分解，提出了大规模信息网络嵌入方法（large-scale information network embedding，LINE）^［1］，尝试通过保留一阶和二阶邻近度，扩展LINE，通过通用的奇异值分解（singular value decomposition，SVD）处理相似度矩阵，从而保留其高阶邻近度^［6］。结构化深度网络嵌入（structural deep network embedding，SDNE）通过自动编码器嵌入节点并捕获其高度非线性的依存关系^［9］。此类可伸缩方法的时间复杂度为O（|V|²）。

近年来，随着大数据、云计算、物联网等新兴技术的不断发展，海量数据的产生和利用场景的不断变化，学术及工业界针对不同的数据应用场景提出了不同的图嵌入算法与模型，共分六类：（1）基于降维方法的图嵌入；（2）基于矩阵分解的图嵌入；（3）基于网络拓扑结构信息的图嵌入；（4）基于神经网络的图嵌入；（5）基于生成式对抗网络的图嵌入；（6）基于超图网络的图嵌入。见表1。

表 1 嵌入模型概况

Table 1 Embedded model overview

类型	年份	刊物	方法	时间复杂度
基于降维方法	1986	Springer	PCA	-
	1994	NIPS	MDS	O（\|V\|d²）
	2000	Science	LLE	O（\|E\|d³）
	2001	IEEE	LDA	O（n³）
	2003	IJCAI	kernel methods	O（n）
基于矩阵分解	2008	ACM	NPMF	-
	2013	WWW	Graph Laplacian Eigenmaps	O（\|E\|d）
	2015	CIKM	GraRep	O（\|V\|³）
	2016	IEEE	HSCA网络	-
	2016	KDD	HOPE	O（\|E\|d²）
基于网络拓扑结构信息	2014	KDD	DeepWalk	O（\|V\|d）
	2015	WWW	LINE	O（\|E\|d）
	2016	KDD	node2vec	O（\|V\|d）
	2017	NIPS	GraphSAGE	O（\|V\|d）
基于神经网络	2016	KDD	SDNE	O（\|V\|\|E\|）
	2017	ICLR	GCN	O（\|E\|d²）
	2018	ACN	EGES	-
基于生成式对抗网络	2017	ArXiv	GraphGAN	-
基于生成式对抗网络	2018	ACM	NetRA	-
基于超图网络	2017	CORR	DHNE	-
	2018	ArXiv	HGNN	-
	2021	ACM WSDM	HWNN	-

2.1　基于降维方法的图嵌入算法

经典的图嵌入算法是将高维稀疏的图数据的维数降至低维稠密空间进行表示，降维后仍需保留原始数据的属性，通常可分为线性和非线性2种^［10］。

2.1.1　线性降维方法

最具代表性的线性降维方法——主成分分析（principal component analysis，PCA） ^［11］是一种使用较广的无监督降维方法，即用原始数据中方差较大的主成分代表原始数据的重要结构信息，方差较小的代表噪声，因此，经PCA计算后的低维表示最大化了原始数据的差异^［12］。通过求解特征值 $w ，$ 得到线性变换矩阵 $W \in R^{D \times d}$ ，以提取最大方差的权重向量，降维结果中各主成分呈正交关系，可通过分解矩阵协方差的特征求解^［13］。

文献［14］提出的线性判别分析（linear discriminant analysis，LDA）是一种有监督的降维方法，数据集中的每个样本均为有类别的输出，且假设数据集中每个类别均呈高斯分布，然后通过使数据的类间分布和类内分布间的比值最大化，求得线性投影矩阵 $W \in R^{D \times d}$ 。而多维缩放（multidimensional scaling，MDS）^［15］模型是一种在低维空间展示“距离”数据结构的流行学习方法，保留了数据的空间距离，得到相异性矩阵 D，在尽可能保留数据相异性的前提下生成低维向量表示^［16］。

2.1.2　非线性降维方法

非线性降维（nonlinear dimensionality redection，NLDR）^［17］方法可用于流行学习，自动学习数据的非线性结构，文献［18］提出的等距特征映射（isometric feature mapping，Isomap）也称等度量映射，能精确保留所有特征向量间的距离，可应用于降维、可视化等领域。

LLE^［1］作为流行学习中经典的非线性降维方法，可使降维后的数据集较好地保留原始数据的流行结构和局部特征向量间的线性结构；内核法（kernel methods）^［19］是一种与Isomap、LLE相当的非线性降维方法，可用于仅需计算数据对间内积的场合，其优点是使原始空间中线性不可分的数据在新的高维空间中分离，其中内核PCA法通常用于多项式或高斯内核的非线性降维。

2.2　基于矩阵分解的图嵌入算法

基于矩阵分解的图嵌入算法常以矩阵的形式表示图的属性（如节点的成对相似性），并进行矩阵分解得到节点的嵌入式表达^［1］。其中拉普拉斯特征图法^［20］通过最小化成本函数Y，确保在流形上彼此接近的点映射至低维空间后仍相互接近。为控制映射后的误差，对相似映射后距离变远的节点以更大惩罚。

节点邻近矩阵分解法^［21］则通过最小化目标函数 $m i n |W - Y Y_{c}^{T}|$ ，并利用矩阵分解计算低维空间中的节点邻近度，其中， W 为节点间的邻近矩阵，Y为节点的嵌入，Y_c为上下文节点的嵌入。此外，HSCA^［22］模型是对TADW模型的改进，基于skip-gram和hierarchical softmax学习分布式单词表示，HSCA的目标函数式为

\underset{W, H}{m i n} (\begin{matrix} {(M - W^{T} H T)}_{F}^{2} + \frac{λ}{2} (∥ W ∥_{F}^{2} + ∥ H ∥_{F}^{2}) + \end{matrix} μ (R_{1} (W) + R_{2} (H)))

。（5）

其中，第1项，使TADW的矩阵分解误差最小化；第2项，对 W 和 H 施加低级约束，并用参数λ进行协调；最后的正则化项，强制网络中邻近点间的结构同质化。该方法将使连接的节点在网络表示中彼此更接近。

基于DeepWalk改进的算法，其概率模型和目标函数普遍难以解释如何保留图的高阶相似性。为解决此类问题，文献［23］提出了GraRep模型，通过邻接矩阵相乘k次得到第k阶过度矩阵 A_k，定义过度概率 $A_{w, c}^{k}$ ，并由skip-gram模型和负采样方法定义损失函数 $Y_{i, j}^{k}$ ，使嵌入结果保留了嵌入空间中图的高阶相似性。而HOPE^［6］模型在计算高阶相似性时保留了非对称传递性，非对称传递性指有向图之间特定的相关性。文献［6］对几种高阶近似性的计算方法，如卡兹指数法^［24］、基于PageRank的方法、共同邻居法和Adamic-Adar法进行了实验，其中节点i的嵌入表达 $V_{i}$ 可通过分解邻近矩阵 S 求得，再用SVD方法等选取前K个特征值，对矩阵 S 进行分解。

2.3　基于网络拓扑结构信息的图嵌入算法

较著名的图嵌入算法为DeepWalk^［25］，借鉴自然语言处理中重要的词嵌入算法word2vec，通过随机游走将图嵌入转化为词嵌入问题。从每个节点出发若干次，用均匀采样方式选择当前节点的邻接节点，并作为下一步的节点进行随机游走，当游走路径达到规定长度时，停止本次游走，然后将这些节点序列作为训练样本输入skip-gram模型进行训练，得到节点的嵌入表达。因此，可将DeepWalk视为一种连接序列嵌入和图嵌入的过渡方法，其目标是最大化随机游走序列 S 中顶点对的平均对数概率，使具有相似邻域（具有较大的二阶相似度）的节点共享相似的嵌入。其目标函数为

\frac{1}{| S |} \sum_{i = 1}^{| S |} \sum_{- t \leq j \leq t} l o g p (v_{i + j} | v_{i})

。（6）

文献［26-28］证明了DeepWalk算法相当于矩阵分解 $M = W^{T} \times H$ ， $M \in R^{| V | \times | V |}$ 中的每个M_ij 表示顶点V_i 在固定步数内可到达顶点V_j 的平均概率的对数， $W \in R^{k \times | V |}$ 为顶点的嵌入表示，但 $H \in R^{k \times | V |}$ 中的信息很少被用于经典的DeepWalk模型。

DeepWalk采用深度优先采样（depth-first sampling，DFS）策略，即从源节点开始以距离递增的方式依次采样产生节点序列，其得到的节点序列具有同质性，即以距离作为节点间相似性的度量。与DFS策略相反，广度优先采样（breadth-first sampling，BFS）策略是从源节点开始，探索当前深度所有邻居节点的结构性，用节点在网络中的位置和结构表示相似性。斯坦福大学在DeepWalk基础上推出了node2vec^［30］。node2vec通过调整随机游走权重，在同质性和结构性间进行权衡，其中提出的概率模型，通过设立节点间的跳转概率控制对BFS和DFS的倾向性。图2显示的为node2vec算法从节点t 跳转至节点v后下一步以节点v为起点继续跳转的概率。

图2

图2 Node2vec算法节点跳转原理

Fig.2 Node2vec algorithm node jump principle

从节点v跳转至下一节点x的概率为

π_{v x} = α_{p q} (t, x) ω_{v x}

，

其中， $ω_{v x}$ 为边V_x 的权重，

α_{p q} (t, x) = \{\begin{matrix} \frac{1}{p}, d_{t x} = 0, \\ 1, d_{t x} = 1, \\ \frac{1}{q}, d_{t x} = 2, \end{matrix}

（7）

$d_{t x}$ 为节点 $t$ 到节点 $x$ 的距离，返回参数 $p$ 和进出参数 $q$ 共同控制随机游走的倾向性，其中， $p$ 越小，随机游走回节点 $t$ 的可能性越大，即算法更注重表达网络的同质性； $q$ 越小，随机游走到远方节点的可能性越大，即更注重表达网络的结构性。反之，当前节点更可能在附近节点游走，同时node2vec所体现的网络的同质性和结构性在推荐系统中可得到直观解释。

LINE^［1］是一种基于邻域相似假设的算法，与DeepWalk使用DFS构造邻域不同，LINE可看作是一种用广度优先搜索（breath first search，BFS）构造邻域算法。在现实世界网络中，相互联系的节点通常表现为较相似或向量距离接近，LINE算法将其定义为一阶近邻，用于描述相邻顶点之间的局部相似度；二阶近邻则用2个节点间的共同邻居度量，描述节点与邻域的关系。LINE算法分别对所有具有一阶近邻关系和二阶近邻关系的节点对进行概率建模，通过最小化其概率分布和经验分布的KL散度，得到2个嵌入；由不同目标函数训练的2个嵌入向量连接每个顶点，可更好地表示输入图。LINE通过捕捉网络中的一阶近邻关系和二阶近邻关系，更完整地描述网络，其适用于有向图、无向图、有权图和无权图。

GraphSAGE^［1］是一种利用顶点属性信息高效产生未知顶点向量进行嵌入的一种归纳式（inductive）学习框架。通过学习对邻居顶点进行聚合表示的函数产生目标顶点的嵌入向量，其运行流程可分为顶点采样、信息聚合和向量表达3个步骤，该模型训练的聚合函数可将本地邻域的特征（如文本属性、节点特征）整合后传递给目标节点V_i，并更新节点V_i 的隐藏状态，此方法可利用节点的邻域信息补充损失的局部结构信息，提升表示向量的准确性。

2.4　基于神经网络的图嵌入算法

2010年后，RNNs和CNNs等神经网络模型快速发展，并试图将其推广应用于图模型。首先将CNN模型作为基础算法，或采用专为欧几里得空间设计的原始CNN模型，通过格式化输入的图模型，以适应原始CNN模型的输入要求，或将深度神经网络模型泛化为非欧几里得图。

其中，SDNE^［26］模型和node2vec^［29］是同时期两项并列的工作，均发表于2016年的KDD会议论文集，可看作是LINE的扩展，首次将深度学习应用于网络表示学习。SDNE中的相似度定义与LINE相同，使用自动编码器结构同时优化一阶和二阶相似度，而LINE模型则分别进行优化，学习得到的向量表示能保留局部和全局结构，并对稀疏网络具有鲁棒性，结构如图3所示。

图 3

图 3 SDNE模型结构

Fig.3 SDNE model structure

GCN模型^［27］可对任意大小和形状的图进行端到端学习，用卷积算子并采取迭代聚合方法对节点的邻近节点进行嵌入表示，该方法已广泛用于图结构化数据的半监督学习。由于GCN模型通常只有2个卷积层，因此无法很好地解释其工作原理。

研究表明，GCN模型是拉普拉斯平滑的一种特殊形式^［30-31］，模型效果良好，若使用2个以上卷积层，将导致过度平滑，令节点的特征相似，分离困难。

带有连边信息的增强图嵌入（enhanced graph embedding with side information，EGES）^［32］模型于2018年由阿里巴巴推出，其基本思想是在嵌入过程中引入带权重的补充信息，解决冷启动问题。该模型是为解决推荐问题而推出的一款基于DeepWalk算法的改进模型，面向推荐系统找回阶段，其核心任务是计算物品间的相似度。文献［32］根据用户历史行为构建物品图，然后用DeepWalk学习每个物品的嵌入表示，即基图嵌入（base graph embedding，BGE），同时为解决少量或无交互行为物品的准确表示问题，提出了使用连边信息增强其学习表示过程，并针对不同连边的贡献度，提出了一种用于学习带有连边信息的嵌入表示的加权机制。EGES并无复杂的理论创新，但给出了能融合多种嵌入表示的算法，解决了因某类信息缺失出现冷启动的问题，是一种实用性较强的图嵌入算法。

2.5　基于生成式对抗网络的图嵌入算法

生成式对抗网络（generative adversarial network，GAN）^［33］是一种非监督学习算法，通过2个神经网络之间相互对抗的方式进行学习。自2014年GAN问世以来，其在计算机视觉等领域广受关注，在其他领域的应用研究相对较少，2019年后，逐渐将GAN思想应用于图嵌入表达。其中，文献［31］将图嵌入学习分为生成式（generative）和判别式（discriminative）2种，并提出GraphGAN模型，该模型包含判别器 $D (v, v_{c}; θ_{D})$ 和生成器 $G (v ∣ v_{c}; θ_{G})$ ，借鉴GAN中常见的对抗机制，即生成器 $G$ 尽可能地逼近 $p_{t r u e} (v ∣ v_{c})$ ，找到与 $v_{c}$ 的相邻节点极相似的节点，以欺骗判别器 $D$ ；反之，判别器 $D$ 则会检测给定的节点 $v$ 是由生成器生成的还是 $v_{c}$ 的真实邻近节点。故GraphGAN模型的核心是目标函数：

\begin{array}{l} \underset{θ_{G}}{m i n} \underset{θ_{D}}{m a x} V (G, D) = \sum_{c = 1}^{V} (E_{v \sim p_{t r u e} (∣ v_{c}) [l o g D (v, v_{c}; θ_{D})]} + \\ E_{v \sim G (\cdot ∣ v_{i} θ_{G})} \{l o g （ 1 - D [v, v_{c}; θ_{D} ）]\}) \end{array}

。（8）

GraphGAN^［30］模型，为实现图中所有节点的嵌入，对每个节点做抽样正样本和生成负样本操作，但这在现实大型网络中难以实现。文献［31］提出的NetRA模型可解决当抽样较稀疏时图嵌入过拟合的问题，通过引入GAN模型的正则项，使编码器提取到更有用的信息。模型框架如图4所示，包括自动编码器、GAN和图嵌入三部分，其中，文献［31］用LSTM^［34］作为编码器，在对GAN训练时需将正负样本间的差异反馈给编码器，帮助编码器提取更有效的信息以区分伪样本，避免编码器出现过拟合^［35］。图嵌入部分通过保留节点与节点间的连边信息获得局部的连接关系，NetRA模型并不只有一个GAN结构，而是将GAN当作正则项的一部分嵌入模型得到节点的表征，这为GAN模型的应用提供了不同思路^［36］。

图 4

图 4 NetRA模型框架

Fig.4 NetRA model framework

2.6　基于超图（hyper-graph）网络的图嵌入算法

近年来，随着社交网络图嵌入应用的激增，简单的图网络已不足以表示真实网络中的复杂信息，真实网络中节点间的关系远较顶点到顶点的连边关系复杂，与传统的图网络不同，超图网络中边的度可能大于2，且所有相关节点通过超边连接形成超节点，一个超图可用尺寸为 $| V | \times | E |$ 的入射矩阵 H 表示^［37］。对每对超级节点均通过共享的事件顶点建立连接。因此，超图可更好地表示网络图中的社区结构，超边的这些特性使得超图更具挑战性，表2为图与超图的特性对比。超图的嵌入表示学习是近年来的研究热点，其为社会网络建模提供了有力的工具，由于超图算法可用于许多其他方式难以实现的嵌入应用场景，且超图可看作是简单图的一种变体，只要对传统图的嵌入算法稍加修改便可将其应用于超图嵌入^［38-39］。

表2 图与超图的特性对比

Table 2 Comparison of characteristics between graphs and hyper-graphs

表示	图	超图
表示	A （\|V\| × \|V\|）	H （\|V\| × \|E\|）
最小割	NP难	NP完全
谱聚类	实值优化	实值优化
谱嵌入	矩阵分解	投影至特征空间

受GCN中图卷积的启发，HGNN^［38］将光谱卷积应用于超图，通过半监督的节点分类任务训练网络，可在卷积层的输出中获得节点表示，模型结构体系如图5所示，超图卷积由超图Laplacian^［40］衍生而来，其为正半定性矩阵，特征值为相应的频率，每层的频谱卷积为

f (X, W, Θ) = σ (D_{v}^{- 1 / 2} H W D_{e}^{- 1} H^{T} D_{v}^{- 1 / 2} X Θ) ，

（9）

其中， $X$ 为每层的隐藏嵌入， $D_{v}$ 和 $D_{e}$ 为对角矩阵，输出分别为顶点和超边的度。

图 5

图 5 图和超图图示^［38］

Fig.5 Illustrations of graphs and hyper-graphs

DHNE^［39］模型通过深度神经网络自动编码器保留超边的结构信息，其中自动编码器将每个顶点嵌入低维空间，将其重构为原始的入射向量。在编码和解码过程中保留其二阶邻近度以学习全局结构信息，并通过定义N元组方向的相似度函数在嵌入空间保留一阶接近度。若N个节点在同一超边上，则这些节点在低维空间的相似度更高，基于相似性，可预测N个节点是否通过单个超边进行连接，其N元组相似性函数须为非线性函数，若不然将导致相互矛盾的预测，同时可通过缩短潜入空间相邻顶点的距离保留超图的局部信息。

2.7　图嵌入算法对比分析

图嵌入算法的特征分析见表3。经典的降维方法已被广泛用于图嵌入算法，其原理较简单且容易理解，但大多模型无法表示高阶相似度。基于网络拓扑结构信息的算法不是对整图进行嵌入表示，而是对每个节点的邻居信息进行采样，此类算法可以捕获节点间的远距离关系，但嵌入后的网络表示无法完全保留原始图的全部结构信息。

表3 图嵌入算法特性分析

Table 3 Characteristic analysis of graph embedding algorithms

图嵌入算法	适用数据集	优势	不足	应用
基于降维方法	高维稀疏数据	数学原理简单、易于理解和实施	无法捕捉高阶相似度	节点分类、节点聚类
基于矩阵分解	稀疏数据	可以捕捉全局结构	高时间复杂度	节点分类、节点聚类
基于网络拓扑结构信息	大部分数据集	可以捕获节点间的远距离关系	无法保留全局结构	节点分类、链接预测、可视化、图分类
基于神经网络	大部分数据集	有效且健壮	高计算成本	节点分类、链接预测、三元组预测
基于生成式对抗网络	复杂数据	充分利用不同来源的结构信息，改善了嵌入精度	难以证明合理性	节点分类、图分类
基于超图网络	复杂数据	可以处理复杂的图网络数据	难以实施	节点分类

基于矩阵分解的图嵌入算法，根据节点间成对相似度的统计信息进行图嵌入，为捕获全局结构，一些算法考虑了全局节点的邻近性，能细粒度地捕获1~k阶节点的相似度信息，其性能优于基于随机游走的深度学习算法，因随机游走算法仅使用局部采样窗口，易损失图的全局结构信息，但由于邻接矩阵的构造及特征分解计算和存储复杂性更高，故此类图嵌入算法并不适合大规模的图数据场景，且算法可扩展性较差。此外，LLE算法、图拉普拉斯特征图法仅保留了图的一阶相似度，在保持图的二阶甚至更高阶相似度方面存在不足，易丢失原始图的部分结构信息。

深度学习在不同的图嵌入算法中均表现良好，能从复杂的图结构中自动识别有用的表示。例如，基于随机游走的深度学习（如DeepWalk、node2vec等）可通过图上的采样路径自动利用邻域结构；无随机游走的深度学习可对同构图（如GCN、GraphSAGE）中的可变尺寸子图结构进行建模，作为有用的表示。同时，基于深度学习的图嵌入算法能捕获网络中节点间的高阶非线性关系。传统线性降维算法无法保持图的非线性结构，基于深度神经网络的图嵌入算法主要对节点表示间的非线性进行建模，能捕获网络结构和属性中的非线性关系，并通过PPMI矩阵，避免大量无效节点的嵌入。其局限性为由于深度学习框架主要是基于神经网络结构搭建的，在模型参数优化上严重依赖现代GPU的性能，且模型处理难，解释性差，此外，适用BP神经网络训练模型参数的时间复杂度较高。大型图嵌入算法（如LGCL、GPNN）可处理大规模图数据，适合嵌入包含数千甚至百万个节点的社交网络，但仍存在限制。首先，时间复杂度很高；其次，从本质上看图都是动态的，例如学术数据库中的社交网络图和引文图均在不断变化中，且图的结构复杂性随时间的推移不断增加，故该类方法通常只适用于静态图；最后，要求对原始输入数据进行预处理，故需要适用性强的可扩展性嵌入技术。

基于生成式对抗网络的图嵌入算法，在一个统一的模型中，利用图结构、节点属性等图结构信息进行嵌入学习，由于基于某些分布假设的观测建模难以证明其合理性，且需要大量训练数据用以拟合，故此类算法对小规模图数据的嵌入效果不佳。

基于超图网络的图嵌入算法功能强大，可用于复杂、动态的图数据网络，但实施困难，尽管可用其他途径替代图嵌入，但大多数算法尚处于“证明概念”的研究阶段，未得到广泛使用。内核法可将图映射为单个向量，所得向量适用于执行整图层面的应用任务（如图分类），由于只需枚举图中所包含的子图结构，因此较深度网络模型更有效，但因在图嵌入过程中会产生冗余的子图结构，令嵌入表示维度呈几何级数增加。

3　图嵌入算法的应用

因图嵌入算法可在时间与空间上有效解决图数据的向量表示问题，所以图嵌入算法将有利于后续图数据分析。根据图嵌入算法的输入特征，将图嵌入算法的应用分为三类：与节点相关的应用、与连边相关的应用和与整图相关的应用。

3.1　与节点相关的应用

3.1.1　节点分类

节点分类已被广泛应用于社区发现^［41］、欺诈识别^［42］和推荐系统^［43-45］等任务，通过在标记节点嵌入的结合上用分类器进行训练实现，如M-NMF^［44］、SDNE、HNE^［45］等使用SVM分类器，DeepWalk、GraRep等用逻辑回归作为分类模型，GCN则设计了一个统一框架共同优化图嵌入和节点分类的效果，学习每个节点分类的特定表示。

3.1.2　节点聚类

节点聚类，即将图中相似的节点分为一组，以获得彼此相似的不同节点分组，其作为一种无监督算法可用于节点标签不可用的情景。现有的模型如M-NMF、GraRep、HNE、DNGR^［46］等均将K-means作为聚类算法，文献［47-48］同时采用优化聚类和图嵌入，以学习特定聚类的节点表示。节点聚类已被广泛应用于社区发现、欺诈识别、推荐系统和隐私保护^［49］等任务。

3.2　与连边相关的应用

3.2.1　连接预测

图嵌入可帮助推断原始的图结构^［50］。通常，原始的图结构并不完整，图嵌入后的低维向量则有望保留不同级别的网络邻近度（如DeepWalk、LINE）以及不同尺度的结构相似度（如GCN、struc2vec），因此，嵌入后的向量将对有关网络结构信息进行编码，以预测不完整图中的丢失链接。已有文献对图嵌入驱动连接预测大多基于同构图，涉及异构图连接预测的图嵌入工作处理与解释很困难。其中大型图嵌入算法（如LGCL和GPNN）可处理大规模的图数据。

3.2.2　三元组预测

三元组分类在知识图谱中有特定应用，如文献［51-53］均基于三元组的预测完成知识图谱的相关任务，判断未知三元组〈h；r；t〉的分类是否正确，即预测h与t之间的关系是否为r。

3.3　与图相关的应用

3.3.1　图分类

图分类是将类别标签分配给整幅图，当图作为一个数据单位时，此应用将变得十分重要，例如文献［51］，每幅图表示一种化合物，大多情况下，全图嵌入往往用于计算整图级别的相似度^［49］。近年来，已出现为相似性图^［54］匹配节点嵌入，用每幅图表示一组节点嵌入向量，进而比较基于组节点的2幅嵌入图。文献［54］将图分解为一组子结构，然后将每个子结构嵌入为向量表示，进而通过子结构间的相似性比较图的相似性。

3.3.2　图重构

图重构与连接预测具有相似性，但二者应用目的不同，评价标准也有差异。图重构，旨在重构和修正图数据中已存在的连边，在实验中，将图中所有节点作为训练集，将移除连边后的节点作为测试集，利用预测结果对原始图中节点对的连边进行重构和修正；连接预测，旨在预测图中未知或可能存在的连边，从而补充节点对间的连边。

3.3.3　图拓扑信息可视化

图拓扑信息通常是在低维空间进行的可视化表达，所有节点均可作为2D向量嵌入，如在2D空间中，用不同颜色绘制的向量表示节点类别，图嵌入也可用于降维，可视化图的拓扑信息（如PCA和t-SNE^［55］），DeepWalk通过可视化Zachary's空手道俱乐部网络，说明嵌入方法的优点，LINE可视化DBLP网络，表明LINE能将同一领域的作者聚在一起。将SDNE应用于20-Newsgroup文档相似性网络，并基于主题对文档进行聚类。

4　实验数据集及评价指标

4.1　实验数据集

根据不同的应用领域选取相应的实验数据集和评价指标，常用的五类数据集为：（1）社交网络，（2）合成网络，（3）语言网络，（4）协作网络，（5）生物网络，共计10个数据集，如表4所示。

表4 数据集概况

Table 4 Data set overview

名称	社交网络				合成网络	语言网络	协作网络			生物网络
名称	BLOGCATALOG	FLICKR	YOUTUBE	KARATE	SYN-SBM	WIKIPEDIA	CiteSeer	ASTRO-PH	Cora	PPI
节点数	10 312	80 513	1 157 827	34	1 024	2 405	3 312	18 772	2 708	3 890
边数	333 983	5 899 882	4 945 382	78	29 833	17 981	4 723	396 160	5 429	38 739
平均度	64.78	43.74	8.54	4.59	58.27	-	5.27	31.55	46.73	19.92
标签数	39	195	47	2	3	19	6	—	7	50
加权图	—	—	—	—	—	√	—	—	—	—
有向图	—	—	√	√	—	—	√	—	√	—

4.2　评价指标

为评估图重构和连接预测任务中嵌入方法的性能，用Pr@k和平均精度均值（mean average precision，MAP）作为评价指标，常用Micro-F1、Macro-F1作为节点分类指标，用标准化互信息（normalized mutual information，NMI）作为评价节点聚类效果指标。指标定义如下：

Pr@k是指在前k个预测中正确预测的比例，即

P r @ k = \frac{|E_{p r e d} (1 : k) ⋂ E_{o b s}|}{k}

，（10）

其中， $E_{p r e d} (1 : k)$ 为前 $k$ 个预测， $E_{o b s}$ 为观察到的连边，对图重构任务， $E_{o b s} = E$ ，对连接预测任务，E_obs为隐藏边的集合。

MAP可估算节点的精度，为所有节点精度的平均值，即

M A P = \frac{\sum_{i} A P (i)}{|V|}

，（11）

其中， $A P (i) = \frac{\sum_{k} P r @ k (i) {E_{p r e d_{i}} (k) \in E_{o b s_{i}}}}}{| {k : E_{p r e d_{i}} (k) \in E_{o b s_{i}}} |}$ ，

P r @ k (i) = \frac{|E_{p r e d_{i}} (1; k) ⋂ E_{o b s_{i}}|}{k}

，

$E_{p r e d_{i}}$ 和 $E_{o b s_{i}}$ 分别为节点i的预测连边和观察连边。

在多标签分类任务中，Micro-F1定义为所有标签的平均值F1，即

M a c r o - F 1 = \frac{\sum_{l \in ℒ} F 1 (l)}{| ℒ |}

，（12）

其中， $F 1 (l)$ 指的是标签l的F1得分。Micro-F1通过计算全部TP、FN、FP得到全局F1，并赋予每个实体同等的权重，其定义为

M i c r o - F 1 = \frac{2 P R}{P + R}

，（13）

其中， $P = \frac{\sum_{l \in ℒ} T P (I)}{\sum_{l ε l} [T P (l) + F P (l)]}$ ，

R = \frac{\sum_{l \in ℒ} T P (l)}{\sum_{l = r} [T P (I) + F N (l)]}

，

分别表示精度和召回率，TP（l）、FP（l）和FN（l）分别表示标签l在与实际或预测相关联的实体中的TP、FP和FN。

NMI又称为标准化信息，常用于度量2个聚类结果的相近程度，是社区发现的重要衡量指标，可较客观地评价社区划分与标准划分间的准确度，NMI的值为（0，1），值越大表示划分越准确。

5　总结与展望

对近年来图嵌入领域的研究进行了全面梳理，首先，对图嵌入进行了定义并介绍了其基本原理，分析了基于降维方法的、基于矩阵分解的、基于网络拓扑结构信息的、基于神经网络的、基于生成式对抗网络的和基于超图网络的六类图嵌入算法的原理、创新点和嵌入效果等，系统梳理了图嵌入算法的发展历程，对比分析了各算法的优劣，介绍了图嵌入算法的主要应用领域，并根据应用领域与顶点、连边和整图的关系将图嵌入算法分为三类，还介绍了常用数据集及对应的评价指标。

虽然图嵌入算法在处理高维稀疏数据、计算效率和嵌入效果上已有大幅提升，但面对不断发展和变化的数据及应用要求，图嵌入算法仍需进一步发展和创新。

5.1　动态图嵌入

动态图嵌入将是图嵌入算法未来发展的重要方向。在现实世界中，图数据是动态的，如微博的社交圈、DBLP中的引文图等每时每刻都在动态变化中，图的结构（节点、连边）信息亦呈动态变化状态。一方面，图结构随时间不断变化，新的节点或连边不断出现，老的节点或连边可能消失；另一方面，可通过不断变化的信息描述节点或连边。已有文献主要集中于静态图的嵌入研究，对动态图的嵌入研究很少。与静态图嵌入算法不同，动态图嵌入算法需具更强的伸缩性和增量性，以便有效处理图的动态变化，而现有的大多数嵌入算法不符合此要求，且动态图嵌入算法存在效率低下等问题，因此，如何对动态图有效进行图嵌入将是未来重要的研究方向之一^［56］。

5.2　图嵌入的可扩展性

随着社交网络规模的快速增长，其节点和连边数以亿计，针对更大规模和更高多样性的图网络，如何有效、准确地嵌入海量图数据是面临的一大挑战。尽管深度神经网络模型具有最为先进的功能，但依靠现代GPU查找最佳参数的效率较低，需要建立更合适的模型，一种可能是用前馈机器学习处理无BP的图网络，另一种是研究更优的图粗化或分区方法对数据进行预处理。

5.3　图嵌入的可解释性

最新的图嵌入算法大多为用BP神经网络训练并确定参数的CNNs模型，训练复杂度较高，其中Quickprop用于降低训练复杂度，由于用BP神经网络迭代训练模型耗时较长且对硬件的要求较高，最近，出现了有关神经网络模型的可解释性研究^{［54，56］}，文献［54］采用基于FFdata的方法对当前层的网络参数进行基于单词通过的前一层输出的数据统计，试图用可解释的前馈设计解释CNNs模型，所得结论说明将前馈机器学习方法应用于图嵌入算法是有效的，因此，可解释性的设计可代替高级神经网络的体系结构，进而为当前图嵌入相关任务的研究提供启发。

http://dx.doi.org/10.3785/j.issn.1008-9497.2022.04.008

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

GOYAL

， FERRARA

Graph embedding techniques， applications， and performance： A survey

［J］. Knowledge-Based Systems， 2018， 151： 78-94. DOI：10.1016/j.knosys.2018.03.022

[本文引用: 10]

[2]

CAI

H Y

， ZHENG

V W

， CHANG

K C C

A comprehensive survey of graph embedding： Problems， techniques， and applications

［J］. IEEE Transactions on Knowledge and Data Engineering， 2018， 30（9）： 1616-1637. DOI：10.1109/TKDE. 2018.2807452

[3]

祁志卫，王笳辉，岳昆，等.

图嵌入方法与应用：研究综述

［J］. 电子学报， 2020， 48（4）： 808-818. DOI：10.3969/j.issn.0372-2112.2020.04.023

Z W

， WANG

J H

， YUE

， et al.

Methods and applications of graph embedding： A survey

［J］. Acta Electronica Sinica， 2020， 48（4）： 808-818. DOI：10. 3969/j.issn.0372-2112.2020.04.023

[4]

CUI

， WANG

， PEI

， et al.

A survey on network embedding

［J］. IEEE Transactions on Knowledge and Data Engineering， 2018， 31（5）： 833-852. DOI：10.1109/TKDE.2018.2849727

[5]

CHEN

F X

， WANG

Y C

， WANG

， et al.

Graph representation learning： A survey

［J］. APSIPA Transactions on Signal and Information Processing， 2020， 9： e15. DOI：10.1017/ATSIP.2020.13

[6]

M D

， CUI

， PEI

， et al.

Asymmetric transitivity preserving graph embedding

［C］// Proceedings of the 22th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco： Association for Computing Machinery， 2016： 1105-1114. DOI：10. 1145/2939672.2939751

[本文引用: 5]

[7]

涂存超，杨成，刘知远，等.

网络表示学习综述

［J］. 中国科学（信息科学）， 2017， 47（8）： 980-996. DOI：10. 1360/N112017-00145

C C

， YANG

， LIU

Z Y

， et al.

Network representation learning： An overview

［J］. SCIENTIA SINICA Informations， 2017， 47（8）： 980-996. DOI：10.1360/N112017-00145

[8]

ROWEIS

S T

， SAUL

L K

Nonlinear dimensionality reduction by locally linear embedding

［J］. Science， 2000， 290（5500）： 2323-2326. DOI：10.1126/science. 290.5500.2323

[9]

TANG

， QU

， WANG

M Z

， et al.

LINE： Large-scale information network embedding

［C］// Proceedings of the 24th International Conference on World Wide Web. Florence： International World Wide Web Conferences Steering Committee， 2015： 1067-1077. DOI：10.1145/2736277.2741093

[10]

AHMED

， SHERVASHIDZE

， NARAYANAMURTHY

， et al.

Distributed large-scale natural graph factorization

［C］// Proceedings of the 22th International Conference on World Wide Web. Rio de Janeiro： Association for Computing Machinery， 2013： 37-48. DOI：10.1145/2488388. 2488393

[11]

HAMILTON

， YING

， LESKOVEC

Inductive representation learning on large graphs

［C］// Advances in Neural Information Processing Systems. Long Beach： Curran Associates Inc， 2017： 1025-1035.

[12]

JOLLIFFE

， CADIMA

Principal component analysis： A review and recent developments

［J］. Philosophical Transactions of the Royal Society A： Mathematical， Physical and Engineering Sciences， 2016， 374（2065）： 20150202. DOI：10.1098/rsta. 2015.0202

[13]

UMEYAMA

An eigendecomposition approach to weighted graph matching problems

［J］. IEEE Transactions on Pattern Analysis and Machine Intelligence， 1988， 10（5）： 695-703. DOI：10.1109/34.6778

[14]

J P

， JANARDAN

， LI

Two-dimensional linear discriminant analysis

［C］// Proceedings of the 17th International Conference on Neural Information Processing Systems. Cambridge： MIT Press， 2004： 1569-1576. doi:10.1145/1015330.1015348

[15]

ROBINSON

S L

， BENNETT

R J

A typology of deviant workplace behaviors： A multidimensional scaling study

［J］. Academy of Management Journal， 1995， 38（2）： 555-572. DOI：10.5465/256693

[16]

SAUL

L K

， WEINBERGER

K Q

， SHA

， et al.

Spectral methods for dimensionality reduction

［C］// Semi-Supervised Learning. Cambridge： MIT Press， 2006. DOI：10.7551/mitpress/9780262033 589.003.0016

[17]

DEMERS

， COTTRELL

Non-linear dimensionality reduction

［C］// Proceedings of the 5th International Conference on Neural Information Processing Systems. San Francisco： Morgan Kaufmann Publishers Inc， 1992： 580-587.

[18]

SAMKO

， MARSHALL

A D

， ROSIN

P L

Selection of the optimal parameter value for the Isomap algorithm

［J］. Pattern Recognition Letters， 2006， 27（9）： 968-979. DOI：10.1016/j.patrec. 2005.11.017

[19]

HARANDI

M T

， SANDERSON

， SHIRAZI

， et al.

Graph embedding discriminant analysis on Grassmannian manifolds for improved image set matching

［C］// Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway： IEEE， 2011： 2705-2712. DOI：10.1109/CVPR.2011.5995564

[20]

BELKIN

， NIYOGI

Laplacian eigenmaps for dimensionality reduction and data representation

［J］. Neural Computation， 2003， 15（6）： 1373-1396. DOI：10.1162/089976603321780317

[21]

SINGH

A P

， GORDON

G J

Relational learning via collective matrix factorization

［C］// Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York： Association for Computing Machinery， 2008： 650-658. DOI： 10.1145/1401890.1401969

[22]

ZHANG

D K

， YIN

， ZHU

X Q

， et al.

Homophily， structure， and content augmented network representation learning

［C］// 16th International Conference on Data Mining （ICDM）. Piscataway： IEEE， 2016： 609-618. DOI：10.1109/ICDM.2016.0072

[23]

CAO

S S

， LU

， XU

Q K

GraRep： Learning graph representations with global structural information

［C］// Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. Melbourne： Association for Computing Machinery， 2015： 891-900. DOI：10.1145/2806416.2806512

[24]

KATZ

A new status index derived from sociometric analysis

［J］. Psychometrika， 1953， 18（1）： 39-43. DOI：10.1007/BF02289026

[25]

PEROZZI

， AL-RFOU

， SKIENA

DeepWalk： Online learning of social representations

［C］// Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York： Association for Computing Machinery， 2014： 701-710. DOI：10.1145/2623330.2623732

[26]

WANG

D X

， CUI

， ZHU

W W

Structural deep network embedding

［C］// Proceedings of the 22th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco： Association for Computing Machinery， 2016： 1225-1234. DOI：10.1145/2939672.2939753

[27]

KIPF

T N

， WELLING

Semi-supervised classification with graph convolutional networks

［J］. arXiv preprint， arXiv：， 2016.

[28]

Q M

， HAN

Z C

， WU

X M

Deeper insights into graph convolutional networks for semi-supervised learning

［J］. arXiv preprint， arXiv：1801.07606， 2018. DOI：10.48550/arXiv.1801.07606

[29]

GROVER

， LESKOVEC

Node2vec： Scalable feature learning for networks

［C］// Proceedings of the 22th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco： Association for Computing Machinery， 2016： 855-864. DOI：10.1145/2939672.2939754

[30]

WANG

H W

， WANG

J L

， et al.

GraphGAN： Graph representation learning with generative adversarial nets

［J］. Proceedings of the AAAI Conference on Artificial Intelligence， 2018， 32（1）： 2508-2515. doi:10.1609/aaai.v32i1.11872

[31]

W C

， ZHENG

， CHENG

， et al.

Learning deep network representations with adversarially regularized autoencoders

［C］// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London： Association for Computing Machinery， 2018： 2663-2671. DOI：10.1145/3219819.3220000

[本文引用: 4]

[32]

WANG

J Z

， HUANG

P P

， ZHAO

， et al.

Billion-scale commodity embedding for e-commerce recommendation in Alibaba

［C］// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London： Association for Computing Machinery， 2018： 839-848. DOI：10.1145/3219819.3219869

[33]

GOODFELLOW

I J

， POUGET-ABADIE

， MIRZA

， et al.

Generative adversarial nets

［C］// Proceedings of the 27th International Conference on Neural Information Processing Systems. Montreal： MIT Press， 2014： 2672-2680.

[34]

GREFF

， SRIVASTAVA

R K

， KOUTNÍK

， et al.

LSTM： A search space odyssey

［J］. IEEE Transactions on Neural Networks and Learning Systems， 2016， 28（10）： 2222-2232. DOI：10.1109/ TNNLS.2016.2582924

[35]

SUN

X G

， YIN

H Z

， LIU

， et al.

Heterogeneous hypergraph embedding for graph classification

［C］// Proceedings of the 14th ACM International Conference on Web Search and Data Mining. Virtual Event： Association for Computing Machinery， 2021： 725-733. DOI：10.1145/3437963.3441835

[36]

ZHEN

Y M

， WANG

J H

Community detection in general hypergraph via graph embedding

［J］. Journal of the American Statistical Association， 2022： 1-10. DOI：10.1080/01621459.2021.2002157

[37]

， CUI

， WANG

， et al.

Structural deep embedding for hyper-networks

［J］. arXiv preprint， arXiv：， 2017. doi:10.1609/aaai.v32i1.11266

[38]

FENG

Y F

， YOU

H X

， ZHANG

Z Z

， et al.

Hypergraph neural networks

［C］// Proceedings of the 33th AAAI Conference on Artificial Intelligence. Honolulu： AAAI Press， 2019， 33（1）： 3558-3565. DOI：10.1609/aaai.v33i01.33013558

[39]

ZHOU

D Y

， HUANG

J Y

， SCHÖLKOPF

Learning with hypergraphs： Clustering， classification， and embedding

［J］. Advances in Neural Information Processing Systems， 2007， 19： 1601-1608.

[40]

陈洁，李锐，赵姝，等.

面向图表示社区检测的新型聚类覆盖算法

［J］. 电子学报， 2020， 48（9）： 1680-1687. DOI：10.3969/j.issn.0372-2112.2020.09. 003

CHEN

， LI

， ZHAO

， et al.

A new clustering cover algorithm based on graph representation for community detection

［J］. Acta Electronica Sinica， 2020， 48（9）： 1680-1687. DOI：10.3969/j.issn.0372-2112.2020.09.003

[41]

， CUI

， WANG

， et al.

Structural deep embedding for hyper-networks

［C］// Proceedings of the 32th AAAI Conference on Artificial Intelligence and 30th Innovative Applications of Artificial Intelligence Conference and 8th AAAI Symposium on Educational Advances in Artificial Intelligence. New Orleans： AAAI Press， 2018， 53： 426-433. doi:10.1609/aaai.v32i1.11266

[42]

杨晓慧，万睿，张海滨，等.

基于符号语义映射的知识图谱表示学习算法

［J］. 计算机研究与发展， 2018， 55（8）： 1773-1784. DOI：10.7544/issn1000-1239. 2018.20180248

YANG

X H

， WAN

， ZHANG

H B

， et al.

Knowledge map representation learning algorithm based on symbolic semantic mapping

［J］. Journal of Computer Research and Development， 2018， 55（8）： 1773-1784. DOI：10.7544/issn1000-1239. 2018.20180248

[43]

秦川，祝恒书，庄福振，等.

基于知识图谱的推荐系统研究综述

［J］. 中国科学（信息科学）， 2020， 50（7）： 937-956. DOI：10.1360/SSI-2019-0274

QIN

， ZHU

H S

， ZHUANG

F Z

， et al.

A survey on knowledge graph-based recommender systems

［J］. SCIENTIA SINICA Informations， 2020，50（7）： 937-956. DOI：10.1360/SSI-2019-0274

[44]

WANG

， CUI

， WANG

， et al.

Community preserving network embedding

［C］// Proceedings of the 31th AAAI Conference on Artificial Intelligence. San Francisco： AAAI Press， 2017： 203-209. doi:10.1609/aaai.v31i1.10488

[45]

CHANG

S Y

， HAN

， TANG

J L

， et al.

Heterogeneous network embedding via deep architectures

［C］// Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Sydney： Association for Computing Machinery， 2015： 119-128. DOI：10. 1145/2783258.2783296

[46]

CAO

S S

， LU

， XU

Q K

Deep neural networks for learning graph representations

［C］// Proceedings of the 30th AAAI Conference on Artificial Intelligence. Phoenix： AAAI Press， 2016： 1145-1152. doi:10.1609/aaai.v30i1.10179

[47]

WEI

X K

， XU

L C

， CAO

B K

， et al.

Cross view link prediction by learning noise-resilient representation consensus

［C］// Proceedings of the 26th International Conference on World Wide Web. Perth： International World Wide Web Conferences Steering Committee， 2017： 1611-1619. DOI：10. 1145/3038912.3052575

[48]

TANG

M F

， NIE

F P

， JAIN

Capped LP-NORM graph embedding for photo clustering

［C］// Proceedings of the 24th ACM International Conference on Multimedia. Amsterdam： Association for Computing Machinery， 2016： 431-435. DOI：10. 1145/2964284. 2967257

[49]

ZHANG

Q S

， WU

Y N

， ZHU

S C

Interpretable convolutional neural networks

［C］// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City： IEEE， 2018： 8827-8836. DOI：10.1109/CVPR. 2018.00920

[50]

MAATEN

L V D

， HINTON

Visualizing data using t-SNE

［J］. Journal of Machine Learning Research， 2008， 9（11）： 2579-2605.

[51]

NIKOLENTZOS

， MELADIANOS

， VAZIRGIANNIS

Matching node embeddings for graph similarity

［C］// Proceedings of the 31th AAAI Conference on Artificial Intelligence. San Francisco： AAAI Press， 2017： 2429-2435. doi:10.1609/aaai.v31i1.10839

[52]

刘华玲，郑建国，孙辞海.

基于贪心扰动的社交网络隐私保护研究

［J］. 电子学报， 2013，41（8）： 1586-1591. DOI：10.3969/ j.issn.0372-2112.2013.08. 021

LIU

H L

， ZHENG

J G

， SUN

C H

Privacy preserving in social networks based on greedy perturbation

［J］. Acta Electronica Sinica， 2013， 41（8）： 1586-1591. DOI：10.3969/j.issn.0372-2112. 2013.08.021

[53]

YANARDAG

， VISHWANATHAN

S V N

Deep graph kernels

［C］// Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Sydney： Association for Computing Machinery， 2015： 1365-1374. DOI：10.1145/2783258.2783417

[54]

KUO

C C J

， ZHANG

， LI

， et al.

Interpretable convolutional neural networks via feedforward design

［J］. Journal of Visual Communication and Image Representation， 2019， 60： 346-359. DOI：10. 1016/j.jvcir.2019.03.010

[本文引用: 4]

[55]

RIBEIRO

L F R

， SAVARESE

P H P

， FIGUEIREDO

D R

Struc2vec： Learning node representations from structural identity

［C］// Proceedings of the 23th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. HaliFax： Association for Computing Machinery， 2017： 385-394. DOI：10. 1145/3097983.3098061

[56]

曹燕，董一鸿，邬少清，等.

动态网络表示学习研究进展

［J］. 电子学报， 2020， 48（10）： 2047-2059. DOI：10.3969/j.issn.0372-2112.2020.10.024

CAO

， DONG

Y H

， WU

S Q

， et al.

Dynamic network representation learning： A review

［J］. Acta Electronica Sinica， 2020， 48（10）： 2047-2059. DOI：10. 3969/j.issn.0372-2112.2020.10.024