<img src="https://www.zjujournals.com/sci/images/1008-9497/images/logo.png" class="img-responsive">

图1 多重网络图采样算法流程

（a）原始多重网络图（b）融合多重网络图结构特征的表征学习（c）多目标的自适应蓝噪声采样（d）多重网络图采样结果

Fig.1 Flow chart of the multiple graph sampling

2.1　融合多重网络图结构特征的表征学习

利用node2vec^［17］的游走策略将多重网络图结构特征转换至统一的向量化空间，如图1（b）所示，在保持多重网络图上下文结构的同时，为后续采样提供遍历基础和搜索空间。步骤如下：

Step 1　生成序列样本集。首先，假设t为上一个访问节点，当前随机游走经过边（t，v），到达节点v，而由v经过边（v，x）跳转至下一节点x的概率为

a_{p q} (t, x) = \{\begin{array}{l} \frac{1}{p}, d_{t x} = 0, \\ 1, d_{t x} = 1, \\ \frac{1}{q}, d_{t x} = 2, \end{array}

（1）

其中，d_tx 为t与x之间的最短路径。由式（1）知，当d_tx 为0时，t和x为同一个节点，此时参数p控制的是已访问节点的概率，即返回概率，且p越大，游走访问新节点的概率越高。当d_tx 为1时，t和x相连，默认跳转概率为1。当d_tx 为2时，t和x不相连，参数q控制的是随机游走的方向策略。当q>1时，倾向于访问与t接近的节点，反映广度优先的遍历特性；当q<1时，倾向于访问远离t的节点，反映深度优先的遍历特性。

由式（1）设置归一化v跳转至各邻居节点的概率，在随机跳转至下一节点后按照相同方式访问其他节点，直至达到随机游走的最大路径长度L，一条序列样本生成完毕。接着以任一节点为源节点，利用上述游走策略在每一重网络背景下生成对应的序列样本。最终将这些样本组成完整的多重网络图序列数据集，作为下一步表征学习的输入。

Step 2　向量化表示。基于获得的所有序列样本集，设置目标函数：

\underset{f}{m a x} \sum_{u \in V} l o g P r (N_{s} (u) | f (u))

，（2）

其中，f （u）表示将节点u映射为向量的函数，N_s（u）表示和u出现在同一条序列样本中的邻近节点集合，即在给定某个节点的条件下，使其所在序列样本集中其他节点出现的概率最大。用Skip-Gram模型训练输入序列样本集，最终得到每个节点的向量化表示。

Step 3　降维。经以上2个步骤将多重网络图的所有节点转化为高维向量，同时保留每一重图的上下文结构特征，如果在大部分网络背景下2个节点处于邻近关系，那么它们在向量空间中的分布也接近。采用分布式随机邻居嵌入（t-distributed stochastic neighbor embedding，t-SNE）^［18］算法将节点的高维学习向量投影至二维平面，为下一步采样做准备。

2.2　基于表征学习空间的多重网络图采样

2.2.1　保持上下文结构特征的采样

基于二维表征学习空间，采用自适应蓝噪声采样算法筛选节点，尽可能保留和覆盖原始多重网络图上下文结构特征，如图1（c）所示。

Step 1　随机选择一个节点u，并以此为中心构造一个半径为r的泊松盘，且r=r_a/den（u）， r_a 为由用户设置的可以调整采样率的参数，采样率越大，r_a 越小，泊松盘就越小。den（u）代表节点u所处局部区域的节点密度，即以u为圆心、r_a 为半径的圆包含的节点数量。密度越大，泊松盘的尺寸就越小，在泊松盘内随机选择一个节点作为该局部区域的代表性节点。

Step 2　在选择代表性节点后，将其所在泊松盘内的其他节点标记为非活动节点，再将位于圆盘r_a 和2r_a 之间环形区域的节点标记为活动节点。随机选择一个活动节点按照step 1构造新的泊松盘，并随机选择代表性节点。

Step 3　重复以上2个步骤，直至所有节点被标记为代表性节点或非活动节点，采样结束。

综上可知，传统的蓝噪声采样算法可较好地覆盖整个数据空间，还可根据节点疏密自适应地调整采样圆盘大小，进而控制采样节点的数量，保证节点密度分布的一致性。

2.2.2　多目标采样优化

基于向量化空间的蓝噪声采样在保持多重网络图上下文结构特征上具有一定优势，但在结构连通性保持上存在明显不足。例如，具有较大中介度的节点（桥节点），在网络连通中很重要，但在泊松盘内随机选择代表性节点时易被忽略。此外，蓝噪声采样过程没有考虑多重网络图的复杂连接关系，使得多重网络图的连通性保持存在较大的不确定性。为此，做以下两点改进以增强多重网络图连通性的同步保持。

（1）增加桥节点被选择的概率。在采样模型中加入中介度分析，计算每一重图所有节点的中介度（即任意两节点间的最短路径经过该点的次数），并做归一化处理。节点u在多重网络图中的综合中介度定义为其在每一重图中的中介度总和。记bet （u）为节点u所处局部区域的连通重要性，即以u为圆心、r_a 为半径的圆包含的所有节点的平均综合中介度。对以u为中心的泊松盘的半径进行优化：

r = \frac{r_{a}}{α \times d e n (u) + β \times b e t (u)}

，（3）

其中，α和β为密度和连通重要性的权重，且满足α+β=1.0，α不为0，初始设置α=β=0.5。若某个泊松盘包含桥节点的数量越多，则泊松盘的半径将相应减小，进一步，保证盘内节点的综合中介度与采样概率成正比，从而有效增加桥节点被选为代表性节点的概率。如图2（a）所示，优化前，以u为圆心的泊松盘半径相对较大，当随机选择一个代表性节点时，容易丢失节点u邻域范围内的多个桥节点（黑色圆点）。优化后的泊松盘如图2（b）所示，以u为圆心的泊松盘半径减小，同时周边区域需要填充的泊松盘数量增加，使得分处不同小盘内的多个桥节点都有较大概率成为代表性节点，从而增加了采样结果中桥节点的数量。

图2

图2 泊松盘优化

Fig.2 Optimization of the Poisson disks

（2）考虑多重网络图的同步连通性。虽然在向量化空间中，彼此邻近的节点之间相互连接的可能性较高，但由于采样的随机性，难以保证多重网络图在不同网络结构上连接。因此，当一个泊松盘向外拓展确定另一个泊松盘时，需遍历其周边多个不同的泊松盘，同时考虑其包含的节点与当前泊松盘内代表性节点在多重网络图上的连接关系。如图3所示，中间黑实线圆为当前的采样圆盘，黑圆点为选中的代表性节点。假定当前为3重网络图，在周边预设的多个不同泊松盘（虚线圆）中，三角形节点表示与之前的代表性节点在每一重图上均存在连接关系，图3右侧图例中，三角形后面的每个方框表示其中1重网络图，对号表示在对应网络图上连接，叉号表示不连接。菱形节点表示与代表性节点在其中2重网络图上存在连接，圆形节点表示与代表性节点在其中1重网络图上存在连接。如果周边某个泊松盘包含与上一个代表性节点在所有图（或数量较多的图）上都存在连接关系的节点且节点数量较多，那么这个泊松盘将优先作为下一个采样圆盘。相比于其他采样圆盘，在该圆盘内选择某个代表性节点维持多重网络图同步连通性的概率更大。如图3所示，箭头指向的右侧圆盘包含2个与中心圆盘黑色代表性节点在3重网络上都连接的节点，因此优先选中作为下一个采样盘。

图3

图3 考虑多重网络图连通性的泊松盘遍历

Fig.3 Traversal across different Poisson disks for the retention of multiple graph connection.

3　多重网络图采样可视分析系统

多重网络图采样可视分析系统如图4所示。

图4

图4 多重网络图采样可视分析系统

Fig.4 Visual analytics system of multiple network sampling

3.1　多重网络图数据集

系统内置2套多重网络图数据集（https：//manliodedomenico.com/data.php）。第一套是热点Twitter转发数据集MOSS，从中选取400个用户，根据转发、提及和回复构造3重网络。第二套是线虫连接体数据CELE，包含237个神经元节点，通过不同的信号传递方式（电突触、化学突触和多元突触）构建3重网络。

3.2　采样算法和评估指标

系统包含3种经典的网络图采样算法。（1）基于节点的采样：本文算法（Our）、随机节点采样（random node，RN）^［4］；（2）基于边的采样：随机边（random edge，RE）采样^［5］、全诱导边（total induction edge，TIE）采样^［10］；（3）基于游走的采样：简单随机游走（simple random walk，SRW）采样^［19］、随机跳转（random jump，RJ）采样^［13］、诱导子图随机游走（induced subgraph random walk，ISRW）采样^［1］。利用可视分析系统对表1所示的各项指标进行对比。

表1 评估指标

Table 1 Evaluation metrics

分类	指标	说明
节点	平均中介度（ABD）^［4］	衡量桥节点保留情况，值越大被保留的桥节点越多，表现越好
节点	平均中心性（ACC）^［4］	衡量节点中心性保持情况，与原始图结果越一致越好
连接性	平均最短路径长度（APL）^［1］	采样图和原始图的平均最短路径长度，越一致越好
连接性	连通性（CC）^［4］	统计连通分量的数量，值越大连通性越差
社区结构	社区相似性（SC）^［1］	度量采样前后社区结构直方图的分布变化，值越大越好
社区结构	社区结构稳定性（SSC）^［1］	使用互信息度量采样前后社区结构的变化，值越小越好
聚类	局部聚类系数（LCC）^［1］	采样图和原始图的局部聚类系数，越一致越好
聚类	全局聚类系数（GCC）^［1］	采样图和原始图的全局聚类系数，越一致越好

新窗口打开| 下载CSV

3.3　可视化视图和交互

通过图4左上角的控制面板加载多重网络数据集，选择不同的采样算法并设置采样率等参数完成图采样工作。系统提供以下可视化形式帮助用户交互式地探索采样结果，并评估各类采样算法。

3.3.1　网络视图

图4中间。用点线连接式的图布局展示采样前后的多重网络结构。上方并排展示采样图，下方对应展示每一重网络的原始图。系统还支持节点、社区结构和连通分量的高亮等操作，帮助用户自主选择和探索感兴趣的结构。

3.3.2　投影视图

图4右上角。利用散点图将表征学习得到的节点向量在二维空间展示，点与点之间的距离表示节点之间的上下文结构相似性，此外，系统还提供了一套交互工具，可支持高亮采样节点、选择感兴趣的局部区域，为探索多重网络上下文结构特征提供便利。

3.3.3　评估视图

（1）图4左下角。以直方图的形式展示采样前后某些结构特征的分布情况，包括节点中介度、节点中心性、最短路径长度、局部聚类系数和社区节点数量。例如，可通过堆叠的直方图清晰直观地观察采样前后节点中介度的分布变化，从而估计采样后是否保留原始图中中介度较高的节点。

（2）图4右下角。以雷达图的形式展示所有采样算法在各项指标上的表现情况。每个径向轴代表一项度量指标，且与同一类别的指标轴相邻，而指标值由内向外表示从小到大。位于雷达图右上方的径向轴为ABD，沿顺时针方向排列的轴依次为ACC，CC，APL，SSC，SC，GCC和LCC，不同颜色的闭合连线代表不同的采样算法，可帮助用户快速对比和评估不同采样算法的有效性。

4　评估

4.1　量化实验

每种采样算法在多重网络数据集上运行20次（采样率设置为10%），统计所有网络图各项指标的平均值。传统的算法是单图采样，因此在每次测试中，随机将其应用于某一重图，并将采样点的结果推广至其他几重图。表2和表3分别为各算法在MOSS数据集和CELE数据集上的评估结果，箭头↑和↓分别表示指标值越大越优和越小越优。

表2 各采样算法在MOSS数据集中的评估结果

Table 2 Evaluation results of different sampling algorithm on MOSS dataset

采样算法	ABD↑	△ACC↓	△APL↓	CC↓	SC↑	SSC↓	△LCC↓	△GCC↓
Our	0.046 961	0.010 221	2.297 159	3.380 471	0.777 901	1.429 352	0.005 196	0.001 791
RN	0.005 318	0.285 930	3.272 230	35.159 032	0.452 875	1.517 411	0.035 891	0.003 874
RE	0.037 784	0.039 312	2.441 687	5.512 265	0.684 801	1.420 547	0.019 482	0.000 556
TIE	0.036 419	0.051 711	2.493 230	5.341 204	0.682 788	1.407 531	0.035 130	0.001 108
SRW	0.030 404	0.057 299	2.601 051	8.974 027	0.626 009	1.416 423	0.018 509	0.001 172
RJ	0.007 105	0.270 322	3.252 558	33.216 703	0.443 592	1.511 981	0.035 891	0.003 874
ISRW	0.032 846	0.044 754	2.360 106	5.980 326	0.653 282	1.405 518	0.035 656	0.000 194

新窗口打开| 下载CSV

表3 各采样算法在CELE数据集中的评估结果

Table 3 Evaluation results of different sampling algorithm on CELE dataset

采样算法	ABD↑	△ACC↓	△APL↓	CC↓	SC↑	SSC↓	△LCC↓	△GCC↓
Our	0.043 351	0.083 769	4.159 635	10.173 904	0.808 134	1.428 093	0.162 431	0.022 517
RN	0.016 103	0.204 642	4.346 191	18.462 014	0.675 309	1.470 793	0.212 950	0.090 168
RE	0.027 193	0.158 657	4.168 920	13.559 312	0.710 273	1.453 103	0.163 088	0.050 793
TIE	0.025 415	0.176 552	4.183 467	14.560 231	0.707 707	1.454 800	0.174 652	0.012 149
SRW	0.023 110	0.163 137	4.126 947	13.170 032	0.725 736	1.452 183	0.151 335	0.026 816
RJ	0.014 913	0.201 243	4.333 991	18.131 796	0.687 025	1.471 107	0.214 303	0.065 831
ISRW	0.025 311	0.137 640	4.149 394	12.129 012	0.684 757	1.440 637	0.095 268	0.085 155

新窗口打开| 下载CSV

如表2所示，在MOSS数据集中，本文算法在ABD，ACC，APL，CC，SC和LCC指标上表现最优，ISRW算法在SSC和GCC上最优。如表3所示，在CELE数据集中，本文算法在ABD，ACC，CC和SC指标上依然维持最优；在SSC指标上排名由MOSS数据集中的第5升至第1；虽然在APL和LCC指标上排名有所下滑，但依然排在前3；在GCC指标上排名由MOSS数据集中的第5升至第2。SRW，ISRW和TIE算法分别在APL，LCC和GCC 3项指标上排名第1。

对比MOSS和CELE两套数据集的特点，发现MOSS数据集的节点数量为400，每一重图包含连边的数量均在500左右。而CELE数据集的节点数量为237，但每一重图包含连边的数量均在1 300左右，网络连接关系更为紧密和复杂。由以上量化结果可知，本文算法在面对具有不同结构特点的多重网络数据时，大部分指标更为优秀和稳定，但在某些指标上有所起伏。

分析可知，本文算法注重维持所有网络图的全局结构以及它们之间的关联和互通性，因此当节点连接相对稀疏时（如MOSS数据集），本文算法在APL指标上的优势更明显，但当节点连接普遍紧密时（如CELE数据集），其他算法也能相对较好地保持连通关系，一定程度上弱化了本文算法在该指标上的优势。

此外，本文算法忽略了局部区域之间连接关系的相对强弱，尤其在MOSS数据集中，区域之间的关联强弱变化明显，本文算法在采样后打破了原有节点间的强弱关联关系，从而改变了原有的社区结构稳定性（SSC）和全局聚类系数（GCC）。但在CELE数据集中，节点之间的连接普遍紧实，局部区域之间的连接关系都很强且相对稳定，弥补了本文算法在关系强弱保持上的不足，使得本文算法的这2项指标得到提升。

在实验结果中，只在某1~2项指标上排名第1的ISRW和SRW采样算法，均考虑局部特征，在保持社区结构稳定性和局部聚类系数方面有一定优势。但在更多的全局特征上，如反映重要节点保留的ABD和ACC指标、反映全局社区采样的SC指标和反映连通性的CC指标，本文算法均优于传统的图采样算法，能在更大程度上保留多重网络图的全局特征。

4.2　案例分析

在多重网络图采样可视分析系统中，加载MOSS数据集，将采样率设置为15%。从基于点、边和游走的算法中各选择一种经典的采样算法RN，RE和SRW，将其应用于第一重图，进一步应用于第二和第三重图，得到节点接近中心性分布直方图，如图5所示，从左到右依次为第一、二、三重图的采样结果。在行列相间位置的直方图中，横轴表示节点接近中心性经归一化后的度量值，纵轴表示落在相应区间的节点数量的对数值，从而缩小了柱状图之间的高度差，方便对比。

图5

图5 节点接近中心性分布直方图对比（MOSS）

Fig.5 Comparison of histogram distributions for node closeness centrality （MOSS）

由图5可知，相较传统算法，本文算法获得的采样结果涵盖原有直方图分布区间的范围较广，且采样柱状图的高度和大小比例与原始图更一致。例如，最后一行的RN采样算法效果最差，在每一重图上的深色柱状图较少，与原始网络图的节点接近中心性分布差异较大。而RE和SRW算法形成的直方图分布连续性较差，在中间某1~2段区间出现了缺失（右侧第三重图最明显），在左侧或右侧的空白区间易产生新的直方图，表现极不稳定。结合量化实验可知，本文算法不仅在节点接近中心性上的宏观统计表现最优，而且在每一重图上均能较好地保持分布特征。

图6为本文算法和在量化实验中表现相对较好的ISRW和TIES算法的对比，其中，（a）为在MOSS数据集中每一重图的力导向布局，（b）（c）和（d）依次为本文、ISRW和TIES算法在15%采样率下得到的可视化效果，（c）和（d）均为将对应算法应用于第一重网络，然后将采样结果推广至其他2重图得到的采样结果。所有结果均按第一、二、三重图的顺序从左到右依次展示，每一重图的节点颜色都映射为在该网络结构下的社区分类。

图6

图6 在MOSS数据集中的采样结果可视化对比

Fig.6 Comparison of sampling results of MOSS dataset

由图6可知，本文算法在每一重图的区域覆盖和连通性上均表现最优。例如，ISRW算法在第一重图上出现了严重的社区丢失现象。对比图6（a）原始的第一重图，不难发现图6（c）在左上角区域的灰色社区和青色社区中没有采样到任何一个节点，使得用户对全局结构的感知极易出现偏差。图6（d）所示的TIES算法在第二重图的中间出现了明显的空白区域，无法保留一些起关键连通作用的节点和连边。

本文算法使用了综合所有图上下文结构特征的图表征学习方法，并在此空间内使用覆盖性较好的蓝噪声采样算法，使得每一重图的社区或局部区域都有点被采样，从而较为完整地保留了全局结构。此外，图6（c）中的第二、三重图和图6（d）中的第一、三重图均存在较多的孤立点和明显的不连通分量，无法正确推断网络间的区域互联和社区连通情况，而此类问题在图6（b）中出现较少，关联缺失的现象不明显，进一步验证了本文算法在CC和SC这2项指标上表现最优。

最后利用多重网络图采样可视分析系统加载CELE数据集，将采样率设置为20%。选择RJ算法和TIES算法，并将其应用于第三重网络，进一步探索得到的采样结果在每一重图中的连通情况，见图7。其中，（a）展示了原始的多重网络图布局，（b）（c）和（d）依次为本文、RJ和TIES算法的连通分量高亮可视化效果，其中孤立节点用同一种颜色高亮展示，其余的连通分量用不同颜色的包围盒展示。

图7

图7 在CELE数据集中的采样结果可视化对比

Fig.7 Comparison of sampling results of CELE dataset

由图7（b）知，本文算法在第一重图上表现稍差，出现了10个左右的孤立节点，在第二、三重图上均出现了5个左右的孤立节点，而在每个图中生成的主体连通子图，均能较好地还原初始网络的全局结构和整体特征。相比之下，图7（c）和（d）均在第三重图上表现较好，只有1~2个孤立节点，但在其余2重图上表现较差，除产生10多个孤立节点外，还形成了2~3个规模较大的连通子图，容易破坏用户对网络结构的整体认知。具体原因为RJ和TIES算法均以第三重图为参照进行采样，没有考虑其他重图，因此只有参照图维持了一定的结构特征，无法同时保持多重网络图的结构属性。本文算法能同步保持每一重图的结构关联，因此在多重网络图上的采样表现更稳定。

5　结论

利用改进的自适应蓝噪声采样算法，从多重网络图表征学习空间中启发式地筛选节点，尽可能地实现多重网络图的特征保持。基于多重网络图采样可视分析系统的案例分析和量化实验均显示了本文算法在多重网络图采样中的有效性。下一步将在规模更大、网络图数量更多的多重网络数据集中进行采样效果实验，以分析和测试本文算法的可拓展性。此外，通过与领域专家密切讨论进一步改进多重网络图采样可视分析系统的视图设计和交互功能，提高系统的实用性。

http://dx.doi.org/10.3785/j.issn.1008-9497.2022.03.001

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

ZHOU

， SHI

， SHEN

， et al.

Context-aware sampling of large networks via graph representation learning

［J］. IEEE Transactions on Visualization and Computer Graphics， 2020， 27（2）： 1709-1719. DOI：10.1109/TVCG.2020.3030440

[本文引用: 8]

[2]

CHENG

Sampling from large graphs with a reservoir

［C］// Proceedings of the 2014 17th International Conference on Network-Based Information Systems. Los Alamitos： IEEE Computer Society Press， 2014： 347-354. DOI：10. 1109/NBiS.2014.25

[3]

MAGNANI

， ROSSI

Formation of multiple networks

［C］// International Conference on Social Computing， Behavioral-Cultural Modeling and Prediction. Berlin/Heidelberg： Springer， 2013： 257-264. DOI：10.1007/978-3-642-37210-0_28

[4]

SUN

， ZHANG

， CHEN

A sample-based approximate ranking method for large graphs

［C］// 2018 6th International Conference on Advanced Cloud and Big Data（CBD）. Los Alamitos： IEEE Computer Society Press， 2018： 112-117. DOI：10. 1109/CBD.2018.00029

[本文引用: 5]

[5]

TÜRKOGLU

， TURK

Edge-based wedge sampling to estimate triangle counts in very large graphs

［C］// 2017 IEEE International Conference on Data Mining（ICDM）. Los Alamitos： IEEE Computer Society Press， 2017： 455-464. DOI：10. 1109/ICDM.2017.55

[6]

YOON

S H

， KIM

K N

， HONG

， et al.

A community-based sampling method using DPL for online social networks

［J］. Information Sciences， 2015， 306： 53-69. DOI：10.1016/j.ins. 2015.02.014

[7]

， HONG

S H

， CHEN

， et al.

Connectivity-based spectral sampling for big complex network visualization

［C］// International Conference on Complex Networks and Their Applications. Cham： Springer， 2020： 237-248. DOI：10.1007/978-3-030-65347-7_20

[8]

ZHOU

， MENG

， TANG

， et al.

Visual abstraction of large scale geospatial origin-destination movement data

［J］. IEEE Transactions on Visualization and Computer Graphics， 2018， 25（1）： 43-53. DOI：10.1109/TVCG.2018.2864503

[9]

GUO

， ZHU

Origin-destination flow data smoothing and mapping

［J］. IEEE Transactions on Visualization and Computer Graphics， 2014， 20（12）： 2043-2052. DOI：10.1109/TVCG.2014. 2346271

[10]

ZHAO

， JIANG

， CHEN

， et al.

Preserving minority structures in graph sampling

［J］. IEEE Transactions on Visualization and Computer Graphics， 2020， 27（2）： 1698-1708. DOI：10.1109/TVCG.2020.3030428

[11]

MAIYA

A S

， BERGER-WOLF

T Y

Benefits of bias： Towards better characterization of network sampling

［C］// Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York： ACM Press， 2011： 105-113. DOI：10.1145/2020408. 2020431

[12]

NGUYEN

Q H

， HONG

S H

， EADES

， et al.

Proxy graph： Visual quality metrics of big graph sampling

［J］. IEEE Transactions on Visualization and Computer Graphics， 2017， 23（6）： 1600-1611. DOI：10.1109/TVCG.2017.2674999

[13]

， CAO

， ARCHAMBAULT

， et al.

Evaluation of graph sampling： A visualization perspective

［J］. IEEE Transactions on Visualization and Computer Graphics， 2016， 23（1）： 401-410. DOI：10.1109/TVCG.2016.2598867

[14]

ZHANG

F Y

， ZHANG

， WONG

P C

， et al.

A visual evaluation study of graph sampling techniques

［J］. Electronic Imaging， 2017， 2017（1）： 110-117. DOI：10.2352/ISSN.2470-1173.2017.1.VDA-394

[15]

ZHANG

， YIN

， ZHU

， et al.

Network representation learning： A survey

［J］. IEEE Transactions on Big Data， 2020， 6（1）： 3-28. DOI：10.1109/TBDATA.2018.2850013 .

[16]

PEROZZI

， AL-RFOU

， SKIENA

Deepwalk： online learning of social representations

［C］// Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York： ACM Press， 2014： 701-710. DOI：10.1145/2623330.2623732

[17]

GROVER

， LESKOVEC

Node2vec： Scalable feature learning for networks

［C］// Proceedings of the 22th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York： ACM Press， 2016： 855-864. DOI：10.1145/2939672.2939754

[18]

WANG

， CHEN

， JO J， et al.

Joint t-SNE for comparable projections of multiple high-dimensional datasets

［J］. IEEE Transactions on Visualization and Computer Graphics， 2022， 28（1）： 623-632. DOI：10.1109/TVCG.2021.3114765 .

[19]

SARMA

A D

， NANONGKAI

， PANDURANGAN

， et al.

Distributed random walks

［J］. Journal of the ACM， 2013， 60（1）： 1-31. DOI：10.1145/2432622. 2432624