浙江大学学报(工学版), 2023, 57(4): 719-725 doi: 10.3785/j.issn.1008-973X.2023.04.009

自动化技术、计算机技术

时序多层网络熵值结构洞节点重要性建模

胡钢,, 牛琼, 王琴, 许丽鹏, 任勇军

1. 安徽工业大学 复杂系统多学科管理与控制安徽普通高校重点实验室,安徽 马鞍山 243032

2. 安徽工业大学 管理科学与工程学院,安徽 马鞍山 243032

3. 南京信息工程大学 计算机与软件学院,江苏 南京 210044

Modeling of node importance in entropy-value structured hole of temporal multilayer network

HU Gang,, NIU Qiong, WANG Qin, XU Li-peng, REN Yong-jun

1. Key Laboratory of Multidisciplinary Management and Control of Complex Systems of Anhui Higher Education Institutes, Anhui University of Technology, Maanshan 243032, China

2. School of Management Science and Engineering, Anhui University of Technology, Maanshan 243032, China

3. School of Computer Science, Nanjing University of Information Science and Technology, Nanjing 210044, China

收稿日期: 2022-04-21  

基金资助: 国家自然科学基金资助项目(71772002);安徽省自然科学基金资助项目(2108085MG236);安徽省高校自然科学研究资助项目(KJ2021A0385);安徽省高校研究生科学研究资助项目(YJS20210356);安徽普通高校重点实验室开放基金资助项目(GS2021-05)

Received: 2022-04-21  

Fund supported: 国家自然科学基金资助项目(71772002);安徽省自然科学基金资助项目(2108085MG236);安徽省高校自然科学研究资助项目(KJ2021A0385);安徽省高校研究生科学研究资助项目(YJS20210356);安徽普通高校重点实验室开放基金资助项目(GS2021-05)

作者简介 About authors

胡钢(1970—),男,副教授,从事复杂网络、决策分析的研究.orcid.org/0000-0003-4952-4940.E-mail:hug_2004@126.com , E-mail:hug_2004@126.com

摘要

分析动态多层复杂网络时空演化过程中的网络节点重要性序结构,提出时序多层网络熵值结构洞节点重要性辨识模型. 分析时序网络节点局部信息熵的属性与节点全局K-shell信息集结偏好信息熵. 依据复杂网络结构洞系数,提出节点熵值结构洞节点重要性辨识模型. 时序化处理节点演化信息,提出节点重要性时序网络计算模型. 通过SIR模型检验节点传播效率,开展实证网络仿真. 本文的时序多层网络节点演化重要性排序结果与经典时序网络模型相比,Kendall值有了显著的提高.

关键词: 熵值 ; 结构洞 ; K壳 ; 时序网络 ; 节点重要性

Abstract

The importance ranking structure of network nodes in the temporal and spatial evolution process of temporal multilayer network was analyzed. A model for identifying the importance of network nodes in the temporal evolution process of temporal multilayer networks based on entropy-value structured holes was proposed. The attributes of local information entropy of nodes in the temporal network and their global K-shell information aggregation preference entropy were analyzed. A model for identifying the importance of nodes of their entropy and structural hole was proposed based on the complex network structural hole coefficient. A temporal network calculation model was developed for analyzing the temporal evolution of node importance. The efficiency of node propagation was tested by using the SIR model, and empirical network simulations were conducted. The simulation results showed a significant improvement in the Kendall value of the temporal evolution ranking of network nodes compared to classic temporal network models.

Keywords: entropy ; structural hole ; K-shell ; temporal network ; node importance

PDF (996KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

胡钢, 牛琼, 王琴, 许丽鹏, 任勇军. 时序多层网络熵值结构洞节点重要性建模. 浙江大学学报(工学版)[J], 2023, 57(4): 719-725 doi:10.3785/j.issn.1008-973X.2023.04.009

HU Gang, NIU Qiong, WANG Qin, XU Li-peng, REN Yong-jun. Modeling of node importance in entropy-value structured hole of temporal multilayer network. Journal of Zhejiang University(Engineering Science)[J], 2023, 57(4): 719-725 doi:10.3785/j.issn.1008-973X.2023.04.009

时序网络是当前动态复杂网络特征多属性研究的重要领域,时序网络可以更加准确地描述网络演化进程,刻画现实生活中存在的生物网络、社交网络、交通网络和蛋白质网络等[1-5]复杂网络系统的时序演化交互关系. 时序网络研究始于静态网络,经典静态网络节点重要性序结构的研究方法有度中心性[6]、介数中心性[7]、特征向量中心性[8-9]等. 杨松青等[10]结合节点K-shell中心性和结构洞特征,提出基于Tsallis熵的复杂网络节点重要性评估方法. Lu[11]利用相对熵并引入灰色关联度量曲线边缘耦合度,提出基于结构洞和改进TOPSIS的节点重要性评估方法. 苏晓萍等[12]提出基于节点及其邻域结构洞的局部中心性测量方法,可以准确地评价节点传播能力. Zeng等[13]考虑节点混合度和剩余度,提出混合度分解方法. Sun等[14]提出基于熵的自适应节点重要性评估方法,客观地评估节点重要性. 杨杰等[15]提出基于覆盖范围和结构洞影响力最大化算法,挖掘使信息在网络中传播范围最大化的种子节点.

时序多层网络节点重要性辨识是目前网络系统研究的难点,对时序网络中节点的时序化分层提取属性特征,可以有效地表征动态复杂网络的演化过程,揭示动态复杂网络的拓扑结构与动力学系统的内在规律. 在现实生活中,网络包含时间属性,网络节点活跃程度随着时间不断变化. 时序网络节点全时间段内的属性信息变更规律及节点全时间段内的重要性排序结果较静态网络的准确性更高. Kim等[16]将时序图转化为有向静态网络,定义有向时序网络度中心性、介数中心性和紧密度中心性. Taylor等[17]考虑网络多层耦合的方法,分析网络时间层内和层间关系,建立超邻接矩阵,定义基于特征向量中心性指标和节点重要性的评判指标(SAM). 杨剑楠等[18]使用邻居拓扑重叠系数对层间关系进行度量,计算相邻层间的相似性,提出基于节点层间相似性的超邻接矩阵时序网络节点重要性识别方法. 笔者等[19]提出基于时序网络层间同构率动态演化的超邻接矩阵建模重要节点辨识方法,分析时序网络多时间层内节点交互信息对节点重要性排序的影响. 曹连谦等[20]分析节点异质性、层间耦合、层内耦合对网络能控性的影响,给出网络系统能控的充分条件或必要条件.

时序网络领域研究取得初步成果,应注意到在动态多层复杂网络的时序演化过程中,不同时序网络层间节点交互关联信息集结存在冗余,同一时间段内多层网络、层与层之间、层内之间的关联关系存在冗余. 为了有效地剔除动态网络时序演化的大量冗余交互关联信息,提高时序网络节点重要性的辨识准确性,本文提出熵值结构洞时序网络(entropy-valued structural holes temporal networks, ESHT)节点重要性辨识模型. 给出时序网络K-shell广义邻接信息熵、熵值投入比、熵值结构洞等相关定义. 提出熵值结构洞模型,给出相应的算法. 利用SIR模型与Kendall相关系数进行验证,说明模型的有效性及优越性.

1. 理论基础

时序网络节点的重要性排序结果在不同时间层内是动态变化的. 在静态多层网络中,节点的邻接信息熵可以提供准确的节点重要性排序信息. 将其延伸至时序网络,则节点在相邻时间层和多个连续时间层内的交互关系会随着时间的推进而不断间断和重连,网络拓扑结构不断演化,如图1所示,静态网络无法描述这一过程. 本文针对动态多层无向无权时序网络节点的重要性进行演化分析,使用邻接度和邻接度概率函数表征节点属性信息. 基于网络K-shell分解,构建K-shell广义邻接信息熵. 本文提出节点熵值结构洞重要性序结构辨识方法,并延伸至时序网络,提出对应的时序网络节点重要性辨识模型.

图 1

图 1   时序多层网络节点信息演化图

Fig.1   Evolution diagram of temporal multilayer network node information


1.1. 广义邻接信息熵

节点邻接信息熵通过研究节点及其直接和间接节点间交互关联关系,利用节点信息熵刻画不同节点在网络中局部影响力的重要性. 网络节点交互关联属性信息通过局部信息熵集结表述更加精准.

设无向网络 $G = \left( {V,E} \right)$( $ V = \left\{ {{v_1},{v_2},{v_3}, \cdots ,{v_n}} \right\} $)为网络中的节点集合, $\left| V \right| = n$, $E = \left\{ {{e_1},{e_2},{e_3}, \cdots ,{e_m}} \right\} \subseteq $ $V \times V$为边的集合, $\left| E \right| = m$. 节点 $i$的度值可以表示为 $ {k_i} =\displaystyle \sum\nolimits_{j \in G} {{a_{ij}}} $,其中

邻接度为

$ {Q_i} = \mathop \sum \limits_{\omega \in {\varGamma _i}} {k_\omega }. $

其中 ${\varGamma _i}$为节点 $i$的邻居节点集合.

邻接度概率函数为

$ {P_i} = \frac{{{k_i}}}{{{Q_j}}};{\text{ }}j \in \varGamma \left( i \right). $

信息熵[21]由香农在1948年提出,指出任何信息都存在冗余,冗余大小与信息中每个符号的出现概率或不确定性有关. 利用概率与统计的方法,表征样本空间所体现的无序化程度.

$ {H_i} = - \mathop \sum \limits_{i=1}^n {P_i^{'}}{\log _2}\;{P_i^{'}}. $

式中: ${P_i^{'}}=k_i/\displaystyle\sum\nolimits_{{i=1}}^{{n}}{{k_i}} $.

节点邻居概率函数. 为了描述不同节点的邻居节点对节点的影响力大小,根据信息熵理论,定义节点邻居概率函数如下:

$ {{\rm{NP}}_i} = - \mathop \sum \limits_{j \in {{{\varGamma }}_i}} {P_i}{\log _2}\;{P_i}. $

广义邻接信息熵为

$ {{\rm{NH}}_i} = - \mathop \sum \limits_{j \in {\varGamma _i}} {P_j} {{P_i}{{\log }_2}\;{P_i}} . $

节点邻接信息熵通过集结网络节点多属性度偏好信息,比较全面有效地表征网络各个节点的重要性权重.

1.2. K-shell分解

K-shell分解的核心思想是将整个网络划分为从边缘至核心的不同层次,递归地删除网络中节点度值小于或等于 $k$的节点,记录被删除节点的K-shell(简称Ks)值. K-shell分解有利于大型复杂网络节点的快速分类计算. 如图2所示为K-shell分解的具体划分步骤. 1)删除网络中所有度为1的节点,若删除完成后网络内继续出现度为1的节点,则继续上述删除过程,直至网络中不出现度为1的节点,此时将已删除节点的 $K_{\rm{s}}$记为1. 2)删除网络中节点度为2, 3, 4,···的节点, $K_{\rm{s}}$值分别记为2,3,4,···,直到网络中的所有节点都被赋予对应的 $K_{\rm{s}}$.图2所示为 $K_{\rm{s}} = 3$的分解过程, $K_{\rm{s}} = 1$的节点包括1、2、3、4、5、6、9、14、16、17, $K_{\rm{s}} = 2$的节点包括7、8、15, $K_{\rm{s}} = 3$的节点包括10、11、12、13.

图 2

图 2   K-shell分解

Fig.2   K-shell decomposition


1.3. K-shell广义邻接信息熵

节点的广义邻接信息熵表征各个节点在网络中不同层间的局部交互关联信息. 在时序网络演化过程中,节点会被网络局部信息影响,网络整体关联信息对每个节点的演化进程起到主导作用. K-shell分解是对网络整体信息等级划分处理的方式,节点 $K_{\rm{s}}$值表征网络节点位置属性,大量节点被赋予相同的 $K_{\rm{s}}$,使得节点间区分度变低. 基于以上信息,提出K-shell广义邻接信息熵,结合网络邻接节点交互关系,通过熵值实现局部属性到整体属性的跨越. 应用K-shell分解,有效地提高层内层间交互关联信息的整体可靠性.

K-shell广义邻接信息熵为

$ {{\rm{KH}}_i} = - \left( {{{\rm{e}}^k}} \right)\mathop \sum \limits_{j \in {\varGamma _i}} {P_j} {{P_i}{{\log }_2}{P_i}} . $

式中: ${\rm{e}}$为自然常数, $k$为节点 $i$在该网络中的 $K_{\rm{s}}$.

1.4. 结构洞理论

结构洞[22]是Burt研究人际关系网络的经典社会学理论,从社会学角度来看,结构洞通常表示非冗余联系. 图3中,Kev与ABC之间任意两者的关系是一个结构洞. AB与Kev都有联系,但是二者之间不存在关系,相当于存在一个空洞. Kev充当起中间人的角色,为Kev获取“信息利益”和“控制利益”提供机会,较网络中其他位置上的节点具有更高的重要性.

图 3

图 3   结构洞网络

Fig.3   Structural hole network


Burt为了衡量网络节点形成结构洞时所受到的约束,提出网络约束系数[22]

$ {C_i} = \mathop \sum \limits_{j \in {\varGamma _i}} {\left( {{p_{ij}}+\mathop \sum \limits_q {p_{iq}}{p_{qj}}} \right)^2};{\text{ }}q \ne i,j. $

式中:节点 $q$为节点 $i$和节点 $j$的共同邻居; ${p_{ij}}$为节点 $i$连接节点 $j$付出的总精力占比,

$ {p_{ij}} = \frac{{{a_{ij}}}}{{\displaystyle\mathop \sum \nolimits_{j \in {\varGamma _i}} {a_{ij}}}}. $

图4所示,计算节点 $i$的约束系数. 可知,节点 $i$的邻居节点集合 $ {\varGamma _i} = \left\{ {A,B,C,D,E,F} \right\} $,其中iA的共同邻居有 $\left\{ {B,E,F} \right\}$,于是有

图 4

图 4   结构洞约束系数计算的示意图

Fig.4   Schematic diagram of structural hole constraint coefficient calculation


同理可以继续求得 ${C_{iB}}$, ${C_{iC}}$,···,求和后可得 ${C_i}$. 在网络约束系数的计算过程中,考虑每个节点度和网络邻居节点拓扑的关系,网络约束系数越大,表示该节点的紧密度越高,节点在新的关系资源竞争中可能处于不利地位. 网络约束系数越小,使得该节点拥有较高的度和较低的紧密度,则该节点有更高的结构洞性质.

1.5. 熵值结构洞

结构洞理论为寻找网络中的重要枢纽节点提供理论基础. 结构洞计算结合网络中节点的自身度和所计算节点的共同邻居数目,计算出每个节点与共同邻居节点间的贡献程度,得到每个节点的结构洞约束系数. K-shell邻接信息熵可以快速约简,加速网络分层分块,但K-shell信息熵带来较多的冗余信息. 为了有效地解决节点信息的冗余性问题,基于结构洞投入比提出节点熵值投入比:

$ {{\rm{Hp}}_i} = \frac{{{{\rm{KH}}_i}}}{{\displaystyle\mathop \sum \nolimits_{v \in {\varGamma _i}} {{\rm{KH}}_v}}}. $

网络K-shell分解得到节点 $K_{\rm{s}}$值,大量节点被赋予相同的属性值,使得节点在分类后网络一阶邻居节点的属性特征相同,导致网络广义邻接信息熵相同,故在网络中部分节点的K-shell广义邻接信息熵值相等. 为了提升网络节点重要性的分辨效率,引进网络节点与邻居节点,计算节点与其邻居节点K-shell广义邻接信息熵比值,细化节点信息表征.

基于结构洞理论,提出节点熵值结构洞:

$ {{\rm{HC}}_i} = \mathop \sum \limits_{j \in {\varGamma _i}} {\left( {{{\rm{KH}}_i}+\mathop \sum \limits_{j \in {{{\varGamma }}_i}} {{\rm{Hp}}_i}{p_{ij}}} \right)^2}. $

时序多层网络熵值结构洞在计算过程中,将结构洞投入比转换成节点K-shell邻接信息熵投入比,节点K-shell邻接信息熵信息包含网络整体拓扑结构属性和节点局部拓扑信息属性,使得节点在网络全局计算上更加精准.

1.6. 时序多层网络节点重要性的计算模型

熵值结构洞的时序化网络节点重要性计算考虑节点累计效应的影响,将时序多层网络节点在每个时间层内的排序结果进行归一化无量纲处理. 基于以上分析可知,时序网络节点熵值结构洞的重要性系数为

$ {{\rm{THC}}_i} = \mathop \sum \limits_{t = 1}^{{T}} \frac{{{{\rm{HC}}_i}^t}}{{\displaystyle\mathop \sum \nolimits_{i = 1}^N {{\rm{HC}}_i}^t}} . $

式中: ${{\rm{HC}}_i}^t$为节点 $i$在时间层 $t$的熵值结构洞系数, $N$为网络节点总数, $T$为网络时间层总数.

式(11)中 $t = 1$时表示第1个时间层内节点 $i$熵值结构洞系数. 由于第1个时间层内的节点未进行累计结果,当前时间层内的节点重要性排序结果等于节点熵值结构洞排序结果.

式(11)中 $t = 2$时表示第1个时间层和第2个时间层内节点 $i$熵值结构洞系数的累计结果. 由于节点熵值占比信息在时间层内进行累计, $t = 2$时节点重要性的排序结果与 $t = 1$时相比,节点重要性排序结果发生明显变化.

式(11)中 $t = T$时表示第1个时间层至第T个时间层内节点 $i$熵值结构洞系数的累计结果.

熵值结构洞计算节点在时序网络中的活跃性系数,根据熵增定律可知,在确定时间层划分长度的情况下,每个时间层内的熵总值为定值. 计算时间层内节点熵值结构洞系数在本层内的占比,可以直观地表述该节点在本层的活跃性占比. 网络时间层依据时间间隔进行均值划分,单一时间层的时间长度比例相等,节点随着时间推进演化,累计节点熵值结构洞系数占比更加合理. 熵值结构洞时序网络计算模型反映节点在一个或多个时间层内节点重要性排序结果的演化规律,避免单一时间层节点活跃性突变导致重要性排序在短时间内发生巨大变化,降低节点影响力突变效应在全时间层内的消极影响.

2. 实证数据分析

2.1. SIR传播模型

使用SIR传播模型,模拟真实网络节点受到感染后的传播过程,统计在时序网络层内稳定状态下的免疫节点数量,计算该节点在当前时间层内的影响力大小. SIR模型将网络中的节点分为以下3类. 1)易感者,其数量记为 $S\left( t \right)$,表示 $t$时刻健康但缺乏免疫力的节点. 2)感染者,其数量记为 $I\left( t \right)$,表示 $t$时刻被感染成为病人并且具有传染能力的节点. 3)免疫者,其数量记为 $R\left( t \right)$,表示 $t$时刻已经痊愈并且获得免疫能力的节点或已经死亡、不再对相应动力学行为有影响的节点. 设总人口为 $N\left( t \right)$,则有 $N\left( t \right) = S\left( t \right)+I\left( t \right)+R\left( t \right)$. 传染率 $\;\beta $为2个人接触后被感染的概率,无论其是否为易感者. 治愈率 $\gamma $为一位感染者被治愈为免疫者的概率. SIR模型的微分方程如下:

$ \left. {\begin{array}{*{20}{l}} {\dfrac{{{\rm{d}}S\left( {{t}} \right)}}{{{\rm{d}}t}}{{ = - \lambda I}}\left( {{t}} \right){{S}}\left( {{t}} \right)}, \\ {\dfrac{{{\rm{d}}I\left( {{t}} \right)}}{{{\rm{d}}t}}{{ = \lambda {{I}}}}\left( {{t}} \right){{S}}\left( {{t}} \right){{ - \eta {{I}}}}\left( {{t}} \right)}, \\ {\dfrac{{{\rm{d}}R\left( {{t}} \right)}}{{{\rm{d}}t}}{{ = \eta {{I}}}}\left( {{t}} \right)}. \end{array}} \right\} $

2.2. 数据集及相关参数

实验采用Workspace数据集和Email-Eu-core数据集,验证时序多层网络熵值结构洞节点重要性的排序结果. Workspace数据集[23]是2013年6月24日至7月3日在法国一栋办公楼测量到的个人之间面对面交互联系数据集. 面对面接触记录是按照交流时长进行统计,每个场景的总时长不同,因此Workspace数据的单位时间层划分长度为“一天”,即每个时间层的时间范围是24 h. Email-Eu-core数据集[24]利用欧洲一家大型研究机构的电子邮件数据生成的网络数据集,电子邮件时序网络数据包含986个匿名ID在历时803天中产生的交互信息,本文以30 d为一个时间尺度进行划分,截取其中360 d的交互信息进行仿真实验. 网络的基本特征如表12所示. 表中, $T$为切分的网络层数, $N$为网络节点数目, $ N _{\rm{a}} $为当前时间层内有连边的节点数, $ E $为当前时间层内整个网络的连边数, $\left\langle k \right\rangle $为网络平均度, $\left\langle {{k^2}} \right\rangle $为网络二阶邻居平均度,βth为传播阈值.

表 1   Workspace网络的基本特征统计

Tab.1  Basic characteristics statistics of Workspace network

T N Na E 时间段 $\left\langle k \right\rangle $ $\left\langle {{k^2}} \right\rangle $ $\;{\beta _{{\rm{th}}}}$
1 92 72 188 第1~10天 4.09 28.41 0.14
2 92 70 152 第11~20天 3.30 18.83 0.18
3 92 59 123 第21~30天 2.67 15.39 0.17
4 92 70 186 第31~40天 4.04 28.61 0.14
5 92 62 103 第41~50天 2.24 10.46 0.21
6 92 68 147 第51~60天 3.20 17.93 0.18
7 92 69 151 第61~70天 3.28 19.83 0.17
8 92 69 160 第71~80天 3.48 23.65 0.15
9 92 68 158 第81~90天 3.43 21.54 0.16
10 92 62 94 第91~100天 2.04 8.30 0.25

新窗口打开| 下载CSV


表 2   Email-Eu-core网络的基本特征统计

Tab.2  Basic characteristics statistics of Email-Eu-core network

T N Na E 时间段 $\left\langle k \right\rangle $ $\left\langle {{k^2}} \right\rangle $ $\;{\beta _{{\rm{th}}}}$
1 851 664 2863 第1~30天 62.24 1206.43 0.05
2 851 646 2505 第31~60天 54.46 903.61 0.06
3 851 607 1770 第61~90天 38.48 493.30 0.08
4 851 633 2170 第91~120天 47.17 688.20 0.07
5 851 665 3053 第121~150天 66.37 1300.28 0.05
6 851 676 3110 第151~180天 67.61 1364.50 0.05
7 851 689 3236 第181~210天 70.35 1537.57 0.05
8 851 648 2602 第211~240天 56.57 976.17 0.06
9 851 675 2822 第241~270天 61.35 1115.15 0.06
10 851 671 2590 第271~300天 56.30 1008.50 0.06
11 851 696 3198 第301~330天 69.52 1483.78 0.05
12 851 694 3290 第331~360天 71.52 1493.76 0.05

新窗口打开| 下载CSV


假设传染者为节点 $i$,开始时刻只有该节点一个传染者,剩余节点均为易感者. 在设定传播率 $\;\beta $时, $\;\beta $过大或过小都无法衡量每个节点的传播能力. 设定的传播阈值[25]$\;{\beta _{{\rm{th}}}} \approx \left\langle k \right\rangle /\left\langle {{k^2}} \right\rangle $. 为了保证传播过程的正常进行,本文的 $\;\beta $大于 $\;{\beta _{{\rm{th}}}}$. 对每个节点进行1 000次模拟仿真实验,传染者节点 $i$在当前层内传染后,最终的免疫者数量取1000次实验结果的期望值. 不同网络时间层内节点 $i$的邻居节点数和邻居节点信息熵可能不同,故节点 $i$在每一层实验仿真的排序结果都会有所差异.

2.3. 评价方法

实验采用肯德尔相关系数(Kendall’s $\tau $)[26],对时序网络熵值结构洞排序结果和单位时间层内SIR传播模型结果进行相关性分析. Kendall’s $\tau $相关系数用来衡量各指标两变量序列之间的相关性程度,表达式为

$ \tau = \frac{{\displaystyle\mathop \sum \nolimits_{i < j} {\text{sgn}}\left[ {\left( {{x_i} - {x_j}} \right)\left( {{y_i} - {y_j}} \right)} \right]}}{{\sqrt {\left[ {\dfrac{{n\left( {n - 1} \right)}}{2} - {n_1}} \right]\left[ {\dfrac{{n\left( {n - 1} \right)}}{2} - {n_2}} \right]} }} . $

式中: ${\boldsymbol{X}} = {\left[ {{x_1},{x_2}, \cdots ,{x_n}} \right]^{\rm{T}}}$, ${\boldsymbol{Y}} = {\left[ {{y_1},{y_2}, \cdots ,{y_n}} \right]^{\rm{T}}}$XY中元素的节点熵值按从大到小的顺序排列; $n$为序列长度,即节点总数;

其中 ${t_i}$$X$序列中第 $i$个使得 ${\text{sgn}} \;z = 0$${x_i}$的个数, ${u_j}$$Y$序列中第 $j$个使得 ${\text{sgn}}\; z = 0$${y_j}$的个数. $\tau $的取值为 $\left[ { - 1,1} \right]$,该值越大,两序列的相关性越强;反之,则两序列的相关性越弱.

2.4. 实验结果分析

为了验证本文方法的有效性,基于实证网络数据集,使用SIR模型得到节点免疫数量排序分析, 利用 $\tau $评估排序相关性. 利用本文ESHT方法与SAM方法、OSAM方法[27]开展仿真比较,时序网络中SAM和OSAM节点重要性辨识方法均是依托超邻接矩阵计算网络节点特征向量中心性大小,对节点进行重要性排序. SAM方法使用固定参数表征相邻时间层内的关系,取 $\omega \in \left\{ {0.1,0.2, \cdots ,1.0} \right\}$,且只考虑当前时间层与相邻时间层的关系. OSAM方法在SAM的基础上,考虑不同时间层对当前时间层内节点重要性序结构的叠加信息演化影响. 具体的实验结果如图5~8所示.

图 5

图 5   Workspace数据节点使用ESHT方法与SAM方法排序结果的Kendall相关性系数分析对比

Fig.5   Comparative analysis of Kendall correlation coefficients between sorting results of ESHT and SAM methods for Workspace data nodes


图 6

图 6   Workspace数据节点使用ESHT方法与OSAM方法排序结果的Kendall相关性系数分析对比

Fig.6   Comparative analysis of Kendall correlation coefficients between sorting results of ESHT and OSAM methods for Workspace data nodes


图 7

图 7   Email-Eu-core数据节点使用ESHT方法与SAM方法排序结果的Kendall相关性系数分析对比

Fig.7   Comparative analysis of Kendall correlation coefficients between sorting results of ESHT and SAM methods for Email-Eu-core data nodes


图 8

图 8   Email-Eu-core数据节点使用ESHT方法与OSAM方法排序结果的Kendall相关性系数分析对比

Fig.8   Comparative analysis of Kendall correlation coefficients between sorting results of ESHT and OSAM methods for Email-Eu-core data nodes


根据实验结果分析,可得如下结论. 1) 如图56所示,ESHT方法在Workspace数据的部分时间层内τ有所提高,与SAM方法和OSAM方法相比,在整个时域内τ的提升比例分别为11.178%和29.776%. 在部分时间层中,ESHT方法的结果表现不如其他方法,这是由于数据本身的特性所导致的. 2) 如图78所示为Email-Eu-core数据实验结果,ESHT方法在全时域内的结果都有明显的提高. 3) 时序化网络的τ在整个时域内有所下降,这是由于SIR结果的序结构没有进行时序化处理所导致的,随着时间的推移,这种误差效应将更加明显.

3. 结 语

本文提出熵值结构洞时序网络的节点重要性序结构辨识方法,可以有效地对复杂网络中的节点重要性进行排序. 该方法综合考虑了网络节点局部信息熵属性变化和节点K-shell全局拓扑信息,利用时序网络计算模型将网络节点时序化,揭示了节点重要性序结构随时间的演化规律,通过仿真建模分析验证了相关结论. 未来应进一步探讨动态多层网络熵值结构洞节点重要性的辨识方法,并将其推广到时序演化节点重要性的预测分析中.

参考文献

AGHAALIZADEH S, AFSHORD S T, BOUYER A, et al. A three-stage algorithm for local community detection based on the high node importance ranking in social networks [J]. Physica A: Statistical Mechanics and its Applications. 2021, 563: 125420.

[本文引用: 1]

LI H, ZHANG R, ZHAO Z, et al

LPA-MNI: an improved label propagation algorithm based on modularity and node importance for community detection

[J]. Entropy (Basel, Switzerland), 2021, 23 (5): 497

DOI:10.3390/e23050497     

纪秋磊, 梁伟, 傅伯杰, 等

基于Google Earth Engine与复杂网络的黄河流域土地利用/覆被变化分析

[J]. 生态学报, 2021, 42 (6): 1- 14

JI Qiu-lei, LIANG Wei, FU Bo-jie, et al

Land ues/cover change in the Tellow River Basin based on Google Earth Engine and complex network

[J]. Acta Ecologica Sinica, 2021, 42 (6): 1- 14

CHENFENG X, SONGHUA H, MOFENG Y, et al

Mobile device data reveal the dynamics in a positive relationship between human mobility and COVID-19 infections

[J]. Proceedings of the National Academy of Sciences, 2020, 117 (44): 27087- 27089

DOI:10.1073/pnas.2010836117     

YABE T, TSUBOUCHI K, FUJIWARA N, et al

Non-compulsory measures sufficiently reduced human mobility in Tokyo during the COVID-19 epidemic

[J]. Scientific Reports, 2020, 10 (1): 1- 9

DOI:10.1038/s41598-019-56847-4      [本文引用: 1]

BONACICH P

Factoring and weighting approaches to status scores and clique identification

[J]. Journal of Mathematical Sociology, 2010, 2 (1): 113

[本文引用: 1]

LORRAIN F, WHITE H C

Structural equivalence of individuals in social networks

[J]. Social Networks, 1977, 1 (1): 67- 98

[本文引用: 1]

BORGATTI S P

Centrality and network flow

[J]. Social Networks, 2005, 27 (1): 55- 71

DOI:10.1016/j.socnet.2004.11.008      [本文引用: 1]

ZELEN S M

Rethinking centrality: methods and examples

[J]. Social Networks, 1989, 11 (1): 1- 37

DOI:10.1016/0378-8733(89)90016-6      [本文引用: 1]

杨松青, 蒋沅, 童天驰, 等

基于Tsallis熵的复杂网络节点重要性评估方法

[J]. 物理学报, 2021, 70 (21): 273- 284

[本文引用: 1]

YANG Song-qing, JIANG Yuan, TONG Tian-chi, et al

A method for evaluating the importance of nodes in complex network based on Tsallis entropy

[J]. Chinese Journal of Physics, 2021, 70 (21): 273- 284

[本文引用: 1]

LU M

Node importance evaluation based on neighborhood structure hole and improved TOPSIS

[J]. Computer Networks, 2020, 178 (9): 107336- 107349

[本文引用: 1]

苏晓萍, 宋玉蓉. 利用邻域“结构洞”寻找社会网络中最具影响力节点[J]. 物理学报, 2015, 64(2): 5-15.

[本文引用: 1]

SU Xiao-ping, SONG Yu-rong. Leveraging neighborhood “structural holes” to identifying key spreaders in social networks [J] Chinese Journal of Physics, 2015, 64(2): 5-15.

[本文引用: 1]

ZENG A, ZHANG C J

Ranking spreaders by decomposing complex networks

[J]. Physics Letters A, 2013, 377 (14): 1031- 1035

DOI:10.1016/j.physleta.2013.02.039      [本文引用: 1]

SUN Q, YANG G Y, ZHOU A, et al

An entropy-based self-adaptive node importance evaluation method for complex networks

[J]. Complexity, 2020, 2020 (10): 1- 13

[本文引用: 1]

杨杰, 张名扬, 芮晓彬, 等

融合节点覆盖范围和结构洞的影响力最大化算法

[J]. 计算机应用, 2021, 42 (4): 1- 8

[本文引用: 1]

YANG Jie, ZHANG Ming-yang, RUI Xiao-bin, et al

Influence maximization algorithm based on node coverage and structural holes

[J]. Journal of Computer Applications, 2021, 42 (4): 1- 8

[本文引用: 1]

KIM H, ANDERSON R

Temporal node centrality in complex networks

[J]. Physical Review. E, Statistical, Nonlinear, and Soft Matter Physics, 2012, 85 (2): 1- 8

[本文引用: 1]

TAYLOR D, MYERS S A, CLAUSET A, et al

Eigenvector-based centrality measures for temporal networks

[J]. Multiscale Modeling and Simulation: A SIAM Interdisciplinary Journal, 2017, 15 (1): 537- 574

DOI:10.1137/16M1066142      [本文引用: 1]

杨剑楠, 刘建国, 郭强

基于层间相似性的时序网络节点重要性研究

[J]. 物理学报, 2018, 67 (4): 279- 286

DOI:10.7498/aps.67.20172255      [本文引用: 1]

YANG Jian-nan, LIU Jian-guo, GUO Qiang

Node importance idenfication for temporal network based on inter-layer similarity

[J]. Chinese Journal of Physics, 2018, 67 (4): 279- 286

DOI:10.7498/aps.67.20172255      [本文引用: 1]

胡钢, 许丽鹏, 徐翔

基于时序网络层间同构率动态演化的重要节点辨识

[J]. 物理学报, 2021, 70 (10): 355- 366

[本文引用: 1]

HU Gang, XU Li-peng, XU Xiang

Identification of important nodes based on dynamic evolution of inter-layer isomorphism rate in temporal networks

[J]. Chinese Journal of Physics, 2021, 70 (10): 355- 366

[本文引用: 1]

曹连谦, 王立夫, 孔芝, 等. 多层异质复杂网络系统的能控性[EB/OL]. [2022-04-01]. https://doi.org/10.16383/j.aas.c210654.

[本文引用: 1]

CAO Lian-qian, WANG Li-fu, KONG Zhi, et al. Controllability of multi-layer heterogeneous complex network systems[EB/OL]. [2022-04-01]. https://doi.org/10.16383/j.aas.c210654.

[本文引用: 1]

穆俊芳, 郑文萍, 王杰, 等

基于重连机制的复杂网络鲁棒性分析

[J]. 计算机科学, 2021, 48 (7): 130- 136

[本文引用: 1]

MU Jun-fang, ZHENG Wen-ping, WANG Jie, et al

Robustness analysis of complex network based on rewiring mechanism

[J]. Computer Science, 2021, 48 (7): 130- 136

[本文引用: 1]

BURT R S

Structural holes: the social structure of competition

[J]. The Economic Journal, 1994, 40 (2): 685- 686

[本文引用: 2]

GÉNOIS M, BARRAT A

Can co-location be used as a proxy for face-to-face contacts?

[J]. Epj Data Science, 2018, 7 (1): 11

DOI:10.1140/epjds/s13688-018-0140-1      [本文引用: 1]

PARANJAPE A, BENSON A R, LESKOVEC J. Motifs in temporal networks [M]. New York: ACM, 2017: 601-610.

[本文引用: 1]

CASTELLANO C, PASTOR-SATORRAS R

Thresholds for epidemic spreading in networks

[J]. Physical Review Letters, 2010, 105 (21): 218701

DOI:10.1103/PhysRevLett.105.218701      [本文引用: 1]

BORRONI C G

A new rank correlation measure

[J]. Statistical Papers, 2013, 54 (2): 255- 270

DOI:10.1007/s00362-011-0423-0      [本文引用: 1]

胡钢, 牛琼, 许丽鹏, 等

基于网络超链接信息熵的节点重要性序结构演化建模分析

[J]. 电子学报, 2022, 50 (11): 2638- 2644

[本文引用: 1]

HU Gang, NIU Qiong, XU Li-peng, et al

The model to analyses of node importance order structure evolution based on network hyperlink information entropy

[J]. Acta Electronica Sinica, 2022, 50 (11): 2638- 2644

[本文引用: 1]

/