<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 Sta-HisNet框架图

Fig.1 Framework of Sta-HisNet

2.1. 动态知识图谱背景

动态知识图谱在传统的知识图谱上添加了时间信息. 在动态知识图谱中，每个事实是在时间戳 $\tau $中获得头实体、尾实体和其对应的关系. 将动态知识图谱中的事实定义成四元组的形式： $\left( {h,r,t,\tau } \right)$. 一般动态知识图谱的推理基于四元组的形式，在已知时间戳下，给定任意3个元素推测另一个元素. 根据动态知识图谱推理方法，分为实体预测和关系预测. 其中实体预测又可分为头实体预测和尾实体预测，尾实体预测是在已知h、r和τ的情况下来预测t；而头实体预测是在已知r、t和τ的情况下来预测h.

2.2. 基于时间序列的实体嵌入

由于实体随着时间的变化，含义将会发生变化，同时实体也有着时不变的特性. 为了同时满足实体嵌入的时变和时不变特征，本研究的实体嵌入 $ {h_\tau } $计算式为

(1) $ {{\boldsymbol{h}}_{\tau}} = [e||\varPhi (\tau )] \in {{\bf{R}}^{{{O+D}}}} . $

式中： $ e $为时常嵌入，它捕获时常特征和对动态知识图谱的全局依赖性； $ {{O}} $为 $ e $的嵌入维度； $ || $为拼接操作； $ \varPhi (\tau ) $为捕获实体之间的时间依赖性的时间编码，采用正弦的形式使得实体与每个时间戳相结合，可以更好地让实体嵌入学习到时间信息； $ {{D}} $为 $ \varPhi (\tau ) $的嵌入维度. $ \varPhi (\tau ) $的表达式为

(2) $ \varPhi (\tau ) = d^{-1/2} [{\rm{sin}}\;({\omega _1}\tau +{\varphi _1}), \cdots ,{\rm{sin}}\;({\omega _d}\tau +{\varphi _d})]. $

式中： $d$为时间序列长度， $ \omega $和 $ \varphi $为可学习的参数.

2.3. 基于静态事实的静态嵌入

实体中包含有大量的静态属性，将这些属性组成一个静态知识图谱，可以看作是动态知识图谱的背景知识，有助于模型学习到更准确的实体信息. 在ICEWS18^[17]数据集中的实体有（公民）菲律宾、（政府）菲律宾、（城市）菲律宾、菲律宾、（公民）美国、（公民）俄罗斯、公民，他们之间存在一定的关系，可以构成这样的事实三元组——（（公民）菲律宾，隶属，菲律宾）、（（政府）菲律宾，隶属，菲律宾）、（（城市）菲律宾，隶属，菲律宾）、（（公民）菲律宾，是，公民）、（（公民）美国，是，公民）、（（公民）俄罗斯，是，公民），如图2所示.

图 2

图 2 ICEWS18数据集的部分静态知识图谱

Fig.2 Partial static knowledge graph of ICEWS18 data set

若直接将公民（菲律宾）视为一个嵌入，则会丢失其与公民和菲律宾之间的联系，因此通过挖掘实体间隐藏的联系构成新的静态事实，从而构建成新的静态知识图谱. 由于获得的静态知识图谱是多关系图，R-GCN^[8]采用一层没有自循环的R-GCN来获得静态知识图谱中实体的静态嵌入，这样可以在建立多关系图时，不需要额外的关系嵌入. R-GCN的更新规则定义为

(3) $ {{\boldsymbol{h}}}_{s}=\sigma \left(\frac{1}{{c}_{{i}}}{\displaystyle \sum _{ r\in {\bf{R}}}{\displaystyle \sum _{j\in {N}}{{\boldsymbol{W}}}_{{r}}}}{{\boldsymbol{h}}}_{{j}}\right). ^{ } $

式中： $ {{\boldsymbol{h}}_s} $、 $ {{\boldsymbol{h}}_j} $分别为输出和随机初始化的输入嵌入矩阵； $ {c_{{i}}} $为归一化常数，是与实体 $i$连接的实体数量； $N$为所有实体的数量； $ {{\boldsymbol{W}}_r} $为关系 $r$的可训练矩阵； $ \sigma ( \cdot ) $为ReLu激活函数.

2.4. 历史模式

在特定的数据集中有许多历史事实是重复的，一个模型可能会从历史上出现的已知事实中学到很多东西. 历史模式旨在识别重复的事实，并通过惩罚历史上未知的事实来预测未来的事实. 历史模式的流程如下：传统的一维卷积可以提取的特征信息十分有限，因此采用卷积的方式提取特征. 为了更好地提取实体、关系、时间和静态嵌入特征，采用基于卷积神经网络嵌入(convolution embedding, ConvE)^[18]模型中的二维卷积方法，利用长短期记忆(long short-term memory, LSTM)^[19]网络捕获时序信息，经过一层神经网络改变维度得到实体预测结果. 通过历史事实构建历史词表，利用历史词表筛选出历史中未出现过的事实并对其进行惩罚，经过softmax函数得到历史模式的最终预测概率，流程如图3所示.

图 3

图 3 Sta-HisNet的历史模式流程图

Fig.3 Historical pattern flow chart for Sta-HisNet

假设给定头实体、关系、时间戳和预测尾实体 $\left( {h,r,?,\tau } \right)$，将基于时间序列的头实体嵌入、关系嵌入、时间戳嵌入和静态嵌入丢弃部分信息防止过拟合，再重塑成三维矩阵 ${{\boldsymbol{m}}_\tau }$，然后将矩阵做卷积核为 $k \times k$的二维卷积得到特征图 ${{\boldsymbol{M}}_\tau }$，将其二维卷积后的特征图重塑成一维向量可得

(4) $ {{\boldsymbol{m}}_\tau } = {{\rm{concat}}} ({{\rm{Re}}} ({h_\tau }){\text{;}}{{\rm{Re}}} (r);{{\rm{Re}}} (\tau ){\text{;}}{{\rm{Re}}} ({h_s})). $

(5) $ {{\boldsymbol{M}}_\tau } = {\text{Conv2d}}\left( {{{\boldsymbol{m}}_\tau }} \right), $

(6) $ {{\boldsymbol{V}}_\tau } = {{\rm{Re}}} '\left( {{{\boldsymbol{M}}_\tau }} \right). $

式中： $ {{\rm{Re}}} $为把嵌入形状改成 $1 \times m \times n$三维矩阵的运算符号； ${\text{concat}}$为拼接操作； $ {{\boldsymbol{m}}_{\tau}} $为重塑后的三维矩阵， ${\boldsymbol{m}}_{\tau} \in {\bf{R}}^{{\text{4}} \times m \times n}$； $ {\text{Conv2d}} $为二维卷积函数，输入的通道为1； $ k $为卷积核大小； $f$为卷积核个数； $ {{\boldsymbol{M}}_\tau } $ 为卷积后的特征图， $ {{\boldsymbol{M}}_\tau } \in {{\bf{R}}^{{f} \times {i} \times {j}}} $，其中 $i = 4m - k+1$， $j = n - k+1$； ${{\rm{Re}}} '$为把特征图 $ {{\boldsymbol{M}}_\tau } $的形状改为向量的运算符号； ${{\boldsymbol{V}}_\tau }$为重塑后的特征向量， ${{\boldsymbol{V}}_\tau } \in {{\bf{R}}^l}$； $l$为 ${{\boldsymbol{V}}_\tau }$特征向量的长度， $l = f \times i \times j$.

将向量 ${{\boldsymbol{V}}_\tau }$送入长短期记忆网络中捕获时间序列信息得到 $ {{\boldsymbol{F}}_\tau } $，随后经过一层神经网络输出长度为实体总个数的向量：

(7) $ {{\boldsymbol{F}}_\tau } = {\rm{LSTM}}({{\boldsymbol{V}}_\tau }), $

(8) $ {{\boldsymbol{S}}_\tau } = {{\boldsymbol{W}}_\tau }{\rm{ \times }}{{\boldsymbol{F}}_\tau } + {{\boldsymbol{b}}_\tau }. $

式中： ${{\boldsymbol{F}}_\tau } $为经过长短期记忆网络训练后的时序特征向量， ${{\boldsymbol{S}}_\tau } $为尾实体得分， ${{\boldsymbol{W}}_\tau } $和 ${{\boldsymbol{b}}_\tau } $均为可训练参数.

为了惩罚一些没有与历史中的头实体和关系形成已知事实的尾实体，通过历史词表判断历史中是否存在过三元组，如果历史中存在过三元组，历史词表向量为 ${{\boldsymbol{H}}_t}^{\left( {h,r} \right)} $. 最后用softmax函数来估计历史词表中预测尾实体的概率.

(9) $ {{\boldsymbol{H}}_\tau } = {{\boldsymbol{M}}_\tau } - \alpha \times {{\boldsymbol{H}}_t}^{\left( {h,r} \right)} \times {\text{abs}}({{\boldsymbol{M}}_\tau }), $

(10) $ {P_\tau } = {\text{softmax}}\left( {{{\boldsymbol{H}}_\tau }} \right). $

式中： ${{\boldsymbol{H}}_\tau } $为 ${{\boldsymbol{M}}_\tau } $经过历史词表 ${{\boldsymbol{H}}_t}^{\left( {h,r} \right)} $惩罚后，在不感兴趣的尾实体上赋予的较小数， ${{\boldsymbol{H}}_\tau } \in {{\bf{R}}^{\rm{N}}} $； $ \alpha $为控制惩罚力度的超参数； ${{\rm{abs}}} $为绝对值函数； ${P_\tau } $为历史模式的预测概率， ${P_\tau } \in {{\bf{R}}^{{N}}}$.

2.5. 学习目标

实体预测的损失函数使用多分类的交叉熵损失函数来表示. 尾实体预测损失函数为

(11) $ { L}{_t} = - \sum\limits_{\tau \in T} {\sum\limits_{(h,r,t,\tau ) \in D} {\sum\limits_{n = 0}^{N - 1} {{t_{n,\tau }}} } } {\mathop{\rm ln}\nolimits}\; P\left( {{y_n}|h,r,\tau } \right). $

式中： $T$为所有的时间戳； $D$为全部训练集的四元组； $ {{P}}\left( {{y_n}|h,r,\tau } \right) $为当第n个被预测尾实体为正确尾实体 ${t_{n,\tau }}$时，被预测为尾实体的概率.

3. 实验及结果分析

利用实体预测对Sta-HisNet进行评估，选用ConvE^[17]、RE-NET^[13]、CEN^[14]、RE-GCN^[15]和CyGNET^[16]模型作为基准方法来进行对比.

3.1. 实验数据

实验性能分析中采用ICEWS18系统(integrated crisis early warning system)^[17] 和GDELT(global database of events, language, and tone)^[20]作为对比实验数据集，这2个数据集是动态知识图谱领域通用的数据集. 其中ICEWS18是从2018−1−1—2018−10−31发生的所有政治事件，每个事件之间都是以24 h的间隔作为时间戳；GDELT是从新闻媒体中提取的人类社会规模行为和信念的目录，实验数据集的时间跨度为2018−1−1—2018−1−31，每个事件之间都是以15 min的间隔作为时间戳. 数据集都按照8∶1∶1的比例划分. 数据集的详细统计情况如表1所示.

表 1 不同知识图谱在公开数据集中的数量统计

Tab.1 Statistical information on number of publicly available datasets by different knowledge graphs

数据集	实体数	关系数	训练集数	验证集数	测试集数
ICEWS18	23 033	256	373 018	45 995	69 514
GDELT	7 691	240	1734 399	238 765	305 241

3.2. 评价标准

使用知识图谱推理中常用的2个指标^[2]即平均倒数排名(mean reciprocal rank, MRR)和Hits@1、Hits@3、Hits@10来评价模型. 对于每个缺少头实体或尾实体的测试三元组，计算出所有候选实体的概率并按降序排列. 其中，MRR为预测正确实体的平均倒数排名，Hits@1、Hits@3、Hits@10分别为在测试集中正确预测实体在排名第1、前3、前10中所占的比例. 计算式为

(12) $ {\rm{MRR}} = \frac{1}{N}\sum\limits_{i = 1}^N {\frac{1}{{{\rm{rank}}}}} . $

式中： ${\rm{rank}}$为预测正确实体的排名位置.

(13) $ {\rm{Hits}}@n = \frac{{N_{\rm{r}}}}{N}. $

式中： $ N_{\rm{r}} $为预计正确实体中排名在前n的个数.

3.3. 实体预测实验结果

在实体预测上对比了现有的静态推理方法中的ConvE模型和基于动态推理方法的RE-NET、CEN、RE-GCN和CyGNET模型，分别在ICEWS18、GDELT这2个数据集上进行实验. 本研究的Sta-HisNet模型参数设置为：批训练大小为1 024，学习率为0.001，嵌入向量维度为200，丢弃系数为0.2，重塑成3m×n的二维矩阵，其中 $m{\text{ = 10}}$， $n{\text{ = 20}}$，二维卷积核大小为9×9，二维卷积核个数为200，长短期记忆网络的隐藏层维度为600，神经网络层数为2层， $\alpha = 0.6$，所有可训练的参数都随机初始化，并使用AMSGrad优化器进行优化. 实验结果如表2、3所示.

表 2 不同模型在ICEWS18数据集上的实体预测结果

Tab.2 Entity prediction results of different models on ICEWS18 dataset

模型	MRR	Hits@1	Hits@3	Hits@10
ConvE	0.366 7	0.285 1	0.398 0	0.506 9
RE-NET	0.429 3	0.361 9	0.454 7	0.558 0
RE-GCN	0.463 1	0.391 2	0.497 3	0.569 3
CyGNET	0.466 9	0.405 8	0.498 2	0.571 4
CEN	0.472 6	0.418 6	0.506 1	0.579 1
Sta-HisNet	0.489 1	0.429 4	0.515 3	0.588 7

表 3 不同模型在GDELT数据集上的实体预测结果

Tab.3 Entity prediction results of different models on GDELT dataset

模型	MRR	Hits@1	Hits@3	Hits@10
ConvE	0.359 9	0.270 5	0.393 2	0.494 4
RE-NET	0.401 2	0.324 3	0.434 0	0.538 0
RE-GCN	0.481 4	0.421 6	0.523 7	0.583 5
CyGNET	0.509 2	0.445 3	0.546 9	0.609 9
CEN	0.516 8	0.457 6	0.549 7	0.612 3
Sta-HisNet	0.530 5	0.475 5	0.560 1	0.616 5

表2、3展示了利用Sta-HisNet和基线方法对2个动态知识图谱数据集的链接进行预测的结果，其中ConvE、RE-NET和CyGNET的实验结果来源于文献[17]，CEN和RE-GCN的实验结果来源于实验. 从实验结果可以看出，与静态知识图谱推理方法ConvE相比，利用时间信息进行推理的动态知识图谱方法能够进一步提升预测任务的精确度. 与动态知识图谱推理且基准效果最好的CEN模型，Sta-HisNet在MRR指标上提高了1.65%和1.37%，在Hits@1指标上提高了1.08%和1.79%，在Hits@3指标上提高了0.92%和1.04%，在 Hits@10指标上提高了0.96%和0.42%.

3.4. 消融实验

为了帮助理解Sta-HisNet的不同模型成分，开展消融实验. 通过调整Sta-HisNet模型的组件来创造变体，比较在ICEWS18、GDELT数据集上的性能. 实验结果如表4、5所示.

表 4 各模块在 ICEWS18 数据集上的消融实验结果

Tab.4 Ablation experiment results of different modules on ICEWS18 dataset

模型	MRR	Hits@1	Hits@3	Hits@10
Sta-HisNet-NON-EMB	0.479 4	0.421 2	0.506 3	0.573 5
Sta-HisNet-NON-STA	0.482 2	0.494 5	0.509 8	0.578 1
Sta-HisNet-NON-CONV	0.473 1	0.411 3	0.503 2	0.571 3
Sta-HisNet-NON-LSTM	0.463 9	0.402 1	0.498 6	0.574 2
Sta-HisNet-NON-PUN	0.458 9	0.396 5	0.483 8	0.559 2
Sta-HisNet	0.489 1	0.429 4	0.515 3	0.588 7

表 5 各模块在 GDELT 数据集上的消融实验结果

Tab.5 Ablation experiment results of different modules on GDELT dataset

模型	MRR	Hits@1	Hits@3	Hits@10
Sta-HisNet-NON-EMB	0.526 3	0.471 0	0.555 2	0.611 2
Sta-HisNet-NON-STA	0.518 6	0.463 6	0.546 9	0.603 9
Sta-HisNet-NON-CONV	0.523 2	0.469 1	0.556 6	0.610 5
Sta-HisNet-NON-LSTM	0.514 5	0.459 8	0.546 3	0.601 2
Sta-HisNet-NON-PUN	0.509 2	0.445 3	0.536 9	0.589 9
Sta-HisNet	0.530 5	0.475 5	0.560 1	0.616 5

表4、5中的Sta-HisNet-NON-EMB、Sta-HisNet-NON-STA、Sta-HisNet-NON-CONV、Sta-HisNet-NON-LSTM、Sta-HisNet-NON-PUN分别为Sta-HisNet模型将基于时间序列的实体嵌入更改为常规嵌入、去除静态嵌入、去除二维卷积、将长短期记忆网络更改为一层神经网络和去除历史惩罚. 可以看出，在所有数据集上相比于 Sta-HisNet 模型，通过更改实体嵌入，在 MRR 指标上提高了1.03%和0.42%，在 Hits@10指标上提高了1.52%和0.53%，这说明通过实体随时间进化的嵌入能够有效地提升预测结果. 通过增加静态嵌入，在 MRR 指标上提高了0.69%和1.19%，在 Hits@10指标上提高了1.06%和1.26%，这说明通过挖掘实体之间的静态联系能有效提高动态知识图谱推理的准确性. 通过增加二维卷积，在 MRR 指标上提高了1.66%和0.73%，在Hits@10指标上提高了1.74%和0.60%，这说明通过二维卷积可以聚合嵌入特征. 通过更改成长短期记忆网络，在 MRR 指标上提高了2.52%和1.60%，在Hits@10 指标上提高了1.45%和1.53%，这说明通过长短期记忆网络的历史记忆可以较好地捕获时序信息，更好地处理动态知识图谱. 通过增加历史惩罚，在MRR 指标上提高了3.02%和2.13%，在 Hits@10 指标上提高了2.95%和2.66%，这说明历史事实中存在大量重复的三元组，且在预测未来时，这些三元组仍会频繁出现. 历史惩罚可以在预测未来时，对历史中未出现过的实体做出惩罚，从而提高实体预测的准确性.

为了更具体描述使用的历史惩罚与不使用的历史惩罚，对比Sta-HisNet模型和 Sta-HisNet-NON-PUN 模型的拟合速率. 在相同的实验设备上分别计算 Sta-HisNet模型与Sta-HisNet-NON-PUN 模型的拟合轮数. 2种方法训练参数设置相同，批训练大小都设置为1 024，学习率为0.001，嵌入向量维度相同，训练数据集为 ICEWS18、GDELT. 为了更充分、全面地对比，在训练轮数分别取 0、5、10、20、30、40、50时，以MRR评分指数作为评判指标，具体实验结果如图4所示. 图4中E为训练轮数. 可以看出，增加历史惩罚的Sta-HisNet达到最佳模型的运行轮数明显小于没有增加的，历史惩罚的筛选能够帮助模型去掉部分错误答案，在较小的数据集ICEWS18上更为明显，这也进一步表明Sta-HisNet在动态知识图谱推理上的快速拟合优势.

图 4

图 4 2种方法在2个数据集上的最佳轮数对比

Fig.4 Comparison of optimal number of rounds between two methods on two datasets

3.5. 时间复杂度实验

考虑到动态知识图谱推理是难度较大的多分类问题，因此本研究的Sta-HisNet算法通过较复杂的特征处理以挖掘事实间更深层的联系. 为了探索复杂特征处理对实际运行时间所造成的影响，本研究在相同的实验设备、相同数据集上分别测试目前实验效果较好的CyGNET、RE-GCN和Sta-HisNet方法在一个回合内的所需时间，这2种方法的批训练大小都设置为1 024，学习率为0.001，嵌入向量维度相同，且数据集都为 ICEWS18、GDELT.

如图5所示， ${T_{\rm{m}}} $为模型运行一个回合所需的时间. 从图中可以看出，Sta-HisNet采用更加复杂的特征处理和计算，使得模型训练时间变长. 由于历史惩罚导致模型收敛速度变快，使得总体运行时间相差不大. RE-GCN的一个进化单元就包含有GCN、GRU运算模块，运行一回合所需时间也远远超过CyGNET模型和Sta-HisNet模型.

图 5

图 5 3种方法在2个数据集上的运行一个回合的所需时间

Fig.5 Time required for three methods to run one round on two datasets

4. 结　语

在动态知识图谱中实体往往随着时间而进化，简单的向量嵌入无法满足事实需求. 知识图谱存在大量的静态事实，挖掘这些事实信息可以有效地协助动态知识图谱推理. 历史事实往往是不断重复的，未来发生的事实可能在过去发生过，运用重复历史事实对动态知识图谱推理大有帮助，因此提出结合静态事实和重复历史事实的动态知识图谱推理. 通过在实体嵌入中采用正弦函数，使得实体嵌入结合时间信息. 使用R-GCN对静态事实提取更深层次的特征，并在历史模式中使用历史惩罚，对历史中未发生过的事实进行惩罚，提高重复事实的预测概率. 实验结果表明，Sta-HisNet在预测动态知识图谱的未来事实方面具有良好的性能. 在未来的工作中，考虑加入外部动态知识图谱信息如实体类型来增强模型的学习能力.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

LIU Z, XIONG C, SUN M, et al. Entity-duet neural ranking: Understanding the role of knowledge graph semantics in neural information retrieval [C]// Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. Columbus: ACL, 2008: 2395-2405.

[2]

JIANG T, LIU T, GE T, et al. Encoding temporal information for time-aware link prediction [C]// Proceedings of the Conference on Empirical Methods in Natural Language Processing. Austin: ACL, 2016: 2350-2354.

[3]

BORDES A, USUNIER N, GARCIADURAN A, et al. Translating embeddings for modeling multi-relational data [C]// Proceedings of the Neural Information Processing Systems. Lake Tahoe: NIP, 2013: 2787-2795.

[4]

WANG Z, ZHANG J, FENG J, et al. Knowledge graph embedding by translating on hyperplanes [C]// Proceedings of the AAAI Conference on Artificial Intelligence. Quebec: AAAI, 2014, 28(1): 1112-1119.

[5]

DAI S, LIANG Y, LIU S, et al. Learning entity and relation embeddings with entity description for knowledge graph completion [C]// Proceedings of the 4th International Conference on Artificial Intelligence Technologies and Applications. Chengdu: JPCS, 2018: 202-205.

[6]

TROUILLON T, WELBL J, RIEDEL S, et al. Complex embeddings for simple link prediction [C]// Proceedings of the International Conference on Machine Learning. Hong Kong: ACM, 2016: 2071-2080.

[7]

SOCHER R, CHEN D, MANNING C D, et al. Reasoning with neural tensor networks for knowledge base completion [C]// Proceedings of the Neural Information Processing Systems. Lake Tahoe: NIP, 2013: 926-934.

[8]

SCHLICHTKRULL M, KIPF T N, BLOEM P, et al. Modeling relational data with graph convolutional networks [C]// Proceedings of the European Semantic Web Conference. Heraklion: ESWC, 2018: 593-607.

[本文引用: 3]

[9]

KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks [EB/OL]. [2022-09-01]. https://arxiv.org/abs/1609.02907.

[10]

LEBLAY J, CHEKOL M W. Deriving validity time in knowledge graph [C]// Proceedings of the 27th Internation Conference on World Wide Web. Lyons: ACM, 2018: 1771-1776.

[11]

DASGUPTA S S, RAY S N, TALUKDAR P. Hyte: hyperplane-based temporally aware knowledge graph embedding [C]// Proceedings of the Conference on Empirical Methods in Natural Language Processing. Brussels: ACL, 2018: 2001-2011.

[12]

TRIVEDI R, DAI H, WANG Y, et al. Know-evolve: Deep temporal reasoning for dynamic knowledge graphs [C]// Proceedings of the 34th International Conference on Machine Learning-Volume 70. Sydney: ACM, 2017: 3462-3471.

[13]

JIN W, ZHANG C, SZEKELY P, et al. Recurrent event network for reasoning over temporal knowledge graphs [C]// Proceedings of the Conference on Empirical Methods in Natural Language Processing. Hong Kong: ACL, 2019: 8352-8364.

[14]

LI Z, GUAN S, JIN X, et al. Complex evolutional pattern learning for temporal knowledge graph reasoning [C]// Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics. Dublin: ACL, 2022: 290-296.

[15]

LI Z X, JIN X L, LI W, et al. Temporal knowledge graph reasoning based on evolutional representation learning [C]// Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. Montréal: ACM, 2021: 408-417.

[本文引用: 3]

[16]

ZHU C, CHEN M, FAN C, et al. Learning from History: modeling temporal knowledge graphs with sequential copy-generation networks [EB/OL]. [2022-09-01]. https://arxiv.org/abs/2012.08492.

[本文引用: 3]

[17]

WARD M D, BEGER A, CUTLER J, et al. Comparing GDELT and ICEWS event data [C]// Proceedings of the ISA Annual Convention. San Francisco: ISA, 2013: 1-49.

[本文引用: 4]

[18]

DETTMERS T, MINERVINI P, STENETORP P, et al. Convolutional 2d knowledge graph embeddings [C]// Proceedings of the 32th AAAI Conference on Artificial Intelligence. New Orleans: AAAI, 2018: 1811-1818.

[19]

HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.

[20]

LEETARU K, SCHRODT P A. Gdelt: global data on events, location, and tone, 1979–2012 [C]// Proceedings of the ISA Annual Convention. San Francisco: ISA, 2013, 2(4): 1-49.