<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 微博事件举例

Fig.1 Example of microblog event

定义2　源微博. 源微博是指最开始发出的那一条微博，该微博不回复其他任何一条微博. 用m_i,0表示，代表第i个微博事件的源微博.

定义3　相关评论. 相关评论是指与源微博相关联的那些微博，它们直接回复源微博或回复与源微博相关的微博. 用m_i,j (1≤j<N)表示，代表第i个微博事件的第j条相关评论.

定义4　谣言检测函数. 谣言检测函数RD(E_i，Ω)输出E_i是否为谣言的判定结果(Ω为所需参数集)，如果RD(E_i，Ω)=1，说明E_i为谣言，否则，E_i为正常事件.

2.2. 方法描述

本研究提出了基于图卷积网络的归纳式谣言检测方法−归纳式图卷积网络 (inductive graph convolutional network，IGCN). 如图2所示，首先针对微博谣言数据集中的每个微博事件，以源微博和其评论中出现的词语为节点，利用词共现性和词语义相关性建图；然后，提出基于GCN和GRU的归纳式节点信息传播模型，经过GCN层和GRU层获得微博事件节点信息交互后的向量表达；最后，使用注意力机制融合不同池化方法(最大池、平均池、全局池^[21])的优势在池化层得到微博事件的最终图级向量表达，将其输入到全连接层中，通过计算损失函数值实现模型训练参数优化，完成谣言检测.

图 2

图 2 归纳式图卷积网络流程图

Fig.2 Flowchart of inductive graph convolutional network

2.2.1. 基于语义相关性的微博事件建图

Zhang等^[20]通过词的共现关系构建单词图，但该方法忽略了词之间的语义关系且没有区分不同词之间的权重大小. 以语句“人生无限美好生活无限美妙”为例，如图3(a)所示为Zhang等^[20]方法对应的建图结果，如图3(b)所示为使用Word2Vector词向量和余弦相似度得到的不同节点之间的语义相似度. 由图3(a)可知，“人生”和“生活”、“无限”和“无比”、“美好”和“美妙”之间不存在连接关系，但图3(b)显示这3对词之间均具有较强的语义相关性. 可以看出，Zhang等^[20]仅以窗口大小确定节点对应的邻居节点，且将所有连边权重同等对待，难以准确表达相距较远的词语之间的语义关系.

图 3

图 3 文献[20]建图方法面临问题举例

Fig.3 Example of problems in graph construction of reference [20]

为了解决上述问题，本研究基于每个微博事件对应的微博源文和相关评论构成的语句，通过在词共现邻接矩阵Ψ基础上引入词语义相关邻接矩阵Φ来融合词语之间的共现性和语义相关性的影响. 与Zhang等^[20]方法类似，Ψ矩阵通过计算固定大小的滑动窗口(默认长度为3)中出现的单词之间的关系获得：

(6) $ {{{\varPsi}} }_{kl}=\left\{\begin{array}{l}1,\;词{v}_{k}和词{v}_{l}处于同一窗口\text{；}\\ 0,\;其他.\end{array} \right.$

词语义相关性邻接矩阵通过计算不同词语对应词向量之间的余弦相似度获得:

(7) $ {{{\varPhi}} _{kl}} = \cos\;({\boldsymbol{V}}_k,{\boldsymbol{V}}_l) = \frac{{\displaystyle\sum\limits_{m = 1}^d {{{V}}_{km}{{V}}{{\rm{}}_{lm}}} }}{{\sqrt {\displaystyle\sum\limits_{m = 1}^d {{{V}}_{km}^2} } \sqrt {\displaystyle\sum\limits_{m = 1}^d {{{V}}_{lm}^2} } }}. $

式中：V_k、V_l分别为词语v_k、v_l对应的词向量，V_km、V_lm分别为向量V_k、V_l的第m维元素，d为词向量的维度. 可见，Φ_kl∈[−1.0，1.0]，Φ_kl越大，词语v_k、v_l之间的语义相似度越高. 为了减少建图规模，引入语义相关性阈值th，其在图中的作用原理如下:

(8) $ {{{\varPhi}} _{kl}} = \left\{ {\begin{array}{*{20}{l}} {0,\; \;\;\;\; {{{\varPhi}} _{kl}} < {\text{th}}\; {\text{或}} \;{{{\varPsi}} _{kl}} = 0}; \\ {{{{\varPhi}} _{kl}}, \; {\text{其他}}.} \end{array}} \right. $

在此基础上，得到每个微博事件E_i对应的词共现邻接矩阵Ψ_i(Ψ_i∈ $ {{\bf{{{R}}}}^{|{V_i}| \times |{V_i}|}} $，V_i为E_i中词语集合，|V_i|为V_i中词语数量)和词语义相关性邻接矩阵Φ_i（Φ_i∈ $ {{{{\bf{{{R}}}}}}^{|{V_i}| \times |{V_i}|}} $）. 进一步地，分别针对Ψ_i和Φ_i建立图结构，以此获得E_i对应的词共现图G_ci={V_i，E_ci，Ψ_i}和词语义相关图G_si={V_i，E_si，Φ_i}. 其中，E_ci为Ψ_i中所有值为1的点对之间的连边集合，E_si为Φ_i中所有值大于0的点对之间的连边集合.

2.2.2. 基于GCN和GRU的节点信息传播模型

基于GCN的文本分类方法依靠邻接矩阵更新节点状态信息^[22]，而邻接矩阵仅描述节点的邻居信息，缺乏对文本中连续上下文语义的表达. 鉴于GRU能够自动学习连续节点的上下文信息，将其与GCN结合，提出新的信息传播模型以实现图中节点向量信息的有效交互. 针对微博事件E_i，首先抽取E_i中所有词语V={v_j}(v_j为V中第j个词语)并利用Word2Vector模型构建词向量H¹ (H¹由h_j组成，h_j为v_j对应的词向量)；然后，利用2.2.1节构建的词共现邻接矩阵Ψ和词语义相关邻接矩阵Φ，通过如下公式获得第l层(1<l≤L)节点状态H^l(H^l由 $ {\boldsymbol{h}}_j^l $组成， $ {\boldsymbol{h}}_j^l $为微博事件图中节点j在第l层的状态向量):

(9) $ \begin{split} {{{\boldsymbol{H}}}}^l =\;& {\rm{laye}}{{\rm{r}}_{{\rm{GCN}}}}({{{\boldsymbol{H}}}}^{l - 1},{\boldsymbol{\varPsi}} ,{\boldsymbol{\varPhi}} ) =\hfill \\ \;&{{\rm{Relu}}}\; (\hat {\boldsymbol{\varPsi}} {{{\boldsymbol{H}}}}_{}^{l - 1}{\boldsymbol{W}}_0^{l - 1} + \hat {\boldsymbol{\varPhi}} {{{\boldsymbol{H}}}}_{}^{l - 1}{\boldsymbol{W}}_1^{l - 1});\;{l \geqslant 2} . \end{split} $

式中： $\hat{\boldsymbol{ \varPsi }}={{\boldsymbol{D}}_{\rm{c}}}^{ -{1}/{2}}({\boldsymbol{ \varPsi }} + {\boldsymbol{I}}){{\boldsymbol{D}}_{\rm{c}}}^{ -{1}/{2}}$， $\hat {\boldsymbol{\varPhi}}={{\boldsymbol{D}}_{\rm{s}}}^{ -{1}/{2}}({\boldsymbol{\varPhi}} + {\boldsymbol{I}}) {{\boldsymbol{D}}_{\rm{s}}}^{ -{1}/{2}}$，D_c∈R^|V|×|V|、D_s∈R^|V|×|V|分别为Ψ和Φ的度矩阵； $ {\boldsymbol{W}}_0^l $、 $ {\boldsymbol{W}}_1^l $分别为第l层对应的训练权重矩阵；Relu为激活函数.

最后，将H^L中的第k(1≤k≤|V|)个节点向量h_k依次输入至GRU中，以此获得GRU输出节点状态向量H^L+1(该向量由 $ {\boldsymbol{h}}_k' $组成，1≤k≤|V|)：

(10) $ {{\boldsymbol{z}}_k} = {\text{Sigmoid}}\;\left( {{{\boldsymbol{W}}_z}\left[ {{\boldsymbol{h}}_{_{k - 1}}',{{\boldsymbol{h}}_k}} \right]} \right), $

(11) $ {{\boldsymbol{r}}_k} = {\text{Sigmoid}}\;\left( {{{\boldsymbol{W}}_r}\left[ {{\boldsymbol{h}}_{_{k - 1}}',{{\boldsymbol{h}}_k}} \right]} \right), $

(12) $ \widetilde {{{\boldsymbol{h}}_k}} = \tanh\; \left( {{\boldsymbol{W}}\left[ {{{\boldsymbol{r}}_k} \odot {\boldsymbol{h}}_{_{k - 1}}',{{\boldsymbol{h}}_k}} \right]} \right), $

(13) $ {{\boldsymbol{h}}_k'} = \left( {{\boldsymbol{1}} - {{\boldsymbol{z}}_k}} \right) \odot {{\boldsymbol{h}}_k} + {{\boldsymbol{z}}_k} \odot \widetilde {{{\boldsymbol{h}}_k}}. $

式中：k≥2， $ {\boldsymbol{h}}_1' $=h₁. 可以看出，本研究所提出的基于GCN和GRU的信息传播模型以每个微博事件中的词向量为输入，通过利用词共现性邻接矩阵和词语义相关性邻接矩阵有效融合词语的连续上下文信息和非连续语义相关信息. 与米源等^[22]不同的是，本研究针对每个微博事件建立词共现图和词语义相关图，因此可以从大量训练样本数据中学习有用规则以实现对未知微博事件的谣言检测，避免了米源等^[22]的研究中测试数据必须参与训练导致模型无法推广到一般任务的问题.

2.2.3. 基于注意力机制的多池化方法融合

给定GRU输出节点向量H^L+1(该向量由 $ {\boldsymbol{h}}_k' $组成，1≤k≤|V|)，Zhang等^[20-21]通过使用固定的池化方法降低节点向量维度，难以有效融合不同池化方法的优势. 为此，本研究引入注意力机制，通过融合平均池、最大池、全局池^[21]函数获得最终图级向量表示，有效利用不同节点在图中的作用，具体如下：

(14) $ {{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,avg}}}} = {\text{avg}}\;\left( {{{\boldsymbol{H}}^{L +1 }}} \right), $

(15) $ {{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,max}}}} = {\text{max}}\;\left( {{{\boldsymbol{H}}^{L + 1}}} \right), $

(16) $ \begin{split} {{\boldsymbol{h}}_{{\rm{g}},{\rm{glo}}}}=&{\rm{glo}}\;\left( {{{\boldsymbol{H}}^{L + 1}}} \right)=\\ &\tanh \;\left( {\sum\limits_{v \in V} {\sigma \;\left( {{f_1}\left( {{{\boldsymbol{h}}_v}} \right) \odot \tanh \;\left( {{f_2}\left( {{{\boldsymbol{h}}_v}} \right)} \right)} \right)} } \right). \end{split}$

式中：avg为节点向量按行求均值函数，max为节点向量按行求最大值函数，glo利用软注意力机制学习不同词语对应的权重，σ为Sigmoid激活函数，f₁、f₂为多层感知机，h_v为该微博事件中L+1时刻节点v的状态向量. 进一步地，使用注意力机制融合上述结果以获得最终的图级向量，具体公式如下：

(17) $ {\bf{key}} = \left[ {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,avg}}}}}, {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,}}{{\rm{max}}} }}}, {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,glo}}}}} \right]^{\rm{T}}{{\boldsymbol{W}}_{{\rm{key}}}}, $

(18) $ {\bf{que}} = \left[ {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,avg}}}}} , {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,}}{{\rm{max}}} }}} , {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,glo}}}}} \right]^{\rm{T}}{{\boldsymbol{W}}_{{\rm{que}}}}, $

(19) $ {\bf{val}} = \left[ {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,avg}}}}} , {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,}}{{\rm{max}}} }}} , {{{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,glo}}}}} \right]^{\rm{T}}{{\boldsymbol{W}}_{{\rm{val}}}}, $

(20) $ \left[ { {{\tilde{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,avg}}}}}} , { {{\tilde{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,}}{{\rm{max}}} }}}} , { {{\tilde{\boldsymbol{h}}_{\mathcal{{\rm{g}}}{\text{,glo}}}}}} \right]^{\rm{T}} = {\bf{val}}\;{({\text{softmax (}}{\bf{que}}{({\bf{key}})^{\text{T}}}))^{\text{T}}}, $

(21) $ {{\boldsymbol{h}}}_{\mathcal{{\rm{g}}}}={\displaystyle \sum _{i\in \left\{{\rm{avg}},\mathrm{max},\text{glo}\right\}}\frac{{\Vert {{\tilde{\boldsymbol{h}}}_{{{\rm{g}}}\text{,}i}}\Vert }_{2}}{{\Vert {{\tilde{\boldsymbol{h}}}_{\mathcal{{\rm{g}}}\text{,avg}}}\Vert }_{2}+\Vert {{\tilde{\boldsymbol{h}}}_{\mathcal{{\rm{g}}}\text{,max}}}\Vert_{2} +{\Vert {{\tilde{\boldsymbol{h}}}_{\mathcal{{\rm{g}}}\text{,glo}}}\Vert }_{2}}{{\tilde{\boldsymbol{h}}}_{{\rm{g}}\text{,}i}}}. $

式中：W_key∈R^|V|×3、W_que∈R^|V|×3、W_val∈R^|V|×3为随机初始化的训练权重矩阵， $ {{\tilde {\boldsymbol{h}}_{\mathcal{{\rm{g}}},i}}} $为向量 $ {{\boldsymbol{h}}_{\mathcal{{\rm{g}}},i}} $经过自注意力机制后所得新向量， $ {\left\| { {{\tilde{\boldsymbol{h}}_{\mathcal{{\rm{g}}},i}}}} \right\|_2} $为向量 $ {{\tilde{\boldsymbol{h}}_{\mathcal{{\rm{g}}},i}}} $的模， $ {{\boldsymbol{h}}_\mathcal{{\rm{g}}}} $为最终获得的图级向量.

将2.2.2节获得的节点向量H^L+1输入到本池化层中得到微博事件E_i对应的最终图级向量 ${{\boldsymbol{h}}_{{\rm{g}}}^i}$，最后将 ${{\boldsymbol{h}}_{{\rm{g}}}^i}$输入到全连接层中，结合E_i实际类别及交叉熵函数来使损失最小化，实现谣言检测：

(22) $ {{\hat{\boldsymbol{Y}}_i}} = {\text{softmax}}\;({\boldsymbol{W}}{{\boldsymbol{h}}_{{\rm{g}}}^i} + {\boldsymbol{b}}), $

(23) $ {L_{\rm{r}}} = - \sum\limits_{{E_i} \in E} {{y_i}\log_2\; (\hat {{y_i}})} . $

式中：W、b为训练权重矩阵， $ {L_{\rm{r}}} $为损失值，E为微博事件集合， $ \hat {{y_i}} $为 $\hat{\boldsymbol{Y}}_i $中谣言事件的概率，y_i为E_i的实际类别(谣言事件为1，非谣言事件为0).

3. 实验结果与分析

3.1. 实验设置

本研究软件环境：Python3.6+TensorFlow1.14，硬件环境：CPU: Intel Xeon Gold 5218，内存：64 G，显卡：NVIDIA GeForce RTX 2080Ti. 实验采用公开的微博数据集Ma_Dataset^[8]和Song_Dataset^[11]，2个数据集的详细信息如表1所示. 表中，n_u、n_e、n_r、n_t、n_c分别为用户数、事件数、谣言事件数、非谣言事件数、评论数.

表 1 数据集的详细信息

Tab.1 Details of datasets

数据集	n_u	n_e	n_r	n_t	n_c
Ma_Dataset	2 746 818	4 664	2 351	2 313	3 805 656
Song_Dataset	1 067 410	3 387	1 838	1 849	1 275 180

为了减少噪声对实验效果的影响，对数据进行如下降噪操作：1)去除特殊信息，微博评论中包含无关信息，如超链接和@某某人，通过正则表达式删除这些信息；2)去除标点符号，由于感叹号和问号也可以作为区分谣言和非谣言的特征，保留这2种符号，去除其余符号；3)去除表情符号，去除微博事件中包含的表情符号；4)分词，采用jieba中文分词工具包实现分词操作；5)去除停用词，考虑到语气词可以作为一种隐含的文本特征，采用哈工大停用词表来去除语气词之外的其他停用词.

本研究验证集占总样本数的10%，其余样本中训练集和测试集的比例为3∶1. 实验参数设定如下：节点失活率dropout_rate=0.5，隐藏层大小hidden_size=96，轮次Epoch=400，学习率learning_rate=0.005，批尺寸batch_size=1 024. 此外，使用Gensim库的Word2Vec训练获得词向量，词向量维度D=300. 为了避免实验误差，针对每种方法取50次实验平均值作为最终的实验结果.

3.2. 评价指标

使用准确率(accuracy, Acc)、精确率(precision, Pre)、召回率(recall, Rec)和F₁值4个指标作为微博谣言检测效果的评价指标，对应方式如下：

(24) $ {\rm{Acc}} = \frac{{{\rm{TP}} + {\rm{TN}}}}{{{\rm{TP}} + {\rm{TN}} + {\rm{FP}} + {\rm{FN}}}}, $

(25) $ {\rm{Rec}} = \frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FN}}}}, $

(26) $ {\rm{Pre}} = \frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FP}}}}, $

(27) $ {F_1} = \frac{{2 \times {\rm{Pre}} \times {\rm{Rec}}}}{{{\rm{Pre}} + {\rm{Rec}}}}. $

式中：TP为正确分类的微博谣言事件数量，TN为正确分类的非谣言事件数量，FP为错误分类的非谣言事件数量，FN为错误分类的谣言事件数量.

3.3. 评论利用时间对谣言检测效率的影响

鉴于人工检测一条谣言信息的平均用时为11.09 h^[2]，将微博评论利用时间控制在11.09 h内. 如表2所示为微博谣言事件“林依晨郑元畅相恋”的部分评论. 表中，t_m为微博发出后的时间. 可以看出，在该微博发出后，从第1~5 h的评论和第1~10 h的评论中获取的信息是极其相似的，说明极有可能仅使用前5 h的评论信息便能获得跟前10 h评论信息相近的实验效果. 为此，本研究基于微博发出后10 h内的评论数据，以每2 h为分隔，通过实验结果确定评论利用的最佳时间，以此解决使用大量评论数据导致的方法训练效率较低的问题，实现谣言早期检测.

表 2 某源微博及其发出10 h内的相关评论

Tab.2 One source microblog and its related comments in ten hours

t_m/h	典型评论内容
1	这是真的么？真的？
2	真噶?![吃惊][哈哈] 真的还是假的现在醒着还是醉了[围观]
3	真的还是假的,咋没新闻？假的吧
4	假的吧P的吧 [汗] 真的？
5	真的吗,求真相真葛..真葛..?
6	真的吗？~小综！真的吗
7	真的假的[思考] 求真相···
8	真的的还是假的？震惊~ 这是骗我的吧?
9	不是吧[抓狂] 是假的是吗
10	啥？真的假的？这么假也有人信

如图4(a)~(d)所示为利用本研究方法在不同批尺寸下进行谣言检测时各个时间点对应的Acc. 可以看出，针对任意批尺寸取值，微博发出2 h的谣言检测准确率明显高于微博刚发出时的谣言检测准确率，充分说明在谣言检测中引入评论数据对提升谣言检测准确率的有效性. 同时，发现在Ma_Dataset中，当批尺寸为128、256、1024时，在微博发出4 h后能够达到最高的谣言检测准确率，而当批尺寸为512时，在微博发出8 h后能够达到最高的谣言检测准确率；而在Song_Dataset中，在所有批尺寸下，微博发出6 h后能够达到最高的谣言检测准确率. 考虑到一般情况，在Ma_Dataset和Song_Dataset中，评论数据利用最佳时间阈值分别取4、6 h，并将其应用于后续对比实验中.

图 4

图 4 源微博发出0~10 h内不同时间点的谣言检测准确率

Fig.4 Rumor detection accuracy at different time points within ten hours after source microblog being sent out

3.4. 微博事件建图方法对比

为了验证基于语义相关性的建图方法的有效性，将基于词共现性(word co-occurrence， WC)邻接矩阵的建图方法^[20]和本研究建图方法进行对比. 这里将WC方法中的滑动窗口大小设定为3，并将本研究建图方法按照语义相关性阈值th划分为如表3所示的6种不同情况.

表 3 阈值不同时对应的本研究建图方法分类

Tab.3 Classification of proposed graph construction methods of different threshold values

本研究建图方法分类	th	本研究建图方法分类	th
WR-1	0.95	WR-4	0.80
WR-2	0.90	WR-5	0.75
WR-3	0.85	WR-6	0.70

在此基础上，将上述不同建图方法应用于本研究方法后续执行流程中，计算每种方法对应的谣言检测Acc，结果如图5所示. 可以看出，本研究使用词共现邻接矩阵和语义相关性邻接矩阵的谣言检测准确率均高于单纯基于词共现邻接矩阵的建图方法的，原因在于：1) 本研究建图方法同时考虑词语上下文连接关系和词语之间的语义相关性，所构建的微博事件图具有更多的连边数量，因此节点在信息传播过程融合了更丰富的特征信息；2) 本研究建图方法通过考虑语义相关信息为不同连边权重赋值，区分了不同邻居节点的影响. 进一步发现，除了在Ma_Dataset中批尺寸为512和Song_Dataset中批尺寸为256的情况外，2个数据集使用WR-3方法均能获得最高的谣言检测准确率. 因此，考虑到一般情况，本研究在后续实验中将语义相关性阈值设置为th=0.85.

图 5

图 5 不同建图方法的准确性比较

Fig.5 Accuracy comparison of different graph construction methods

3.5. 不同池化方法对比

为了验证基于注意力机制的多池化方法融合的有效性，首先使用基于语义相关性的建图方法对数据集中每个微博事件单独建图，然后利用本研究提出的基于GCN和GRU的信息传播模型获得图中不同节点向量表达，最后分别使用平均池化方法(AVG)、最大池化方法(MAX)、全局池化方法(GLO)^[21]以及本研究池化方法(MIX)获取微博事件对应的最终图级向量. 将式(23)作为损失函数并进行训练后，得到不同批尺寸情况下上述池化方法对应的Acc，结果如图6所示. 可以看出，当批尺寸分别为128、256、512、1024时，在2个数据集中，MIX方法均表现最好，在Ma_Dataset中该方法比表现次优方法对应的Acc分别高出0.004、0.001、0.004、0.002，而在Song_Dataset中对应的Acc分别高出0.005、0.006、0.006、0.008. 当批尺寸为128时，MIX方法能够获得最大Acc，对应数据集Ma_Dataset和Song_Dataset结果分别为0.949和0.925，充分证明了本研究基于注意力机制的多池化方法融合策略在获取最终图级向量表达方面的有效性.

图 6

图 6 不同池化方法的准确性比较

Fig.6 Accuracy Comparison of different pooling methods

3.6. 与现有典型方法的比较

为了进一步验证本研究方法在微博谣言检测方面的有效性，将本研究方法与最先进的基线方法进行对比，这些方法可以分为：1) 机器学习方法，包括决策树排名(decision tree ranking， DT-Rank)^[4]和使用时间序列信息的支持向量机(support vector machine using time series information， SVM-TS)^[3]；2) 非图神经网络深度学习方法，包括基于卷积神经网络的文本分类(text classification via convolutional neural networks， Text-CNN)^[23]、双层GRU(GRU-2)^[8]和可解释虚假新闻检测(explainable fake news detection，dEFEND)^[24]；3) 图神经网络深度学习方法，包括基于图卷积网络的文本分类(text classification via convolutional graph networks， Text-GCN)^{[18, 22]}、双向图卷积网络(bi-directional graph convolutional networks， Bi-GCN)^[25]、全局-局部注意力网络(global-local attention networks， GLAN)^[26]和基于图神经网络的归纳文本分类(inductive text classification via graph neural networks，TextING)^[20]，相关实验设定如表4所示. 公平起见，深度学习方法未说明的设定与本研究方法的相同.

表 4 不同对比方法参数设置

Tab.4 Parameter settings of different methods for comparisons

对比方法	实验设定
DT-Rank^[4]	所选特征包括来源可信度、来源身份、来源多样性、来源地址、语言态度、事件传播特征，特征选择方法为信息增益.
SVM-TS^[3]	所选特征为内容特征、用户特征和传播特征,核函数为RBF.
Text-CNN^[23]	卷积核尺寸分别等于3、4、5，卷积核数量为256.
GRU-2^[8]	GRU层数为2,词典大小为5 000.
dEFEND^[24]	注意力层维度为100,共注意力层潜在维度为200.
Text-GCN^{[18, 22]}	GCN层数为2.
Bi-GCN^[25]	模型早停忍耐批次为10.
GLAN^[26]	卷积核尺寸分别等于3、4、5,卷积核数量为100.
TextING^[20]	滑动窗口大小为3.

在此基础上计算不同方法对应的Acc、Pre、Rec及F₁，结果如表5所示. 可以看出，传统方法SVM-TS表现优于DT-Rank. 与SVM-TS相比，本研究对应的Acc、Pre、Rec及F₁在Ma_Dataset中依次分别提升了0.117、0.125、0.12、0.123，在Song_Dataset中依次分别提升了0.177、0.174、0.161、0.167. 与传统机器学习方法相比，非图神经网络深度学习方法对应的Acc、Pre、Rec及F₁普遍偏高. 其中，dEFEND表现最佳，对应的Acc、F₁在Ma_Dataset中分别为0.917、0.920，在Song_Dataset中分别为0.881、0.885. 进一步发现，图神经网络方法表现明显优于其他方法，这可能是因为此类方法在谣言检测时能有效利用长距离非连续单词的语义交互信息. 在Ma_Dataset和Song_Dataset中，与dEFEND相比，本研究方法的Acc分别提升了0.029、0.042，F₁分别提升了0.021、0.038；与 TextING相比，Acc分别提升0.008、0.011，F₁分别提升0.001和0.013，验证了基于语义相关性的微博建图方法以及基于注意力机制的多池化方法融合策略在提升微博谣言检测表现上的有效性.

表 5 本研究所提方法与现有典型方法的微博谣言检测结果对比

Tab.5 Comparison of microblog rumor detection results of proposed method and existing typical methods

方法	Ma_Dataset				Song_Dataset
方法	Acc	Pre	Rec	F₁	Acc	Pre	Rec	F₁
DT-Rank	0.727	0.736	0.731	0.733	0.653	0.637	0.665	0.651
SVM-TS	0.829	0.814	0.823	0.818	0.746	0.751	0.761	0.756
Text-CNN	0.848	0.839	0.854	0.846	0.801	0.807	0.812	0.809
GRU-2	0.902	0.895	0.891	0.893	0.842	0.837	0.846	0.841
dEFEND	0.917	0.912	0.929	0.920	0.881	0.873	0.898	0.885
Text-GCN	0.924	0.915	0.919	0.917	0.889	0.892	0.885	0.888
Bi-GCN	0.929	0.931	0.924	0.927	0.901	0.897	0.906	0.901
GLAN	0.930	0.935	0.932	0.933	0.903	0.908	0.912	0.910
TextING	0.938	0.937	0.943	0.940	0.912	0.906	0.915	0.910
本研究方法	0.946	0.939	0.943	0.941	0.923	0.925	0.922	0.923

为了验证本研究最优评论利用时间阈值的有效性，在Ma_Dataset和Song_Dataset中分别随机选取了源微博及源微博发出10 h内的连续4 h和连续6 h的评论构建新数据集，并在该数据集上计算TextING和本研究方法对应的Acc、Pre、Rec及F₁，结果如表6所示. 可以看出，本研究方法仍优于其他对比方法，与表现次优的TextING相比，在Ma_Dataset中本研究方法的Acc、Pre、Rec及F₁分别提升了0.008、0.002、0.002和0.003，而在Song_Dataset中分别为0.012、0.012、0.014、0.014. 结合表5可以看出，除了Text-GCN和Bi-GCN外，其他算法在本研究所得评论数据集上表现普遍更好，例如相较于随机选择连续4 h的评论数据而言，在Ma_Dataset中dEFEND及本研究算法使用前4 h评论数据对应的Acc分别提升了0.002和0.001，而在Song_Dataset中为0.004和0.002，验证了本研究最优评论利用时间阈值的有效性.

表 6 最优评论利用时间阈值有效性验证

Tab.6 Validation of effectiveness of optimal comment utilization time threshold

方法	Ma_Dataset				Song_Dataset
方法	Acc	Pre	Rec	F₁	Acc	Pre	Rec	F₁
DT-Rank	0.723	0.728	0.725	0.726	0.647	0.635	0.669	0.652
SVM-TS	0.824	0.810	0.817	0.813	0.743	0.753	0.764	0.758
Text-CNN	0.839	0.833	0.849	0.841	0.800	0.813	0.809	0.811
GRU-2	0.899	0.896	0.885	0.890	0.839	0.835	0.847	0.841
dEFEND	0.915	0.913	0.931	0.922	0.877	0.869	0.899	0.883
Text-GCN	0.925	0.916	0.913	0.914	0.892	0.887	0.880	0.883
Bi-GCN	0.928	0.933	0.921	0.927	0.902	0.895	0.911	0.903
GLAN	0.929	0.936	0.930	0.933	0.902	0.907	0.916	0.911
TextING	0.937	0.936	0.939	0.937	0.909	0.908	0.911	0.909
本研究方法	0.945	0.938	0.941	0.940	0.921	0.920	0.925	0.923

4. 结　论

（1）通过为每个微博事件单独建立词共现图和词语义相关图，不仅有效结合了词的短距离上下文语义和长距离非连续语义，而且避免了测试数据必须参与模型训练导致无法推广到一般任务的问题.

（2）综合GCN和GRU在处理非连续文本和连续文本方面的优势，提出基于GCN和GRU的节点向量信息传播模型.

（3）考虑不同节点的贡献不同，通过注意力机制融合最大池、平均池、全局池结果以获取最终的图级向量，避免了单一池化方法带来的精度损失.

（4）研究评论发出时间对谣言检测结果的影响，通过实验获取最佳评论利用时间，在保证谣言检测准确率的同时提高了检测效率.

（5）实验结果表明，本研究在给定数据集上表现普遍优于现有典型方法. 未来研究将在微博谣言事件检测过程中综合考虑符号、图片、用户属性等更多特征以提高检测精度，并引入多任务学习、主动学习技术实现微博谣言事件的实时检测.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

ZUBIAGA A, AKER A, BONTCHEVA K, et al

Detection and resolution of rumours in social media: a survey

[J]. ACM Computing Surveys (CSUR), 2018, 51 (2): 1- 36

[2]

新浪微博虚假消息辟谣官方账号. 2020年度微博辟谣数据报告[EB/OL]. (2020-02-07) [2021-11-05]. https://weibo.com/1866405545/K0QaImwsK.

[3]

MA J, GAO W, WEI Z, et al. Detect rumors using time series of social context information on microblogging websites [C]// Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. Melbourne: CIKM, 2015.

[本文引用: 3]

[4]

ZHAO Z, RESNICK P, MEI Q. Enquiring minds: early detection of rumors in social media from enquiry posts [C]// Proceedings of the 24th International Conference on World Wide Web. New York: WWW, 2015.

[5]

张仰森, 彭媛媛, 段宇翔, 等

基于评论异常度的新浪微博谣言识别方法

[J]. 自动化学报, 2020, 46 (8): 1689- 1702

ZHANG Yang-sen, PENG Yuan-yuan, DUAN Yu-xiang, et al

The method of Sina Weibo rumor detecting based on comment abnormality

[J]. Acta Automatica Sinica, 2020, 46 (8): 1689- 1702

DOI:10.3772/j.issn.1000-0135.2019.01.010 [本文引用: 1]

[6]

曾子明, 王婧

基于LDA和随机森林的微博谣言识别研究: 以2016年雾霾谣言为例

[J]. 情报学报, 2019, 38 (1): 89- 96

ZENG Zi-ming, WANG Jing

Research on Microblog rumor identification based on LDA and random forest

[J]. Journal of the China Society for Scientific and Technical Information, 2019, 38 (1): 89- 96

DOI:10.3772/j.issn.1000-0135.2019.01.010 [本文引用: 1]

[7]

CAI G, BI M, LIU J. A novel rumor detection method based on labeled cascade propagation tree [C]// Proceedings of the 13th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery. Guilin: ICNC-FSKD, 2017.

DOI:10.3969/j.issn.1002-1965.2020.07.014 [本文引用: 2]

[8]

MA J, GAO W, MITRA P, et al. Detecting rumors from microblogs with recurrent neural networks [C]// International Joint Conference on Artificial Intelligence. New York: IJCAI, 2016.

[本文引用: 6]

[9]

WANG Z, GUO Y, WANG J, et al

Rumor events detection from chinese microblogs via sentiments enhancement

[J]. IEEE Access, 2019, 7: 103000- 103018

DOI:10.1109/ACCESS.2019.2928044 [本文引用: 4]

[10]

尹鹏博, 潘伟民, 彭成, 等

基于用户特征分析的微博谣言早期检测研究

[J]. 情报杂志, 2020, 39 (7): 81- 86

YIN Peng-bo, PAN Wei-min, PENG Cheng, et al

Research on early detection of Weibo rumors based on user characteristics analysis

[J]. Journal of Intelligence, 2020, 39 (7): 81- 86

DOI:10.3969/j.issn.1002-1965.2020.07.014 [本文引用: 2]

[11]

SONG C, YANG C, CHEN H, et al

CED: credible early detection of social media rumors

[J]. IEEE Transactions on Knowledge and Data Engineering, 2019, 33 (8): 3035- 3047

[本文引用: 4]

[12]

刘政, 卫志华, 张韧弦

基于卷积神经网络的谣言检测

[J]. 计算机应用, 2017, 37 (11): 3053- 3056

LIU Zheng, WEI Zhi-hua, ZHANG Ren-xian

Rumor detection based on convolutional neural network

[J]. Journal of Computer Applications, 2017, 37 (11): 3053- 3056

DOI:10.7544/issn1000-1239.2021.20200810 [本文引用: 1]

[13]

胡斗, 卫玲蔚, 周薇, 等

一种基于多关系传播树的谣言检测方法

[J]. 计算机研究与发展, 2021, 58 (7): 1395- 1411

HU Dou, WEI Ling-wei, ZHOU Wei, et al

A rumor detection approach based on multi-relational propagation tree

[J]. Journal of Computer Research and Development, 2021, 58 (7): 1395- 1411

DOI:10.7544/issn1000-1239.2021.20200810 [本文引用: 1]

[14]

WU Z, PI D, CHEN J, et al

Rumor detection based on propagation graph neural network with attention mechanism

[J]. Expert Systems with Applications, 2020, 158: 113595

DOI:10.1016/j.eswa.2020.113595 [本文引用: 1]

[15]

杨延杰, 王莉, 王宇航

融合源信息和门控图神经网络的谣言检测研究

[J]. 计算机研究与发展, 2021, 58 (7): 1412- 1424

DOI:10.7544/issn1000-1239.2021.20200801 [本文引用: 1]

YANG Yan-jie, WANG Li, WANG Yu-hang

Rumor detection based on source information and gating graph neural network

[J]. Journal of Computer Research and Development, 2021, 58 (7): 1412- 1424

DOI:10.7544/issn1000-1239.2021.20200801 [本文引用: 1]

[16]

YANG X, LYU Y, TIAN T, et al. Rumor detection on social media with graph structured adversarial learning [C]// Proceedings of the 29th International Conference on International Joint Conferences on Artificial Intelligence. Montreal: IJCAI, 2021.

[17]

HU L, YANG T, SHI C, et al. Heterogeneous graph attention networks for semi-supervised short text classification [C]// Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing. Hong Kong: EMNLP-IJCNLP, 2019.

[18]

YAO L, MAO C, LUO Y. Graph convolutional networks for text classification [C]// Proceedings of the AAAI Conference on Artificial Intelligence. New Orleans: AAAI, 2019.

[本文引用: 4]

[19]

LIU X, YOU X, ZHANG X, et al. Tensor graph convolutional networks for text classification [C]// Proceedings of the AAAI Conference on Artificial Intelligence. New York: AAAI, 2020.

DOI:10.3778/j.issn.1002-8331.2003-0357 [本文引用: 8]

[20]

ZHANG Y, YU X, CUI Z, et al. Every document owns its structure: inductive text classification via graph neural networks [C]// Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics.[s.l.]:ACL, 2020.

[本文引用: 12]

[21]

LI Y, TARLOW D, BROCKSCHMIDT M, et al. Gated graph sequence neural networks [C]// Proceedings of the 4th International Conference on Learning Representations. Puerto Rico: ICLR, 2016.

[本文引用: 6]

[22]

米源, 唐恒亮

基于图卷积网络的谣言鉴别研究

[J]. 计算机工程与应用, 2021, 57 (13): 161- 167

MI Yuan, TANG Heng-liang

Rumor identification research based on graph convolutional network

[J]. Computer Engineering and Applications, 2021, 57 (13): 161- 167

DOI:10.3778/j.issn.1002-8331.2003-0357 [本文引用: 8]

[23]

KIM Y. Convolutional neural networks for sentence classification [C]// Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha: EMNLP, 2014.

[24]

SHU K, CUI L, WANG S, et al. dEFEND: explainable fake news detection [C]// Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Anchorage: KDD, 2019.

[25]

BIAN T, XIAO X, XU T, et al. Rumor detection on social media with bi-directional graph convolutional networks [C]// Proceedings of the AAAI Conference on Artificial Intelligence. New York: AAAI, 2020.

[26]

YUAN C, MA Q, ZHOU W, et al. Jointly embedding the local and global relations of heterogeneous graph for rumor detection [C]// 2019 IEEE International Conference on Data Mining. Newark: ICDM, 2019.