Journal of ZheJiang University (Engineering Science)  2021, Vol. 55 Issue (4): 615-625    DOI: 10.3785/j.issn.1008-973X.2021.04.003
Mechanism of corrections to false information in online social network
Yu-qi ZHANG(),Bin GUO*(),Ya-san DING,Si-cong LIU,Zhi-wen YU
School of Computer Science, Northwestern Polytechnical University, Xi’an 710129, China
The mechanism of corrections on false information in real social network environments was analyzed. The effect of corrections was evaluated and its influencing factors were explored. Eight factors that affect the effectiveness of correction were summarized based on existing research and our hypotheses, such as the proportion of the original false information, whether it contains text warnings of false information, whether to explain the explanation, user influence, etc.. The effectiveness of correction posts was evaluated by sentiment analysis and the social context of themselves. Statistical methods were used to test the relationship between the pre-determined influencing factors and the effectiveness of correction. The experiment was conducted based on the false information data about COVID-19 epidemic collected from Sina Weibo. Results show that a higher proportion of false information in a correction reduces the effectiveness, and explaining the reason improves the effectiveness. Six conclusions that improve the effectiveness of corrections on social networks were proposed such as mentioning original misinformation less, explaining why original misinformation is wrong. Guidance was provided for related media to correct false information on social network.

Key wordsfalse information      mechanism of correction      sentiment analysis      social network      Weibo     
Received: 27 January 2021      Published: 07 May 2021
CLC:  TP 399  
Fund:  国家重点研发计划资助项目(2019QY0600);国家自然科学基金资助项目(61772428,61725205)
Corresponding Authors: Bin GUO     E-mail:;
Yu-qi ZHANG,Bin GUO,Ya-san DING,Si-cong LIU,Zhi-wen YU. Mechanism of corrections to false information in online social network. Journal of ZheJiang University (Engineering Science), 2021, 55(4): 615-625.

研究真实社交网络环境下假消息辟谣作用机理. 提出评估辟谣效果的方法及探究影响辟谣效果的因素. 基于已有研究成果与假设,总结出8个影响辟谣效果的因素,如原假消息内容占比、是否包含谣言文字警示、是否解释原因、用户影响力等. 使用情感分析和微博社交上下文,评估辟谣微博的辟谣效果. 利用统计学方法,检验预设影响因素与辟谣效果间的关系. 基于新冠疫情相关的辟谣微博数据开展实验,实验分析表明,辟谣信息中原假消息内容占比和辟谣效果呈负相关,解释原因与辟谣效果呈正相关. 提出尽量少地提及原假消息、应解释原假消息错误的原因等6条辟谣建议,为社交网络假消息辟谣提供指导.

关键词: 假消息,  辟谣机理,  情感分析,  社交网络,  微博 
术语 中文描述
误传消息(misinformation) 由于信息不准确或误解,无意识传播的错误信息
恶意消息(disinformation) 被故意传播用来欺骗人们和加强偏见的错误信息
恶搞(hoaxes) 恶作剧地故意用来欺骗人们的错误消息
(satirical news)
鼓动(propaganda) 用来影响人们舆论和行为的欺骗性信息,目的常出于政治性或宗教性
标题党(click-bait) 用来吸引流量的低质量报道
谣言(rumor) 人们之间传播的一种说法,并且暂时还没有被认证其真实性
Tab.1 Common false information classification table
Fig.1 Examples of refuting Weibo
Fig.2 Architecture of exploration on mechanism of correction
数据名 描述 类型 数据示例
微博id 微博特有且唯一的标识 字符串 IvZBqpH3O
发布者 发布微博的用户名 文本 微博辟谣
微博正文 微博的文字内容 文本
发布时间 微博的发布时间 时间 2020/2/26 16:09
点赞数 微博被点赞的数目 整数 4315
转发数 微博被转发的数目 整数 1106
评论数 微博被评论的数目 整数 1671
Tab.2 Data format of post
数据名 描述 类型 数据示例
用户id 发布评论的用户
数字串 264384 2782
发布时间 评论发布时间 时间 2020/2/26 1:08:00
评论 评论的内容 文本 湖南日报这个消息已经没有…
点赞数 评论被点赞数 整数 3
Tab.3 Data format of comment
理论与假设 说明 归纳的影响辟谣效果的因素
熟悉-逆火效应 辟谣中再次提到假消息,会加深错误认知 原假消息内容占比
过度-逆火效应 过度地辟谣会降低辟谣效果 帖子字数
替代性解释 用令人信服的解释填补假消息被揭穿时心理模型的空缺 “是否包含谣言文字警示”、“是否包含谣言图片警示”、
信息来源对辟谣有影响 信息的可信度和影响力对辟谣有促进作用 “来源是否认证用户”以及“来源影响力”
Tab.4 Summary on influencing factors
特征名 标注说明 数据类型 数据示例
微博id 微博的唯一标识 字符串 IqPUS phiw
时间 发布时间 时间 2020/1/23 18:18:00
来源 发布者的昵称 文本 丁香医生
原假消息占比 假消息字数/微博正文总字数 数值 0.824
帖子字数 微博正文总字数 整数 416
是否包含谣言文字警示 首次提及假消息是否警示,比如“谣言”,“不实”等字样 二分类变量 1
是否包含谣言图片警示 是否包含图片的谣言警示 二分类变量 0
是否包含真相图片 是否包含说明真相的图片解释 二分类变量 0
是否解释原因 是否包含文字或图片解释 二分类变量 0
Tab.5 Description of labeling
数据名 描述 数据类型 数据示例
微博id 微博唯一的标识 字符串 4231270000000000
评论 原始评论内容 文本 战争的灾难远超你
情感倾向 人工标注的情感分类,0-消极,1-积极 二分类变量 1
Tab.6 Data format of corpus
流程 内容
原始文本 {%##%123music}“书中自有黄金屋,书中自有颜如玉”. 沿着岁月的长河跋涉,或是风光旖旎,或是姹紫嫣红.
数据清洗 书中自有黄金屋 书中自有颜如玉 沿着岁月的长河跋涉 或是风光旖旎 或是姹紫嫣红
分词 ['书中','自有','黄金屋','书中','自有','颜如玉','沿着','岁月','的','长河','跋涉','或是','风光旖旎','或是','姹紫嫣红'']
Tab.7 Process of data pre-processing
Fig.3 Comparison of model indicator
评论用户id 评论内容 描述
6094940083 这些造谣的人是怎么想的 没有表达对假消息的观点,只是对造谣的人的批判
3896911115 以色列可能已经在路上 提到的与当前的假消息无关
5133431206 有个在华伊拉克人在说伊拉克··· 提到的不是当前的假消息,而是别的假消息
Tab.8 Examples of unrelated comments
Fig.4 Process of sentiment classification
数据名 数据类型
原假消息内容占比 定量
帖子字数 定量
是否包含谣言文字警示 定类
是否包含谣言图片警示 定类
是否包含真相图片 定类
是否解释原因 定类
来源是否为认证用户 定类
来源影响力 定量
辟谣效果 定量
Tab.9 Data category of predefined influencing factors
变量名 辟谣效果 选用分析 选用方法
原假消息内容占比 定量 & 定量 相关分析 斯皮尔曼相关系数
是否包含谣言文字警示 定类 & 定量 差异分析 曼-惠特尼秩和检验
Tab.10 Selected methods for relation analysis
因素 显著性
是否包含谣言文字警示 0.667
是否包含谣言图片警示 0.604
是否包含真相图片 0.571
是否解释原因 0.018
是否为认证用户 0.418
Tab.11 Results of difference analysis
因素 相关系数 显著性
原假消息内容占比 ?0.131** 0.001
帖子字数 0.033 0.400
来源影响力 0.269** 0.000
Tab.12 Results of Spearman correlation analysis
是否包含谣言文字警示 0.72 0.28
是否包含谣言图片警示 0.30 0.70
是否包含谣言警示 0.74 0.26
Tab.13 Frequency distributions of posts whether contains warnings of false information in text,graphic or either format,respectively
Fig.5 Distribution of verified users
Fig.6 Comparison of effectives between posts explaining or not
Fig.7 Relation between proportion of original false content, source of information and effect of correction respectively
Fig.8 Combined effect of proportion of original false content and influence of source on effect of correction
Fig.9 Temporal changes on effect of correction, number of corrections and influence of source respectively
