Please wait a minute...
浙江大学学报(工学版)  2021, Vol. 55 Issue (4): 615-625    DOI: 10.3785/j.issn.1008-973X.2021.04.003
计算机技术、电信技术     
社交网络假消息辟谣作用机理
张玉琪(),郭斌*(),丁亚三,刘思聪,於志文
西北工业大学 计算机学院,陕西 西安 710129
Mechanism of corrections to false information in online social network
Yu-qi ZHANG(),Bin GUO*(),Ya-san DING,Si-cong LIU,Zhi-wen YU
School of Computer Science, Northwestern Polytechnical University, Xi’an 710129, China
 全文: PDF(1191 KB)   HTML
摘要:

研究真实社交网络环境下假消息辟谣作用机理. 提出评估辟谣效果的方法及探究影响辟谣效果的因素. 基于已有研究成果与假设,总结出8个影响辟谣效果的因素,如原假消息内容占比、是否包含谣言文字警示、是否解释原因、用户影响力等. 使用情感分析和微博社交上下文,评估辟谣微博的辟谣效果. 利用统计学方法,检验预设影响因素与辟谣效果间的关系. 基于新冠疫情相关的辟谣微博数据开展实验,实验分析表明,辟谣信息中原假消息内容占比和辟谣效果呈负相关,解释原因与辟谣效果呈正相关. 提出尽量少地提及原假消息、应解释原假消息错误的原因等6条辟谣建议,为社交网络假消息辟谣提供指导.

关键词: 假消息辟谣机理情感分析社交网络微博    
Abstract:

The mechanism of corrections on false information in real social network environments was analyzed. The effect of corrections was evaluated and its influencing factors were explored. Eight factors that affect the effectiveness of correction were summarized based on existing research and our hypotheses, such as the proportion of the original false information, whether it contains text warnings of false information, whether to explain the explanation, user influence, etc.. The effectiveness of correction posts was evaluated by sentiment analysis and the social context of themselves. Statistical methods were used to test the relationship between the pre-determined influencing factors and the effectiveness of correction. The experiment was conducted based on the false information data about COVID-19 epidemic collected from Sina Weibo. Results show that a higher proportion of false information in a correction reduces the effectiveness, and explaining the reason improves the effectiveness. Six conclusions that improve the effectiveness of corrections on social networks were proposed such as mentioning original misinformation less, explaining why original misinformation is wrong. Guidance was provided for related media to correct false information on social network.

Key words: false information    mechanism of correction    sentiment analysis    social network    Weibo
收稿日期: 2021-01-27 出版日期: 2021-05-07
CLC:  TP 399  
基金资助: 国家重点研发计划资助项目(2019QY0600);国家自然科学基金资助项目(61772428,61725205)
通讯作者: 郭斌     E-mail: 1347088657@qq.com;guobin.keio@gmail.com
作者简介: 张玉琪(1998—),女,博士生,从事数据挖掘的研究. orcid.org/0000-0001-8173-3844. E-mail: 1347088657@qq.com
服务  
把本文推荐给朋友
加入引用管理器
E-mail Alert
作者相关文章  
张玉琪
郭斌
丁亚三
刘思聪
於志文

引用本文:

张玉琪,郭斌,丁亚三,刘思聪,於志文. 社交网络假消息辟谣作用机理[J]. 浙江大学学报(工学版), 2021, 55(4): 615-625.

Yu-qi ZHANG,Bin GUO,Ya-san DING,Si-cong LIU,Zhi-wen YU. Mechanism of corrections to false information in online social network. Journal of ZheJiang University (Engineering Science), 2021, 55(4): 615-625.

链接本文:

http://www.zjujournals.com/eng/CN/10.3785/j.issn.1008-973X.2021.04.003        http://www.zjujournals.com/eng/CN/Y2021/V55/I4/615

术语 中文描述
误传消息(misinformation) 由于信息不准确或误解,无意识传播的错误信息
恶意消息(disinformation) 被故意传播用来欺骗人们和加强偏见的错误信息
恶搞(hoaxes) 恶作剧地故意用来欺骗人们的错误消息
讽刺新闻
(satirical news)
主要目的是娱乐人们,但脱离语境会产生误解的信息
鼓动(propaganda) 用来影响人们舆论和行为的欺骗性信息,目的常出于政治性或宗教性
标题党(click-bait) 用来吸引流量的低质量报道
谣言(rumor) 人们之间传播的一种说法,并且暂时还没有被认证其真实性
表 1  常见假消息分类表
图 1  辟谣微博示例
图 2  辟谣机理探究框架图
数据名 描述 类型 数据示例
微博id 微博特有且唯一的标识 字符串 IvZBqpH3O
发布者 发布微博的用户名 文本 微博辟谣
微博正文 微博的文字内容 文本
发布时间 微博的发布时间 时间 2020/2/26 16:09
点赞数 微博被点赞的数目 整数 4315
转发数 微博被转发的数目 整数 1106
评论数 微博被评论的数目 整数 1671
表 2  微博数据格式
数据名 描述 类型 数据示例
用户id 发布评论的用户
唯一的标识
数字串 264384 2782
发布时间 评论发布时间 时间 2020/2/26 1:08:00
评论 评论的内容 文本 湖南日报这个消息已经没有…
点赞数 评论被点赞数 整数 3
表 3  评论数据格式
理论与假设 说明 归纳的影响辟谣效果的因素
熟悉-逆火效应 辟谣中再次提到假消息,会加深错误认知 原假消息内容占比
过度-逆火效应 过度地辟谣会降低辟谣效果 帖子字数
替代性解释 用令人信服的解释填补假消息被揭穿时心理模型的空缺 “是否包含谣言文字警示”、“是否包含谣言图片警示”、
“是否包含真相图片”、“是否解释原因”
信息来源对辟谣有影响 信息的可信度和影响力对辟谣有促进作用 “来源是否认证用户”以及“来源影响力”
表 4  影响辟谣因素归纳表
特征名 标注说明 数据类型 数据示例
微博id 微博的唯一标识 字符串 IqPUS phiw
时间 发布时间 时间 2020/1/23 18:18:00
来源 发布者的昵称 文本 丁香医生
原假消息占比 假消息字数/微博正文总字数 数值 0.824
帖子字数 微博正文总字数 整数 416
是否包含谣言文字警示 首次提及假消息是否警示,比如“谣言”,“不实”等字样 二分类变量 1
是否包含谣言图片警示 是否包含图片的谣言警示 二分类变量 0
是否包含真相图片 是否包含说明真相的图片解释 二分类变量 0
是否解释原因 是否包含文字或图片解释 二分类变量 0
表 5  人工标注说明
数据名 描述 数据类型 数据示例
微博id 微博唯一的标识 字符串 4231270000000000
评论 原始评论内容 文本 战争的灾难远超你
我的想象……
情感倾向 人工标注的情感分类,0-消极,1-积极 二分类变量 1
表 6  语料数据格式
流程 内容
原始文本 {%##%123music}“书中自有黄金屋,书中自有颜如玉”. 沿着岁月的长河跋涉,或是风光旖旎,或是姹紫嫣红.
数据清洗 书中自有黄金屋 书中自有颜如玉 沿着岁月的长河跋涉 或是风光旖旎 或是姹紫嫣红
分词 ['书中','自有','黄金屋','书中','自有','颜如玉','沿着','岁月','的','长河','跋涉','或是','风光旖旎','或是','姹紫嫣红'']
表 7  数据预处理过程
图 3  模型指标的对比
评论用户id 评论内容 描述
6094940083 这些造谣的人是怎么想的 没有表达对假消息的观点,只是对造谣的人的批判
3896911115 以色列可能已经在路上 提到的与当前的假消息无关
5133431206 有个在华伊拉克人在说伊拉克··· 提到的不是当前的假消息,而是别的假消息
表 8  不相关评论示例
图 4  情感分类流程图
数据名 数据类型
原假消息内容占比 定量
帖子字数 定量
是否包含谣言文字警示 定类
是否包含谣言图片警示 定类
是否包含真相图片 定类
是否解释原因 定类
来源是否为认证用户 定类
来源影响力 定量
辟谣效果 定量
表 9  预设影响因素的数据类别
变量名 辟谣效果 选用分析 选用方法
原假消息内容占比 定量 & 定量 相关分析 斯皮尔曼相关系数
帖子字数
来源影响力
是否包含谣言文字警示 定类 & 定量 差异分析 曼-惠特尼秩和检验
是否包含谣言图片警示
是否包含真相图片
是否解释原因
是否为认证用户
表 10  关系分析方法选取
因素 显著性
是否包含谣言文字警示 0.667
是否包含谣言图片警示 0.604
是否包含真相图片 0.571
是否解释原因 0.018
是否为认证用户 0.418
表 11  差异分析结果
因素 相关系数 显著性
原假消息内容占比 ?0.131** 0.001
帖子字数 0.033 0.400
来源影响力 0.269** 0.000
表 12  斯皮尔曼相关分析结果
变量名
是否包含谣言文字警示 0.72 0.28
是否包含谣言图片警示 0.30 0.70
是否包含谣言警示 0.74 0.26
表 13  谣言文字警示、图片警示以及包含图片或文字警示的频率分布
图 5  认证用户的分布
图 6  是否解释原因的辟谣效果对数分布的对比
图 7  原假消息内容占比、信息来源影响力与辟谣效果的关系
图 8  原假消息内容占比与来源影响力对辟谣效果共同作用
图 9  辟谣效果、辟谣数目以及来源影响力的时序变化
1 SHU K, BERNARD H R, LIU H. Studying fake news via network analysis: detection and mitigation[M]// Emerging Research Challenges and Opportunities in Computational Social Network Analysis and Mining. Cham: Springer, 2019: 43–65.
2 LAZER D M J, BAUM M A, BENKLER Y, et al The science of fake news[J]. Science, 2018, 359 (6380): 1094- 1096
doi: 10.1126/science.aao2998
3 NGUYEN N P, YAN G, THAI M T, et al. Containment of misinformation spread in online social networks [C]// Proceedings of the 4th Annual ACM Web Science Conference. Wuhan: ACM, 2012: 213-222.
4 TRIPATHY R M, BAGCHI A, MEHTA S, et al. A study of rumor control strategies on social networks [C]// Conference on Information and Knowledge Management. Toronto: ACM, 2010: 1817-1820.
5 JERIT J Partisan perceptual bias and the information environment[J]. The Journal of Politics, 2012, 74 (3): 672- 684
doi: 10.1017/S0022381612000187
6 BUSH J G, JOHNSON H M, SEIFERT C M. The implications of corrections: then why did you mention it [C]// Proceedings of the 16th Annual Conference of the Cognitive Science Society. Atlanta: Elsevier, 1994: 112-117.
7 COOK J, LEWANDOWSKY S. The debunking handbook [EB/OL]. (2012-01-23). http: //sks.to/debunk.
8 LEWANDOWSKY S, ECKER U K, SEIFERT C M, et al Misinformation and its correction continued influence and successful debiasing[J]. Psychological Science in the Public Interest, 2012, 13 (3): 106- 131
doi: 10.1177/1529100612451018
9 SHARMA K, QIAN F, JIANG H, et al Combating fake news: a survey on identification and mitigation techniques[J]. ACM Transactions on Intelligent Systems and Technology, 2019, 10 (3): 1- 42
10 BUDAK C, AGRAWAL D, ABBADI A E, et al. Limiting the spread of misinformation in social networks [C]// Proceedings of the 20th International Conference on World Wide Web. Bangalore: ACM, 2011: 665-674.
11 HE X, SONG G, CHEN W, et al. Influence blocking maximization in social networks under the competitive linear threshold model [C]// Proceedings of the 2012 SIAM International Conference on Data Mining. Anaheim: SIAM, 2012: 463-474.
12 FARAJTABAR M, YANG J, YE X, et al. Fake news mitigation via point process based intervention [C]// International Conference on Machine Learning. Sydney: ML Research Press, 2017: 1097-1106.
13 AMORUSO M, ANELLO D, AULETTA V, et al Contrasting the spread of misinformation in online social networks[J]. Journal of Artificial Intelligence Research, 2020, 69: 847- 879
doi: 10.1613/jair.1.11509
14 YU S, VOROBEYCHIK Y, ALFELD S, et al. Adversarial classification on social networks [C]// Adaptive Agents and Multi-agents Systems. Stockholm: ACM, 2018: 211-219.
15 THORSON E A Belief echoes: the persistent effects of corrected misinformation[J]. Political Communication, 2016, 33 (3): 460- 480
doi: 10.1080/10584609.2015.1102187
16 NYHAN B, REIFLER J When corrections fail: the persistence of political misperceptions[J]. Political Behavior, 2010, 32 (2): 303- 330
doi: 10.1007/s11109-010-9112-2
17 KIM A, DENNIS A R. Says who?: how news presentation format influences perceived believability and the engagement level of social media users [C]// Proceedings of the 51st Hawaii International Conference on System Sciences. Hawaii: AIS eLibrary, 2018: 1-11.
18 BODE L, VRAGA E K In related news, that was wrong: the correction of misinformation through related stories functionality in social media[J]. Journal of Communication, 2015, 65 (4): 619- 638
doi: 10.1111/jcom.12166
19 BODE L, VRAGA E K See something, say something: correction of global health misinformation on social media[J]. Health Communication, 2018, 33 (9): 1131- 1140
doi: 10.1080/10410236.2017.1331312
20 PIERRI F, CERI S False news on social media: a data-driven survey[J]. Sigmod Record, 2019, 48 (2): 18- 27
doi: 10.1145/3377330.3377334
21 SCHEUFELE D A, KRAUSE N M Science audiences, misinformation, and fake news[J]. Proceedings of the National Academy of Sciences of the United States of America, 2019, 116 (16): 7662- 7669
doi: 10.1073/pnas.1805871115
22 LEWANDOWSKY S, ECKER U K, COOK J, et al Beyond misinformation: understanding and coping with the “post-truth” era[J]. Journal of Applied Research in Memory and Cognition, 2017, 6 (4): 353- 369
doi: 10.1016/j.jarmac.2017.07.008
23 SKURNIK I, YOON C, PARK D C, et al How warnings about false claims become recommendations[J]. Journal of Consumer Research, 2005, 31 (4): 713- 724
doi: 10.1086/426605
24 SCHWARZ N, SANNA L J, SKURNIK I, et al Metacognitive experiences and the intricacies of setting people straight: implications for debiasing and public information campaigns[J]. Advances in Experimental Social Psychology, 2007, 39 (6): 127- 161
25 NYHAN B, REIFLER J The roles of information deficits and identity threat in the prevalence of misperceptions[J]. Journal of Elections, Public opinion and parties, 2019, 29 (2): 222- 244
doi: 10.1080/17457289.2018.1465061
[1] 王亮, 於志文, 郭斌, 熊菲. 基于移动社交网络的群智感知社群化任务分发[J]. 浙江大学学报(工学版), 2018, 52(9): 1709-1716.
[2] 孙念, 李玉强, 刘爱华, 刘春, 黎威威. 基于松散条件下协同学习的中文微博情感分析[J]. 浙江大学学报(工学版), 2018, 52(8): 1452-1460.
[3] 张亚楠, 陈德运, 王莹洁, 刘宇鹏. 基于增量图形模式匹配的动态冷启动推荐方法[J]. 浙江大学学报(工学版), 2017, 51(2): 408-415.
[4] 欧阳逸, 郭斌, 何萌, 於志文, 周兴社. 微博事件感知与脉络呈现系统[J]. 浙江大学学报(工学版), 2016, 50(6): 1176-1182.
[5] 张亚楠, 曲明成,刘宇鹏. 基于社交关系拓扑结构的冷启动推荐方法[J]. 浙江大学学报(工学版), 2016, 50(5): 1001-1008.
[6] 林萌, 罗森林, 贾丛飞, 韩磊, 原玉娇, 潘丽敏. 融合句义结构模型的微博话题摘要算法[J]. 浙江大学学报(工学版), 2015, 49(12): 2316-2325.
[7] 刘芳, 孙芸, 杨庚, 林海. 基于粒子群优化算法的社交网络可视化[J]. J4, 2013, 47(1): 37-43.